AI đang học cách dự đoán tương lai—và đánh bại con người trong việc đó

(SeaPRwire) – Cứ ba tháng một lần, những người tham gia cuộc thi dự báo của Metaculus cố gắng dự đoán tương lai để giành giải thưởng khoảng 5.000 đô la. Metaculus, một nền tảng dự báo, đặt ra những câu hỏi có tầm quan trọng về địa chính trị như “Thái Lan có trải qua một cuộc đảo chính quân sự trước tháng 9 năm 2025 không?” và “Israel có tấn công quân đội Iran một lần nữa trước tháng 9 năm 2025 không?”

Những người dự báo ước tính xác suất xảy ra các sự kiện – một phỏng đoán mang tính thông tin hơn là một câu trả lời “có” hoặc “không” đơn giản – trước nhiều tuần đến nhiều tháng, thường với độ chính xác đáng kinh ngạc. Người dùng Metaculus đã dự đoán chính xác ngày Nga xâm lược Ukraine trước hai tuần và tỷ lệ 90% khả năng phán quyết Roe v. Wade bị lật ngược gần hai tháng trước khi nó xảy ra.

Tuy nhiên, một trong 10 người về đích hàng đầu trong cuộc thi, với những người chiến thắng được công bố vào thứ Tư, đã gây bất ngờ ngay cả với các chuyên gia dự báo: đó là một AI. “Điều đó thực sự đáng kinh ngạc,” Toby Shevlane, CEO của Mantic, công ty khởi nghiệp có trụ sở tại Vương quốc Anh vừa được công bố đã phát triển AI, cho biết. Khi cuộc thi mở cửa vào tháng Sáu, những người tham gia đã dự đoán rằng điểm số của bot hàng đầu sẽ là 40% so với điểm trung bình của những người biểu diễn hàng đầu. Thay vào đó, Mantic đạt hơn 80%.

“Dự báo – nó ở khắp mọi nơi, phải không?” Nathan Manzotti, người đã làm việc về AI và phân tích dữ liệu cho Department of Defence và General Services Administration, cùng với khoảng nửa tá cơ quan chính phủ Hoa Kỳ, nói. “Hãy chọn một cơ quan chính phủ bất kỳ, và họ chắc chắn có một loại hình dự báo nào đó đang diễn ra.”

Các chuyên gia dự báo giúp các tổ chức lường trước tương lai, Anthony Vassalo, đồng giám đốc Sáng kiến Dự báo tại RAND, một viện nghiên cứu của chính phủ Hoa Kỳ, giải thích. Nó cũng giúp họ thay đổi tương lai. Dự báo các sự kiện địa chính trị trước nhiều tuần hoặc nhiều tháng giúp “ngăn chặn bất ngờ” và “hỗ trợ các nhà ra quyết định đưa ra quyết định,” Vassalo nói. Các chuyên gia dự báo cập nhật dự đoán của họ dựa trên các chính sách do các nhà lập pháp ban hành, để họ có thể dự đoán một sự can thiệp chính sách giả định có khả năng thay đổi kết quả tương lai như thế nào. Nếu các nhà ra quyết định đang đi chệch hướng mong muốn, các chuyên gia dự báo có thể giúp họ “thay đổi kịch bản mà họ đang ở,” Vassalo nói.

Nhưng dự báo các câu hỏi địa chính trị rộng lớn thì nổi tiếng là khó. Các dự báo từ những chuyên gia hàng đầu có thể mất nhiều ngày cho một câu hỏi duy nhất. Đối với các tổ chức như RAND, theo dõi nhiều chủ đề trên nhiều khu vực địa chính trị, “sẽ mất nhiều tháng để các chuyên gia dự báo con người đưa ra dự báo ban đầu về tất cả những câu hỏi đó, chứ chưa nói đến việc cập nhật chúng thường xuyên,” Vassalo nói.

Học máy từ lâu đã hữu ích trong các lĩnh vực có dữ liệu phong phú, có cấu trúc tốt, như dự báo thời tiết hoặc giao dịch quỹ định lượng. Khi dự báo địa chính trị hoặc tiến bộ công nghệ, “bạn sẽ có rất nhiều yếu tố phức tạp, phụ thuộc lẫn nhau mà phán đoán của con người có thể dễ tiếp cận và phải chăng hơn” trong việc dự đoán, Deger Turan, CEO của Metaculus, nói.

Các mô hình ngôn ngữ lớn làm việc với cùng một thông tin lộn xộn như các chuyên gia dự báo con người, và có khả năng mô phỏng phán đoán của con người này. Chúng cũng đang cải thiện theo cùng một cách mà con người làm: bằng cách đưa ra dự đoán về nhiều câu hỏi, xem chúng diễn ra như thế nào, và cập nhật phương pháp dự báo của chúng dựa trên kết quả – ở một quy mô lớn hơn nhiều so với khả năng của con người.

“Insight chính của chúng tôi thực ra là dự đoán tương lai có xu hướng là một vấn đề có thể kiểm chứng được, bởi vì đó giống như cách con người học, phải không?” Ben Turtel, CEO của LightningRod, công ty phát triển AI cho việc dự báo đã đạt thứ hạng cạnh tranh trong các giải đấu AI của Metaculus, nói. Công ty đã huấn luyện một mô hình gần đây trên các câu hỏi dự báo.

Việc huấn luyện mà AI nhận được đang thể hiện rõ trong bảng xếp hạng. Vào tháng Sáu, bot xếp hạng cao nhất, được Metaculus xây dựng dựa trên mô hình suy luận o1 của OpenAI, đã tham gia cuộc thi. Lần này, Mantic đứng thứ tám trong số 549 thí sinh – đây là lần đầu tiên một bot lọt vào top 10 trong chuỗi cuộc thi.

Kết quả này nên được nhìn nhận một cách thận trọng, theo Ben Wilson, một kỹ sư tại Metaculus, người thực hiện các so sánh giữa AI và con người trong các thử thách dự báo. Cuộc thi chỉ chứa một mẫu tương đối nhỏ gồm 60 câu hỏi. Hơn nữa, hầu hết trong số 600 thí sinh là nghiệp dư, một số người trong số họ chỉ dự đoán một vài câu hỏi trong giải đấu, khiến họ có điểm số thấp.

Cuối cùng, các cỗ máy có một lợi thế không công bằng. Những người tham gia giành điểm không chỉ dựa trên độ chính xác, mà còn dựa trên “phạm vi bao phủ” – mức độ sớm khi họ đưa ra dự đoán, số lượng câu hỏi họ dự đoán, và tần suất họ cập nhật ước tính của mình. Một AI kém chính xác hơn đối thủ con người vẫn có thể đạt thứ hạng cao bằng cách liên tục cập nhật ước tính của mình để phản ứng với tin tức mới nổi, theo một cách mà con người không thể thực hiện được.

Đối với Vassalo, lợi thế không công bằng của AI giải quyết vấn đề lớn nhất còn lại của ông: đạt được các dự báo chất lượng cao cho tất cả các câu hỏi mà ông cần dự đoán. “Tôi thực sự không cần nó phải đạt đến cấp độ của một siêu dự báo viên,” ông nói, sử dụng biệt danh dành cho những chuyên gia dự báo hàng đầu. “Tôi cần nó phải tốt như đám đông.”

Điều này khó hơn vẻ ngoài của nó: dự đoán của Cộng đồng Metaculus, một tổng hợp các dự báo của tất cả người dùng về mỗi câu hỏi, là một trong những thực thể có hiệu suất ổn định nhất trên nền tảng. Nếu đó là một người, nó sẽ xếp thứ tư trên trang web – đó là trí tuệ của đám đông. Trong Quarterly Cup, Mantic đã xếp sau Community Prediction năm bậc.

Một AI dự báo đáng tin cậy có thể theo dõi hàng trăm câu hỏi cùng lúc, cho phép Vassalo chỉ triển khai các chuyên gia dự báo hàng đầu của con người đối với những câu hỏi mà AI cho là cần được xem xét kỹ lưỡng hơn.

“Một điều về dự báo, hoặc phân tích dự đoán, là nó hỗ trợ ra quyết định,” Manzotti nói. “Nhiều nhà lãnh đạo sẽ bỏ qua dữ liệu nếu họ có một cảm giác trực giác theo hướng khác.” Đó là một vấn đề mà AI không thể giải quyết.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.