AI “Lý luận” của OpenAI trong Quảng Cáo Mới mắc Sai Lầm Cơ Bản “`

Digital Company Logos

(SeaPRwire) –   OpenAI đã phát hành mô hình AI tiên tiến nhất của mình cho đến nay, được gọi là o1, cho người dùng trả phí vào thứ Năm. Buổi ra mắt đã khởi động sự kiện “” của công ty — mười hai bản phát hành liên tiếp để kỷ niệm mùa lễ hội.

OpenAI đã quảng cáo khả năng “lý luận phức tạp” của o1 và đã thông báo vào thứ Năm rằng quyền truy cập không giới hạn vào mô hình sẽ có giá 200 đô la mỗi tháng. Trong mà công ty đã phát hành để thể hiện sức mạnh của mô hình, một người dùng tải lên một bức ảnh về một chiếc nhà chim bằng gỗ và yêu cầu mô hình tư vấn về cách xây dựng một chiếc tương tự. Mô hình “suy nghĩ” trong một thời gian ngắn và sau đó đưa ra những gì thoạt nhìn có vẻ là một tập hợp hướng dẫn toàn diện.

Kiểm tra kỹ lưỡng cho thấy các hướng dẫn gần như vô dụng. AI đo lượng sơn, keo và chất bịt kín cần thiết cho nhiệm vụ tính bằng inch. Nó chỉ đưa ra kích thước cho tấm mặt trước của nhà chim, chứ không phải các tấm khác. Nó đề nghị cắt một mảnh giấy nhám với một bộ kích thước khác, mà không rõ lý do. Và trong một phần riêng biệt của danh sách hướng dẫn, nó nói “kích thước chính xác như sau…” và sau đó không đưa ra bất kỳ kích thước chính xác nào.

“Bạn sẽ biết về việc xây dựng nhà chim từ hình ảnh cũng như từ văn bản, điều đó loại bỏ toàn bộ mục đích của công cụ AI,” James Filus, giám đốc Viện Thợ mộc, một tổ chức thương mại có trụ sở tại Vương quốc Anh, cho biết trong một email. Ông lưu ý rằng danh sách vật liệu bao gồm đinh, nhưng danh sách dụng cụ cần thiết không bao gồm búa, và chi phí xây dựng nhà chim đơn giản sẽ “không ở gần” mức 20-50 đô la do o1 ước tính. “Đơn giản chỉ cần nói ‘lắp đặt một bản lề nhỏ’ không thực sự bao quát được phần có lẽ phức tạp nhất của thiết kế,” ông nói thêm, đề cập đến một phần khác của video cho biết cách thêm mái mở cho nhà chim.

OpenAI đã không ngay lập tức trả lời yêu cầu bình luận.

Đây chỉ là ví dụ mới nhất về bản demo sản phẩm AI làm điều ngược lại với mục đích của nó. Năm ngoái, cho một công cụ tìm kiếm hỗ trợ AI đã nhầm lẫn nói rằng kính viễn vọng James Webb đã thực hiện một khám phá mà nó chưa từng thực hiện, một sai sót đã khiến giá cổ phiếu của công ty lao dốc. Gần đây hơn, một phiên bản cập nhật của một công cụ tương tự của Google , và rằng họ có thể sử dụng keo để dán pho mát vào pizza của họ.

o1 của OpenAI, theo các điểm chuẩn công khai là mô hình có khả năng nhất cho đến nay, sử dụng một phương pháp tiếp cận khác so với ChatGPT để trả lời các câu hỏi. Về cơ bản, nó vẫn là một trình dự đoán từ tiếp theo rất tiên tiến, được đào tạo bằng máy học trên hàng tỷ từ văn bản từ Internet và hơn thế nữa. Nhưng thay vì ngay lập tức đưa ra các từ để đáp lại lời nhắc, nó sử dụng một kỹ thuật gọi là lập luận “chuỗi suy nghĩ” để về cơ bản “suy nghĩ” về câu trả lời trong một khoảng thời gian đằng sau hậu trường, và sau đó chỉ đưa ra câu trả lời của mình sau đó. Kỹ thuật này thường cho ra câu trả lời chính xác hơn so với việc cho một mô hình đưa ra câu trả lời theo phản xạ, và OpenAI đã quảng cáo khả năng lập luận của o1 — đặc biệt là khi nói đến toán học và lập trình. Nó có thể trả lời chính xác 78% câu hỏi khoa học cấp tiến sĩ, theo dữ liệu mà OpenAI cùng với phiên bản xem trước của mô hình được phát hành vào tháng 9.

Nhưng rõ ràng một số lỗi logic cơ bản vẫn có thể xảy ra.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.