Cursor đã sử dụng một bầy agent AI được chạy bởi OpenAI để xây dựng và chạy một trình duyệt web trong một tuần—không cần bất kỳ sự giúp đỡ từ con người nào. Đây là lý do tại sao các nhà phát triển đang nhiệt huyết

(SeaPRwire) – Nếu một đội kỹ sư người xây dựng một trình duyệt web chỉ hoạt động được moitié, nó không khiến mọi người nói về nó. Nhưng khi Michael Truell, CEO của startup lập trình Cursor, tuần trước rằng một bầy tác nhân AI đã xây dựng một trình duyệt mà, ông viết, “hơi hoạt động” — trong khi chạy không ngừng trong một tuần mà không cần bất kỳ can thiệp người nào — nó đã lan tràn trên toàn thế giới công nghệ, với hơn sáu triệu lượt xem.
Tại sao lại có sự nhiệt huyết? Hai lý do lớn: Thứ nhất, thời gian tập trung của AI vốn ngắn. Trong những ngày đầu của ChatGPT, các mô hình chỉ có thể giữ cho công việc trong vài giây. Ngưỡng đó mở rộng lên vài phút đối với các mô hình tốt hơn, sau đó là vài giờ. Dự án Cursor tuyên bố là một trong những lần đầu tiên một hệ thống AI duy trì một dự án phần mềm phức tạp, không giới hạn trong suốt một tuần mà không cần hướng dẫn từ người.
Ngoài ra, các tác nhân AI đơn lẻ chỉ giới hạn trong các nhiệm vụ nhỏ, tập trung. Nhưng việc khiến hàng trăm tác nhân phối hợp trong một dự án lớn vẫn có vẻ tương lai. Đó là lý do tại sao Cursor bao xa họ có thể thúc đẩy lập trình tự chủ — trên một dự án có thể mất vài tháng cho một đội người — bằng cách có một “dàn nhạc” các tác nhân AI làm việc như một đội. Một hệ thống AI có thể bền vững enough, và làm việc cùng nhau tốt enough để khám phá mã, chia công việc thành các phần, sửa lỗi chính mình và tiếp tục tiến bộ trong nhiều ngày mà không trôi khỏi nhiệm vụ hiện tại không?
Dàn “dàn nhạc” tác nhân AI
Những nhà nghiên cứu phát hiện rằng câu trả lời hầu như là có. Thử nghiệm của Cursor đã điều phối hàng trăm tác nhân thành một thứ giống như một đội phần mềm. Nó có “nhân viên lập kế hoạch”, “nhân viên lao động” và “nhân viên phán xét” phối hợp trên triệu dòng mã. Điều này gợi ý về điều mà cả Cursor và OpenAI nói là một tương lai gần, trong đó AI không chỉ hỗ trợ nhân viên mà còn đảm nhận toàn bộ dự án. Điều đó sẽ thay đổi cơ bản cách làm việc phức tạp được thực hiện — đầu tiên trong phát triển phần mềm, sau đó là các nghề khác.
Đã có các thí nghiệm về bầy tác nhân AI từ vài năm nay. Nhưng hôm nay, Cursor nói rằng các mô hình thông minh hơn và có thể giữ tính nhất quán lâu hơn. Các mô hình có thể chạy ở quy mô lớn hơn nhiều, với một lớp tùy chỉnh điều phối hàng trăm tác nhân và ngăn họ rơi vào hỗn loạn.
Jonas Nelle, một kỹ sư tại Cursor làm việc trên các tác nhân AI chạy dài hạn, cho biết rằng khi các mô hình AI ngày càng tốt hơn, các kỹ sư và nhà nghiên cứu cần xem lại các giả định của họ mỗi vài tháng về những gì các mô hình AI có thể làm. Mặc dù ông thừa nhận rằng ông “không sẽ tải nó xuống và xóa Chrome hôm nay”, nhưng dự án trình duyệt “chắc chắn tốt hơn bất cứ điều gì mà các mô hình trước đây có thể làm được”.
Các tác nhân chạy dài hạn này là một ranh giới quan trọng, bổ sung Bill Chen, một kỹ sư OpenAI chịu trách nhiệm kiểm tra áp lực và đánh giá hành vi thực tế của các mô hình của công ty. Độ dài của một nhiệm vụ, và thực tế rằng một hệ thống AI có thể hoàn thành nhiệm vụ một cách tự chủ và nhất quán là “một chỉ số rất tốt về mức độ thông minh và mức độ tổng quát của một hệ thống”, ông nói. Dự án Cursor, được chạy bằng GPT-5.2 của OpenAI, là “kết quả trực tiếp của chúng tôi thực sự liên tục mở rộng ranh giới năng lực của mô hình”. Ông nói rằng trong tương lai, sẽ có các thử nghiệm về ngưỡng thời gian dài hơn nữa.
Bầy tác nhân AI chưa sẵn sàng để sử dụng trong kinh doanh
Tuy nhiên, đây không phải là các hệ thống sẵn sàng sản xuất. Bên cạnh việc có lỗi và chưa hoàn chỉnh, một dự án chạy bầy tác nhân trong nhiều ngày hoặc tuần rất đắt đỏ. Mặc dù giá cả đã giảm mạnh trong năm ngoái, nhưng các công việc chạy dài hạn với hàng trăm tác nhân AI vẫn có thể tăng chi phí.
Còn các vấn đề an ninh. Một hệ thống tự chủ gây ra lo lắng về các lỗ hổng, tràn dữ liệu và nhiều điều hơn nữa, và đòi hỏi nhiều lớp kiểm soát và khả năng kiểm toán mới.
Nhưng Chen nói rằng ông dự đoán một tương lai gần nơi mà thứ gì đó như thế này có thể sẵn sàng “để sử dụng rộng rãi và với chi phí không quá cao”. Ông giải thích rằng tiến bộ đến nay liên tục, và có nhiều sự mở khóa quan trọng ở mỗi bước. Ông nói rằng hiện tại, sự phấn khích được thúc đẩy bởi thực tế rằng đây là một ví dụ thực tế, thực tiễn về năng lực của mô hình, “so với cách mô hình này hoạt động trên các đánh giá và tiêu chuẩn học thuật và công cộng”.
Sự thay đổi thậm chí còn khiến những quan sát viên AI lâu năm ngạc nhiên. Trong một bài đăng gần đây, nhà nghiên cứu độc lập Simon Willison rằng đến năm 2029, ai đó sẽ xây dựng một trình duyệt web đầy đủ chủ yếu sử dụng AI — và điều đó thậm chí không đáng ngạc nhiên. Ông viết: “Xây dựng một trình duyệt web mới là một trong những dự án phần mềm phức tạp nhất mà tôi có thể tưởng tượng得到”. Cursor có thể đã tăng tốc dòng thời gian đó. Willison nói: “Tôi có thể sai mất ba năm”. “Tôi phải thừa nhận rằng tôi rất ngạc nhiên khi thấy thứ gì đó có năng lực này xuất hiện quá nhanh”.
Điều này nói về điều mà OpenAI và những người khác đã nói về như một “” — ý tưởng rằng các mô hình AI tinh tế nhất có thể làm nhiều thứ hơn những gì đã được triển khai công khai, nhưng sự kết hợp đúng đắn giữa các công cụ, thiết kế sản phẩm và giảm giá có thể đột nhiên khiến chúng có thể sử dụng quy mô. Vì vậy, mặc dù các công cụ như trình duyệt Cursor chưa hoàn toàn sẵn sàng cho thời điểm chính, nhưng đường đi rõ ràng.
Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.
Lĩnh vực: Tin nổi bật, Tin tức hàng ngày
SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.