Độc quyền: Nhà nghiên cứu thâm niên Google DeepMind David Silver rời bỏ để thành lập startup AI riêng

(SeaPRwire) –   David Silver, một nhà nghiên cứu nổi tiếng đã đóng góp quan trọng vào nhiều đột phá nổi tiếng nhất của công ty, đã rời công ty để thành lập một công ty khởi nghiệp của riêng mình.

Theo một người có kiến thức trực tiếp về kế hoạch của Silver, anh ấy đang thành lập một công ty khởi nghiệp mới tên là Ineffable Intelligence, có trụ sở tại London. Người đó cho biết công ty đang tích cực tuyển dụng các nhà nghiên cứu trí tuệ nhân tạo và đang tìm kiếm vốn đầu tư mạo hiểm.

Người đó cho biết Google DeepMind đã thông báo cho nhân viên về việc Silver rời đi vào đầu tháng này. Silver đã nghỉ phép trong những tháng trước khi rời đi và không bao giờ trở lại chính thức vào vai trò của mình tại DeepMind.

Một người phát ngôn của Google DeepMind đã xác nhận việc Silver rời đi trong một tuyên bố bằng email gửi cho . Người phát ngôn nói: “Những đóng góp của Dave vô giá và chúng tôi biết ơn những tác động anh ấy đã tạo ra cho công việc của chúng tôi tại Google DeepMind.”

Không thể liên hệ ngay được với Silver để lấy ý kiến của anh ấy.

Theo các tài liệu được nộp với cơ quan đăng ký kinh doanh của Vương quốc Anh – Companies House, Ineffable Intelligence được thành lập vào tháng 11 năm 2025 và Silver được bổ nhiệm làm giám đốc công ty vào ngày 16 tháng 1 năm 2026.

Ngoài ra, trang web cá nhân của Silver hiện liệt kê liên hệ của anh ấy là Ineffable Intelligence và cung cấp một địa chỉ email của Ineffable Intelligence, mặc dù nó vẫn nói rằng anh ấy “đứng đầu nhóm học tăng cường” tại Google DeepMind.

Ngoài công việc tại Google DeepMind, Silver là giáo sư tại Đại học College London. Anh ấy vẫn duy trì mối liên hệ đó.

Một nhân vật quan trọng đằng sau nhiều đột phá của DeepMind

Silver là một trong những nhân viên đầu tiên của DeepMind khi công ty được thành lập vào năm 2010. Anh biết Demis Hassabis – đồng sáng lập DeepMind từ thời đại đại học. Silver đóng góp quan trọng vào nhiều đột phá ban đầu của công ty, bao gồm thành tựu điển hình năm 2016 với , chứng minh rằng một chương trình trí tuệ nhân tạo có thể đánh bại những người chơi giỏi nhất thế giới trong trò chơi chiến lược cổ đại Cờ vây.

Anh cũng là thành viên quan trọng của nhóm phát triển , một chương trình trí tuệ nhân tạo có thể đánh bại những người chơi giỏi nhất thế giới trong trò chơi video phức tạp Starcraft 2, AlphaZero, có thể chơi cờ vua, cờ tướng và cờ vây ở mức độ siêu con người, và , có thể thành thạo nhiều loại trò chơi khác nhau tốt hơn con người mặc dù nó bắt đầu không có bất kỳ kiến thức nào về trò chơi, bao gồm cả không biết luật chơi của các trò chơi.

Gần đây hơn, anh đã làm việc cùng nhóm DeepMind tạo ra , một hệ thống trí tuệ nhân tạo có thể trả lời thành công các câu hỏi từ Kỳ thi Toán Quốc tế. Anh cũng là một trong những tác giả của bài báo nghiên cứu năm 2023 giới thiệu dòng mô hình trí tuệ nhân tạo Gemini ban đầu của Google. Gemini hiện là sản phẩm và thương hiệu trí tuệ nhân tạo thương mại hàng đầu của Google.

Tìm kiếm con đường đến trí tuệ siêu nhân tạo

Theo người biết rõ suy nghĩ của anh, Silver đã nói với bạn bè rằng anh muốn trở lại với “sự kinh ngạc và thẩm mỹ khi giải quyết những vấn đề khó nhất trong trí tuệ nhân tạo” và coi trí tuệ siêu nhân – hay trí tuệ nhân tạo sẽ thông minh hơn bất kỳ con người nào và có thể thông minh hơn cả nhân loại – là thách thức chưa được giải quyết lớn nhất trong lĩnh vực này.

Một số nhà nghiên cứu trí tuệ nhân tạo nổi tiếng khác cũng đã rời các phòng thí nghiệm trí tuệ nhân tạo thành lập từ lâu trong những năm gần đây để thành lập các công ty khởi nghiệp chuyên theo đuổi trí tuệ siêu nhân. Ilya Sutskever, cựu nhà khoa học trưởng tại OpenAI, đã thành lập một công ty tên là Safe Superintelligence (SSI) vào năm 2024. Cho đến nay, công ty đó đã kiếm được vốn đầu tư mạo hiểm và có giá trị được báo cáo lên tới 30 tỉ đô la. Một số đồng nghiệp của Silver đã làm việc trên AlphaGo, AlphaZero và MuZero cũng gần đây đã rời đi để thành lập Reflection AI, một công ty khởi nghiệp trí tuệ nhân tạo cũng nói rằng đang theo đuổi trí tuệ siêu nhân. Trong khi đó, vào năm ngoái đã thành lập một “Nhà thí nghiệm Trí tuệ siêu nhân” mới do cựu CEO và sáng lập Scale AI – Alexandr Wang đứng đầu.

Vượt ra ngoài mô hình ngôn ngữ

Silver nổi tiếng với công việc nghiên cứu về học tăng cường, một cách huấn luyện mô hình trí tuệ nhân tạo từ kinh nghiệm thay vì dữ liệu lịch sử. Trong học tăng cường, một mô hình thực hiện một hành động, thường trong một trò chơi hoặc mô phỏng, và sau đó nhận được phản hồi về việc những hành động đó có hữu ích trong việc giúp nó đạt được mục tiêu hay không. Thông qua quá trình thử thách và sai sót trong suốt nhiều hành động, trí tuệ nhân tạo học được những cách tốt nhất để đạt được mục tiêu.

Nhà nghiên cứu này thường được coi là một trong những người ủng hộ học tăng cường kiên quyết nhất, cho rằng đó là cách duy nhất để tạo ra trí tuệ nhân tạo có thể vượt quá kiến thức con người một ngày nào đó.

Trong một podcast do Google DeepMind sản xuất được phát hành vào tháng 4, anh nói rằng các mô hình ngôn ngữ lớn (LLM), loại trí tuệ nhân tạo gây ra sự phấn khích gần đây về trí tuệ nhân tạo, rất mạnh mẽ, nhưng chúng cũng bị giới hạn bởi kiến thức con người. Anh nói: “Chúng ta muốn vượt ra ngoài những gì con người biết và để làm điều đó, chúng ta sẽ cần một phương pháp khác và phương pháp đó sẽ yêu cầu các trí tuệ nhân tạo của chúng ta thực sự tự tìm ra cách giải quyết vấn đề và phát hiện những điều mới mà con người không biết.” Anh đã kêu gọi một “thời đại kinh nghiệm” mới trong trí tuệ nhân tạo sẽ dựa trên học tăng cường.

Hiện tại, các mô hình ngôn ngữ lớn có giai đoạn phát triển “huấn luyện trước” sử dụng cái gọi là học không giám sát. Chúng hấp thụ một lượng lớn văn bản và học cách dự đoán những từ nào có khả năng thống kê cao nhất sẽ theo sau những từ khác trong một bối cảnh nhất định. Sau đó, chúng có giai đoạn phát triển “huấn luyện sau” sử dụng một số học tăng cường, thường với các người đánh giá con người xem các đầu ra của mô hình và đưa ra phản hồi cho trí tuệ nhân tạo, đôi khi chỉ dưới dạng một dấu ngón tay lên hoặc xuống. Thông qua phản hồi này, xu hướng của mô hình tạo ra các đầu ra hữu ích được tăng cường.

Tuy nhiên, loại huấn luyện này cuối cùng vẫn phụ thuộc vào những gì con người biết – cả vì nó phụ thuộc vào những gì con người đã học và viết lại trong quá khứ trong giai đoạn huấn luyện trước và bởi vì cách thức huấn luyện sau của các mô hình ngôn ngữ lớn thực hiện học tăng cường cuối cùng dựa trên sở thích con người. Tuy nhiên, trong một số trường hợp, trực giác con người có thể sai hoặc ngắn hạn.

Ví dụ, nổi tiếng là trong nước đi thứ 37 của trận đấu thứ hai năm 2016 giữa AlphaGo và người vô địch thế giới cờ vây Lee Sedol, AlphaGo đã có một nước đi rất phi truyền thống đến nỗi tất cả các chuyên gia con người bình luận về trận đấu đều chắc chắn rằng đó là một sai lầm. Nhưng sau đó, nước đi đó đã được chứng minh là chìa khóa để AlphaGo chiến thắng trận đấu đó. Tương tự, những người chơi cờ vua con người thường mô tả cách AlphaZero chơi cờ vua là “bất thường” – và tuy nhiên, những nước đi trái trực giác của nó thường tỏ ra rất xuất sắc.

Nếu các người đánh giá con người đưa ra đánh giá về những nước đi như vậy trong quá trình học tăng cường được sử dụng trong huấn luyện sau của các mô hình ngôn ngữ lớn, họ có thể cho những nước đi đó là “không được” bởi vì chúng trông như những sai lầm đối với các chuyên gia con người. Đó là lý do tại sao những người theo đuổi học tăng cường thuần túy như Silver nói rằng để đạt được trí tuệ siêu nhân, trí tuệ nhân tạo sẽ không chỉ phải vượt ra ngoài kiến thức con người, mà còn cần phải loại bỏ nó và học cách đạt được mục tiêu từ đầu, dựa trên các nguyên tắc cơ bản.

Người biết rõ suy nghĩ của Silver nói rằng anh đã nói rằng Ineffable Intelligence sẽ hướng tới việc xây dựng “một trí tuệ siêu nhân học không ngừng tự phát hiện ra nền tảng của tất cả kiến thức”.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.