Cỗ trợ của Nvidia cho Groq cho thấy nền kinh tế trong việc sản xuất chip AI vẫn chưa ổn định

(SeaPRwire) – Nvidia đã xây dựng đế chế AI của mình trên nền GPU. Nhưng khoản đầu tư 20 tỉ đô la vào Groq của hãng cho thấy công ty không tin rằng chỉ bằng GPU sẽ thống trị giai đoạn quan trọng nhất của AI cho đến nay: chạy các mô hình trên quy mô lớn, được gọi là suy luận (inference).
Cuộc chiến để giành chiến thắng trong lĩnh vực suy luận AI, tất nhiên, là về mặt kinh tế của nó. Khi một mô hình được đào tạo xong, mọi việc hữu ích mà nó thực hiện – trả lời câu hỏi, tạo mã code, đề xuất sản phẩm, tóm tắt tài liệu, cung cấp năng lực cho chatbot hoặc phân tích hình ảnh – đều xảy ra trong quá trình suy luận. Đó là thời điểm AI chuyển từ một chi phí đã bỏ ra thành một dịch vụ tạo ra doanh thu, cùng với tất cả áp lực đi kèm để giảm chi phí, rút ngắn độ trễ (thời gian bạn phải đợi AI trả lời) và cải thiện hiệu quả.
Áp lực đó chính là lý do tại sao suy luận đã trở thành chiến trường tiếp theo của ngành công nghiệp để tìm kiếm lợi潤 tiềm năng – và lý do tại sao Nvidia, trong một thỏa thuận được công bố ngay trước kỳ nghỉ Giáng sinh, đã cấp phép sử dụng công nghệ từ Groq, một công ty khởi nghiệp chuyên sản xuất chip được thiết kế đặc biệt cho suy luận AI nhanh và có độ trễ thấp, và thuê hầu hết đội ngũ của họ, bao gồm cả người sáng lập và CEO Jonathan Ross.
Suy luận là ‘cuộc cách mạng công nghiệp’ của AI
CEO của Nvidia, Jensen Huang, đã nói rõ về thách thức của suy luận. Mặc dù ông nói rằng Nvidia “xuất sắc trong mọi giai đoạn của AI”, nhưng ông đã cho biết trong cuộc gọi báo cáo kết quả quý 3 vào tháng 11 rằng suy luận là “rất, rất khó”. Không phải là một trường hợp đơn giản chỉ cần đưa vào một lời nhắc và nhận về một câu trả lời, suy luận hiện đại phải hỗ trợ quá trình suy luận liên tục, hàng triệu người dùng đồng thời, đảm bảo độ trễ thấp và có ràng buộc chi phí không ngừng. Và các tác nhân AI, phải xử lý nhiều bước, sẽ làm tăng đáng kể nhu cầu và độ phức tạp của suy luận – cũng như làm tăng mức độ nghiêm trọng nếu xảy ra sai sót.
“Mọi người nghĩ rằng suy luận chỉ là một lần và do đó rất dễ dàng. Bất kỳ ai cũng có thể tiếp cận thị trường theo cách đó,” Huang nói. “Nhưng hóa ra đây là điều khó khăn nhất của tất cả, bởi vì suy nghĩ, hóa ra, là khá khó.”
Việc Nvidia hỗ trợ Groq củng cố niềm tin đó và cho thấy ngay cả công ty thống trị lĩnh vực đào tạo AI cũng đang đợi xem kinh tế của suy luận cuối cùng sẽ phát triển như thế nào.
Huang cũng đã nói thẳng về tầm quan trọng của suy luận đối với sự phát triển của AI. Trong một cuộc trò chuyện gần đây trên podcast BG2, ông cho biết suy luận đã chiếm hơn 40% doanh thu liên quan đến AI – và dự đoán rằng số liệu này “sắp tăng lên một tỉ lần”.
“Đó là phần mà hầu hết mọi người chưa hoàn toàn nắm bắt được,” Huang nói. “Đây là ngành công nghiệp mà chúng ta đang nói đến. Đây là cuộc cách mạng công nghiệp.”
Sự tự tin của CEO giúp giải thích tại sao Nvidia sẵn sàng đẩy mạnh việc đợi xem cách thức triển khai suy luận, ngay cả khi nền kinh tế cơ bản vẫn chưa rõ ràng.
Nvidia muốn垄斷 thị trường suy luận
Nvidia đang phân tán rủi ro để đảm bảo rằng họ có tay vào mọi phần của thị trường, Karl Freund, người sáng lập và nhà phân tích chính của Cambrian AI Research, đã nói. “Nó hơi giống như Meta mua lại Instagram,” ông giải thích. “Không phải là họ nghĩ rằng Facebook xấu, họ chỉ biết rằng có một giải pháp thay thế mà họ muốn đảm bảo không cạnh tranh với họ.”
Điều đó, mặc dù Huang đã đưa ra những tuyên bố mạnh mẽ về kinh tế của nền tảng suy luận hiện có của Nvidia. “Tôi đoán họ phát hiện ra rằng nó không gây được tiếng vang với khách hàng như mong đợi, hoặc có thể họ thấy điều gì đó trong cách tiếp cận dựa trên chip và bộ nhớ mà Groq và một công ty khác tên là D – Matrix có,” Freund nói, đề cập đến một công ty khởi nghiệp chip AI nhanh và có độ trễ thấp khác được đầu tư bởi [nội dung bị thiếu] và đã huy động được 275 triệu đô la với giá trị 2 tỉ đô la.
Freund nói rằng việc Nvidia bước vào Groq có thể nâng cao cả ngành. “Tôi chắc chắn D – Matrix là một công ty khởi nghiệp khá hạnh phúc lúc này, bởi vì tôi đoán vòng tài trợ tiếp theo của họ sẽ có giá trị cao hơn nhiều nhờ [thỏa thuận Nvidia – Groq],” ông nói.
Các nhà quản lý ngành công nghiệp khác nói rằng kinh tế của suy luận AI đang thay đổi khi AI vượt ra khỏi chatbot sang các hệ thống thời gian thực như robot, drone và công cụ an ninh. Những hệ thống đó không thể chấp nhận được sự chậm trễ khi gửi dữ liệu đi và đến đám mây, hoặc rủi ro rằng sức mạnh tính toán không luôn sẵn có. Thay vào đó, chúng ưu tiên các chip chuyên dụng như của Groq hơn là các cụm GPU tập trung.
Behnam Bastani, người sáng lập và CEO của OpenInfer, tập trung vào việc chạy suy luận AI gần nơi dữ liệu được tạo ra – chẳng hạn như trên thiết bị, cảm biến hoặc máy chủ cục bộ thay vì các trung tâm dữ liệu đám mây xa – nói rằng công ty khởi nghiệp của ông đang nhắm vào các ứng dụng thuộc loại “cận biên”.
Ông nhấn mạnh rằng thị trường suy luận vẫn còn mới mẻ. Và Nvidia đang tìm cách垄斷 thị trường đó với thỏa thuận Groq của mình. Với kinh tế của suy luận vẫn chưa rõ ràng, ông nói rằng Nvidia đang cố gắng định vị bản thân như một công ty trải dài trên toàn bộ ngăn xếp phần cứng suy luận, thay vì đặt cược vào một kiến trúc duy nhất.
“Nó giúp Nvidia trở thành một cái mũi tên lớn hơn,” ông nói.
Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.
Lĩnh vực: Tin nổi bật, Tin tức hàng ngày
SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.