Mô hình mới nhất của Anthropic xuất sắc trong việc tìm ra các lỗ hổng an toàn – nhưng cũng gây ra những mối nguy cơ an toàn mạng mới
(SeaPRwire) – Những mô hình AI bậc cao không chỉ đơn giản là giúp các kỹ sư viết mã code nhanh hơn hoặc tự động hóa các công việc thường xuyên. Chúng ngày càng có khả năng phát hiện những lỗi của mình.
Anthropic cho biết mô hình mới nhất của mình, Claude Opus 4.6, xuất sắc trong việc phát hiện những loại lỗ hổng phần mềm là nền tảng cho các cuộc tấn công mạng lớn. Theo một báo cáo, trong quá trình thử nghiệm, Opus 4.6 đã xác định hơn 500 lỗ hổng zero-day chưa được biết trước đây – những lỗ hổng mà người viết phần mềm hoặc bên chịu trách nhiệm sửa chữa hoặc chữa lỗi không biết – trên các thư viện phần mềm mã nguồn mở. Quan trọng là, mô hình không được chỉ định một cách rõ ràng để tìm kiếm các lỗ hổng bảo mật, mà là tự phát hiện và báo hiệu các vấn đề.
Anthropic cho biết “kết quả cho thấy rằng các mô hình ngôn ngữ có thể mang lại giá trị thực trên các công cụ phát hiện hiện có”, nhưng đồng thời công nhận rằng các khả năng này cũng vốn có tính “lưỡng bái”.
Các khả năng giống nhau giúp các công ty tìm và chữa lỗ hổng bảo mật cũng có thể dễ dàng được sử dụng độc hại bởi các tấn công者 để phát hiện và khai thác các lỗ hổng trước khi người bảo vệ có thể tìm thấy chúng. Một mô hình AI có thể tự động xác định các khai thác zero-day trong phần mềm được sử dụng rộng rãi có thể thúc đẩy cả hai bên trong cuộc đua an ninh mạng – có thể khiến lợi thế chuyển sang cho người hành động nhanh nhất.
Logan Graham, trưởng nhóm red team bậc cao của Anthropic, cho biết công ty coi an ninh mạng là một cuộc thi đấu giữa công cuộc tấn công và phòng thủ, và muốn đảm bảo rằng người bảo vệ có thể truy cập vào các công cụ này trước.
Để quản lý một số rủi ro, Anthropic đang triển khai các hệ thống phát hiện mới để giám sát hoạt động bên trong Claude khi nó tạo ra các phản hồi, sử dụng những gì công ty gọi là “câu hỏi” để báo hiệu các sử dụng độc hại trong thời gian thực. Công ty cho biết nó cũng đang mở rộng khả năng thực thi, bao gồm khả năng chặn các giao thông được xác định là độc hại. Anthropic thừa nhận cách tiếp cận này sẽ tạo ra sự mâu thuẫn cho các nhà nghiên cứu an ninh hợp pháp và công việc phòng thủ, và đã cam kết hợp tác với cộng đồng an ninh để giải quyết những thách thức này. Các biện pháp bảo vệ, công ty cho biết, đại diện cho “một bước tiến ý nghĩa” trong việc phát hiện và phản ứng nhanh chóng với các sử dụng độc hại, mặc dù công việc vẫn đang diễn ra.
OpenAI, ngược lại, đã sử dụng cách tiếp cận cẩn thận hơn với mô hình mã hóa mới của mình, GPT-5.3-Codex, cũng được phát hành vào thứ Năm. Công ty đã nhấn mạnh rằng mặc dù mô hình đã cải thiện năng suất mã hóa, những rủi ro an ninh mạng nghiêm trọng đi kèm với những cải thiện này. Trưởng giám đốc OpenAI Sam Altman nói trong một bài đăng trên rằng GPT-5.3-Codex là mô hình đầu tiên được đánh giá “cao” về rủi ro an ninh mạng trong khung chuẩn bị bên trong công ty.
Kết quả là, OpenAI đang tung ra GPT-5.3-Codex với các kiểm soát chặt hơn. Trong khi mô hình có sẵn cho các người dùng ChatGPT có phí cho các công việc phát triển hàng ngày, công ty đang trì hoãn quyền truy cập API đầy đủ và hạn chế các trường hợp sử dụng có rủi ro cao có thể cho phép tự động hóa quy mô lớn. Các ứng dụng nhạy cảm hơn đang được hạn chế sau các biện pháp bảo vệ bổ sung, bao gồm một chương trình truy cập đáng tin cậy cho các chuyên gia an ninh được kiểm tra. OpenAI cho biết trong cuộc ra mắt rằng nó vẫn chưa có “bằng chứng xác định” mô hình có thể tự động hóa đầy đủ các cuộc tấn công mạng nhưng đang sử dụng cách tiếp cận phòng ngừa, triển khai cái mà nó miêu tả là bộ đệm an ninh mạng toàn diện nhất đến nay, bao gồm giám sát nâng cao, đào tạo an toàn và cơ chế thực thi được thông báo bởi tình báo mối đe dọa.
Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.
Lĩnh vực: Tin nổi bật, Tin tức hàng ngày
SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.