Chuyên mục: CNTT - Viễn thông

Claude Mythos: Chiêu trò PR của Anthropic hay thực sự là 'quái vật' AI?

10 giờ trước

Mô hình trí tuệ nhân tạo mới tên Claude Mythos của Anthropic đang gây xôn xao giới an ninh mạng.

Anthropic tạm hoãn phát hành rộng rãi mô hình với lý do Claude Mythos nguy hiểm đến mức đem lại mối đe dọa nghiêm trọng đối với an ninh phần mềm trên mọi hệ điều hành lẫn trình duyệt web chính.

Anthropic tạm hoãn phát hành rộng rãi Claude Mythos - Ảnh: NurPhoto via Getty Images

“Quái vật AI” Claude Mythos?

Claude Mythos không chỉ là bản nâng cấp từ dòng Claude 3.5, mà ở cấp độ năng lực hoàn toàn mới. Trong các bài kiểm tra, mô hình tự xây dựng chuỗi tấn công nhiều bước để thoát khỏi môi trường máy tính bị giới hạn, truy cập internet và gửi thư điện tử thông báo cho nhà nghiên cứu.

Đặc biệt theo tài liệu từ Anthropic, Claude Mythos đã phát hiện hàng nghìn lỗ hổng trên nhiều hệ điều hành, trình duyệt đến phần mềm mã nguồn mở. Trong số đó có không ít lỗ hổng chưa từng được biết đến, chẳng hạn một lỗi tồn tại suốt 27 năm trong OpenBSD.

So với các mô hình trước đó có tỷ lệ thành công lúc thực hiện nhiệm vụ an ninh mạng gần như bằng 0%, Claude Mythos đạt tỷ lệ lên đến 72%.

Trước khả năng của mô hình mới, Anthropic phải khởi động dự án Glasswing hợp tác với loạt đơn vị lớn như Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks để vá số lỗ hổng mà Claude Mythos phát hiện.

Nếu những gì Anthropic tuyên bố về khả năng của mô hình mới là sự thật thì giới an ninh mạng sắp đối mặt mối nguy vô cùng lớn. AI có thể tìm thấy và khai thác nhiều lỗ hổng chưa từng được biết đến hơn trên hệ điều hành người dùng cuối, hệ thống máy chủ hay hệ thống cơ sở hạ tầng quan trọng. Chúng xác định chỉ cần qua gợi ý mà chẳng cần đến chuyên môn lập trình cấp cao.

Theo giám đốc công nghệ CrowdStrike Elia Zaitsev: “Khoảng thời gian giữa phát hiện lỗ hổng với bị khai thác đã bị thu hẹp, từ hàng tháng xuống chỉ vài phút với AI. Bản xem trước Claude Mythos cho thấy kịch bản khả dĩ mà bên phòng thủ an ninh mạng phải đối mặt ở quy mô lớn. Bên tấn công chắc chắn sẽ tìm cách khai thác”.

Chỉ là chiêu trò PR?

Thông tin từ Anthropic nghe qua quả thực rất đáng sợ, nhưng giới chuyên gia cùng cộng đồng công nghệ vẫn đặt nghi vấn về động thái của công ty.

Việc công bố một mô hình cực mạnh nhưng lại từ chối phát hành rộng rãi là chiến thuật PR kinh điển nhằm tạo tiếng vang và nâng tầm vị thế. Làm vậy cũng dễ dẫn đến tình trạng “khan hiếm giả tạo” kích thích tâm lý tò mò của người dùng.

Hơn nữa thay vì phát hành rộng rãi, Anthropic lại chỉ cấp quyền truy cập Claude Mythos cho 40 đơn vị hàng đầu thuộc dự án Glasswing – khiến nhiều người cho rằng đây là công cụ dành riêng cho giới tinh hoa.

Về mặt số liệu, con số hàng nghìn lỗ hổng không phải kết quả kiểm chứng trực tiếp mà được suy ra từ một tệp mẫu chỉ gồm 198 báo cáo đã trải qua đánh giá bởi con người.

Vài ví dụ cụ thể cũng đáng chú ý. Claude Mythos phát hiện một lỗi tồn tại 16 năm trong FFmpeg, nhưng Anthropic thừa nhận việc khai thác lỗi này trên thực tế là rất khó. Tương tự, một số lỗi tiềm tàng trên Linux không thể bị khai thác do hệ điều hành đặt nhiều lớp bảo vệ

Giới chuyên gia cho rằng trí tuệ nhân tạo hiện tại (gồm cả Claude Mythos) chưa phải hệ thống có ý thức hay khả năng tự hành động như tin tặc thực thụ. Chúng chỉ mới đóng vai trò công cụ xử lý dữ liệu hỗ trợ phát hiện lỗi chứ chưa thể tự động khai thác lỗ hổng ngoài thực tế.

Cẩm Bình

Nguồn: https://baomoi.com/claude-mythos-chieu-tro-pr-cua-anthropic-hay-thuc-su-la-quai-vat-ai-c54918790.epi

TIN LIÊN QUAN