🔍
Chuyên mục: Công nghệ

Google phát hiện các mô hình AI của Trung Quốc tạo tranh luận nội bộ như trí tuệ tập thể con người

5 giờ trước
Nghiên cứu mới của Google về DeepSeek R1 và Alibaba Cloud QwQ-32B cho thấy các mô hình suy luận tạo ra tranh luận đa tác nhân nội bộ, mô phỏng trí tuệ tập thể con người.

Các nhà nghiên cứu dựa trên phân tích "dấu vết suy luận" của các mô hình Trung Quốc, vốn lần đầu tiên được công bố cho người dùng khi DeepSeek phát hành mô hình suy luận của mình cách đây một năm. Ảnh: Shutterstock.

Các nhà nghiên cứu của Google phát hiện rằng các mô hình suy luận tạo ra những cuộc tranh luận đa tác nhân bên trong, mà họ gọi là “societies of thought” (xã hội tư duy).

Nghiên cứu mới của Google về các mô hình AI của DeepSeek và Alibaba Cloud cho thấy những mô hình suy luận mạnh, có khả năng “tư duy”, đã thể hiện nhận thức nội tại giống với các cơ chế nền tảng của trí tuệ tập thể ở con người.

Các phát hiện được công bố hôm 22/1 cho thấy sự đa dạng về góc nhìn – chứ không chỉ quy mô tính toán – mới là yếu tố thúc đẩy sự gia tăng “trí thông minh” của các mô hình AI, đồng thời nhấn mạnh vai trò ngày càng quan trọng của các mô hình mã nguồn mở Trung Quốc đối với nghiên cứu liên ngành tiên tiến tại Mỹ.

Thông qua các thí nghiệm với mô hình R1 của DeepSeek và QwQ-32B của Alibaba Cloud, nhóm nghiên cứu phát hiện rằng các mô hình suy luận này tạo ra những cuộc tranh luận đa tác nhân bên trong – thứ họ gọi là “xã hội tư duy” – trong đó sự tương tác giữa các đặc điểm “tính cách” khác nhau và chuyên môn theo lĩnh vực đã tạo ra năng lực vượt trội.

“Chúng tôi cho rằng các mô hình suy luận thiết lập một sự tương đồng mang tính tính toán với trí tuệ tập thể trong các nhóm con người, nơi sự đa dạng cho phép giải quyết vấn đề tốt hơn khi được cấu trúc một cách có hệ thống”, nhóm nghiên cứu viết trong bài báo đăng trên kho lưu trữ truy cập mở arXiv.

Nghiên cứu này, hiện chưa được bình duyệt, do bốn nhà nghiên cứu thuộc nhóm “Paradigms of Intelligence” của Google thực hiện – một nhóm chuyên khám phá bản chất của trí tuệ bằng các phương pháp liên ngành.

Ông Junsol Kim, nghiên cứu sinh tiến sĩ ngành xã hội học tại Đại học Chicago, là tác giả chính của nghiên cứu, trong khi ông Blaise Agüera y Arcas, Phó Chủ tịch Google, được ghi tên là tác giả cuối cùng.

Các mô hình suy luận “tư duy” thông qua nhiệm vụ đã trở thành loại hệ thống AI nền tảng chủ đạo kể từ khi OpenAI – nhà phát triển ChatGPT – giới thiệu dòng mô hình o-series vào tháng 9/2024.

Theo công ty đánh giá chuẩn Artificial Analysis, những mô hình này – được thiết kế để “tư duy” bằng cách sử dụng nhiều tài nguyên tính toán hơn trong quá trình triển khai – đã góp phần làm tăng đáng kể năng lực của AI, đồng thời làm giảm chi phí.

Các nhà nghiên cứu Google dựa trên phân tích “dấu vết suy luận” của các mô hình Trung Quốc – tức các bước trung gian, theo từng bước, được tạo ra trước khi mô hình đưa ra câu trả lời cuối cùng. Những dấu vết này lần đầu tiên được công khai với người dùng khi start-up DeepSeek tại Hàng Châu phát hành mô hình suy luận đầu tiên R1 cách đây một năm.

Nhóm nghiên cứu cho biết các dấu vết suy luận này mô phỏng “những tương tác xã hội giả lập”, bao gồm đặt câu hỏi, tiếp nhận góc nhìn và hòa giải các quan điểm khác nhau. Khi các mô hình được điều chỉnh để “trò chuyện với chính mình” nhiều hơn, độ chính xác trong suy luận của chúng được cải thiện.

Những phát hiện này có thể làm thay đổi cách con người khái niệm hóa các mô hình AI, từ “những thực thể giải quyết vấn đề đơn lẻ” sang “các kiến trúc suy luận tập thể, nơi trí tuệ không chỉ phát sinh từ quy mô mà từ sự tương tác có cấu trúc giữa các tiếng nói khác biệt”, nhóm nghiên cứu nhận định.

Google được xem là một trong những công ty AI hàng đầu thế giới, với mô hình suy luận chủ lực mới nhất Gemini Pro 3 – do DeepMind, nhóm phát triển mô hình nền tảng của hãng, xây dựng – được Artificial Analysis đánh giá là một trong những mô hình mạnh nhất toàn cầu.

Nghiên cứu mới nhất của Google sử dụng các mô hình Trung Quốc làm đối tượng thử nghiệm cũng phản ánh xu hướng ngày càng phụ thuộc vào các mô hình mã nguồn mở Trung Quốc trong giới học thuật Mỹ, bao gồm cả tại những cơ sở hàng đầu như Đại học Stanford.

Theo ông Chai Wenhao, nghiên cứu sinh tiến sĩ ngành khoa học máy tính tại Đại học Princeton, các lớp học tại trường ông hiện gần như chỉ sử dụng các mô hình Trung Quốc, do có rất ít mô hình mở của Mỹ đạt hiệu năng tương đương.

Theo SCMP

Huyền Chi

TIN LIÊN QUAN


DeepSeek giờ ra sao
Tạp chí Tri thức 3 ngày trước





















Home Icon VỀ TRANG CHỦ