Startup robot Trung Quốc 'vượt mặt' Nvidia trên bảng xếp hạng AI toàn cầu

Ảnh minh họa: South China Morning Post.
Trong bối cảnh AI dần hiện diện trong thế giới thực, cuộc đua phát triển bộ não robot đang trở thành chiến trường mới giữa hai cường quốc công nghệ hàng đầu thế giới, South China Morning Post đánh giá.
CUỘC CHIẾN MỚI TRONG LĨNH VỰC AI
Chỉ hai ngày sau khi Nvidia công bố mô hình Cosmos 3, được thiết kế nhằm giúp các hệ thống AI vật lý có khả năng “suy nghĩ trước khi hành động”, Spirit AI đã nhanh chóng thu hút sự chú ý của giới công nghệ.
Hôm 4/6, công ty có trụ sở tại Hàng Châu (tỉnh Chiết Giang) cho biết mô hình Spirit v1.6 của họ đã dẫn đầu bảng xếp hạng RoboArena với số điểm 1.924, vượt qua Cosmos3-Nano-Policy của Nvidia, đạt 1.881 điểm và xếp thứ hai. Vị trí thứ ba thuộc về DreamZero với 1.763 điểm, cũng là một dự án khác của Nvidia được công bố hồi tháng 2 năm nay.
RoboArena là bộ tiêu chuẩn đánh giá được Nvidia đồng phát triển cùng nhiều tổ chức nghiên cứu hàng đầu thế giới như Stanford University và University of California, Berkeley.
Kết quả này đặc biệt đáng chú ý bởi RoboArena là bộ tiêu chuẩn đánh giá được Nvidia đồng phát triển cùng nhiều tổ chức nghiên cứu hàng đầu thế giới như Stanford University và University of California, Berkeley. RoboArena được thiết kế để đo lường mức độ hiệu quả của các mô hình điều khiển robot đa năng trong chuyển hóa nhận thức và ra quyết định thành hành động thực tế.
Khác với các mô hình ngôn ngữ lớn (LLM) như ChatGPT hay Gemini, vốn được xây dựng để xử lý và tạo ra văn bản, hình ảnh hoặc mã lập trình, AI vật lý (Physical AI) được phát triển để giúp máy móc tương tác trực tiếp với thế giới thực.
AI vật lý thường được xây dựng dựa trên hai năng lực cốt lõi.
Thứ nhất là khả năng điều khiển hành động (policy capability), khả năng của mô hình chuyển đổi những gì quan sát được thành hành động cụ thể. Đây cũng chính là tiêu chí trọng tâm được RoboArena sử dụng để đánh giá và xếp hạng các mô hình.
Thứ hai là khả năng mô hình hóa thế giới (world model capability), năng lực mô phỏng, dự đoán và suy luận về những gì có thể xảy ra tiếp theo nếu một hành động nào đó được thực hiện.
Trong nhiều năm, hai năng lực này thường được phát triển tách biệt. Tuy nhiên, xu hướng mới của ngành là kết hợp chúng vào cùng một kiến trúc thống nhất.
TRUNG QUỐC "PHỦ BÓNG" TRÊN CÁC BẢNG XẾP HẠNG
Tháng 9 năm ngoái, các nhà nghiên cứu Trung Quốc đã giới thiệu khái niệm “Mô hình Thế giới - Chính sách” (World-Policy Model), tích hợp khả năng mô phỏng thế giới và lập kế hoạch hành động trong một hệ thống duy nhất. Cách tiếp cận này được kỳ vọng sẽ giúp robot đưa ra quyết định chính xác hơn trong những môi trường phức tạp và khó dự đoán.
Ưu thế của các công ty Trung Quốc không chỉ ở lĩnh vực mô hình điều khiển robot.
Trong bảng xếp hạng WorldArena, bộ tiêu chuẩn dùng để đánh giá bộ não AI có đủ thông minh để điều khiển robot hoạt động trong thế giới thực hay không, vị trí dẫn đầu hiện thuộc về WorldScape-0.2 do startup Trung Quốc Manifold AI phát triển.

Một mô hình robot của Spirit AI - Ảnh: VCG.
Ở lĩnh vực nhận thức, yếu tố giúp robot quan sát, hiểu và diễn giải môi trường xung quanh, vị trí số một hiện thuộc về AgiBot, một trong những công ty robot hàng đầu Trung Quốc. Mô hình GenieEnvisioner-Sim2.0-2B của hãng đang dẫn đầu bảng xếp hạng nhờ khả năng xây dựng thế giới mô phỏng từ dữ liệu video phục vụ cho các tác vụ điều khiển và thao tác robot, được công bố cách đây chưa đầy một tuần.
Theo truyền thông Trung Quốc, sự phát triển của AI vật lý Trung Quốc hiện được thúc đẩy bởi làn sóng đầu tư chưa từng có từ các quỹ mạo hiểm.
Ngày 4/6, Spirit AI công bố hoàn tất vòng gọi vốn trị giá 1,5 tỷ nhân dân tệ (tương đương khoảng 222 triệu USD). Đây đã là vòng huy động vốn thứ tư của công ty chỉ trong vòng ba tháng, một tốc độ được đánh giá là hiếm thấy ngay cả trong những giai đoạn bùng nổ nhất của ngành AI.
Một doanh nghiệp khác là XYZ Embodied AI, được ươm tạo từ Học viện Trí tuệ Nhân tạo Bắc Kinh, cũng cho biết vừa hoàn tất vòng gọi vốn tiền Series A. Công ty tiết lộ đã huy động được khoảng 1 tỷ nhân dân tệ chỉ trong vòng 10 tháng.
Trong khi đó, Manifold AI, công ty khởi nghiệp hàng đầu, đã hoàn thành 5 vòng gọi vốn chỉ trong 10 tháng. Vòng huy động gần nhất diễn ra vào tháng 4 vừa qua đã mang về cho công ty số vốn lên tới hàng trăm triệu nhân dân tệ.
Đáng chú ý, tại các trung tâm công nghệ lớn như Bắc Kinh và Thâm Quyến, chính quyền địa phương thậm chí đã xây dựng các "nhà máy dữ liệu" do nhà nước hậu thuẫn. Những cơ sở này có nhiệm vụ thu thập, chuẩn hóa và tạo lập khối dữ liệu khổng lồ về hoạt động của robot trong môi trường thực tế.
Hạ Chi
1 giờ trước
2 giờ trước
5 giờ trước
1 ngày trước
1 ngày trước
2 ngày trước
2 ngày trước
52 phút trước
4 phút trước
53 phút trước
16 phút trước
24 phút trước
37 phút trước
41 phút trước
44 phút trước
48 phút trước