Dữ liệu là yếu tố quyết định trong cuộc đua robot hình người

Robot trình diễn một điệu nhảy tại trung tâm hội nghị và triển lãm quốc tế Nam Ninh, khu tự trị dân tộc Choang Quảng Tây, Trung Quốc. Ảnh minh họa: THX/TTXVN
Báo Chosun Kinh tế dẫn nguồn từ giới chuyên gia nhận định, chất lượng và khối lượng dữ liệu dùng để huấn luyện trí tuệ nhân tạo (AI) sẽ quyết định trực tiếp khả năng hoạt động của robot hình người. Vì vậy, ngày càng nhiều công ty chuyển hướng sang khai thác dữ liệu tổng hợp (synthetic data) - loại dữ liệu được tạo ra bằng AI, mô phỏng hoặc các phương pháp thống kê thay vì thu thập trực tiếp từ môi trường thực tế.
Theo giới công nghiệp robot Hàn Quốc ngày 27/6, công ty AI vật lý RLWRLD (Real World) vừa ra mắt mô hình nền tảng robot mang tên RLDX-1. Khác với các mô hình AI ngôn ngữ lớn (LLM) được huấn luyện bằng lượng văn bản khổng lồ, mô hình nền tảng robot được huấn luyện trên dữ liệu từ thế giới thực nhằm giúp robot thực hiện nhiều nhiệm vụ vật lý khác nhau trong nhiều môi trường khác nhau. RLDX-1 được thiết kế để cánh tay robot có thể thao tác tinh vi như bàn tay con người, đồng thời nhận biết được trọng lượng, hình dạng, chuyển động của vật thể cũng như các điều kiện vật lý phức tạp.
Dữ liệu quyết định năng lực của robot
Các chuyên gia cho rằng để robot hình người có thể làm việc trong nhà máy, AI không chỉ cần học chuyển động của bàn tay con người mà còn phải nhận biết vị trí của vật thể, không gian sản xuất và vô số tình huống có thể xảy ra trong môi trường công nghiệp.
RLWRLD đã xây dựng hệ thống tự thu thập dữ liệu phục vụ cho việc huấn luyện mô hình ngôn ngữ - thị giác (VLM) và mô hình thị giác - hành động (VLA). Thông thường, việc thu thập dữ liệu cho bàn tay robot được thực hiện bằng cách để con người đeo các thiết bị cơ khí hoặc găng tay cảm biến nhằm ghi lại chuyển động. Tuy nhiên, phương pháp này hạn chế cử động tự nhiên của bàn tay và khó áp dụng cho các robot có năm ngón tay giống người.
RLDX-1 sử dụng camera ghi lại trực tiếp chuyển động của bàn tay trần, sau đó chuyển các cử động của khớp ngón tay thành dữ liệu số để huấn luyện AI. Cách tiếp cận này giúp robot học được những thao tác tinh vi như điều chỉnh lực nắm tùy theo trọng lượng vật thể hay phối hợp các ngón tay để thực hiện những nhiệm vụ phức tạp.
Dữ liệu tổng hợp giúp mở rộng quy mô huấn luyện
Bên cạnh dữ liệu thực tế, RLWRLD còn xây dựng hệ thống tạo dữ liệu tổng hợp nhằm mô phỏng môi trường làm việc của robot trong nhà máy. Dữ liệu thu thập từ môi trường thực có độ chính xác cao nhưng chi phí lớn và rất khó mở rộng. Trong khi đó, dữ liệu tổng hợp có thể được tạo ra với số lượng lớn thông qua AI và các mô hình mô phỏng, đồng thời tái hiện nhiều tình huống hiếm gặp hoặc khó thu thập ngoài thực tế.
Theo RLWRLD, RLDX-1 sử dụng AI tạo video để xây dựng dữ liệu tổng hợp. Hệ thống có thể tạo ra nhiều kịch bản với các vật thể, điều kiện ánh sáng và bối cảnh khác nhau, giúp quy mô bộ dữ liệu huấn luyện tăng khoảng 5 lần so với chỉ sử dụng dữ liệu thực.
Đại diện công ty cho biết việc thu thập dữ liệu từ robot đang vận hành trong nhà máy rất khó khăn vì môi trường sản xuất thường phức tạp và không có tính chuẩn hóa. Việc sử dụng video do AI tạo ra giúp khắc phục hạn chế này.
Công ty Robotics của Hàn Quốc cũng vừa giới thiệu robot hình người AI Sapiens có thể biểu diễn các điệu nhảy của nhóm nhạc thần tượng K-pop. Sau khi học từ các video gốc, AI Sapiens tiếp tục được huấn luyện bằng lượng lớn dữ liệu tổng hợp nhằm bổ sung các biến thể chuyển động. Những động tác vũ đạo phức tạp không chỉ đòi hỏi khả năng điều khiển từng khớp mà còn yêu cầu robot giữ thăng bằng và chuyển đổi tư thế chính xác.
Robotics cho biết nhờ có lượng dữ liệu tổng hợp phong phú, robot có thể thực hiện ổn định cả những động tác có độ khó cao.
Đầu tháng 6, nhóm nghiên cứu từ bốn trường đại học Trung Quốc, gồm Đại học Phúc Đán và Đại học Giao thông Thượng Hải, đã đăng trên kho lưu trữ arXiv công trình nghiên cứu về phương pháp sử dụng mô phỏng 3D để tạo dữ liệu tổng hợp phục vụ huấn luyện robot hình người. Nhóm nghiên cứu cho biết công nghệ mô phỏng có thể tạo ra lượng lớn dữ liệu sát với chuyển động thực tế. Các mô hình 3D được dùng để tái tạo vật thể chân thực từ hình ảnh thực tế, sau đó kết hợp điều khiển từ xa trong môi trường mô phỏng nhằm mở rộng bộ dữ liệu.
Kết quả thử nghiệm trên robot hình người thực tế cho thấy robot được huấn luyện bằng dữ liệu mô phỏng đạt tỷ lệ thành công cao hơn trong phần lớn nhiệm vụ so với robot chỉ học từ dữ liệu thu thập trực tiếp.
Giáo sư Han Jae-kwon, Khoa Kỹ thuật robot, Đại học Hanyang, cho biết hiệu suất của robot phụ thuộc rất lớn vào chất lượng dữ liệu, cũng giống như kết quả học tập của con người phụ thuộc vào phương pháp học. Hiện nay, các doanh nghiệp đang phát triển hàng chục phương pháp khác nhau để thu thập dữ liệu chuyển động của con người. Theo giáo sư Han, ưu điểm lớn nhất của dữ liệu tổng hợp là có thể tạo ra những tình huống nguy hiểm hoặc hiếm gặp mà rất khó thu thập ngoài thực tế, đồng thời sản xuất được hàng trăm nghìn, thậm chí hàng triệu mẫu dữ liệu phục vụ huấn luyện AI.
Giáo sư Han nhấn mạnh rằng việc xây dựng được hệ thống tạo và quản lý dữ liệu tổng hợp không hề dễ dàng, nhưng trong dài hạn, chính năng lực này sẽ trở thành yếu tố quyết định sức cạnh tranh của mỗi doanh nghiệp trong cuộc đua phát triển robot hình người.
Khánh Vân (P/v TTXVN tại Hàn Quốc)
2 giờ trước
2 giờ trước
19 phút trước
2 giờ trước
8 phút trước
31 phút trước
49 phút trước
1 giờ trước
1 giờ trước
2 giờ trước
2 giờ trước
2 giờ trước