🔍
Chuyên mục: Công nghệ

Công nghệ bộ nhớ đa tầng giúp robot khắc phục tình trạng 'não cá vàng'

3 giờ trước
Một kiến trúc bộ nhớ mới dành cho robot vừa được giới thiệu, giúp khắc phục tình trạng 'não cá vàng' - hiện tượng robot nhanh chóng quên ngữ cảnh khi thực hiện nhiệm vụ. Công nghệ này cho phép robot duy trì sự tập trung trong thời gian dài và thực hiện các công việc nhiều bước phức tạp.

Trong những năm gần đây, robot và trí tuệ nhân tạo đã đạt nhiều tiến bộ đáng kể, từ nhận diện hình ảnh đến thao tác vật lý phức tạp. Tuy nhiên, robot vẫn có một nhược điểm lớn cần khắc phục: tình trạng khó khăn khi phải ghi nhớ và xử lý chuỗi hành động kéo dài. Giới nghiên cứu gọi hiện tượng này là “não cá vàng”, ám chỉ khả năng ghi nhớ rất ngắn khiến robot dễ quên ngữ cảnh của nhiệm vụ đang thực hiện.

Để giải quyết vấn đề này, các nhà phát triển robot đã đưa ra một kiến trúc bộ nhớ mới mang tên MEM (Multiscale Embodied Memory - bộ nhớ hiện thân đa tầng). Công nghệ này được thiết kế nhằm giúp robot kết hợp nhiều dạng thông tin khác nhau để duy trì nhận thức về môi trường và tiến trình công việc trong thời gian dài hơn.

Ảnh minh họa.

Thách thức từ “não cá vàng” của robot

Trong nhiều hệ thống robot hiện nay, trí tuệ nhân tạo thường hoạt động dựa trên mô hình thị giác - ngôn ngữ - hành động (VLA). Các mô hình này cho phép robot quan sát môi trường, phân tích dữ liệu và đưa ra hành động phù hợp. Tuy nhiên, khi nhiệm vụ kéo dài qua nhiều bước, hệ thống dễ mất ngữ cảnh hoặc không nhớ chính xác các bước trước đó.

Nguyên nhân chính của hiện tượng này nằm ở cách robot lưu trữ dữ liệu. Nếu cố gắng lưu trữ toàn bộ video ở độ phân giải cao trong thời gian dài, hệ thống sẽ tiêu tốn năng lượng tính toán rất lớn. Điều này khiến robot khó xử lý thông tin nhanh chóng và đôi khi dẫn đến việc robot lặp lại hành động sai chỉ vì chúng xuất hiện trong dữ liệu lịch sử.

Hệ quả là robot có thể gặp khó khăn khi thực hiện những nhiệm vụ tưởng chừng đơn giản với con người, chẳng hạn như dọn dẹp nhà bếp hay chuẩn bị một bữa ăn. Những công việc này đòi hỏi chuỗi hành động liên tục và khả năng ghi nhớ những bước đã thực hiện.

Bộ nhớ đa tầng: video cho chi tiết, ngôn ngữ cho ngữ cảnh

Kiến trúc MEM được thiết kế để giải quyết vấn đề trên bằng cách chia bộ nhớ robot thành hai lớp khác nhau. Lớp thứ nhất lưu trữ dữ liệu hình ảnh ngắn hạn dưới dạng video hoặc chuỗi hình ảnh. Phần này sử dụng mô hình mã hóa thị giác hiệu quả dựa trên Vision Transformers (ViTs) để ghi nhận các chi tiết về vị trí và trạng thái của vật thể.

Nhờ cơ chế này, robot có thể nhớ vị trí của đồ vật ngay cả khi chúng tạm thời bị che khuất, chẳng hạn như khi cánh tay robot di chuyển trước camera. Điều này đặc biệt quan trọng trong các thao tác cầm nắm hoặc sắp xếp đồ vật.

Trong khi đó, lớp bộ nhớ thứ hai lưu trữ ngữ cảnh dài hạn dưới dạng tóm tắt bằng ngôn ngữ tự nhiên. Thay vì ghi nhớ toàn bộ video của một hành động, robot chỉ lưu lại thông tin ngắn gọn về sự kiện. Ví dụ, thay vì lưu từng khung hình khi mở tủ lạnh, hệ thống chỉ ghi chú rằng “tôi đã mở tủ lạnh”.

Cách tiếp cận này giúp giảm đáng kể khối lượng dữ liệu cần xử lý, đồng thời cho phép robot duy trì nhận thức về tiến trình của nhiệm vụ.

Khả năng học hỏi từ sai lầm

Một lợi ích quan trọng của MEM là giúp robot thích ứng tốt hơn khi gặp lỗi. Trong các hệ thống trước đây, nếu robot thực hiện sai một thao tác - chẳng hạn như cầm nắm vật thể không đúng cách - nó có thể lặp lại sai lầm đó nhiều lần vì không hiểu nguyên nhân thất bại.

Với bộ nhớ đa tầng, robot có thể ghi nhận thất bại trong bộ nhớ ngắn hạn và điều chỉnh hành động ngay ở lần thử tiếp theo. Trong một thử nghiệm, robot khi cố gắng lấy đôi đũa trên bàn thấp đã thất bại ở lần đầu tiên. Sau khi ghi nhớ lỗi trong bộ nhớ video, nó thay đổi góc tiếp cận và thành công ngay ở lần thứ hai.

Cơ chế tương tự cũng được áp dụng trong các tình huống khác, chẳng hạn khi robot cố mở cửa tủ lạnh từ phía bản lề. Nếu cửa không mở, robot nhanh chóng chuyển sang kéo từ phía đối diện thay vì lặp lại hành động cũ.

Nhờ kiến trúc bộ nhớ mới, robot có thể duy trì sự tập trung trong khoảng thời gian dài hơn nhiều so với trước đây. Các thử nghiệm cho thấy robot sử dụng MEM có thể thực hiện chuỗi nhiệm vụ kéo dài tới khoảng 15 phút.

Trong một bài kiểm tra thực tế, robot đã hoàn thành toàn bộ quy trình dọn dẹp nhà bếp, bao gồm lau bề mặt bàn, làm khô bằng khăn giấy, rửa bát đĩa và cất đồ vào tủ lạnh. Hệ thống thậm chí có thể lấy vật dụng từ ngăn kéo hoặc tủ mà camera không nhìn thấy trực tiếp.

Ngoài ra, robot còn có khả năng mở túi và kiểm tra số lượng vật dụng bên trong để đảm bảo không bỏ sót đồ. Những kỹ năng này cho thấy robot đã tiến gần hơn tới khả năng hoạt động trong môi trường thực.

Bước tiến trong phát triển “bộ não robot”

MEM được giới thiệu trong bối cảnh nhiều công ty công nghệ đang tìm cách xây dựng “bộ não phổ quát” cho robot - hệ thống trí tuệ có thể áp dụng cho nhiều loại nhiệm vụ khác nhau thay vì phụ thuộc vào phần cứng chuyên dụng.

Phương pháp này kết hợp giữa học tập, bắt chước từ con người và học tăng cường tự động, cho phép robot luyện tập, ghi nhớ sai lầm và cải thiện hiệu suất theo thời gian.

Theo các chuyên gia, việc cải thiện bộ nhớ là yếu tố then chốt để đưa robot từ giai đoạn thử nghiệm trong phòng thí nghiệm sang ứng dụng thực tế. Khi robot có thể ghi nhớ và hiểu ngữ cảnh tốt hơn, chúng sẽ thực hiện các nhiệm vụ phức tạp một cách ổn định và an toàn hơn.

Trong tương lai, những tiến bộ trong kiến trúc bộ nhớ như MEM có thể giúp robot đảm nhiệm nhiều công việc hơn trong nhà máy, dịch vụ và cả đời sống gia đình. Từ việc dọn dẹp nhà cửa đến hỗ trợ sản xuất, robot với khả năng ghi nhớ dài hạn có thể trở thành trợ lý thông minh, góp phần thay đổi cách con người tương tác với máy móc trong kỷ nguyên công nghệ mới.

Nguyên Bách

TIN LIÊN QUAN















Home Icon VỀ TRANG CHỦ