🔍
Chuyên mục: CNTT - Viễn thông

Google, OpenAI và các công ty ở Thung lũng Silicon làm gì giữa cơn sốt OpenClaw?

3 ngày trước
Khi Thung lũng Silicon đang bị cuốn vào làn sóng mới của các tác tử AI lập trình, Google và nhiều phòng thí nghiệm AI khác đang điều chỉnh lại chiến lược.

Google đang tiến hành cải tổ đội ngũ đứng sau Project Mariner, tác tử AI có khả năng điều hướng trình duyệt Chrome và thực hiện các tác vụ thay người dùng, theo nguồn tin của tạp chí WIRED.

Vài tháng gần đây, một số nhân sự tại Google Labs từng tham gia phát triển phiên bản thử nghiệm ban đầu này đã chuyển sang các dự án có mức độ ưu tiên cao hơn.

Người phát ngôn Google xác nhận các thay đổi này, nhưng cho biết những năng lực sử dụng máy tính được phát triển trong Project Mariner sẽ tích hợp vào chiến lược tác tử AI của công ty trong thời gian tới. Google cũng đưa một phần các khả năng này vào những sản phẩm tác tử AI khác, gồm cả Gemini Agent vừa ra mắt.

Gemini Agent là tác tử AI do Google phát triển dựa trên mô hình Gemini, có khả năng tự thực hiện hành động thay người dùng, chứ không chỉ trả lời câu hỏi như chatbot thông thường.

Động thái đó diễn ra trong bối cảnh Google và các phòng thí nghiệm AI khác đang chạy đua để phản ứng trước sự trỗi dậy mạnh mẽ của OpenClaw. OpenClaw đang gây sốt ở Trung Quốc, khi từ trẻ em đến người nghỉ hưu đều sử dụng tác tử AI này. Hiện mức độ sử dụng OpenClaw ở Trung Quốc vượt qua Mỹ, theo công ty an ninh mạng SecurityScorecard (Mỹ).

Dù OpenClaw và tác tử AI khác hiện chủ yếu được lập trình viên sử dụng, Thung lũng Silicon tin rằng chúng sớm có thể trở thành trợ lý đa năng cho cá nhân và doanh nghiệp. Jensen Huang, Giám đốc điều hành Nvidia, thậm chí gọi OpenClaw là “ChatGPT tiếp theo”.

Ông còn nhấn mạnh rằng “mọi công ty đều cần một chiến lược OpenClaw” và thậm chí mô tả công nghệ này như “chiếc máy tính mới” của thời đại AI.

Các tác tử trình duyệt không thành công như kỳ vọng

Ông Sundar Pichai, Giám đốc điều hành Google, từng giới thiệu Project Mariner tại hội nghị I/O năm ngoái. Khi đó, tác tử trình duyệt được xem là hướng đi lớn tiếp theo của ngành, với OpenAI và Perplexity tung ra sản phẩm dành cho người tiêu dùng hứa hẹn tự động hóa các tác vụ trực tuyến. Những tác tử AI này có thể nhấp chuột, cuộn trang web và điền biểu mẫu giống con người. Tuy nhiên, mức độ phổ biến của các tác tử trình duyệt này không đạt kỳ vọng của ngành.

Tác tử trình duyệt Comet của Perplexity chỉ đạt 2,8 triệu người dùng hoạt động hàng tuần vào tháng 12.2025. Trong khi đó, ChatGPT Agent của OpenAI được cho là giảm xuống dưới 1 triệu người dùng hoạt động hàng tuần những tháng gần đây. So với hơn 900 triệu người dùng ChatGPT mỗi tuần, lượng sử dụng tác tử trình duyệt gần như không đáng kể.

Làn sóng tác tử AI mới

Trong năm qua, động lực của thế giới AI đã chuyển mạnh sang các tác tử như Claude Code và OpenClaw. Lập trình viên Peter Steinberger, người sáng lập OpenClaw, đã gia nhập OpenAI vào tháng 2.

Ông Sam Altman, Giám đốc điều hành OpenAI, cho biết: “Peter Steinberger sẽ gia nhập OpenAI để thúc đẩy thế hệ tác tử AI cá nhân tiếp theo. OpenClaw sẽ tồn tại trong một tổ chức phi lợi nhuận với tư cách là dự án mã nguồn mở mà OpenAI sẽ tiếp tục hỗ trợ”.

“Ông ấy là một thiên tài với rất nhiều ý tưởng tuyệt vời về tương lai của những tác tử AI cực kỳ thông minh có thể tương tác với nhau để thực hiện các công việc hữu ích cho con người. Chúng tôi kỳ vọng điều này sẽ nhanh chóng trở thành một phần cốt lõi trong các sản phẩm của mình”, Sam Altman viết về Peter Steinberger trên mạng xã hội X thời điểm đó.

Khác với tác tử duyệt web, Claude Code và OpenClaw điều khiển máy tính thông qua dòng lệnh, tỏ ra đáng tin cậy hơn để hoàn thành công việc. Một số tác tử AI còn tích hợp khả năng sử dụng máy tính như một tính năng bổ sung. So với điều đó, tác tử trình duyệt ngày càng bị xem là hạn chế nếu tồn tại như sản phẩm độc lập.

Ông Kian Katanforoosh, Giám đốc điều hành nền tảng nâng cao kỹ năng AI Workera và giảng viên tại Đại học Stanford (Mỹ), cho rằng một phần lý do khiến các tác tử AI sử dụng máy tính chưa bùng nổ là do yêu cầu tính toán rất lớn. Phần lớn tác tử AI này hoạt động bằng cách chụp hàng loạt ảnh màn hình của trang web, đưa vào mô hình AI rồi hành động dựa trên những gì “nhìn thấy”. Việc xử lý lượng thông tin này vừa chậm vừa có lúc thiếu ổn định.

“Claude Code và OpenClaw cho thấy làm việc với dòng lệnh hiệu quả hơn nhiều, vì dòng lệnh là văn bản và các mô hình ngôn ngữ lớn cũng dựa trên văn bản. Số bước để đạt cùng kết quả có thể ít hơn từ 10 đến 100 lần”, Kian Katanforoosh lý giải.

Tuy vậy, điều đó không có nghĩa là tác tử trình duyệt không còn tiến triển, hoặc nghiên cứu về khả năng sử dụng máy tính đã đi vào ngõ cụt.

Tháng trước, công ty khởi nghiệp Standard Intelligence đã giới thiệu một mô hình sử dụng máy tính được huấn luyện bằng video thay vì ảnh chụp màn hình. Công ty cho biết đã phát triển bộ mã hóa video có thể nén dữ liệu vào cửa sổ ngữ cảnh của mô hình AI, hiệu quả hơn gấp 50 lần so với các mô hình sử dụng máy tính trước đây. Để trình diễn, Standard Intelligence kết nối mô hình AI với một chiếc xe, luồng video trực tiếp và bàn phím máy tính. Mô hình AI này có thể tự lái xe trong thời gian ngắn quanh thành phố San Francisco (Mỹ).

Ang Li, Giám đốc điều hành công ty khởi nghiệp Simular và cựu nhà nghiên cứu Google DeepMind, cho rằng các tác tử sử dụng máy tính vẫn đóng vai trò quan trọng và khó có thể bị thay thế hoàn toàn.

“Tôi nghĩ sẽ luôn tồn tại tỷ lệ 80/20. Bạn có thể dùng dòng lệnh để giải quyết nhiều vấn đề, nhưng vẫn sẽ có những việc buộc phải xử lý trên giao diện đồ họa. Ví dụ, các website bảo hiểm y tế hay phần mềm cũ thường không có API (giao diện lập trình ứng dụng) để tác tử dòng lệnh gọi trực tiếp”.

Dù vậy, nhìn chung các phòng thí nghiệm AI đang chuyển trọng tâm từ tác tử sử dụng máy tính sang tác tử lập trình. Ngay cả với các tác vụ không liên quan đến viết mã, các phòng thí nghiệm AI đã phát hiện rằng khả năng sử dụng ứng dụng khác, chỉnh sửa file và tạo phần mềm tùy chỉnh giúp tác tử lập trình trở nên hữu ích hơn cho người dùng. Chẳng hạn, nếu cần lập ngân sách, người dùng có thể tải sao kê ngân hàng lên và để tác tử tạo bảng tổng hợp trực quan phân tích chi tiêu.

Các lãnh đạo OpenAI cho biết muốn Codex trở thành nền tảng cho những tác tử AI đa năng trong ChatGPT. Trong khi đó, Anthropic đã xây dựng Claude Cowork, một biến thể của Claude Code không yêu cầu người dùng mở cửa sổ dòng lệnh. Perplexity, vốn đặt cược lớn vào tác tử trình duyệt, gần đây cũng ra mắt sản phẩm tương tự mang tên Personal Computer.

Dù các tác tử lập trình đang bùng nổ trong giới phát triển, vẫn chưa rõ liệu các tính năng bổ sung có giúp tăng mức độ phổ biến với người dùng phổ thông hay không.

Google và OpenAI cho rằng người tiêu dùng có thể dùng tác tử AI để đặt thực phẩm qua Instacart hoặc đặt bàn ăn tối. Song dù tiện lợi, nhiều người có thể chưa sẵn sàng tự động hóa các tác vụ này cho đến khi họ tin rằng tác tử AI sẽ không mắc sai sót.

Instacart là ứng dụng và dịch vụ giao hàng tạp hóa (đồ ăn, nhu yếu phẩm) từ siêu thị đến tận nhà.

Sơn Vân

Home Icon VỀ TRANG CHỦ