🔍
Chuyên mục: Thiết bị - Phần cứng

Mô hình AI của Alibaba biến văn bản thành thế giới 3D có thể tương tác

14 giờ trước
Tập đoàn công nghệ Alibaba vừa chính thức trình làng mô hình AI Happy Oyster được ví là một 'mô hình thế giới' (world model) mang tính đột phá.

Mô hình AI thế hệ mới này sở hữu năng lực phi thường trong việc tạo ra các môi trường 3D và video tương tác có khả năng mô phỏng hoàn hảo các định luật vật lý của thế giới thực. Sự xuất hiện của Happy Oyster diễn ra vào một thời điểm vô cùng nhạy cảm và mang tính bước ngoặt, ngay sau khi OpenAI đưa ra quyết định đột ngột đóng cửa dịch vụ tạo video Sora. Màn ra mắt này không chỉ lấp đầy khoảng trống mà OpenAI để lại, mà còn trực tiếp hâm nóng cuộc đua AI tại châu Á, nơi Alibaba đang phải đối đầu gay gắt với kỳ phùng địch thủ Tencent cùng mô hình Humayun HY-World 2.0 – một hệ thống cũng có khả năng tái tạo toàn bộ thế giới 3D từ các đoạn video clip.

Mô hình AI Happy Oyster được coi là mô hình tạo thế giới 3D đầy đột phá

Đáng chú ý, trước khi được công bố danh tính chính thức, Happy Oyster đã từng tạo ra một cơn địa chấn lan truyền trên mạng internet dưới bí danh "HappyHorse-1.0". Mô hình bí ẩn này đã liên tục thống trị và đứng đầu các bảng xếp hạng về khả năng chuyển đổi văn bản thành video và hình ảnh thành video trên nền tảng đo lường hiệu năng uy tín Artificial Analysis. Sau một thời gian gây xôn xao giới công nghệ, Alibaba mới chính thức thừa nhận Happy Horse chính là "đứa con tinh thần" của mình và mô hình này sau đó cũng tự tin xuất hiện trên hàng loạt các nền tảng đánh giá tiêu chuẩn khác.

Điểm làm nên sức hút mãnh liệt của mô hình mới này nằm ở khả năng phá vỡ hoàn toàn quy trình làm việc thụ động. Theo lời giải thích từ Alibaba: "Khác với các công cụ video AI truyền thống thường tuân theo một quy trình một chiều tẻ nhạt là 'viết câu lệnh, chờ kết xuất đồ họa và nhận về một đoạn clip thành phẩm', Happy Oyster liên tục lắng nghe và phản hồi trong suốt quá trình tạo dựng. Cảnh vật sẽ phản ứng theo thời gian thực và tiếp tục tiến hóa khi người dùng liên tục đưa ra các chỉ thị mới".

Mô hình AI phá vỡ giới hạn truyền thống với chế độ Đạo diễn và Lang thang

Để mang lại trải nghiệm tương tác chưa từng có, Alibaba thiết kế Happy Oyster vận hành dựa trên hai chế độ cốt lõi: Đạo diễn (Directing) và Lang thang (Wandering).

Thay vì chỉ tạo ra những cảnh quay tiêu chuẩn vô hồn, chế độ Đạo diễn kiến tạo nên một "thế giới vật lý đang vận hành, nơi ánh sáng, trọng lực, chuyển động của nhân vật và tính nhân quả của cảnh vật luôn được duy trì một cách liên tục và mạch lạc theo thời gian". Khả năng kiểm soát là vô hạn khi người dùng có thể can thiệp vào thế giới ảo này ở bất kỳ thời điểm nào thông qua các câu lệnh bằng văn bản, giọng nói hoặc hình ảnh. Bạn có thể tự do chuyển đổi góc máy quay, chỉ đạo hành động của nhân vật, hoặc bẻ lái toàn bộ cốt truyện ngay trong thời gian thực mà không làm gián đoạn luồng video đang chạy.

Trong khi đó, chế độ Lang thang lại trao cho người dùng đặc quyền tự tay xây dựng và khám phá một thế giới có thể mở rộng đến vô tận chỉ từ một câu lệnh văn bản hoặc một bức ảnh duy nhất. Người dùng có thể đắm chìm vào môi trường vừa được AI tạo ra dưới góc nhìn thứ nhất, trực tiếp điều khiển bước đi của mình bằng các phím WASD quen thuộc trên bàn phím và chuột để xoay góc nhìn, hệt như đang trải nghiệm một tựa game nhập vai thế giới mở. Đại diện công ty tự hào khẳng định: "Người dùng có thể tự do lang thang, thay đổi hướng đi và chuyển động của camera, thậm chí bước ra khỏi khung hình ban đầu trong khi thế giới ảo vẫn tiếp tục được tự động kiến tạo và duy trì tính nhất quán tuyệt đối".

Về mặt kỹ thuật, cả hai chế độ đều hỗ trợ đầu vào đa phương thức và có khả năng xuất ra các tệp tin hoàn chỉnh cả về âm thanh lẫn hình ảnh. Chế độ Đạo diễn hiện tại có thể tạo ra các đoạn video liền mạch dài tối đa ba phút ở độ phân giải 480p hoặc 720p. Trong khi đó, chế độ Lang thang đang được giới hạn ở các phiên tạo thế giới kéo dài một phút với độ phân giải 480p, một con số dự kiến sẽ còn được nâng cấp mạnh mẽ trong tương lai.

Định hình lại tương lai của ngành giải trí và phát triển Game

Với những năng lực vượt trội kể trên, Happy Oyster đang mở ra một chân trời ứng dụng khổng lồ, hứa hẹn sẽ định hình lại toàn bộ quy trình làm việc của nhiều ngành công nghiệp sáng tạo. Alibaba định hướng mô hình mới này sẽ trở thành công cụ đắc lực cho lĩnh vực sản xuất phim ảnh thời gian thực, giúp các đạo diễn nhanh chóng phác thảo kịch bản phân cảnh (storyboarding) chỉ trong chớp mắt. Đặc biệt, nó mở ra kỷ nguyên của các loạt phim ngắn tương tác, nơi "những lựa chọn ngẫu hứng của người xem sẽ biến mỗi lần thưởng thức phim trở thành một trải nghiệm độc nhất vô nhị".

Đối với lĩnh vực công nghiệp trò chơi điện tử, tiềm năng của Happy Oyster là không thể đong đếm. Thay vì phải mất hàng tháng trời để các kỹ sư đồ họa xây dựng nguyên mẫu, các nhà phát triển game giờ đây có thể sử dụng hệ thống này để biến những ý tưởng văn bản thô sơ thành các thế giới 3D có thể trực tiếp tương tác và chơi được. Những thế giới này được đảm bảo vận hành với hệ thống logic và truyền thuyết nhất quán, phục vụ đắc lực cho giai đoạn lên ý tưởng và phát triển concept ban đầu của các dự án game bom tấn.

Hiện tại, Alibaba đang mở cửa cho cộng đồng trải nghiệm sớm "siêu phẩm" này. Những người dùng tiên phong, các nhà làm phim, lập trình viên và những người đam mê công nghệ có thể đăng ký tham gia danh sách chờ thông qua cổng thông tin chính thức happyoyster.cn để trở thành những người đầu tiên chạm tay vào công nghệ kiến tạo thế giới của tương lai. Sự xuất hiện của Happy Oyster không chỉ khẳng định vị thế của Alibaba mà còn cho thấy trí tuệ nhân tạo đang bước sang một kỷ nguyên mới: kỷ nguyên của sự tương tác trực tiếp và làm chủ các thế giới mô phỏng.

Bùi Tú








Home Icon VỀ TRANG CHỦ