Nvidia chi 26 tỉ USD tạo các mô hình AI trọng số mở, cạnh tranh với OpenAI và DeepSeek
Các lãnh đạo Nvidia đã xác nhận thông tin trên với tạp chí WIRED.
Khoản đầu tư lớn này có thể giúp Nvidia chuyển mình từ hãng sản xuất chip với hệ sinh thái phần mềm mạnh mẽ thành phòng thí nghiệm AI thực thụ, đủ khả năng cạnh tranh với OpenAI và DeepSeek. Đây cũng là bước đi chiến lược có thể giúp Nvidia củng cố vị thế là nhà sản xuất chip AI số 1 thế giới, bởi các mô hình này được tối ưu hóa cho phần cứng của chính hãng.
Trọng số là những con số được học trong quá trình huấn luyện, quyết định cách mô hình AI xử lý dữ liệu và đưa ra câu trả lời. Với mô hình AI trọng số mở, các giá trị này được công bố công khai để bất kỳ ai cũng có thể tải về, chạy, nghiên cứu hoặc chỉnh sửa. Trong trường hợp của mình, Nvidia còn công bố cả những cải tiến kỹ thuật dùng để xây dựng và huấn luyện mô hình AI trọng số mở, giúp các công ty khởi nghiệp và nhà nghiên cứu dễ dàng sửa đổi và phát triển tiếp công nghệ của hãng.
Hôm 11.3, Nvidia ra mắt Nemotron 3 Super - mô hình AI trọng số mở mạnh nhất của hãng cho đến nay. Mô hình mới có 128 tỉ tham số (thước đo về kích thước và độ phức tạp), tương đương phiên bản gpt-oss lớn nhất của OpenAI. Thế nhưng, Nvidia cho biết Nemotron 3 Super vượt trội hơn gpt-oss và nhiều mô hình AI khác trong một số bài kiểm tra tiêu chuẩn.
Cụ thể, Nvidia cho biết Nemotron 3 Super đạt 37 điểm trên Artificial Intelligence Index, hệ thống đánh giá mô hình dựa trên 10 bài kiểm tra tiêu chuẩn khác nhau. Gpt-oss đạt 33 điểm, nhưng một số mô hình Trung Quốc có điểm cao hơn.
Nvidia cho biết Nemotron 3 Super đã được thử nghiệm bí mật trên PinchBench, bài kiểm tra tiêu chuẩn mới đánh giá khả năng điều khiển OpenClaw của mô hình, và xếp hạng nhất.
Ngoài ra, Nvidia giới thiệu nhiều kỹ thuật mới được dùng để tạo ra Nemotron 3 Super, gồm phương pháp về kiến trúc và huấn luyện giúp cải thiện khả năng suy luận, xử lý ngữ cảnh dài, cũng như khả năng phản hồi với học tăng cường.
“Nvidia đang nghiêm túc hơn rất nhiều với việc phát triển các mô hình mở và chúng tôi đang đạt được nhiều tiến triển”, Bryan Catanzaro, Phó chủ tịch phụ trách nghiên cứu học sâu ứng dụng tại Nvidia, nhấn mạnh.

Nvidia của Jensen Huang sẽ chi 26 tỉ USD trong 5 năm tới để phát triển các mô hình AI trọng số mở - Ảnh: WIRED
Cuộc đua mô hình AI mở
Meta là công ty AI lớn đầu tiên phát hành mô hình mở Llama vào năm 2023. Tuy nhiên, Mark Zuckerberg (Giám đốc điều hành Meta) gần đây đã cải tổ chiến lược AI của công ty và cho biết các mô hình AI trong tương lai có thể không còn hoàn toàn mở. OpenAI cũng cung cấp một mô hình trọng số mở gpt-oss, nhưng nó kém hơn đáng kể so với các mô hình độc quyền tốt nhất của công ty và không dễ sửa đổi.
Hiện chỉ có thể truy cập những mô hình AI hàng đầu của Mỹ, từ OpenAI, Anthropic và Google, qua đám mây hoặc giao diện trò chuyện. Ngược lại, nhiều mô hình AI mạnh mẽ của Trung Quốc, từ DeepSeek, Alibaba, Moonshot AI, Z.ai và MiniMax, được phát hành công khai và miễn phí. Vì vậy, nhiều công ty khởi nghiệp và nhà nghiên cứu trên thế giới đang xây dựng công nghệ dựa trên các mô hình AI Trung Quốc.
“Việc giúp hệ sinh thái phát triển là lợi ích của chúng tôi”, Bryan Catanzaro nói.
Ông gia nhập Nvidia năm 2011 và góp phần dẫn dắt quá trình chuyển đổi công ty từ sản xuất GPU (bộ xử lý đồ họa) cho game sang phát triển chip cho AI. Nvidia phát hành mô hình Nemotron đầu tiên vào tháng 11/2023. Bryan Catanzaro cũng tiết lộ công ty gần đây đã hoàn tất giai đoạn tiền huấn luyện một mô hình 550 tỉ tham số. Tiền huấn luyện là quá trình đưa lượng dữ liệu khổng lồ vào mô hình bằng hàng loạt chip chuyên dụng chạy song song.
Kể từ tháng 11.2023, Nvidia đã phát hành nhiều mô hình AI chuyên biệt cho các lĩnh vực như robotics, khí hậu và gấp protein (quá trình protein tự gấp thành cấu trúc không gian 3 chiều).
Protein được tạo thành từ một chuỗi dài các axit amin. Ban đầu chuỗi này giống như một sợi thẳng, nhưng sau khi được tổng hợp trong tế bào, nó sẽ tự gấp lại theo một cách rất cụ thể để tạo thành cấu trúc 3D ổn định. Chính hình dạng 3D này quyết định chức năng sinh học của protein.
Kari Briski, Phó chủ tịch phụ trách phần mềm AI tạo sinh cho doanh nghiệp tại Nvidia, cho biết các mô hình AI tương lai của Nvidia không chỉ giúp cải thiện chip mà còn giúp tối ưu các siêu trung tâm dữ liệu mà công ty xây dựng. “Chúng tôi tạo ra các mô hình này để mở rộng hệ thống của mình và kiểm tra không chỉ năng lực tính toán mà còn cả lưu trữ lẫn mạng, đồng thời định hình lộ trình kiến trúc phần cứng của mình”, bà nói.
Định hình cuộc cạnh tranh AI giữa Mỹ và Trung Quốc
Việc phát hành mô hình AI mở cũng có thể mang lại lợi ích chiến lược dài hạn cho Nvidia. Chip AI Nvidia hiện vẫn là tiêu chuẩn vàng để huấn luyện các mô hình ngôn ngữ lớn, với khách hàng chi hàng tỉ USD để mua phần cứng của hãng này cho các trung tâm dữ liệu. Tuy nhiên, việc các mô hình AI mở từ Trung Quốc trỗi dậy có thể làm xói mòn vị thế này nếu chúng chứng minh được sự cải thiện đáng kể trên phần cứng của đối thủ.
Tháng 1.2025, DeepSeek phát hành mô hình mở suy luận R1 có hiệu năng ngang các sản phẩm Mỹ của OpenAI, Google và Anthropic nhưng được huấn luyện với chi phí thấp hơn rất nhiều. Ngoài ra, nhiều mô hình AI Trung Quốc khác từ Alibaba, Moonshot AI, Z.ai và MiniMax cũng ngày càng phổ biến tại phương Tây. Dòng mô hình Qwen của Alibaba dễ sử dụng, dễ chỉnh sửa nên hiện được nhiều nhà nghiên cứu và công ty khởi nghiệp sử dụng.
Rộ tin mô hình DeepSeek mới, dự kiến sẽ sớm ra mắt, có thể được huấn luyện hoàn toàn bằng chip AI của Huawei - gã khổng lồ công nghệ Trung Quốc đang chịu các lệnh trừng phạt từ Mỹ. Nếu DeepSeek xác nhận thông tin này thì có thể nhiều công ty khởi nghiệp và nhà nghiên cứu sẽ thử nghiệm chip AI của Huawei, đặc biệt tại Trung Quốc.
Về mặt này, Nvidia có thể giúp định hình cuộc cạnh tranh AI giữa Mỹ và Trung Quốc bằng cách cung cấp giải pháp thay thế các mô hình AI mở của Trung Quốc.
“Chúng tôi là một công ty Mỹ, nhưng làm việc với các doanh nghiệp trên khắp thế giới. Việc xây dựng một hệ sinh thái đa dạng và mạnh mẽ ở mọi nơi là lợi ích của chúng tôi”, Bryan Catanzaro nói.
Một số chuyên gia trong ngành cảnh báo rằng nếu đổi mới mở chuyển dịch sang phía bên kia thế giới, điều đó có thể gây bất lợi lâu dài cho Mỹ.
“Tôi là người rất hâm mộ Nemotron”, Nathan Lambert, nhà nghiên cứu AI tại Viện Allen về AI và lãnh đạo dự án ATOM (Các mô hình AI thực sự mở của Mỹ), chia sẻ. Ông cho rằng chính phủ Mỹ cũng nên tài trợ cho các mô hình AI mở.
Andy Konwinski, nhà khoa học máy tính và doanh nhân đứng đầu Laude Institute - tổ chức phi lợi nhuận thúc đẩy sự cởi mở trong AI, nói khoản đầu tư từ Nvidia có ý nghĩa rất lớn nhờ vị trí trung tâm của công ty trong hệ sinh thái AI.
“Nvidia đang ở tuyến đầu với rất nhiều nỗ lực về cả AI mở lẫn đóng. Đây là tín hiệu chưa từng có cho thấy họ thực sự tin vào mô hình AI mở”, Andy Konwinski nói.
NemoClaw - nền tảng mã nguồn mở dành cho các tác tử
AI
Nvidia đang lên kế hoạch ra mắt NemoClaw, nền tảng mã nguồn mở dành cho các tác tử AI tương tự OpenClaw, trước hội nghị nhà phát triển thường niên GTC.
Những người am hiểu kế hoạch của Nvidia tiết lộ thông tin trên với tạp chí WIRED.
Nvidia đã giới thiệu NemoClaw tới các hãng phần mềm doanh nghiệp. NemoClaw sẽ cho phép các công ty triển khai tác tử AI để thực hiện nhiệm vụ thay cho lực lượng lao động của họ. Theo các nguồn tin, doanh nghiệp có thể truy cập NemoClaw ngay cả khi sản phẩm của họ không chạy trên chip Nvidia.
Động thái này diễn ra khi Nvidia chuẩn bị cho hội nghị nhà phát triển thường niên GTC tại thành phố San Jose (bang California, Mỹ) vào tuần tới. Trước sự kiện, Nvidia đã liên hệ với các công ty như Salesforce, Cisco, Google, Adobe và CrowdStrike nhằm thiết lập quan hệ hợp tác cho NemoClaw. Hiện chưa rõ các cuộc trao đổi này đã dẫn đến những quan hệ đối tác chính thức hay chưa.
Vì NemoClaw là nền tảng tác tử AI mã nguồn mở, nhiều khả năng các đối tác sẽ được quyền truy cập sớm miễn phí để đổi lại việc đóng góp cho dự án, theo các nguồn tin của WIRED.
Nvidia cũng dự định cung cấp các công cụ bảo mật và quyền riêng tư trong nền tảng mới này.
Với Nvidia, NemoClaw dường như là một phần trong nỗ lực thu hút các hãng phần mềm doanh nghiệp, bằng cách cung cấp thêm các lớp bảo mật cho tác tử AI. Đây cũng là một bước nữa trong chiến lược ủng hộ AI mã nguồn mở của hãng chip AI số 1 thế giới, nằm trong kế hoạch rộng hơn nhằm duy trì vị thế thống trị về hạ tầng AI, khi một số khách hàng lớn như OpenAI, Meta, Microsoft tự phát triển chip riêng.
Đến nay, chiến lược phần mềm của Nvidia chủ yếu dựa vào CUDA - nền tảng độc quyền khiến các nhà phát triển phải viết và tối ưu phần mềm để chạy trên GPU Nvidia, từ đó tạo ra lợi thế cạnh tranh rất lớn cho công ty.
CUDA là nền tảng điện toán song song và bộ công cụ lập trình do Nvidia phát triển, cho phép các nhà phát triển sử dụng GPU để thực hiện các phép tính phức tạp thay vì chỉ dựa vào CPU (bộ xử lý trung tâm).
Ban đầu, GPU được thiết kế chủ yếu để xử lý đồ họa. Thế nhưng, CUDA cho phép các lập trình viên khai thác sức mạnh tính toán rất lớn của GPU để giải quyết nhiều bài toán khác như AI, học máy, mô phỏng khoa học, phân tích dữ liệu lớn và xử lý hình ảnh. Nhờ CUDA, một chương trình có thể chia nhỏ công việc thành hàng nghìn tác vụ và xử lý chúng đồng thời trên nhiều lõi của GPU, giúp tăng tốc độ tính toán lên rất nhiều so với CPU truyền thống.
CUDA cũng cung cấp các thư viện, công cụ phát triển và giao diện lập trình để các nhà phát triển dễ dàng xây dựng phần mềm chạy trên GPU của Nvidia. Tuy nhiên, phần mềm viết bằng CUDA thường chỉ chạy tối ưu trên GPU Nvidia, khiến nhiều ứng dụng AI và tính toán hiệu năng cao phụ thuộc vào hệ sinh thái phần cứng của hãng này. Đây là một trong những yếu tố quan trọng giúp Nvidia duy trì vị thế thống trị trong lĩnh vực hạ tầng AI.
Sơn Vân
5 giờ trước
3 ngày trước
4 ngày trước
12 ngày trước
16 ngày trước
24 ngày trước
24 ngày trước
24 ngày trước
2 giờ trước
1 giờ trước
2 giờ trước
8 phút trước
57 phút trước
2 giờ trước