Chuyên mục: CNTT - Viễn thông

Nvidia tái sản xuất H200, chuẩn bị phiên bản chip AI Groq có thể bán ở Trung Quốc

11 giờ trước

Nvidia đang khởi động lại việc sản xuất H200, dòng chip được thiết kế để tuân thủ các hạn chế xuất khẩu của Mỹ sang Trung Quốc, CEO Jensen Huang cho biết hôm 17.3.

Nvidia từng ngừng sản xuất chip H200, dòng chip dựa trên kiến trúc Hopper đã cũ, vào năm ngoái do các rào cản pháp lý ngày càng gia tăng tại Mỹ và Trung Quốc, theo hãng tin Reuters.

Sau đó, Nvidia đã nhận được giấy phép xuất khẩu H200 từ chính phủ Mỹ và các đơn đặt hàng, Jensen Huang nói. Điều này khiến Nvidia bắt đầu khởi động lại hoạt động sản xuất H200 từ vài tuần trước.

“Chuỗi cung ứng của chúng tôi đang được kích hoạt trở lại”, Giám đốc điều hành Nvidia nói.

Doanh số chip tại Trung Quốc không được tính vào dự báo doanh thu hơn 1.000 tỉ USD mà Jensen Huang đưa ra cho các dòng chip AI Blackwell và Rubin của công ty vào cuối năm 2027.

Blackwell và Rubin là các dòng chip AI chủ lực của Nvidia hiện không được bán sang Trung Quốc, có khả năng xây dựng các mô hình ngôn ngữ lớn đứng sau các chatbot như ChatGPT của OpenAI. Blackwell đã có mặt trên thị trường, trong khi Rubin là thế hệ chip AI tiếp theo của Nvidia và đang được sản xuất hàng loạt.

Ước tính 1.000 tỉ USD mà Jensen Huang đưa ra không bao gồm cả một loạt sản phẩm khác của Nvidia như CPU (bộ xử lý trung tâm), các dòng chip mạng, chip dựa trên công nghệ được cấp phép từ Groq và biến thể của Rubin có tên Rubin Ultra.

Jensen Huang phát biểu tại GTC 2026 ở thành phố San Jose, bang California, Mỹ hôm 16.3 - Ảnh: Reuters

Vào tháng 12.2025, Nvidia chi khoảng 20 tỉ USD để mua tài sản và giấy cấp phép công nghệ của Groq, đồng thời tuyển dụng nhiều lãnh đạo của công ty khởi nghiệp này. Đây là thương vụ lớn nhất trong lịch sử Nvidia.

Groq là chuyên phát triển phần cứng để tăng tốc xử lý AI, đặc biệt là phần suy luận. Nếu Nvidia nổi tiếng với GPU (bộ xử lý đồ họa) dùng để huấn luyện AI, thì Groq tập trung vào việc giúp AI trả lời nhanh hơn sau khi đã được huấn luyện. Điểm khác biệt là Groq tự phát triển một loại chip riêng gọi là LPU (Language Processing Unit), tối ưu cho các tác vụ AI như tạo văn bản, viết mã…

Tại hội nghị dành cho nhà phát triển GTC 2026 hôm 16.3, Jensen Huang đã công bố Groq 3 LPU, chip đầu tiên của Groq kể từ khi Nvidia công bố thương vụ nêu trên.

Nvidia dự kiến Groq 3 LPU bắt đầu được giao trong quý 3/2026.

Groq được thành lập bởi những người tạo ra TPU - chip AI nội bộ của Google, vốn đã nổi lên trong những năm gần đây như một đối thủ của GPU Nvidia. Groq 3 LPU được xây dựng để nâng cao công nghệ này, với một lõi được thiết kế để xử lý suy luận AI với độ trễ thấp, hoạt động bổ trợ cho GPU.

Ở GTC 2026, Jensen Huang cũng giới thiệu một rack chuyên dụng để chứa các bộ tăng tốc Groq mới.

Rack Groq 3 LPX sẽ chứa 256 LPU và được thiết kế để đặt cạnh hệ thống rack-scale Vera Rubin, dự kiến bắt đầu giao cho khách hàng vào cuối năm nay. Jensen Huang cho biết rack Groq LPX có thể tăng hiệu năng token trên mỗi watt của các GPU Rubin lên gấp 35 lần.

“Chúng tôi đã hợp nhất hai bộ xử lý rất khác nhau: một dành cho thông lượng cao, một dành cho độ trễ thấp. Thế nhưng, điều đó không thay đổi thực tế là chúng ta cần rất nhiều bộ nhớ. Vì vậy, chúng tôi sẽ bổ sung thêm rất nhiều chip Groq, qua đó tận dụng kiến trúc SRAM tốc độ cao để giảm độ trễ và tăng hiệu năng suy luận”, tỷ phú 63 tuổi người Mỹ gốc Đài Loan nói.

Rack là khung tủ tiêu chuẩn dùng để lắp và sắp xếp các thiết bị máy tính như máy chủ, GPU, thiết bị mạng và hệ thống lưu trữ. Nói đơn giản, rack giống chiếc tủ kim loại cao trong đó xếp nhiều máy chủ lên các tầng để tiết kiệm không gian và dễ quản lý.

Rack-scale là một hệ thống máy tính được thiết kế và tối ưu hóa ở cấp độ toàn bộ rack, thay vì chỉ ở cấp độ từng máy chủ riêng lẻ. Trong kiến trúc rack-scale, toàn bộ rack được xem như một “siêu máy tính thống nhất”, nơi mọi thành phần như GPU, CPU, bộ nhớ, mạng và làm mát được thiết kế để hoạt động cùng nhau như một hệ thống duy nhất.

Nvidia chuẩn bị một phiên bản chip AI của Groq có thể bán tại Trung Quốc

Nvidia đang chuẩn bị một phiên bản chip AI của Groq có thể bán tại thị trường Trung Quốc, hai nguồn tin am hiểu vấn đề nói với Reuters hôm 17.3.

Động thái này diễn ra trong bối cảnh Jensen Huang cho biết Nvidia đã khởi động lại sản xuất H200 sau khi nhận được giấy phép xuất khẩu từ chính quyền Trump và đơn đặt hàng từ các công ty ở quốc gia châu Á.

Nvidia dự định sử dụng chip của Groq cho tác vụ suy luận, khi các mô hình AI trả lời câu hỏi, viết mã hoặc thực hiện tác vụ cho người dùng. Trong các sản phẩm được giới thiệu tại GTC 2026, Nvidia dự kiến kết hợp chip Vera Rubin sắp ra mắt (không thể bán tại Trung Quốc) với chip của Groq.

Dù thống trị thị trường huấn luyện AI, Nvidia phải đối mặt với sự cạnh tranh lớn hơn nhiều trong mảng suy luận. Một số công ty lớn của Trung Quốc, gồm cả Baidu, đã tự sản xuất chip suy luận riêng.

Theo Reuters, chip AI của Groq đang được Nvidia chuẩn bị không phải là phiên bản bị hạ cấp hay được thiết kế riêng cho thị trường Trung Quốc. Biến thể mới có thể được điều chỉnh để hoạt động với các hệ thống khác. Nguồn tin của Reuters cũng cho biết chip AI Groq dự kiến được bán ra vào tháng 5.

Tại GTC 2026, Jensen Huang cho biết ông kỳ vọng các đơn đặt hàng liên quan đến hai nền tảng chip Blackwell cùng Vera Rubin sẽ đạt tổng cộng 1.000 tỉ USD vào năm 2027.

Năm ngoái, công ty từng dự báo cơ hội doanh thu khoảng 500 tỉ USD từ hai công nghệ chip này. Sau báo cáo kết quả kinh doanh quý 1 năm tài chính 2026 của Nvidia vào tháng trước, Giám đốc tài chính Colette Kress nói công ty kỳ vọng tăng trưởng năm nay sẽ vượt xa mức dự báo trong ước tính trước đó.

Jensen Huang tuyên bố nhu cầu với chip Nvidia đang bùng nổ từ cả các công ty khởi nghiệp lẫn tập đoàn lớn.

Sơn Vân

Nguồn: https://baomoi.com/nvidia-tai-san-xuat-h200-chuan-bi-phien-ban-chip-ai-groq-co-the-ban-o-trung-quoc-c54720070.epi

TIN LIÊN QUAN