Nvidia đã chính thức công bố loạt GPU AI mạnh mẽ tại Hội nghị Công nghệ GPU (GTC) 2025, bao gồm Blackwell Ultra B300, Vera Rubin và Rubin Ultra, cùng kiến trúc GPU thế hệ tiếp theo mang tên Feynman. Những sản phẩm này hứa hẹn sẽ cách mạng hóa hiệu suất AI trong các tác vụ suy luận và đào tạo, củng cố vị trí dẫn đầu của Nvidia trong lĩnh vực công nghệ AI.
Nvidia Blackwell Ultra B300 tại GTC 2025
Blackwell Ultra B300: Sức mạnh vượt trội cho suy luận AI
Dự kiến ra mắt vào nửa cuối năm 2025, Blackwell Ultra B300 là phiên bản nâng cấp đáng kể so với Blackwell GB200. Với dung lượng bộ nhớ HBM3e lên đến 288GB, gấp rưỡi so với 192GB của GB200, B300 cho phép xử lý các mô hình AI quy mô lớn hơn. Hiệu suất tính toán FP4 tensor dày đặc cũng được cải thiện 50%, tối ưu hóa hiệu quả suy luận cho các nền tảng AI tiên tiến như DeepSeek R1.
Blackwell Ultra trong hệ sinh thái Nvidia
Blackwell Ultra B300 không chỉ là một GPU đơn lẻ mà còn được tích hợp vào các giải pháp toàn diện như giá đỡ máy chủ B300 NVL16, trạm DGX GB300 và hệ thống giá đỡ GB300 NV72L. Đặc biệt, Blackwell Ultra DGX SuperPOD, kết hợp 8 giá NV72L, tạo nên một “nhà máy AI” với sức mạnh tính toán FP4 lên tới 11,5 exaflop, đáp ứng nhu cầu xử lý dữ liệu khổng lồ của các mô hình AI phức tạp.
Nvidia Blackwell Ultra trong hệ thống DGX SuperPOD
Vera Rubin: Đột phá trong đào tạo và suy luận AI
Ra mắt vào nửa cuối năm 2026, Vera Rubin tích hợp hai chip trên một đế, mỗi chip đạt hiệu suất suy luận FP4 50 petaflop và sở hữu hàng chục terabyte bộ nhớ. Kết hợp với CPU Vera 88 lõi Arm tùy chỉnh do Nvidia tự phát triển, Vera Rubin trong cấu hình giá đỡ NVL144 mang đến sức mạnh tính toán 3,6 exaflop FP4, mở ra kỷ nguyên mới cho xử lý AI.
Nvidia Vera Rubin – Kiến trúc đột phá
Feynman: Kiến trúc GPU tương lai của Nvidia
Nvidia cũng hé lộ về kiến trúc GPU Feynman, dự kiến ra mắt năm 2028 cùng CPU Vera. Feynman được kỳ vọng sẽ tiếp tục nâng cao khả năng tính toán AI, duy trì vị thế dẫn đầu của Nvidia trong cuộc đua công nghệ.
Tầm nhìn “Nhà máy AI” của Jensen Huang
Jensen Huang, CEO của Nvidia, envisions trung tâm dữ liệu tương lai là “nhà máy AI”, sản xuất mã thông báo (token) cho các mô hình AI. Ông nhấn mạnh vai trò của “AI vật lý” trong việc cung cấp năng lượng cho robot hình người, sử dụng phần mềm Nvidia để đào tạo AI trong môi trường ảo trước khi áp dụng vào thực tế.
Nvidia Feynman – Kiến trúc GPU tương lai
FAQ về GPU AI mới của Nvidia
1. Khi nào Blackwell Ultra B300 sẽ được phát hành? Dự kiến vào nửa cuối năm 2025.
2. Vera Rubin có gì đặc biệt? Tích hợp hai chip trên một đế, hiệu suất suy luận FP4 50 petaflop mỗi chip, và CPU Vera tùy chỉnh.
3. Kiến trúc GPU Feynman là gì? Kiến trúc GPU thế hệ tiếp theo của Nvidia, dự kiến ra mắt năm 2028.
4. “Nhà máy AI” là gì? Tầm nhìn của Nvidia về trung tâm dữ liệu tương lai, tập trung vào sản xuất mã thông báo cho AI.
5. AI vật lý được ứng dụng như thế nào? Cung cấp năng lượng cho robot hình người, được đào tạo trong môi trường ảo bằng phần mềm Nvidia.
6. Blackwell Ultra B300 mạnh hơn GB200 như thế nào? Dung lượng bộ nhớ gấp rưỡi và hiệu suất tính toán FP4 tensor dày đặc tăng 50%.
7. Tìm hiểu thêm về GPU Nvidia ở đâu? Anime Marvel