Điện tử [ Đăng ngày (04/04/2026) ]
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới
Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ cập nhật phần mềm, không thay đổi phần cứng.

NVIDIA vừa công bố kết quả tham dự bộ bài kiểm tra MLPerf Inference v6.0, với nền tảng Blackwell Ultra, đồng thời ghi nhận số lần chiến thắng cao gấp 9 lần đối thủ gần nhất.

MLPerf Inference v6.0 do tổ chức MLCommons phát triển, bổ sung hỗ trợ cho các mô hình lập luận và MoE thế hệ mới gồm DeepSeek-R1, GPT-OSS-120B và Mixtral 8x7B. Bên cạnh đó, bộ bài kiểm tra còn mở rộng phạm vi sang các mô hình ngôn ngữ lớn dạng dense, hệ thống gợi ý tạo sinh và mô hình ngôn ngữ thị giác, phản ánh đúng yêu cầu thực tế của doanh nghiệp hiện nay. CEO Jensen Huang từng gọi MLPerf là một trong những bộ bài kiểm tra "khắt khe" nhất hiện có.

Kết quả nổi bật nhất đến từ cấu hình GB300 NVL72 khi so sánh giữa v5.1 và v6.0. Với tác vụ DeepSeek-R1 ở chế độ Server, thông lượng tăng từ 2.907 lên 8.064 tokens/giây/GPU, tương đương 2,77 lần. Ở chế độ Offline, con số lần lượt là 5.842 và 9.821 tokens/giây/GPU (tăng 1,68 lần). Với mô hình Llama 3.1 405B, tốc độ Server tăng từ 170 lên 259 tokens/giây/GPU (1,52 lần), còn Offline đạt 271 tokens/giây/GPU so với 224 tokens/giây/GPU ở thế hệ trước (1,21 lần).

Phần lớn mức tăng này đến từ tối ưu hóa phần mềm, không phải thay đổi phần cứng. Kể từ lần tham dự đầu tiên với bài kiểm tra DeepSeek-R1 vài tháng trước, NVIDIA đã cải thiện thông lượng token lên 2,7 lần chỉ nhờ cập nhật phần mềm. Ở cấp độ phần cứng, GB300 NVL72 mang lại tốc độ cao hơn tới 2,77 lần so với GB200 NVL72, cho thấy mức độ cải tiến qua từng thế hệ là nhất quán và rõ ràng.

NVIDIA cho biết đây là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 trong kỳ MLPerf Inference năm ngoái. Ở phiên bản v6.0, ưu thế này tiếp tục được duy trì. Nhiều nhà sản xuất chip ASIC và cả AMD vẫn chưa tham gia bộ bài kiểm tra này một cách toàn diện như NVIDIA. Công ty lý giải hiệu năng suy luận đạt được nhờ thiết kế đồng bộ cực kỳ chặt chẽ trên nhiều cấp độ: chip, kiến trúc hệ thống, thiết kế trung tâm dữ liệu và phần mềm. Kết quả MLPerf Inference v6.0 cũng được dùng để minh chứng cho chỉ số token/USD và chi phí sở hữu toàn phần (TCO) cạnh tranh trong các triển khai quy mô lớn.

www.genk.vn (ntbtra)
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

Chuyển đổi số tại Cần Thơ: Thực trạng và giải pháp hoàn thiện hệ thống chính sách nâng cao năng lực đổi mới sáng tạo của các doanh nghiệp
Nỗ lực hoàn thiện hạ tầng công nghệ thông tin, đảm bảo kết nối thông suốt
Tập trung cao độ cho phát triển kinh tế - xã hội thành phố
Nâng cao chất lượng đội ngũ cán bộ làm công tác đối ngoại
Lãnh đạo UBND thành phố Cần Thơ làm việc với Sở Khoa học và Công nghệ về tình hình hoạt động sau khi hợp nhất ba địa phương
Hội đồng tư vấn, giao trực tiếp tổ chức chủ trì nhiệm vụ KH&CN (Tư vấn và chứng nhận Tiêu chuẩn ISO 9001:2015 – Hệ thống quản lý chất lượng - Các yêu cầu và Tiêu chuẩn ISO 14001:2015 – Hệ thống quản lý môi trường) thuộc Chương trình NSCL năm 2025
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Siêu thị số  
 
Đề xuất thuật toán ước lượng độ cao bờ sông sử dụng máy ảnh ba chiều
Mô hình độ cao địa hình là một thành phần dữ liệu quan trọng trong các nghiên cứu mô phỏng thủy lực sông ngòi và dự báo lũ lụt. Tuy nhiên, việc thu thập độ cao khu vực ven bờ sông vẫn còn gặp nhiều hạn chế do các thiết bị đo tự động khó tiếp cận vùng gần bờ. Nghiên cứu này đề xuất một thuật toán ước lượng độ cao bờ sông dựa trên dữ liệu độ sâu thu được từ máy ảnh ba chiều (3D).


 
Công nghệ 4.0  
 
Châm cứu, sắc thuốc bằng AI
Y học cổ truyền Trung Quốc, một lĩnh vực vốn được coi là khó chuẩn hóa và khó số hóa, đang thay đổi căn bản nhờ ứng dụng AI, từ chẩn đoán đến bào chế thuốc.


 
Điện tử  
 
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới
Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ cập nhật phần mềm, không thay đổi phần cứng.


 
Tin học  
 
Đề xuất thuật toán ước lượng độ cao bờ sông sử dụng máy ảnh ba chiều
Mô hình độ cao địa hình là một thành phần dữ liệu quan trọng trong các nghiên cứu mô phỏng thủy lực sông ngòi và dự báo lũ lụt. Tuy nhiên, việc thu thập độ cao khu vực ven bờ sông vẫn còn gặp nhiều hạn chế do các thiết bị đo tự động khó tiếp cận vùng gần bờ. Nghiên cứu này đề xuất một thuật toán ước lượng độ cao bờ sông dựa trên dữ liệu độ sâu thu được từ máy ảnh ba chiều (3D).


 



© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này