Lượt truy cập:
Điện tử [ Đăng ngày (04/04/2026) ]
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới
Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ cập nhật phần mềm, không thay đổi phần cứng.

NVIDIA vừa công bố kết quả tham dự bộ bài kiểm tra MLPerf Inference v6.0, với nền tảng Blackwell Ultra, đồng thời ghi nhận số lần chiến thắng cao gấp 9 lần đối thủ gần nhất.

MLPerf Inference v6.0 do tổ chức MLCommons phát triển, bổ sung hỗ trợ cho các mô hình lập luận và MoE thế hệ mới gồm DeepSeek-R1, GPT-OSS-120B và Mixtral 8x7B. Bên cạnh đó, bộ bài kiểm tra còn mở rộng phạm vi sang các mô hình ngôn ngữ lớn dạng dense, hệ thống gợi ý tạo sinh và mô hình ngôn ngữ thị giác, phản ánh đúng yêu cầu thực tế của doanh nghiệp hiện nay. CEO Jensen Huang từng gọi MLPerf là một trong những bộ bài kiểm tra "khắt khe" nhất hiện có.

Kết quả nổi bật nhất đến từ cấu hình GB300 NVL72 khi so sánh giữa v5.1 và v6.0. Với tác vụ DeepSeek-R1 ở chế độ Server, thông lượng tăng từ 2.907 lên 8.064 tokens/giây/GPU, tương đương 2,77 lần. Ở chế độ Offline, con số lần lượt là 5.842 và 9.821 tokens/giây/GPU (tăng 1,68 lần). Với mô hình Llama 3.1 405B, tốc độ Server tăng từ 170 lên 259 tokens/giây/GPU (1,52 lần), còn Offline đạt 271 tokens/giây/GPU so với 224 tokens/giây/GPU ở thế hệ trước (1,21 lần).

Phần lớn mức tăng này đến từ tối ưu hóa phần mềm, không phải thay đổi phần cứng. Kể từ lần tham dự đầu tiên với bài kiểm tra DeepSeek-R1 vài tháng trước, NVIDIA đã cải thiện thông lượng token lên 2,7 lần chỉ nhờ cập nhật phần mềm. Ở cấp độ phần cứng, GB300 NVL72 mang lại tốc độ cao hơn tới 2,77 lần so với GB200 NVL72, cho thấy mức độ cải tiến qua từng thế hệ là nhất quán và rõ ràng.

NVIDIA cho biết đây là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 trong kỳ MLPerf Inference năm ngoái. Ở phiên bản v6.0, ưu thế này tiếp tục được duy trì. Nhiều nhà sản xuất chip ASIC và cả AMD vẫn chưa tham gia bộ bài kiểm tra này một cách toàn diện như NVIDIA. Công ty lý giải hiệu năng suy luận đạt được nhờ thiết kế đồng bộ cực kỳ chặt chẽ trên nhiều cấp độ: chip, kiến trúc hệ thống, thiết kế trung tâm dữ liệu và phần mềm. Kết quả MLPerf Inference v6.0 cũng được dùng để minh chứng cho chỉ số token/USD và chi phí sở hữu toàn phần (TCO) cạnh tranh trong các triển khai quy mô lớn.

www.genk.vn (ntbtra)
In bài viết  
Bookmark
Ý kiến của bạn




© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
Tin mới
Siemens và Humanoid thử nghiệm robot HMND 01 Alpha trong logistics
Siemens AG và Humanoid vừa thông báo đã thử nghiệm thành công robot hình người HMND 01 Alpha tại nhà máy điện tử của Siemens ở Erlangen, Đức. Dựa trên...
Fail Fast, Fail Small, Fail Safe: Mô hình thực tiễn cho tự động hóa robot
Các dự án tự động hóa thường được biện minh bằng ROI rõ ràng: tăng hiệu suất, cải thiện an toàn và công thái học, nâng cao năng lực sản...
Chef Robotics đạt cột mốc 100 triệu suất ăn với robot tự động
Chef Robotics Inc. vừa công bố các robot của hãng đã hoàn thành 100 triệu suất ăn tại các cơ sở khách hàng, con số mà công ty khẳng định...
Ouster ra mắt camera cổ tay Stereolabs ZED X Nano
Ouster, Inc. vừa chính thức giới thiệu Stereolabs ZED X Nano, một mẫu camera stereo gắn cổ tay nhỏ gọn, được thiết kế chuyên biệt cho các tác vụ robotic...
AGIBOT triển khai robot bán nhân hình trong sản xuất điện tử
AGIBOT vừa công bố việc đưa dòng robot AGIBOT G2 vào môi trường sản xuất điện tử tiêu dùng tại Longcheer Technology. Đây được xem là bước tiến quan trọng,...
Gaming Smartphones 2026: Liệu có còn đáng mua?
Trong năm 2026, smartphone gaming đã phát triển thành những thiết bị cầm tay mạnh mẽ, đủ sức cạnh tranh với máy chơi game cầm tay và thậm chí cả...
Meta Quest 3, Quest 3S tăng giá vì thiếu RAM – Đây là mức giá mới
Meta vừa công bố cập nhật giá bán mới cho dòng kính thực tế ảo Quest 3, với lý do tình trạng thiếu hụt RAM đang ảnh hưởng trực tiếp...
Đột phá 100 lần nhanh hơn có thể khắc phục vấn đề lớn nhất của máy tính lượng tử
Một phương pháp theo dõi dữ liệu lượng tử biến mất nhanh gấp 100 lần vừa được phát triển, hứa hẹn giúp ổn định tương lai của ngành điện...
10 công nghệ tương lai sẽ thay đổi cuộc sống hằng ngày: AI, công nghệ lượng tử và hơn thế nữa
Xu hướng công nghệ tương lai đang tăng tốc với tốc độ chóng mặt, khi những đổi mới từng được coi là khoa học viễn tưởng nay đã trở thành...
NVIDIA chuẩn bị tung GPU chơi game giá rẻ với 12GB VRAM vào tháng 6
NVIDIA vẫn đang chịu ảnh hưởng từ tình trạng thiếu hụt chip trong ngành công nghệ, nhưng hãng có thể mang đến cho người dùng cơ hội sở hữu một...
Rò rỉ Samsung Galaxy S27 hé lộ UFS 5.0, nhưng chỉ dành cho một số phiên bản cao cấp
Những thông tin rò rỉ sớm về dòng Samsung Galaxy S27 đã đủ khiến cộng đồng công nghệ háo...
TCL ra mắt TV SQD-Mini LED và TV Fashion A400 Series: Tự tin dẫn đầu công nghệ, định chuẩn phong cách sống mới
Với bộ đôi TV SQD-Mini LED và TV Fashion A400 Series, có thể thấy TV đang dần trở thành trung tâm của trải nghiệm giải trí hiện đại, một phần...
Insta360 hé lộ Luna Ultra: zoom quang 6x, thiết kế tách rời, tiện thể "đá xoáy" màn ra mắt mờ nhạt của Osmo Pocket 4
Ngay sau khi DJI ra mắt Osmo Pocket 4 và hé lộ bản Osmo Pocket 4P, đối thủ Insta360 đã nhanh chóng phản pháo bằng loạt rò rỉ về mẫu...
ASUS ROG ra tai nghe open-ear, chơi game vẫn nghe thấy mọi thứ xung quanh
ROG Open Wireless kết nối qua dongle USB-C 2,4GHz với công nghệ SpeedNova, độ trễ chỉ bằng một phần sáu Bluetooth thông thường, giá ưu đãi khoảng 4,6 triệu đồng...
SSD dưới 1 TB không ai mua, RAM 8 GB vẫn bán chạy
Lexar bất ngờ khi SSD 256 GB và 512 GB chỉ bán được một phần rất nhỏ so với kỳ vọng ban đầu, trong khi RAM 8 GB vẫn có...
-->