Điện tử

Lượt truy cập:

Điện tử [ Đăng ngày (04/04/2026) ]
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới

Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ cập nhật phần mềm, không thay đổi phần cứng.
NVIDIA vừa công bố kết quả tham dự bộ bài kiểm tra MLPerf Inference v6.0, với nền tảng Blackwell Ultra, đồng thời ghi nhận số lần chiến thắng cao gấp 9 lần đối thủ gần nhất. MLPerf Inference v6.0 do tổ chức MLCommons phát triển, bổ sung hỗ trợ cho các mô hình lập luận và MoE thế hệ mới gồm DeepSeek-R1, GPT-OSS-120B và Mixtral 8x7B. Bên cạnh đó, bộ bài kiểm tra còn mở rộng phạm vi sang các mô hình ngôn ngữ lớn dạng dense, hệ thống gợi ý tạo sinh và mô hình ngôn ngữ thị giác, phản ánh đúng yêu cầu thực tế của doanh nghiệp hiện nay. CEO Jensen Huang từng gọi MLPerf là một trong những bộ bài kiểm tra "khắt khe" nhất hiện có. Kết quả nổi bật nhất đến từ cấu hình GB300 NVL72 khi so sánh giữa v5.1 và v6.0. Với tác vụ DeepSeek-R1 ở chế độ Server, thông lượng tăng từ 2.907 lên 8.064 tokens/giây/GPU, tương đương 2,77 lần. Ở chế độ Offline, con số lần lượt là 5.842 và 9.821 tokens/giây/GPU (tăng 1,68 lần). Với mô hình Llama 3.1 405B, tốc độ Server tăng từ 170 lên 259 tokens/giây/GPU (1,52 lần), còn Offline đạt 271 tokens/giây/GPU so với 224 tokens/giây/GPU ở thế hệ trước (1,21 lần). Phần lớn mức tăng này đến từ tối ưu hóa phần mềm, không phải thay đổi phần cứng. Kể từ lần tham dự đầu tiên với bài kiểm tra DeepSeek-R1 vài tháng trước, NVIDIA đã cải thiện thông lượng token lên 2,7 lần chỉ nhờ cập nhật phần mềm. Ở cấp độ phần cứng, GB300 NVL72 mang lại tốc độ cao hơn tới 2,77 lần so với GB200 NVL72, cho thấy mức độ cải tiến qua từng thế hệ là nhất quán và rõ ràng. NVIDIA cho biết đây là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 trong kỳ MLPerf Inference năm ngoái. Ở phiên bản v6.0, ưu thế này tiếp tục được duy trì. Nhiều nhà sản xuất chip ASIC và cả AMD vẫn chưa tham gia bộ bài kiểm tra này một cách toàn diện như NVIDIA. Công ty lý giải hiệu năng suy luận đạt được nhờ thiết kế đồng bộ cực kỳ chặt chẽ trên nhiều cấp độ: chip, kiến trúc hệ thống, thiết kế trung tâm dữ liệu và phần mềm. Kết quả MLPerf Inference v6.0 cũng được dùng để minh chứng cho chỉ số token/USD và chi phí sở hữu toàn phần (TCO) cạnh tranh trong các triển khai quy mô lớn.
www.genk.vn (ntbtra)

In bài viết

Tin tiếp theo

Nghiên cứu
Tự nhiên
Nông-Lâm-Ngư
Xã hội-Nhân văn

Công nghệ
Cơ khí chế tạo
Môi trường
Sức khỏe

Thông tin
Tin học
Điện tử
Truyền thông

Kinh tế - Xã hội
Đời sống
Pháp luật
Kinh doanh

Sở hữu trí tuệ
Hoạt động
Văn bản
SHTT và Cuộc sống

Năng lượng
Thành tựu mới
Văn bản
Sản phẩm xanh

Chợ công nghệ
Sự kiện
Chào bán
Tìm mua

Ứng dụng
Công nghiệp
Nông nghiệp
Xây dựng

Hợp tác
Trong nước
Quốc tế
Địa phương

Giải trí
Đố vui khoa học
Xe
Thể thao

Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này

Họ tên	(*) Vui lòng nhập họ tên
Đơn vị công tác
Email	(*) Vui lòng nhập địa chỉ email
Mã xác nhận	Nhập mã được hiển thị ở hộp dưới đây (*)
Nội dung	(*)
Chú ý: (*) bắt buộc nhập.

© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ

Tin mới

Siemens và Humanoid thử nghiệm robot HMND 01 Alpha trong logistics

Fail Fast, Fail Small, Fail Safe: Mô hình thực tiễn cho tự động hóa robot

Chef Robotics đạt cột mốc 100 triệu suất ăn với robot tự động

Ouster ra mắt camera cổ tay Stereolabs ZED X Nano

AGIBOT triển khai robot bán nhân hình trong sản xuất điện tử

Gaming Smartphones 2026: Liệu có còn đáng mua?

Meta Quest 3, Quest 3S tăng giá vì thiếu RAM – Đây là mức giá mới

Đột phá 100 lần nhanh hơn có thể khắc phục vấn đề lớn nhất của máy tính lượng tử

10 công nghệ tương lai sẽ thay đổi cuộc sống hằng ngày: AI, công nghệ lượng tử và hơn thế nữa

NVIDIA chuẩn bị tung GPU chơi game giá rẻ với 12GB VRAM vào tháng 6

Rò rỉ Samsung Galaxy S27 hé lộ UFS 5.0, nhưng chỉ dành cho một số phiên bản cao cấp

TCL ra mắt TV SQD-Mini LED và TV Fashion A400 Series: Tự tin dẫn đầu công nghệ, định chuẩn phong cách sống mới

Insta360 hé lộ Luna Ultra: zoom quang 6x, thiết kế tách rời, tiện thể "đá xoáy" màn ra mắt mờ nhạt của Osmo Pocket 4

ASUS ROG ra tai nghe open-ear, chơi game vẫn nghe thấy mọi thứ xung quanh

SSD dưới 1 TB không ai mua, RAM 8 GB vẫn bán chạy

Video

Điểm tin Khoa học và Công nghệ tuần 16

Thương mại điện tử xuyên biên giới: Mở "đường băng" mới cho hàng Việt

OpenAI GPT 5.5 mới là một loại trí tuệ hoàn toàn mới

Agent Swarms - Một trong những hệ thống trí tuệ nhân tạo mạnh mẽ nhất hiện nay.

Mở đường cho công nghệ sinh học bứt phá thành ngành kinh tế - kỹ thuật trọng yếu

Minh bạch thị trường từ chuẩn chất lượng sản phẩm

Minh bạch thị trường từ chuẩn chất lượng sản phẩm

Mở cửa thị trường bằng “hộ chiếu số”

Nghiên cứu

Công nghệ

Thông tin

Xã hội

Ứng dụng

Vũ trụ

Sở hữu trí tuệ

Năng lượng

Hợp tác

Sức khỏe

Đời sống

Thiên nhiên

© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ

Tin mới

Điểm tin Khoa học và Công nghệ tuần 16

Thương mại điện tử xuyên biên giới: Mở "đường băng" mới cho hàng Việt

OpenAI GPT 5.5 mới là một loại trí tuệ hoàn toàn mới

Agent Swarms - Một trong những hệ thống trí tuệ nhân tạo mạnh mẽ nhất hiện nay.

Mở đường cho công nghệ sinh học bứt phá thành ngành kinh tế - kỹ thuật trọng yếu

Minh bạch thị trường từ chuẩn chất lượng sản phẩm

Minh bạch thị trường từ chuẩn chất lượng sản phẩm

Mở cửa thị trường bằng “hộ chiếu số”