Home Hot New Lộ diện điểm hiệu suất card đồ họa NVIDIA Tesla V100 dựa trên nhân GPU Volta GV100.

Lộ diện điểm hiệu suất card đồ họa NVIDIA Tesla V100 dựa trên nhân GPU Volta GV100.

by Kiet Nguyen

Tesla V100, giải pháp tăng tốc dựa trên GPU đầu bảng và nhanh nhất thế giới hiện tại của NVIDIA đã bắt đầu được chuyển đến các khách hàng đầu tiên. Dựa trên nhân Volta là một GPU được phát triển với những công nghệ và kỹ thuật hoàn hảo nhất hiện nay như dựa trên quy trình 12nm mới nhất, NVLINK 2.0, HBM 2.0, Tensor Cores và kiến trúc được thiết kế mang tính hiệu quả cao, làm cho nó trở thành con chip phù hợp nhất cho tính toán hạng nặng hoặc AI học thuật chuyên sâu.

Điểm số hiệu suất GeekBench của NVIDIA Tesla V100 dựa trên trên nhân Volta GV100 – hiệu suất tăng một cách vượt trội so với phiên bản tiền nhiệm P100 dựa trên nhân Pascal.

Được tung ra chỉ một năm trước, Tesla P100 với nhân Pascal đã đánh bại người tiền nhiệm trước đó một cách ngoạn mục. Vẫn được định vị dành cho các hệ thống tính toán chuyên ngành hoặc học thuật chuyên sâu. Tại GTC 2017, chúng ta đã biết được tất cả những thông tin về Volta GV100 và giờ đây, những con số điểm hiệu suất đầu tiên của nó đã xuất hiện và một lần nữa, nó đã làm cho chúng ta cảm thấy bị sốc thật sự.

Trong các bài test với GeekBench 4, với một hệ thống NVIDIA DGX-1, theo cách gọi của NVIDIA thì đây là một siêu máy tính bên trong một chiếc hộp. Một cỗ máy mạnh mẽ có khả năng mang lại những kết quả tính toán một cách đáng kinh ngạc. Theo tuyên bố chính thức, tổng mã lực trên DGX-1 đã được tăng từ 170 TFLOPS của tính toán FP16 lên đến 960 TFLOP, đó là nhờ vào các lõi Tensor mới trong mỗi GPU Volta GV100.

Về cấu hình, NVIDIA DGX-1 sử dụng đến 8 card Tesla V100 với mỗi card chứa 5120 nhân bên trong, tổng cộng chúng ta có đến 40.960 nhân CUDA và 5120 lõi Tensor. DGX-1 cũng bao gồm 128GB bộ nhớ HBM2 trên tổng 8 card Tesla V100. Hệ thống này với đầu não là hai bộ vi xử lý Intel Xeon E5-2698 v4 (20 nhân, 40 luồng, xung nhịp 2.2GHz). Ngoài ra DGX-1 còn có 512GB bộ nhớ DDR4 bên trong hệ thống. Về lưu trữ chúng ta có 4 ổ SSD 2TB cấu hình ở RIAD 0, hai card mạng 10 Gigabit. Và dĩ nhiên là một hệ thống nguồn cũng cực kỳ khủng bố 3200 Watt.

Bây giờ đến phần mà chúng ta đang chờ đợi, đó là kết quả. NVIDIA DGX-1 với GPU Pascal hiện đang là hệ thống có hiệu suất tính toán nhanh nhất thế giới hiện nay trên cơ sở dữ liệu của GeekBench 4. Để tiện so sánh, chúng ta sẽ so sánh với một máy trạm HP Z8 G4 với một card Quadro GP100 (thực chất là một card Tesla P100) đạt 278.706 điểm trong bài test OpenCL API. Tiếp tục di chuyển lên những hệ thống sử dụng Tesla P100 nhanh nhất, chúng ta có một hệ thống với cấu hình 8 card Tesla P100 đạt 320.031 điểm trong CUDA API. Nhưng hãy nhìn vào điểm số của Tesla V100. Hệ thống DGX-1 với 8 card Tesla V100 đạt một con số rất kinh hoàn 418.504 trong OpenCL API và còn hoành tráng hơn với 743537 trong CUDA API.

Với một con số vô cùng ấn tượng như thế, dù là trên lý thuyết. Nhưng chúng ta cũng có quyền kỳ vọng vào một mức hiệu suất nhảy vọt của kiến trúc Volta một khi nó bước vào thị trường máy tính chơi game. Một điều cần lưu ý từ những điều chỉnh đáng kinh ngạc trong tính toàn bằng CUDA cũng như các thư viện liên quan. Không chỉ có Tesla V100 mới có được những cải tiến mạnh mẽ trong OpenCL nhưng cũng giống như Tesla P100, nghĩa là NVIDIA đã làm việc rất cật lực và đang làm rất tốt và chắc chắn là sẽ còn tốt hơn nữa trong các thế hệ GPU tiếp theo. Còn hiện tại, bạn đang có nó, GPU nhanh nhất của NVIDIA, một sát thủ đầy uy lực đối với khối lượng các công việc liên quan đến tính toán chuyên sâu.

Nguồn: wccftech

Related Articles

Leave a Comment