Graphic Card Leadtek | |
---|---|
GPU | NVIDIA Ampere Architecture |
CUDA Parallel Processing cores | 6,144 |
NVIDIA Tensor Cores | 192 |
NVIDIA RT Cores | 48 |
Single-Precision Performance | 19.2 TFLOPS |
RT Core Performance | 37.4 TFLOPS |
Tensor Performance | 153.4 TFLOPS |
Graphics Bus | PCI Express 4.0 x 16 |
Memory size | 16 GB GDDR6 with ECC |
Output | 4x DisPlayPort 1.4 |
Memory Interface | 256-bit |
Memory Bandwidth (GB/sec) | 448 GB/s |
Card Dimensions | 4.4" H x 9.5" Single Slot |
Product Weight | 500g |
Graphics Card Power | 140 W |
Thermal Solution | Active |
Package contents | 1x 6-pin PCle |
Power Connector | 1x 6-pin PCle |
Frame lock | Compatible (with Quadro Sync II) |
Thông số kỹ thuật
Mô tả sản phẩm
NVIDIA RTX A4000
NVIDIA RTX A4000 là GPU một khe cắm mạnh mẽ nhất dành cho các chuyên gia, mang lại khả năng theo dõi tia thời gian thực, máy tính tăng tốc bằng AI và hiệu suất đồ họa cao cho máy tính để bàn của bạn. Được xây dựng trên kiến trúc NVIDIA Ampere, RTX A4000 kết hợp 48 lõi RT thế hệ thứ hai, 192 lõi Tensor thế hệ thứ ba và 6, 144 lõi CUDA với bộ nhớ đồ họa 16 GB. Vì vậy, bạn có thể thiết kế các sản phẩm thế hệ tiếp theo, thiết kế cảnh quan thành phố trong tương lai và tạo ra trải nghiệm giải trí phong phú của ngày mai, ngày hôm nay, từ máy trạm để bàn của bạn. Và với hệ số hình thức PCIe một khe, tiết kiệm điện năng phù hợp với nhiều loại khung máy trạm, bạn có thể làm những công việc đặc biệt mà không có giới hạn.
Các tính năng hiệu suất
Kiến trúc NVIDIA Ampere
NVIDIA RTX A4000 là giải pháp GPU khe đơn mạnh mẽ nhất cung cấp khả năng dò tia theo thời gian thực hiệu suất cao, máy tính tăng tốc AI và kết xuất đồ họa chuyên nghiệp. Dựa trên những cải tiến chính của SM từ GPU Turing, kiến trúc NVIDIA Ampere nâng cao các hoạt động dò tia, hoạt động ma trận tensor và thực thi đồng thời các hoạt động FP32 và INT32.
Màu CUDA
Các lõi CUDA dựa trên kiến trúc NVIDIA Ampere mang lại thông lượng dấu chấm động chính xác đơn (FP32) lên đến 2,7 lần so với thế hệ trước, cung cấp các cải tiến hiệu suất đáng kể cho quy trình đồ họa như phát triển mô hình 3D và tính toán cho khối lượng công việc như mô phỏng máy tính để bàn kỹ thuật hỗ trợ máy tính (CAE). RTX A4000 cho phép hai đường dẫn dữ liệu chính FP32, tăng gấp đôi hoạt động FP32 cao nhất.
Lõi RT thế hệ thứ 2
Kết hợp công cụ dò tia thế hệ thứ 2, GPU dựa trên kiến trúc NVIDIA Ampere cung cấp hiệu suất hiển thị tia đáng kinh ngạc. Một bảng RTX A4000 duy nhất có thể hiển thị các mô hình chuyên nghiệp phức tạp với bóng, phản xạ và khúc xạ chính xác về mặt vật lý để giúp người dùng có cái nhìn sâu sắc tức thì. Hoạt động cùng với các ứng dụng tận dụng API như NVIDIA OptiX, Microsoft DXR và Vulkan ray tracing, các hệ thống dựa trên RTX A4000 sẽ cung cấp năng lượng cho quy trình thiết kế tương tác thực sự để cung cấp phản hồi ngay lập tức cho mức năng suất chưa từng có. RTX A4000 có khả năng dò tia nhanh hơn gấp 2 lần so với thế hệ trước. Công nghệ này cũng tăng tốc độ hiển thị hiện tượng nhòe chuyển động theo tia để có kết quả nhanh hơn với độ chính xác hình ảnh cao hơn.
Lõi căng thế hệ thứ 3
Được xây dựng có mục đích cho phép số học ma trận học sâu ở trung tâm của các chức năng hội thảo và đào tạo mạng nơ-ron, RTX A4000 bao gồm các lõi Tensor nâng cao giúp tăng tốc nhiều loại dữ liệu hơn và bao gồm tính năng Sparsity có cấu trúc mịn mới mang lại thông lượng lên tới 2X cho các hoạt động của ma trận tensor so với thế hệ trước. Lõi Tensor mới sẽ tăng tốc hai chế độ chính xác TF32 và BFloat16 mới. Các đường dẫn dữ liệu số nguyên và dấu phẩy động độc lập cho phép thực thi khối lượng công việc hiệu quả hơn bằng cách sử dụng kết hợp các phép tính địa chỉ và tính toán.
PCIe thế hệ 4
RTX A4000 hỗ trợ PCI Express Gen 4, cung cấp băng thông gấp đôi PCIe Gen 3, cải thiện tốc độ truyền dữ liệu từ bộ nhớ CPU cho các tác vụ đòi hỏi nhiều dữ liệu như AI và khoa học dữ liệu.
Bộ nhớ GDDR6 tốc độ cao hơn
Được xây dựng với bộ nhớ GDDR6 16GB mang lại thông lượng lớn hơn tới 23% cho khối lượng công việc theo dõi tia, kết xuất và AI so với thế hệ trước. RTX A4000 cung cấp bộ nhớ đồ họa lớn nhất trong ngành để giải quyết các bộ dữ liệu và mô hình lớn nhất trong các ứng dụng chuyên nghiệp nhạy cảm với độ trễ.
Mã sửa lỗi (ECC) trên bộ nhớ đồ họa
Đáp ứng các yêu cầu nghiêm ngặt về tính toàn vẹn của dữ liệu cho các ứng dụng quan trọng với độ chính xác và độ tin cậy của máy tính không thỏa hiệp cho các máy trạm.
Công cụ NVDEC thế hệ thứ 5
NVDEC rất thích hợp cho các ứng dụng chuyển mã và phát lại video để giải mã thời gian thực. Các codec video sau được hỗ trợ để giải mã tăng tốc phần cứng: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 và AV1.
Công cụ NVENC thế hệ thứ 7
NVENC có thể đảm nhận các tác vụ mã hóa video 4K hoặc 8K khắt khe nhất để giải phóng công cụ đồ họa và CPU cho các hoạt động khác. RTX A4000 cung cấp chất lượng mã hóa tốt hơn so với các bộ mã hóa x264 dựa trên phần mềm.
Đồ họa Preemption
Ưu tiên cấp độ pixel cung cấp khả năng kiểm soát chi tiết hơn để hỗ trợ tốt hơn các tác vụ nhạy cảm với thời gian như theo dõi chuyển động VR.
Compute Preemption
Preemption ở cấp độ hướng dẫn cung cấp khả năng kiểm soát hạt tốt hơn đối với các tác vụ tính toán để ngăn các ứng dụng đang chạy lâu từ việc độc quyền tài nguyên hệ thống hoặc hết thời gian.
NVIDIA RTX IO
Tăng tốc hiệu suất giải nén không mất dữ liệu dựa trên GPU bằng cách sử dụng CPU thấp hơn tới 100 lần và 20 lần so với các API lưu trữ truyền thống bằng cách sử dụng API DirectStorage cho Windows mới của Microsoft. RTX IO di chuyển dữ liệu từ bộ nhớ sang GPU ở dạng nén, hiệu quả hơn và cải thiện hiệu suất I / O.
Công nghệ đa GPU
Công nghệ NVIDIA SLI
Tận dụng nhiều GPU để tự động mở rộng hiệu suất đồ họa, nâng cao chất lượng hình ảnh, mở rộng vùng hiển thị và lắp ráp một hệ thống được ảo hóa hoàn toàn.
Tính năng hiển thị
Công nghệ khảm NVIDIA Quadro
Rõ ràng quy mô máy tính để bàn và các ứng dụng trên tối đa 4 GPU và 16 màn hình từ một máy trạm duy nhất trong khi mang lại hiệu suất và chất lượng hình ảnh đầy đủ.
DisplayPort 1.4a
Hỗ trợ tối đa bốn màn hình 5K @ 60Hz hoặc màn hình 8K kép @ 60Hz trên mỗi thẻ. RTX A4000 hỗ trợ màu HDR cho 4K @ 60Hz cho giải mã HEVC 10 / 12b và lên đến 4K @ 60Hz cho mã hóa HEVC 10b. Mỗi đầu nối DisplayPort có thể cung cấp độ phân giải cực cao 4096x2160 @ 120 Hz với màu 30-bit.
NVIDIA RTX Desktop Manager
Có được quyền kiểm soát trải nghiệm máy tính để bàn của người dùng cuối chưa từng có để tăng năng suất trong môi trường màn hình lớn hoặc nhiều màn hình, đặc biệt là trong thời đại màn hình lớn, màn hình rộng hiện nay.
NVIDIA ® Quadro Sync II
Đồng bộ hóa màn hình và đầu ra hình ảnh của tối đa 32 màn hình từ 8 GPU (được kết nối thông qua hai bo mạch Sync II) trong một hệ thống duy nhất, giảm số lượng máy cần thiết để tạo môi trường hình ảnh hóa video nâng cao.
Chốt kết nối khóa khung
Mỗi đầu nối khóa khung được thiết kế với cơ chế giữ lại tự khóa để đảm bảo kết nối của nó với cáp khóa khung để mang lại kết nối mạnh mẽ và năng suất tối đa.
Hỗ trợ âm thanh nổi bốn bộ đệm OpenGL
Cung cấp trải nghiệm Âm thanh nổi 3D mượt mà và đắm chìm cho các ứng dụng chuyên nghiệp.
Hỗ trợ máy tính để bàn độ phân giải siêu cao
Nhận nhiều lựa chọn cấu trúc liên kết Mosaic với các thiết bị hiển thị độ phân giải cao có kích thước máy tính để bàn Tối đa 32K.
Đồng bộ hóa âm thanh nổi 3D chuyên nghiệp
Kiểm soát mạnh mẽ các hiệu ứng âm thanh nổi thông qua kết nối chuyên dụng để đồng bộ hóa trực tiếp phần cứng âm thanh nổi 3D với cạc đồ họa Quadro.
Hỗ trợ phần mềm
Trải nghiệm NVIDIA RTX
NVIDIA RTX Experience cung cấp một bộ công cụ năng suất cho máy trạm để bàn của bạn, bao gồm ghi âm trên máy tính để bàn lên đến 8K, cảnh báo tự động về các bản cập nhật trình điều khiển NVIDIA RTX Enterprise mới nhất và truy cập các tính năng chơi game. Ứng dụng có sẵn để tải xuống tại đây
Phần mềm được tối ưu hóa cho AI
Các khuôn khổ học tập sâu như Caffe2, MXNet, CNTK, TensorFlow và các khuôn khổ khác mang lại thời gian đào tạo nhanh hơn đáng kể và hiệu suất đào tạo đa nút cao hơn. Các thư viện tăng tốc GPU như cuDNN, cuBLAS và TensorRT mang lại hiệu suất cao hơn cho cả ứng dụng suy luận học sâu và Máy tính hiệu suất cao (HPC).
Nền tảng máy tính song song NVIDIA CUDA
Thực thi nguyên bản các ngôn ngữ lập trình tiêu chuẩn như C / C ++ và Fortran, và các API như OpenCL, OpenACC và Direct Compute để tăng tốc các kỹ thuật như dò tia, xử lý video và hình ảnh cũng như tính toán động lực học.
Bộ nhớ hợp nhất
Một không gian địa chỉ ảo 49 bit liền mạch, duy nhất cho phép di chuyển dữ liệu trong suốt giữa việc phân bổ đầy đủ bộ nhớ CPU và GPU.
NVIDIA GPUDirect cho video
GPUDirect cho tốc độ Video giao tiếp giữa GPU và thiết bị I / O video bằng cách tránh các bản sao bộ nhớ hệ thống không cần thiết và chi phí CPU.
Công cụ quản lý doanh nghiệp NVIDIA
Tối đa hóa thời gian hoạt động của hệ thống, quản lý liền mạch việc triển khai trên quy mô rộng và điều khiển từ xa các cài đặt đồ họa và hiển thị để có các hoạt động hiệu quả.