Đặt banner 324 x 100

NVIDIA GTC Fall 2022 – Tóm tắt bài phát biểu chính


Dưới đây là phần tóm tắt cho bài phát biểu quan trọng của NVIDIA GTC Fall 2022, một sự kiện chuyên sâu về AI và công nghệ GPU do NVIDIA tổ chức, diễn ra trực tuyến từ ngày 19 – 22 tháng 9 năm 2022.

Bài viết được ghi lại theo trình tự trực tiếp từ sự kiện.

NVIDIA GTC Fall 2022 Keynote

Trong bản tóm tắt này, chúng ta kỳ vọng sẽ được nghe về các GPU mới và các ứng dụng mới của RTX, AI và Omniverse. Có thể có thông tin về chip mới và các dịch vụ đám mây.

NVIDIA RTX 4000 Ada Lovelace

NVIDIA Ada Lovelace là nền tảng RTX thế hệ thứ 3. GPU mới được xây dựng trên TSMC 4N 76B và 18000 nhân CUDA, nhiều hơn 70% so với thế hệ RTX 3000.

Các shader (trình tạo bóng) mới có năng lực lên đến 90 TFLOPS. Một bộ xử lý streaming mới có Shader Execution Reodering (SER) mà NVIDIA ví như bộ thực thi out-of-order cho CPU.

Các lõi RT thế hệ thứ 3 mới nhanh hơn với 200 RT TFLOPS. Ngoài ra còn có các lõi tensor thế hệ thứ 4 với năng lực lên đến 1400 Tensor TFLOPS và bộ tăng tốc luồng quang học để giúp khung hình mượt mà.

NVIDIA cũng có một số phát minh để giúp tính năng Ray Tracing trở nên phổ biến hơn.

Với DLSS 3, bạn có thể làm được nhiều việc hơn mà không cần sử dụng GPU rendering chính hoặc thậm chí cả CPU pipelines.

Một thứ mà NVIDIA đang thúc đẩy gần đây là Omniverse. Nó đã tìm ra một cách thông minh để đưa mọi người đến với nền tảng này. Nó có RTX Remix cho phép bạn tải game, sao chụp lại game bằng USD (Universal Scene Description), sau đó trong Omniverse, bộ công cụ RTX Remix có thể chỉnh sửa các texture và giúp người sửa đổi tạo vật liệu thông qua AI.

Tiếp theo, người ta có thể xuất ra bản mod và chơi nó. Điều này thực sự khôn khéo vì nó là một gateway để thu hút các nhà phát triển và nghệ sĩ trên Omniverse.

>>> Xem thêm: Card Dell PERC H745

 

NVIDIA Omniverse

NVIDIA Omniverse là nền tảng của công ty dành cho thế giới kỹ thuật số mà công ty hy vọng sẽ mở rộng mọi thứ từ các “digital twins” (phiên bản số hóa), đến gaming, mô phỏng và hơn thế nữa.

Trong suốt bài keynote, họ đã công bố các tính năng mới cho nền tảng này, bao gồm hỗ trợ cho GPU Ada Lovelace

Cuối cùng, Omniverse cần một thành phần đám mây để cộng tác.

Và chúng ở đây.

Đây là công bố đầu tiên trong số nhiều thông tin về cloud mà NVIDIA sẽ đưa ra hôm nay và trong tương lai gần.

Cập nhật mới NVIDIA Drive với Thor

Trước đây, NVIDIA đã lên lịch ra mắt cho nền tảng Atlan vào năm 2024. Nhưng bây giờ không còn thấy nữa và được thay thế bằng Thor, với hiệu suất gấp đôi Atlan trong cùng mốc thời gian

Điều này sẽ mang GPU thế hệ tiếp theo, cùng với các lõi được tăng cường sức mạnh Grace Neoverse V2 mới, tiến lên nền tảng robot thế hệ tiếp theo, trước đây là Orin, là nền tảng hiện nay.

Một phần ý tưởng ở đây là nền tảng mới có thể được sử dụng để cung cấp sức mạnh cho lĩnh vực thông tin giải trí cũng như các tính năng hỗ trợ lái xe. Nó cũng có khả năng xử lý multi-domain để nó có thể chạy chẳng hạn như Linux, QNX và Android, cùng một lúc.

Ngày nay, có rất nhiều máy tính khác nhau trên ô tô.

Trong tương lai, NVIDIA cho rằng Thor có thể thay thế phần lớn, nếu không muốn nói là tất cả. Điều đó có nghĩa là tiêu thụ điện năng thấp hơn và yêu cầu về trọng lượng / kích thước đối với máy tính cũng như hệ thống dây điện cũng thấp hơn.

NVIDIA nói rằng NVLink C2C giúp kết nối nhiều chip Thor cho các ứng dụng cần nhiều sức mạnh xử lý hơn.

NVIDIA cho biết NVIDIA Drive Orin thế hệ hiện tại của họ đã có hơn 40 chiến thắng về thiết kế cho đến thời điểm này.

Orin đang ở trong Máy chủ Metropolis Edge AI Orin

Nó cũng là trung tâm của NVIDIA IGX Orin. Đây là nền tảng mATX kết hợp hai cổng ConnectX-7 (400Gbps) và sẽ được sử dụng trong một số ứng dụng mới, bao gồm cả y tế.

IGX Orin này có lẽ là nền tảng thú vị nhất tại GTC 2022, bên cạnh dòng RTX 4000.

Mô phỏng NVIDIA Isaac cho robot cũng có sẵn dưới dạng dịch vụ đám mây.

>>> Xem thêm: Card Dell PERC H755

 

Hệ thống điện toán tăng tốc của NVIDIA trong Datacenter Stack

Đây là slide thiết lập cho phần tiếp theo.

NVIDIA RAPIDS có thể được sử dụng trên Windows WSL. Nó cũng hỗ trợ máy chủ Arm. Công ty cho biết RAPIDS cũng sẽ đến với Apache Spark.

Máy chủ suy luận NVIDIA Triton đang được mở rộng với 50 tính năng mới. Nó bao gồm suy luận mô hình ngôn ngữ lớn.

NVIDIA đưa ra các phần mềm và các công ty sử dụng phần mềm của NVIDIA. Chúng ta sẽ bỏ qua các phân đoạn này.

Một trong những thông báo lớn hơn được gắn với các mô hình ngôn ngữ lớn khi chúng phát triển về mức độ phức tạp và quy mô.

NVIDIA sẽ cung cấp một dịch vụ có thể sử dụng các mô hình ngôn ngữ lớn và tùy chỉnh chúng với số lượng ít nhất là 500 cặp đầu vào.

Sau đó, nó sẽ cung cấp đầu ra dưới dạng dịch vụ API. Lợi thế cho một công ty là họ có thể đào tạo các mô hình mà không cần có các cụm GPU lớn. Đối với NVIDIA, đây có thể là một ngành kinh doanh có tỷ suất lợi nhuận cực cao vì khách hàng dựa vào nó để lưu trữ các mô hình AI ở trung tâm của các chức năng kinh doanh.

NVIDIA sẽ có một phiên bản khác cho y tế và những thứ như khám phá thuốc. Đó sẽ là BioNeMo. Cả hai dịch vụ NeMo sẽ được chạy thử trên NVIDIA SuperPod vào tháng 10 năm 2022. NVIDIA cho biết H100 nhanh hơn ~ 5 lần so với A100 đối với các mô hình ngôn ngữ lớn do các transformer engine.

Công ty cổ phần thương mại Máy Chủ Hà Nội

- Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa

Hotline mua hàng Hà Nội: 0979 83 84 84       Điện thoai: 024 6296 6644

- CN Hồ Chí Minh: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10

Hotline mua hàng Hồ Chí Minh: 0945 92 96 96      Điện thoai: 028 2244 9399

- Email: hotro@maychuhanoi.vn

- website: https://maychuhanoi.vn/

- facebook: https://www.facebook.com/maychuhanoi