Компания Nvidia смогла за 53 минуты обучить ИИ языковой модели BERT (модель для обработки и использования естественных языков), а вывести результат получилось за 2 мс. Оба достижения являются рекордными в отрасли.
До этого никому не удавалось преодолеть часовой барьер обучения ИИ BERT, а скорость вывода в отрасли держалась на отметке около 10 мс. NVIDIA достигла такого результата на одной из своих ИИ-инфраструктур SuperPOD с установленными в ней 92 системами Nvidia DGX-2H, 1472 графическими процессорами V100 SXM3-32GB и десятью коммутаторами Mellanox Infiniband на каждый узел сети. Обучение производилось под управлением Nvidia TensorRT — библиотеки оптимизации глубокого обучения ИИ.
Кроме того, компания создала самую большую пользовательскую версию BERT, которая включает в себя 8,3 млрд параметров. Она получила название Megatron. Также Nvidia выложила код обучения для этой модели.
материал сайта www.macdigger.ru