«Яндекс» выложил в Сеть YaFSDP — алгоритм для ускорения обучения больших языковых моделей
Компания «Яндекс» разместила в сервисе Github исходный код набора инструментов и методов разработки YaFSDP, на котором обучалась модель YandexGPT 3.
По словам представителей компании, алгоритм сможет ускорить обучение больших языковых моделей вплоть до 25% — в зависимости от архитектуры и параметров нейросети.
Библиотека должна помочь бизнесу, частным разработчикам и исследователям сократить расходы на оборудование для обучения как языковых моделей, так и других технологий. Например, которые генерируют изображения.
Посмотреть код YaFSDP можно здесь.
Источник, фото: пресс-служба «Яндекса»