Компания «Яндекс» разместила в сервисе Github исходный код набора инструментов и методов разработки YaFSDP, на котором обучалась модель YandexGPT 3.

По словам представителей компании, алгоритм сможет ускорить обучение больших языковых моделей вплоть до 25% — в зависимости от архитектуры и параметров нейросети.

Библиотека должна помочь бизнесу, частным разработчикам и исследователям сократить расходы на оборудование для обучения как языковых моделей, так и других технологий. Например, которые генерируют изображения.

Посмотреть код YaFSDP можно здесь.

Источник, фото: пресс-служба «Яндекса»