«Яндекс» разработал новые методы сжатия больших языковых моделей

Команды научного отдела компании «Яндекс» Yandex Research, а также зарубежных учреждений IST Austria и Kaust разработали и опубликовали в открытом доступе новые методы сжатия больших языковых моделей. Они позволят бизнесу сократить расходы на вычислительные ресурсы до восьми раз.

Новое решение ускоряет нейросеть с помощью уменьшения и сохраняет в среднем 95 % качества ответов языковой модели. Для сравнения, другие популярные инструменты сохраняют от 59 % до 90 %, заявили в Yandex Research.

Эффективность методов сжатия оценивали на нейросетях с открытым исходным кодом: Llama 2, Llama 3, Mistral и других. Качество ответов оригинальной и сжатой версий языковой модели сравнивали на англоязычных бенчмарках — тестах, которые состоят из наборов вопросов в разных областях знаний.

Код новых методов сжатия есть на платформе GitHub. Разработчики также могут скачать обучающие материалы, которые помогут дообучить уменьшенные нейросети под свои сценарии.

Кроме того, исследователи Yandex Research опубликовали уже сжатые с помощью новых методов популярные языковые модели с открытым исходным кодом.

источник: представители Yandex Research

«Яндекс» разработал новые методы сжатия больших языковых моделей

Другие статьи по темам

Первая полоса

ЗОЖ без давления: Как заботиться о себе в своем ритме

Смальта, лепешка кока и сангрия с ананасом: Каталонское коктейльное бистро «Ослиный рай»

5 заметных женщин-операторов современного кино

Куда сходить в Москве с 21 по 27 апреля

Boulevard Depo, Biicla с друзьями, пасхальный турнир и фестиваль керамики ручной работы

13 атмосферных веранд в Москве, которые работают уже сейчас

13 атмосферных веранд в Москве, которые работают уже сейчас

Закусочная Miyu, каталонское бистро «Ослиный рай», кафе «5 июня» и другие новости (Петербург)

«На шапке было что-то похожее на пыль»: Редакция «БГ» пробует недорогие куличи из магазинов

«На шапке было что-то похожее на пыль»: Редакция «БГ» пробует недорогие куличи из магазинов

«Под огнем»: Стреляй, а то убьют!

Авиакомпании начали продавать билеты в Абхазию. Сколько они стоят и кто выполняет рейсы

«Что я хочу создать, но пока не решаюсь»: Гастрономический лагерь, клуб для гурманов и сет «МРОТ»

Polka dot у российских брендов: 20 вещей в горох

Polka dot у российских брендов: 20 вещей в горох

«Яндекс» разработал новые методы сжатия больших языковых моделей

Другие статьи по темам

Новые и лучшие

Как выглядит штаб-квартира Т-Банка на Грузинском Валу

Как разобрать гардероб к началу нового сезона: 10 простых советов

Скоро Пасха: Выбрали 20+ самых красивых куличей в Москве

Где есть мясо в Москве: 11 ресторанов

13 атмосферных веранд в Москве, которые работают уже сейчас

Что за зверь этот Whoop: Как люди отказались от алкоголя и улучшили сон благодаря health-трекеру

Первая полоса

ЗОЖ без давления: Как заботиться о себе в своем ритме

Смальта, лепешка кока и сангрия с ананасом: Каталонское коктейльное бистро «Ослиный рай»

5 заметных женщин-операторов современного кино

Куда сходить в Москве с 21 по 27 апреля

Boulevard Depo, Biicla с друзьями, пасхальный турнир и фестиваль керамики ручной работы

13 атмосферных веранд в Москве, которые работают уже сейчас

13 атмосферных веранд в Москве, которые работают уже сейчас

Закусочная Miyu, каталонское бистро «Ослиный рай», кафе «5 июня» и другие новости (Петербург)

«На шапке было что-то похожее на пыль»: Редакция «БГ» пробует недорогие куличи из магазинов

«На шапке было что-то похожее на пыль»: Редакция «БГ» пробует недорогие куличи из магазинов

«Под огнем»: Стреляй, а то убьют!

Авиакомпании начали продавать билеты в Абхазию. Сколько они стоят и кто выполняет рейсы

«Что я хочу создать, но пока не решаюсь»: Гастрономический лагерь, клуб для гурманов и сет «МРОТ»

Polka dot у российских брендов: 20 вещей в горох

Polka dot у российских брендов: 20 вещей в горох