Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA представили новый метод быстрого сжатия больших языковых моделей (LLM). Решение позволяет уменьшить размер модели без потери качества и запустить ее на более доступных устройствах — смартфоне или ноутбуке. Об этом Sostav сообщил представитель