Разработан метод быстрого "сжатия" аналогов ChatGPT

Исследователи из России и США, Австрии и Саудовской Аравии разработали подход, позволяющий быстро квантизировать - особым образом сжимать - большие языковые модели, что позволит использовать их не только на серверах, но и на телефонах и прочих устройствах с ограниченным объемом