Команда исследователей Microsoft представила самую масштабную на сегодняшний день 1-битную генеративную ИИ-модель под названием BitNet b1.58 2B4T, которая уже доступна для свободного использования по лицензии MIT. В отличие от стандартных решений, эта модель может работать даже на обычных процессорах, включая чипы Apple M2, что открывает новые возможности для пользователей с минимальными аппаратными ресурсами.
BitNet b1.58 2B4T использует уникальный подход к сжатию, сохраняя параметры в виде всего трех значений — минус один, ноль и один. Такая структура позволяет модели оставаться чрезвычайно эффективной по памяти и скорости работы, опережая традиционные модели аналогичного размера. Для обучения этой модели был использован массивный объем данных — четыре триллиона токенов, что примерно равно тридцати трем миллионам книг.
В тестах BitNet b1.58 2B4T превзошла конкурентов с подобным количеством параметров, среди которых — Llama 3.2 1B от Meta, Gemma 3 1B от Google и Qwen 2.5 1.5B от Alibaba. Особенно яркие результаты модель показала на задачах с логическим мышлением и повседневных математических задачах, а по скорости работы временами вдвое опередила аналогичные решения, используя при этом значительно меньше памяти.
В то же время, для достижения таких показателей требуется применение специальной разработки Microsoft — фреймворка bitnet.cpp, который на данный момент поддерживает лишь ограниченный круг аппаратного обеспечения. Поддержка графических процессоров, которые доминируют в сфере ИИ, пока отсутствует, что ограничивает возможности внедрения модели на различных платформах.