Новая модель Sky-T1 от NovaSky, способная конкурировать с OpenAI

Sky-T1-32B-Preview обошлась в 450 долларов и превзошла ранние версии на тестах MATH500 и LiveCodeBench

Опубликовано: 14.01.2025

Логотип NovaSky с сайта novasky-ai.github.io

Исследовательская команда NovaSky из лаборатории Sky Computing Lab при UC Berkeley представила новый прототип модели Sky-T1-32B-Preview, способный конкурировать с ранними версиями OpenAI на ключевых тестах. Это первая по-настоящему открытая модель понимания, которая может быть воспроизведена с нуля, поскольку команда поделилась данными, использованными для обучения, и необходимым кодом. Впечатляет, что обучение Sky-T1-32B-Preview обошлось менее чем в 450 долларов. Для сравнения, недавно модели подобной производительности стоили миллионы долларов.

Sky-T1 использует синтетические данные, что помогло снизить расходы. Это модель, которая эффективно проверяет себя, избегая типичных ошибок. В отличие от многих ИИ, она требует немного больше времени для решения задач, но ее решения более надежны в таких областях, как физика, наука и математика. NovaSky применила модель Alibaba QwQ-32B-Preview для создания первоначальных данных, а затем использовала GPT-4o-mini от OpenAI для их обработки.

Sky-T1 имеет 32 миллиарда параметров и обучалась 19 часов на восьми Nvidia H100 GPU. Модель превзошла раннюю версию o1 на тестах MATH500 и LiveCodeBench. В то же время она уступает в GPQA-Diamond, где проверяются знания по физике, биологии и химии.

NovaSky планирует продолжать разработку открытых моделей с усовершенствованными возможностями понимания. Команда сосредоточится на создании более эффективных моделей, сохраняющих сильные навыки понимания, и исследовании техник, повышающих эффективность и точность моделей во время тестирования.

Отметки:NovaSky OpenAI Sky

Комментариев нет

Новая модель Sky-T1 от NovaSky, способная конкурировать с OpenAI

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Google добавляет персональные настройки в NotebookLM для пользователей

Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями

Amazon MGM Studios тестирует AI Studio для кинопроизводства

Claude Opus 4.6 возглавила рейтинг анализа данных ИИ

Seedance 2.0 создает волну видео со знаменитостями онлайн

Навигация

Полезное

Читайте также

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Читайте также

Прокачайся с AI!