DeepSeek, китайский стартап в области искусственного интеллекта, удивил мир своими новыми моделями Janus-Pro. Компания заявляет, что эти модели могут превзойти известные DALL-E 3 от OpenAI. Janus-Pro доступна для загрузки на платформе Hugging Face и имеет от одного до семи миллиардов параметров. Это означает, что модели способны решать сложные задачи, ведь, как правило, больше параметров означает лучшую производительность.

Janus-Pro может анализировать и создавать новые изображения. По словам DeepSeek, самая большая модель Janus-Pro-7B превосходит DALL-E 3. Несмотря на то, что большинство моделей Janus-Pro могут анализировать только небольшие изображения с разрешением до 384×384, их производительность впечатляет.
DeepSeek также привлекает внимание своими открытыми моделями, которые, по словам компании, можно обучать за меньшие затраты и с использованием меньшего количества графических процессоров. Это заставило многих аналитиков сомневаться, может ли США сохранить лидерство в гонке ИИ. На фоне этого акции Nvidia упали на 17 процентов, что стало самым крупным падением в истории США, по данным CNBC.
DeepSeek ограничил регистрацию новых пользователей из-за масштабных атак на свои сервисы. Однако существующие пользователи могут войти в систему без проблем. Это ограничение вызвало дополнительный интерес к компании, которая уже покорила вершины App Store со своим AI-помощником.