Google DeepMind представила новую коллекцию генеративных моделей под названием Gemma 3, которая доступна для работы на различных устройствах, включая смартфоны, ноутбуки и рабочие станции. Эта коллекция включает облегчённые модели, которые отличаются высокой скоростью и производительностью, что делает их идеальными для использования на одном GPU или TPU. Gemma 3 поддерживает более 140 языков и предлагает расширенные возможности текстового и визуального анализа, что открывает новые возможности для создания интерактивных и интеллектуальных приложений.
Среди новых функций Gemma 3 — возможность обрабатывать сложные задачи благодаря расширенному контекстному окну на 128 тысяч токенов и поддержка вызова функций для автоматизации процессов. Модели Gemma 3 также представлены в квантизованных версиях, что обеспечивает более быструю производительность и сниженные требования к вычислительным ресурсам. Это позволяет пользователям адаптировать модели к своим нуждам, используя различные платформы и инструменты, такие как Hugging Face Transformers, PyTorch и другие.
Вместе с Gemma 3, Google DeepMind запустила ShieldGemma 2 — инструмент для проверки безопасности изображений, который обеспечивает автоматическое маркирование контента по трём категориям безопасности: опасный, сексуально откровенный и насильственный. Это позволяет разработчикам настраивать инструмент в соответствии с их потребностями, обеспечивая безопасное развитие ИИ-решений. ShieldGemma 2 построен на основе Gemma 3, что придаёт ему высокую эффективность и гибкость.
Gemma 3 легко интегрируется в существующие рабочие процессы, предлагая разнообразные варианты развёртывания, включая Vertex AI, Cloud Run и локальные среды. Это обеспечивает пользователям возможность быстрого начала работы с моделями, их адаптации и развёртывания на различных аппаратных платформах. Gemma 3 оптимизирована для работы на GPU от NVIDIA и интегрируется с AMD GPU через ROCm™ stack, что делает её доступной для широкого круга пользователей и разработчиков.