Новая версия ИИ-модели генерации изображений от Идеограмм — 2.1, в настоящее время находится на этапе предварительного тестирования. Основное улучшение в версии 2.1 — способность генерировать последовательный текст внутри изображений, что является вызовом для многих моделей ИИ. TestingCatalog поделились примерами, где все четыре тестовых результатов показали высокую последовательность текста, что может стать значительным шагом вперед в этой сфере.
Контекст, предоставленный lamarena, демонстрирует эффективность Идеограмм 2.0 на их лидерборде. Сервис занял первое место в категории «Только пользовательские запросы» и третье в категории «Заранее сгенерированные запросы». Это свидетельствует о том, что модель хорошо работает с творческими или специфическими запросами, но сталкивается с большей конкуренцией при работе со стандартизированными запросами. Новая версия, 2.1, направлена на улучшение этих возможностей, в частности сосредотачиваясь на текстовой последовательности внутри сгенерированных изображений.
Хотя официального объявления о Идеограмм 2.1 пока не было, ее разработка соответствует общим тенденциям в сфере генеративного ИИ. Улучшения соблюдения запросов и специфических случаев использования, таких как генерация текста в изображениях, становятся основными направлениями инноваций. Эта функция может быть особенно ценной для отраслей, таких как реклама, дизайн и создание контента, где важна точная передача текста в визуалах.
Прогресс Идеограмм также отражает растущую конкуренцию в сфере генеративного ИИ. По данным лидерборда lamarena.ai, другие модели, такие как Recraft V3, также демонстрируют высокие результаты, что указывает на конкурентную среду, где постоянные усовершенствования являются необходимыми для сохранения лидерства.