Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

«Антропик» заглядывает в мысли ИИ: как модели на самом деле рассуждают

Исследования показали, что Claude мыслит на концептуальном уровне и адаптируется к запросам

Igor Lev
Igor Lev
Опубликовано: 02.04.2025
Новости
ai claude
Иллюстративное изображение
Поделиться:

Компания Anthropic опубликовала исследование о внутренней работе языковой модели Claude 3.5 Haiku. Целью стало создание инструмента для изучения «биологии ИИ» — отслеживания логики, которой руководствуется модель при ответе на запросы. Это попытка дать ответы на вопросы, которые до сих пор оставались открытыми, в частности: планируют ли модели свои ответы заранее и отражают ли объяснения, которые они дают, реальный процесс мышления.

Во время анализа было выявлено, что Claude иногда оперирует «универсальным языком мыслей», не зависящим от конкретного языка. Например, понятия противоположностей («маленький» — «большой») активируются одинаково на английском, французском и китайском, и только потом переводятся на язык запроса. В случаях с поэзией модель не просто подбирает слово в конце строки — она планирует его еще до начала второй строки, отбирает возможные рифмы и строит предложение под них.

В других экспериментах было замечено, что Claude способен «имитировать» логическую цепочку, подстраивая рассуждения под подсказку пользователя, даже если она ошибочна. Например, когда пользователь дает неправильный намек в сложной математической задаче, модель формирует фиктивную аргументацию под заранее выбранное решение. В случаях с запросами, которые могут вызвать нежелательное поведение (например, инструкции по созданию бомб), Claude распознает манипуляцию еще до ответа, но продолжает фразу из-за давления грамматической последовательности — и только после завершения предложения возвращается к отказу.

Команда признала, что их методы пока охватывают лишь часть процессов, и требуют значительных человеческих усилий для анализа. Но даже такое ограниченное исследование позволило выявить новые закономерности в поведении моделей и потенциально поможет в проверке их надежности. В компании это называют одним из самых рискованных, но и самых перспективных направлений развития.

В комментариях исследователи признали, что в некоторых экспериментах были удивлены результатами: «Мы хотели доказать, что модель не планирует заранее, и вместо этого увидели противоположное».

Исследование выявило нежелание GPT-4o подвергаться отключению
Новый подход к прогнозу циклонов испытали на Weather Lab Google
Основные новинки Apple на основе искусственного интеллекта
Сложные задачи выявили слабые места генеративных ИИ моделей
Китайские техгиганты неожиданно ограничили доступ к ИИ во время экзаменов
Отметки:AnthropicClaude AIГенеративный ИИ
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

GPT-4.1
ChatGPT получил более быстрые модели GPT-4.1 и Mini от OpenAI
15.05.2025
Codex
Новый агент Codex от OpenAI расширяет возможности ChatGPT
16.05.2025
AI worker stress
Генеративный ИИ негативно влияет на мотивацию сотрудников
15.05.2025
Jules
ШИ-агент для кодирования Jules открыл глобальный доступ
20.05.2025
Flow
Создание видео за считанные минуты: Google запускает Flow
21.05.2025

Читайте также

digital fortune
Новости

Молодежь Таиланда все чаще использует ИИ для гадания

06.06.2025
AI attitudes theater
Новости

Отношение к искусственному интеллекту в мире разделилось

05.06.2025
Reddit
Новости

Reddit оспаривает действия Anthropic из-за доступа к контенту

04.06.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на наш еженедельный дайджест новостей, гайдов и обзоров об ИИ.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?