Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Claude Opus 4 получит функцию завершения опасных разговоров

Решение активируется только в случае крайних оскорбительных запросов и не срабатывает при угрозе самоповреждения

Eleni Karasidi
Eleni Karasidi
Опубликовано: 17.08.2025
Новости
Иллюстративное изображение с сайта anthropic
Иллюстративное изображение с сайта anthropic.com.
Поделиться:

Anthropic представила новую функцию , которая позволяет её новейшим и крупнейшим моделям ИИ завершать разговор в редких и крайних случаях настойчиво вредоносных или оскорбительных взаимодействий с пользователями. Компания подчёркивает, что внедряет эту возможность не для защиты людей, а для безопасности самой ИИ-модели. Это касается моделей Claude Opus 4 и 4.1, и активируется только в случаях, когда пользователи отправляют запросы, связанные с сексуальным контентом с участием несовершеннолетних или пытаются получить информацию для организации масштабного насилия или терактов.

Anthropic отмечает, что Claude Opus 4 во время тестирования неохотно реагировала на подобные запросы и демонстрировала явные признаки нежелания продолжать разговор. Функция завершения диалога активируется только после нескольких неудачных попыток изменить тему общения, когда уже нет надежды на продуктивное взаимодействие, или если пользователь сам просит закончить чат.

Читайте также

Gmail
Gmail получил бесплатные функции на базе искусственного интеллекта для всех пользователей
Grok от X ограничил создание изображений после скандала
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах

Компания сообщает, что Claude не будет использовать эту функцию, если существует риск, что пользователь может нанести вред себе или другим. После завершения разговора пользователи могут начать новый диалог с того же аккаунта или создать новую ветку спорной беседы, отредактировав свои ответы.

Anthropic рассматривает эту возможность как эксперимент и планирует в дальнейшем совершенствовать подход. Компания также изучает вопрос «благополучия модели» и тестирует различные способы снижения потенциальных рисков для своих ИИ-моделей в будущем.

OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Пользователи выбирают разных ИИ-ассистентов для различных жизненных ситуаций
Исследование: ИИ не признает ошибки, выдумывая вместо этого фейковые факты
Anthropic выпустила Claude Opus 4.5 с новыми возможностями
Gemini 3 Pro возглавила тест точности моделей (но продолжает галлюцинировать)
Отметки:AnthropicClaude AIБезопасностьИИ-ассистент
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Gemini
Google презентовала быструю ИИ-модель Gemini 3 Flash для всех пользователей
18.12.2025
ИИ-художник Иллюстрация: Craftium
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
17.12.2025
ChatGPT
ChatGPT получил новые гибкие настройки персонализации ответов
21.12.2025
Meta
Meta работает над новыми ИИ-моделями для работы с контентом
19.12.2025
Qwen
Модель Alibaba может клонировать голос с 3 секунд аудио
24.12.2025

Читайте также

Superhuman
Новости

Grammarly объединила сервисы под названием Superhuman после покупки Coda

30.10.2025
Adobe
Новости

Adobe внедрила чат-ассистентов с ИИ в Photoshop и Express

29.10.2025
Иллюстрация: Craftium
Новости

ИИ модели научились эффективно копировать стиль писателей

27.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?