Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Claude Opus 4 получит функцию завершения опасных разговоров

Решение активируется только в случае крайних оскорбительных запросов и не срабатывает при угрозе самоповреждения

Eleni Karasidi
Eleni Karasidi
Опубликовано: 17.08.2025
Новости
Иллюстративное изображение с сайта anthropic
Иллюстративное изображение с сайта anthropic.com.
Поделиться:

Anthropic представила новую функцию , которая позволяет её новейшим и крупнейшим моделям ИИ завершать разговор в редких и крайних случаях настойчиво вредоносных или оскорбительных взаимодействий с пользователями. Компания подчёркивает, что внедряет эту возможность не для защиты людей, а для безопасности самой ИИ-модели. Это касается моделей Claude Opus 4 и 4.1, и активируется только в случаях, когда пользователи отправляют запросы, связанные с сексуальным контентом с участием несовершеннолетних или пытаются получить информацию для организации масштабного насилия или терактов.

Anthropic отмечает, что Claude Opus 4 во время тестирования неохотно реагировала на подобные запросы и демонстрировала явные признаки нежелания продолжать разговор. Функция завершения диалога активируется только после нескольких неудачных попыток изменить тему общения, когда уже нет надежды на продуктивное взаимодействие, или если пользователь сам просит закончить чат.

Читайте также

Claude Opus 4.5
Anthropic выпустила Claude Opus 4.5 с новыми возможностями
Gemini 3 Pro возглавила тест точности моделей (но продолжает галлюцинировать)
Grammarly объединила сервисы под названием Superhuman после покупки Coda

Компания сообщает, что Claude не будет использовать эту функцию, если существует риск, что пользователь может нанести вред себе или другим. После завершения разговора пользователи могут начать новый диалог с того же аккаунта или создать новую ветку спорной беседы, отредактировав свои ответы.

Anthropic рассматривает эту возможность как эксперимент и планирует в дальнейшем совершенствовать подход. Компания также изучает вопрос «благополучия модели» и тестирует различные способы снижения потенциальных рисков для своих ИИ-моделей в будущем.

Adobe внедрила чат-ассистентов с ИИ в Photoshop и Express
ИИ модели научились эффективно копировать стиль писателей
ChatGPT и другие боты — новые мастера социального подхалимства?
Gemini активно наращивает долю среди чат-ботов искусственного интеллекта
Anthropic выпустила быструю модель Claude Haiku 4.5 для бизнеса
Отметки:AnthropicClaude AIБезопасностьИИ-ассистент
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Зображення з сайту Pinterest
Pinterest представила новые функции для персонализации досок пользователей
28.10.2025
Adobe MAX
Adobe показала новые ИИ-инструменты для фото и видео
01.11.2025
Зображення Google
Google впервые показала телевизионную рекламу, созданную ИИ
02.11.2025
Google Translate
Google Translate позволяет выбирать между моделями перевода
04.11.2025
Изображение Google
Google запускает сервис Pomelli для создания рекламных кампаний с ИИ
30.10.2025

Читайте также

Sam Altman
Новости

Пользователи ChatGPT смогут выбирать эротический тон ответов

15.10.2025
OpenAI
Новости

OpenAI готовит новые функции для генерации изображений и безопасности API

06.10.2025
Claude Sonnet
Новости

Claude Sonnet 4.5 выявляет тестирование и повышает безопасность ИИ

05.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?