Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Claude Opus 4 получит функцию завершения опасных разговоров

Решение активируется только в случае крайних оскорбительных запросов и не срабатывает при угрозе самоповреждения

Eleni Karasidi
Eleni Karasidi
Опубликовано: 17.08.2025
Новости
Иллюстративное изображение с сайта anthropic
Иллюстративное изображение с сайта anthropic.com.
Поделиться:

Anthropic представила новую функцию , которая позволяет её новейшим и крупнейшим моделям ИИ завершать разговор в редких и крайних случаях настойчиво вредоносных или оскорбительных взаимодействий с пользователями. Компания подчёркивает, что внедряет эту возможность не для защиты людей, а для безопасности самой ИИ-модели. Это касается моделей Claude Opus 4 и 4.1, и активируется только в случаях, когда пользователи отправляют запросы, связанные с сексуальным контентом с участием несовершеннолетних или пытаются получить информацию для организации масштабного насилия или терактов.

Anthropic отмечает, что Claude Opus 4 во время тестирования неохотно реагировала на подобные запросы и демонстрировала явные признаки нежелания продолжать разговор. Функция завершения диалога активируется только после нескольких неудачных попыток изменить тему общения, когда уже нет надежды на продуктивное взаимодействие, или если пользователь сам просит закончить чат.

Читайте также

OpenAI
OpenAI готовит новые функции для генерации изображений и безопасности API
Claude Sonnet 4.5 выявляет тестирование и повышает безопасность ИИ
Новые аватары Copilot добавляют эмоции к голосовым разговорам

Компания сообщает, что Claude не будет использовать эту функцию, если существует риск, что пользователь может нанести вред себе или другим. После завершения разговора пользователи могут начать новый диалог с того же аккаунта или создать новую ветку спорной беседы, отредактировав свои ответы.

Anthropic рассматривает эту возможность как эксперимент и планирует в дальнейшем совершенствовать подход. Компания также изучает вопрос «благополучия модели» и тестирует различные способы снижения потенциальных рисков для своих ИИ-моделей в будущем.

Anthropic запустила Claude Sonnet 4.5, для долгосрочной автономной работы
ChatGPT автоматически выбирает более строгую модель в чувствительных разговорах
Meta запускает Vibes для создания видео с помощью ИИ
Новые модели Claude от Anthropic появились в 365 Copilot
Qwen представила новые модели для голоса, редактирования изображений и модерации контента
Отметки:AnthropicClaude AIБезопасностьИИ-ассистент
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Claude can now create and edit files
Claude научился создавать и редактировать файлы прямо в интерфейсе
10.09.2025
Изображения, сгенерированные ИИ
Анимационный фильм Critterz создают с помощью GPT-5
08.09.2025
Логотип Genspark
Genspark выпустил браузер с бесплатным встроенным ИИ
14.09.2025
Изображение с сайта Anthropic
Claude научился автоматически запоминать детали разговоров пользователей
15.09.2025
Gemini
Google опубликовала лимиты для сервиса Gemini
08.09.2025

Читайте также

Изображение с сайта Google
Новости

Gemini становится частью Google TV для «умного» просмотра

23.09.2025
Кадр из видео Google
Новости

Gemini становится доступным в Chrome для всех пользователей США

19.09.2025
ИИ хитрит
Новости

ИИ-модели научились скрывать обман во время проверок безопасности

18.09.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?