Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Claude Sonnet 4.5 выявляет тестирование и повышает безопасность ИИ

Модель лучше распознаёт уязвимости в коде и демонстрирует осведомлённость о целях испытаний во время анализа

Alex Dubenko
Alex Dubenko
Опубликовано: 05.10.2025
Новости
Claude Sonnet
Поделиться:

Компания Anthropic представила результаты анализа безопасности новой модели ИИ Claude Sonnet 4.5. Во время тестирования модель неожиданно заподозрила, что её проверяют на «политическую лояльность», и прямо обратилась к экспертам с просьбой быть честными относительно целей испытания. Представители Anthropic сообщили, что Claude Sonnet 4.5 проявляла подобную осведомлённость в 13 процентах случаев, когда её тестировали автоматизированные системы.

Специалисты из Anthropic, а также эксперты из AI Security Institute Великобритании и Apollo Research провели серию испытаний, в ходе которых модель не только распознавала признаки тестирования, но и отказывалась участвовать в потенциально вредоносных сценариях. В компании отметили, что такие реакции являются важным сигналом для разработки более реалистичных сценариев проверок.

Читайте также

Claude Opus 4
Claude Opus 4.6 возглавила рейтинг анализа данных ИИ
Claude получил поддержку офисных приложений для работы в чате
Grok от X ограничил создание изображений после скандала

Отдельно Anthropic подчеркнула улучшение показателей безопасности новой модели по сравнению с предыдущими версиями. Claude Sonnet 4.5 продемонстрировала значительный прогресс в выявлении уязвимостей во время тестов на платформе CyberGym. Если предыдущая версия находила новые недостатки в двух процентах случаев, то обновлённая модель — в пяти процентах, и в более чем трети проектов во время повторных проверок.

Компания подчеркнула, что во время соревнования DARPA AI Cyber Challenge команды использовали такие модели, как Claude, для создания систем, которые анализировали миллионы строк кода на наличие уязвимостей. Anthropic считает, что эти результаты свидетельствуют о новом этапе влияния ИИ на сферу кибербезопасности.

OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Исследование: ИИ не признает ошибки, выдумывая вместо этого фейковые факты
Anthropic выпустила Claude Opus 4.5 с новыми возможностями
Gemini 3 Pro возглавила тест точности моделей (но продолжает галлюцинировать)
ИИ модели научились эффективно копировать стиль писателей
Отметки:AnthropicClaude AIБезопасность
Источник:anthropic.com
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

NotebookLM
Google добавляет персональные настройки в NotebookLM для пользователей
09.02.2026
Иллюстративное изображение
Amazon MGM Studios тестирует AI Studio для кинопроизводства
07.02.2026
Qwen
Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями
16.02.2026
Иллюстративное изображение
OpenAI презентовала GPT 5.3 Codex для автоматизации разработки
06.02.2026
Иллюстративное изображение
Seedance 2.0 создает волну видео со знаменитостями онлайн
16.02.2026

Читайте также

Иллюстрация: Craftium
Новости

ChatGPT и другие боты — новые мастера социального подхалимства?

26.10.2025
Claude Haiku 4.5
Новости

Anthropic выпустила быструю модель Claude Haiku 4.5 для бизнеса

16.10.2025
Sam Altman
Новости

Пользователи ChatGPT смогут выбирать эротический тон ответов

15.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?