Google DeepMind объявила , что их система Gemini Deep Think достигла уровня золотой медали на Международной математической олимпиаде 2025 года. Модель смогла решить пять из шести сложных задач по алгебре, комбинаторике, геометрии и теории чисел, набрав 35 баллов из 42 возможных. Все решения были написаны на естественном языке, проверены официальными судьями IMO и описаны как четкие и понятные. Gemini Deep Think работала в специальном режиме, который позволяет параллельно рассматривать несколько гипотез перед формированием окончательного ответа, и выполнила задания в пределах стандартного времени без внешних инструментов.
Команда DeepMind обучала модель с использованием подкрепляющего обучения, предоставляя ей доступ к тщательно отобранным решениям предыдущих олимпиад и рекомендациям по подходам к таким задачам. Это позволило Gemini находить различные пути решения и комбинировать их для получения полного доказательства. DeepMind планирует дать математическому сообществу возможность протестировать эту версию модели, а затем открыть её для подписчиков Google AI Ultra.
В то же время OpenAI заявила , что их экспериментальная языковая модель также завоевала золото на IMO, решив пять из шести задач в стандартных условиях. Модель работала без доступа к интернету или внешним инструментам, а все доказательства в текстовой форме оценивали бывшие победители олимпиады. По словам исследователей OpenAI, эта модель не была специально натренирована для IMO, а развивалась как универсальная система рассуждений с акцентом на устойчивую работу в течение многих часов.
Успех обеих компаний свидетельствует, что современные языковые модели могут решать сложные математические задачи, используя только естественный язык без специализированных программных средств. Для пользователей это означает, что подобные ИИ уже способны поддерживать длительные мыслительные процессы, предлагать полные доказательства и могут стать инструментом для исследователей, педагогов и энтузиастов математики. DeepMind планирует и дальше совершенствовать Gemini для следующих олимпиад и более широкого применения.