В середине мая 2025 года в Калифорнии состоялась закрытая научная встреча с участием тридцати ведущих математиков со всего мира. Мероприятие было организовано с целью проверить возможности нового искусственного интеллекта в решении сложных математических задач.
Тестируемая модель — чат-бот на базе языковой архитектуры o4-mini, разработанной компанией OpenAI. В отличие от привычных ИИ-систем, o4-mini обучен не только на текстах, но и на примерах формальной логики и доказательственного мышления, приближая его поведение к работе настоящего математика.
Для эксперимента некоммерческая организация Epoch AI подготовила 300 уникальных математических задач. Все они ранее не публиковались и были разработаны специально для оценки способностей искусственного интеллекта. Большинство существующих моделей показали крайне низкий результат — менее 2% успешных решений.
Однако o4-mini продемонстрировал иные результаты: он сумел корректно решить часть задач, которые требуют не только вычислительных навыков, но и глубокой теоретической подготовки. По словам участника встречи, профессора Кена Оно, некоторые специалисты были поражены уровнем рассуждений модели и её приближением к экспертному мышлению.
Собеседники подчеркивают, что этот эксперимент может стать важной вехой в развитии математического ИИ и его применении в научных исследованиях, пишет scientificamerican.