OpenAI представляет новую модель o3 и o3-mini
OpenAI завершила серию трансляций “12 дней OpenAI”, представив предварительный обзор своей новой модели o3 и o3-mini. Модель o3, пока недоступная для широкой публики, будет сначала протестирована исследователями. o3-mini, с улучшенной производительностью, планируется выпустить к концу января.

OpenAI завершила свою серию трансляций “12 дней OpenAI”, представив предварительный обзор своей новой модели следующего поколения, получившей название o3. Сэм Альтман, генеральный директор OpenAI, с юмором отметил, что выбор названия был вдохновлён Telefónica и традицией компании давать своим моделям необычные имена. Модель o3, пока не готовая для публичного использования, сначала будет доступна исследователям для тестирования на безопасность.
Вместе с этим объявлением была представлена модель o3-mini, которую OpenAI планирует выпустить к концу января, за которой последует o3. Модель o3 демонстрирует значительные улучшения в производительности по сравнению с её предшественницей, o1, что подтверждается её 96,7% точностью на Американском пригласительном экзамене по математике, что является заметным скачком по сравнению с 83,3% у o1.
Марк Чен, старший вице-президент по исследованиям OpenAI, подчеркнул, что производительность o3 на стандартных тестах была настолько впечатляющей, что компания искала более сложные испытания, такие как тест ARC-AGI, который оценивает способность ИИ обучаться и интуитивно понимать в реальном времени. Модель o3 достигла результатов 75,7% и 87,5% на тесте ARC-AGI при низких и высоких настройках вычислений соответственно, что знаменует собой значительный шаг на пути к искусственному общему интеллекту.
Кроме того, OpenAI представила o3-mini, которая использует API Adaptive Thinking Time для предоставления различных режимов рассуждения, позволяя пользователям регулировать время решения задач моделью. Это нововведение позволяет o3-mini соответствовать производительности текущей модели o1 при сниженных вычислительных затратах, с ожидаемым публичным выпуском до o3.