:format(webp)/YXJ0aWNsZXMvaW1hZ2UvMjAyNi8zLzI5OGEwMDk1LmpwZw.webp)
Смогли или нет? Нейросети прошли проверку ЕГЭ по математике — результаты удивили
МСК1.ру: ChatGPT, DeepSeek и Perplexity сдали базовую математику на «отлично»Три популярные нейросети — ChatGPT, DeepSeek и Perplexity — попробовали свои силы в сдаче Единого государственного экзамена по базовой математике. Каждой из них предложили решить один и тот же вариант из 21 задания с портала «РешуЕГЭ», сообщает МСК1.ру. Условия были максимально приближены к реальным: искусственному интеллекту не давали подсказок и пояснений, просто отправляли задания с пометкой «реши».
Эксперимент вдохновлен успехами ИИ в других предметах. Недавно стало известно, что ChatGPT справился с ЕГЭ по информатике на 90 баллов — тогда как еще в 2023 году его результат составлял лишь 14 баллов. Прогресс за три года оказался впечатляющим.
По итогам тестирования все три нейросети получили оценку «отлично». DeepSeek и Perplexity верно решили по 18 заданий из 21, ChatGPT — 17. Каждая ошиблась в разных местах: одна не разобралась с графиком, другая — с геометрической фигурой, третья — с вычислением площади. При этом, если бы ИИ давали возможность уточнять вопросы и анализировать условия, результат мог бы быть идеальным.
Как пояснил доцент Университета ИТМО Алексей Комиссаров, сегодня правильнее говорить не просто о нейросетях, а об ИИ-агентах. Они способны не только отвечать на основе обученных данных, но и самостоятельно искать информацию, обращаясь к другим инструментам.