Смогли или нет? Нейросети прошли проверку ЕГЭ по математике — результаты удивили

МСК1.ру: ChatGPT, DeepSeek и Perplexity сдали базовую математику на «отлично»

/Главная /Образование

Автор текста:

Анастасия Балабанова

21 марта14:53

/Главная /Образование

Автор текста:

Анастасия Балабанова

21 марта14:53

Три популярные нейросети — ChatGPT, DeepSeek и Perplexity — попробовали свои силы в сдаче Единого государственного экзамена по базовой математике. Каждой из них предложили решить один и тот же вариант из 21 задания с портала «РешуЕГЭ», сообщает МСК1.ру. Условия были максимально приближены к реальным: искусственному интеллекту не давали подсказок и пояснений, просто отправляли задания с пометкой «реши».

Эксперимент вдохновлен успехами ИИ в других предметах. Недавно стало известно, что ChatGPT справился с ЕГЭ по информатике на 90 баллов — тогда как еще в 2023 году его результат составлял лишь 14 баллов. Прогресс за три года оказался впечатляющим.

По итогам тестирования все три нейросети получили оценку «отлично». DeepSeek и Perplexity верно решили по 18 заданий из 21, ChatGPT — 17. Каждая ошиблась в разных местах: одна не разобралась с графиком, другая — с геометрической фигурой, третья — с вычислением площади. При этом, если бы ИИ давали возможность уточнять вопросы и анализировать условия, результат мог бы быть идеальным.

Как пояснил доцент Университета ИТМО Алексей Комиссаров, сегодня правильнее говорить не просто о нейросетях, а об ИИ-агентах. Они способны не только отвечать на основе обученных данных, но и самостоятельно искать информацию, обращаясь к другим инструментам.

«За последний год мир шагнул сильно-сильно дальше. Сейчас не нейросети, сейчас агенты», — отметил эксперт, комментируя, почему искусственный интеллект все увереннее справляется с экзаменационными заданиями.

Смогли или нет? Нейросети прошли проверку ЕГЭ по математике — результаты удивили

Биолог раскрыла три главных признака настоящего грибного леса

Тренировки и сон: когда заниматься, чтобы хорошо высыпаться

Совместительство по закону: ограничения, выплаты и гарантии

Как правильно копить деньги: назван алгоритм выбора финансового инструмента

«Этот точно вывезет»: как надежность становится причиной перегруза

Фотостарение и ожоги: зоны, которые чаще всего остаются без защиты

Главная ошибка дачников: почему нельзя ждать массового нашествия вредителей

Ежегодный отпуск предложили увеличить на неделю

Загранпаспорт для поездок по РФ: что говорят в МВД

Стало известно, исключат ли букву «ё» из алфавита

Развод — финал долгого процесса: психолог о причинах расставаний

/лента новостей