• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

© Высшая школа экономики

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.

Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.

В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.

Елена Кантонистова

В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.

Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.

Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).

Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.

В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

© Высшая школа экономики

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).

В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.

В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.

Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.

У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.

В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.

Вам также может быть интересно:

В НИУ ВШЭ состоялся финал Международной олимпиады «Яндекса» и ВШЭ по ИИ и анализу данных

«Яндекс Образование» и факультет компьютерных наук НИУ ВШЭ подвели итоги Международной олимпиады по искусственному интеллекту и анализу данных AIDAO (Artificial Intelligence and Data Analysis Olympiad). В ней участвовали студенты из 14 стран. Первое место второй год подряд заняла команда AI Capybara — она разработала наиболее точную ИИ-модель для системы зрения автономного транспорта.

Экономисты ВШЭ выяснили, что ИИ слишком хорошо думает о людях

Ученые из НИУ ВШЭ выяснили, что современные ИИ-модели, включая ChatGPT и Claude, в играх на стратегическое мышление вроде «конкурса красоты» Кейнса переоценивают уровень рациональности своих оппонентов, будь то студенты-первокурсники или опытные ученые. Модели стараются предсказать поведение людей, но в итоге играют «слишком умно» и проигрывают, потому что приписывают людям больше логики, чем те демонстрируют на деле. Исследование опубликовано в Journal of Economic Behavior & Organization.

Вышка Онлайн представила документальный фильм о влиянии ИИ на нашу жизнь

27 ноября на всех онлайн-площадках Вышки Онлайн состоялась премьера документального фильма «После промпта» от онлайн-кампуса НИУ ВШЭ. Его авторы исследуют, как искусственный интеллект меняет работу, карьерные траектории и профессиональное развитие специалистов. Это первый видеопроект, полностью реализованный командой онлайн-кампуса НИУ ВШЭ совместно с приглашенным режиссером Ольгой Науменко.

Технологический прорыв: исследования Института ИИ и цифровых наук отмечены на AI Journey 2025

Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭ в рамках Международной конференции AI Journey 2025 представили передовые ИИ-исследования с высоким уровнем научной новизны и практической применимости. Научное решение заведующего Научно-учебной лабораторией матричных и тензорных методов в машинном обучении Максима Рахубы получило премию «Лидеры ИИ — 2025». Заведующий Центром глубинного обучения и байесовских методов Айбек Аланов — среди финалистов премии.

В НИУ ВШЭ завершился Региональный кейс-чемпионат «КЛЮЧ — Москва»

9 ноября в Центре культур НИУ ВШЭ состоялась церемония награждения лауреатов в специальных номинациях, призеров и победителей Регионального кейс-чемпионата «КЛЮЧ — Москва». В центре внимания участников кейс-чемпионата была фиджитал-революция — объединение лучших практик цифрового и физического мира для развития регионов. Школьники и студенты колледжей соединяли офлайн и онлайн, создавая решения, которые изменят нашу жизнь.

Вышка и Сбер запустили образовательный проект для участников Всероссийской олимпиады школьников по экономике

Стартовал совместный образовательный проект Высшей школы экономики и Сбера для школьников 8–11-х классов — участников Всероссийской олимпиады школьников по экономике. Проект поможет показать, как знания по экономике применяются в работе крупнейших компаний и финансовых институтов страны. До конца 2025 года пройдет минимум четыре встречи — очно в корпусе НИУ ВШЭ и офисе Сбера в Москве с прямыми трансляциями для школьников из регионов.

В 64 регионах России стартуют финалы Национальной технологической олимпиады Junior

В России стартуют финалы Национальной технологической олимпиады Junior (НТО Junior) — командных инженерных соревнований для школьников 5–7-х классов, которые организует Кружковое движение НТИ совместно с президентской платформой «Россия — страна возможностей». Проектный офис олимпиады развернут на базе НИУ ВШЭ. Приглашения на заключительный этап получили 4950 участников. Соревнования пройдут с 10 по 18 ноября в 64 регионах страны.

«ИИ позволяет людям без опыта разработки прототипировать решения, упрощающие их деятельность»

28 октября завершилось обучение в рамках третьего потока программы «Искусственный интеллект в социальной сфере». Слушатели представили и защитили свои проекты. В рамках освоенного курса преподаватели помогли им найти перспективные области применения ИИ для эффективной работы в социальной сфере и обучили практическому применению инструментов ИИ.

Олимпиада по промышленной разработке PROD выходит на международный уровень

Первая в мире ежегодная олимпиада по промышленной разработке для старшеклассников PROD выходит на международный уровень и приглашает к участию школьников 8–11-х классов из всех стран мира. Олимпиада впервые пройдет на русском и английском языках. Организаторы Международной олимпиады PROD — Центральный университет и Группа «Т-Технологии» (головная компания Т-Банка) в партнерстве с факультетом компьютерных наук НИУ ВШЭ.

«Я никогда не сомневался, что окажусь именно в Вышке»

Из года в год Высшая школа экономики остается в числе лидеров по приему дипломантов Всероссийской олимпиады школьников, и приемная кампания — 2025 не стала исключением. «Вышка.Главное» продолжает рассказывать о недавних амбициозных и целеустремленных абитуриентах, а ныне первокурсниках НИУ ВШЭ.