Машинное обучение и большие данные 2020
22.12.2020
В декабре 2020 года в МБОУ СОШ № 27 в рамках IV Открытой технической спартакиады школьников Орджоникидзевского района г. Екатеринбурга “ИнжеТех” состоялись соревнования в компетенции «Машинное обучение и большие данные». 26 учащихся 8-11-х классов из 11 школ Орджоникидзевского района, объединенные в 13 команд, заявились на эти соревнования.
В этом году экспертом и главным судьей соревнований выступил Бибилов Иван Владимирович — куратор образовательных программ Школы анализа данных Яндекса, содиректор образовательной программы "Прикладной анализ данных" Европейского университета в Санкт-Петербурге, а также выпускник школы № 27.
Соревнования проводились в онлайн-формате с использованием технической базы МБОУ СОШ № 27.
Дети применяли технологические инструменты, которые используют настоящие аналитики Jupyter Hub/Notebook, а также библиотеку анализа панельных и табличных данных — pandas.
За четыре часа соревнований участникам предлагалось выполнить 2 модуля заданий.
В первом модуле школьникам предоставили файл, в котором находились данные по всем заездам Формулы-1 сезонов 1950-2017 годов (более 426 тыс. записей). Необходимо было найти ответы на пять вопросов, среди которых:
1. Сколько всего человек принимало участие в заездах за все время?
2. Какой пилот участвовал в наибольшем количестве заездов?
3. Были ли драматические заезды (два участника все время держались на 1 и 2 местах соответственно, но на последнем круге второй участник вырвал победу)?
4. Были ли драматические заезды (первое и второе место в заезде (сумма кругов) разделяли 5 миллисекунд или меньше)?
Во втором модуле работа велась с так называемыми неструктурированными данными. Участникам был дан фрагмент Государственного каталога музейного фонда Российской Федерации, содержащий сведения о датировках 10 000 экспонатов. Сложность заключалась в том, что данные о датировках объектов внесены самыми разными способами (и словами, и арабскими и римскими числами, и диапазоном дат), и поэтому автоматизированная обработка таких данных затруднена. Модуль содержал два задания:
1. Определить какие экспонаты изготовлены до нашей эры, а какие в нашу эру, кроме того нужно было посчитать количество экспонатов в обеих категориях.
2. Отсортировать список экспонатов по “старости”.
В данном модуле привести полностью идеальное, правильное решение невозможно, жюри оценивало некоторое приближение к такому решению. Участникам необходимо было соблюсти баланс между автоматизацией и ручной работой. Задания этого модуля оказались самыми сложными.
Большинство участников только открывают для себя тему машинного обучения и больших данных, и потому до финиша соревновании смогли добраться 9 команд.
В процессе выполнения заданий участники столкнулись с интересной ситуацией, когда некорректно написанный код на 100% загрузил все ресурсы сервера, на котором проходили соревнования, и на 10 минут вывел его из строя.
Результаты соревнований следующие: победителями соревнований в компетенции «Машинное обучение и большие данные» в 2020 году стали команды МАОУ Лицей № 128 (1-е место), МАОУ СОШ № 178 (2-е место) и МАОУ СОШ № 167 (3-е место).
Интересные факты: в прошлом году команда Лицея № 128 в этом составе заняла 7-е место, команда школы № 178 в этом же составе заняла 3-е место, а команда школы № 167 наполовину в этом составе заняла 1-е место.
Справка
Соревнования в компетенции «Машинное обучение и большие данные» проводятся с 2018 года в рамках Открытой технической спартакиады школьников Орджоникидзевского района г. Екатеринбурга. В первых соревнованиях в ноябре 2018 года приняло участие 18 команд из 16 школ района. Во вторых соревнованиях в 2019 году приняли участие 19 команд из 15 школ района. Организатором соревнований является МБОУ СОШ № 27.
Просмотров всего: , сегодня:
Дата создания: 11.12.2021
Дата обновления: 11.12.2021
Дата публикации: 22.12.2020