Машинное обучение и большие данные 2020

22.12.2020

В декабре 2020 года в МБОУ СОШ № 27 в рамках IV Открытой технической спартакиады школьников Орджоникидзевского района г. Екатеринбурга “ИнжеТех” состоялись соревнования в компетенции «Машинное обучение и большие данные». 26 учащихся 8-11-х классов из 11 школ Орджоникидзевского района, объединенные в 13 команд, заявились на эти соревнования.


В этом году экспертом и главным судьей соревнований выступил Бибилов Иван Владимирович — куратор образовательных программ Школы анализа данных Яндекса, содиректор образовательной программы "Прикладной анализ данных" Европейского университета в Санкт-Петербурге, а также выпускник школы № 27.


Соревнования проводились в онлайн-формате с использованием технической базы МБОУ СОШ № 27.


Дети применяли технологические инструменты, которые используют настоящие аналитики Jupyter Hub/Notebook, а также библиотеку анализа панельных и табличных данных — pandas.


За четыре часа соревнований участникам предлагалось выполнить 2 модуля заданий.


В первом модуле школьникам предоставили файл, в котором находились данные по всем заездам Формулы-1 сезонов 1950-2017 годов (более 426 тыс. записей). Необходимо было найти ответы на пять вопросов, среди которых:

1. Сколько всего человек принимало участие в заездах за все время?

2. Какой пилот участвовал в наибольшем количестве заездов?

3. Были ли драматические заезды (два участника все время держались на 1 и 2 местах соответственно, но на последнем круге второй участник вырвал победу)?

4. Были ли драматические заезды (первое и второе место в заезде (сумма кругов) разделяли 5 миллисекунд или меньше)?


Во втором модуле работа велась с так называемыми неструктурированными данными. Участникам был дан фрагмент Государственного каталога музейного фонда Российской Федерации, содержащий сведения о датировках 10 000 экспонатов. Сложность заключалась в том, что данные о датировках объектов внесены самыми разными способами (и словами, и арабскими и римскими числами, и диапазоном дат), и поэтому автоматизированная обработка таких данных затруднена. Модуль содержал два задания:

1. Определить какие экспонаты изготовлены до нашей эры, а какие в нашу эру, кроме того нужно было посчитать количество экспонатов в обеих категориях.Хочу такой сайт

2. Отсортировать список экспонатов по “старости”.


В данном модуле привести полностью идеальное, правильное решение невозможно, жюри оценивало некоторое приближение к такому решению. Участникам необходимо было соблюсти баланс между автоматизацией и ручной работой. Задания этого модуля оказались самыми сложными.

Большинство участников только открывают для себя тему машинного обучения и больших данных, и потому до финиша соревновании смогли добраться 9 команд.


В процессе выполнения заданий участники столкнулись с интересной ситуацией, когда некорректно написанный код на 100% загрузил все ресурсы сервера, на котором проходили соревнования, и на 10 минут вывел его из строя.


Результаты соревнований следующие: победителями соревнований в компетенции «Машинное обучение и большие данные» в 2020 году стали команды МАОУ Лицей № 128 (1-е место), МАОУ СОШ № 178 (2-е место) и МАОУ СОШ № 167 (3-е место).


Интересные факты: в прошлом году команда Лицея № 128 в этом составе заняла 7-е место, команда школы № 178 в этом же составе заняла 3-е место, а команда школы № 167 наполовину в этом составе заняла 1-е место.


Справка

Соревнования в компетенции «Машинное обучение и большие данные» проводятся с 2018 года в рамках Открытой технической спартакиады школьников Орджоникидзевского района г. Екатеринбурга. В первых соревнованиях в ноябре 2018 года приняло участие 18 команд из 16 школ района. Во вторых соревнованиях в 2019 году приняли участие 19 команд из 15 школ района. Организатором соревнований является МБОУ СОШ № 27.

Просмотров всего: , сегодня:

Рейтинг: . Оценили: .
Протокол_Машинное_обучение_2020_сайт.pdf (скачать) (посмотреть)

Дата создания: 11.12.2021

Дата обновления: 11.12.2021

Дата публикации: 22.12.2020

Наверх
На сайте используются файлы cookie. Продолжая использование сайта, вы соглашаетесь на обработку своих персональных данных (согласие). Подробности об обработке ваших данных — в политике конфиденциальности.

Функционал «Мастер заполнения» недоступен с мобильных устройств.
Пожалуйста, воспользуйтесь персональным компьютером для редактирования информации в «Мастере заполнения».