Выращивание данных для школьных виртуальных лабораторий

Обложка

Цитировать

Полный текст

Аннотация

Проблема и цель. Рассматривается преподавание школьных дисциплин, связанных с формированием статистической, математической, вычислительной и исследовательской грамотности. Цель состоит в порождении данных в ходе экспериментов, условия которых диктуются учениками. Методология. В исследовании использованы генерация данных в агентных моделях NetLogo и последующая статистическая обработка в средах CODAP и R. Результаты. Показано, что генеративный подход позволяет ученикам работать с данными, которые порождаются агентами-исполнителями, выполняющими указания учащегося. При этом ученик находится в позиции ученого, который планирует собственные эксперименты и анализирует полученные в их процессе данные. Заключение. Предложенный подход генерации данных для их последующего анализа приобщает школьников к современной культуре выращивания и обмена данными и генерирующими их моделями.

Полный текст

Проблема и цель. В настоящее время в образовательных системах многих стран проявляется бурный интерес к внедрению в учебные планы школ разделов, с помощью которых школьники приобретают практические навыки сбора, обработки, визуализации информации и принятия решений на этой основе. В школьном образовании резко возрос интерес к организации учебной деятельности на основе использования данных. С одной стороны, рост интереса активизируется международными исследованиями, такими как PISA, в которых акцент делается на практическое использование математического и естественно-научного аппарата или функциональную грамотность. С другой - школа испытывает значительное давление со стороны рынка труда, в котором в самых различных профессиях все более востребованными оказываются специалисты, обладающие навыками анализа данных и принятия решений на их основе [1-3]. При этом очевидно, что школьное образование, ориентированное на работу с данными, тесно связано с содержанием предмета «Математика», но не ограничивается его рамками [4; 5]. Мы видим, что не только предметы естественно-научного цикла (физика, химия, география, биология), но и традиционно гуманитарные, такие как литература и история, открыты к внедрению методов анализа данных в учебный процесс [6-8]. Задачей как администраций школ, так и разработчиков учебных материалов является создание условий для того, чтобы все предметы школьного цикла, в которых ведется преподавание с опорой на анализ данных, были обеспечены датасетами, работа с которыми позволяла бы расширять образовательные возможности предмета для учителей и учащихся. Естественный интерес к данным и их источникам проявляет математическое и статистическое образование, компьютерные дисциплины, дисциплины, внутри которых формируется системное и вычислительное мышление. В ряде исследований повышение доступности данных и инструментов для работы с данными рассматривается как важная для образования тенденция. Передача данных в руки граждан и учеников необходима для роста субъектности учащихся и их вовлеченности в исследовательскую деятельность. Доступные данные и доступные для школьников инструменты работы с данными - обязательное условие освоения науки о данных, системного мышления и формирования статистической, математической и вычислительной грамотности учеников. Здесь уместно говорить о продолжающейся демократизации цифрового образования [9] и вовлечении школьников в научную деятельность через управление исполнителями, создание и изобретение цифровых и физических объектов, порождение и анализ данных. Методология. При создании образовательных моделей, построенных на данных, используются различные способы получения данных, пригодных для их дальнейшей обработки. В последние годы большое распространение получил автоматический сбор данных на основе автоматических устройств, связанных интерфейсом с компьютером. Для автоматического сбора данных могут использоваться: - датчики (probeware) - первые образовательные решения, позволяющие считывать показатели среды с их помощью, появились еще в 1980-х гг. [10; 11]. Сегодня, с повышением доступности компьютеров в образовании, сфера их применения еще более возрастает; - носимые сенсорные устройства (wearable sensors) - развитие мобильных технологий, доступность основанных на них устройств, интеграция в них различных сенсоров привела к возможности организовать сбор данных непосредственно с помощью устройств, доступных большинству школьников. Благодаря этому в последние годы мы наблюдаем рост образовательных решений и практик, основанных на сборе и обработке данных, полученных с помощью носимых сенсорных устройств. Так, биологические концепции, связанные с распространением инфекционных заболеваний, могут быть проиллюстрированы с помощью датасетов, отражающих расстояние между людьми в ситуациях естественного общения, собранных школьниками с помощью их мобильных телефонов [12; 13]; - данные электронных журналов (log data) - могут представлять большой интерес для образования, если они сгруппированы в виде датасета и встроены в контекст учебной задачи или проекта. Например, данные электронного журнала российского вики-проекта Lepisi.org постоянно доступны для визуализации в виде социограмм, представляющих отношения участников и статей, которые они совместно редактируют [14]. Этот же подход используется для визуализации отношений между учителями и учениками в Московской электронной школе [15]; - данные интернета вещей (remote and embedded networked sensing) - развитие технологий интернета вещей позволяет получать данные, генерируемые устройствами, подключенными к Сети. Так, проект с участием школьников, реализованный Concord Consortium, показал применимость формируемых таким образом датасетов в преподавании школьного курса биологии [16; 17]; - удаленные лаборатории (remote laboratories) - ряд современных лабораторий и устройств предоставляют возможность пользоваться в учебных целях генерируемыми ими данными. Образовательная ценность таких данных высока, поскольку речь идет о профессионально организованном процессе генерации научного знания, приобщиться к которому школьники могут в режиме реального времени [18]. Например, лаборатория может помочь исследовать сложно наблюдаемые особенности поведения микроорганизмов [19]. Результаты и обсуждение. Среди наборов данных, используемых в учебном процессе, особое место занимают данные, полученные (выращенные) в искусственных сообществах многоагентного моделирования [20-22]. Выращивание данных в ходе изучения сложных и комплексных систем с огромным количеством агентов сформировалось как отдельное исследовательское направление - data-farming [5; 23-25]. В отличие от данных, получаемых в ходе натурных наблюдений и экспериментов (таких, как дневники наблюдения за погодой), их можно получить в короткий срок, для этого, как правило, достаточно запустить модель и записать в отдельный файл данные. К тому же, таким способом можно получить данные, отражающие характер и особенности функционирования достаточно сложных объектов, манипулировать которыми в реальности у школьников нет возможности, таких как экологические системы, инженерные установки, сообщества живых существ и т. д. Научный прогресс в современном мире все больше зависит от использования имитационного моделирования, которое служит инструментом исследования и образования. Имитационное моделирование позволяет создавать искусственные системы и цифровые двойники, которые можно запускать и исследовать с различной скоростью [26]. Генерация данных в многоагентных компьютерных моделях является результатом исследовательской деятельности учащихся по отношению к предметам и явлениям, структура и образ поведения которых воссоздается в модели. Разнообразие сред агентного моделирования, для систематизации которых были разработаны различные типологии, проанализированы в [27]. Среди открытых исследовательских сред ведущие позиции занимает NetLogo, предоставляющая свои возможности не только исследователям, но и учащимся. В этом плане показательны две недавние книги, где представлены и исследовательские и образовательные возможности среды [28; 29]. В рамках данной статьи мы рассматриваем связь порождаемых моделями NetLogo данных со средой статистического анализа на примере R. Модель распространения огня в лесу[28]. Объектами управления и анализа в данной модели служат неподвижные агенты управления - точки экрана (patches), которые могут менять свои свойства и сообщать исследователю их значение. Мы можем проводить эксперимент, изменяя значение независимой переменной - плотность деревьев в лесу и фиксируя изменение зависимой переменной - процент сгоревших деревьев. Если мы хотим поставить эксперимент с многократным повторением одних и тех же параметров или с изменением параметров, то в десктопной версии NetLogo для этого есть специальный инструмент BehaviorSpace. Его можно рассматривать как отдельную программу, встроенную в NetLogo. BehaviorSpace помогает экспериментировать с моделью и сохранять результаты в файл для дальнейшего анализа. Начало работы с настройкой инструмента BehaviorSpace представлено на рис. 1. Мы выбираем инструмент в верхнем меню на вкладке Tools. Рис. 1. BehaviorSpace NetLogo Figure 1. BehaviorSpace NetLogo При запуске инструмента BehaviorSpace появляется окно, в котором пользователь указывает для программы задания к выполнению: ● Как назвать эксперимент? ● Какие сценарии эксперимента нужно создать и какие значения в этих сценариях будут принимать глобальные переменные? ● Сколько раз нужно повторить исполнение каждого сценария? ● В какой последовательности нужно проводить выполнение? ● Какие данные нужно собирать в ходе выполнения сценария или после его завершения? ● Какой параметр использовать для остановки сценария, если сценарий не завершается автоматически? Укажем для эксперимента, что необходимо изменять значение переменной density ["density" [51 0.5 70]], начав со значения 51 и увеличивая плотность на 0.5 в каждой серии. Каждая серия будет повторяться 10 раз, и каждый раз в конце эксперимента мы будем измерять процент сгоревших деревьев. При запуске эксперимента программа предлагает выбрать формат, в котором будут сохраняться результаты. В данном случае мы выбираем Table output. Результаты экспериментов записываются программой в таблицу csv - в нашем случае это был файл Fire_2_table.csv. Мы можем открыть этот файл в любом текстовом редакторе, приложениях для работы с электронными таблицами (Microsoft Excel или Google Sheets) или загрузить в одну из сред для статистической обработки. Загрузив данные, мы тут же можем представить зависимость процента сгоревших деревьев от плотности леса на графике Box Plot: boxplot(persent_burned ~ density,data=df, main="Данные о пожарах", xlab="Плотность", ylab="Процент сгоревших") Рис. 2. Box Plot данных Figure 2. Data Box Plot На рис. 2 мы видим, что максимальный межквартильный размах и вариативность процента сгоревших деревьев наблюдается на промежутке плотности леса 57-60 %. Модель помогает исследовать, как плотность деревьев в лесу влияет на распространение пожаров. При этом модель знакомит нас не столько с лесными пожарами, сколько с нелинейным поведением сложных систем, когда очень небольшое изменение в значении данных может привести к очень большим изменениям в результатах. При переходе границы плотности леса от 57 к 60 % мы наблюдаем резкое снижение устойчивости системы к пожару. Модель формирования стай птиц или рыб[29]. Эта модель - попытка имитировать процесс формирования стаи птиц в отсутствии каких-либо лидеров. Каждая птица следует общему набору правил, и из этого общего поведения формируется стая. Стаи птиц можно рассматривать как пример возникновения стайных свойств в результате того, что отдельные животные двигаются в ответ на движения других животных. Как сказано в описании модели, птицы следуют трем правилам: «выравнивание», «разделение» и «сплоченность». «Выравнивание» означает, что птица поворачивается так, чтобы двигаться в том же направлении, что и ближайшие птицы. «Разделение» означает, что птица поворачивается, чтобы избежать столкновения с другой птицей, которая летит слишком близко. «Сплоченность» означает, что птица будет двигаться к другим ближайшим птицам. Когда две птицы находятся слишком близко, правило «разделения» отменяет действие двух других. Правила «Выравнивание» и «Сплоченность» не начнут действовать до тех пор, пока не будет достигнуто минимальное разделение. Все три правила влияют только на направление птицы и никак не влияют на скорость полета. В первой версии каждая птица будет выбирать себе в товарищи по стае всех птиц, которые находятся от нее на расстоянии радиуса видения: 1) to find-flockmates; 2) set flockmates other turtles in-radius vision; 3) end. Мы собираем данные первого эксперимента при помощи BehaviorSpace. Определяем значения независимых переменных. В данном случае они будут неизменны, поскольку свойства стаи будут меняться со временем в результате реакции агентов на поведение других агентов. Значения, которые мы будем собирать на каждом шаге программы: - count turtles with [any? flockmates] - число птиц, у которых есть товарищи по стае; - mean [count flockmates] of turtles - среднее число товарищей у каждой птицы; - mean [min [distance myself] of other turtles] of turtles - среднее расстояние до других птиц; - standard-deviation [heading] of turtles - стандартное отклонение в направлении от других птиц. По завершении эксперимента мы получаем уже привычную таблицу в формате csv и используем данные в среде R, чтобы проследить, как меняются значения по мере формирования стай с предустановленными значениями независимых переменных. А теперь внесем изменения в модель и поменяем правила, по которым птицы отслеживают товарищей по стае, так, что в число товарищей будет попадать только та птица, которая ближе всех к ней расположена. Мы добавили в программу только одну строчку set flockmates flockmates with-min [distance myself]: 1) to find-flockmates; 2) set flockmates other turtles in-radius vision; 3) set flockmates flockmates with-min [distance myself]; 4) end. Никаких других изменений мы не вносим. Результаты экспериментов собираются точно так же, как они собирались для предыдущей модели при помощи BehaviorSpace. В данном случае нам важно показать, как можно объединять и сравнивать результаты двух экспериментов. Рис. 3 демонстрирует, как меняется число птиц, у которых есть товарищи. Синим цветом на графике показаны результаты эксперимента, когда товарищами по стае считаются все рыбы, которые находятся в радиусе видимости. Красным цветом показаны результаты, когда товарищем по стае считается ближайшая птица. Динамика среднего числа товарищей у каждой птицы представлена на рис. 4. Синим цветом на графике показаны результаты эксперимента, когда товарищами по стае считаются все рыбы, которые находятся в радиусе видимости. Красным цветом показаны результаты, когда товарищем по стае считается ближайшая рыба. Здесь ожидаемо товарищей по стае не может быть больше одной рыбы. Динамика среднего расстояния до других рыб представлена на рис. 5. Синим цветом на графике показаны результаты эксперимента, когда товарищами по стае считаются все рыбы, которые находятся в радиусе видимости. Красным цветом показаны результаты, когда товарищем по стае считается ближайшая рыба. Рис. 3. Сравнение экспериментов по изменению числа flockmates Figure 3. Flockmates number alteration comparison experiments Рис. 4. Сравнение экспериментов по среднему числу товарищей Figure 4. Average number of peers comparison experiments Рис. 5. Сравнение экспериментов по среднему расстоянию до других рыб Figure 5. Average distance to other fish experiments comparison Рис. 6. Сравнение экспериментов по отклонению от общего направления Figure 6. Deviation from common direction experiments comparison Мы видим, что среднее расстояние между рыбами уменьшается и они становятся ближе друг другу независимо от того, какая стратегия выбора товарищей по стае используется в эксперименте. Динамика стандартного отклонения в направлении от других рыб представлена на рис. 6. Синим цветом на графике показаны результаты эксперимента, когда товарищами по стае считаются все рыбы, которые находятся в радиусе видимости. Красным цветом показаны результаты, когда товарищем по стае считается ближайшая рыба. Заключение. Описанный в данной работе способ генерации данных для их последующего анализа может стать весьма перспективным направлением работы со школьниками. С одной стороны, он позволяет лучше понять природу и закономерности изучаемых явлений, к какой бы области естественно-научного или гуманитарного знания они ни принадлежали. Даже при использовании компьютерной модели процесса, созданной другими людьми, у школьника есть возможность проследить логику, которая стоит за этой моделью, и далее сделать следующий шаг - создать собственную версию (ремикс) этой модели, видоизменив ее или применив к другой области знания. Кроме того, создание модели - это только первый шаг в исследовании и постановке экспериментов. Для того чтобы оставаться в субъектной позиции творца эксперимента и указывать агентам в какой последовательности совершать действия и какие данные сохранять, совершенно не обязательно писать код модели с нуля. В этом плане каждая из сотен готовых моделей, опубликованных в библиотеке NetLogo или в сообществе NetLogo Commons, является отдельной управляемой учеником средой для выращивания данных. Развиваемое таким образом у школьника умение сопоставить изучаемый процесс или явление с его моделью, сделать выводы из того, как структурирован или как себя проявляет этот процесс в результате экспериментирования с этой моделью, создает основу для формирования вычислительного мышления. Освоение учащимся приемов и методов вычислительного мышления в свою очередь создает условия для формирования у него более широкой картины действительности, в которой он будет осознавать связи между процессами, протекающими в различных областях (например, в экологии и социологии), и занимать творческую, активную, ответственную позицию по отношению к ним, понимая существующие в них причинно-следственные связи. Привлекая школьника к процессу выращивания данных на основе компьютерных моделей, мы даем ему возможность приобщиться к культуре обмена данными и генерирующими их моделями со своими сверстниками из других регионов и стран. Объединяя свои данные и делая на их основе выводы, школьники могут реализовывать глобальные проекты и наблюдать в них особенности протекания привычных процессов в разных уголках мира, обусловленные географическими и культурными различиями. Таким образом мы можем совершить важный шаг к воспитанию исследователей и ученых для реальности, в которой мы будем жить уже в ближайшем будущем. Общей тенденцией последних лет является разработка веб-приложений, к которым ученики могут обращаться через Сеть, ничего не скачивая и ничего не устанавливая дополнительно на свои собственные компьютеры. Это могут быть приложения, в которых данные создаются как результат действий и взаимодействий множества агентов. И тут мы наблюдаем, как в последние несколько лет различные среды создания агентного моделирования из программ на компьютерах превратились в программы, работающие исключительно через веб-интерфейс. Даже давно и успешно развивающаяся среда многоагентного моделирования NetLogo, кроме привычной десктопной версии, получила вариант веб-приложения - NetLogo Web[30]. Общая тенденция, которая требует внимательного изучения, состоит в том, что среды порождения данных начинают объединяться со средами статистического анализа данных. В результате образуются веб-платформы, на базе которых ученик может формулировать правила поведения для искусственных агентов, собирать данные, которые возникают в качестве следов поведения искусственных агентов, проводить статистическую обработку и представлять данные на графиках.

×

Об авторах

Евгений Дмитриевич Патаракин

Национальный исследовательский университет «Высшая школа экономики»

Email: epatarakin@hse.ru
ORCID iD: 0000-0002-1216-5043

доктор педагогических наук, академический руководитель образовательной программы «Цифровая трансформация образования»

Российская Федерация, 101000, Москва, Потаповский пер., д. 16/9

Борис Борисович Ярмахов

Московский городской педагогический университет

Автор, ответственный за переписку.
Email: yarmakhovbb@mgpu.ru
ORCID iD: 0000-0001-6217-0871

кандидат философских наук, научный руководитель Центра анализа данных, Институт цифрового образования

Российская Федерация, 129524, Москва, ул. Шереметьевская, д. 28

Список литературы

  1. Ben-Zvi D, Makar K, Garfield J. International handbook of research in statistics education. Cham: Springer International Publishing; 2018.
  2. Erickson T, Finzer B, Reichsman F, Wilkerson M. Data moves: one key to data science at school level. Proceedings of the International Conference on Teaching Statistics (ICOTS-10). 2018;6:1-6.
  3. Fekete A, Kay J, Röhm U. A data-centric computing curriculum for a data science major. Proceedings of the 52nd ACM Technical Symposium on Computer Science Education. New York: Association for Computing Machinery; 2021. p. 865-871. https://doi.org/10.1145/3408877.3432457
  4. Bates M., Usiskin Z. Digital curricula in school mathematics. IAP; 2016.
  5. Wilkerson M, Lanouette K, Shareff R, St Clair N, Bulalacao N, Erickson T, Heller J, Finzer W, Reichsman F. Data transformations: restructuring data for inquiry in a simulation and data analysis environment. In Kay J, Luckin R. (eds.) Rethinking Learning in the Digital Age: Making the Learning Sciences Count: 13th International Conference of the Learning Sciences 2018 (vol. 3). London: International Society of the Learning Sciences; 2018.
  6. Gibson P, Mourad T. The growing importance of data literacy in life science education. American Journal of Botany. 2018;105(12):1953-1956. https://doi.org/10.1002/ajb2.1195
  7. Uzunalioglu H, Cao J, Phadke C, Lehmann G, Akyamac A, He R, Lee J, Able M. Augmented data science: towards industrialization and democratization of data science. 2019. Available from: http://arxiv.org/abs/1909.05682 (accessed: 21.03.2021).
  8. Wilkerson MH. DataSketch: a tool to turn student sketches into data-driven visualizations. Frontiers in Pen and Touch. Springer; 2017. p. 227-234.
  9. Blikstein P. Seymour Papert’s legacy: thinking about learning, and learning about thinking. Seymour Papert Tribute at IDC 2013 (New York, 24-27 June 2013). New York; 2013.
  10. Mokros JR, Tinker RF. The impact of microcomputer-based labs on children’s ability to interpret graphs. Journal of Research in Science Teaching. 1987;24(4):369-383. https://doi.org/10.1002/tea.3660240408
  11. Tinker R, Krajcik JS. Portable technologies: science learning in context. London: Springer; 2002.
  12. Klopfer E. Augmented learning: research and design of mobile educational games. The MIT Press; 2008.
  13. Klopfer E, Sheldon J, Perry J, Chen VH-H. Ubiquitous games for learning (UbiqGames): Weatherlings, a worked example. J. Comp. Assist. Learn. 2012;28(5):465-476. https://doi.org/10.1111/j.1365-2729.2011.00456.x
  14. Patarakin ED. Wikigrams-based social inquiry. Digital Tools and Solutions for Inquiry-Based STEM Learning. 2017;1:112-138.
  15. Vachkova S, Petryaeva E, Patarakin E. Typology of schools operating in the Moscow Electronic School system based on the analysis of network indicators. SHS Web Conf. EDP Sciences. 2021;98:03001. https://doi.org/10.1051/shsconf/20219803001
  16. Bondaryk L, Hsi S, Van Doren S. Probeware for the modern era: IoT dataflow system design for secondary classrooms. IEEE Transactions on Learning Technologies. 2021;14(2):226-237. https://doi.org/10.1109/TLT.2021.3061040
  17. Dixon C, Hardy L, Hsi S, Van Doren S. Computational tinkering in science: designing space for computational participation in high school biology. International Society of the Learning Sciences; 2020.
  18. Tho SW, Yeung YY, Wei R, Chan KW, So WW. A systematic review of remote laboratory work in science education with the support of visualizing its structure through the HistCite and CiteSpace software. Int. J. of Sci. and Math. Educ. 2017;15(7):1217-1236. https://doi.org/10.1007/s10763-016-9740-z
  19. Hossain Z, Bumbacher E, Brauneis A, Diaz M, Saltarelli A, Blikstein P, Riedel-Kruse IH. Design guidelines and empirical case study for scaling authentic inquiry-based science learning via open online courses and interactive biology cloud labs. Int. J. Artif. Intell. Educ. 2018;28(4):478-507. https://doi.org/10.1007/s40593-017-0150-3
  20. De Caux R. An agent-based approach to modelling long-term systemic risk in networks of interacting banks (Doctoral Thesis). University of Southampton; 2017.
  21. Sayama H, Cramer C, Sheetz L, Uzzo S. NetSciEd: network science and education for the interconnected world. 2017. Available from: http://arxiv.org/abs/1706.00115 (accessed: 20.10.2020).
  22. Secchi D, Neumann M. (eds.) Agent-based simulation of organizational behavior. Cham: Springer International Publishing; 2016.
  23. Horne GE, Schwierz K-P. Data farming around the world overview. Proceedings of the 40th Conference on Winter Simulation. Miami; 2008. p. 1442-1447.
  24. Sanchez SM. Data farming: methods for the present, opportunities for the future. ACM Trans. Model. Comput. Simul. 2020;30(4):22:1-22:30. https://doi.org/10.1145/3425398
  25. Sanchez S. Data farming: better data, not just big data. 2018 Winter Simulation Conference. 2018. p. 425-439. https://doi.org/10.1109/WSC.2018.8632383
  26. Lorig F, Timm IJ. Simulation-based data acquisition. In: Arabnia HR, Daimi K, Stahlbock R, Soviany C, Heilig L, Brüssau K. (eds.) Principles of Data Science. Cham: Springer International Publishing; 2020. p. 1-15. https://doi.org/10.1007/978-3-030-43981-1_1
  27. Rakić K, Rosić M, Boljat I. A survey of agent-based modelling and simulation tools for educational purpose. Tehnički Vjesnik. 2020;27(3):1014-1020. https://doi.org/10.17559/TV-20190517110455
  28. Railsback SF, Grimm V. Agent-based and individual-based modeling: a practical introduction. 2nd ed. Princeton University Press; 2019.
  29. Wilensky U, Rand W. An introduction to agent-based modeling: modeling natural, social, and engineered complex systems with NetLogo. MIT Press; 2015.

© Патаракин Е.Д., Ярмахов Б.Б., 2021

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах