СИСТЕМА АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ УЧЕБНОЙ ДЕЯТЕЛЬНОСТЬЮ И ЕЕ ДИАГНОСТИКИ

информационные технологии и образование
УДК 681.52
система автоматического управления учебной деятельностью и ее диагностики
П. П. Дьячук,
канд. физ.-мат. наук, доцент Л. Н. Дроздова, канд. мед. наук, доцент И. В. Шадрин,
канд. техн. наук
Красноярский государственный педагогический университет им. В. П. Астафьева
В рамках информационной модели развития учебной деятельности, регулируемой системой автоматического управления Tr@cK, рассмотрен процесс научения решению задач. Проведена диагностика учебной деятельности, а ее результаты сопоставлены с результатами диагностики уровня развития базовых когнитивных функций мозга.
Ключевые слова — системы управления, автоматическое регулирование, диагностика учебной деятельности.
Введение
Учебную деятельность обучающегося решению задач можно рассматривать как процесс развития потому, что с ней связано получение новой информации, в результате опыта совершения действий. Этот процесс происходит вследствие итеративного научения, а результат является следствием решения последовательности аналогичных задач и перехода от незнания к знанию путем продуцирования информации при взаимодействии обучающегося с проблемной средой. Особую роль в системе «обучающийся — проблемная среда» играет процесс изменения (развития) структуры системы действий обучающегося, регулируемый с помощью каналов обратной связи.
Основой функционирования главной и местной обратных связей являются исполнительные механизмы, преобразующие интерфейс проблемной среды. Они реализуют институциональное (ограничение набора допустимых действий), информационное (реализованное в виде индикатора расстояния до цели, информирующего о количестве действий, которые необходимо совершить для перехода в целевое состояние) и мотивационное (отображение изменений функции ценности состояния обучающегося с помощью дискретной системы уровней деятельности) управление учебной деятельностью. Постоянно, пока обучающий-
ся не решит задачу (и не научится решать задачи данного типа), проблемная среда будет посылать сигналы. При этом индивидуальные способности обучающихся влияют лишь на процесс поиска решения задачи, но не на результат. Такая система, управляющая самоорганизацией деятельности обучающегося, получила название автоматического регулятора учебной деятельности Тг@сК (далее регулятор Тг@сК). Следуя работе [1], опишем принципы его функционирования.
Регулятор Тг@сК
Регулятор Тг@сК предназначен для управления учебной деятельностью обучающихся решению задач или проблем (обобщенное название компьютерных программ, созданных на его основе — «Проблемные среды»). Употребление термина «учебная деятельность» [2] обусловлено тем, что регулятор Тг@сК не управляет процессом обучения, а создает для обучающегося условия, позволяющие реализовать его поисковую активность с помощью некоторого набора доступных действий.
Цель функционирования регулятора Тг@сК состоит в том, чтобы привести структуру системы действий обучающегося — набор осуществляемых им действий и их последовательность — в такое состояние, когда каждое совершаемое действие будет приближать решение задачи. Для
достижения этой цели регулятор Тг@сК поощряет правильные действия и угнетает неправильные. Общая структурная схема регулятора Тг@сК представлена на рис. 1.
Регулятор Тг@сК производит поиск такого требуемого значения параметров местной обратной связи (аргументов передаточной функции звена 6, реализующего эту связь), при котором структура системы действий г(^) обучающегося 8 будет соответствовать целям функционирования регулятора ^). Проверка этого соответствия осуществляется в цепи главной обратной связи в моменты срабатывания переключателя 9, когда включается звено 10, определяющее параметры структуры системы действий обучающегося на основе сохраненной во внешней памяти 11 последовательности действий.
При этом истинные законы изменения параметров структуры системы действий обучающегося г(Р) установить невозможно в силу объективных причин, зависящих от психических, физиологических, интеллектуальных и других индивидуальных особенностей конкретного человека. Обучающийся, деятельность которого подлежит регулированию, является «черным ящиком». Подавая на его входы (органы чувств, в частности глаза или уши) управляющие сигналы, смысл которых ему знаком, на выходе мы имеем сигналы (в виде зафиксированных действий, доступных в проблемной среде, им совершаемых). Передаточную функцию этого звена нельзя определить заранее. Более того, анализ протоколов деятельности, сохраненных во внешней памяти, является наиболее интересным направлением исследования — он позволяет устанавливать вид и параметры передаточной функции для каждого обучающегося, т. е. диагностировать индивидуальные особенности осуществления учебной деятельности.
Элемент сравнения 1 производит вычитание х^) = g(t) - г(Ь) и тем самым определяет рассогласование между реальной структурой системы действий обучающегося г(Ь) и требуемой g(t) — исключающей неправильные действия. На основании вычисленной ошибки х(Ь) звено 2 опреде-
8(0 *(і)
Рис. 1. Структурная схема регулятора учебной деятельности Тг@сК
ляет уровень деятельности обучающегося Li, где I — номер очередного формируемого звеном 3 задания — новой задачной (проблемной) ситуации. Li дискретно изменяется во времени (после выполнения очередного задания) и определяется лишь параметрами структуры системы действий обучающегося при выполнении предыдущего - 1)-го задания. L1 = 1. Уровень деятельности отображается специальным датчиком в интерфейсе проблемной среды. В зависимости от значения уровня деятельности звено 4 определяет параметры функционирования местной обратной связи 6.
Сформированная звеном 3 задача отображается интерфейсом проблемной среды, приведенным модулем 5 в состояние, соответствующее начальным параметрам. Элемент памяти 7 сохраняет тот же набор параметров, но содержащий значения, достижение которых соответствует решению поставленной задачи. Преобразование объектов проблемной среды для достижения этого соответствия является для обучающегося локальной целью, которую он должен достичь, используя систему действий, доступных ему в проблемной среде. Кроме того, модуль 5 реализует все изменения интерфейса проблемной среды, связанные с действиями обучающегося. При этом формирование новой задачной ситуации (формирование соответствующего состояния интерфейса) происходит лишь в моменты включения главной обратной связи, а текущие изменения отображаются после каждого совершенного обучающимся действия.
Для реализации местной обратной связи после каждого действия обучающегося вычислительное звено 12 определяет изменение параметров объектов проблемной среды, а элемент сравнения 13 определяет рассогласование между текущей обстановкой и значениями, сохраненными звеном 7. Величина этого рассогласования, выраженная в количестве дискретных шагов (каждый из которых — это конкретное действие обучающегося, дискретно изменяющее определенный параметр проблемной среды), определяет расстояние до цели (решения задачи). Эта информация, составляющая основу местной обратной связи, позволяет обучающемуся отличить правильные действия от ошибочных и достичь решения текущей задачи.
В моменты времени, когда расстояние до цели равно нулю, переключатель 9 может изменить свое состояние при поступлении от обучающегося сигнала об окончании выполнения задания. Если такой сигнал не поступает (обучающийся не нажимает соответствующую кнопку), регулятор продолжает функционировать по малому кругу через местную обратную связь. И напротив, если
расстояние до цели не равно нулю, переключатель 9 не изменит своего состояния при поступлении этого сигнала.
При изменении состояния переключателя 9 включается контур главной обратной связи, в который входит звено 10, определяющее параметры структуры системы действий обучающегося на основе формализованной информации, сохраненной в модуле внешней памяти 11. Отметим, что при формировании очередной проблемной ситуации вновь возникает рассогласование в элементе сравнения 13 и переключатель 9 переходит в состояние, когда сигналы проходят по контуру местной обратной связи и регулируют процесс поиска обучающимся решения текущей задачи.
Во внешней памяти сохраняется не только последовательность действий обучающегося с указанием затраченного времени, но и управляющие воздействия регулятора Тг@сК: условия поставленной задачи, параметры работы датчика «Расстояние до цели», параметры структуры системы действий обучающегося. Благодаря этой информации появляется возможность более сложного анализа деятельности обучающегося в любое удобное для исследователя время с применением различных методов и программных средств.
Приведенное описание показывает, что регулятор Тг@сК производит поиск такого режима работы местной обратной связи, при котором деятельность обучающегося наиболее эффективна. Учитывая, что истинные законы изменения параметров структуры системы действий обучающегося установить невозможно, регулятор Тг@сК можно определить как экстремальную самонастраивающуюся систему автоматического управления дискретного действия.
Учебная деятельность в проблемной среде
Учебная деятельность — это особый способ саморазвития обучающегося, направленный на освоение новых видов деятельности, продуцирование обучающимся новых знаний, умений и навыков. Актуальность диагностики индивидуальных особенностей ее осуществления сегодня не вызывает сомнений.
Структура системы действий, совершаемых обучающимся в проблемной среде, имеет сложный вид в силу разнообразия семантического смысла действий и порядка их выполнения. Однако если учитывать только синтаксическое значение данных о действиях обучающегося, то множество действий можно разделить на два подмножества: подмножество правильных действий (приближающих решение задачи) и подмножество неправильных действий (отдаляющих решение). Таким образом, деятельность можно фор-
мально представить в виде последовательности единиц и нулей — 1110110011..., т. е. в виде сообщения обучающегося (в синтаксической форме), характеризующего структуру системы его действий. В процессе научения решению задач доля правильных действий возрастает, соответственно доля неправильных действий уменьшается.
Трактуя развитие, как процесс снижения меры неупорядоченности (убывания энтропии Н) действий, который проявляется в снижении неопределенности при принятии решения обучающимся о выборе действия, будем говорить о накоплении внутренней (субъективной для обучающегося) информации, такой, информации, которая позволила бы обучающемуся безошибочно находить решение задачи. Значение энтропии, характеризующее структуру системы действий обучающегося, можно вычислить по формуле Шеннона
нь = -Рь 1оИ2 Рь - (1 - Рь )1°Я2(1 - 22
где р1 — доля правильных действий при выполнении ^го задания, так как отмена ошибочного действия является правильным действием, всегда р1 > 0,5, а при р1 ^ 0,5 (большом количестве ошибочных действий) Н1 ^ 1.
Отметим, что энтропия деятельности обучающегося Н при условии предъявления ориентиров с частотой РВ-- при выполнении ^ - 1)-го задания определяет параметры функционирования системы Тг@сК при поиске обучающимся решения ^о задания.
Таким образом, информацию, накопленную обучающимся при осуществлении деятельности в проблемной среде после выполнения i заданий, можно выразить как меру снятой неопределенности:
I = 1 - Н (1)
В системах машинного обучения с подкреплением [3] подобный параметр (1) называют функцией ценности состояния. В нашем случае эта числовая величина определяет величину вознаграждения, на которое может рассчитывать обучающийся.
В начале обучения, когда энтропия деятельности обучающегося высока, недостаток внутренней информации компенсирует регулятор Тг@сК. Чем больше обучающийся накопил информации о способах решения задачи, тем меньше он нуждается в дополнительной (внешней по отношению к нему) информации. В этом случае Тг@сК ограничивает функционирование датчика «Расстояние до цели», а на завершающем этапе обучения отключает его.
Таким образом, показателем эффективности функционирования системы «обучающийся —
проблемная среда» следует считать такой параметр, который отражал бы и состояние структуры системы действий обучающегося, и параметры проблемной среды, при которых осуществлялась деятельность. Такая мера должна отражать уровень самостоятельности обучающегося.
Следуя работе [4], возьмем в качестве показателя эффективности функционирования обучающегося в проблемной среде при выполнении задания коэффициент обратной связи, который с учетом двух контуров обратной связи принимает вид
= РдРв + н, (2)
; N
где РА = — доля неправильных действии
(N1 — количество неправильных действий; N0 — общее количество действий); РВ — относительная частота включения датчика «Расстояние до цели»; Hi — энтропия деятельности обучающегося при выполнении ^о задания. Индекс Т в обозначении коэффициента обратной связи (указывает количество затраченного на обучение времени на момент завершения выполнения ^го задания) позволяет рассматривать его как в масштабе выполненных заданий, так и по затраченному времени.
Целью функционирования системы Тг@сК является достижение коэффициентом обратной связи нулевого значения. Это означает, что действия обучающегося не зависят от датчиков проблемной среды и определяются только собственной системой управления, т. е. мозгом, на основе внутренней информации. При этом отсутствует неопределенность при выборе действия, и каждое действие приближает решение задачи.
Мера рассогласования между требуемой и реальной деятельностью обучающегося — значение функции ценности состояния — представлена в проблемной среде дискретным датчиком, отображающим систему уровней в диапазоне от 1 до 10. Благодаря этому датчику обучающийся имеет возможность осуществлять саморегулирование своей учебной деятельности.
Проблемная среда выступает в роли регулятора учебной деятельности Тг@сК. Она связана с обучающимся двумя линиями связи — прямой линией передачи управляющих сигналов от проблемной среды к обучающемуся и линией обратной связи, передающей в проблемную среду информацию о действительном состоянии деятельности обучающегося.
Система управления через датчик «Расстояние до цели» содействует обучающемуся в снятии структурного дисбаланса, обусловленного отрицательной обратной связью между деятельностью
обучающегося и проблемной средой. Для этого в системе Тг@сК имеется модуль, который обеспечивает через датчик «Расстояние до цели» положительную обратную связь между множеством правильных действий и отрицательную обратную связь с множеством неправильных действий.
Положительная обратная связь, реализуемая системой Тг@сК, поддерживает (усиливает) правильные действия обучающегося, а отрицательная обратная связь угнетает неправильные. По мере научения относительная частота правильных действий возрастает, т. е. деятельность обучающегося становится самодостаточной и не нуждается во внешнем подкреплении. Благодаря этому потребность в датчике «Расстояние до цели» снижается и вероятность его подключения уменьшается.
Диагностика учебной деятельности
Примером реализации изложенных принципов управления является пазловая проблемная среда «Динамические пазлы», с помощью которой проводилась диагностика учебной деятельности по конструированию пространственного объекта из фрагментов [5]. Задание состоит в сборке чертежа из 25 фрагментов. Обучающийся может совершать три вида действий: 1 — просмотр фрагментов в специальном окне; 2 — установка выбранного фрагмента на рабочее поле; 3 — отмена установленного ранее фрагмента. Несмотря на то что задание одно и то же и потенциально проблемная среда одинакова для всех обучающихся, реальная проблемная среда зависит как от их поведения (учебной деятельности), так и от личности обучающегося. Это определяется тем, что поведение обучающегося является саморегулируе-мым и взаимосвязанным с проблемной средой и личностными особенностями обучающегося.
Научение проходит в итеративном режиме, т. е. обучающиеся повторяют конструирование объекта до тех пор, пока их деятельность не станет безошибочной. При выполнении первого задания обучающийся осуществляет конструирование, незамедлительно получая информацию о правильности или неправильности каждого действия.
Функции вознаграждения и базовые когнитивные функции мозга
Представляет интерес сопоставление стратегии действий обучающегося с состоянием развития его базовых когнитивных функций мозга (БКФМ). К таким функциям относятся: распознавание, дифференцирование, направленное внимание, объем оперативной памяти и скорость
обработки информации. Проследим, какое отражение находят психические процессы, характеризуемые БКФМ, в деятельности обучающегося, осуществляющего конструирование пространственных объектов в проблемной среде.
Проведенный в ходе исследования эксперимент состоял в сопоставлении результатов психофизиологического обследования обучающихся методом когнитивных вызванных потенциалов Р300 и результатов, полученных при обработке протоколов деятельности обучающихся в проблемных средах.
Вызванные потенциалы (ВП) являются индикаторами электрических процессов работы мозга, связанных с механизмами восприятия информации, ее обработки. Одной из таких методик, значительно продвинувших анализ этих процессов, является методика когнитивных вызванных потенциалов (КВП), или методика Р300. Этот вид ВП в последнее время все больше находит применение в клинической практике при оценке доклинической стадии когнитивных нарушений различного типа [6].
Сущность этой методики заключается в том, что не просто выделяются ответные реакции на тот или иной стимул, связанные с приходом аф-ферентации, а анализируются эндогенные события, происходящие в мозгу, связанные с опознанием стимула, его дифференциацией, удержанием в памяти и пр., — все, что создает сущность когнитивных процессов.
В ходе эксперимента нейрофизиологическая диагностика БКФМ была проведена в группе студентов из 63 чел. Средний возраст составил 1718 лет. После анализа ВП были выделены три группы: 1) в группе из 36 чел. (57 % от числа обследованных) показатели соответствовали норме, что свидетельствует о том, что процессы опознания, дифференцировки, направленного внимания и объем оперативной памяти не страдают; 2) в группе из 15 чел. (24 % от числа обследованных) отмечалось нарушение процессов направленного внимания и снижение объема оперативной памяти; 3) в группе из 12 чел. (19 % от числа обследованных) отмечались нарушения ответа в виде удлинения пика РЗ и слабо выраженного пика N2, что свидетельствует не только о снижении объема оперативной памяти и направленного внимания, но и о нарушении процессов опознания и дифференцировки. Представлены диаграммы обследования КВП Р300 для характерных представителей первой (обучающийся № 1, рис. 2, а) и третьей (обучающийся № 2, рис. 2, б) групп.
Из рисунка видно, что обучающиеся первой и третьей группы сильно отличаются по форме и характеристикам ВП. Проследим, какие отличия имеют место в способах осуществления дея-
а)
СЙ
А 3
И Н
Ф & Й & О и
в
Время, мс 200 400
600
N1
Р1 ^>==4 N2
; ; рг
б)
Время, мс 200 400
600
Рис. 2. Диаграммы обследования КВП Р300: а — обучающийся № 1; б — обучающийся № 2
тельности в проблемной среде для этих обучающихся. Графически учебная деятельность, регулируемая системой Тг@сК, в проблемной среде для первого выполнения задания обучающимся № 1 и обучающимся № 2 представлена на рис. 3, а, б функциями вознаграждения г^). Функция вознаграждения задает отображение каждого действия в числовую меру, определяющую степень эффективности принятия действия в данном со-
а)
к
к
и
ф
ч
СЙ

м
О

Я
К
Я
и
и
©
к
и
ф
ч
&
Рн
СЙ

м
О

Я
К
Я
и
и
©
20
10
о
-10
-20
б)
20
10
-10
-20
0
100
200 300
Время, с
400
500
100 200 300 400 500 600 700
Время, с
Рис. 3. Функция вознаграждения при первом выполнении задания в масштабе времени: а — обучающийся № 1; б — обучающийся № 2
стоянии проблемной ситуации для достижения цели. Она определяет сиюминутную эффективность пары «действие — состояние проблемной среды», а достижение решения задачи соответствует максимуму общего вознаграждения.
Функция вознаграждения вычисляется из обработки данных синтаксической информации (см. выше) о действиях обучающегося и представляет траекторию его деятельности. Значение г() увеличивается на единицу, если совершено правильное действие, и уменьшается на единицу, если — неправильное. На рис. 3 представлены функции вознаграждения при выполнении первого задания: максимальное вознаграждение равно количеству исходных фрагментов изображения.
Из сравнения траекторий деятельности видно, что обучающийся № 2 совершает гораздо больше неправильных действий по сравнению с обучающимся № 1. Исходя из того, что при выполнении первого задания Р^ = 1 и коэффициент обратной связи зависит только от доли неправильных действий, его значение говорит лишь о том, что обучающийся № 1 справился с заданием более успешно. Для определения особенностей функционирования системы «обучающийся — проблемная среда» следует рассматривать последовательность значений функции ценности состояния.
Динамика изменения коэффициента обратной связи
Представим графически особенности функционирования регулятора Тг@сК для нескольких обучающихся (звено 8 на рис. 1), отличающихся друг от друга способами осуществления учебной деятельности в проблемной среде и уровнем развития БКФМ. Построим график изменения коэффициента обратной связи (2) в масштабе выполненных заданий (рис. 4).
Для большинства обучающихся от задания к заданию Р1А уменьшается, что делает структуру системы действий более совершенной, т. е. функция ценности состояния обучающегося возрастает, а значение энтропии деятельности — второго слагаемого в уравнении (2) — убывает. По мере научения недостаток внешней помощи (уменьшение РВ, затем отключение датчика «Расстояние до цели») компенсируется накопленными знаниями и деятельность обучающегося перестает нуждаться в регулировании. Такому положению вещей соответствует уменьшение коэффициента обратной связи до нуля (см. рис. 4, а).
Некоторая часть обучающихся, успешно осуществляющих деятельность при повышенной частоте РВ (датчик «Расстояние до цели» ком-
а)
б)
в)
Номера заданий
Рис. 4. Функция ценности состояния в масштабе выполненных заданий: а — обучающегося № 1; б — обучающегося № 3; в — обучающегося № 2; о — выполненные задания
пенсирует внутреннюю неопределенность), при уменьшении частоты подкрепления совершают больше ошибочных действий, и проблемная среда увеличивает РВ при выполнении следующего задания. Происходит колебание показателя общей эффективности функционирования регулятора Тг@сК е[ (см. рис. 4, б, в).
В эксперименте все обучающиеся достигают десятого уровня (безошибочной деятельности в отсутствие подкрепления). Но графики изменения коэффициента обратной связи показывают, насколько разным может быть процесс научения
решению задач в проблемной среде. Сопоставляя данные нейрофизиологической и компьютерной диагностики следует отметить, что обучающийся № 1 относится к первой группе (когнитивные функции мозга достаточно развиты), обучающийся № 3 — ко второй, а обучающийся № 2 — к третьей группе.
Выводы
Предлагаемая система автоматического управления учебной деятельностью, состоящая из проблемной среды, включающей систему автоматического регулирования Тг@сК, снимает структурный дисбаланс между желанием обучающе-
Литература
1. Бесекерский В. А., Попов Е. П. Теория систем автоматического управления. 4-е изд., перераб. и доп. — СПб.: Профессия, 2003. — 752 с.
2. Зимняя И. А. Педагогическая психология: учеб. пособие. — Ростов н/Д.: Феникс, 1997. — 480 с.
3. Рассел С., Норвиг П. Искусственный интеллект: современный подход. — М.: Вильямс, 2006. — 1408 с.
4. Светлов В. А. Конфликт: модели, решения, менеджмент. — СПб.: Питер, 2005. — 540 с.
5. Шадрин И. В. Инструментальный метод исследования деятельности обучающихся конструированию
гося обучиться решению проблемы и несовершенством структуры его системы действий.
Сравнительный анализ данных нейрофизиологической диагностики БКФМ с данными компьютерной диагностики учебной деятельности обучающихся показал, что одной из причин возникающих проблем в обучении студентов является недостаточный уровень развития БКФМ.
Система автоматического управления учебной деятельностью содействует процессу саморегуляции деятельности обучающегося, количественно определяет функции вознаграждения, позволяет измерить скорости изменения функции ценности состояния (обучаемость). Эта информация может использоваться при индивидуализации обучения.
пространственных объектов//Системы управления и информационные технологии. 2008. № 2.2(32). С. 308-311.
6. Дроздова Л. Н., Дьячук П. П. Диагностика динамики когнитивных стратегий поиска решения задач и когнитивных функций мозга студентов в процессе обучения // Competences and teacher competence: Proc. Conf., Osijek, 18-19 April 2007. P. 168175.