Методы и модели интеллектуального автоматизированного контроля знаний

Калининградский Государственный Технический Университет

Кафедра СУ и ВТ

Реферат

«Методы и модели интеллектуального автоматизированного контроля знаний»

Проверил

к.тн., доцент кафедры СУ и ВТ КГТУ Рудинский Игорь Давидович

оценка___________________

«______»_____________2001

_________________________ Выполнил

Соловей

Евгений Владимирович

«____»_________2001

__________________

Калининград

2001

Аннотация

Настоящий реферат содержит результаты анализа методов и моделей
интеллектуального контроля знаний с применением средств вычислительной
техники, существующих на данный момент в области образования. Также
рассказывается о новых разработках в этой области и собственных мыслях
автора. Узловыми вопросами работы является обзор имеющихся средств
автоматизации контроля знаний и тестирования, теоретические разработки
различных авторов, методы построения интеллектуальных систем контроля,
модели оценивания знаний.

Содержание

TOC \o “1-4” \h \z HYPERLINK \l “_Toc530318959” Введение PAGEREF
_Toc530318959 \h 5

HYPERLINK \l “_Toc530318960” 1. Контроль и тестирование PAGEREF
_Toc530318960 \h 7

HYPERLINK \l “_Toc530318961” 1.1 Функции контроля PAGEREF
_Toc530318961 \h 7

HYPERLINK \l “_Toc530318962” 1.1.1 Контролирующая функция PAGEREF
_Toc530318962 \h 7

HYPERLINK \l “_Toc530318963” 1.1.2 Обучающая функция PAGEREF
_Toc530318963 \h 7

HYPERLINK \l “_Toc530318964” 1.1.3 Диагностическая функция PAGEREF
_Toc530318964 \h 8

HYPERLINK \l “_Toc530318965” 1.1.4 Прогностическая функция PAGEREF
_Toc530318965 \h 8

HYPERLINK \l “_Toc530318966” 1.1.5 Развивающая функция PAGEREF
_Toc530318966 \h 8

HYPERLINK \l “_Toc530318967” 1.1.6 Ориентирующая функция PAGEREF
_Toc530318967 \h 9

HYPERLINK \l “_Toc530318968” 1.1.7 Воспитывающая функция PAGEREF
_Toc530318968 \h 9

HYPERLINK \l “_Toc530318969” 1.2 Методы контроля PAGEREF
_Toc530318969 \h 9

HYPERLINK \l “_Toc530318970” 1.2.1 Устная проверка PAGEREF
_Toc530318970 \h 9

HYPERLINK \l “_Toc530318971” 1.2.2 Проверка письменно – графических
работ PAGEREF _Toc530318971 \h 11

HYPERLINK \l “_Toc530318972” 1.2.3 Проверка практических и
лабораторных работ PAGEREF _Toc530318972 \h 12

HYPERLINK \l “_Toc530318973” 1.3 Средства контроля PAGEREF
_Toc530318973 \h 12

HYPERLINK \l “_Toc530318974” 1.3.1 Безмашинные средства контроля
PAGEREF _Toc530318974 \h 12

HYPERLINK \l “_Toc530318975” 1.3.1.1 Проверка домашнего задания
PAGEREF _Toc530318975 \h 12

HYPERLINK \l “_Toc530318976” 1.3.1.2. Диктант PAGEREF _Toc530318976
\h 13

HYPERLINK \l “_Toc530318977” 1.3.1.3 Организация самостоятельных
работ PAGEREF _Toc530318977 \h 13

HYPERLINK \l “_Toc530318978” 1.3.1.4. Организация контрольных работ
PAGEREF _Toc530318978 \h 13

HYPERLINK \l “_Toc530318979” 1.3.2 Машинные средства проверки
PAGEREF _Toc530318979 \h 14

HYPERLINK \l “_Toc530318980” 1.4 Компьютерное тестирование PAGEREF
_Toc530318980 \h 14

HYPERLINK \l “_Toc530318981” 2. Интеллектуальное тестирование
PAGEREF _Toc530318981 \h 19

HYPERLINK \l “_Toc530318982” 2.1 Методы и модели PAGEREF
_Toc530318982 \h 20

HYPERLINK \l “_Toc530318983” 2.1.1 Модели распознавания образа уровня
знаний PAGEREF _Toc530318983 \h 20

HYPERLINK \l “_Toc530318984” 2.1.2 Предметно – критериальная методика
составления тестов PAGEREF _Toc530318984 \h 22

HYPERLINK \l “_Toc530318985” 2.1.3 Метод определения количества
образовательной информации PAGEREF _Toc530318985 \h 24

HYPERLINK \l “_Toc530318986” 2.1.4 Информационно-генетические
алгоритмы PAGEREF _Toc530318986 \h 26

HYPERLINK \l “_Toc530318987” 2.1.5 Модель Раша PAGEREF
_Toc530318987 \h 28

HYPERLINK \l “_Toc530318988” 2.1.6 Абсолютная временная шкала
измерения знаний PAGEREF _Toc530318988 \h 31

HYPERLINK \l “_Toc530318989” 2.1.7 Методика статистического анализа
качества обучения PAGEREF _Toc530318989 \h 32

HYPERLINK \l “_Toc530318990” 2.1.8 Модель адаптивного тестового
контроля PAGEREF _Toc530318990 \h 34

HYPERLINK \l “_Toc530318991” 2.1.9 Концептуальная модель адаптивного
тестового контроля знаний PAGEREF _Toc530318991 \h 36

HYPERLINK \l “_Toc530318992” 2.1.9.1 Блок целей обучения PAGEREF
_Toc530318992 \h 36

HYPERLINK \l “_Toc530318993” 2.1.9.2 Блок содержания PAGEREF
_Toc530318993 \h 36

HYPERLINK \l “_Toc530318994” 2.1.9.3 Блок измерения PAGEREF
_Toc530318994 \h 37

HYPERLINK \l “_Toc530318995” 2.1.9.4 Блок адаптивного обучения
PAGEREF _Toc530318995 \h 39

HYPERLINK \l “_Toc530318996” 2.1.9.5 Блок системы мониторинга.
PAGEREF _Toc530318996 \h 42

HYPERLINK \l “_Toc530318997” 2.1.10 Технология рейтинговых
исследований качества образования с применением нейронных сетей
PAGEREF _Toc530318997 \h 42

HYPERLINK \l “_Toc530318998” 2.2 Собственные разработки PAGEREF
_Toc530318998 \h 45

HYPERLINK \l “_Toc530318999” 2.2.1 Тестирование по методу цепочек
вопросов PAGEREF _Toc530318999 \h 45

HYPERLINK \l “_Toc530319000” 2.2.2 Автоматизированный контроль знаний
по методике уточняющих вопросов PAGEREF _Toc530319000 \h 46

HYPERLINK \l “_Toc530319001” 2.2.4 Алгоритмы прямого тестирования в
интеллектуальной автоматизированной системе контроля знаний PAGEREF
_Toc530319001 \h 48

HYPERLINK \l “_Toc530319002” 2.2.5 Метод адаптивного
автоматизированного тестирования знаний PAGEREF _Toc530319002 \h 50

HYPERLINK \l “_Toc530319003” Заключение PAGEREF _Toc530319003 \h
52

HYPERLINK \l “_Toc530319004” Список использованной литературы
PAGEREF _Toc530319004 \h 54

Введение

В последние годы в России в сфере образования наблюдается стремительное
усиление интереса к автоматизации промежуточного и финального контроля
результатов обучения учащихся самых различных учебных заведений, начиная
от школ и заканчивая коммерческими курсами. Самым популярным видом
такого контроля является тестирование, основанное на диалоге
вычислительной системы с пользователем. Стремительный рост
быстродействия компьютерных систем, уменьшение цен на вычислительную
технику, появление качественных и мощных систем программирования
увеличило потребность в системах, позволяющих объективно, быстро и
надежно оценивать знания учащихся, предлагая интересные формы
взаимодействия с ними.

Но вопрос создания таких систем является не однозначным, и авторы
существующих разработок иногда отходят от педагогической и
психологической стороны вопроса, пытаясь максимально увеличить
привлекательность своих программных продуктов за счет средств
мультимедиа. Иногда программисты просто игнорируют процесс
взаимодействия с непосредственно носителями знаний (преподавателями),
что отражается на существующих приложениях. Очень часто сами
преподаватели не владеют в должной мере методами оценки качества
создаваемых тестов (будем говорить о тестировании).

Необходимо отметить, что первые концепции компьютеризации обучения
возникли более 30 лет назад под лозунгом “техническое перевооружение
педагога, механизация его труда”, “обучающей машины”, имитирующей
процесс индивидуальной работы преподавателя с обучаемым. Со временем
росло понимание их ограниченности. Определенное распространение получили
попытки использовать в учебном процессе системы искусственного
интеллекта [1]. Именно применение методов искусственного интеллекта и
инженерии знаний, на мой взгляд, поможет превозмочь субъективность и
прямолинейность процесса тестирования, поднимая уровень оценивания
знаний машинными системами. Дело в том, что применение традиционных
методов компьютерного обучения и контроля (прямое тестирование, бальная
система, и т.д.) неприемлемо: для того, чтобы оценить знания обучаемого,
преподавателю приходится переработать огромное количество информации, и
процесс взаимодействия оценивающего и оцениваемого не поддается строгой
формализации, поэтому три основные алгоритмические структуры
(последовательная, ветвление, цикл) при реализации машинных систем не
смогут описать в полной мере данную предметную область. Т.е.
осуществление автоматизированного контроля знаний, умений обучаемых, в
первую очередь, включает решение проблемы определения совокупности
требуемых качеств знаний, без которых критерии оценки знаний и способы
определения уровня их усвоения выявить нельзя.

Автор в данной работе попытался показать некоторые существующие методы и
модели интеллектуального тестирования (см. 2), описать и оценить
качество существующих систем контроля, выдвинуть собственные идеи.

1. Контроль и тестирование

Основная цель контроля знаний и умений состоит в обнаружении достижений,
успехов учащихся, в указании путей совершенствования, углубления знаний,
умений, с тем, чтобы создавались условия для последующего включения
учащихся в активную творческую деятельность. Эта цель в первую очередь
связана с определением качества усвоения учащимися учебного материала –
уровня овладения знаниями, умениями и навыками предусмотренных
программой. Во – вторых, конкретизация основной цели контроля связана с
обучением приемам взаимоконтроля и самоконтроля, формированием
потребности в самоконтроле и взаимоконтроле.

В – третьих эта цель предполагает воспитание у учащихся таких качеств
личности, как ответственность за выполненную работу, проявление
инициативы.

Если перечисленные цели контроля знаний и умений учащихся реализовать,
то можно говорить о том, что контроль выполняет следующие функции:
контролирующую, обучающую (образовательную), диагностическую,
прогностическую, развивающую, ориентирующую, воспитывающую [3].
Рассмотрим эти функции более подробно.

1.1 Функции контроля

1.1.1 Контролирующая функция

Контролирующая функция состоит в выявлении состояния знаний и умений
учащихся, уровня их умственного развития, в изучении степени усвоения
приемов познавательной деятельности, навыков рационального учебного
труда.

При помощи контроля определяется исходный уровень для дальнейшего
овладения знаниями, умениями и навыками, изучается глубина и объем их
усвоения. Сравнивается планируемое с действительными результатами,
устанавливается эффективность используемых преподавателем методов, форм
и средств обучения.

1.1.2 Обучающая функция

Обучающая функция контроля заключается в совершенствовании знаний и
умений, их систематизации. В процессе проверки учащиеся повторяют и
закрепляют изученный материал. Они не только воспроизводят ранее
изученное, но и применяют знания и умения в новой ситуации. Проверка
помогает выделить главное, основное в изучаемом материале, сделать
проверяемые знания и умения более ясными и точными. Контроль
способствует также обобщению и систематизации знаний.

1.1.3 Диагностическая функция

Сущность диагностической функции контроля – в получении информации об
ошибках, недочетах и пробелах в знаниях и умениях учащихся и порождающих
их причинах затруднений учащихся в овладении учебным материалом, о
числе, характере ошибок. Результаты диагностических проверок помогают
выбрать наиболее интенсивную методику обучения, а также уточнить
направление дальнейшего совершенствования содержания методов и средств
обучения.

1.1.4 Прогностическая функция

Прогностическая функция проверки служит получению опережающей информации
об учебно-воспитательном процессе. В результате проверки получают
основания для прогноза о ходе определенного отрезка учебного процесса:
достаточно ли сформированы конкретные знания, умения и навыки для
усвоения последующей порции учебного материала (раздела, темы).

Результаты прогноза используют для создания модели дальнейшего поведения
учащегося, допускающего сегодня ошибки данного типа или имеющего
определенные пробелы в системе приемов познавательной деятельности.

Прогноз помогает получить верные выводы для дальнейшего планирования и
осуществления учебного процесса.

1.1.5 Развивающая функция

Развивающая функция контроля состоит в стимулировании познавательной
активности учащихся, в развитии их творческих способностей. Контроль
обладает исключительными возможностями в развитии учащихся. В процессе
контроля развиваются речь, память, внимание, воображение, воля и
мышление школьников. Контроль оказывает большое влияние на развитие и
проявление таких качеств личности, как способности, склонности,
интересы, потребности.

1.1.6 Ориентирующая функция

Сущность ориентирующей функции контроля – в получении информации о
степени достижения цели обучения отдельным учеником и группой в целом –
насколько усвоен и как глубоко изучен учебный материал. Контроль
ориентирует учащихся в их затруднениях и достижениях.

Вскрывая пробелы, ошибки и недочеты учащихся, он указывает им
направления приложения сил по совершенствованию знаний и умений.
Контроль помогает учащемуся лучше узнать самого себя, оценить свои
знания и возможности.

1.1.7 Воспитывающая функция

Воспитывающая функция контроля состоит в воспитании у учащихся
ответственного отношения к учению, дисциплины, аккуратности, честности.
Проверка побуждает более серьезно и регулярно контролировать себя при
выполнении заданий. Она является условием воспитания твердой воли,
настойчивости, привычки к регулярному труду [3].

Выделение функции контроля подчеркивает его роль и значение в процессе
обучения. В учебном процессе сами функции проявляются в разной степени и
различных сочетаниях. Реализация выделенных функций на практике делает
контроль более эффективным, а также эффективней становится и сам
учебный процесс.

Итак, контроль знаний является неотъемлемой частью учебного процесса.
Существует несколько методов контроля, рассмотрим основные из них.

1.2 Методы контроля

1.2.1 Устная проверка

Устная проверка организуется по-разному, в зависимости от ее цели и от
содержания проверяемого материала. Среди целевых установок проверки
можно выделить следующие: проверить выполнение домашнего задания,
выявить подготовленность учащихся к изучению нового материала, проверить
степень понимания и усвоения новых знаний. В зависимости от содержания
она проводится по материалу предшествующего урока или по отдельным
разделам и темам курса.

Методика устной проверки включает в себя две основные части:

составление проверочных вопросов и их задание;

ответ учащихся на поставленные вопросы.

Составление проверочных вопросов и заданий – важный элемент устной
проверки. Качество вопросов определяется их содержанием, характером
выполняемых учащимися при ответе на вопросы умственных действий, а также
словесной формулировкой.

При составлении вопросов всегда исходят из того, что проверять следует
те знания, которые являются основными в данном курсе или относительно
трудно усваиваются учащимися или которые необходимы для успешного
усвоения дальнейших разделов и тем курса. На подбор вопросов оказывает
влияние вид проверки: для уточнения содержания вопросов для текущей
проверки необходим анализ связей изучаемого материала с ранее
пройденным, а для тематической и итоговой проверки – выделение ведущих
знаний и способов оперирования ими. Причем устную проверку считают
эффективной, если она направлена на выявление осмысленности восприятия
знаний и осознанности их использования, если она стимулирует
самостоятельность и творческую активность учащихся.

Качество вопросов определяется характером умственных действий, которые
выполняют учащиеся при ответе на вопрос. Поэтому среди проверочных
заданий выделяют вопросы, активизирующие память (на воспроизведение
изученного), мышление (на сравнение, доказательство, обобщение), речь.
Большое значение имеют проблемные вопросы, которые заставляют применять
полученные знания в практической деятельности.

Качество устной проверки зависит от подбора, последовательности и
постановки вопросов, которые предлагаются, во-первых, каждый вопрос
должен быть целенаправленным и логически завершенным, а, во-вторых,
должен быть предельно сжатым, лаконичным и точным.

Второй составной частью устной проверки является ответ учащегося на
вопросы. В дидактической литературе выделяются два условия качественного
выявления знаний учащегося:

ученику никто не мешает (преподаватель и аудитория комментируют ответ
потом);

создается обстановка, которая обеспечивает наилучшую работу его
интеллектуальных сил.

Прерывать ученика можно только в том случае, если он не отвечает на
вопрос, а уклоняется в сторону. При оценке ответа ученика обращают
внимание на правильность и полноту ответа, последовательность изложения,
качество речи.

Приемы устной проверки используются на различных этапах урока. Выбор тех
или иных приемов во многом предопределяется целью и логикой урока.

1.2.2 Проверка письменно – графических работ

Вторым широко применяемым методом контроля в обучении является проверка
письменно – графических работ. Этот метод имеет свои качественные
особенности: большая объективность по сравнению с устной проверкой,
охват нужного числа проверяемых, экономия времени. Применение письменных
работ используется для:

проверки знания теоретического материала;

умения применять его к решению задач;

контроля сформированных навыков.

В методике письменно – графических работ выделяют четыре основных этапа,
которым надо уделять внимание, это подготовка, организация, проведение,
анализ результатов.

При подготовке нужно: вычленить цель проверки, отобрать содержание
объектов проверки, составить проверочные задания. Большую помощь при
этом оказывают учебно – методические пособия, образцы проверочных работ
в журналах.

При организации проверочной работы учащимся сообщается, какие задания
им предназначены, как озаглавить работу, как оформить решение, время
выполнения работы. При этом следить за самостоятельностью выполнения
работы каждым учеником.

Анализ ответов учащихся эффективен тогда, когда он проводится по
определенным схемам (схемам поэлементного анализа). Тщательно
проведенный анализ позволяет глубоко изучить пробелы и достижения
отдельных учеников, выделить типичные ошибки и основные затруднения
учащихся, изучить причины их появления и наметить пути их устранения.

1.2.3 Проверка практических и лабораторных работ

С помощью этого метода получают данные об умении учащихся применять
полученные знания при решении практических задач, пользоваться
различными таблицами, формулами, чертежными и измерительными
инструментами, приборами.

Преподаватель получает отчет ученика, в котором приводится только
результат или схематически описаны план практической работы и ее
результаты. Это несколько затрудняет проверку и оценку каждого действия
ученика. Поэтому на практике в проверочном задании приводится алгоритм
его выполнения, что позволяет осуществить такую проверку правильности
действий ученика. Все работы проверяются, но оцениваются по-разному, по
результатам обзорных работ оценки выставляются, по результатам
тренировочных работ можно выставить лишь положительные оценки.

Таким образом, несколько методов контроля, удачно подобранных
преподавателем в своей образовательной деятельности, позволят достаточно
объективно оценить знания учащихся, проконтролировать то, что было
изучено и сделано за определенный период. Средства, применяемые
преподавателями в своей практике, очень различны.

1.3 Средства контроля

В настоящее время создаются и распространяются такие средства, которые
не требуют больших затрат времени на подготовку, проведение и обработку
результатов. Среди них выделяют машинные и безмашинные средства
проверки.

1.3.1 Безмашинные средства контроля

Среди безмашинных средств проверки наиболее распространены в практике
устный опрос учащихся у доски, проверка учителем тетрадей с домашним
заданием, диктант, самостоятельная и контрольная работы.

1.3.1.1 Проверка домашнего задания

Роль домашних заданий практически обесценивается, если не налажена их
проверка. Преподаватели практикуют разные формы учета. Это и устный
опрос у доски или с места по домашнему заданию, и короткая письменная
работа, но, прежде всего это непосредственная проверка задания в
тетрадях – фронтальная при обходе класса в начале и более основательная,
выборочная во внеурочное время.

Также существует самопроверка по образцу и применяется на первом уроке
после объяснения нового материала. Образец решения домашней работы
записан на доске заранее. Учащиеся рассматривают решение образец и устно
комментируют его, тетради у всех закрыты. Затем открываются тетради и
проверяются свои работы по образцу, подчеркивая ошибки. Этот способ
развивает внимание и выявляет ошибки с помощью образца.

Взаимопроверка с помощью образца используется на следующем уроке. В этом
случае учащиеся проверяют домашнюю работу своего соседа тоже по образцу.
Как и в первом случае, окончательно тетради проверяет преподаватель.

1.3.1.2. Диктант

Диктант может заменить опрос по теме, заданной для повторения. Его
продолжительность обычно 10-20 минут. Он представляет собой систему
вопросов, связанных между собой.

1.3.1.3 Организация самостоятельных работ

При изучении важно, чтобы учащиеся не только знали теоретический
материал, но и умели применять его к решению задач и упражнений,
обладали бы рядом навыков (вычислительными навыками, умениями
преобразовывать выражения и т.д.). Эти умения и навыки могут быть по
настоящему проверены только в письменной работе. Обычно самостоятельные
работы проводятся после коллективного решения задач новой темы и
предшествуют контрольной работе по этой теме.

1.3.1.4. Организация контрольных работ

Контрольная работа может быть кратковременной и долговременной.

Перед проведением контрольной работы необходимо определить объект
контроля, цель предстоящей работы и средства контроля. Они должны быть
сообщены учащимся;

В зависимости от вида заданий нужно продумать, каким образом ученик
должен их оформить;

Учитель должен продумать что он отнесет к недочетам, а что к ошибкам, из
этого будет складываться оценка. Критерии оценки хотя бы в общих чертах
должны быть известны учащимся;

Контрольная работа должна быть посильной для всех учащихся без
исключения. Сильным ученикам нужно дать задания труднее;

Каждой контрольной работе должна предшествовать самостоятельная работа с
аналогичными упражнениями;

Анализ контрольной работы необходимо проводить сразу, для этого
необходимо завершать работу за несколько минут до окончания. Желательно
фрагменты решения разобрать сразу после написания работы, потому что на
следующий день или позже учащиеся уже теряют интерес к содержанию работы
и многие интересуются только оценкой;

Обязательно нужно проводить количественный и качественный анализ
контрольной работы.

1.3.2 Машинные средства проверки

Для контроля знаний учащихся используют персональный компьютер. Для
контроля знаний учащихся удобно применять типовые расчеты, которые
включают наиболее характерные задания базового курса [3].

В дальнейшем будем говорить о машинных средствах контроля знаний, и, в
частности, о тестировании с применением средств вычислительной техники.

1.4 Компьютерное тестирование

Идея компьютерного тестирования напрямую проистекает от идеи
программированного контроля знаний. Программированный контроль знаний, в
свою очередь, явился неизбежной реакцией на некоторые проблемы прежде
всего высшего образования в России. Собственно, примерно те же проблемы
распространяются и на школьное образование, но последнее, в силу
традиционной косности, очень слабо восприимчиво к новым технологиям.

Основной проблемой любого образования (и не только российского, кстати),
является отсутствие четкого контроля за качеством усвоения материала.
Причем если в школьной практике учитель еще более-менее имеет
возможность с определенной периодичностью проверять уровень текущих
знаний ученика, то в ВУЗе преподаватель целый семестр выдает материал и
лишь в конце семестра убеждается в уровне его усвоения. Само собой, в
системе высшего образования подразумевается, что студенты должны в
достаточной степени заниматься и самостоятельным образованием, однако,
это предполагаемое самостоятельное получение знаний остается целиком и
полностью на совести студента, и преподаватель абсолютно не может знать,
кто именно из студентов хоть что-то делает самостоятельно. С получением
большим числом обучаемых доступа в Internet положение усугубилось еще и
тем, что теперь даже сдача рефератов не подразумевает абсолютно никакой
работы с информацией; частенько студенты даже не считают нужным целиком
прочесть то, что распечатывают из Сети [4].

Необходимость систематического контроля за усвоением материала сомнений
не вызывает. Прежде всего это давало бы экономию времени преподавателя,
который при отсутствии обратной связи вынужден или повторять положения,
которые студентами давно усвоены, или излагать положения, основанные на
фактах, плохо усвоенных студентами. Во вторую очередь, систематический
контроль за уровнем знаний учащихся стимулирует повышение качества
обучения за счет усиления акцента на трудных для усвоения положениях и
повышения ответственности обучаемых за результаты самостоятельной работы
(в случае, естественно, когда преподаватель в этом заинтересован).

Важным моментом систематического программированного контроля знаний
является его объективность, что обусловлено переносом акцента с
карательной функции на информативную. Только в таком случае учащийся не
будет бояться контроля и изобретать способы получения повышенной оценки,
и только в таком случае преподаватель будет получать реальную картину
знаний учащегося.

Технически программированный контроль знаний прост – учащимся выдается
некий бумажный носитель (расцвет программированного контроля вызвал к
жизни релейно-ламповых “электронных” монстров, которые по сей день можно
видеть на экзаменах по сдаче на водительские права), на котором записаны
вопросы и варианты ответов, один (или несколько) из которых являются
правильными. Учащемуся остается лишь расставить крестики против
правильных ответов.

Подобная технология позволила совершить качественный скачок в
осуществлении обратной связи между преподавателем и студентом.
Программированный контроль, состоящий из 8-10 вопросов, проводится за
очень короткий срок – от 5 до 10 минут, и при этом преподаватель может
получить полноценную информацию об усвоении пройденного материала всей
учебной группой одновременно. Кроме того, техническая реализация
программированного контроля позволила полностью избежать списывания,
давая возможность предложить каждому учащемуся свой вариант
программированной карты.

Недостатком программированного контроля в его до-компьютерном виде
являлась высокая трудоемкость создания программированных карт, которые
(в идеале) требовались на каждое занятие, и сложность их последующей
обработки. С появлением компьютерных технологий у преподавателей
появилась возможность резко снизить трудоемкость и подготовки контроля,
и обработки результатов.

Выделяют пять общих требований к тестам:

валидность;

определенность (общепонятность);

простота;

однозначность;

надежность.

Валидность теста – это адекватность. Различают содержательную и
функциональную валидность: первая – это соответствие теста содержанию
контролируемого учебного материала, вторая – соответствие теста
оцениваемому уровню деятельности.

Выполнение требования определенности (общедоступности) теста необходимо
не только для понимания каждым учеником того, что он должен выполнить,
но и для исключения правильных ответов, отличающихся от эталона.

Требование простоты теста означает, что тест должен иметь одно задание
одного уровня, т.е. не должен быть комплексным и состоять из нескольких
заданий разного уровня. Необходимо отличать понятие “комплексный тест”
от понятия “трудный тест”. Трудность теста принято характеризовать
числом операций P, которое надо выполнить в тесте: P 2. Интеллектуальное тестирование В понятие «искусственный интеллект» вкладывается различный смысл — от признания интеллекта у ЭВМ, решающих логические или даже любые вычислительные задачи, до отнесения к интеллектуальным лишь тех систем, которые решают весь комплекс задач, осуществляемых человеком, или еще более широкую их совокупность. Можно выделить две основные линии работ по искусственному интеллекту (ИИ). Первая связана с совершенствованием самих машин, с повышением "интеллектуальности" искусственных систем. Вторая связана с задачей оптимизации совместной работы "искусственного интеллекта" и собственно интеллектуальных возможностей человека. Идея создания мыслящих машин "человеческого типа", которые, казалось бы, думают, двигаются, слышат, говорят, и вообще ведут себя как живые люди, уходит корнями в глубокое прошлое. Еще древние египтяне и римляне испытывали благоговейный ужас перед культовыми статуями, которые жестикулировали и изрекали пророчества (разумеется, не без помощи жрецов). В средние века и даже позднее ходили слухи о том, что у кого-то из мудрецов есть гомункулы (маленькие искусственные человечки) - настоящие живые, способные чувствовать существа [2]. В настоящее время роботы, системы распознавания образов, экспертные системы и т.д. вызывают у непосвященного тот же трепет и восторг перед «думающей» машиной. Но не зря в свое время были заморожены некоторые исследования в области ИИ. Попытки создать машинный разум не удавались, и раз за разом энтузиазм ученых угасал, так как существующие на тот момент вычислительные средства не позволяли хотя бы приблизительно воссоздать взаимодействие нейронов головного мозга. Появление многопроцессорных систем и увеличение количества команд микропроцессоров и его тактовой частоты позволяет сейчас, на мой взгляд, «построить» приближенное мышление человека с использованием параллельных процессов и нейронных сетей. Обращаясь к проблеме роли ИИ в обучении и образовании, будем рассматривает этот процесс как одну из разновидностей взаимодействия человека с ЭВМ, и раскрывать среди перспективных возможностей те, которые направлены на создание так называемых адаптивных обучающихся систем, имитирующих оперативный диалог учащегося и преподавателя-человека. 2.1 Методы и модели Интеллектуальное тестирование предполагает наличие модели знаний, модели самого процесса тестирования и оценивания. Так можно охарактеризовать в общем все разработки в этой области. Рассмотрим некоторые из них более подробно. 2.1.1 Модели распознавания образа уровня знаний Традиционная Российская система оценивания знаний обучаемых основана на лингвистических оценках, по которым устанавливается стипендия, производится учет успеваемости, проставляются записи в зачетных книжках за период обучения и др. Вместе с тем, такая новая образовательная процедура как образовательное тестирование по альтернативному признаку предполагает оценивание уровня знаний в диапазоне от нуля до ста, что порождает проблему распознавания лингвистического образа знаний по результатам такого образовательного тестирования. Под образом уровня знаний понимаются обучаемые, принадлежащие к множеству (группе), знания которых по “эталону уровня знаний” отнесены к лингвистическим оценкам неудовлетворительно (D), удовлетворительно (C), хорошо (B), отлично (A). Под распознаванием образа уровня знаний понимается процедура принятия решения о принадлежности конкретного обучаемого к одному из указанных образов на основании сравнения его образовательных достижений при тестировании с характеристиками образа. При тестировании по альтернативному признаку используется закрытая форма теста, характеристиками которой являются: функция плотности распределения неправильных ответов f(d), приемлемый уровень неправильных ответов q0, неприемлемый уровень неправильных ответов q1, риск заниженной оценки знаний a, риск завышенной оценки знаний b, функция оценивания знаний f(Q), объем образовательной информации N, объем выборки заданий теста n и критерий принятия решений в виде предельного числа неправильных ответов K. Перечисленные характеристики являются взаимозависимыми, но не обладающими достаточным свойством четкости. В условиях их нечеткости для распознавания образа уровня знаний обучаемых вполне допустимо для нормально реализованной образовательной услуги принять модель распределения неправильных ответов по закону редких случайных событий Пуассона и функцию оценивания уровня знаний сформировать по этому же закону [8]. Поскольку образовательная информация в банке заданий теста N в их выборке n представляется как статистическая совокупность, а задания теста обучаемому в компьютерном варианте всегда для выполнения выдаются последовательно, то для распознавания образа уровня знаний возможно воспользоваться последовательным критерием Вальда. При этом примем дополнительное принципиальное условие, что задания теста однородны по количеству образовательной информации по конкретной учебной дисциплине, поскольку аналитических методов классификации заданий по мере их сложности или трудности пока не разработано. Будем обозначать гипотезу о приемлемом уровне знаний H0, а гипотезу о неприемлемом уровне знаний H1. Пусть в результате последовательного поступления заданий теста в объеме n получены неправильные ответы d1, d2, d3…dn. При известной функции оценивания знаний по закону Пуассона последовательный критерий Вальда позволяет по выборке объемом n классифицировать обучаемых по уровню знаний на три подобраза по количеству областей принятия решений. Для того, чтобы иметь четыре образа необходимо произвести для каждой из трех областей повторное последовательное тестирование [7]. В предлагаемой процедуре рекомендуется использовать два способа распознавания образа уровня знаний: нормальный и усиленный. При этом задаются только четыре исходные характеристики теста q1, q0, a и b. По нормальному способу по первой выборке заданий теста n1 производится классификация обучаемых на три предварительные области (уровни): низкая, нормальная и высокая. По второй выборке заданий теста n2=n1 или n2

2.1.6 Абсолютная временная шкала измерения знаний Знания являются абсолютной субстанцией: они либо есть, либо их нет. По крайней мере, так считается в любой форме традиционного оценивания знаний — как на выпускных экзаменах в школах, так и на вступительных экзаменах в вузы. Поэтому интересно проанализировать возможности абсолютных шкал оценки и при переходе к измерению знаний на основе тестов. В данных исследованиях изучаются возможности так называемой «абсолютной временной шкалы оценивания знаний». Формулируются ее принципы. Формулируются этапы последовательного перехода от традиционной формы экзаменов к тестовой форме этого подхода, на их основе – требования к созданию тестовых материалов этого подхода. Анализируется опыт использования данного подхода на вступительных экзаменах в Тверском государственном университете на протяжении 4-х лет. Изучается диагностический потенциал данного подхода. Формулируется принцип «трехуровнего абстрагирования» для диагностических тестирований. Ниже показана «диаграмма знаний» по математике, полученная в результате обработки данных тестирования выпускников одной из школ г.Твери (75 учащихся). Здесь цифры по окружности – номера тем по математике, по радиусам отложена «успешность ответов» учащихся по той или иной теме. Как видно, тестирование с использованием абсолютной шкалы оценки имеет ценность диагностическую даже более, чем для итоговых экзаменов. Изучается уровень достоверности результатов компьютерного тестирования в данном подходе и соотношение «случайного» и «достоверного» в итоговой оценке. На рисунках приведена зависимость (в данном подходе) итоговой оценки по математике от времени тестирования: Как видно, за все время тестирования (40 минут) в первые 15 минут (первые 4 задания по математике) оценка менялась наиболее заметно. За последние же 10 минут итоговая оценка изменялась не более чем на 10 баллов — доля «случайного» в итоговой оценке. Таким образом, при использовании абсолютной шкалы данного подхода существует возможность ответить на вопросы: 1) существует ли предел, к которому сходится итоговая оценка с увеличением времени тестирования (или количества заданий теста); 2) какова погрешность «измерения знаний» если прервать тестирование в некоторый определенный момент, например через 40 минут. Еще одно очевидное преимущество абсолютной шкалы оценивания – итоговая оценка появляется на экране компьютера сразу же после выполнения теста испытуемым [15]. 2.1.7 Методика статистического анализа качества обучения Предлагаемая методика основывается на том, что учебный процесс является частным случаем технологического процесса и ему должны быть свойственны такие же методы анализа, какие приняты для производственных процессов. Однако слепо перенести подобные методики нельзя, особенно это касается содержательного анализа процесса. Для того чтобы проанализировать учебный процесс нужно иметь, во-первых, критерий качества обучения, а, во-вторых, проследить его изменение во времени. В качестве наиболее информативного критерия качества обучения следует использовать степень обученности учащихся — СОУ. Этот критерий основан на статистике полученных учащимися оценок за выполнение отдельных заданий или контрольных работ. Оценки входят в СОУ с «весом» равным интегралу вероятности получения данной оценки для некоторого «типового» распределения оценок. В качестве такого «типового» распределения используется стандартное распределение Гаусса с параметрами: среднее значение оценки — 4 и стандартное отклонение — 1,39 /1/. Такое распределение обладает одним особым свойством: для этого распределения значения СОУ и качественной успеваемости совпадают и составляют 0,64. Это свойство выделяет «типовое» распределение среди других распределений со средней оценкой 4. Расчеты для «типового» распределения показывают, что если СОУ больше 0,76, то обученность «отличная», если СОУ от 0,5 до 0,76, то обученность «хорошая», если СОУ от 0,24 до 0,5, то обученность «удовлетворительная», если менее 0,24, то «неудовлетворительная». Для оценки изменения СОУ во времени используется известная в математической статистике методика, связанная с критерием «3 s». Согласно этой методике, если какой либо процесс идет нормально, то отдельные значения должны укладываться в интервал «3s» относительно среднего значения (s — стандартное отклонение) с определенной точностью. Те значения, которые не укладываются в заданный интервал, являются отклонениями от стандартного распределения. Чем меньше таких отклонений, тем больше соответствие анализируемого распределения стандартному. Что касается применения этой методики для технологических процессов, то ее надо скорректировать — следует учитывать только те значения, которые выходят за нижнюю границу интервала. Если взять отношение числа значений попадающих в интервал «3 s» к общему количеству значений, то такую величину можно назвать коэффициентом стандартности распределения, а в случае рассмотрения учебного процесса — коэффициентом отлаженности учебного процесса (КОУП). Расчеты показывают, что если значение КОУП больше 0,94, то процесс можно считать «отлично отлаженным», если КОУП от 0,84 до 0,94 — «хорошо отлаженным», если КОУП от 0,69 до 0,84 — «почти отлаженным», если менее 0,69 — «не отлаженным». Для общей оценки учебного процесса можно перемножить среднее значение СОУ по предмету за год на КОУП. Полученную величину можно трактовать как фактор качества учебного процесса (ФКУП). Этот фактор имеет большее число градаций, чем СОУ и КОУП. «Отличному» качеству соответствует ФКУП больше 0,71, «очень хорошему» от 0,64 до 0,71, «хорошему» от 0,41 до 0,64, «удовлетворительному» от 0,17 до 0,41 и «неудовлетворительному» менее 0,17. Описанная методика реализована в виде электронной таблицы. Для примера проанализируем учебный процесс по информатике и информационным технологиям в 8 классе. По программе это первый класс, когда начинается систематическое изучение информационных технологий. Кроме того, следует учитывать, что учащиеся переходят от одного учителя к другому и уровень требовательности к ним существенно повышается. В течение учебного года, учащиеся должны выполнить 9 заданий на оценку, при чем первые 4 задания по работе с операционной средой Windows, а остальные 5 по работе с текстовым процессором Word. В таблице представлены результаты для 8 Б класса, который по уровню обученности оказался средним среди 3-х классов в параллели [16]. 2.1.8 Модель адаптивного тестового контроля Процедура тестирования предполагает анализ ответов на последовательность тестовых заданий определенной сложности. Проведем аналогию с поведением поискового алгоритма оптимизации для некоторой гипотетической функция Y, максимум которой необходимо найти. В задачах оценивания по тестированию — это максимум функции уровня знаний. Реализация поискового алгоритма сводится к последовательному анализу локальной окрестности функционала Y, оценки градиента и выбора очередной области исследования. Если при оценке градиента имеют место помехи, то нельзя говорить о сходимости алгоритма. В обычном смысле он сходится вообще не будет, а будет “блуждать” вокруг области экстремума. Аналогично можно поступить в случае тестового контроля. Если ответ правильный, то предполагается, что уровень подготовки студента выше сложности предъявленной задачи и он способен решать задачи заданной сложности, в противном случае — неспособен. Это подобно оценке градиента некоторой гипотетической функции регрессии, в которой градиент сам является случайной величиной. Предлагается использовать следующий подход. Считаем, что если тестируемый решил задание, то у него появляется желание решить более сложное задание. Если нет — то им будет сделана еще одна попытка решения задания той же сложности. Если оно также не решено, то предъявляется задача пониженной сложности. Если сразу не решено менее сложное задание, то к решению предлагается задача меньшей сложности . Аналогично происходит процесс повышения сложности заданий. В результате, если исключить этап обучения при решении задач, студент выберет для себя определенный уровень сложности, вокруг которого и будет размываться сложность заданий. Таким образом, функция «уровня знаний» является преобразованием функции «сложности» задачи через «способность решения задач» определенной «сложности». В этом высказывании термины «уровень знаний», «способность решения задач» и «сложности» носят нечеткий характер. Поэтому для формализации этих понятий целесообразно использование аппарата нечетких множеств. Кроме того, в указанной постановке заметна разница между «сложностью» и «способностью решения задач». Понятия «сложность» и «уровень знаний» — это некоторые нечеткие переменные (только переменные, хотя они и задаются функцией), в то время как «способность решения задач» является нечетким отношением нечетких переменных «сложности» и «уровня знаний». Количество баллов также является переменной, однако эта переменная может не анализироваться, поскольку является преобразованием «уровня знаний». При моделировании ответов в настоящее время наиболее развит анализ IRT теории, которая использует для моделирования вероятностей правильных ответов логистическую кривую. Проведен сравнительный анализ логистического и нормального распределений. Показано, что рассматривая логистическое распределение очень хорошо аппроксимируется нормальным. В свою очередь нормальный закон является предельным случаем биномиального распределения. Этот факт можно формально интерпретировать так, что «уровень знаний» является долей решенных задач, так как число решенных из общего числа задач при заданной вероятности решения подчинено биномиальному распределению. Далее предполагается, что сложность задания задана некоторым числовым значением, и в результате выполнена формализация процесса тестирования в виде марковской цепи, в которой вероятности переходов по сложностям определяются на основании логистической кривой. Предполагается, что ответы на задания — независимые величины. Поэтому используется однородная марковская цепь, где состояниями цепи являются меры сложности заданий. Показано, что для построенной цепи существует единственное, не зависящее от начального состояния, стационарное распределение. Найдено аналитическое решение стационарных вероятностей. Увеличивая дискретизацию сложности, т.е. увеличивая количество состояний марковской цепи показана сходимость к непрерывному распределению. Найдено предельное распределение, которое используется для визуализации преобразований «сложности» в «знание». На практике наиболее естественны случаи, когда оценки имеют постоянную дисперсию или постоянный коэффициент вариации. Постоянный коэффициент вариации объясняется увеличением неопределенности при возрастании «уровня знаний». Постоянная дисперсия может использоваться, когда изменение уровня знаний невелико. Для постоянной дисперсии показано, что преобразование носит экспоненциальный характер. Экспоненциальная функция монотонная и большим значениям функции «уровень знаний» соответствуют большие значения плотности распределения «сложности» решаемой задачи. Соответственно максимум плотности приходится на максимум целевой функции. Для постоянного коэффициента вариации (g) показано, что преобразование описывается степенной функцией, а при g=1 функция плотности вероятности с точностью до постоянного множителя на всей области определения совпадает со средним значением функционала. Таким образом, если есть мера «сложности» задания, то определена и мера «уровня знаний» и она совпадает с плотностью распределения адаптивного алгоритма тестирования. Если предположить существование функционала «знаний» Y, то стационарные вероятности марковской цепи являются монотонным преобразованием Y. Однако Y неизвестен и этот функционал можно подменить стационарными вероятностями. Такая замена основывается на том, что в поисковом алгоритме при оценки градиента по оценке значений функционала, стационарные вероятности полностью повторяют функционал [17]. 2.1.9 Концептуальная модель адаптивного тестового контроля знаний Была предложена концептуальная модель, состоящая из следующих блоков. 2.1.9.1 Блок целей обучения Цели обучения определяют успешность процесса обучения. Поэтому их содержание, конкретная формулировка являются важнейшим шагом в технологическом конструировании учебного процесса. Цели образовательной системы в целом определяются законом об образовании. Цели данного учебного заведения определяются Уставом этого учреждения. При формировании целей обучения в рамках учебного предмета основная задача учителя заключается в следующем: по каждому разделу и теме учебной программы он должен определить степень успешности освоения учеником требуемых знаний, умений, и навыков, учесть проявляемое отношение к предмету и на основании этого определить комплекс учебных целей. 2.1.9.2 Блок содержания В соответствии с концепцией адаптивного тестового контроля было рассмотрено содержание непрерывного курса информатики с 1 по 11 кл. и структурировано на модули. Обучающий цикл должен обеспечивать последовательную ориентацию обучения на намеченные цели. Благодаря такому строению учебный процесс приобретает “модульный” характер. В гуманитарно-естественном лицее N41 г. Ижевска разработана учебная программа по предмету “Основы информатики и вычислительной техники” (ОИВТ), построенная на модульном принципе, который позволяет в максимальной степени учесть быстро меняющееся содержание, дифференциацию учебных классов и учащихся. Созданная модель содержания курса информатики и представленная в виде образовательных модулей позволяет разработать план теста и его спецификацию по каждому модулю курса с учетом требований образовательного стандарта по школьному курсу информатики. Для оценки изучаемого объема знаний предлагается составить тезаурус –толковый тематический словарь понятий. Для контроля знаний учащихся методистами ИУУ и учителями информатики в роли экспертов проводился анализ и экспертиза качества созданных в лицее педагогических тестов по анкетной форме согласно разработанной инструкции. Были определены основные проблемы при конструировании и применении адаптированных тестовых измерителей: модульный принцип структурирования содержания курса информатики, создание плана и спецификации тестов с выделением структурных единиц в виде “учебных единиц”, повышение содержательной валидности тестовых заданий, надежности результатов тестирования учащихся, предварительная диагностическая оценка уровня обученности и тестирование с применением адаптивных тестов для индивидуального точного определения уровня обученности. 2.1.9.3 Блок измерения 1) Таксономическая модель адаптивного контроля знаний определяет таксономию учебных целей в когнитивной области. Один из подходов к описанию целей обучения состоит в указании уровней, ступеней, которых достигает ученик по мере овладения знаниями. Выделяются шесть иерархических ступеней по B.S.Bloom: узнавание, понимание, применение, анализ, синтез, оценка. Формулирование целей обучения можно производить с помощью системы требований к качеству знаний. К двум наиболее известным в мировой литературе классификациям знаний и способностей B.S.Bloom и R.M.Gagne. B.C.Аванесов добавляет свой перечень видов знаний, которые сформулированы исключительно для решения задач педагогического измерения. Объективные и адекватные измерителя успешности обучения - тесты, задачи, упражнения, контрольные задания, контрольные работы, компьютерное моделирование - могут быть использованы на всех уровнях иерархии учебных целей. Самый распространенный способ описания целей обучения состоит в указании качеств знаний, которыми должны обладать учащиеся в результате обучения. Такой подход обоснован в трудах известных советских дидактов: М.И.Зарецкого, И.Я.Лерненра, И.Т.Огородникова, Е.И.Перовского, М.Н.Скаткина. Руководством к выбору целей обучения является раскрытие содержания качеств знания. Полнота знаний определяется количеством знаний об изучаемом объекте, входящих в школьную программу, глубина - совокупностью осознанных знаний об объекте. Полнота и глубина знаний - связанные, но не тождественные качества. Полнота допускает изолированность знаний друг от друга, глубина же, напротив, предполагает наличие осознанных существенных связей, в разной степени опосредованных. 2) Математическая модель адаптивного контроля знаний определяет уровень обученности учащихся в зависимости от трудности заданий. Теоретической основой адаптивного контроля является теория IRT в сочетании с дидактическим принципом индивидуализации обучения. Целям дифференциации обучаемых служит построение индивидуальных кривых испытуемых по двухпараметрической модели A.Bimbaum. В рамках классической теории тестов уровень знаний испытуемых оценивается с помощью их индивидуальных баллов, преобразованных в те или иные производные показатели. Это позволяет определить относительное положение каждого испытуемого в нормативной выборке. Другой подход к созданию педагогических тестов и к интерпретации результатов их выполнения представлен в так называемой современной теории педагогических измерений Item Response Theory (IRT), получившей широкое развитие в 60-е - 80-е годы в ряде западных стран. К исследованиям последних лет в этом направлении относятся труды B.C.Аванесова, В.П.Беспалько, Л.В.Макаровой, В.И.Михеева, Б.У.Родионова, А.О.Татура, В.С.Черепанова, Д.В.Люсина, М.Б.Челышковой, Т.Н.Родыгиной. Е.Н.Лебедевой и др. К наиболее значимым преимуществам IRT относят измерение значений параметров испытуемых и заданий теста в одной и той же шкале, что позволяет соотнести уровень знаний любого испытуемого с мерой трудности каждого задания теста. Именно на этом свойстве оценок параметров испытуемых и заданий основана организация современного адаптивного контроля знаний. Критики тестов интуитивно осознавали невозможность точного измерения знаний испытуемых различного уровня подготовки с помощью одного и того же теста. Это одна из причин того. что в практике стремились обычно создавать тесты, рассчитанные на измерение знаний испытуемых самого многочисленного, среднего уровня подготовленности. Естественно, что при такой ориентации теста знания у сильных и слабых испытуемых измерялись с меньшей точностью. 3) Автоматизированный контроль знаний с применением компьютера и обработка результатов тестирования на ЭВМ для определения параметров качества тестирования. 2.1.9.4 Блок адаптивного обучения 1) Модели обучения. Информационные технологии оказывают решающее влияние на все этапы процесса обучения: от предоставления учащимся знаний, умений и навыков до контроля их усвоения, при этом обеспечиваются такие важнейшие характеристики обучения, как качество, избирательность материала, учет индивидуальности, постоянный контроль и самоконтроль усвояемости материала, высокий эффект использования ресурсов учителей. Конгресс Юнеско подтвердил это положение и предложил рассмотреть различные модели использования информационных технологий в компьютерных приложениях и способы организации работы учащихся такие, как классно-урочная модель, проектная и индивидуальная. 2) Педагогические технологии. Технологический подход к учебному процессу гарантирует достижение поставленных целей обучения. Оперативная обратная связь которая пронизывает весь учебный процесс, является основой последовательной ориентации обучения на цели. Таким образом, отличительными особенностями технологического конструирования учебного процесса являются: • конкретизация целей обучения в когнитивной области, разработка учебных единиц как эталонов усвоения учебного материала всеми учениками в классе; • создание системы проверочных работ (диагностических тестов, адаптивных тестов); • выбор быстрых способов проверки тестов (компьютерные программы); • подготовка специальных методов корректирующей методики (краткие конкретные тексты, содержащие необходимые теоретические сведения, тренажеры); • дополнительные задания, повторные тесты. Весь учебный процесс пронизан возможностями адаптации к индивидуальным особенностям обучающихся в условиях коллективного обучения. Переход к развивающему обучению без адаптации к индивидуальным особенностям учащихся практически невозможен. Именно во время индивидуального контакта учителя с учеником важно иметь инструмент для контрольного тестирования уровней обученности. Контроль проводится учителем и не влияет на оценку, он позволяет увидеть состояние обученности каждого и внести соответствующие коррекции в учебный процесс. Важно знать заучил, усвоил ли ученик базовый минимум. Остальной материал прорабатывается с ориентацией на непроизвольное запоминание, расширяющее возможности каждого ученика, занятого активной творческой деятельностью[2]. Исходный тест по предложенному модулю, оцененный экспертами, предназначен для предварительного тестирования групп учащихся с целью приближенного определения уровня обученности группы по соответствующему модулю курса. Обработка результатов тестирования была проведена по IRT, определялась групповая адаптивность, на соответствие среднего догита трудности заданий теста Вср. и среднего логита обученности испытуемых Qcp. по выражению: Агр=1- [Qcp. - Вер.] Групповая адаптивность Агр.=1 при идеальном соответствии Вер. и Qcp. Результаты предварительного тестирования группы учащихся имеют значения Агр. далеко не равными единице, поэтому следующим шагом является изменение значения групповой адаптивности путем исключения из теста “неработающих” заданий в этой группе тестируемых с Bj“0 и определение уровня обученноети каждого испытуемого, а также получения в этом случае индивидуальных характеристических кривых испытуемых. В дальнейшем определяется истинный балл как сумма всех вероятностей ответов каждого испытуемого на каждое задание теста и оценивается уровень знаний. Таким образом, появляется возможность для данного испытуемого выбирать соответствующий его уровню набор тестовых заданий и испытуемые могут быть протестированы тестами составленными индивидуально для них. Для группы тестируемых создаются адаптивные тесты, имеющие разную длину и время выполнения для сильных, слабых и средних учащихся данной группы. Такой процесс требует компьютерной технологии создания, хранения тестов, проведения тестирования и обработки результатов тестирования. Для обработки результатов тестирования исходного и адаптивного тестов создана программа, позволяющая определить такие параметры как: надежность, погрешность измерения,, корреляция, определение значений информационной функции и др. По сути, эта технология дает начало новой организации как тестового контроля знаний, так и учебного процесса в целом, на более высоком научном уровне. В классно-урочной форме обучения этот принцип не мог быть реализован в каких-нибудь заметных масштабах из-за отсутствия требуемых для этого программно - педагогических и программно - инструментальных средств. В условиях массового образования адаптивное обучение дает возможность эффективной практической реализации принципа индивидуализации обучения. В качестве доказательств ценности полученных результатов исследования, подтверждающих выдвинутую гипотезу, состоящую в том, что применение адаптированных тестовых измерителей позволит повысить объективность в оценке индивидуального уровня обученности учащихся за счет снижения погрешности измерения в выборке учащихся, адаптивной предлагаемым трудностям тестовых заданий; можно привести следующие факты: 1) разработанный комплект тестовых заданий и рекомендованный кафедрой естественнонаучных дисциплин ИУУ УР для оценки усвоения знаний учащихся общеобразовательной школы по предмету “информатика”, применялся для текущего и итогового контроля знаний учащихся общеобразовательных учреждений; 2) применение адаптивных тестов для контроля знаний учащихся приводит к более точной оценки уровня знаний испытуемых с использованием меньшего количества тестовых заданий по сравнению с обычным тестированием за счет снижения погрешности измерения в выборке учащихся, адаптивной предлагаемым трудностям тестовых заданий; 3) эффективные тестовые измерители позволяют определить уровень обученности каждого испытуемого после изучения модуля курса и определить индивидуальную динамику развития учащегося по окончанию изучения всего курса; 4) в лицее, где с 1996 г. применяется адаптивное обучение, а позднее с 1998г. внедряется адаптивный тестовый контроль знаний учащихся, полученные результаты обученности учащихся характеризуются такими уровнями в когнитивной области как анализ, синтез, что обеспечивает прекрасный потенциал для их дальнейшего успешного развития в творческой эвристической оценочной деятельности (участие в олимпиадах, турнирах, научно-исследовательских конференциях и др.). 2.1.9.5 Блок системы мониторинга. Под мониторингом в системе “учитель-ученик” мы понимаем совокупность контролирующих и диагностирующих мероприятий, обусловленных целеполаганием процесса обучения и предусматривающих в динамике уровни усвоения учащимися материала и его корректировку. Иначе говоря, мониторинг - это непрерывные контролирующие действия в системе “учитель-ученик”, позволяющие наблюдать (и корректировать по мере необходимости) продвижение ученика от незнания к знанию. Мониторинг - это регулярное отслеживание качества усвоения знаний и умений в учебном процессе. Мониторинг отличается от обычной оценки знаний тем, что обеспечивает учителя оперативной обратной связью об уровне усвоения учащимися обязательного учебного материала. Система мониторинга включает в себя создание непосредственно инструментов контроля знаний и умений и корректирующую методику, ориентированную непосредственно на личность школьника с учетом его индивидуальных достижений в учебном процессе [18]. 2.1.10 Технология рейтинговых исследований качества образования с применением нейронных сетей Основными компонентами процесса оценки качества образования являются[ сбор исходных данных и получение результирующей информации о состоянии системы образования. Ежегодный аналитический доклад «Качество образования в выявим учебном заведении» предполагает получение данных по более чем десяти направлениям. Для выполнения аналитических отчетов и мер по повышению качества образования необходимо проведение результирующих «интеллектуальных» обработок исходных данных Задача определения качественного уровня вуза (его рейтинга) является одним из основных направлений таких обработок. В информационной системе мониторинга качества образования (ИСМО), создаваемой в Брянском государственном техническом университете, разрабатывается информационная технология рейтинговых исследований качества образования на основе применения нейронных сетей. Программный комплекс нейрокомпьютерной обработки применяется в качестве одного из модулей финишной обработки информации. Выходная информация работа! такого модуля - вычисленные «рейтинги качества» для каждого вуза. Исследования проводятся по следующим основным направлениям: классификация - определение принадлежности каждого вуза к конкретной группе качества. На первом этапе выявляются основные тенденции в образовании, такие, как уровень разрыва в качестве образования, плотность распределения объектов мониторинга по группам качества. При этом возможны следующие варианты реализации первого этапа: глобальная кластеризация — предполагает наличие в исходной выборке данных по отечественным и зарубежным вузам; федеральная кластеризация - наличие в выборке данных по вузам из подчинения Министерства образования Российской Федерации; отраслевая кластеризация - выборка состоит из данных по однотипным вузам (техническим, педагогическим, медицинским, и т. д.); региональная кластеризация - выборка по вузам определенного региона. Для адекватности кластерных исследований периодичность их проведения должна быть достаточно большой. На этапе классификации исходные данные но каждому вузу подаются на входы обученной нейронной сети, после чего определяется «рейтинг качества» данного вуза. Многие параметры, по которым происходит опенка качества образования, подвержены динамическим изменениям. Поэтому определение рейтинга качества образования в информационной системе будет выполняться ежеквартально. Ряд последовательных операций на каждом этапе определяет облик соответствующей информационной технологии. Информационная технология этапа кластерных исследований определяется следующими операциями: получение исходных данных для проведения исследований с сервера информационной системы (отдельно для каждого этапа реализация); проведение кластерных исследований посредством самоорганизующейся карты Кохонена; идентификация «групп качества образования», на которые было разбито исходное множество учебных заведений; присвоение «рейтингов качества» каждой «группе качества». Завершающая операция на данном этапе может дать заключение о глобальных тенденциях в качестве образования и являться основанием для проведения мероприятий организационно-управленческого плана. Такой тенденцией может быть, например, резкое увеличение количества объектов в группах с низким рейтингом качества В ИСМО в основу технологии классификации положено использование многослойной нейронной сети, обучаемой по методу обратного распространения ошибки. В данном случае технологический облик этапа определяется особенностями процесса обучения нейронной сети и состоит из следующих операций: формирование исходной выборки для обучения нейронной сети, в которой на входы нейронной сети подаются параметры качества образования, а на выходы-рейтинги качества; подача на входы сети нового примера, соответствующего вузу, рейтинг которого определяется; выполнение предыдущей процедуры для всех вузов, включенных в систему мониторинга. Выполнение первого этапа, на котором генерируются примеры для обучения нейронной сети, может основываться на методе экспертных оценок. Функционирование информационной системы происходит в полуавтоматическом режиме. На персонал информационной системы возлагается обязанность пополнения базы данных параметров оценки качества образования. Текущая обработка по этапу классификации может изменять рейтинг качества конкретного вуза, но не меняет картину качества в целом. Этим определяется небольшой период проведения итоговых обработок по этому этапу. Итоговые обработки; проводимые в рамках кластерных исследований, способны изменить общую картину качества [25]. 2.2 Собственные разработки В результате трехлетней работы были разработаны некоторые методы автоматизированного контроля совместно с преподавателями кафедры «СУ и ВТ» Калининградского Технического Университета, созданы реализации теоретических выкладок, о которых хотелось бы рассказать в этой работе. 2.2.1 Тестирование по методу цепочек вопросов Автоматизированная система контроля знаний, созданная как результат выпускной квалификационной работы и дипломного проектирования в подсистеме «Создание теста» предлагает преподавателю использовать цепочную систему вопросов, когда несколько вопросов объединяются в фиксированную последовательность (цепочку) по некоторому смысловому признаку, определяемому преподавателем, а каждому вопросу в цепочке присваивается некоторый коэффициент важности данного вопроса в данной цепочке. Этот коэффициент изменяется от 0 и сумма коэффициентов вопросов в цепочке принимается равной 1. Смысл коэффициента раскрывается при обработке результатов тестирования: оценка за ответы на вопросы, объединенные в цепочку, выставляется в зависимости от важности вопросов, на которые были даны правильные ответы . Цепочка может содержать неограниченное число вопросов, объединенных по семантическому признаку внутри выбранной темы тестирования. Вырожденным случаем цепочной структуры является наличие в цепочке всего лишь одного вопроса. В этом случае коэффициент его важности, очевидно, устанавливается равным единице. Хочется отметить, что тест, как правило, создается по отдельной теме конкретной дисциплины, должен иметь небольшой объем, что обуславливается неразделяемостью ресурсов персонального компьютера и необходимостью проводить тестирование большого количества обучаемых в течение ограниченного времени. 2.2.2 Автоматизированный контроль знаний по методике уточняющих вопросов Концепция базируется на автоматизации методики уточняющих вопросов, широко используемой в педагогической практике для выявления глубины знаний обучаемого. Относительная важность задаваемых вопросов определяется их весовыми коэффициентами, учитываемыми при подведении результатов тестирования. При подготовке к тестированию преподаватель имеет возможность определять или корректировать относительную важность каждого вопроса, устанавливать объем теста N, задавать время, отводимое экзаменуемому на демонстрацию своих знаний, и настраивать оценочную шкалу, по которой суммарный балл, набранный в ходе тестирования, переводится в итоговую оценку. В ходе автоматизированного тестирования экзаменуемому предъявляется конечное множество т.н. цепочек вопросов. Каждая цепочка представляет собой последовательность близких по тематике вопросов, формулируемых для уточнения знаний экзаменуемого. Очередной вопрос в цепочке задается только после получения ответа на предыдущий вопрос. В зависимости от стратегии тестирования, избираемой организатором контроля знаний, очередной вопрос в цепочке может предъявляться до первой ошибки (“строгий” преподаватель), либо экзаменуемому предоставляется возможность демонстрировать максимум знаний, отвечая на все вопросы данной тематической последовательности. Каждому j-му вопросу в i-й цепочке присваивается весовой коэффициент Кij, характеризующий его относительную важность в рамках этой цепочки. Значения всех коэффициентов автоматически нормируются так, чтобы их сумма внутри каждой цепочки была равна 1. В цепочку может объединяться неограниченное количество тематически близких вопросов. В вырожденном случае цепочка состоит из единственного вопроса, коэффициент важности которого устанавливается равным 1. Процедура количественного оценивания знаний, выявленных в ходе тестирования, состоит из трех этапов. На первом рассчитываются баллы, набранные за правильные ответы в рамках каждой отдельной тематической последовательности: , где Si - балл, выставляемый за ответы на i-ю тематическую последовательность; Кij - весовой коэффициент j-го вопроса в i-й цепочке; Zij =1, если на j-й вопрос в i-й цепочке получен правильный ответ и Zij=0 - в противном случае; Li - количество вопросов в i-й цепочке. На втором этапе рассчитывается суммарный балл S( за ответы на все вопросы теста с учетом количества цепочек вопросов, на которые экзаменуемый успел ответить за отведенное время: 2 , где N –объем теста; Кt – количество цепочек вопросов, на которые экзаменуемый успел ответить за отведенное время t. На третьем этапе определяется итоговая оценка знаний экзаменуемого. Для этого набранный им суммарный балл S( проецируется на оценочную шкалу, имеющую вид [0; I1; I2; I3; 1] , где 00, в котором с вероятностью Pt
находится истинное значение Stи: Stи?[St-?I;St+?I]. C
практической точки зрения это означает, что при проецировании значения
St на шкалу ZI следует принимать во внимание не только сегмент этой
шкалы (Ii,Ii+1], в который попадает значение St, но и его зонирование с
учетом интервала неопределенности ?I.

При попадании суммы баллов в интервал Ii+?I?SN

Заключение Начавшееся в нашей стране с начала 80-х годов внедрение в учебных заведениях новых информационных технологий – обучение при помощи педагогических программных средств, а также использование тестирующих программ – дало более чем скромные результаты. Среди многих известных причин этого (финансовые, технические, организационные, методические трудности) отметим одну: психологическое неприятие учителями “компьютерных” методов обучения и контроля знаний, особенно высококвалифицированными, творчески работающими. У них для этого есть основания: налицо большое количество плохих программ, не отвечающих главным психолого-педагогическим принципам обучения, неудачно реализующих основные этапы процесса усвоения знаний; как правило, отсутствует методическое сопровождение; оказываются непомерно большими затраты времени и сил на освоение компьютеров, изучение программы, поддержку соответствующей инфраструктуры; при использовании даже хороших систем нивелируется роль учителя в учебно-воспитательном процессе, исчезает творческий характер его труда; отсутствует система поощрения педагогов-новаторов, осваивающих новые информационные технологии. Эту ситуацию, на мой взгляд, можно и хочется изменить. Технический прогресс стремительно продвинулся вперед, современная вычислительная техника и системы телекоммуникаций достигли огромных результатов за последние несколько лет в плане быстродействия, объемов обрабатываемой и хранимой информации. Развитие систем проектирования программ (объектно-ориентированные системы визуального программирования, СУБД, системы моделирования нейронных сетей, и т.п.) дало в руки инженеров и системных аналитиков мощнейшие средства разработки и внедрения в жизнь самых фантастических проектов. Отсутствие финансирования в области образования в нашей стране тормозит, как мне кажется, процессы создания качественных программных продуктов общего применения, смещая акцент в сторону коммерческих интеллектуальных мультимедийных курсов, создание которых могут себе позволить только крупные «софтверные» компании. В данной работе частично были проанализированы существующие методы и модели, позволяющие построить так называемую интеллектуальную автоматизированную систему контроля знаний. Практические реализации собственных теоретических разработок в этой области уже есть: на сегодняшний день готова демонстрационная версия программы, проводящей тестирование по методу цепочек вопросов. Этот метод не является «интеллектуализацией» процесса контроля знаний, а является первым шагом к созданию системы, позволяющей преподавателю проводить текущий и финальный контроль более быстро, объективно и эффективно. Реализация методов адаптивного тестирования, использование нечеткой логики и инженерии знаний позволит достичь больших результатов в этой области. Список использованной литературы Касьянова Н. В. «Cоздание системы компьютерного контроля как результат новых информационных технологий в обучении», Восточноукраинский Национальный Университет (ВНУ), Украина, г.Луганск // материалы конференции ИТО-2001; Бренич С.Г. «Проблема искусственного интеллекта. Кибернетика.» // реферат; Иващенко А.И. «Контроль знаний и умений учащихся по математике в школе» // дипломная работа; Ваньков Е.А. «Технологии компьютерного тестирования» // реферат; Кузнецов А. А. «Универсальная автоматизированная обучающая система. Подсистема контроля знаний.» // дипломный проект; Соловей Е.В. «Автоматизированная система контроля знаний «Цепь знаний». Сетевая версия» // дипломный проект; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-28.html" http://ito.edu.ru/2001/ito/VI/VI-0-28.html ; Моисеев В.Б., Пятирублевый Л.Г., Таранцева К.Р. «Информационный подход к выбору решений в системах адаптивного тестирования». Материалы конференции «Анализ качества образования и тестирование». 22.03.2001, Москва, МО РФ, МЭСИ Моисеев В.Б., Пятирублевый Л.Г., Таранцева К.Р. «Распознавание образа обучаемых по уровням их знаний в компьютерном тестировании». Сборник материалов Интернет-конференции «Проблемы перехода классических университетов в систему открытого образования». Москва. МЭСИ, 2001 HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-19.html" http://ito.edu.ru/2001/ito/VI/VI-0-19.html ; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-27.html" http://ito.edu.ru/2001/ito/VI/VI-0-27.html ; Моисеев В.Б., Усманов В.В., Таранцева К.Р., Пятирублевый Л.Г. «Оценивание результатов тестирования на основе экспертно-аналитических методов». Журнал «Открытое образование», №3, 2001, с.32-36.; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-12.html" http://ito.edu.ru/2001/ito/VI/VI-0-12.html ; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-1.html" http://ito.edu.ru/2001/ito/VI/VI-0-1.html ; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-32.html" http://ito.edu.ru/2001/ito/VI/VI-0-32.html ; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-2.html" http://ito.edu.ru/2001/ito/VI/VI-0-2.html ; HYPERLINK "http://ito.edu.ru/2001/ito/VI/VI-0-17.html" http://ito.edu.ru/2001/ito/VI/VI-0-17.html ; HYPERLINK "http://www.tl.ru/~gimn13/ped/doclad/shuhard.html" http://www.tl.ru/~gimn13/ped/doclad/shuhard.html ; Аванесов B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов пед.вузов. 2 изд., испр.. и доп. М.: Адепт; Границкая А.С. Научить думать и действовать: Адаптивная система обучения в школе: Кн. для учителя. М.: Просвещение; Казаринов А.С., Култышева А.Ю., Мирошниченко А.А. Технология адаптивной валидности тестовых заданий: Учебное пособие. Глазов: ГГПИ, 1999; Майоров А.Н. Тесты школьных достижений: конструирование, проведение, использование. Издание второе - СПб.: Образование и культура, 1997; Кальней В.А., Шишов С.Е. Технология мониторинга качества обучения в системе “учитель-ученик”: Методическое пособие для учителя. М.: Педагогическое общество России, 1999; Челышкова М.Б. Разработка педагогических тестов на основе современных математических моделей: Уч.пособие. М.: Исследовательский центр проблем качества подготовки специалистов, 1995; П.Ю. Шалимов, В.И. Попоков «Технология рейтинговых исследований качества образования с применением нейронных сетей» И.Д. Рудинский, Е.В. Соловей «Автоматизированный контроль знаний по методике уточняющих вопросов». Сборник материалов конференции, 2001 И.Д. Рудинский, Е.В. Соловей «реализация алгоритмов прямого тестирования в интеллектуальной автоматизированной системе контроля знаний». Сборник материалов конференции, 2001 И.Д. Рудинский «Метод адаптивного автоматизированного контроля знаний». Сборник материалов конференции, 2001 PAGE PAGE 54 Получение N неправильных ответов Превышение предельной длительности теста 5. Условие раннего прекращения 4.4.Выявление имеющихся знаний 4.3.Выявление простейших знаний 4.2.Выявление наиболее важных знаний 4.1.Строгий 4. Уровень контроля 3.3.Пониженная 3.2.Повышенная 3.1.Стандартная 3. Сложность теста 2.2.Экзаме- национное 2.1.Зачетное 2. Вид тестирования 1.2.Проверка глубины знаний 1.1.Проверка широты знаний 1. Цель тестирования Свойства алгоритмов прямого тестирования

Нашли опечатку? Выделите и нажмите CTRL+Enter