Тестові технології оцінювання якості
Упровадження новітніх технологій навчання, що ґрунтується на нових
підходах подання та засвоєння навчальної інформації, потребує нових,
сучасних методів їх вимірювання й оцінювання
Пошук досконалих методів вимірювання рівня навчальних досягнень учнів на
сучасному етапі розвитку інформаційних технологій набуває надзвичайної
актуальності, оскільки об’єктивізація процесу вимірювання, забезпечуючи
зворотний зв’язок, дає можливість координувати цей розвиток. Отже,
об’єктивні та точні методи вимірювання й оцінювання знань стають однією
з рушійних сил наукового прогресу.
Порівняльний аналіз методів вимірювання рівня навчальних
компетентностей, які використовуються в сучасній педагогіці, – усного
опитування, письмової роботи, інтерв’ю та тестування свідчить про те, що
останній метод більш ніж інші відповідає критеріям якості при визначенні
рівня теоретичних знань, умінь і навичок учнів.
Використання тестів у навчальному процесі надійно увійшло у світову
педагогічну практику. В Україні цей процес також набуває сил:
розвиваються наші уявлення про призначення та педагогічні можливості
тестів, форми тестів, формати запитань, методи обробки результатів
тестування та їх інтерпретації.
У 20-і роки ХХ століття, під керівництвом Блонського створювались перші
вітчизняні шкільні стандарти та тести. І сьогодні існує міфічна думка
про те, що для складання тестового інструменту не потрібні спеціальні
знання. Доказом цього є величезна кількість книг із тестами, більшість
яких є поза критикою.
Відомо, що тільки правильно складений тест дає можливість повністю
відповідати сучасним цілям навчання й освіти. Багато викладачів мають
певні труднощі в розробці таких тестів та їх правильному методичному
застосуванні. Таким чином, можна констатувати, що в цьому плані
необхідні певні рекомендації. Фундаментальні дослідження тестування як
методу педагогічної діагностики, висвітлені в роботах С. Аванесова, В.
Беспалька, К. Інгекампа, П. Клайна, А. Майорова, Л. Долінера та інших.
Слово “тест” англійського походження. Класичним у педагогіці є
визначення К. Інгекампа: Тестування – це метод педагогічної діагностики,
за допомогою якого вибір поведінки, що презентує передумови чи
результати навчального процесу, повинен максимально відповідати
принципам співставлення, об’єктивності, надійності та валідності
вимірів, повинен пройти обробку й інтерпретацію та бути прийнятним для
застосування в педагогічній практиці.
Дещо інше визначення поняття “тест” дають автори Л. Бурлачук і С.
Морозов. Вони вважають, що тест – фіксоване в часі випробування,
призначене для встановлення кількісних (та якісних)
індивідуально-психологічних якостей.
Схоже визначення тесту вводить психолог П. Клайн. Психологічний тест (а
педагогічні тести він розглядає саме як підвид психологічних) – це
стандартизоване, часто обмежене в часі випробування, призначене для
встановлення кількісних (та якісних) індивідуально-психологічних
особливостей.
В. Аванесов уважає, що тест – науково обґрунтований метод вимірювання
досліджуваних особливостей особистості. Попри узагальнене поняття тесту
часто вводиться й поняття педагогічного тесту. Так, В. Аванесов уважає,
що педагогічний тест являє собою сукупність взаємопов’язаних завдань
зростаючої складності та специфічної форми, що дозволяє якісно оцінити
структуру й виміряти рівень знань.
Кожне з наведених визначень має свої недоліки та переваги. Тому,
проаналізувавши ці визначення й урахувавши мету статті, ми при
дослідженні даної проблеми опирались на таке розуміння сутності понять
тест і тестування.
Тестування – науково обґрунтований процес вимірювання (за допомогою
тестів) якості властивостей особистості.
Тест – інструмент, що складається із кваліметрично вивіреної системи
тестових завдань, стандартизованої процедури проведення, із заздалегідь
спроектованої технології обробки та аналізу результатів.
Як видно вже з поданих вище визначень, важливими критеріями
діагностичних тестів навченості є дієвість (валідність), ефективність і
надійність їх результатів.
Валідність методу – це комплексна характеристика, яка визначається як
параметрами засобів і процедури вимірювання, так і властивостями ознаки,
яка досліджується. Отже, валідність методу – це відповідність того, що
вимірюється даним методом, тому, що він повинен вимірювати. Цей критерій
установлює сферу дійсності, для якої метод дає статистично ймовірні
результати. Якщо мова йде про тестування діяльності певного рівня, то
кваліфікаційні завдання, що пропонуються в тесті, повинні відповідати
саме такому рівню складності, тобто їх не можна виконати засобами
діяльності більш низького рівня. При цьому говорять про функціональну
валідність тесту.
Валідність методу при вимірюванні успішності можна диференціювати за
такими критеріями: валідність змісту; валідність відповідності;
валідність прогнозу.
Валідність за Л. Долінером:
Очевидна (внутрішня) – тест є валідним, якщо про нього складається
враження, що він вимірює саме те, що необхідно. Очевидна валідність не
має жодного відношення до справжньої валідності і тільки допомагає
створити атмосферу співпраці з випробуваним.
Змістовна. Цей термін визначає, чи завдання тесту відповідає всім
аспектам досліджуваного питання (тема, розділ та ін.).
Функціональна – відповідність контрольного завдання тій пізнавальній
дії, яка перевіряється.
Валідність за П. Клайном:
Очевидна – тест є валідним, якщо про нього в опитуваних складається
враження, що він вимірює саме те, що необхідно.
Конкурентна – оцінюється по кореляції результатів даного тесту з
результатами інших тестів.
Прогностична – вивчаються кореляції між показниками тесту та деяким
критерієм, що характеризує вимірювану властивість, але через певний час.
Змістовна – якщо можна показати, що завдання відображають усі аспекти
досліджуваної сфери, при умові, що інструкція до нього чітко
сформульована.
Конструктивна – включає в себе всі підходи до визначення валідності,
перераховані вище.
Надійність методу вимірювання – це міра стійкості результатів, що
впливає на точність, з якою можна виміряти ту чи іншу конкретну ознаку.
Перевірка надійності методу стосується насамперед відновлення
результатів при повторних вимірюваннях.
Ступінь надійності методу залежить від:
об’єктивності методу;
параметрів засобу вимірювання;
стабільності характеристики, яку вимірюють.
Під надійністю контрольного завдання розуміють ступінь точності, з якою
може бути визначена та чи інша ознака. Тобто визначено, наскільки можна
довіряти результатам даного тесту. Про надійність тестів іноді роблять
висновки за такою ознакою: якщо в усіх випадках перевірки тесту чи його
варіантів виявиться, що учні в розподілі за показниками успішності
займуть ті самі місця, то такий тест можна вважати надійним.
Надійність тесту залежить від кількості тестових завдань. Тому для
достатньої надійності підсумкового контролю достатньо великих розділів
курсу навчання, тест має містити не менше ніж 40 завдань.
П. Клайн уважає, що у психометрії термін «надійність» має два значення.
Тест називається надійним, якщо він є внутрішньо узгодженим. Тест також
називається надійним, якщо він дає одні й ті ж показники для кожного
випробуваного (при умові, що випробуваний не змінився) при повторному
тестуванні. Надійність при повторному тестуванні через певний час
називають ретестовою надійністю.
В. Аванесов уважає, що в міру становлення нової теорії тестів починає
відчуватись необхідність розширення кількості критеріїв хоча б до трьох.
В якості третього педагог пропонує критерій ефективності.
Ефективність – порівняльний критерій, який дозволяє порівняти тести.
Ефективним можна назвати тест, який краще, ніж інші тести, вимірює
знання учнів потрібного рівня підготовки, з меншою кількістю завдань,
якісніше, швидше, дешевше, і все це – за можливістю одночасно.
Якщо порівняти поняття “ефективність” із поняттями “надійність” і
“валідність”, то найістотніша відмінність нового поняття від двох
традиційних полягає в переході від середнього показника до
диференційованого. Достатньо пригадати, що надійність стосується тесту,
який складається із зафіксованої кількості завдань, що пред’являються
всім випробовуваним; тільки тоді можна знайти коефіцієнт надійності
тесту як середню міру точності вимірювання. Аналогічно це стосується й
валідності тесту. Ефективний же тест, навпаки, припускає відхід від
усереднення та від фіксованої для всіх випробовуваних кількості завдань.
Психологи Л. Бурлачук і С. Морозов до ефективних тестів висувають іще
одну, на наш погляд, суттєву вимогу – складність завдання тесту.
Складність завдання тесту – характеристика завдання тесту, що відображає
статистичний рівень розв’язуваності в даній вибірці стандартизації.
Показником складності тестового завдання є частка вибірки випробуваних,
які розв’язали чи не розв’язали дане завдання. Наприклад, якщо лише 20 %
випробуваних виконали завдання, його можна вважати складним для даної
вибірки, якщо 80 % – легким.
Підбір завдань за показниками складності важливий для успішного
використання тестів. Так, при підборі надто складних тестових завдань
валідність і надійність тесту різко зменшуються. Надто прості тестові
завдання призведуть до одноманітності тесту та його неефективності.
Ще однією особливістю ефективних тестів, на думку П. Клайна, є
дискримінативність. Досягнення задовільного розподілу показників є
однією з цілей автора тестів. Нема необхідності підкреслювати те, що є
очевидним: яка цінність тесту, за яким усі випробувані показали
однаковий результат? За допомогою ретельного конструювання тесту можна
забезпечити відповідний рівень дискримінативності, а це саме те, у чому
тести виграють у порівнянні з іншими формами випробувань.
Як видно, вимоги, які ставлять тестологи до ефективних тестів, між собою
дещо відрізняються. Мета вимірювань завжди полягає в отриманні
інформації про ознаки об’єктів чи подій. Вимірюється не сам об’єкт, а
тільки властивості або відмінні ознаки об’єкту.
У педагогічній діагностиці намагаються визначити якість результатів
вимірювання (у нашому випадку – вимірювання успішності). Варто
зазначити, що всі вище названі критерії спрямовані на єдину загальну
вимогу: тест повинен давати якнайточнішу інформацію про досліджуване
явище. Вони лише конкретизують цю вимогу й характеризують її з різних
сторін.
Радимо опрацювати таку літературу
1. Анастази А., Урбина С. Психологическое тестирование. – 7-е изд. –
СПб.: Питер, 2005. – 688 с.
2. Безпалько В. П. Образование и обучение с участием компьютеров
(педагогика ІІІ тысячелетия). – М.: Воронеж: Изд. Московского
психолого-социального института, 2002. – 352 с.
3. Бурлачук Л. Ф., Морозов С. М. Словарь- справочник по
психодиагностике. – СПб.: Питер, 1999. – 528 с.
4. Долинер Л.И. Компьютерные тесты успеваемости как средство оптимизации
учебного процесса // Вестник Московского университета. – 2004. – № 1.
5. Клайн Пол. Справочное руководство по конструированию тестов. Перевод
Е. П. Савченко. – М.: «ПАН Лтд.», 1994. – 283 с.
6. Майоров А. Н. Теория и практика создания тестов для системы
образования. – М.: Народное образование, 2000 – 352 с.
7. Малихін А. Тести у навчальному процесі сучасної школи // Рідна школа.
– 2001. – №8.
8. Методичні рекомендації з організації тестового контролю
освітньо-професійної підготовки вчителя. – Тернопіль: видавництво ТНПУ
ім. В. Гнатюка, 2004. – 100 с.
9. Педагогическая диагностика. Под ред. К. Ингекампа. Перевод с нем. –
М., 1991. – 525 с.
Нашли опечатку? Выделите и нажмите CTRL+Enter