Реферат на тему Педагогическое тестирование в России и США
Работа добавлена на сайт bukvasha.net: 2014-08-03Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
Педагогическое тестирование в России
Современное состояние педагогического контроля в российской системе образования представляет собой контрастное соединение старого с новым, субъективного с объективным, устного опроса по пятибалльной системе оценок с попытками внедрения контролирующих технологий. Одним из самых перспективных методов нам представляется тестовый — быстро развивающееся направление на стыке педагогики, теории измерений, математического моделирования, математической статистики и автоматизации. Внедрение и развитие такого тестирования внесет существенный вклад в процесс реформирования отечественной системы образования и ее интеграцию в мировую образовательную практику.
История проверки знаний и способностей с помощью различных заданий насчитывает около 4 тыс. лет. Однако реальное использование педагогических тестов началось век назад, когда в педагогике и психологии была сформулирована проблема исследования индивидуальных различий. Научно разработанный тест представляет собой совокупность взаимосвязанных заданий возрастающей сложности, позволяющих надежно и валидно оценить знания и другие интересующие педагога характеристики личности. В зависимости от длительности контролируемого периода обучения контроль можно разделить на текущий, тематический, рубежный, итоговый и заключительный. Его проведение связано с выполнением основных педагогических функций — диагно-стической, обучающей, организующей, воспитывающей и развивающей; базируется на принципах гласности (открытость всех этапов контроля), объективности (использование стандартных тестовых программ и технических средств), научности (надежность и валидность), систематичности и эффективности (минимальные затраты времени и средств контроля). В дополнение к педагогическому контролю целесообразно использовать методы психологической диагностики, например оценку внимательности, памяти, интеллектуальных и творческих способностей.
Появившиеся на рубеже XX в. педагогические тесты довольно быстро завоевали популярность во всех развитых странах. Однако в СССР к 30-м гг. развернулась их встречная критика, а затем и полный запрет, продолжавшийся вплоть до начала 70-х гг. Советская педагогика этого периода фактически отказалась от математических моделей обучения, статистических методов обработки педагогических данных и даже анкет, которые в то трудное время были названы "вредными". С конца 80-х гг. педагогическое тестирование в нашей стране переживает второе рождение.
Инициатором этого процесса стало Гособразование СССР, а основным исполнителем — кафедра педагогических измерений его Исследовательского центра под руководством В.С.Аванесова. Здесь были собраны и проанализированы основные теоретические и практические результаты в данной области, полученные международным сообществом. Однако, как оказалось, главная трудность заключалась в том, что научно обоснованные международные педагогические тесты не поддавались однозначной адаптации к отечественной системе образования в силу ее специфики. На эту работу потребовалось целое десятилетие.
В середине 90-х гг. организован Центр тестирования Минобразования России, на который возложена роль основного координатора теоретических исследований, посвященных педагогическому тестированию, и их внедрения в образовательную систему страны. С I998 г. Центром осуществляется широкомасштабный эксперимент по проведению централизованного абитуриентского тестирования в вузы России, который дал неоценимый опыт создания и внедрения итоговых педагогических тестов по отдельным дисциплинам в общеобразовательную среднюю школу. По результатам эксперимента создается единый банк тестовых заданий; сформированы обобщенные умения по географии, физике, истории, химии; создана стандартизованная спецификация тестов; осуществляется разработка классификации тестовых заданий и сервисных программ для автоматизации их проектирования, экспертизы и использования. Уже можно сделать вывод о том, что централизованное тестирование способно объективно оценить уровень школьных знаний и отобрать лучших студентов из числа прошедших тестирование абитуриентов, т.е. оно может служить конкурентоспособной альтернативой традиционной форме приемных экзаменов в вуз. Среди организационно-педагогических и теоретических проблем развития тестирования в России организаторы и участники эксперимента выделили следующие:
- создание единой системы мониторинга качества образования по схеме: учебное – учреждение — регион — федеральный центр:
- организация подсистем бланочного и компьютерного тестирования и их интеграция для оптимизации функционирования федеральной системы:
подготовка учащихся, учителей, экзаменаторов, административного и технического персонала к участию в централизованном тестировании;
адекватный перевод результатов тестирования в традиционную 5-балльную шкалу:
корректный выбор формы заданий и их числа, обеспечение репрезентативности выборки, надежности и валидности тестов;
создание тестов разного уровня сложности, применяемых в зависимости от рейтинга высшего учебного заведения и показателей конкурсного отбора.
Их решение принесло конкретные позитивные результаты. Например, для всех желающих (учащихся, их родителей, преподавателей, руководителей образовательных учреждений и т.п.) в любом регионе России ознакомиться с правилами и процедурой тестирования, получить представление о форме и содержании тестов, объективно оценить свой уровень знаний по разным предметам перед ежегодной официальной кампанией Центр с 1999 г. проводит бесплатное репетиционное тестирование через Интернет. Это расширяет возможности дополнительной широкой апробации тестовых материалов, развития системы компьютерного тестирования, совершенствование элементов единой системы мониторинга качества образования [3-с. 30—32].
В педагогической литературе появилось большое количество публикаций, отражающих варианты решения выявленных проблем. В частности, приводятся результаты создания институциональных форм реализации централизованного тестирования и анализ решенных с их помощью организационно-педагогических задач в отдельных вузах и регионах страны. Среди" них — разработка и создание:
программно-инструментальных систем автоматизированного тестирования, работающих в локальной сети и в режиме реального времени при удаленном доступе;
региональных консультационных центров по проблемам педагогического тестирования:
научно обоснованных характеристик перевода результатов централизованного тестирования в шкалу оценок вступительных экзаменов в зависимости от показателей конкурсного отбора абитуриентов:
единых трехуровневых итоговых тестов, ориентированных на вариативную систему образования и обеспечивающих в результате самоопределения учащихся их дифференциацию по уровню подготовленности (базовый, повышенный или углубленный уровень):
различных программно-методических комплексов для автоматизации проектирования тестов, экспертизы и использования тестовых заданий по дисциплине, а также обеспечения прогностической валидности тестов достижений, обоснования формы тестовых заданий в зависимости от предметной направленности и уровня усвоения материала, разработки технологи формирования дистракторов.
Опыт централизованного абитуриентского и репетиционного тестирования послужил основой для перехода к следующему этапу — единому государственному тестовому экзамену выпускников средних школ, который в порядке эксперимента проводится с 2001 г. в ряде субъектов Российской Федерации. После этого отечественная система образования планирует отказаться от вступительных экзаменов в вузы и перейти к существующей в большинстве стран мира практике конкурсного отбора в высшие учебные заведения на основании аттестационных тестов на выходе из средней школы. Однако в связи с этим появились новые проблемы. Во-первых, тестирование выпускников школ и абитуриентов вузов — это разные задачи педагогического измерения, поэтому возникли трудности отбора содержания тестов для единого экзамена. Тест должен, с одной стороны, охватить минимум знаний и умений, который следует освоить каждому выпускнику средней школы в соответствии с государственными образовательными стандартами, а с другой - отразить специфику требований к отдельным разделам дисциплин, необходимым для обучения в том или ином учебном заведении по различным специальностям или направлениям. Во-вторых, выпускники школ и абитуриенты — это различный контингент для тестирования, имеющий в целом разные уровень подготовки и образовательные цели, что предопределяет отличие в требованиях как к содержанию тестов, так и к уровню усвоения материала. И, в-третьих, при абитуриентском тестировании интерес представляет не только уровень знаний и умений претендентов, но и профессионально значимые качества личности, такие, как творческие и логические способности, объем памяти, профессиональная направленность, широта интересов, уровень технического, вербального или социального интеллекта. Последний эксперимент единого государственного экзамена только начался, а исследователи уже публикуют различные предложения по разрешению поставленных проблем. В частности, для аттестации выпускников общеобразовательных учреждений нужно иметь такие тестовые задания, которые позволяют судить о минимально допустимой компетентности выпускников. За рубежом такие тесты называют Minimum Competency Test. Рекомендуется использование критериально-ориентированных тестов, посредством которых определяется то, что испытуемый знает и чего он не знает из заданного стандарта. Централизованное абитуриентское тестирование предназначено в первую очередь для ранжирования абитуриентов, поэтому здесь требуются иные подходы. Предлагается конструирование комбинированного теста по математике, где начальные задания первого и второго уровней сложности предназначаются для выявления соответствия критерию минимальных знаний предмета, определяемому учебным стандартом, а последующие — третьего уровня — служат для определения рейтинга тестируемого. При абитуриентском тестировании необходимо разрабатывать нормативно-ориентированные тесты, так как их основная цель — ранжирование учащихся по степени владения знаниями по определенной дисциплине. Здесь задания должны контролировать знания на содержательно-личностном уровне качеств, поэтому число репродуктивных заданий, преобладающих в критериально-ориентированных тестах, следует уменьшить за счет заданий, носящих творческий характер.
Единый государственный экзамен по каждой дисциплине должен состоять из двух частей. Первая часть (А) — это аттестационный экзамен по курсу X—XI классов, обязательный для всех учащихся. Имеются два варианта аттестации: А1 — контроль обязательного уровня подготовки выпускников и А2 — повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттестате. Вторая часть (В) — по желанию выпускников для поступления в вузы, состоящая также из вариантов В1 (базовый уровень) и В2 (повышенный уровень). По совокупным ответам на задания частей А (А1 или А2) и В (В1 или В2) выдается сертификат единого государственного экзамена с оценкой по 100-балльной шкале для поступления в вузы.
При проведении аттестационного тестирования необходимо определить минимальный набор совокупности учебных элементов содержания образования. Это можно сделать с помощью структурно-логических схем и матриц логической связи, которые решают задачу формирования минимально полного набора базовых учебных единиц, удовлетворяющих свойствам полноты и минимальности. На основе подобных идей реализуется основной принцип формирования единого банка тестовых заданий — возможно полное и подробное отражение содержания предмета его логической структурой. В связи с этим решается задача создания перечня обобщенных видов умений по каждой дисциплине, обладающих свойствами полноты и минимальности. В соответствии с этим принципом в Центре тестирования Минобразования РФ сформированы обобщенные умения по географии, физике, истории и химии.
Возможен "тезаурусный подход" к определению содержания обучения, основанный на разработке базовых понятий соответствующих учебных дисциплин и специальностей. В педагогических исследованиях чаще встречаются два типа тезаурусов — "информационно-поисковый" (Л.Т.Турбович. 1970) и "логико-категориальный" (Л.В.Макарова. 1992). Первый тип делит множество учебных понятий на отдельные области, а второй устанавливает между ними логические и функциональные взаимные связи. Предлагается методика составления информационно-поискового тезауруса на основе классификатора знаний и способностей Б.Блума — Р.Гегна. дополненного В.С.Аванесовым [9]. В частности, разработаны два классификатора знаний по биологии, содержащие знания "дифференциального" и "интегрального" типов. Первый из них. основываясь на типологии мыслительных операций, содержит группы фактуальных. сравнительных, ассоциативных, причинных, алгоритмических, классификационных, системных, метрологических и методических знаний. Второй на основе деятельностного подхода содержит "житейские", мировоззренческие, технологические, математические, кибернетические, квалитативные и акмеологическне знания. Анализ репетиционных тестов по биологии позволил авторам диагностировать в них 30% фактуальных знаний (термины, определения, исторические факты и достижения ученых, законы и закономерности). 20% классификационных знаний (основные признаки растений и животных, их систематическое положение и морфологическое описание) и 16% причинных знаний (причинно-следственные отношения). Мало внимания уделяется диагностике алгоритмических (10%), ассоциативных (5%) и сравнительных (3%) знании. Таким образом, педагогическое тестирование, основанное на таксономической модели уровней обученное™ [10] и классификаторе знани! и способностей, наиболее полно удовлетво ряет требованиям государственных образовательных стандартов.
Что касается проблемы психологической диагностики абитуриентов на предполагаемом втором туре абитуриентского тестирования в конкретном учебном заведении, тс здесь вдобавок к сертификату выпускника средней школы предлагается психофизиологическое обследование абитуриентов е вузе по факторам, связанным со свойствами нервной системы и когнитивными психическими функциями — памятью, вниманием, особенностями восприятия и мышления [11. с. 51—52]. Например, в технических вузах целесообразно оценивать психологические предпосылки к обучению и профессиональному становлению студентов на основании теста технического интеллекта в экономических — теста социального интеллекта Дж. Гилфорда, в гуманитарных — теста вербального интеллекта Дж.Айзенка. Для диагностики развития приемов мыслительной деятельности используются специфические тестовые задания с помощью применения аналогий, исключения лишнего и т.п. Кроме того, полезно разрабатывать методы оценки конкретных профессионально значимых качеств личности абитуриента в соответствии с его будущей профессиональной деятельностью.
Отечественная система образования весьма специфична, поэтому научные и прикладные наработки мировых лидеров по педагогическому тестированию в нашей! стране однозначно не адаптируются, что служит основанием для развития не только прикладных разработок, но и теоретических исследований в данной области; педагогики. Последнее дополнительно стимулируется наличием у нас большого количества научных работников с хорошей математической подготовкой, способных заняться данной актуальной педагогической проблемой. Отдельную группу здесь составляют работы, выполняемые в рамках теории моделирования и параметризации педагогических тестов. Моделирование педагогических тестов I может осуществляться с пр1шенением двух f теоретических подходов — классической ■ теории и современной теории 1RT (Item
Научные сообщения
Response Theory). Первая с помощью определения показателей надежности и ва-пнпности позволяет сделать оценку качества разработанного теста. Для определения взаимосвязанности заданий в тесте в ней используются методы корреляционного „ факторного анализа. Второй подход основан на методологии латентно-структурного анализа XLSAI_c его мощным математическим аппаратом и имеет больше возможностей по созданию эффективных тестов Так, с помощью модели Г.Раша [12] посредством использования характеристических кривых можно оценивать латентные (скрытые) параметры уровня подготовленности испытуемых и трудности заданий. Разумно составленные варианты теста и статистическая обработка результатов тестирования в рамках данной модели позволяют получать оценки латентных параметров на метрической шкале, однако шкалы, соответствующие различным вариантам теста, отличаются друг от друга. Для их преобразования в единую шкалу необходимо иметь дополнительную информацию, получаемую перекрытием вариантов теста для различных групп участников или перекрытием групп испытуемых, исследуемых различными вариантами теста. Такая дополнительная информация устраняет неопределенность начала отсчета каждой шкалы, соответствующей различным вариантам теста.
Современное состояние педагогического контроля в российской системе образования представляет собой контрастное соединение старого с новым, субъективного с объективным, устного опроса по пятибалльной системе оценок с попытками внедрения контролирующих технологий. Одним из самых перспективных методов нам представляется тестовый — быстро развивающееся направление на стыке педагогики, теории измерений, математического моделирования, математической статистики и автоматизации. Внедрение и развитие такого тестирования внесет существенный вклад в процесс реформирования отечественной системы образования и ее интеграцию в мировую образовательную практику.
История проверки знаний и способностей с помощью различных заданий насчитывает около 4 тыс. лет. Однако реальное использование педагогических тестов началось век назад, когда в педагогике и психологии была сформулирована проблема исследования индивидуальных различий. Научно разработанный тест представляет собой совокупность взаимосвязанных заданий возрастающей сложности, позволяющих надежно и валидно оценить знания и другие интересующие педагога характеристики личности. В зависимости от длительности контролируемого периода обучения контроль можно разделить на текущий, тематический, рубежный, итоговый и заключительный. Его проведение связано с выполнением основных педагогических функций — диагно-стической, обучающей, организующей, воспитывающей и развивающей; базируется на принципах гласности (открытость всех этапов контроля), объективности (использование стандартных тестовых программ и технических средств), научности (надежность и валидность), систематичности и эффективности (минимальные затраты времени и средств контроля). В дополнение к педагогическому контролю целесообразно использовать методы психологической диагностики, например оценку внимательности, памяти, интеллектуальных и творческих способностей.
Появившиеся на рубеже XX в. педагогические тесты довольно быстро завоевали популярность во всех развитых странах. Однако в СССР к 30-м гг. развернулась их встречная критика, а затем и полный запрет, продолжавшийся вплоть до начала 70-х гг. Советская педагогика этого периода фактически отказалась от математических моделей обучения, статистических методов обработки педагогических данных и даже анкет, которые в то трудное время были названы "вредными". С конца 80-х гг. педагогическое тестирование в нашей стране переживает второе рождение.
Инициатором этого процесса стало Гособразование СССР, а основным исполнителем — кафедра педагогических измерений его Исследовательского центра под руководством В.С.Аванесова. Здесь были собраны и проанализированы основные теоретические и практические результаты в данной области, полученные международным сообществом. Однако, как оказалось, главная трудность заключалась в том, что научно обоснованные международные педагогические тесты не поддавались однозначной адаптации к отечественной системе образования в силу ее специфики. На эту работу потребовалось целое десятилетие.
В середине 90-х гг. организован Центр тестирования Минобразования России, на который возложена роль основного координатора теоретических исследований, посвященных педагогическому тестированию, и их внедрения в образовательную систему страны. С I998 г. Центром осуществляется широкомасштабный эксперимент по проведению централизованного абитуриентского тестирования в вузы России, который дал неоценимый опыт создания и внедрения итоговых педагогических тестов по отдельным дисциплинам в общеобразовательную среднюю школу. По результатам эксперимента создается единый банк тестовых заданий; сформированы обобщенные умения по географии, физике, истории, химии; создана стандартизованная спецификация тестов; осуществляется разработка классификации тестовых заданий и сервисных программ для автоматизации их проектирования, экспертизы и использования. Уже можно сделать вывод о том, что централизованное тестирование способно объективно оценить уровень школьных знаний и отобрать лучших студентов из числа прошедших тестирование абитуриентов, т.е. оно может служить конкурентоспособной альтернативой традиционной форме приемных экзаменов в вуз. Среди организационно-педагогических и теоретических проблем развития тестирования в России организаторы и участники эксперимента выделили следующие:
- создание единой системы мониторинга качества образования по схеме: учебное – учреждение — регион — федеральный центр:
- организация подсистем бланочного и компьютерного тестирования и их интеграция для оптимизации функционирования федеральной системы:
подготовка учащихся, учителей, экзаменаторов, административного и технического персонала к участию в централизованном тестировании;
адекватный перевод результатов тестирования в традиционную 5-балльную шкалу:
корректный выбор формы заданий и их числа, обеспечение репрезентативности выборки, надежности и валидности тестов;
создание тестов разного уровня сложности, применяемых в зависимости от рейтинга высшего учебного заведения и показателей конкурсного отбора.
Их решение принесло конкретные позитивные результаты. Например, для всех желающих (учащихся, их родителей, преподавателей, руководителей образовательных учреждений и т.п.) в любом регионе России ознакомиться с правилами и процедурой тестирования, получить представление о форме и содержании тестов, объективно оценить свой уровень знаний по разным предметам перед ежегодной официальной кампанией Центр с 1999 г. проводит бесплатное репетиционное тестирование через Интернет. Это расширяет возможности дополнительной широкой апробации тестовых материалов, развития системы компьютерного тестирования, совершенствование элементов единой системы мониторинга качества образования [3-с. 30—32].
В педагогической литературе появилось большое количество публикаций, отражающих варианты решения выявленных проблем. В частности, приводятся результаты создания институциональных форм реализации централизованного тестирования и анализ решенных с их помощью организационно-педагогических задач в отдельных вузах и регионах страны. Среди" них — разработка и создание:
программно-инструментальных систем автоматизированного тестирования, работающих в локальной сети и в режиме реального времени при удаленном доступе;
региональных консультационных центров по проблемам педагогического тестирования:
научно обоснованных характеристик перевода результатов централизованного тестирования в шкалу оценок вступительных экзаменов в зависимости от показателей конкурсного отбора абитуриентов:
единых трехуровневых итоговых тестов, ориентированных на вариативную систему образования и обеспечивающих в результате самоопределения учащихся их дифференциацию по уровню подготовленности (базовый, повышенный или углубленный уровень):
различных программно-методических комплексов для автоматизации проектирования тестов, экспертизы и использования тестовых заданий по дисциплине, а также обеспечения прогностической валидности тестов достижений, обоснования формы тестовых заданий в зависимости от предметной направленности и уровня усвоения материала, разработки технологи формирования дистракторов.
Опыт централизованного абитуриентского и репетиционного тестирования послужил основой для перехода к следующему этапу — единому государственному тестовому экзамену выпускников средних школ, который в порядке эксперимента проводится с 2001 г. в ряде субъектов Российской Федерации. После этого отечественная система образования планирует отказаться от вступительных экзаменов в вузы и перейти к существующей в большинстве стран мира практике конкурсного отбора в высшие учебные заведения на основании аттестационных тестов на выходе из средней школы. Однако в связи с этим появились новые проблемы. Во-первых, тестирование выпускников школ и абитуриентов вузов — это разные задачи педагогического измерения, поэтому возникли трудности отбора содержания тестов для единого экзамена. Тест должен, с одной стороны, охватить минимум знаний и умений, который следует освоить каждому выпускнику средней школы в соответствии с государственными образовательными стандартами, а с другой - отразить специфику требований к отдельным разделам дисциплин, необходимым для обучения в том или ином учебном заведении по различным специальностям или направлениям. Во-вторых, выпускники школ и абитуриенты — это различный контингент для тестирования, имеющий в целом разные уровень подготовки и образовательные цели, что предопределяет отличие в требованиях как к содержанию тестов, так и к уровню усвоения материала. И, в-третьих, при абитуриентском тестировании интерес представляет не только уровень знаний и умений претендентов, но и профессионально значимые качества личности, такие, как творческие и логические способности, объем памяти, профессиональная направленность, широта интересов, уровень технического, вербального или социального интеллекта. Последний эксперимент единого государственного экзамена только начался, а исследователи уже публикуют различные предложения по разрешению поставленных проблем. В частности, для аттестации выпускников общеобразовательных учреждений нужно иметь такие тестовые задания, которые позволяют судить о минимально допустимой компетентности выпускников. За рубежом такие тесты называют Minimum Competency Test. Рекомендуется использование критериально-ориентированных тестов, посредством которых определяется то, что испытуемый знает и чего он не знает из заданного стандарта. Централизованное абитуриентское тестирование предназначено в первую очередь для ранжирования абитуриентов, поэтому здесь требуются иные подходы. Предлагается конструирование комбинированного теста по математике, где начальные задания первого и второго уровней сложности предназначаются для выявления соответствия критерию минимальных знаний предмета, определяемому учебным стандартом, а последующие — третьего уровня — служат для определения рейтинга тестируемого. При абитуриентском тестировании необходимо разрабатывать нормативно-ориентированные тесты, так как их основная цель — ранжирование учащихся по степени владения знаниями по определенной дисциплине. Здесь задания должны контролировать знания на содержательно-личностном уровне качеств, поэтому число репродуктивных заданий, преобладающих в критериально-ориентированных тестах, следует уменьшить за счет заданий, носящих творческий характер.
Единый государственный экзамен по каждой дисциплине должен состоять из двух частей. Первая часть (А) — это аттестационный экзамен по курсу X—XI классов, обязательный для всех учащихся. Имеются два варианта аттестации: А1 — контроль обязательного уровня подготовки выпускников и А2 — повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттестате. Вторая часть (В) — по желанию выпускников для поступления в вузы, состоящая также из вариантов В1 (базовый уровень) и В2 (повышенный уровень). По совокупным ответам на задания частей А (А1 или А2) и В (В1 или В2) выдается сертификат единого государственного экзамена с оценкой по 100-балльной шкале для поступления в вузы.
При проведении аттестационного тестирования необходимо определить минимальный набор совокупности учебных элементов содержания образования. Это можно сделать с помощью структурно-логических схем и матриц логической связи, которые решают задачу формирования минимально полного набора базовых учебных единиц, удовлетворяющих свойствам полноты и минимальности. На основе подобных идей реализуется основной принцип формирования единого банка тестовых заданий — возможно полное и подробное отражение содержания предмета его логической структурой. В связи с этим решается задача создания перечня обобщенных видов умений по каждой дисциплине, обладающих свойствами полноты и минимальности. В соответствии с этим принципом в Центре тестирования Минобразования РФ сформированы обобщенные умения по географии, физике, истории и химии.
Возможен "тезаурусный подход" к определению содержания обучения, основанный на разработке базовых понятий соответствующих учебных дисциплин и специальностей. В педагогических исследованиях чаще встречаются два типа тезаурусов — "информационно-поисковый" (Л.Т.Турбович. 1970) и "логико-категориальный" (Л.В.Макарова. 1992). Первый тип делит множество учебных понятий на отдельные области, а второй устанавливает между ними логические и функциональные взаимные связи. Предлагается методика составления информационно-поискового тезауруса на основе классификатора знаний и способностей Б.Блума — Р.Гегна. дополненного В.С.Аванесовым [9]. В частности, разработаны два классификатора знаний по биологии, содержащие знания "дифференциального" и "интегрального" типов. Первый из них. основываясь на типологии мыслительных операций, содержит группы фактуальных. сравнительных, ассоциативных, причинных, алгоритмических, классификационных, системных, метрологических и методических знаний. Второй на основе деятельностного подхода содержит "житейские", мировоззренческие, технологические, математические, кибернетические, квалитативные и акмеологическне знания. Анализ репетиционных тестов по биологии позволил авторам диагностировать в них 30% фактуальных знаний (термины, определения, исторические факты и достижения ученых, законы и закономерности). 20% классификационных знаний (основные признаки растений и животных, их систематическое положение и морфологическое описание) и 16% причинных знаний (причинно-следственные отношения). Мало внимания уделяется диагностике алгоритмических (10%), ассоциативных (5%) и сравнительных (3%) знании. Таким образом, педагогическое тестирование, основанное на таксономической модели уровней обученное™ [10] и классификаторе знани! и способностей, наиболее полно удовлетво ряет требованиям государственных образовательных стандартов.
Что касается проблемы психологической диагностики абитуриентов на предполагаемом втором туре абитуриентского тестирования в конкретном учебном заведении, тс здесь вдобавок к сертификату выпускника средней школы предлагается психофизиологическое обследование абитуриентов е вузе по факторам, связанным со свойствами нервной системы и когнитивными психическими функциями — памятью, вниманием, особенностями восприятия и мышления [11. с. 51—52]. Например, в технических вузах целесообразно оценивать психологические предпосылки к обучению и профессиональному становлению студентов на основании теста технического интеллекта в экономических — теста социального интеллекта Дж. Гилфорда, в гуманитарных — теста вербального интеллекта Дж.Айзенка. Для диагностики развития приемов мыслительной деятельности используются специфические тестовые задания с помощью применения аналогий, исключения лишнего и т.п. Кроме того, полезно разрабатывать методы оценки конкретных профессионально значимых качеств личности абитуриента в соответствии с его будущей профессиональной деятельностью.
Отечественная система образования весьма специфична, поэтому научные и прикладные наработки мировых лидеров по педагогическому тестированию в нашей! стране однозначно не адаптируются, что служит основанием для развития не только прикладных разработок, но и теоретических исследований в данной области; педагогики. Последнее дополнительно стимулируется наличием у нас большого количества научных работников с хорошей математической подготовкой, способных заняться данной актуальной педагогической проблемой. Отдельную группу здесь составляют работы, выполняемые в рамках теории моделирования и параметризации педагогических тестов. Моделирование педагогических тестов I может осуществляться с пр1шенением двух f теоретических подходов — классической ■ теории и современной теории 1RT (Item
Научные сообщения
Response Theory). Первая с помощью определения показателей надежности и ва-пнпности позволяет сделать оценку качества разработанного теста. Для определения взаимосвязанности заданий в тесте в ней используются методы корреляционного „ факторного анализа. Второй подход основан на методологии латентно-структурного анализа XLSAI_c его мощным математическим аппаратом и имеет больше возможностей по созданию эффективных тестов Так, с помощью модели Г.Раша [12] посредством использования характеристических кривых можно оценивать латентные (скрытые) параметры уровня подготовленности испытуемых и трудности заданий. Разумно составленные варианты теста и статистическая обработка результатов тестирования в рамках данной модели позволяют получать оценки латентных параметров на метрической шкале, однако шкалы, соответствующие различным вариантам теста, отличаются друг от друга. Для их преобразования в единую шкалу необходимо иметь дополнительную информацию, получаемую перекрытием вариантов теста для различных групп участников или перекрытием групп испытуемых, исследуемых различными вариантами теста. Такая дополнительная информация устраняет неопределенность начала отсчета каждой шкалы, соответствующей различным вариантам теста.
Использование двухпараметрнческой модели, предложенной А.Бирнбаумом [13], позволяет определять дифференцирующую способность тестовых заданий. Для обеспечения нормализации их распределения по уровню трудности рассматриваются вопросы аппроксимации логистического распределения тестовых заданий [14. с. 59—61]. При работе с этой моделью неопределенными оказываются не только начала отсчета каждой шкалы, соответствующей различным вариантам теста, но и масштабы таких шкал. Для устранения указанных неопределенностей рекомендуется обеспечивать определенное перекрытие вариантов теста. Обсуждаются структура перекрытия, количество общих заданий — узлов и основные требования к ним. Трехпараметрическая модель А.Бирнбаума позволяет при моделировании тестов учитывать вероятность угадывания ответа на каждое задание. Это повышает эффективность проектирования тестов и ждет своего применения.
Следует отметить, что современная теория измерений различает шкалы номинальные (наименований), порядковые (ранговые), интервалов, отношений (пропорций) и разностей. При измерениях в педагогике чаще всего ограничиваются применением порядковых шкал. Однако в работах Б.П.Битинаса, В.И.Михеева, Л.Т.Турбовича, Л.М.Фридмана, К.Инген-камна и других авторов делаются попытки перехода к интервальным шкалам. Для этого все чаще используются стандартные нормы (z-шкала, с-шкала, т-шкала, р-шка-ла и др.), являющиеся нормированными шкалами на уровне шкал интервалов. В этой связи заметим, что педагогические измерения с помощью традиционной 5-балльной шкалы и тестовых оценок также основаны на порядковых шкалах. Однако перевод латентных параметров в единую метрическую шкалу позволяет перейти от качественных порядковых к количественным квазиннтервальным шкалам и проводить адекватную обработку результатов более мощным математическим аппаратом. Наиболее удобным для оценивания результатов тестирования является 100-балльная т-шкала. в которой в настоящее время стал выставляться сертификационный балл выпускников средних школ при проведении единого государственного экзамена.
Отечественная школа при развитии тестовых измерений показала высокую готовность к использованию информационных технологий на всех этапах разработки и внедрения педагогических тестов. Здесь следует отметить значительные достижения Центра тестирования Минобразования РФ в организации централизованного, абитуриентского и репетиционного тестирования, а также единого государственного тестового экзамена, результатом обобщения которых явилась монографическая публикация [15]. Компьютерные технологии автоматической генерации тестов, проведения и обработки результатов тестирования, региональные и федеральные системы тестирования с использованием всемирной информационно-образовательной среды Интернет возводят педагогическое тестирование в России в разряд современных педагогических технологий и позволяют ему быстрыми шагами приближаться к мировому эталонному уровню.
Основное внимание федеральной власти, регионов и учебных учреждений уделяется итоговым аттестационным экзаменам в средней школе и абитуриентским экзаменам в высшей. Это та отправная точка, от которого педагогическое тестирование будет развиваться вниз (в среднюю общеобразовательную и специальную школу) и вверх (в высшую школу и послевузовское образование). Пока нормативная база отечественной системы образования (за исключением рассмотренного выше перехода школа — вуз) не разрешает проводить тестовые экзамены итогового и заключительного уровней, однако во всех компонентах этой системы ведется большая подготовительная работа. Наиболее актуальным становится разработка текущих, тематических и рубежных тестов, используемых в учебном процессе всех образовательных структл-р. Это большое профессиональное иоле, полностью заполнить которое не удастся на ближайшую обозримую перепекших. Для сравнения можно указать, что к США ежегодно знания и способности учашмхея проверяются с помощью 47 млн. тестовых бланков, выпускаемых 400 тестовыми компаниями. Подавляющее большинство из них представляют бланки текущего, тематического и рубежного уровнен
Всевозрастающее число разработчиков педагогических тестов выдвигают перед отечественной системой образования ряд важных задач.
Первая из них связана с сертификацией качества педагогических тестовых материалов, используемых для оценки знаний и других педагогических характеристик обучающихся в образовательных учреждениях РФ. С целью повышения качества образования и дальнейшего совершенствования аттестационных тестовых технологий создан Координационный совет Минобразования России (приказ Минобразования РФ № 1122 от 17.04.2000), призванный осуществлять контроль за соблюдением требований к качеству педагогических тестовых материалов, вырабатывать рекомендации по совершенствованию процесса их сертификации, определять порядок оформления и выдач сертификатов. Наличие сертифицированных педагогических тестов позволит организовать их распределение и будет способствовать формированию рынка тестовых услуг.
Вторая актуальная задача связана с подготовкой квалифицированных тестологов. С недавнего времени эта задача стала государственной, и ее решение предлагается введением в системе дополнительного профессионального образования дополнительной квалификации "тестолог".
Таким образом, можно констатировать, что педагогическое тестирование в России в настоящий исторический момент возрождено и переходит в стадию интенсивного развития. Специфика российских образовательных систем придает ему индивидуальные черты, формирование которых позволит решить ряд важнейших педагогических проблем их интеграции в международные системы образования, реформирования отечественной средней и высшей школы, а также развития научных основ педагогического тестирования.
Тесты в американской системе образования
Интерес к тестам впервые возник в отечественной педагогике в 20-е гг., в период становления советской школы. Тогда активно обсуждался вопрос об отношении к стандартизованным видам учета – тестам успешности. Педагоги хотели найти наиболее объективный и точный способ оценки знаний учащихся. Тесты привлекали их возможностью массовой проверки знаний школьников. Советские педагоги того времени опирались главным образом на исследования этой проблемы в американской школе.
Однако в советской педагогической литературе тех лет указывалось и на ограниченные возможности тестовой методики. Подчеркивалось, что тесты нужны лишь для проверки элементарных школьных навыков и непригодны для выявления глубины и осознанности знаний.
В сер. 30-х гг. работа с тестами была свернута в известным постановлением ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов» (1936), в котором их использование подверглось резкой критике. Вообще-то в постановлении речь шла не о проверки знаний, а о тестировании умственных способностей школьников, которое, хотя и гораздо позднее, было категорически отвергнуто и западной педагогикой. Однако в атмосфере 30-х гг. сам термин "тест" стал символом "педологических извращений". Идея использования тестов в учебном процессе была вычеркнута из арсенала педагогических средств.
Интерес к тестам вновь возродился лишь с начала 60-х гг. Статьи о них появились на страницах педагогических изданий. Исследователи видели достоинства этого метода прежде всего в возможности объективной оценки знаний. Однако, как и в 20-е гг. отмечались ограниченные возможности тестов. Подчеркивалось, что они не выявляют способность ученика логически рассуждать и связно излагать свои мысли и их нецелесообразно применять для проверки сформированности умения обобщать, сравнивать, делать выводы, объяснять явления и факты на основе изученных законов и теорий. В связи с намечаемой реформой образования в России представляется уместным познакомиться с опытом, накопленным американской школой, так как разработка и применение тестов для проверки подготовленности учеников являются се неотъемлемой составной частью. Тестовая методика в США — универсальное средство проверки знаний, умений, профессиональной подготовки во всех областях человеческой деятельности. Для допуска к практически любому роду деятельности, требующей каких-то навыков и знаний, необходимо получение сертификата. Например, десятки тысяч нештатных счетчиков для проведения переписи 2000 г. отбирались среди добровольцев: с помощью специальных тестов, направленных на проверку элементарных канцелярских навыков, умения писать и считать. Тесты для профессиональной деятельности, разумеется, намного сложнее.
В области образования тесты разрабатываются силами специализированных коммерческих компаний, располагающих весьма компетентными специалистами. Отбор материала и степень сложности предлагаемых вопросов зависят от ступени обучения. Естественно, в начальной и средней школе они различны, но во всех случаях включают математику и так называемый вербальный тест (объяснительное чтение: способность понимать текст, проводить аналогии, дополнять незаконченные утверждения, проводить критический анализ текста). Особое значение имеют тесты, предлагаемые в выпускных XI и XII классах. Это прежде всего SAT-1 (Scholastic Aptitude Test) — по существу школьный выпускной экзамен. Он не очень сложен, соответствуя примерно уровню VI—VII классов российской школы. SAT-I принят большинством штатов. Практически он стал общегосударственным, хотя закон, делающий его обязательным для всех, до сих пор остается предметом дискуссий. Есть еше много других аналогичных тестов, например ACT (American College Test) — оценка подготовленности к поступлению в колледж.
Результатами этих тестов, наряду с другими показателями (средние баллы за последние годы обучения, личная характеристика и пр.), колледжи и университеты руководствуются при отборе абитуриентов. Разумеется, требования сильно отличаются н зависимости от ранга учебного заведения. Поступающему в очень престижные и дорогие, например Принстонский или Стенфордский. университеты необходимо иметь оценки, близкие к максимальным, и благоприятные дополнительные характеристики. Для муниципального колледжа достаточно, чтобы оценки по SAT-1 были не ниже уровня среднеамериканского выпускника. В университетах некоторых штатов, например Флориды и Техаса, прием вообще производится не по результатам тестов, а по итоговым школьным оценкам, но эти университеты занимают в общеамериканской табели о рангах соответственно 60-е и 82-е места в списке из 228 американских университетов (147 общественных и 81 частный). Есть заведения, в особенности частные колледжи, которые вообще ничего не требуют: плати деньги и приступай к учебе, а чему научишься и какова будет цена полученного диплома в глазах будущего работодателя — проблема самих студентов.
Обычно время проведения теста строго ограничено: сверх положенного не дадут ни одной лишней секунды, на размышления и колебания времени нет. Например, на SAT-I отводится пять получасовых и два пятнадцатиминутных периода с короткими перерывами между ними. Общее число вопросов — 60 по математике и 78 вербальных. Один из получасовых периодов является "экспериментальным" — его результаты не входят в зачет, однако испытуемый не знает, какой именно. Если он чувствует, что не справился с заданием, то может в течение суток отменить свою работу и пересдать тест в другой раз. Если полученные результаты неудо-влетворительны, то можно пройти испытание повторно, снова внеся небольшую плату. Разумеется, при неизменности содержания, вопросы тестов каждый раз новые. Теоретически тестирование можно проходить сколько угодно раз, однако каждый результат фиксируется в компьютерах системы образования. Поэтому любой серьезный университет всегда имеет возможность поинтересоваться не только очками абитуриента, то и тем, с какой попытки они получены.
Престижные университеты крайне дорожат своей репутацией и очень строго отбирают лишь самых способных и подготовленных: слабый абитуриент не попадет туда ни за какие деньги. Напротив, очень талантливые студенты, с наиболее высокими показателями, вполне реально могут рассчитывать не только на прием, но и на всякие льготы, вплоть до бесплатного образования в самых дорогих университетах.
Особое место в американской системе тестирования занимает SAT-II, предлагаемый ученикам выпускного класса. Этот общеамериканский комплекс был введен в практику в 1994 г. Он включает все дисциплины естественно-математического и гуманитарного циклов, в том числе иностранные — европейские и азиатские — языки. Как правило, прохождение SAT-II добровольное, хотя ряд колледжей и университетов требует его выполнения. Но в любом случае он дает абитуриентам дополнительные шансы на поступление. Само собой разумеется, что выпускники школ выбирают из комплекса разделы, соответствующие направлению их дальнейшего образования.
Нам представляется, что для иллюстрации того, как построены тесты в американской системе образования, SAT-II подходит больше всего. С одной стороны, он основан на тех же принципах, что и все остальные тесты, с другой — достаточно сложен, чтобы показать, как при надлежащем построении тесты могут служить для выявления способности учеников логически мыслить, формулировать выводы и обобщения на материале полученных знаний. Более простые испытания, такие, как SAT-I. обладают теми же свойствами, но демонстрируют их не столь наглядно.
В качестве примера мы возьмем тест по всемирной истории, поскольку из всего набора тем эта наиболее знакома широкому кругу читателей. Тест включает 95 вопросов, на которые надо ответить в течение часа.
В соответствии с технологией, повсеместно применяемой в американской системе образования, для каждого из вопросов предлагается несколько вариантов ответов, имеющих буквенное обозначение — А. В. С. D, Е. На отдельном листе напечатаны номера вопросов и против них — перечисленные буквы. Испытуемый должен отметить ту из них, которая, по его мнению, соответствует правильному ответу. Если он не отмстит ни одного ответа, то теряет очко. Если ответит неправильно, то теряет I/4 очка. Очевидно, что подобная система подсчета позволяет учесть даже неполное знание вопроса.
Окончательной оценкой являются не очки, а баллы, рассчитываемые по специальной таблице. Последняя построена так. что максимальное число баллов (800) абитуриент получает, даже набрав лишь 85 очков. Другими словами, он имеет право вообще не отвечать на 10 вопросов.
Получается, что испытуемый имеет некоторую свободу выбора в пределах заданной тематики теста. Такая свобода в какой-то мере создает психологическую разрядку для испытуемого. Он чувствует себя более комфортно, зная, что от него не ждут полного совершенства. При этом тест остается весьма суровым, и далеко не все его успешно проходят с первого раза. Известно, например, что в 1999 г из 1,3 млн. американских школьников проходивших SAT-1, лишь 730 получили полный балл. В среднем, неплохим результатом считается, если по каждому тесту дано примерно 75% правильных ответов. Катастрофическим называют 40-процентный уровень верных ответов.
Обратимся непосредственно к содержанию теста SAT-11 по всемирной истории Более половины из его 95 вопросов посвящены истории Африки. Азии, Северной и Южной Америки. История США сюда не входит — ей отводится отдельный тест. Вторая половина вопросов касается европейской истории. Содержание теста включает материалы социального, экономического, культурологического характера. Абитуриенты должны уметь проанализировать отрывки из выступлений политических деятелей, различные документы, предполагается знакомство с основными направлениями искусства и материальной культуры. Ответы требуют знания и понимания как фактов прошлого, так и событий современности, причинно-следственных связей, основных тенденции развития всемирной истории.
Значительная часть вопросов проверяет знание фактического материала. На первый взгляд они кажутся достаточно элементарными, но жесткие временные рамки требуют от испытуемого свободной ориентации в материале, обеспечивающей быстрый ответ. Вопросы такого рода — простейший способ определить уровет его подготовки. Приведем некоторые примеры. Вопрос: "Какие продукты позаимствовали европейцы только после их контактов с американскими индейцами в XVI веке?" Предлагаемые ответы:
A. Чай.
B. Рис.
C. Корица.
D. Сахар.
E. Картофель.
Из любого учебника истории школьники должны знать, что в ходе контактов с индейцами европейцы узнали такие культуры, как картофель, маис (кукуруза), табак. Но даже если упоминание картофеля в учебнике выпало из памяти, можно воспользоваться другими фактами и другими источниками, чтобы дать верный ответ. Как правило, всем известно, что чай и рис выращивают в Китае, а корица входила в число пряностей, которые издавна привозились с Востока, в частности из Индии. Выбор сужается до D и Е, что уже неплохо. Если же ученик еще откуда-то, хотя бы из детских сказок, знает, что сахар был знаком европейцам еще в средние века (в домике у доброй волшебницы окошки были из леденцов), то он получает желанное очко.
Другой пример. Вопрос: "Какие из колоний европейских стран получили независимость до 1900 года?" Набор предлагаемых ответов:
A. Алжир.
B. Бразилия.
C. Индия.
D. Индокитай.
E. Берег Слоновой Кости.
Хотя содержание вопроса строится на качественно ином материале, но по своему характеру он тоже нацелен на выявление фактических знаний. В данном случае кроме знания учебника важна общеисторическая ориентация выпускника, понимание в самых общих чертах истории общества после Второй мировой войны. Это включает и обретение независимости Индией, и деятельность де Голля в решении алжирской проблемы, и ситуацию вокруг Вьетнама, и процессы, связанные с пробуждением "черного континента". Ориентация на этом общеисторическом фоне позволяет дать правильный ответ — Бразилия, даже не зная подробностей истории Южной Америки.
Оба эти примера свидетельствуют о том, что нахождение правильного ответа даже на сравнительно простые вопросы требует не столько запоминания, сколько общеисторической подготовки
К числу более сложных вопросов можно отнести те, которые требуют понимания причинно-следственных связей. Эти вопросы отличаются по степени сложности, по характеру материала, на основе которого должны быть сформулированы требуемые выводы. Приведем несколько примеров.
Вопрос: "Какие из перечисленных факторов обусловили стремительное развитие Французской революции?' Предлагается выбрать один из ответов,
A. Национальное банкротство.
B. Наступление на права третьего сословия.
С Желание знати получить конституцию.
D. Страдания крестьянства.
E. Попытка короля вернуться к феодальным порядкам.
Чтобы сделать правильный выбор, необходимо обладать историческим мышлением, рассмативать крупное историческое явление как целостный процесс, который определяется Совокупностью ряда факторов. Соотношение этих факторов находит отражение в причинно-следственных связях. В рассмотренном выше вопросе каждое положение из предлагаемого круга ответов выступало в качестве причины, приближающей страну к революции. Но только совокупность всех этих причин, их переплетение и взаимодополнение вызвали общенациональное банкротство, кризис власти которые и обусловили стремительное развитие французской революции.
Наконец, есть тесты, направленные на выяснение обшекультурного кругозора, степени знакомства с памятниками искусства разных эпох, умения ориентироваться в разнообразных художественных стилях. В качестве примера приведем три задания, объединенные в единый тест. Даны репродукции, изображающие памятники искусства: мозаика "Император Юстиниан с семьей", скульптура Микеланджело "Моисей" и интерьер церкви. Предлагается определить, к какому направлению в искусстве относится каждое из произведений:
A. Баухауз.
B. Ренессанс.
C. Прерафаэлиты.
D. Византийский стиль.
E. Рококо.
В данном случае интересны не столько вопросы, сколько набор предлагаемых ответов. Можно надеяться, что определение византийского стиля применительно к мозаике, изображающей императора Юстиниана, не вызовет особых затруднений. Точно так же вполне очевидна принадлежность к направлению Ренессанса широко известной скульптуры Микеланджело. Но баухауз (направление в немецкой архитектуре и прикладном искусстве первой четверти XX в.) или прерафаэлиты (группа английских художников середины XIX в.) вряд ли знакомы абитуриенту, не занимавшемуся специально историей искусства. Выполнение предложенного теста предполагает не только знание различных стилей в искусстве, но и умение применить эти знания в конкретной ситуации. Это еше раз напоминает о том, что поступление в серьезный колледж или университет требует основательной подготовки по избранному профилю.
Примеры можно продолжить, но и приведенные выше показывают, что для прохождения теста недостаточно просто запомнить какой-то набор фактов. SAT-1I нацелен в первую очередь на то. чтобы выявить кругозор абитуриента, его умение анализировать и обобщать материал. Этот вывод существенно отличается от прежних представлений о тестовых методиках. Гибкость и насыщенность тестов наряду со строгими рамками при их выполнении — характерные черты современных тестовых методов, используемых в Америке. Разумеется, уровень и направление заданий могут коренным образом изменяться в зависимости от их тематики и назначения. Но общие черты, о которых говорилось, присущи всем бесчисленным испытаниям, проводимым в стране.
Следует отметить, что современная теория измерений различает шкалы номинальные (наименований), порядковые (ранговые), интервалов, отношений (пропорций) и разностей. При измерениях в педагогике чаще всего ограничиваются применением порядковых шкал. Однако в работах Б.П.Битинаса, В.И.Михеева, Л.Т.Турбовича, Л.М.Фридмана, К.Инген-камна и других авторов делаются попытки перехода к интервальным шкалам. Для этого все чаще используются стандартные нормы (z-шкала, с-шкала, т-шкала, р-шка-ла и др.), являющиеся нормированными шкалами на уровне шкал интервалов. В этой связи заметим, что педагогические измерения с помощью традиционной 5-балльной шкалы и тестовых оценок также основаны на порядковых шкалах. Однако перевод латентных параметров в единую метрическую шкалу позволяет перейти от качественных порядковых к количественным квазиннтервальным шкалам и проводить адекватную обработку результатов более мощным математическим аппаратом. Наиболее удобным для оценивания результатов тестирования является 100-балльная т-шкала. в которой в настоящее время стал выставляться сертификационный балл выпускников средних школ при проведении единого государственного экзамена.
Отечественная школа при развитии тестовых измерений показала высокую готовность к использованию информационных технологий на всех этапах разработки и внедрения педагогических тестов. Здесь следует отметить значительные достижения Центра тестирования Минобразования РФ в организации централизованного, абитуриентского и репетиционного тестирования, а также единого государственного тестового экзамена, результатом обобщения которых явилась монографическая публикация [15]. Компьютерные технологии автоматической генерации тестов, проведения и обработки результатов тестирования, региональные и федеральные системы тестирования с использованием всемирной информационно-образовательной среды Интернет возводят педагогическое тестирование в России в разряд современных педагогических технологий и позволяют ему быстрыми шагами приближаться к мировому эталонному уровню.
Основное внимание федеральной власти, регионов и учебных учреждений уделяется итоговым аттестационным экзаменам в средней школе и абитуриентским экзаменам в высшей. Это та отправная точка, от которого педагогическое тестирование будет развиваться вниз (в среднюю общеобразовательную и специальную школу) и вверх (в высшую школу и послевузовское образование). Пока нормативная база отечественной системы образования (за исключением рассмотренного выше перехода школа — вуз) не разрешает проводить тестовые экзамены итогового и заключительного уровней, однако во всех компонентах этой системы ведется большая подготовительная работа. Наиболее актуальным становится разработка текущих, тематических и рубежных тестов, используемых в учебном процессе всех образовательных структл-р. Это большое профессиональное иоле, полностью заполнить которое не удастся на ближайшую обозримую перепекших. Для сравнения можно указать, что к США ежегодно знания и способности учашмхея проверяются с помощью 47 млн. тестовых бланков, выпускаемых 400 тестовыми компаниями. Подавляющее большинство из них представляют бланки текущего, тематического и рубежного уровнен
Всевозрастающее число разработчиков педагогических тестов выдвигают перед отечественной системой образования ряд важных задач.
Первая из них связана с сертификацией качества педагогических тестовых материалов, используемых для оценки знаний и других педагогических характеристик обучающихся в образовательных учреждениях РФ. С целью повышения качества образования и дальнейшего совершенствования аттестационных тестовых технологий создан Координационный совет Минобразования России (приказ Минобразования РФ № 1122 от 17.04.2000), призванный осуществлять контроль за соблюдением требований к качеству педагогических тестовых материалов, вырабатывать рекомендации по совершенствованию процесса их сертификации, определять порядок оформления и выдач сертификатов. Наличие сертифицированных педагогических тестов позволит организовать их распределение и будет способствовать формированию рынка тестовых услуг.
Вторая актуальная задача связана с подготовкой квалифицированных тестологов. С недавнего времени эта задача стала государственной, и ее решение предлагается введением в системе дополнительного профессионального образования дополнительной квалификации "тестолог".
Таким образом, можно констатировать, что педагогическое тестирование в России в настоящий исторический момент возрождено и переходит в стадию интенсивного развития. Специфика российских образовательных систем придает ему индивидуальные черты, формирование которых позволит решить ряд важнейших педагогических проблем их интеграции в международные системы образования, реформирования отечественной средней и высшей школы, а также развития научных основ педагогического тестирования.
Тесты в американской системе образования
Интерес к тестам впервые возник в отечественной педагогике в 20-е гг., в период становления советской школы. Тогда активно обсуждался вопрос об отношении к стандартизованным видам учета – тестам успешности. Педагоги хотели найти наиболее объективный и точный способ оценки знаний учащихся. Тесты привлекали их возможностью массовой проверки знаний школьников. Советские педагоги того времени опирались главным образом на исследования этой проблемы в американской школе.
Однако в советской педагогической литературе тех лет указывалось и на ограниченные возможности тестовой методики. Подчеркивалось, что тесты нужны лишь для проверки элементарных школьных навыков и непригодны для выявления глубины и осознанности знаний.
В сер. 30-х гг. работа с тестами была свернута в известным постановлением ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов» (1936), в котором их использование подверглось резкой критике. Вообще-то в постановлении речь шла не о проверки знаний, а о тестировании умственных способностей школьников, которое, хотя и гораздо позднее, было категорически отвергнуто и западной педагогикой. Однако в атмосфере 30-х гг. сам термин "тест" стал символом "педологических извращений". Идея использования тестов в учебном процессе была вычеркнута из арсенала педагогических средств.
Интерес к тестам вновь возродился лишь с начала 60-х гг. Статьи о них появились на страницах педагогических изданий. Исследователи видели достоинства этого метода прежде всего в возможности объективной оценки знаний. Однако, как и в 20-е гг. отмечались ограниченные возможности тестов. Подчеркивалось, что они не выявляют способность ученика логически рассуждать и связно излагать свои мысли и их нецелесообразно применять для проверки сформированности умения обобщать, сравнивать, делать выводы, объяснять явления и факты на основе изученных законов и теорий. В связи с намечаемой реформой образования в России представляется уместным познакомиться с опытом, накопленным американской школой, так как разработка и применение тестов для проверки подготовленности учеников являются се неотъемлемой составной частью. Тестовая методика в США — универсальное средство проверки знаний, умений, профессиональной подготовки во всех областях человеческой деятельности. Для допуска к практически любому роду деятельности, требующей каких-то навыков и знаний, необходимо получение сертификата. Например, десятки тысяч нештатных счетчиков для проведения переписи 2000 г. отбирались среди добровольцев: с помощью специальных тестов, направленных на проверку элементарных канцелярских навыков, умения писать и считать. Тесты для профессиональной деятельности, разумеется, намного сложнее.
В области образования тесты разрабатываются силами специализированных коммерческих компаний, располагающих весьма компетентными специалистами. Отбор материала и степень сложности предлагаемых вопросов зависят от ступени обучения. Естественно, в начальной и средней школе они различны, но во всех случаях включают математику и так называемый вербальный тест (объяснительное чтение: способность понимать текст, проводить аналогии, дополнять незаконченные утверждения, проводить критический анализ текста). Особое значение имеют тесты, предлагаемые в выпускных XI и XII классах. Это прежде всего SAT-1 (Scholastic Aptitude Test) — по существу школьный выпускной экзамен. Он не очень сложен, соответствуя примерно уровню VI—VII классов российской школы. SAT-I принят большинством штатов. Практически он стал общегосударственным, хотя закон, делающий его обязательным для всех, до сих пор остается предметом дискуссий. Есть еше много других аналогичных тестов, например ACT (American College Test) — оценка подготовленности к поступлению в колледж.
Результатами этих тестов, наряду с другими показателями (средние баллы за последние годы обучения, личная характеристика и пр.), колледжи и университеты руководствуются при отборе абитуриентов. Разумеется, требования сильно отличаются н зависимости от ранга учебного заведения. Поступающему в очень престижные и дорогие, например Принстонский или Стенфордский. университеты необходимо иметь оценки, близкие к максимальным, и благоприятные дополнительные характеристики. Для муниципального колледжа достаточно, чтобы оценки по SAT-1 были не ниже уровня среднеамериканского выпускника. В университетах некоторых штатов, например Флориды и Техаса, прием вообще производится не по результатам тестов, а по итоговым школьным оценкам, но эти университеты занимают в общеамериканской табели о рангах соответственно 60-е и 82-е места в списке из 228 американских университетов (147 общественных и 81 частный). Есть заведения, в особенности частные колледжи, которые вообще ничего не требуют: плати деньги и приступай к учебе, а чему научишься и какова будет цена полученного диплома в глазах будущего работодателя — проблема самих студентов.
Обычно время проведения теста строго ограничено: сверх положенного не дадут ни одной лишней секунды, на размышления и колебания времени нет. Например, на SAT-I отводится пять получасовых и два пятнадцатиминутных периода с короткими перерывами между ними. Общее число вопросов — 60 по математике и 78 вербальных. Один из получасовых периодов является "экспериментальным" — его результаты не входят в зачет, однако испытуемый не знает, какой именно. Если он чувствует, что не справился с заданием, то может в течение суток отменить свою работу и пересдать тест в другой раз. Если полученные результаты неудо-влетворительны, то можно пройти испытание повторно, снова внеся небольшую плату. Разумеется, при неизменности содержания, вопросы тестов каждый раз новые. Теоретически тестирование можно проходить сколько угодно раз, однако каждый результат фиксируется в компьютерах системы образования. Поэтому любой серьезный университет всегда имеет возможность поинтересоваться не только очками абитуриента, то и тем, с какой попытки они получены.
Престижные университеты крайне дорожат своей репутацией и очень строго отбирают лишь самых способных и подготовленных: слабый абитуриент не попадет туда ни за какие деньги. Напротив, очень талантливые студенты, с наиболее высокими показателями, вполне реально могут рассчитывать не только на прием, но и на всякие льготы, вплоть до бесплатного образования в самых дорогих университетах.
Особое место в американской системе тестирования занимает SAT-II, предлагаемый ученикам выпускного класса. Этот общеамериканский комплекс был введен в практику в 1994 г. Он включает все дисциплины естественно-математического и гуманитарного циклов, в том числе иностранные — европейские и азиатские — языки. Как правило, прохождение SAT-II добровольное, хотя ряд колледжей и университетов требует его выполнения. Но в любом случае он дает абитуриентам дополнительные шансы на поступление. Само собой разумеется, что выпускники школ выбирают из комплекса разделы, соответствующие направлению их дальнейшего образования.
Нам представляется, что для иллюстрации того, как построены тесты в американской системе образования, SAT-II подходит больше всего. С одной стороны, он основан на тех же принципах, что и все остальные тесты, с другой — достаточно сложен, чтобы показать, как при надлежащем построении тесты могут служить для выявления способности учеников логически мыслить, формулировать выводы и обобщения на материале полученных знаний. Более простые испытания, такие, как SAT-I. обладают теми же свойствами, но демонстрируют их не столь наглядно.
В качестве примера мы возьмем тест по всемирной истории, поскольку из всего набора тем эта наиболее знакома широкому кругу читателей. Тест включает 95 вопросов, на которые надо ответить в течение часа.
В соответствии с технологией, повсеместно применяемой в американской системе образования, для каждого из вопросов предлагается несколько вариантов ответов, имеющих буквенное обозначение — А. В. С. D, Е. На отдельном листе напечатаны номера вопросов и против них — перечисленные буквы. Испытуемый должен отметить ту из них, которая, по его мнению, соответствует правильному ответу. Если он не отмстит ни одного ответа, то теряет очко. Если ответит неправильно, то теряет I/4 очка. Очевидно, что подобная система подсчета позволяет учесть даже неполное знание вопроса.
Окончательной оценкой являются не очки, а баллы, рассчитываемые по специальной таблице. Последняя построена так. что максимальное число баллов (800) абитуриент получает, даже набрав лишь 85 очков. Другими словами, он имеет право вообще не отвечать на 10 вопросов.
Получается, что испытуемый имеет некоторую свободу выбора в пределах заданной тематики теста. Такая свобода в какой-то мере создает психологическую разрядку для испытуемого. Он чувствует себя более комфортно, зная, что от него не ждут полного совершенства. При этом тест остается весьма суровым, и далеко не все его успешно проходят с первого раза. Известно, например, что в 1999 г из 1,3 млн. американских школьников проходивших SAT-1, лишь 730 получили полный балл. В среднем, неплохим результатом считается, если по каждому тесту дано примерно 75% правильных ответов. Катастрофическим называют 40-процентный уровень верных ответов.
Обратимся непосредственно к содержанию теста SAT-11 по всемирной истории Более половины из его 95 вопросов посвящены истории Африки. Азии, Северной и Южной Америки. История США сюда не входит — ей отводится отдельный тест. Вторая половина вопросов касается европейской истории. Содержание теста включает материалы социального, экономического, культурологического характера. Абитуриенты должны уметь проанализировать отрывки из выступлений политических деятелей, различные документы, предполагается знакомство с основными направлениями искусства и материальной культуры. Ответы требуют знания и понимания как фактов прошлого, так и событий современности, причинно-следственных связей, основных тенденции развития всемирной истории.
Значительная часть вопросов проверяет знание фактического материала. На первый взгляд они кажутся достаточно элементарными, но жесткие временные рамки требуют от испытуемого свободной ориентации в материале, обеспечивающей быстрый ответ. Вопросы такого рода — простейший способ определить уровет его подготовки. Приведем некоторые примеры. Вопрос: "Какие продукты позаимствовали европейцы только после их контактов с американскими индейцами в XVI веке?" Предлагаемые ответы:
A. Чай.
B. Рис.
C. Корица.
D. Сахар.
E. Картофель.
Из любого учебника истории школьники должны знать, что в ходе контактов с индейцами европейцы узнали такие культуры, как картофель, маис (кукуруза), табак. Но даже если упоминание картофеля в учебнике выпало из памяти, можно воспользоваться другими фактами и другими источниками, чтобы дать верный ответ. Как правило, всем известно, что чай и рис выращивают в Китае, а корица входила в число пряностей, которые издавна привозились с Востока, в частности из Индии. Выбор сужается до D и Е, что уже неплохо. Если же ученик еще откуда-то, хотя бы из детских сказок, знает, что сахар был знаком европейцам еще в средние века (в домике у доброй волшебницы окошки были из леденцов), то он получает желанное очко.
Другой пример. Вопрос: "Какие из колоний европейских стран получили независимость до 1900 года?" Набор предлагаемых ответов:
A. Алжир.
B. Бразилия.
C. Индия.
D. Индокитай.
E. Берег Слоновой Кости.
Хотя содержание вопроса строится на качественно ином материале, но по своему характеру он тоже нацелен на выявление фактических знаний. В данном случае кроме знания учебника важна общеисторическая ориентация выпускника, понимание в самых общих чертах истории общества после Второй мировой войны. Это включает и обретение независимости Индией, и деятельность де Голля в решении алжирской проблемы, и ситуацию вокруг Вьетнама, и процессы, связанные с пробуждением "черного континента". Ориентация на этом общеисторическом фоне позволяет дать правильный ответ — Бразилия, даже не зная подробностей истории Южной Америки.
Оба эти примера свидетельствуют о том, что нахождение правильного ответа даже на сравнительно простые вопросы требует не столько запоминания, сколько общеисторической подготовки
К числу более сложных вопросов можно отнести те, которые требуют понимания причинно-следственных связей. Эти вопросы отличаются по степени сложности, по характеру материала, на основе которого должны быть сформулированы требуемые выводы. Приведем несколько примеров.
Вопрос: "Какие из перечисленных факторов обусловили стремительное развитие Французской революции?' Предлагается выбрать один из ответов,
A. Национальное банкротство.
B. Наступление на права третьего сословия.
С Желание знати получить конституцию.
D. Страдания крестьянства.
E. Попытка короля вернуться к феодальным порядкам.
Чтобы сделать правильный выбор, необходимо обладать историческим мышлением, рассмативать крупное историческое явление как целостный процесс, который определяется Совокупностью ряда факторов. Соотношение этих факторов находит отражение в причинно-следственных связях. В рассмотренном выше вопросе каждое положение из предлагаемого круга ответов выступало в качестве причины, приближающей страну к революции. Но только совокупность всех этих причин, их переплетение и взаимодополнение вызвали общенациональное банкротство, кризис власти которые и обусловили стремительное развитие французской революции.
Наконец, есть тесты, направленные на выяснение обшекультурного кругозора, степени знакомства с памятниками искусства разных эпох, умения ориентироваться в разнообразных художественных стилях. В качестве примера приведем три задания, объединенные в единый тест. Даны репродукции, изображающие памятники искусства: мозаика "Император Юстиниан с семьей", скульптура Микеланджело "Моисей" и интерьер церкви. Предлагается определить, к какому направлению в искусстве относится каждое из произведений:
A. Баухауз.
B. Ренессанс.
C. Прерафаэлиты.
D. Византийский стиль.
E. Рококо.
В данном случае интересны не столько вопросы, сколько набор предлагаемых ответов. Можно надеяться, что определение византийского стиля применительно к мозаике, изображающей императора Юстиниана, не вызовет особых затруднений. Точно так же вполне очевидна принадлежность к направлению Ренессанса широко известной скульптуры Микеланджело. Но баухауз (направление в немецкой архитектуре и прикладном искусстве первой четверти XX в.) или прерафаэлиты (группа английских художников середины XIX в.) вряд ли знакомы абитуриенту, не занимавшемуся специально историей искусства. Выполнение предложенного теста предполагает не только знание различных стилей в искусстве, но и умение применить эти знания в конкретной ситуации. Это еше раз напоминает о том, что поступление в серьезный колледж или университет требует основательной подготовки по избранному профилю.
Примеры можно продолжить, но и приведенные выше показывают, что для прохождения теста недостаточно просто запомнить какой-то набор фактов. SAT-1I нацелен в первую очередь на то. чтобы выявить кругозор абитуриента, его умение анализировать и обобщать материал. Этот вывод существенно отличается от прежних представлений о тестовых методиках. Гибкость и насыщенность тестов наряду со строгими рамками при их выполнении — характерные черты современных тестовых методов, используемых в Америке. Разумеется, уровень и направление заданий могут коренным образом изменяться в зависимости от их тематики и назначения. Но общие черты, о которых говорилось, присущи всем бесчисленным испытаниям, проводимым в стране.