Теоретико-методологический тезаурус педагогического тестирования

Раздел 3 Теоретико-методологический тезаурус педагогического тестирования. Цели и функции тестирования

Теоретико-методологический тезаурус педагогического тестирования

http://doidpo.rusoil.net/storage/Video/EUMK_DOVOU/tutorial/part8/item3_1.html

Адаптивное (последовательное) тестирование — вид компьютерного тестирования, при котором тестовые задания с известными характеристиками последовательно изображаются на экране компьютера, а уровень подготовленности испытуемого со все возрастающей точностью оценивается сразу же после каждого его ответа. Очередное задание в зависимости от ранее данных ответов испытуемых подбирается так, чтобы его уровень трудности позволял наилучшим образом оценить уровень подготовленности тестируемого. Количество заданий теста заранее не фиксируется, а процесс тестирования заканчивается по достижении заданной точности оценки уровня подготовленности испытуемого.

Апробация теста — предварительное тестирование стратифицированной выборки испытуемых для определения соответствия теста его целям и априорным характеристикам. Апробация есть необходимый этап для создаваемого теста перед его широким использованием.

Ассоциации в тестовом задании — словесная подсказка в содержании задания, позволяющая тестируемому угадать правильный ответ; свидетельство некорректности задания.

Балл — условная единица для оценки по определенной шкале результатов выполнения теста или его задания.

Балл истинный — латентный объект измерений, представляющий собой тот балл по определенной шкале, которому объективно соответствует уровень подготовленности данного испытуемого при указанной методике оценивания (при этом ошибки измерений условно предполагаются отсутствующими).

Балл категории ответа на тестовое задание — балл, соответствующий определенной категории ответа на политомическое задание в зависимости от уровня полноты того ответа (например, категория ответа на уровне узнавания — один балл, на уровне репродукции — два балла, на уровне оперативного применения — 3 балла и т. д.).

Балл критериальный — граничное значение тестового балла, с помощью которого заданная выборка тестируемых разделяется на выполнивших данный тест удовлетворительно («зачет») и неудовлетворительно («незачет»).

Балл первичный дихотомического задания — количество участников тестирования, верно выполнивших данное задание; дополнение до общего количества испытуемых, выполнявших задание, отражает некоторую меру трудности задания для данного контингента участников.

Балл первичный испытуемого — сумма баллов, приписанных тем категориям ответов на тестовые задания, которые испытуемый указал в качестве правильных. Для тестов, состоящих из дихотомических заданий — количество верно выполненных заданий, что отражает некоторую меру подготовленности данного испытуемого относительно данного теста.

Балл первичный категории задания — количество участников тестирования, указавших данную категорию ответа для определенного задания в качестве правильного ответа; в случае дихотомического задания совпадает с первичным баллом этого задания.

Балл тестовый — окончательное количественное выражение по определенной шкале индивидуальной оценки уровня подготовленности тестируемого, полученное на основании стандартизованной обработки результатов выполнения испытуемым тестовых заданий.

Банк тестовых материалов — совокупность систематизированных тестовых заданий и тестов, разработанных различными авторами, для различных целей, прошедших апробацию и имеющих известные характеристики.

Бланк ответа — стандартный бланк для записи ответов на предложенные в тесте задания; тестируемый отмечает или записывает номера выбранных ответов или сами ответы в определенные позиции бланка.

Валидизация — процедура улучшения валидности теста по результатам оценки валидности критериальной.

Валидность теста критериальная — характеристика теста, отражающая показатель соответствия диагноза и прогноза теста определенным внешним критериям, характеризующим объект измерения.

Валидность теста прогностическая — частный случай валидности критериальной. Отражает эффективность прогноза теста о возможностях испытуемых в будущем.

Валидность теста содержательная — характеристика теста, выражающая показатель охвата заданиями теста той области знания, подготовленность в которой этот тест оценивает.

Валидность сопоставительная (текущая) — частный случай валидности критериальной. Отражает соответствие текущего диагноза теста результатам другого измерения того же объекта.

Валидность теста — комплексная характеристика теста, отражающая его способность измерять именно то, для чего он предназначен. Характеризует возможности генеральной совокупности заданий в тестируемой области знаний несмещенно оценить объект измерений теста.

Валидность теста факторная — характеристика теста, выражающая корреляцию между данным тестом и каждым из выбранных факторов контроля знаний, умений и навыков.

Варианты теста — набор неидентичных тестов, созданных по единой спецификации и имеющих одинаковую структуру.

Время тестирования — интервал времени, отводимого на выполнение теста.

Выравнивание вариантов теста — определенный метод решения комплекса вопросов, связанных с отображением на определенной шкале латентных характеристик всех тестовых заданий (в том числе, составляющих его различные варианты).

Генеральная совокупность тестовых заданий — гипотетическое множество тестовых заданий, связанных общей целью и теоретически полностью отражающих определенную область знаний.

Дистрактор (отвлекающий ответ) — вариант ответа на тестовое , задание закрытого типа, похожий на правильный, но не являющийся таковым.

Дихотомическое (альтернативное) тестовое задание — задание, выполнение которого оценивается только альтернативно: выполнено верно (обычно символизируется единицей) или выполнено неверно (обычно символизируется нулем).

Длина теста — количество тестовых заданий теста.

Задание закрытого типа — тестовое задание, содержание которого сопровождается несколькими номерованными вариантами ответа; испытуемому предлагается выбрать номер правильного ответа.

Задание открытого типа — тестовое задание без указания возможных вариантов ответа; испытуемому предлагается самостоятельно указать правильный ответ.

Задания узловые — тестовые задания, общие для всех или нескольких вариантов одного и того же теста. Используются для выравнивания результатов тестирования с использованием различных вариантов тестов.

Инструкция о проведении тестирования — документ, устанавливающий порядок и организацию тестирования, которые определяются используемой методикой, техническими и организационными средствами и запланированными способами обработки.

Инструкция тестового задания — словесные указания, испытуемому, связанные с выполнением тестового задания (выбором правильного ответа из нескольких вариантов; решением математической задачи и т. п.). Указывается способ записи правильного ответа (что, каким образом и где надо отметить, вписать и т. д.). Инструкция может быть единой для нескольких заданий теста, если эти задания однотипны по действиям.

Ключ тестового задания — правильный ответ для тестового задания.

Коэффициент дискриминации (дифференцирующая способность) тестового задания — количественная характеристика способности тестового задания дифференцировать испытуемых по уровню их подготовленности. Изменяется от -1 до +1.

Логит — единица измерения уровней подготовленности участников тестирования и трудностей тестовых заданий в рамках логистических моделей тестирования. Если разность между упомянутыми двумя понятиями составляет 1 логит, то вероятность верного выполнения таким испытуемым такого задания равна 0,73.

Матрица ответов — прямоугольная таблица, в каждой позиции которой указываются ответы участника тестирования. Обычно номер строки соответствует номеру испытуемого, а номер столбца соответствует номеру задания теста.

Метод Кронбаха — обобщение метода Кьюдера-Ричардсона на случай, когда задания теста не являются дихотомическими.

Метод Кьюдера—Ричардсона — оценка надежности теста, основанная на вычислении по одноименной формуле среднего значения коэффициента надежности, оцененного методом Рюлона при всевозможных расщеплениях теста на две половины; при этом задания теста предполагаются дихотомическими, а само расщепление практически не требуется.

Метод расщепления — оценка надежности теста, основанная на сопоставлении результатов тестирования по двум или нескольким эквивалентным частям теста.

Метод Рюлона — метод оценивания числителя отношения, определяющего коэффициент надежности, по разностям результатов тестирования испытуемых по двум эквивалентным половинам одного и того же теста.

Модель двухпараметрическая — логистическая модель, в которой функция успеха зависит от разности между уровнем подготовленности тестируемого и уровнем трудности тестового задания и от коэффициента дискриминации тестового задания.

Модель однопараметрическая — логистическая модель, в которой функция успеха зависит только от разности между уровнем подготовленности тестируемого и уровнем трудности тестового задания.

Модель тестирования — одна или несколько функциональных зависимостей, гипотетически связывающих подлежащие определению характеристики (параметры) участников тестирования и тестовых заданий с такими величинами, которые реально проявляются в результате выполнения соответствующего теста (например, с вероятностью правильного выполнения испытуемым определенного уровня подготовленности тестового задания определенной трудности).

Модель частичного оценивания — обобщение логистических моделей для политомических тестовых заданий, позволяющее дополнить альтернативное оценивание заданий (выполнено верно, выполнено неверно) оцениванием частично правильного ответа. Определяется количеством категорий ответа, их оценками и видом соответствующих функций успеха.

Модератор — комплексная характеристика контингента испытуемых (возраст, пол, регион и т. п.).

Надежности коэффициент — количественная характеристика надежности, изменяющаяся от 0 до 1; показывает, в какой мере результаты тестирования можно считать реальными, а в какой приписывать влиянию случайных ошибок. Представляет собой отношение дисперсии измеряемого объекта в выборке (обычно истинного балла) к реально полученной полной дисперсии с учетом неизбежных ошибок измерений (обычно тестового балла).

Надежность теста — показатель точности и устойчивости результатов измерения с помощью теста при его многократном применении. Характеризует степень адекватности отражения тестом соответствующей генеральной совокупности заданий.

Нормативная выборка стратифицированная — группа тестируемых, содержащая представителей всех наиболее значимых страт, реально существующих в генеральной совокупности потенциальных испытуемых, причем в той же пропорции.

Параллельные варианты теста — варианты теста, имеющие одинаковые характеристики.

Педагогические измерения — область педагогики, разрабатывающая и применяющая методы и средства измерений и оценки результатов учебной деятельности испытуемых.

План теста — таблица, в которой каждое тестовое задание соотносится с определенным элементом содержания учебного предмета, конкретным видом знаний или умений, позволяющим объективно судить об уровне подготовленности испытуемых. Указывается также планируемое время выполнения каждого тестового задания и всего теста в целом.

Политомическое тестовое задание — задание, выполнение которого допускает несколько категорий ответа, каждая из которых оценивается по-разному (например, полностью верный ответ — 2 балла, частично верный ответ — 1 балл, неверный ответ — 0 баллов).

Пользователь теста — юридическое или физическое лицо, использующее тест или результаты тестирования для оценки уровня подготовленности испытуемых в определенной области.

Предтест (предварительный, пилотный тест) — педагогический тест, априорно соответствующий спецификации, но подлежащий апробации и, возможно, последующей коррекции.

Протокол результатов тестирования — официальный документ о результатах тестирования определенного контингента испытуемых с указанием тестового балла для каждого участника тестирования.

Разрешающая способность теста (РСТ) — длина промежутка на шкале уровня подготовленности испытуемых, соответствующая изменению первичного балла участника тестирования на единицу.

Ретестовый метод — оценка надежности теста, основанная на повторном, желательно многократном его использовании при приближенно одинаковых условиях. Надежность теста характеризуется степенью соответствия полученных результатов друг другу.

Сертификат результатов тестирования — индивидуальный официальный документ государственного образца о результате централизованного педагогического тестирования определенного лица с указанием полученного тестового балла.

Ситуативные переменные — совокупность случайных факторов, влияющих на результаты тестирования (например, место и время проведения тестирования, особенности поведения тестирующего лица, волнение испытуемого и т. д.).

Спецификация теста — документ, в котором содержится информация о целях, задачах, плане и структуре теста, а также указаны основные требования к правилам проведения тестирования, обработки результатов тестирования и их интерпретации.

Стратификация — описание структуры определенного множества объектов (например, генеральной совокупности потенциальных участников тестирования), расслоение его на страты.

Страты — определенные слои в некотором множестве объектов, например, в генеральной совокупности потенциальных участников тестирования. Характеризуются различными программами обучения, региональным представительством, бытовыми условиями и т. п.

Структура теста — совокупность сведений о числе и типе тестовых заданий по каждому элементу содержания учебного предмета и по каждому виду знаний или умений, позволяющих объективно судить об уровне подготовленности испытуемых. Указывается также предполагаемый уровень трудности каждого тестового задания и, по возможности, его коэффициент дискриминации.

Субтест — определенное подмножество тестовых заданий некоторого теста, допускающее независимую обработку результатов тестирования и позволяющее, таким образом, решать специфические частные задачи тестирования. Тест может содержать несколько субтестов, возможно перекрывающихся.

Теория моделирования и параметризации педагогических тестов (ТППТ) — теоретическая основа педагогических измерений, позволяющая ввести метрику шкалы, по которой фиксируются результаты тестирования. Основные задачи: разработка моделей тестирования; проверка адекватности различных предположений тестирования реальной действительности; измерение характеристик тестовых заданий и участников тестирования в виде оценки параметров модели; шкалирование результатов тестирования и оценивание их точности.

Тест аппаратурный — тест с использованием технических устройств для изучения внимания, восприятия, памяти и т. д.

Тест гетерогенный — педагогический тест, проверяющий уровень подготовленности по нескольким родственным дисциплинам.

Тест гомогенный — педагогический тест, проверяющий уровень подготовленности по конкретной дисциплине.

Тест достижений — тест, предназначенный для определения степени освоения испытуемым определенной области знаний или умений.

Тест критериально-ориентированный — частный случай теста, предназначенного для абсолютного тестирования, позволяющий оценить, преодолел ли испытуемый определенный порог усвоения учебного материала рассматриваемый учебной программы или ее части. При этом результаты тестирования сравниваются с некоторым критерием уровня подготовленности.

Тест мономорфный — тест, объединяющий задания одного типа (например, задания закрытого типа).

Тест мощности (тест на сложность) — тест, состоящий из заданий возрастающей трудности. Время выполнения лимитируется мягко. Оценивается в зависимости от уровня трудности верно выполненных заданий.

Тест нормативно-ориентированный — частный случай относительного теста, позволяющий сравнивать учебные достижения (уровень подготовленности) отдельных испытуемых друг с другом или относительно предварительно полученных тестовых норм.

Тест обучающий — педагогический тест, включающий актуальный учебный материал, предназначенный для формирования у обучаемого определенного уровня знаний, навыков, умений и позволяющий осуществлять самоконтроль усвоения материала.

Тест педагогический — совокупность тестовых заданий, позволяющая по результатам их выполнения объективно измерить уровень подготовленности испытуемых по конкретным разделам определенной области знания. Тест педагогический представляет собой конечную репрезентативную выборку из генеральной совокупности калиброванных тестовых заданий.

Тест полиморфный — тест, в котором присутствуют задания различных типов.

Тест репетиционный — тест, позволяющий проверить степень готовности испытуемого к педагогическому тестированию, знакомящий с порядком работы, объемом и сложностью заданий и т. п.

Тест скорости — тест, состоящий из заданий приближенно одинаковой трудности, оценка по которому определяется количеством выполненных заданий в строго ограниченное время.

Тест смешанный — тест, содержащий черты теста скорости и теста мощности. Наиболее распространен при оценке учебных достижений испытуемых.

Тест стандартизованный — педагогический тест, имеющий спецификацию и определенные характеристики, стабильно подтвержденные на представительной выборке испытуемых. Предназначен для многократного использования.

Тестирование абитуриентское — педагогическое тестирование с целью измерения уровня подготовленности абитуриентов ВУЗов.

Тестирование абсолютное — педагогическое тестирование, предназначенное для оценивания уровня подготовленности каждого испытуемого персонально (безотносительно к успехам других) в четко определенной области знаний.

Тестирование аттестационное — педагогическое тестирование по окончании обучения определенного уровня, как правило, основного и полного среднего образования с целью сопоставления уровня подготовленности учащихся с образовательными стандартами и аттестации испытуемых.

Тестирование компьютерное — педагогическое тестирование на компьютере под управлением специальной программы, обеспечивающей нужную презентацию тестовых заданий и обработку результатов тестирования.

Тестирование на бланках — педагогическое тестирование, при котором носителем содержания теста служит бланк определенного образца; дополняется соответствующим бланком ответов.

Тестирование относительное — педагогическое тестирование, предназначенное для сопоставления уровня подготовленности испытуемых в определенной области знаний относительно друг друга или относительно нормативной выборки.

Тестирование педагогическое — совокупность методических и организационных мероприятий, обеспечивающих разработку педагогических тестов, подготовку и проведение стандартизованной процедуры измерения уровня подготовленности испытуемых, а также обработку и анализ результатов.

Тестирование тематическое — педагогическое тестирование с целью измерения уровня подготовленности испытуемых в определенной области знаний, соответствующей законченной теме или разделу учебной дисциплины.

Тестирование централизованное— педагогическое тестирование, проводимое в разных регионах России по тестам и инструкциям, исходящим из единого центра. Обработка результатов тестирования и шкалирование также выполняется в том же центре.

Тестируемый (испытуемый) — человек, проходящий тестирование, с целью оценки его уровня подготовленности в определенной области знаний.

Тестирующее лицо — наблюдатель, инструктор, непосредственно проводящий тестирование и обеспечивающий самостоятельную работу испытуемых в соответствии с инструкцией но проведению тестирования.

Тестовая батарея — совокупность субтестов, объединенных единой методикой использования и направленных на измерение различных сторон сложного объекта.

Тестовое задание — задание специфической формы, элемент теста, минимальная законченная составляющая единица теста.

Тестовое задание в виде логические соотношения — тестовое задание, при выполнении которого предполагается установить логические соотношения между указанными в тестовом задании понятиями.

Тестовое задание на соответствие (тестовое задание перекрестного выбора) — тестовое задание, при выполнении которого необходимо установить соответствие между элементами двух множеств (двух списков).

Тестовое задание на установление правильной последовательности — тестовое задание, выполнение которого состоит в установлении правильной последовательности операций, действий, событий.

Тестовое задание на установление точки зрения — задание с несколькими ответами качественного характера, среди которых нет правильных и нет неправильных; испытуемый выбирает ответ в соответствии со своей точкой зрения по сформулированному в задании вопросу, основываясь на своих склонностях, представлениях и т. п. (примером предлагаемых ответов могут быть следующие: полностью согласен, частично согласен, безразличен, не согласен, категорически не согласен).

Тестовое задание с несколькими правильными ответами — задание, в котором правильных ответов может быть несколько.

Тестовые нормы — наиболее важные статистические характеристики распределения результатов тестирования нормативной выборки испытуемых.

Тестолог — специалист, занимающийся теоретическими и практическими вопросами тестологии.

Тестология — наука, изучающая возможности оценить различные свойства личности с помощью специально разработанных тестов и методов их интерпретации.

Трудность тестового задания (уровень трудности) — основная количественная характеристика тестового задания, не зависящая от выборки испытуемых и отраженная на определенной шкале.

Уровень подготовленности испытуемого — количественная характеристика знаний, навыков и умений участника тестирования по определенному кругу вопросов.

Условия тестирования — окружающая обстановка (готовность помещения, состояние рабочих мест, поведение тестирующих лиц) и другие факторы, оказывающие влияние на процесс тестирования.

Функция успеха для категории ответа — функциональная зависимость, указывающая вероятность выбора данной категории ответа в зависимости от близости этой категории к правильному ответу и уровня подготовленности испытуемого. Определяет модель тестирования для политомических заданий.

Функция успеха для тестового задания — функциональная зависимость, указывающая вероятность правильного выполнения задания в зависимости от характеристик этого задания (уровня трудности и др.) с одной стороны и уровня подготовленности испытуемого с другой. Определяет модель тестирования для дихотомических заданий.

Характеристическая функция заданного уровня подготовленности испытуемых — функция характеристик заданий теста, полученная из функции успеха для тестового задания при фиксированном значении заданного уровня подготовленности испытуемых.

Характеристическая функция заданных параметров тестовых заданий — функция одного переменного уровня подготовленности участников тестирования, полученная из функции успеха для тестового задания при фиксированных значениях характеристик заданий.

Шкала — упорядоченное множество действительных чисел (индексов), соответствующих ряду возможных значений измеряемой величины.

Шкала нормализованная с постоянным шагом — порядковая шкала, индексы которой соответствуют равноудаленным значениям стандартной нормальной переменной с некоторым шагом z (например, десятибалльная шкала с z=0,5).

Шкала нормализованная стандартная — нормализованная шкала типа N (0;1), тестовый балл по которой пропорционален стандартной нормальной переменной с нулевым математическим ожиданием и единичной дисперсией.

Шкала нормализованная типа N (математическое ожидание µ, дисперсия) — порядковая шкала, полученная в результате преобразования эмпирического распределения частот первичных баллов к модельному нормальному распределению N (математическое ожидание µ, дисперсия), где математическое ожидание µ, и дисперсия — параметры шкалы. Тестовый балл по такой шкале определяется отклонением от математического ожидания в единицах стандарта.

Шкала нормализованных процентилей — порядковая шкала, тестовый балл, по которой соответствует квантилям нормального распределения, в частности, квантилям стандартной нормальной переменной с нулевым математическим ожиданием и единичной дисперсией.

Шкала первичных процентилей — порядковая шкала, тестовый балл испытуемого, по которой определяется соответствующей квантилью эмпирического распределения частот первичных баллов участников тестирования.

Шкала процентная — порядковая шкала, тестовый балл испытуемого, по которой прямо пропорционален первичному баллу соответствующего участника тестирования (в частности, равен первичному баллу, выраженному в процентах).

Шкалирование — определенный метод решения комплекса вопросов, связанных с выставлением каждому испытуемому тестового балла по единой шкале вне зависимости от того, в какой группе и над каким вариантом теста он работал.

Не нашли, что искали? Воспользуйтесь поиском по сайту: