:: Статьи :: :: Здоровое питание :: :: Травоведение :: :: Внешность :: :: Лекарства ::
:: Общая медицина :: :: Педиатрия :: :: Лекарства :: :: Косметология :: :: Факты ::
:: Возраст :: :: Социология :: :: Психика :: :: Вес :: :: Зависимость ::


Главная страница --> Познавательные медицинские публикации

Тесты специальных способностей и дос .. | 51. Долой живот .. | Краткая история дефектологической ди .. | Структурный анализ .. | Одаренность и ее структура .. |


Надежность теста


НАДЕЖНОСТЬ — одно из трех главных психометрических свойств любой измерительной психодиагностической методики (теста). Надежность — это помехоустойчивость теста, независимость его результатов от действия всевозможных случайных факторов. К числу таких факторов следует отнести:

—      разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому (время суток, освещенность, температура в помещении, наличие посторонних звуков, отвлекающих внимание и т. п.),

—      динамичные внутренние факторы, по-разному действующие на разных испытуемых в ходе тести рования (время так называемой «врабатываемости» — выхода на стабильные показатели темпа и точности действий после начала тестирования, скорость утомления и т. п.),

— информационно-социальные обстоятельства
(различная динамика в установлении контакта с пси
хологом или лаборантом, проводящим тестирование;
возможное наличие других людей в помещении;
наличие предыдущего опыта знакомства с данным
тестом; наличие какого-то знания и отношения к

тестам вообще и т. п.).

Разнообразие и изменчивость всех этих факторов так велики, что они обусловливают появление у каждого испытуемого непрогнозируемого по размерам и направлению отклонения измеренного тестового балла от истинного тестового балла (который можно было бы в принципе получать в идеальных условиях). Средняя относительная величина этого отклонения определяется как «стандартная ошибка измерения» ( Se ). Величина ошибки измерения указывает на уровень неточности или ненадежности тестовой шкалы (специально подчеркнем, что в психометрической теории надежность и точность оказываются синонимами).

ОШИБКА ИЗМЕРЕНИЯ ( Se ) и надежность измерения ( R ), согласно общепринятой психометрической теории, связаны следующей формулой:

(1) R -1 — Se 2 / Sx 2 ,

*

где S — дисперсия тестовых показателей X .

Формула (1) является чисто теоретической, и на ее основе нельзя подсчитать надежность теста, так как величина Se оказывается также неизвестной величиной. Поэтому на практике применяют корреляционные методы- Самый известный из них — метод перетестирования (тест-ретест) или метод измерения «РЕТЕСТОВОЙ НАДЕЖНОСТИ». На одной и той же выборке испытуемых (не менее 30 человек, участвующих в пилотажном психометрическом экспериментальном исследовании) проводят первое тестирование X , а затем повторное тестирование Y . Интервал, как правило, — две недели, что гарантирует забывание вопросов теста.

Затем для двух рядов значений X и Y подсчиты-вается, например, линейный коэффициент корреляции (возможный и нередко более корректный вари-

ант — подсчитывать ранговый коэффициент корреляции):

(2) R -* ВД» •

где Sx , S — стандартные отклонения X и Y ,

Cov ( X , Y ) — ковариация двух переменных X и Y .

В этой книге мы не ставим целью научить студентов-педагогов корреляционным методам и пытаемся изложить лишь принципиальную суть дела. Интересующиеся найдут все необходимые формулы и вычислительные примеры в любом учебнике по статистике, а также в специализированных изданиях по психодиагностике и психометрике («Общая психодиагностика», 1987; Клайн, 1994).

Что важно для сути теории надежности тестов, так это возможность определить ошибку измерения после того, как подсчитана корреляция «тест-ретест» по формуле (3), полученной путем простого преобразования формулы (1):

(3) Se = Sx - Vl — R

Таким образом, если стандартное отклонение в тесте составило 10 очков (среднее отклонение, которое в среднем допускают испытуемые от среднего балла для выборки), а корреляция «тест-ретест» оказалась равной лишь 0,5, то ошибка измерения оказывается очень большой:

Se = 10* V 1 - 0,5 ~ 7.1.

То есть оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И

если испытуемый набрал на 6 очков больше, чем «средний» испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения.

Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью, и его нельзя использовать как измерительный инструмент.

Показатель надежности R , который принято считать достаточно высоким, равен или превышает 0,95. Хотя в личностных тестах часто пользуются значительно менее надежными тестами с показателями 0,8 — 0,9.

Метод измерения «ретестовой надежности» пригоден только для психических свойств, стабильных во времени. Надежность тестов на психические состояния и динамичные установки личности нельзя проверить таким образом. В этом случае применяют различные методы «расщепления» теста на отдельные пункты, освещение которых выходит за пределы настоящего пособия.



Похожие по содержанию материалы:
1.3. ИСТОРИЯ ПСИХОДИАГНОСТИКИ ..
Парные сравнения и сортировка ..
2.6. ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ШКОЛЬНОЙ ПСИХОДИАГНОСТИКИ, КОМПЬЮТЕРИЗАЦИЯ ..
ЧАСТЬ 2 ПРАКТИЧЕСКИЕ ЗАДАЧИ ШКОЛЬНОЙ ПСИХОДИАГНОСТИКИ
3. ПСИХОДИАГНОСТИКА • И ОБРАЗОВАНИЕ
3.
..
Тесты специальных способностей и достижений ..
51. Долой живот ..
Краткая история дефектологической диагностики ..
Структурный анализ ..
Одаренность и ее структура ..
Лечение хронического неязвенного колита ..
3.5, ДИАГНОСТИКА УМСТВЕННОГО РАЗВИТИЯ И ПРЕДМЕТНОЙ УСПЕВАЕМОСТИ УЧАЩИХСЯ ..
Диагностика учебных достижений ..
3.7. ОПЕРАТИВНОЕ ТЕСТИРОВАНИЕ ЗНАНИЙ ..

Задержитесь, пожалуйста, еще на минутку и обратите внимание на очень похожие материалы:


Валидность теста

Соответствие теста измеряемому психическому свойству называется ВАЛНДНОСТЫО теста. Это, без преувеличения, важнейшее психометрическое свойство теста. Если высокая надежность теста говорит нам о том, что тест действительно «что-то» измеряет, то высокая валидность указывает.на то, что тест измеряет именно то, что мы хотим. Конечно, на валидность теста также негативно влияют случай-

ные фак .. читать далее




Стандартизация тестов

Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста — это понимать, что такое тестовые нормы и как ими пользоваться.

Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной пс .. читать далее




Достоверность теста

Особой разновидностью валидности является ДОСТОВЕРНОСТЬ, которая не всегда выделяется в учебниках по психодиагностике, хотя требует специальных усилий и процедур по обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит в тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая пуща ему в реальном поведении. Сп .. читать далее




2.4. МЕТОДИКИ ШКАЛИРОВАНИЯ И САМООЦЕНКИ

Очень широко используются в школьной практике методики шкалирования. Наиболее простые из них привлекают школьных психологов именно простотой проведения, прозрачностью интерпретации, возможностью как бы заглянуть во внутренний мир ребенка.

В отличие от экспертных оценок, которые дают преподаватели ребенку, мы говорим в данном случае о том, что сам ребенок оценивает либо какие-то объекты в .. читать далее






Яндекс.Метрика Rambler's Top100