Средства контроля диагностических качеств психологических тестов

Лекция

Привет, Вы узнаете о том , что такое средства контроля диагностических качеств психологических тестов, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое средства контроля диагностических качеств психологических тестов , настоятельно рекомендую прочитать все из категории Математические методы в психологии.

В пособии размещен информация, касающаяся одного из главных аспектов разработки психодиагностических методик, а именно средств контроля надежности и валидности тестов. Знание принципов построения и свойств теста как исследовательского инструмента относятся к особо важным в профессиональной подготовке специалистов психологов.Благодаря им обеспечивается научно обоснованное использование психодиагностических методов и квалифицированная интерпретация полученных за их помощью данных. Вместе с развернутым толкованием показателей валидности и надежности Приведены данные о Некоторых вторых принципиальных характеристики психологических тестов.

В пособии размещена информация, касающаяся одного из главных аспектов разработки психодиагностических методик, а именно средств контроля надежности и валидности тестов. Знание принципов построения и качеств теста как исследовательского инструмента относятся к особо важных в профессиональной подготовке специалистов психологов. Благодаря им обеспечивается научно обоснованное использование психодиагностических методов и квалифицированная интерпретация полученных с их помощью данных. В то же время с развернутым толкованием показателей валидности и надежности приведены данные о некоторых другие важные характеристики психологических тестов.

Руководство ориентирован на углубленное изучение курса «Психологическая диагностика» для студентов специальностей «Психология», «Социология» и «Преподаватель-исследователь» и может быть полезным для специалистов, использующих в своей работе психологические тесты или психодиагностическую информацию, а также для всех, кто интересуется проблемами измерения человеческой личности.

содержание

Введение
1. Надежность психологических тестов и способы ее определения
1.1. Определение надежности как показателя качества психологического теста
1.2. Погрешность измерения и надежность теста
1.3. Методики определения надежности психологических тестов
1.3.1. ретестовой надежность
1.3.2. Надежность параллельных форм
1.3.3. Надежность частей теста
1.4. Определение надежности проективных тестов
2. Валидность психологического теста
2.1. валидность содержания
2.2. эмпирическая валидность
2.2.1. критерий валидизации
2.2.2. исходная валидность
2.2.3. конструктной валидность
2.3. коэффициенты валидности
2.4. очевидная валидность
2.5. Валидность проективных тестов
3. Внутренняя согласованность заданий теста
4. Дискриминативнисть заданий теста
5. Показатели тяжести заданий теста

Введение

Практическая психодиагностика относится к ведущим отраслям прикладной психологии; ее цель - разработка средств построения и использования методик измерения качеств личности, ранжирования ее свойств, выявление главных черт, психологических характеристик, особенностей протекания психических процессов, состояний и т. Эта отрасль психологии едва ли не древнейшие традиции в истории научной психологии. Благодаря развитию психологической диагностики в течение последних десятилетий разработано немало направлений психологического обследования личности, появились новые тестовые процедуры, ориентированные на углубленное исследование структур и составляющих индивидуальности. Главными направлениями применения психологических тестов в общественной практике есть сферы обучения, воспитания и подготовки кадров, а также отрасли производства, медицины.

Широкое использование средств измерения психологической индивидуальности обусловливает необходимость в подготовке квалифицированных специалистов по этой специальности. Психологический тест является чрезвычайно сложной исследовательской процедурой. Научно обоснованные выводы, адекватный анализ психодиагностической информации может осуществлять только специалист соответствующего профиля. В кругу необходимых специальных знаний психолога-диагноста ведущее место принадлежит осведомленности в вопросах теории и практики по контролю диагностических свойств имеющихся и впервые разрабатываемых тестовых методик. Информация о надежности, валидность, пределы использования, влияние различных условий обследования обязательно должен предусматривать использование того или иного теста. Знание сути психологических показателей, того, что именно измеряет тест и как хорошо он это делает, позволяют не просто механически следовать инструкциям разработчиков методики, а сознательно относиться к постановке диагноза.

Необходимость сложной подготовительной работы, предшествующей практическому использованию теста, подчеркивали авторы первых психометрических процедур. Особенно подчеркивалась необходимость специальной психометрической подготовки специалиста-исследователя. В этой связи целесообразно, на наш взгляд, привести высказывание А.Шуберта из предисловия к переводу на русский язык шкалы для исследования умственного развития ребенка Бине-Симона: «... Кажущаяся простота метода часто приводит к большим злоупотреблениям, Которые Штерн иронически назвал «бинетизированием».Крайним образцом такового может служит Опубликованная в Германии в 1911 г. работа, в которой рекомендуется ввести употребление шкалы в войсках, поручает исследование унтер-офицерам. Всякое психологическое исследование требует как достаточных психологических знаний, так и экспериментального опыта ... Применяя этот метод, говорил Бине, следует остерегаться всякой механизации: "Это не весы, на которых за пятачок может взвеситься каждый» (А.Шуберт, 1927. - С . 9-10).

В этом пособии рассмотрены вопросы структуры надежности и валидности психологического теста, основные средства их определения, виды показателей, отражающих эти психодиагностические характеристики тестов. В то же время с углубленным анализом надежности и валидности психологических процедур представлена информация о других главные категории контроля диагностического качества отдельных видов психологических тестов (внутренняя согласованность, дискриминативнисть задач, анализ субъективных трудностей при решении отдельных задач, модераторы, пределы использования теста).

1. Надежность психологических тестов и способы ее определения

1.1. Определение надежности как показателя качества психологического теста

Надежность (в англоязычной психологической литературе эквивалентом этого срока является термин «reliability») - это характеристика психодиагностической методики, отражает степень точности измерений, осуществляемых с помощью данного теста, а также устойчивость результатов теста относительно влияния посторонних случайных факторов, которые не являются объ объектами исследования. Как свидетельствуют действующие в США Стандарты разработки учебных и психологических тестов (Standards for Educational and Psychological Tests), надежность и валидность являются важнейшими характеристиками методики как инструмента психодиагностического исследования.

На результат психологического исследования обычно влияет огромное количество неучтенных факторов. Например, состояние эмоциональной сферы, степень усталости исследуемого, мотивационная направленность на исследования со стороны его субъекта, если эти показатели не входят в круг специально испытуемых, а также такие случайные факторы, как освещение в помещении, температура и влажность, уровень шума, час суток и множество других. Любое изменение ситуации исследования усиливает влияние одних или ослабляет действие других. В совокупности влияние неучтенных факторов приводит рассеяния (дисперсию) результатов психологического измерения. Общее рассеяния результатов тестового обследования можно, таким образом, считать результатом влияния двух категорий факторов: изменчивости самого измеряемого психологического явления, черты личности, интеллекта и т.д. и нестабильности самой измерительной процедуры.

В широком смысле надежность теста - это показатель того, насколько обнаружены у подопытных лиц различия в тестовых данных является отражением настоящей различия в измеряемых психологических свойствах, и наоборот, в какой мере они могут быть следствием случайных ошибок и артефактов.

В более узком смысле понятие надежности, непосредственно связано с методиками определения устойчивости показателей теста, является надежность как мера согласованности результатов теста, полученных при первичном и последующем его использовании для одних и тех же испытуемых в разные моменты времени, или при использовании различных (но таких, что можно сопоставлять по результатам) наборов тестовых заданий или при каких-то других изменениях условий исследования.

Распределение оценок, имеющих члены выборки за выполнение теста, который измеряет какую-то одну психологическую характеристику, в идеальном случае теоретически совпадает с нормальным распределением. При этом дисперсия может считаться как «дозтеменна» (то есть такая, что отражает вариативность только показателя, который исследуется). Каждый подопытный занимает свое место, что определяется оценкой теста, и теоретически это место для каждого подопытного из выборки является устойчивым. В этом случае при повторном выполнении теста теми же лицами мы будем наблюдать распределение мест на шкале оценок, идентичен предыдущему. Тогда методика, как инструмент измерения данного психологического фактора, считается точной и максимально надежной. В реальных обстоятельствах оценки и ранговые места испытуемых по каждому следующему исследования могут меняться и распределение ранговых мест той или иной степени отличаться от первичного. Итак, дисперсия нового распределения реально выше «истинную» на значение дисперсии погрешности измерения. Все это можно представить в виде формулы, характеризующий надежность как отношение «истинной» к реальной (эмпирической) дисперсии:

Средства контроля диагностических качеств психологических тестов

где а - надежность теста; S 2 t - «истинная» дисперсия; S 2 e - дисперсия погрешности; S 2 x - эмпирическая дисперсия оценок теста.

Как видим, надежность теста тесно связана с погрешностью измерения, используемая для определения диапазона возможных колебаний измеряемой величины под влиянием случайных и побочных факторов. Размер S 2 t / S 2 х выступает как основной показатель достоверности и устойчивости измерений и называется коэффициента надежности теста (r t).

Средства контроля диагностических качеств психологических тестов

Погрешность измерения находится в обратной зависимости по отношению показателя достоверности (чем шире диапазон значений, в котором предположительно регистрируется результат определенного подопытного, тем меньше точность измерения). Относительную долю дисперсии погрешности легко, исходя из уравнения

Средства контроля диагностических качеств психологических тестов

В большинстве методик, применяемых на практике, редко удается достичь таких коэффициентов надежности, превышающих значение 0,7-0,8. При r t = 0,8 относительная доля стандартной погрешности измерения составляет 0,45 = √ (1 - 0,8), а эмпирическое значение отклонения тестового балла от среднего его значения оказывается завышенным. Для коррекции эмпирического значения в практических исследованиях используют уравнение

Средства контроля диагностических качеств психологических тестов

где х t - достоверное значение тестового балла; X 1 - эмпирический балл испытуемого; r t - коэффициент надежности; х - среднее значение оценок по тесту.

Например, в подопытного при обследовании по шкале Векслера оценка вербального показателя интеллекта равен 107 баллам. Ceредне значение для шкалы составляет 100, надежность r t = 0,89. Вероятное значение х t составит, баллов:

X t = 0,89 * 107 + 0,11 * 100 = 106,2.

Особое значение для правильной интерпретации оценок теста а учетом его надежности имеет показатель погрешности измерения. Остановимся подробнее на раскрытии сути этого критерия.

1.2. Погрешность измерения и надежность теста

Погрешность измерения - это статистический показатель, отражающий степень точности конкретных измерений в выборке.

При проведении эмпирических психологических исследований почти никогда не удается достичь полного совпадения значений измеряемых параметров в различных сериях опытов, даже при использовании выборки, состоящий из тех же испытуемых. Конечно, значение измеряемого показателя флуктуирует в определенных пределах. Например, многократно повторяя тест по выявлению общих способностей в одной и той же ребенка, можно обнаружить, что оценки меняются в определенном интервале - допустим, от 108 до 115 баллов. Аналогично при повторном анализе одной или нескольких выборок среднее значение (х) также распределяется в интервале на оси X.

Колебания результатов измерения в определенном диапазоне значений могут быть связаны с систематическими или случайными факторами. К категории факторов, вызывающих систематические погрешности, можно, в частности, отнести какое-то постоянное и одинаковое отклонение от стандарта проведения теста, к которому прибегает конкретный исследователь, неточности в процедуре обработки первичной информации (например, технические ошибки в «ключи») и др. В этих случаях результаты измерений отличаются от истинных на более или менее постоянную величину. Случайные ошибки возникают из самых разных - объективных или субъективных - причин. Величина случайных ошибок и характеризует главным образом точность метода.

При большом количестве наблюдений Индивидуальные оценки или их средние значения образуют свой распределение, статистические показатели которого отражают погрешность измерения, характерную для. данного метода.

Погрешность измерения - статистическое явление, в определении которого определенную роль играют закономерности, присущие закону нормального распределения. Благодаря случайным ошибкам, которые зависят от огромного количества различных факторов, влияющих на конечный результат, распределение эмпирических оценок и их средних при повторных наблюдениях имеет вид нормального закона. Исходя из основных свойств нормального распределения, можно подсчитать, что примерно 68% измерений располагаются в интервале ± σ, около 95% - в интервале ± 2σ и 99% - в диапазоне ± 2,5σ распределения значений повторных наблюдений. Таким образом, для того чтобы установить, в каких пределах и с какой заранее заданной вероятностью будет находиться настоящая оценка, необходимо определить стандартное отклонение такого распределения. В табл. 1 приведены данные десятикратного обследования одного подопытного с помощью теста общих способностей. Стандартное отклонение

Средства контроля диагностических качеств психологических тестов

в данном случае составляет 3; из этого следует: с вероятностью P = 0,05 (95% от общего количества измерений) можно надеяться, что достоверное значение показателя будет находиться в пределах значений 100 ± 6 баллов, или от 94 до 106 баллов по шкале данного теста (среднее значение измеряемого показателя составляет 100).

Таблица 1. Распределение погрешности измерения общего показателя теста по шкале Векслера

Средства контроля диагностических качеств психологических тестов

Надежность теста можно определить в виде стандартной погрешности измерения (σ m), что также называется стандартной погрешности. В случае интерпретации индивидуальных показателей эта мера является полезнее коэффициент надежности (r t).Исходя из коэффициента надежности стандартную погрешность измерения определяют по формуле

Средства контроля диагностических качеств психологических тестов

где S x - стандартное отклонение результатов теста в выборке; r t - коэффициент надежности, определенный для этой же выборки.

Важным аспектом использования критерия погрешности измерения в психологической диагностике является оценка надежности методики и вероятности ошибки по анализу и интерпретации различий между данными в испытуемых. Представление результатов в виде интервальных возможных значений предостерегает от ошибочного толкования различных результатов как отражение реальной динамики измеряемого свойства у подопытных, а также ошибочной интерпретации разногласий между средними показателями в выборках, что сопоставляются.

При сопоставлении тестовых оценок - при наличии сведений о стандартные показатели погрешности для одного и другого тестов (или субтестов) - стандартную погрешность расхождения можно определить как

Средства контроля диагностических качеств психологических тестов

или то же самое с использованием коэффициента надежности:

Средства контроля диагностических качеств психологических тестов

где S x - стандартное отклонение, в данном случае одинаково для двух тестов.

Для иллюстрации изложенного в разделе приведем такой пример. Допустим, нам необходимо убедиться в том, действительно ли у конкретного испытуемого имеет место расхождение в оценках вербальных и практических субтестов по шкале Векслера, или разница в данных может быть связана с погрешностью измерения. Известно, что для шкалы измерения интеллекта Д.Векслера значение r t вербальных субтестов составляет 0,96, практических - 0,93; значение стандартного отклонения для обеих шкал - 15. Тогда

Средства контроля диагностических качеств психологических тестов

Таким образом, для установления разницы с вероятностью 68% необходима разница в оценках (что будет свидетельствовать о расхождении в результатах) примерно в 5 баллов. При стандартной вероятности P 0,05, принятой предельной для психологических исследований, значение σ д умножается на 2 и получаем около 10 баллов. Иными словами, если в подопытного оценка по вербальной шкале составляет 105, а по практической - 115 баллов, то при стократно повторении исследования лишь 5 раз вероятно произойдет то, что оценки по шкалам будут одинаковыми. Этого будет достаточно для утверждения: конкретный подопытный справляется с вербальными заданиями теста лучше, чем с практическими. Если разница в баллах будет меньше, чем 10, такое утверждение будет считаться недостоверным.

1.3. Методики определения надежности психологических тестов

Нужно, видимо, признать, что ни одна из существующих психодиагностических процедур не является идеальной с точки зрения ее надежности. Показатели надежности теста могут существенно меняться в случае незначительных, на первый взгляд, вариаций условий проведения тестирования, изменения характера тестовых заданий, а также в зависимости от степени сложности задач для подопытного. Стандартный комплекс сведений о психодиагностические методики имеет, конечно, информацию о тех или иных показатели надежности, но подсчитать или определить критерии стабильности результата для одного случая использования того или иного теста практически невозможно.

На характеристики надежности, определяются эмпирическим путем, существенное влияние оказывает характер выборки, которая используется для проверки теста по показателям надежности. Особое значение здесь имеет диапазон расхождения в оценках, точнее в ранговых местах подопытных или их групп в общей выборке. Так, если оценки испытуемых локализоваться в относительно узком диапазоне значений и будут близки друг к другу, можно надеяться, что и в случае повторного исследования эти оценки также будут располагаться плотной гомогенной группой. Возможные изменения ранговых мест отдельных испытуемых будут внешне незначительными. Коэффициент надежности в таком случае будет завышен. Такое же безосновательное завышение коэффициентов может возникнуть в случае анализа надежности, осуществляется на материале выборки, которая состоит из контрастных групп, например из лиц, которые имеют высокие и самые низкие оценки по тесту. Тогда эти отдаленные друг от друга итоге не перекрываться за счет случайных факторов.

В практической психодиагностике при разработке указаний и методических материалов к тесту конечно обусловливается характер групп, для которых определялись показатели надежности. Индексы надежности нередко подсчитываются для контингентов испытуемых, которые отличаются по полу, возрасту, уровню образования, специальности и т. Д. В некоторых случаях показатели надежности подсчитывают отдельно и для высоких и низких оценок теста.

Разнообразие характеристик и показателей надежности теста так же велико, как и разнообразие условий, которые могут влиять на результат теста. Во все же широко практическое применение получили несколько методов характеристики надежности. это:

ретестовой надежность;
надежность параллельных форм теста;
надежность частей теста.

1.3.1. ретестовой надежность

Ретестовой надежность - это средство определения надежности пси-ходиагностичнои методики, при котором показатели точности и устойчивости результатов определяются путем повторного исследования. Надежность в этом случае устанавливается как мера совпадения результатов первого и повторного обследований или как степень сохранности ранговых мест обследованных в выборке по ретест. Коэффициент надежности r t равен коэффициенту корреляции между данными таких обследований. Если в исследуемом тесте для измерения психологического свойства используют количественную интервальную шкалу, то при определении результатов можно применить коэффициент корреляции Пирсона. Для порядковых шкал как меру устойчивости результатов при перетестуванни можно использовать коэффициент ранговой корреляции Спирмена или Кендела.

При определении показателя ретестовой надежности особое значение приобретает выбор интервала ретест, то есть времени, проходит между первичным и следующим опытом. Вполне Естественным является то, что с увеличением этого интервала показатели корреляции между данными исследований приобретают тенденцию к снижению. После прохождения значительного промежутка времени ретест вероятность возникновения побочных факторов существенно возрастает; могут также оказаться последствия вполне закономерных возрастных изменений психологических свойств, измеряемых с помощью теста, могут произойти определенные события, влияющие на состояние и особенности развития исследуемых психологических свойств. По этой причине при определении ретестовой надежности пытаются устанавливать не очень длительные интервалы времени (до нескольких месяцев). При определении надежности методик,

используют для обследования детей младшего возраста, такие интервалы должны быть еще меньше из-за того, что в этом контингенте испытуемых возрастные изменения большинства психологических свойств личности осуществляются интенсивнее. Несмотря на указанную тенденцию, при установлении качества теста проводятся повторные испытания со значительным интервалом ретест, что может составлять несколько лет. Такая процедура используется для оценить не столько ретестовой надежность, сколько определить прогностическую валидность, элементы конструктной валидности, особенно те, которые связаны с так называемой дифференциацией показателей теста по возрастному критерию.

Указанные показатели будут рассматриваться в последующих главах пособия.

По определению ретестовой надежности, то, конечно, ограничиваются анализом кратковременных случайных изменений в результатах, которые и характеризуют тест как измерительную процедуру. Интервал ретест подбирают только исходя из определения динамики устойчивости результата методики течение определенного времени. Несмотря на явную простоту определения ретестовой надежности как принципа анализа устойчивости показателей теста, этот способ имеет существенные недостатки. Опишем самые значительные из них.

При повторном использовании одних и тех же задач, особенно в условиях относительно короткого интервала ретест, у подопытных возможно формирование навыков работы с "данной психодиагностических методик. Улучшение показателей под влиянием результатов, возникающие при этом, будет различаться степенью проявления в отдельных испытуемых в зависимости от их индивидуальных особенностей .. Это приведет к заметной изменения ранговых мест отдельных испытуемых и - соответственно - к искусственному уменьшению коэффициента надежности. К еще более заметного влияния на результаты анализа надежности приводит запоминания подопытными отдельных решений или ответов. В этом случае человек отражает в повторном исследовании предварительное распределение правильных и ошибочных решений. По этой причине результаты обоих случаев использования теста не будут независимыми друг от друга, показатель корреляции между ними окажется искусственно завышенным.

Одним из путей уменьшения влияния фактора тренировки на оценку ретестовой надежности может стать предварительное формирование устойчивого навыка к работе с данной методикой. Но при таком подходе количество повторов теста неизбежно будет расти, что приведет к увеличению количества решений, которые запоминаются подопытным. Такие меры могут быть рекомендованы только для методик типа тестов скорости (speed test), состоящие из большого количества внешне одинаковых задач.

Для других методик единственным приемлемым путем снижения влияния тренировки является увеличение интервала ретест. Однако, как было указано, увеличение этого интервала вступает в противоречие с определением надежности как характеристики теста, а не как меры устойчивости самого психологического конструкта.

Для большинства тестов общих способностей характерно постепенное улучшение показателей ретестовой надежности в старших контингентов испытуемых. Это является следствием тщательного контроля условий выполнения теста, конечно, легче реализовать при работе с подопытными старшего возраста. Другим фактором, приводит к таким изменениям вычислительных показателей ретестовой надежности, является относительное замедление с течением времени темпов развития. При измерении показателей надежности с помощью повторного тестирования в возрастных группах, подвержены относительно слабых динамических изменений исследуемой психологической черты, будет зарегистрировано менее случайных колебаний результатов в промежутке между опытами. Существование этой закономерности требует отдельных определений ретестовой надежности для различных возрастных групп испытуемых. Особенно существенное это для тестов, предназначенных для исследований в широком возрастном диапазоне. К таким методикам преимущественно относят батареи тестов интеллекта широкого назначения (таких, как шкала Станфорд-Бине, детские шкалы Векслера, Матрицы Равена, тест структуры интеллекта R.Amthauer и некоторые другие). Заметим, что относительное улучшение показателей надежности с возрастом обследуемых не является универсальным законом. Вполне естественно - с этим приходится считаться при определении надежности тестов, предназначенных для пожилых людей, - влияние факторов различного темпа инволюционных изменений, наоборот, способствовать ухудшению показателей надежности в старших возрастных группах.

Приведенные особенности и недостатки метода разрахунку надежности путем ретест приводят к тому, что такой подход может считаться пригодным лишь для ограниченного круга методик, для которых возможно многократное использование одного и того же комплекса задач. К таким методам можно отнести сенсомоторные пробы, уже упомянутые тесты скорости, а также ряд других, отличаются большим количеством тестовых заданий (например, Миннесотский многофакторный опросник личности).

1.3.2. Надежность параллельных форм

Попытка компенсировать часть недостатков метода определения надежности путем ретест привела к разработке средства надежности параллельных форм. При этом используется такая процедура. Одни и те же испытуемые с выборки определения надежности исследуются с основным вариантом теста, а затем - с каким-то заданным интервалом ретест - с использованием вспомогательного набора, которым может стать параллельная или совместная форма теста. Понятие параллельной формы теста требует дополнительного объяснения. В такой формой обычно понимают близок к первичному по критериям надежности и валидности, а также по другим психодиагностическими характеристиками вариант теста. Последний разрабатывается с целью эквивалентной замены первичного теста. Разработка нескольких модификаций одного и того же теста, которые различаются по конкретным составом тестовых заданий, ориентированная на повышение достемен ности повторного тестирования одних и тех же испытуемых через небольшие интервалы ретест. Приведем пример. Перед практическим психодиагностическим исследованием стоит задача выяснить характер психофармакологического действия разработанного препарата на эмоциональную сферу пациентов. Для этого перед приемом лекарств больным предлагается ответить на вопрос опросника, предназначенного для измерения некоторых особенностей эмоциональных состояний. Через некоторое время после начала действия препарата процедура обследования повторяется. При повторном использовании одних и тех же пунктов (заданий, вопросов) имеет место опасность проявления тенденции у испытуемых отражать в своих ответов не текущее состояние, а припоминание того что отвечалось на те же вопросы в предыдущем обследовании. Естественно, это приведет к искажению результатов. Использование в двух вариантах разных, но эквивалентных по определяемыми показателями наборов задач позволяет минимизировать негативное ретестовой влияние.

Несмотря на то, что параллельная форма теста добирается таким образом, чтобы оба варианта теста были максимально совместимыми с главными диагностическими характеристиками, выбранные варианты теста не всегда имеют одинаковые средние показатели и стандартное отклонение. В этом случае обязательным условием для параллельной формы теста является обеспечение возможности приведения показателей обеих форм друг к другу с помощью специальных коэффициентов, или таблиц евкивалентности.

Параллельные формы теста следует отличать от так называемых уравновешенных форм, состоящих из задач, которые попарно подбирают таким образом, чтобы был соблюден принцип наиболее возможной совпадения структуры и состава задач. Параллельные и уравновешенные формы, в свою очередь, следует отличать от эквивалентных форм. Последние могут состоять из различных по сути задач, но давать достаточно близки по количеству или по сути статистические выводы. Общий термин, объединяющий приведены варианты тестов - сопоставлены формы. В американской психологической литературе употребляются несколько иные наименования разновидностей сопоставленных форм - коррелированы (correlated), дублированные (dubiicated), уровни (equal) и подобные (similar).

Самые известные и распространенные в отечественной психологической диагностике методики, имеют Парал ;. ли формы - опросник личности Айзенка, тест R.Amthauer'a и некоторые другие.

Наличие одного из видов параллельных форм - важное качество теста, за счет которой обеспечиваются большие удобства его использования в прикладных исследованиях. В то же время определенный круг методик не требует таких форм. К ним можно отнести большие по объему задач тесты. По повторного использования таких методик становится малозаметным влияние навыков или упоминавшихся вариантов ответов. Параллельные формы не нужны также для тестов скорости.

Достаточно простым и распространенным средством повышения достоверности результатов повторного исследования с помощью методик, не имеющих параллельных форм, является расщепление совокупности пунктов на парные и непарные по

продолжение следует...

Продолжение:

Часть 1 Средства контроля диагностических качеств психологических тестов
Часть 2 1.3.3. Надежность частей теста - Средства контроля диагностических качеств психологических
Часть 3 2.2. эмпирическая валидность - Средства контроля диагностических качеств психологических тестов
Часть 4 2.3. коэффициенты валидности - Средства контроля диагностических качеств психологических тестов
Часть 5 5. Показатели тяжести заданий теста - Средства контроля диагностических качеств

Ответы на вопросы для самопроверки пишите в комментариях, мы проверим, или же задавайте свой вопрос по данной теме.

Средства контроля диагностических качеств психологических тестов

Введение

1. Надежность психологических тестов и способы ее определения

1.1. Определение надежности как показателя качества психологического теста

1.2. Погрешность измерения и надежность теста

1.3. Методики определения надежности психологических тестов

1.3.1. ретестовой надежность

1.3.2. Надежность параллельных форм

Продолжение:

Комментарии

Оставить комментарий

Математические методы в психологии

Термины: Математические методы в психологии