Надежность результатов

Надежность - это постоянство результатов тестирования. Если тест социальных умений в первый раз показывает, что вы очень обаятельны, а по прошествии недели тот же тест признает вас социально неспособным, то он ненадежен. Для определения чего бы то ни было важно, чтобы измерительный инструмент был постоянным. Некоторые психологические тесты, такие как знаменитый тест Роршарха с чернильными пятнами, не предоставляют очень надежных измерений; другие, например тесты интеллекта, дают гораздо более постоянные результаты. Но даже если тест надежен, это еще не значит, что он валиден. Валидность - это степень, в которой тест измеряет именно то, что он должен измерять. Возьмем, например, такой параметр, как цвет глаз, и попробуем с его помощью определить, насколько мы привлекательны для противоположного пола. На первый взгляд, этот тест выглядит очень надежным: опытные наблюдатели будут вполне согласованно отвечать на вопрос, у кого из испытуемых голубые, зеленые или карие глаза; и цвет глаз у испытуемых через месяц или два, конечно, сильно не изменится. Однако цвет глаз скорее всего не будет валидным показателем привлекательности: его, например, никак нельзя будет сопоставить с числом свиданий данного человека в прошлом году. С другой стороны, если испытуемые оценивали все лицо человека или просматривали видеозапись его разговора, то показатели могут быть чуть менее надежными, но более валидными, когда мы говорим о привлекательности человека для потенциальных партнеров.

Надежность и валидность важны независимо от того, какой метод мы применяем. Например, архивные записи о различиях в возрасте при вступлении в брак мужчин и женщин в разных культурах дают постоянно одни и те же данные. Эти данные довольно надежны. И все же регистрации браков за один месяц в маленьком городе окажутся ненадежным источником. Что касается валидности, то три различных типа опросов могут показать один и тот же результат: люди якобы постоянно используют вторичное сырье и сравнительно редко ездят на автомобилях. И все же эти данные, хотя они и надежны, могут не быть валидными: не лгут ли опрашиваемые, говоря, например, о своих привычках вождения или использования вторичного сырья? Поэтому применительно к каждому исследованию важно задать следующий вопрос: получим ли мы те же результаты, если измерение будет проводиться иначе или с другим наблюдателем? И действительно ли исследователь изучает то, что он или она собираются изучить?