Тесты в процессе разработки программного обеспечения. Диагностические методы исследования в социальной работе. Тестирование

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

  • Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
  • Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
  • Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
  • После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

  1. дизайн и разработка
  2. тестирование
  3. реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

  1. Планирование
  2. Анализ рисков
  3. Разработка
  4. Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

  • Участие в Scrum планировании
  • Поддержка в юнит-тестировании
  • Тестирование пользовательских историй
  • Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
  • Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

  • Оценка усилий, необходимых для каждой пользовательской истории является обязательной
  • Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
  • Риск регрессии возрастает вместе с частыми изменениями в коде
  • Одновременность планирования и выполнения тестов
  • Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Контрольные испытания помогают: выявить уровень развития отдельных двигательных качеств; оценить степень технической и тактической подготовленности; сравнить подготовленность как отдельных занимающихся, так и целых групп; провести наиболее оптимальный отбор спортсменов для занятий тем или иным видом спорта и для участия в соревновании; вести в значительной степени объективный контроль за тренировками, как отдельных спортсменов, так и целых групп; выявлять преимущества и недостатки применяемых средств, методов обучения и форм организации занятий; составлять наиболее обоснованные индивидуальные и групповые планы занятий.

Контрольные испытания проводятся с помощью контрольных упражнений, или тестов. Определенная система использования контрольных упражнений называется тестированием.

Контрольные упражнения - это стандартизированные по содержанию, форме и условиям выполнения двигательные действия, применяемые с целью определения физического состояния занимающихся на данный период обучения. Контрольные упражнения могут применяться и как обычные физические упражнения.

В исследованиях, как правило, применяют не одно контрольное упражнение, а несколько. Например, при изучении специальной подготовленности спортсмена применяют тесты, характеризующие уровни развития специальных двигательных качеств, технической, тактической подготовленности и т. п.

При том, что контрольные упражнения помогают определить физическое состояние человека, его готовность к физическим упражнениям

Достоверность любых контрольных упражнений проверяется таким комплексным показателем подготовленности занимающихся, как оценочные результаты той деятельности, которая являлась предметом специальной подготовки (например, для выступления на соревнованиях).

Приступая к исследованию, следует предварительно разработать систему контрольных упражнений. Сложность разработки зависит от характера «основной» деятельности. Несколько проще создавать систему контрольных упражнений для видов спорта, в которых результаты оцениваются метрическими единицами, поскольку при наличии объективных единиц измерения можно использовать математические расчеты для установления избирательности и воспроизводимости контрольных упражнений.

Билет 17

Вопрос 1. Методы использования слова

С помощью слова учитель осуществляет многие функции, составляющие его конструктивную, организаторскую и другие стороны деятельности, а также устанавливает взаимоотношения с учениками, общается с ними. Слово активизирует весь процесс обучения, так как способствует формированию более полных и отчетливых представлений, помогает глубже осмыслить, активнее воспринять учебную задачу. Через слово ученик получает новые знания, понятия и их терминологическое определение, что во многом определяет его отношение к физическому воспитанию в целом и к изучаемому упражнению в частности. С помощью слова учитель анализирует и оценивает результаты освоения учебного материала и тем самым способствует развитию у ребенка самооценки. Наконец, без слова учитель был бы не в состоянии руководить всем процессом обучения и поведения учеников. Таким образом, учитель физического воспитания имеет возможность использовать две функции слова: смысловую, с помощью которой выражается содержание преподаваемого материала, и эмоциональную, позволяющую воздействовать на чувства ученика.

Грамотность употребления терминов обусловлена знанием некоторых общих требований к ним:

Термин должен быть показательным, т. е. отражающим основу техники физического упражнения. Тогда он приобретает только ему свойственное содержание. Показательность термина достигается двумя способами: чаще отражением в названии физического упражнения структуры действия (прыжок в высоту с разбега способом «перешагивание»).

Термин должен быть точным.

Термин должен быть понятным. Терминология становится языком обучения в том случае, если употребляемые слова-термины доступны пониманию учеников.

Термин должен быть кратким. Если нарушается это требование, то термин превращается в описание, а следовательно, теряет свое назначение.

Эмоциональная функция слова способствует решению и учебных, и воспитательных задач. Эмоциональность речи усиливает значение слов и помогает понять их смысл. Она показывает отношение учителя к предмету изучения, к самим ученикам, что, естественно, стимулирует их интерес, уверенность в своем успехе, желание преодолеть трудности и т. п.

Почти все разновидности методов использования слова являются общепедагогическими. Использование их в процессе физического воспитания отличается лишь содержанием и некоторыми особенностями методики применения.

Рассказ - повествовательная форма изложения - чаще всего применяется учителем при организации игровой деятельности учеников.

Описание - это способ создания у ребенка представления о действии. При описании дается перечень характерных признаков действия, говорится, что надо делать, но не указывается, почему надо так делать. Используется оно при создании первоначального представления или при изучении относительно простых действий, когда ученики могут использовать свои знания и двигательный опыт.

Объяснение является важнейшим способом развития сознательного отношения к действиям, так как призвано вскрывать основу техники, отвечать на главный вопрос: «Почему?»

Беседа помогает, с одной стороны, повысить активность, развить умение высказывать свои мысли, а с другой - узнать учителю своих учеников, оценить проделанную работу. Беседа может протекать в виде вопросов учителя и ответов учеников или в виде свободного выяснения взглядов. Вторая разновидность более активна, но доступна ученикам с высоким уровнем знаний и двигательного опыта.

Разбор отличается от беседы только тем, что проводится после выполнения какого-либо задания (например, игры). Разбор может быть односторонним, когда его проводит только учитель, или двусторонним - в виде беседы с участием учеников. Вторая форма позволяет решать образовательные и воспитательные задачи более эффективно.

Заданиепредусматривает постановку задачи перед уроком или частных задач по ходу урока. Первая форма задания характеризуется тем, что учитель объясняет все способы выполнения задачи, ученикам остается лишь выполнить требуемое. Вторая форма является более сложной для учеников, так как они получают от учителя лишь формулировку задачи, а способы ее решения вынуждены искать самостоятельно.

Указание (или распоряжение) отличается краткостью и требует безоговорочного исполнения. Это акцентирует внимание учеников на необходимости выполнения задачи и одновременно повышает уверенность в возможности ее выполнения. Через указания ученики получают точную ориентацию в способах решения задачи, в приемах исправления ошибки, но без обоснования.

Оценка является результатом анализа выполнения действия. Критерии оценки зависят от задач учебного процесса, а поэтому имеют несколько разновидностей:

· Оценка путем сравнения со стандартной техникой исполнения применяется, как правило, на начальных этапах обучения, когда возможности учеников ограничены способностью подражать образцу.

· Оценка путем сравнения с техникой исполнения другого ученика является своеобразной конкурсной оценкой. Она призвана стимулировать интерес ученика к упражнению, к систематическим занятиям, но часто не может служить показателем качества исполнения.

· Оценка путем определения результативности действия обладает, как правило, наибольшей дидактической ценностью. Она заставляет ученика сопоставлять технику своего исполнения с достигнутым результатом и искать способы ее индивидуализации.

· Категории оценки выражаются в различного рода замечаниях учителя, отражающих его одобрение или неодобрение: «хорошо», «правильно», «так», «плохо», «неправильно», «не так», а также в форме инструктивных указаний: «выше ноги», «не сгибать руки» и т. п.

· Подобные односложные замечания должны мотивироваться учителем. Правда, одобрение уже само по себе имеет положительное значение, так как подтверждает правильность действий ученика. Однако и в этом случае пояснение учителя, что именно заслуживает похвалы, будет иметь большое дидактическое значение, причем не только для выполнявшего упражнение, но и для наблюдавших за ним товарищей.

· Оценка учителя обязана быть средством воспитания в ученике уверенности в своих силах. Поэтому оцениваться должны успехи или неудачи в освоении учебного материала, отношение к работе, но ни в коем случае не личность ученика.

Команда - специфический и наиболее распространенный метод использования слова в физическом воспитании. Она имеет форму приказа к немедленному исполнению действия, к его окончанию или к изменению темпа движений. Применяются строевые команды, принятые в армии, и специальные - в виде судейских реплик, стартовых команд и т. п. При работе с детьми дошкольного возраста команда не применяется, а при работе с детьми младшего школьного возраста используется с ограничениями. На эффективность команды влияют: умение правильно и с необходимыми ударениями произносить слова, развитое чувство ритма речи и движений учеников, способность изменять силу и тон голоса, красивая осанка и умеренная жестикуляция, высокий уровень дисциплинированности учеников.

Подсчет позволяет задавать ученикам необходимый темп выполнения движений. Осуществляется он несколькими приемами: голосом с применением счета («раз-два-три-четыре!»), счетом в сочетании с односложными указаниями («раз-два-выдох-выдох!»), только односложными указаниями («вдох-вдох-выдох-выдох!») и, наконец, различными сочетаниями счета, постукивания, похлопывания и т. п.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Тестирование как метод психологических исследований

тестирование интеллектуальный психический личность

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагогике и других науках о человеке это слово употребляется в качестве термина, обозначающего систему заданий, подобранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверяются, используются и интерпретируются по строгим и независящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влияния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это такое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицированно, по одному и тому же стандарту. Тем самым обеспечивается определенная гарантия уравнивания ситуативных факторов, способных поставить часть испытуемых в более выгодное положение по сравнению с остальными. Без стандартизации становится невозможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуальных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих количество выполненных заданий, в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуемый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколько заданий следовало бы выполнить, чтобы засвидетельствовать высокий уровень интеллекта?

На все эти вопросы невозможно дать ответ, не имея единой для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования многочисленной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической норме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормативом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим характеристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития метода тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индивидуальных различий между людьми. Так, в Китае более четырех тысяч лет назад высшие чиновники обязаны были выдержать в присутствии императора строгий экзамен по знанию ритуалов и церемоний, стрельбе из лука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбираться в финансах, законах, сельском хозяйстве. В библии описаны своеобразные способы отбора воинов на особо трудные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весьма подробные классификации характеров и закономерности их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое исторически предшествовало тестированию, возникновение научных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропометрических тестов Френсисом Гальтоном (1822 -1911), занимавшимся исследованием остроты зрения и слуха, мускульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной американским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии статистически обрабатываемых заданий к большому количеству индивидов как ничто другое способствует преобразованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуации обследования.

Кеттелл разработал несколько десятков тестов, направленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроизводимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства образования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявления заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляющим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае, если ребенок решал лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания решены) прибавлялось несколько месяцев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходили до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась разность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотношение (частное) умственного и хронологического возрастов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффициента интеллекта (IQ).

Заметим, что в большинстве современных тестов интеллекта принята иная процедура определения коэффициента, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на применении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке возникла необходимость массовых обследований призывников на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые групповые тесты - «альфа» и «бета». Одна из форм предназначалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на малограмотных и иностранцев. Эти тесты были значительно упрощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирования во всем мире. При этом, наряду с тестами общего интеллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагностической практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происходит становление психодиагностики личности, осуществляемой при помощи тестов, опросников, проективных методик.

Именно тогда на несколько десятилетий были прекращены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса методов психологии, анатомии, физиологии, медицины и педагогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психологического исследования. Динамично развивается его инструментарий, непрерывно совершенствуются способы обработки и интерпретации информации.

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иногда печатают так называемые «популярные тесты». В отечественной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не установлены.

Надежность - это помехоустойчивость теста, независимость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими своими оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отличающимися от полученных ранее. Надежность является характеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

Разнообразие ситуационных условий испытания, меняющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних помех, непредусмотренное присутствие других людей, вариативность освещенности помещения и температуры воздуха и т. д.);

Несовершенство разработанного теста (нечеткость инструкций, принципиальная разнородность заданий, допущение элементов субъективизма при интерпретации выполнений и т. д.);

Изменения внутренних состояний испытуемых (усталость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них освещает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению типов надежности, заметим, что процедура исчисления значений коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении которых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как самостоятельный метод, укажем лишь одно: величина коэффициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1. Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени между тестированиями небольшой, то заметно влияние эффекта тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуемый признак. Тем не менее, ретестовая надежность является важной характеристикой, она позволяет установить степень независимости результатов тестирования от воздействий проводящих его людей, а также от возможных изменений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой надежности был не ниже 0,80. В противном случае точность измерения недостаточна, процедура тестирования нуждается в дополнительной стандартизации.

2. Надежность частей теста, которая характеризует степень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест отражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непротиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания делятся на четные и нечетные. Результаты выполнения людьми тех и других обрабатываются отдельно, а затем сопоставляются.

Тест считается надежным, если полученный при сопоставлении коэффициент превышает 0,75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходимо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержанию являются весьма сходными, но не идентичными, напоминая варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а другой - вторая. Через некоторое время производится повторное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0,75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из параллельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного качества - валидности.

Валидность (от англ. «действительный», «пригодный», «имеющий силу») - комплексная характеристика теста, указывающая на обоснованность и эффективность его применения.

В классической тестологии выделяется множество типов валидности. Проанализируем наиболее распространенные из них.

Такая валидность имеет особое значение в критериально-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесения результатов теста с базовыми для него теоретическими понятиями (конструктами). Определяется, когда предмет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени понимания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня только те пункты, которые относятся к «пониманию речи»:

Ребенок может ответить на вопросы;

Он очень внимателен при слушании;

Он может пересказать услышанное своими словами;

Он может дословно запомнить текст с первого раза;

Он может составить план текста;

Он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматриваемому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:

Валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;

Валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

Ориентированные на статистическую норму;

Критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса.

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического (х) и стандартного отклонения (у). Оба они получается путем несложных расчетов:

формула среднего арифметического и стандартного отклонения

Где n - число членов выборки, ?N - сумма полученных ими результатов, ?d - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения (х ± у) находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы (х ± у), находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

Соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других».

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

Интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;

Способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;

Достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);

Личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;

Межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

Вербальные, материал которых представлен в словесной форме;

Образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;

Практические, выполняемые при манипулировании реальными объектами или их заместителями;

Комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

Скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;

Результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

2) стандартизацией процедур применения и интерпретации;

3) опорой на содержание определенной научной концепции, теории;

4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.

5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками», а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.

Размещено на Allbest.ru

...

Подобные документы

    Понятие и виды эксперимента, его организация. Этические проблемы при его проведении. Использование теста для объективной оценки индивидуально-психологических различий. Сущность исследований человека в социальном контексте посредством качественных методов.

    реферат , добавлен 16.02.2011

    Диагностирование развития и функционирования когнитивных психических процессов и состояний, индивидуальных нейрофизиологических особенностей. Изучение эмоционально-волевой и мотивационной сферы. Анализ индивидуально-психологических особенностей.

    курсовая работа , добавлен 24.06.2011

    Понятие о генетической психофизиологии. Роль генетических и средовых факторов в формировании физиологических систем организма и индивидуально-психологических различий личности. Место психофизиологических исследований в системе психогенетических знаний.

    реферат , добавлен 09.12.2014

    Взаимосвязь профессионализма и индивидуальных психологических особенностей личности. Актуальность диагностики профессиональной пригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Понятие личность в психологии, свойства личности.

    курсовая работа , добавлен 14.08.2010

    Группы методов психологических исследований, их классификация. Сущность и основные задачи анкетирования, наблюдения, беседы. Особенности проведения естественного, лабораторного и моделирующего эксперимента. Анализ методов психологических исследований.

    курсовая работа , добавлен 05.03.2012

    Актуальность диагностики профпригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Влияние психологических факторов на эффективность обучения. Различные подходы к пониманию структуры личности. Условия развития способностей.

    контрольная работа , добавлен 15.01.2016

    Психодиагностика как метод психологического исследования. Психологическое тестирование и опрос. Характерологический опросник Леонгарда. Уровень субъективного контроля Дж. Роттера, опросник Р. Кеттела. Индивидуально-типологический опросник Л.Н. Собчик.

    курсовая работа , добавлен 22.01.2012

    Связь методологии и методов в социально-психологическом исследовании. Характеристика избирательного внимания к различным методам в современных социально-психологических исследованиях. Метод наблюдения, тестирование, методика опроса и эксперимент.

    курсовая работа , добавлен 06.01.2015

    Типы и формы зависимого поведения. Психологические риски формирования зависимостей в юношеском возрасте. Представление и анализ индивидуально-психологических особенностей личности юношей и девушек. Задачи многофакторного личностного опросника Р. Кеттела.

    дипломная работа , добавлен 09.10.2013

    Изучение индивидуально-психологических особенностей подростков. Исследование воздействия биологических ритмов на физическую работоспособность школьников. Методики определения хронотипа, анаэробной производительности и уровня тревожности индивида.

Шпаргалка по общей психологии Войтина Юлия Михайловна

15. ТЕСТИРОВАНИЕ КАК МЕТОД В ПСИХОЛОГИИ

Методы психологии – основные пути и приемы научного показания психических явлений и их закономерностей.

В психологии принято выделять четыре группы методов изучения психики.

Одним из видов эмпирических методов является тестирование.

Тест – кратковременное задание, выполнение которого может служить показателем совершенства некоторых психических функций. Задачей тестов является не получение новых научных дачных, а испытание, проверка.

Тесты – более или менее стандартизированные кратковременные испытания свойств личности. Существуют тесты, направленные на оценку интеллектуальных, перцептивных способностей, двигательных функций, личностных особенностей, порога возникновения тревоги, досады в определенной ситуации или интереса, проявляемого к тому или иному виду активности. Хороший тест – результат большой предварительной экспериментальной проверки. Теоретически обоснованные и экспериментально апробированные тесты имеют научное (дифференциация испытуемых по уровню развития того или иного свойства, особенностей и т. п.) и, главное, практическое (профотбор) значение.

Наиболее широко известны и популярны личностные тесты, направленные на определение уровня интеллектуального развития личности. Однако в настоящее время они все меньше и меньше применяются для отбора, хотя первоначально были созданы именно для этого. Такое ограничение применения данных тестов может быть объяснено целым рядом причин. Но именно благодаря их использованию, критике по поводу злоупотребления тестами и мерам, предпринятым для их улучшения, стали значительно лучше понимать сущность и функционирование интеллекта.

При разработке первых тестов были выдвинуты два основных требования, которым должны удовлетворять «хорошие» тесты: валидность и надежность.

Валидность теста заключается в том, что он должен оценивать именно то качество, для которого предназначен.

Надежность теста заключается в том, что его результаты воспроизводятся с хорошим постоянством у одного и того же человека.

Также очень важным является требование нормализации теста. Это означает, что для него в соответствии с данными испытания эталонной группы должны быть установлены нормы. Такая нормализация может не только четко определить группы лиц, к которым может быть применен данный тест, но и располагать результаты, получаемые при тестировании испытуемых, на кривой нормального распределения эталонной группы. Очевидно, было бы нелепо использовать нормы, полученные на студентах университета, для оценки (с помощью тех же тестов) интеллекта детей начальной школы, или применить нормы для детей из западных стран при оценке умственных способностей молодых африканцев или азиатов.

Таким образом, критерии интеллекта в такого рода тестах обусловливаются преобладающей культурой, т. е. теми ценностями, которые первоначально сложились в западно-европейских странах. При этом не учитывается, что у кого-то могут быть совершенно иное семейное воспитание, иной жизненный опыт, иные представления (в частности, о значении теста), а в некоторых случаях и плохое владение тем языком, на котором говорит большинство населения.

Из книги Сознавание: исследуем, экперементируем, упражняемся автора Стивенс Джон

Тестирование реальности Теперь намеренно представляйте, что видит ваш партнер, когда смотрит на вас. Вы, вероятно, так или иначе проделываете это, так что уделите внимание этим образам и начните лучше сознавать их. (…) Что конкретно, по-вашему, он видит и как он реагирует на

Из книги Собеседование от А до Я автора Head Hunter

Тестирование Поиск «правильного» кандидатаБольшинство западных компаний, представленных на российском рынке, приглашая соискателей на вакансии, используют различные тесты. Рассказывает Варвара Лялягина, менеджер по подбору персонала Procter&Gamble: «Мы набираем новых

Из книги Психология труда автора Прусова Н В

3. Задачи психологии труда. Предмет психологии труда. Объект психологии труда. Субъект труда. Методы психологии труда Главные задачи психологии труда:1) совершенствование производственных отношений и повышение качества труда;2) улучшение условий жизни

Из книги 100 cпособов найти работу автора Черниговцев Глеб

8. Метод анкетирования. Метод тестирования. Методы оценки эффективности труда работника Метод анкетирования является наиболее дешевым способом, который может охватить большую группу людей и большую территорию. Основным плюсом является запас времени, предоставляемый

Из книги Характеры и роли автора Левенталь Елена

ТЕСТИРОВАНИЕ Вы ищете работу, и вам довольно часто приходится проходить тестирование, собеседование, иметь непосредственно личный контакт с работодателем. А потому мы считаем нелишним в этой ситуации знать о своих правах, т. е. о том, какие вопросы имеет право задать

Из книги Кризис психоанализа автора Фромм Эрих Зелигманн

ТЕСТИРОВАНИЕ РЕАЛЬНОСТИ Его восхитительная способность тестирования реальности помогает ему подметить неоднородность мира, причем он проявляет одинаковый интерес к его и светлому, и темному началу. Он необычайно точно воспринимает не только окружающий, но и свой

Из книги Социальная психология автора Почебут Людмила Георгиевна

ТЕСТИРОВАНИЕ РЕАЛЬНОСТИ Внутренняя схема эпилептоидов построена на необычайно высокой самооценке, идее превосходства над другими, недоброжелательном отношении к окружающим.Любая информация, поступающая из окружающего мира и проходящая через подобную призму, будет

Из книги Шпаргалка по общей психологии автора Войтина Юлия Михайловна

ТЕСТИРОВАНИЕ РЕАЛЬНОСТИ Восприятие реальности крайне неточно, так как ее рассматривают всегда через призму внутреннего мира, значительно более яркого и значимого. «О том, что происходит кругом них, о ситуации, в которой они находятся, шизоиды обыкновенно имеют

Из книги Избранные работы автора Наторп Пауль

Из книги Методика раннего развития Глена Домана. От 0 до 4 лет автора Страубе Е. А.

Часть I История и предмет социальной психологии Становление социальной психологии Направления зарубежной социальной

Из книги Шпаргалка по социальной психологии автора Челдышова Надежда Борисовна

13. МЕТОД НАБЛЮДЕНИЯ И САМОНАБЛЮДЕНИЯ В ПСИХОЛОГИИ. ЭКСПЕРИМЕНТ В ПСИХОЛОГИИ Наблюдение – это планомерное и целенаправленное фиксирование психологических фактов в естественных условиях повседневной жизни.Существуют определенные требования к организации и проведению

Из книги Французские дети всегда говорят «Спасибо!» автора Антье Эдвига

Из книги автора

Из книги автора

12. Наблюдение как метод социальной психологии Наблюдение – это один из древнейших методов, состоящий в преднамеренном восприятии явлений окружающей среды с целью сбора данных определенного рода.Отличия научного наблюдения от обыденного:1) целенаправленность;2) четкая

Из книги автора

15. Тестирование как метод социально-психологической диагностики Тестирование – стандартизованное, обычно ограниченное во времени испытание, с помощью которого измеряется уровень развития или степень выраженности некоторых психических свойств личности, групп или

Из книги автора

Тестирование «Я получил высший бал на тестировании»Тестирования проводятся в школах для сравнения уровня образования детей одной возрастной группы в западных странах. Родители с трепетом ждут объявления оценок. «Хорошо воспитанный» ребенок должен быть не только

Тестирование – это исследовательский метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий. Такие задания принято называть тестами. Тест – это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности. Она должна быть соотносима с установленными для данной категории испытуемых нормами.

Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период.

Существуют определенные правила проведения тестирования и интерпретации полученных результатов. Эти правила достаточно четко проработаны, и основные из них имеют следующий смысл:

1) информирование испытуемого о целях проведения тестирования;

2) ознакомление испытуемого с инструкцией по выполнению тестовых заданий и достижение уверенности исследователя в том, что инструкция понята правильно;

3) обеспечение ситуации спокойного и самостоятельного выполнения заданий испытуемыми; сохранение нейтрального отношения к тестируемым, уход от подсказок и помощи;

4) соблюдение исследователем методических указаний по обработке полученных данных и интерпретации результатов, которыми сопровождается каждый тест или соответствующее задание;

5) предупреждение распространения полученной в результате тестирования психодиагностической информации, обеспечение ее конфиденциальности;

6) ознакомление испытуемого с результатами тестирования, сообщение ему или ответственному лицу соответствующей информации с учетом принципа «Не навреди!»; в этом случае возникает необходимость решения серии этических и нравственных задач;

7) накопление исследователем сведений, полученных другими исследовательскими методами и методиками, их соотнесение друг с другом и определение согласованности между ними; обогащение своего опыта работы с тестом и знаний об особенностях его применения.

Выделяют также несколько типов тестов, каждому из которых сопутствуют соответствующие процедуры тестирования.

Тесты способностей позволяют выявить и измерить уровень развития тех или иных психических функций, познавательных процессов. Такие тесты чаще всего связаны с диагностикой познавательной сферы личности, особенностей мышления и обычно называются также интеллектуальными.

К ним относятся, например, тест Равена, тест Амтхауэра, соответствующие субтесты теста Векслера и т.д., а также тесты-задания на обобщение, классификацию и множество других тестов исследовательского характера.

Тесты достижений ориентированы на выявление уровня сформированности конкретных знаний, умений и навыков и как меры успешности выполнения, и как меры готовности к выполнению некоторой деятельности. В качестве примеров могут служить все случаи тестовых экзаменационных испытаний. На практике обычно применяются «батареи» тестов достижений.

Личностные тесты предназначены для выявления свойств личности испытуемых. Они многочисленны и разнообразны: существуют опросники состояний и эмоционального склада личности (например, тесты тревожности), опросники мотивации деятельности и предпочтений, определения черт характера личности и отношений.

Имеется группа тестов, называемых проективными, которые позволяют выявить установки, неосознаваемые потребности и побуждения, тревоги и состояние страха.

Применение тестов всегда связано с измерением проявления того или иного психологического свойства и оценкой уровня его развития или сформированности. Поэтому важное значение имеет качество теста. Качество теста характеризуется критериями его точности, т.е. надежностью и валидностью.

Надежность теста определяется тем, насколько получаемые показатели являются стабильными и насколько они не зависят от случайных факторов. Разумеется, речь идет о сравнении показаний одних и тех же испытуемых. Это значит, что надежному тесту должна быть свойственна согласованность показателей тестирования, полученных при повторном тестировании, и можно быть уверенным в том, что тест выявляет одно и то же

свойство. Применяются разные способы проверки надежности тестов.

Один способ – это только что упомянутое повторное тестирование: если результаты первого и через определенное время проводимого повторного тестирования покажут наличие достаточного уровня корреляции, то это будет свидетельствовать о надежности теста. Второй способ связан с применением другой эквивалентной формы теста и наличием высокой корреляции между ними. Возможно и применение третьего способа оценки надежности, когда тест допускает его расщепление на две части и одна

и та же группа испытуемых обследуется с применением обеих частей теста. Надежность теста показывает, насколько точно измеряются психологические параметры и насколько высокой может быть мера доверия исследователя к полученным результатам.

Валидность теста отвечает на вопрос о том, что именно выявляет тест, насколько он пригоден для выявления того, для чего он предназначен. Например, тесты способностей нередко выявляют несколько иное: натренированность, наличие соответствующего опыта или, наоборот, его отсутствие. В таком случае тест не отвечает требованиям валидности.

В психодиагностике выделяют разные виды валидности. В простейшем случаеь валидность теста обычно определяется путем сопоставления полученных в результате тестирования показателей с экспертными оценками о наличии данного свойства у исследуемых (текущая валидность или валидность «по одновременности»), а также путем анализа данных, полученных в результате наблюдения за обследуемыми в различных ситуациях их жизни и деятельности, и их достижений в соответствующей области.

Вопрос о валидности теста может быть решен еще и сравнением его данных с показателями, полученными с помощью методики, связанной с данной методикой, валидность которой считается установленной.

Изучение продуктов деятельности – это исследовательский метод, который позволяет опосредованно изучать сформированность знаний и навыков, интересов и способностей человека на основе анализа продуктов его деятельности. Особенность этого метода заключается в том, что исследователь не вступает в контакт с самим человеком, а имеет дело с продуктами его предшествующей деятельности или размышлениями о том, какие

изменения произошли в самом испытуемом в процессе и в результате его включенности в некоторую систему взаимодействий и отношений.