人々が心理テストについて話すとき、彼らはしばしばテストが有効かどうか尋ねます。 これはどういう意味ですか? 妥当性は、テストが測定すると主張するものがどれくらいうまく測定されるかの尺度です。
心理的評価は、実験的研究および臨床的治療の両方において重要な部分である。 心理テストを作成する際の最大の問題の1つは、実際に測定していると思っているものを実際に測定するかどうかです。
たとえば、安定した人格特性を測定する代わりに、状況または環境条件によって生成される一時的な感情を測定するテストを設計することができます。 有効なテストは、結果が評価中の次元を正確に反映していることを保証します。
それで、テストの正当性はどういう意味ですか?
妥当性は、テストが測定すると主張するものをテストする程度です。 結果が正確に適用され、解釈されるためには、テストが有効であることが不可欠です。
妥当性は単一の統計ではなく、テストとそれが測定しようとしている振る舞いとの間の関係を示す研究によって決定されます。 有効性には3つのタイプがあります。
1.コンテンツの有効性
テストにコンテンツの有効性がある場合、テスト上の項目は、テストでカバーする可能性のあるアイテムの全範囲を表します。 個々のテストの質問は、幅広いトピックをカバーする大きなアイテムのプールから引き出される可能性があります。
テストで定義が困難な形質を測定する場合には、専門家の裁判官が各項目の関連性を評価することがあります。 それぞれの裁判官が意見に基づいているため、2名の独立した裁判官が別々に評価を行います。 両方の審査員によって強く関連すると評価された項目は、最終テストに含まれます。
2.基準関連の妥当性
例えば、雇用主がインタビュー、教育、経験などの通常の雇用手続きに基づいて新入社員を雇用する場合など、テストがコンストラクトの基準や指標を予測する上で有効であることを実証した場合、テストは基準関連の有効性を有すると言われます。 この方法は、テストでうまくいく人は仕事でうまくいくことを示し、テストで得点が低い人は仕事でうまくやらないことを示しています。
基準妥当性には2つの異なるタイプがあります。
- 並行妥当性は、基準尺度が試験得点と同時に得られたときに発生する。 これは、テストスコアが基準に関する個人の現在の状態を正確に推定する程度を示す。 例えば、うつ病のレベルを測定する試験では、被験者が経験するうつ病の現在のレベルを測定した場合、その試験は同時に有効であると言われます。
- 予測妥当性は、テスト後に基準尺度が取得されたときに発生します。 予測的妥当性を持つテストの例は、キャリアまたは適性テストであり、特定の科目や職業で誰が成功するか失敗するかを判断するのに役立ちます。
3.妥当性の構築
テストは、テストの得点と理論的特性の予測との間の関連を示す場合、構成の有効性を有する。
インテリジェンステストは、有効性を構築する必要のある測定機器の一例です。 有効な知能テストは、記憶や教育レベルなどの他の特性ではなく、知能の構成を正確に測定できる必要があります。
本質的に、コンテンツの妥当性は、テストが、測定される構成を構成する動作の全範囲をカバーするかどうかを調べます。 ここでの手順は、タイピング、デザイン、または物理的能力のような仕事を実行するのに必要なタスクを特定することです。 選択手順の内容の妥当性を実証するために、選択で示された振る舞いは、その職務の代表的なサンプルでなければなりません。
顔の妥当性
それほど洗練されていないためにほとんど使用されない別の方法は、顔の妥当性である。 これは、測定値の外観と測定対象の値のみに基づいていますが、実際に測定値が測定されるものではありません。
顔の妥当性は、最も基本的な妥当性の尺度の1つです。 本質的に、研究者は、テストが目標変数を測定するように見えるかどうかを調べることによって、テストの有効性を単に額面価格で取るだけです。 例えば、幸福の尺度では、幸福のレベルを実際に測定するように見える場合には、顔の正当性があると言われます。
明らかに、顔の妥当性は、テストが機能するように見えることを意味します。 これは、テストが機能することが証明されたことを意味するものではありません。 しかし、この時点で測定値が有効であると思われる場合、研究者は、試験が有効であり、将来使用すべきかどうかを判断するために、さらに調査することができる。
基本的に、顔の妥当性は、テストが測定するものを測定するように見えるかどうかです。 それは、テストを額面にすることを含む。
投票しようとしている政治候補者に対して、顔の正当性が高いと言われる調査が行われる。 テストの目的は、精神測定に慣れていない人にも、非常に明確です。
さまざまな価値観、性格、行動を調べる心理学的実験の一環として使用される複雑なテストは、顔の妥当性が低いと言えるでしょう。 テストの正確な目的は、特に参加者にとってはすぐにはっきりしません。
明らかに、顔の妥当性はテストが実際に有効であることを意味するものではありません。 実際には何か他のものを実際に測定しているうちに、あるものを測定しているように見えることがあります。