精神測定における信頼性と一貫性

私たちが誰かや何かを信頼できると呼ぶとき、彼らは一貫性があり信頼できるという意味です。 信頼性はまた、良い心理テストの重要な要素です。 結局のところ、一貫性がなく、毎回異なる結果を出すようなテストはあまり価値がありません。 心理学者はどのように信頼性を定義しますか? 心理テストにはどのような影響がありますか?

信頼性とは、尺度の一貫性を指します。 同じ結果が繰り返し得られれば、信頼できると見なされます。 例えば、特性(例えば、 内翻 )を測定するための試験が設計されている場合、試験が被験者に投与されるたびに、結果はほぼ同じでなければならない。 残念ながら、信頼性を正確に計算することは不可能ですが、さまざまな方法で推定できます。

テスト再テストの信頼性

テスト - テストの信頼性は、心理テストまたは評価の一貫性の尺度です。 この種の信頼性は、時間の経過とともにテストの一貫性を判断するために使用されます。 テスト - テストの信頼性は、 インテリジェンスなど時間の経過と共に安定しているものに最もよく使用されます。

試験 - 再試験の信頼性は、2つの異なる時点で試験を2回実施することによって測定される。 このタイプの信頼性は、測定される品質または構造に変化がないことを前提としています。

ほとんどの場合、テストの間に時間がほとんどかからなければ、信頼性は高くなります。

test-retestメソッドは、測定の信頼性を判断するために使用できる方法の1つに過ぎません。 使用可能な他の技術には、評価者間信頼性、内部整合性、および並列形態信頼性が含まれる。

テスト再テストの信頼は、必ずしも結果の妥当性ではなく、テストの一貫性のみを指していることに注意することが重要です。

レター間信頼性

このタイプの信頼性は、2人以上の独立した裁判官が試験に合格することによって評価されます。 次いで、得点を比較して、評価者の推定値の一貫性を決定する。

レター間信頼度をテストする1つの方法は、各レーターが各テスト項目にスコアを割り当てるようにすることです。 たとえば、各評価者は、1〜10の尺度で項目をスコア付けすることができます。次に、評価者間の信頼性のレベルを決定するために、2つの評価の相関を計算します。

評価者間の信頼性をテストするもう1つの方法は、評価者にそれぞれの評価がどのカテゴリに該当するかを決定させ、評価者間の合意の割合を計算することです。 したがって、レーターが10回のうち8回に同意すると、テストには80%の評価者間信頼性があります。

パラレルフォームの信頼性

パラレルフォームの信頼性は、同じコンテンツを使用して作成された2つの異なるテストを比較することによって評価されます。 これは、同じ品質を測定し、次に項目を2つの別々のテストにランダムに分割するテスト項目の大きなプールを作成することによって達成されます。 2つの試験は、同じ被験者に同時に実施すべきである。

内部一貫性の信頼性

この形式の信頼性は、同じテストで項目間の結果の一貫性を判断するために使用されます。 基本的には、同じ構成を測定するテスト項目を比較して、テストの内部整合性を判断しています。 別のテスト問題と非常によく似ているような質問が表示された場合、2つの質問が信頼性を評価するために使用されていることを示している可能性があります。 2つの質問は同じで、同じものを測定するように設計されているので、テスト受験者は両方の質問に同じ回答をする必要があります。これは、テストに内部整合性があることを示します。

信頼性に影響を与える要因

メジャーの信頼性に影響を及ぼす可能性のあるさまざまな要因がいくつかあります。

まず、おそらく最も明らかに、測定されているものがかなり安定していて、一貫していることが重要です。 測定された変数が定期的に変化するものであれば、テストの結果は一致しません。

テスト状況の側面も信頼性に影響する可能性があります。 たとえば、試験が非常に暑い部屋で実施されている場合、回答者は注意をそらし、能力を最大限発揮して試験を完了できない可能性があります。 これは、測定の信頼性に影響を与える可能性があります。 疲労、ストレス、病気、動機づけ、指示の乏しさ、環境の邪魔など、信頼性を損なう可能性もあります。

信頼性と有効性

テストには信頼性があるという理由だけで、テストには妥当性があるわけではありません。 妥当性は、テストが実際に測定するものを測定するかどうかを表します。 精度の尺度としての精度と妥当性の尺度としての信頼性を考えてください。 場合によっては、テストは信頼できるものの、有効ではない可能性があります。 たとえば、求人が特定の人格特性を持っているかどうかを判断するためにテストを受けているとします 。 テストでは一貫した結果が得られるかもしれませんが、実際に測定することが目的である特性を測定しているわけではありません。