トップへ

 5 調査問題の妥当性と信頼性(S−P表等による分析)
 平成26年度高等学校入学者数学学力調査について,S−P表処理等を基にして差異係数,信頼性係数,内容別平均正答率,正答率帯別問題数,注意係数,UL指数,問題間の相関等を考察したところ,次のような結果を得た。なお,データは,テストについては参加41校から337名,テストについては112校から1,539名を抽出して作成した。


[1] 問題全体について

(1) 差異係数   表5  
 差異係数とは,S,P両曲線のずれの程度を数量化したもので,生徒理解と一連の学習内容がうまくかみ合っているかを見るものである。差異係数は0から1の値をとり,0.5より小さい値のとき生徒の理解と指導の密着性が高いとされている。  
 簡単な確認テストのようなドリル演習型のテストではS曲線とP曲線の乖離は小さく,差異係数は小さくなる。実力テストのような多面にわたる総合的な問題ではS曲線とP曲線は大きく乖離して,差異係数は大きくなる。差異係数が0.5を超えたとき,指導内容に問題がなかったか,出題に問題がなかったか,学習者の理解やモチベーションはよかったかなどを検討する必要がある。今回のテストでは表5のように差異係数は小さいので,出題にとりわけ大きな問題はないと考えられる。

(2) 信頼性係数(クーダー・リチャードソンの公式20による) 
 信頼性係数とは,作成されたテスト問題が内容的に妥当で信頼できるものなのかを算出するものである。ここで言う信頼性とは,同一条件下で再度試験を実施しても同じ結果が出ると思われる安定性のことで,0から1の値をとり,1に近いほど信頼性が高いとされている。 表6  
 今回のテストでは表6のように信頼性係数は高いので,信頼できる良好な問題であったことが分かる。

(3) 内容別平均正答率 ( )内の数字は問題数
 ともに関数の分野において正答率が下がっている。詳細な分析についてはテストテストの考察を参考にしていただきたい。
表7         

(4) 正答率帯別問題数   表8

(5) 全体の正答率との相関  
表9
 [2] 検討を要する問題群 

 表10の4つの指標について,基準を満たさない問題に注意マーク“×”を付けた。注意マークが一つ以上付いた問題を,正答率が基準を満たす“T群”と,正答率が基準を満たさない“U群”とに分け整理したところ以下のようになった。
 平均正答率が非常に高い場合や非常に低い場合に,下記の指標AからCは注意マーク“×”が付きやすくなる。したがって,今回のテストで,問題となるものは表10の※印の問題である。
 テスト2(2),テスト2(2)については,資料の整理の分野で中央値を求める問題で,解答を表から探す多肢選択型の解答形式となったことから,上位群,下位群の正答率の差がなくなり,注意マークがついたと考えられる。テスト2(3)については,あたりくじを引く確率を求める問題で,下位群の正答率が約7割と高く,上位群との正答率の差が小さくなったからである。テスト5(2)については,全体の正答率が0.104と大変低く,上位群の正答率も約2割と低く,下位群との正答率の差が小さくなったからである。

×印は該当項目について検討を要する数値であることを示す。 表10
 
      

(各項目の説明)         表11
@正答率 各問題の正答率を示す。
A注意係数 S−P表において,ある問題の正誤の状況と他の問題の正誤の状況を比較し,異質の程度を数値化したものである。0.5より小さい方が適切な問題であるとされている。表11に示すように平均正答率と併せて検討するとよい。
BUL指数 (上位27%の正答者数)−(下位27%の正答者数)
       (生徒27%の人数)
 UL指数は上式で算出する。「上位群に正答者が多く,下位群に正答者が少ない」場合にUL指数は高くなるが、上位群に正答者が少なく下位群に正答者が多いという逆転現象の場合,UL指数は低くなる。UL指数が0.4より大きい方が適切な問題であるとされている。
C相  関 生徒の得点合計とその問題の正解との相関を示す。基準値を0.4として大きい方が適切な問題であるとされている。



           目    次
1  調査の趣旨 5  調査問題の妥当性と信頼性
2  調査の実施及び処理    6  テストAの結果とその考察
3  調査結果の概要 7  テストBの結果とその考察
4   分析結果の概要    
 平成25年度高等学校数学標準学力検査の結果とその考察(PDF418KB)