説明

試験問題評価装置及びその制御方法並びにプログラム及び記録媒体

【課題】効率的かつ客観的に試験問題を評価する。
【解決手段】CPU2は、作問時に入力される試験問題の難易度及び必要度に基づいて試験問題の難易度及び必要度を表す修正イーベル指数を算出する。さらに、CPU2は、複数の受験者の試験問題に対する解答内容を含むデータに基づいて、試験問題の正答率と識別指数とを算出し、算出された修正イーベル指数と、正答率と、識別指数とに基づいて、所定の関数を用いて試験問題の品質を表す問題評価指数を算出し、算出された問題評価指数をディスプレイ6に表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の受験者を対象に繰り返し実施される客観試験に用いられる試験問題を評価するための試験問題評価装置及びその制御方法並びにプログラム及び記録媒体に関する。
【背景技術】
【0002】
医師国家試験、薬剤師国家試験、看護士国家試験、及び運転免許試験のように複数の受験者を対象に繰り返し実施される客観試験(出題時にすでに正解が決定しており、採点者が異なっても同一の採点結果が得られる試験)は、受験者の健全な自己学習を促進させ、問題解決能力を向上させるものが望ましい。また、難問及び奇問を排し、暗記のみでは正解に至らないような、解釈及び問題解決能力の測定に重点を置いた試験である必要がある。さらに、良く学習し理解している受験者とそれ以外の受験者を識別できる必要がある。従って、客観試験においては、各試験問題を評価し、適切にかつ効率的に見直して更新することが重要である(特許文献1及び2参照。)。非特許文献1には、修正イーベル法(非特許文献2参照。)により、又は、最低合格水準(Minimum Pass Level(MPL))に基づいて、客観試験の試験問題を評価することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−221895号公報。
【特許文献2】特開2003−85296号公報。
【非特許文献】
【0004】
【非特許文献1】平野豊ほか、「良質な試験問題の作成法とその評価の仕方」、近畿大学医学雑誌、第33巻、4号、323〜328頁、2008年。
【非特許文献2】牛場大蔵ほか、「試験の合格水準の理論と実際」、医学教育、第16巻、175〜182頁、1985年。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、修正イーベル法又は最低合格水準のみによる試験問題の評価は、客観性及び汎用性に欠けるという面もあり、試験問題の評価方法としては不十分であるという課題があった。
【0006】
本発明の目的は以上の問題点を解決し、試験問題を従来技術に比較して効率的かつ客観的に評価できる試験問題評価装置及びその制御方法並びにプログラム及び記録媒体を提供することにある。
【課題を解決するための手段】
【0007】
第1の発明に係る試験問題評価装置は、
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置であって、
上記制御手段は、
上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出し、
上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力することを特徴とする。
【0008】
上記試験問題評価装置において、上記制御手段はさらに、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力することを特徴とする。
【0009】
また、上記試験問題評価装置において、上記制御手段はさらに、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納することを特徴とする。
【0010】
さらに、上記試験問題評価装置において、上記試験問題は多肢選択問題であって、
上記制御手段はさらに、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更することを特徴とする。
【0011】
またさらに、上記試験問題評価装置において、上記試験問題は多肢選択問題であって、
上記制御手段はさらに、
上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力し、
上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力することを特徴とする。
【0012】
また、上記試験問題評価装置において、上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする。
【0013】
第2の発明に係る試験問題評価装置の制御方法は、
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置の制御方法であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出するステップと、
上記制御手段が、上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するステップとを含むことを特徴とする。
【0014】
上記試験問題評価装置の制御方法において、上記制御手段が、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力するステップをさらに含むことを特徴とする。
【0015】
また、上記試験問題評価装置の制御方法において、上記制御手段が、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納するステップをさらに含むことを特徴とする。
【0016】
さらに、上記試験問題評価装置の制御方法において、上記試験問題は多肢選択問題であって、
上記制御手段が、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更するステップをさらに含むことを特徴とする。
【0017】
またさらに、上記試験問題評価装置の制御方法において、上記試験問題は多肢選択問題であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力するステップと、
上記制御手段が、上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力するステップとをさらに含むことを特徴とする。
【0018】
また、上記試験問題評価装置の制御方法において、上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする。
【0019】
第3の発明に係るプログラムは、上記試験問題評価装置の制御方法における各ステップを含むことを特徴とする。
【0020】
第4の発明に係るコンピュータで読み取り可能な記録媒体は、上記プログラムを格納したことを特徴とする。
【発明の効果】
【0021】
本発明に係る試験問題評価装置及びその制御方法並びにプログラム及び記録媒体によれば、作問時に入力される試験問題の難易度及び必要度に基づいて算出される修正イーベル指数と、試験問題に対する解答内容を含むデータに基づいて算出される試験問題の正答率及び識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するので、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。
【図面の簡単な説明】
【0022】
【図1】本発明の実施形態に係る試験問題評価装置1の構成を示すブロック図である。
【図2】図1の試験問題分類テーブル12の一例を示すテーブルである。
【図3】図1のコメントテーブル13の一例を示すテーブルである。
【図4】図1のCPU2によって実行される作問サポート処理のフローチャートである。
【図5】図1のCPU2によって実行される試験問題評価処理のフローチャートである。
【図6】図4のステップS1においてディスプレイ6に表示される問題一覧ウィンドウ100の表示例である。
【図7】図4のステップS5においてディスプレイ6に表示される問題入力ウィンドウ200の表示例である。
【図8】図5のステップS18におけるディスプレイ6への表示例である。
【発明を実施するための形態】
【0023】
以下、本発明に係る実施形態について図面を参照して説明する。なお、以下の実施形態において、同様の構成要素については同一の符号を付している。
【0024】
図1は、本発明の実施形態に係る試験問題評価装置1の構成を示すブロック図であり、図2は、図1の試験問題分類テーブル12の一例を示すテーブルであり、図3は、図1のコメントテーブル13の一例を示すテーブルである。図1において、試験問題評価装置1は、例えばパーソナルコンピュータなどのディジタル計算機であって、作問者が、医師国家試験に準拠した模擬試験のための試験問題を作成し、評価するための端末装置として用いられる。本実施形態において、各試験問題は、5個の選択肢の中から1個の選択肢を選択する多肢選択問題(以下、MCQ(Multiple Choice Question)という。)である。試験問題評価装置1は、CPU(Central Processing Unit)2と、ROM(Read Only Memory)3と、RAM(Random Access Memory)4と、ハードディスクドライブ5と、ディスプレイ6と、操作入力部7と、LAN(Local Area Network)インターフェース8と、光ディスクドライブ20とを備えて構成される。CPU2は、バスを介してROM3、RAM4、ハードディスクドライブ5、ディスプレイ6、操作入力部7、LANインターフェース8、及び光ディスクドライブ20と接続されていてそれらの各動作及び試験問題評価装置1の全体の動作を制御するほか、後述する種々のソフトウェアプログラムの処理(図4及び図5)を実行する。
【0025】
また、図1において、ディスプレイ6は、液晶表示装置(LCD(Liquid Crystal Display))又はCRT(Cathode Ray Tube)ディスプレイなどの表示装置であり、試験問題評価装置1の動作状態の表示及び種々のGUI(Graphic User Interface)プログラムのための表示装置として機能する。さらに、操作入力部7は、例えば、マウスなどのポインティングデバイス及びキーボードなどの文字入力手段を含む。作問者及び受験者などの試験問題評価装置1のユーザは、データ及び指示コマンドなどを入力するために操作入力部7を用いる。さらに、LANインターフェース8は、LAN80に接続され、LAN80に接続された複数M台の受験者用端末装置30−1〜30−Mなどの機器からの信号及びデータを受信する一方、LAN80に接続された複数M台の受験者用端末装置30−1〜30−Mなどの機器に対してCPU2からの信号及びデータを送信して、信号変換及びプロトコル変換などのLAN通信に係る双方向のインターフェース処理を実行する。光ディスクドライブ20は、CD−ROM又はDVDなどの、コンピュータで読み取り可能な記録媒体21に記録されたデータ及びプログラムを読み出して出力する。
【0026】
図1において、ROM3は、試験問題評価装置1の動作に必要であってCPU2によって実行される種々のソフトウェアのプログラムを予め格納する。また、ハードディスクドライブ5は、記録媒体を内蔵する記憶装置であり、CPU2が実行する試験問題評価プログラム10と、修正イーベル指数算出テーブル11と、試験問題分類テーブル12と、コメントテーブル13とを予め格納する。ここで、試験問題評価プログラム10は、図4を参照して詳細後述する作問サポート処理のプログラムと、図5を参照して詳細後述する試験問題評価処理のプログラムとを含む。また、ハードディスクドライブ5は、作問サポート処理によってそれぞれ生成されたN個(Nは正の整数である。)の試験問題データ14−1〜14−N(以下、試験問題データ14−1〜14−Nを区別しない場合には、試験問題データ14という。)を格納する。さらに、ハードディスクドライブ5は、プール(蓄積)対象の試験問題データ14を格納するためのプール対象試験問題データ格納領域15と、一部修正(ブラッシュアップ)してプール対象の問題となり得る試験問題データ14を格納するためのブラッシュアップ対象試験問題格納領域16と、重要な修正を含みかつブラッシュアップで十分に吟味の上、修正することにより再実施対象問題の候補になり得る試験問題データ14を格納するための、重要な修正を含むブラッシュアップ対象試験問題格納領域17とを有する。
【0027】
ここで、修正イーベル指数算出テーブル11は、作問者によって試験問題データ14の生成時に設定される試験問題の難易度(平易、中等、又は困難)及び必要度(疑問、重要、又は必須)と、修正イーベル指数との対応関係を示す。ここで、修正イーベル指数は、試験問題の難易度及び必要度を表す指数であって、難易度の低下、及び必要度の上昇に伴って大きくなるように設定される。例えば、修正イーベル指数として、修正イーベル法(非特許文献2参照。)で用いられる期待正答率を用いてもよい。この場合は、修正イーベル指数算出テーブル11は、以下のように設定される。
【0028】
【表1】

【0029】
また、図2に示すように、試験問題分類テーブル12は、詳細後述する試験問題評価処理によって算出される試験問題データ14の品質を表す問題評価指数と、試験問題の問題評価区分との対応関係を示す。さらに、図3に示すように、コメントテーブル13は、試験問題データ14の問題評価区分と、ディスプレイ6に表示されるコメントとの対応関係を示す。
【0030】
さらに、図1において、RAM4は、SRAM(Static RAM)、DRAM(Dynamic RAM)、SDRAM(Synchronous DRAM)などで構成され、CPU2のワーキングエリアとして使用されて、試験問題評価プログラム10などのプログラムを実行したときに、当該実行するプログラムに対応する機能を実行するために必要な実行プログラムとそれを実行するために必要なデータ及び実行時に発生する一時的なデータを格納する。
【0031】
次に、図4を参照して、図1のCPU2によって実行される作問サポート処理を説明する。図4は、図1のCPU2によって実行される、作問者の試験問題の作成をサポートするための作問サポート処理のフローチャートである。作問者が、試験問題評価装置1の操作入力部7を用いて、試験問題データ14−n(n=1,2,…,N)を生成するための所定の操作(例えば、ディスプレイ6に表示されている所定のアイコンをクリックする、又は、ディスプレイ6に表示されているコンソールウィンドウにおいて所定のコマンドを入力するなど。)を行うと、これに応答して、CPU2は、試験問題評価プログラム10に含まれる作問サポート処理のためのプログラムを実行する。
【0032】
まず始めに、図4のステップS1において、ディスプレイ6に問題一覧ウィンドウ100が表示される。図6は、図4のステップS1においてディスプレイ6に表示される問題一覧ウィンドウ100の表示例である。図6に示すように、問題一覧ウィンドウ100は、試験問題データ14−nを新規に生成することを指示するための「新規作成」ボタン101と、既に生成されてハードディスクドライブ5に格納されている試験問題データ14−nを修正することを指示するための「問題の修正」ボタン102と、ハードディスクドライブ5に格納されている試験問題データ14−nの一覧表103とを含む。図4のステップS2において、作問者が、「新規作成」ボタン101をクリックしたか否かが判断され、YESのときはステップS5に進む一方、NOのときはステップS3に進む。そして、ステップS3において、作問者が、「問題の修正」ボタン102をクリックしたか否かが判断され、YESのときはステップS4に進む一方、NOのときはステップS2に戻る。ステップS4では、問題一覧ウィンドウ100の一覧表103において選択された問題データ14−nがハードディスクドライブ5から読み出される。そして、ステップS4又はステップS2に続いて、ステップS5において、ディスプレイ6に問題入力ウィンドウ200が表示される。
【0033】
図7は、図4のステップS5においてディスプレイ6に表示される問題入力ウィンドウ200の表示例である。作問者は、ステップS5において、ディスプレイ6に表示された問題入力ウィンドウ200と操作入力部7とを用いて、対話形式で作問を行う。図7に示すように、問題入力ウィンドウ200は、問題文を入力するためのテキストボックス201と、選択肢毎に解答肢を入力するためのテキストボックス202−1〜202−5と、選択肢毎に難易度コードを選択して入力するためのドロップダウンリスト23−1〜23−5と、試験問題の必要度を選択して入力するためのドロップダウンリスト204と、試験問題の難易度を選択して入力するためのドロップダウンリスト205と、「保存」ボタン206とを含む。ここで、難易度コード(非特許文献1参照。)は、最低合格指数(非特許文献1参照。)に用いられるコードであって、選択肢が正解であるか否か及び難易度を表す。難易度コードは、正解を表す難易度コード(丸で囲まれた2(図7参照。))と、合格認定を許容できる最低能力の受験生が正解との区別できなくてもやむを得ない不正解の選択肢を表す難易度コード(2)と、合格認定を許容できる最低能力の受験生が正解とすることもあるであろうし、しないこともあるであろう不正解の選択肢を表す難易度コード(1)と、本試験問題に関係する領域の学習を行ったと思えない受験生が選択する選択肢を表す難易度コード(0)とから選択される。また、試験問題の必要度は、疑問、重要、及び必須の中から選択される。さらに、試験問題の難易度は、平易、中等、及び困難の中から選択される。図7の例では、テキストボックス201に、問題文「インフォームドコンセントとして適切でないのはどれか。」が入力されている。また、選択肢毎に、以下の解答肢と難易度コードが入力されている。
【0034】
[表1]
____________________________________
選択肢 解答肢 難易度コード
____________________________________
a 治療処置の目的を説明する。 0
b 治療処置の選択肢を説明する。 0
c 治療処置のリスクを説明する。 0
d 病院の免責文書に署名をもらう。 正解を表す2(丸で囲まれた2)
e 納得の上同意文書に署名をもらう。 0
____________________________________
【0035】
さらに、図7において、ドロップダウンリスト204を用いて、必要度として「必須」が選択され、ドロップダウンリスト205を用いて、難易度として「平易」が選択されている。なお、図4のステップS3において作問者が「問題の修正」ボタンをクリックし、ステップS4において、選択された試験問題データ14−nがハードディスクドライブ5から読み出された場合には、読み出された試験問題データ14−nに含まれる問題文と、選択肢毎の解答肢及び難易度コードと、必要度及び難易度とを、ステップS5において問題入力ウィンドウ200に表示する。
【0036】
図4のステップS5に続いて、ステップS6において、作問者が、問題入力ウィンドウ200の「保存」ボタン206をクリックしたか否かが判断され、YESのときはステップS7に進む一方、NOのときはステップS6の処理を繰り返す。次に、ステップS7において、CPU2は、入力された必要度及び難易度に基づいて修正イーベル指数算出テーブル11を参照して、修正イーベル指数を算出する。そして、ステップS8において、CPU2は、入力された問題文と、入力された選択肢毎の解答肢及び難易度コードと、入力された必要度及び難易度と、算出された修正イーベル指数とを含む試験問題データ14−nを生成して、ハードディスクドライブ5に格納し、作問サポート処理を終了する。
【0037】
以上説明したように、図4の作問サポート処理によって、問題文と、選択肢毎の解答肢及び難易度コードと、必要度及び難易度と、修正イーベル指数とを含む試験問題データ14−nを生成してハードディスクドライブ5に格納することができる。図1において、各受験者用端末装置30−1〜30−Mは、生成された試験問題データ14−nを、ハードディスクドライブ5からLANインターフェース8及びLAN80を介して他の受験者用端末装置30−1〜30−Mを用いて受信して受験者用端末装置30−1〜30−Mの各表示装置に表示する。各受験者は、受験者用端末装置30−1〜30−Mにおいて試験問題に解答し、受験者用端末装置30−1〜30−Mは、解答内容を含むデータを、LAN80を介して試験問題評価装置1に送信する。
【0038】
次に、図5を参照して、図1のCPU2によって実行される試験問題評価処理を説明する。図5は、図1のCPU2によって実行される試験問題評価処理のフローチャートである。作問者が、試験問題評価装置1の操作入力部7を用いて、試験問題データ14−nを評価するための所定の操作(例えば、ディスプレイ6に表示されている所定のアイコンをクリックする、又は、ディスプレイ6に表示されているコンソールウィンドウにおいて所定のコマンドを入力するなど。)を行うと、これに応答して、CPU2は、試験問題評価プログラム10に含まれる試験問題評価処理のためのプログラムを実行する。
【0039】
まず始めに、ステップS10において、CPU2は、受験者用端末装置30−1〜30−Mから、試験問題データ14−nに対する解答内容を含むデータを受信し、当該受信されたデータに基づいて、各解答を採点し、正答率と、選択肢毎の選択者数と、選択肢毎の選択率と、識別指数とを算出する。
【0040】
ここで、試験問題データ14−nの正答率は、全ての受験者のうち試験問題データ14−nに正解した受験者の割合(0以上1以下の値)である。また、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す。本実施形態において、試験問題データ14−nの識別指数は、全ての受験者のうちの成績最上位X%の受験者の試験問題データ14−nの正答率から、全ての受験者のうちの成績最下位Y%の受験者の試験問題データ14−nの正答率を減算した値であり、−1以上1以下の数値である。識別指数が負の値の試験問題は、適切な問題ではない可能性、あるいは、実施した試験で測定する能力と異なる能力を測定している可能性がある。一般に、識別指数は0.2を超えることが好ましい。また、成績最上位者の割合X%及び成績最下位者の割合Y%は、試験問題データ14−nを含む試験全体の得点順位に基づいて、例えば、それぞれ25%、15%、50%などの所定の値に設定される。ここで、例えばX=Y=50%であるとき、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも直下の下位の成績の成績下位層の受験者とを区別する能力を表す。また、例えばX<50%かつY<50%であるとき、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも、所定数の受験者を介して、下位の成績の成績下位層の受験者とを区別する能力を表し、当該成績上位層の受験者は第1のしきい値順位以上の受験者であり、当該下位の成績の成績下位層の受験者は、上記第1のしきい値順位よりも下位の第2のしきい値順位以下の受験者であり、それ故、試験問題データ14−nの識別指数は、全ての受験者のうちの、第1のしきい値順位以上の成績上位層の受験者と、第2のしきい値順位以下の下位の成績の成績下位層の受験者とを区別する能力を表す
【0041】
次に、ステップS10に続いてステップS11において、CPU2は、試験問題データ14−nに含まれる修正イーベル指数と、算出した正答率及び識別指数とに基づいて、所定の関数を用いて問題評価指数を算出する。ここで、問題評価指数Eは、以下の式で表される。
【0042】
[数1]
E=f(x,y,z)
【0043】
ここで、xは修正イーベル指数であり、yは正答率であり、zは識別指数であり、fは例えば、それぞれ所定の係数を有してパラメータx、y、zを線形結合し、又は2次以上の高次方程式で結合する所定の関数である。このように算出された問題評価指数Eは試験問題の品質(良否)を表し、本実施形態では、関数fは、品質の上昇と共に試験問題の問題評価指数Eが高い値を有するように設定される。
【0044】
図5において、ステップS11に続いてステップS12において、CPU2は、算出された問題評価指数に基づいて問題分類テーブル12を参照して、試験問題データ14−nを問題評価区分A,B又はCに分類する。ここで、問題評価区分A,B,Cは、試験問題の品質を表し、問題評価区分A,B,Cの順序で品質が悪くなる。具体的には、問題評価区分Aに分類された試験問題データ14−nはプール対象問題に適しており、問題評価区分Bに分類された試験問題データ14−nは一部修正(ブラッシュアップ)してプール対象問題となり得る。また、問題評価区分Cに分類された試験問題データ14−nは、問題評価区分Bに分類された試験問題データ14−nに比較して重要な修正を行う必要があるが、ブラッシュアップで十分に吟味の上、修正することにより再実施対象問題の候補になり得る。
【0045】
次に、ステップS13において、試験問題データ14−nが問題評価区分Cに分類されたか否かが判断され、YESのときはステップS16に進む一方、NOのときはステップS14に進む。さらに、ステップS14において、選択者数がゼロの選択肢があるか、又は、選択率が2%未満の選択肢があるか否かが判断され、YESのときはステップS15に進む一方、NOのときはステップS16に進む。ステップS15では、問題評価区分は1段階だけ下げられ(問題評価区分Aから問題評価区分Bへ、又は、問題評価区分Bから問題評価区分Cへ下げられる。)、ステップS16に進む。ステップS16では、試験問題データ14−nが問題評価区分Aに分類された場合はプール対象試験問題データ格納領域15に格納し、問題評価区分Bに分類された場合はブラッシュアップ対象試験問題データ格納領域16に格納し、問題評価区分Cに分類された場合は重要な修正を含むブラッシュアップ対象試験問題データ格納領域17に格納する。ステップS16の処理により、問題評価区分Aに分類されたプール対象問題である試験問題データ14−nと、問題評価区分Bに分類された一部修正が必要な試験問題データ14−nと、問題評価区分Cに分類されたより重要な修正が必要な試験問題データ14−nとを、それぞれ異なる格納領域15,16及び17に格納できる。次に、ステップS17では、ディスプレイ6に、試験問題データ14−nの選択肢番号と、難易度コードと、修正イーベル指数と、正答率と、選択者数と、選択率と、識別指数と、問題評価指数と、問題評価区分とを表示するとともに、問題評価区分に基づいてコメントテーブル13を参照してコメントを表示し、試験問題評価処理を終了する。図8は、図5のステップS18におけるディスプレイ6への表示例である。なお、図8では、算出された正答率を100倍した値(単位は、%である。)を「正答率」として表示している。
【0046】
従来は、修正イーベル法による試験問題の主観的な評価と、試験実施後に得られる正答率などの客観的な数値に基づく試験問題の評価とは、独立に行われており、2つの評価結果に基づいて作問者自身が総合的に試験問題を評価する必要があった。しかしながら、本実施形態によれば、作問時に作問者によって設定される試験問題の難易度及び必要度を表す修正イーベル指数と、試験実施後に得られる試験問題の正答率及び識別指数とに基づいて問題評価指数を算出し、当該問題評価指数に基づいて試験問題を自動的に評価する。このため、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。
【0047】
さらに、図8に示すように、試験問題の問題評価区分を表示するので、作問者は、当該表示に基づいて、例えば、問題評価区分Bに分類されてブラッシュアップ対象試験問題格納領域16に格納された試験問題データ14と、問題評価区分Cに分類されて重要な修正を含むブラッシュアップ対象試験問題格納領域17に格納された試験問題データ14を吟味し推敲できる。また、問題評価区分Aに分類された(すなわち、しきい値区分Bより品質の良い問題評価指数を有し、良問と判定された)試験問題データ14−nを自動的にプール対象試験問題データ格納領域15に格納するので、従来技術に比較して、容易に客観試験を作成できる。従って、本実施形態によれば、試験作成を補助することができる。さらに、受験者用端末装置30−1〜30−Mから、問題評価区分Aに分類されてプール対象試験問題データ格納領域15に格納された試験問題データ14−nを読み出すことができるように設定すれば、受験者の自己学習を促進できる。
【0048】
また、図5の試験問題評価処理において、選択者数がゼロの選択肢がある、又は、選択率が2%未満の選択肢があるときに、問題評価区分を1段階だけ下げる(ステップS14及びステップS15)ので、選択肢毎の選択率を考慮した試験問題評価を行うことができる。
【0049】
なお、上記実施形態では、試験問題データ14は5個の選択肢の中から1個の選択肢を選択する多肢選択問題を含んだ。しかしながら、本発明はこれに限らず、任意の数の選択肢から任意の数の選択肢を選択する多肢選択問題、又は論述問題であってもよい。ただし、論述問題の場合は、難易度コードの設定はできず、図5のステップS12の処理の次にステップS18の処理を実行することになる。
【0050】
また、上記実施形態では、試験問題データ14を問題評価指数に基づいて問題評価区分A,B,Cに分類したが、本発明はこれに限らず、2つ又は4つ以上の問題評価区分に分類してもよい。例えば、測定する能力と異なる能力を測定しているために難しすぎる試験問題又は易しすぎる試験問題であって、ブラッシュアップの対象問題になり得ない試験問題を表す問題評価区分Dを追加して設けてもよい。
【0051】
さらに、ステップS14における選択者数のしきい値及び選択率のしきい値と、試験問題分類テーブル12における試験問題データ14を分類するための問題評価指数のしきい値とは、本実施形態において示した値に限らない。試験問題評価処理を繰り返し実行し、より高精度に試験問題を評価できるように、これらの値を変更してもよい。
【0052】
またさらに、作問者によって図4の作問サポート処理のステップS5において設定された各選択肢の難易度コードに基づいて、最低合格指数(MPI(Minimum Pass Index)。非特許文献1参照。)を算出して、算出された最低合格指数をさらに含む試験問題データ14を生成してもよい。この場合、最低合格指数は、例えば、以下の式で算出される。
【0053】
[数2]
最低合格指数=2/(各選択肢の難易度コードに対応する値の総和)
【0054】
ただし、正解を表す難易度コード(丸で囲まれた2)に対応する値は2であり、難易度コード(2)に対応する値は2であり、難易度コード(1)に対応する値は1であり、難易度コード(0)に対応する値は0である。
【0055】
また、上記実施形態において、決定された問題評価区分A、B又はCをディスプレイ6に表示したが、本発明はこれに限らず、プリンタなどの出力手段を用いて印字出力等してもよい。
【0056】
さらに、上記実施形態において、試験問題評価装置1は、作問者が、医師国家試験に準拠した模擬試験のための試験問題を作成して評価するために用いられた。しかしながら、本発明はこれに限らず、薬剤師国家試験又は看護士国家試験などの医学以外の領域の客観試験の試験問題を作成して評価するために用いられてもよい。
【0057】
またさらに、上記実施形態において、試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータとをそれぞれハードディスクドライブ5に予め格納した。しかしながら、本発明はこれに限らず、CD−ROM又はDVDなどの、コンピュータで読み取り可能な記録媒体21に記録された試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータをそれぞれ、コンピュータなどのコントローラを含む光ディスクドライブ20により読み出して、ハードディスクドライブ5に格納してもよい。また、試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータとを、試験問題評価装置1の外部装置から、インターネット及びLANインターフェース8を介してハードディスクドライブ5に格納してもよい。
【0058】
さらに、CPU2は、図4の作問サポート処理のステップS5において、ディスプレイ6に問題入力ウィンドウ200(図7参照。)を表示したが、本発明はこれに限られない。例えば、CPU2は、問題タイプ(図7の例では、上部に記載されているように、「タイプA」である。)に応じて類似の雛形問題を併せて表示するサポート機能を実行してもよい。さらに、CPU2は、問題作成時のガイダンス機能(例えば、コア・カリキュラムに準拠する場合は、「3歳」と入力すると、「女性」という単語が「女児」という単語に置き換わる機能。)を実行してもよい。
【0059】
またさらに、上記実施形態において、正答率及び期待正答率は0以上1以下の値であったが、本発明はこれに限らず、百分率であってもよい。
【産業上の利用可能性】
【0060】
以上説明したように、本発明に係る試験問題評価装置及びその制御方法並びにプログラム及び記録媒体によれば、作問時に入力される試験問題の難易度及び必要度に基づいて算出される修正イーベル指数と、試験問題に対する解答内容を含むデータに基づいて算出される試験問題の正答率及び識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するので、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。
【符号の説明】
【0061】
1…試験問題評価装置、
2…CPU、
3…ROM、
4…RAM、
5…ハードディスクドライブ、
6…ディスプレイ、
7…操作入力部、
8…LANインターフェース、
10…試験問題評価プログラム、
11…修正イーベル指数算出テーブル、
12…試験問題分類テーブル、
13…コメントテーブル、
14−1〜14−N…試験問題データ、
15…プール対象試験問題データ格納領域、
16…ブラッシュアップ対象試験問題データ格納領域、
17…重要な修正を含むブラッシュアップ対象試験問題データ格納領域、
20…光ディスクドライブ、
21…記録媒体、
31−1〜31−M…受験者用端末装置、
80…LAN。

【特許請求の範囲】
【請求項1】
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置であって、
上記制御手段は、
上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出し、
上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力することを特徴とする試験問題評価装置。
【請求項2】
上記制御手段はさらに、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力することを特徴とする請求項1記載の試験問題評価装置。
【請求項3】
上記制御手段はさらに、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納することを特徴とする請求項2記載の試験問題評価装置。
【請求項4】
上記試験問題は多肢選択問題であって、
上記制御手段はさらに、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更することを特徴とする請求項2又は3記載の試験問題評価装置。
【請求項5】
上記試験問題は多肢選択問題であって、
上記制御手段はさらに、
上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力し、
上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力することを特徴とする請求項1乃至4のうちのいずれか1つに記載の試験問題評価装置。
【請求項6】
上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする請求項1乃至5のうちのいずれか1つに記載の試験問題評価装置。
【請求項7】
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置の制御方法であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出するステップと、
上記制御手段が、上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するステップとを含むことを特徴とする試験問題評価装置の制御方法。
【請求項8】
上記制御手段が、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力するステップをさらに含むことを特徴とする請求項7記載の試験問題評価装置の制御方法。
【請求項9】
上記制御手段が、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納するステップをさらに含むことを特徴とする請求項8記載の試験問題評価装置の制御方法。
【請求項10】
上記試験問題は多肢選択問題であって、
上記制御手段が、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更するステップをさらに含むことを特徴とする請求項8又は9記載の試験問題評価装置の制御方法。
【請求項11】
上記試験問題は多肢選択問題であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力するステップと、
上記制御手段が、上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力するステップとをさらに含むことを特徴とする請求項7乃至10のうちのいずれか1つに記載の試験問題評価装置の制御方法。
【請求項12】
上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする請求項7乃至11のうちのいずれか1つに記載の試験問題評価装置の制御方法。
【請求項13】
請求項7乃至12のうちのいずれか1つに記載の試験問題評価装置の制御方法における各ステップを含むことを特徴とするプログラム。
【請求項14】
請求項13記載のプログラムを格納したことを特徴とするコンピュータで読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate