説明

問題自動作成装置および作成方法

【課題】完成度の高い多様な分野の多肢選択問題を自動的に作成する。
【解決手段】複数の項目に関するデータが格納された項目集データベースを利用して穴埋め式多肢選択問題を自動的に作成するように構成され、所定の媒体から項目のタイトル、解説文およびカテゴリの各情報を取得して項目集データベースを作成し、任意に設定された問題文中の所定の単語にタグ付けを行い、タグ付けされた単語の1つを正答として設定し、正答に対する誤答候補を、項目集データベースを参照して項目のタイトルとなっている単語の中から抽出し、抽出された誤答候補のうちの少なくとも1つを誤答として設定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば歴史、地理、時事、流行、法律および国語等の任意の分野の知識を問う、各種の多肢選択問題を自動的に作成する問題自動作成装置および作成方法に関する。
【背景技術】
【0002】
従来、様々な知識に関して試験を行う手法の一つとして、設問に対応した複数の選択肢の中から回答者が正解と思う選択肢を選択し、その回答の正誤を判定する多肢選択問題が存在する。
【0003】
多肢選択問題の作成は、問題作成者が誤答を決定するのに多大な労力を要し、作成の負担が大きい。このような事情の下、例えば特許文献1には、コンピュータを利用して英単語に関する多肢選択問題を自動的に作成する問題作成装置が開示されている。この問題作成装置は、各英単語に対して日本語訳を対応させるデータテーブルを用意し、このデータテーブルから、多肢選択問題とすべき英単語を1つ選択し、選択した英単語に対応する日本語訳に基づき、当該英単語以外の他の英単語それぞれに対する日本語訳から誤答を決定するようになっている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−85734号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、例えば歴史、地理、時事、流行、法律および国語等の任意の分野の知識を問う多肢選択問題の場合には、特許文献1に開示された問題作成装置の技術をそのまま利用することは困難である。
【0006】
本発明は上記課題に鑑みてなされたものであり、完成度の高い多様な分野の多肢選択問題を自動的に作成し、問題作成者が問題作成にかける労力を省くことができる問題自動作成装置および作成方法を提供することを目的としている。
【課題を解決するための手段】
【0007】
上記目的を達成する本発明は、電子計算機で構成され、複数の項目について当該項目のタイトルと当該項目の内容を解説する解説文と当該項目の属するカテゴリとがそれぞれ格納された項目集データベースを利用して穴埋め式多肢選択問題を自動的に作成する問題自動作成装置であって、所定の媒体から前記項目のタイトル、前記解説文および前記カテゴリの各情報を取得し、取得した情報を所定の体系で格納する前記項目集データベースを作成し、前記電子計算機の記憶装置に記憶させる項目集データベース用意部と、出題対象となる問題文を設定する問題文設定部と、前記問題文設定部で設定された問題文中の所定の単語にタグ付けを行うタグ付け処理部と、前記タグ付け処理部でタグ付けされた単語の1つを正答として設定する正答設定部と、前記項目集データベースを参照して、前記正答設定部で設定された正答に対する誤答候補を前記項目集データベースの前記項目のタイトルとなっている単語の中から抽出する誤答候補調査部と、前記誤答候補調査部で抽出された誤答候補のうちの少なくとも1つを誤答として設定する誤答設定部と、を備えたことを特徴としている。
【0008】
なお、前記項目集データベースに格納されている前記項目のタイトルとなっている各単語の品詞構造を解析した結果を所定の体系で格納する品詞構造データベースを作成し、前記記憶装置に記憶させる品詞構造データベース用意部をさらに備え、前記誤答設定部は、前記品詞構造データベースを参照して、正答として設定された単語と品詞構造が一致する誤答候補を誤答として設定することが好ましい。
【0009】
また、前記所定の媒体から前記カテゴリの上下関係に関する情報を取得し、取得した情報を所定の体系で格納するカテゴリ階層データベースを作成し、前記記憶装置に記憶させるカテゴリ階層データベース用意部をさらに備え、前記誤答候補調査部は、前記カテゴリ階層データベースを参照して、正答として設定された単語とカテゴリ階層が一致する単語を誤答候補として抽出することが好ましい。
【0010】
また、前記誤答候補調査部は、前記問題文の文脈に最も近いカテゴリを選定し、当該選定したカテゴリに属する項目のタイトルとなっている単語を誤答候補として抽出することが好ましい。
【0011】
また、前記タグ付け処理部は、前記項目集データベースの項目のタイトルとなっている単語にタグ付けを行うことが好ましい。
【0012】
また、前記項目集データベースに格納されている前記項目のタイトルとなっている単語それぞれの、前記項目集データベースに格納されている前記解説文に対する出現頻度を調査した結果を所定の体系で格納する出現頻度データベースを作成し、前記記憶装置に記憶させる出現頻度データベース用意部と、前記出現頻度データベースを参照して、前記タグ付け処理部でタグ付けされた単語の出現頻度を調査する出現頻度調査部と、をさらに備え、前記正答設定部は、前記タグ付けされた単語が複数ある場合には前記出現頻度に基づいて前記単語を正答として設定することが好ましい。
【0013】
また、上記目的を達成する本発明は、複数の項目について当該項目のタイトルと当該項目の内容を解説する解説文と当該項目の属するカテゴリとがそれぞれ格納された項目集データベースを利用して、電子計算機によって穴埋め式多肢選択問題を自動的に作成する問題自動作成方法であって、前記電子計算機の中央演算装置が、所定の媒体から前記項目のタイトル、前記解説文および前記カテゴリの各情報を取得し、取得した情報を所定の体系で格納する前記項目集データベースを作成し、前記電子計算機の記憶装置に記憶させ、出題対象となる問題文を設定し、設定した前記問題文中の所定の単語にタグ付けを行い、前記タグ付けした単語の1つを正答として設定し、設定した前記正答に対する誤答候補を前記項目集データベースの前記項目のタイトルとなっている単語の中から抽出し、抽出した前記誤答候補のうちの少なくとも1つを誤答として設定する処理を実行することを特徴としている。
【発明の効果】
【0014】
本発明によれば、完成度の高い多様な分野の多肢選択問題を自動的に作成することができ、問題作成者の問題作成にかける時間を省くことができるという優れた効果を奏し得る。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施形態に係る問題自動作成装置のハードウェアの全体構成を模式的に示すブロック図である。
【図2】本発明の一実施形態に係る問題自動作成装置が情報を取得するウィキペディアにおける項目(記事)の一つを模式的に示す図である。
【図3】本発明の一実施形態に係る問題自動作成装置が情報を取得するウィキペディアにおいて規定されているカテゴリ階層の一部を模式的に示す図である。
【図4】本発明の一実施形態に係る問題自動作成装置が情報を取得するウィキペディアにおけるカテゴリ解説ページの一つを模式的に示す図である。
【図5】本発明の一実施形態に係る問題自動作成装置のソフトウェアの全体構成を模式的に示すブロック図である。
【図6】本発明の一実施形態に係る問題自動作成装置が解析した項目の品詞構造の一例を示す図である。
【図7】本発明の一実施形態に係る問題自動作成装置による誤答候補の抽出に用いるカテゴリ階層を示す図である。
【図8】本発明の一実施形態に係る問題自動作成装置による問題作成の手順(問題自動作成方法)と完成した問題の一例を示す図である。
【発明を実施するための形態】
【0016】
本発明の問題自動作成装置および作成方法の一実施形態について、図面を参照しながら詳細に説明する。なお、本実施形態では、オープンコンテンツとなる「フリー百科事典、ウィキペディア(日本語版)」(記事コンテンツという)を利用して、多様な分野の穴埋め式多肢選択問題を自動的に作成する場合について説明する。
【0017】
図1に、本実施形態に係る問題自動作成装置1のハードウェアの全体構成を示す。問題自動作成装置1は、コンピュータ等の電子計算機で構成されており、CPU等の中央演算装置2と、キーボードやマウス等の入力装置3と、ディスプレイ等の出力装置4と、ROM、RAMおよびハードディスク等の記憶装置5とを物理的な構成要素として備え、各装置2〜6はバス6で接続されている。また、問題自動作成装置1は、通信インタフェースを介してインターネット等の公衆通信回線網に接続可能となっている。
【0018】
記憶装置5にはプログラムやデータベースが記憶されるようになっており、具体的には、問題を自動的に作成する手順が定められたプログラム10と、複数の項目の情報を格納する項目集データベース21と、項目集データベース21の各項目が属するカテゴリ(分類)の上下関係を規定したカテゴリ階層の情報を格納するカテゴリ階層データベース22と、項目集データベース21の各項目の品詞構造の情報を格納する品詞構造データベース23と、項目集データベース21の各項目の出現頻度の情報を格納する出現頻度データベース24と、が記憶される。
【0019】
項目集データベース21の複数の項目の情報は、所定の媒体(ここではウィキペディア)から取得することが好ましい。問題自動作成装置1がインターネットを利用してアクセスできるウィキペディアには複数の記事が存在している。例えば2011年4月1日時点では、日本語版のウィキペディアには740000本を超える記事が存在している。なお、ウィキペディアにおける「記事」とは、百科事典としての情報が記載されているページのことであり、百科事典で慣習的に使用されている「項目」という言い方もされる。以下ではこの「記事」を「項目」とも称して説明する。
【0020】
ウィキペディアでは、項目ごとに、項目のタイトルと、項目の内容を説明する解説文と、項目の属するカテゴリとが記載されており、これらの情報の全てが項目集データベース21に登録されている。ウィキペディアにおける項目の一例として「小泉純一郎」に関する項目を図2に示して説明すると、ここには、『小泉純一郎』というタイトルと、『小泉純一郎(こいずみじゅんいちろう、1942年(昭和17年)1月8日-)は、日本の元政治家。国際公共政策研究センター顧問。衆議院議員、厚生大臣(第69・70・81代)、郵政大臣(第55代)、内閣総理大臣(第87・88・89代)などを歴任した。』という解説文とが記載されている。また、この項目が次の10個のカテゴリに属していることが記載されている。「日本の内閣総理大臣」、「日本の閣僚経験者」、「日本の外務大臣」、「衆議院議員」、「自由民主党の国会議員」、「神奈川県選出の政治家」、「小泉純一郎」、「神奈川県出身の人物」、「1942年生」、「存命人物」。このカテゴリの情報は、ウィキペディアの該当ページの最下部に表示されている。
【0021】
また、ウィキペディアでは、各項目の属するカテゴリ(分類)の上下関係がカテゴリ階層として規定されている。図3にそのカテゴリ階層の一部を模式的に示すと、例えば「主要カテゴリ」の下位に「社会」および「技術」のカテゴリが位置し、「社会」のカテゴリの下位に「経済」および「生活」のカテゴリが位置し、「経済」のカテゴリの下位に「倒産」および「会計」のカテゴリが位置し、「技術」のカテゴリの下位に「兵器」および「宇宙開発」のカテゴリが位置している。各カテゴリには、それに関連する項目(記事)が属していることになる。なお、ウィキペディアにおける「主要カテゴリ」とは、カテゴリ機能を用いた検索の起点となるべき最も主要なカテゴリのみを集めたものと規定されている。
【0022】
なお、図4には、ウィキペディアにおける「閣僚」カテゴリの解説ページが例示されている。図4から分かるように、「閣僚」カテゴリの解説ページに含まれる情報には、カテゴリのタイトルと、カテゴリ解説文と、この閣僚カテゴリに所属している「項目」のリストと、カテゴリの上位及び下位(サブ)を意味するカテゴリ階層情報が含まれている。この項目リストには、「閣僚」カテゴリに属している「項目」のタイトルが五十音順に列挙されている。
【0023】
次に、問題自動作成装置1のソフトウェアの全体構成について説明する。図5に示すように、問題自動作成装置1は機能的な構成要素として、項目集データベース用意部30と、カテゴリ階層データベース用意部31と、品詞構造データベース用意部32と、出現頻度データベース用意部33と、問題文設定部34と、タグ付け処理部35と、出現頻度調査部36と、誤答候補調査部37と、正答設定部38と、誤答設定部39と、問題生成部41と、フロー制御部43を備えている。これらの各部31〜43は、中央演算装置2が記憶装置5に記憶されたプログラム10を実行することによって実現される機能である。
【0024】
項目集データベース用意部30は、複数の項目のデータを所定の体系で格納した項目集データベース21を用意する手段である。項目集データベース用意部30は、「フリー百科事典、ウィキペディア日本語版」としてインターネット上で公開されている複数の項目のテキストデータをインターネット経由で取得する。そして、取得した各項目のデータ(タイトル、解説文、カテゴリ)を所定の体系で格納した項目集データベース21を作成し、記憶装置5に記憶させる。
【0025】
カテゴリ階層データベース用意部31は、項目集データベース21に格納されている各項目のカテゴリの上下関係を規定したカテゴリ階層データベース22を作成し、記憶装置5に記憶させる。カテゴリ階層データベース22に格納するデータもウィキペディアから取得する。
【0026】
品詞構造データベース用意部32は、項目集データベース21の全ての項目のタイトル、解説文、カテゴリの中の単語の品詞構造を解析し、品詞構造データベース23を用意する手段である。品詞構造データベース用意部32は、項目集データベース21に格納されている全ての項目のタイトルを順に抽出し、そのタイトルの品詞構造を順に解析する。なお、タイトル以外にも、解説文、カテゴリを順に抽出し、これらの品詞構造を解析して品詞構造データベースを用意しても良い。例えば図6に示すように、「社会」という単語については「社会(名詞、固有名詞、組織)」と解析し、「経済」という単語については「経済(名詞、一般)」と解析し、「小泉純一郎」という単語については、「小泉(名詞・人名・姓)」及び「純一郎(名詞・人名・名)」と解析する。解析には、適宜の解析ソフトウェア(例えば、Mecab等のオープンソース形態素解析エンジン)を利用すると好ましい。そして、項目集データベース21に格納されている項目のタイトルとなっている単語とその単語の解析された品詞の情報とを対応づけて、品詞構造データベース23を作成し、記憶装置5に記憶させる。
【0027】
出現頻度データベース用意部33は、項目集データベース21に格納されている全ての項目について、各項目のタイトルの出現頻度を格納した出現頻度データベース24を用意する手段である。出現頻度データベース用意部33はまず、項目集データベース21とカテゴリ階層データベース22とを参照して、項目のタイトルとなっている単語について、カテゴリごとに、そのカテゴリに属する全ての解説文中において当該単語が何回出現しているか、その出現頻度を調査する。そして、各カテゴリにおける単語の出現確率表を作成する。つまり、一のカテゴリC1に関する単語の出現確率表X1、別の一のカテゴリC2に関する単語の出現確率表X2、また別の一のカテゴリC3に関する単語の出現確率表X3、等を作成する。そして、各単語の全カテゴリにおける出現頻度と、カテゴリごとの単語の出現確率表とを所定の体系で格納したものを出現頻度データベース24として記憶装置5に記憶させる。なお、タイトルとなっていない名詞の単語や名詞以外の単語についても出現頻度を調査し、出現頻度データベース24中の各出現確率表に反映させても良い。
【0028】
問題文設定部34は、任意の文章を問題文として設定して記憶装置5に記憶させる手段である。問題文とする文章は、時事ニュースなどのように他の所定の媒体から取得して記憶装置5に記憶させても良いし、ユーザがその都度適宜に入力しても良い。勿論、項目集データベース21の中から抽出しても良い。仮に項目集データベース21から抽出する場合、ユーザがカテゴリ階層データベース22を参照して予めカテゴリを指定しておき、このカテゴリに属する項目に絞り込んで問題文とする文章を読み出しても良い。カテゴリの指定は、問題文設定部34がディスプレイ等の出力手段4に指定を促す画面を表示し、ユーザが入力装置3を介して所望のカテゴリを入力・選択することで実行されれば好ましい。
【0029】
なお本実施形態では、問題文設定部34において、問題候補となる一つの文章ブロックを設定する場合を例示しているが、本発明はこれに限定されない。例えば、複数の問題文を同時に生成する場合、予め複数の問題候補を登録しておくことも可能である。
【0030】
タグ付け処理部35は、問題文設定部34により設定された問題文に対して、項目集データベース21を参照してタグ付け処理を実施する手段である。タグは、項目集データベース21の項目のタイトルとなっている単語に付与するようにする。
【0031】
出現頻度調査部36は、タグ付け処理部35によりタグ付けされた問題文中の各単語の出現頻度について、出現頻度データベース24を参照して調査する手段である。まずタグ付けされた単語を列挙し、各単語の全カテゴリにおける出現頻度(回数)を調査する。例えば最尤法を用いて、各カテゴリの単語の出現頻度表に基づき、タグ付けされた単語を含む問題文が、各カテゴリの母集団から生成される確率(各カテゴリとの相関性の大きさ)をカテゴリごとに算出する。そして、確率が大きいカテゴリほど問題文に近いと推定し、最も問題文に近いカテゴリを特定する。なお、ここでは最尤法を用いてカテゴリを特定する場合を例示しているが、本発明はこれに限定されない。要は、問題文と各カテゴリとの相関性の大きさを、問題文とカテゴリに含まれる単語を利用して分析し、最適なカテゴリを特定できれば良い。例えば、問題文にタグ付けされる単語を、項目タイトルとして一番多く含むカテゴリを単純に選定しても良い。
【0032】
誤答候補調査部37は、項目集データベース21を参照して、正答設定部38で設定された正答に対する誤答候補を、この項目集データベース21の項目のタイトルとなっている単語の中から抽出する。特に本実施形態において、誤答候補調査部37は、タグ付け処理部35によりタグ付けされた全ての単語のうちの出現頻度が低い単語を回答対象物(正答)とした場合の誤答候補を、カテゴリ階層データベース22を参照して調査する手段である。誤答候補調査部37は、正答と同じカテゴリ階層の項目の中から誤答候補を抽出する。
【0033】
例えば、何らかの問題文の正答として「厚生大臣」が選定され、更にこの正答と組み合わせる誤答を抽出するために、問題文との文脈の相関性の高い図4の「閣僚」カテゴリが特定された場合を考える。誤答候補調査部37は、この「閣僚」カテゴリに所属している合計19個の項目タイトルから、「厚生大臣」を除く18個を誤答候補として抽出する。これらの誤答候補は、正答となる「厚生大臣」と同じ階層のカテゴリに所属するので、「厚生大臣」と並列の関係となり、正答と似たような趣旨になる。結果、これらの誤答候補と正答を混在させた選択肢群を構成しても、違和感がなくなる。更に問題の難易度も高められる。
【0034】
なお、既に述べたように、正答と一致する項目が、複数のカテゴリに属している場合には、問題文の文脈に最も近いカテゴリを選定して、そのカテゴリ内から誤答候補を抽出する。この場合、最尤法を用いて、各カテゴリの単語の出現頻度表に基づき、タグ付けされた単語を含む問題文が、各カテゴリの母集団から生成される確率を算定し、確率が高い方のカテゴリを利用することが好ましい。すなわち、図7に示すように、「AAA」と「FFF」の2つのカテゴリに属する「DDD」という単語(項目)が正答に設定された場合、「AAA」と「FFF」のうちの問題文の文脈に近いほうのカテゴリを選定し、例えば「FFF」のほうが問題文の文脈に近い場合には、「FFF」のカテゴリに対して同じカテゴリ階層にある「GGG」、「HHH」、「III」、「JJJ」、「KKK」の5つの項目を誤答候補として抽出する。
【0035】
なお、ここでは複数のカテゴリから誤答候補を抽出するカテゴリを特定する際に、問題文の文脈と、カテゴリに含まれる単語の近さから判定するようにしているが、本発明はこれに限定されない。例えば、正答となる項目「DDD」が、このように「AAA」カテゴリと「FFF」カテゴリのような複数のカテゴリに属している場合、各カテゴリに属する項目リストの数が少ない順番に、誤答候補を抽出するカテゴリを特定することが好ましい。例えば、「AAA」カテゴリには4つの項目が属しており、「FFF」カテゴリは6つの項目が属しているので、「AAA」カテゴリの方が項目リストの数が少ないことから、この「AAA」カテゴリから誤答候補を抽出する。なぜなら、カテゴリに属する項目数が多いということは、そのカテゴリ自体が広い概念であり、多様な項目が所属している可能性が高い。従って、誤答候補を抽出する際の意味的なばらつきが大きくなるからである。また、ここでは例示しないが、正答となる項目「DDD」と全く同じ名称となる「DDD」カテゴリが存在する場合もあり得る。この場合、「DDD」カテゴリから誤答候補を抽出することを禁止することが好ましい。なぜなら、「DDD」カテゴリ内では、項目「DDD」よりも下位に属する項目が主として収集されるため、項目「DDD」と並列関係となるような誤答の選定が難しくなるからである。
【0036】
正答設定部38は、誤答候補調査部37による調査結果に基づき、誤答候補を所定数以上(少なくとも1つ以上)取得できた場合に、空欄とした位置の単語を正答として最終設定する。なお、正答設定部38は、誤答候補調査部37が誤答候補を所定数以上取得できていない場合には、他の単語を正答とした場合の誤答候補を改めて調査するように、誤答候補調査部37に指示を出すものとする。
【0037】
なお、問題文中において正答として設定可能な単語(正答候補)が複数存在する場合は、出現頻度データベース24を参照してその適否を判断する。例えば、設問の難易度を高める為には、カテゴリ全体での出現頻度が最も低い単語を正答に設定することが好ましい。一方、設問の難易度を低める為には、出現頻度が最も高い単語を正答に設定すれば良い。勿論、これらの事例に限らずに任意に単語を選択することが可能である。また、正答として設定される単語は固有名詞であれば最も好ましいが、本発明はこれに限られず他の品詞であっても良い。更に、各単語の出現頻度を比較する際に、出現頻度を品詞の種類毎に補正することが好ましい。仮に、出現頻度が最も低いものを正答に設定する条件設定において、固有名詞の選定確率を高めたい場合は、固有名詞の出現頻度の数値を例えば10等の数値で割って強制的に小さくし、それを補正後の出現頻度とする。このようにすると、固有名詞の出現頻度が形式的に低く調整されるので、正答に選択されやすくなる。
【0038】
また、問題文中に正答候補が複数存在する場合、この正答候補の単語の少なくとも一部が、問題文中に繰り返し登場しているか否かを判断し、複数回登場している場合はこの正答候補を除外することも好ましい。また更に、正答候補の単語が、カテゴリ階層データベース22におけるカテゴリ名称と一致しているか、又はカテゴリ名称の一部に含まれる場合は、問題の難易度が低くなりすぎる可能性があるので、正答候補から除外することが好ましい。例えば、正答候補の可能性がある単語して「議員」「議会」などが挙げられる場合、これらの単語は、ウィキペディアの階層カテゴリとなる「社会>政治>立法>議会>議員>日本の国会議員>衆議院議員」という階層状に含まれる「議員」カテゴリや「議会」カテゴリと名称が一致するので、これらの「議員」や「議会」などの単語は正答候補から除外することが好ましい。カテゴリ名称になるような単語は、一般的に知名度が高いことを意味する。このような単語を正答に設定すると設問の難易度が低くなってしまう可能性がある。従って、この種の単語を正答候補から除外することで、より具体的且つ詳細な内容を問う問題を生成できる。
【0039】
誤答設定部39は、誤答候補調査部37で抽出された誤答候補のうちの少なくとも1つを誤答として設定する手段である。具体的に本実施形態の誤答設定部39は、正答設定部38により設定された正答の単語と同じ品詞構造である単語を誤答として設定する。誤答設定部39は、品詞構造データベース23を参照して、誤答候補調査部37により抽出された誤答候補の中から正答と同じ品詞構造を有する単語を誤答として設定する。正答と誤答を同一又は類似の品詞構造とすることで、選択肢の難易度を高めることができるからである。
【0040】
なお、ここでは正答と誤答候補の品詞構造の類似性から、誤答を選択する場合を例示したが、本発明はこれに限定されない。例えば誤答設定部39は、正答と比較して、平仮名、片仮名、漢字、及び英数字のいずれかの文字種で共通する誤答候補を優先して、誤答に選定することが好ましい。選択肢の中に、平仮名、片仮名、漢字が混在していると、問題の難易度が低下するからである。同様に、正答と文字量の近い誤答候補を優先して、誤答に選定することも好ましい。正答と誤答の文字量に大きな差があると、問題の難易度が低下しやすいからである。例えば図4の例において、正答が「厚生大臣」とすれば、文字量に差がある「大臣」「沖縄及び北方対策担当大臣」「外務大臣 (日本)」「海洋政策担当大臣」「金融担当大臣」「経済財政政策担当大臣」「経済産業大臣」「厚生労働大臣」「消費者及び食品安全担当大臣」「副首相」などは、誤答から除外することが好ましい。
【0041】
また更に、誤答選定部39は、正答と比較して、開始語又は末尾語と共通する誤答候補を優先して、誤答に選定することも好ましい。図4の例では、解答が「厚生大臣」であることから、開始語となる「厚」や末尾語となる「臣」が一致するものを選択することが好ましい。例えば、開始語となる「厚」が一致するものとして「厚生労働大臣」が挙げられる。反対に、誤答が解答と似すぎるのを避けたい場合は、開始語となる「厚」や末尾語となる「臣」が一致するものを除外することが好ましい。
【0042】
問題生成部41は、これまでに設定された正答と誤答と正答の位置が空欄にされた問題文とを組み合わせて、1つの問題として記憶装置5に記憶させる。なお、ここで設定される誤答の数が誤答として列挙したい数(例えば3つあるいは2つ等)を超えている場合には、ディスプレイ等の出力手段4に誤答候補を表示してユーザが手作業で選択できるようにすると良い。
【0043】
フロー制御部43では、例えば、問題文設定部34において、複数の問題文を同時に登録した場合に、これらの複数の問題文に対して、上記問題の生成手順を繰り返し適用していく処理を行う。この際、一つも問題文であっても、選択される正答が異なるものは別の問題となり得る。従って、このフロー制御部43を利用して、一つの問題文に対して上記問題の生成手順を複数回適用して、複数の問題を生成することが可能である。
【0044】
問題自動作成装置1により穴埋め式多肢選択問題を作成する具体的な実施例について、図8を用いて説明する。この実施例では、芥川龍之介の小説「羅生門」の次の一節について問題を作成する場合について説明する。問題文となる以下の一節は、ここではユーザが入力装置3を操作して入力し、問題文設定部34が記憶装置5に問題文として設定したものとする。
【0045】
『ある日の暮方の事である。一人の下人が、羅生門の下で雨やみを待っていた。広い門の下には、この男のほかに誰もいない。ただ、所々丹塗の剥げた、大きな円柱に、蟋蟀が一匹とまっている。羅生門が、朱雀大路にある以上は、この男のほかにも、雨やみをする市女笠や揉烏帽子が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。』
【0046】
問題文を設定すると、この問題文に対して、項目集データベース21を参照してタグ付け処理を実行する。タグは、項目集データベース21の項目のタイトルとなっている単語に付与され、例えば次の大括弧で示す名詞の単語に付与される。
【0047】
『ある日の暮方の事である。一人の[下人]が、[羅生門]の下で雨やみを待っていた。広い門の下には、この男のほかに誰もいない。ただ、所々丹塗の剥げた、大きな[円柱]に、[蟋蟀]が一匹とまっている。[羅生門]が、[朱雀大路]にある[以上]は、この男のほかにも、雨やみをする市女笠や揉[烏帽子]が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。』
【0048】
次いで、出現頻度データベース24を参照して、タグの付いた単語の出現頻度を調査する。例えば、本実施形態のウィキペディアから構築したデータベースを利用すると、「下人」が144回、「羅生門」が192回、「円柱」が1190回、「蟋蟀」が22回、「朱雀大路」が76回、「以上」が124415回、「烏帽子」が303回と調査される。この調査結果は、記憶装置5に一時的に記憶させる。
【0049】
更に、固有名詞を正答として選択される確率を高めるために、固有名詞に限って11倍の重み付け(出現頻度を11分の1にする)と、上記出現頻度は以下の通り補正される。「下人」が144回、「羅生門」が17.45回(補正有り)、「円柱」が1190回、「蟋蟀」が22回、「朱雀大路」が6.91回(補正有り)、「以上」が124415回、「烏帽子」が303。次に、この補正後の出現頻度リストを利用して、出現頻度の最も低い単語(ここでは「朱雀大路」)を回答対象物すなわち正答と選定する。更に「朱雀大路」の誤答候補として、正答と同じカテゴリ階層にあり且つ問題文の文脈に最も近いカテゴリに属する項目を項目集データベース21の中から抽出する。カテゴリ階層データベース22によれば、「朱雀大路」は、「道路」、「都市計画」、「日本の土木史」、「土木史」の4つのカテゴリに属している。このようなカテゴリ状態のうえで、最尤法により今回の問題文の文脈に最も近いと特定されたカテゴリである「土木史」のカテゴリに関して、同一階層にある、綾羅木郷遺跡、遺構、石垣、石垣の積み方、遺跡、運河、エ・テメン・アン・キ、園冶、河川総合開発事業、カナート、灌漑、環濠集落、巨石記念物、溝渠、工事誌、工兵、国際運河、ジエ水道、ジェゼル王のピラミッド、ジッグラト、昭和池、水道橋、水道道路、(朱雀大路)、世界の七不思議、世界八番目の不思議、疏水、京杭大運河、ため池、垂柳遺跡、治水、鄭国、天満大池公園、都江堰、土塁、永久堡塁(習志野)、版築、樋(土木)、平池公園、ピラミッド、文化遺産(世界遺産)、ベームスター干拓地、防塁、堀、ポン・デュ・ガール、マスタバ、満濃池、山池、由利海岸波除石垣、用水路、ランドマーク、流域圏、霊渠、ローマ街道、ローマ水道、といった複数の項目のタイトルとなっている単語を誤答候補として抽出する。
【0050】
次いで、品詞構造データベース23を参照して上記の誤答候補の品詞構造を調査し、正答の品詞構造と同じ品詞構造を持つ誤答候補を誤答として絞り込む。ここでは、「朱雀大路」の品詞構成が「名詞、固有名詞、地域、一般+名詞、一般」と解析されることから、具体的にこれと同じ品詞構成となる誤答候補として、「ローマ水道」、「ローマ街道」、「平池公園」に絞り込まれる。
【0051】
次いで、正答の位置を空欄にした問題文と正答と絞り込まれた誤答とを組み合わせて1つの問題とし、記憶装置5に記憶させる。ここでは、図8の下部に示すような問題が完成する。なお、ここでは特に図示しないが、正答と誤答の組合せの難易度が低い場合は、問題確認画面において最適化ボタンを選択する。この最適化ボタンを押すと、誤答設定部39では、誤答の選択ルールを変更する。例えば、正答と誤答の品詞構造が完全に一致していなくても、正答と比較して、平仮名、片仮名、漢字、及び英数字のいずれかの文字種で共通していたり、正答と比較して所属するカテゴリのリストが類似する誤答候補を優先的に選択する。この結果、誤答として「平池公園」、「天満大池公園」、「満濃池」が選択される。本実施例では、最適化を行った方が、問題の難易度が上昇している。この最適化を実行する場合、誤答設定部39は、複数の誤答設定ルール(例えば、品詞完全一致、品詞一部一致、漢数字・カタカナ・平仮名一致)を画面に表示させて、作業者が、誤答候補を見ながら最適な誤答設定ルールを選択するようにしても良い。
【0052】
これらの手順を繰り返すことによって多数の問題を作成し、作成した問題を集めた問題集データベースを記憶装置5に記憶させると好ましい。
【0053】
本発明の一実施形態に係る問題自動作成装置および作成方法は上述のように構成されているので、ユーザが問題自動作成装置1のプログラム10を実行すると、問題自動作成装置1はプログラム10に規定された手順に従い自動的に問題を作成し、問題作成のための問題作成者の労力を省くことができる。また、どのような問題文であっても、含まれる単語に対して自動的にタグ付けを行うので、様々な多肢選択問題を自動的に生成することが可能となる。例えば、問題文は、上述した小説以外の分野、例えば歴史、地理、時事、流行、法律等の多様な分野について設定することができ、幅広い分野において完成度の高い多肢選択問題を自動的に作成することができる。
【0054】
また、問題自動作成装置1がユーザに問題文の入力を促す画面をディスプレイ等の出力装置4に表示することで、ユーザは必要に応じて適宜に問題文を設定することができる。また、問題自動作成装置1が誤答候補を表示し、誤答の選択を可能とする画面をディスプレイ等の出力装置4に表示することで、ユーザは必要に応じて誤答を自由に決定することもできる。
【0055】
以上、本発明の実施形態について説明したが、本発明は、上記実施形態に限定されず、本発明の趣旨を逸脱しない範囲で種々変更することが可能である。
【0056】
例えば、上記実施形態では、項目集データベース21の情報をウィキペディアから取得たが、例えば辞書データベース等の他の媒体から情報を取得して項目集データベース21を構築しても良い。また、所定の媒体からの情報は、インターネットを介して取得することに限らず、情報が格納されたCD等の記録媒体から取得してももちろん良い。
【0057】
また、問題自動作成装置1は携帯電話等の移動式端末と連携し、移動式端末をユーザが操作してプログラム10を実行し、問題を自動的に作成できるようにしても良い。このとき、ユーザは移動式端末の画面を通して出題対象となる問題のカテゴリを入力・選択したり、具体的な問題文を個別に設定したりすると好ましい。
【符号の説明】
【0058】
1 問題自動作成装置
2 中央演算装置
3 入力装置
4 出力装置
5 記憶装置
6 バス
10 プログラム
21 項目集データベース
22 カテゴリ階層データベース
23 品詞構造データベース
24 出現頻度データベース
31 項目集データベース用意部
32 品詞構造データベース用意部
33 出現頻度データベース用意部
34 問題文設定部
35 タグ付け処理部
36 出現頻度調査部
37 誤答候補調査部
38 正答設定部
39 誤答設定部
41 問題生成部
43 フロー制御部

【特許請求の範囲】
【請求項1】
電子計算機で構成され、複数の項目について当該項目のタイトルと当該項目の内容を解説する解説文と当該項目の属するカテゴリとがそれぞれ格納された項目集データベースを利用して穴埋め式多肢選択問題を自動的に作成する問題自動作成装置であって、
所定の媒体から前記項目のタイトル、前記解説文および前記カテゴリの各情報を取得し、取得した情報を所定の体系で格納する前記項目集データベースを作成し、前記電子計算機の記憶装置に記憶させる項目集データベース用意部と、
出題対象となる問題文を設定する問題文設定部と、
前記問題文設定部で設定された問題文中の所定の単語にタグ付けを行うタグ付け処理部と、
前記タグ付け処理部でタグ付けされた単語の1つを正答として設定する正答設定部と、
前記項目集データベースを参照して、前記正答設定部で設定された正答に対する誤答候補を前記項目集データベースの前記項目のタイトルとなっている単語の中から抽出する誤答候補調査部と、
前記誤答候補調査部で抽出された誤答候補のうちの少なくとも1つを誤答として設定する誤答設定部と、を備えた
ことを特徴とする、問題自動作成装置。
【請求項2】
前記項目集データベースに格納されている前記項目のタイトルとなっている各単語の品詞構造を解析した結果を所定の体系で格納する品詞構造データベースを作成し、前記記憶装置に記憶させる品詞構造データベース用意部をさらに備え、
前記誤答設定部は、前記品詞構造データベースを参照して、正答として設定された単語と品詞構造が一致する誤答候補を誤答として設定する
ことを特徴とする、請求項1に記載の問題自動作成装置。
【請求項3】
前記所定の媒体から前記カテゴリの上下関係に関する情報を取得し、取得した情報を所定の体系で格納するカテゴリ階層データベースを作成し、前記記憶装置に記憶させるカテゴリ階層データベース用意部をさらに備え、
前記誤答候補調査部は、前記カテゴリ階層データベースを参照して、正答として設定された単語とカテゴリ階層が一致する単語を誤答候補として抽出する
ことを特徴とする、請求項1または2に記載の問題自動作成装置。
【請求項4】
前記誤答候補調査部は、
前記問題文の文脈に最も近いカテゴリを選定し、当該選定したカテゴリに属する項目のタイトルとなっている単語を誤答候補として抽出する
ことを特徴とする、請求項3に記載の問題自動作成装置。
【請求項5】
前記タグ付け処理部は、前記項目集データベースの項目のタイトルとなっている単語にタグ付けを行う
ことを特徴とする、請求項1〜4のいずれか1項に記載の問題自動作成装置。
【請求項6】
前記項目集データベースに格納されている前記項目のタイトルとなっている単語それぞれの、前記項目集データベースに格納されている前記解説文に対する出現頻度を調査した結果を所定の体系で格納する出現頻度データベースを作成し、前記記憶装置に記憶させる出現頻度データベース用意部と、
前記出現頻度データベースを参照して、前記タグ付け処理部でタグ付けされた単語の出現頻度を調査する出現頻度調査部と、をさらに備え、
前記正答設定部は、前記タグ付けされた単語が複数ある場合には、前記出現頻度に基づいて前記単語を正答として設定する
ことを特徴とする、請求項1〜5のいずれか1項に記載の問題自動作成装置。
【請求項7】
複数の項目について当該項目のタイトルと当該項目の内容を解説する解説文と当該項目の属するカテゴリとがそれぞれ格納された項目集データベースを利用して、電子計算機によって穴埋め式多肢選択問題を自動的に作成する問題自動作成方法であって、
前記電子計算機の中央演算装置が、
所定の媒体から前記項目のタイトル、前記解説文および前記カテゴリの各情報を取得し、取得した情報を所定の体系で格納する前記項目集データベースを作成し、前記電子計算機の記憶装置に記憶させ、
出題対象となる問題文を設定し、
設定した前記問題文中の所定の単語にタグ付けを行い、
前記タグ付けした単語の1つを正答として設定し、
設定した前記正答に対する誤答候補を前記項目集データベースの前記項目のタイトルとなっている単語の中から抽出し、
抽出した前記誤答候補のうちの少なくとも1つを誤答として設定する処理を実行する
ことを特徴とする、問題自動作成方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate