説明

多肢選択言語試験問題自動作成装置およびコンピュータプログラム

【課題】多肢選択言語試験問題を自動的に作成することができる装置を提供する。
【解決手段】装置は、コーパスを記憶するコーパス記憶部82と、選択肢作成のための言語情報を記憶する各種データ記憶部68と、コーパスから問題の元となる文を選択する種文選択部84と、選択された文のうちの空所を決定する問題位置選択部86と、各種データ記憶部68に記憶された言語情報に基づいて、空所に対する選択肢候補を作成する選択肢候補生成処理部88と、選択された文において、空所を選択肢候補で置換して得られる文の妥当性を判定する妥当性判定部90と、文が妥当でないと判定された選択肢候補と、元となる文とを整形して多肢選択言語試験問題を作成する整形部94とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は試験問題を自動的に作成するための装置に関し、特に、多肢選択式の言語試験問題を自動的に作成するための装置に関する。
【背景技術】
【0002】
語学教育用試験には、いわゆる記述式問題と多肢選択式問題とがある。語学教育用試験は、学習者の学習習熟度を測定する上で欠くことができないものであり、そのために語学教師は試験問題作成に多大な時間を割いている。したがって、問題作成を容易にする方策が求められている。
【0003】
記述式試験問題と多肢選択試験問題とを比較すると、両者には以下のような相違がある。まず記述式試験問題については、問題を作成することは比較的容易である。しかし、記述式試験の場合、問題に対する解答の入力および採点が難しいという問題がある。特に採点は採点者の主観によってかなり異なってくるという問題がある。また記述式試験の場合には、採点を機械化することが非常に難しいという問題もある。
【0004】
これと比較して多肢選択言語試験問題の場合、解答入力が容易で、採点も容易であるという長所を備えている。さらに、評価者による採点の揺れがない、という意味で客観的であるという長所もある。そのため、大量の受験者がある場合や、コンピュータベースの試験(CBT)では多肢選択式試験が広く用いられる。また、「いつでもどこでも学習」という目標を標榜するいわゆるeラーニングでは、携帯電話またはPDA(Portable Digital Assistant)等のモバイル機器特有の問題、例えば画面が小さい、入力装置が貧弱である、等という制約から考えて、多肢選択言語試験問題が重要な役割を担うと考えられる。
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、多肢選択式試験の場合、問題を作成する手間が記述式試験と比較してかなり大きいという問題がある。特に、学習対象のドメイン(旅行会話、ビジネス会話、ニュース等)に合致し、かつ被験者の到達目標に合致した問題を作成することは困難だという課題がある。学習対象のドメインにおいて長年の経験または蓄積を持たない教育機関の場合、所望のドメインの多肢選択言語試験問題を、所定の到達レベルに合致させて作成することは非常に困難である。そうした問題を解決しようとすれば、多大な人員を動員することが必要になり、試験問題作成のコストが高くなる要因となっている。何らかの形で多肢選択言語試験問題を自動的に作成できるようになれば、そうした問題が解決され、好ましい。
【0006】
それゆえに本発明の目的は、多肢選択言語試験問題を自動的に作成することができる装置を提供することである。
【0007】
本発明の他の目的は、多肢選択言語試験問題であって、所望のドメインの問題を自動的に作成することができる装置を提供することである。
【0008】
本発明のさらに他の目的は、多肢選択言語試験問題であって、所望のドメインの所望の到達レベル問題を自動的に作成することができる装置を提供することである。
【課題を解決するための手段】
【0009】
本発明の第1の局面に係る多肢選択言語試験問題自動作成装置は、多肢選択言語試験問題を自動的に作成するための、多肢選択言語試験問題自動作成装置であって、コンピュータ読取可能なコーパスを記憶するためのコーパス記憶手段と、選択肢作成のための言語情報をコンピュータ読取可能な形式で記憶するための言語情報記憶手段と、コーパス記憶手段に記憶されたコーパスから、予め定める選択方式にしたがって多肢選択言語試験問題の元となる文を選択するための文選択手段と、文選択手段により選択された文のうち、所定条件を充足する構成要素を決定するための構成要素決定手段と、言語情報記憶手段に記憶された言語情報に基づいて、構成要素決定手段により決定された構成要素に対する置換候補を作成するための置換候補作成手段と、選択された文において、決定された構成要素を置換候補で置換することにより得られる文の妥当性を判定するための妥当性判定手段と、妥当性判定手段により文が妥当でないと判定された置換候補と、元となる文とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための多肢選択言語試験問題作成手段とを含む。
【0010】
コーパス記憶手段から文が選択され、その中の所定条件を充足する構成要素に対する置換候補が作成される。当該構成要素を置換候補で置換した後の文の妥当性を妥当性判定手段で判定し、文が妥当でないと判定された置換候補と、最初に選択された元となる文とを所定の形態に組合わせることで多肢選択言語試験問題が自動的に作成される。コーパスを変えれば所望のドメインまたはレベルの多肢選択言語試験問題を自動的に作成できる。さらに、置換候補のうち、置換によって得られる文が妥当でないものだけを残すことで、最初に選ばれた文との組合せにより、適切な多肢選択言語試験問題を作成できる。問題文および選択肢集合を人間が考えたり、問題としての正しさを検証したりする必要がなく、短い時間に大量の多肢選択言語試験問題を作成できる。
【0011】
好ましくは、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、決定された構成要素に対する複数個の置換候補を作成するための手段を含み、多肢選択言語試験問題作成手段は、選択された文のうち、決定された構成要素を空所で置換した問題文を作成するための手段と、複数個の置換候補のうち、妥当性判定手段で文が妥当でないと判定された予め定める所定個数の置換候補と、決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、問題文と選択肢集合とを所定の問題形式に整形するための整形手段とを含む。
【0012】
さらに好ましくは、多肢選択言語試験問題作成手段は、選択された文のうち、決定された構成要素を、妥当性判定手段により文が妥当でないと判定された置換候補で置換して問題文を作成するための手段と、問題文のうち、置換候補と、置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように問題文を整形するための整形手段とを含む。
【0013】
より好ましくは、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、所与の条件に合致するように決定された構成要素に対する置換候補を作成するための条件付置換候補作成手段を含む。
【0014】
好ましくは、多肢選択言語試験問題自動作成装置はさらに、所与の条件に関するユーザの入力を受け、条件付置換候補作成手段に与えるための手段を含む。
【0015】
多肢選択言語試験問題自動作成装置は、さらに、複数個のコーパスからなるコーパス群を記憶するためのコンピュータ読取可能なコーパス群記憶手段から、ユーザによって指定されたコーパスを読出してコーパス記憶手段に格納するためのコーパス読出手段を含んでもよい。
【0016】
好ましくは、コーパスは第1言語の文と第2言語の文との対訳を複数個含むバイリンガルコーパスであり、文選択手段は、コーパス記憶手段に記憶されたバイリンガルコーパスから、選択方式にしたがって多肢選択言語試験問題の元となる対訳を選択するための対訳選択手段を含む。
【0017】
さらに好ましくは、構成要素決定手段は、選択された対訳の第2言語の文のうち、所定条件を充足する構成要素を決定するための手段を含み、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、決定された構成要素に対する複数個の第2言語の置換候補を作成するための手段を含み、多肢選択言語試験問題作成手段は、選択された対訳の第1言語の文と、選択された対訳の第2言語の文のうち、決定された構成要素を空所で置換した文とを含む問題文を作成するための手段と、複数個の置換候補のうち、妥当性判定手段により文が妥当でないと判定された予め定める所定個数の第2言語の置換候補と、決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、問題文と選択肢集合とを所定の問題形式に整形するための整形手段とを含む。
【0018】
多肢選択言語試験問題作成手段は、選択された対訳の第1言語の文と、選択された対訳の第2言語の文のうち、決定された構成要素を、妥当性判定手段により文が妥当でないと判定された置換候補で置換して得られた文とを含む問題文を作成するための手段と、問題文の第2言語の文のうち、置換候補と、置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように問題文を整形するための整形手段とを含んでもよい。
【0019】
好ましくは、構成要素決定手段は、選択された対訳の第2言語の文全体を所定条件を充足する構成要素として決定するための手段を含み、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、選択された対訳の第1言語の文を機械翻訳するための複数の機械翻訳手段を含み、多肢選択言語試験問題作成手段は、選択された対訳の第2言語の文、および複数の機械翻訳手段による翻訳結果のうち、妥当性判定手段により妥当でないと判定された文からなる選択肢集合を作成するための手段と、選択された対訳の第1言語の文と、選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための手段とを含む。
【0020】
さらに好ましくは、文選択手段、構成要素決定手段、置換候補作成手段、妥当性判定手段、および多肢選択言語試験問題作成手段を制御して、所定個数の多肢選択言語試験問題を作成させるための制御手段をさらに含む。
【0021】
本発明の第2の局面に係る多肢選択言語試験問題自動作成装置は、多肢選択言語試験問題を自動的に作成するための、多肢選択言語試験問題自動作成装置であって、第1言語の単語と第2言語の単語との対訳を複数個記憶するためのコンピュータ読取可能な辞書記憶手段と、選択肢作成のための言語情報をコンピュータ読取可能な形式で記憶する言語情報記憶手段と、辞書記憶手段から、予め定める選択方式にしたがって多肢選択言語試験問題の元となる単語の対訳を選択するための対訳選択手段と、言語情報記憶手段に記憶された言語情報に基づいて、選択された対訳のうち第2言語の単語に対する第2言語の置換候補を作成するための置換候補作成手段と、選択された対訳の第1言語の単語に対する対訳として、置換候補作成手段により得られる第2言語の置換候補の妥当性を判定するための妥当性判定手段と、妥当性判定手段により妥当でないと判定された置換候補と、元となる単語の対訳中の第2言語の単語とから選択肢集合を作成するための選択肢作成手段と、選択された対訳の第1言語の単語と、選択肢作成手段により作成された選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための多肢選択言語試験問題作成手段とを含む。
【0022】
本発明の第3の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを上記したいずれかの多肢選択言語試験問題自動作成装置として動作させる。
【発明を実施するための最良の形態】
【0023】
[多肢選択言語試験問題の概要]
多肢選択言語試験問題には、図1に示す空所補充問題、図3に示す誤り検出問題、図示しない正解文または誤り文選択問題等がある。以下に述べる実施の形態に係る多肢選択言語試験問題の作成装置は、少なくとも空所補充問題と誤り検出問題との双方を含む複数種類の多肢選択言語試験問題を作成することができる。
【0024】
まず、図1に示す空所補充問題について説明する。図1を参照して、空所補充問題では、受験者は正しい文となるように選択肢26から選択して問題文22中の空所24を補充することが要求される。
【0025】
本実施の形態に係る装置では、こうした空所補充問題では、正解は文をなし、不正解は文をなさないことを利用する。また、正解が誤りなく作成できるように、模範的な文を集めたコーパスを準備し、当該コーパスに含まれる文を種として、多肢選択言語試験問題を作成する。
【0026】
より具体的には、模範的な文を集めたコーパスに基づいて、問題と選択肢(正解と不正解との候補)を生成する。正解はコーパスから抽出できる。問題と不正解の選択肢候補との組合せの各々について、文として妥当か否かを判定する。ここでは不正解の選択肢候補を生成するので、上記判定で文として妥当と判定されたものは、選択肢から除外する。以下の実施の形態では所定の方法で文の妥当性を計算し、妥当性が所定のしきい値を下回るもののみを選択肢として残す。
【0027】
図2に、例として、問題と解の候補とから生成される文群30を示す。図2を参照して、この文群は全部で5つの文40、42、44、46および48を含む。下線を引いた部分が解候補であり、その中で太字で示したものが正解である。図2に示す例では、1番目の文40と5番目の文48との双方とも正解となる。一般的に多肢選択の場合、選択肢の個数と正解の個数は一定である。本明細書では、特に断らない限り、前者を4、後者を1とする。したがってこの場合には1番目の選択肢40または5番目の選択肢48を削除する。
【0028】
誤り検出問題も、空所補充問題とほぼ同様に実現できる。図3に誤り検出問題の例50を示す。図3を参照して、この問題は、文52の4つの選択肢a)〜d)の中から誤り部分を選択する、というものである。この場合には、最初に文を決め、選択肢として単語を決め、その中の一つに関して単語の置換を行なって、文の妥当性検査で非文になることを確認すればよい。なお、最初に置換単語の位置を決めてから、他の選択肢を決めるようにしても同じことである。
【0029】
[第1の実施の形態]
<構成>
以下、こうした手順を実現するための一実施の形態に係る装置の構成および動作について説明する。なお、以下の装置は本発明の一実施の形態に過ぎず、本発明が以下の実施の形態に限定されることはない。
【0030】
図4に、本実施の形態に係る多肢選択言語試験問題作成システム60をブロック図形式で示す。図4を参照して、この多肢選択言語試験問題作成システム60は、問題作成の条件を設定するためにユーザが使用する条件選択部62と、種々のドメインに応じた問題の種文となる正しい文をそれぞれ含む、複数のコーパスからなるコーパス群66と、条件選択部62により設定された条件にしたがい、指定されたドメインにふさわしいコーパスをコーパス群66から選択し、上記した空所補充問題と誤り検出問題とのいずれかからなる多肢選択言語試験問題74を自動的に作成するための問題作成装置64と、問題作成装置64が問題を作成する際に参照する種々の言語情報データを記憶する各種データ記憶部68とを含む。問題作成装置64はまた、いわゆるインターネット70を用いて、多肢選択言語試験問題の作成中に文の妥当性をチェックする機能を持つ。
【0031】
多肢選択言語試験問題作成システム60はいわゆるコンピュータシステムで実現されることが想定されている。条件選択部62は、図示しないキーボードと、マウス等のポインティングデバイスと、条件設定の画面を用いた入出力を行なうためのソフトウェアおよび表示装置等からなる。本実施の形態においては、条件選択部62は、以下のような条件を指定する。
【0032】
(1)問題作成の対象となるドメイン
(2)作成する多肢選択言語試験問題の種別(空所補充問題または誤り検出問題)
(3)作成する問題の個数
(4)問題作成時の種文の選択条件
(5)空所補充問題の際の空所の位置の決定条件
(6)空所補充問題の選択肢作成の際の条件
(7)候補の妥当性の検証方式
問題作成装置64は、後述するようにコンピュータハードウェアと、当該コンピュータ上で実行されるコンピュータプログラムとにより実現される。コーパス群66および各種データ記憶部68は、本実施の形態では、問題作成装置64を実現するものと同じコンピュータ内に設けられた記憶装置により実現される。
【0033】
問題作成装置64は、条件選択部62を用いてユーザにより指定されたドメインのコーパスをコーパス群66から選択するためのコーパス選択部80と、コーパス選択部80により選択されたコーパスを記憶するためのコーパス記憶部82と、条件選択部62を用いてユーザにより指定された条件にしたがって、コーパス記憶部82に格納されているコーパスの中から問題の元となる種文を選択するための種文選択部84とを含む。
【0034】
問題作成装置64はさらに、種文選択部84により選択された種文の中で、条件選択部62を用いてユーザにより指定された問題の種別に応じ、空所補充問題の作成の際には指定された条件にしたがった位置の単語を空所として選択し、誤り検出問題の作成の際には、選択肢となる単語位置を選択肢の数だけ選択し、問題の種別を示す情報および種文とともに出力するための問題位置選択部86と、問題位置選択部86から与えられた種文に対し、問題の種別を示す情報と問題位置とにしたがい、各種データ記憶部68に記憶された各種データを参照しながら選択肢を作成することにより、多肢選択言語試験の選択肢候補を生成するための選択肢候補生成処理部88と、選択肢候補生成処理部88により作成された選択肢候補に関連する文の各々に対し、その妥当性を判定するために、インターネット70を検索するための妥当性判定用データ検索部92と、選択肢候補生成処理部88から受取る選択肢候補に関連する文の各々に対し、妥当性判定用データ検索部92を用いて妥当性判定用データを検索し、文として妥当性を判定するとともに、条件選択部62から与えられる問題種別に応じ、問題自体の適切さをも判定するための妥当性判定部90とを含む。
【0035】
妥当性判定部90は、選択肢候補の妥当性の判定の結果、問題が適切なものでないと判定された場合には、当該問題を破棄し、種文選択部84に対して次の問題作成を指示する機能を持つ。
【0036】
問題作成装置64はさらに、妥当性判定部90によって適切と判定された問題を、問題の種類に応じた適切なフォーマットに整形するための整形部94と、整形部94により整形された問題に対して、インターネット70上のデータおよび各種データ記憶部68に記憶されたデータの中から、問題に関連した情報(例文、定義、語義等)を付与するための関連情報付与処理部96と、関連情報付与処理部96から出力される、関連情報が付与されかつ整形された問題を多肢選択言語試験問題74として記憶装置に書込む処理を行なうための出力部98とを含む。
【0037】
なお、多肢選択言語試験問題の場合には、異なる問題文中に同じ単語が出現することは望ましくない。そのため、問題作成装置64は、出力部98により出力された多肢選択言語試験問題中の選択肢を記憶するための既出選択肢記憶部100を含み、選択肢候補生成処理部88は、問題作成時に既出選択肢記憶部100を参照して、既出の単語が後続の問題中に含まれないように、問題作成の際の単語の選択を行なう機能を持つ。
【0038】
図5は、コーパス記憶部82に記憶されたコーパス110の構成例を示す。図5を参照して、コーパス110は本実施の形態ではモノリンガルコーパスであって、複数個の例文116を含む。各例文116は、識別番号(ID)112と、本文114とを含む。コーパス群66に含まれるコーパスは、全て同じフォーマットである必要はないが、問題作成装置64の構成を簡単にするために、統一されたフォーマットであることが望ましい。
【0039】
図6は、図4に示す各種データ記憶部68の構成を示す。図6を参照して、各種データ記憶部68は、選択肢を作成する際に使用する、ある単語に関連した誤りを誤りの種類にしたがって集めた複数のリストからなる誤りリスト120と、単語に関する辞書122と、同義語、反義語等を収録するとともに、単語の間の類似関係等を収録したシソーラス124と、所定の単語を、その頻度および重要度とともにリストした単語リスト126とを含む。
【0040】
誤りリスト120は、綴りの似た語の集合を集めたリスト130と、ある単語と、その単語に対して綴りを誤った単語とからなる集合を集めたリスト132と、いわゆる和製英語を正しい英語単語(単語列)とともに集めたリスト134とを含む。
【0041】
リスト130に含まれる単語の集合の例として、「moss,miss,mess」がある。リスト132に含まれる単語の集合の例としては、「flight,fright,flit,flite」等がある。リスト134に含まれる単語の集合の例としては、「nighter(ナイター),night game」がある。
【0042】
後述するように、本実施の形態に係る多肢選択言語試験問題作成システム60は、コンピュータハードウェアおよびその上で実行されるソフトウェアにより実現可能である。図7に、多肢選択言語試験問題作成システム60を実現するためのソフトウェアを構成するプログラムのメイン処理の流れをフローチャート形式で示す。以下、図7を参照してこのプログラムの制御構造について説明する。
【0043】
図7を参照して、このプログラムが起動されると、ステップ140で設定の読込みが行なわれる。この設定は、図4に示す条件選択部62により設定され、記憶装置等に書き込まれていたものである。続いてステップ142で、読込んだ設定にしたがって、試験の種別を判定する。試験の種別が空所補充問題の場合にはステップ144に進む。試験の種別が誤り検出問題の場合にはステップ146に進む。以下同様に、選択された試験の種別にしたがい、適切なステップ144〜148の処理が実行される。
【0044】
図8にステップ144で実行される空所補充問題の作成処理を行なうプログラムの制御構造をフローチャート形式で示す。図8を参照して、まずステップ150で作成中の問題番号を表す変数iに0を代入する。ステップ152で変数iに1を加算する。ステップ154で変数iの値が、作成する問題数として設定された値MAXを超えたか否かを判定する。変数iの値が値MAXを超えていれば処理を終了する。変数iの値が値MAX以下であれば制御はステップ156に進む。
【0045】
ステップ156では、図4に示すコーパス記憶部82に記憶された文の中から所定の方法で種文を選択する。なお、図9を参照して後述するように、このステップで選択する種文については、長さに制限を設けてある。
【0046】
続いてステップ158で、種文の中で空所とする位置を決定する。空所の位置も、全体の中からランダムに選択したり、品詞および単語の位置等を条件として選んだりすることができる。例えば、「最左の動詞(例えば「I lost the return ticket of my flight」の「lost」)」、「頻度の高い前置詞(例えば上記「of」)」、または「最右の限定詞(例えば上記「my」)」等を選択することができる。
【0047】
さらにステップ160で、選択肢候補からなる選択肢集合を作成する。このステップでは、ステップ158で選択された空所位置に存在していた単語を「正解」として保存(記憶)した上で、誤りの選択肢候補を複数個だけ作成し、i番目の問題に対する選択肢候補集合Aiとする。本実施の形態では、作成される選択肢候補の最大個数はM個とし、各選択肢候補をAi,mと表す(1≦m≦M)。ステップ160での処理の詳細については図10を参照して後述する。なお、後述するように、ステップ160の処理では、既出の問題に含まれる単語と同じ単語を選択肢候補とすることは不適当と考えられるので、そのような単語は選択肢候補としない。
【0048】
この後、ステップ162で以下の繰返しを制御するための繰返制御変数mに0を代入する。ステップ164で変数mに1を可算する。続いてステップ166で変数mの値が値Mを超えたか否かが判定される。変数mの値が値Mを超えた場合、制御はステップ172に進む。それ以外の場合、制御はステップ168に進む。ステップ172以下の処理については後述する。
【0049】
ステップ168では、選択肢候補Ai,mを含む文が妥当な文かどうかを判定する。本実施の形態では、インターネット70を利用して文の妥当性を判定する。具体的には、本実施の形態では、空所の前後の内容語までの単語列と選択肢とからなる単語列をインターネット70の多数のウェブにおいて検索し、あれば選択肢候補Ai,mを含む文が妥当な文だと判定する。ここでの目的は、誤りとして選択肢候補を見つけることであるから、選択肢候補Ai,mを含む文が妥当な文だと判定された場合、ステップ170で選択肢候補の集合Aiから選択肢候補Ai,mを削除し、ステップ164に戻る。さもなければ選択肢候補Ai,mを含む文は非文であって選択肢候補Ai,mは選択肢として適当であるから選択肢候補集合Aiに残し、何もせずステップ164に戻る。
【0050】
ステップ166で変数mの値が値Mを上回ると、制御はステップ172に進む。ステップ172では、選択肢候補の集合Aiに含まれる要素の数|Ai|が2より大きいか否か(すなわち3以上か)を判定する。2より大きい場合にはステップ174に進むが、それ以外の場合には選択肢の数が不足し問題を構成できないので、この選択肢集合Aiについては問題作成をやめることとし、ステップ156に戻って次の種文の選択からやり直す。
【0051】
ステップ174では、選択肢集合Aiに正解の選択肢を加え、ランダムな順番に配列してその内容を整形して、図1に示すような問題とする。ステップ176で、各選択肢についてウェブで検索した例文、辞書から読みだした語義等の関連情報をこの問題に付与する。さらにステップ178で、この問題を既出選択肢として図4に示す既出選択肢記憶部100のような記憶装置に記憶する。この情報は、ステップ160での選択肢候補の作成処理で使用される。
【0052】
さらに、ステップ180において、このようにして作成された問題を所定の記憶装置に出力する。この後制御はステップ152に戻り、次の問題の作成を開始する。
【0053】
図9を参照して、図8のステップ156で行なわれる種文選択処理について説明する。まずステップ181で、種文候補をコーパスの中から選択する。この際、本実施の形態では、種文の選択方式は複数の方式の中からユーザが指定できるようになっている。例えば種文を全くランダムに選択したり、文の属性(長さ、頻度、読みやすさ等)に関する条件、文に含まれる文法事項または文の使われる場面、例えば動詞を含む文、感嘆文、特定の前置詞を含む文、等の条件等で絞った中からランダムに選択したり、上記した属性の値にしたがって所定の順番で選択したりすることができる。
【0054】
ステップ182では、ステップ181で選択した種文候補の形態素長が所定のしきい値TH1より大きいか否かを判定する。このような判定をするのは、あまりにも短い文では情報が足りず、受験者が選択肢を選ぶのが難しくなり、試験が成立しない可能性があるためである。形態素長がしきい値TH1より大きければステップ184に進み、それ以外の場合には種文として不適当であるためステップ181に戻り、次の種文候補の選択を行なう。一方、ステップ184では、形態素長が別のしきい値TH2(TH2>TH1)より小さいか否かを判定する。このような判定を行なうのは、問題文が長いと、場所をとり、例えば携帯電話等の狭い画面上に問題を表示するには不都合である可能性があるためである。形態素長がしきい値TH2より小さければこの種文候補を種文として種文選択の処理を終了する。さもなければステップ181に戻り、次の種文候補の選択から繰返す。
【0055】
図10に、図8のステップ160で実行される選択肢候補作成処理の詳細をフローチャート形式で示す。図10を参照して、まずステップ190で、選択肢候補からなる集合Aiを空集合φとし、繰返制御変数jに0を代入する。ステップ191で変数jに1を加算する。ステップ192で変数jの値が選択肢候補の最大数Mを超えたか否かを判定する。jがMを超えた場合、この選択肢候補作成処理を終了する。jがM以下であればステップ193に進む。
【0056】
ステップ193では、選択肢候補の単語を、図4に示す各種データ記憶部68を参照して選択する。この場合、以下のような選択の仕方が可能である。
【0057】
(1)問題位置の単語を置換しても文法を逸脱しないように、選択肢の単語の品詞、活用(過去形、単数現在等)を維持して別の単語に置換える。この場合、辞書122から単語をランダムに選択したり、シソーラス124から類義語または反義語を選択したり、単語リスト126から単語の頻度順、重要度順に単語を取出して置換したりできる。
【0058】
(2)単語を置換することで文法を逸脱するように、当該位置の単語の語基を維持して、品詞、活用(過去形、単数現在等)を置換える。例えば辞書122を参照して単語の活用形を変化させたり、ある単語を、当該単語に対応する別品詞の単語に置換する。
【0059】
(3)頻度の高い誤りを再現するように、当該位置の単語を含む誤り単語の集合を図6に示す誤りリスト120から取出し、その中の単語で置換する。例えば、図6に示すように,綴りの似た語、綴りの誤っている語、和製英語等で元の単語位置を置換する。
【0060】
選択肢候補を選択した後、ステップ194において当該単語の頻度を各種データ記憶部68を参照して調べ、その頻度が所定のしきい値TH3より小さいか否かを判定する。頻度があまりに低い単語の場合、受験者は、見慣れないという理由だけで選択肢の単語が不正解であると考えてしまう可能性があり、選択肢として不適当と考えられるためである。したがってステップ194において頻度がしきい値TH3より小さいと判定された場合、ステップ193に戻り、次の選択肢候補を選択する。さもなければステップ195に進む。
【0061】
ステップ195では、選択肢候補が既に作成した問題に出現した単語と同じか否かについて、図4に示す既出選択肢記憶部100に記憶された内容を参照して判定する。既出の単語は選択肢候補として妥当でないため、このような判定を行なう。したがって、選択肢候補が既出単語であればステップ193に戻り、次の選択肢候補について上記した処理を繰返す。既出単語でなければ、ステップ196に進み、この選択肢候補を選択肢候補集合Aiに追加する。この後ステップ191に戻る。
【0062】
以上が、例えば問題作成装置64が空所補充問題を作成する場合に実行されるプログラムのフローチャートである。
【0063】
一方、図7に示すステップ146で実行される誤り検出問題の作成処理も、同様のプログラムにより実現できる。図11に、本実施の形態の問題作成装置64において採用したプログラムの制御構造をフローチャート形式で示す。図11において、図8と同じ処理には同じ参照番号を付す。したがってそれらについての詳細な説明は繰返さない。
【0064】
図11において、ステップ156で種文を選択した後、制御はステップ200に進む。ステップ200では、選択肢として種文の中の所定個数(デフォルトは4個であるが、ユーザによる指定が可能である。)の単語を決定し、そのうちの一つを誤り単語位置として選択する。
【0065】
続いてステップ202で、選択された単語を別の単語で置換することにより、種文Biを別の文Bi'に変換する。本実施の形態では、ここでの置換単語は、図6に示す誤りリスト120の各リストを用いて決定する。なお、ステップ200で選択肢として決定された単語と、ステップ202で決定された置換単語とは、いずれもこれより前の問題(空所補充/誤り検出の別を問わない。)において既出の単語ではないものとする。またこの置換単語は、後に記載する実験では内容語に限定し、機能語は候補から外している。
【0066】
ステップ204で、置換後の文Bi'が非文か否かを判定する。この判定は、図8のステプ168で行なう処理と同様の処理により実現できる。文Bi'が非文であれば、この文Bi'を誤り検出問題の問題とすることができる。
【0067】
したがってステップ206で文Bi'を整形して図3に示すような問題とする。ステップ208で、ステップ204の判定においてインターネット70等から取得した例文、辞書から取得した語義情報等を関連情報としてこの問題に付与する。ステップ210で、この問題を既出選択肢として図4の既出選択肢記憶部100に記憶する。ステップ212でこの問題を出力する。この後、ステップ152に戻り、次の問題の作成を行なう。
【0068】
こうして、誤り検出問題についても、自動的に作成することができる。これ以外にも多肢選択言語試験問題の形式はあるが、それらはいずれも上で説明したものと同様の考え方で実現できる。したがってここではそれら個々についてのプログラムの制御構造については説明しない。
【0069】
<動作>
上に説明した多肢選択言語試験問題作成システム60は以下のように動作する。図4を参照して、予め様々なドメインおよびレベルに対応したコーパス群66が準備されているものとする。また、問題を作成するための誤りリスト120、辞書122、シソーラス124、および単語リスト126についても予め準備されているものとする。
【0070】
ユーザは、条件選択部62を使用して種々の設定を行なう。例えば問題の対象となるドメイン、多肢選択言語試験問題の種別、作成する問題の数、作成しようとする問題のレベル、等を指定する。
【0071】
コーパス選択部80は、ユーザによる指定に応答して、コーパス群66の中から適切なドメインで適切なレベルのコーパスを選択し、コーパス記憶部82に格納する。
【0072】
種文選択部84は、条件選択部62により指定された条件にしたがって、コーパス記憶部82に格納されたコーパス中から種文を選択し、指定された条件とともに問題位置選択部86に与える。問題位置選択部86は、例えば作成すべき問題が空所補充問題であれば、どの単語を空所とするかを決定する。作成すべき問題が誤り検出問題であれば、問題位置選択部86は種文の中で選択肢となる単語位置を決定し、さらにどの単語を誤り単語で置換するかを決定する。なおこの順序は逆でもよい。
【0073】
選択肢候補生成処理部88は、問題位置選択部86により問題位置が決定された種文を受け、各種データ記憶部68を参照して、問題の種別に応じ選択肢候補を生成する。例えば問題が空所補充問題であれば、例えば図6に示すシソーラス124を参照し、問題位置の単語と同じ意味コードを持つ単語を選んで選択肢集合を作成する。
【0074】
妥当性判定部90は、こうして生成された選択肢候補が妥当か否かを判定する。空所補充問題であれば、選択肢集合に含まれる単語を空所に補充した文が、一つを除いて非文となるか否かを判定する。また誤り検出問題であれば、問題位置に誤り単語を挿入した結果得られた文が非文となるか否かを判定する。この際、妥当性判定部90は、妥当性判定用データ検索部92を用いてインターネット70上のウェブを検索し、文の妥当性を判定する。
【0075】
空所補充問題の場合、選択肢集合に含まれる単語を種文の空所に補充した文が、一つ(正解)を除いてすべて非文と判定されれば、妥当性判定部90は選択肢候補を整形部94に与える。誤り検出問題の場合、種文のうち問題位置に誤り単語を挿入して得られた文が非文であれば、妥当性判定部90はこの問題を整形部94に与える。それ以外の場合には、妥当性判定部90は選択肢候補生成処理部88から与えられた問題を破棄する。妥当性判定部90は、問題を採用した場合も、そうでない場合も、種文選択部84に再度問題の作成を開始することを指示する信号を与える。
【0076】
整形部94は、妥当性判定部90から問題が与えられると、問題の種類に応じて適切な形に整形し関連情報付与処理部96に与える。関連情報付与処理部96は、インターネット70から得られた例文、および各種データ記憶部68から得られた単語の語義等の関連情報を選択肢に付与し、出力部98に与える。出力部98は、この問題を既出選択肢記憶部100に書込んだ後,多肢選択言語試験問題74として問題を出力する。
【0077】
種文選択部84は、妥当性判定部90から次の問題の作成を指示する信号が与えられると、既に作成した問題数が条件選択部62から指定された問題数に達したか否かを判定し、達した場合に処理を終了する。達していない場合には、種文選択部84は次の種文をコーパス記憶部82から選択し、問題位置選択部86に与える。
【0078】
以下、種文選択部84、問題位置選択部86、選択肢候補生成処理部88、妥当性判定部90、妥当性判定用データ検索部92、整形部94、関連情報付与処理部96、出力部98および既出選択肢記憶部100により、指定された個数の問題が作成されるまで既に述べた動作が繰返される。
【0079】
なお、上記した妥当性の判定では、空所の前後の内容語までの単語列と、選択肢とからなる単語列がウェブ上に存在するか否かを基準とした。しかし本発明はそのような実施の形態には限定されない。これ以外にも、ウェブにおいて選択肢候補Ai,mを含む文を検索し、あれば妥当な文だと判定する方法、選択肢候補Ai,mを含む文を構成する全てのNグラム(たとえばトライグラム)がウェブ上で見つけられたら妥当な文だと判定する方法、ウェブから求めたNグラム尤度を用いて選択肢候補Ai,mを含む文尤度を計算し、所定のしきい値以上であれば妥当な文と判定する方法、等がある。なお最後に挙げた方法では、ウェブのNグラムの頻度としては、通常の単語列の頻度ではなく、検索システムで検索できた単語列を含む文書の数、すなわち文書頻度dfに置換える。バイグラムwの文書頻度をdf(w)、ユニグラムwの文書頻度をdf(w)、バイグラム文書尤度P(w)はdf(w)/df(w)とする。
【0080】
<実験>
上記した実施の形態に係る多肢選択言語試験問題作成システム60について、実験によりその有効性を検証した。実験では、コーパス群66として旅行会話とビジネス会話という二つのドメインのコーパスを準備し、多肢選択言語試験問題作成システム60により得られた問題を複数の受験者に解かせた結果と、各受験者のTOEIC(登録商標)スコアとが相関しているか否かを調べることで多肢選択言語試験問題作成システム60の有効性を検証した。
【0081】
実験では、以下のオプションを使用した。上記したいずれかのコーパスを選択し、種文を順に選択させる。問題は空所補充問題とする。空所位置は種文の最左の動詞とする。選択肢候補としては、問題位置の単語と同じ意味コードを持つ単語をシソーラス124から選択する。妥当性判定では、選択肢候補の前後の内容語までをキーにしてウェブで文書頻度(妥当性判定用データ検索部92で検索できた単語列を含む文書の個数)を求め、これが0のものを選択肢とする。
【0082】
種文としては、形態素数が6未満、または21以上の文を除いた。また、選択肢候補から頻度9未満の単語を除いた。既出の問題で選択肢として採用された単語列は、別の問題では選択肢候補から除いた。妥当性判定用データ検索部92としては、GOOGLE(登録商標)を用いた。
【0083】
こうして作成した問題を、TOEICスコアが既知の受験者に解かせ、項目反応理論(大友賢二著、「項目応答理論入門」、大修館書店、1996年等の教科書を参照されたい。)によって受験者の英語能力(θ)を推定した。受験者のTOEICスコアを横軸に、受験者の推定英語能力θを縦軸にして、解答結果を示したのが図12のグラフである。図12に示すように、両者の相関は82%と高かった。このことから、上記した実施の形態に係る多肢選択言語試験問題作成システム60によって自動作成した多肢選択問題/空所補充問題が受験者の英語能力を計測するのに有効であることが検証できた。
【0084】
なお、本実験では、パーソナルコンピュータ1台で、1時間ほどの間に20、000問の多肢選択言語試験問題を作成した。従来、英語の検定試験の運営機関では、問題作成および整備に数年の時間をかけている。しかもそうした機関で準備された問題数は4、000問程度である。したがって、本実施の形態に係る多肢選択言語試験問題作成システム60が問題作成の上で非常に有効であることが分かる。
【0085】
[第2の実施の形態]
第1の実施の形態では、種文をソースとしてモノリンガルのコーパスを用いた。しかし、本発明はモノリンガルのコーパスを用いたものに限定されない。例えば、この第2の実施の形態のように、対訳を集めたバイリンガルコーパスを用いて多肢選択言語試験問題を作成することもできる。バイリンガルコーパスを種文のソースとして用いると、原文が制約として働く多肢選択言語試験問題を実現できる。
【0086】
<構成>
図13に、本実施の形態に係る多肢選択言語試験問題作成システム220の構成をブロック図形式で示す。図13を参照して、多肢選択言語試験問題作成システム220は、第1の実施の形態で使用された条件選択部62と同様の条件選択部222と、複数のバイリンガルコーパスを含むバイリンガルコーパス群234と、複数の機械翻訳装置226と、第1の実施の形態で使用した各種データ記憶部68と同様、図6に示すような各種データを記憶するための各種データ記憶部228と、条件選択部222、複数の機械翻訳装置226、各種データ記憶部228、およびインターネット230に接続され、条件選択部222により指定された条件にしたがって多肢選択言語試験問題232を自動的に作成するための問題作成装置224とを含む。
【0087】
各種データ記憶部228は図4に示す各種データ記憶部68と同様のデータを記憶している。したがってその構成についてはここでは説明は繰返さない。
【0088】
複数の機械翻訳装置226は、本実施の形態では互いに異なる方式の機械翻訳装置からなっている。機械翻訳装置226は、後述するように誤り選択肢となる文を作成するために使用される。
【0089】
問題作成装置224は、条件選択部222を用いてユーザが与える指示にしたがい、バイリンガルコーパス群234から一つのバイリンガルコーパスを選択するためのコーパス選択部240と、コーパス選択部240により選択されたバイリンガルコーパスを記憶するためのバイリンガルコーパス記憶部242を含む。このバイリンガルコーパスとしては、一般的には受験者の母語の文と、試験の対象となる言語の文との対訳文を多数含むものを選択する。例えば日本人に英語の試験を課す場合であれば、バイリンガルコーパスとして日本語と英語の対訳を多数含むものを用いる。本実施の形態では、日本語と英語とのバイリンガルコーパスを用いるものとする。この場合、複数の機械翻訳装置226は、いずれも日本語から英語への翻訳を行なうものを用いる。
【0090】
問題作成装置224はさらに、バイリンガルコーパス記憶部242に記憶されたバイリンガルコーパスから、問題を作成するための種文を含む対訳を選択するための種文選択部244と、種文選択部244により選択された対訳のうちの英語の文について、空所補充問題における空所、誤り検出問題における選択肢位置等を選択するための問題位置選択部246とを含む。なお、後述するように、本実施の形態では、原文である日本語を提示してそれに対する複数の訳文から正しいものを選ぶ、という問題形式も可能である。そうした問題を作成する場合には、問題位置選択部246は英語の文全体をまとめて問題位置とする。
【0091】
問題作成装置224はさらに、種文を含む対訳を受け、条件選択部222を用いてユーザにより指定された問題形式にしたがって選択肢候補を作成するための選択肢候補生成処理部248と、選択肢候補生成処理部248により生成された選択肢候補についてインターネット230を検索した結果に基づいて妥当性を判定し、問題として適切なもののみを残し、不適切なものを削除するための妥当性判定部250と、妥当性判定部250からの要求に応じてインターネット230を検索し、結果を妥当性判定部250に返すための妥当性判定用データ検索部252とを含む。
【0092】
選択肢候補生成処理部248が行なう選択肢候補生成処理は、作成すべき多肢選択言語試験問題の形式によって異なる。図14に、本実施の形態に係る問題作成装置224によって作成可能な多肢選択言語試験問題の例を示す。図14を参照して、問題作成装置224により作成可能な問題は、問題270のように日本語の原文を与えて対応の英語文の空所に、ある単語を適切に活用したものを選択肢から選ぶ問題、問題272のように日本語の原文を与えてそれに対応する適切な英語の訳文を4つの選択肢から選択する問題、問題274のように日本語の原文を与え、対応する英語の訳文の空所に補充すべき適切な単語を選択する問題、問題276のように日本語の複合語を与え、それに対する正しい訳語を選択肢から選ぶ問題、等がある。空所補充問題の場合の作成方法は基本的に第1の実施の形態と同様である。問題272の場合には、前述した複数の機械翻訳装置226に原文を与えることにより生成される英文を誤答として準備することができる。問題276の場合には、日本語の複合語の要素単語の各々を各種データ記憶部228内の辞書を使って翻訳し、それら訳語を組合せて誤答を生成できる。
【0093】
これらいずれの場合にも、種文選択部244が選ぶ種文に日本語の文が含まれているため、図14に示すように問題文に日本語文を添えることが可能になる。この場合、例えば空所補充問題では、受験者は、英語だけでなく日本語も制約条件として考慮し解答する。したがって、種文が短くても解答することが容易になり、短い文でも種文として採用できるという効果がある。
【0094】
再び図13を参照して、問題作成装置224はさらに、妥当性判定部250によって問題として適切と判定されたものを問題形式にあわせて整形するための整形部254と、整形部254により整形された問題に、インターネット230から検索された用例、各種データ記憶部228に記憶されている語義、用法等の情報を付与するための関連情報付与処理部256と、関連情報付与処理部256により関連情報が付された問題を多肢選択言語試験問題232として外部の記憶装置に書込むための出力部258と、出力部258により出力される問題中の選択肢を記憶するための既出選択肢記憶部260とを含む。
【0095】
<動作>
多肢選択言語試験問題作成システム220は以下のように動作する。空所補充問題については、多肢選択言語試験問題作成システム220の動作は第1の実施の形態に係る多肢選択言語試験問題作成システム60と同様の動作を行なう。異なるのは、選択する種文が日本語の文と英語の文との対訳からなること、短い文でも種文として使用できること、問題文に日本語の文を制約条件として追加すること、等である。従って以下では、図14に示す問題272を作成するときの多肢選択言語試験問題作成システム220の動作について説明する。
【0096】
条件選択部222によって、問題272のような多肢選択言語試験問題を作成することが指定されたものとする。予めバイリンガルコーパス記憶部242には、ユーザの指示にしたがいコーパス選択部240がバイリンガルコーパス群234から選択したコーパスが記憶されているものとする。以下の説明では、このコーパスは日本語と英語のバイリンガルコーパスであるものとする。
【0097】
種文選択部244は、バイリンガルコーパス記憶部242に記憶されたコーパスの中から種文となる対訳を一組選択する。この選択の際、種文の長さとしては、日本語の文と英語の文との双方について考慮する。ただし、選ばれる種文は、第1の実施の形態の場合より短くてもよい。
【0098】
問題位置選択部246は、問題272のように複数の文のうちから適切な文を選択する問題の場合、種文全体を問題位置として選択し選択肢候補生成処理部248に与える。
【0099】
選択肢候補生成処理部248は、与えられた種文の対訳のうち、日本語の文を機械翻訳装置226に与え、機械翻訳させる。例えば、種文が「好きなデザートはアイスクリームです。」と「My favorite dessert is ice cream.」という文との対訳である場合を考える。選択肢候補生成処理部248は、この日本語の文「好きなデザートはアイスクリームです。」を複数の機械翻訳装置226の各々に与え、その結果を受取る。選択肢候補生成処理部248は、受取った機械翻訳結果と、種文の対訳とを妥当性判定部250に与える。
【0100】
妥当性判定部250は、機械翻訳結果の各々を選択肢候補とし、妥当性判定用データ検索部252を用いたインターネットの検索を行ない、第1の実施の形態で行なったのと同様に、非文か否かの判定を行なう。非文でない候補は捨て、非文となる候補のみ残す。非文となる候補の数が2以下であれば、選択肢の数が不足する。したがって選択肢候補生成処理部248は、処理中の種文に関する問題作成を中止し、種文選択部244に対して次の種文選択を指示する。非文となる候補の数が3以上の場合、選択肢候補生成処理部248は、そのうち3つの文のみ選択して、種文の対訳とともに整形部254に与える。妥当性判定部250はこのとき、種文選択部244に対して次の種文の選択を指示する。これに応答して、種文選択部244は次の種文を選択し、次の問題の作成が開始される。
【0101】
妥当性判定部250から選択肢候補と種文の対訳とを受取った整形部254は、図14に示す問題272のような形式に問題を整形する。この際、整形部254は、種文のうちの英語文と選択肢候補とをマージし、乱数にしたがってa)、b)、c)、d)のいずれかに配置する。
【0102】
関連情報付与処理部256は、このように整形された問題に対し、インターネット230から検索した用例、各種データ記憶部228に記憶されている語義、同義語、反義語、関連単語等の情報を付与し出力部258に与える。
【0103】
出力部258は、この問題を多肢選択言語試験問題232として外部記憶装置に出力する。出力部258はまた、出力する問題文中の単語を既出選択肢記憶部260に格納する。
【0104】
以上の処理を繰返し、条件選択部222を用いてユーザが指定しただけの数の問題が作成できたら処理を終了する。
【0105】
以上のようにこの実施の形態の多肢選択言語試験問題作成システム220によれば、バイリンガルコーパスを用いるため、コーパス中の原文を制約として用いる問題を作成することができる。そのため、受験者は問題文が短くても答えを選択することができるようになる。その結果、コーパスをより有効に利用して、多くの種類の多肢選択言語試験問題を作成することが可能になる。
【0106】
また、上記第1の実施の形態、第2の実施の形態のいずれにおいても、様々な属性のコーパスを準備してそこから種文を選択することにより、試験の対象のドメイン(旅行会話、ビジネス会話、ニュース等)、対象となる受験者のレベル(中学、高校、大学等教育機関の別、または各種検定のランク等)に容易に対応することができる。例えば、特定の教科書の特定単元に出現する文(およびその訳文)を含むコーパスを準備することにより、その教科書が想定している学習者(例えば中学1年、高校3年、ビジネス英語受講者等)の学習レベルに適した多肢選択言語試験問題を容易に、かつ短時間のうちに作成することができる。
【0107】
さらに、コーパス、辞書、シソーラス等を言語ごとに準備することで、複数の言語についても容易に多肢選択言語試験問題を作成できる。また、対訳辞書の言語の組合せを様々にかえることにより、受験者の母語と、試験の対象となる言語との多様な組合せを容易に実現できる。
【0108】
また、インターネット、辞書、シソーラス等を検索することにより、誤答となる選択肢には、適切な用例、語義、同義語、類義語、反義語等を関連情報として付加することができるので、単に問題を解くだけのための問題ではなく、教育効果をあげることが期待できる問題を作成できる。
【0109】
なお、上記した実施の形態では、たとえば携帯電話のように狭い画面を使用して多肢選択言語試験問題を提供する場合を想定し、そのために問題文が長くなることを避けている。しかし、この制限は本質的なものではなく、たとえば問題文を提示するスペースに特に制限がない場合等には、問題文の長さを制限する必要はない。
【0110】
また、上記した実施の形態では、選択肢候補の妥当性を検査するに際してインターネット上のウェブページを検索し、その結果を用いている。ウェブページは極めて大規模なコーパスと考えることができるので、そこにおける、ある単語列からなる言語表現の出現頻度は、当該言語表現の妥当性を近似できると考えられる。つまり、頻度が大きければその言語表現が極めてよく使用されることの現れであり、頻度が非常に低いかまたはゼロであれば、それはその言語表現が非文法的であるか、不自然な表現であることが期待できる。したがって、上記したようにインターネットを用いることで妥当性検査を精度良く行なうことが期待できる。
【0111】
もっとも、文法的であるにもかかわらず新規な表現はどのウェブページにものっていない可能性もあるし、正しい表現が全ていずれかのウェブページ上にあるという保証はない。したがって上記した妥当性検査はあくまで近似的なものと理解されるべきである。したがって、正しい文からなる大規模なコーパスを、ウェブの代わりに使用することもできる。
【0112】
[コンピュータによる実現]
なお、上記した第1の実施の形態に係る問題作成装置64、および第2の実施の形態に係る問題作成装置224はいずれも、コンピュータシステムと、当該コンピュータシステムにより実行されるコンピュータプログラムと、当該コンピュータシステム内の記憶装置または外部記憶装置に格納されるデータとにより実現できる。図15はこのコンピュータシステム330の外観を示し、図16はコンピュータシステム330の内部構成を示す。
【0113】
図15を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352およびCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、いずれもコンピュータ340に接続されるキーボード346、マウス348、およびモニタ342とを含む。
【0114】
図16を参照して、コンピュータ340は、FDドライブ352およびCD−ROMドライブ350に加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352およびCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、および作業データ等を記憶するランダムアクセスメモリ(RAM)360とを含む。コンピュータシステム330はさらに、プリンタ344を含んでいる。
【0115】
ここでは示さないが、コンピュータ340はさらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを含んでもよい。
【0116】
コンピュータシステム330に上記した問題作成装置64または問題作成装置224としての動作を行なわせるためのコンピュータプログラムは、CD−ROMドライブ350またはFDドライブ352に挿入されるCD−ROM362またはFD364に記憶され、さらにハードディスク354に転送される。または、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、またはネットワークを介して、直接にRAM360にプログラムをロードしてもよい。
【0117】
このプログラムは、コンピュータ340に上記した問題作成装置64または問題作成装置224としての動作を行なわせる複数の命令を含む。このために必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)またはサードパーティのプログラム、もしくはコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施の形態のシステムおよび方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」を呼出すことにより、上記した問題作成装置64または224としての動作を実現するための命令のみを含んでいればよい。コンピュータシステム330の動作は周知であるので、ここでは繰り返さない。
【0118】
なお、上記した実施の形態の説明では、例えば図7に示すように、作成する対象となる選択肢問題の種類に応じて、プログラムの主要部分を全く別のものとしている。しかし本発明はそのような実施の形態に限定されるわけではなく、共通の処理を実行する部分は同一のプログラムコードが実行されるようにしてもよい。また、上記説明では、制御構造の説明として便宜的にフローチャートを用いたが、実際のプログラムがこのようなフローチャートにより表された制御構造を持っているとは限らない。例えばオブジェクト指向プログラムのように、個々のオブジェクトが別々に動作し、全体として上に示した実施の形態の装置の機能を実現するものであってもかまわない。
【0119】
さらに、上記実施の形態では、コーパス、条件選択部、問題作成装置の各部、および多肢選択言語試験問題を記憶する記憶装置がすべて同一の場所にあるものとして説明した。しかし本発明はそのような実施の形態に限定されるわけではない。例えば問題作成装置がインターネットに接続されたあるコンピュータにより実現され、条件選択部が無線電話網およびインターネットを通じて当該コンピュータに接続可能な携帯電話のような情報端末装置で実現されてもよい。また、多肢選択言語試験問題を蓄積せず、条件選択部を介して問題の作成要求があるごとに、問題作成装置によって多肢選択言語試験問題を作成し、要求の送信元に返信するような構成を採ってもよい。
【0120】
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
【図面の簡単な説明】
【0121】
【図1】空所補充問題の例を示す図である。
【図2】問題作成の途中で得られる問題と解の候補とから生成される文群を模式的に示す図である。
【図3】誤り検出問題の例を示す図である。
【図4】第1の実施の形態に係る多肢選択言語試験問題作成システム60のブロック図である。
【図5】コーパス記憶部82に記憶されるコーパス110の構成の一例を示す図である。
【図6】各種データ記憶部68に記憶される各種データの構成の一例を示す図である。
【図7】第1の実施の形態に係る多肢選択言語試験問題作成システム60を実現するコンピュータプログラムの制御構造を示すフローチャートである。
【図8】空所補充問題を作成するコンピュータプログラムの制御構造を示すフローチャートである。
【図9】種文選択処理のフローチャートである。
【図10】選択肢候補作成処理のフローチャートである。
【図11】誤り検出問題を作成するコンピュータプログラムの制御構造を示すフローチャートである。
【図12】実験により得られた問題を受験者に解かせて得た受験者の英語能力(θ)と、受験者のTOEICスコアとの相関を示すグラフである。
【図13】本発明の第2の実施の形態に係る多肢選択言語試験問題作成システム220のブロック図である。
【図14】第2の実施の形態において作成可能な多肢選択言語試験問題の種々の形式を模式的に示す図である。
【図15】コンピュータシステムの外観図である。
【図16】図15に示すコンピュータのブロック図である。
【符号の説明】
【0122】
60,220 多肢選択言語試験問題作成システム、62,222 条件選択部、64,224 問題作成装置、66 コーパス群、68,228 各種データ記憶部、70,230 インターネット、80 コーパス選択部、82 コーパス記憶部、84,244 種文選択部、86,246 問題位置選択部、88,248 選択肢候補生成処理部、90,250 妥当性判定部、92,252 妥当性判定用データ検索部、94,254 整形部、96,256 関連情報付与処理部、98,258 出力部、100,260 既出選択肢記憶部、242 バイリンガルコーパス記憶部

【特許請求の範囲】
【請求項1】
多肢選択言語試験問題を自動的に作成するための、多肢選択言語試験問題自動作成装置であって、
コンピュータ読取可能なコーパスを記憶するためのコーパス記憶手段と、
選択肢作成のための言語情報をコンピュータ読取可能な形式で記憶するための言語情報記憶手段と、
前記コーパス記憶手段に記憶された前記コーパスから、予め定める選択方式にしたがって多肢選択言語試験問題の元となる文を選択するための文選択手段と、
前記文選択手段により選択された文のうち、所定条件を充足する構成要素を決定するための構成要素決定手段と、
前記言語情報記憶手段に記憶された前記言語情報に基づいて、前記構成要素決定手段により決定された構成要素に対する置換候補を作成するための置換候補作成手段と、
前記選択された文において、前記決定された構成要素を前記置換候補で置換することにより得られる文の妥当性を判定するための妥当性判定手段と、
前記妥当性判定手段により文が妥当でないと判定された置換候補と、前記元となる文とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための多肢選択言語試験問題作成手段とを含む、多肢選択言語試験問題自動作成装置。
【請求項2】
前記置換候補作成手段は、
前記言語情報記憶手段に記憶された前記言語情報に基づいて、前記決定された構成要素に対する複数個の置換候補を作成するための手段を含み、
前記多肢選択言語試験問題作成手段は、
前記選択された文のうち、前記決定された構成要素を空所で置換した問題文を作成するための手段と、
前記複数個の置換候補のうち、前記妥当性判定手段で文が妥当でないと判定された予め定める所定個数の置換候補と、前記決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、
前記問題文と前記選択肢集合とを所定の問題形式に整形するための整形手段とを含む、請求項1に記載の多肢選択言語試験問題自動作成装置。
【請求項3】
前記多肢選択言語試験問題作成手段は、
前記選択された文のうち、前記決定された構成要素を、前記妥当性判定手段により文が妥当でないと判定された置換候補で置換して問題文を作成するための手段と、
前記問題文のうち、前記置換候補と、前記置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように前記問題文を整形するための整形手段とを含む、請求項1に記載の多肢選択言語試験問題自動作成装置。
【請求項4】
前記置換候補作成手段は、前記言語情報記憶手段に記憶された前記言語情報に基づいて、所与の条件に合致するように前記決定された構成要素に対する置換候補を作成するための条件付置換候補作成手段を含む、請求項1〜請求項3のいずれかに記載の多肢選択言語試験問題自動作成装置。
【請求項5】
さらに、前記所与の条件に関するユーザの入力を受け、前記条件付置換候補作成手段に与えるための手段を含む、請求項4に記載の多肢選択言語試験問題自動作成装置。
【請求項6】
さらに、複数個のコーパスからなるコーパス群を記憶するためのコンピュータ読取可能なコーパス群記憶手段から、ユーザによって指定されたコーパスを読出して前記コーパス記憶手段に格納するためのコーパス読出手段を含む、請求項1に記載の多肢選択言語試験問題自動作成装置。
【請求項7】
前記コーパスは第1言語の文と第2言語の文との対訳を複数個含むバイリンガルコーパスであり、
前記文選択手段は、前記コーパス記憶手段に記憶された前記バイリンガルコーパスから、前記選択方式にしたがって多肢選択言語試験問題の元となる対訳を選択するための対訳選択手段を含む、請求項1に記載の多肢選択言語試験問題自動作成装置。
【請求項8】
前記構成要素決定手段は、前記選択された対訳の前記第2言語の文のうち、前記所定条件を充足する構成要素を決定するための手段を含み、
前記置換候補作成手段は、
前記言語情報記憶手段に記憶された前記言語情報に基づいて、前記決定された構成要素に対する複数個の前記第2言語の置換候補を作成するための手段を含み、
前記多肢選択言語試験問題作成手段は、
前記選択された対訳の前記第1言語の文と、前記選択された対訳の前記第2言語の文のうち、前記決定された構成要素を空所で置換した文とを含む問題文を作成するための手段と、
前記複数個の置換候補のうち、前記妥当性判定手段により文が妥当でないと判定された予め定める所定個数の前記第2言語の置換候補と、前記決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、
前記問題文と前記選択肢集合とを所定の問題形式に整形するための整形手段とを含む、請求項7に記載の多肢選択言語試験問題自動作成装置。
【請求項9】
前記多肢選択言語試験問題作成手段は、
前記選択された対訳の前記第1言語の文と、前記選択された対訳の前記第2言語の文のうち、前記決定された構成要素を、前記妥当性判定手段により文が妥当でないと判定された置換候補で置換して得られた文とを含む問題文を作成するための手段と、
前記問題文の前記第2言語の文のうち、前記置換候補と、前記置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように前記問題文を整形するための整形手段とを含む、請求項7に記載の多肢選択言語試験問題自動作成装置。
【請求項10】
前記構成要素決定手段は、前記選択された対訳の前記第2言語の文全体を前記所定条件を充足する構成要素として決定するための手段を含み、
前記置換候補作成手段は、前記言語情報記憶手段に記憶された言語情報に基づいて、前記選択された対訳の前記第1言語の文を機械翻訳するための複数の機械翻訳手段を含み、
前記多肢選択言語試験問題作成手段は、
前記選択された対訳の前記第2言語の文、および前記複数の機械翻訳手段による翻訳結果のうち、前記妥当性判定手段により妥当でないと判定された文からなる選択肢集合を作成するための手段と、
前記選択された対訳の前記第1言語の文と、前記選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための手段とを含む、請求項7に記載の多肢選択言語試験問題自動作成装置。
【請求項11】
前記文選択手段、前記構成要素決定手段、前記置換候補作成手段、前記妥当性判定手段、および前記多肢選択言語試験問題作成手段を制御して、所定個数の多肢選択言語試験問題を作成させるための制御手段をさらに含む、請求項1〜請求項10のいずれかに記載の多肢選択言語試験問題自動作成装置。
【請求項12】
多肢選択言語試験問題を自動的に作成するための、多肢選択言語試験問題自動作成装置であって、
第1言語の単語と第2言語の単語との対訳を複数個記憶するためのコンピュータ読取可能な辞書記憶手段と、
選択肢作成のための言語情報をコンピュータ読取可能な形式で記憶する言語情報記憶手段と、
前記辞書記憶手段から、予め定める選択方式にしたがって多肢選択言語試験問題の元となる単語の対訳を選択するための対訳選択手段と、
前記言語情報記憶手段に記憶された前記言語情報に基づいて、前記選択された対訳のうち前記第2言語の単語に対する前記第2言語の置換候補を作成するための置換候補作成手段と、
前記選択された対訳の前記第1言語の単語に対する対訳として、前記置換候補作成手段により得られる前記第2言語の置換候補の妥当性を判定するための妥当性判定手段と、
前記妥当性判定手段により妥当でないと判定された置換候補と、前記元となる単語の対訳中の前記第2言語の単語とから選択肢集合を作成するための選択肢作成手段と、
前記選択された対訳の前記第1言語の単語と、前記選択肢作成手段により作成された選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための多肢選択言語試験問題作成手段とを含む、多肢選択言語試験問題自動作成装置。
【請求項13】
コンピュータにより実行されると、当該コンピュータを請求項1〜請求項12のいずれかに記載の多肢選択言語試験問題自動作成装置として動作させる、コンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2006−39353(P2006−39353A)
【公開日】平成18年2月9日(2006.2.9)
【国際特許分類】
【出願番号】特願2004−221450(P2004−221450)
【出願日】平成16年7月29日(2004.7.29)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成16年度独立行政法人情報通信研究機構、研究テーマ「大規模コーパスベース音声対話翻訳技術の研究開発」に関する委託研究、産業活力再生特別措置法第30条の適用を受ける特許出願
【出願人】(393031586)株式会社国際電気通信基礎技術研究所 (905)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】