説明

文章認識能力評価システム、文章認識能力評価プログラム、文章認識能力評価プログラムが記憶された記憶媒体及び文章認識能力評価方法

【課題】言葉の塊であるチャンクをパターン認識しながら読解する能力を評価する。
【解決手段】記憶部9は、判定基本文章を基本文字データとして記憶するとともに、判定表示文章を表示文字データとして記憶する。判定表示文章は、判定基本文章がチャンク毎に区別可能に仮名文字によって表されたものであり、且つ複数のチャンクのうち4文字以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられている。計算部8は、判定表示文章を表示装置3に表示し、マイク7は、判定表示文章を音読する回答者の発話音声を音声データとして取得する。計算部8は、音声データを解析して音読文字データに変換し、音読文字データと基本文字データとを照合することによって、回答者の文章認識能力を評価する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文章認識能力評価システム、文章認識能力評価プログラム、文章認識能力評価プログラムが記憶された記憶媒体及び文章認識能力評価方法に関する。
【背景技術】
【0002】
特開昭62−2285号公報には、1語以上であって1文には満たない単位であるフレーズを所定時間毎に順次切り替えて表示することによって、複数のフレーズから構成される文章を語順通りに理解する能力を高める読解訓練装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開昭62−2285号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
日本語の文章の読み方は、必ずしも一様ではなく、読み手の知識や経験に応じて相違する。例えば、知識や経験が浅い初歩段階の読み手の場合、1文字1文字を逐次的に認識しながら、単語及び文節を理解して文章全体を理解する。初歩段階よりも習熟した読み手の場合、個々の文字を逐次的に認識せず、言葉の塊(チャンク)をパターン認識しながら文章全体を理解する。また、さらに習熟した読み手の場合、文節や文章を全体的に把握する速読(いわゆる斜め読み)が可能となる。すなわち、日本語の文章を読む際に、読解力が高くなるほど、個々の文字を逐次的に認識せずに、言葉の塊であるチャンクを認識するようになる。このため、例えば日本語を学習している外国人や子供などにとって、自身の読み方がどの段階であるか(言葉の塊であるチャンクを認識しながら読解しているか否か)を知ることは、読解力を高めるために有効である。
【0005】
しかし、上記従来の読解訓練装置は、文章を語順通りに正確に理解する能力を高めるものであり、言葉の塊であるチャンクを認識する能力を評価するものではない。
【0006】
そこで、本発明は、言葉の塊であるチャンクをパターン認識しながら読解する能力を評価することが可能な文章認識能力評価システム、文章認識能力評価プログラム及び文章認識能力評価方法の提供を目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成すべく、本発明の文章認識能力評価システムは、記憶手段と、表示手段と、表示制御手段と、集音手段と、音声解析手段と、評価手段と、出力手段とを備える。
【0008】
記憶手段は、判定基本文章を基本文字データとして記憶するとともに、判定表示文章を表示文字データとして記憶する。判定基本文章は、各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する。判定表示文章は、判定基本文章がチャンク毎に区別可能に仮名文字によって表されたものであり、且つ複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられている。
【0009】
表示制御手段は、記憶手段から表示文字データを読み出して判定表示文章を表示手段に表示する。集音手段は、表示手段に表示された判定表示文章を音読する被験者の発話音声を集音して音声データとして取得する。音声解析手段は、集音手段が取得した音声データを解析して音読文字データに変換する。
【0010】
評価手段は、音声解析手段が変換した音読文字データと記憶手段に記憶された基本文字データとを照合することによって、被験者の文章認識能力を評価する。出力手段は、評価手段の評価結果を出力する。
【0011】
また、本発明の文章能力評価プログラムは、記憶手段と表示手段と集音手段とを備えた文章認識能力評価システムのコンピュータを、表示制御手段、音声解析手段、評価手段、及び出力手段として機能させるためのプログラムである。
【0012】
記憶手段は、判定基本文章を基本文字データとして記憶するとともに、判定表示文章を表示文字データとして記憶する。判定基本文章は、各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する。判定表示文章は、判定基本文章がチャンク毎に区別可能に仮名文字によって表されたものであり、且つ複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられている。
【0013】
集音手段は、表示手段に表示された判定表示文章を音読する被験者の発話音声を集音して音声データとして取得する。
【0014】
表示制御手段は、記憶手段から表示文字データを読み出して判定表示文章を表示手段に表示する。音声解析手段は、集音手段が取得した音声データを解析して音読文字データに変換する。
【0015】
評価手段は、音声解析手段が変換した音読文字データと記憶手段に記憶された基本文字データとを照合することによって、被験者の文章認識能力を評価する。出力手段は、評価手段の評価結果を出力する。
【0016】
また、本発明の文章認識能力評価方法は、判定基本文章記憶ステップと、判定表示文章記憶ステップと、判定文章表示ステップと、音読ステップと、集音ステップと、音読文章検出ステップと、判定ステップと、評価結果出力ステップとを備える。
【0017】
判定基本文章記憶ステップでは、各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する判定基本文章を、基本文字データとして記憶手段が記憶する。判定表示文章記憶ステップでは、判定基本文章がチャンク毎に区別可能に仮名文字によって表され、且つ複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられた判定表示文章を、表示文字データとして記憶手段が記憶する。
【0018】
判定文章表示ステップでは、表示制御手段が、記憶手段から表示文字データを読み出して判定表示文章を表示手段に表示する。音読ステップでは、表示手段に表示された判定表示文章を被験者が音読する。集音ステップでは、判定表示文章を音読した被験者の発話音声を、集音手段が集音して音声データとして取得する。音読文章検出ステップでは、集音手段が取得した音声データを、音声解析手段が解析して音読文字データに変換する。
【0019】
判定ステップでは、音声解析手段が変換した音読文字データと記憶手段に記憶された基本文字データとを照合することによって、判定手段が被験者の文章認識能力を評価する。評価結果出力ステップでは、評価手段の評価結果を出力手段が出力する。
【0020】
なお、出力手段は、評価手段の評価結果を画像として表示手段に表示する上記表示制御手段であってもよい。また、出力手段は、評価手段の評価結果を印刷データとして印刷装置へ出力してもよく、音声データとしてスピーカへ出力してもよい。
【発明の効果】
【0021】
本発明によれば、日本語の文章を読む際に文字をチャンクとして認識する能力を的確に評価することができる。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施形態の文章認識能力評価システムを示すブロック構成図である。
【図2】候補テキストからテストピースを生成する過程を説明する図である。
【図3】本実施形態のテストピース生成処理を示すフローチャートである。
【図4】本実施形態の評価処理を示すフローチャートである。
【発明を実施するための形態】
【0023】
以下、本発明の一実施形態を図面に基づいて説明する。
【0024】
[文章認識能力評価方法の概要]
全体として所定の意味を有する日本語の文章を、仮名文字(ひらがな及びカタカナ)のみによって構成するとともに、1単語を基本構成とする複数のチャンクに分割し、チャンク毎に区別可能なように各チャンク間にスペースを設定した(文字間隔を拡げた)仮名だけ文を用意し、この仮名だけ文を画面に表示して音読させた場合、日本語に対する知識や経験が浅い初歩段階の読み手は、1文字1文字を逐次的に認識しながら単語及び文節を理解して、文章全体を理解する傾向を示す。これに対し、初歩段階よりも習熟した読み手は、個々の文字を逐次的に認識せず、チャンクを言葉の塊として認識しながら文章全体を理解する傾向を示すため、初歩段階の読み手に比べて音読時間が短い。
【0025】
また、上記仮名だけ文に含まれる複数のチャンクのうち、3文字を超える所定数以上(本実施形態では4文字以上)の仮名文字から構成されるチャンク(以下、変換対象チャンクと称する)の最初の1文字と最後の1文字とを除く複数の中間文字の配列順序を作為的に入れ替えた判定表示文章を生成し、この判定表示文章を表示して音読させた場合、習熟した読み手は、変換対象チャンクの最初の1文字及び最後の1文字や、変換対象チャンクを構成する文字の組み合わせや、前後の文脈などから、文字順序が入れ替えられる前の所定の意味を有する言葉の塊として変換対象チャンクをパターン認識する。このため、習熟した読み手は、変換対象チャンクを、入れ替え後の文字の並びのまま音読せず、入れ替え前の文字の並びで音読する。これに対し、初歩段階の読み手は、変換対象チャンクを所定の意味を有する言葉の塊として認識せず、個々の文字を逐次的に認識するため、変換対象チャンクを入れ替え後の文字の並びで音読する。
【0026】
本発明の文章認識能力評価方法は、このような初歩段階の読み手と習熟した読み手との読み方の相違に着目したものであり、変換対象チャンクの中間文字の配列順序を作為的に入れ替えた判定表示文章を画面に表示して被験者に音読させ、被験者が入れ替え前の文字の並びで変換対象チャンクを音読した場合を正答とし、それ以外(入れ替え後の文字の並びを含む)の場合には誤答として、その結果を被験者に報知する。
【0027】
[文章認識能力評価システムの構成]
図1に示すように、文章認識能力評価システム(以下、評価システムと称する)1は、評価処理装置2と、表示装置(ディスプレイ、表示手段)3と、スピーカ4と、マウス5と、キーボード6と、マイク(集音手段)7とを備える。
【0028】
評価処理装置2は、入出力部(図示省略)と計算部8と記憶部(記憶手段)9とを備える。入出力部と計算部8と記憶部9とは、バス(図示省略)を介して接続されている。計算部8は、表示制御手段、音声解析手段、評価手段、出力手段及び判定表示文章生成手段として機能する。なお、本実施形態では、汎用のパーソナルコンピュータ(PC)を評価処理装置2として用いたが、専用の装置を用いてもよい。
【0029】
入出力部は、インターフェースであり、表示装置3、スピーカ4、マウス5、キーボード6及びマイク7との間でデータを送受信する。適性診断の実施者や被験者がマウス5やキーボード6に対して入力操作を行うことにより、各種制御信号や各種データが入出力部から評価処理装置2へ入力する。マイク7は、回答者の音声集音して音声データとして取得する。取得された音声データは、入出力部から評価処理装置2へ入力する。
【0030】
記憶部9は、ROM(Read Only Memory)やRAM(Random Access Memory)によって構成され、計算部8が各種処理を実行するための各種プログラムや各種データが記憶されている。各種プログラムには、文章認識能力評価プログラムが含まれ、文章認識能力評価プログラムには、計算部8がテストピース生成処理を実行するためのテストピース生成プログラムと、評価処理を実行するための評価プログラムとが含まれる。また、記憶部9には、テストピース生成処理で処理対象となる複数の候補テキスト(判定基本文章)を記憶するデータベースDBと、候補テキストから生成したテストピース(判定表示文章)を示す表示文字データをその候補テキストを示す基本文字データに対応付けて記憶するテストピース記憶領域と、評価結果を記憶する評価結果記憶領域と、単語難易度データベースと、候補数カウント領域と、目標実行数カウント領域とが設定されている。文章認識能力評価プログラムは、各種CDメディア(Compact Disc Media)などの外部の記憶媒体から読み出されて記憶部9に記憶されてもよく、またインターネットなどのネットワークを介して取得されて記憶部9に記憶されてもよい。
【0031】
計算部8は、CPU(Central Processing Unit)によって構成され、記憶部9から文章認識能力評価プログラムを読み出してテストピース生成処理や評価処理を実行する。計算部8は、後述する音読所要時間を算出するためのカウント値(例えば時刻)を取得可能な内部タイマ(図示省略)を含む。また、計算部8は、各種制御信号や各種データや検出信号を入出力部を介して外部と送受信し、画像データを生成して表示装置3へ出力することによって表示画面に所望の画像を表示させる。さらに、計算部8は、マイク7から入力された音声データを解析して音読文字データ(本実施形態では全てをひらがなで構成したテキストデータ)に変換する自動音声認識機能を有する。
【0032】
テストピース生成処理において、計算部8は、候補テキストを特定し、特定した候補テキストの全ての文字を仮名文字(ひらがなのみ、又はひらながとカタカナの双方)によって表した仮名だけ文を生成し、生成した仮名だけ文の各チャンク間にスペースを設定し、この仮名だけ文に含まれる複数のチャンクのうち4文字以上の仮名文字から構成される所定のチャンクを変換対象チャンクとして特定し、特定した変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序を作為的に入れ替えることによってテストピース(表示文字データ)を生成する。また、計算部8は、テストピースの生成源である候補テキストの全ての文字をひらがなによって表した文章のテキストデータを基本文字データとして生成し、生成した基本文字データとテストピースとを対応付けて記憶部9に記憶する。
【0033】
候補テキストとは、全体として所定の意味を有する日本語の文章であり、複数のチャンクからなる。チャンクとは、1単語(名詞・動詞・形容詞・形容動詞・副詞・連体詞・接続詞・感動詞・助動詞・助詞)を基本構成とする意味的な塊である。なお、助動詞及び助詞については、直前の単語の文字数が少ない場合(本実施形態では3文字以下の場合)、1つのチャンクとして独立させず、直前の単語に連結させ、連続する2品詞を1つのチャンクとして扱う。
【0034】
単語難易度データベースには、小学校や中学校で習う標準的な単語が予め登録されている。テストピース生成処理において、どの難易度でテストピースを生成するかが予め設定されており、計算部8は、候補テキストを特定する際に、その候補テキストを単語難易度データベースと照合し、設定された難易度に応じて候補テキストを取捨する。本実施形態では、難易度として3段階(低・中・高)が設定可能であり、難易度が低いほど候補テキスト中の上記標準的な単語が高い割合で含まれるように、候補テキストが選択される。具体的には、難易度が「低」の場合には、候補テキスト中の全ての単語が標準的であることが要求され、難易度が「中」の場合には、候補テキスト中の全ての単語のうち80%以上100%未満が標準的であることが要求され、難易度が「高」の場合には、候補テキスト中の全ての単語のうち80%未満が標準的であることが要求される。
【0035】
基本文字データとは、候補テキストの全ての文字をひらがなで構成した文字データ(本実施形態ではテキストデータ)である。候補テキストが「これは読む能力を評価するシステムです。」という文章の場合(図2(1)参照)、「これはよむのうりょくをひょうかするしすてむです。」という文章のテキストデータが基本文字データとして記憶される。
【0036】
テストピースとは、上述のように、候補テキストの全ての文字が仮名文字によって表され、且つ各チャンク間にスペースが設定された仮名だけ文をベースとし、この仮名だけ文に含まれる4文字以上のチャンクのうち所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序を作為的に入れ替えた仮名文字のみからなる文章であり、その文字データ(テキストデータ)が表示文字データとして記憶部9に記憶される。候補テキストが「これは読む能力を評価するシステムです。」という文章であり、「システム」を変換対象チャンクとした場合(図2(1)参照)、対応するテストピースは、例えば「これは よむ のうりょく を ひょうかする シテスム です。」となる(図2(5)参照)。
【0037】
計算部8がテストピース生成処理を複数回実行することによって、記憶部9には、候補テキストを示す基本文字データとテストピースを示す表示文字データとの組み合わせが複数記憶される。
【0038】
評価処理において、計算部8は、1つのテストピース(表示文字データ)を記憶部9から読み出して表示装置3の画面に表示する。被験者は、表示装置3に表示されたテストピースを音読し、マイク7は、テストピースを音読した被験者の発話音声を集音して音声データとして取得する。計算部8は、マイク7が取得した音声データを解析して音読文字データに変換し、変換した音読文字データと記憶部9に記憶された基本文字データとを照合することによって、被験者の文章認識能力を評価し、その評価結果を表示装置3の画面に表示する。
【0039】
本実施形態の計算部8は、音読文字データと基本文字データとが一致するか否か(変換対象チャンクを、入れ替え後の文字の並びでは音読せず、入れ替え前の文字の並びで音読したか否か)を判定し、その判定結果を評価結果として出力する。また、計算部8は、テストピースの表示開始から被験者の音読終了までに要した時間を内部タイマによって計時し、その時間(音読所要時間)を評価結果として出力する。さらに、計算部8は、音読文字データと基本文字データとが相違する場合において、ミスのタイプ別のカウントを行う。具体的には、テストピースを構成するチャンクを変換対象チャンクとそれ以外のチャンク(非変換対象チャンク)とに分類し、非変換対象チャンクの正答率と、変換対象チャンクの正答率とをそれぞれ評価結果として算出する。1文字1文字を逐次的に認識する能力が未だ不十分なタイプの被験者の場合、非変換対象チャンクの正答率と変換対象チャンクの正答率とが共に低くなる。これに対し、1文字1文字を逐次的に認識する能力は十分であるが、チャンクを言葉の塊として認識しながら文章全体を理解する能力が不十分な被験者の場合、非変換対象チャンクの正答率は高く、変換対象チャンクの正答率は低くなる。
【0040】
[起動処理]
次に、計算部8が実行する起動処理について説明する。
【0041】
評価試験の提供者や評価試験の被験者(回答者)などのユーザがマウス5やキーボード6によって所定の入力を行い、アプリケーション(文章認識能力評価プログラム)を起動させると、計算部8は、表示装置3に所定のメニュー画像を表示させる。
【0042】
このメニュー画面は、テストピース生成モードと評価モードと訓練モードとの中から所望のモードを択一的に選択させる画面であり、ユーザがマウス5やキーボード6によってテストピース生成モードを選択するとテストピース生成処理が開始され、評価モードを洗濯すると評価処理が開始され、訓練モードが選択されると訓練処理が開始される。
【0043】
[テストピース生成処理]
次に、計算部8が実行するテストピース生成処理について、図3のフローチャートを参照して説明する。
【0044】
テストピース生成処理が開始されると、計算部8は、表示装置3に所定の準備画面を表示する。準備画面には、ユーザが難易度や作成するテストピースの必要数などの諸条件を入力するための設定欄が表示される。ユーザが諸条件を入力し、所定の開始指示を入力すると、計算部8は、データベースDBから1つの候補テキストを読み込む(ステップS11)。なお、この開始時において、計算部8は、候補数カウント領域に記憶されている数値(候補数)をリセットする。
【0045】
候補テキストには、公開された情報ソース(例えばWEB上に掲載されたニュースソース)や教科書的書籍などにおいてコピーペーストが許容されている日本語の文章が使用可能であり、ユーザは、これらの候補テキストをデータベース(DB)に予め複数取り込んでおく。また、音声として取り込むことが可能な日常会話やCDなどのソースからテキストデータに変換して候補テキストとして用いることも可能である。計算部8は、候補テキストをデータベースDBから所定の順序(例えば記憶が古い順など)で読み出してもよく、ランダムに読み出してもよい。
【0046】
また、データベースDBから候補テキストを読み出す際に、計算部8は、その候補テキストを単語難易度データベースと照合し、設定された難易度に応じて候補テキストを取捨する。
【0047】
次に、計算部8は、読み出した候補テキストに数詞やアルファベットなどの排除文字が含まれていないか否かを判定する(ステップS12)。排除文字が含まれている場合(ステップS12:NO)、計算部8は、その候補テキストを選択せず、データベースDBから削除し、ステップS11へ戻り、次の候補テキストを読み込む。
【0048】
一方、読み出した候補テキストに排除文字が含まれていない場合(ステップS12:YES)、計算部8は、漢字と仮名文字の混成文である候補テキストから、仮名だけ文を生成する(ステップS13)。なお、カタカナで表記された外来語は、ひらがなではなく、カタカナのままで用いる。
【0049】
次に、計算部8は、仮名だけ文をチャンクとして分割し、各チャンクの間に適切な文字間隔を設定する(ステップS14)。
【0050】
次に、計算部8は、候補テキストの各チャンクから、文字順変更候補(変換対象チャンクの候補)を選択する(ステップS15)。本実施形態では、候補テキストの文末のチャンクから文頭のチャンクに向かって、文字順変更候補を順次選択する。
【0051】
次に、計算部8は、選択し文字順変更候補が4文字以上であるか否かを判定する(ステップS16)。変換対象チャンクは、その文字順を、チャンクの最初の1文字と最後の1文字は変えずに、中間の文字の順序のみを変更することから、変換対象チャンクの文字数は、少なくとも4文字以上であることが必要なためである。なお、変更対象チャンクの文字数の下限値は、4文字以上であれば任意に設定可能である。
【0052】
文字順変更候補が4文字以上の場合(ステップS14:YES)、中間の文字順序をランダムに入れ替えたワード(配列変換ワード)を作成する。このとき、例えば、文字順変更候補が「ぶんしょう」である場合、「ぶんょしう」のように実際には発音できない文字の並びとなる配列変換ワードの生成を許容してもよく、また意図的に発音できない配列変換ワードが生成されるように予め設定してもよい。
【0053】
次に、作成した配列変換ワードが固有の意味を有する言葉として不成立であるか否かを判定する(ステップS17)。例えば、元のチャンクが「ふたたび」の場合、配列変換ワードも同じ「ふたたび」となり、固有の意味を有する言葉として成立するため、そのチャンクを変換対象チャンクの候補から除外する。また、例えば、元のチャンクが「さかさま(逆さま)」の場合、配列変換ワードは「ささかま(笹かま)」となり、変換前とは異なる固有の意味を有する言葉として成立し得るため、そのチャンクを変換対象チャンクの候補から除外する。なお、チャンクが5文字以上であり、中間の文字順序の入れ替えが複数通り成立し、その複数通りの配列変換ワードの中に言葉として成立するものと成立しないものとの双方が存在する場合、不成立である配列変換ワードを候補とし、固有の意味を有する言葉として成立しないと判定する。
【0054】
次に、計算部8は、テストピース記憶領域を参照し、過去の使用履歴から今回作成した配列変換ワードに過去の実施例があるか否かを判定する(ステップS18)。音読を一度経験してしまうと、2回目からは容易に読めてしまうため、できる限り同じ文を使用しないことが評価上好ましい。このため、過去に実施例がある配列変換ワードの場合は候補から除外する。
【0055】
配列変換ワードが4文字以上であり(ステップS16:YES)、固有の意味を有する言葉として不成立であり(ステップS17:YES)、過去に実施例がない場合(ステップS18:YES)、計算部8は、ステップS15で選択した文字順変更候補を変換対象チャンクとして決定し、候補テキストの仮名だけ文の変換対象チャンクを配列変換ワードで置換することによってテストピース(候補文)を生成し、生成したテストピースをテストピース記憶領域に難易度別に分類して記憶する(ステップS19)。このとき、計算部8は、候補テキストの全ての文字をひらがなによって表した基本文字データ(テキストデータ)を生成し、生成した基本文字データとテストピースとを対応付けてテストピース記憶領域に記憶する。
【0056】
一方、配列変換ワードが4文字未満の場合(ステップS16:NO)、固有の意味を有する言葉として成立する場合(ステップS17:NO)、或いは過去に実施例がある場合(ステップS18:NO)、計算部8は、候補テキストに次の文字順変更候補が存在するか否かを判定する(ステップS22)。次候補がある場合(ステップS22:YES)、ステップS15へ戻り、計算部8は、次の文字順変更候補を選択し、ステップS16以降の処理を実行する。次候補がない場合(ステップS22:NO)、ステップS11へ戻り、計算部8は、次の新たな候補テキストを読み込み、ステップS12以降の処理を実行する。
【0057】
テストピースを記憶部9に記憶した計算部8は、候補数カウント領域に積算されるテストピースの候補数を1つインクリメントし(ステップS20)、テストピースの候補数がユーザによって設定された必要数に達したか否かを判定し(ステップS21)、必要数に達すると(ステップS21:YES)、本処理を終了する。
【0058】
一方、テストピースの候補数が必要数に達していない場合(ステップS21:NO)、ステップS11へ移行し、計算部8は、次の新たな候補テキストを読み込み、ステップS12以降の処理を実行する。
【0059】
このようなテストピース生成処理によって、計算部8は、例えば、図2(1)に示すように「これは読む能力を評価するシステムです。」というテキストデータを候補テキストとしてデータベースDBから読み込むと(ステップS11)、図2(2)に示すように「これはよむのうりょくをひょうかするシステムです。」という仮名だけ文を生成し(ステップS13)、「これは よむ のうりょく を ひょうかする システム です。」のように仮名だけ文の各チャンクの間に適切な文字間隔を設定する(ステップS14)。最初の文字順変更候補である「です」は、文字順を変更した場合に図2(4)に示すように「すで」となってしまう2文字であるため、ステップS16→ステップS22→ステップS15と移行し、次の文字順変更候補として「システム」を選択する。「システム」は、4文字以上であり(ステップS16:YES)、配列変換ワードである「シテスム」は固有の意味を有する言葉として不成立である(ステップS17:YES)ため、過去に実施例がない場合(ステップS18:YES)、計算部8は、図2(5)に示すように「これは よむ のうりょく を ひょうかする シテスム です。」というテキストデータをテストピースとして生成し、「これはよむのうりょくをひょうかするしすてむです」といテキストデータを基本文字データとして生成し、両者を関連付けて記憶する。
【0060】
なお、本実施形態では、文字順変更候補を候補テキストの文末から文頭に向かって順次選択したが、候補テキストの文頭から文末に向かって順次選択してもよく、ランダムな順序で選択してもよい。また、1つのテストピースに1つの変換対象チャンクが存在するように各テストピースを生成する例を説明したが、1つのテストピースに2つ以上の所定数の変換対象チャンクが存在するように各テストピースを生成してもよく、条件を満たす全てのチャンクを変更対象チャンクとしてもよい。また、難易度に応じて1つのテストピースに含める変換対象チャンクの数を増減させてもよい。
【0061】
[評価処理]
次に、計算部8が実行する評価処理について説明する。なお、本テストに先立ち、テストピースでは文字が作為的に入れ替えられている旨を回答者(被験者)に通知するか否かは任意であるが、初歩段階の回答者の場合には予め通知しておくことが好ましい。
【0062】
評価処理が開始されると、計算部8は、表示装置3に所定のメニュー画面を表示する。メニュー画面には、ユーザが難易度及びテストピースの実行数を選択するための選択欄が表示される。ユーザが難易度及び実行数を選択し、所定の開始指示を入力すると、計算部8は、選択された難易度のテストピースを、選択された実行数分だけテストピース記憶領域から読み込み(ステップS1)、目標実行数カウント領域に積算されるテストピースの実行数を1つインクリメントする(ステップS2)。
【0063】
次に、計算部8は、画面上に表示開始ボタンを表示する。回答者がマウス5を操作して表示開始ボタンをクリックすると(ステップS3)、計算部8は、最初のテストピースを記憶部9から読み出して画面に表示し(ステップS4)、回答者は、表示されたテストピースを音読する(ステップS5)。この表示開始時に、計算部8は内部タイマによる計時を開始する。マイク7は、テストピースを音読した回答者の発話音声を集音して音声データとして取得し、計算部8は、マイク7が取得した音声データを解析して音読文字データに変換(回答音声を認識)する(ステップS6)。
【0064】
次に、計算部8は、変換した音読文字データと記憶部9に記憶された基本文字データとを照合することによって、回答者の文章認識能力を評価する(ステップS7)。すなわち、計算部8は、音読文字データと基本文字データとが一致するか否か(変換対象チャンクを、入れ替え後の文字の並びでは音読せず、入れ替え前の文字の並びで音読したか否か)を判定する。また、計算部8は、回答者の音読終了時に内部タイマによる計時を終了し、回答者が音読に要した音読所要時間を取得する。さらに、計算部8は、音読文字データと基本文字データとが相違する場合において、ミスのタイプ別のカウントを行う。具体的には、非変換対象チャンクの正答率と、変換対象チャンクの正答率とをそれぞれ評価結果として算出する。
【0065】
例えば、「これは よむ のうりょく を ひょうかする シテスム です。」というテストピースが表示され、回答者が「これはよむのうりょくをひょうかするしすてむです」と音読した場合、計算部8は、音読文字データと基本文字データとが一致する正答であると判定し、それ以外の場合(文字通りに「これはよむのうりょくをひょうかするしてすむです」と音読した場合を含む)、音読文字データと基本文字データとが一致しない誤答であると判定する。
【0066】
次に、計算部8は、テストピースの実行数(目標実行数カウント領域の積算値)が目標数に達したか否かを判定し(ステップS8)、目標数に達していない場合(ステップS8:NO)、目標数に達するまで、ステップS2〜ステップS7の処理を繰り返して実行する。
【0067】
テストピースの実行数が目標数に達すると(ステップS8:YES)、計算部8は、回答の正答率、音読所要時間の平均値、及びタイプ別ミス率を算出し(ステップS9)、これらの算出結果と各テストピース毎の結果とを、評価結果として表示装置3の画面に表示して(ステップS10)、本処理を終了する。また、計算部8は、評価に使用したテストピースとその評価結果とを記憶部9に記憶する。
【0068】
[訓練処理]
訓練処理は、評価処理の一態様であり、テストピースの実行数は予め1回に設定されている。また、回答者から所定の終了指示が入力されない限り、テストピースの表示(ステップS4)から評価結果の表示(ステップS10)の処理が繰り返される。表示するテストピースは、評価結果に因らず次々に変更してもよく、誤答の場合は同じテストピースを表示し、正答の場合にのみ次のテストピースを表示してもよい。
【0069】
以上説明したように、本実施形態によれば、評価結果を見た回答者は、1文字1文字を逐次的に認識しながら文章全体を理解する初歩段階であるか、或いは個々の文字を逐次的に認識せず、無意識な予測を含めて言葉の塊であるチャンクをパターン認識しながら文章全体を理解する段階に進んでいるかという自己の文章認識能力を、的確に評価することができる。
【0070】
また、訓練モードを用いることによって、日本語の初学者(例えば、若年層や日本語を学習している外国人など)の文章認識能力を向上させることができる。
【0071】
また、テストピース生成モードを用いることによって、テストピースを簡単に作成することができる。
【0072】
さらに、限定された対象者に対し日本語の文章を表示して所定の情報を提供する場合において、対象者の文章認識能力の評価結果を利用することによって、対象者に合わせた適切な表現(例えば、対象者の多数が初歩段階の場合には平易な表現にするなど)で情報を提供することができる。
【0073】
なお、上述の実施形態は本発明の一例である。このため、本発明は上述の実施形態に限定されることはなく、本発明に係る技術的思想を逸脱しない範囲であれば、上述の実施形態以外であっても種々の変更が可能であることは勿論である。
【産業上の利用可能性】
【0074】
本発明は、文章認識能力を評価する装置やその実行プログラムや実行プログラムを記憶した記憶媒体に適用することができる。
【符号の説明】
【0075】
1:文章認識能力評価システム
2:評価処理装置
3:表示装置(表示手段)
4:スピーカ
5:マウス
6:キーボード
7:マイク(集音手段)
8:計算部(表示制御手段、音声解析手段、評価手段、出力手段、判定表示文章生成手段)
9:記憶部(記憶手段)

【特許請求の範囲】
【請求項1】
各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する判定基本文章を、基本文字データとして記憶するとともに、前記判定基本文章がチャンク毎に区別可能に仮名文字によって表され、且つ前記複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられた判定表示文章を、表示文字データとして記憶する記憶手段と、
表示手段と、
前記記憶手段から前記表示文字データを読み出して前記判定表示文章を前記表示手段に表示する表示制御手段と、
前記表示手段に表示された判定表示文章を音読する被験者の発話音声を集音して音声データとして取得する集音手段と、
前記集音手段が取得した音声データを解析して音読文字データに変換する音声解析手段と、
前記音声解析手段が変換した音読文字データと前記記憶手段に記憶された基本文字データとを照合することによって、前記被験者の文章認識能力を評価する評価手段と、
前記評価手段の評価結果を出力する出力手段と、を備えた
ことを特徴とする文章認識能力評価システム。
【請求項2】
請求項1に記載の文章認識能力評価システムであって、
前記表示制御手段による前記判定表示文章の表示開始から前記被験者の音読終了までに要した時間を計時する計時手段を備え、
前記評価手段は、前記計時手段が計時した時間に基づいて前記被験者の文章認識能力を評価する
ことを特徴とする文章認識能力評価システム。
【請求項3】
請求項1又は請求項2に記載の文章認識能力評価システムであって、
前記評価手段は、前記音読文字データと前記基本文字データとが一致するか否かを判定し、その判定結果を評価結果として算出する
ことを特徴とする文章能力評価システム。
【請求項4】
請求項1〜請求項3の何れか1項に記載の文章認識能力評価システムであって、
前記判定基本文章をチャンク毎に区別可能に仮名文字によって表し、前記複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定のチャンクを変換対象チャンクとして特定し、特定した変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序を入れ替えることによって前記判定表示文章を生成する判定表示文章生成手段を備え、
前記記憶手段は、前記判定表示文章生成手段が生成した判定表示文章を、前記表示文字データとして記憶する
ことを特徴とする文章認識能力評価システム。
【請求項5】
各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する判定基本文章を、基本文字データとして記憶するとともに、前記判定基本文章がチャンク毎に区別可能に仮名文字によって表され、且つ前記複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられた判定表示文章を、表示文字データとして記憶する記憶手段と、表示手段と、該表示手段に表示された前記判定表示文章を音読する被験者の発話音声を集音して音声データとして取得する集音手段と、を備えた文章認識能力評価システムのコンピュータを、
前記記憶手段から前記表示文字データを読み出して前記判定表示文章を前記表示手段に表示する表示制御手段、
前記集音手段が取得した音声データを解析して音読文字データに変換する音声解析手段、
前記音声解析手段が変換した音読文字データと前記記憶手段に記憶された基本文字データとを照合することによって、前記被験者の文章認識能力を評価する評価手段、及び
前記評価手段の評価結果を出力する出力手段、
として機能させるための文章能力評価プログラム。
【請求項6】
請求項5に記載の文章認識能力評価プログラムであって、
前記コンピュータを、前記表示制御手段による前記判定表示文章の表示開始から前記被験者の音読終了までに要した時間を計時する計時手段として機能させ、
前記評価手段は、前記計時手段が計時した時間に基づいて前記被験者の文章認識能力を評価する
ことを特徴とする文章認識能力評価プログラム。
【請求項7】
請求項5又は請求項6に記載の文章認識能力評価プログラムであって、
前記評価手段は、前記音読文字データと前記基本文字データとが一致するか否かを判定し、その判定結果を評価結果として算出する
ことを特徴とする文章能力評価プログラム。
【請求項8】
請求項5〜請求項7の何れか1項に記載の文章認識能力評価プログラムであって、
前記コンピュータを、前記判定基本文章をチャンク毎に区別可能に仮名文字によって表し、前記複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定のチャンクを変換対象チャンクとして特定し、特定した変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序を入れ替えることによって前記判定表示文章を生成する判定表示文章生成手段として機能させ、
前記記憶手段は、前記判定表示文章生成手段が生成した判定表示文章を、前記表示文字データとして記憶する
ことを特徴とする文章認識能力評価プログラム。
【請求項9】
請求項5〜請求項8の何れか1項の文章認識能力評価プログラムが記憶されたコンピュータ読み取り可能な記憶媒体。
【請求項10】
各々が1単語を基本構成とする複数のチャンクからなり、全体として所定の意味を有する判定基本文章を、基本文字データとして記憶手段が記憶する判定基本文章記憶ステップと、
前記判定基本文章がチャンク毎に区別可能に仮名文字によって表され、且つ前記複数のチャンクのうち3文字を超える所定数以上の仮名文字から構成される所定の変換対象チャンクの最初の1文字と最後の1文字とを除く複数の中間文字の配列順序が入れ替えられた判定表示文章を、表示文字データとして前記記憶手段が記憶する判定表示文章記憶ステップと、
表示制御手段が、前記記憶手段から前記表示文字データを読み出して前記判定表示文章を表示手段に表示する判定文章表示ステップと
前記表示手段に表示された判定表示文章を被験者が音読する音読ステップと、
前記判定表示文章を音読した被験者の発話音声を、集音手段が集音して音声データとして取得する集音ステップと、
前記集音手段が取得した音声データを、音声解析手段が解析して音読文字データに変換する音読文章検出ステップと、
前記音声解析手段が変換した音読文字データと前記記憶手段に記憶された基本文字データとを照合することによって、判定手段が前記被験者の文章認識能力を評価する判定ステップと、
前記評価手段の評価結果を出力手段が出力する評価結果出力ステップと、を備えた
ことを特徴とする文章認識能力評価方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate