画像処理装置および画像処理プログラム
【課題】答案用紙やアンケート用紙などの各種の用紙に手書き記入された文字や数字等の記入情報を文字認識して記入者を特定する際の信頼性の向上を可能とする。
【解決手段】手書きOCR部72の認識結果からデータベース装置31を探索して、対応する生徒を特定するのではなく、確度取得部704、確度算出部705および対応付け部706の作用により、データベース装置31にあらかじめ登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、採点対象の答案用紙の各々について解答記入者である生徒を対応付ける。
【解決手段】手書きOCR部72の認識結果からデータベース装置31を探索して、対応する生徒を特定するのではなく、確度取得部704、確度算出部705および対応付け部706の作用により、データベース装置31にあらかじめ登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、採点対象の答案用紙の各々について解答記入者である生徒を対応付ける。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および画像処理プログラムに関する。
【背景技術】
【0002】
一般に、学校や塾等の教育機関では、例えばテストの答案用紙や練習問題用紙のような教育用教材を用いることが多い。そして、問題およびその解答欄を含む教育用教材を用いて、その教育用教材(用紙)上に生徒に解答を記入させ、その記入された解答に対して教師が採点を行う、といったことが広く行われている。
【0003】
ところで、教育用教材については、その採点処理の省力化が強く求められている。これに応えるべく、採点処理の省力化を実現するものとしては、例えば、パーソナルコンピュータ(以下、単に「PC」と記述する)に採点台および採点ペンを接続し、採点台の所定位置に教育用教材を載置した状態で採点ペンによって○×付けを実施することで、PCに対して教育用教材上に記入された解答の位置情報およびその正否情報を入力し得るようにし、これによりPCにて教育用教材上の解答についての自動採点を実施するように構成されたシステムが提案されている(例えば、特許文献1参照)。
【0004】
【特許文献1】特開平6−266278号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明は、答案用紙やアンケート用紙などの各種の用紙に手書き記入された文字や数字等の記入情報を文字認識して記入者を特定する際の信頼性の向上を可能とする画像処理装置および画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
請求項1記載の画像処理装置は、用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識手段と、複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識手段による認識結果の信頼度を表す確度を、前記認識手段によって認識された複数の用紙の各々について前記確度情報を用いて算出する確度算出手段と、前記確度算出手段が算出した確度を基に前記複数の記入者候補の中から、前記認識手段が認識した複数の用紙の各記入者を特定する特定手段とを備えることを特徴としている。
【0007】
請求項2記載の画像処理装置は、請求項1記載の画像処理装置において、前記認識手段は、認識した文字についての複数の候補文字に対する確度情報を出力し、前記確度算出手段は、前記複数の候補文字に対する確度情報を基に前記記入者情報に対する確度を算出することを特徴としている。
【0008】
請求項3記載の画像処理装置は、請求項1又は2記載の画像処理装置において、前記特定手段は、前記複数の用紙のうち前記確度算出手段が算出した確度が最大となる用紙を、前記確度算出手段による算出対象の記入者の用紙とすることを特徴としている。
【0009】
請求項4記載の画像処理装置は、請求項1又は2記載の画像処理装置において、前記確度算出手段は、前記記入者情報のうち数字に対する確度情報と文字に対する確度情報とに対してそれぞれ異なる演算を施して前記記入者情報に対する確度を算出することを特徴としている。
【0010】
請求項5記載の画像処理装置は、用紙に手書き記入された記入情報を認識する認識手段と、前記認識手段によって認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付け手段と、前記第1の対応付け手段による対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出手段と、前記抽出手段が抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付け手段と、前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付ける第3の対応付け手段とを備えることを特徴としている。
【0011】
請求項6記載の画像処理装置は、請求項5記載の画像処理装置において、前記第3の対応付け手段は、前記第1の対応付け手段による処理機能と前記第2の対応付け手段による処理機能とを持ち、これらの処理機能を前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付けるまで繰り返して実行することを特徴としている。
ことを特徴とする。
【0012】
請求項7記載の画像処理プログラムは、用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識ステップと、複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識ステップでの認識結果の信頼度を表す確度を、前記認識ステップで認識した複数の用紙の各々について前記確度情報を用いて算出する確度算出ステップと、前記確度算出ステップで算出した確度を基に前記複数の記入者候補の中から、前記認識ステップで認識した複数の用紙の各記入者を特定する特定ステップとを有することを特徴としている。
【0013】
請求項8記載の画像処理プログラムは、用紙に手書き記入された記入情報を認識する認識ステップと、前記認識ステップで認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付けステップと、前記第1の対応付けステップでの対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出ステップと、前記抽出ステップで抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付けステップと、前記第1の対応付けステップで対応付けられていない前記認識対象の用紙と前記第2の対応付けステップで対応付けられていない記入者とを1対1で対応付ける第3の対応付けステップとを有することを特徴としている。
【発明の効果】
【0014】
請求項1記載の画像処理装置によれば、活字に比べて認識精度が落ちる、手書き文字や数字等の記入情報でも当該記入情報から高い信頼性にて記入者を特定できる。
【0015】
請求項2記載の画像処理装置によれば、記入者情報に対する算出確度を上げることができる。
【0016】
請求項3記載の画像処理装置によれば、確度を算出した用紙と確度の算出対象の記入者との対応付けの精度を上げることができる。
【0017】
請求項4記載の画像処理装置によれば、記入者情報に対する確度の算出精度を上げることができる。
【0018】
請求項5記載の画像処理装置によれば、手書きによる文字や数字が活字に比べて認識精度が低いことに起因して、第1の対応付けの段階で1枚の用紙に対して複数の記入者が対応付けられた場合であっても、最終的に、用紙と記入者とを1対1で対応付けることができる。
【0019】
請求項6記載の画像処理装置によれば、請求項5記載の画像処理装置に比べて、用紙と記入者との対応付けの精度を上げることができる。
【0020】
請求項7記載の画像処理プログラムによれば、活字に比べて認識精度が落ちる、手書き文字や数字等の記入情報でも当該記入情報から高い信頼性にて記入者を特定できる。
【0021】
請求項8記載の画像処理プログラムによれば、手書きによる文字や数字が活字に比べて認識精度が低いことに起因して、第1の対応付けの段階で1枚の用紙に対して複数の記入者が対応付けられた場合であっても、最終的に、用紙と記入者とを1対1で対応付けることができる。
【発明を実施するための最良の形態】
【0022】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0023】
[適用例]
図1は、本発明が適用される画像処理装置の基本構成の一例を示すシステム構成図である。ここでは、画像処理装置として、教育機関で用いられる教材(以下、「教育用教材」と記述する)を取り扱う教材処理装置を例に挙げて説明するものとする。
【0024】
図1に示すように、本適用例に係る教材処理装置は、データベース部1と、画像読み取り部2と、画像データ解析部3と、教材判別部4と、歪み補正部5と、差分抽出部6と、解答者抽出部7と、正誤判定抽出部8と、途切れ補正部9と、図形形状認識部10と、記入位置算出部11と、採点集計部12と、集計結果出力部13とを有する構成となっている。
【0025】
かかる教材処理装置において、データベース部1は、教育用教材についての電子データを保持蓄積する。
【0026】
ここで、教育用教材について簡単に説明する。図2は、教育用教材の一具体例を示す説明図である。図2に示すように、教育用教材20は、教育機関で用いられるテストの答案用紙や練習問題用紙等であり、問題およびその解答欄21を有している。ただし、教育用教材20は、少なくとも解答欄21を有していればよく、問題文については必ずしも記載されていなくともよい。
【0027】
また、教育用教材20には、その教育用教材20を識別特定するための情報が記載された識別情報欄22と、解答欄21への解答記入者に関する情報を記載するための解答者情報欄23と、採点結果の得点を記入する得点欄24とが設けられている。識別情報欄22には、例えば教育用教材20の科目、タイトル、適用学年等の情報があらかじめ記載されるものとする。一方、解答者情報欄23には、解答記入者の学級、出席番号、氏名等が手書きにて記入され得るようになっている。
【0028】
このような教育用教材20についての電子データに関しては、その教育用教材20における解答欄21や識別情報欄22等のレイアウトを特定し得るものであって、かつ、データベース部1にて保持蓄積可能なものであれば、そのデータ形式を問わない。例えば、画像データであっても、文書作成ソフトウェアで作成したアプリケーション文書データであっても良い。
【0029】
ただし、教育用教材20の電子データは、その教育用教材20における各解答欄21についての配点情報を含んでいるものとする。配点情報とは、教育用教材20上における各解答欄21について、どの位置に存在する解答欄21への配点が何点であるかを特定するための情報である。なお、配点は、解答欄21ごとに異なっていても、あるいは一律であっても構わない。
【0030】
図1に説明を戻す。画像読み取り部2は、解答欄21への解答記入、解答者情報欄23への氏名等の手書き記入および当該解答に対する採点者による正誤判定の採点記号(例えば、「○」,「×」等の図形)の手書き記入が為された教育用教材20に対して、公知の光学的画像読み取り技術を用いた画像読み取りを行って、その教育用教材20から画像データを得て本教材処理装置内に入力する。
【0031】
画像データ解析部3は、画像読み取り部2から入力された画像データについて、その解析処理を行う。解析処理としては、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識等が挙げられるが、いずれも公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。
【0032】
教材判別部4は、タイトル解析部41とコード情報解析部42との少なくとも一方によって構成され、画像データ解析部3での解析処理の結果、特に識別情報欄22についてのタイトル解析部41によるタイトル解析またはコード情報解析部42によるコード解析の少なくとも一方の解析結果を基にして、画像読み取り部2で得られた画像データの元となった教育用教材20を識別特定する。
【0033】
このとき、教材判別部4においては、データベース部1が保持蓄積している教育用教材20の電子データと照らし合わせ、該当する電子データがデータベース部1に保持蓄積されていなければ、教育用教材の識別特定エラーとする判定を行う。すなわち、教材判別部4は、画像データ解析部3での解析結果を基に、画像読み取り部2で得られた画像データとの比較対象となる電子データを特定する。
【0034】
歪み補正部5は、画像読み取り部2で得られた画像データに対して、その画像データにおける画像歪みの補正を行う。画像歪みの補正としては、傾き補正や主走査方向または副走査方向の拡縮補正等が挙げられる。これらの歪み補正については、いずれも公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。あるいは、画像読み取り部2で得られた画像データと比較対象となるデータベース部1内の電子データとを比較照合し、その画像歪み(傾き、拡縮など)を補正するようにしても良い。
【0035】
差分抽出部6は、教材判別部4での教育用教材20の識別特定の結果に基づいて、画像読み取り部2から入力され、歪み補正部5での歪み補正処理後の画像データと、その比較対象となるデータベース部1内の電子データとを比較して、それぞれの間の差分を抽出する。なお、差分抽出処理の手法自体については、公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。
【0036】
解答者抽出部7は、手書き領域切り出し部71、手書きOCR(Optical Character Reader;光学式文字読み取り装置)部72および解答者特定部73から構成され、画像データ解析部3での解析処理の結果を基にしつつ、差分抽出部6で抽出された差分情報から、画像読み取り部2で読み取り対象となった教育用教材における解答者情報を抽出し、当該解答者情報から解答者(生徒)を特定する。解答者情報としては、解答記入者の学級、出席番号、氏名等といった、解答記入者を識別するための情報が挙げられる。
【0037】
この解答者抽出部7において、手書き領域切り出し部71は、差分抽出部6で抽出された差分情報のうち、解答記入者が手書きにて記入する手書き領域である解答者情報欄23についての差分情報を切り出す。この切り出された差分情報は、解答記入者の学級、出席番号を表す数字や、解答記入者の氏名を表す文字などである。
【0038】
手書きOCR部72は、手書き領域切り出し部71が切り出した数字や文字に対して、パターンマッチング等の周知の文字認識処理技術によって文字認識を行い、その認識結果である数字や文字(解答者情報)を、その認識結果の信頼度を表す確度情報と共に解答者特定部73に対して出力する。
【0039】
解答者特定部73は、手書きOCR部72が出力する認識結果とその確度情報とを基にして、あらかじめデータベース装置31に登録されている解答者情報、具体的には解答記入者の学級、出席番号、氏名等の情報から、画像読み取り部2で読み取り対象となった教育用教材、即ち採点対象の教育用教材についての解答者を特定する。この解答者を特定するための画像処理が本実施形態の特徴とする画像処理手法であり、その詳細については後述する。
【0040】
正誤判定抽出部8は、画像データ解析部3での解析処理の結果を基にしつつ、差分抽出部6で抽出された差分から、さらに正誤判定の記入内容を抽出する。正誤判定の記入内容の抽出は、例えば差分抽出部6での抽出結果に対する色成分認識処理を通じて、所定色成分についてのものを抽出することによって行えばよい。何故ならば、採点者による正誤判定の記入は、一般に、赤色で行われるからである。
【0041】
途切れ補正部9は、正誤判定抽出部8での抽出結果に対して途切れ補正処理を行う。ここに、途切れ補正処理とは、正誤判定抽出部8が抽出した線分に途切れがある場合に、その線分同士を接続して途切れを解消するための処理である。
【0042】
図形形状認識部10は、正誤判定抽出部8で抽出され、途切れ補正部9で途切れ補正が為された正誤判定の記入内容に対して、その形状認識を行って正誤判定の記入内容を認識する。形状認識は、正誤判定の採点記号、例えば「○」や「×」等の図形形状とのパターンマッチングによって行えばよい。すなわち、図形形状認識部10は、正誤判定の記入内容が「正解(○)」または「不正解(×)」であるかを認識するものである。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識するようにしてもよい。特徴量としては、例えば、穴の個数、外接矩形に占める対象図形の面積率などが挙げられる。
【0043】
記入位置算出部11は、図形形状認識部10にて形状認識された正誤判定の記入内容について、その教育用教材20上における記入位置を算出する。記入位置の算出は、例えば教育用教材20上における座標解析によって行えばよい。
【0044】
採点集計部12は、図形形状認識部10による正誤判定の記入内容の認識結果と、記入位置算出部11による正誤判定の記入位置の算出結果と、データベース部1が保持蓄積している教育用教材20の電子データに含まれる当該教育用教材20の各解答欄21についての配点情報とを基にして、画像読み取り部2が画像読み取りを行った教育用教材20について、当該教育用教材20に記入された正誤判定の採点集計を行う。この採点集計を行う際に、採点集計部12は、「○」や「×」等の正誤判定記号(採点記号)と教育用教材20の各解答欄21とを対応付ける処理を行う。
【0045】
集計結果出力部13は、採点集計部12による採点集計の結果を、解答者抽出部7で特定された採点対象の教育用教材についての解答者と関連付けて出力する。なお、集計結果出力部13による出力先としては、本教材処理装置と接続されるデータベース装置31またはファイルサーバ装置32など、教育用教材20についての採点集計結果を管理するものが挙げられる。
【0046】
なお、以上説明した各構成要素、即ちデータベース部1〜集計結果出力部13のうち、画像読み取り部2については、画像読み取り装置としての機能を有した複写機、複合機あるいはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder;ADF)を付設して、複数の教育用教材に対する画像読み取りを連続的に行うようにすることが考えられる。
【0047】
また、画像読み取り部2を除く他の各構成要素、即ちデータベース部1、画像データ解析部3〜集計結果出力部13については、例えばPC(パーソナルコンピュータ)のように、所定プログラムを実行することによって情報記憶処理機能、画像処理機能、演算処理機能等を実現するコンピュータ機器を利用して実現することが考えられる。
【0048】
その場合に、データベース部1、画像データ解析部3〜集計結果出力部13の各機能を実現するのに必要となる所定プログラムは、あらかじめPC内にインストールしておくことが考えられる。ただし、あらかじめインストールされているのではなく、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであってもよく、または有線若しくは無線による通信手段を介して配信されるものであってもよい。
【0049】
(教材処理手順)
次に、以上のように構成された本適用例に係る教材処理装置における処理手順の一例について、図3の説明図を参照して説明する。
【0050】
教材処理装置を利用する場合には、先ず、生徒等によって解答者情報欄23への氏名等の情報の記入および解答欄21への解答記入が為され、さらに教師等によって各解答欄21に記入された解答に対する「○」や「×」等の正誤判定の採点記号が記入された教育用教材20について、画像読み取り部2が画像読み取りを行って、その教育用教材20からの画像データを得る(ステップS101)。
【0051】
このとき、自動原稿搬送装置を用いれば、例えば同一学級のような一つのグループに纏めて処理すべき複数の教育用教材20について、一括して画像読み取りを行って、各教育用教材20から連続的に画像データを得ることができる。そして、画像読み取りによって得られた画像データについては、一旦ワークエリアとして用いられるメモリ等に保持しておく。
【0052】
その後は、各教育用教材20から得られたそれぞれの画像データに対して、順次、以下のような自動採点処理が行われる(ステップS102)。
【0053】
すなわち、ある一つの教育用教材20から得られた画像データについて、画像データ解析部3がその解析処理を行い、その解析処理の結果に基づいて教材判別部4が教育用教材20の識別特定を行う。この識別特定は、例えば「理科」、「5年」、「1.天気と気温の変化」といったタイトル解析または識別情報欄22に埋め込まれたコード情報についてのコード解析を通じて行えばよい。この識別特定を経ることで、教材判別部4において、画像読み取り部2で得られた画像データとの比較対象となる電子データを特定することが可能となる。
【0054】
なお、この識別特定は、画像読み取り部2が画像読み取りを行った複数の教育用教材20のそれぞれについて順次行うことも考えられるが、一般に一つのグループに纏めて処理される教育用教材20は全て同一のものであるため、その纏めて処理される中で最初に処理される教育用教材20についてのみ行えばよい。
【0055】
教材判別部4が電子データを特定すると、データベース部1は、その特定結果に従いつつ、保持蓄積している中から該当する電子データを取り出して、これを差分抽出部6へ受け渡す。
【0056】
また、ある一つの教育用教材20から得られた画像データについては、歪み補正部5がその画像データにおける画像歪みの補正を行う。この画像歪みの補正は、その後に行う電子データとの比較や差分抽出等の処理を行う際の精度向上を図ることを目的として、画像読み取り部2での画像読み取りの際に生じ得る画像歪みを補正するために行われる。
【0057】
そして、差分抽出部6は、データベース部1から受け渡された電子データと、画像読み取り部2で得られ、歪み補正部5で画像歪みが補正された後の画像データとをそれぞれ比較して、その差分を抽出する。この差分抽出によって、解答者情報欄23および各解答欄21への記入内容、並びに各解答欄21に対する正誤判定の記入内容が抽出されることになる。
【0058】
差分抽出部6が差分を抽出すると、その後は、解答者抽出部7が、その差分に対する文字認識処理等を通じて、画像読み取り部2で読み取り対象となった教育用教材についての解答者(解答記入者)を特定する。具体的には、解答者抽出部7は、文字認識処理による認識結果とその確度情報を基に、あらかじめデータベース装置31に登録されている解答者情報から、画像読み取り部2で読み取り対象となった教育用教材(採点対象の教育用教材)についての解答者を特定する。
【0059】
また、差分抽出部6による差分抽出結果に対しては、各解答欄21への正誤判定の記入内容を抽出するために、その差分抽出結果から正誤判定抽出部8がさらに所定色成分についてのもの、具体的には例えば赤色成分のものを抽出する。所定色成分の抽出は、例えば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで実行できる。
【0060】
ただし、一般に、教育用教材20上での「○」や「×」等の正誤判定の図形記入は、問題文、各解答欄21を特定する枠、各解答欄21への解答記入内容等に重ねて行われることが多い。そのため、正誤判定抽出部8による所定色成分の抽出結果は、その重なり部分が除かれたもの、すなわち「○」や「×」等の図形に途切れ部分が生じたものとなるおそれがある。このことから、正誤判定抽出部8による所定色成分の抽出結果に対しては、途切れ補正部9が途切れ補正処理を行う。
【0061】
以上は、本発明が適用される教材処理装置(教育用教材の自動採点システム)の基本的な構成および処理についての説明である。
【0062】
この種の教材処理装置において、採点結果をデータベースに登録するためには生徒(解答記入者)を特定する必要がある。生徒を特定するに当たっては、生徒が答案用紙に手書き記入した氏名や出席番号についての文字や数字等の記入情報を認識するとき、手書きによる文字や数字は活字に比べて認識精度が落ちるために、光学式文字読み取り装置(OCR)による認識結果だけから生徒を特定する手法では生徒特定の信頼性が低い。
【0063】
そこで、以下では、例えば上記構成の教材処理装置において、OCR認識処理による認識結果とその確度情報とを基に、例えばデータベース装置31にあらかじめ登録されている複数の生徒(記入者候補)の中から各生徒を特定する生徒情報(記入者情報)を用いて、採点対象の答案用紙についての解答記入者である生徒を特定するための画像処理装置の具体的な実施の形態について説明する。
【0064】
なお、以下に述べる実施の形態は、本発明を実施するための好適な実施の形態であることから、技術的に好ましい種々の限定が付された態様となっているが、本発明は、これらの態様に発明の範囲が限られるものではなく、他の様々な態様での実施が可能である。
【0065】
[第1実施形態]
図4は、本発明の第1実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【0066】
図4に示すように、本実施形態に係る画像処理装置70Aは、クラス確定部701、生徒情報取得部702、手書きOCR部703、確度取得部704、確度算出部705および対応付け部706を有する構成となっている。
【0067】
クラス確定部701は、例えば、手書きOCR部72(図1参照)による解答者情報欄23(図2参照)の認識結果のうち、例えば組番号から生徒が属する母集団、即ちクラス(組)を確定する。ただし、クラス確定部701としては、手書きOCR部72の認識結果からクラスを確定する構成のものに限られるものではなく、例えば、画像読み取り部2(図1参照)の操作部から教師(採点者)によって手入力されるクラス番号や教師の識別番号(以下、「ID番号」と記述する)などの情報からクラスを確定する構成のものであってもよい。
【0068】
生徒情報取得部702は、データベース装置31(図1参照)にあらかじめ登録されている全生徒の中から、クラス確定部701が確定したクラスに所属する全ての生徒(複数の記入者候補)の生徒情報(記入者情報)、具体的には出席番号および氏名(生徒名)をデータベース装置31から取得する。
【0069】
手書きOCR部703は、図1の手書きOCR部72に相当し、手書き領域切り出し部71(図1参照)が切り出した数字や文字に対して文字認識を行って、その認識結果を認識の信頼度を表す確度情報と共に出力する。この手書きOCR部703は、1文字(1数字)に対して認識結果として候補文字を複数出力するとともに、各候補文字に対する確度情報を出力する構成となっている。
【0070】
ここで、一例として、図5に示すように、解答者情報欄23に生徒が、組「2」、出席番号「15」、氏名「特許太郎」と手書きにて記入した答案用紙を採点の対象とする。この答案用紙の場合の解答者情報欄23に対するOCR認識結果と候補文字およびその確度(信頼度)としては、図6に示すように、OCR認識文字を第1候補、OCR認識文字に類似する文字を第2候補、第3候補、……とし、これら各候補文字の確度(信頼度)と共に手書きOCR部703から出力される。
【0071】
確度取得部704は、生徒情報取得部702がデータベース装置31から取得した生徒一人一人の出席番号および氏名の全文字(数字)について、手書きOCR部703によるOCR認識結果(図6参照)から、各文字に対応する確度を取得する処理を採点対象の全答案用紙に対して行う。この確度取得部704による確度の取得処理は、例えば出席番号順にクラスの全生徒に対して行われる。
【0072】
確度算出部705は、確度取得部704が取得した各文字(数字を含む)の確度から文字全体の確度を、採点対象の全答案用紙について算出する。文字全体の確度を算出する手法としては、文字個々の確度をそのまま加算する単純加算法や、数字に対する確度と文字に対する確度とに対してそれぞれ異なる演算を施して文字全体の確度を算出する、具体的には、例えば出席番号(数字)の確度に対して重み付けをしたり、氏名(文字)の確度に対して重み付けしたりするなど、文字(数字)個々の確度に対して重み付けを行って加算する重み付け加算法などの手法が考えられる。
【0073】
対応付け部706は、確度算出部705が算出した文字全体の確度から、例えば当該確度が最大となる答案用紙を、確度取得の基準となった生徒の答案用紙として対応付ける。この対応付け部706による対応付けにより、結果的に、採点対象の答案用紙の各々に対して解答記入者である生徒が確定される。
【0074】
すなわち、確度取得部704、確度算出部705および対応付け部706は、図1の解答者特定部73に相当し、手書きOCR部72が出力する認識結果とその確度情報とを基にして、あらかじめデータベース装置31に登録されている複数の生徒の中から、出席番号や氏名等の生徒情報を基に採点対象の答案用紙の解答記入者である生徒を特定する。
【0075】
上述した第1実施形態に係る画像処理装置70Aでは、手書きOCR部72の認識結果からデータベース装置31を探索して、対応する生徒を特定するのではなく、確度取得部704、確度算出部705および対応付け部706の作用により、データベース装置31にあらかじめ登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、採点対象の答案用紙の各々について解答記入者である生徒を対応付ける。
【0076】
上記構成の画像処理装置70Aの各構成要素のうち、クラス確定部701(画像読み取り部2からの手入力の場合を除く)、生徒情報取得部702、確度取得部704、確度算出部705および対応付け部706については、所定プログラムを実行することによって情報記憶処理、演算処理等の各機能を実行するコンピュータ機器を利用してソフトウェア構成によって実現することが考えられる。ただし、ソフトウェア構成による実現に限られるものではなく、ハードウェア構成、あるいはハードウェアとソフトウェアの複合構成によって実現することも可能である。
【0077】
(画像処理の手順)
次に、第1実施形態に係る画像処理の手順、例えば自動採点処理において文字認識による認識結果とその確度情報とを基にして、あらかじめ登録されている解答者情報から採点対象の教育用教材(答案用紙)についての解答記入者(生徒)を特定するための処理手順の一例について、図7のフローチャートを用いて説明する。この画像処理は、図1の解答者抽出部7で実行される処理に相当する。
【0078】
図7のフローチャートにおいて、先ず、解答記入者である生徒のクラス(組)番号Wを取得して母集団を確定する(ステップS11)。この母集団の確定に当たっては、図2の解答者情報欄23に対して文字認識処理(OCR)を実施してクラス番号Wを取得するようにしてもよいし、教師(採点者)が手入力した情報を基にクラス番号Wを取得するようにしてもよい。
【0079】
教師が手入力する場合の取得例としては、例えば、教師(担任)とクラスとは対応関係にあることから、教師がID番号を入力することによって当該ID番号から担任のクラスのクラス番号Wを取得する手法などが考えられる。なお、ここでは、クラスを母集団として確定するとしたが、学年を母集団として確定するようにしてもよい。
【0080】
次に、クラスWの全生徒の答案用紙(教育用教材)について、図2の解答者情報欄23に手書き記入したクラス、出席番号および氏名等の記入情報に対して文字認識処理(OCR)を実施し、OCR認識結果およびその確度情報を取得する(ステップS12)。OCR認識結果についての信頼度を表す確度情報は、手書きOCR部72において認識結果と共に得られる情報である(図6参照)。
【0081】
次に、クラスWに属する全ての生徒の生徒情報、具体的には出席番号および氏名をデータベース装置31から取得する(ステップS13)。このようにして、クラスWの全生徒の答案用紙について出席番号および氏名のOCR認識結果およびその確度情報を取得するとともに、クラスWに所属する全生徒の出席番号および氏名を取得したら、これら取得した情報を基に採点対象の答案用紙の各々について生徒を特定する処理を実行する。
【0082】
具体的には、先ず、クラスWに属する全ての生徒の中に未照合の生徒が存在するか否かを判断し(ステップS14)、未照合生徒が存在すれば、その未照合生徒を照合対象の生徒Sとする(ステップS15)。次に、OCR認識処理を行った答案用紙の中に未照合の答案用紙が存在するか否かを判断し(ステップS16)、未照合答案が存在すれば、その未照合答案(最初は1枚目の答案)に対するOCR認識結果を取り出して採点対象の答案のOCR認識結果Pとする(ステップS17)。
【0083】
そして、生徒Sの出席番号および氏名の各文字(数字)に対して順番に、採点対象の答案についてのOCR認識結果P(図6参照)を用いて、各文字の確度を取得し(ステップS18)、次いで、生徒Sの出席番号および氏名の文字全てについて確度取得を行ったかを判断する(ステップS19)。生徒Sの出席番号および氏名の文字全てについて確度取得が終わったら、文字個々の確度から生徒Sの出席番号および氏名の文字全体の確度を算出する(ステップS20)。
【0084】
文字(数字を含む)全体の確度を算出する手法としては、文字個々の確度をそのまま加算する単純加算や、例えば出席番号(数字)の確度に対して重み付けをしたり、氏名(文字)の確度に対して重み付けしたりするなど、文字(数字)個々の確度に対して重み付けを行って加算する重み付け加算などの手法が考えられる。
【0085】
採点対象の答案Pについて生徒Sの出席番号および氏名の文字全体の確度算出が終わったら、次の未照合答案を採点対象の答案とし(ステップS21)、しかる後、ステップS16に戻ってステップS16〜ステップS21の各処理を、ステップS16で未照合答案が存在しないと判定するまで繰り返して実行する。
【0086】
ステップS16で未照合答案が存在しないと判定したら、ステップS20で算出した文字全体の確度から、例えば当該確度が最大となる答案用紙を、確度取得の基準となった生徒Sと対応付ける(ステップS22)。その結果、採点対象の答案用紙についてその解答記入者である生徒が特定されたことになる。続いて、例えば出席番号が次の未照合生徒を照合対象の生徒Sとし(ステップS23)、しかる後、ステップS14に戻ってステップS14〜ステップS23の各処理を、ステップS14で未照合の生徒が存在しないと判定するまで繰り返して実行する。
【0087】
そして、ステップS14で未照合の生徒が存在しないと判定したら、OCR認識処理による認識結果とその確度情報とを基にして、データベース装置31にあらかじめ登録されている生徒情報(解答者情報)から採点対象の答案用紙についての生徒(解答記入者)を特定するための一連の処理を終了する。
【0088】
上述した第1実施形態に係る画像処理の一連の処理シーケンスにおける各ステップの処理をコンピュータに実行させるプログラムが、本発明の第1実施形態に係る画像処理プログラムとなる。そして、この画像処理プログラムについては、あらかじめコンピュータ内にインストールしておくことが考えられる。ただし、あらかじめインストールすることに限定されるものではなく、有線若しくは無線による通信手段により提供(配信)することはもちろん、コンピュータ読み取り可能なCD−ROM等の記憶媒体に格納して提供することも可能である。
【0089】
ところで、第1実施形態に係る画像処理の場合に限らず、一般的に、手書きによる文字や数字が活字に比べてOCR認識精度が低いために、OCR認識結果だけから生徒特定を間違いなく行うのは難しく、1枚の答案用紙に対して複数Nの生徒が解答記入者として対応付けられる(特定される)ことが起こり得る。
【0090】
そこで、以下に説明する第2実施形態に係る画像処理では、1枚の答案用紙に対して複数Nの生徒が解答記入者として対応付けられたときに、第2,第3の対応付け処理を行うことにより、最終的に、複数の答案用紙の各々と記入者候補である複数の生徒とを1対1に対応付ける処理を行うことを特徴とする。
【0091】
[第2実施形態]
図8は、本発明の第2実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【0092】
図8に示すように、本実施形態に係る画像処理装置70Bは、クラス確定部711、手書きOCR部712、第1の対応付け部713、集合抽出部714、第2の対応付け部715、第3の対応付け部716および論理和回路717を有する構成となっている。
【0093】
クラス確定部711は、例えば、手書きOCR部72(図1参照)による解答者情報欄23(図2参照)の認識結果のうち、例えば組番号から生徒が属する母集団、即ちクラス(組)を確定する。ただし、クラス確定部711としては、手書きOCR部72の認識結果からクラスを確定する構成のものに限られるものではなく、例えば、画像読み取り部2(図1参照)の操作部から教師(採点者)によって手入力されるクラス番号や教師の識別番号(ID番号)などの情報からクラスを確定する構成のものであってもよい。
【0094】
手書きOCR部712は、図1の手書きOCR部72に相当し、手書き領域切り出し部71(図1参照)が切り出した数字や文字に対して文字認識を行ってその認識結果を出力する。この手書きOCR部712として、第1実施形態の手書きOCR部703と同様のもの、即ち認識結果をその認識の信頼度を表す確度情報と共に出力する構成のものを用いるようにしてもよい。
【0095】
第1の対応付け部713は、データベース装置31(図1参照)にあらかじめ登録されている全生徒の中から、クラス確定部711が確定したクラスに所属する全ての生徒(複数の記入者候補)の生徒情報(具体的には、出席番号および氏名)をデータベース装置31から取得し、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合することにより、認識対象の答案用紙の各々と生徒の各々とを対応付ける。この対応付けのとき、閾値を設けておき、全てが閾値未満の場合は、どれとも対応付けを行わないようにする。
【0096】
第1の対応付け部713としては、例えば、第1実施形態に係る画像処理装置70Aにおける生徒情報取得部702、確度取得部704、確度算出部705および対応付け部706からなり、データベース装置31に登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、認識対象(採点対象)の答案用紙の各々について解答記入者である生徒を対応付ける構成のものを用いることができる。
【0097】
ただし、これは一例に過ぎず、これに限られるものではなく、要は、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合して答案用紙の各々と生徒の各々とを対応付けることができる構成のものであればよく、その構成は問わない。他の例としては、データベース装置31内でOCR認識結果が近い生徒をそのOCR認識対象の答案用紙と対応付ける構成のものなどが考えられる。
【0098】
この第1の対応付け部713で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。ここで、第1の対応付け部713での対応付け処理において、手書きによる文字や数字が活字に比べてOCR認識精度が低いことに起因して、1枚の答案用紙に対して複数(N)の生徒の重複割り当て(重複対応付け)が発生したり、未割り当てが発生したりすることが起こり得る。
【0099】
集合抽出部714は、第1の対応付け部713による対応付けの結果、重複割り当てが発生した場合にその集合を対応付け結果から抽出する。ここで、集合抽出部714が取得する集合は、複数の生徒が対応付けられた答案用紙が複数枚(M)ある場合には、1枚の答案用紙と複数の生徒とを1集合とするとM集合となる。
【0100】
第2の対応付け部715は、集合抽出部714が取得したM集合において、各集合ごとに、1枚の答案用紙と複数(N)の生徒の一人とを対応付ける。この第2の対応付け部715での対応付けでは、例えば、第1の対応付け部713で用いたOCR認識結果を用いて、当該OCR認識結果と複数(N)の生徒の各生徒情報とを照合し、最も一致度の高い一人の生徒を抽出して対応付ける。この第2の対応付け部715で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。
【0101】
第2の対応付け部715による対応付けの結果、集合MにおけるM枚の答案用紙の全てに対して生徒が対応付けられることになるが、当該対応付け処理で除外された生徒については、この段階では対応付けられる答案用紙が存在しないことになる。換言すれば、答案用紙が対応付けられてない生徒が存在することになる。一方、採点対象の答案用紙の枚数とクラスの生徒数とは同数である訳であるから、第1の対応付け部713による対応付け処理では、重複割り付けが発生した場合には、生徒が対応付けられていない答案用紙が存在することになる。
【0102】
第3の対応付け部716は、第1の対応付け部713による対応付け結果から生徒が対応付けられていない答案用紙を抽出するとともに、第2の対応付け部715による対応付け結果から答案用紙が対応付けられてない生徒を抽出し、これら答案用紙と生徒とを所定の方法にて対応付ける。この第3の対応付け部716で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。
【0103】
第3の対応付け部716での対応付けの所定の方法としては、例えば、第1の対応付け部713で用いたOCR認識結果を用いて、当該OCR認識結果と生徒の生徒情報とを照合する際に、第1の対応付け部713での対応付けの場合よりも閾値を下げて緩い条件で対応付けを行う手法や、生徒が対応付けられていない答案用紙X1〜Xkの全てと答案用紙が対応付けられてない生徒Y1〜Ykの全てとを総当たり的に、第1実施形態での対応付けで用いた確度の高いものから割り当てる、具体的にはk×kの全ての組の確度を求め、当該確度が高いものが順に割り当てを決定する手法等が考えられる。
【0104】
さらに、第3の対応付け部716による対応付けの方法として、第1の対応付け部713による対応付けと第2の対応付け部715による対応付けとを、答案用紙と生徒との対応付けが1対1になるまで繰り返して実行する手法を採ることも考えられる。
【0105】
上記構成の画像処理装置70Bの各構成要素のうち、クラス確定部711(画像読み取り部2からの手入力の場合を除く)、第1の対応付け部713、集合抽出部714、第2の対応付け部715、第3の対応付け部716および論理和回路717については、所定プログラムを実行することによって情報記憶処理、演算処理等の各機能を実行するコンピュータ機器を利用してソフトウェア構成によって実現することが考えられる。ただし、ソフトウェア構成による実現に限られるものではなく、ハードウェア構成、あるいはハードウェアとソフトウェアの複合構成によって実現することも可能である。
【0106】
(画像処理の手順)
次に、第2実施形態に係る画像処理の手順の一例について、図9のフローチャートを用いて説明する。この画像処理は、図1の解答者抽出部7で実行される処理に相当する。
【0107】
図9のフローチャートにおいて、先ず、解答記入者である生徒のクラス(組)番号Wを取得して母集団を確定する(ステップS31)。この母集団の確定に当たっては、図2の解答者情報欄23に対して文字認識処理(OCR)を実施してクラス番号Wを取得するようにしてもよいし、教師(採点者)が手入力した情報を基にクラス番号Wを取得するようにしてもよい。
【0108】
教師が手入力する場合の取得例としては、例えば、教師(担任)とクラスとは対応関係にあることから、教師がID番号を入力することによって当該ID番号から担任のクラスのクラス番号Wを取得する手法などが考えられる。なお、ここでは、クラスを母集団として確定するとしたが、学年を母集団として確定するようにしてもよい。
【0109】
次に、クラスWの全生徒の答案用紙(教育用教材)について、図2の解答者情報欄23に手書き記入したクラス、出席番号および氏名等の記入情報に対して文字認識処理(OCR)を実施してOCR認識結果を取得し(ステップS32)、次いで、クラスWに属する全ての生徒の生徒情報、具体的には出席番号および氏名をデータベース装置31から取得する(ステップS33)。
【0110】
このようにして、クラスWの全生徒の答案用紙について出席番号および氏名のOCR認識結果を取得するとともに、クラスWに所属する全生徒の出席番号および氏名を取得したら、これら取得した情報を基に採点対象の答案用紙の各々とクラスWの生徒の各々とを1対1で対応付ける処理を実行する。
【0111】
具体的には、先ず、第1の対応付け処理を行う(ステップS34)。この第1の対応付け処理での具体的な処理として、例えば、第1実施形態に係る画像処理(図7参照)におけるステップS14〜ステップS23の各処理により、データベース装置31に登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、認識対象(採点対象)の答案用紙の各々について解答記入者である生徒を対応付ける処理が考えられる。
【0112】
ただし、この処理は一例に過ぎず、これに限られるものではなく、要は、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合して答案用紙の各々と生徒の各々とを対応付けることができる処理であればよい。他の処理例としては、例えば、図10のフローチャートに示す処理手法が考えられる。
【0113】
図10のフローチャートにおいて、先ず、クラスWに属する全ての生徒の中に未照合の生徒が存在するか否かを判断し(ステップS51)、未照合生徒が存在すれば、その未照合生徒を照合対象の生徒Sとする(ステップS52)。次に、採点対象の答案用紙の出席番号および氏名に対してOCR認識を行い(ステップS53)、次いで、当該OCR認識結果と照合対象の生徒Sの生徒情報との一致の度合いが閾値以上であれば認識対象の答案用紙と照合対象の生徒Sを対応付ける(ステップS54)。続いて、例えば出席番号が次の未照合生徒を照合対象の生徒Sとし(ステップS55)、しかる後、ステップS51に戻ってステップS51〜ステップS55の各処理を、ステップS51で未照合の生徒が存在しないと判定するまで繰り返して実行する。
【0114】
図9のフローチャートに説明を戻す。第1の対応付け処理においては、手書きによる文字や数字が活字に比べてOCR認識精度が低いことに起因して、1枚の答案用紙に対して複数(N)の生徒の重複割り当て(重複対応付け)が発生したり、未割り当てが発生したりすることが起こる場合がある。そこで、採点対象の答案用紙の各々とクラスWの生徒の各々とが1対1で対応付けられたか否かを判断し(ステップS35)、1対1で対応付けられていれば、答案用紙の各々とクラスWの生徒の各々との対応付けのための一連の処理を終了する。
【0115】
1対1で対応付けられていなければ、1対Nの集合が存在するか否かを判断し(ステップS36)、1対Nの集合が存在すれば、1対Nの対応付けとなっている1集合を第1の対応付け処理による対応付け結果から抽出し(ステップS37)、次いで、当該集合の答案用紙と複数(N)の生徒の一人とを対応付ける(ステップS38)。ここでの対応付けが第2の対応付けとなる。この第2の対応付け処理では、例えば、第1の対応付け処理でのOCR認識結果を用いて、当該OCR認識結果と複数(N)の生徒の各生徒情報とを照合し、最も一致度の高い一人の生徒を抽出して当該集合の答案用紙と対応付ける。
【0116】
次に、第2の対応付け処理で対応付けられなかった残りの生徒については未割り当てとし(ステップS39)、次いで、1対Nの対応付けとなっている次の1集合を抽出し(ステップS40)、しかる後、ステップS36に戻って、ステップS36〜ステップS40の処理を、ステップS36で1対Nの集合が存在しないと判定するまで繰り返して実行する。
【0117】
ここで、採点対象の答案用紙の枚数とクラスの生徒数とは同数である訳であるから、第1の対応付け処理で1対Nの重複割り付けが発生した場合には、生徒が対応付けられていない答案用紙が存在することになる。また、第2の対応付け処理の結果、ステップS39で未割り当てとなった生徒、即ち答案用紙が対応付けられてない生徒が存在することになる。すなわち、第2の対応付け処理が終了した段階で、生徒と対応付けさせていない答案用紙と、答案用紙と対応付けられていない生徒とが同数存在することになる。
【0118】
そこで、未対応付けの答案用紙についてのOCR認識結果と、未対応付けの生徒の生徒情報とを抽出し(ステップS41)、次いで、OCR認識結果と生徒情報とを基に、未対応付けの答案用紙の各々と未対応付けの生徒の各々とを所定の方法にて1対1に対応付け(ステップS42)、答案用紙の各々とクラスWの生徒の各々との対応付けのための一連の処理を終了する。ここでの対応付けが第3の対応付けとなる。
【0119】
第3の対応付けでの所定の方法としては、例えば、第1の対応付け処理で用いたOCR認識結果を用いて、当該OCR認識結果と生徒の生徒情報とを照合する際に、第1の対応付けの場合よりも閾値を下げて緩い条件で対応付けを行う手法や、生徒が対応付けられていない答案用紙X1〜Xkの全てと答案用紙が対応付けられてない生徒Y1〜Ykの全てとを総当たり的に、第1実施形態での対応付けで用いた確度の高いものから割り当てる、具体的にはk×kの全ての組の確度を求め、当該確度が高いものが順に割り当てを決定する手法等が考えられる。
【0120】
さらに、第3の対応付けでの所定の方法として、第1の対応付け処理と第2の対応付け処理とを、答案用紙と生徒との対応付けが1対1になるまで繰り返して実行する手法を採ることも考えられる。
【0121】
上述した第2実施形態に係る画像処理の一連の処理シーケンスにおける各ステップの処理をコンピュータに実行させるプログラムが、本発明の第2実施形態に係る画像処理プログラムとなる。そして、この画像処理プログラムについては、あらかじめコンピュータ内にインストールしておくことが考えられる。ただし、あらかじめインストールすることに限定されるものではなく、有線若しくは無線による通信手段により提供(配信)することはもちろん、コンピュータ読み取り可能なCD−ROM等の記憶媒体に格納して提供することも可能である。
【0122】
なお、上記各実施形態では、生徒が答案用紙に手書き記入した出席番号や氏名を文字認識することによって生徒を特定する教育用教材の自動採点システム(教材処理装置)に適用した場合を例に挙げて説明したが、本発明はこの適用例に限られるものではなく、用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付けて認識対象の用紙についての手書き記入者を特定する画像処理装置全般に対して適用可能である。
【0123】
その他の適用例として、例えば、社内のアンケート集計を行う場合などのアンケート集計システムにおいて、部署別、男女別などの集計結果をデータベースに登録するに当たって、社員がアンケート用紙に手書き記入した社員番号や氏名あるいは所属部署などを光学式文字読み取り装置によって文字認識して、アンケート用紙についての手書き記入者である社員を特定するような場合が考えられる。
【図面の簡単な説明】
【0124】
【図1】本発明が適用される教材処理装置の基本構成の一例を示すシステム構成図である。
【図2】教育用教材の一具体例を示す説明図である。
【図3】本適用例に係る教材処理装置における処理動作例を示す説明図である。
【図4】本発明の第1実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【図5】答案用紙の解答者情報欄への手書き記入例を示す図である。
【図6】OCR認識結果と候補文字およびその確度の関係の一例を示す図である。
【図7】第1実施形態に係る画像処理の手順の一例を示すフローチャートである。
【図8】本発明の第2実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【図9】第2実施形態に係る画像処理の手順の一例を示すフローチャートである。
【図10】第2実施形態に係る画像処理における第1の対応付け処理の一例を示すフローチャートである。
【符号の説明】
【0125】
1…データベース部、2…画像読み取り部、3…画像データ解析部、4…教材判別部、5…歪み補正部、6…差分抽出部、7…解答者抽出部、8…正誤判定抽出部、9…途切れ補正部、10…図形形状認識部、11…記入位置算出部、12…採点集計部、13…集計結果出力部、20…教育用教材、21…解答欄、22…識別情報欄、23…解答者情報欄、24…得点欄、31…データベース装置、32…ファイルサーバ装置、41…コード情報解析部、42…タイトル解析部、71…手書き領域切り出し部、72…手書きOCR部、73…解答者特定部、70A,70B…画像処理装置
【技術分野】
【0001】
本発明は、画像処理装置および画像処理プログラムに関する。
【背景技術】
【0002】
一般に、学校や塾等の教育機関では、例えばテストの答案用紙や練習問題用紙のような教育用教材を用いることが多い。そして、問題およびその解答欄を含む教育用教材を用いて、その教育用教材(用紙)上に生徒に解答を記入させ、その記入された解答に対して教師が採点を行う、といったことが広く行われている。
【0003】
ところで、教育用教材については、その採点処理の省力化が強く求められている。これに応えるべく、採点処理の省力化を実現するものとしては、例えば、パーソナルコンピュータ(以下、単に「PC」と記述する)に採点台および採点ペンを接続し、採点台の所定位置に教育用教材を載置した状態で採点ペンによって○×付けを実施することで、PCに対して教育用教材上に記入された解答の位置情報およびその正否情報を入力し得るようにし、これによりPCにて教育用教材上の解答についての自動採点を実施するように構成されたシステムが提案されている(例えば、特許文献1参照)。
【0004】
【特許文献1】特開平6−266278号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明は、答案用紙やアンケート用紙などの各種の用紙に手書き記入された文字や数字等の記入情報を文字認識して記入者を特定する際の信頼性の向上を可能とする画像処理装置および画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
請求項1記載の画像処理装置は、用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識手段と、複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識手段による認識結果の信頼度を表す確度を、前記認識手段によって認識された複数の用紙の各々について前記確度情報を用いて算出する確度算出手段と、前記確度算出手段が算出した確度を基に前記複数の記入者候補の中から、前記認識手段が認識した複数の用紙の各記入者を特定する特定手段とを備えることを特徴としている。
【0007】
請求項2記載の画像処理装置は、請求項1記載の画像処理装置において、前記認識手段は、認識した文字についての複数の候補文字に対する確度情報を出力し、前記確度算出手段は、前記複数の候補文字に対する確度情報を基に前記記入者情報に対する確度を算出することを特徴としている。
【0008】
請求項3記載の画像処理装置は、請求項1又は2記載の画像処理装置において、前記特定手段は、前記複数の用紙のうち前記確度算出手段が算出した確度が最大となる用紙を、前記確度算出手段による算出対象の記入者の用紙とすることを特徴としている。
【0009】
請求項4記載の画像処理装置は、請求項1又は2記載の画像処理装置において、前記確度算出手段は、前記記入者情報のうち数字に対する確度情報と文字に対する確度情報とに対してそれぞれ異なる演算を施して前記記入者情報に対する確度を算出することを特徴としている。
【0010】
請求項5記載の画像処理装置は、用紙に手書き記入された記入情報を認識する認識手段と、前記認識手段によって認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付け手段と、前記第1の対応付け手段による対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出手段と、前記抽出手段が抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付け手段と、前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付ける第3の対応付け手段とを備えることを特徴としている。
【0011】
請求項6記載の画像処理装置は、請求項5記載の画像処理装置において、前記第3の対応付け手段は、前記第1の対応付け手段による処理機能と前記第2の対応付け手段による処理機能とを持ち、これらの処理機能を前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付けるまで繰り返して実行することを特徴としている。
ことを特徴とする。
【0012】
請求項7記載の画像処理プログラムは、用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識ステップと、複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識ステップでの認識結果の信頼度を表す確度を、前記認識ステップで認識した複数の用紙の各々について前記確度情報を用いて算出する確度算出ステップと、前記確度算出ステップで算出した確度を基に前記複数の記入者候補の中から、前記認識ステップで認識した複数の用紙の各記入者を特定する特定ステップとを有することを特徴としている。
【0013】
請求項8記載の画像処理プログラムは、用紙に手書き記入された記入情報を認識する認識ステップと、前記認識ステップで認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付けステップと、前記第1の対応付けステップでの対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出ステップと、前記抽出ステップで抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付けステップと、前記第1の対応付けステップで対応付けられていない前記認識対象の用紙と前記第2の対応付けステップで対応付けられていない記入者とを1対1で対応付ける第3の対応付けステップとを有することを特徴としている。
【発明の効果】
【0014】
請求項1記載の画像処理装置によれば、活字に比べて認識精度が落ちる、手書き文字や数字等の記入情報でも当該記入情報から高い信頼性にて記入者を特定できる。
【0015】
請求項2記載の画像処理装置によれば、記入者情報に対する算出確度を上げることができる。
【0016】
請求項3記載の画像処理装置によれば、確度を算出した用紙と確度の算出対象の記入者との対応付けの精度を上げることができる。
【0017】
請求項4記載の画像処理装置によれば、記入者情報に対する確度の算出精度を上げることができる。
【0018】
請求項5記載の画像処理装置によれば、手書きによる文字や数字が活字に比べて認識精度が低いことに起因して、第1の対応付けの段階で1枚の用紙に対して複数の記入者が対応付けられた場合であっても、最終的に、用紙と記入者とを1対1で対応付けることができる。
【0019】
請求項6記載の画像処理装置によれば、請求項5記載の画像処理装置に比べて、用紙と記入者との対応付けの精度を上げることができる。
【0020】
請求項7記載の画像処理プログラムによれば、活字に比べて認識精度が落ちる、手書き文字や数字等の記入情報でも当該記入情報から高い信頼性にて記入者を特定できる。
【0021】
請求項8記載の画像処理プログラムによれば、手書きによる文字や数字が活字に比べて認識精度が低いことに起因して、第1の対応付けの段階で1枚の用紙に対して複数の記入者が対応付けられた場合であっても、最終的に、用紙と記入者とを1対1で対応付けることができる。
【発明を実施するための最良の形態】
【0022】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0023】
[適用例]
図1は、本発明が適用される画像処理装置の基本構成の一例を示すシステム構成図である。ここでは、画像処理装置として、教育機関で用いられる教材(以下、「教育用教材」と記述する)を取り扱う教材処理装置を例に挙げて説明するものとする。
【0024】
図1に示すように、本適用例に係る教材処理装置は、データベース部1と、画像読み取り部2と、画像データ解析部3と、教材判別部4と、歪み補正部5と、差分抽出部6と、解答者抽出部7と、正誤判定抽出部8と、途切れ補正部9と、図形形状認識部10と、記入位置算出部11と、採点集計部12と、集計結果出力部13とを有する構成となっている。
【0025】
かかる教材処理装置において、データベース部1は、教育用教材についての電子データを保持蓄積する。
【0026】
ここで、教育用教材について簡単に説明する。図2は、教育用教材の一具体例を示す説明図である。図2に示すように、教育用教材20は、教育機関で用いられるテストの答案用紙や練習問題用紙等であり、問題およびその解答欄21を有している。ただし、教育用教材20は、少なくとも解答欄21を有していればよく、問題文については必ずしも記載されていなくともよい。
【0027】
また、教育用教材20には、その教育用教材20を識別特定するための情報が記載された識別情報欄22と、解答欄21への解答記入者に関する情報を記載するための解答者情報欄23と、採点結果の得点を記入する得点欄24とが設けられている。識別情報欄22には、例えば教育用教材20の科目、タイトル、適用学年等の情報があらかじめ記載されるものとする。一方、解答者情報欄23には、解答記入者の学級、出席番号、氏名等が手書きにて記入され得るようになっている。
【0028】
このような教育用教材20についての電子データに関しては、その教育用教材20における解答欄21や識別情報欄22等のレイアウトを特定し得るものであって、かつ、データベース部1にて保持蓄積可能なものであれば、そのデータ形式を問わない。例えば、画像データであっても、文書作成ソフトウェアで作成したアプリケーション文書データであっても良い。
【0029】
ただし、教育用教材20の電子データは、その教育用教材20における各解答欄21についての配点情報を含んでいるものとする。配点情報とは、教育用教材20上における各解答欄21について、どの位置に存在する解答欄21への配点が何点であるかを特定するための情報である。なお、配点は、解答欄21ごとに異なっていても、あるいは一律であっても構わない。
【0030】
図1に説明を戻す。画像読み取り部2は、解答欄21への解答記入、解答者情報欄23への氏名等の手書き記入および当該解答に対する採点者による正誤判定の採点記号(例えば、「○」,「×」等の図形)の手書き記入が為された教育用教材20に対して、公知の光学的画像読み取り技術を用いた画像読み取りを行って、その教育用教材20から画像データを得て本教材処理装置内に入力する。
【0031】
画像データ解析部3は、画像読み取り部2から入力された画像データについて、その解析処理を行う。解析処理としては、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識等が挙げられるが、いずれも公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。
【0032】
教材判別部4は、タイトル解析部41とコード情報解析部42との少なくとも一方によって構成され、画像データ解析部3での解析処理の結果、特に識別情報欄22についてのタイトル解析部41によるタイトル解析またはコード情報解析部42によるコード解析の少なくとも一方の解析結果を基にして、画像読み取り部2で得られた画像データの元となった教育用教材20を識別特定する。
【0033】
このとき、教材判別部4においては、データベース部1が保持蓄積している教育用教材20の電子データと照らし合わせ、該当する電子データがデータベース部1に保持蓄積されていなければ、教育用教材の識別特定エラーとする判定を行う。すなわち、教材判別部4は、画像データ解析部3での解析結果を基に、画像読み取り部2で得られた画像データとの比較対象となる電子データを特定する。
【0034】
歪み補正部5は、画像読み取り部2で得られた画像データに対して、その画像データにおける画像歪みの補正を行う。画像歪みの補正としては、傾き補正や主走査方向または副走査方向の拡縮補正等が挙げられる。これらの歪み補正については、いずれも公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。あるいは、画像読み取り部2で得られた画像データと比較対象となるデータベース部1内の電子データとを比較照合し、その画像歪み(傾き、拡縮など)を補正するようにしても良い。
【0035】
差分抽出部6は、教材判別部4での教育用教材20の識別特定の結果に基づいて、画像読み取り部2から入力され、歪み補正部5での歪み補正処理後の画像データと、その比較対象となるデータベース部1内の電子データとを比較して、それぞれの間の差分を抽出する。なお、差分抽出処理の手法自体については、公知の画像処理技術を利用して実現すればよいために、ここではその詳細な説明を省略する。
【0036】
解答者抽出部7は、手書き領域切り出し部71、手書きOCR(Optical Character Reader;光学式文字読み取り装置)部72および解答者特定部73から構成され、画像データ解析部3での解析処理の結果を基にしつつ、差分抽出部6で抽出された差分情報から、画像読み取り部2で読み取り対象となった教育用教材における解答者情報を抽出し、当該解答者情報から解答者(生徒)を特定する。解答者情報としては、解答記入者の学級、出席番号、氏名等といった、解答記入者を識別するための情報が挙げられる。
【0037】
この解答者抽出部7において、手書き領域切り出し部71は、差分抽出部6で抽出された差分情報のうち、解答記入者が手書きにて記入する手書き領域である解答者情報欄23についての差分情報を切り出す。この切り出された差分情報は、解答記入者の学級、出席番号を表す数字や、解答記入者の氏名を表す文字などである。
【0038】
手書きOCR部72は、手書き領域切り出し部71が切り出した数字や文字に対して、パターンマッチング等の周知の文字認識処理技術によって文字認識を行い、その認識結果である数字や文字(解答者情報)を、その認識結果の信頼度を表す確度情報と共に解答者特定部73に対して出力する。
【0039】
解答者特定部73は、手書きOCR部72が出力する認識結果とその確度情報とを基にして、あらかじめデータベース装置31に登録されている解答者情報、具体的には解答記入者の学級、出席番号、氏名等の情報から、画像読み取り部2で読み取り対象となった教育用教材、即ち採点対象の教育用教材についての解答者を特定する。この解答者を特定するための画像処理が本実施形態の特徴とする画像処理手法であり、その詳細については後述する。
【0040】
正誤判定抽出部8は、画像データ解析部3での解析処理の結果を基にしつつ、差分抽出部6で抽出された差分から、さらに正誤判定の記入内容を抽出する。正誤判定の記入内容の抽出は、例えば差分抽出部6での抽出結果に対する色成分認識処理を通じて、所定色成分についてのものを抽出することによって行えばよい。何故ならば、採点者による正誤判定の記入は、一般に、赤色で行われるからである。
【0041】
途切れ補正部9は、正誤判定抽出部8での抽出結果に対して途切れ補正処理を行う。ここに、途切れ補正処理とは、正誤判定抽出部8が抽出した線分に途切れがある場合に、その線分同士を接続して途切れを解消するための処理である。
【0042】
図形形状認識部10は、正誤判定抽出部8で抽出され、途切れ補正部9で途切れ補正が為された正誤判定の記入内容に対して、その形状認識を行って正誤判定の記入内容を認識する。形状認識は、正誤判定の採点記号、例えば「○」や「×」等の図形形状とのパターンマッチングによって行えばよい。すなわち、図形形状認識部10は、正誤判定の記入内容が「正解(○)」または「不正解(×)」であるかを認識するものである。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識するようにしてもよい。特徴量としては、例えば、穴の個数、外接矩形に占める対象図形の面積率などが挙げられる。
【0043】
記入位置算出部11は、図形形状認識部10にて形状認識された正誤判定の記入内容について、その教育用教材20上における記入位置を算出する。記入位置の算出は、例えば教育用教材20上における座標解析によって行えばよい。
【0044】
採点集計部12は、図形形状認識部10による正誤判定の記入内容の認識結果と、記入位置算出部11による正誤判定の記入位置の算出結果と、データベース部1が保持蓄積している教育用教材20の電子データに含まれる当該教育用教材20の各解答欄21についての配点情報とを基にして、画像読み取り部2が画像読み取りを行った教育用教材20について、当該教育用教材20に記入された正誤判定の採点集計を行う。この採点集計を行う際に、採点集計部12は、「○」や「×」等の正誤判定記号(採点記号)と教育用教材20の各解答欄21とを対応付ける処理を行う。
【0045】
集計結果出力部13は、採点集計部12による採点集計の結果を、解答者抽出部7で特定された採点対象の教育用教材についての解答者と関連付けて出力する。なお、集計結果出力部13による出力先としては、本教材処理装置と接続されるデータベース装置31またはファイルサーバ装置32など、教育用教材20についての採点集計結果を管理するものが挙げられる。
【0046】
なお、以上説明した各構成要素、即ちデータベース部1〜集計結果出力部13のうち、画像読み取り部2については、画像読み取り装置としての機能を有した複写機、複合機あるいはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder;ADF)を付設して、複数の教育用教材に対する画像読み取りを連続的に行うようにすることが考えられる。
【0047】
また、画像読み取り部2を除く他の各構成要素、即ちデータベース部1、画像データ解析部3〜集計結果出力部13については、例えばPC(パーソナルコンピュータ)のように、所定プログラムを実行することによって情報記憶処理機能、画像処理機能、演算処理機能等を実現するコンピュータ機器を利用して実現することが考えられる。
【0048】
その場合に、データベース部1、画像データ解析部3〜集計結果出力部13の各機能を実現するのに必要となる所定プログラムは、あらかじめPC内にインストールしておくことが考えられる。ただし、あらかじめインストールされているのではなく、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであってもよく、または有線若しくは無線による通信手段を介して配信されるものであってもよい。
【0049】
(教材処理手順)
次に、以上のように構成された本適用例に係る教材処理装置における処理手順の一例について、図3の説明図を参照して説明する。
【0050】
教材処理装置を利用する場合には、先ず、生徒等によって解答者情報欄23への氏名等の情報の記入および解答欄21への解答記入が為され、さらに教師等によって各解答欄21に記入された解答に対する「○」や「×」等の正誤判定の採点記号が記入された教育用教材20について、画像読み取り部2が画像読み取りを行って、その教育用教材20からの画像データを得る(ステップS101)。
【0051】
このとき、自動原稿搬送装置を用いれば、例えば同一学級のような一つのグループに纏めて処理すべき複数の教育用教材20について、一括して画像読み取りを行って、各教育用教材20から連続的に画像データを得ることができる。そして、画像読み取りによって得られた画像データについては、一旦ワークエリアとして用いられるメモリ等に保持しておく。
【0052】
その後は、各教育用教材20から得られたそれぞれの画像データに対して、順次、以下のような自動採点処理が行われる(ステップS102)。
【0053】
すなわち、ある一つの教育用教材20から得られた画像データについて、画像データ解析部3がその解析処理を行い、その解析処理の結果に基づいて教材判別部4が教育用教材20の識別特定を行う。この識別特定は、例えば「理科」、「5年」、「1.天気と気温の変化」といったタイトル解析または識別情報欄22に埋め込まれたコード情報についてのコード解析を通じて行えばよい。この識別特定を経ることで、教材判別部4において、画像読み取り部2で得られた画像データとの比較対象となる電子データを特定することが可能となる。
【0054】
なお、この識別特定は、画像読み取り部2が画像読み取りを行った複数の教育用教材20のそれぞれについて順次行うことも考えられるが、一般に一つのグループに纏めて処理される教育用教材20は全て同一のものであるため、その纏めて処理される中で最初に処理される教育用教材20についてのみ行えばよい。
【0055】
教材判別部4が電子データを特定すると、データベース部1は、その特定結果に従いつつ、保持蓄積している中から該当する電子データを取り出して、これを差分抽出部6へ受け渡す。
【0056】
また、ある一つの教育用教材20から得られた画像データについては、歪み補正部5がその画像データにおける画像歪みの補正を行う。この画像歪みの補正は、その後に行う電子データとの比較や差分抽出等の処理を行う際の精度向上を図ることを目的として、画像読み取り部2での画像読み取りの際に生じ得る画像歪みを補正するために行われる。
【0057】
そして、差分抽出部6は、データベース部1から受け渡された電子データと、画像読み取り部2で得られ、歪み補正部5で画像歪みが補正された後の画像データとをそれぞれ比較して、その差分を抽出する。この差分抽出によって、解答者情報欄23および各解答欄21への記入内容、並びに各解答欄21に対する正誤判定の記入内容が抽出されることになる。
【0058】
差分抽出部6が差分を抽出すると、その後は、解答者抽出部7が、その差分に対する文字認識処理等を通じて、画像読み取り部2で読み取り対象となった教育用教材についての解答者(解答記入者)を特定する。具体的には、解答者抽出部7は、文字認識処理による認識結果とその確度情報を基に、あらかじめデータベース装置31に登録されている解答者情報から、画像読み取り部2で読み取り対象となった教育用教材(採点対象の教育用教材)についての解答者を特定する。
【0059】
また、差分抽出部6による差分抽出結果に対しては、各解答欄21への正誤判定の記入内容を抽出するために、その差分抽出結果から正誤判定抽出部8がさらに所定色成分についてのもの、具体的には例えば赤色成分のものを抽出する。所定色成分の抽出は、例えば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで実行できる。
【0060】
ただし、一般に、教育用教材20上での「○」や「×」等の正誤判定の図形記入は、問題文、各解答欄21を特定する枠、各解答欄21への解答記入内容等に重ねて行われることが多い。そのため、正誤判定抽出部8による所定色成分の抽出結果は、その重なり部分が除かれたもの、すなわち「○」や「×」等の図形に途切れ部分が生じたものとなるおそれがある。このことから、正誤判定抽出部8による所定色成分の抽出結果に対しては、途切れ補正部9が途切れ補正処理を行う。
【0061】
以上は、本発明が適用される教材処理装置(教育用教材の自動採点システム)の基本的な構成および処理についての説明である。
【0062】
この種の教材処理装置において、採点結果をデータベースに登録するためには生徒(解答記入者)を特定する必要がある。生徒を特定するに当たっては、生徒が答案用紙に手書き記入した氏名や出席番号についての文字や数字等の記入情報を認識するとき、手書きによる文字や数字は活字に比べて認識精度が落ちるために、光学式文字読み取り装置(OCR)による認識結果だけから生徒を特定する手法では生徒特定の信頼性が低い。
【0063】
そこで、以下では、例えば上記構成の教材処理装置において、OCR認識処理による認識結果とその確度情報とを基に、例えばデータベース装置31にあらかじめ登録されている複数の生徒(記入者候補)の中から各生徒を特定する生徒情報(記入者情報)を用いて、採点対象の答案用紙についての解答記入者である生徒を特定するための画像処理装置の具体的な実施の形態について説明する。
【0064】
なお、以下に述べる実施の形態は、本発明を実施するための好適な実施の形態であることから、技術的に好ましい種々の限定が付された態様となっているが、本発明は、これらの態様に発明の範囲が限られるものではなく、他の様々な態様での実施が可能である。
【0065】
[第1実施形態]
図4は、本発明の第1実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【0066】
図4に示すように、本実施形態に係る画像処理装置70Aは、クラス確定部701、生徒情報取得部702、手書きOCR部703、確度取得部704、確度算出部705および対応付け部706を有する構成となっている。
【0067】
クラス確定部701は、例えば、手書きOCR部72(図1参照)による解答者情報欄23(図2参照)の認識結果のうち、例えば組番号から生徒が属する母集団、即ちクラス(組)を確定する。ただし、クラス確定部701としては、手書きOCR部72の認識結果からクラスを確定する構成のものに限られるものではなく、例えば、画像読み取り部2(図1参照)の操作部から教師(採点者)によって手入力されるクラス番号や教師の識別番号(以下、「ID番号」と記述する)などの情報からクラスを確定する構成のものであってもよい。
【0068】
生徒情報取得部702は、データベース装置31(図1参照)にあらかじめ登録されている全生徒の中から、クラス確定部701が確定したクラスに所属する全ての生徒(複数の記入者候補)の生徒情報(記入者情報)、具体的には出席番号および氏名(生徒名)をデータベース装置31から取得する。
【0069】
手書きOCR部703は、図1の手書きOCR部72に相当し、手書き領域切り出し部71(図1参照)が切り出した数字や文字に対して文字認識を行って、その認識結果を認識の信頼度を表す確度情報と共に出力する。この手書きOCR部703は、1文字(1数字)に対して認識結果として候補文字を複数出力するとともに、各候補文字に対する確度情報を出力する構成となっている。
【0070】
ここで、一例として、図5に示すように、解答者情報欄23に生徒が、組「2」、出席番号「15」、氏名「特許太郎」と手書きにて記入した答案用紙を採点の対象とする。この答案用紙の場合の解答者情報欄23に対するOCR認識結果と候補文字およびその確度(信頼度)としては、図6に示すように、OCR認識文字を第1候補、OCR認識文字に類似する文字を第2候補、第3候補、……とし、これら各候補文字の確度(信頼度)と共に手書きOCR部703から出力される。
【0071】
確度取得部704は、生徒情報取得部702がデータベース装置31から取得した生徒一人一人の出席番号および氏名の全文字(数字)について、手書きOCR部703によるOCR認識結果(図6参照)から、各文字に対応する確度を取得する処理を採点対象の全答案用紙に対して行う。この確度取得部704による確度の取得処理は、例えば出席番号順にクラスの全生徒に対して行われる。
【0072】
確度算出部705は、確度取得部704が取得した各文字(数字を含む)の確度から文字全体の確度を、採点対象の全答案用紙について算出する。文字全体の確度を算出する手法としては、文字個々の確度をそのまま加算する単純加算法や、数字に対する確度と文字に対する確度とに対してそれぞれ異なる演算を施して文字全体の確度を算出する、具体的には、例えば出席番号(数字)の確度に対して重み付けをしたり、氏名(文字)の確度に対して重み付けしたりするなど、文字(数字)個々の確度に対して重み付けを行って加算する重み付け加算法などの手法が考えられる。
【0073】
対応付け部706は、確度算出部705が算出した文字全体の確度から、例えば当該確度が最大となる答案用紙を、確度取得の基準となった生徒の答案用紙として対応付ける。この対応付け部706による対応付けにより、結果的に、採点対象の答案用紙の各々に対して解答記入者である生徒が確定される。
【0074】
すなわち、確度取得部704、確度算出部705および対応付け部706は、図1の解答者特定部73に相当し、手書きOCR部72が出力する認識結果とその確度情報とを基にして、あらかじめデータベース装置31に登録されている複数の生徒の中から、出席番号や氏名等の生徒情報を基に採点対象の答案用紙の解答記入者である生徒を特定する。
【0075】
上述した第1実施形態に係る画像処理装置70Aでは、手書きOCR部72の認識結果からデータベース装置31を探索して、対応する生徒を特定するのではなく、確度取得部704、確度算出部705および対応付け部706の作用により、データベース装置31にあらかじめ登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、採点対象の答案用紙の各々について解答記入者である生徒を対応付ける。
【0076】
上記構成の画像処理装置70Aの各構成要素のうち、クラス確定部701(画像読み取り部2からの手入力の場合を除く)、生徒情報取得部702、確度取得部704、確度算出部705および対応付け部706については、所定プログラムを実行することによって情報記憶処理、演算処理等の各機能を実行するコンピュータ機器を利用してソフトウェア構成によって実現することが考えられる。ただし、ソフトウェア構成による実現に限られるものではなく、ハードウェア構成、あるいはハードウェアとソフトウェアの複合構成によって実現することも可能である。
【0077】
(画像処理の手順)
次に、第1実施形態に係る画像処理の手順、例えば自動採点処理において文字認識による認識結果とその確度情報とを基にして、あらかじめ登録されている解答者情報から採点対象の教育用教材(答案用紙)についての解答記入者(生徒)を特定するための処理手順の一例について、図7のフローチャートを用いて説明する。この画像処理は、図1の解答者抽出部7で実行される処理に相当する。
【0078】
図7のフローチャートにおいて、先ず、解答記入者である生徒のクラス(組)番号Wを取得して母集団を確定する(ステップS11)。この母集団の確定に当たっては、図2の解答者情報欄23に対して文字認識処理(OCR)を実施してクラス番号Wを取得するようにしてもよいし、教師(採点者)が手入力した情報を基にクラス番号Wを取得するようにしてもよい。
【0079】
教師が手入力する場合の取得例としては、例えば、教師(担任)とクラスとは対応関係にあることから、教師がID番号を入力することによって当該ID番号から担任のクラスのクラス番号Wを取得する手法などが考えられる。なお、ここでは、クラスを母集団として確定するとしたが、学年を母集団として確定するようにしてもよい。
【0080】
次に、クラスWの全生徒の答案用紙(教育用教材)について、図2の解答者情報欄23に手書き記入したクラス、出席番号および氏名等の記入情報に対して文字認識処理(OCR)を実施し、OCR認識結果およびその確度情報を取得する(ステップS12)。OCR認識結果についての信頼度を表す確度情報は、手書きOCR部72において認識結果と共に得られる情報である(図6参照)。
【0081】
次に、クラスWに属する全ての生徒の生徒情報、具体的には出席番号および氏名をデータベース装置31から取得する(ステップS13)。このようにして、クラスWの全生徒の答案用紙について出席番号および氏名のOCR認識結果およびその確度情報を取得するとともに、クラスWに所属する全生徒の出席番号および氏名を取得したら、これら取得した情報を基に採点対象の答案用紙の各々について生徒を特定する処理を実行する。
【0082】
具体的には、先ず、クラスWに属する全ての生徒の中に未照合の生徒が存在するか否かを判断し(ステップS14)、未照合生徒が存在すれば、その未照合生徒を照合対象の生徒Sとする(ステップS15)。次に、OCR認識処理を行った答案用紙の中に未照合の答案用紙が存在するか否かを判断し(ステップS16)、未照合答案が存在すれば、その未照合答案(最初は1枚目の答案)に対するOCR認識結果を取り出して採点対象の答案のOCR認識結果Pとする(ステップS17)。
【0083】
そして、生徒Sの出席番号および氏名の各文字(数字)に対して順番に、採点対象の答案についてのOCR認識結果P(図6参照)を用いて、各文字の確度を取得し(ステップS18)、次いで、生徒Sの出席番号および氏名の文字全てについて確度取得を行ったかを判断する(ステップS19)。生徒Sの出席番号および氏名の文字全てについて確度取得が終わったら、文字個々の確度から生徒Sの出席番号および氏名の文字全体の確度を算出する(ステップS20)。
【0084】
文字(数字を含む)全体の確度を算出する手法としては、文字個々の確度をそのまま加算する単純加算や、例えば出席番号(数字)の確度に対して重み付けをしたり、氏名(文字)の確度に対して重み付けしたりするなど、文字(数字)個々の確度に対して重み付けを行って加算する重み付け加算などの手法が考えられる。
【0085】
採点対象の答案Pについて生徒Sの出席番号および氏名の文字全体の確度算出が終わったら、次の未照合答案を採点対象の答案とし(ステップS21)、しかる後、ステップS16に戻ってステップS16〜ステップS21の各処理を、ステップS16で未照合答案が存在しないと判定するまで繰り返して実行する。
【0086】
ステップS16で未照合答案が存在しないと判定したら、ステップS20で算出した文字全体の確度から、例えば当該確度が最大となる答案用紙を、確度取得の基準となった生徒Sと対応付ける(ステップS22)。その結果、採点対象の答案用紙についてその解答記入者である生徒が特定されたことになる。続いて、例えば出席番号が次の未照合生徒を照合対象の生徒Sとし(ステップS23)、しかる後、ステップS14に戻ってステップS14〜ステップS23の各処理を、ステップS14で未照合の生徒が存在しないと判定するまで繰り返して実行する。
【0087】
そして、ステップS14で未照合の生徒が存在しないと判定したら、OCR認識処理による認識結果とその確度情報とを基にして、データベース装置31にあらかじめ登録されている生徒情報(解答者情報)から採点対象の答案用紙についての生徒(解答記入者)を特定するための一連の処理を終了する。
【0088】
上述した第1実施形態に係る画像処理の一連の処理シーケンスにおける各ステップの処理をコンピュータに実行させるプログラムが、本発明の第1実施形態に係る画像処理プログラムとなる。そして、この画像処理プログラムについては、あらかじめコンピュータ内にインストールしておくことが考えられる。ただし、あらかじめインストールすることに限定されるものではなく、有線若しくは無線による通信手段により提供(配信)することはもちろん、コンピュータ読み取り可能なCD−ROM等の記憶媒体に格納して提供することも可能である。
【0089】
ところで、第1実施形態に係る画像処理の場合に限らず、一般的に、手書きによる文字や数字が活字に比べてOCR認識精度が低いために、OCR認識結果だけから生徒特定を間違いなく行うのは難しく、1枚の答案用紙に対して複数Nの生徒が解答記入者として対応付けられる(特定される)ことが起こり得る。
【0090】
そこで、以下に説明する第2実施形態に係る画像処理では、1枚の答案用紙に対して複数Nの生徒が解答記入者として対応付けられたときに、第2,第3の対応付け処理を行うことにより、最終的に、複数の答案用紙の各々と記入者候補である複数の生徒とを1対1に対応付ける処理を行うことを特徴とする。
【0091】
[第2実施形態]
図8は、本発明の第2実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【0092】
図8に示すように、本実施形態に係る画像処理装置70Bは、クラス確定部711、手書きOCR部712、第1の対応付け部713、集合抽出部714、第2の対応付け部715、第3の対応付け部716および論理和回路717を有する構成となっている。
【0093】
クラス確定部711は、例えば、手書きOCR部72(図1参照)による解答者情報欄23(図2参照)の認識結果のうち、例えば組番号から生徒が属する母集団、即ちクラス(組)を確定する。ただし、クラス確定部711としては、手書きOCR部72の認識結果からクラスを確定する構成のものに限られるものではなく、例えば、画像読み取り部2(図1参照)の操作部から教師(採点者)によって手入力されるクラス番号や教師の識別番号(ID番号)などの情報からクラスを確定する構成のものであってもよい。
【0094】
手書きOCR部712は、図1の手書きOCR部72に相当し、手書き領域切り出し部71(図1参照)が切り出した数字や文字に対して文字認識を行ってその認識結果を出力する。この手書きOCR部712として、第1実施形態の手書きOCR部703と同様のもの、即ち認識結果をその認識の信頼度を表す確度情報と共に出力する構成のものを用いるようにしてもよい。
【0095】
第1の対応付け部713は、データベース装置31(図1参照)にあらかじめ登録されている全生徒の中から、クラス確定部711が確定したクラスに所属する全ての生徒(複数の記入者候補)の生徒情報(具体的には、出席番号および氏名)をデータベース装置31から取得し、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合することにより、認識対象の答案用紙の各々と生徒の各々とを対応付ける。この対応付けのとき、閾値を設けておき、全てが閾値未満の場合は、どれとも対応付けを行わないようにする。
【0096】
第1の対応付け部713としては、例えば、第1実施形態に係る画像処理装置70Aにおける生徒情報取得部702、確度取得部704、確度算出部705および対応付け部706からなり、データベース装置31に登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、認識対象(採点対象)の答案用紙の各々について解答記入者である生徒を対応付ける構成のものを用いることができる。
【0097】
ただし、これは一例に過ぎず、これに限られるものではなく、要は、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合して答案用紙の各々と生徒の各々とを対応付けることができる構成のものであればよく、その構成は問わない。他の例としては、データベース装置31内でOCR認識結果が近い生徒をそのOCR認識対象の答案用紙と対応付ける構成のものなどが考えられる。
【0098】
この第1の対応付け部713で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。ここで、第1の対応付け部713での対応付け処理において、手書きによる文字や数字が活字に比べてOCR認識精度が低いことに起因して、1枚の答案用紙に対して複数(N)の生徒の重複割り当て(重複対応付け)が発生したり、未割り当てが発生したりすることが起こり得る。
【0099】
集合抽出部714は、第1の対応付け部713による対応付けの結果、重複割り当てが発生した場合にその集合を対応付け結果から抽出する。ここで、集合抽出部714が取得する集合は、複数の生徒が対応付けられた答案用紙が複数枚(M)ある場合には、1枚の答案用紙と複数の生徒とを1集合とするとM集合となる。
【0100】
第2の対応付け部715は、集合抽出部714が取得したM集合において、各集合ごとに、1枚の答案用紙と複数(N)の生徒の一人とを対応付ける。この第2の対応付け部715での対応付けでは、例えば、第1の対応付け部713で用いたOCR認識結果を用いて、当該OCR認識結果と複数(N)の生徒の各生徒情報とを照合し、最も一致度の高い一人の生徒を抽出して対応付ける。この第2の対応付け部715で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。
【0101】
第2の対応付け部715による対応付けの結果、集合MにおけるM枚の答案用紙の全てに対して生徒が対応付けられることになるが、当該対応付け処理で除外された生徒については、この段階では対応付けられる答案用紙が存在しないことになる。換言すれば、答案用紙が対応付けられてない生徒が存在することになる。一方、採点対象の答案用紙の枚数とクラスの生徒数とは同数である訳であるから、第1の対応付け部713による対応付け処理では、重複割り付けが発生した場合には、生徒が対応付けられていない答案用紙が存在することになる。
【0102】
第3の対応付け部716は、第1の対応付け部713による対応付け結果から生徒が対応付けられていない答案用紙を抽出するとともに、第2の対応付け部715による対応付け結果から答案用紙が対応付けられてない生徒を抽出し、これら答案用紙と生徒とを所定の方法にて対応付ける。この第3の対応付け部716で1対1に対応付けられた答案用紙と生徒の対は、対応付け結果として論理和回路717を介して出力される。
【0103】
第3の対応付け部716での対応付けの所定の方法としては、例えば、第1の対応付け部713で用いたOCR認識結果を用いて、当該OCR認識結果と生徒の生徒情報とを照合する際に、第1の対応付け部713での対応付けの場合よりも閾値を下げて緩い条件で対応付けを行う手法や、生徒が対応付けられていない答案用紙X1〜Xkの全てと答案用紙が対応付けられてない生徒Y1〜Ykの全てとを総当たり的に、第1実施形態での対応付けで用いた確度の高いものから割り当てる、具体的にはk×kの全ての組の確度を求め、当該確度が高いものが順に割り当てを決定する手法等が考えられる。
【0104】
さらに、第3の対応付け部716による対応付けの方法として、第1の対応付け部713による対応付けと第2の対応付け部715による対応付けとを、答案用紙と生徒との対応付けが1対1になるまで繰り返して実行する手法を採ることも考えられる。
【0105】
上記構成の画像処理装置70Bの各構成要素のうち、クラス確定部711(画像読み取り部2からの手入力の場合を除く)、第1の対応付け部713、集合抽出部714、第2の対応付け部715、第3の対応付け部716および論理和回路717については、所定プログラムを実行することによって情報記憶処理、演算処理等の各機能を実行するコンピュータ機器を利用してソフトウェア構成によって実現することが考えられる。ただし、ソフトウェア構成による実現に限られるものではなく、ハードウェア構成、あるいはハードウェアとソフトウェアの複合構成によって実現することも可能である。
【0106】
(画像処理の手順)
次に、第2実施形態に係る画像処理の手順の一例について、図9のフローチャートを用いて説明する。この画像処理は、図1の解答者抽出部7で実行される処理に相当する。
【0107】
図9のフローチャートにおいて、先ず、解答記入者である生徒のクラス(組)番号Wを取得して母集団を確定する(ステップS31)。この母集団の確定に当たっては、図2の解答者情報欄23に対して文字認識処理(OCR)を実施してクラス番号Wを取得するようにしてもよいし、教師(採点者)が手入力した情報を基にクラス番号Wを取得するようにしてもよい。
【0108】
教師が手入力する場合の取得例としては、例えば、教師(担任)とクラスとは対応関係にあることから、教師がID番号を入力することによって当該ID番号から担任のクラスのクラス番号Wを取得する手法などが考えられる。なお、ここでは、クラスを母集団として確定するとしたが、学年を母集団として確定するようにしてもよい。
【0109】
次に、クラスWの全生徒の答案用紙(教育用教材)について、図2の解答者情報欄23に手書き記入したクラス、出席番号および氏名等の記入情報に対して文字認識処理(OCR)を実施してOCR認識結果を取得し(ステップS32)、次いで、クラスWに属する全ての生徒の生徒情報、具体的には出席番号および氏名をデータベース装置31から取得する(ステップS33)。
【0110】
このようにして、クラスWの全生徒の答案用紙について出席番号および氏名のOCR認識結果を取得するとともに、クラスWに所属する全生徒の出席番号および氏名を取得したら、これら取得した情報を基に採点対象の答案用紙の各々とクラスWの生徒の各々とを1対1で対応付ける処理を実行する。
【0111】
具体的には、先ず、第1の対応付け処理を行う(ステップS34)。この第1の対応付け処理での具体的な処理として、例えば、第1実施形態に係る画像処理(図7参照)におけるステップS14〜ステップS23の各処理により、データベース装置31に登録されている各生徒の生徒情報から、手書きOCR部703のOCR認識結果と確度情報とを用いて各生徒に対応する答案用紙を特定することで、結果的に、認識対象(採点対象)の答案用紙の各々について解答記入者である生徒を対応付ける処理が考えられる。
【0112】
ただし、この処理は一例に過ぎず、これに限られるものではなく、要は、手書きOCR部72で文字認識する答案用紙ごとにそのOCR認識結果とクラスの全生徒情報とを照合して答案用紙の各々と生徒の各々とを対応付けることができる処理であればよい。他の処理例としては、例えば、図10のフローチャートに示す処理手法が考えられる。
【0113】
図10のフローチャートにおいて、先ず、クラスWに属する全ての生徒の中に未照合の生徒が存在するか否かを判断し(ステップS51)、未照合生徒が存在すれば、その未照合生徒を照合対象の生徒Sとする(ステップS52)。次に、採点対象の答案用紙の出席番号および氏名に対してOCR認識を行い(ステップS53)、次いで、当該OCR認識結果と照合対象の生徒Sの生徒情報との一致の度合いが閾値以上であれば認識対象の答案用紙と照合対象の生徒Sを対応付ける(ステップS54)。続いて、例えば出席番号が次の未照合生徒を照合対象の生徒Sとし(ステップS55)、しかる後、ステップS51に戻ってステップS51〜ステップS55の各処理を、ステップS51で未照合の生徒が存在しないと判定するまで繰り返して実行する。
【0114】
図9のフローチャートに説明を戻す。第1の対応付け処理においては、手書きによる文字や数字が活字に比べてOCR認識精度が低いことに起因して、1枚の答案用紙に対して複数(N)の生徒の重複割り当て(重複対応付け)が発生したり、未割り当てが発生したりすることが起こる場合がある。そこで、採点対象の答案用紙の各々とクラスWの生徒の各々とが1対1で対応付けられたか否かを判断し(ステップS35)、1対1で対応付けられていれば、答案用紙の各々とクラスWの生徒の各々との対応付けのための一連の処理を終了する。
【0115】
1対1で対応付けられていなければ、1対Nの集合が存在するか否かを判断し(ステップS36)、1対Nの集合が存在すれば、1対Nの対応付けとなっている1集合を第1の対応付け処理による対応付け結果から抽出し(ステップS37)、次いで、当該集合の答案用紙と複数(N)の生徒の一人とを対応付ける(ステップS38)。ここでの対応付けが第2の対応付けとなる。この第2の対応付け処理では、例えば、第1の対応付け処理でのOCR認識結果を用いて、当該OCR認識結果と複数(N)の生徒の各生徒情報とを照合し、最も一致度の高い一人の生徒を抽出して当該集合の答案用紙と対応付ける。
【0116】
次に、第2の対応付け処理で対応付けられなかった残りの生徒については未割り当てとし(ステップS39)、次いで、1対Nの対応付けとなっている次の1集合を抽出し(ステップS40)、しかる後、ステップS36に戻って、ステップS36〜ステップS40の処理を、ステップS36で1対Nの集合が存在しないと判定するまで繰り返して実行する。
【0117】
ここで、採点対象の答案用紙の枚数とクラスの生徒数とは同数である訳であるから、第1の対応付け処理で1対Nの重複割り付けが発生した場合には、生徒が対応付けられていない答案用紙が存在することになる。また、第2の対応付け処理の結果、ステップS39で未割り当てとなった生徒、即ち答案用紙が対応付けられてない生徒が存在することになる。すなわち、第2の対応付け処理が終了した段階で、生徒と対応付けさせていない答案用紙と、答案用紙と対応付けられていない生徒とが同数存在することになる。
【0118】
そこで、未対応付けの答案用紙についてのOCR認識結果と、未対応付けの生徒の生徒情報とを抽出し(ステップS41)、次いで、OCR認識結果と生徒情報とを基に、未対応付けの答案用紙の各々と未対応付けの生徒の各々とを所定の方法にて1対1に対応付け(ステップS42)、答案用紙の各々とクラスWの生徒の各々との対応付けのための一連の処理を終了する。ここでの対応付けが第3の対応付けとなる。
【0119】
第3の対応付けでの所定の方法としては、例えば、第1の対応付け処理で用いたOCR認識結果を用いて、当該OCR認識結果と生徒の生徒情報とを照合する際に、第1の対応付けの場合よりも閾値を下げて緩い条件で対応付けを行う手法や、生徒が対応付けられていない答案用紙X1〜Xkの全てと答案用紙が対応付けられてない生徒Y1〜Ykの全てとを総当たり的に、第1実施形態での対応付けで用いた確度の高いものから割り当てる、具体的にはk×kの全ての組の確度を求め、当該確度が高いものが順に割り当てを決定する手法等が考えられる。
【0120】
さらに、第3の対応付けでの所定の方法として、第1の対応付け処理と第2の対応付け処理とを、答案用紙と生徒との対応付けが1対1になるまで繰り返して実行する手法を採ることも考えられる。
【0121】
上述した第2実施形態に係る画像処理の一連の処理シーケンスにおける各ステップの処理をコンピュータに実行させるプログラムが、本発明の第2実施形態に係る画像処理プログラムとなる。そして、この画像処理プログラムについては、あらかじめコンピュータ内にインストールしておくことが考えられる。ただし、あらかじめインストールすることに限定されるものではなく、有線若しくは無線による通信手段により提供(配信)することはもちろん、コンピュータ読み取り可能なCD−ROM等の記憶媒体に格納して提供することも可能である。
【0122】
なお、上記各実施形態では、生徒が答案用紙に手書き記入した出席番号や氏名を文字認識することによって生徒を特定する教育用教材の自動採点システム(教材処理装置)に適用した場合を例に挙げて説明したが、本発明はこの適用例に限られるものではなく、用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付けて認識対象の用紙についての手書き記入者を特定する画像処理装置全般に対して適用可能である。
【0123】
その他の適用例として、例えば、社内のアンケート集計を行う場合などのアンケート集計システムにおいて、部署別、男女別などの集計結果をデータベースに登録するに当たって、社員がアンケート用紙に手書き記入した社員番号や氏名あるいは所属部署などを光学式文字読み取り装置によって文字認識して、アンケート用紙についての手書き記入者である社員を特定するような場合が考えられる。
【図面の簡単な説明】
【0124】
【図1】本発明が適用される教材処理装置の基本構成の一例を示すシステム構成図である。
【図2】教育用教材の一具体例を示す説明図である。
【図3】本適用例に係る教材処理装置における処理動作例を示す説明図である。
【図4】本発明の第1実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【図5】答案用紙の解答者情報欄への手書き記入例を示す図である。
【図6】OCR認識結果と候補文字およびその確度の関係の一例を示す図である。
【図7】第1実施形態に係る画像処理の手順の一例を示すフローチャートである。
【図8】本発明の第2実施形態に係る画像処理装置の概略構成例を示すブロック図である。
【図9】第2実施形態に係る画像処理の手順の一例を示すフローチャートである。
【図10】第2実施形態に係る画像処理における第1の対応付け処理の一例を示すフローチャートである。
【符号の説明】
【0125】
1…データベース部、2…画像読み取り部、3…画像データ解析部、4…教材判別部、5…歪み補正部、6…差分抽出部、7…解答者抽出部、8…正誤判定抽出部、9…途切れ補正部、10…図形形状認識部、11…記入位置算出部、12…採点集計部、13…集計結果出力部、20…教育用教材、21…解答欄、22…識別情報欄、23…解答者情報欄、24…得点欄、31…データベース装置、32…ファイルサーバ装置、41…コード情報解析部、42…タイトル解析部、71…手書き領域切り出し部、72…手書きOCR部、73…解答者特定部、70A,70B…画像処理装置
【特許請求の範囲】
【請求項1】
用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識手段と、
複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識手段による認識結果の信頼度を表す確度を、前記認識手段によって認識された複数の用紙の各々について前記確度情報を用いて算出する確度算出手段と、
前記確度算出手段が算出した確度を基に前記複数の記入者候補の中から、前記認識手段が認識した複数の用紙の各記入者を特定する特定手段と
を備えることを特徴とする画像処理装置。
【請求項2】
前記認識手段は、認識した文字についての複数の候補文字に対する確度情報を出力し、
前記確度算出手段は、前記複数の候補文字に対する確度情報を基に前記記入者情報に対する確度を算出する
ことを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記特定手段は、前記複数の用紙のうち前記確度算出手段が算出した確度が最大となる用紙を、前記確度算出手段による算出対象の記入者の用紙とする
ことを特徴とする請求項1又は2記載の画像処理装置。
【請求項4】
前記確度算出手段は、前記記入者情報のうち数字に対する確度情報と文字に対する確度情報とに対してそれぞれ異なる演算を施して前記記入者情報に対する確度を算出する
ことを特徴とする請求項1又は2記載の画像処理装置。
【請求項5】
用紙に手書き記入された記入情報を認識する認識手段と、
前記認識手段によって認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付け手段と、
前記第1の対応付け手段による対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出手段と、
前記抽出手段が抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付け手段と、
前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付ける第3の対応付け手段と
を備えることを特徴とする画像処理装置。
【請求項6】
前記第3の対応付け手段は、前記第1の対応付け手段による処理機能と前記第2の対応付け手段による処理機能とを持ち、これらの処理機能を前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付けるまで繰り返して実行する
ことを特徴とする請求項5記載の画像処理装置。
【請求項7】
用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識ステップと、
複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識ステップでの認識結果の信頼度を表す確度を、前記認識ステップで認識した複数の用紙の各々について前記確度情報を用いて算出する確度算出ステップと、
前記確度算出ステップで算出した確度を基に前記複数の記入者候補の中から、前記認識ステップで認識した複数の用紙の各記入者を特定する特定ステップと
を有することを特徴とする画像処理プログラム。
【請求項8】
用紙に手書き記入された記入情報を認識する認識ステップと、
前記認識ステップで認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付けステップと、
前記第1の対応付けステップでの対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出ステップと、
前記抽出ステップで抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付けステップと、
前記第1の対応付けステップで対応付けられていない前記認識対象の用紙と前記第2の対応付けステップで対応付けられていない記入者とを1対1で対応付ける第3の対応付けステップと
を有することを特徴とする画像処理プログラム。
【請求項1】
用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識手段と、
複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識手段による認識結果の信頼度を表す確度を、前記認識手段によって認識された複数の用紙の各々について前記確度情報を用いて算出する確度算出手段と、
前記確度算出手段が算出した確度を基に前記複数の記入者候補の中から、前記認識手段が認識した複数の用紙の各記入者を特定する特定手段と
を備えることを特徴とする画像処理装置。
【請求項2】
前記認識手段は、認識した文字についての複数の候補文字に対する確度情報を出力し、
前記確度算出手段は、前記複数の候補文字に対する確度情報を基に前記記入者情報に対する確度を算出する
ことを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記特定手段は、前記複数の用紙のうち前記確度算出手段が算出した確度が最大となる用紙を、前記確度算出手段による算出対象の記入者の用紙とする
ことを特徴とする請求項1又は2記載の画像処理装置。
【請求項4】
前記確度算出手段は、前記記入者情報のうち数字に対する確度情報と文字に対する確度情報とに対してそれぞれ異なる演算を施して前記記入者情報に対する確度を算出する
ことを特徴とする請求項1又は2記載の画像処理装置。
【請求項5】
用紙に手書き記入された記入情報を認識する認識手段と、
前記認識手段によって認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付け手段と、
前記第1の対応付け手段による対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出手段と、
前記抽出手段が抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付け手段と、
前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付ける第3の対応付け手段と
を備えることを特徴とする画像処理装置。
【請求項6】
前記第3の対応付け手段は、前記第1の対応付け手段による処理機能と前記第2の対応付け手段による処理機能とを持ち、これらの処理機能を前記第1の対応付け手段で対応付けられていない前記認識対象の用紙と前記第2の対応付け手段で対応付けられていない記入者とを1対1で対応付けるまで繰り返して実行する
ことを特徴とする請求項5記載の画像処理装置。
【請求項7】
用紙に手書き記入された記入情報を認識し、その認識結果と共に認識の信頼度を表す確度情報を出力する認識ステップと、
複数の記入者候補の各々に対して、当該記入者候補を特定する記入者情報に対する前記認識ステップでの認識結果の信頼度を表す確度を、前記認識ステップで認識した複数の用紙の各々について前記確度情報を用いて算出する確度算出ステップと、
前記確度算出ステップで算出した確度を基に前記複数の記入者候補の中から、前記認識ステップで認識した複数の用紙の各記入者を特定する特定ステップと
を有することを特徴とする画像処理プログラム。
【請求項8】
用紙に手書き記入された記入情報を認識する認識ステップと、
前記認識ステップで認識する用紙ごとに認識対象の用紙と複数の記入者候補の各記入者とを対応付ける第1の対応付けステップと、
前記第1の対応付けステップでの対応付けの結果、前記認識対象の用紙に対して複数の記入者が対応付けられた集合を抽出する抽出ステップと、
前記抽出ステップで抽出した集合において前記認識対象の用紙と前記複数の記入者の一人とを対応付ける第2の対応付けステップと、
前記第1の対応付けステップで対応付けられていない前記認識対象の用紙と前記第2の対応付けステップで対応付けられていない記入者とを1対1で対応付ける第3の対応付けステップと
を有することを特徴とする画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公開番号】特開2008−20506(P2008−20506A)
【公開日】平成20年1月31日(2008.1.31)
【国際特許分類】
【出願番号】特願2006−189965(P2006−189965)
【出願日】平成18年7月11日(2006.7.11)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
【公開日】平成20年1月31日(2008.1.31)
【国際特許分類】
【出願日】平成18年7月11日(2006.7.11)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
[ Back to top ]