説明

追記情報処理方法、追記情報処理装置、およびプログラム

【課題】教材自動採点システムにおいて、採点記号を適切に抽出できるようにする。
【解決手段】付加情報記入済教材81ごとに、合計点記入欄の位置を予め登録しておく(S10)。1枚目の付加情報記入済教材81が入力されたら、合計点記入欄内の画素値についてRGB色空間でヒストグラム解析をする(S12)。用紙以外の色で最も頻度の多い画素値を全ての付加情報記入済教材81の追記色とする(S14)。特定された追記色を元に抽出許容範囲を決定する(S16)。追記色と判定した色領域に属する画素成分のみを抽出することで、データ処理対象の追記情報とその他の追記情報とを分離して抽出する(S18)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、追記情報処理方法、追記情報処理装置、およびプログラムに関する。より詳細には、文書に追加記入された付加情報(追記情報やアノテーションとも称する)を、文書本体から分離し、文書本体と関わりを持つ様々な情報処理に利用する仕組みに関する。
【背景技術】
【0002】
情報処理技術の進歩の著しい今日、文書に関する様々な処理を自動処理する仕組みがある。たとえば、予め所定の情報が記載されている文書原本にさらに別の付加情報を追記し、その付加情報の追記された追記済文書を処理対象として、追記された付加情報に基づいて所定のデータ処理を行なう仕組みがある。
【0003】
たとえば、定型伝票に情報を記入して、その記入された情報を処理対象とする場合や、予め日付や予定記入欄が用意された主に手帳やメモなどに手書きで予定を記入し、その記入された予定を電子データ化する個人情報管理(特にスケジュール管理ともいう)の仕組みもある。また、校正記号を使用して画像編集や文字編集などの文書編集処理を行なう仕組みもある。
【0004】
文書編集処理を例にすれば、たとえば特許文献1には、文字情報と赤画像データを抽出後、赤画像データの種類に応じて、文字情報を編集する仕組みが開示されている。この仕組みでは、予め定義付けておいた「赤」と一致するものを赤画像とすることで、赤画像とそれ以外の画像プレーン(たとえば黒文字情報)とを分離するようにしている。
【0005】
【特許文献1】特開平5−108791号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の仕組みでは、実際に使用するペン色がどうであるかに拘わらず、予め定義付けておいた「赤」と一致するもののみを赤画像とするので、たとえば「理想の赤」からずれているペン色にも対応しようとすると抽出許容範囲を広くしなければならないが、この場合、実際に使用するペン色と離れた成分をもそのペン色に一致している成分であるとして抽出するようになり、データ処理対象の追記情報の抽出精度が低下する。
【0007】
本発明は、上記事情に鑑みてなされたものであり、データ処理対象の追記情報を高精度に抽出することのできる仕組みを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る仕組みにおいては、処理対象の追記済文書中に存在する付加情報の記入に使用された追記部材の記入剤の波長成分(いわゆる色)を特定し、この特定した波長成分に注目してデータ処理の対象となる付加情報(追記情報)を抽出し、この抽出した付加情報についてデータ処理を行なうようにした。つまり、実際に使用する追記部材による付加情報の波長成分(色)を特定し、各種の付加情報の内、この特定した波長成分と一致するもののみをデータ処理対象のものとして抽出する。
【0009】
なお、本発明に係る仕組みは、電子計算機(コンピュータ)を用いてソフトウェアで実現することもでき、このためのプログラムやこのプログラムを格納した記録媒体を発明として抽出することも可能である。プログラムは、コンピュータ読取り可能な記憶媒体に格納されて提供されてもよいし、有線あるいは無線による通信手段を介した配信により提供されてもよい。
【発明の効果】
【0010】
本発明によれば、実際に使用する追記部材による付加情報の波長成分(色)を特定し、この特定した波長成分と一致する付加情報をデータ処理対象のものとして抽出するようにしたので、実情に即した抽出処理を実現でき、データ処理対象の付加情報を高精度に抽出することができるようになる。その結果、抽出した付加情報の記載内容に基づくデータ処理においても、適切にデータ処理ができるようになる。
【発明を実施するための最良の形態】
【0011】
以下、図面を参照して本発明の実施形態について詳細に説明する。
【0012】
<処理対象文書の例>
図1〜図3は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。何れも、文書原本8Aを(A)に、追記済文書8Bを(B)に示す。また、データベースへの登録情報の一例を(C)に示す。
【0013】
先ず図1に示す第1例の文書は、特許文献1に記載の仕組みと同様に、文書編集処理に供される文書であって、図1(A)はその文書原本8Aを示し、図1(B)は、編集指示用の追記情報が記入された状態(追記済文書8B)を模式的に示している。
【0014】
たとえば、文書編集処理現場では、図1(A)に示した文書原本8Aの一例である編集対象文書70を処理対象として、訂正を要する箇所に、編集指示用の校正記号77や校正コメント78を追記していく。この際には、通常、編集対象文書70で使用されている文字画像色と、校正記号77や校正コメント78の記入に使用するペン色とは、異なるものが使用される。
【0015】
たとえば、黒の文字画像の編集対象文書70上に、訂正・編集処理に対応した校正パターンを示す校正記号77や校正指示内容を記述した校正コメント78を赤の筆記具で記入することで、図1(B)に示した追記済文書8Bの一例である校正情報記入済文書71が得られる。
【0016】
この後、この校正情報記入済文書71を読み取って、記入した赤の追記情報(校正記号77、校正コメント78)に基づいて、校正情報記入済文書71を自動修正(画像を再構成)する。
【0017】
なお、校正記号77や校正コメント78に基づくデータ処理としての文書編集処理を実行するための編集対象文書70(原本画像)のデータベースへの登録に当たっては、校正記号77に基づく校正作業時に必要となる処理内容を特定する校正記号情報37を登録しておく。全ての文書に共通する処理内容を登録することも可能であるが、編集対象文書70とは別に校正記号77とその処理内容とを登録することで、各校正情報記入済文書71に合わせた編集作業が可能となるので、想定して事前に登録した共通する処理内容では実現できないような特殊な校正作業を実行することも可能となる。
【0018】
たとえば、図1(C)に示すように、各校正記号77と、それぞれの処理内容とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
【0019】
また、図2に示す第2例の文書は、教育現場で紙媒体として使用される教育用教材80であって、典型例として、問題文82およびその解答欄84(本例では括弧で示された部分)を有したものであり、図2(A)はその文書原本8Aを示し、図2(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。
【0020】
このような教育用教材80は、具体的には教育機関で用いられるペーパーテストや練習問題シートなどが該当する。なお、教育用教材80は、少なくとも解答欄84を有していればよく、たとえば採点官が読み上げた問題について解答欄84に解答を記入する場合などがあり、問題文82については必ずしも記載されていなくともよい。
【0021】
また、図2(A)に示すように、教育用教材80は、問題文82および第1種の付加情報の一例である解答が記入される解答欄84の他に、配点欄83(問題別の項目点欄83aや部分点欄や合計点欄でなる集計欄83b)と、第1種の付加情報の一例である教育用教材80を識別特定するための情報を記入する識別情報欄85と、第1種の付加情報の一例である解答者情報であって解答欄84への解答記入者に関する情報を記入する解答者情報欄86とを有している。解答欄84、識別情報欄85、解答者情報欄86は、何れも第1種の付加情報を記入する記入欄の一例である。
【0022】
識別情報欄85には、たとえば教育用教材80の科目、タイトル、あるいは適用学年などが予め記載されるものとする。ただし、これらの記載に加えて、またはこれらの記載とは別に、教育用教材80を識別するためのコード情報が埋め込まれていてもよい。
【0023】
コード情報の埋込みは、公知技術を利用して実現すればよいが、その一つの具体例として、たとえば「iTone(登録商標)」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態(位置、形状など)を変化させることで、ハーフトーン画像の中にデジタル情報を埋め込むようにする、といった技術を用いることが考えられる。一方、解答者情報欄86には、解答記入者の学級86a、出席番号86b、あるいは氏名86cなどが記入され得るようになっている。
【0024】
配点欄83(特に項目点欄83a)には、各解答欄84についての配点情報が記入される。配点情報とは、教育用教材80における各解答欄84について、各位置の解答欄84への配点が何点であるかを特定するための情報である。なお、配点は、解答欄84ごとに異なっていてもよいし、あるいは一律であってもよい。また、配点欄83(特に集計欄83b)や解答欄84は、後述する抽出対象指定欄8cとしても利用し得るものである。
【0025】
このような教育用教材80は、対応する原本(教材原本)の電子データに基づき印刷装置で印刷出力することで得ることができる。教材原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
【0026】
なお、教材原本の電子データは、その教育用教材80における解答欄84や識別情報欄85などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
【0027】
教育現場では、図2(A)に示した文書原本8Aの一例である教育用教材80が生徒や受験者などに配布され、先ず、生徒などによって解答者情報欄86への氏名や解答欄84への解答などの第1種の付加情報が所定欄に記入された後に回収される。この後さらに、図2(B)に示す追記済文書8Bの一例である付加情報記入済教材81のように、教師などの採点官によって各解答欄84に記入された解答に対する採点記号(正誤判定図形)87や採点記号87と関連するその他の図形や文章で示されたコメント88などの第2種の付加情報が記入される。なお、追記情報処理装置10で自動採点処理を行なうので、この時点では、採点官による配点欄83Cへの記入はない。
【0028】
この際には、通常、生徒などによる第1種の付加情報の記入に使用されるペン色と、採点官などによる第2種の付加情報の記入に使用されるペン色とは、異なるものが使用されるし、教育用教材80として予め記入されている色とも異なるものが使用される。
【0029】
また、採点記号87としては、たとえば、正解を示す「○」やその他の図形(たとえば楕円図形)、不正解を示す「×」やその他の図形(たとえば「レ点」などのチェックマーク)、あるいは一部正解を示す「△」やその他の図形がある。
【0030】
コメント88は、採点記号87を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
【0031】
教材自動採点システムでは、この追記済文書8Bの一例である付加情報記入済教材81を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例では採点記号87とコメント88)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理として採点記号87を元にした自動採点処理を行なう。この自動採点処理結果として、たとえば、配点欄83Cへ記入する得点情報が取得されることになる。また、コメント88の追記内容を元にした自動採点処理結果とは別の第2のデータ処理を行なう。
【0032】
自動採点処理とは別の第2のデータ処理としては、たとえば、コメント88の追記内容を所定の条件に基づいて分類する処理や、分類したコメント(全ての追記内容には限らず一部の追記内容でもよい)を対応する解答欄84についての採点処理結果と関連付けて生徒指導用データベースに登録・蓄積しておく処理などを行なう。
【0033】
こうすることで、自動採点処理とは別の第2のデータ処理の利用形態としては、生徒指導用データベースから情報を取り出して、後の生徒指導に利用することができるようになる。たとえば、全ての採点結果と対応するコメントを表示するようにすれば、優秀、優、並、劣、などの評価の細分類と合わせて採点結果を確認することができる。また、結果が不正解のコメントのみを表示するようにすれば、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いなどの生徒の能力分析に利用することもできる。あるいは、コメント88で示されている注意文やミス修正に基づき生徒指導に利用することも考えられる。
【0034】
なお、採点記号87やコメント88を対象としたデータ処理を実行するための教育用教材80(原本画像)のデータベースへの登録に当たっては、採点記号87についてのデータ処理時に必要となる解答欄84の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38と、コメント88についてのデータ処理時に必要となる分類基準情報とを登録しておく。
【0035】
たとえば、図2(C)に示すように、記入欄位置領域情報38の一例である解答欄および採点欄位置領域情報を、教育用教材80上に存在する問題の番号と、その問題の解答に対する配点と、その問題の解答を記入する解答欄84として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)、また抽出対象指定欄8c(集計欄83b)として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
【0036】
なお、付加情報記入済教材81に対応する元の教育用教材80が文書管理サーバに登録されていないときには、無記入の教育用教材80を文書入力装置で読み取ることで対処してもよい。
【0037】
また、図3に示す第3例の文書は、ビジネスマンなどが使用するビジネス文書であって、典型例として、スケジュール管理用の手帳90を示している。一般的な手帳90では、日付(年月日)欄92と、各日付における予定97を記入する予定欄94を有しており、図3(A)はその文書原本8Aを示し、図3(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。なお、図3(A)では、予定97を記入するための予定欄94が日付単位で区分けされた例で示しているが、さらに、各日付内の時間(時刻)単位で区分けしたものもある。予定欄94は第1種の付加情報を記入する記入欄の一例であり、この予定欄94には、たとえば、該当日時に実行すべき予定97が記入され得るようになっている。なお、必要に応じて、抽出対象指定欄8c(詳細は後述する)を設けてもよい。
【0038】
このような手帳90は、市場で購入することができるし、あるいは対応する原本(手帳原本)の電子データに基づき印刷装置で印刷出力することで得ることもできる。手帳原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
【0039】
なお、手帳原本の電子データは、その手帳90における日付欄92や予定欄94などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
【0040】
ビジネス現場では、図3(A)に示した文書原本8Aの一例である手帳90を身近におき、先ず、所有者によって予定欄94への予定97(第1種の付加情報)が該当日時の予定欄94に記入される。このとき、さらに、図3(B)に示す追記済文書8Bの一例である付加情報記入済手帳91のように、所有者自らによって各予定欄94に記入された予定97に対する分類記号99(たとえば社用と私用の区別をするもの)や予定97と関連するその他の図形や文章で示されたコメント98などの第2種の付加情報が記入される。
【0041】
この際には、通常、手帳90で使用されている文字色と、予定97やコメント98の記入に使用するペン色とは、異なるものが使用される。
【0042】
分類記号99としては、たとえば、私用(Private use )を示す「P」やその他の文字・図形(たとえば◇マークなど)がある。私用にのみ分類記号99を付すことで、社用(Business use)については、特に分類記号99を付さなくてもよい。
【0043】
また、コメント98は、予定97を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
【0044】
分類記号99を含むコメント98は、一般的なビジネス文書における追記内容(付加情報記入済手帳91の例では予定97に相当)に対しての校正記号としての意味を持ち、このコメント98を利用することで、予定97を所定の条件に基づいて編集することができるようになる。
【0045】
たとえば、個人情報管理システムでは、この追記済文書8Bの一例である付加情報記入済手帳91を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例ではコメント98に基づく予定97の種類)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理とし予定97の内容を元にした自動スケジュール管理処理(予定97の電子データ化)を行ない、またコメント98の追記内容を元にした自動スケジュール管理処理そのものとは別の第2のデータ処理を行なう。
【0046】
自動スケジュール管理処理そのものとは別の第2のデータ処理としては、たとえば、コメント98(分類記号99を含む)の追記内容に従って、第1のデータ処理としての自動スケジュール管理処理結果を社用と私用とに分類する処理や、分類した予定97(全ての追記内容には限らず一部の追記内容でもよい)を対応する日付と関連付けてデータベースに個別に登録・蓄積しておく処理などを行なう。
【0047】
こうすることで、社用スケジュールと私用スケジュールをと切り分けてデータベース上で管理することができるようになる。それぞれのデータベースの公開と非公開とを個別に設定することができるようになるので使い勝手がよくなる。
【0048】
特開平5−216932号公報に記載の仕組みでは、予定欄94に記入された内容の全てについて単一の処理がなされ、この例では、仕事の予定もプライベートの予定も、全て区別無く1つのデータベースとして登録されることになる。このため、たとえば、仕事のスケジュールを公開・共有しようとしたときには、公開したくないプライベートの予定までもが公開されてしまう不都合が生じるのと大きく異なる。
【0049】
なお、予定97やコメント98を対象としたデータ処理を実行するための手帳90(原本画像)のデータベースへの登録に当たっては、予定97やコメント98についてのデータ処理時に必要となる予定欄94の位置情報、さらに抽出対象指定欄8cを設ける場合には、その抽出対象指定欄8cの位置情報などを示す記入欄位置領域情報38と、コメント98についてのデータ処理時に必要となる分類基準情報とを登録しておく。
【0050】
たとえば、図3(C)に示すように、記入欄位置領域情報38の一例である予定欄位置領域情報を、手帳90上に存在する日付(年月日)と、各日付内の時間(時刻)と、予定97を記入する予定欄94として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
【0051】
<追記情報の抽出処理;基本概念>
図4は、追記済文書8Bを処理対象として、文書原本8Aに記載済の情報に追加された追記情報を分離抽出する追記情報抽出処理手法を説明する図である。本実施形態においては、文書原本8Aに対しての追記情報の抽出は、追記に使用された追記部材(たとえば筆記具)の記入剤が持つ波長成分(たとえば赤の波長成分)に対応した情報(赤の情報)を検出することで行なう。この点は、処理対象における赤色のデータ領域を検出する赤領域検出手段を備える特許文献1に記載の仕組みと類似する。
【0052】
ただし、特許文献1に記載の仕組みでは、抽出しようとする波長成分が「赤色」に限定されているのに対して、本実施形態では、その波長成分を任意に設定できる点で異なる。つまり、抽出しようとする波長成分を、実際に追記処理時に使用する追記部材の記入剤(たとえばインクや鉛筆の芯など)が持つ波長成分と一致させることができるようにする点で大きく異なるのである。
【0053】
たとえば、可視光帯内での他の波長成分として、「緑色」や「青色」に注目した抽出も可能となるので緑色ペンや青色ペンを追記部材として使用することもできる。また、可視光帯外の波長成分を設定することもでき、たとえば「紫外線」や「赤外線」の波長領域に注目した抽出も可能となるので、いわゆる不可視ペンを追記部材として使用することもできる。
【0054】
また、追記処理時に使用される筆記具は様々であり、その記入剤が持つ波長成分は、一般概念として、たとえば「赤色」とはいっても、その範囲(該当する波長領域)は広く、ピンク系やオレンジ系など幅広いが、この場合でも、追記に使用される追記部材の記入剤が持つ波長成分を指定し、指定された波長成分に対応した情報を抽出することで、高精度の抽出処理を実現できる。つまり、抽出しようとする波長成分を実際に追記処理時に使用するペン色と一致させることで、データ処理用の追記情報(たとえば校正記号77、校正コメント78、採点記号87、コメント88、予定97、コメント98)を安定して抽出することができるようになる。
【0055】
たとえば、一般概念としての「赤色」の情報を抽出する場合、色空間(たとえばRGB色空間)上で最も赤らしいものを選択する。この際、「赤らしいもの」を抽出するために、色空間上に赤の抽出許容領域を設定し適合する画素を抽出する、すなわち設定した抽出許容領域内の画素は赤成分の画素であるとして抽出する。
【0056】
この際、一般概念として「赤」に属するピンク系やオレンジ系などの幅広い領域にある任意の「赤」のペンに対処しようとする場合、図4(A)に示すように、RGB色空間において、理想的な「赤」を起点として、比較的広い汎用領域を抽出許容領域に設定して抽出対象とする必要がある。抽出許容領域を狭くしてしまうと、理想的な「赤」から離れたピンク系やオレンジ系のペン色に対応できなくなるからである。
【0057】
たとえば、赤領域検出手段では、R,G,Bの各色画像データをそれぞれ個別に処理対象とし、先ず、「理想の赤」を抽出するべくRの色画像信号のみから成る画素を検出する。また、余裕を取るため、R,G,Bの各色画像信号の差分を検出し、Rの色画像信号に対して他のG,Bの各色画像信号が低レベルである画素を検出する。
【0058】
こうすることで、R軸上の画素データと、R軸方向のG,B成分に対してR成分がより強い範囲Aを赤領域として検出することになるが、ピンク系やオレンジ系などを考慮しようとすると、図4(A)に示すように、G軸方向やB軸方向に、広目の抽出許容領域(図中の点線で示す直方体領域)を設定しておかなければならない。この場合、実際に使用したペン色が図4(A)中のa点にあるときでも、カラー画像に存在するピンク系やオレンジ系などの画素成分をも、ペン色成分であるとして抽出してしまう。
【0059】
これに対して、追記に使用される追記部材の記入剤が持つ波長成分を特定すれば、図4(B)に示すように、余裕を取る場合でも、G軸方向やB軸方向を狭く設定することができるし、R軸方向も狭く設定することができ、全体の抽出許容領域(図中の点線で示す直方体領域)を実情に即して狭い領域(実用領域)にすることができる。
【0060】
これにより、たとえば、追記に使用されるペン色が図4(B)中のb点にあるとき、カラー画像に存在するピンク系からオレンジ系までの画素成分と、このb点の画素成分(つまり実際のペン色成分)とを精度よく区別して抽出することができる。特定した追記部材の追記色により記入された追記情報の抽出を高精度に行なうことができるようになる。
【0061】
このように、本実施形態の仕組みによれば、カラー対応の画像データに基づいてペン色成分データを検出する際、抽出許容範囲を実際に即して狭くすることで、ペン色成分の分離が容易に、しかも確実に行なうことができ、信頼性の高い追記情報抽出を実現できる。結果として、信頼性の高いデータ処理(たとえば自動採点処理)を実現できる。
【0062】
<追記情報の抽出処理;波長成分の特定方法>
図5〜図8は、追記に使用される追記部材の記入剤が持つ波長成分(追記色)を特定する各種の方法を説明する図である。ここで、図5は、特定処理時に注目する追記情報の記載箇所の一例を説明する図である。また、図6〜図8は、追記色特定処理の具体例を説明する図である。
【0063】
なお、本実施形態の自動採点処理においては、教師が合計点を集計欄83bの合計点欄内に記入することを前提とする。正誤を記録しておくことで、後の生徒指導に利用する、という点が自動採点システムの目的になる。
【0064】
本実施形態においては、先ず、テータ処理対象の追記情報の記入に使用される追記部材の記入剤が持つ波長成分(以下特定色ともいう)を特定し、この特定した特定色(追記色)に注目して追記情報の抽出(特定色抽出ともいう)を実行するが、その特定色の特定方法としては様々な手法を採ることが考えられる。
【0065】
たとえば、RGB色空間上で使用ペン色の領域を定義し(以下色領域定義するともいう)、その色領域定義した領域に適合する画素を抽出するのであるが、この際、1点のみの成分を抽出するのでは、信号処理ばら付きに対応できないので、その指定された特定色に近い成分を抽出する。たとえば、付加情報記入済教材81を処理対象とする場合には、採点に使用する赤色ペンの色を特定し、それに近い赤を抽出する。
【0066】
また、抽出対象の追記部材の記入剤の波長成分(たとえば使用ペン色)の特定に際しては、たとえば、予め、追記者ごとに使用する追記部材を登録しておく第1の方法が考えられる。あるいは、追記済文書8Bと文書原本8Aとの比較(差分抽出処理)結果として得られる差分情報9について波長分布(色分布と等価)を解析し、その解析結果に基づいて実際に使用されている記入剤の波長成分を特定する第2の方法も考えられる。
【0067】
また、テータ処理対象の追記情報の記入に使用された特定色を特定した後には、さらに、各種の追記画像から特定色に関する情報のみを抽出することで、テータ処理対象の追記情報とそれ以外の追記情報とを区別する。この際には、スキャン画像上の画素ごとに、特定された追記色との近さが一定以内であれば抽出する。
【0068】
また、抽出対象の追記部材の記入剤の波長成分(たとえば使用ペン色)の特定に際しては、処理対象の追記済文書において所定の規則に基づいた位置に追記部材によって追記された付加情報の記入剤の波長成分を特定する第3の方法も考えられる。たとえば、「文書内の一番上あるいは下」などの相対位置による追記部分の抽出を行なうのが一例である。
【0069】
ここで、追記色を特定する第1の方法における登録方法としては、処理対象文書中の何れかの箇所に抽出対象指定欄8cを用意し、この抽出対象指定欄8cに追記部材で何らかの追記情報を記入する方法が考えられる。こうすることで、抽出対象指定欄8cに記入された追記情報と同じ色成分の画素を抽出することができる。
【0070】
追記色を特定するに当たり、解析対象範囲を抽出対象指定欄8cに絞っておくことで、特定精度を向上させることができる。たとえば、追記済文書8Bがカラー画像を持つ文書であっても、カラー画像の影響を受けない部分に抽出対象指定欄8cを設けることで、高精度に追記色を特定できる。
【0071】
ここで、抽出対象指定欄8cとしては、データ処理の対象となる追記情報など、他の情報を一切記載しておかないようにした空欄にし、追記色特定用の追記情報のみを記入するようにした専用の特別な欄を用意してもよいし、データ処理の対象となる追記情報など、他の追記情報を記入するための欄を兼用してもよい。
【0072】
専用の抽出対象指定欄8cを使用すれば、そこには追記色特定用の追記情報のみが記入されるので、他の追記情報の記入欄と兼用する態様に比べて、追記色の特定精度を高くすることができる。
【0073】
専用の抽出対象指定欄8cを用意する場合には、たとえば、図5(A)に示すように文書原本8A(つまり追記済文書8B)そのものに抽出対象指定欄8cを用意してもよいし、図5(B)に示すように文書原本8A(追記済文書8B)とは別にスキャン時用のフェースシート(作業指示書)8Dを用意し、このフェースシート8Dに抽出対象指定欄8cを用意するようにしてもよい。
【0074】
フェースシート8Dのように、処理対象の追記済文書8Bに対応する文書原本8Aとは別の用紙を使用することで、たとえば白紙用紙上に抽出対象指定欄8cを設けるなど、追記色特定時に、文書原本8A(追記済文書8B)に記載済の文字や画像の影響を一切受けないようにすることが容易になる。一方、処理対象の追記済文書8Bに対応する文書原本8Aそのものに抽出対象指定欄8cを設ける場合、別の用紙を使う必要がない利点があるものの、記載済の文字や画像の影響を受けないようにするには、文字や画像が記載されていない位置を探して抽出対象指定欄8cを設ける必要が生じる。
【0075】
一方、兼用する場合には、たとえば、教育用教材80であれば、図5(C)に示すように、集計欄83bの部分点欄や合計点欄を抽出対象指定欄8cとして利用することができるし、あるいは、図5(D)に示すように、解答欄84を抽出対象指定欄8cとして利用することもできる。解答欄84を抽出対象指定欄8cとして利用する場合、その解答欄84中に追記された生徒による解答のペン色ではなく、採点記号87のペン色と同じ色成分の画素を抽出するようにすればよい。
【0076】
専用の特別な欄を用意する態様(図5(A),(B))や集計欄83bを兼用する態様では、その欄には採点記号87やコメント88用のペン色以外の色成分が存在する可能性が少なく、高精度の抽出が期待できる。なお、特別な欄を用意する態様は記入者に確実に記入を促すことができ、集計欄83bを兼用する態様では特別な欄のためのスペースや余分な作業を必要としないが、記入者によっては集計結果を欄外に書く可能性もある。一方、解答欄84を兼用する態様では、その欄には採点記号87やコメント88用のペン色の他に生徒による解答のペン色も存在するので、その両者を切り分ける処理が必要となる。
【0077】
たとえば、図6は、付加情報記入済教材81を処理対象とし、かつ集計欄83bの合計点欄内に記入されているペン色(たとえば赤色)を参考に、データ処理対象の全ての追記情報(採点記号87およびコメント88)を抽出する追記色特定処理の具体例(その1)を説明する図である。
【0078】
先ず、付加情報記入済教材81ごとに、記入欄位置領域情報38(図2(C))にて示したように合計点記入欄の位置を予め登録しておく(S10)。1枚目の付加情報記入済教材81としての生徒答案画像が入力されたら、合計点記入欄(図6(A)を参照)内の画素値について統計解析を行なう(S12)。具体的には、処理対象画像について、RGB色空間やLab色空間などの所定の色空間上でヒストグラム解析をする。
【0079】
通常、ヒストグラム上で、最も頻度の多い画素値を呈するのは追記済文書8B(用紙)の地肌色となる。そこで、合計点記入欄内の画素値のうち、最も頻度の多い画素値を呈する用紙以外の色で、最も頻度の多い画素値を、全ての付加情報記入済教材81(生徒答案セット)の追記色とする(S14)。つまり、地肌成分以外で、最も頻度の多い画素値を呈する波長成分(本例では色成分と等価)を追記色とする。そして、実際に使用された追記色を特定した後は、それを元に、採点記号87やコメント88を抽出する際の抽出許容範囲を決定することで色領域定義を行なう(S16)。
【0080】
この後、追記色と判定した色領域に属する画素成分のみを抽出することで、データ処理対象の追記情報とその他の追記情報とを分離して抽出する(S18)。
【0081】
なお、ここでは1枚目の解析結果に基づいて採点記号87やコメント88の記入に使用された追記色を特定することで、残りの付加情報記入済教材81についても、同じ追記色であるとしたが、付加情報記入済教材81ごとに、使用されたペン色(追記色)を特定するようにしてもよい。
【0082】
また、図7は、校正情報記入済文書71を処理対象とし、さらに編集者リスト欄75を抽出対象指定欄8cとして兼用し、かつこの編集者リスト欄75に記入されたチェックマークの色を参考に、データ処理対象の全ての追記情報(校正記号77および校正コメント78)を抽出する追記色特定処理の具体例(その2)を説明する図である。
【0083】
ここでは、校正者(記入者)ごとに、それぞれ異なるペン色の校正ペンで編集対象文書70に対して校正作業を行なうことにより校正情報記入済文書71が得られるものとする。そして、校正記号77および校正コメント78を付した校正情報記入済文書71を読み取る前に、図7(A)に示すように、編集者リスト欄75のチェック欄75aに、校正者(記入者)ごとに、自分の名前の横に各人が使用した校正ペンでチェックマークを付しておく(S20)。
【0084】
次に、前述のステップS12のようにして、編集者リスト欄75のチェック欄75aの画素値(RGBデータ)の統計を取ることで、処理対象画像のヒストグラム解析を行なう(S22)。通常、ヒストグラム上は、最も頻度の多い画素値を呈するのは用紙の色となる。そこで、校正者ごとに、編集者リスト欄75内の画素値のうち、最も頻度の多い画素値を呈する用紙以外の色で、最も頻度の多い画素値を、その校正者のペン色とする(S24)。
【0085】
記入者全員のペン色を特定した後、それを元に、各校正者の校正記号77や校正コメント78を抽出する際の抽出許容範囲を決定することで、その校正者についての色領域定義を行なう(S26)。
【0086】
この後、追記色と判定した色領域に属する画素成分のみを抽出することで、注目する校正者(編集者)による校正記号77や校正コメント78を分離して抽出する(S28)。
【0087】
このように、校正者別に色領域定義を行なうことにより、校正者ごとに校正記号77や校正コメント78をチェックすることができるようになる。
【0088】
また、図8は、追記色を特定する第2の方法において、追記済文書8Bと文書原本8Aとの差分抽出処理結果として得られる差分情報9について色分布を解析することで追記色を特定する追記色特定処理の具体例(その3)を説明する図である。
【0089】
先ず、図8(A)に示すように、文書原本8Aと追記済文書8Bとを比較して、両者の差分を取ることで差分情報9を得る(S30)。
【0090】
この後、差分情報9について色分布を解析するに当たっては、先ず、差分情報9の画素値の統計解析を行なう(S32)。具体的には、差分情報9について、たとえばRGB色空間やLab色空間などの所定の色空間上でヒストグラム解析をする。
【0091】
差分情報9においては、文書原本8Aに対して追記された情報のみが抽出されているので、図6や図7の場合とは異なり、既に、用紙の色(地肌色)に関する情報は差分情報9から除外されている。一方、種類を問わず全ての追記情報が差分情報9には含まれる。
【0092】
たとえば、付加情報記入済教材81を処理対象とする場合であれば、採点官による採点記号87やコメント88の他に、生徒による解答欄84に記入された解答や解答者情報欄86に記入された解答者の情報も差分情報9には含まれる。この場合でも、生徒が使用したペン色と採点官が使用したペン色とが異なれば、ヒストグラム解析を行なうと、その両者を区別することができる。
【0093】
また、それぞれ異なる色の校正ペンを使用して複数の校正者によって校正作業がなされた校正情報記入済文書71を処理対象とする場合であれば、各人の校正記号77や校正コメント78が差分情報9には含まれる。この場合でも、各校正者が使用したペン色が異なるので、ヒストグラム解析を行なうと、それぞれを区別することができる。
【0094】
そこで、差分情報9についての画素値のうち、注目すべきペン色と思われる方の波長成分(色成分)をそれぞれの追記色と判定する(S34)。そして、注目すべき(実際に使用された)追記色を特定した後は、それを元に、校正記号77や校正コメント78を抽出する際の抽出許容範囲を決定することで色領域定義を行なう(S36)。
【0095】
この後、追記色と判定した色領域に属する画素成分のみを抽出することで、注目する校正者(編集者)による校正記号77や校正コメント78を分離して抽出する(S38)。
【0096】
たとえば、生徒が使用する筆記具が黒鉛筆や青色ペンで、採点官が使用する筆記具が赤色ペンであれば、ヒストグラム上は黒色領域と青色領域と赤色領域とに分離でき、赤色領域に属する画素成分のみを抽出することで、採点記号87やコメント88のみのデータ処理対象の追記情報と、その他の追記情報とを分離して抽出することができる。
【0097】
また、各校正者が使用する筆記具が、黒鉛筆、青色ペン、赤色ペンであれば、ヒストグラム上は黒色領域と青色領域と赤色領域とに分離でき、赤色領域に属する画素成分のみを抽出することで、黒鉛筆を使用した校正者によって追記された校正記号77や校正コメント78のみの追記情報と、青色ペンを使用した校正者によって追記された校正記号77や校正コメント78のみの追記情報と、赤色ペンを使用した校正者によって追記された校正記号77や校正コメント78のみの追記情報とを、それぞれ分離して抽出することができる。
【0098】
なお、校正者を問わず単一の色の校正ペンを使用して校正作業がなされた校正情報記入済文書71を処理対象とする場合であれば、ヒストグラム解析を行なうと、頻度が1点に集中する。この場合、その頻度が多いものの色成分を追記色と判定すればよい(S34)。そして、追記色と判定した領域に属する画素成分のみを抽出することで、データ処理対象の追記情報とその他の追記情報とを分離して抽出することができる(S38)。
【0099】
また、付加情報記入済手帳91を処理対象とする場合において、様々な色のペンで予定97やコメント98が記入されている場合、使用されたペン色に対応する予定97、コメント98が差分情報9には含まれ、ヒストグラム解析を行なうと、それぞれを区別することができる。
【0100】
したがって、ペン色を区別した抽出が必要であれば、注目すべきペン色と思われる方の色成分をそれぞれの追記色と判定する(S34)。そして、追記色と判定した領域に属する画素成分のみを抽出することで、データ処理対象の追記情報とその他の追記情報とを分離して抽出する(S38)。また、特段の区別が不要であれば、全てを注目すべき追記色と判定すればよい。たとえば、社用の予定97と私用の予定97とを異なるペン色で記入しておけば、分別用のコメント98(本例では分類記号99)を使用しなくても、両者を区別した自動スケジューリング処理ができるようになる。
【0101】
なお、追記情報について自動データ処理を実行する際に、追記情報を複数種類のものに分類し、それぞれの分類ごとに個別のデータ処理を実行しようとする場合には、各追記情報を他方のものと分離して認識・特定することが必要となる。両者の分離認識が適正になされないと、それぞれのデータ処理を適正に実行することができなくなる。
【0102】
たとえば、図2に示した付加情報記入済教材81の場合には、採点記号87に基づく自動採点処理と、コメント88に基づく生徒指導用データベースの構築処理があり、このような個別処理を実現するには、採点記号87とコメント88とを区別して認識処理などを行なってから最終的なデータ処理を行なう必要がある。
【0103】
一方、答案の採点においては、採点記号87以外のコメント88を、採点記号87と同じペンで記載することがあり、たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した認識と記載内容の特定ができない。採点記号87とコメント88とを適切に分離できず、自動採点処理に悪影響を及ぼす。また、追記情報としては、自動採点処理用の採点記号87の他に、生徒指導などにも利用し得るコメント88が存在するにも関わらず、付加情報記入済教材81を生徒に返却した後には、生徒がその記載内容を確認する以外には活用できない事態となる。
【0104】
また、図3に示した付加情報記入済手帳91の場合には、予定97に基づく自動スケジュール管理処理(予定97の電子データ化)と、コメント98(分類記号99を含む)に基づく社用スケジュールと私用スケジュールの個別データベース構築処理があり、このような個別処理を実現するには、予定欄94に記入された予定97とコメント98とを区別して抽出し、認識処理などを行なってから最終的なデータ処理を行なう必要がある。
【0105】
一方、記入されたスケジュールの電子データ化とデータベースへの登録においては、予定97以外のコメント98を予定97と同じペンで記載することがあるし、また、各予定97を記入する時点が異なることも起こり得る、つまり、予定97の記入に使用されるペン色は様々であり、かつ予定97とコメント98とを切り分けて別のペン色が使用されるとは限らない。この場合、たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した抽出ができない。
【0106】
このような事態を避けるには、たとえば、追記済文書8B中に存在する複数の付加情報を、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の種類に分類(分離)するようにするのがよい。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにするのがよい。なお、これらについては詳細な説明を割愛する。
【0107】
<システム構成>
図9は、本発明に係る追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例を示す図である。なお、この情報処理システムは、答案用紙などの教育用教材80を処理対象とする教材自動採点システムへの適用例で示す。
【0108】
図示のように、教材自動採点システム1は、システムの中心をなす追記情報処理装置10と、追記情報処理装置10に処理対象文書である付加情報記入済教材81を電子化して入力する文書入力装置20と、処理対象文書である付加情報記入済教材81に対応する教育用教材80(詳しくはその原本画像)の電子データを記憶する文書管理サーバ30と、情報処理(本例では自動採点処理など)の結果を保存しておく処理結果保存サーバ40とが、有線や無線を利用してネットワーク接続されて構成されている。
【0109】
文書入力装置20は、教育用教材80における解答欄84への解答記入、解答者情報欄86への氏名などの記入および解答欄84に記入された解答に対する採点官による採点記号87(具体的には、たとえば「○」や「×」の図形)の記入がされた付加情報記入済教材81に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済教材81から画像データを得るものである。
【0110】
文書入力装置20は、処理対象文書である付加情報記入済教材81を電子データにする機能を備えたものであればよく、たとえば、画像読取装置としての機能を有した複写機、複合機、またはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder ;ADF)が付設されていると、複数の教育用教材に対する画像読取りを連続的に行なうことができ便利である。
【0111】
なお、教育用教材80を利用した試験などは、紙媒体を用いることに限定されない。たとえばタブレット型のPCを利用して試験を行ない採点するケースでは、最初から付加情報記入済教材81を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置20が不要となる。
【0112】
文書管理サーバ30は、付加情報記入済教材81に対応する教育用教材80の原本画像と、この原本画像を特定するための、たとえば、科目、タイトル、適用学年などの識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に登録している。
【0113】
また、文書管理サーバ30は、付加情報記入済教材81に対応する元の教育用教材80(原本画像)を保存するとともに、採点記号87やコメント88についてのデータ処理時に必要となる解答欄の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38を、図2(C)に示したように、テーブル形式で、所定の格納領域に保持蓄積している。
【0114】
処理結果保存サーバ40としては、追記情報処理装置10とネットワーク接続され、付加情報記入済教材81についての自動採点集計結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。
【0115】
教材自動採点システム1の中心部をなす追記情報処理装置10は、文書入力装置20から入力された付加情報記入済教材81の画像データに基づき所定の信号処理を行なう読取画像処理部110と、読取画像処理部110による処理に基づいて文書入力装置20から入力された読取画像の元となった文書原本8Aを識別特定する文書原本特定部120とを備えている。教材自動採点システム1においては、文書原本特定部120は、文書原本8Aの一例である教育用教材80を特定する教材特定部122として機能する。
【0116】
また、追記情報処理装置10は、読取画像処理部110による処理が施された画像データから追記情報(アノテーション)を抽出する追記情報抽出部130と、追記情報抽出部130により抽出されたデータ処理対象の追記情報に基づき記載内容や記入位置を認識し特定するデータ処理対象追記情報特定処理部150と、データ処理対象追記情報特定処理部150により特定された追記情報の記載内容に基づいてデータ処理を行なうデータ処理部170とを備えている。
【0117】
読取画像処理部110は、文書入力装置20から入力された画像データについて、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識などの公知の画像処理技術(それぞれの詳細説明は割愛する)を利用して解析処理を行なう画像データ解析部112と、文書入力装置20から入力された画像データの傾きや主走査方向または副走査方向の拡縮率などの画像歪みを補正する歪み補正部114とを有している。なお、歪み補正部114は、文書入力装置20から入力された画像データと、比較対象となる文書管理サーバ30内の対応する原本画像とを比較照合し、その画像歪み(傾き、拡縮など)を補正してもよい。
【0118】
教材特定部122は、たとえば、画像データ解析部112によるデータ解析結果に基づいて、識別情報欄85に記入されている科目、タイトル、あるいは適用学年などの識別情報を解析する識別情報解析部123と、同じく識別情報欄85に埋め込まれている教育用教材80を特定するコード情報を解析するコード情報解析部124とを有している。
【0119】
教材特定部122は、画像データ解析部112での解析結果に基づいて特定した、たとえば科目、タイトル、適用学年などの識別情報や識別コードと、文書管理サーバ30に保持蓄積されている教育用教材80の原本画像の情報(たとえば科目、タイトル、適用学年などの識別情報や識別コード)とを照らし合わせ、該当する原本画像が文書管理サーバ30に保持蓄積されていなければ、文書入力装置20で得られた画像データとの比較対象となる電子データを特定できないと判定して、識別特定エラー信号を出力するようになっている。
【0120】
なお、教材特定部122は、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)と対応する元の教育用教材80を識別特定できればよく、識別情報解析部123とコード情報解析部124とは、付加情報記入済教材81の識別情報欄85に記載もしくは埋め込まれている識別情報の形式に対応する適正な方を備えていればよく、必ずしも、両者を備えている必要はない。
【0121】
追記情報抽出部130は、歪み補正部114にて画像歪みが補正された画像データと、教材特定部122により特定された、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)に対応する原本画像(教育用教材80に相当)とを公知の画像処理技術を利用して比較しそれぞれの間の差分を抽出する差分抽出部132を有する。
【0122】
また、追記情報抽出部130は、差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報(第1種の付加情報の一例)を抽出する解答者抽出部134と、同じく差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における採点記号87やコメント88などのデータ処理に供される第2種の付加情報を抽出するデータ処理用追記情報抽出処理部140とを有する。
【0123】
解答者抽出部134は、差分抽出部132による抽出結果に基づき、解答者情報欄86の学級88aや出席番号88bや氏名88cの欄に記入された解答記入者の手書きによる番号や文字の画像をそのまま文字情報として切り出す手書き情報切出部136と、差分抽出部132による抽出結果に基づき(好ましくは、手書き情報切出部136により切り出された手書き情報について)、解答者情報欄86の手書きによる記入情報を、追記情報処理装置10上で加工編集が可能な文字データに変換する文字認識処理(OCR;Optical Character Reader)部138とを有する。
【0124】
なお、解答者抽出部134は、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報欄86に記入された解答者情報を抽出できればよく、手書き情報切出部136と文字認識処理部138の何れか一方を備えていればよい。また、文字認識処理部138を設けない場合や文字認識処理部138で文字認識できなかったコメント88の部分に関しては、抽出された解答者情報をそのまま画像として取り扱うことにする。
【0125】
データ処理用追記情報抽出処理部140は、追記済文書8B中に存在するデータ処理対象の付加情報の記入に使用された追記部材の記入剤の波長成分を特定する追記部材特定部141と、追記部材特定部141により特定された追記色の情報を参照して、差分抽出部132による抽出結果に基づき、追記情報抽出部130により抽出された追記情報の内、文書入力装置20で読取り対象となった追記済文書8B(本例では付加情報記入済教材81)におけるデータ処理の対象となる追記情報(本例では採点記号87やコメント88)を抽出するデータ処理対象追記情報抽出部142と、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報をデータ処理に耐え得るように整形する追記情報整形部146とを有する。本実施形態においては、データ処理対象追記情報抽出部142は、採点記号87を抽出する採点記号抽出部およびコメント88を抽出するコメント抽出部の機能を備える。
【0126】
なお、データ処理対象追記情報抽出部142は、データ処理対象の追記情報(本例では採点記号87やコメント88)を抽出できればよく、色を指標に追記情報をさらに分類するとよい。たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、採点官が採点記号87やコメント88の記入に使用したペン色と対応する所定色成分についてのものを抽出することで行なえばよい。たとえば、付加情報記入済教材81における採点記号87やコメント88の記入は、一般に赤色ペン(赤の筆記具)で行なわれることが多く、この場合には、赤色成分に注目した抽出を行なえばよい。
【0127】
ただし、赤色ペンとはいってもピンク系やオレンジ系というように似通った色気のものがあるし、必ずしも採点記号87やコメント88の記入に赤色ペンを使用するとは限らないし、採点記号87とコメント88とを別のペン色で記入することもあるので、採点記号87やコメント88の記入に使用するペン色の情報を採点記号抽出部やコメント抽出部として機能するデータ処理対象追記情報抽出部142に設定可能に構成しておくことで、抽出性能を向上させるようにするとよい。
【0128】
このため、本実施形態では、先ず、追記部材特定部141は、前述の追記色を特定する第1、第2、もしくは第3の方法を適用して、実際に使用した追記色を特定し、その特定した追記色の情報をデータ処理対象追記情報抽出部142に通知する。つまり、追記部材特定部141は、データ処理の対象となる追記情報の記入に使用されたペン色である追記色を特定する追記色特定部として機能する。データ処理対象追記情報抽出部142は、追記部材特定部141から通知された追記色の情報を参照して、追記色に注目した抽出を行なう。
【0129】
この際、実際に使用されたペン色が追記部材特定部141で特定されているので、データ処理対象追記情報抽出部142は、単に赤色成分に注目した場合よりも抽出許容範囲を狭くすることができる。これにより、採点記号87やコメント88を、その他の追記情報と高精度に区別して抽出することができる。
【0130】
追記情報整形部146は、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報について、線分同士を接続してその抽出線分間の途切れを解消するように補正処理を行なう抽出線分途切れ補正部148を有する。
【0131】
一般に、追記済文書8B上での図形記入や「2重線」や「波線」や「花丸」や「矢印」などの図形記入やコメント文などは、記入済のものに対して重ねて行なわれることもある。たとえば、付加情報記入済教材81の場合には、各問題文82や各解答欄84を特定する枠や各解答欄84への解答記入内容などに重ねて「○」や「×」などの採点記号87が記入され、あるいは図形や文字でコメント88の追記が行なわれることもある。そのため、データ処理対象追記情報抽出部142による所定色成分の抽出結果は、その重なり部分が除かれる結果、図形や文字に途切れ部分が生じたものとなる虞がある。
【0132】
このことから、抽出線分途切れ補正部148は、「○」や「×」や「線」やその他の印(マーク)などの図形や文字であるはずの抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理(いわゆる連結処理)、あるいは線図形の直線近似などを適宜実行する。なお、このときに行なう細線化処理、端点抽出処理、あるいは端点間接続処理や線図形の直線近似などは、公知技術を利用して行なえばよいため、ここではその詳細な説明を割愛する(たとえば、「画像の処理と認識」,安居院猛著,昭晃堂発行などを参照)。
【0133】
データ処理対象追記情報特定処理部150は、差分抽出部132による差分抽出結果に基づいて、具体的には、抽出線分途切れ補正部148で補正されたデータ処理対象追記情報に基づいて、追記済文書8Bにおける第1のデータ処理用の追記情報の記入内容を第2のデータ処理用の追記情報と分離して認識する第1データ処理用追記情報認識部154と第2のデータ処理用の追記情報の記入内容を第1のデータ処理用の追記情報と分離して認識する第2データ処理用追記情報認識部164とを有している。
【0134】
データ処理対象追記情報特定処理部150としては、第1データ処理用追記情報認識部154は、付加情報記入済教材81における採点記号87の記入内容をコメント88と分離して認識し、また、第2データ処理用追記情報認識部164は、付加情報記入済教材81におけるコメント88の記入内容を採点記号87と分離して認識する。
【0135】
各データ処理用追記情報認識部154,164は、抽出線分途切れ補正部148で補正されたデータ処理用追記情報の記入内容に対して形状認識処理を行なうことでデータ処理用追記情報の記入内容を認識する図形形状認識部156,166と、抽出線分途切れ補正部148で補正されたデータ処理用追記情報の記入内容に対して文字認識処理を行なうことでデータ処理用追記情報の記入内容を認識するする文字認識部157,167と、図形形状認識部156,166や文字認識処理部157,167により認識された各データ処理用追記情報の記入内容の、文書原本8A(追記済文書8B)上における記入位置を認識する記入位置認識部158,168とを有している。図形形状認識部156,166および文字認識処理部157,167により、採点記号87とコメント88とを分離して認識する分離認識処理部155が構成される。
【0136】
文字認識処理部157,167を設けない場合や文字認識処理部157,167で文字認識できなかったデータ処理用追記情報の部分に関しては、抽出されたデータ処理用追記情報をそのまま画像として取り扱うことにする。
【0137】
なお、図示のように、図形形状認識部156,166、文字認識処理部157,167、並びに記入位置認識部158,168とは、それぞれ1つの機能部が双方の機能を実現する構成としてもよいし、それぞれを個別の機能部として独立に設けてもよい。
【0138】
たとえば、付加情報記入済教材81を処理対象とする構成においては、第1データ処理用追記情報認識部154は、採点記号87を第1のデータ処理用の追記情報とするものであり採点記号認識部として機能する。この場合、採点記号87についての図形形状認識部156は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを図形の側面から認識することができればよく、たとえば「○」,「×」,「△」の図形形状とのパターンマッチングによって形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識してもよい。特徴量としては、たとえば、穴の個数や外接矩形に占める対象図形の面積率などを使用することができる。
【0139】
また、採点記号87について文字認識処理部157は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを文字の側面から認識することができればよい。なお、採点記号87は図形のみであるとする場合には、文字認識処理部157を割愛することもできる。
【0140】
また、採点記号87についての記入位置認識部158は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上の採点記号87の記入内容の記入位置を認識すればよい。
【0141】
なお、図形形状認識部156は、採点記号87に関する形状認識の際には、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部158による位置認識の際にも、そのラベリング処理の結果を利用して、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
【0142】
また、記入位置認識部158は、採点記号87の記入位置の認識処理に当たって、付加情報記入済教材81上に複数の採点記号87が記入されていることが一般的であるから、その複数の採点記号87のそれぞれについて順次予め定められた走査順で検出される採点記号87について、順にその位置を認識していく。
【0143】
各採点記号87に関する位置認識は、たとえば「○」や「×」などの採点記号87を示す図形(あるいは文字)の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる図形もしくは文字(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわち採点記号87の記入位置の認識結果とする。
【0144】
一方、第2データ処理用追記情報認識部164は、コメント88を第2のデータ処理用の追記情報とするコメント認識部として機能する。この場合、コメント88についての図形形状認識部166は、コメント88の追記内容を図形の側面から認識することができればよく、たとえば「1重線」や「2重線」や「(1重または2重の)波線」などの線を示す図形形状とのパターンマッチングによって線に関する形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から線の形状を認識してもよい。特徴量としては、たとえば、線数や外接矩形内の画素密度などを使用することができる。
【0145】
また、コメント88について文字認識処理部167は、付加情報記入済教材81におけるコメント88の記入内容を文字の側面から認識することができればよい。また、コメント88についての記入位置認識部168は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上のコメント88の追記内容の記入位置を認識すればよい。
【0146】
なお、図形形状認識部166は、コメント88に関する形状認識の際には、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部168による位置認識の際にも、そのラベリング処理の結果を利用して、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
【0147】
また、記入位置認識部168は、コメント88の記入位置の認識処理に当たって、付加情報記入済教材81上に複数のコメント88が記入されていることが一般的であるから、その複数のコメント88のそれぞれについて順次予め定められた走査順で検出されるコメント88について、順にその位置を認識していく。
【0148】
各コメント88に関する位置認識は、たとえばコメント文や「2重線」や「花丸」などのコメント88の文字や図形の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる文字や図形(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわちコメント88の記入位置の認識結果とする。
【0149】
また、この位置認識の際には、各コメント88は、ある位置の解答欄84への採点記号87と対応して、その近傍に記入されることが多いので、記入位置認識部158による採点記号87についての位置認識と協働して処理を行なうのがよい。こうすることで、双方の位置情報の各解答欄84との対応付け、結果としては、採点記号87とコメント88との関連付けが容易になる。
【0150】
データ処理部170は、文書入力装置20から入力された追記済文書8Bの画像データについて、その追記済文書8Bに記入された第1のデータ処理対象追記情報に関する第1のデータ処理を実行する第1データ処理部170_1と、第2のデータ処理対象追記情報に関する第2のデータ処理を実行する第2データ処理部170_2を有する。
【0151】
第1データ処理部170_1は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入された採点記号87を元に採点集計を行なう採点集計部172と、採点集計部172による採点集計の結果を、解答者抽出部134が抽出した解答者情報と関連付けて出力する集計結果出力部174とを備えている。採点集計結果と解答者情報とが関連付けられた状態の処理結果を特に採点認識結果と称する。
【0152】
採点集計部172は、図形形状認識部156による採点記号87の追記内容の図形の側面からの認識結果や文字認識処理部157による採点記号87の追記内容の文字情報の側面からの認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書入力装置20が保持蓄積している付加情報記入済教材81に対応する教育用教材80の電子データ(原本画像)に含まれる教育用教材80(付加情報記入済教材81)の各解答欄84についての配点欄83で規定されている配点情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、付加情報記入済教材81に記入された採点記号87に関する採点処理および集計処理(纏めて採点集計という)を行なう。
【0153】
なお、採点記号87の記入は、一般に教育用教材80上の複数の解答欄84のそれぞれに対応して行なわれ、かつ教師などの採点官によって手書きでされるため、各解答欄84に対する記入位置が必ずしも一義的に定まっている訳ではない。その一方で、採点記号87の採点集計に当たっては、各解答欄84と採点記号87の記入位置との対応を明確にする必要がある。採点記号87に関する採点集計は、各解答欄84に対応する採点記号87の記入結果を明確にした上で、採点記号87の内容(正解か不正解か一部正解かなど)および各解答欄84についての配点に基づいて行なわれるからである。
【0154】
このことから、採点集計部172は、以下に述べるような手順で、採点記号87の採点集計を行なう。すなわち、採点集計部172は、「○」や「×」などの採点記号87の外接矩形と、付加情報記入済教材81上で解答欄84となる領域との重なり面積を求め、その面積(外接矩形に対する面積比でも同様)が最も大きくなる採点記号87と解答欄84とを互いに対応付け、その採点記号87を解答欄84に対して記入された採点記号87の判定結果とする。ただし、重なり面積の外接矩形に対する比が所定閾値未満の場合には、重なる部分が小さいことから、対応付けについての判定が不能であると判断する。
【0155】
そして、対応付けを行なった後は、採点記号87が「○」であれば、これに対応する解答欄84についての配点情報から特定される配点を加算し、また採点記号87が「×」であれば、これに対応する解答欄84についての配点加算を行なわず、このような採点集計を付加情報記入済教材81上の全ての解答欄84について行なう。
【0156】
なお、付加情報記入済教材81上で解答欄84となる領域は、各解答欄84についての配点情報として、または当該配点情報と同様に、付加情報記入済教材81に対応する文書管理サーバ30に登録されている原本画像に含まれる記入欄位置領域情報38によって特定されるものとする。
【0157】
集計結果出力部174は、採点集計部172により集計された採点集計結果と解答者抽出部134が抽出した解答者情報と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。あるいは、採点結果の点数を付加情報記入済教材81の集計欄83bに記入し用紙上に返却答案81bとして出力して生徒などに返却できるようにする。
【0158】
また、第2データ処理部170_2は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入されたコメント88を元に分類処理を行なうコメント分類処理部176と、コメント分類処理部176による分類結果を集計結果出力部174が出力した採点認識結果や各解答に関連付けて出力するコメント処理結果出力部178とを備えている。
【0159】
コメント分類処理部176は、図形形状認識部166によるコメント88の追記内容の図形の側面からの認識結果や文字認識処理部167によるコメント88の追記内容の文字情報の側面からの認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、コメント88の追記内容と対応するように予め規定されている分類情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、その付加情報記入済教材81に記入されたコメント88の分類処理を行なう。
【0160】
コメント処理結果出力部178は、コメント分類処理部176による分類結果を各解答欄や集計結果出力部174が出力した採点認識結果と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。
【0161】
なお、採点集計部172での採点集計処理やコメント分類処理部176での分類処理に当たっては、完全なる自動処理にしてもよいが、ユーザ端末171のCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などで構成された表示部に処理過程や処理結果を表示して、適宜、操作者が処理過程や処理結果をキーボードやマウスなどの指示入力部を介して訂正できるようにしてもよい。
【0162】
<全体の処理手順>
図10および図11は、情報処理システムの一実施形態である教材自動採点システム1における教材処理方法の処理動作の手順を説明する図である。ここで、図10は、その全体概要をシステム構成図と対応付けて示しており、また図11は、教材処理手順を示すフローチャートである。
【0163】
追記情報処理装置10(特に教材自動採点システム1においては教材処理装置に該当する)を利用する場合には、先ず、生徒などによって解答者情報欄86への氏名などの記入および解答欄84への解答記入、つまり生徒による第1種の付加情報の記入がされ、さらに教師などによって各解答欄84に記入された解答に対する「○」や「×」などの採点記号87やコメント88などの第2種の付加情報の記入がされた付加情報記入済教材81について、文書入力装置20は、その付加情報記入済教材81を読み取り(S110)、その付加情報記入済教材81を表わす画像データを追記情報処理装置10に入力する(S112)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
【0164】
なお、このとき、文書入力装置20にてADF装置を用いれば、たとえば同一学級のような1つのグループに纏めて処理すべき複数の付加情報記入済教材81について、一括して読み取り(一括スキャン)、各付加情報記入済教材81に対応する画像データを連続的に追記情報処理装置10に入力することができる。
【0165】
追記情報処理装置10は、文書入力装置20から取り込んだ各付加情報記入済教材81の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動採点処理並びに自動コメント処理といった付加情報終末処理を実行する。
【0166】
たとえば、データ処理部170における自動採点処理並びに自動コメント処理に先立って、ある1つの付加情報記入済教材81から得られた画像データについて、読取画像処理部110の画像データ解析部112は解析処理を行ない(S122)、教材特定部122は、その解析処理の結果に基づいて付加情報記入済教材81に対応する元の教育用教材80の識別特定を行なう(S124)。
【0167】
この識別特定(S124)は、たとえば「理科」「5年」「1.天気と気温の変化」といった識別情報解析部123によるタイトル解析または識別情報欄85に埋め込まれたコード情報についてのコード情報解析部124によるコード解析を通じて行なえばよい。この識別特定を経ることで、教材特定部122では、文書入力装置20により得られた付加情報記入済教材81の画像データとの比較対象となる教育用教材80の電子データ(原本画像)を特定することができる。
【0168】
なお、この識別特定は、文書入力装置20が画像読取りを行なった複数の付加情報記入済教材81のそれぞれについて順次行なうことも考えられるが、一般に1つのグループに纏めて処理される付加情報記入済教材81は全て同一のものであるため、その纏めて処理される中で最初に処理される付加情報記入済教材81についてのみ行なえばよい。
【0169】
教材特定部122により各付加情報記入済教材81に対応する教育用教材80の特定が完了すると、文書管理サーバ30は、その特定結果に従いつつ、保持蓄積している中から該当する教育用教材80の原本画像(電子データ)を取り出して、これを差分抽出部132へ受け渡す(S126)。
【0170】
また、歪み補正部114は、ある1つの付加情報記入済教材81から得られた画像データの歪みを補正する(S128)。この画像歪み補正は、文書入力装置20での画像読取りの際に生じ得る画像歪みを補正するために行なうものであり、その後に差分抽出部132にて行なう原本画像との比較や差分抽出などの精度向上を図るためのものである。
【0171】
差分抽出部132は、文書管理サーバ30から受け渡された原本画像(教育用教材80)と、文書入力装置20から入力され、歪み補正部114により画像歪みが補正された後の画像データ(付加情報記入済教材81)とを、それぞれ比較して、その差分を抽出する(S130)。差分抽出部132は、抽出した差分情報9を解答者抽出部134やデータ処理用追記情報抽出処理部140に渡す。
【0172】
差分抽出部132による差分抽出によって、たとえば図10中の中央部分に示すように、解答者情報欄86および各解答欄84への解答者による第1種の付加情報の記入内容、並びに各解答欄84に対する採点記号87やコメント88などの採点官による第2種の付加情報の記入内容のみで表わされる差分情報9が抽出されることになる。
【0173】
解答者抽出部134は、差分情報9に対する文字認識処理部138による文字認識処理などを通じて、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報を抽出する(S132)。これにより、ある1つの付加情報記入済教材81に解答を記入した解答記入者の学級、出席番号、氏名などを特定できる。
【0174】
また、データ処理用追記情報抽出処理部140において、先ず追記部材特定部141は、データ処理の対象となる追記情報の記入に使用されたペン色である追記色を特定し(S141)、データ処理対象追記情報抽出部142は、追記部材特定部141にて特定された追記色に基づき、差分抽出部132による差分抽出結果に対して、データ処理用の追記情報を抽出する(S142)。
【0175】
本例の場合、各解答欄84への採点記号87やコメント88の追記内容を抽出するために、その差分情報9からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。所定色成分の抽出は、たとえば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで行なうことができる。
【0176】
抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する(S146)。抽出線分途切れ補正部148は、途切れ補正処理済の採点記号87の抽出結果を採点記号認識部として機能する第1データ処理用追記情報認識部154に渡し、また途切れ補正処理済のコメント88の抽出結果をコメント認識部として機能する第2データ処理用追記情報認識部164に渡す。
【0177】
データ処理対象追記情報特定処理部150は、先ず、分離認識処理部155を構成する図形形状認識部156,166および文字認識処理部157,167が協働して、文書管理サーバ30に保存されている解答欄84の位置情報を参照して、採点記号87とコメント88とを分離し(S162)、この後、分離した採点記号87とコメント88の別に、記入内容の特定処理や記入位置の特定処理を実行する。
【0178】
図形形状認識部156や文字認識処理部157は、コメント88と分離した採点記号87について(S163−採点記号)、採点記号87の記入内容に対する形状認識あるいは文字認識により、その採点記号87の記入内容が「正解」であるかあるいは「不正解」であるかなど、採点記号87で示された採点官の採点結果を特定する(S164)。続いて、記入位置認識部158は、採点記号87の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S166)。
【0179】
このようにして、記入位置認識部158が採点記号87の記入位置を認識した後は、採点集計部172は、図形形状認識部156や文字認識処理部157による採点記号87の記入内容の認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書管理サーバ30が保持蓄積している付加情報記入済教材81に対応する原本画像(教育用教材80)に含まれる教育用教材80の各解答欄84についての配点情報とに基づいて、採点および集計を行なう(S168)。
【0180】
集計結果出力部174は、その採点・集計の結果を処理結果保存サーバ40に保存する(S169)。あるいは採点結果の点数が付加情報記入済教材81の集計欄83bに記入されて返却答案81bとして生徒などに返却される。
【0181】
各付加情報記入済教材81についての採点結果(問題別採点結果)のファイル形式としては、たとえば、図10に示すように、付加情報記入済教材81上に存在する問題の番号と、その問題の解答に対する正誤判定と、その正誤判定に基づく得点とからなる情報で、これらを互いに関連付けるテーブル形式である。また、集計結果のファイル形式としては、たとえば、図10に示すように、出席番号および解答者情報と、得点情報(集計欄83bに記入される項目点や合計点)とからなる情報で、これらを互いに関連付けるテーブル形式である。
【0182】
各付加情報記入済教材81上に記入される正誤判定の採点集計の結果が問題別採点結果としてファイル出力されるし、また、問題別の採点集計の結果がファイル出力されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果を、たとえば一覧形式で、管理または利用することが可能となる。
【0183】
図形形状認識部166や文字認識処理部167は、採点記号87と分離したコメント88について(S163−コメント)、コメント88の記入内容に対する形状認識あるいは文字認識により、採点官により追記されたコメント88の記入内容を特定する(S170)。続いて、記入位置認識部168は、コメント88の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S172)。
【0184】
このようにして、記入位置認識部168がコメント88の記入位置を認識した後は、コメント分類処理部176は、図形形状認識部166や文字認識処理部167によるコメント88の記入内容の認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、文書管理サーバ30が保持蓄積している分類基準情報とに基づいて、コメント88を分類する(S174)。
【0185】
コメント処理結果出力部178は、コメント分類処理部176で分類された各コメント88を、位置が近い採点記号87の採点結果と関連付けて(S178)、処理結果保存サーバ40に保存する(S179)。各コメント88についての分類結果のファイル形式としては、たとえば、図10に示すように、各コメントと近傍の採点記号87とからなる情報で、これらを互いに関連付けるテーブル形式である。なお、実際にテーブル形式で保存することに限らず、各コメント88と、このコメント88と対応する採点集計結果の両者を関連付ける関連付け情報とを対応付けて保存してもよい。
【0186】
各付加情報記入済教材81上に記入される採点記号87の採点集計結果とコメント88とが対応するようにデータ保存されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果とコメント88とを、たとえば一覧形式で、管理または利用することが可能となるし、生徒の能力分析や生徒指導にコメント88を利用できるようになる。
【0187】
このように、情報処理システムの一実施形態として示した教材自動採点システム1では、採点記号87やコメント88の記入がされた付加情報記入済教材81から読み取った画像データと、その付加情報記入済教材81についての元の教育用教材80、すなわち解答欄84への解答記入などの生徒などによる第1種の付加情報および解答に対する採点官による採点記号87やコメント88などの第2種の付加情報の記入がされていないものについてのデータとを比較し、互いの差分から採点記号87やコメント88の記入内容を分離してその記入内容を特定し、その採点記号87についての採点集計とコメント88についての分類処理を実行するようになっている。
【0188】
したがって、採点記号87に関するデータ処理については、差分抽出部132で抽出される差分結果から、コメント88の記入内容を排除して採点記号87のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、自動採点に悪影響を及ぼすことがない。
【0189】
また、採点結果の自動集計を実行できるので、結果として付加情報記入済教材81についての採点処理が省力化される。付加情報記入済教材81を紙媒体で入手するケースでは、付加情報記入済教材81を文書入力装置20で読み取った画像データを基にすればよく、たとえば、複写機、複合機、またはスキャナ装置などによって実現されるスキャン機能と、パーソナルコンピュータ(PC)などのコンピュータ機器が有する情報記憶処理機能、画像処理機能および演算処理機能とがあれば、システム構成を簡単に実現することができ、専用の機器を必要とすることもない。
【0190】
さらには、付加情報記入済教材81の画像データを、文書管理サーバ30が保持する電子データと比較するため、その文書管理サーバ30に各種の教育用教材80についての電子データを保持蓄積しておけば、対応可能な付加情報記入済教材81についての汎用性を十分に確保し得る。さらには、文書管理サーバ30に予め電子データを保持蓄積しておくことで、文書管理サーバ30から取り込んだ画像データとの比較を行なう場合において、比較対象となる電子データの入力などを行なう手間を省くことができ、結果として迅速な採点処理を実現することができる。
【0191】
また、コメント88に関するデータ処理については、差分抽出部132で抽出される差分結果から、採点記号87の記入内容を排除してコメント88のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、コメント88に関する分類処理に悪影響を及ぼすことがない。また、各採点記号87と対応付けて処理結果保存サーバ40に各コメント88を保存するようにしたので、コメント88を生徒などが確認する用途以外に、採点官自らが、能力分析や生徒指導に活用できるようになる。
【0192】
<追記情報処理装置;計算機構成>
図12は、追記情報処理装置10の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、追記情報処理をソフトウェアを実行するマイクロプロセッサなどから構築されるより現実的なハードウェア構成を示している。
【0193】
すなわち、本実施形態において、追記情報に関するデータ処理を実行する仕組みは、ハードウェア処理回路により構成することに限らず、その機能を実現するプログラムコードに基づき電子計算機(コンピュータ)を用いてソフトウェア的に実現することも可能である。
【0194】
よって、本発明に係る仕組みを、電子計算機(コンピュータ)を用いてソフトウェアで実現するために好適なプログラムあるいはこのプログラムを格納したコンピュータ読取可能な記憶媒体を発明として抽出することもできる。ソフトウェアにより実行させる仕組みとすることで、ハードウェアの変更を伴うことなく、処理手順などを容易に変更できる利点を享受できるようになる。
【0195】
電子計算機に、追記情報に関するデータ処理機能をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ(組込マイコンなど)、あるいは、CPU(Central Processing Unit )、論理回路、記憶装置などの機能を1つのチップ上に搭載して所望のシステムを実現するSOC(System On a Chip:システムオンチップ)、または、各種のプログラムをインストールすることで各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【0196】
記録媒体は、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気などのエネルギの状態変化を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。
【0197】
たとえば、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクFDを含む)、光ディスク(CD−ROM(Compact Disc-Read Only Memory )、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc )を含む)、または半導体メモリなどよりなるパッケージメディア(可搬型の記憶媒体)により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROMやハードディスクなどで構成されてもよい。
【0198】
また、ソフトウェアを構成するプログラムは、記録媒体を用いずに、記録媒体を介して提供されることに限らず、有線あるいは無線などの通信網を介して提供されてもよい。
【0199】
たとえば、追記情報に関するデータ処理機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、ハードウェア処理回路にて構成する場合と同様の効果は達成される。この場合、記憶媒体から読み出されたプログラムコード自体が追記情報に関するデータ処理機能を実現する。
【0200】
また、コンピュータが読み出したプログラムコードを実行することで、追記情報に関するデータ処理機能が実現されるだけでなく、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(Operating Systems ;基本ソフト)などが実際の処理の一部または全部を行ない、その処理により追記情報に関するデータ処理機能が実現される場合であってもよい。
【0201】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって追記情報に関するデータ処理機能が実現される場合であってもよい。
【0202】
なお、追記情報に関するデータ処理機能を実現するプログラムコードを記述したファイルとしてプログラムが提供されるが、この場合、一括のプログラムファイルとして提供されることに限らず、コンピュータで構成されるシステムのハードウェア構成に応じて、個別のプログラムモジュールとして提供されてもよい。
【0203】
たとえば、コンピュータシステム900は、コントローラ部901と、ハードディスク装置、フレキシブルディスク(FD)ドライブ、あるいはCD−ROM(Compact Disk ROM)ドライブ、半導体メモリコントローラなどの、所定の記憶媒体からデータを読み出したり記録したりするための記録・読取制御部902とを有する。
【0204】
コントローラ部901は、CPU(Central Processing Unit )912、読出専用の記憶部であるROM(Read Only Memory)913、随時書込みおよび読出しが可能であるとともに揮発性の記憶部の一例であるRAM(Random Access Memory)915、および不揮発性の記憶部の一例であるRAM(NVRAMと記述する)916を有している。
【0205】
なお、上記において“揮発性の記憶部”とは、装置の電源がオフされた場合には、記憶内容を消滅してしまう形態の記憶部を意味する。一方、“不揮発性の記憶部”とは、装置のメイン電源がオフされた場合でも、記憶内容を保持し続ける形態の記憶部を意味する。記憶内容を保持し続けることができるものであればよく、半導体製のメモリ素子自体が不揮発性を有するものに限らず、バックアップ電源を備えることで、揮発性のメモリ素子を“不揮発性”を呈するように構成するものであってもよい。
【0206】
また、半導体製のメモリ素子により構成することに限らず、磁気ディスクや光ディスクなどの媒体を利用して構成してもよい。たとえば、ハードディスク装置を不揮発性の記憶部として利用できる。また、CD−ROMなどの記録媒体から情報を読み出す構成を採ることでも不揮発性の記憶部として利用できる。
【0207】
また、コンピュータシステム900は、ユーザインタフェースをなす機能部としての指示入力部903と、操作時のガイダンス画面や処理結果などの所定の情報をユーザに提示する表示出力部904と、各機能部との間のインタフェース機能をなすインタフェース部(IF部)909とを有する。
【0208】
なお、データ処理結果を印刷出力してユーザに提示する構成とするべく、処理結果を所定の出力媒体(たとえば印刷用紙)に出力する画像形成部906を設けることもできる。
【0209】
指示入力部903としては、たとえば、ユーザインタフェース部985の操作キー部985bを利用することができる。あるいは、キーボードやマウスなどを利用することもできる。
【0210】
表示出力部904は、表示制御部919と表示装置とを備える。表示装置としては、たとえば、ユーザインタフェース部985の操作パネル部985aを利用することができる。あるいは、CRT(Cathode Ray Tube;陰極線管)やLCD(Liquid Crystal Display;液晶)などでなるその他のディスプレイ部を利用することもできる。
【0211】
たとえば、表示制御部919が、操作パネル部985aやディスプレイ部上に、ガイダンス情報や文書入力装置20が取り込んだ全体画像などを表示させる。また、各種の情報をユーザに通知する際の表示デバイスとしても利用される。なお、表示面上にタッチパネルを有するディスプレイ部とすることで、指先やペンなどで所定の情報を入力する指示入力部903を構成することもできる。
【0212】
インタフェース部909としては、処理データ(画像データを含む)や制御データの転送経路であるシステムバス991の他、たとえば、画像形成部906や他のプリンタとのインタフェース機能をなすプリンタIF部996、およびネットワークとの間の通信データの受け渡しを仲介する通信IF部999を有している。
【0213】
このような構成において、CPU912は、システムバス991を介してシステム全体の制御を行なう。ROM913は、CPU912の制御プログラムなどを格納する。RAM915は、SRAM(Static Random Access Memory )などで構成され、プログラム制御変数や各種処理のためのデータなどを格納する。また、RAM915は、所定のアプリケーションプログラムに従って演算して得たデータや外部から取得したデータなどを一時的に格納する領域を含んでいる。
【0214】
たとえば、追記情報に関するデータ処理機能をコンピュータに実行させるプログラムは、CD−ROMなどの記録媒体を通じて配布される。あるいは、このプログラムは、CD−ROMではなくFDに格納されてもよい。また、MOドライブを設け、MOに前記プログラムを格納してもよく、またフラッシュメモリなどの不揮発性の半導体メモリカードなど、その他の記録媒体にプログラムを格納してもよい。さらに、他のサーバなどからインターネットなどのネットワークを経由してプログラムをダウンロードして取得したり、あるいは更新したりしてもよい。
【0215】
なおプログラムを提供するための記録媒体としては、FDやCD−ROMなどの他にも、DVDなどの光学記録媒体、MDなどの磁気記録媒体、PDなどの光磁気記録媒体、テープ媒体、磁気記録媒体、ICカードやミニチュアカードなどの半導体メモリを用いることができる。記録媒体の一例としてのFDやCD−ROMなどには、追記情報に関するデータ処理機能を実現する際の、一部または全ての機能を格納することができる。
【0216】
また、ハードディスク装置は、制御プログラムによる各種処理のためのデータを格納したり、自装置で取得したデータや外部から取得したデータなどを大量に一時的に格納したりする領域を含んでいる。
【0217】
このような構成により、操作キー部985bを介した操作者による指令にて、前述の追記情報処理方法を実行するプログラムが記憶されているCD−ROMなどの読取可能な記録媒体からRAM915に追記情報処理プログラムがインストールされ、また操作キー部985bを介した操作者による指令や自動処理にて追記情報処理プログラムが起動される。たとえば、教材自動採点システム1を実現する場合であれば、教材処理プログラムでは、所定色成分、具体的にはたとえば赤色成分の差分抽出結果を、採点記号87やコメント88の記入内容として認識し、かつ両者を分離するようにする処理ステップなどが記述されプログラムが起動される。
【0218】
CPU912は、この追記情報処理プログラムに従って前述の追記情報処理方法に伴う計算処理を施し、処理結果をRAM915やハードディスクなどの記憶装置に格納し、必要により操作パネル部985a、あるいはCRTやLCDなどの表示装置に出力する。追記情報処理方法を実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、追記情報処理システムを汎用的に構築することができる。
【0219】
なお、このようなコンピュータを用いた構成に限らず、図9を用いて示した各機能部の処理をなす専用のハードウェアの組合せにより、追記情報に関するデータ処理機能を行なう追記情報処理装置10を構成することもできる。
【0220】
また、たとえば、追記情報に関するデータ処理機能のための各機能部分の全ての処理をソフトウェアで行なうのではなく、これら機能部分の一部を専用のハードウェアにて行なう処理回路908を設けてもよい。ソフトウェアで行なう仕組みは、並列処理や連続処理に柔軟に対処し得るものの、その処理が複雑になるに連れ、処理時間が長くなるため、処理速度の低下が問題となる。
【0221】
これに対して、ハードウェア処理回路で行なうことで、高速化を図ったアクセラレータシステムを構築することができるようになる。アクセラレータシステムは、処理が複雑であっても、処理速度の低下を防ぐことができ、高いスループットを得ることができる。
【0222】
たとえば、追記情報に関するデータ処理機能を実現する場合であれば、処理回路908としては、図9に示した読取画像処理部110に相当する読取画像処理部908a、文書原本特定部120に相当する文書原本特定部908b、追記情報抽出部130に相当する追記情報抽出部908c、データ処理対象追記情報特定処理部150に相当するデータ処理対象追記情報特定処理部908d、あるいはデータ処理部170に相当するデータ処理部908eなどをハードウェアで構成するとよい。
【産業上の利用可能性】
【0223】
以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれる。
【0224】
また、上記の実施形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組合せの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組合せにより種々の発明を抽出できる。実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。
【0225】
たとえば、歪み補正処理や途切れ補正処理などは、必ずしも必須ではない。また、採点記号87の採点集計に当たって、各解答欄84と採点記号87の記入位置とを対応付ける場合に、本実施形態で説明したような採点記号87の外接矩形と解答欄84の領域との重なり面積を求めるのではなく、たとえばそれぞれの中心座標の距離から対応付けを行なったり、あるいは単にそれぞれの間で重なる部分があるか否かによって対応付けを行なったりすることも考えられる。
【0226】
また、処理対象の追記済文書8Bの一例として校正情報記入済文書71や付加情報記入済教材81や付加情報記入済手帳91を例に説明したが、これらは一例に過ぎず、データ処理対象となる追記情報が含まれているものであれば、その文書の種別は問わない。
【0227】
また、先にも述べたが、処理対象の追記済文書8Bは、紙媒体を用いることに限定されず、最初から追記済文書8Bを電子データの形式で入手する態様の場合であっても、データ処理対象となる追記情報が含まれているものであれば、上述した仕組みを同様に適用することができる。
【図面の簡単な説明】
【0228】
【図1】本発明に係る追記情報処理において処理対象とする文書の一例である編集対象文書を示す図である。
【図2】本発明に係る追記情報処理において処理対象とする文書の一例である教育用教材を示す図である。
【図3】に本発明に係る追記情報処理において処理対象とする文書の一例である手帳を示す図である。
【図4】追記済文書中の追記情報を分離抽出する追記情報抽出処理手法を説明する図である。
【図5】追記部材の記入剤が持つ波長成分を特定する際に注目する追記情報の記載箇所の一例を説明する図である。
【図6】追記色特定処理の具体例(その1)を説明する図である。
【図7】追記色特定処理の具体例(その2)を説明する図である。
【図8】追記色特定処理の具体例(その3)を説明する図である。
【図9】本発明に係る追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例(教材自動採点システム)を示す図である。
【図10】教材自動採点システムにおける教材処理方法の全体概要をシステム構成図と対応付けて示した図である。
【図11】教材自動採点システムにおける処理手順を示すフローチャートである。
【図12】追記情報処理装置を、電子計算機を用いて構成する場合のハードウェア構成の一例を示した図である。
【符号の説明】
【0229】
1…教材自動採点システム、8A…文書原本、8B…追記済文書、8c…抽出対象指定欄、9…差分情報、10…追記情報処理装置、20…文書入力装置、30…文書管理サーバ、40…処理結果保存サーバ、70…編集対象文書、71…校正情報記入済文書、77…校正記号、78…校正コメント、80…教育用教材、81…付加情報記入済教材、87…採点記号、88…コメント、90…手帳、91…付加情報記入済手帳、97…予定、98…コメント、99…分類記号、110…読取画像処理部、112…画像データ解析部、114…歪み補正部、120…文書原本特定部、122…教材特定部、123…識別情報解析部、124…コード情報解析部、130…追記情報抽出部、132…差分抽出部、134…解答者抽出部、136…手書き情報切出部、138…文字認識処理部、140…データ処理用追記情報抽出処理部、141…追記部材特定部、142…データ処理対象追記情報抽出部、146…追記情報整形部、148…抽出線分途切れ補正部、150…データ処理対象追記情報特定処理部、154…第1データ処理用追記情報認識部、155…分離認識処理部、156…図形形状認識部、157…文字認識処理部、158…記入位置認識部、164…第2データ処理用追記情報認識部、166…図形形状認識部、167…文字認識処理部、168…記入位置認識部、170…データ処理部、170_1…第1データ処理部、170_2…第2データ処理部、171…ユーザ端末、172…採点集計部、174…集計結果出力部、176…コメント分類処理部、178…コメント処理結果出力部

【特許請求の範囲】
【請求項1】
所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理を行なう追記情報処理方法であって、
前記追記済文書中に存在する前記付加情報の記入に使用された追記部材の記入剤の波長成分を特定し、この特定した波長成分に注目して前記データ処理の対象となる追記情報を抽出し、この抽出した追記情報について前記データ処理を行なう
ことを特徴とする追記情報処理方法。
【請求項2】
所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理を行なう追記情報処理装置であって、
前記追記済文書中に存在する前記付加情報の記入に使用された追記部材の記入剤の波長成分を特定する追記部材特定部と、
前記追記部材特定部が特定した波長成分を参照して、前記データ処理の対象となる付加情報を抽出する追記情報抽出部と、
前記追記情報抽出部が抽出した付加情報に基づいて、前記データ処理を行なうデータ処理部と
を備えたことを特徴とする追記情報処理装置。
【請求項3】
前記追記部材特定部は、処理対象の前記追記済文書における所定の欄に前記追記部材によって追記された前記付加情報の記入剤の波長成分を特定する
ことを特徴とする請求項2に記載の追記情報処理装置。
【請求項4】
前記追記部材特定部は、処理対象の前記追記済文書とは別の文書における所定の欄に前記追記部材によって追記された前記付加情報の記入剤の波長成分を特定する
ことを特徴とする請求項2に記載の追記情報処理装置。
【請求項5】
前記所定の欄には、前記記入剤の波長成分を特定するための付加情報とは別の情報は記載されていない
ことを特徴とする請求項3または4に記載の追記情報処理装置。
【請求項6】
前記所定の欄は、前記記入剤の波長成分を特定するための付加情報とは別の追記情報の記入欄と兼用されている
ことを特徴とする請求項3に記載の追記情報処理装置。
【請求項7】
前記追記部材特定部は、処理対象の前記追記済文書において所定の規則に基づいた位置に前記追記部材によって追記された前記付加情報の記入剤の波長成分を特定する
ことを特徴とする請求項2に記載の追記情報処理装置。
【請求項8】
前記追記部材特定部は、前記文書原本と前記追記済文書との差分結果の画素値について統計解析を行ない、この統計解析結果に基づいて前記記入剤の波長成分を特定する
ことを特徴とする請求項2〜7のうちの何れか1項に記載の追記情報処理装置。
【請求項9】
所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理をコンピュータを用いて行なうためのプログラムであって、
前記コンピュータを、
前記追記済文書中に存在する前記付加情報の記入に使用された追記部材の記入剤の波長成分を特定する追記部材特定部と、
前記追記部材特定部が特定した波長成分を参照して、前記データ処理の対象となる付加情報を抽出する追記情報抽出部と、
前記追記情報抽出部が抽出した追記情報に基づいて、前記データ処理を行なうデータ処理部
として機能させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2007−295320(P2007−295320A)
【公開日】平成19年11月8日(2007.11.8)
【国際特許分類】
【出願番号】特願2006−121446(P2006−121446)
【出願日】平成18年4月26日(2006.4.26)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】