アンケート用マークシート方式
【課題】
マーキング済みのマークシートをOMRで読取た出力データをデータ処理してマーキングを判定する方式において、余分な記号の多用と表形式のマークシートを避けて、平文の体裁のよいマークシート方式を提案すること、さらに、マーク対象短文字列中に空白文字を有する2単語以上のマーク対象短文字列にも適用できる方式を提案することである。
【解決手段】
マーキングさせるマーク対象短文字列の前後両側に1文字分以上の空白を設け、マーク対象短文字列を仕切ることで解決でき、さらに、この手段とレイアウト認識機能を有するOCRと組合わせる手段も課題解決に有効である。
マーキング済みのマークシートをOMRで読取た出力データをデータ処理してマーキングを判定する方式において、余分な記号の多用と表形式のマークシートを避けて、平文の体裁のよいマークシート方式を提案すること、さらに、マーク対象短文字列中に空白文字を有する2単語以上のマーク対象短文字列にも適用できる方式を提案することである。
【解決手段】
マーキングさせるマーク対象短文字列の前後両側に1文字分以上の空白を設け、マーク対象短文字列を仕切ることで解決でき、さらに、この手段とレイアウト認識機能を有するOCRと組合わせる手段も課題解決に有効である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は各種のアンケート、設問形式のテスト、問診票、マーク選択欄を有する帳票類などに用いられるマークシートに関するものである。
【背景技術】
【0002】
マークシートには、従来よりOMRによってマーク位置を認識し、データとして取得する方式が広く知られている。この方式は、専用の読取り装置が必要なこと、マーク記入枠やその他の部分がドロップアウトカラーで印刷されているため、マークシートの記述内容が視認しにくいなどの欠点がある。イメージスキャナもしくはファックス等の走査型の光学画像読取装置でマーク記入後のマークシートを読取り、元のマークシートの画像とマーク記入後の画像を画像処理によって比較することによって、マークを認識する光学画像読取方式が多数提案がされている。これらの提案によって、専用の読取り装置が不要となり、単色印刷のマークシートが可能となりOMRを用いる方式の幾つかの欠点が解決されつつある。しかしながら、これらの光学画像読取方式についての公知の提案の多くが、○、0 、「」、□などのマーク枠で囲まれた部分を筆記具にて塗りつぶすことによってマークすることを踏襲している。そのため、マーク対象自体が文字として意味を有していないこと、マーク対象が列状に密集して配置しているため、記入者が箇所を間違えてマークし易いなどの欠点がある、これらの欠点の改善のための提案が特許文献1、特許文献2など幾つか開示されているが、これらの欠点が十分改善されたとは言い難いのが現状である。
【0003】
本願発明者は、これらの欠点を解決する手段として、マークシートの被マーク対象文字を筆記具でマークさせ、マーク済みマークシートを光学式文字読取装置(以下OCRと呼ぶ場合がある)で読取って光学画像を文字データに変換し、その文字データをデータ処理して、被マーク対象文字の異なる文字への変化によってマークされたか否かを認識する方式を特許文献3および4において提案した。
【特許文献1】特開2002−7980の公報
【特許文献2】特開平5−19436の公報
【特許文献3】特開平2004−46751の公報
【特許文献4】特開平2005−173673の公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
本願発明者が以前提案した特許文献3および4によるOCRによってマーキング済みのマークシートを読取るマークシート方式は、従来のOMRの方式と従来の画像認識方式の欠点を共に解決する有効な手段である。他の光学画像をデータ処理する方式ではマーク対象の黒度の変化によってマークの有無を判定するが、この方式では文字の変化によって判定する。この方式では、マーキング前のマーク対象文字がマーキング後のどの文字になっているか対応をつけることができれば、文字の変化を認識することは比較的容易である。しかしながらこの対応を確実に行なうことは容易でない。何故ならば、従来の他の画像を画像処理する方式の場合のようにマークシート上の幾何学的位置によって対応することができず、対応は専ら文字列中の順位、文字種の比較などに依存しているためである。さらにこの対応を複雑にし、難しくする要因がある。この方式において、被マーク対象文字列をマーキングするとOCRは、通常の被マーク対象文字列中の文字と異なった文字に変化する。文字種の変化と同時に文字数の変化も認識される。そのため、行中の文字列中の被マーク対象文字の位置が、元のマークシートとマーク済みマークシートの間で変化する。また、被マーク対象文字列以外のマークシートの文字も時に被マーク対象文字列中の文字種にご認識されることがある。本願発明者らは、この対応の困難を如何に解決するかを追求し、先ず、標識文字を付加することによる方法を特許文献3で提案した。しかしながら、特許文献3の提案では、多数のしかも無意味な標識文字がマークシート上に存在するため、マークシートの体裁が悪い欠点がある。続いて提案した特許文献4の方式は、マークされた被マーク対象の位置をマーク対象の存在する表中の行および列によって検出したため、この対応を確実にできる特長があるが、マークシートの外見がやや堅苦しい印象を与える欠点がある。これらの欠点は、特にアンケートに用いるマークシートの場合に不利となる。さらに、このOCRを用いる方式を2単語以上からなる被マーク対象文字列に適用することに多くの努力を積んできたが、前述の対応が困難であることから適当な方法が実証されていない。
【0005】
本発明の課題は、従来のマークシート方式の欠点を有せず、さらに、発明者が以前提案した特許文献3と特許文献4の方式の欠点を改善し、無意味な記号の多用を避けた体裁のよい、複数単語のマーク対象に適用可能な平文のマークシートを提案することである。
【課題を解決するための手段】
【0006】
このような種々な問題を解決するため、多くの試行を重ねた結果、到達したのが空白を標識に用いることである。空白でない他の記号などを標識に用いると、誤認識によって、その標識が他の文字として認識されることがあること、被マーク対象文字列中の標識以外の文字がマーキングによって標識と同じ文字に変化することがあること、被マーク対象文字列以外の説明文中の文字が誤認識等によって標識として認識されることがあることなどの原因で、前記の対応が確実にできない。その対策として、標識として複数の記号を用いると改善できるが、マークシートの見栄えが悪くなり、マークシートのデザインがそれによって制限を受ける。しかし、空白を標識として用いればどのように多数用いても文の意味と、外観への影響が極めて少ないからである。また、マークシートのデザインへの制約への影響も少ない。当初、マークシート中に多数存在する空白を標識に用いることは難しいと思われたが、意外にも、他の部分の空白の存在は障碍にならないことが実証された。さらに実証された重要な要素は、マーク対象短文字列の必ず前後両側に空白を置くことである。片側のみでは問題は解決できない。なぜなら文字にマーキングする方式では、通常マーク対象短文字列中の文字種のみでなく、文字数も変化する。さらに元の文字列中の文字は変化せず、前または後ろに他の文字を付加する変化もある。このような多様な変化を確実に把握するためには、マーク対象短文字列の前後を明確に標識で区切って他の部分と分離することが必須である。記号でなく空白を用いる他の利点は、レイアウト認識機能を有するOCRとの組合せにおいて発揮される。レイアウト認識機能では空白を領域の境界とみなすため、空白をマーク対象短文字列の両側に配置することによって、マーク対象短文字列を他の部分から仕切ることができ、マーク対象短文字列のマーキング前後の変化を正確な判定を可能にする。他の記号等はレイアウト認識に関して全く役立たない。空白の利用によって、レイアウト認識機能を有するOCRの機能を十分に引き出すことができた。
【0007】
さらに、この検討段階で、平文のマークシートにおいて、欧文のような空白を含む被マーク対象文字列にも、文字にマーキングする方式を適用できることが実証できた。
【0008】
課題を解決するための第1の手段は、複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ各該マーク対象短文字列は前後に隣接する他の文字列との間が少なくとも1文字分の空白によって離隔されている回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式である。
【0009】
第2の手段は複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ1個以上の該マーク対象短文字列が空白文字を含むものである回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式である。
【0010】
第3の手段は第1の手段に加えて空白文字も含むマーク対象短文字列を回答要求文中に有することであり、第4の手段は、第1および第2の手段に加えて、レイアウト認識機能を有する光学式文字認識装置を用いることである。
【発明の効果】
【0011】
本発明のマークシートは、平文中に配置した例えば“はい”などの被マーク対象短文字列上を直接引線してのマーキング、その短文字列周囲の余白にアンダーラインするマーキング、短文字列の周囲を丸く囲むことによってマーキングすることができ、さらに、VERY GOODなどの空白文字を含む複数単語の被マーク対象短文字列とすることができた。これによって、従来のマークシートの欠点を解決すると共に、参考文献3および4の堅苦しい印象を改善したアンケート用途などに好適なマーク方式を実現することができた。
【発明を実施するための最良の形態】
【0012】
実施例の説明に先立ち、本発明の請求範囲に用いられている用語などについて説明する。本請求範囲に云う回答要求文は、アンケート用紙などのマークシートの主要要素であって、複数のマーク対象短文字列に加え、質問項目名、質問、説明、回答の方法指示その他の文字列および空白によって構成される。回答要求文には、OCRによって文字として認識されない手書き記入欄、図、写真、表、空白などを必要に応じて挿入してもよい。マークシートは、紙、フィルムなどの平面媒体の面にインクなどによって回答要求文とその他の図形などを印刷などの技術によって描写した物である。一般にマークシートは白色、明色、もしくは無色の媒体表面に暗色の文字を印刷した物であるが、逆に、暗色の媒体表面に白色、明色、もしくは無色の文字、図形などを描写した印刷物も本発明のマークシートとして使用できる。
【0013】
本請求範囲に云う「文字」は、マークシート中の文字にあっては、文字、記号および空白文字を意味する。他方、文字データにあっては、文字、記号に加え、空白文字、および制御文字を含める。両者で定義が異なる理由は、マークシートにあっては制御文字は存在しないからである。
本請求範囲で云う、空白とは、作成方法にかかわらない。したがって空白文字によって作成されたものも空白に含める。他方、制御文字列中の空白は作成方法によらず空白文字と呼ぶことにする。
【0014】
本発明の効果を達成するためには、マークシート中の文字はOCRによる読取り時に、正しく認識される字体のものを用いることが好ましい。一般に、日本語の場合、行書体、草書体よりも明朝体、ゴシック体などの楷書形の活字体の方が適している。
本請求範囲1に云う「マーク対象短文字列」とは、アンケートなどマークシートの回答者に回答のためのマーキングを施す対象とする短い文字列である。文字列の長さは、通常10以下長くても15以下程度である。
本請求範囲に云う文字列は、単数もしくは、複数の文字と空白文字からなる文字の列を云う。 「マーク対象短文字列」には、A、1、イなどの単文字のもの、はい、いいえ、どちらとも言えない、(はい)、(いいえ)、Aはい、Bいいえ、Yes、Noなどの複数文字の文字列、Very Good、Not YeTなどの空白文字を有する文字列がある。
本請求範囲に云う「周囲の空白部」とは、マーク対象短文字列の前後に接して存在する空白と余白、およびマーク対象短文字列の上下に接して存在する行間、空白行と余白を意味する。ここで余白とは、行頭、行末、文頭及び文末と紙面の周囲との間の空白を意味する。
【0015】
本請求範囲に云う「曲線等」とは、線、曲線などで描いた通常の図形に加え、文字あるいは記号状の形状を有する図形も含まれる。曲線等の例としては、マーク対象小行列上に描かれる例としては、水平線、水平に二重線、斜線、チェック形線などがある。マーク対象小行列の周囲の余白にマーキング図形を描く例としては、下方行間の空白部に描かれたアンダーライン、マーク対象小行列の周りを囲む円・楕円または方形、マーク対象短行列の前方空白部に描く丸印、X印などがある。これらのマーキング図形は必ずしもマーク対象小行列の全域に渡って描く必要は無く、マークしたことが判別できれば、マーク対象小行列の一部の文字あるいは周囲の空白部の一部のみを限定してマーク対象に指定することもできる。本請求範囲に云う筆記具には鉛筆、ボールペンなどの通常の筆記具の他に、スタンプも含むものとする。
【0016】
本請求範囲1に云う少なくとも1文字分の空白において1文字分における文字幅の基準は、マーク対象短文字列の文字の中の空白に接する文字の活字幅とする。もし、空白が1文字分の場合にあって、かつ、空白の前後の文字の活字幅が異なる場合は、大きな方の活字幅とする。また、デザイン上許されれば、1文字分よりもできるだけ幅広の空白が好ましい。
【0017】
本請求範囲に云う光学式文字認識装置とは、別名OCRと呼ばれ、平面媒体上に印刷された文を光学的に画像として読取って、その画像を文字データに変換する機能を有する装置である。一体の装置もあるが、通常イメージスキャナと文字認識ソフトの組合せとして入手できる。なお、本提案に使用する光学式文字認識装置としては、平面媒体上に印刷された文字は、相対位置をできるだけ保ったまま同一の文字として認識し、マーキングされた文字列は元の文字列と異なる文字列として認識されることが好ましい。
【0018】
本請求範囲に云うレイアウト認識機能を有する光学式文字認識装置とは、入力された画像に対して、文字・表・画像・図形などの属性を分類して認識し、それらの情報を分離もしくは総合して出力することができる光学式文字認識装置を意味する。
【0019】
レイアウト認識機能を有する光学式文字認識装置を用いる最大の利点は、マークシートの文中に挿入される図形、手書き部分の文字、表領域などを確実に除外し、活字文字の回答要求文のみを文字データとして出力できることである。図形などの挿入されたマークシートをレイアウト機能を有しない光学式文字認識装置で読取ると、図形などを文字として認識するため、元のマークシートにない多くの文字が読取り文字データに付加されるため、マーキングの判定が困難になる。その他、挿入された表形のマークシートを分離し、別途マーキング認識することができること、挿入された手書き文字回答部分を分離して別途読取ることができる利点がある。
【0020】
本請求範囲に云う「文字列変化の有無」には、認識誤りが起き易い文字を除外し、マーク対象短文字列中の一部の文字で構成した短文字列のマーキング前後の変化の「文字列変化の有無」も包含される。各該マーク対象短文字列の文字列変化の有無は、通常マーキング前後の短文字列全体の相互比較によって行なう。しかし、短文字列の中に、光学的文字認識装置によって認識誤りが起き易い文字が含まれている場合には、その文字を除外した文字列を比較する方がマーク判定の目的に合致するからである。さらに、あるマーク対象短文字列がマーキング後の文字認識データにおいて、元の文字列の前または後ろに他の文字が付加した文字列に変化する場合も文字列変化が有と定義する。
【実施例1】
【0021】
この提案を実証するため、文字I、E、H、TをそれぞれがI、E、H、Tと読取り、それ以外の文字はXと読取り、1個以上の余白はWと読取り、改行はRと読取って文字列データとして出力する機能を有する光学式文字認識装置(OCR)を試作した。OCRは本来全ての文字種が正しく読取れるものにすべきであるが、試作を容易にするため文字種をI、E、H、T限定したものである。図1は実施例1のマークシートの上面図である。この実施例において、図1の第1行「アンケート」から第8「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図1の第5行は「ETI」と「HET」は共に請求範囲に云うマーク対象短文字列である。「ETI」は前方には1文字を十分超える空白があり、後方は「HET」との間に2文字分の空白がある。「HET」は前方には「ETI」との間に2文字分の空白があり、後方には1文字を十分超える空白がある。図1の第6行は「ETI」と「HET」がマーク対象短文字列である。「ETI」は、前方にある文字列の最後の文字Tとの間に4文字文の空白があり、後方の「HET」との間に2文字文の空白がある。さらに、第8行には「EIT」および「HET」の2個のマーク対象短文字列がある。「EIT」は前方に1文字を十分超える空白があり、後方は「HET」との間に1文字分の空白がある。
【0022】
この実施例では文字種が限られて無意味なため、各マーク対象短文字列であることが分り難いが、実際のマークシートでは、これらの各マーク対象短文字列は、回答としての意味を有し、それら以外の回答要求文中の文字列は表題、説明指示である文意を有することから回答者には説明を要しない。次に、文字列図1の第1行目のマーキング方法に従って、マーキングした。そのマーキング済みのマークシートの上面図を図2に示した。このマーキング済みのマークシートを前記の試作したOCRによって読取り、文字列データとしてパソコンに出力した。パソコン内でデータ処理して図1のマーク対象短文字列の中、第5行の「ETI」、第6行の「HET」および第8行の「HET」がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。
【0023】
紙面の節約と理解を容易にするための両理由から、上記のデータ処理の詳細を記述する代わりに前記試作したOCRで図2のマーキング済みシートを読取った文字列データをメモ帳に入力し、印刷したものを図4にマーキング済みマークシートをOCRで読取った出力データ内容を示す図として示した。実際の操作では、出力データをパソコン中で処理するのであるが、この図は、その内容を便宜上印刷して目に見えるようにしたものである。当業者でなくても、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列の比較は容易であることが理解できよう。この対応付けの過程で、空白で仕切られた短文字列の全文中の順がマーキングの前後で変わらないことが利用できる。この実施例によって、マーク対象短文字列の前後に空白を置くことの効用は、全文の文字列を明確に区切って、細分化して順序を正確に把握可能とし、さらにマーク対象短文字列を他の部分から完全に分離化することができるため、マーキング前後のマーク対象短文字列の比較が正確にできることにあることが分る。なお、実施例においては、OCRの出力を直接データ処理したが、その出力を一旦エクセルなどの表ソフトに入力し、短文字列の位置を、表の行と列の組合せに変換した後、データ処理してもよい。なお、データ処理に必要ではないが、参考までにマーキング前の図1マークシートを読取った文字列データをメモ帳に入力し、印刷したものを図5に示した。この実施例では、5人の回答者に図1のマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて、同様にマーキングを判定した。マーキングは全て正しく判定された。なお、図2のマーキング済みマークシートは、その中の1枚である。
【実施例2】
【0024】
この実施例は、マーク対象短文字列の周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段であるこの提案の一例である。図5はこの実施例のマーキング済みのマークシートの上面図である。紙面節約のため、元のマークシートの図は省略したが、この
マークシートは、マーキングが、マーク対象短文字列の周囲を楕円状に囲んでマーキングすること以外、実施例1と大差がない。その他相違する点は、周囲の空白部にマークを記入するため、実施例1に比較して、前後に隣接する他の文字列との空白の幅を広く取り、全てのマーク対象短文字列が前後の隣接する他の文字列との空白の幅4文字分以上とした。
これは、マーク対象短文字列の前後の空白部にマークの曲線が光学式文字認識装置により文字として認識されることがあるため、マーキング後の空白の有効幅が減少するため、マーキング後にも空白1文字分を確保するための措置である。次の操作として、このマーキング済みのマークシートを実施例1と同一の光学式文字認識装置によって読取り、文字列データとしてパソコンに出力した。パソコン内でデータ処理した結果、図5のマーク対象短文字列の中、第5行の「ETI」、第6行の「ETI」および第8行の「HET」がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。実施例1と同理由から、上記のデータ処理の詳細を記述する代わりにマーキング後に光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図6に示めした。マーキング前のマークシートと比較すれば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。この対応付けの過程で、対文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。この実施例では、5人の回答者に同じマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて同様にマーキングを判定した。マーキングは全て正しく判定された。上記図5のマーキング済みマークシートは、その中の1枚である。
【実施例3】
【0025】
この実施例は、この提案の方式がマーク対象短文字列中に空白文字もしくは空白を含む場合にも適用できることを示す一例である。このような適用は特に欧文の場合に有用である。欧文のマークシートの場合、Very Good 、Not Yetなど空白を含むマーク対象短文字列にも適用できると便利だからである。適用可能なことを実証するため、先ず、実施例1で試作した光学式文字認識装置を改造し、2字分以上の連続した余白があるときはWと読取るが1字分の単独の空白は無視するように改造した。その他の機能は実施例1の場合と同じである。 次に上面図が図7のマークシートを作成した。この実施例において、図7の「アンケート」から第8行の「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図8の第5行には「ETIH THIT」と「HET THIE」の2個のマーク対象短文字列がある。 マーク対象短文字列「ETIH THIT」は前方に1文字分を十分に越す空白、後方の「HET THIE」との間には10文字分の空白」を有する。一方マーク対象短文字列「HET THIE」は前方の「ETIH THIT」との間に10文字分の空白」を後方には1文字分を十分に越す空白を有している。さらに、これらのマーク対象短文字列は共に文字列内に1文字幅の空白を含んでいる。これらの空白は、Very Goodなど欧文などでの複数単語から成るマーク対象短文字列を模したものである。さらにこのマークシートには、第6行に「ETI」と「HET」がマーク対象短文字列である。「ETI」は、前方にある文字列の最後の文字Tとの間に4文字文の空白があり、後方の「HET」との間に4文字文の空白がある。さらに第8行には「EIT」および「HET」の2個のマーク対象短文字列がある。マーク対象短文字列「EIT」は前方に1文字を十分超える空白があり、後方は「HET」との間に4文字分の空白がある。マーク対象短文字列「HET」は前方「EIT」との間に4文字分の空白、後方には1文字を十分超える空白がある。なお、当然のことであるが、このマークシートでは、マーク対象短文字列内以外の空白は2文字以上にすることによってマーク対象短文字列内の空白として認識されないようにしなければならない。次の操作として、文字列図7の第1行目のマーキング方法に従って、マーキングした。そのマーキング済みのマークシートの上面図を図9に示した。このマーキング済みのマークシートを前記の試作改造した光学式文字認識装置によって読取り、文字列データとしてパソコンに出力し、パソコン内でデータ処理して図7のマーク対象短文字列の中、第5行の第5行には「ETIH THIT」、第6行の「HET」および第8行の「EIT」の3箇所のマーク対象短文字列がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。
【0026】
実施例1と同理由から、上記のデータ処理の詳細を記述する代わりにマーキング後に光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図9に示した。
マーキング後の文字データ図9と元のマークシートを比較すれば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。この対応付けの過程で、対文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。なお、図6の最終行に着目すると、マーキング前の「HET」の3文字だった短文字列がマーキング後、I、E、H、T以外の4文字の短文字に変化している。このようにマーキングによって、空白が文字に変化することがあるので、マーク対象短文字列の前後の空白は余裕をもって広くとることが望ましい。参考までに図7のマークシートを光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図10に示した。この実施例では、5人の回答者に同じマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて同様にマーキングを判定した。マーキングは全て正しく判定された。図9のマーキング済みマークシートは、その中の1枚である。
【実施例4】
【0027】
図11は実施例4のマークシートの上面図である。このマークシートは医院の問診票を模したものである。詳しい説明は省略するが、「はい」、「いいえ」などの全てのマーク対象短文字列の前後に1文字分以上の余白が設けてある。このマークシートの第2行目のマーキング方法の指示にしたがってマーキングした。マーキング済みのマーキングシートの上面図を図12に示す。この実施例は、マーク対象短文字列の直接上でなく、マーク対象短文字列の周囲の空白部に筆記具で曲線等を記入させることにより実行させる例であり、曲線はマーク対象短文字列を囲む楕円上の曲線である。次にこのマーキング済みのマークシートを市販のレイアウト認識機能を有する光学式文字認識装置によって読取り、CSV形式の文字データとしてパソコンに出力し、マーク対象パソコン内でデータ処理して全てのマーク対象短文字列がマーキングされているか否かを判定した。その結果、マークシートの第2行目のある「満足してない」と「カラーコピーのみ」がマーキングされていることが判定できた。上記のデータ処理の詳細を記述する代わりに前記CSV形式の文字データをメモ帳に入力し、印刷したものを図13に示した。図13と図11を比較して見れば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。なお、この対応付けの過程で、対応する文字列がマーキングの前後で変わらないこと、文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。なお、この実施例では、使用した光学式文字認識装置のデータ出力において、余白がある場所で改行を行なうレイアウトミスがあることがあることが予め分っていた。この実施例では、最終行でその現象が起きている。したがってマーキング前後の対応する文字列を求めるためのデータ処理において行のデータを活用できないが、空白によって区切られた文字列の順番を利用して対応関係を求めることができた。このように、使用する光学式文字認識装置の特性を予め調査し、さらに、例えば、この実施例における☆印の位置を利用してマーキング後の文字列の位置を確認するなどしてデータ処理の方法を工夫すればマーキングの有無を確実に判定すること可能である。なお、この実施例のマークシートには、回答要求文の中途にくすり名前中途欄として手書き文字部分が挿入され、記入のための引線がある。このような活字文字以外の図形などが挿入されたマークシートを、レイアウト機能を有しない光学式文字認識装置で読取ろうとすると、図形などが予想もされない文字として読取られるため、マーク位置を正確に判定することが難しい。この実施例では、5人の回答者に図11のマーキングシートに各5回回答させた50枚のマーキング済みマークシートを同様にマーキングについて判定した。マーキングは全て正しく判定された。図9のマーキング済みマークシートは、その中の1枚である。
【0028】
[比較例]
図14は、比較例のマークシートの上面図である。実施例1で試作した光学式文字認識装置を改造し、実施例1文字I、E、H、T、( および)をそれぞれがI、E、H、T、(、)と読取り、それ以外の文字はXと読取り、改行はRと読取って文字列データとして出力する機能を有する光学式文字認識装置(OCR)を試作した。(および)を標識にできるようにするためである。図14である第1行「アンケート」から第8「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図1の第5行は「ETI」と「HET」、第6行の「ETI」、「HET」および第8行の「EIT」および「HET」が回答者がマーキングするマーク対象短文字列である。この比較例の場合、いずれマーク対象短文字列もその前後に空白がない。マーキング後のマークシートを実施例1と同様に光学式文字認識装置で読取ったデータからマーク位置を判定することを、データ解析をする方法を種々工夫したが、正確にマーク判定することができなかった。実施例1と同様50枚のマーキング済みマークシートによって行なったが、中には正しく判定されるものもあるが、大部分が正しく判定されなかった。正しく判定される主な原因は、マーキングにより、(あるいは、)が他の文字種に変化し、標識としての機能を失うこと、さらにその変化によって、他の文字との境界が判別できなくなるためである。その他の原因としては、光学式文字認識装置以外の文字である文字Iまたは文字しが文字)もしくは文字)に誤認識されることであった。次に、両側の()を含めてマーク対象短文字列として認識することも試みたが同様に正しく判定できなかった。さらに、実施例4と同じようにレイアウト認識機能を有する光学式文字認識装置によって読取る方法を試みたが、マーク対象短文字列の前後に空白がないため、読取後の認識データにおいて、マーク対象短文字列の文字列は前後の他の文字列と連接した文字列になるため、全くマーク判定を正しくできなかった。
【図面の簡単な説明】
【0029】
【図1】実施例1のマークシートの上面図
【図2】実施例1のマーキング済みマークシートの上面図
【図3】実施例1のマーキング済みマークシートを光学的文字認識装置で読取った文字データ出力の内容を示す図
【図4】実施例1のマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図5】実施例2のマーキング済みマークシートの上面図
【図6】実施例2のマーキング済みマークシートを光学的文字認識装置で読取った文字データ出力の内容を示す図
【図7】実施例3のマークシートの上面図
【図8】実施例3のマーキング済みマークシートの上面図
【図9】実施例3のマーキング済みマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図10】実施例3のマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図11】実施例4のマークシートの上面図
【図12】実施例4のマーク済みマークシートの上面図
【図13】実施例4のマーキング済みマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図14】比較例のマークシートの上面図
【技術分野】
【0001】
本発明は各種のアンケート、設問形式のテスト、問診票、マーク選択欄を有する帳票類などに用いられるマークシートに関するものである。
【背景技術】
【0002】
マークシートには、従来よりOMRによってマーク位置を認識し、データとして取得する方式が広く知られている。この方式は、専用の読取り装置が必要なこと、マーク記入枠やその他の部分がドロップアウトカラーで印刷されているため、マークシートの記述内容が視認しにくいなどの欠点がある。イメージスキャナもしくはファックス等の走査型の光学画像読取装置でマーク記入後のマークシートを読取り、元のマークシートの画像とマーク記入後の画像を画像処理によって比較することによって、マークを認識する光学画像読取方式が多数提案がされている。これらの提案によって、専用の読取り装置が不要となり、単色印刷のマークシートが可能となりOMRを用いる方式の幾つかの欠点が解決されつつある。しかしながら、これらの光学画像読取方式についての公知の提案の多くが、○、0 、「」、□などのマーク枠で囲まれた部分を筆記具にて塗りつぶすことによってマークすることを踏襲している。そのため、マーク対象自体が文字として意味を有していないこと、マーク対象が列状に密集して配置しているため、記入者が箇所を間違えてマークし易いなどの欠点がある、これらの欠点の改善のための提案が特許文献1、特許文献2など幾つか開示されているが、これらの欠点が十分改善されたとは言い難いのが現状である。
【0003】
本願発明者は、これらの欠点を解決する手段として、マークシートの被マーク対象文字を筆記具でマークさせ、マーク済みマークシートを光学式文字読取装置(以下OCRと呼ぶ場合がある)で読取って光学画像を文字データに変換し、その文字データをデータ処理して、被マーク対象文字の異なる文字への変化によってマークされたか否かを認識する方式を特許文献3および4において提案した。
【特許文献1】特開2002−7980の公報
【特許文献2】特開平5−19436の公報
【特許文献3】特開平2004−46751の公報
【特許文献4】特開平2005−173673の公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
本願発明者が以前提案した特許文献3および4によるOCRによってマーキング済みのマークシートを読取るマークシート方式は、従来のOMRの方式と従来の画像認識方式の欠点を共に解決する有効な手段である。他の光学画像をデータ処理する方式ではマーク対象の黒度の変化によってマークの有無を判定するが、この方式では文字の変化によって判定する。この方式では、マーキング前のマーク対象文字がマーキング後のどの文字になっているか対応をつけることができれば、文字の変化を認識することは比較的容易である。しかしながらこの対応を確実に行なうことは容易でない。何故ならば、従来の他の画像を画像処理する方式の場合のようにマークシート上の幾何学的位置によって対応することができず、対応は専ら文字列中の順位、文字種の比較などに依存しているためである。さらにこの対応を複雑にし、難しくする要因がある。この方式において、被マーク対象文字列をマーキングするとOCRは、通常の被マーク対象文字列中の文字と異なった文字に変化する。文字種の変化と同時に文字数の変化も認識される。そのため、行中の文字列中の被マーク対象文字の位置が、元のマークシートとマーク済みマークシートの間で変化する。また、被マーク対象文字列以外のマークシートの文字も時に被マーク対象文字列中の文字種にご認識されることがある。本願発明者らは、この対応の困難を如何に解決するかを追求し、先ず、標識文字を付加することによる方法を特許文献3で提案した。しかしながら、特許文献3の提案では、多数のしかも無意味な標識文字がマークシート上に存在するため、マークシートの体裁が悪い欠点がある。続いて提案した特許文献4の方式は、マークされた被マーク対象の位置をマーク対象の存在する表中の行および列によって検出したため、この対応を確実にできる特長があるが、マークシートの外見がやや堅苦しい印象を与える欠点がある。これらの欠点は、特にアンケートに用いるマークシートの場合に不利となる。さらに、このOCRを用いる方式を2単語以上からなる被マーク対象文字列に適用することに多くの努力を積んできたが、前述の対応が困難であることから適当な方法が実証されていない。
【0005】
本発明の課題は、従来のマークシート方式の欠点を有せず、さらに、発明者が以前提案した特許文献3と特許文献4の方式の欠点を改善し、無意味な記号の多用を避けた体裁のよい、複数単語のマーク対象に適用可能な平文のマークシートを提案することである。
【課題を解決するための手段】
【0006】
このような種々な問題を解決するため、多くの試行を重ねた結果、到達したのが空白を標識に用いることである。空白でない他の記号などを標識に用いると、誤認識によって、その標識が他の文字として認識されることがあること、被マーク対象文字列中の標識以外の文字がマーキングによって標識と同じ文字に変化することがあること、被マーク対象文字列以外の説明文中の文字が誤認識等によって標識として認識されることがあることなどの原因で、前記の対応が確実にできない。その対策として、標識として複数の記号を用いると改善できるが、マークシートの見栄えが悪くなり、マークシートのデザインがそれによって制限を受ける。しかし、空白を標識として用いればどのように多数用いても文の意味と、外観への影響が極めて少ないからである。また、マークシートのデザインへの制約への影響も少ない。当初、マークシート中に多数存在する空白を標識に用いることは難しいと思われたが、意外にも、他の部分の空白の存在は障碍にならないことが実証された。さらに実証された重要な要素は、マーク対象短文字列の必ず前後両側に空白を置くことである。片側のみでは問題は解決できない。なぜなら文字にマーキングする方式では、通常マーク対象短文字列中の文字種のみでなく、文字数も変化する。さらに元の文字列中の文字は変化せず、前または後ろに他の文字を付加する変化もある。このような多様な変化を確実に把握するためには、マーク対象短文字列の前後を明確に標識で区切って他の部分と分離することが必須である。記号でなく空白を用いる他の利点は、レイアウト認識機能を有するOCRとの組合せにおいて発揮される。レイアウト認識機能では空白を領域の境界とみなすため、空白をマーク対象短文字列の両側に配置することによって、マーク対象短文字列を他の部分から仕切ることができ、マーク対象短文字列のマーキング前後の変化を正確な判定を可能にする。他の記号等はレイアウト認識に関して全く役立たない。空白の利用によって、レイアウト認識機能を有するOCRの機能を十分に引き出すことができた。
【0007】
さらに、この検討段階で、平文のマークシートにおいて、欧文のような空白を含む被マーク対象文字列にも、文字にマーキングする方式を適用できることが実証できた。
【0008】
課題を解決するための第1の手段は、複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ各該マーク対象短文字列は前後に隣接する他の文字列との間が少なくとも1文字分の空白によって離隔されている回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式である。
【0009】
第2の手段は複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ1個以上の該マーク対象短文字列が空白文字を含むものである回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式である。
【0010】
第3の手段は第1の手段に加えて空白文字も含むマーク対象短文字列を回答要求文中に有することであり、第4の手段は、第1および第2の手段に加えて、レイアウト認識機能を有する光学式文字認識装置を用いることである。
【発明の効果】
【0011】
本発明のマークシートは、平文中に配置した例えば“はい”などの被マーク対象短文字列上を直接引線してのマーキング、その短文字列周囲の余白にアンダーラインするマーキング、短文字列の周囲を丸く囲むことによってマーキングすることができ、さらに、VERY GOODなどの空白文字を含む複数単語の被マーク対象短文字列とすることができた。これによって、従来のマークシートの欠点を解決すると共に、参考文献3および4の堅苦しい印象を改善したアンケート用途などに好適なマーク方式を実現することができた。
【発明を実施するための最良の形態】
【0012】
実施例の説明に先立ち、本発明の請求範囲に用いられている用語などについて説明する。本請求範囲に云う回答要求文は、アンケート用紙などのマークシートの主要要素であって、複数のマーク対象短文字列に加え、質問項目名、質問、説明、回答の方法指示その他の文字列および空白によって構成される。回答要求文には、OCRによって文字として認識されない手書き記入欄、図、写真、表、空白などを必要に応じて挿入してもよい。マークシートは、紙、フィルムなどの平面媒体の面にインクなどによって回答要求文とその他の図形などを印刷などの技術によって描写した物である。一般にマークシートは白色、明色、もしくは無色の媒体表面に暗色の文字を印刷した物であるが、逆に、暗色の媒体表面に白色、明色、もしくは無色の文字、図形などを描写した印刷物も本発明のマークシートとして使用できる。
【0013】
本請求範囲に云う「文字」は、マークシート中の文字にあっては、文字、記号および空白文字を意味する。他方、文字データにあっては、文字、記号に加え、空白文字、および制御文字を含める。両者で定義が異なる理由は、マークシートにあっては制御文字は存在しないからである。
本請求範囲で云う、空白とは、作成方法にかかわらない。したがって空白文字によって作成されたものも空白に含める。他方、制御文字列中の空白は作成方法によらず空白文字と呼ぶことにする。
【0014】
本発明の効果を達成するためには、マークシート中の文字はOCRによる読取り時に、正しく認識される字体のものを用いることが好ましい。一般に、日本語の場合、行書体、草書体よりも明朝体、ゴシック体などの楷書形の活字体の方が適している。
本請求範囲1に云う「マーク対象短文字列」とは、アンケートなどマークシートの回答者に回答のためのマーキングを施す対象とする短い文字列である。文字列の長さは、通常10以下長くても15以下程度である。
本請求範囲に云う文字列は、単数もしくは、複数の文字と空白文字からなる文字の列を云う。 「マーク対象短文字列」には、A、1、イなどの単文字のもの、はい、いいえ、どちらとも言えない、(はい)、(いいえ)、Aはい、Bいいえ、Yes、Noなどの複数文字の文字列、Very Good、Not YeTなどの空白文字を有する文字列がある。
本請求範囲に云う「周囲の空白部」とは、マーク対象短文字列の前後に接して存在する空白と余白、およびマーク対象短文字列の上下に接して存在する行間、空白行と余白を意味する。ここで余白とは、行頭、行末、文頭及び文末と紙面の周囲との間の空白を意味する。
【0015】
本請求範囲に云う「曲線等」とは、線、曲線などで描いた通常の図形に加え、文字あるいは記号状の形状を有する図形も含まれる。曲線等の例としては、マーク対象小行列上に描かれる例としては、水平線、水平に二重線、斜線、チェック形線などがある。マーク対象小行列の周囲の余白にマーキング図形を描く例としては、下方行間の空白部に描かれたアンダーライン、マーク対象小行列の周りを囲む円・楕円または方形、マーク対象短行列の前方空白部に描く丸印、X印などがある。これらのマーキング図形は必ずしもマーク対象小行列の全域に渡って描く必要は無く、マークしたことが判別できれば、マーク対象小行列の一部の文字あるいは周囲の空白部の一部のみを限定してマーク対象に指定することもできる。本請求範囲に云う筆記具には鉛筆、ボールペンなどの通常の筆記具の他に、スタンプも含むものとする。
【0016】
本請求範囲1に云う少なくとも1文字分の空白において1文字分における文字幅の基準は、マーク対象短文字列の文字の中の空白に接する文字の活字幅とする。もし、空白が1文字分の場合にあって、かつ、空白の前後の文字の活字幅が異なる場合は、大きな方の活字幅とする。また、デザイン上許されれば、1文字分よりもできるだけ幅広の空白が好ましい。
【0017】
本請求範囲に云う光学式文字認識装置とは、別名OCRと呼ばれ、平面媒体上に印刷された文を光学的に画像として読取って、その画像を文字データに変換する機能を有する装置である。一体の装置もあるが、通常イメージスキャナと文字認識ソフトの組合せとして入手できる。なお、本提案に使用する光学式文字認識装置としては、平面媒体上に印刷された文字は、相対位置をできるだけ保ったまま同一の文字として認識し、マーキングされた文字列は元の文字列と異なる文字列として認識されることが好ましい。
【0018】
本請求範囲に云うレイアウト認識機能を有する光学式文字認識装置とは、入力された画像に対して、文字・表・画像・図形などの属性を分類して認識し、それらの情報を分離もしくは総合して出力することができる光学式文字認識装置を意味する。
【0019】
レイアウト認識機能を有する光学式文字認識装置を用いる最大の利点は、マークシートの文中に挿入される図形、手書き部分の文字、表領域などを確実に除外し、活字文字の回答要求文のみを文字データとして出力できることである。図形などの挿入されたマークシートをレイアウト機能を有しない光学式文字認識装置で読取ると、図形などを文字として認識するため、元のマークシートにない多くの文字が読取り文字データに付加されるため、マーキングの判定が困難になる。その他、挿入された表形のマークシートを分離し、別途マーキング認識することができること、挿入された手書き文字回答部分を分離して別途読取ることができる利点がある。
【0020】
本請求範囲に云う「文字列変化の有無」には、認識誤りが起き易い文字を除外し、マーク対象短文字列中の一部の文字で構成した短文字列のマーキング前後の変化の「文字列変化の有無」も包含される。各該マーク対象短文字列の文字列変化の有無は、通常マーキング前後の短文字列全体の相互比較によって行なう。しかし、短文字列の中に、光学的文字認識装置によって認識誤りが起き易い文字が含まれている場合には、その文字を除外した文字列を比較する方がマーク判定の目的に合致するからである。さらに、あるマーク対象短文字列がマーキング後の文字認識データにおいて、元の文字列の前または後ろに他の文字が付加した文字列に変化する場合も文字列変化が有と定義する。
【実施例1】
【0021】
この提案を実証するため、文字I、E、H、TをそれぞれがI、E、H、Tと読取り、それ以外の文字はXと読取り、1個以上の余白はWと読取り、改行はRと読取って文字列データとして出力する機能を有する光学式文字認識装置(OCR)を試作した。OCRは本来全ての文字種が正しく読取れるものにすべきであるが、試作を容易にするため文字種をI、E、H、T限定したものである。図1は実施例1のマークシートの上面図である。この実施例において、図1の第1行「アンケート」から第8「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図1の第5行は「ETI」と「HET」は共に請求範囲に云うマーク対象短文字列である。「ETI」は前方には1文字を十分超える空白があり、後方は「HET」との間に2文字分の空白がある。「HET」は前方には「ETI」との間に2文字分の空白があり、後方には1文字を十分超える空白がある。図1の第6行は「ETI」と「HET」がマーク対象短文字列である。「ETI」は、前方にある文字列の最後の文字Tとの間に4文字文の空白があり、後方の「HET」との間に2文字文の空白がある。さらに、第8行には「EIT」および「HET」の2個のマーク対象短文字列がある。「EIT」は前方に1文字を十分超える空白があり、後方は「HET」との間に1文字分の空白がある。
【0022】
この実施例では文字種が限られて無意味なため、各マーク対象短文字列であることが分り難いが、実際のマークシートでは、これらの各マーク対象短文字列は、回答としての意味を有し、それら以外の回答要求文中の文字列は表題、説明指示である文意を有することから回答者には説明を要しない。次に、文字列図1の第1行目のマーキング方法に従って、マーキングした。そのマーキング済みのマークシートの上面図を図2に示した。このマーキング済みのマークシートを前記の試作したOCRによって読取り、文字列データとしてパソコンに出力した。パソコン内でデータ処理して図1のマーク対象短文字列の中、第5行の「ETI」、第6行の「HET」および第8行の「HET」がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。
【0023】
紙面の節約と理解を容易にするための両理由から、上記のデータ処理の詳細を記述する代わりに前記試作したOCRで図2のマーキング済みシートを読取った文字列データをメモ帳に入力し、印刷したものを図4にマーキング済みマークシートをOCRで読取った出力データ内容を示す図として示した。実際の操作では、出力データをパソコン中で処理するのであるが、この図は、その内容を便宜上印刷して目に見えるようにしたものである。当業者でなくても、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列の比較は容易であることが理解できよう。この対応付けの過程で、空白で仕切られた短文字列の全文中の順がマーキングの前後で変わらないことが利用できる。この実施例によって、マーク対象短文字列の前後に空白を置くことの効用は、全文の文字列を明確に区切って、細分化して順序を正確に把握可能とし、さらにマーク対象短文字列を他の部分から完全に分離化することができるため、マーキング前後のマーク対象短文字列の比較が正確にできることにあることが分る。なお、実施例においては、OCRの出力を直接データ処理したが、その出力を一旦エクセルなどの表ソフトに入力し、短文字列の位置を、表の行と列の組合せに変換した後、データ処理してもよい。なお、データ処理に必要ではないが、参考までにマーキング前の図1マークシートを読取った文字列データをメモ帳に入力し、印刷したものを図5に示した。この実施例では、5人の回答者に図1のマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて、同様にマーキングを判定した。マーキングは全て正しく判定された。なお、図2のマーキング済みマークシートは、その中の1枚である。
【実施例2】
【0024】
この実施例は、マーク対象短文字列の周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段であるこの提案の一例である。図5はこの実施例のマーキング済みのマークシートの上面図である。紙面節約のため、元のマークシートの図は省略したが、この
マークシートは、マーキングが、マーク対象短文字列の周囲を楕円状に囲んでマーキングすること以外、実施例1と大差がない。その他相違する点は、周囲の空白部にマークを記入するため、実施例1に比較して、前後に隣接する他の文字列との空白の幅を広く取り、全てのマーク対象短文字列が前後の隣接する他の文字列との空白の幅4文字分以上とした。
これは、マーク対象短文字列の前後の空白部にマークの曲線が光学式文字認識装置により文字として認識されることがあるため、マーキング後の空白の有効幅が減少するため、マーキング後にも空白1文字分を確保するための措置である。次の操作として、このマーキング済みのマークシートを実施例1と同一の光学式文字認識装置によって読取り、文字列データとしてパソコンに出力した。パソコン内でデータ処理した結果、図5のマーク対象短文字列の中、第5行の「ETI」、第6行の「ETI」および第8行の「HET」がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。実施例1と同理由から、上記のデータ処理の詳細を記述する代わりにマーキング後に光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図6に示めした。マーキング前のマークシートと比較すれば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。この対応付けの過程で、対文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。この実施例では、5人の回答者に同じマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて同様にマーキングを判定した。マーキングは全て正しく判定された。上記図5のマーキング済みマークシートは、その中の1枚である。
【実施例3】
【0025】
この実施例は、この提案の方式がマーク対象短文字列中に空白文字もしくは空白を含む場合にも適用できることを示す一例である。このような適用は特に欧文の場合に有用である。欧文のマークシートの場合、Very Good 、Not Yetなど空白を含むマーク対象短文字列にも適用できると便利だからである。適用可能なことを実証するため、先ず、実施例1で試作した光学式文字認識装置を改造し、2字分以上の連続した余白があるときはWと読取るが1字分の単独の空白は無視するように改造した。その他の機能は実施例1の場合と同じである。 次に上面図が図7のマークシートを作成した。この実施例において、図7の「アンケート」から第8行の「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図8の第5行には「ETIH THIT」と「HET THIE」の2個のマーク対象短文字列がある。 マーク対象短文字列「ETIH THIT」は前方に1文字分を十分に越す空白、後方の「HET THIE」との間には10文字分の空白」を有する。一方マーク対象短文字列「HET THIE」は前方の「ETIH THIT」との間に10文字分の空白」を後方には1文字分を十分に越す空白を有している。さらに、これらのマーク対象短文字列は共に文字列内に1文字幅の空白を含んでいる。これらの空白は、Very Goodなど欧文などでの複数単語から成るマーク対象短文字列を模したものである。さらにこのマークシートには、第6行に「ETI」と「HET」がマーク対象短文字列である。「ETI」は、前方にある文字列の最後の文字Tとの間に4文字文の空白があり、後方の「HET」との間に4文字文の空白がある。さらに第8行には「EIT」および「HET」の2個のマーク対象短文字列がある。マーク対象短文字列「EIT」は前方に1文字を十分超える空白があり、後方は「HET」との間に4文字分の空白がある。マーク対象短文字列「HET」は前方「EIT」との間に4文字分の空白、後方には1文字を十分超える空白がある。なお、当然のことであるが、このマークシートでは、マーク対象短文字列内以外の空白は2文字以上にすることによってマーク対象短文字列内の空白として認識されないようにしなければならない。次の操作として、文字列図7の第1行目のマーキング方法に従って、マーキングした。そのマーキング済みのマークシートの上面図を図9に示した。このマーキング済みのマークシートを前記の試作改造した光学式文字認識装置によって読取り、文字列データとしてパソコンに出力し、パソコン内でデータ処理して図7のマーク対象短文字列の中、第5行の第5行には「ETIH THIT」、第6行の「HET」および第8行の「EIT」の3箇所のマーク対象短文字列がマーキングされ、それ以外のマーク対象短文字列はマーキングされていないことが判定できた。
【0026】
実施例1と同理由から、上記のデータ処理の詳細を記述する代わりにマーキング後に光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図9に示した。
マーキング後の文字データ図9と元のマークシートを比較すれば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。この対応付けの過程で、対文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。なお、図6の最終行に着目すると、マーキング前の「HET」の3文字だった短文字列がマーキング後、I、E、H、T以外の4文字の短文字に変化している。このようにマーキングによって、空白が文字に変化することがあるので、マーク対象短文字列の前後の空白は余裕をもって広くとることが望ましい。参考までに図7のマークシートを光学式文字認識装置で読取った文字列データをメモ帳に入力し、印刷したものを図10に示した。この実施例では、5人の回答者に同じマーキングシートに各5回回答させた50枚のマーキング済みマークシートについて同様にマーキングを判定した。マーキングは全て正しく判定された。図9のマーキング済みマークシートは、その中の1枚である。
【実施例4】
【0027】
図11は実施例4のマークシートの上面図である。このマークシートは医院の問診票を模したものである。詳しい説明は省略するが、「はい」、「いいえ」などの全てのマーク対象短文字列の前後に1文字分以上の余白が設けてある。このマークシートの第2行目のマーキング方法の指示にしたがってマーキングした。マーキング済みのマーキングシートの上面図を図12に示す。この実施例は、マーク対象短文字列の直接上でなく、マーク対象短文字列の周囲の空白部に筆記具で曲線等を記入させることにより実行させる例であり、曲線はマーク対象短文字列を囲む楕円上の曲線である。次にこのマーキング済みのマークシートを市販のレイアウト認識機能を有する光学式文字認識装置によって読取り、CSV形式の文字データとしてパソコンに出力し、マーク対象パソコン内でデータ処理して全てのマーク対象短文字列がマーキングされているか否かを判定した。その結果、マークシートの第2行目のある「満足してない」と「カラーコピーのみ」がマーキングされていることが判定できた。上記のデータ処理の詳細を記述する代わりに前記CSV形式の文字データをメモ帳に入力し、印刷したものを図13に示した。図13と図11を比較して見れば、あるマーク対象短文字列とマーキング後の文字列との対応がデータ処理によって容易にできること、対応がつけば、文字列比較が容易であることが理解できよう。なお、この対応付けの過程で、対応する文字列がマーキングの前後で変わらないこと、文字列の全文中の順がマーキングの前後で変わらないことなどが利用できる。なお、この実施例では、使用した光学式文字認識装置のデータ出力において、余白がある場所で改行を行なうレイアウトミスがあることがあることが予め分っていた。この実施例では、最終行でその現象が起きている。したがってマーキング前後の対応する文字列を求めるためのデータ処理において行のデータを活用できないが、空白によって区切られた文字列の順番を利用して対応関係を求めることができた。このように、使用する光学式文字認識装置の特性を予め調査し、さらに、例えば、この実施例における☆印の位置を利用してマーキング後の文字列の位置を確認するなどしてデータ処理の方法を工夫すればマーキングの有無を確実に判定すること可能である。なお、この実施例のマークシートには、回答要求文の中途にくすり名前中途欄として手書き文字部分が挿入され、記入のための引線がある。このような活字文字以外の図形などが挿入されたマークシートを、レイアウト機能を有しない光学式文字認識装置で読取ろうとすると、図形などが予想もされない文字として読取られるため、マーク位置を正確に判定することが難しい。この実施例では、5人の回答者に図11のマーキングシートに各5回回答させた50枚のマーキング済みマークシートを同様にマーキングについて判定した。マーキングは全て正しく判定された。図9のマーキング済みマークシートは、その中の1枚である。
【0028】
[比較例]
図14は、比較例のマークシートの上面図である。実施例1で試作した光学式文字認識装置を改造し、実施例1文字I、E、H、T、( および)をそれぞれがI、E、H、T、(、)と読取り、それ以外の文字はXと読取り、改行はRと読取って文字列データとして出力する機能を有する光学式文字認識装置(OCR)を試作した。(および)を標識にできるようにするためである。図14である第1行「アンケート」から第8「HET」までの空白を含む文字列が請求範囲に云う回答要求文である。図1の第5行は「ETI」と「HET」、第6行の「ETI」、「HET」および第8行の「EIT」および「HET」が回答者がマーキングするマーク対象短文字列である。この比較例の場合、いずれマーク対象短文字列もその前後に空白がない。マーキング後のマークシートを実施例1と同様に光学式文字認識装置で読取ったデータからマーク位置を判定することを、データ解析をする方法を種々工夫したが、正確にマーク判定することができなかった。実施例1と同様50枚のマーキング済みマークシートによって行なったが、中には正しく判定されるものもあるが、大部分が正しく判定されなかった。正しく判定される主な原因は、マーキングにより、(あるいは、)が他の文字種に変化し、標識としての機能を失うこと、さらにその変化によって、他の文字との境界が判別できなくなるためである。その他の原因としては、光学式文字認識装置以外の文字である文字Iまたは文字しが文字)もしくは文字)に誤認識されることであった。次に、両側の()を含めてマーク対象短文字列として認識することも試みたが同様に正しく判定できなかった。さらに、実施例4と同じようにレイアウト認識機能を有する光学式文字認識装置によって読取る方法を試みたが、マーク対象短文字列の前後に空白がないため、読取後の認識データにおいて、マーク対象短文字列の文字列は前後の他の文字列と連接した文字列になるため、全くマーク判定を正しくできなかった。
【図面の簡単な説明】
【0029】
【図1】実施例1のマークシートの上面図
【図2】実施例1のマーキング済みマークシートの上面図
【図3】実施例1のマーキング済みマークシートを光学的文字認識装置で読取った文字データ出力の内容を示す図
【図4】実施例1のマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図5】実施例2のマーキング済みマークシートの上面図
【図6】実施例2のマーキング済みマークシートを光学的文字認識装置で読取った文字データ出力の内容を示す図
【図7】実施例3のマークシートの上面図
【図8】実施例3のマーキング済みマークシートの上面図
【図9】実施例3のマーキング済みマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図10】実施例3のマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図11】実施例4のマークシートの上面図
【図12】実施例4のマーク済みマークシートの上面図
【図13】実施例4のマーキング済みマークシートを光学的文字認識装置で読取った出力データ内容を示す図
【図14】比較例のマークシートの上面図
【特許請求の範囲】
【請求項1】
複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ各該マーク対象短文字列は前後に隣接する他の文字列との間が少なくとも1文字分の空白によって離隔されている回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式
【請求項2】
複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ1個以上の該マーク対象短文字列が空白文字を含むものである回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式
【請求項3】
空白文字も含むマーク対象短文字列を回答要求文中に有することを特徴とする請求項1に記載のマークシート方式
【請求項4】
光学式文字認識装置がレイアウト認識機能を有することを特徴とする請求項1および請求項2に記載のマークシート方式
【請求項1】
複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ各該マーク対象短文字列は前後に隣接する他の文字列との間が少なくとも1文字分の空白によって離隔されている回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式
【請求項2】
複数の行で構成され、該行は0個以上のマーク対象短文字列を含み、かつ1個以上の該マーク対象短文字列が空白文字を含むものである回答要求文を印刷した平面媒体からなるマークシートに、該マーク対象短文字列の直接上またはその周囲の空白部に筆記具を用いて曲線等を記入させるマーキング手段によって任意の該マーク対象短文字列にマーキングさせてマーキング済みマークシートを取得し、次いで該マーキング済みマークシートを光学式文字認識装置によって認識させて文字データに変換し、該文字データをデータ処理することによってマーキング前後の各該マーク対象短文字列の文字列変化の有無を認識し、該有無に基づき各該マーク対象短文字列がマークされたか否かを判定することを特徴とするマークシート方式
【請求項3】
空白文字も含むマーク対象短文字列を回答要求文中に有することを特徴とする請求項1に記載のマークシート方式
【請求項4】
光学式文字認識装置がレイアウト認識機能を有することを特徴とする請求項1および請求項2に記載のマークシート方式
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2008−225524(P2008−225524A)
【公開日】平成20年9月25日(2008.9.25)
【国際特許分類】
【出願番号】特願2007−58311(P2007−58311)
【出願日】平成19年3月8日(2007.3.8)
【出願人】(302042818)
【Fターム(参考)】
【公開日】平成20年9月25日(2008.9.25)
【国際特許分類】
【出願日】平成19年3月8日(2007.3.8)
【出願人】(302042818)
【Fターム(参考)】
[ Back to top ]