説明

手書き文字テキスト化システム

【課題】ノートに記入された手書き文字の高精度な読み取りが可能で、かつノートの不正利用も防止可能な手書き文字テキスト化システムを提供する。
【解決手段】端末に搭載したデジタルカメラが撮影した文字画像データを、通信回線網を利用してサーバに送信し、文字画像データをテキストデータ化処理部によりテキストデータに変換するように構成すれば、ノートに記入した手書き文字のテキストデータ化処理を高精度で行うことができる。しかも、ノートに付した2次元コードを利用し、サービス利用前にノートの認証を行うため、手書き文字の消去やノートコピーなどによるテキストデータ化処理サービスの利用回数の不正を防止できる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、手書き文字テキスト化システム、詳しくはノートに記入された手書き文字を、サーバのテキストデータ化処理部を利用してテキストデータ化する手書き文字テキスト化システムに関する。
【背景技術】
【0002】
近年、手書きした内容を電子データ化する技術として、例えば、ノートに記入した手書き文字をスマートフォンのデジタルカメラにより撮影し、スマートフォンにインストールしたアプリケーションにより、文字画像データを画面に表示するとともにストレージに記憶させる株式会社キングジム製の「ショットノート」が開発されている(非特許文献1)。
非特許文献1では、紙面の四隅に印されたガイドマークを利用し、アプリケーションに搭載された歪補正部により文字画像データの歪みを補正するとともに、アプリケーションに搭載された簡易なOCR(Optical Character Reader)機能によって、ヘッダの日付と整理番号とのみを光学的に読み取ってテキストデータ化し、これらを文字画像データと関連付けてアプリケーションのストレージに記憶することで、ノートへの手書き内容の検索を容易としていた。
【先行技術文献】
【特許文献】
【0003】
【非特許文献1】[平成23年9月25日検索]、インターネット〈URL:http://www.kingjim.co.jp/sp/shotnote/〉
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1の「ショットノート」では、手書き文字を文字画像データのままで画面表示し、かつアプリケーションのストレージに記憶していた。そのため、例えばストレージに文字画像データとして記憶した議事録を、クライアントが電子メールを利用して関係者に文書で送信したい場合には、まずアプリケーションを起動し、テキストデータ化されたヘッダの日付や整理番号をインデックスとして、その議事録の文字画像データをスマートフォンのディスプレイに読み出し、それの内容をパソコンのワープロソフトにキーボードによって入力し、テキストデータ化する必要があった。
そこで、このようなクライアントに手入力を強いる煩わしさを解消するため、読み取り対象が数字のみという従来の簡易なOCRではなく、手書き文字を光学的に読み取る高精度なOCRを、アプリケーションに搭載することが考えられる。しかしながら、このように手書き文字も読み取れるOCRでは、読み取り精度が十分とは言えなかった。
【0005】
そこで、本発明者らは鋭意研究の結果、スマートフォンに搭載したデジタルカメラにより撮影した文字画像データを、通信回線網を利用してセンタのサーバに送信し、ここで文字画像データをテキストデータに変換すればよいことに想到した。すなわち、サーバにオペレータの端末から送信された読み取り結果としての(部分)テキストデータを利用する文字画像データのテキストデータ化処理部を設ければ、手書き文字(活字を含む)の高精度なテキストデータ化処理を行えることを知見するに至った。
しかしながら、サーバ側では、このテキストデータ化処理サービスをクライアントが利用する前に、クライアントが利用するノートの大きさや頁数などを把握しておく必要がある。その理由は、例えば手書き文字の消去やノートをコピーするといったテキストデータ化処理部の利用回数の不正を防止するためである。そこで、発明者は、ノートにQRコード(登録商標)などの2次元コードを印字し、これを利用して事前にノートのアクティベート(認証処理)をクライアント(ユーザ)に行わせ、その際、購入したノートのテキストデータ化利用回数の情報を取得するように構成すれば、上述した問題はすべて解消することを知見し、この発明を完成させた。
【0006】
この発明は、ノートに記入された手書き文字の高精度な読み取りが可能で、かつノートの不正利用も防止することができる手書き文字テキスト化システムを提供することを目的としている。
【課題を解決するための手段】
【0007】
この発明は、文字の手書きスペースを有し、ノート認証用の2次元コードが表示された手書き用のノートと、前記手書きスペースに記入された手書き文字を撮影するデジタルカメラと、前記2次元コードを読み取る2次元コードリーダと、通信回線網を利用する端末側の通信部とを搭載した端末と、前記端末側の通信部よりそれぞれ送信された前記2次元コードリーダによる前記2次元コードの読み取りデータと、前記デジタルカメラによる前記手書き文字の文字画像データとを、前記通信回線網を利用して受信するサーバ側の通信部が搭載されたサーバと、前記サーバに設けられ、かつ前記2次元コードの読み取りデータを受信することで、前記ノートの利用を認証するとともに、該ノートによる前記テキストデータ化処理部の利用回数のデータを取得するノート認証部と、前記文字画像データを読み取ってテキストデータに変換するテキストデータ化処理部とを備えた手書き文字テキスト化システムである。
【0008】
ここでいう「ノート」とは、複数枚の紙(頁紙、用紙)を横綴じまたは縦綴じしたノートブック(帳面、冊子など)である。また、紙1枚だけのものでもよい。ノートサイズとしては、例えばA7,A5,A1が挙げられる。紙の手書きされる紙面(手書き面)は、例えば紙の表面である。
「手書き文字」とは、鉛筆、シャープペンシル、ボールペン、マジックペン、筆などの筆記具を用いて、人手により書かれた字(漢字、ひらがな、カタカナ、数字、アルファベットなど)で、印刷機により印刷された活字とは異なる。
「手書きスペース」とは、通常、紙の手書き面の全部または中央部のみであるが、例えば手書き面の上部のみ、下部のみまたは外周部のみでもよい。手書きスペースには、横罫や縦罫、マス目などを記入してもよい。
【0009】
また、ノート紙面の撮影画像の歪みを、例えば端末のアプリケーションの歪補正機能により補正するようにしてもよい。補正法としては、台形補正法(射影変換)などを採用することができる。具体的には、デジタルカメラにより紙面を撮影し、その撮影画像の中から四隅のガイドマークを探し出し、発見した四隅のガイドマークを利用して、台形補正法によって、撮影画像を矩形状の整った紙面画像に変換する。これと同時に、端末のアプリケーションのノート種類特定機能により、四隅のガイドマークの形状や配列に基づき、読み取り対象のノートの種類(ノートサイズ、ノート等級)を特定する。
【0010】
ここでいう「ノート認証」とは、アプリケーションのアクティベート機能により行われ、該当ノートに対して利用許可を与える処理である。
ここでいう「2次元コード(2次元バーコード)」とは、文字や数字などのデータを二次元の図形パターンとして紙面に刻印、印刷したもので、例えば、マトリックス型2次元コード(QRコード)、スタック型2次元コードなどが挙げられる。
ノート上の2次元コードの表示位置は任意である。例えば、ノートの表紙の表面や裏面でも、各紙(頁紙)の紙面でも、表紙と1枚目の読み取り用紙との間に配置された認証専用紙の表面でもよい。この場合、認証専用紙の裏面にアクティベート方法を含むノートの利用方法の説明書きをしてもよい。特に、ノートの表紙をめくった1頁目(認証専用紙)に2次元コードを表示した方が、第三者が店内でノートを購入せずに携帯電話のデジタルカメラで撮影した後に、そのノートを購入したクライアントのアクティベートを妨害することを防止するとともに、利用しやすいという点から好ましい。
【0011】
ここでいう端末とは、例えば個人用の携帯コンピュータの機能を併せ持った携帯電話(スマートフォン)の他、携帯コンピュータの機能を有さない携帯電話、パソコンなどを採用することができる。その他、クライアントが指定した別のパソコンでもよい。
デジタルカメラとしては、例えばCCDカメラ、CMOSカメラなどを採用することができる。
ここでいう「文字画像データ」とは、ノートに記入された手書き文字をデジタルカメラに撮影して得た手書き文字のイメージデータ(静止画像データ)である。例えば、ビットマップ・データ(Bitmap Data)などが挙げられる。
【0012】
2次元コードリーダ(2次元バーコードリーダ)の種類は限定されない。
通信回線網としては、例えばインターネットなどを採用することができる。
端末側の通信部としては、無線伝送用の通信機器を採用することができる。また、サーバ側の通信部としては、有線伝送用の通信機器を採用することができる。一般的に、テキストデータはサーバ側のストレージに記憶し、必要時にクライアントが端末を使用して通信回線網からサーバにアクセスし、ストレージに記憶されたテキストデータを利用する。または、取得後のテキストデータをサーバから端末に返送するようにしてもよい。
テキストデータとは、レイアウト情報や修飾情報を持たない、純粋に文字のみで構成されるデータである。
【0013】
ここでいう「テキストデータ化処理部」とは、例えば、2人以上のオペレータがノートの手書きスペースに記入された手書き文字を読み取り、その読み取り結果をオペレータ端末から送信(入力)することでテキストデータ化する処理部を採用することができる。その他、ノートのヘッダに手書きされた記入日(日付)や、フッタに記載された企業番号、整理番号だけでなく、手書きスペースの手書き文字を光学的に読み取ってテキストデータ化するOCRでもよい。または、オペレータが介在する処理部とOCRとの両方を併用したものでもよい。OCR部を設けた場合には、テキストデータ化処理部に、OCR部によるテキストデータ化が正しく行われたか否かを判定する2人以上のOCR判定オペレータのオペレータ端末から送信された判定結果が一致しているか否かを判定するOCR判定部を設けた方が望ましい。これにより、OCR部による手書き文字の自動読み取りの精度が高まる。
【0014】
ここでいう「2次元コードの読み取りデータを受信することで、ノートの利用を認証する」とは、2次元コード中に図形パターン化されたノート情報(手書きスペース付きの紙面数など)を2次元コードリーダにより読み取り、対象ノートによるテキストデータ化処理部の利用を承認するものである。これに加えて、対象のノートを使用してテキストデータ化処理を何回利用できるかという情報を取得するものである。また、実際に発行しているコードかどうかも偽造防止のためチェックすることができる。
「ノート認証部」とは、アクティベーション(ライセンス認証)を行うソフトウエアである。
【0015】
また、この発明は、テキストデータ化処理部が、文字画像データを複数の部分文字画像データに分割する画像分割部と、1つの部分文字画像データを個別に読み取る2人以上の読み取りオペレータの各オペレータ端末から1つずつ送信された部分文字画像データの読み取り結果としての複数の部分テキストデータが一致しているか否かを判定する部分テキスト判定部と、部分テキスト判定部が一致すると判定した部分テキストデータを記憶する記憶部と、記憶部に記憶したテキストデータの全体分の部分テキストデータを、複数の部分文字画像データに文字画像データを分割した配列に則して繋げることで、テキストデータを作成するテキスト作成部とを有したものとし、テキストデータの作成後、サーバ側の通信部により、通信回線網を利用してテキストデータを端末に返送するようにした方が望ましい。
【0016】
ここでいう「文字画像データを複数の部分文字画像データに分割する」とは、文字画像データを、所定の文字数ごと、所定の紙面領域(所定間隔、所定行数ごと)ごとに細分化することをいう。文字画像データの分割数、分割サイズは任意である。
「部分文字画像データ」とは、文字画像データを画像分割部により分割して得られたデータである。
「画像分割部」とは、この文字画像データの分割を行うソフトウエアである。
「1つの部分文字画像データを個別に読み取る2人以上の読み取りオペレータ」とは、文字画像データを分割して得た複数の部分文字画像データのうち、選出された1つの部分文字画像データについて、互いに協議することなく独自の判断で読み取りを行う2人または3人以上の読み取りオペレータをいう。
【0017】
「各オペレータ端末から1つずつ送信された部分文字画像データの読み取り結果としての複数の部分テキストデータ」とは、2人以上の読み取りオペレータが個別に所有するオペレータ端末から部分テキスト判定部に送信(入力)された各オペレータの部分文字画像データの読み取り結果を意味する。各オペレータ端末からの読み取り結果は1台につき1つずつである。
「部分テキスト判定部」とは、各オペレータ端末から1つずつ送信された複数の部分テキストデータが一致(合致)または不一致かを判定するソフトウエアである。判定の対象となる部分テキストデータが3つ以上の場合の判定としては、例えばすべての部分テキストデータが一致するか否かという判定方法を採用することができる。この場合には、読み取りオペレータの人数が増えるほど、部分文字画像データの読み取り精度が高まる。その他、このすべての部分テキストデータが一致するか否かという判定方法の場合を除く、1組(2つ)以上の部分テキストデータが一致するか否かの判定としてもよい。
【0018】
「記憶部」としては、例えばサーバのホストコンピュータが有する各種のストレージなどを採用することができる。
ここでいう「記憶部に記憶したテキストデータの全体分の部分テキストデータ」とは、読み取り対象としての文字画像データの全体分量にあたる、すべての部分文字画像データについて個別に行われた部分テキスト判定部による一致判定(みなし一致判定を含む)で得られた部分テキストデータ(テキストデータを構成するために必要なすべての部分テキストデータ)を意味する。
ここでいう「テキストデータの全体分の部分テキストデータを、複数の部分文字画像データに文字画像データを分割した配列に則して繋げる」とは、複数の部分文字画像データに文字画像データを分割したときの配列順で、記憶部に記憶されたすべての部分テキストデータ、すなわち部分テキスト判定部による判定で一致(みなし一致判定を含む)しているとされたすべての部分テキストデータを繋げることで、テキストデータを作成することをいう。
「テキスト作成部」とは、サーバのホストコンピュータに設けられた前記すべての部分テキストデータからテキストデータを作成する(組み立てる)ソフトウエアである。
【0019】
また、この発明は、部分テキスト判定部として、1人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、2人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータとが一致しているか否かを判定する第1の部分判定部と、第1の部分判定部の判定結果が不一致だった場合の3人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、1人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否か、および、3人目の部分テキストデータと2人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否かを判定する第2の部分判定部とを有したものを採用し、記憶部に記憶される部分テキストデータは、第1の部分判定部が一致していると判定した部分テキストデータか、第1の部分判定部が一致していないと判定した後の第2の部分判定部が一致していると判定した部分テキストデータとした方が望ましい。
【0020】
記憶部に記憶される部分テキストデータは、第1の部分判定部が一致していると判定した部分テキストデータである。または、第1の部分判定部が一致しないと判定した場合における第2の部分判定部が一致していると判定した部分テキストデータとなる。
さらに、第2の部分判定部による判定で一致するという結果が得られなかった場合には、4人目以降(5人目、6人目…、n人目)の読み取りオペレータのオペレータ端末から送信された部分テキストデータと、それまでに取得された部分テキストデータとが一致しているかを、第3以降(第4、第5…、n−1番目)の部分判定部により一致しているか否かを判定するようにしてもよい。また、4人目以降の読み取りオペレータは、それまでに取得された部分テキストデータを参照し、記憶部に記憶すべき部分テキストデータが存在すれば、取得済みの部分テキストデータの中から該当する部分テキストデータを選出し、この選出した部分テキストデータを4人目以降の読み取りオペレータの端末から、そのオペレータの読み取り結果の部分テキストデータとして送信するようにしてもよい。
【発明の効果】
【0021】
請求項1に記載の発明によれば、ノートの2次元コードを2次元コードリーダによって読み取り、その後、通信回線網を利用し、2次元コードの読み取り結果であるノートの認証情報とノート記載文字のテキストデータ化利用回数情報とが、サーバのノート認証部に送信される。これにより、ノートのアクティベート(認証処理)が実施されるとともに、サーバ側に、そのノートのテキストデータ化利用回数情報も伝わる。その結果、クライアントがテキストデータ化処理サービスを要求する前に、ノートの規格(頁数など)を把握しておくことができる。よって、例えば手書き文字の消去やコピーノートを用いてのノートの不正使用、ひいてはテキストデータ化処理部による手書き文字のテキストデータ化処理サービスの不正利用を防止することができる。
次に、端末(例えばスマートフォン)のデジタルカメラにより撮影した文字画像データを、通信回線網を利用して文字読み取りセンタとしてのサーバに送信し、サーバが有したテキストデータ化処理部により、手書き文字をイメージ化した文字画像データに対するテキストデータ化処理を行う。これにより、手書き文字のテキストデータ化処理を高精度に行うことができる。
【0022】
特に、請求項2に記載の発明によれば、画像分割部により文字画像データを複数の部分文字画像データに分割し、その後、部分テキスト判定部によって、それぞれの部分文字画像データに対して、個別に読み取る2人以上の読み取りオペレータの各オペレータ端末から1つずつ送信された複数の部分テキストデータが一致しているか否かを判定する。ここで、部分テキスト判定部が一致すると判定した部分テキストデータは記憶部に記憶する。同様の処理で、テキストデータの全体分の部分テキストデータが記憶部に記憶された後、テキスト作成部により、複数の部分文字画像データに文字画像データを分割した配列に則して、記憶部の中のすべての部分テキストデータを繋げて、テキストデータを作成する。これにより、OCRよりも高精度な手書き文字のテキストデータ化処理が可能となる。しかも、画像分割部により文字画像データを複数の部分文字画像データに分割することで、文字画像データの全体を各オペレータが目視することができない。これにより、情報漏洩を防止することができる。
【0023】
請求項3に記載の発明によれば、部分テキスト判定部により判定する際には、まず1人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、2人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータとが一致しているか否かを第1の部分判定部により判定する。ここで、第1の部分判定部が一致していないと判定した場合には、3人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、1人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否か、および、3人目の部分テキストデータと2人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否かを、第2の判定部により判定する。
このような複数ステップで行われる部分テキスト判定部による判定後、記憶部に記憶される部分テキストデータは、第1の部分判定部が一致していると判定した部分テキストデータか、第2の部分判定部が一致していると判定した部分テキストデータとなる。その結果、オペレータ端末の使用数を少なくして、請求項2の場合よりもさらに高精度な手書き文字のテキストデータ化処理が可能となる。
【図面の簡単な説明】
【0024】
【図1】この発明の実施例1に係る手書き文字テキスト化システムの全体構成を示す斜視図である。
【図2】この発明の実施例1に係る手書き文字テキスト化システムの要部ブロック図である。
【図3】この発明の実施例1に係る手書き文字テキスト化システムのノート認証のフローシートである。
【図4】この発明の実施例1に係る手書き文字テキスト化システムの手書き文字テキスト化処理の全体フローシートである。
【図5】この発明の実施例1に係る手書き文字テキスト化システムのテキストデータ化処理工程のフローシートである。
【図6】この発明の実施例1に係る手書き文字テキスト化システムのノートの手書きスペースを有する紙面の拡大正面図である。
【図7】この発明の実施例1に係る手書き文字テキスト化システムのテキストデータ化処理の部分テキスト判定工程のフローシートである。
【発明を実施するための形態】
【0025】
以下、この発明の実施例を具体的に説明する。
【実施例】
【0026】
図1および図2において、10は実施例1に係る手書き文字テキスト化用システム(以下、テキスト化システム)で、このテキスト化システム10は、各紙11の外周部を除く部分に手書き文字の手書きスペースSを有し、ノート認証用のQRコード(2次元コード)14が表示された手書き用のノート15と、手書きスペースSに記入された手書き文字を撮影するCMOSカメラ(デジタルカメラ)16、QRコード14を読み取る2次元コードリーダ17、インターネット(通信回線網)18を利用する端末側の通信部19、および、テキストデータ化処理用のアプリケーション20をそれぞれ搭載した端末(ここではスマートフォン)21と、端末側の通信部19よりそれぞれ送信された2次元コードリーダ17によるQRコード14の読み取りデータと、CMOSカメラ16による手書き文字の文字画像データとを、インターネット18を利用して受信するサーバ22と、インターネット18を利用するサーバ側の通信部23と、サーバ22に設けられ、文字画像データを読み取ってテキストデータに変換するテキストデータ化処理部24と、サーバ22に設けられ、かつQRコード14の読み取りデータを受信することで、ノート15の利用を認証するとともに、ノート15によるテキストデータ化処理部24の利用回数のデータを取得するノート認証部25とを備えている。
【0027】
図1および図6に示すように、ノート15は、端末21と同一サイズ(横60mm、縦115mm)の29枚(説明書付きの20枚〜50枚でもよい)の紙11を、縦綴りし、これを厚地の表紙12と裏表紙13との間に挟み込んだ冊子である。よって、テキストデータ化処理サービスの最大利用回数は29回である。なお、表紙12と1枚目の紙11との間には、表面に2次元コードが表示され、かつ裏面にノート認証を含むノートの使用法が記載された認証専用紙12Aが差し入れられている。また、表紙12の表面の中央部には、図示しない提携企業の社名とロゴとが印刷されている。
【0028】
各紙11の表面の上端部には、ヘッダに当たる記入日(記入した年月日)26を手書きするため、8桁の矩形状の小枠が印刷されている。また、各紙11の表面の下端部には、フッタに該当する6桁の数字(英字でもよい)のフッタコード(分類コード)27が印字されている。フッタコード27は、左から3ケタまでが広告(企業)コード(例えば000;広告なし、001;第1の自社広告、002;第2の自社広告など)、左から4桁目が機能コード(例えば0;機能なし、1;カレンダー、2;タグ、カレンダーなど)、左から5桁目が文字画像データの分割方法のコード(例えば0;現在の固定座標分割、1;マニュアル分割など)、左から6桁目(右端)が検査数字であるチェックデジットのコードである。ここでのチェックデジットの計算方法は、広告コードの各桁の数字をすべて足し、機能コードの数字を2倍し、分割コードの数字を3倍し、これらを合算して得た総数を10で除算した答えの余りをチェックデジットとする。これらは、サーバ22の記憶部33に記憶される。
【0029】
手書きの記入日26は、後述するOCR部28によって自動的に読み取られ、また活字のフッタコード27は端末側のOCR部(認識できない場合はオペレータによる読み取り)52によって自動的に読み取られる。なお、ヘッダに手書きされた記入日26とフッタコード27の活字とを各判定部により読み取る際には、これらの領域に記入された各文字を、同時に読み取るようにしてもよい。さらに、各紙11の表面の四隅には、歪補正用およびノート情報取得用のガイドマーク(分類マーク)29が印刷されている。この四隅のガイドマーク29をカメラ撮影することで、後述するアプリケーション20に搭載された歪補正部53により、カメラ撮影時の文字画像データの歪みが補正される。しかも、アプリケーション20を使用して、ガイドマーク29の形状、四隅での配列などからノートサイズやノート等級(テキストデータ化提供速度・品質を変えてもよい)などの情報を読み取る。
【0030】
ガイドマーク29は、表1に示すように、ヘッダ(左隅)用の6種類(横並び)と、フッタ(左隅)用の6種類(縦並び)とからなる。ヘッダ用の6種類のものとしては、1;上下に近接した正方形が2個の組み合わせ、2;1個の正方形と1個の縦長な長方形が上下に近接した組み合わせ、3;2個の正方形が上下に離間した組み合わせ、4;2個の若干横長な長方形が左右に近接した組み合わせ、5;1個の正方形と1個の横長な長方形とが左右に近接した組み合わせ、6;2個の正方形が左右に離間した組み合わせが挙げられる。また、フッタ用の6種類としては、1;2個の正方形が上下に近接した組み合わせ、2;1個の縦長な長方形と1個の正方形とが上下に近接した組み合わせ、3;2個の正方形が上下に離間した組み合わせ、4;2個の若干横長な正方形が左右に近接した組み合わせ、5;1個の正方形と1個の横長な長方形とが左右に近接した組み合わせ、6;2個の正方形が左右に離間した組み合わせが挙げられる。表1のデータは、サーバ22の記憶部33にあらかじめ記憶されている。
【0031】
【表1】

【0032】
また、各紙11の表面の外周部を除く部分には、手書きスペースSが形成されている。具体的な手書きスペースSの形成位置は、各紙11の表面の記入日26とフッタコード27との間の領域である。
【0033】
このような手書きスペースSは、最上段のタイトル記入欄30と、それより下方の領域を、合計8本の横罫(実線)aによって上下均等に区分した6つの部分文字画像データ表示欄31とにより構成されている。なお、横罫aはノートサイズにより異なる。また、カレンダ連携用時刻記載欄、タグ記載欄などを設けてもよい。各部分文字画像データ表示欄31は、幅方向の中間部にそれぞれ平行に配置された破線の横罫bによって、上下1行ずつの2行書きとなっている。手書き文字は、それぞれの部分文字画像データ表示欄31に上下2行で記入することが正規であるものの、破線の横罫bを跨ぐような大きな字で、1つの部分文字画像データ表示欄31に1行書きしてもよい。
また、ノート15の認証専用紙12Aの表面の中央部には、ノート認証用の2次元コード14が1つ印刷されている。サーバ22側は、この2次元コード14を2次元コードリーダ17によって読み取ることで、クライアントに対して事前にノート15のアクティベート(認証処理)を行わせる。しかも、購入したノート15のテキストデータ化利用回数の情報を取得する。
【0034】
次に、図1および図2を参照して、クライアントの端末21を詳細に説明する。
この端末21は、携帯電話の一種であるスマートフォンで、CPU50に対して、インターネット接続用の端末側の通信部19と、ネットストアから端末21にインストールしたテキストデータ化処理専用のアプリケーション20と、裏面の上部に埋め込まれたデジタルカメラの一種であるCMOSカメラ16と、2次元コード14を読み取る2次元コードリーダ17と、記憶部32とがそれぞれ電気的に接続されている。アプリケーション20には、CMOSカメラ16により撮影されたノート紙面の撮影画像の歪を補正するための歪補正部53と、フッターコード27を読み取るOCR部52とが搭載されている。歪補正部53は、手書きスペースSを有する各紙11の紙面の四隅に表示された前記複数のガイドマーク29を利用し、紙面の撮影画像の歪みを台形補正法(射影変換)により補正するソフトウエアである。OCR部52は、印刷された数字が読み取れる程度の簡易なものである。
【0035】
次いで、図2および図7を参照して、サーバ22の構成を詳細に説明する。
サーバ22は、CPU51に対して、サーバ用の通信部23と、手書きの文字画像データをテキストデータに変換するテキストデータ化処理部24と、クライアントが購入したノート15の認証を行うノート認証部25とが電気的に接続されたものである。
【0036】
このうち、図2に示すように、テキストデータ化処理部24は、端末21からサーバ22にアップロードされた文字画像データを、タイトルを含めて7つの部分文字画像データに分割する画像分割部34と、ヘッダの記入日26および手書きの本文を光学的に読み取るOCR部28と、サーバ22のOCR部28と端末21のOCR部52のテキストデータ化が正しく行われたか否かを判定する2人のOCR判定オペレータα、βの各オペレータ端末21α、21βから1つずつ送信された判定結果としてのサーバ22のOCR部28と端末21のOCR部52とのテキストデータが一致しているか否かを判定するOCR判定部35と、1つの部分文字画像データを個別に読み取る2人以上の読み取りオペレータの各オペレータ端末21A〜21E(図7)から1つずつ送信された部分文字画像データの読み取り結果としての複数の部分テキストデータが一致しているか否かを判定する部分テキスト判定部40と、この部分テキスト判定部40が一致すると判定した部分テキストデータとを記憶する記憶部33と、記憶部33に記憶したテキストデータの全体分の部分テキストデータを、合計7つの部分文字画像データに文字画像データを分割した配列に則して繋げることで、テキストデータを作成するテキスト作成部41とを有している。作成されたテキストデータは、サーバ22の記憶部33に記憶され、必要時にクライアントが端末21やパソコンなどからサーバ22にアクセスし、テキストデータを取得する。このとき、OCR判定オペレータまたは読み取りオペレータは、通常勤務のオペレータではなく、自宅にいながら都合の良い時間に自己の端末を利用して、サーバ22にアクセスして作業を行ってもよい。部分文字画像データの数は7つに限定されない(例えば11でもよい)。
【0037】
ここで、図7のフローシートを参照して、データエントリが行われる部分テキスト判定部の具体的な構成を説明する。
部分テキスト判定部40は、1人目の読み取りオペレータAのオペレータ端末21Aから送信された読み取り結果としての部分テキストデータと、2人目の読み取りオペレータBのオペレータ端末21Bから送信された読み取り結果としての部分テキストデータとが一致しているか否かを判定する第1の部分判定部36と、第1の部分判定部36の判定結果が不一致だった場合の3人目の読み取りオペレータCのオペレータ端末21Cから送信された読み取り結果としての部分テキストデータと、1人目の読み取りオペレータAのオペレータ端末21Aから送信された部分テキストデータとが一致しているか否か、および、3人目の部分テキストデータと2人目の読み取りオペレータBのオペレータ端末21Bから送信された部分テキストデータとが一致しているか否かを判定する第2の判定部37を有し、第2の部分判定部37による判定で何れも一致していないという判定結果が得られた場合には、4人目の読み取りオペレータDのオペレータ端末21Dから、サーバ22の記憶部33に送信された読み取り結果としての部分テキストデータを、部分テキスト判定部40における一致した判定結果とみなすものである。
【0038】
したがって、記憶部33に記憶される部分テキストデータは、第1の部分判定部36が一致していると判定した部分テキストデータか、第1の部分判定部36が一致していないと判定した後に、第2の部分判定部37が一致していると判定した部分テキストデータか、第2の部分判定部37が一致していないと判定した後に4人目の読み取りオペレータDのオペレータ端末21Dからサーバ22の記憶部33に送信された部分テキストデータの何れかである。つまり、読み取りオペレータDは、読み取りオペレータA、B、Cの読み取り結果を閲覧し、自己の判断で読み取り結果をオペレータ端末21Dから記憶部33に送信可能である。
【0039】
次に、図1〜図7を参照して、この発明の実施例1に係るテキスト化システム10によるクライアントがノート15に記入した手書き文字のテキストデータ化処理方法を説明する。
まず、クライアントは、スマートフォンである端末21をインターネット18に接続し、ネットストアからテキストデータ化処理専用のアプリケーション20をインストールするとともに、ネットショップなどからノート15を購入する。
次いで、クライアントは、テキスト化システム10によるテキストデータ化処理サービスを利用する前に、図3のフローシートに示すように、ノート15の表紙12を捲り、認証専用紙12Aの2次元コード14を、2次元(QR)コードリーダ17により読み取ってコード情報を得る。その後、端末側の通信部19からインターネット18を利用し、2次元コード14の読み取り結果としてのテキストデータ化利用回数情報(利用回数29回)を含むノート15の認証情報をサーバ22に送信し、これらをサーバ側の通信部23が受信してノート認証部25に送信する。その後、ノート認証部25によるノート15の認証が行われ、認証終了後、ノート認証部25から端末21へ認証完了通知が返信される。これにより、ノート15のアクティベート(認証処理)が実施されるとともに、サーバ22にノート15のテキストデータ化利用回数情報が伝達される。その結果、例えば手書き文字の消去やコピーノートを用いてのノート15の不正使用、ひいてはこのテキストデータ化処理サービスの不正利用を防止することができる。
【0040】
次に、図4、図5および図7の各フローシートおよび図1、図6を参照して、テキスト化システム10を用いて行われる、ノート15に記入した手書き文字のテキストデータ化処理方法を説明する。
まず、図1および図6に示すように、ノート15の認証専用紙12Aをめくり、紙11の表面のヘッダの8つの小枠内に記入日26を示す、例えば「2011−08−06」を、ペンを使って手書きする。ただし、西暦の「20」はすでに印刷され、フッタコード27にもあらかじめ6桁「555165」が印刷されている。その後、手書きスペースSに、ペンを使用して日誌を手書きする。記入にあたっては、タイトル記入欄30にタイトルの「MV penを購入」を手書きするとともに、上から3段までの部分文字画像データ表示欄31に、1段2行で日誌を手書きする。具体的には、最上段の部分文字画像データ表示欄31には「スマートにアナログメモ→iphone→KYBER」を上下2段に手書きし、上から2段目の部分文字画像データ表示欄31には「又はEvernoteで、グラウド上に保存でき」を上下2段に手書きするとともに、上から3段目の部分文字画像データ表示欄31の上1段のみに「ないか奮闘中…」をそれぞれ手書きする。
【0041】
その後、図4のフローシートに示すように、端末(スマートフォン)21のアプリケーション20を作動した状態で、CMOSカメラ16により、手書きされた紙11の表面全体を撮影する。撮影された文字画像データは、紙11の表面の四隅に印刷されたガイドマーク29を利用し、アプリケーション20に搭載された歪補正部(歪補正機能)53により、カメラ16撮影時の歪みが補正される。すなわち、歪補正部53は、文字画像データの中から、手書きスペースSを有する各紙11の紙面の四隅に表示されたガイドマーク29を探し出し、これらを利用し、紙面の撮影画像の歪みを周知の台形補正法(射影変換)により補正する。また、アプリケーション20に搭載されたOCR部52により、フッターコード27を読み取る。
【0042】
補正後の文字画像データ、アプリケーション20により処理された四隅のガイドマーク29の読み取りデータおよびフッターコード27の読み取りデータは、端末側の送信部19からインターネット18を利用して文字テキスト化センタとしてのサーバ22に送信され、サーバ側の通信部23がこれを受信してテキストデータ化処理部24に送信する。ここでは、まずテキストデータ化処理サービスの利用回数が規定回数(29回)以内か否かが判断され、規定回数以内である場合には、次のテキストデータ化処理工程に移行する。一方、規定回数を上回っている場合には、規定回数超えの通知を、サーバ側の通信部23とインターネット18と端末側の通信部19とを順次経て、端末21のアプリケーション20に送信され、指定回数超えであることが、端末21の液晶画面に表示される。
次に、テキストデータ化処理部24によって文字画像データがテキストデータに変換される。得られたテキストデータは、サーバ22の記憶部33に記憶される。こうすることで、クライアントの端末21からアクセスがあったときに、このサーバ22の記憶部33からテキストデータを取り出すことができる。なお、テキストデータを、サーバ側の通信部23から端末側の通信部19に送信し、端末21の液晶画面に表示するとともに、端末21の記憶部(メモリ)32に記憶するようにしてもよい。
【0043】
ここで、図5および図7のフローシートを参照して、テキストデータ化処理部24によるテキストデータ化処理工程を詳細に説明する。
テキストデータ化処理部24では、まず画像分割部34により文字画像データが、ヘッダの部分と、フッタ部分と、タイトル部分と、手書き文字の本文部分とに分割される。このうち、ヘッダ部分に手書きされた記入日26と本文部分とはOCR部28により光学的に読み取られてテキストデータ化される。フッタコード27は、あらかじめ端末側のOCR部52により読み取られているので、OCR判定部35による判定結果に基づき、インターネット18を通して端末21の液晶画面に提携先企業のURLに結びついた各提携先企業の社名やロゴなどを表示させる。これにより、表紙12の表面のアナログの宣伝だけでなく、デジタルの宣伝効果も同時に得られる。
【0044】
四隅のガイドマーク29の読み取りデータに基づき、ノート15の用紙サイズや等級(テキストデータ化提供速度、品質を変えてもよい)をアプリケーション20にて認識する。すなわち、ヘッダの左隅に印刷された複数のガイドマーク29の形状および配置と、フッタの左隅に印刷された複数のガイドマーク29の形状および配置との組み合わせを、表1に示すガイドマーク29の分類表に照らし合わせることで、ノート15の用紙サイズと等級とを認識することができる。例えば、表1の分類表において、ヘッダ用が「1」でフッタ用が「3」の組み合わせの場合は、アイフォン用(通常価格)であることが判る(なお、その他の組み合わせは、表1を参照)。端末21から送信されたデータに基づき、文字画像データを、部分文字画像データに分割する。
【0045】
次に、端末21より送信された6桁の数字からなるフッタコード27の読み取りデータから、広告コードと機能コードと文字画像データとを取得する。フッタコード27は、左から3ケタまでが広告(企業)コード(000;広告なし、001;第1の自社広告、002;第2の自社広告)、左から4桁目が機能コード(0;機能なし、1;カレンダー、2;タグ、カレンダー)、左から5桁目が文字画像データの分割方法のコード(0;現在の固定座標分割、1;マニュアル分割)、左から6桁目(右端)が検査数字であるチェックデジットのコードである。チェックデジットの計算方法は、広告コードの各桁の数字(555)を足し(5+5+5=15)、機能コードの数字(1)を2倍し(1×2=2)、分割コードの数字(6)を3倍し(6×3=18)、これらを合算して得た総数(15+2+18=35)を10で除算した答えの余り(35÷10=3…05)「5」をチェックデジットとする。
【0046】
その後、図5および図7のフローシートに示すように、OCR部28による記入日26と、端末側のOCR部52によるフッタコード27と、手書き文字の本文とのテキストデータ化が正しく行われたか否かを2人のOCR判定オペレータα,βが判定する。その後、2人のOCR判定オペレータα,βの各オペレータ端末21α,21βから1つずつ送信された判定結果としての記入日26およびフッタコード27と、手書き文字の本文のテキストデータが一致しているか否かをOCR判定部35が判定し、これらが一致している場合には後述するチェック専用のオペレータEによるチェックが行われる一方、一致していない場合には、選出された1つの部分文字画像データについて、第1〜第4のオペレータA〜Dおよびチェック専用のオペレータEを介在させるデータエントリ方式の読み取り工程が実施される。
【0047】
具体的には、1人目の読み取りオペレータAのオペレータ端末21Aから送信された読み取り結果としての部分テキストデータと、2人目の読み取りオペレータBのオペレータ端末21Bから送信された読み取り結果としての部分テキストデータとが一致しているか否かを第1の部分判定部36により判定する。一致している場合には、その共通する部分テキストデータがチェック専用のオペレータEのオペレータ端末21Eに送信される。一方、一致していない場合(不一致率は5%程度)には、3人目の読み取りオペレータCのオペレータ端末21Cから送信された読み取り結果としての部分テキストデータと、1人目の読み取りオペレータAのオペレータ端末21Aから送信された部分テキストデータとが一致しているか否か、および、3人目の部分テキストデータと2人目の読み取りオペレータBのオペレータ端末21Bから送信された部分テキストデータとが一致しているか否かを、第2の部分判定部37により判定する。
【0048】
第2の部分判定部37での判定が一致している場合には、前記チェック専用のオペレータ端末21Eに、その共通する部分テキストデータが送信される。一方、第2の部分判定部37による判定で何れも一致していないという判定結果が得られた場合(不一致率は1%程度)には、4人目の読み取りオペレータDのオペレータ端末21Dから、サーバ22の記憶部33に送信された読み取り結果としての部分テキストデータが、この部分テキスト判定部40における一致した判定結果とみなし、チェック専用のオペレータ端末21Eに、その見なされた部分テキストデータが送信される。
このように、選出した1つの部分文字画像データに対応して得られた部分テキストデータは、順次、サーバ22の記憶部33に記憶される。このとき、記憶部33に記憶される部分テキストデータは、第1の部分判定部36が一致していると判定した部分テキストデータか、第1の部分判定部36が一致していないと判定した後に、第2の部分判定部37が一致していると判定した部分テキストデータか、第2の部分判定部37が一致していないと判定した後に、4人目の読み取りオペレータDのオペレータ端末21Dからサーバ22の記憶部33に送信された部分テキストデータの何れかである。これにより、OCR部28よりも高精度な手書き文字のテキストデータ化処理が可能となる。
【0049】
その後、全ての部分画像データのテキスト化が終了したか否かが判断され、終了している場合には、記憶部33に記憶された文字画像データの全体分の全ての部分テキストデータを、テキスト作成部41により、複数の部分文字画像データに文字画像データを分割した配列に則して繋げて、テキストデータを作成する。これにより、OCR部28よりも高精度な手書き文字のテキストデータ化処理が可能となる。
以上説明したテキストデータ化処理部24によって文字画像データのテキストデータ化処理を行うように構成したので、手書き文字のテキストデータ化処理を高精度で行うことができる。しかも、画像分割部34により文字画像データを複数の部分文字画像データに分割することで、文字画像データの全体を各オペレータA〜Dが目視することができない。これにより、情報漏洩を防止することができる。
【0050】
また、端末21のOCR部52によるフッタコード27の読み取り結果に基づき、提携企業が特定される。そのため、この読み取り時にサーバ22がインターネット18を通して例えば提携企業のURLにアクセスし、提携企業のアイコンやバナーを端末21のアプリケーション20やクライアントのPC画面上などに、文字画像データとテキストデータとに並べて表示を行うことができる。その結果、ノート15の表紙12の表面に印刷されたアナログな企業広告と、液晶画面上でのアイコンやバナーによるデジタルな企業広告とが連動した新しい広告方法を提供することができる。しかも、アクティベーションにスポンサー企業の広告や会社名ロゴをスプラッシュウィンドウとして表示してもよい。
【産業上の利用可能性】
【0051】
この発明は、ノートに記入された手書き文字を、サーバのテキストデータ化処理部を利用してテキストデータ化する技術として有用である。
【符号の説明】
【0052】
10 手書き文字テキスト化システム、
14 QRコード(2次元コード)、
15 ノート、
16 CMOSカメラ(デジタルカメラ)、
17 2次元コードリーダ、
18 インターネット(通信回線網)、
19 端末側の通信部、
21 端末、
21A〜21E オペレータ端末、
22 サーバ、
23 サーバ側の通信部
24 テキストデータ化処理部、
25 ノート認証部、
33 記憶部、
34 画像分割部、
40 部分テキスト判定部、
41 テキスト作成部、
A 1人目の読み取りオペレータ、
B 2人目の読み取りオペレータ、
C 3人目の読み取りオペレータ、
D 4人目の読み取りオペレータ、
S 手書きスペース。

【特許請求の範囲】
【請求項1】
文字の手書きスペースを有し、ノート認証用の2次元コードが表示された手書き用のノートと、
前記手書きスペースに記入された手書き文字を撮影するデジタルカメラと、前記2次元コードを読み取る2次元コードリーダと、通信回線網を利用する端末側の通信部とを搭載した端末と、
前記端末側の通信部よりそれぞれ送信された前記2次元コードリーダによる前記2次元コードの読み取りデータと、前記デジタルカメラによる前記手書き文字の文字画像データとを、前記通信回線網を利用して受信するサーバ側の通信部が搭載されたサーバと、
前記サーバに設けられ、かつ前記2次元コードの読み取りデータを受信することで、前記ノートの利用を認証するとともに、該ノートによる前記テキストデータ化処理部の利用回数のデータを取得するノート認証部と、
前記文字画像データを読み取ってテキストデータに変換するテキストデータ化処理部とを備えた手書き文字テキスト化システム。
【請求項2】
前記テキストデータ化処理部は、
前記文字画像データを複数の部分文字画像データに分割する画像分割部と、
1つの前記部分文字画像データを個別に読み取る2人以上の読み取りオペレータの各オペレータ端末から1つずつ送信された前記部分文字画像データの読み取り結果としての複数の部分テキストデータが一致しているか否かを判定する部分テキスト判定部と、
該部分テキスト判定部が一致すると判定した前記部分テキストデータを記憶する記憶部と、
該記憶部に記憶した前記テキストデータの全体分の前記部分テキストデータを、前記複数の部分文字画像データに前記文字画像データを分割した配列に則して繋げることで、前記テキストデータを作成するテキスト作成部とを有する請求項1に記載の手書き文字テキスト化システム。
【請求項3】
前記部分テキスト判定部は、
1人目の前記読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、2人目の前記読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータとが一致しているか否かを判定する第1の部分判定部と、
該第1の部分判定部の判定結果が不一致だった場合の3人目の読み取りオペレータのオペレータ端末から送信された読み取り結果としての部分テキストデータと、前記1人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否か、および、前記3人目の部分テキストデータと前記2人目の読み取りオペレータのオペレータ端末から送信された部分テキストデータとが一致しているか否かを判定する第2の部分判定部とを有し、
前記記憶部に記憶される部分テキストデータは、前記第1の部分判定部が一致していると判定した部分テキストデータか、前記第1の部分判定部が一致していないと判定した後に、前記第2の部分判定部が一致していると判定した部分テキストデータである請求項2に記載の手書き文字テキスト化システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate