情報処理装置及び情報処理プログラム
【課題】今後需要の増加が見込まれる紙文書の電子化業務を、異なる種類の複数の文字認識サーバーを用いることで、高精度かつ高速度に行う。
【解決手段】依頼者から文書認識処理対象となる画像を受信したら、複数の文書認識サーバーのうち受信画像を文書認識処理するのに適切な文書認識サーバーを選択して文書認識処理を依頼し、依頼した文書認識サーバーから文書認識処理後の電子情報化されたデータを受信して依頼者に提供する。
【解決手段】依頼者から文書認識処理対象となる画像を受信したら、複数の文書認識サーバーのうち受信画像を文書認識処理するのに適切な文書認識サーバーを選択して文書認識処理を依頼し、依頼した文書認識サーバーから文書認識処理後の電子情報化されたデータを受信して依頼者に提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像に基づく文書認識処理を行う文書認識サーバーとこの文書認識サーバーにネットワークを介して文書認識処理を依頼する依頼者との間での文書認識業務を代行する文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置に関する。
【背景技術】
【0002】
近年、ネットワークを介して文書の入力を行うシステムが開発されている。例えば、特許文献1には、オフィスや出張先等で自由に利用できる情報処理装置が提案されている。
【0003】
しかしながら、ネットワークを介して、複数の文書認識サーバーを用いて文書の入力を行う方法に関する従来技術は見当たらない。
【0004】
複数の文書認識サーバーを用いる手法に類似する例としては、複数の文字認識エンジンを用いる方法が特許文献2に記載されている。この特許文献2に記載された方法は、領域識別後に各認識対象領域毎に異なる認識演算手段を用いることで処理の高速化を図るというものである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記複数の文字認識エンジンを用いる手法は、処理の高速化を主眼としたものであり、いずれの手法も同じ文字認識エンジンを複数用意して処理を行っているため、認識性能の向上は望めない。また、文書入力代行システムとしての提案はなされていない。
【0006】
本発明は、上記に鑑みてなされたものであって、今後需要の増加が見込まれる紙文書の電子化業務を、高精度かつ高速度に行うことを第1の目的としている。
【0007】
また、本発明は、電子化を行う対象毎に最適な文書入力環境を提供することを第2の目的としている。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するために、請求項1記載の発明は、依頼者から文書認識処理対象となる画像を受信する第1のステップと、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2のステップと、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3のステップと、を具備する文書入力代行方法である。
【0009】
請求項2記載の発明は、前記第2のステップは、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項1記載の文書入力代行方法である。
【0010】
請求項3記載の発明は、前記第2のステップは、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項1記載の文書入力代行方法である。
【0011】
請求項4記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項3記載の文書入力代行方法である。
【0012】
請求項5記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項1又は2記載の文書入力代行方法である。
【0013】
請求項6記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項1、3又は4記載の文書入力代行方法である。
【0014】
請求項7記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項1又は2記載の文書入力代行方法である。
【0015】
請求項8記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項1、3又は4記載の文書入力代行方法である。
【0016】
請求項9記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項1又は2記載の文書入力代行方法である。
【0017】
請求項10記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項1、3又は4記載の文書入力代行方法である。
【0018】
請求項11記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1又は2記載の文書入力代行方法である。
【0019】
請求項12記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1、3又は4記載の文書入力代行方法である。
【0020】
請求項13記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項1又は2記載の文書入力代行方法である。
【0021】
請求項14記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項1、3又は4記載の文書入力代行方法である。
【0022】
請求項15記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1又は2記載の文書入力代行方法である。
【0023】
請求項16記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1、3又は4記載の文書入力代行方法である。
【0024】
請求項17記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1又は2記載の文書入力代行方法である。
【0025】
請求項18記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1、3又は4記載の文書入力代行方法である。
【0026】
請求項19記載の発明は、前記第2のステップは、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項1、3又は4記載の文書入力代行方法である。
【0027】
請求項20記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項19記載の文書入力代行方法である。
【0028】
請求項21記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項19記載の文書入力代行方法である。
【0029】
請求項22記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項19記載の文書入力代行方法である。
【0030】
請求項23記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項19記載の文書入力代行方法である。
【0031】
請求項24記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項19記載の文書入力代行方法である。
【0032】
請求項25記載の発明は、前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項24記載の文書入力代行方法である。
【0033】
請求項26記載の発明は、前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項24記載の文書入力代行方法である。
【0034】
請求項27記載の発明は、前記第2のステップは、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項1ないし26のいずれか一記載の文書入力代行方法である。
【0035】
請求項28記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項27記載の文書入力代行方法である。
【0036】
請求項29記載の発明は、前記第3のステップは、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項1ないし28のいずれか一記載の文書入力代行方法である。
【0037】
請求項30記載の発明は、前記第3のステップは、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項1ないし29のいずれか一記載の文書入力代行方法である。
【0038】
請求項31記載の発明は、前記第3のステップは、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項1ないし30のいずれか一記載の文書入力代行方法である。
【0039】
請求項32記載の発明は、コンピュータにインストールされ、ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の機能と、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の機能と、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の機能と、をコンピュータに実行させる文書入力代行用のコンピュータプログラムである。
【0040】
請求項33記載の発明は、前記第2の機能は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項32記載の文書入力代行用のコンピュータプログラムである。
【0041】
請求項34記載の発明は、前記第2の機能は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項32記載の文書入力代行用のコンピュータプログラムである。
【0042】
請求項35記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項34記載の文書入力代行用のコンピュータプログラムである。
【0043】
請求項36記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0044】
請求項37記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0045】
請求項38記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0046】
請求項39記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0047】
請求項40記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0048】
請求項41記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0049】
請求項42記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0050】
請求項43記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0051】
請求項44記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0052】
請求項45記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0053】
請求項46記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0054】
請求項47記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0055】
請求項48記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0056】
請求項49記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0057】
請求項50記載の発明は、前記第2の機能は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0058】
請求項51記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0059】
請求項52記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0060】
請求項53記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0061】
請求項54記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0062】
請求項55記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0063】
請求項56記載の発明は、前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項55記載の文書入力代行用のコンピュータプログラムである。
【0064】
請求項57記載の発明は、前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項55記載の文書入力代行用のコンピュータプログラムである。
【0065】
請求項58記載の発明は、前記第2の機能は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項32ないし57のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0066】
請求項59記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項58記載の文書入力代行用のコンピュータプログラムである。
【0067】
請求項60記載の発明は、前記第3の機能は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項32ないし59のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0068】
請求項61記載の発明は、前記第3の機能は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項32ないし60のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0069】
請求項62記載の発明は、前記第3の機能は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項32ないし61のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0070】
請求項63記載の発明は、ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の手段と、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の手段と、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の手段と、を具備する文書入力代行装置である。
【0071】
請求項64記載の発明は、前記第2の手段は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項63記載の文書入力代行装置である。
【0072】
請求項65記載の発明は、前記第2の手段は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項63記載の文書入力代行装置である。
【0073】
請求項66記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項65記載の文書入力代行装置である。
【0074】
請求項67記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項63又は64記載の文書入力代行装置である。
【0075】
請求項68記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項63、65又は66記載の文書入力代行装置である。
【0076】
請求項69記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項63又は64記載の文書入力代行装置である。
【0077】
請求項70記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項63、65又は66記載の文書入力代行装置である。
【0078】
請求項71記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項63又は64記載の文書入力代行装置である。
【0079】
請求項72記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項63、65又は66記載の文書入力代行装置である。
【0080】
請求項73記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63又は64記載の文書入力代行装置である。
【0081】
請求項74記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63、65又は66記載の文書入力代行装置である。
【0082】
請求項75記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項63又は64記載の文書入力代行装置である。
【0083】
請求項76記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項63、65又は66記載の文書入力代行装置である。
【0084】
請求項77記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63又は64記載の文書入力代行装置である。
【0085】
請求項78記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63、65又は66記載の文書入力代行装置である。
【0086】
請求項79記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63又は64記載の文書入力代行装置である。
【0087】
請求項80記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63、65又は66記載の文書入力代行装置である。
【0088】
請求項81記載の発明は、前記第2の手段は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項63、65又は66記載の文書入力代行装置である。
【0089】
請求項82記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項81記載の文書入力代行装置である。
【0090】
請求項83記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項81記載の文書入力代行装置である。
【0091】
請求項84記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項81記載の文書入力代行装置である。
【0092】
請求項85記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項81記載の文書入力代行装置である。
【0093】
請求項86記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項81記載の文書入力代行装置である。
【0094】
請求項87記載の発明は、前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項86記載の文書入力代行装置である。
【0095】
請求項88記載の発明は、前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項86記載の文書入力代行装置である。
【0096】
請求項89記載の発明は、前記第2の手段は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項63ないし88のいずれか一記載の文書入力代行装置である。
【0097】
請求項90記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項89記載の文書入力代行装置である。
【0098】
請求項91記載の発明は、前記第3の手段は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項63ないし90のいずれか一記載の文書入力代行装置である。
【0099】
請求項92記載の発明は、前記第3の手段は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項63ないし91のいずれか一記載の文書入力代行装置である。
【0100】
請求項93記載の発明は、前記第3の手段は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項63ないし92のいずれか一記載の文書入力代行装置である。
【発明の効果】
【0101】
本発明によれば、今後需要の増加が見込まれる紙文書の電子化業務を高精度かつ高速度に行うことができるという効果を奏する。
【0102】
また、本発明によれば、電子化を行う対象毎に最適な文書入力環境を提供することができるという効果を奏する。
【図面の簡単な説明】
【0103】
【図1】図1は、システムの概略構成を示す模式図である。
【図2】図2は、本発明の第1の実施の形態として、ユーザによる文書認識サーバーの選択基準の一例を示す模式図である。
【図3】図3は、文書認識サーバーの処理条件の一例を示す模式図である。
【図4】図4は、本発明の第2の実施の形態として、ユーザによる文書認識サーバーの選択基準の別の一例を示す模式図である。
【図5】図5は、文書認識サーバーの処理条件の別の一例を示す模式図である。
【図6】図6は、ユーザがサービス提供装置に送付した文書画像の一例を示す模式図である。
【図7】図7は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の一例を示す模式図である。
【図8】図8は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の別の一例を示す模式図である。
【図9】図9は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の別の一例を示す模式図である。
【図10】図10は、本発明の第3の実施の形態として、文書認識サーバーの特性例を示す模式図である。
【図11】図11は、文書画像解析結果例を示す模式図である。
【図12】図12は、本発明の第4の実施の形態として、ユーザがサービス提供装置に送付した文書、表及び写真を含む画像の一例を示す模式図である。
【図13】図13は、文書画像解析結果例を示す模式図である。
【図14】図14は、文書認識サーバーの特性例を示す模式図である。
【図15】図15は、本発明の第5の実施の形態として、システムの概略構成を示す模式図である。
【図16】図16は、広告データベース(広告DB)の内容を例示する模式図である。
【発明を実施するための形態】
【0104】
以下に添付図面を参照して、この発明にかかる文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置の最良な実施の形態を詳細に説明する。
【0105】
本発明の実施の形態を構成する概略構成について図1を参照しながら説明する。
【0106】
システム構成例を図1に示す。本システムは、ユーザが扱うユーザユーザ端末と、文書入力代行サービスの提供者が管理するサービス提供装置と、複数の文書認識サーバーとが、通信回線(例えばインターネット)を介してアクセス可能に接続されている。
【0107】
ユーザ装置、サービス提供装置及び文書認識サーバーは、それぞれがコンピュータとしてのアーキテクチャを備えており、それぞれの機器の記憶領域には、それぞれの機能を実現するために必要なコンピュータプログラムがインストールされている。この場合のハードウェア資源とソフトウェア資源であるコンピュータプログラムとは、一般的なコンピュータとアプリケーションプログラムとの相互関係と同様な一般的な関係でもって結ばれており、そこに特殊性があるわけではない。そこで、以下、専ら、コンピュータプログラムに従いコンピュータとしてのアーキテクチャを備えるユーザ装置、サービス提供装置及び文書認識サーバーが自らのプロセッサによって実行される機能そのものについて説明を進める。
【0108】
基本的な動作を次に説明する。
【0109】
まず、文書入力作業を依頼するユーザはスキャナやデジタルカメラ等の画像入力装置を用いて紙上の文書を文書画像に変換する。
【0110】
次いで、ユーザは、通信回線を介して、変換された画像をサービス提供装置に送る。
【0111】
サービス提供装置では、送られてきた画像に基づいて適当な文書認識サーバーを用いて文書画像を電子化し、得られた結果をユーザ(ユーザ端末)に送り返す。
【0112】
サービス提供装置の動作に関しては、本発明の中心をなす部分であるので、以下の各実施の形態にて詳しく説明する。
【0113】
本発明の第1の実施の形態を図2及び図3に基づいて説明する。
【0114】
第1の実施の形態においては、ユーザから選択基準としての入力条件の希望を得、それに基づいて文書認識サーバーを選択する例について説明する。
【0115】
ここで用いる入力条件を入力条件(1)として図2に示す。
【0116】
ユーザは入力条件に対して、優先順位をつけ、画像と共にサービス提供装置に送る。ここでは、ユーザは「料金」「納期」の順番に優先順位をつけたものとして、サービス提供装置には画像と入力条件の順位「4−3−1−2−5」及び、入力条件「日本語(言語)」、「カラー(入力画像フォーマット)」及び「html(出力画像フォーマット)」が送られる。
【0117】
サービス提供装置では、各文書認識サーバーに対して画像を送付し、送付した画像の電子化を行うのに要する納期と料金の情報を得る。ここでは、図3に例示する処理条件例(1)に示すように各文書認識サーバーの料金と納期が得られたとする。
【0118】
ここで、サービス提供装置は、ユーザから得られている優先順位「4−3−1−2−5」を解釈して、「入力データフォーマット」、「言語」、「納期」、「料金」及び「出力データフォーマット」の順番で文書認識サーバーを選択する。
【0119】
まず、「入力データフォーマット」を基準に選択すると、「カラー」に対応している文書認識サーバー1、3、4が選択される。ここではまだ3つの候補があるので、次に「言語」を基準に選択すると、文書認識サーバー1、3、4のうち、「日本語」に対応しているのは文書認識サーバー1、4である。この時点でも2つの候補が残るので、次に「納期」を基準に選択すると、文書認識サーバー4の方が早いので、最終的にサービス提供装置は文書認識サーバー4を選択する。もちろん、この時点でも1つに絞り込めない場合には、引き続いて「料金」、「出力データフォーマット」の順番で比較を行う。そして、文書認識サーバー4に処理を依頼する信号を出す。
【0120】
文書認識サーバー4は、処理を依頼する信号を受けたならば、文書画像の電子化処理を行い、結果をサービス提供装置に返す。
【0121】
サービス提供装置は、得られた電子情報化されたデータをユーザ端末に送付すると共に、料金の請求を行う。あるいは、文書認識サーバー4に選択に伴う対価を要求する方法もある。例えば、文書認識サーバー4に対して、選択の対価として料金240円の10%である24円を請求する。つまり、依頼者から得た240円のうち、216円を文書認識サーバー4に電子化の対価として支払う。
【0122】
本発明の第2の実施の形態を図4ないし図9に基づいて説明する。
【0123】
本実施の形態においては、ユーザに入力条件を提示し、ユーザが選択した文書認識サーバーを用いて文書画像の電子化を行う例について説明する。
【0124】
まず、ユーザはユーザ端末を用いて電子化したい文書画像をサービス提供装置に送る。サービス提供装置では画像を受け取ったならば、各文書認識サーバーに送付し、入力の条件を得る。ここで用いる入力条件を入力条件(2)として図4に示す。
【0125】
サービス提供装置では、各文書認識サーバーに対して画像を送付し、送付した画像の電子化を行う場合の入力条件を得る。ここでは、図5に例示する処理条件例(2)に示すように、各文書認識サーバーの入力条件が得られたとする。ここで、「品質」に関しては、実際に電子化されたデータがサービス提供装置に送られて来るものとする。
【0126】
ここで、サービス提供装置は「品質」以外の情報をユーザ端末に送る。ユーザ端末では送られてきた入力条件をユーザに提示し、ユーザの選択を促す。もちろん、「品質」の情報もユーザ端末に送っても良いが、「品質」の情報はデータ量が多いので、後述の方法による方が処理時間がかからない場合が多い。この時点では、ユーザは複数の候補を選択できる。この例の場合には、ユーザは「ネットワークの混雑度」で混雑の激しい文書認識サーバー3以外を選択したものとする。その結果はユーザ端末からサービス提供装置に送られる。
【0127】
サービス提供装置では、ユーザによって選択された文書認識サーバーによって得られている電子化データを再び画像データに変換する。画像データの再変換する理由は、電子化されたままのデータをユーザ端末に送付した場合、ユーザはその時点で電子化されたデータを手に入れてしまうことになるので、サービス提供装置の利益が損なわれる恐れがあるからである。得られた画像データはユーザ端末に送られ、ユーザに提示される。ここで、ユーザが送付した文書画像の一例を入力画像例(1)として図6に示す、この入力画像例(1)に対して、提示される画像の例を文書認識サーバー1品質例(1)として図7に、文書認識サーバー2品質例(1)として図8に、そして、文書認識サーバー4品質例(1)として図9にそれぞれ示す。
【0128】
ユーザは提示された画像を見て「品質」(認識性能)を確認し、「料金」などの他の入力条件も考慮して、最も適当な文書認識サーバーを選択する。この例の場合、文書認識サーバー2が選択されたものとする。この選択結果はユーザ端末からサービス提供装置に送られる。
【0129】
サービス提供装置では選択された文書認識サーバー2によって作成された電子化情報をユーザ端末に送付すると共に、料金の請求を行う。
【0130】
本発明の第3の実施の形態を図10及び図11に基づいて説明する。
【0131】
本実施の形態においては、サービス提供装置が各文書認識サーバーの特性を把握している場合に、ユーザから入力された入力画像に対して簡単な解析を行い、その結果に基づいて最も適切な文書認識サーバーを選択する方法について説明する。
【0132】
本実施例で用いる文書認識サーバーの特性を文書認識サーバーの特性例(1)として図10に示す。
【0133】
ここで、料金は1文字当たりの料金(円)、文字認識速度は1秒当たりに認識できる文字数、文字サイズ特性は文字認識率が一定の基準以上を達成できる文字のサイズ、同様に品質特性は文字認識率が一定の基準以上を達成できる文字の品質である。文字の品質を評価する方法はいくつか提案されているが、ここでは、文字画像のかすれ、つぶれをあらわすパラメータとして、輪郭長2 ÷画素数(面積)を用いる。
【0134】
ユーザ端末を介してユーザから文書画像が送られてきたならば、サービス提供装置は画像中の連結矩形成分の数を算出する。
【0135】
連結成分の数は大雑把に文字数に比例するが、日本語文書の場合、1文字が複数の連結成分から構成される文字も多いので、距離の近い連結成分を統合する処理を追加することで、更に精度よく文字数を推定できる。最も簡単な方法としては、連結成分外接矩形の中心間距離があらかじめ定めたしきい値より小さい場合には、その連結成分を統合すれば良い。
【0136】
そして、この統合処理の結果得られた矩形のサイズの統計を取ることで、原稿中の文字の大きさを得ることが出来る。最も簡単な方法としては、連結成分の外接矩形の平均値を持って、文書中の文字のサイズとすれば良い。
【0137】
さらに、文書画像中の総輪郭長(エッジの数)と総黒画素数を求め、品質=総輪郭長2 ÷総黒画素数を算出する。
【0138】
本実施の形態では、上記解析の結果として、文書画像解析結果例(1)として図11に例示する結果が得られたとする。
【0139】
次に、サービス提供装置では、文字サイズ及び品質に関して、その特性の範囲内にある文書認識サーバーを選択する。この例の場合、文書認識サーバー2は文字サイズ特性の条件を満たさず、文書認識サーバー3は品質特性を満たさないので、候補から外れる。候補として残った文書認識サーバー1、4については、処理時間が一定の時間内で、料金の安価なものを選ぶ。ここでは、処理時間のしきい値を10秒とする。文書認識サーバー1での処理時間は、963/100=9.63秒、文書認識サーバー4での処理時間は963/80=12.03秒となり、文書認識サーバー4は処理時間のしきい値を超えるので、最終的に文書認識サーバー1が選択される。ここで、複数の文書認識サーバーが処理時間のしきい値を超えない場合には、料金の安価な方の文書認識サーバーを選択すれば良い。全ての文書認識サーバーの処理時間がしきい値を超えた場合も同様である。
【0140】
サービス提供装置では、文書認識サーバー1に対して文書画像を送り、得られた電子化情報をユーザ端末に送付する。
【0141】
本発明の第4の実施の形態を図12ないし図14に基づいて説明する。
【0142】
本実施の形態においては、サービス提供装置において、領域識別処理を行い、必要な部分だけを文書認識サーバーに送ることで画像の転送時間の短縮を図る。
【0143】
サービス提供装置では、ユーザから送られてきた画像に対して領域識別処理を行い、画像を写真領域と文字領域に分割する。この方法としては多くの手法が提案されているが、例えば、特開平7−334614号公報に示されているような手法を用いれば良い。文書認識サーバーでは文字領域の認識処理を行うので、サービス提供装置は得られた文書領域の部分だけを文書認識サーバーに送り、電子化された情報を得る。
【0144】
より具体的に領域識別例(1)として図12に示す画像がユーザから送られてきた場合の処理について説明する。サービス提供装置において、領域識別処理を行った結果、2つの文書領域、1つの表領域と1つの写真領域が領域識別例(1)に示すように得られたものとする。
【0145】
ここで、それぞれの文書領域を第3の実施の形態と同様に解析した結果は、文書画像解析結果例(2)として図13に示すように得られたとする。また、各文書認識サーバーの特性は文書認識サーバーの特性例(1)として図14に示す通りであるとする。
【0146】
まず、表領域1について適切な文書認識サーバーの選択を行う。図14に示す文書認識サーバーの特性例(2)から、表を処理できる文書認識サーバーは文書認識サーバー3のみであるので、サービス提供装置では文書認識サーバー3に表領域の画像を送り、電子化情報を得る。
【0147】
文書領域1について、適切な文書認識サーバーの選択を行う。文書領域については全てのサーバーで処理が可能であるとする。実施例3と同様に、文字サイズ及び品質に関して、その特性の範囲内にある文書認識サーバーを選択する。この例の場合、文書認識サーバー2のみがこの条件を満たす。そこで、サービス提供装置では、文書領域1の画像を文書認識サーバー2に送り、電子化情報を得る。
【0148】
文書領域2について同様の処理を行うと、文字サイズ及び品質の条件を満たすのは文書認識サーバー1のみであるので、文書領域2の画像を文書認識サーバーに送り、電子化情報を得る。
【0149】
それぞれの文書領域について電子化情報が得られたならば、それぞれの文書領域の座標等必要な情報を付加して、ユーザ端末に送付する。
【0150】
本発明の第5の実施の形態を図15及び図16に基づいて説明する。
【0151】
本実施の形態においては、図15に例示するようなシステム構成を用いる。ただし、広告検索装置以外の部分の処理は他の実施例と同様であるので、でう何時部分については説明を割愛する。
【0152】
サービス提供装置においては、第1〜第4の実施の形態に示されている手法で、ユーザ端末から送られてきた画像に対する電子化情報を得る。つぎに、サービス提供装置は電子化情報を広告検索装置に送る。広告検索装置では、電子化情報に基づいて、広告DB(広告データベース)中から適当な広告を検索し、得られた広告をサービス提供装置に送る。サービス提供装置では得られた広告を電子化情報に付与してユーザ端末へ送付する。
【0153】
電子化情報に基づいて広告を選択する手段については多く提案されているが、最も簡単な例では、電子化された文書中に現れる単語をキーとして広告DB中で該当するキーワードをもつ広告を抽出すれば良い。広告の登録時には、広告を付与するキーワードと広告主が支払う料金を広告と供に登録しておけば良い。広告DBの例を広告DB例(1)として図16に示す。
【0154】
ここで、図12に例示した領域識別例(1)に示す画像がユーザ端末から与えられ、サービス提供部で得られた電子化情報が広告検索装置に入力された場合の例を説明する。
【0155】
広告検索装置では、形態素解析を行い、キーワードとなり得る単語を抽出する。簡単な例では名詞のみを抽出すれば良い。ここでは、「夏休み」「伊豆高原」「せせらぎ」が抽出されたとする。つぎに、これらの単語がキーワードとなっている広告を広告DBから検索する。広告DB例の場合、123と124番のキーワードに「夏休み」があるので、この広告を抽出し、サービス提供部に送付すると供に、広告主に対して料金の請求を行う。
【先行技術文献】
【特許文献】
【0156】
【特許文献1】特開2000−172428号公報
【特許文献2】特開平7−28946号公報
【技術分野】
【0001】
本発明は、画像に基づく文書認識処理を行う文書認識サーバーとこの文書認識サーバーにネットワークを介して文書認識処理を依頼する依頼者との間での文書認識業務を代行する文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置に関する。
【背景技術】
【0002】
近年、ネットワークを介して文書の入力を行うシステムが開発されている。例えば、特許文献1には、オフィスや出張先等で自由に利用できる情報処理装置が提案されている。
【0003】
しかしながら、ネットワークを介して、複数の文書認識サーバーを用いて文書の入力を行う方法に関する従来技術は見当たらない。
【0004】
複数の文書認識サーバーを用いる手法に類似する例としては、複数の文字認識エンジンを用いる方法が特許文献2に記載されている。この特許文献2に記載された方法は、領域識別後に各認識対象領域毎に異なる認識演算手段を用いることで処理の高速化を図るというものである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記複数の文字認識エンジンを用いる手法は、処理の高速化を主眼としたものであり、いずれの手法も同じ文字認識エンジンを複数用意して処理を行っているため、認識性能の向上は望めない。また、文書入力代行システムとしての提案はなされていない。
【0006】
本発明は、上記に鑑みてなされたものであって、今後需要の増加が見込まれる紙文書の電子化業務を、高精度かつ高速度に行うことを第1の目的としている。
【0007】
また、本発明は、電子化を行う対象毎に最適な文書入力環境を提供することを第2の目的としている。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するために、請求項1記載の発明は、依頼者から文書認識処理対象となる画像を受信する第1のステップと、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2のステップと、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3のステップと、を具備する文書入力代行方法である。
【0009】
請求項2記載の発明は、前記第2のステップは、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項1記載の文書入力代行方法である。
【0010】
請求項3記載の発明は、前記第2のステップは、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項1記載の文書入力代行方法である。
【0011】
請求項4記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項3記載の文書入力代行方法である。
【0012】
請求項5記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項1又は2記載の文書入力代行方法である。
【0013】
請求項6記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項1、3又は4記載の文書入力代行方法である。
【0014】
請求項7記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項1又は2記載の文書入力代行方法である。
【0015】
請求項8記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項1、3又は4記載の文書入力代行方法である。
【0016】
請求項9記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項1又は2記載の文書入力代行方法である。
【0017】
請求項10記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項1、3又は4記載の文書入力代行方法である。
【0018】
請求項11記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1又は2記載の文書入力代行方法である。
【0019】
請求項12記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1、3又は4記載の文書入力代行方法である。
【0020】
請求項13記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項1又は2記載の文書入力代行方法である。
【0021】
請求項14記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項1、3又は4記載の文書入力代行方法である。
【0022】
請求項15記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1又は2記載の文書入力代行方法である。
【0023】
請求項16記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1、3又は4記載の文書入力代行方法である。
【0024】
請求項17記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1又は2記載の文書入力代行方法である。
【0025】
請求項18記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1、3又は4記載の文書入力代行方法である。
【0026】
請求項19記載の発明は、前記第2のステップは、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項1、3又は4記載の文書入力代行方法である。
【0027】
請求項20記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項19記載の文書入力代行方法である。
【0028】
請求項21記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項19記載の文書入力代行方法である。
【0029】
請求項22記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項19記載の文書入力代行方法である。
【0030】
請求項23記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項19記載の文書入力代行方法である。
【0031】
請求項24記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項19記載の文書入力代行方法である。
【0032】
請求項25記載の発明は、前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項24記載の文書入力代行方法である。
【0033】
請求項26記載の発明は、前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項24記載の文書入力代行方法である。
【0034】
請求項27記載の発明は、前記第2のステップは、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項1ないし26のいずれか一記載の文書入力代行方法である。
【0035】
請求項28記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項27記載の文書入力代行方法である。
【0036】
請求項29記載の発明は、前記第3のステップは、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項1ないし28のいずれか一記載の文書入力代行方法である。
【0037】
請求項30記載の発明は、前記第3のステップは、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項1ないし29のいずれか一記載の文書入力代行方法である。
【0038】
請求項31記載の発明は、前記第3のステップは、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項1ないし30のいずれか一記載の文書入力代行方法である。
【0039】
請求項32記載の発明は、コンピュータにインストールされ、ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の機能と、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の機能と、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の機能と、をコンピュータに実行させる文書入力代行用のコンピュータプログラムである。
【0040】
請求項33記載の発明は、前記第2の機能は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項32記載の文書入力代行用のコンピュータプログラムである。
【0041】
請求項34記載の発明は、前記第2の機能は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項32記載の文書入力代行用のコンピュータプログラムである。
【0042】
請求項35記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項34記載の文書入力代行用のコンピュータプログラムである。
【0043】
請求項36記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0044】
請求項37記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0045】
請求項38記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0046】
請求項39記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0047】
請求項40記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0048】
請求項41記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0049】
請求項42記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0050】
請求項43記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0051】
請求項44記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0052】
請求項45記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0053】
請求項46記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0054】
請求項47記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0055】
請求項48記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラムである。
【0056】
請求項49記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0057】
請求項50記載の発明は、前記第2の機能は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項32、34又は35記載の文書入力代行用のコンピュータプログラムである。
【0058】
請求項51記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0059】
請求項52記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0060】
請求項53記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0061】
請求項54記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0062】
請求項55記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラムである。
【0063】
請求項56記載の発明は、前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項55記載の文書入力代行用のコンピュータプログラムである。
【0064】
請求項57記載の発明は、前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項55記載の文書入力代行用のコンピュータプログラムである。
【0065】
請求項58記載の発明は、前記第2の機能は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項32ないし57のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0066】
請求項59記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項58記載の文書入力代行用のコンピュータプログラムである。
【0067】
請求項60記載の発明は、前記第3の機能は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項32ないし59のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0068】
請求項61記載の発明は、前記第3の機能は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項32ないし60のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0069】
請求項62記載の発明は、前記第3の機能は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項32ないし61のいずれか一記載の文書入力代行用のコンピュータプログラムである。
【0070】
請求項63記載の発明は、ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の手段と、複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の手段と、依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の手段と、を具備する文書入力代行装置である。
【0071】
請求項64記載の発明は、前記第2の手段は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項63記載の文書入力代行装置である。
【0072】
請求項65記載の発明は、前記第2の手段は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項63記載の文書入力代行装置である。
【0073】
請求項66記載の発明は、前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項65記載の文書入力代行装置である。
【0074】
請求項67記載の発明は、前記選択の基準として、文書認識に要する料金を用いる請求項63又は64記載の文書入力代行装置である。
【0075】
請求項68記載の発明は、前記処理の条件として、文書認識に要する料金を用いる請求項63、65又は66記載の文書入力代行装置である。
【0076】
請求項69記載の発明は、前記選択の基準として、文書認識に要する時間を用いる請求項63又は64記載の文書入力代行装置である。
【0077】
請求項70記載の発明は、前記処理の条件として、文書認識に要する時間を用いる請求項63、65又は66記載の文書入力代行装置である。
【0078】
請求項71記載の発明は、前記選択の基準として、文書認識結果の品質を用いる請求項63又は64記載の文書入力代行装置である。
【0079】
請求項72記載の発明は、前記処理の条件として、文書認識結果の品質を用いる請求項63、65又は66記載の文書入力代行装置である。
【0080】
請求項73記載の発明は、前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63又は64記載の文書入力代行装置である。
【0081】
請求項74記載の発明は、前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63、65又は66記載の文書入力代行装置である。
【0082】
請求項75記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項63又は64記載の文書入力代行装置である。
【0083】
請求項76記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項63、65又は66記載の文書入力代行装置である。
【0084】
請求項77記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63又は64記載の文書入力代行装置である。
【0085】
請求項78記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63、65又は66記載の文書入力代行装置である。
【0086】
請求項79記載の発明は、前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63又は64記載の文書入力代行装置である。
【0087】
請求項80記載の発明は、前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63、65又は66記載の文書入力代行装置である。
【0088】
請求項81記載の発明は、前記第2の手段は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項63、65又は66記載の文書入力代行装置である。
【0089】
請求項82記載の発明は、前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項81記載の文書入力代行装置である。
【0090】
請求項83記載の発明は、前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項81記載の文書入力代行装置である。
【0091】
請求項84記載の発明は、前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項81記載の文書入力代行装置である。
【0092】
請求項85記載の発明は、前記解析処理は、与えられた画像の品質を解析する処理を含む請求項81記載の文書入力代行装置である。
【0093】
請求項86記載の発明は、前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項81記載の文書入力代行装置である。
【0094】
請求項87記載の発明は、前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項86記載の文書入力代行装置である。
【0095】
請求項88記載の発明は、前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項86記載の文書入力代行装置である。
【0096】
請求項89記載の発明は、前記第2の手段は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項63ないし88のいずれか一記載の文書入力代行装置である。
【0097】
請求項90記載の発明は、前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項89記載の文書入力代行装置である。
【0098】
請求項91記載の発明は、前記第3の手段は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項63ないし90のいずれか一記載の文書入力代行装置である。
【0099】
請求項92記載の発明は、前記第3の手段は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項63ないし91のいずれか一記載の文書入力代行装置である。
【0100】
請求項93記載の発明は、前記第3の手段は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項63ないし92のいずれか一記載の文書入力代行装置である。
【発明の効果】
【0101】
本発明によれば、今後需要の増加が見込まれる紙文書の電子化業務を高精度かつ高速度に行うことができるという効果を奏する。
【0102】
また、本発明によれば、電子化を行う対象毎に最適な文書入力環境を提供することができるという効果を奏する。
【図面の簡単な説明】
【0103】
【図1】図1は、システムの概略構成を示す模式図である。
【図2】図2は、本発明の第1の実施の形態として、ユーザによる文書認識サーバーの選択基準の一例を示す模式図である。
【図3】図3は、文書認識サーバーの処理条件の一例を示す模式図である。
【図4】図4は、本発明の第2の実施の形態として、ユーザによる文書認識サーバーの選択基準の別の一例を示す模式図である。
【図5】図5は、文書認識サーバーの処理条件の別の一例を示す模式図である。
【図6】図6は、ユーザがサービス提供装置に送付した文書画像の一例を示す模式図である。
【図7】図7は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の一例を示す模式図である。
【図8】図8は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の別の一例を示す模式図である。
【図9】図9は、ユーザが送付した文書画像に対して文書認識サーバーで文書認識処理を行い、さらにサービス提供装置で再画像変換後にユーザに提示される画像の別の一例を示す模式図である。
【図10】図10は、本発明の第3の実施の形態として、文書認識サーバーの特性例を示す模式図である。
【図11】図11は、文書画像解析結果例を示す模式図である。
【図12】図12は、本発明の第4の実施の形態として、ユーザがサービス提供装置に送付した文書、表及び写真を含む画像の一例を示す模式図である。
【図13】図13は、文書画像解析結果例を示す模式図である。
【図14】図14は、文書認識サーバーの特性例を示す模式図である。
【図15】図15は、本発明の第5の実施の形態として、システムの概略構成を示す模式図である。
【図16】図16は、広告データベース(広告DB)の内容を例示する模式図である。
【発明を実施するための形態】
【0104】
以下に添付図面を参照して、この発明にかかる文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置の最良な実施の形態を詳細に説明する。
【0105】
本発明の実施の形態を構成する概略構成について図1を参照しながら説明する。
【0106】
システム構成例を図1に示す。本システムは、ユーザが扱うユーザユーザ端末と、文書入力代行サービスの提供者が管理するサービス提供装置と、複数の文書認識サーバーとが、通信回線(例えばインターネット)を介してアクセス可能に接続されている。
【0107】
ユーザ装置、サービス提供装置及び文書認識サーバーは、それぞれがコンピュータとしてのアーキテクチャを備えており、それぞれの機器の記憶領域には、それぞれの機能を実現するために必要なコンピュータプログラムがインストールされている。この場合のハードウェア資源とソフトウェア資源であるコンピュータプログラムとは、一般的なコンピュータとアプリケーションプログラムとの相互関係と同様な一般的な関係でもって結ばれており、そこに特殊性があるわけではない。そこで、以下、専ら、コンピュータプログラムに従いコンピュータとしてのアーキテクチャを備えるユーザ装置、サービス提供装置及び文書認識サーバーが自らのプロセッサによって実行される機能そのものについて説明を進める。
【0108】
基本的な動作を次に説明する。
【0109】
まず、文書入力作業を依頼するユーザはスキャナやデジタルカメラ等の画像入力装置を用いて紙上の文書を文書画像に変換する。
【0110】
次いで、ユーザは、通信回線を介して、変換された画像をサービス提供装置に送る。
【0111】
サービス提供装置では、送られてきた画像に基づいて適当な文書認識サーバーを用いて文書画像を電子化し、得られた結果をユーザ(ユーザ端末)に送り返す。
【0112】
サービス提供装置の動作に関しては、本発明の中心をなす部分であるので、以下の各実施の形態にて詳しく説明する。
【0113】
本発明の第1の実施の形態を図2及び図3に基づいて説明する。
【0114】
第1の実施の形態においては、ユーザから選択基準としての入力条件の希望を得、それに基づいて文書認識サーバーを選択する例について説明する。
【0115】
ここで用いる入力条件を入力条件(1)として図2に示す。
【0116】
ユーザは入力条件に対して、優先順位をつけ、画像と共にサービス提供装置に送る。ここでは、ユーザは「料金」「納期」の順番に優先順位をつけたものとして、サービス提供装置には画像と入力条件の順位「4−3−1−2−5」及び、入力条件「日本語(言語)」、「カラー(入力画像フォーマット)」及び「html(出力画像フォーマット)」が送られる。
【0117】
サービス提供装置では、各文書認識サーバーに対して画像を送付し、送付した画像の電子化を行うのに要する納期と料金の情報を得る。ここでは、図3に例示する処理条件例(1)に示すように各文書認識サーバーの料金と納期が得られたとする。
【0118】
ここで、サービス提供装置は、ユーザから得られている優先順位「4−3−1−2−5」を解釈して、「入力データフォーマット」、「言語」、「納期」、「料金」及び「出力データフォーマット」の順番で文書認識サーバーを選択する。
【0119】
まず、「入力データフォーマット」を基準に選択すると、「カラー」に対応している文書認識サーバー1、3、4が選択される。ここではまだ3つの候補があるので、次に「言語」を基準に選択すると、文書認識サーバー1、3、4のうち、「日本語」に対応しているのは文書認識サーバー1、4である。この時点でも2つの候補が残るので、次に「納期」を基準に選択すると、文書認識サーバー4の方が早いので、最終的にサービス提供装置は文書認識サーバー4を選択する。もちろん、この時点でも1つに絞り込めない場合には、引き続いて「料金」、「出力データフォーマット」の順番で比較を行う。そして、文書認識サーバー4に処理を依頼する信号を出す。
【0120】
文書認識サーバー4は、処理を依頼する信号を受けたならば、文書画像の電子化処理を行い、結果をサービス提供装置に返す。
【0121】
サービス提供装置は、得られた電子情報化されたデータをユーザ端末に送付すると共に、料金の請求を行う。あるいは、文書認識サーバー4に選択に伴う対価を要求する方法もある。例えば、文書認識サーバー4に対して、選択の対価として料金240円の10%である24円を請求する。つまり、依頼者から得た240円のうち、216円を文書認識サーバー4に電子化の対価として支払う。
【0122】
本発明の第2の実施の形態を図4ないし図9に基づいて説明する。
【0123】
本実施の形態においては、ユーザに入力条件を提示し、ユーザが選択した文書認識サーバーを用いて文書画像の電子化を行う例について説明する。
【0124】
まず、ユーザはユーザ端末を用いて電子化したい文書画像をサービス提供装置に送る。サービス提供装置では画像を受け取ったならば、各文書認識サーバーに送付し、入力の条件を得る。ここで用いる入力条件を入力条件(2)として図4に示す。
【0125】
サービス提供装置では、各文書認識サーバーに対して画像を送付し、送付した画像の電子化を行う場合の入力条件を得る。ここでは、図5に例示する処理条件例(2)に示すように、各文書認識サーバーの入力条件が得られたとする。ここで、「品質」に関しては、実際に電子化されたデータがサービス提供装置に送られて来るものとする。
【0126】
ここで、サービス提供装置は「品質」以外の情報をユーザ端末に送る。ユーザ端末では送られてきた入力条件をユーザに提示し、ユーザの選択を促す。もちろん、「品質」の情報もユーザ端末に送っても良いが、「品質」の情報はデータ量が多いので、後述の方法による方が処理時間がかからない場合が多い。この時点では、ユーザは複数の候補を選択できる。この例の場合には、ユーザは「ネットワークの混雑度」で混雑の激しい文書認識サーバー3以外を選択したものとする。その結果はユーザ端末からサービス提供装置に送られる。
【0127】
サービス提供装置では、ユーザによって選択された文書認識サーバーによって得られている電子化データを再び画像データに変換する。画像データの再変換する理由は、電子化されたままのデータをユーザ端末に送付した場合、ユーザはその時点で電子化されたデータを手に入れてしまうことになるので、サービス提供装置の利益が損なわれる恐れがあるからである。得られた画像データはユーザ端末に送られ、ユーザに提示される。ここで、ユーザが送付した文書画像の一例を入力画像例(1)として図6に示す、この入力画像例(1)に対して、提示される画像の例を文書認識サーバー1品質例(1)として図7に、文書認識サーバー2品質例(1)として図8に、そして、文書認識サーバー4品質例(1)として図9にそれぞれ示す。
【0128】
ユーザは提示された画像を見て「品質」(認識性能)を確認し、「料金」などの他の入力条件も考慮して、最も適当な文書認識サーバーを選択する。この例の場合、文書認識サーバー2が選択されたものとする。この選択結果はユーザ端末からサービス提供装置に送られる。
【0129】
サービス提供装置では選択された文書認識サーバー2によって作成された電子化情報をユーザ端末に送付すると共に、料金の請求を行う。
【0130】
本発明の第3の実施の形態を図10及び図11に基づいて説明する。
【0131】
本実施の形態においては、サービス提供装置が各文書認識サーバーの特性を把握している場合に、ユーザから入力された入力画像に対して簡単な解析を行い、その結果に基づいて最も適切な文書認識サーバーを選択する方法について説明する。
【0132】
本実施例で用いる文書認識サーバーの特性を文書認識サーバーの特性例(1)として図10に示す。
【0133】
ここで、料金は1文字当たりの料金(円)、文字認識速度は1秒当たりに認識できる文字数、文字サイズ特性は文字認識率が一定の基準以上を達成できる文字のサイズ、同様に品質特性は文字認識率が一定の基準以上を達成できる文字の品質である。文字の品質を評価する方法はいくつか提案されているが、ここでは、文字画像のかすれ、つぶれをあらわすパラメータとして、輪郭長2 ÷画素数(面積)を用いる。
【0134】
ユーザ端末を介してユーザから文書画像が送られてきたならば、サービス提供装置は画像中の連結矩形成分の数を算出する。
【0135】
連結成分の数は大雑把に文字数に比例するが、日本語文書の場合、1文字が複数の連結成分から構成される文字も多いので、距離の近い連結成分を統合する処理を追加することで、更に精度よく文字数を推定できる。最も簡単な方法としては、連結成分外接矩形の中心間距離があらかじめ定めたしきい値より小さい場合には、その連結成分を統合すれば良い。
【0136】
そして、この統合処理の結果得られた矩形のサイズの統計を取ることで、原稿中の文字の大きさを得ることが出来る。最も簡単な方法としては、連結成分の外接矩形の平均値を持って、文書中の文字のサイズとすれば良い。
【0137】
さらに、文書画像中の総輪郭長(エッジの数)と総黒画素数を求め、品質=総輪郭長2 ÷総黒画素数を算出する。
【0138】
本実施の形態では、上記解析の結果として、文書画像解析結果例(1)として図11に例示する結果が得られたとする。
【0139】
次に、サービス提供装置では、文字サイズ及び品質に関して、その特性の範囲内にある文書認識サーバーを選択する。この例の場合、文書認識サーバー2は文字サイズ特性の条件を満たさず、文書認識サーバー3は品質特性を満たさないので、候補から外れる。候補として残った文書認識サーバー1、4については、処理時間が一定の時間内で、料金の安価なものを選ぶ。ここでは、処理時間のしきい値を10秒とする。文書認識サーバー1での処理時間は、963/100=9.63秒、文書認識サーバー4での処理時間は963/80=12.03秒となり、文書認識サーバー4は処理時間のしきい値を超えるので、最終的に文書認識サーバー1が選択される。ここで、複数の文書認識サーバーが処理時間のしきい値を超えない場合には、料金の安価な方の文書認識サーバーを選択すれば良い。全ての文書認識サーバーの処理時間がしきい値を超えた場合も同様である。
【0140】
サービス提供装置では、文書認識サーバー1に対して文書画像を送り、得られた電子化情報をユーザ端末に送付する。
【0141】
本発明の第4の実施の形態を図12ないし図14に基づいて説明する。
【0142】
本実施の形態においては、サービス提供装置において、領域識別処理を行い、必要な部分だけを文書認識サーバーに送ることで画像の転送時間の短縮を図る。
【0143】
サービス提供装置では、ユーザから送られてきた画像に対して領域識別処理を行い、画像を写真領域と文字領域に分割する。この方法としては多くの手法が提案されているが、例えば、特開平7−334614号公報に示されているような手法を用いれば良い。文書認識サーバーでは文字領域の認識処理を行うので、サービス提供装置は得られた文書領域の部分だけを文書認識サーバーに送り、電子化された情報を得る。
【0144】
より具体的に領域識別例(1)として図12に示す画像がユーザから送られてきた場合の処理について説明する。サービス提供装置において、領域識別処理を行った結果、2つの文書領域、1つの表領域と1つの写真領域が領域識別例(1)に示すように得られたものとする。
【0145】
ここで、それぞれの文書領域を第3の実施の形態と同様に解析した結果は、文書画像解析結果例(2)として図13に示すように得られたとする。また、各文書認識サーバーの特性は文書認識サーバーの特性例(1)として図14に示す通りであるとする。
【0146】
まず、表領域1について適切な文書認識サーバーの選択を行う。図14に示す文書認識サーバーの特性例(2)から、表を処理できる文書認識サーバーは文書認識サーバー3のみであるので、サービス提供装置では文書認識サーバー3に表領域の画像を送り、電子化情報を得る。
【0147】
文書領域1について、適切な文書認識サーバーの選択を行う。文書領域については全てのサーバーで処理が可能であるとする。実施例3と同様に、文字サイズ及び品質に関して、その特性の範囲内にある文書認識サーバーを選択する。この例の場合、文書認識サーバー2のみがこの条件を満たす。そこで、サービス提供装置では、文書領域1の画像を文書認識サーバー2に送り、電子化情報を得る。
【0148】
文書領域2について同様の処理を行うと、文字サイズ及び品質の条件を満たすのは文書認識サーバー1のみであるので、文書領域2の画像を文書認識サーバーに送り、電子化情報を得る。
【0149】
それぞれの文書領域について電子化情報が得られたならば、それぞれの文書領域の座標等必要な情報を付加して、ユーザ端末に送付する。
【0150】
本発明の第5の実施の形態を図15及び図16に基づいて説明する。
【0151】
本実施の形態においては、図15に例示するようなシステム構成を用いる。ただし、広告検索装置以外の部分の処理は他の実施例と同様であるので、でう何時部分については説明を割愛する。
【0152】
サービス提供装置においては、第1〜第4の実施の形態に示されている手法で、ユーザ端末から送られてきた画像に対する電子化情報を得る。つぎに、サービス提供装置は電子化情報を広告検索装置に送る。広告検索装置では、電子化情報に基づいて、広告DB(広告データベース)中から適当な広告を検索し、得られた広告をサービス提供装置に送る。サービス提供装置では得られた広告を電子化情報に付与してユーザ端末へ送付する。
【0153】
電子化情報に基づいて広告を選択する手段については多く提案されているが、最も簡単な例では、電子化された文書中に現れる単語をキーとして広告DB中で該当するキーワードをもつ広告を抽出すれば良い。広告の登録時には、広告を付与するキーワードと広告主が支払う料金を広告と供に登録しておけば良い。広告DBの例を広告DB例(1)として図16に示す。
【0154】
ここで、図12に例示した領域識別例(1)に示す画像がユーザ端末から与えられ、サービス提供部で得られた電子化情報が広告検索装置に入力された場合の例を説明する。
【0155】
広告検索装置では、形態素解析を行い、キーワードとなり得る単語を抽出する。簡単な例では名詞のみを抽出すれば良い。ここでは、「夏休み」「伊豆高原」「せせらぎ」が抽出されたとする。つぎに、これらの単語がキーワードとなっている広告を広告DBから検索する。広告DB例の場合、123と124番のキーワードに「夏休み」があるので、この広告を抽出し、サービス提供部に送付すると供に、広告主に対して料金の請求を行う。
【先行技術文献】
【特許文献】
【0156】
【特許文献1】特開2000−172428号公報
【特許文献2】特開平7−28946号公報
【特許請求の範囲】
【請求項1】
依頼者から文書認識処理対象となる画像を受信する第1のステップと、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2のステップと、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3のステップと、
を具備する文書入力代行方法。
【請求項2】
前記第2のステップは、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項1記載の文書入力代行方法。
【請求項3】
前記第2のステップは、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項1記載の文書入力代行方法。
【請求項4】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項3記載の文書入力代行方法。
【請求項5】
前記選択の基準として、文書認識に要する料金を用いる請求項1又は2記載の文書入力代行方法。
【請求項6】
前記処理の条件として、文書認識に要する料金を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項7】
前記選択の基準として、文書認識に要する時間を用いる請求項1又は2記載の文書入力代行方法。
【請求項8】
前記処理の条件として、文書認識に要する時間を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項9】
前記選択の基準として、文書認識結果の品質を用いる請求項1又は2記載の文書入力代行方法。
【請求項10】
前記処理の条件として、文書認識結果の品質を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項11】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1又は2記載の文書入力代行方法。
【請求項12】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項13】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項1又は2記載の文書入力代行方法。
【請求項14】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項15】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1又は2記載の文書入力代行方法。
【請求項16】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1、3又は4記載の文書入力代行方法。
【請求項17】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1又は2記載の文書入力代行方法。
【請求項18】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1、3又は4記載の文書入力代行方法。
【請求項19】
前記第2のステップは、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項1、3又は4記載の文書入力代行方法。
【請求項20】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項21】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項19記載の文書入力代行方法。
【請求項22】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項23】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項24】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項19記載の文書入力代行方法。
【請求項25】
前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項24記載の文書入力代行方法。
【請求項26】
前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項24記載の文書入力代行方法。
【請求項27】
前記第2のステップは、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項1ないし26のいずれか一記載の文書入力代行方法。
【請求項28】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項27記載の文書入力代行方法。
【請求項29】
前記第3のステップは、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項1ないし28のいずれか一記載の文書入力代行方法。
【請求項30】
前記第3のステップは、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項1ないし29のいずれか一記載の文書入力代行方法。
【請求項31】
前記第3のステップは、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項1ないし30のいずれか一記載の文書入力代行方法。
【請求項32】
コンピュータにインストールされ、
ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の機能と、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の機能と、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の機能と、
をコンピュータに実行させる文書入力代行用のコンピュータプログラム。
【請求項33】
前記第2の機能は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項32記載の文書入力代行用のコンピュータプログラム。
【請求項34】
前記第2の機能は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項32記載の文書入力代行用のコンピュータプログラム。
【請求項35】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項34記載の文書入力代行用のコンピュータプログラム。
【請求項36】
前記選択の基準として、文書認識に要する料金を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項37】
前記処理の条件として、文書認識に要する料金を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項38】
前記選択の基準として、文書認識に要する時間を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項39】
前記処理の条件として、文書認識に要する時間を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項40】
前記選択の基準として、文書認識結果の品質を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項41】
前記処理の条件として、文書認識結果の品質を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項42】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項43】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項44】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項45】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項46】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項47】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項48】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項49】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項50】
前記第2の機能は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項51】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項52】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項53】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項54】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項55】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項56】
前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項55記載の文書入力代行用のコンピュータプログラム。
【請求項57】
前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項55記載の文書入力代行用のコンピュータプログラム。
【請求項58】
前記第2の機能は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項32ないし57のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項59】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項58記載の文書入力代行用のコンピュータプログラム。
【請求項60】
前記第3の機能は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項32ないし59のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項61】
前記第3の機能は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項32ないし60のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項62】
前記第3の機能は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項32ないし61のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項63】
ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の手段と、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の手段と、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の手段と、
を具備する文書入力代行装置。
【請求項64】
前記第2の手段は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項63記載の文書入力代行装置。
【請求項65】
前記第2の手段は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項63記載の文書入力代行装置。
【請求項66】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項65記載の文書入力代行装置。
【請求項67】
前記選択の基準として、文書認識に要する料金を用いる請求項63又は64記載の文書入力代行装置。
【請求項68】
前記処理の条件として、文書認識に要する料金を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項69】
前記選択の基準として、文書認識に要する時間を用いる請求項63又は64記載の文書入力代行装置。
【請求項70】
前記処理の条件として、文書認識に要する時間を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項71】
前記選択の基準として、文書認識結果の品質を用いる請求項63又は64記載の文書入力代行装置。
【請求項72】
前記処理の条件として、文書認識結果の品質を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項73】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63又は64記載の文書入力代行装置。
【請求項74】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項75】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項63又は64記載の文書入力代行装置。
【請求項76】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項77】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63又は64記載の文書入力代行装置。
【請求項78】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63、65又は66記載の文書入力代行装置。
【請求項79】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63又は64記載の文書入力代行装置。
【請求項80】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63、65又は66記載の文書入力代行装置。
【請求項81】
前記第2の手段は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項63、65又は66記載の文書入力代行装置。
【請求項82】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項83】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項81記載の文書入力代行装置。
【請求項84】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項85】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項86】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項81記載の文書入力代行装置。
【請求項87】
前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項86記載の文書入力代行装置。
【請求項88】
前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項86記載の文書入力代行装置。
【請求項89】
前記第2の手段は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項63ないし88のいずれか一記載の文書入力代行装置。
【請求項90】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項89記載の文書入力代行装置。
【請求項91】
前記第3の手段は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項63ないし90のいずれか一記載の文書入力代行装置。
【請求項92】
前記第3の手段は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項63ないし91のいずれか一記載の文書入力代行装置。
【請求項93】
前記第3の手段は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項63ないし92のいずれか一記載の文書入力代行装置。
【請求項1】
依頼者から文書認識処理対象となる画像を受信する第1のステップと、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2のステップと、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3のステップと、
を具備する文書入力代行方法。
【請求項2】
前記第2のステップは、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項1記載の文書入力代行方法。
【請求項3】
前記第2のステップは、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項1記載の文書入力代行方法。
【請求項4】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項3記載の文書入力代行方法。
【請求項5】
前記選択の基準として、文書認識に要する料金を用いる請求項1又は2記載の文書入力代行方法。
【請求項6】
前記処理の条件として、文書認識に要する料金を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項7】
前記選択の基準として、文書認識に要する時間を用いる請求項1又は2記載の文書入力代行方法。
【請求項8】
前記処理の条件として、文書認識に要する時間を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項9】
前記選択の基準として、文書認識結果の品質を用いる請求項1又は2記載の文書入力代行方法。
【請求項10】
前記処理の条件として、文書認識結果の品質を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項11】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1又は2記載の文書入力代行方法。
【請求項12】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項13】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項1又は2記載の文書入力代行方法。
【請求項14】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項1、3又は4記載の文書入力代行方法。
【請求項15】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1又は2記載の文書入力代行方法。
【請求項16】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項1、3又は4記載の文書入力代行方法。
【請求項17】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1又は2記載の文書入力代行方法。
【請求項18】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項1、3又は4記載の文書入力代行方法。
【請求項19】
前記第2のステップは、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項1、3又は4記載の文書入力代行方法。
【請求項20】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項21】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項19記載の文書入力代行方法。
【請求項22】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項23】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項19記載の文書入力代行方法。
【請求項24】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項19記載の文書入力代行方法。
【請求項25】
前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項24記載の文書入力代行方法。
【請求項26】
前記第2のステップは、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項24記載の文書入力代行方法。
【請求項27】
前記第2のステップは、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項1ないし26のいずれか一記載の文書入力代行方法。
【請求項28】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項27記載の文書入力代行方法。
【請求項29】
前記第3のステップは、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項1ないし28のいずれか一記載の文書入力代行方法。
【請求項30】
前記第3のステップは、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項1ないし29のいずれか一記載の文書入力代行方法。
【請求項31】
前記第3のステップは、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項1ないし30のいずれか一記載の文書入力代行方法。
【請求項32】
コンピュータにインストールされ、
ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の機能と、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の機能と、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の機能と、
をコンピュータに実行させる文書入力代行用のコンピュータプログラム。
【請求項33】
前記第2の機能は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項32記載の文書入力代行用のコンピュータプログラム。
【請求項34】
前記第2の機能は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項32記載の文書入力代行用のコンピュータプログラム。
【請求項35】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項34記載の文書入力代行用のコンピュータプログラム。
【請求項36】
前記選択の基準として、文書認識に要する料金を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項37】
前記処理の条件として、文書認識に要する料金を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項38】
前記選択の基準として、文書認識に要する時間を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項39】
前記処理の条件として、文書認識に要する時間を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項40】
前記選択の基準として、文書認識結果の品質を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項41】
前記処理の条件として、文書認識結果の品質を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項42】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項43】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項44】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項45】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項46】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項47】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項48】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32又は33記載の文書入力代行用のコンピュータプログラム。
【請求項49】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項50】
前記第2の機能は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項32、34又は35記載の文書入力代行用のコンピュータプログラム。
【請求項51】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項52】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項53】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項54】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項55】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項50記載の文書入力代行用のコンピュータプログラム。
【請求項56】
前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項55記載の文書入力代行用のコンピュータプログラム。
【請求項57】
前記第2の機能は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項55記載の文書入力代行用のコンピュータプログラム。
【請求項58】
前記第2の機能は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項32ないし57のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項59】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項58記載の文書入力代行用のコンピュータプログラム。
【請求項60】
前記第3の機能は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項32ないし59のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項61】
前記第3の機能は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項32ないし60のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項62】
前記第3の機能は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項32ないし61のいずれか一記載の文書入力代行用のコンピュータプログラム。
【請求項63】
ネットワークを介して依頼者から文書認識処理対象となる画像を受信する第1の手段と、
複数の文書認識サーバーのうち前記受信画像を文書認識処理するのに適切な前記文書認識サーバーを選択して文書認識処理を依頼する第2の手段と、
依頼した前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信してその依頼者に提供する第3の手段と、
を具備する文書入力代行装置。
【請求項64】
前記第2の手段は、前記文書認識サーバーの選択基準を依頼者から得る処理を含む請求項63記載の文書入力代行装置。
【請求項65】
前記第2の手段は、与えられた画像を複数の前記文書認識サーバーに提示してそれぞれの前記文書認識サーバーから処理の条件を収集した後に、最も適切なサーバーを選択する処理を含む請求項63記載の文書入力代行装置。
【請求項66】
前記最も適切なサーバーを選択する処理は、前記文書認識サーバーから収集した処理の条件を依頼者に提示して選択を促し、依頼者の選択に基づいて決定される前記文書認識サーバーに文書認識処理を依頼する処理を含む請求項65記載の文書入力代行装置。
【請求項67】
前記選択の基準として、文書認識に要する料金を用いる請求項63又は64記載の文書入力代行装置。
【請求項68】
前記処理の条件として、文書認識に要する料金を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項69】
前記選択の基準として、文書認識に要する時間を用いる請求項63又は64記載の文書入力代行装置。
【請求項70】
前記処理の条件として、文書認識に要する時間を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項71】
前記選択の基準として、文書認識結果の品質を用いる請求項63又は64記載の文書入力代行装置。
【請求項72】
前記処理の条件として、文書認識結果の品質を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項73】
前記選択の基準として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63又は64記載の文書入力代行装置。
【請求項74】
前記処理の条件として、前記文書認識サーバーの混雑度と前記文書認識サーバーにアクセスするためのネットワークの混雑度との少なくとも一方を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項75】
前記選択の基準として、前記文書認識サーバーが対応している言語を用いる請求項63又は64記載の文書入力代行装置。
【請求項76】
前記処理の条件として、前記文書認識サーバーが対応している言語を用いる請求項63、65又は66記載の文書入力代行装置。
【請求項77】
前記選択の基準として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63又は64記載の文書入力代行装置。
【請求項78】
前記処理の条件として、前記文書認識サーバーが対応している入力画像フォーマットを用いる請求項63、65又は66記載の文書入力代行装置。
【請求項79】
前記選択の基準として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63又は64記載の文書入力代行装置。
【請求項80】
前記処理の条件として、前記文書認識サーバーが対応している出力フォーマットを用いる請求項63、65又は66記載の文書入力代行装置。
【請求項81】
前記第2の手段は、与えられた画像に対して解析処理を行い、その解析結果に基づいて複数の文書認識サーバーから適当な文書認識サーバーを選択する処理を含む請求項63、65又は66記載の文書入力代行装置。
【請求項82】
前記解析処理は、与えられた画像中の連結矩形成分を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項83】
前記解析処理は、与えられた画像中の文字サイズを解析する処理を含む請求項81記載の文書入力代行装置。
【請求項84】
前記解析処理は、与えられた画像中の文字数を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項85】
前記解析処理は、与えられた画像の品質を解析する処理を含む請求項81記載の文書入力代行装置。
【請求項86】
前記解析処理は、与えられた画像中のレイアウトを解析する処理を含む請求項81記載の文書入力代行装置。
【請求項87】
前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる文字領域だけを前記文書認識サーバーに送る処理を含む請求項86記載の文書入力代行装置。
【請求項88】
前記第2の手段は、前記画像中のレイアウトを解析する処理の結果得られる各領域の属性に応じて、それらの領域毎に前記文書認識サーバーを選択する処理を含む請求項86記載の文書入力代行装置。
【請求項89】
前記第2の手段は、候補となっている前記文書認識サーバーに与えられた画像を送信し、前記文書認識サーバーから文書認識処理後の電子情報化されたデータを受信し、受信した文書認識処理の結果を合成して依頼者に提示する処理を含む請求項63ないし88のいずれか一記載の文書入力代行装置。
【請求項90】
前記受信した文書認識処理の結果を電子情報化されていない状態に変換して依頼者に提示する請求項89記載の文書入力代行装置。
【請求項91】
前記第3の手段は、前記文書認識サーバー選択に対する対価を依頼者に課金する処理を含む請求項63ないし90のいずれか一記載の文書入力代行装置。
【請求項92】
前記第3の手段は、前記文書認識サーバー選択に対する対価を前記文書認識サーバーの管理者に課金する処理を含む請求項63ないし91のいずれか一記載の文書入力代行装置。
【請求項93】
前記第3の手段は、依頼者から文書認識処理を依頼された画像の内容に応じて選択された広告を文書認識処理後の電子情報化されたデータと共に依頼者に送付する処理を含み、
その電子情報化されたデータに伴う広告の広告主に対して広告の選択に対する対価を課金する第4の処理を具備する請求項63ないし92のいずれか一記載の文書入力代行装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2010−33605(P2010−33605A)
【公開日】平成22年2月12日(2010.2.12)
【国際特許分類】
【出願番号】特願2009−256900(P2009−256900)
【出願日】平成21年11月10日(2009.11.10)
【分割の表示】特願2001−81514(P2001−81514)の分割
【原出願日】平成13年3月21日(2001.3.21)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成22年2月12日(2010.2.12)
【国際特許分類】
【出願日】平成21年11月10日(2009.11.10)
【分割の表示】特願2001−81514(P2001−81514)の分割
【原出願日】平成13年3月21日(2001.3.21)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]