文字認識装置、文字認識プログラム、および文字認識方法

【課題】接触文字、および縦横比変形文字による文字列であっても、正しく文字認識できる文字認識装置、文字認識プログラム、および文字認識方法を提供する。
【解決手段】文字認識装置に、文字列画像を取得する文字列画像取得手段と、文字列方向の文字長を測定した測定文字長を前記文字列画像取得手段で取得した文字列画像から複数の文字について取得する測定文字長取得手段と、取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識手段と、仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定手段と、決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出手段と、切り出した文字を本マッチング処理により本認識する文字認識手段とを備えた。

【発明の詳細な説明】
【技術分野】
【０００１】
この発明は、例えば文字を認識するような文字認識装置、文字認識プログラム、および文字認識方法に関する。
【背景技術】
【０００２】
従来、デジタルカメラなどの撮像手段、あるいはデジタルスキャナなどによって文字画像データを取得し、この文字画像データ内の文字を認識する文字認識技術が利用されている。
【０００３】
この文字認識技術では、文字列から文字を切り出し、切り出した文字を辞書データとマッチングすることで文字を認識する。
【０００４】
このような文字認識では、例えば文字と文字が接触している場合や、文字列方向に分離した複数の文字要素からなる分離文字（例えば、横書き文字列における「州」と「川」、縦書き文書における「二」と「三」など）、本来単独の文字要素からなる文字がかすれにより複数の文字要素に分離してしまった文字など、正確な文字の切り出しが困難な場合が生じる。
【０００５】
このような接触文字や分離文字が含まれる文字列からでも正確な文字切り出しを行えるよう、文字幅を推定した上で文字切り出しを行う手法が、いくつか提案されている（特許文献１〜５参照）。
【０００６】
しかし、これらの特許文献記載の技術には、未だ問題点が残っている。
詳述すると、特許文献１記載の文字認識装置は、文字幅が固定という前提で文字切り出しを行うものである。このため、この文字認識装置は、全角文字と半角文字が混合している文字列にうまく対応できないものである。
【０００７】
特許文献２記載の文字認識装置は、全角文字と半角文字の各々について所定の文字幅を用意しておき、文字切り出しを行うものである。このため、全角文字と半角文字が混合している文字列に対応できる。しかし、中国で用いられるような縦横比変形文字には対応できないものである。すなわち、例えば中国の案内板や看板、飲食店のメニューなどでは、図１０（Ａ）に示すように、縦長に変形された縦長文字で構成される文字列や、図１０（Ｂ）に示すように横太に変形された横長文字で構成される文字列など、様々な縦横比変形文字が使用されている。そして、特許文献２記載の文字認識装置は、所定の文字幅であることが前提であるから、このような縦横比変形文字にうまく対応できないという問題点がある。
【０００８】
また、特許文献３記載の文字認識装置は、所定の文字幅を前提とし、抽出された文字が一文字である場合と二文字である場合の両方について考慮するというものである。しかし、これも前記特許文献２の場合と同様、所定の文字幅が前提であるが故に、縦長文字で構成される文字列や横長文字で構成される文字列など縦横比変形文字による文字列にうまく対応できない。
【０００９】
また、前記特許文献４記載の文字認識装置は、全角文字の縦横比がほぼ１：１に近いことを仮定している。このため、前記特許文献２，３と同様に、縦長文字で構成される文字列や横長文字で構成される文字列など縦横比変形文字による文字列にうまく対応できない。
【００１０】
また、前記特許文献５記載の文字認識装置は、文字列と垂直な方向に黒画素（文字に相当する画素）を投影させたデータから投影文字幅のヒストグラムを作成し、そのピーク値を文字幅とする。このため、縦長文字で構成される文字列や横長文字で構成される文字列など縦横比変形文字による文字列に対応できる可能性はある。しかし、例えば、図１０（Ｃ）に示すように接触文字がある場合、接触文字の影響でピーク値がＷ２となり、実際の文字幅Ｗ１の倍のサイズＷ２が文字幅として推定されてしまう。
【特許文献１】特開平５−１２８３０８号公報
【特許文献２】特開平５−１２８３０７号公報
【特許文献３】特開平３−５３３９３号公報
【特許文献４】特開平７−２７１９１１号公報
【特許文献５】特開平１−７８３９５号公報
【発明の開示】
【発明が解決しようとする課題】
【００１１】
この発明は、上述した従来の問題点に着目してなされたものであり、接触文字、および縦横比変形文字による文字列であっても、正しく文字認識できる文字認識装置、文字認識プログラム、および文字認識方法を提供することを目的とする。
【課題を解決するための手段】
【００１２】
この発明は、文字列画像を取得する文字列画像取得手段と、文字列方向の文字長を測定した測定文字長を前記文字列画像取得手段で取得した文字列画像から複数の文字について取得する測定文字長取得手段と、取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識手段と、仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定手段と、決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出手段と、切り出した文字を本マッチング処理により本認識する文字認識手段とを備えた文字認識装置であることを特徴とする。
【００１３】
前記文字列画像取得手段は、例えばＣＣＤカメラやＣＭＯＳカメラなどの撮像手段とする、あるいは、このような撮像手段で撮像した文字列画像のデータを該撮像手段から受信するインターフェースとするなど、画像を取得可能な適宜の手段で構成することができる。
【００１４】
前記文字列方向は、文字が縦方向に並んでいれば縦方向、文字が横方向に並んでいれば横方向とするなど、文字が並んでいる適宜の方向とすることができる。
前記文字長は、文字列方向の１文字の長さを指し、例えば１文字における文字列方向の画素数とすることができる。
【００１５】
前記文字仮認識手段は、例えば、文字画像から特徴データを抽出し該特徴データを辞書データの特徴データとマッチングし、どの文字かを認識する手段とすることができる。また、仮認識ができたとは、正しい文字が認識できていると考えられる程度にマッチング信頼度が得られている場合とすることができる。
【００１６】
前記標準文字長決定手段は、複数の測定文字長の平均値を標準文字長とする平均文字長演算手段で構成する、あるいは、複数の測定文字長が最も集中している値を抽出する集中値抽出手段で構成するなど、標準文字長を決定する適宜の手段で構成することができる。
【００１７】
前記文字認識手段は、例えば、文字画像から特徴データを抽出し該特徴データを辞書データの特徴データとマッチングし、どの文字かを認識する手段とすることができる。
【００１８】
前記文字認識装置は、情報処理を実行するＣＰＵなどの情報処理部と情報記憶を行うメモリなどの情報記憶部と外部装置に接続する接続端子などのインターフェース部とを有する半導体チップなどの装置で構成する、あるいは、撮像手段と制御手段と記憶手段とを備えた携帯電話機やＰＤＡなどの情報処理端末で構成するなど、適宜の装置で構成することができる。
この発明により、接触文字、および縦横比変形文字による文字列であっても、正しく文字認識することが可能になる。
【００１９】
この発明の態様として、前記仮マッチング処理により仮認識した文字が、前記文字列画像の文字列方向に配置された２つの部品文字を結合してできる１つの結合文字である場合、前記標準文字長決定手段は、前記標準文字長の決定に利用する測定文字長から該結合文字の測定文字長を除外する構成とすることができる。
【００２０】
前記結合文字は、文字列方向が左右方向である場合に偏（へん）と旁（つくり）からなる文字、あるいは、文字列方向が上下方向である場合に冠（かんむり）と脚（あし）からなる文字とすることができる。
【００２１】
前記部品文字は、文字列方向が左右方向である場合の前記結合文字の偏（へん）または旁（つくり）に該当する文字、あるいは、文字列方向が上下方向である場合の前記結合文字の冠（かんむり）または脚（あし）からなる文字とすることができる。
【００２２】
これにより、２文字分の文字長を１文字の文字長として用いることを防止できる。詳述すると、例えば「日」の文字と「月」の文字がこの順で２つ並んでいる文字列について、過って「日」と「月」を結合した「明」の１文字と仮認識してしまうケースが考えられる。このような場合に、仮認識した「明」が結合文字であることから「明」の測定文字長を除外することができる。このため、「日」と「月」の２文字分の文字長を「明」１文字の測定文字長として誤採用することを防止できる。
【００２３】
またこの発明の態様として、前記仮マッチング処理により仮認識した文字が、当該文字に対して文字列方向の前後いずれかの文字を結合すると１つの結合文字を形成できる部品文字である場合、前記標準文字長決定手段は、前記標準文字長の決定に利用する測定文字長から該部品文字の測定文字長を除外する構成とすることができる。
【００２４】
これにより、結合文字の部品文字の測定文字長を１文字の測定文字長として過って採用することを防止できる。詳述すると、「明」の１文字を仮認識する際に、過って「日」と「月」の２文字であると仮認識するケースが考えられる。このような場合に、部品文字となり得る「日」や「月」の測定文字長を除外することができる。このため、部品文字の測定文字長を１文字分の測定文字長として誤採用することを防止できる。
【００２５】
前記文字切出手段は、前記文字列画像を文字列方向と垂直な方向に投射した射影データを作成し、該射影データの切れ目あるいは谷から次の切れ目あるいは谷までの仮文字長が前記標準文字長に対して所定誤差内にある文字を切り出す第１切出処理を実行する構成とし、前記文字認識手段は、前記本マッチング処理として、切り出した文字について全角文字とマッチングする全角文字本マッチング処理を行う構成とし、該全角文字本マッチング処理でのマッチング信頼度が所定の閾値よりも低い場合、前記文字切出手段は、前記標準文字長のうち文字列前方から所定の範囲と文字列後方から前記所定誤差を切り落とした縮小文字長内にある文字を切り出す第２切出処理を実行する構成とし、前記文字認識手段は、前記本マッチング処理として、切り出した文字について半角文字とマッチングする半角文字本マッチグ処理を行う構成とすることができる。
これにより、全角文字と半角文字を正しく認識することができる。
【００２６】
またこの発明の態様として、前記所定誤差を前記標準文字長の４分の１とすることができる。
これにより、全角文字同士の文字幅のばらつきに適切に対応できる。すなわち、例えば文字「と」と文字「ど」では、濁点の分だけ文字幅が少し異なるが、このような文字幅のばらつきに適切に対応することができる。
【００２７】
またこの発明の態様として、前記所定の範囲を前記標準文字長の１６分の１とすることができる。
これにより、「Ｉ」や「ｌ」などの文字幅の小さい文字に対しても適切に対応できる。
【００２８】
またこの発明は、文字列画像を文字列画像取得手段により取得する文字列取得ステップと、文字列方向の文字長を測定した測定文字長を前記文字列画像から複数の文字について取得する測定文字長取得ステップと、取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識ステップと、仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定ステップと、決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出ステップと、切り出した文字を本マッチング処理により本認識する文字認識ステップとをコンピュータに実行させる文字認識プログラムとすることができる。
【００２９】
前記文字認識プログラムは、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、フレキシブリディスク、メモリ、チップ、またはハードディスクなど、適宜の記憶媒体に格納することができる。また、前記文字認識プログラムは、インターネットなどの電気通信回線に接続されたサーバの記憶手段に記憶しておき、電気通信回線を通じてダウンロード可能とする、あるいは電気通信回線を通じてＡＳＰ（Application Service Provider）のサービスとして利用可能にする構成としてもよい。
この発明により、接触文字、および縦横比変形文字による文字列であっても、正しく文字認識することが適宜のハードウェアにて実行可能になる。
【００３０】
またこの発明は、文字列画像を文字列画像取得手段により取得する文字列取得ステップと、文字列方向の文字長を測定した測定文字長を前記文字列画像から複数の文字について取得する測定文字長取得ステップと、取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識ステップと、仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定ステップと、決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出ステップと、切り出した文字を本マッチング処理により本認識する文字認識ステップとを実行する文字認識方法とすることができる。
【発明の効果】
【００３１】
この発明により、接触文字、および縦横比変形文字による文字列であっても、正しく文字認識できる文字認識装置、文字認識プログラム、および文字認識方法を提供することができる。
【発明を実施するための最良の形態】
【００３２】
この発明の一実施形態を以下図面と共に説明する。
図１は、携帯端末１の斜視図を示し、図２は、携帯端末１の構成のブロック図を示す。
【００３３】
携帯端末１は、図１に示すように、画像入力部３、操作部５、及び画面表示部７が設けられている。画像入力部３は、画像を撮像するデジタルカメラであり、操作部５は、押下操作されるボタンであり、画面表示部７は、画像を表示する液晶ディスプレイあるいは有機ＥＬディスプレイである。
【００３４】
図２に示すように、携帯端末１は、画像入力部３、操作部５、及び画面表示部７に加えて、ＣＰＵ１１、ＲＯＭ１２、およびＲＡＭ１３が、バス１６に接続して設けられている。
【００３５】
画像入力部３は、ＣＣＤカメラまたはＣＭＯＳカメラなどのデジタルカメラであり、バス１６に接続されている。画像入力部３が撮像して得た撮像画像は、デジタル画像データとしてＣＰＵ１１に送信される。このデジタル画像データは、最終的に別途の記憶装置（不揮発性メモリなど）に記憶しても良い。なお、画像入力部３は、ＣＰＵ１１から撮像信号を受けて撮像を開始する。
【００３６】
操作部５は、バス１６に接続されている。この操作部５は、利用者に押下操作された押下信号を、バス１６を介してＣＰＵ１１に送信する。
【００３７】
画面表示部７は、操作画面を表示する操作画面表示部７ａとしての機能と、文字認識した認識結果を表示する認識結果表示部７ｂとしての機能とを有している。この操作画面表示部７は、バス１６に接続されている。ＣＰＵ１１から画像データが送られてくると、この画像データの画像を操作画面表示部７ａまたは認識結果表示部７ｂに表示する。
【００３８】
ＣＰＵ１１は、ＲＯＭ１２に記憶されたプログラムに従ってＲＡＭ１３を一時記憶領域に使用して各種動作を行うプロセッサであり、各部を制御する制御機能２１と、文字認識機能２２を有している。
【００３９】
この文字認識機能２２は、射影データ取得部３１、文字長候補抽出処理部３２、標準文字長算出部３３、文字切出処理部３４、および文字認識処理部３５を有している。
【００４０】
射影データ取得部３１は、文字列画像を２値化して文字列方向と垂直な方向の黒画素数(文字を構成する画素の数)を文字列方向に並べたヒストグラムである射影データを取得する。
【００４１】
文字長候補抽出処理部３２は、射影データから黒画素のない部分や少ない部分を文字の切れ目と推測して標準文字長の候補となる測定文字長を抽出する。
【００４２】
標準文字長算出部３３は、測定文字長から標準文字長を算出する。
文字切出処理部３４は、前記標準文字長で文字列を切り出して１文字単位に分離する。
【００４３】
文字認識処理部３５は、切り出された文字から該文字の特徴データを取得し、この特徴データがＲＯＭ１２の辞書データ２５に記憶されている各文字の特徴データと一致または近似するかマッチングする。
【００４４】
ＲＯＭ１２は、文字認識プログラム２３、設定データ２４、および辞書データ２５を記憶している。設定データ２４は、例えば、仮マッチング処理を行った文字が標準文字長を求める際に使用可能な文字か否か判定する条件を定めた標準文字長算出条件などが記憶されている。
【００４５】
ＲＡＭ１３は、ＣＰＵ１１が各種制御や演算に使用するデータを一時記憶すると共に、画像メモリ１４に文字列画像などの画像を記憶する。
【００４６】
なお、携帯端末１には、無線通信を行う通信アンテナ、音声出力を行うスピーカ、および集音を行うマイク等も設けられている。これにより、携帯電話機として利用できるように構成されている。
【００４７】
また、図に仮想線で示すように、ＣＰＵ１１とＲＯＭ１２は、１つのチップ１５に搭載して電子部品として構成してもよい。この場合、チップ１５を携帯端末１に備えれば、簡単に文字認識機能を追加することができる。
【００４８】
図３は、文字のマッチングに使用する辞書データ２５の構成図を示す。
辞書データ２５は、文字コード、マッチング情報、全角／半角区別、結合文字区別、および左部品文字区別などの各項目によって構成されている。
【００４９】
文字コードは、各文字についてＳＨＩＦＴ−ＪＩＳやＵＴＦ−８などの適宜の文字コードを記憶する。
マッチング情報は、各文字について特徴量データを記憶している。
【００５０】
全角／半角区別は、全角文字か半角文字かの区別を“１”／“０”で記憶している。
結合文字区別は、結合文字か否かの区別を“１”／“０”で記憶している。
左部品文字区別は、左側の部品文字であるか否かの区別を“１”／“０”で記憶している。
【００５１】
図４は、画面表示部７に表示する認識画面４０の画面構成図を示す。
認識画面４０は、画像入力部３で取得した画像を画面中に大きく表示し、その中で認識したい文字列画像Ｐを認識対象特定枠４１で囲んで表示している。なお、図示する例では、文字が横並びであるため、文字長は一般に言う文字幅となる。
【００５２】
画面下方には、戻るボタン４２、認識ボタン４３、およびサブメニューボタン４４が設けられている。
戻るボタン４２は、押下されると前の画面に戻るボタンである。
認識ボタン４３は、押下されると文字認識を開始するボタンである。
【００５３】
サブメニューボタン４４は、押下されると種々の機能を備えたサブメニューを表示するボタンである。なお、このサブメニューでは、認識対象特定枠４１の位置や範囲を利用者の操作によって任意に変更できる認識対象指定機能も表示する。
【００５４】
図５は、文字列画像から射影データを取得して測定文字長を抽出する仕組みを説明する説明図である。
図５（Ａ）に示す文字列画像５１を、文字部分が黒になるように２値化し、文字列方向に垂直な方向（図示の例では上下方向）の黒画素の数を、文字列方向にビット単位で並べると、図５（Ｂ）に示すように黒画素を投影させた射影データ５２が得られる。
この射影データ５２は、縦軸を黒画素数、横軸を文字列方向の位置とするヒストグラムである。
【００５５】
この射影データ５２は、図示するように、文字列方向における文字と文字の間位置の値が０または微小値となっており、この０または微小値部分が文字と文字の境目の可能性がある。
【００５６】
このような文字と文字の境目から、図５（Ｃ）に示すように、様々な測定文字長の候補が得られる。図５（Ｃ）にて最上段に表示している測定文字長Ｌは、黒画素数が所定数（閾値Ｂ１）以下であれば文字の切れ目と推定した場合のものである。最下段に表示している測定文字長Ｌは、黒画素数が０（閾値Ｂ６）の場合のみを文字の切れ目と推定した場合のものである。これらの間の測定文字長Ｌは、文字の切れ目と推定する黒画素数の値（閾値Ｂ２〜Ｂ５）を異ならせた例である。
【００５７】
このようにして、文字の切れ目とする黒画素数の閾値Ｂを変化させることにより、ある程度の精度の測定文字長Ｌが得られる。ただし、得られた測定文字長Ｌが完全に正しいとは限らないことは、図示するとおりである。このようにしてある程度の信頼性のある測定文字長Ｌを得て、さらに確実性の高い文字認識を行うための処理を次に説明する。
【００５８】
図６〜図７は、ＲＯＭ１２に記憶されている文字認識プログラム２３に従ってＣＰＵ１１が実行する文字認識機能２２についてのフローチャートを示す。
ＣＰＵ１１は、画像入力部３から文字画像を取得する（ステップＳ１）。この文字画像の取得は、操作部５から利用者の撮像操作を受け付け、この撮像操作に基づいて画像入力部３による撮像を実行し、画像入力部３が取得した撮像画像を文字画像としてデータ受信することで取得する。
【００５９】
ＣＰＵ１１は、画面表示部７に認識画面４０を表示し、利用者に操作部５で認識対象特定枠４１を移動操作させて認識対象範囲の指定を受け付ける（ステップＳ２）。これ以降の説明は、図８（Ａ）に示すように、「六月的宴会料理…」の文字画像を認識対象範囲として指定された場合を例にとって行う。
【００６０】
ＣＰＵ１１は、射影データ取得部３１としての機能を発揮し、指定された認識対象範囲の文字列について射影データ５２を取得する（ステップＳ３）。
ＣＰＵ１１は、文字長候補抽出処理部３２としての機能を発揮し、射影データ５２から測定文字長を抽出する（ステップＳ４）。このとき、図８（Ｂ）に示すように、「六」「月」「白」「勺」「宴」「会」「米」「斗」「理」…、の文字候補単位に区分して測定文字長を抽出したものとする。なお、区分した文字候補および測定文字長は、文字列が横並びであれば左から順番に番号を付し、文字列が縦並びであれば上から順番に番号を付すと良い。
【００６１】
ＣＰＵ１１は、変数「ｉ」に“０”をセットして初期化し（ステップＳ５）、ｉ番目の測定文字長内に存在する文字候補について仮マッチング処理を行ってマッチング信頼度を算出する（ステップＳ６）。このマッチング信頼度は、文字候補から特徴量を算出し、この特徴量を辞書データ２５の各文字のマッチング情報と比較することで算出する。このとき、全角文字のマッチング情報のみと比較し、半角文字は使用しない。これにより、最終的に算出する標準文字長を全角文字の文字長とすることができ、精度を高めることができる。またこのとき、仮マッチング処理により文字を仮認識でき、この仮認識した文字を一時的に記憶しておくことが好ましい。
【００６２】
ＣＰＵ１１は、算出したマッチング信頼度が予め定められた標準文字長算出条件を満たすか否か判定する（ステップＳ７）。この標準文字長算出条件は、次に示す条件１〜条件３を全て満たすという条件である。
【００６３】
「標準文字長算出条件」
条件１：マッチング信頼度が所定の基準値以上であること
条件２：マッチングにより認識した文字が、部品文字に該当しないこと
条件３：マッチングにより認識した文字が、結合文字に該当しないこと
【００６４】
条件１における所定の基準値は、正しい文字を認識できていると考えられる基準値に適宜定めることができる。
【００６５】
条件２の部品文字は、例えば文字列方向前方（へん、又は、かんむり）になり得る前方部品文字とする、文字列方向後方（つくり、又は、あし）になり得る後方部品文字とする、あるいはその両方とすることができる。
【００６６】
なお、前方部品文字を除外対象とする場合は、文字の仮認識の結果、当該前方部品文字と後方部品文字を合わせて１つの結合文字となる場合にのみ除外対象とすることが好ましい。このようにすることで、効率および精度を高めることができる。
【００６７】
また、後方部品文字を除外対象とする場合は、文字の仮認識の結果、その前方に並んでいる文字の認識結果が当該後方部品文字と結合することで１つの結合文字となる場合にのみ除外対象することが好ましい。これにより、効率および精度を高めることができる。
【００６８】
条件３の結合文字は、文字列方向が横方向であれば、「へん」と「つくり」からなる文字とし、文字列方向が縦方向であれば、「かんむり」と「あし」からなる文字とすることができる。
【００６９】
図８（Ｃ）に示す例では、標準文字長算出条件を満たすものとして採用できる文字は、「六」「宴」「会」である。他の「月」「白」「勺」「米」「斗」「理」は、部品文字または結合文字に該当し得るものとして条件を満たさない。
【００７０】
標準文字長算出条件を満たす場合（ステップＳ７：Ｙｅｓ）、ＣＰＵ１１は、当該測定文字長を標準算出用文字長とし、初期値を”０”としている変数「文字数」を１カウントアップする（ステップＳ８）。
標準文字長算出条件を満たさない場合（ステップＳ７：Ｎｏ）、ＣＰＵ１１は、そのまま処理をステップＳ９へ進める。
【００７１】
ＣＰＵ１１は、必要数（例えば４文字分）の標準算出用文字長を収集したか、すなわち変数「文字数」が所定数（例えば４個）に達したか否かを判定する（ステップＳ９）。
【００７２】
必要数の標準算出用文字長を収集した場合（ステップＳ９：Ｙｅｓ）、ＣＰＵ１１は、取得した所定数（例えば４文字）の標準算出用文字長から標準文字長を算出し（ステップＳ１０）、ステップＳ１４に処理を進める。この標準文字長は、所定数の標準算出用文字長の平均値とすることが好ましい。また、算出した標準文字長は、全角文字の標準文字長とする。
【００７３】
必要数の標準算出用文字長を収集していない場合（ステップＳ９：Ｎｏ）、ＣＰＵ１１は、変数「ｉ」を１カウントアップし（ステップＳ１１）、この変数「ｉ」が標準算出用文字長の数（すなわち変数「文字数」）に達するまで（ステップＳ１２：Ｙｅｓ）、ステップＳ６に処理を戻して繰り返す。
【００７４】
変数「ｉ」が標準算出用文字長の数に達した場合（ステップＳ１２：Ｎｏ）、標準算出用文字長が必要数集まらなかったと認識できる。このため、ＣＰＵ１１は、標準算出用文字長が１つ以上集まったか否か判定する（ステップＳ１３）。
【００７５】
標準算出用文字長が１つ以上集まっていた場合（ステップＳ１３：Ｙｅｓ）、ＣＰＵ１１は、ステップＳ１０へ処理を進め、集まった標準算出用文字長の平均値を算出し、これを標準文字長と定める（ステップＳ１０）
【００７６】
標準算出用文字長が１つも集まっていなかった場合（ステップＳ１３：Ｎｏ）、ＣＰＵ１１は、標準文字長をデフォルト設定に基づいて算出する（ステップＳ１４）。
【００７７】
このデフォルト設定に基づく標準文字長は、読取対象の文字の縦横比率が１対１であると想定し、文字列方向と垂直方向の文字の長さ（この実施例であれば文字高さ）を標準文字長とする。このように縦横比率を１対１とするのは、一般的に縦横比率１対１の文字がそれ以外の縦横比率の文字よりも多いからである。
ここまでのステップＳ６からＳ１４を実行するＣＰＵ１１は、標準文字長算出部３３として機能する。
【００７８】
ＣＰＵ１１は、定めた標準文字長に従って、文字列画像の一文字目についての切出開始位置をセットする（ステップＳ１５）。
【００７９】
そして、ＣＰＵ１１は、文字切出処理部３４として機能し、図９（Ａ）に示すように切出開始位置から所定の切出範囲の画像を切り出す全角文字切出処理を実行する（ステップＳ１６）。ここでの所定の切出範囲は、標準文字長Ｌａ±αとする。すなわち、全角文字切出処理は、切出開始位置から標準文字長Ｌａの位置を中心とする−α〜＋αをサーチ範囲とし、このサーチ範囲にある射影データ５２の切れ目あるいは谷を文字終端側カット位置と定める。そして、切出開始位置から文字終端側カット位置までの切出範囲で画像を切出す。なお、αは、文字終端許容誤差であり、標準文字長Ｌａの１／４とすることが好ましい。
【００８０】
そして、ＣＰＵ１１は、文字認識処理部３５として機能し、全角文字切出処理で切出した画像内の文字について全角文字認識処理を実行する（ステップＳ１７）。この全角文字認識処理は、辞書データ２５に記憶されているマッチング情報のうち全角／半角区別が全角となっているマッチング情報のみを使用する。また、全角文字認識処理は、切り出した文字画像から特徴量を算出し、この特徴量と一致あるいは最も近似するマッチング情報を辞書データ２５から検索する処理である。
【００８１】
ＣＰＵ１１は、全角文字認識処理で得られたマッチング信頼度が基準値以上に高いか否か判定する（ステップＳ１８）。この基準値は、認識した文字が正しいものであるとの可能性が高い値に設定する。そして、マッチング信頼度が前記基準値よりも高ければ（ステップＳ１８：Ｙｅｓ）、ＣＰＵ１１は、当該文字を採用する（ステップＳ１９）。
【００８２】
マッチング信頼度が一定より低ければ（ステップＳ１８：Ｎｏ）、ＣＰＵ１１は、文字切出処理部３４として機能し、半角文字切出処理を実行する（ステップＳ２０）。この半角文字切出処理は、図９（Ｂ）に示すように、「β＜切出範囲＜標準文字長Ｌａ−α」となるように画像を切り出す。すなわち、全角文字での切出開始位置から文字開始端カット範囲β分をカットし、さらに標準文字長Ｌａより文字終端許容誤差αだけ短い部分でカットすることで、半角文字を精度よく切り出すことができる。
【００８３】
ここで、文字開始端カット範囲β分の画像のカットは、全角文字の切出開始位置から文字開始端カット範囲βの位置で常にカットする、あるいは、全角文字の切出開始位置から文字開始端カット範囲βまでの間で射影データ５２の切れ目または谷でカットすると良い。なお、文字開始端カット範囲βは、標準文字長の１／１６とすることが好ましい。
【００８４】
また、文字終端側カット位置となる「標準文字長Ｌａ−α」での画像のカットは、全角文字の切出開始位置から「標準文字長Ｌａ−α」の位置でカットする、あるいは、全角文字の切出開始位置から「標準文字長Ｌａ−α」の位置から標準文字長Ｌａの位置までをサーチ範囲とし、このサーチ範囲にある射影データ５２の切れ目または谷でカットすると良い。
【００８５】
このようにして半角文字切出処理をした後、ＣＰＵ１１は、文字認識処理部３５として機能し、半角文字認識処理を実行する（ステップＳ２１）。この半角文字認識処理は、辞書データ２５に記憶されているマッチング情報のうち全角／半角区別が半角となっているマッチング情報のみを使用する。また、半角文字認識処理は、切り出した文字画像から特徴量を算出し、この特徴量と一致あるいは最も近似するマッチング情報を辞書データ２５から検索する処理である。
【００８６】
ＣＰＵ１１は、マッチング処理の信頼度が高ければ、マッチングした文字を採用し、当該文字について認識成功とする（ステップＳ２２）。
ＣＰＵ１１は、文字列画像の最後尾の文字か否か判定し（ステップＳ２３）、最後尾の文字でなければ（ステップＳ２３：Ｎｏ）、次の文字の切出開始位置をセットし（ステップＳ２４）、ステップＳ２０に処理を戻して繰り返す。次の文字の切出開始位置は、例えばステップＳ１６の全角文字切出処理またはステップＳ２０の半角文字切出処理で決定した文字終端側のカット位置とすればよい。
【００８７】
前記ステップＳ２３で最後尾の文字ではあった場合（ステップＳ２３：Ｙｅｓ）、ＣＰＵ１１は、読取対象の全ての文字の文字認識が完了したものとして処理を終了する。ここで、文字認識した文字は、認識結果表示部７ｂとなる画面表示部７に表示する、あるいは、翻訳アプリケーションなどの別途のプログラムに渡すなど、適宜の出力手段により出力すればよい。
【００８８】
以上の構成および動作により、接触文字、および縦横比変形文字による文字列であっても、正しく文字認識することができる。
標準文字長Ｌａを定める際に、マッチング信頼度がある閾値より良いという条件を課したため、正しく文字認識できてない文字、すなわち接触文字であったり文字が途中で切れていたり文字以外のノイズが写っていたりする画像を標準文字長Ｌａの算出から排除することができる。
【００８９】
また、マッチング信頼度が高いだけでなく、部品文字になり得る文字や、結合文字となり得る文字を除外して標準文字長Ｌａの算出を行うこととしたため、文字長を誤って認識することを防止できる。すなわち、例えば、「日」や「月」など、別の文字（「明」など）の要素になる確率が大きい文字が、実際に別の文字の要素になっている場合、「明」から「目」や「月」の部分だけで切り出して文字長の候補となってしまった場合にも、これらを除外して標準文字長Ｌａを推定することができる。
【００９０】
また、複数の文字長の平均値を採用することとしたため、文字長の推定精度を高めることができる。
また、射影データ５２からの文字切出処理において、射影データ５２の切れ目あるいは谷となるところを文字切り出し座標の候補としたことで、文字の接触が頻発している文字列であっても、正しく１文字を切出して精度よく文字認識することができる。
【００９１】
また、文字終端許容誤差αと文字開始端カット範囲βを用いて、全角文字認識処理で正しく認識できない場合に半角文字認識処理を実行することで、全角文字と半角文字をいずれも読取ることができる。
【００９２】
また、文字終端許容誤差αと文字開始端カット範囲βの値を標準文字長Ｌａに対する比率で決定しているため、読取対象の文字列が縦長（図８（Ｄ）参照）か横長（図８（Ｅ）参照）かなどの大きさ（縦横比）の違いに関わらず適切に文字を認識することができる。
【００９３】
また、文字開始端カット範囲βを標準文字長の１／１６としたことで、「Ｉ」や「ｌ」などの文字幅の小さい文字に対しても適切に対応できる。
【００９４】
また、採用できる測定文字長を所定数（例えば４つ）取得した時点で標準文字長Ｌａを決定してそれ以降の仮認識を行わず、あとは標準文字長Ｌａを使って本認識を行うことで、文字認識に要する時間の短縮と、文字認識の精度向上を実現ことができる。
【００９５】
この発明の構成と、上述の実施形態との対応において、
この発明の文字認識装置は、実施形態の携帯端末１またはチップ１５に対応し、
以下同様に、
文字列画像取得手段は、ステップＳ１を実行するＣＰＵ１１に対応し、
測定文字長取得手段は、文字長候補抽出処理部３２に対応し、
文字仮認識手段は、ステップＳ６を実行する標準文字長算出部３３に対応し、
標準文字長決定手段は、標準文字長算出部３３に対応し、
文字切出手段は、文字切出処理部３４に対応し、
文字認識手段は、文字認識処理部３５に対応し、
仮文字長は、切出範囲Ｅ１に対応し、
縮小文字長は、切出範囲Ｅ２に対応し、
所定誤差は、文字終端許容誤差αに対応し、
所定の範囲は、文字開始端カット範囲βに対応し、
所定の閾値は、基準値に対応し、
文字列取得ステップは、ステップＳ１に対応し、
測定文字長取得ステップは、ステップＳ４に対応し、
仮マッチング処理、仮認識、および文字仮認識ステップは、ステップＳ６に対応し、
標準文字長決定ステップは、ステップＳ６〜Ｓ１４に対応し、
第１切出処理は、ステップＳ１６に対応し、
全角文字本マッチング処理は、ステップＳ１７に対応し、
文字切出ステップは、ステップＳ１６，Ｓ２０に対応し、
文字認識ステップおよび本マッチング処理は、ステップＳ１７，Ｓ２１に対応し、
第２切出処理は、ステップＳ２０に対応し、
半角文字本マッチグ処理は、ステップＳ２１に対応するが、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
【図面の簡単な説明】
【００９６】
【図１】携帯端末の斜視図。
【図２】携帯端末の構成のブロック図。
【図３】文字のマッチングに使用する辞書データの構成図。
【図４】画面表示部に表示する認識画面の画面構成図。
【図５】測定文字長を抽出する仕組みの説明図。
【図６】文字認識機能についてのフローチャート。
【図７】文字認識機能についてのフローチャート。
【図８】標準文字長を決定する過程の説明図。
【図９】切出開始位置から所定の切出範囲の画像を切り出す全角文字切出処理。
【図１０】中国にて飲食店メニューなどに用いられる変形文字の説明図。
【符号の説明】
【００９７】
１…携帯端末、１１…ＣＰＵ、１５…チップ、２３…文字認識プログラム、３２…文字長候補抽出処理部、３３…標準文字長算出部、３４…文字切出処理部、３５…文字認識処理部、５２…射影データ、Ｅ１…切出範囲Ｅ２…切出範囲、Ｌ…測定文字長、Ｌａ…標準文字長、Ｐ…文字列画像、α…文字終端許容誤差、β…文字開始端カット範囲

【特許請求の範囲】
【請求項１】
文字列画像を取得する文字列画像取得手段と、
文字列方向の文字長を測定した測定文字長を前記文字列画像取得手段で取得した文字列画像から複数の文字について取得する測定文字長取得手段と、
取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識手段と、
仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定手段と、
決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出手段と、
切り出した文字を本マッチング処理により本認識する文字認識手段とを備えた
文字認識装置。
【請求項２】
前記仮マッチング処理により仮認識した文字が、前記文字列画像の文字列方向に配置された２つの部品文字を結合してできる１つの結合文字である場合、前記標準文字長決定手段は、前記標準文字長の決定に利用する測定文字長から該結合文字の測定文字長を除外する構成とした
請求項１記載の文字認識装置。
【請求項３】
前記仮マッチング処理により仮認識した文字が、当該文字に対して文字列方向の前後いずれかの文字を結合すると１つの結合文字を形成できる部品文字である場合、前記標準文字長決定手段は、前記標準文字長の決定に利用する測定文字長から該部品文字の測定文字長を除外する構成とした
請求項１または２記載の文字認識装置。
【請求項４】
前記文字切出手段は、
前記文字列画像を文字列方向と垂直な方向に投射した射影データを作成し、該射影データの切れ目あるいは谷から次の切れ目あるいは谷までの仮文字長が前記標準文字長に対して所定誤差内にある文字を切り出す第１切出処理を実行する構成とし、
前記文字認識手段は、前記本マッチング処理として、切り出した文字について全角文字とマッチングする全角文字本マッチング処理を行う構成とし、
該全角文字本マッチング処理でのマッチング信頼度が所定の閾値よりも低い場合、
前記文字切出手段は、前記標準文字長のうち文字列前方から所定の範囲と文字列後方から前記所定誤差を切り落とした縮小文字長内にある文字を切り出す第２切出処理を実行する構成とし、
前記文字認識手段は、前記本マッチング処理として、切り出した文字について半角文字とマッチングする半角文字本マッチグ処理を行う構成とした
請求項１、２、または３記載の文字認識装置。
【請求項５】
前記所定誤差を前記標準文字長の４分の１とした
請求項４記載の文字認識装置。
【請求項６】
前記所定の範囲を前記標準文字長の１６分の１とした
請求項４または５記載の文字認識装置。
【請求項７】
文字列画像を文字列画像取得手段により取得する文字列取得ステップと、
文字列方向の文字長を測定した測定文字長を前記文字列画像から複数の文字について取得する測定文字長取得ステップと、
取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識ステップと、
仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定ステップと、
決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出ステップと、
切り出した文字を本マッチング処理により本認識する文字認識ステップとをコンピュータに実行させる
文字認識プログラム。
【請求項８】
文字列画像を文字列画像取得手段により取得する文字列取得ステップと、
文字列方向の文字長を測定した測定文字長を前記文字列画像から複数の文字について取得する測定文字長取得ステップと、
取得した測定文字長内の文字を仮マッチング処理により仮認識する文字仮認識ステップと、
仮認識できた文字の前記測定文字長に基づいて標準文字長を決定する標準文字長決定ステップと、
決定した標準文字長に基づいて前記文字列画像から認識対象の全ての文字を切り出す文字切出ステップと、
切り出した文字を本マッチング処理により本認識する文字認識ステップとを実行する
文字認識方法。

【図１】