説明

文字情報読取装置および文字情報読取方法

【課題】表示画面に表示される文字情報を正確かつ迅速に読み取ることができる文字情報読取装置および文字情報読取方法を提供する。
【解決手段】レシピ管理サーバ3は、画像転送ユニット2を介して、表示画面13に文字情報を表示するためのビデオ信号を取得する。画像作成手段32は、取得された前記ビデオ信号を画像に変換する。認識手段33は、画像作成手段32により得られた前記画像に対する画像処理によって前記文字情報を認識する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示画面に表示される文字情報を読み取る文字情報読取装置および文字情報読取方法に関する。
【背景技術】
【0002】
印刷物や手書きの文字を光学的に読み取る装置(OCR:Optical Character Reader)が知られている。OCRは光学的に取り込んだ印刷物等のイメージから文字列の領域を抽出し、その領域にある文字列を認識する機能を有する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003−223610号公報
【0004】
【特許文献2】特開平10−208040号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
通常、コンピュータ画面に文字列を含む情報が表示される状態にある場合には、当然のことながら、元の情報自体にアクセスすることにより画面表示される文字列の内容を認識することが可能である。しかし、オンライン化されていない装置で取り扱っている情報など、元情報にアクセス困難な場合もある。例えば、半導体デバイスの既存生産ラインなど、オンライン化されていない製造設備が生産工程内に含まれている場合などには、当該設備の画面上に表示されるレシピパラメータ(製造条件を規定するパラメータ)の元データにアクセスできない場合もある。このため、レシピパラメータのチェックが画面上での目視に頼らざるを得なくなり、レシピパラメータの内容(パラメータ値)の誤りを見過ごすおそれがある。
【0006】
一方、元情報にアクセスできない場合であっても、コンピュータ画面に表示される文字列をOCRにより認識させることが可能である。この場合には、カメラにより画面を撮影し、あるいは画面の印刷物を光学的に読み取ることが考えられる。
【0007】
しかし、カメラにより画面を撮影する場合には、画像が不鮮明になるだけでなく、画像の大きさや歪み、傾きなどを補正する必要がある。また、印刷物を読み取る場合にも、読み取った画像のずれや傾きを修正する処理等が必要となる。したがって、OCRを用いる方法では単時間で正確な読み取りを行うことが困難である。
【0008】
本発明の目的は、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる文字情報読取装置および文字情報読取方法を提供することにある。
【課題を解決するための手段】
【0009】
本発明の文字情報読取装置は、表示画面に表示される文字情報を読み取る文字情報読取装置において、前記表示画面に前記文字情報を表示するためのビデオ信号を取得するビデオ信号取得手段と、前記ビデオ信号取得手段により取得された前記ビデオ信号を画像に変換する画像作成手段と、前記画像作成手段により得られた前記画像に対する画像処理によって前記文字情報を認識する認識手段と、を備えることを特徴とする。
この文字情報読取装置によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
【0010】
前記認識手段は、前記画像に対する画像処理に基づき前記画像の座標原点を設定する処理と、設定された前記座標原点を基準とする特定の相対座標の領域に対する文字認識処理と、を実行してもよい。
【0011】
前記座標原点を設定する処理では、あらかじめ登録された特徴的な形状を発見し、当該形状の位置に基づいて前記座標原点を設定してもよい。
【0012】
前記文字情報は製造工程における製造条件を規定するパラメータであってもよい。
【0013】
本発明の文字情報読取方法は、表示画面に表示される文字情報を読み取る文字情報読取方法において、前記表示画面に前記文字情報を表示するためのビデオ信号を取得するステップと、前記ビデオ信号を取得するステップにより取得された前記ビデオ信号を画像に変換するステップと、前記変換するステップにより得られた前記画像に対する画像処理によって前記文字情報を認識するステップと、を備えることを特徴とする。
この文字情報読取方法によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
【発明の効果】
【0014】
本発明の文字情報読取装置によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
【0015】
本発明の文字情報読取方法によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
【図面の簡単な説明】
【0016】
【図1】オペレーションコンソールに表示される文字情報を読み取るためのシステム構成を示すブロック図。
【図2】表示画面を例示する図。
【図3】画像作成手段により作成される画像を例示する図。
【図4】原点および文字列の読み込み処理を行う箇所を指定する方法を例示する図。
【図5】別の箇所の読み込みを指定する例を示す図。
【図6】複数の文字列を認識させる例を示す図。
【図7】原点の位置が画面上で移動可能な例を示す図。
【発明を実施するための形態】
【0017】
以下、本発明による文字情報読取方法の実施形態について説明する。
【0018】
図1は、オペレーションコンソールに表示される文字情報を読み取るためのシステム構成を示すブロック図である。
【0019】
図1に示すように、オペレーションコンソール1は、レシピパラメータを格納するパラメータ格納部11と、パラメータ格納部11に格納されたレシピパラメータの表示画面を作成する演算部12と、演算部12で作成された上記表示画面を表示する表示装置13と、を備える。
【0020】
演算部12で作成された表示画面はビデオ信号として表示装置13に与えられる。また、図1に示すように、演算部12から表示装置13に送られるビデオ信号は、画像転送ユニット2を介してレシピ管理サーバ3にネットワーク転送可能とされている。
【0021】
図1に示すように、レシピ管理サーバ3は、画像転送ユニット2から転送されてきた上記ビデオ信号を格納する画像格納部31と、画像格納部31に格納されたビデオ信号に基づいて画像を生成する画像生成手段32と、画像生成手段32により生成された画像に含まれる文字列を認識する認識手段33と、を備える。画像生成手段32により生成された画像は、適宜、表示画面4に表示される。
【0022】
次に、レシピ管理サーバ3の動作について説明する。
【0023】
表示装置13の表示画面にレシピパラメータを表示させた状態で、ユーザが画像転送ユニット2に対して画像転送の指示を与えると、表示装置13の表示画面に表示されている画像に対応するビデオ信号が演算部12から転送され、画像処理装置3の画像格納部31に静止画像として格納される。
【0024】
図2は、表示装置13の表示画面を例示する図である。図2の例では、一覧表形式でパラメータ格納部11に格納されたレシピパラメータが表示されており、レシピパラメータの項目名と、その項目名に対応するパラメータ値とが対応付けられて配置された画像51が示されている。
【0025】
図3は、画像作成手段32により作成される画像を例示する図である。図3に示す画像52は、画像作成手段32により作成された画像を示している。この例では、認識手段33での認識処理の負担を軽減するため、画像51の明暗を反転させることで画像52を作成している。
【0026】
図4は、画像52における原点および文字列の読み込み処理を行う箇所を指定する方法を例示する図である。
【0027】
図4の例では、原点61を「通信先TCPポート」という文字列の中心に位置付けている。この場合、ユーザは原点61を定めるための領域として、「通信先TCPポート」という文字列が表示される領域を指定し、予め登録しておく。また、ユーザは認識したい文字列が配置された領域62を予め指定し、登録しておく。領域62の位置は原点61からの相対位置(座標)として認識、登録される。原点61および領域62の指定は、例えば、表示画面4に画像52を表示させ、画面上へのユーザの操作を介して受け付けることができる。
【0028】
認識手段33は、画像処理によって画像52の全域を検索し、登録された領域のパターンと同一パターンの領域を抽出し、その領域の中心を原点61とする。
【0029】
次に、認識手段33は、登録されている原点61からの上記相対位置(座標)に基づいて領域62を確定し、領域62にある文字列の認識処理を実行する。この認識処理では、OCRにおいて用いられる各種の技術を用いて文字列を認識することができる。この場合には、「7001」という文字列が認識される。
【0030】
また、認識手段33により認識された文字列は、予め文字情報として登録されたレシピパラメータと照合され、不一致であったパラメータが通知される。これにより、パラメータ格納部11に格納されているレシピパラメータの誤りを見過ごすおそれがなくなる。
【0031】
図5は、別の箇所の読み込みを指定する例を示している。
【0032】
図5の例では、領域63に表示される「対応する」という文字列を認識する。原点61からの相対位置(座標)に基づいて領域63が特定される点は、図4の例と同じである。この場合、領域63に表示される文字列は、「対応する」と「対応しない」の2つの文字列のいずれか一方である。この場合には、認識手段33における処理では、通常のOCRにおける処理のような手順で具体的な文字列を特定する必要はなく、二者のうちいずれか1つであると判定できればよい。したがって、認識手段33における処理負担を軽減できる。
【0033】
図6は、複数の文字列を認識させる例を示している。
【0034】
図6の例では、複数の文字列を1つの領域64として指定している。原点61からの相対位置(座標)に基づいて領域64が特定される点は、図4の例と同じである。この場合、認識手段33は、領域64における文字列の配置状況を認識し、次に、それぞれの箇所に配置された文字列を認識する。
【0035】
図7は、原点の位置が画面上で移動可能な例を示している。
【0036】
この例では、図7(a)および図7(b)に示すように、ダイアログボックス7が画面上で移動可能とされているため、ダイアログボックス7中にある原点71の位置は、ダイアログボックス7の位置に応じて移動する。
【0037】
図7の例では、原点65を「T3 Timeout」という文字列の中心に位置付けている。この場合、ユーザは原点65を定めるための領域として、「T3 Timeout」という文字列が表示される領域を指定し、予め登録しておく。また、ユーザは認識したい文字列が配置された領域66およびチェックボックスの領域67を予め指定し、登録しておく。領域66および領域67の位置は原点65からの相対位置(座標)として登録される。
【0038】
認識手段33は、画像処理によって画像の全域を検索し、登録された領域のパターンと同一パターンの領域を抽出し、その領域の中心を原点65とする。このため、ダイアログボックス7がどの位置にあっても、原点65の位置を特定することができる。
【0039】
次に、認識手段33は、登録されている原点65からの上記相対位置(座標)に基づいて領域66を確定し、領域66にある文字列の認識処理を実行する。この認識処理では、OCRにおいて用いられる各種の技術を用いて文字列を認識することができる。図7の例では、「45」という文字列が認識される。
【0040】
また、認識手段33は、登録されている原点65からの上記相対位置(座標)に基づいて領域67を確定し、画像処理によって領域66にあるチェックボックスに対するチェックの有無を判定する。
【0041】
以上のように、本発明の文字情報読取方法によれば、ビデオ信号に基づいて作成された画像に対して文字情報の認識処理を実行するため、光学的に画像を読み込む場合と異なり、画像の変形や回転、ずれ、あるいは歪みなどが発生しない。このため、文字情報を認識するに際して、画像の縮小、拡大、回転、歪みの除去、あるいは文字列の位置ずれの補正などの煩雑な前処理を実行する必要がない。このため、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
【0042】
本発明の適用範囲は上記実施形態に限定されることはない。本発明は、表示画面に表示される文字情報を読み取る文字情報読取装置および文字情報読取方法に対し、広く適用することができる。
【符号の説明】
【0043】
2 画像転送ユニット(ビデオ信号取得手段)
32 画像作成手段
33 認識手段

【特許請求の範囲】
【請求項1】
表示画面に表示される文字情報を読み取る文字情報読取装置において、
前記表示画面に前記文字情報を表示するためのビデオ信号を取得するビデオ信号取得手段と、
前記ビデオ信号取得手段により取得された前記ビデオ信号を画像に変換する画像作成手段と、
前記画像作成手段により得られた前記画像に対する画像処理によって前記文字情報を認識する認識手段と、
を備えることを特徴とする文字情報読取装置。
【請求項2】
前記認識手段は、前記画像に対する画像処理に基づき前記画像の座標原点を設定する処理と、設定された前記座標原点を基準とする特定の相対座標の領域に対する文字認識処理と、を実行することを特徴とする請求項1に記載の文字情報読取装置。
【請求項3】
前記座標原点を設定する処理では、あらかじめ登録された特徴的な形状を発見し、当該形状の位置に基づいて前記座標原点を設定することを特徴とする請求項2に記載の文字情報読取装置。
【請求項4】
前記文字情報は製造工程における製造条件を規定するパラメータであることを特徴とする請求項1〜3のいずれか1項に記載の文字情報読取装置。
【請求項5】
表示画面に表示される文字情報を読み取る文字情報読取方法において、
前記表示画面に前記文字情報を表示するためのビデオ信号を取得するステップと、
前記ビデオ信号を取得するステップにより取得された前記ビデオ信号を画像に変換するステップと、
前記変換するステップにより得られた前記画像に対する画像処理によって前記文字情報を認識するステップと、
を備えることを特徴とする文字情報読取方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−28611(P2011−28611A)
【公開日】平成23年2月10日(2011.2.10)
【国際特許分類】
【出願番号】特願2009−175111(P2009−175111)
【出願日】平成21年7月28日(2009.7.28)
【出願人】(000006507)横河電機株式会社 (4,443)
【Fターム(参考)】