説明

画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムを記録した記録媒体

【課題】 画像からネットワーク上のアクセス先を示す文字列を適切に検出する。
【解決手段】 Webサーバ10は、画像を入力する入力部13と、入力された画像から文字列を抽出する文字列抽出部14と、抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定部15と、文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス部16と、アクセスの結果に応じた出力を行う出力部17とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像から文字列を抽出する画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムを記録した記録媒体に関する。
【背景技術】
【0002】
従来から画像から文字列を抽出することが行われている。例えば、特許文献1では、文書画像にOCR(Optical Character Recognition)をかけてテキスト情報を抽出して、テキスト情報を解析して個人情報の存在の有無を判断している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−48053号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、Webページに含まれる画像中に、メールアドレスやWebサイトのURL(Uniform Resource Locator)等のネットワーク上のアクセス先を示す文字列が含まれていることがある。当該アクセス先を利用したい場合、通常は、Webページを閲覧しているユーザは、画像内に含まれる文字列を目視確認して当該文字列をアドレス欄等に入力する必要がある。
【0005】
また、Webサイトの管理者が、Webサイトにアップロードされる画像中に不適切なアクセス先の文字列が含まれるかどうか確認を行いたい場合がある。不適切なアクセス先とは、例えば、Webサイトの管理者とアップロードを行う者との間の契約に違反するもの等である。
【0006】
上記のような場合に、上述した従来技術のように画像から文字列を抽出する技術が利用できる。しかしながら、画像に含まれる文字列は必ずしもアクセス先を示すものだけではなく様々な文字列が含まれることがある。そのため、単に上記の技術を適用しても画像から適切にアクセス先を示す文字列を抽出することはできない。また、アクセス先を示す文字列を抽出したとしても、当該アクセス先が利用可能でない場合もある。
【0007】
本発明は、上記を鑑みてなされたものであり、画像からネットワーク上のアクセス先を示す文字列を適切に検出することができる画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムを記録した記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明に係る画像処理装置は、画像を入力する入力手段と、入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、判定手段によって文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、を備えることを特徴とする。
【0009】
文字列抽出手段は、画像における文字列が含まれる文字列領域を抽出して、当該文字列領域に含まれる文字列を構成する各文字について文字認識を行うことによって文字列を抽出することが望ましい。
【0010】
出力手段は、アクセス手段によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先がアクセス可能なものであった場合に当該アクセス先文字列を出力することが望ましい。
【0011】
出力手段は、入力手段によって入力された画像とアクセス先文字列とを表示出力することが望ましい。
【0012】
Webサイトにアクセスするためのブラウザを更に備え、入力手段は、ブラウザがWebサイトにアクセスすることによって取得される画像を自装置に入力して、出力手段は、ブラウザへの出力を行う、ことが望ましい。
【0013】
アクセス手段は、アクセス先に対応するネットワーク上の装置に信号を送信して当該信号の送信に応じた応答を受信することが望ましい。
【0014】
アクセス手段は、応答を受信しない場合にアクセスの結果をアクセス先が無効であると判定することが望ましい。
【0015】
出力手段は、アクセス手段によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先がアクセス可能なものであった場合に、画像の当該アクセス先文字列の部分を、当該アクセス先文字列を参照できない状態にした画像を生成して出力することが望ましい。
【0016】
ところで、本発明は、上記のように画像処理装置の発明として記述できる他に、以下のように画像処理方法、画像処理プログラム及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。
【0017】
本発明に係る画像処理方法は、画像を入力する入力ステップと、入力ステップにおいて入力された画像から文字列を抽出する文字列抽出ステップと、文字列抽出ステップにおいて抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定ステップと、判定ステップにおいて文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセスステップと、アクセスステップにおけるアクセスの結果に応じた出力を行う出力ステップと、を含むことを特徴とする。
【0018】
本発明に係る画像処理プログラムは、一つ以上のコンピュータを、画像を入力する入力手段と、入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、判定手段によって文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、して機能させることを特徴とする。
【0019】
本発明に係る記録媒体は、一つ以上のコンピュータを、画像を入力する入力手段と、入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、判定手段によって文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、して機能させる画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【発明の効果】
【0020】
本発明では、画像にアクセス可能なアクセス先文字列が含まれている場合に応じた出力を行うことができ、画像処理装置の利用者が適切に画像に含まれる利用可能なアクセス先文字列があることを認識することができる。即ち、本発明によれば、画像からネットワーク上のアクセス先を示す文字列を適切に検出することができる。
【図面の簡単な説明】
【0021】
【図1】本発明の第1実施形態に係る画像処理装置であるWebサーバの機能構成を示す図である。
【図2】画像からのWebサイトのURLの抽出を模式的に示した図である。
【図3】文字列がアクセス先文字列か否かを判断するための正規表現を示す表である。
【図4】本発明の第1実施形態に係る画像処理装置であるWebサーバで実行される処理(画像処理方法)を示すシーケンス図である。
【図5】Webサーバから送信されてアップロード用端末で表示出力される情報のイメージを示す図である。
【図6】本発明の第2実施形態に係る画像処理装置であるユーザ端末の機能構成を示す図である。
【図7】本発明の第2実施形態に係る画像処理装置であるユーザ端末で実行される処理(画像処理方法)を示すシーケンス図である。
【図8】本発明の実施形態に係る画像処理プログラムの構成を、記録媒体と共に示す図である。
【発明を実施するための形態】
【0022】
以下、図面と共に本発明に係る画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムを記録した記録媒体の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。以下では、Webサーバを本発明の画像処理装置とした第1実施形態と、ユーザに用いられるユーザ端末を本発明の画像処理装置とした第2実施形態とを説明する。
【0023】
<第1実施形態>
図1に本実施形態に係る画像処理装置であるWebサーバ10を示す。Webサーバ10は、図示しないユーザ端末からWebページを参照するリクエストを受信して、リクエストに応じてWebページのデータをレスポンスとしてユーザ端末に対して送信する装置(システム)である。
【0024】
Webサーバ10によって提供されるWebページは、例えば、ブログや商品を販売するEC(electronic commerce)サイトに係るもの等、任意のWebページでよい。Webサーバ10によって提供されるWebページのデータは、Webサーバ10とインターネットやイントラネット等のネットワークを介して接続されるアップロード用端末20からWebサーバ10に入力される。なお、アップロード用端末20の利用者(Webページのデータのアップロードを行う者)は、必ずしもWebサーバ10の管理者と同一ものではない。例えば、アップロードされるWebページがブログである場合、当該ブログの執筆者であり、WebページがECサイトに係るものである場合、当該ECサイトの運営者である。
【0025】
Webサーバ10によって提供されるWebページには、画像(画像データ)が含まれうる。Webサーバ10は、後述する本発明に係る機能によって、当該画像中に不適切なアクセス先(連絡先)が含まれていないか検出する。ここでいうアクセス先とは、ネットワーク上のアクセス先であり、例えば、(インターネット上の)メールアドレスやWebサイトのURLや(電話網上の)電話番号である。不適切なアクセス先とは、例えば、Webサーバ10の管理者とアップロードを行う者との間の契約に違反するもの等である。また、本人の公開の意思がない場合、アップロードを行う者の個人情報が含まれるもの等である。Webサーバ10は、上記のアクセス先が存在するネットワークに接続されており、当該ネットワーク上の装置にアクセス可能である。
【0026】
Webサーバ10は、CPU(Central Processing Unit)やメモリ、通信モジュール等のハードウェアを備えるサーバ装置等のコンピュータにより実現される。これらの構成要素がプログラム等のより動作することによって、後述するWebサーバ10の機能が発揮される。また、Webサーバ10は、複数のコンピュータからなるコンピュータシステムによって構成されていてもよい。
【0027】
引き続いて、Webサーバ10の機能的な構成について説明する。図1に示すようにWebサーバ10は、画像データベース11と、文字情報データベース12と、入力部13と、文字列抽出部14と、判定部15と、アクセス部16と、出力部17とを備えて構成される。なお、Webサーバ10は、本発明に係る機能以外にもWebページを提供する通常のWebサーバが備える機能も有しているがそれらについては説明を省略する。
【0028】
画像データベース11は、Webページに含まれる画像を格納するデータベースである。
【0029】
文字情報データベース12は、画像に含まれる文字の文字認識に用いる情報を格納するデータベースである。具体的には、文字情報データベース12は、文字を示す情報と当該文字の特徴量とを対応付けた情報を格納する。当該文字の特徴量は、後述する文字認識の手法により予め抽出された文字の特徴を示す情報である。この情報と、画像から抽出された特徴量とが比較されることによって文字認識が行われる。なお、文字情報データベース12は、必ずしもWebサーバ10自体に備えられている必要はなく、アクセス可能なWebサーバ10外部の文字情報データベース12があればよい。
【0030】
入力部13は、画像を入力する入力手段である。具体的には、入力部13は、アップロード用端末20からWebページ用の画像のデータを受信することによって画像を入力する。入力部13は、入力した画像を文字列抽出部14及び出力部17に出力する。
【0031】
文字列抽出部14は、入力部13から入力された画像から文字列を抽出する文字列抽出手段である。画像からの文字列の抽出は、画像における文字列が含まれる文字列領域を抽出して、当該文字列領域に含まれる文字列を構成する各文字について文字認識を行うことによって行われる。具体的には、以下のように行われる。
まず、画像内の文字を抽出するために対象画像をグレースケース画像に変換した後、判別分析法により閾値を決定し2値画像に変換する。この方法には、例えば、大津:判別および最小2 乗規準に基づく自動しきい値選定法,信学論D, Vol.63, No.4,pp.349-356(1980)に記載された方法を用いることができる。次に2値画像にラベリング処理を行い、得られた画像連結要素をピッチ、縦横比及び角度を用いて領域を連結し横方向と縦方向に並んだ文字列領域(文字列画像)を抽出する。この方法には、例えば、芦田,永井,岡本,宮尾,山本:情景画像からの文字抽出,信学論D,Vol.J88-D2, No.9,pp.1817-1824(2005)に記載された方法を用いることができる。
【0032】
なお、抽出される文字列領域は、画像中で領域が重複するものであってもよい。画像中において1つの箇所が、縦方向の文字列領域と、横方向の文字列領域との両方に属するものであってもよい。何れの方向に文字列を読むか明確に判別できない場合であっても、文字列の抽出漏れを防止するためである。
【0033】
続いて、抽出した文字列領域に含まれる文字列を構成する各文字について、画像から文字認識を行って各文字を特定する。文字認識は、以下のように行われる。
【0034】
形態素解析を用いて、入力された文字列領域の画像を文字列を構成する各文字の画像に分割して、各文字の画像に対して文字認識処理を行う。文字認識は、画像から文字認識に用いる特徴量(特徴量を示すベクトル)を抽出して、その特徴量と文字情報データベース12に格納された予め抽出しておいた文字の特徴量とを比較することによって行われる。文字認識に用いる特徴量は、例えば、文字の輪郭を利用した方向線素特徴を用いることができる。この方法には、例えば、孫,田原,阿曽,木村:方向線素特徴量を用いた高精度文字認識,信学論, vol.J74-D-II,No.3,pp.330-339(1991)に記載された方法を用いることができる。
【0035】
文字認識の正確性としては、例えば、特徴量のユークリッド距離の短さを用いることができる。即ち、画像から抽出した特徴量と、文字情報データベース12に格納された文字のうち特徴量のユークリッド距離で最も近い特徴量を有する文字を認識された文字とする。例えば、図2に示すような画像からは、「http://renrakusaki.com」及び「元気企業」という文字列が抽出される。
【0036】
文字列抽出部14は、このようにして画像から抽出した文字列を判定部15に出力する。この出力の際、IDを付与する等して、以降の処理で文字列が何れの画像から抽出されたのかを判別できるようにしておく。また、文字列抽出部14は、画像から文字列を抽出できなかった場合には、その旨を出力部17に通知する。
【0037】
判定部15は、文字列抽出部14から入力された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段である。具体的には、判定部15は、アクセス先に応じた正規表現を記憶しておき、文字列が当該正規表現に一致するか否かを判断することによって、当該文字列がアクセス先文字列であるか否かを判定する。なお、判定部15は、文字列全体が正規表現と一致しない場合でも、文字列の一部が正規表現と一致すればその部分をアクセス先文字列と判定する。即ち、判定部15は、文字列抽出部14から入力された文字列にアクセス先文字列を含むか否か(文字列の一部がアクセス先文字列に相当するか否か)を判定する。
【0038】
例えば図3に示すように、判定部15は、アクセス先の種別、即ち、メールアドレス、URL及び電話番号毎に正規表現を記憶する。判定部15は、文字列抽出部14から入力された文字列が記憶した正規表現の何れかにマッチするか否かを判断する。例えば、図2に示す画像の例では、「http://renrakusaki.com」のみがアクセス先文字列と判定される。
【0039】
判定部15は、画像から抽出された全ての文字列がアクセス先文字列でないと判定した場合は、その旨を出力部17に通知する。また、判定部15は、画像から抽出された何れか文字列がアクセス先文字列であると判定した場合は、当該アクセス先文字列をアクセス部16に出力する。なお、この際、アクセス先文字列の種別を示す情報(アクセス先文字列が、メールアドレスであるのか、URLであるのか等を示す情報)も合わせて出力することが望ましい。
【0040】
アクセス部16は、判定部15によって文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段である。アクセス部16は、アクセス先に対応するネットワーク上の装置に信号を送信して当該信号の送信に応じた応答を受信する。
【0041】
アクセス部16は、アクセス先に対応するネットワーク上の装置を特定する。例えば、アクセス先文字列がメールアドレスやURLの場合は、それらに含まれるドメインを特定する。ドメインは、メールアドレスであれば「@」以降の文字列、URLであれば「http://」の後かつそれ以降の最初の「/」前の文字列である。また、電話番号の場合は、電話番号自体によってアクセス先に対応するネットワーク上の装置が特定される。この装置の特定の際に、判定部15から出力されたアクセス先文字列の種別を示す情報が参照されてもよい。
【0042】
例えば、アクセス先がドメインであった場合は、ドメインで示されるサーバに信号を送信して、応答を受信する。この場合の信号は、例えばhttpリクエストを用いることができる。あるいは、アクセス先が電話番号であった場合は、電話番号で示される電話機に発呼信号を送信して、応答を受信する。
【0043】
アクセス部16は、信号を送信してから予め設定された時間までに応答を受信したら、アクセス先が有効であると判定する。アクセス部16は、信号を送信してから予め設定された時間までに応答を受信しなかったら、アクセス先が無効であると判定する。なお、信号を送信してから予め設定された時間までに応答を受信しない場合に、信号の再送を行って再送に対して応答がない場合にアクセス先が無効であると判定することとしてもよい。なお、上記の判定ではアクセス先の有効無効を判定しているが、信号の送信先がアクセス先文字列に直接対応するもの(例えば、電話番号)に関してはアクセス先文字列自体の有効無効の判定としてもよい。アクセス部16は、上記の判定の結果を示す情報を出力部17に出力する。
【0044】
出力部17は、アクセス部16によるアクセスの結果に応じた出力を行う出力手段である。この出力は、例えば、画像に有効なアクセス先を含むアクセス先文字列を含むか否かを通知することを目的とする。例えば、アップロードを行う者の個人情報が含まれることの注意喚起を行いたい場合には、アップロード用端末20に対して、アクセス部16によるアクセスの結果に応じた情報の送信を行う。
【0045】
出力部17は、アクセス部16によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先が有効(アクセス可能)なものであった場合に、当該アクセス先文字列と共に当該当該アクセス先文字列が画像に含まれておりアクセス可能なアクセス先を含む旨の情報を電子メール等でアップロード用端末20に送信する。また、この場合、当該画像の当該アクセス先文字列の部分を、当該アクセス先文字列を参照できない状態にした画像を生成して出力し、画像データベース11に格納する。これは、アップロードを行う者の確認がない状態で当該画像を公開することが適当でないと考えられるためである。
【0046】
アクセス先文字列を参照できない状態にした画像は、例えば、画像中のアクセス先文字列の部分を当該アクセス先文字列の色とは別の色で塗りつぶした画像である。その画像の生成のため、具体的には、出力部17は、画像におけるアクセス先文字列を抽出した文字列領域の位置(座標)を取得する。続いて、出力部17は、当該文字列領域の位置の周辺領域の背景色を示す情報を取得する。出力部17は、その背景色で文字列領域を塗りつぶした画像を生成する。アップロードを行う者の確認がない状態では、当該画像が利用されたWebページに要求があった場合には、塗りつぶされた画像が出力、表示させて、アクセス先文字列を参照できないようにする。出力部17は、その一方で元の(オリジナルの)画像も画像データベース11に格納しておく。アップロードを行う者の確認がされた場合には、元の画像が出力、表示される。
【0047】
出力部17は、アクセス部16によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先が無効(アクセス不可能)なものであった場合に、その旨の情報を電子メール等でアップロード用端末20に送信する。また、その場合、出力部17は、(公開に際して特に問題がない画像であるとして)当該画像をWebページに含まれる画像として画像データベース11に格納する。
【0048】
出力部17は、画像から抽出された文字列がアクセス先文字列でない旨を判定部15から通知された場合、及び画像から文字列が抽出ができない旨を文字列抽出部14から通知された場合に、その旨の情報を電子メール等でアップロード用端末20に送信する。また、その場合、出力部17は、(公開に際して特に問題がない画像であるとして)当該画像をWebページに含まれる画像として画像データベース11に格納する。
【0049】
なお、上記の例では、アクセス部16によるアクセスの結果に応じた出力は、主にアップロード用端末20に対して行われるものであったが、それ以外に出力が行われても良い。例えば、Webサーバ10の管理者が、偽のWebサイトへのリンクやWebサーバ10の管理者とアップロードを行う者との間の契約に違反するアクセス先を検出しようとする場合には、Webサーバ10の管理者が参照できる形での出力を行うこととすればよい。以上が、本実施形態に係るWebサーバ10の機能的な構成である。
【0050】
引き続いて、図4のシーケンス図を用いて、本実施形態に係るWebサーバ10で実行される処理(画像処理方法)を説明する。この処理は、アップロード用端末20から、Webページ用の画像がWebサーバ10に対してアップロードされるときに実行される。
【0051】
本処理では、まず、アップロード用端末20からWebサーバ10に対して、Webページ用の画像がアップロードされる(S01)。画像のアップロードは、アップロード用端末に対するアップロード用端末20の利用者の操作によって、行われる。なお、このアップロードの際には、アップロード用端末20の利用者のID等が含まれていてもよい。
【0052】
Webサーバ10では、入力部13によって当該画像が受信されて入力される(S01、入力ステップ)。入力された画像は、入力部13から文字列抽出部14及び出力部17に出力される。続いて、文字列抽出部14によって、入力部13から入力された画像から文字列(テキスト)が抽出される。まず、画像内の文字列領域が特定(抽出)される(S02、文字列抽出ステップ)。続いて、当該文字列領域の画像が各文字の画像に分割されて、各文字の画像から特徴量を示すベクトルが取得される(S03、文字列抽出ステップ)。続いて、特徴量を示すベクトルと文字情報データベース12に格納された情報とが比較されて、文字列が取得される(S04、文字列抽出ステップ)。
【0053】
このように抽出された文字列は文字列抽出部14から判定部15に出力される。なお、画像から文字列を抽出できなかった場合には、その旨が文字列抽出部14から出力部17に通知される。出力部17によって、その旨の情報が電子メール等でアップロード用端末20に送信される(図示せず)。また、出力部17によって、画像がWebページに含まれる画像として画像データベース11に格納される(図示せず)。
【0054】
画像から文字列が抽出された場合、続いて、判定部15によって、文字列がアクセス先文字列であるか否かが判定される(S05、判定ステップ)。画像から抽出されたいずれの文字列もアクセス先文字列でなかった場合(S05のNO)、その旨が文字列抽出部14から出力部17に通知される。続いて、出力部17によって、その旨の情報が電子メール等でアップロード用端末20に送信される(S06、出力ステップ)。また、出力部17によって、画像がWebページに含まれる画像として画像データベース11に格納される(S07)。
【0055】
画像から抽出された文字列のいずれかがアクセス先文字列であった場合(S05のYES)、そのアクセス先文字列が判定部15からアクセス部16に出力される。続いて、アクセス部16によって、アクセス先文字列のドメインが抽出される(S08、アクセスステップ)。続いて、アクセス部16によって、ドメインで示されるサーバに当該ドメインが存在するか確認するための信号であるリクエスト(httpリクエスト)が送信される(S09、アクセスステップ)。
【0056】
予め設定された時間までに、ドメインで示されるサーバから当該リクエストに対するレスポンスがなかった場合(S10のNO)、アクセス部16によってアクセス先が無効であると判定されて、判定の結果を示す情報がアクセス部16から出力部17に出力される。続いて、出力部17によって、その旨の情報が電子メール等でアップロード用端末20に送信される(S11、出力ステップ)。また、出力部17によって、画像がWebページに含まれる画像として画像データベース11に格納される(S12)。
【0057】
予め設定された時間までに、ドメインで示されるサーバから当該リクエストに対するレスポンスがあった場合、アクセス部16によって当該レスポンスが受信される。その場合(S10のYES)、アクセス部16によって当該アクセス先のドメインは有効であると判定されて、判定の結果を示す情報がアクセス部16から出力部17に出力される(S13、アクセスステップ)。
【0058】
続いて、出力部17によって、その旨の情報が電子メール等でアップロード用端末20に送信される(S14、出力ステップ)。例えば、より具体的には、アップロードした画像に個人情報が含まれるおそれがあることを示す図5(a)に示すようなメールが、出力部17からアップロード用端末20に送信される。
【0059】
また、出力部17によって、以下のように当該画像の当該アクセス先文字列の部分を、当該アクセス先文字列を参照できない状態にした画像が生成されて、元の画像と共に画像データベース11に格納される。まず、画像におけるアクセス先文字列を抽出した文字列領域の位置(座標)が取得される(S15、出力ステップ)。続いて、当該文字列領域の位置の周辺領域の背景色を示す情報が取得される(S16、出力ステップ)。続いて、その背景色で上記の文字列領域を塗りつぶした画像が生成される(S17、出力ステップ)。塗りつぶされた画像及び元の画像の両方が、Webページに含まれる画像として画像データベース11に格納される(S18)。
【0060】
S14においてWebサーバ10からアップロード用端末20に送信された図5(a)に示すメールには、URLが含まれる。Webサーバ10では、このURLによってアクセスされる先に、対象となっている画像を表示すると共に、図5(b)に示すような、当該画像の表示可否の入力をアップロード用端末20の利用者から受け付けられる確認用のWebページが用意される。
【0061】
上記の確認用のWebページにより、アップロード用端末20の利用者から当該画像の表示を許可する入力があった場合は、当該画像が含まれるWebページへのアクセスがあった場合に元の画像が表示されるWebページに含まれる画像として出力される。また、上記の確認用のWebページによりアップロード用端末20の利用者から当該画像の表示を拒否する入力があった場合、あるいは確認用へのアクセスがない場合には、当該画像が含まれるWebページへのアクセスがあった場合に上記の塗りつぶされた画像が表示されるWebページに含まれる画像として出力される。以上が本実施形態に係るWebサーバ10で実行される処理(画像処理方法)である。
【0062】
上述したように本実施形態によれば、アップロード用端末20からアップロードされたWebページ用の画像に含まれるアクセス先文字列に応じたアクセスが行われて、当該アクセスの結果に応じた出力がなされる。従って、本実施形態では、実際にWebページが参照可能なURLや送信可能なメールアドレス等のアクセス可能なアクセス先文字列が画像に含まれている場合に応じた出力を行うことができる。これにより、アップロード用端末20の利用者が適切に画像に含まれる利用可能なアクセス先文字列があることを認識することができる。本実施形態によれば、画像からネットワーク上のアクセス先を示す文字列を適切に検出することができる。
【0063】
なお、本実施形態では、不適切なアクセス先を検出することを目的としていたが、本発明は、必ずしも不適切なアクセス先を検出するものだけに限られない。本発明は、何らかの目的をもって画像からアクセス先文字列を検出するものであれば適用可能である。
【0064】
また、本実施形態のようにアクセス部16によるアクセスを、信号を送信して応答を待つものとすればアクセス先の利用可能性を適切に判断することができる。また、応答を受信しない場合にアクセス先が無効であると判定することとすれば、更にアクセス先の利用可能性を適切に判断することができる。但し、アクセス部16によるアクセスは、必ずしも上記のものに限られない。アクセス先の利用可能性を判定しえるものであれば、どのようなアクセスが行われてもよい。
【0065】
また、本実施形態のように、画像の利用形態によっては、画像にアクセス可能なアクセス先を示すアクセス先文字列が含まれている場合には、当該アクセス先文字列を参照できない画像を生成して出力することが望ましい。この構成によれば、Webページにおいて、アクセス先が示されていない画像を表示させる等の柔軟な画像の利用か可能となり、利便性を向上させることができる。また、本実施形態のようにアクセス先文字列の部分を画像の背景色で塗りつぶすこととすれば、塗りつぶされた画像を別のユーザが見た場合であっても不自然に思うことがない。
【0066】
また、画像から文字列を抽出する方法として、本実施形態のように文字列領域に対して文字認識の手法を用いることが望ましい。但し、文字列が抽出できればよいので必ずしも本実施形態のような方法を利用する必要はなく、任意の方法を利用しえる。
【0067】
<第2実施形態>
図6に本実施形態に係る画像処理装置であるユーザ端末120を示す。ユーザ端末120は、ユーザによって用いられインターネット等のネットワークを介した通信を行うことができる装置である。ユーザ端末120は、当該通信機能によってWebサーバ110と通信を行うことができる。ユーザ端末120は、Webサーバ110にWebページを参照するリクエストを送信して、当該送信に応じてWebサーバから送信されるWebページのデータをレスポンスとして受信する。ユーザ端末120は、受信したWebページのデータを自端末におけるブラウザ(Webブラウザ)で表示する。
【0068】
ユーザ端末120において表示されるWebページの画像中に含まれる文字列はWebページにテキストデータとして含まれる文字列とは異なり、通常、コピーアンドペースト等のテキストデータとしての処理を行うことができない。従って、当該画像中にURL等のアクセス先文字列が含まれており、ユーザが当該URLで示されるWebページにアクセスしたいと思った場合、通常、画像中に含まれる文字列を目視してアドレス欄等に入力する必要があった。本実施形態による機能は、Webページの画像中に含まれるアクセス可能なアクセス先を示すアクセス先文字列を容易に利用できるようにさせるものである。
【0069】
ユーザ端末120は、CPUやメモリ、通信モジュール等のハードウェアを備えるPC(Personal Computer)等のコンピュータにより実現される。これらの構成要素がプログラム等のより動作することによって、後述するユーザ端末120の機能が発揮される。
【0070】
引き続いて、ユーザ端末120の機能的な構成について説明する。図6に示すようにユーザ端末120は、ブラウザ130と、エージェント140とを備えて構成される。なお、ユーザ端末120は、本発明に係る機能以外にも通信端末等として通常備える機能も有しているがそれらについては説明を省略する。
【0071】
ブラウザ130は、WebサイトであるWebサーバ110にアクセスして、Webページを取得して表示出力する手段である。エージェント140は、ブラウザ130と協業して本実施形態の機能を実現する手段であり、例えば、ブラウザ130のアドオンとして実現される。図6に示すように、エージェント140は、文字情報データベース141と、入力部142と、文字列抽出部143と、判定部144と、アクセス部145と、出力部146とを備えて構成される。
【0072】
文字情報データベース141は、第1実施形態の文字情報データベース12と同様のデータベースである。
【0073】
入力部142は、画像を入力する入力手段である。具体的には、ブラウザ130がWebサイトにアクセスすることによって取得される画像を(自装置10のエージェント140に)入力する。入力部142は、入力した画像を文字列抽出部143及び出力部146に出力する。また、入力部142は、画像が含まれるWebページのデータも取得して出力部146に出力する。
【0074】
文字列抽出部143は、第1実施形態の文字列抽出部14と同様の機能を有する文字列抽出手段である。文字列抽出部143は、画像から抽出した文字列を判定部144に出力する。また、文字列抽出部143は、画像から文字列を抽出できなかった場合には、当該Webページに係るエージェント140の処理を終了させる。
【0075】
判定部144は、第1実施形態の判定部15と同様の機能を有する判定手段である。判定部144は、画像から抽出された何れか文字列がアクセス先文字列であると判定した場合は、当該アクセス先文字列をアクセス部145に出力する。また、判定部144は、画像から抽出された全ての文字列がアクセス先文字列でないと判定した場合は、当該Webページに係るエージェント140の処理を終了させる。
【0076】
アクセス部145は、第1実施形態のアクセス部16と同様の機能を有するアクセス手段である。アクセス部145は、アクセスの結果に基づく判定の結果を示す情報を出力部146に出力する。
【0077】
出力部146は、アクセス部145によるアクセスの結果に応じた出力を行う出力手段である。出力部146は、アクセス部145によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先がアクセス可能なものであった場合に当該アクセス先文字列をテキストデータとしてブラウザ130に出力してブラウザ130で表示出力させる。また、出力部146は、入力部142によって入力された画像とアクセス先文字列(のテキストデータ)とを合わせてブラウザ130上で表示出力させる。
【0078】
これは、ユーザ端末120のユーザに、画像内にアクセス可能なアクセス先文字列が含まれていることを認識させるものである。また、テキストデータで表示されているので、アクセス先文字列を容易にコピーアンドペースト等することができ、アドレス欄への入力等のアクセス先文字列の利用を容易にするものである。
【0079】
具体的には、出力部146は、WebページのHTMLのソースをパースして、画像タグを参照することによって当該画像が表示される位置を特定する。特定した画像が表示される位置(画像タグ)の下に、アクセス先文字列をテキストデータが入力されたテキストボックスが設けられたWebページを生成する。当該Webページをブラウザ130に出力して、ブラウザ130において表示出力させる。これにより、画像の下に当該画像に(表示上)含まれるアクセス先文字列がテキストデータとして表示出力される。以上が、本実施形態に係るユーザ端末120の機能的な構成である。
【0080】
引き続いて、図7のシーケンス図を用いて、本実施形態に係るユーザ端末120で実行される処理(画像処理方法)を説明する。この処理は、ユーザ端末120から、Webサイト(Webサーバ110)にアクセスされて、ユーザ端末120においてWebページが閲覧されるときに実行される。
【0081】
本処理では、まず、ユーザ端末120のブラウザ130からWebサーバ10に対してアクセスがなされる(S21)。即ち、ブラウザ130からWebサーバ10に対して、Webページを要求するリクエストが送信される。Webサーバ110では、当該リクエストが受信されると、リクエストに応じたWebページのデータがレスポンスとしてユーザ端末に対して送信される(S22)。当該Webページのデータは、ブラウザ130に入力されて表示される(S23)。その一方、当該Webページのデータは、エージェント140の入力部142にも入力される(S22、入力ステップ)。
【0082】
入力されたWebページのデータに含まれる画像は、入力部142から文字列抽出部14及び出力部17に出力される。また、Webページ自体のデータは、入力部142から出力部17に出力される。なお、Webページに画像が含まれなかった場合には、エージェントの処理は終了する(図示せず)。このようにエージェントの処理が途中で終了した場合には、ブラウザ130におけるWebページの表示には特段の影響がない(以下で、エージェントの処理が途中で終了した場合も同様である)。
【0083】
続いて、文字列抽出部143によって、入力部142から入力された画像から文字列(テキスト)が抽出される。まず、画像内の文字列領域が特定(抽出)される(S24、文字列抽出ステップ)。続いて、当該文字列領域の画像が各文字の画像に分割されて、各文字の画像から特徴量を示すベクトルが取得される(S25、文字列抽出ステップ)。続いて、特徴量を示すベクトルと文字情報データベース141に格納された情報とが比較されて、文字列が取得される(S26、文字列抽出ステップ)。
【0084】
このように抽出された文字列は文字列抽出部143から判定部144に出力される。なお、画像から文字列を抽出できなかった場合には、当該Webページに係るエージェント140の処理が終了する(図示せず)。
【0085】
画像から文字列が抽出された場合、続いて、判定部144によって、文字列がアクセス先文字列であるか否かが判定される(S27、判定ステップ)。画像から抽出されたいずれの文字列もアクセス先文字列でなかった場合(S27のNO)、当該Webページに係るエージェント140の処理が終了する(S28)。
【0086】
画像から抽出された文字列のいずれかがアクセス先文字列であった場合(S27のYES)、そのアクセス先文字列が判定部144からアクセス部145に出力される。続いて、アクセス部145によって、アクセス先文字列のドメインが抽出される(S29、アクセスステップ)。続いて、アクセス部145によって、ドメインで示されるサーバに当該ドメインが存在するか確認するための信号であるリクエスト(httpリクエスト)が送信される(S30、アクセスステップ)。
【0087】
予め設定された時間までに、ドメインで示されるサーバから当該リクエストに対するレスポンスがなかった場合(S31のNO)、アクセス部145によってアクセス先が無効であると判定されて、当該Webページに係るエージェント140の処理が終了する(S32)。
【0088】
予め設定された時間までに、ドメインで示されるサーバから当該リクエストに対するレスポンスがあった場合、アクセス部145によって当該レスポンスが受信される。その場合(S31のYES)、アクセス部145によって当該アクセス先のドメインは有効であると判定されて、判定の結果を示す情報がアクセス部145から出力部146に出力される(S33、アクセスステップ)。
【0089】
続いて、出力部146によって、以下のようにアクセス先文字列のテキストデータがWebページの当該アクセス先文字列が含まれる画像の下の部分に表示出力されるようにされる。まず、WebページのHTMLのソースがパースされて、画像タグを参照されることによって当該画像が表示される位置が特定される(S34、出力ステップ)。続いて、特定された位置(画像タグ)の下にアクセス先文字列をテキストデータが入力されたテキストボックスが設けられたWebページが生成される(S35、出力ステップ)。このようにテキストボックスが画像のすぐ下(後)に表示出力することとすれば、閲覧するユーザにとってどの画像から得られたテキストデータであるのかが判別しやすい。生成されたWebページは、出力部146からブラウザ130に出力されて(S36、出力ステップ)、ブラウザ130において表示出力される(S37、出力ステップ)。ブラウザ130における表示は、既に表示されているWebページの画像の下にテキストボックスが出現する形となる。以上が本実施形態に係るWebサーバ10で実行される処理(画像処理方法)である。
【0090】
上述したように本実施形態によれば、Webサーバ110から取得されたWebページ用の画像に含まれるアクセス先文字列に応じたアクセスが行われて、当該アクセスの結果に応じた出力がなされる。従って、本実施形態では、実際にWebページが参照可能なURLや送信可能なメールアドレス等のアクセス可能なアクセス先文字列が画像に含まれている場合に応じた出力を行うことができる。これにより、ユーザ端末120のユーザが適切に画像に含まれる利用可能なアクセス先文字列があることを認識し、利用することができる。本実施形態によれば、画像からネットワーク上のアクセス先を示す文字列を適切に検出することができる。
【0091】
また、本実施形態のようにアクセス先文字列をテキストデータとして、当該アクセス先文字列が含まれる画像と共にブラウザ130で表示出力されることが望ましい。この構成によれば、画像に含まれるアクセス可能なアクセス先文字列を適切に認識することができ、コピーアンドペースト等、容易に利用することができる。
【0092】
又は、本実施形態におけるアクセス先文字列をテキストデータとして、ユーザ端末のコピー用メモリ領域(クリップボード)に出力することも可能である。コピー用メモリ領域に出力した場合、ユーザは画像に含まれる文字を読み取る必要がないし、さらに抽出されたテキストデータをコピーする操作をする必要もない。
【0093】
なお、上述した実施形態では、他の装置から受信された画像に対する処理としているが、必ずしも他の装置から受信された画像に対する処理ではなく、予め画像処理装置に格納された画像に対する処理としてもよい。
【0094】
引き続いて、上述した一連のWebサーバ10又はユーザ端末120の上述した画像処理をコンピュータに実行させるための画像処理プログラムを説明する。図8に示すように、画像処理プログラム41は、コンピュータに挿入されてアクセスされる、あるいはコンピュータが備える記録媒体40に形成されたプログラム格納領域40a内に格納される。
【0095】
画像処理プログラム41は、画像処理を統括的に制御するメインモジュール41aと、入力モジュール41bと、文字列抽出モジュール41cと、判定モジュール41dと、アクセスモジュール41eと、出力モジュール41fとを備えて構成される。入力モジュール41bと、文字列抽出モジュール41cと、判定モジュール41dと、アクセスモジュール41eと、出力モジュール41fとを実行させることにより実現される機能は、上述したWebサーバ10又はユーザ端末120の入力部13,142と、文字列抽出部14,143と、判定部15,144と、アクセス部16,145と、出力部17,146との機能とそれぞれ同様である。
【0096】
なお、画像処理プログラム41は、その一部若しくは全部が、通信回線等の伝送媒体を介して伝送され、他の機器により受信されて記録(インストールを含む)される構成としてもよい。また、画像処理プログラム41の各モジュールは、1つのコンピュータでなく、複数のコンピュータのいずれかにインストールされてもよい。その場合、当該複数のコンピュータによるコンピュータシステムよって上述した一連のWebサーバ10又はユーザ端末120の画像処理が行われる。
【符号の説明】
【0097】
10…Webサーバ、11…画像データベース、12…文字情報データベース、13…入力部、14…文字列抽出部、15…判定部、16…アクセス部、17…出力部、20…アップロード用端末、110…Webサーバ、120…ユーザ端末、130…ブラウザ、140…エージェント、141…文字情報データベース、142…入力部、143…文字列抽出部、144…判定部、145…アクセス部、146…出力部、40…記録媒体、40a…プログラム格納領域、41…画像処理プログラム、41a…メインモジュール、41b…入力モジュール、41c…文字列抽出モジュール、41d…判定モジュール、41e…アクセスモジュール、41f…出力モジュール。

【特許請求の範囲】
【請求項1】
画像を入力する入力手段と、
前記入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、
前記文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、
前記判定手段によって前記文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、
前記アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、
を備える画像処理装置。
【請求項2】
前記文字列抽出手段は、前記画像における文字列が含まれる文字列領域を抽出して、当該文字列領域に含まれる文字列を構成する各文字について文字認識を行うことによって前記文字列を抽出することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記出力手段は、前記アクセス手段によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先がアクセス可能なものであった場合に当該アクセス先文字列を出力することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記出力手段は、前記入力手段によって入力された画像と前記アクセス先文字列とを表示出力することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
Webサイトにアクセスするためのブラウザを更に備え、
前記入力手段は、前記ブラウザがWebサイトにアクセスすることによって取得される画像を自装置に入力して、
前記出力手段は、前記ブラウザへの出力を行う、
ことを特徴とする請求項1〜4の何れか一項に記載の画像処理装置。
【請求項6】
前記アクセス手段は、前記アクセス先に対応する前記ネットワーク上の装置に信号を送信して当該信号の送信に応じた応答を受信することを特徴とする請求項1〜5の何れか一項に記載の画像処理装置。
【請求項7】
前記アクセス手段は、前記応答を受信しない場合に前記アクセスの結果を前記アクセス先が無効であると判定することを特徴とする請求項6に記載の画像処理装置。
【請求項8】
前記出力手段は、前記アクセス手段によるアクセスの結果、当該アクセス先文字列によって示されるアクセス先がアクセス可能なものであった場合に、前記画像の当該アクセス先文字列の部分を、当該アクセス先文字列を参照できない状態にした画像を生成して出力することを特徴とする請求項1〜7の何れか一項に記載の画像処理装置。
【請求項9】
画像を入力する入力ステップと、
前記入力ステップにおいて入力された画像から文字列を抽出する文字列抽出ステップと、
前記文字列抽出ステップにおいて抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定ステップと、
前記判定ステップにおいて前記文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセスステップと、
前記アクセスステップにおけるアクセスの結果に応じた出力を行う出力ステップと、
を含む画像処理方法。
【請求項10】
一つ以上のコンピュータを、
画像を入力する入力手段と、
前記入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、
前記文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、
前記判定手段によって前記文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、
前記アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、
して機能させる画像処理プログラム。
【請求項11】
一つ以上のコンピュータを、
画像を入力する入力手段と、
前記入力手段によって入力された画像から文字列を抽出する文字列抽出手段と、
前記文字列抽出手段によって抽出された文字列がネットワーク上のアクセス先を示すアクセス先文字列であるか否かを判定する判定手段と、
前記判定手段によって前記文字列がアクセス先文字列であると判定された場合に、当該アクセス先文字列によって示されるアクセス先に応じたアクセスを行うアクセス手段と、
前記アクセス手段によるアクセスの結果に応じた出力を行う出力手段と、
して機能させる画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−94036(P2012−94036A)
【公開日】平成24年5月17日(2012.5.17)
【国際特許分類】
【出願番号】特願2010−241942(P2010−241942)
【出願日】平成22年10月28日(2010.10.28)
【出願人】(399037405)楽天株式会社 (416)
【Fターム(参考)】