説明

キーワードを取得する方法及び装置

【課題】画像に基づいて、画像に対応する更に正確なキーワードを取得することができる、キーワードを取得する方法及び装置を提供する。
【解決手段】本発明に係るキーワードを取得する方法は、画像におけるテキスト領域を探し、光学式文字認識を通して前記テキスト領域におけるテキストコンテンツを認識し、認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチし、サーチされたウェブページから第二のクラスの保留のキーワードを抽出し、少なくとも抽出された第二のクラスの保留のキーワードから前記画像に対応する1以上のキーワードを決定する。本発明の実施の形態によれば、OCRとウェブページのサーチとの両者が組み合わされ、キーワードの収束を保証するためにOCRを通して認識及び選択された第一のクラスのキーワードに基づいてウェブページがサーチされ、次いでキーワードの正確性を保証するためにサーチされたウェブページから第二のクラスの保留のキーワードが選択される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理に関し、より詳細には、キーワードを取得する方法及び装置に関するものである。
【背景技術】
【0002】
科学及び技術の絶えず続く発展に従い、増加する様々なやり方で人々は日常生活の中で情報を公開し、取得している。例えば、広告を公開するため、広告の公にされた画像に対応する屋外広告の詳細な導入は、従来に掲示された公にされた画像に加えて、インターネット上の文書等で公開することができ、多少制限された量の情報を含む広告の画像をユーザが見たとき、広告に関心をもったユーザは、画像にテキストを記録し、次いでコンピュータ又は携帯電話を通してインターネットにログオンし、画像における記録されたテキストをサーチエンジンに入力して、広告の詳細をサーチする。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかし、ユーザは、サーチを実行するとき、サーチキーワードとして画像にテキストを入力する必要があるが、入力のプロセスは手動的に実行され、従って誤りが生じる傾向があり、面倒且つ非効率的である一方、他方で、画像に含まれるテキストの情報が制限されており、画像から決定されたキーワードが十分に正確でない。従って、画像に対応する正確なキーワードの自動的且つ効率的な取得がその後の操作のために重要であり、これらのキーワードは、データ(画像又はウェブページ)のサーチに適用され、製品情報や、需要分布統計サービス及び他のサービスを含む様々なサービスに関して調べることができる。
【0004】
従来技術において、ある画像に対応するキーワードを自動的に取得する方法は、例えばOCR(Optical Character Recognition)等といった文字認識及びテキスト抽出を通して実行することができ、画像に対応するキーワードはこの方法において自動的に抽出されるが、抽出されたキーワードは、文字の制限された認識精度及び画像におけるテキスト情報の量のために、認識エラー又は不正確さの問題に苦しむ場合がある。
【課題を解決するための手段】
【0005】
このような状況に鑑みて、本発明の実施の形態は、画像に基づいて、画像に対応する更に正確なキーワードを取得することができる、キーワードを取得する方法及び装置を提供する。
【0006】
本発明の実施の形態の態様によれば、キーワードを取得する方法が提供され、本方法は、画像におけるテキスト領域を探し、光学式文字認識(OCR)を通してテキスト領域におけるテキストコンテンツを認識し、認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択してウェブページをサーチし、サーチされたウェブページから第二のクラスの保留のキーワードを抽出し、少なくとも第二のクラスの保留のキーワードから画像に対応する1以上のキーワードを決定する。
【0007】
本発明の実施の形態の別の態様によれば、キーワードを取得する装置が提供され、本装置は、画像におけるテキスト領域を探し、光学式文字認識(OCR)を通してテキスト領域におけるテキストコンテンツを認識する認識手段と、認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択してウェブページをサーチするサーチ手段と、サーチされたウェブページから第二のクラスの保留のキーワードを抽出する抽出手段と、少なくとも第二のクラスの保留のキーワードから画像に対応する1以上のキーワードを決定する決定手段とを備える。
【0008】
さらに、本発明の別の態様によれば、情報処理装置で実行されたときに、情報処理装置に、本発明に係るキーワードを取得する上述した方法を実行させるコンピュータ読み取り可能なコードを記憶した記憶媒体が更に提供される。
【0009】
さらに、本発明の更なる態様によれば、情報処理装置で実行されたときに、情報処理装置に、本発明に係るキーワードを取得する上述した方法を実行させるコンピュータ実行可能な命令を含むコンピュータプログラムが更に提供される。
【0010】
本発明の実施の形態の上述した解決手段によれば、OCRを通して抽出されたキーワードは、非常に収束性があるが、認識率が悪く、認識精度が低く、サーチされたウェブページから抽出されたキーワードは、比較的正確であるが、冗長なコンテンツ及び多数の関係のない単語を含む場合があるが(すなわち収束性が悪い)、キーワードの収束を保証するためにOCRを通して認識及び選択された第一のクラスの保留のキーワードい基づいてウェーブページがサーチされ、キーワードの正しさを保証するためにサーチされたウェブページから第二のクラスの保留のキーワードが選択され、これにより画像に対応する最終的に決定されたキーワードの精度が改善されるように、OCRとウェブページのサーチの両者が結合される。これらのキーワードは、データ(画像又はウェブページ)をサーチして、製品情報や、需要分布統計サービス及び他のサービスを含む様々なサービスに関する問合せに適用することができる。
【0011】
本発明の実施の形態の他の態様は、本発明を限定するものではないが、本発明の好適な実施の形態を十分に開示することに役立つ以下の詳細な説明において提供される。
【図面の簡単な説明】
【0012】
本発明の実施の形態の上述の目的及び利点、並びに他の目的及び利点は、添付図面を参照して特定の実施の形態と共に以下に更に記載される。添付図面では、同一又は対応する技術的特徴又は構成要素は、同一又は対応する参照符号と共に示される。
【図1】本発明の実施の形態に係る方法を例示するフローチャートである。
【図2A】本発明の実施の形態における画像を例示する図である。
【図2B】本発明の実施の形態における別の画像を例示する図である。
【図3】本発明の実施の形態に係る方法における、第一のクラスの保留のキーワードを選択してウェブページをサーチすることを例示するフローチャートである。
【図4】本発明の実施の形態に係る方法における、サーチされたウェブページから第二のクラスの保留のキーワードを抽出することを例示するフローチャートである。
【図5A】本発明の実施の形態に係るウェブページのサーチ結果を例示する図である。
【図5B】本発明の実施の形態に係るウェブページのサーチ結果を例示する図である。
【図6A】本発明の実施の形態に係る代表的なウェブページを例示する図である。
【図6B】本発明の実施の形態に係る代表的なウェブページを例示する図である。
【図7】本発明の実施の形態に係る装置を例示する図である。
【図8】本発明の実施の形態に係る装置におけるサーチユニットを例示する図である。
【図9】本発明の実施の形態に係る装置における抽出ユニットを例示する図である。
【図10】本発明の実施の形態で使用される情報処理装置としてパーソナルコンピュータの例示的な構造を示すブロック図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態を添付図面を参照しながら説明する。
本発明者は、従来技術の方法における画像に対するキーワードの取得は少なくとも以下の問題に苦しむ場合があることを、本発明の創作の間に認識している。
従来技術において画像に対応するキーワードを抽出するため、採用される方法は、文字を認識し、画像におけるテキスト情報からダイレクトにテキストを抽出し、更に画像に対応するキーワードを取得することである。この方法では、画像に含まれるテキスト情報の制限された量及び画像の認識精度のため、誤って認識されたキーワードが容易に生じる場合があり、結果として画像に対応する情報を記述している取得されたキーワードは、十分に正確ではない場合がある。
従って、本発明は、はじめに、この問題に対処する対応する方法を提供する。図1を参照して、本発明の実施の形態に係るキーワードを取得する方法は、以下のステップを含む。
S101:画像におけるテキスト領域は探され、OCRを通して、テキスト領域におけるテキストコンテンツが認識される。
【0014】
ユーザが携帯電話等で捕捉した画像を取得した後、はじめに、画像におけるテキスト領域は、例えば図2A及び図2Bに示されるような領域に基づく(area-based)方法、連結性のコンポーネントに基づく(connectivity component-based)方法等といった、既存のテキスト検出方法で探される。次いで、テキストストロークは、例えばカラークラスタリング方法、グレイスケール2値化方法等といった既存のストローク抽出方法で抽出される。
【0015】
テキスト領域が探され、テキストストロークが抽出された後、テキスト領域におけるテキストコンテンツは、テキスト認識を通して認識され、単語の単位で結合される。上述のプロセスは、電子装置(例えばスキャナ、デジタルカメラ等)が、例えば明暗及び明るさのパターンを判定してそれらの形状を決定することで、紙又は別の媒体に印刷された文字をチェックし、次いで、テキスト文書がスキャンされ、画像ファイルが分析されてテキスト及びページ情報が取得されるプロセスである文字認識を通して、その形状をコンピュータテキストに変換するプロセスであるOCRを通して実行される。
【0016】
テキスト領域を探し、テキストコンテンツを認識するプロセスは、従来技術におけるように実行することができ、その詳細な説明は、ここでは繰り返されない。このステップでは、認識されたテキストコンテンツは、以下の表1及び表2に示される。
【0017】
【表1】

【0018】
【表2】

特に、認識された単語は、制限された認識精度のために、複数の候補となる単語を含む場合がある。例えば、
【0019】
(外1)

から認識された単語は、候補となる単語
【0020】
(外2)

を含み、“On Sale”から認識された単語は、候補となる単語“On Sole”を含む。認識された単語は、例えばそれらの信頼度、画像における位置、サイズ等、或いはこれらの組み合わせによる特定のルールの下で更にソートされる。
【0021】
S102:第一のクラスの保留のキーワードは、ウェブページをサーチするために、認識されたテキストコンテンツから選択される。
【0022】
テキストコンテンツが認識された後、認識されたテキストコンテンツは、ウェブページをサーチするために第一のクラスの保留のキーワードとしてダイレクトに使用されるか、認識されたテキストコンテンツの一部は、ウェブページをその後にサーチするために第一のクラスの保留のキーワードとして選択される。認識されたテキストコンテンツの一部を選択する特定のプロセスは、実施の形態において以下に記載される。
【0023】
特に、サーチエンジンは、ウェブページのサーチキーワードとして、決定された第一のクラスの保留のキーワードでウェブページをサーチするために始動される。このウェブページのサーチのプロセスは、従来技術におけるように実行することができ、その詳細な説明は、ここでは繰り返されない。
【0024】
S103:第二のクラスの保留のキーワードは、サーチされたウェブページから抽出される。
ウェブページがサーチされた後、第二のクラスの保留のキーワードは、例えば、ある条件を満たすサーチされたウェブページのうちで再現される数、又はある条件を満たすサーチされたウェブページのうちで発生する位置といった、特定のルールの下でのサーチされたウェブページからダイレクトに抽出される。代替的に、上述したルールの組み合わせは、第二のクラスの保留のキーワードを選択する基準として使用される。
【0025】
第二のクラスの保留のキーワードが選択される前に、はじめに、サーチされたウェブページがフィルタリングされ、次いで、第二のクラスの保留のキーワードは、上述したルールの下でフィルタリングされたウェブページから抽出される。特に、ウェブページは、例えば、ウェブページに含まれる単語が第一のクラスの保留のキーワードに整合する程度、第一のクラスの保留のキーワードがウェブページで生じる頻度といった特定の予め設定されたルールの下でフィルタリングされるか、又は第一のクラスの保留のキーワードとは独立の別のルールの下でフィルタリングされる。その特定のプロセスは、実施の形態で後に記載される。
【0026】
S104:画像に対応するキーワードは、少なくとも第二のクラスの保留のキーワードから決定される。
第二のクラスの保留のキーワードがサーチされたウェブページから抽出された後、画像に対応するキーワードは、第二のクラスの保留のキーワードから更に決定され、例えば特定の閾値を超える信頼度、又は特定の閾値を超えるウェブページ文書のタイトルにおける発生の頻度、或いは特定の閾値を超えるテキストの重要な位置での発生の頻度といった、特定のルールの下で第二のクラスの保留のキーワードから直接に選択される。代替的に、例えば時間、位置、オブジェクト等といった音声の幾つかの重要な部分は、経験的に決定されるか、又は、上述したルールの組み合わせは、画像に対応するキーワードを選択する基準として使用される。
【0027】
代替的に、画像に対応するキーワードは、第一のクラスの保留のキーワードに対して第二のクラスの保留のキーワードを検証した結果に従って、第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから選択される。その詳細は、実施の形態において後に記載される。
【0028】
本発明の実施の形態では、OCRから抽出されたキーワードは、高い収束性を有するが、認識率が悪く、認識精度が低く、サーチされたウェブページから抽出されたキーワードは、比較的精度が高いが、冗長なコンテンツ及び多数の無関係の単語を含み(すなわち収束が悪い)、キーワードの収束性を保証するためにOCRを通して認識及び選択された第一のクラスの保留のキーワードに基づいてウェブページがサーチされ、次いで、キーワードの正確さを保証するためにサーチされたウェブページから第二のクラスの保留のキーワードが選択され、これにより画像に対応する最終的に決定されたキーワードの正確さが保証されるように、OCRとウェブページのサーチの両者が組み合わされる。これらのキーワードは、データ(画像又はウェブページ)をサーチして、製品情報や、需要分布の統計サービス及び他のサービスを含む様々なサービスに関する問合せのために適用される。
【0029】
図2A及び図2Bに例示される画像の取得を例として取り挙げ、本発明の例示的な実施の形態において説明が提供された。この例示的な実施の形態では、画像におけるテキスト領域が探され、テキスト領域におけるテキストコンテンツは、OCRを通して認識され、これにより、認識されたテキストコンテンツの信頼度の降順で配置される候補となるフレーズを含む表1及び表2に示される認識されたテキストコンテンツが取得される。
【0030】
ウェブページをサーチするために認識されたテキストコンテンツから第一のクラスの保留のキーワードを更に選択するステップは、図3に例示されるように、2つのサブステップを更に含む。
S301:第一の閾値を超える信頼度をもつ1以上のテキストコンテンツは、第一のクラスの保留のキーワードとして、それぞれのテキスト領域における認識されたテキストコンテンツから選択される。
【0031】
この実施の形態では、第一の閾値を超える信頼度をもつテキストコンテンツは、第一のクラスの保留のキーワードとして、表1及び表2においてダイレクトに選択され、例えば、表1及び表2における1〜3で番号付けされたテキストコンテンツは、候補となるフレーズを更に含む第一のクラスの保留のキーワードとして選択される。
【0032】
勿論、別の実施の形態では、第一のクラスの保留のキーワードは、画像の重要なゾーン(例えば中央等)に位置し、特定の閾値を超えるテキストサイズ(又は最小のテキストサイズに対するその割合が特定の閾値を超えるサイズ)をもつテキストコンテンツを代替となる単語としてはじめに決定し、次いで代替となる単語から第一の閾値を超える信頼度をもつ単語を第一のクラスの保留のキーワードとして選択することで、代替的に選択される。このルールは、さもなければ設定することができ、その繰り返される説明はここでは省略される。
【0033】
S302:あるキーワードは、それぞれのテキスト領域について選択された第一のクラスの保留のキーワードからそれぞれのテキスト領域において選択され、選択されたキーワードは、それぞれの組み合わせの結果に従って、ウェブページをサーチするために組み合わされる。
【0034】
上述のステップで選択された第一のクラスの保留のキーワードは、表1及び表2において1〜3で番号付けされたテキストコンテンツを含み、これらのテキストコンテンツは、異なるテキスト領域からそれぞれ認識され、すなわち
【0035】
(外3)

であり、この場合
【0036】
(外4)

は、同じテキスト領域からの2つの候補となる単語のセットであり、
【0037】
(外5)

は、同じテキスト領域からの2つの候補となる単語のセットであり、“On Sale”及び“On Sole”は、同じテキスト領域からの2つの候補となる単語のセットであり、“Abundant Goods”及び“Abundant Gods”は、同じテキスト領域の2つの候補となる単語のセットである。OCR認識にとって、何れかが正しい場合に複数の候補となる単語のセットのうちの1つを決定することは不可能であるので、それぞれのテキスト領域で認識されたテキストコンテンツに基づいてそれぞれのテキスト領域において1つのキーワードが選択され、次いで、選択されたキーワードは、ウェブページのサーチキーワードとして、それぞれの組み合わせの結果でサーチするために組み合わされる。
【0038】
例えば、図2Aについて、
【0039】
(外6)

は、ウェブページのサーチのためにキーワードのセットとして使用され、
【0040】
(外7)

は、ウェブページのサーチのためにキーワードの別のセットとして使用される一方、図2Bについて、“Good News”,“On Sale”及び“Abundant Goods”は、ウェブページをサーチするためにキーワードのセットとして使用され、“Good News”,“On Sole”及び“Abundant Gods”は、ウェブページをサーチするためにキーワードの別のセットとして使用される。勿論、他のキーワードの組み合わせも可能であるが、ここでは列挙されない。
【0041】
本発明の例示的な実施の形態では、ウェブページのサーチ後に、サーチされたウェブページから第二のクラスの保留のキーワードを抽出するステップは、図4に例示されるように、2つのサブステップを更に含む。
【0042】
S401:代表的なウェブページは、予め決定されたルールの下でサーチされたウェブページから選択される。上述された組み合わされたキーワードによるウェブページのサーチの後、複数の結果は、キーワードのそれぞれのセットで検索され、このステップでは、検索されたページは、その後に決定された第二のクラスの保留のキーワードを更にリファインするため、代表的なウェブページを選択するためにフィルタリングされる。
【0043】
代表的なウェブページは、様々なルールの下で選択される。例えば、はじめに、幾つかの上位ランクのウェブページは、キーワードのそれぞれのセットに対応するウェブページから選択され、次いで、組み合わせにおける対応するキーワードに対するウェブページのそれぞれのセットの類似性が比較され、最も高い類似性をもつウェブページのセットは、代表的なウェブページとして選択されるか、又は、キーワードのそれぞれのセットに対応する最初の3つのウェブページが選択され、次いで、ウェブページのそれぞれのセットにおけるウェブページ間の類似性が比較され、最も高い類似性をもつウェブページのセットは、代表的なウェブページとして選択される。勿論、代表的なウェブページは、例えば、Gerard Salton, A. Wong, C. S. Yang による“A Vector Space Model for Automatic Indexing”, Commun. ACM 18(11): 613-620 (1975)、及びScott C. Deerwester, Susan T. Dumais, Thomas K. Landauer, George W. Funas, Richrad A. Harshmanによる"Indexing by Latent Semantic Analysis", JASIS 41(6): 391-407 (1990)等により引用されるストリングマッチング方法といった従来技術におけるように選択することができる。
【0044】
この実施の形態では、キーワード
【0045】
(外8)

の組み合わせでサーチされるウェブページから明らかであるように、キーワード
【0046】
(外9)

に対するこれらのウェブページの類似度は、ウェブページにおけるテキストコンテンツの高い精度のため、キーワード
【0047】
(外10)

の組み合わせでサーチされるウェブページのキーワードに対する類似度よりも明らかに低い。従って、最終的に選択される代表的なウェブページは、図5A及び図6Aに示されるように、必然的に、キーワード
【0048】
(外11)

の組み合わせで検索された3つの上位にランクされるウェブページである。さらに、キーワード“Good News”, “On Sole”及び“Abundant Gods”の組み合わせで検索されたウェブページから明らかなように、これらのウェブページのキーワード“Good News”,“On Sole”及び“Abundant Gods”に対する類似度は、ウェブページにおけるテキストコンテンツの高い精度におため、キーワード“Good News”,“On Sale”及び“Abundant Goods”の組み合わせで検索されたウェブページのキーワードに対する類似度よりも明らかに低い。従って、最終的に選択された代表的なウェブページは、必然的に、図5B及び図6Bに示されるように、キーワード“Good News”,“On Sale”及び“Abundant Goods”の組み合わせで検索された3つの上位にランクされるウェブページである。
【0049】
S402:第二のクラスの保留のキーワードは、選択された代表的なウェブページから抽出される。
第二のクラスの保留のキーワードを選択するプロセスは、上述の実施の形態においてステップS103に類似しており、その繰り返される説明は、ここでは省略される。第一のケースでは、決定された第二のクラスの保留のキーワードは、
【0050】
(外12)

等を含み、第二のケースでは、決定された第二のクラスの保留のキーワードは、“On Sale”,“May 1 to May 10”,“***Supermarket”,“Lower Discount”,“Gifts”等を含む。
【0051】
第二のクラスの保留のキーワードが抽出された後、画像に対応するキーワードは、第一のクラスの保留のキーワードに対して第二のクラスの保留のキーワードを検証した結果に従って、第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから選択される。
【0052】
本実施の形態では、代表的なウェブページから抽出された第二のクラスの保留のキーワードは、OCRの認識結果から抽出された第一のクラスの保留のキーワードに対して検証される。特定の検証ルールの下で、OCRの認識結果における第二のクラスの保留のキーワードの信頼度が検証されるか、又は、画像における第二のクラスの保留のキーワードのサイズ及び位置に関する情報が確認される。特に、第一のクラスの保留のキーワードが高い信頼度或いは準拠したサイズ又は位置のテキストコンテンツをもつ選択されたキーワードを含む場合、第一のセットの保留のキーワードで生じる単語は、画像に対応するキーワードとして、第二のクラスの保留のキーワードで選択される。
【0053】
勿論、別の実施の形態では、画像に対応するキーワードは、例えば第二の閾値を超える信頼度、又は特定の閾値を超えるウェブページの文書のタイトルにおける発生の頻度、或いは特定の閾値を超えるテキストの重要な位置での発生の頻度といった、特定のルールの下で第二のクラスの保留のキーワードにおいてダイレクトに選択される。代替的に、例えば時間、場所、オブジェクト等の音声の幾つかの重要な部分が経験的に決定されるか、又は、画像に対応するキーワードを選択する基準としてルールの組み合わせが使用される。
【0054】
勿論、上述した2つのアプローチを組み合わせて、画像に対応するキーワードを、第一のクラスの保留のキーワードと第二のアプローチで選択された単語とに対する検証の結果の合計として決定することができる。例えば、第一のケースでは、画像に対応するキーワードが
【0055】
(外13)

を含み、第二のケースでは、画像に対応するキーワードは、“On Sale”,“***Supermarket”及び“May 1 to May 10”を含む。
【0056】
画像に対応する最終的に決定されるキーワードの精度は、OCRをウェブページのサーチと組み合わせることで保証される。第一のクラスの保留のキーワードは、代表的なウェブページは、データ処理の負荷を低減し、キーワードを選択する効率を改善するためにフィルタリングされ、無関係なコンテンツが除かれ、これにより最終的に取得されるキーワードを更に正確にする。
【0057】
本発明の実施の形態に係るキーワードを取得する第一の方法と関係して、本発明の実施の形態は、キーワードを取得する装置を更に提供し、図7を参照して、本装置は、以下の構成要素を備えている。認識ユニット701は、画像におけるテキスト領域を探し、光学式文字認識OCRを通して、テキスト領域におけるテキストコンテンツを認識する。サーチユニット702は、認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチする。抽出ユニット703は、サーチされたウェブページから第二のクラスの保留のキーワードを抽出する。決定ユニット704は、少なくとも第二のクラスの保留のキーワードから画像に対応するキーワードを決定する。
【0058】
ユーザが携帯電話等での捕捉を通して画像を取得した後、認識ユニット701は、既存のテキスト検出方法において画像におけるテキスト領域を探し、既存のストローク抽出方法においてテキストのストロークを抽出し、次いで、テキスト認識を通してテキスト領域におけるテキストコンテンツを認識し、それらを単語の単位で結合する。サーチユニット702は、第一のクラスの保留のキーワードとしてダイレクトに認識されたテキストコンテンツを使用してウェブページをサーチするか、又はウェブページをその後にサーチするために、第一のクラスの保留のキーワードとして認識されたテキストコンテンツの一部を選択する。抽出ユニット703は、特定のルールの下でサーチされたウェブページからダイレクトに第二のクラスの保留のキーワードを抽出するか、又は、サーチされたウェブページをはじめにフィルタリングし、次いで、上述したルールの下で選択されたウェブページから第二のクラスの保留のキーワードを抽出する。決定ユニット704は、特に特定のルールの下で第二のクラスの保留のキーワードからダイレクトに選択するか、又は第一のクラスの保留のキーワードに対して第二のクラスの保留のキーワードを検証した結果に従って、第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから画像に対応するキーワードを選択することで、第二のクラスの保留のキーワードから画像に対応するキーワードを更に決定する。
【0059】
本発明の実施の形態に係る上述したユニットにおいて、キーワードの収束を保証するためにOCRを通して認識及び選択された第一のクラスの保留のキーワードに基づいてウェブページがサーチされ、次いで、キーワードの正確性を保証するため、サーチされたウェブページから第二のクラスの保留のキーワードが選択され、これにより画像に対応する最終的に決定されたキーワードの精度が保証されるように、OCRとウェブページのサーチの両者が組み合わされる。これらのキーワードは、データ(画像又はウェブページ)をサーチし、製品情報、需要分布の統計サービス及び他のサービスを含む様々なサービスに関して問い合わせるために適用される。
【0060】
本発明の例示的な実施の形態によれば、サーチユニットは、図8に例示される2つのサブユニットを更に含む。
第一の選択サブユニット810は、第一のクラスの保留のキーワードとして、認識されたテキストコンテンツから、第一の閾値を超える信頼度をもつ1以上のテキストコンテンツをそれぞれのテキスト領域において選択する。
【0061】
サーチサブユニット802は、それぞれのテキスト領域について選択された第一のクラスの保留のキーワードから1つのキーワードをそれぞれのテキスト領域において選択し、選択されたキーワードを組み合わせて、それぞれの組み合わせの結果に従ってウェブページをサーチする。
【0062】
本発明の例示的な実施の形態によれば、抽出ユニットは、図9に例示される2つのサブユニットを更に含む。
第二の選択サブユニット901は、予め決定されたルールの下で、サーチされたウェブページから選択された代表的なウェブページを選択する。
抽出サブユニット902は、選択された代表的なウェブページから第二のクラスの保留のキーワードを抽出する。
【0063】
本発明の例示的な実施の形態によれば、決定ユニットは、第一のクラスの保留のキーワードに対して第二のクラスの保留のキーワードを検証した結果に従って、第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから、画像に対応するキーワードを選択する。本発明の別の実施の形態によれば、決定ユニットは、画像に対応するキーワードとして、第二のクラスの保留のキーワードから、第二の閾値を超える信頼度をもつキーワードを選択する。
【0064】
上述したユニットでは、画像に対応する最終的に決定されたキーワードの精度は、OCRをウェブページのサーチと組み合わせることで保証される。また、上述したユニットでは、第一のクラスの保留のキーワードと代表的なウェブページは、データ処理の負荷を低減して、キーワードを選択する効率を改善するためにフィルタリングされ、無関係のコンテンツを除いて、これにより最終的に取得されるキーワードを更に正確にする。
【0065】
さらに、上述した一連のプロセス及び装置は、ソフトウェア及び/又はファームウェアで実施することもできる。ソフトウェア及び/又はファームウェアで実施される場合、ソフトウェアを構成するプログラムは、様々なプログラムがインストールされたときに、様々な機能を実行する、例えば図10に例示される汎用パーソナルコンピュータといった、専用のハードウェア構造をもつコンピュータに記憶媒体又はネットワークからインストールされる。
【0066】
図10では、中央処理装置(CPU)1001は、リードオンリメモリ(ROM)1002に記憶されるプログラム、又は記憶部分1008から、CPU1001が様々な処理を実行するときに必要とされるデータも必要に応じて記憶されるランダムアクセスメモリ(RAM)1003にロードされるプログラムに従って、様々な処理を実行する。
【0067】
CPU1001、ROM1002及びRAM1003は、入力/出力インタフェース1005が接続されるバス1004を介して互いに接続される。
【0068】
以下のコンポーネントは、入力/出力インタフェース1005に接続される。キーボード、マウス等を含む入力部分1006、例えば陰極線管(CRT)、液晶ディスプレイ(LCD)等のディスプレイ、スピーカ等を含む出力部分1007、例えばLANカード、モデム等といったネットワークインタフェースカードを含む通信部分1009。通信部分1009は、例えばインターネットといったネットワークを通して通信プロセスを実行する。
【0069】
また、ドライブ1010は、必要に応じて入力/出力インタフェース1005に接続される。例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等の取り外し可能な媒体1011は、そこからフェッチされるコンピュータプログラムが必要に応じて記憶部分1008にインストールすることができるように、必要に応じてドライブ1010にインストールされる。
【0070】
上述した一連の処理がソフトウェアで実施される場合、ソフトウェアを構成するプログラムは、例えばインターネット等のネットワークから、例えば取り外し可能な媒体1011等の記憶媒体からインストールされる。
【0071】
当業者であれば、係る記憶媒体は、プログラムが記録され、装置から個別に配信されてユーザにプログラムを提供する図10に例示される取り外し可能な記録媒体1011に限定されないことを理解されるであろう。取り外し可能な媒体1011の例は、磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(コンパクトディスク−リードオンリメモリ(CD-ROM)及びデジタルバーサティルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)を含む)、及び半導体メモリを含む。代替的に、記録媒体は、ROM1002、プログラムが記憶され、記憶部分を含む装置と共にユーザに配信される記憶部分1008に含まれるハードディスク等である。
【0072】
上述した一連の処理のステップは、必須ではないが、記載された順序で順次に実行される場合がある。幾つかのステップは、互いに同時又は独立して実行される場合がある。
【0073】
本発明及び本発明の利点が詳細に記載されたが、様々な変更、置換及び変形は、特許請求の範囲に定義されるように、本発明の精神及び範囲から逸脱することなしに行われることを理解されたい。更に、本発明の実施に形態における用語「含む“include”、“contain”」及びその変形は、非排他的な包含を含むことが意図され、一連のエレメントを含むプロセス、方法、製品又は装置がエレメントを含むだけでなく、明示的に列挙しない1以上の他のエレメント又はプロセス、方法、製品又は装置に固有のエレメントを含む。更に多くの制限なしに、文「a(n) ...を含む/備える」に定義されるエレメントは、エレメントを含むプロセス、方法、製品又は装置における更なる同一のエレメントの存在を排除しない。
【0074】
以下に付記する。
(付記)
(付記1)
コンピュータが、
画像におけるテキスト領域を探し、光学式文字認識を通して前記テキスト領域におけるテキストコンテンツを認識し、
認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチし、
サーチされたウェブページから第二のクラスの保留のキーワードを抽出し、
少なくとも抽出された第二のクラスの保留のキーワードから前記画像に対応する1以上のキーワードを決定する、
キーワードを取得する方法。
(付記2)
前記認識されたテキストコンテンツから前記第一のクラスの保留のキーワードを選択して、ウェブページをサーチすることは、
前記第一のクラスの保留のキーワードとして、前記認識されたテキストコンテンツから、第一の閾値を超える信頼度をもつ1以上のテキストコンテンツを、それぞれのテキスト領域において選択し、
前記それぞれのテキスト領域について選択された前記第一のクラスの保留のキーワードから、1つのキーワードをそれぞれのテキスト領域において選択し、選択されたキーワードを組み合わせて、それぞれの組み合わせの結果に従ってウェブページをサーチする、
付記1記載の方法。
(付記3)
前記サーチされたウェブページから前記第二のクラスの保留のキーワードを抽出することは、
予め決定されたルールの下で前記サーチされたウェブページから1以上の代表的なウェブページを選択し、
選択された代表的なウェブページから前記第二のクラスの保留のキーワードを抽出する、
付記1記載の方法。
(付記4)
少なくとも前記抽出された第二のクラスの保留のキーワードから前記画像に対応する前記1以上のキーワードを決定することは、
前記画像に対応するキーワードとして、前記第二のクラスの保留のキーワードから第二の閾値を超える信頼度をもつ1以上のキーワードを選択する、
付記1乃至3の何れか記載の方法。
(付記5)
少なくとも前記抽出された第二のクラスの保留のキーワードから前記画像に対応する前記1以上のキーワードを決定することは、
前記第一のクラスの保留のキーワードに対して前記第二のクラスの保留のキーワードを検証した結果に従って、前記第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから前記画像に対応するキーワードを選択する、
付記1乃至3の何れか記載の方法。
(付記6)
画像におけるテキスト領域を探し、光学式文字認識を通して前記テキスト領域におけるテキストコンテンツを認識しり認識手段と、
認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチするサーチ手段と、
サーチされたウェブページから第二のクラスの保留のキーワードを抽出する抽出手段と、
少なくとも抽出された第二のクラスの保留のキーワードから前記画像に対応する1以上のキーワードを決定する決定手段と、
を備えるキーワードを取得する装置。
(付記7)
前記サーチ手段は、
前記第一のクラスの保留のキーワードとして、前記認識されたテキストコンテンツから、第一の閾値を超える信頼度をもつ1以上のテキストコンテンツを、それぞれのテキスト領域において選択する第一のサブ選択手段と、
前記それぞれのテキスト領域について選択された前記第一のクラスの保留のキーワードから、1つのキーワードをそれぞれのテキスト領域において選択し、選択されたキーワードを組み合わせて、それぞれの組み合わせの結果に従ってウェブページをサーチするサブサーチ手段と、
を有する付記6記載の装置。
(付記8)
前記抽出手段は、
予め決定されたルールの下で前記サーチされたウェブページから代表的なウェブページを選択する第二のサブ選択手段と、
選択された代表的なウェブページから前記第二のクラスの保留のキーワードを抽出するサブ抽出手段と、
を有する付記6記載の装置。
(付記9)
前記決定手段は、前記画像に対応するキーワードとして、前記第二のクラスの保留のキーワードから第二の閾値を超える信頼度をもつ1以上のキーワードを選択する、
付記6乃至8の何れか記載の装置。
(付記10)
前記決定手段は、前記第一のクラスの保留のキーワードに対して前記第二のクラスの保留のキーワードを検証した結果に従って、前記第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから前記画像に対応するキーワードを選択する、
付記6乃至8の何れか記載の装置。
【符号の説明】
【0075】
701:認識ユニット
702:サーチユニット
703:抽出ユニット
704:決定ユニット
801:第一選択サブユニット
802:サーチサブユニット
901:第二選択サブユニット
902:抽出サブユニット


【特許請求の範囲】
【請求項1】
コンピュータが、
画像におけるテキスト領域を探し、光学式文字認識を通して前記テキスト領域におけるテキストコンテンツを認識し、
認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチし、
サーチされたウェブページから第二のクラスの保留のキーワードを抽出し、
少なくとも抽出された第二のクラスの保留のキーワードから前記画像に対応する1以上のキーワードを決定する、
キーワードを取得する方法。
【請求項2】
前記認識されたテキストコンテンツから前記第一のクラスの保留のキーワードを選択して、ウェブページをサーチすることは、
前記第一のクラスの保留のキーワードとして、前記認識されたテキストコンテンツから、第一の閾値を超える信頼度をもつ1以上のテキストコンテンツを、それぞれのテキスト領域において選択し、
前記それぞれのテキスト領域について選択された前記第一のクラスの保留のキーワードから、1つのキーワードをそれぞれのテキスト領域において選択し、選択されたキーワードを組み合わせて、それぞれの組み合わせの結果に従ってウェブページをサーチする、
請求項1記載の方法。
【請求項3】
前記サーチされたウェブページから前記第二のクラスの保留のキーワードを抽出することは、
予め決定されたルールの下で前記サーチされたウェブページから1以上の代表的なウェブページを選択し、
選択された代表的なウェブページから前記第二のクラスの保留のキーワードを抽出する、
請求項1記載の方法。
【請求項4】
少なくとも前記抽出された第二のクラスの保留のキーワードから前記画像に対応する前記1以上のキーワードを決定することは、
前記画像に対応するキーワードとして、前記第二のクラスの保留のキーワードから第二の閾値を超える信頼度をもつ1以上のキーワードを選択する、
請求項1乃至3の何れか記載の方法。
【請求項5】
少なくとも前記抽出された第二のクラスの保留のキーワードから前記画像に対応する前記1以上のキーワードを決定することは、
前記第一のクラスの保留のキーワードに対して前記第二のクラスの保留のキーワードを検証した結果に従って、前記第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから前記画像に対応するキーワードを選択する、
請求項1乃至3の何れか記載の方法。
【請求項6】
画像におけるテキスト領域を探し、光学式文字認識を通して前記テキスト領域におけるテキストコンテンツを認識する認識手段と、
認識されたテキストコンテンツから第一のクラスの保留のキーワードを選択して、ウェブページをサーチするサーチ手段と、
サーチされたウェブページから第二のクラスの保留のキーワードを抽出する抽出手段と、
少なくとも抽出された第二のクラスの保留のキーワードから前記画像に対応する1以上のキーワードを決定する決定手段と、
を備えるキーワードを取得する装置。
【請求項7】
前記サーチ手段は、
前記第一のクラスの保留のキーワードとして、前記認識されたテキストコンテンツから、第一の閾値を超える信頼度をもつ1以上のテキストコンテンツを、それぞれのテキスト領域において選択する第一のサブ選択手段と、
前記それぞれのテキスト領域について選択された前記第一のクラスの保留のキーワードから、1つのキーワードをそれぞれのテキスト領域において選択し、選択されたキーワードを組み合わせて、それぞれの組み合わせの結果に従ってウェブページをサーチするサブサーチ手段と、
を有する請求項6記載の装置。
【請求項8】
前記抽出手段は、
予め決定されたルールの下で前記サーチされたウェブページから代表的なウェブページを選択する第二のサブ選択手段と、
選択された代表的なウェブページから前記第二のクラスの保留のキーワードを抽出するサブ抽出手段と、
を有する請求項6記載の装置。
【請求項9】
前記決定手段は、前記画像に対応するキーワードとして、前記第二のクラスの保留のキーワードから第二の閾値を超える信頼度をもつ1以上のキーワードを選択する、
請求項6乃至8の何れか記載の装置。
【請求項10】
前記決定手段は、前記第一のクラスの保留のキーワードに対して前記第二のクラスの保留のキーワードを検証した結果に従って、前記第一のクラスの保留のキーワード及び/又は第二のクラスの保留のキーワードから前記画像に対応するキーワードを選択する、
請求項6乃至8の何れか記載の装置。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−243309(P2012−243309A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2012−105957(P2012−105957)
【出願日】平成24年5月7日(2012.5.7)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】