文書情報検索システム
【課題】携帯端末装置で取得した文書の一部を含む画像から文書に関連付けられた情報を得る。
【解決手段】文書登録装置10は、入力した文書データを解析装置42で文書の構成要素(ページ、見出し、文、行、単語など)に分解し、構成要素に関連した関連情報を登録する。携帯端末装置300は、文書選択装置で選択した文書を撮影装置23で撮影する。文字認識装置24は、撮影した画像から注目単語とその周辺の複数の単語を認識する。サーバ装置320は、記憶装置44のデータを記憶装置32にコピーし、位置検索装置34は、携帯端末装置300が出力する注目単語と注目単語の周辺の単語から文書中の位置を特定し、情報検索装置31は、注目単語に対応する関連情報の検索を行い、得られた情報を表示装置22に表示する。
【解決手段】文書登録装置10は、入力した文書データを解析装置42で文書の構成要素(ページ、見出し、文、行、単語など)に分解し、構成要素に関連した関連情報を登録する。携帯端末装置300は、文書選択装置で選択した文書を撮影装置23で撮影する。文字認識装置24は、撮影した画像から注目単語とその周辺の複数の単語を認識する。サーバ装置320は、記憶装置44のデータを記憶装置32にコピーし、位置検索装置34は、携帯端末装置300が出力する注目単語と注目単語の周辺の単語から文書中の位置を特定し、情報検索装置31は、注目単語に対応する関連情報の検索を行い、得られた情報を表示装置22に表示する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書中の文字列に擬似的に埋め込んだ関連情報を検索するシステムに係り、あらかじめ文書中の文字列と関連情報を対応した検索用DBを作成し、出版されている文書中の一部を携帯電話などに内蔵されているカメラで撮影した文書中の一部を撮影した画像から文字認識により文字列を認識し、前記複数の文字列から前記検索用DBに登録された関連情報を検索するものである。
【背景技術】
【0002】
従来、印刷された写真や文書に情報を埋め込む方法として電子透かしが知られていた。例えば、文書などの二値化された画像に電子透かしを埋め込む一例として特開2004−289783号公報(特許文献1)がある。
従来、カメラを搭載した携帯電話等の携帯端末で撮影した画像に含まれる文字列の文字を認識して、その認識結果である文字テキストを翻訳する技術が種々提案されている。例えば、特開平09−138802号公報(特許文献2)には、携帯端末内部に文字認識機能と翻訳機能を持ち、これらの機能を利用して、カメラで撮影した画像内の文字列を認識、翻訳処理する翻訳システムが開示されている。
【0003】
また、同出願人の先の出願、特願2004−227610号および特願2004−232891号に、携帯端末で撮影した画像中の複数の単語の並びや位置関係から、文書中の撮影位置を特定し、撮影した単語に関連した翻訳結果や文書中の位置に対して設定したリンク先URLをブラウザに表示する文書翻訳システムに関する発明がある。
【0004】
【特許文献1】特開2004−289783号公報
【0005】
【特許文献2】特開平09−138802号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
特許文献1では、あらかじめ情報を埋め込んだ文書を印刷して配布する必要があった。そのため印刷済みの書籍に電子透かしを適用することができなかった。
また、特許文献2では、文書中の特定の場所を撮影し、文字認識により撮影した画像中の文字イメージを単語または文を含む文字列に変換して出力することにより、出力された単語または文を翻訳する翻訳システムが開示されている。認識範囲を文とした場合、撮影する範囲が広くなりカメラの解像度を高くするか、複数撮影した画像から文字列を認識し、細分化された文字列を再構築して文を再生する必要があった。また単語を翻訳する場合、文書中の単語の位置で訳が異なる場合があった。
【0007】
また、文字認識は、誤読の可能性があることから認識率を向上させる必要がある。図32は文字認識処理の流れの例であり、画像二値化部51は、文字を含む画像から背景と文字を分けた二値画像を作成する。文字行切り出し部52は、二値画像から1行分の文字列領域を判別する。文字切り出し部53は、1行分の文字列領域から1文字の文字領域を判別する。特徴抽出部54は、1文字の文字領域から文字の特徴を算出する。識別処理部55は、文字の特徴からあらかじめ文字毎に登録した文字の特徴と比較し、特徴が似通った順に文字の候補を出力する。単語照合部56は、連続した1文字の文字領域毎の文字の候補から単語照合辞書登録されている単語に最も近い単語を出力する。画像二値化部51では、印刷された文書は、カラー印刷や網点印刷など条件が広く、一種類の二値化方法では、正しく二値化できない場合がある。また、文字行切り出し部52や文字切り出し部53では、文字を認識する前に画像中から文字行および文字領域を予測する必要があるが、罫線、行間、文字間隔など文書により多種多様であり、判別を誤ることがある。また、識別処理部55では、類似文字(例えば日、白、目など非常に似通った文字)があり、画像のノイズやかすれなどによる悪影響により、文字候補が正しく出力されない場合がある。また、単語照合部56では、正読率の向上に全ての単語を単語照合辞書に登録する必要があるが、出版されている全ての文書の単語を登録には大きなメモリが必要であり、メモリ制限がある携帯電話などの携帯端末では全ての単語を単語照合辞書に登録できない。
【0008】
本発明の目的は、カメラを内蔵した携帯可能な情報端末で文書の一部をカメラで撮影した画像に含まれている文字列が文書中のどの場所に存在するかを特定し、その場所に関連付けられる情報を取得する文書情報検索システムを提供することにある。
【0009】
また、本発明の別の目的は、文字の場所を特定するためのデータの作成を自動化し、また文書に関連付けられる情報のデータの作成を簡素に行う、文書情報検索システムを提供することにある。
また、本発明の別の目的は、文書毎に文書の構造を定義した文書ファイルから文書の特徴を抽出することにより文字認識のパラメータを作成し、検索対象の文書に合わせて文字認識のパラメータを設定することにより、文字認識率を向上させることが可能な文書情報検索システムを提供することにある。
【課題を解決するための手段】
【0010】
本発明は、画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部を有する携帯情報端末を用いて、画像撮影部で撮影された画像に含まれる文字に関連付けられた情報を得て、その情報を表示部に表示する文書情報検索システムにおいて、
文書の構成要素に関連する情報を対応付けた関連情報を作成する文書情報登録部と、文字列の位置情報を作成する座標登録部と前記関連情報と前記位置情報を保持する記憶装置とを備えるものである。また、文書選択部を設けることにより、文書毎に記憶装置に登録された関連情報と、位置情報を選択して検索部により情報を検索できるように文書を示す情報をも保持する。
【0011】
また、本発明において、サーバ装置は、前記記憶装置、及び前記検索部を備え、携帯情報端末は、前記文字認識部より得られた文字列を、ネットワークを介して前記サーバに送信し、前記サーバにおいて前記検索部により関連情報を検索した結果得られた情報を、前記ネットワークを介して前記携帯情報端末に送信する。また、前記文字認識部は、サーバ装置に備えることもできる。
【0012】
また、本発明の文書情報登録部は、文書の構造を定義した文書ファイルを入力し、前記文書ファイルの前記文書の構造、すなわち文字、文字種、文字座標、文字サイズなどを解析して文書の構成要素(章、段、文、行、見出しなど)に分解し、前記構成要素単位に関連する情報を対応付けた関連情報を作成する。例えば、図5に示す文書ファイル15は、PDFの文書構造を持つ。 PDFファイルでは、ページオブジェクト、テキストオブジェクトなど、文書を階層化した複数のオブジェクトを持つ。テキストオブジェクトには、書体、字体、文字幅の指定、ページ上の開始位置、文字コード、文字ごとの間隔が記述されている。これらの情報を利用することにより容易に文字列の位置を推定することが可能である。
【0013】
さらに好ましくは、文書の構成要素を階層化し、上位階層から関連情報を設定し、検索時には下位階層から関連情報を検索する。さらに好ましくは、前記文書の構成要素を形態素に分解し、前記形態素単位に関連する情報を対応付けた関連情報を作成する。また、さらに好ましくは、前記形態素は、形態素の区切りを登録者が編集する編集部を有する。
【発明の効果】
【0014】
本発明によって、文書の文字列および文字位置から行、文、単語などといった関連情報を設定する単位を作成するため、登録者が文書から行や文、単語などを登録する作業が不要または簡易となる。
【発明を実施するための最良の形態】
【0015】
本発明の実施形態の文書情報登録システムは、文書登録装置、サーバ装置、携帯端末装置により構成する。検索する文書に設定する関連情報は、行と単語単位にURL(Uniform Resource Locator)を設定し、URLを使ってブラウザ上に情報を表示する。また入力を行う文書の構造を数値化して定義した文書ファイルとしてPDF(Portable Document Format)ファイルを例として説明を行う。
【実施例1】
【0016】
本発明の実施形態を、図1を用いて説明する。図1は、本実施形態の全体構成図の例である。関連情報を登録する文書は、あらかじめ文書登録者が文書登録装置10を操作し、文書入力装置41にて文書データを入力する。解析装置42は、入力された文書ファイルを行や単語などの文書を構成する構成要素に分解し、分解した構成要素を表示装置40に表示する。文書登録者は、構成要素に関連した情報を入力装置45から入力する。構成要素と構成要素に対応した関連情報を含む検索用DBは、登録装置43にて記憶装置44に記憶する。また、検索用DBは、文書登録装置10の通信装置46からサーバ装置320の通信装置33にネットワーク36を経由して送信され、サーバ装置320の記憶装置32に格納される。
【0017】
携帯端末装置300は、関連情報を登録した文書の一覧を表示装置22に表示する。携帯端末装置300の利用者は、関連情報を検索する撮影対象の文書を、入力装置20の操作で文書選択装置21により選択し、印刷された文書の一部を撮影装置23により撮影する。文字認識装置24は、撮影した画像から注目する単語とその周辺の複数の単語を認識する。携帯端末装置300は、携帯電話、PDAなどの、撮像装置を有する情報端末である。
【0018】
サーバ装置320において、位置検索装置34は、記憶装置32に記憶した検索用DBから、携帯端末装置300で撮影した注目単語の文書中の位置を特定し、情報検索装置31は、注目単語に対応する関連情報を検索用DBから検索する。携帯端末装置300の表示装置22は、情報検索装置31で得られた関連情報を表示する。携帯端末装置300とサーバ装置320間のデータ通信は、通信装置25と通信装置30間でネットワーク26を経由して接続し、携帯端末装置300で認識した注目単語と、サーバ装置320で検索した関連情報の転送を行う。
【0019】
次に本発明の実施形態における図1の文書登録装置10の詳細を、図2を用いて詳細に説明する。以下、図2の各部の動作を、図3のフローチャート図および必要に応じて図5、図8乃至図12の符号を用いて説明する。図2は、本実施形態の文書登録装置の動作を示すブロック図の例である。図3は、本実施形態の文書登録装置の動作を示すフローチャート図である。
【0020】
図1と図2の各ブロックの対応を説明する。文書入力装置41は,文書登録部101と文書入力部100に対応する。解析装置42は,属性抽出部102,文書座標抽出部106,文書抽出部103,形態素解析部104,単語編集部105,単語リスト作成部107,照合辞書作成部109に対応する。登録装置43は,リンク先登録部111に対応する。記憶装置43は,文書情報120,文書属性情報121,単語照合辞書122,単語情報123,文字情報126,行リンク情報124,単語リンク情報125に対応する。
【0021】
文書登録部101において、登録者は、文書登録部101から文書のタイトル201などを入力する(130)。登録者は、文書入力部100により文書ファイル15を入力する(131)。属性抽出部102は、文書ファイル15の文書構造を解析し、文書のページ数202、文字の背景、文字方向、使われている文字種を抽出し(132)、ページ数202と、文書登録部101により入力したタイトル201と、自動的に生成する文書番号200を文書情報120に登録する(133)。また、抽出した文字の背景、文字方向、使われている文字種から二値化モード70、文字方向71、文字コード72を作成し、文書属性情報121に登録する(150)。
【0022】
文字座標抽出部106は、ページ中の文字の位置座標を抽出(160)し、文字毎にページ番号210、行番号211、列番号233などの位置情報を出力する。文字抽出部103は、文書ファイル15から文字を抽出し(135)、文字座標抽出部106が設定した文字単位のページ番号210、行番号211から同一行の文字列を再構成し、文字情報126に登録する(139)。
【0023】
形態素解析部104は、文字情報126から、行単位に文字列を形態素解析して行を構成する複数の品詞に分解する(136)。接続詞など不用な品詞を除去し固有名詞など単語として利用可能な品詞を選択して出力する(137)。単語編集部105は、形態素解析部104が出力する品詞を構成する文字列に対し、登録者が必要に応じて行う、連続する複数の品詞を構成する文字列の結合、または品詞を構成する文字列の分割などの編集を受け付け、単語230を作成する(138)。単語リスト作成部107は、単語編集部105が出力する単語230と、単語230の先頭文字の文字座標抽出部106が出力するページ番号210、行番号211、列番号233を用いて、単語情報123に登録する(140)。
【0024】
照合辞書作成部109は、単語情報123に登録されている全ての単語230から、単語照合辞書122を作成する(171)。リンク先登録部111は、文字情報126の各文字データ212−1〜b、および単語情報123に登録してある単語データ234−1〜cに対応するリンク先URLの情報について登録者からの入力を受け付け、行リンク情報124および単語リンク情報125を作成する(143)。
【0025】
以下、文書登録装置10が作成する、文書情報120、文字情報126、単語情報123、行リンク情報124、単語リンク情報125、を図8乃至図12を用いて説明する。
文書情報120を、図8を用いて説明する。図8において、文書情報120は、文書データ203−1〜aから構成され、文書データ203−1〜aは、文書毎の文書番号200とタイトル201、ページ数202から構成する。文書番号200は、登録された文書毎に自動的に設定する番号であり、タイトル201は、文書の表題であり、ページ数202は、文書を構成する総ページ数を示す。
【0026】
次に文字情報126を、図9を用いて説明する。図9において、文字情報126は、文字データ212−1〜bから構成され、文字データ212−1〜bは、文書中の行単位毎に、文字列213と、文字列213が印刷されている、ページ番号210、行番号211、から構成される。
【0027】
次に単語情報123を、図10を用いて説明する。図10において、単語情報123は、単語データ234−1〜cから構成され、単語データ234−1〜cは、単語230と、単語230の印刷された文書中の位置を示すページ番号210、行番号211、列番号233から構成する。単語230は、単語リスト作成部107で作成する単語である。列番号233は、単語230が含まれる文書情報126中の文字列213において、単語230の先頭文字を文字列213の左の文字から数えた位置である。
【0028】
次に行リンク情報124を、図11を用いて説明する。図11において、行リンク情報124は、行リンクデータ222−1〜bから構成され、行リンクデータ222−1〜bは、文書中の全ての行に対して設定した、ページ番号210、行番号211、リンク先URL223から構成する。
【0029】
次に単語リンク情報125を、図12を用いて説明する。図12において単語リンク情報125は、単語リンクデータ235−1〜eから構成され、単語リンクデータ235−1〜eは、単語230と、単語230に設定するリンク先URL223と、単語230の印刷文書中の位置を示す、ページ番号210、行番号211、列番号233から構成する。
【0030】
以下、PDFファイルを例とする文書ファイル15から文字情報126を抽出する手順を図5と図28を用いて、詳細に説明する。図5は,本実施形態の入力する文書ファイルの例,図28は、本実施形態の文字情報126の作成手順を示すフローチャート図である。
【0031】
図5のPDFファイル例の代表的な各行の意味を,行番号16を用いて説明する。説明を分かりやすくするため,埋め込まれた文字は英文である。PDFでは,文書のレイアウトを定義するためオブジェクト単位で定義を行っている。行1と行38は,PDF形式であることを示すヘッダとフッタである。行4〜11は,ページのオブジェクトを定義する。行12〜24は,使用されている書体のオブジェクトを定義する。行16が定義する文字の開始コード,行17が定義する文字の終了コードであり,行18〜19が開始から終了文字の文字幅を定義する。行21は,書体である。行25〜37は,印刷されるテキストオブジェクトを定義する。行28は,テキストオブジェクトの開始,行34は,テキストオブジェクトの終了を示す。行30は,Tcが文字の間隔,Twが単語の間隔を定義する。行31は,印刷する文字と必要に応じて配置のオフセットを定義する。行32は,Tdが次の行へのオフセットを定義する。行33は,印刷する文字を定義する。
【0032】
文書ファイル15から文字情報126を抽出するために、まず、テキストブロックからテキストブロックに共通する書体、字体、文字毎の文字幅のパラメータを抽出する(550)。最初の文字の始点座標のパラメータを抽出する(551)。1文字ごとに文字幅と文字間隔のパラメータより終点座標を計算し、求めた終点座標を次の文字の始点座標とする(552)。552の処理を行方向の座標が異なる文字の始点座標が見つかるまで繰り返す(553)。552で処理した文字を同一行の文字列213として、文字情報126に登録する(555)。テキストブロック内が終了するまで551から555の処理を繰り返す(556)。ページオブジェクトが終了するまで550から556の処理を繰り返す(557)。文書を終了するまで、上記ページオブジェクト内の処理を繰り返す(558)。
【0033】
本発明の実施形態では、列番号233を行の先頭文字からの文字数としたが、例えば図28で求まる文字単位の始点座標を用いることも可能である。また、本発明の実施形態では、リンク先URL223の設定を行または単語単位設定し、それぞれ行リンク情報124、単語リンク情報125を作成したが、文単位にリンク先URL223を設定することも可能である。
【0034】
以下、文単位にリンク先URL223を設定した文リンク情報590の作成手順を文情報580と、文情報580の作成手順を、図29、図30、図31を用いて説明する。図29は、本実施形態の文情報580の作成手順示すフローチャート図である。
【0035】
図30は、本実施形態の文情報580の例であり、文情報580は、文データ582−1〜kから構成され、文データ582−1〜kは、文581と、文581が含まれるページのページ番号210と、文581の最初の文字が存在する文字データ212中の行番号211を始点の行番号273とし、文字列213の左から数えた文字数からなる列番号233を始点の列番号274とする。また、文581の最後の文字が存在する文字データ212中の行番号211を終点の行番号271とし、文字列213の左から数えた文字数からなる列番号233を終点の列番号272とする。
本実施形態では、列番号272、274を文字列中の左からの文字数としたが、図28で算出した文字の始点の座標を利用することも可能である。
【0036】
図31は、本実施形態の文リンク情報590の例であり、文リンク情報590は、文リンクデータ591−1〜kから構成され、文リンクデータ591−1〜kは、文データ582−1〜kに対応して、文情報580の文581の代わりに、文581に関連つけられるリンク先URL223を設定する。
【0037】
文情報580の作成では、図28で作成した文字情報126と、書体、字体、文字コード、文字サイズを利用して作成する。文字情報126の文字データ212−1〜bに登録した行毎の文字列213について、文書ファイル15から図28で抽出した書体、字体と同様に、文字の書体、字体、文字サイズなどを抽出し、次の行の書体、字体、文字サイズなどが異なるか判定する(570)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、先頭文字が記号“(1)”や見出し番号“1.1“など明らかに前後の行と異なるか判定する(571)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、見出し行でなければ、順次行の文字列213から句点“。”を探索し、句点で区切った文581として文情報580の文データ582に登録する(572)。上記の処理を文書中の全ての行を走査するまで繰り返す(574)。
【0038】
次に以下図4を用いて文書登録装置の構成を説明する。図4は、本実施形態の文書登録装置のハードウェア構成図の例である。
図1と図4の各ブロックの対応を説明する。入力装置45は,キーボード700,マウス701に対応する。表示装置40は,ディスプレイ703に対応する。通信装置320は,通信回路705に対応する。記憶装置44は,データメモリ801に対応する。文書選択装置21および文字認識装置24は,文書登録プログラム810に対応する。
【0039】
キーボード700は、登録者からテキスト入力などを行う。マウス701は、利用者からのディスプレイ画面上のボタン操作などを行う。外部記憶装置702は、文書ファイル15を記憶したフロッピー(登録商標)ディスクやコンパクトディスクなどの記憶メディアから文書ファイル15を入力したり、データメモリ801に記憶されたデータを記憶メディアに出力したりする。ディスプレイ703は、登録者に操作画面などを表示する。CPU704はプログラムメモリ800中のプログラムを実行する。通信回路705は、サーバ装置320間でネットワーク36を経由してデータメモリ801に記憶されたデータの転送を行う。プログラムメモリ800は、図2の各部の動作を実行する文書登録プログラム810を格納する。データメモリ801は、文書情報120、文書属性情報121、単語照合辞書122、単語情報123、行リンク情報124、単語リンク情報125、文字情報126と、文書登録プログラム810が使用する作業用の一時データを格納する。
【0040】
以下、本実施形態のリンク先登録のために文書登録装置300において、リンク先URL223を登録者が操作する手順を、図6を用いて説明する。図6は、本実施形態のディスプレイ703に表示する画面の例である。
CPU704で実行される文書登録プログラム810は、登録者が操作する画面をディスプレイ703に表示し、キーボード700およびマウス701を操作し入力操作を受け付ける。ボタンは、マウス701を利用して選択することができる。入力フィールドは、キーボード700を操作し文字を入力することができる。
【0041】
文書登録プログラム810を起動すると、最初に文書登録画面600を表示する。最初に文書を登録する手順を説明する。文書登録画面600は、現在登録されている文書情報120を一覧表示する。登録者は、新規に文書を追加したい場合、追加ボタン601を選択することにより文書情報画面610を表示させることができる。登録した文書中登録を削除する場合は、削除したい項目の削除ボタン603を選択することにより、文書情報120より選択した文書情報を削除し、一覧表示から削除する。文書のリンク情報を設定する場合は、設定する文書の項目の設定ボタン602を選択することにより、リンク登録画面620を表示する。
【0042】
文書情報画面610は、文書番号フィールド611に自動的に設定した文書番号200を表示し、タイトルフィールド612にタイトル201を入力する。登録者は、開くボタン613を選択することにより、文書ファイル15を入力する。入力した文書ファイル15のページ数などの文書情報は文書情報表示フィールド614に表示される。登録者は、登録内容に問題がないことを確認し、登録ボタン615を選択することにより文書の解析が開始され文書登録画面600を表示する。登録をキャンセルする場合は、キャンセルボタン616を選択することで文書情報120に登録されず、文書登録画面600を表示する。
【0043】
次にリンク情報を設定する手順を説明する。リンク登録画面620では、登録者がリンク先フィールド621に、文書全体に設定したいリンク先URL223を記入し、確定ボタン622で確定する。登録者は必要に応じて以下同様に確認ボタン623を選択することによりリンク確認画面660を表示する。登録者は、確定ボタン622を選択することにより、文書番号223および入力したリンク先URL223を、文書リンクテーブル240に登録する。ページ単位のリンク情報の設定では、ページ一括設定ボタン624の選択で、ページ設定画面630を表示する。行単位のリンク情報の設定では、行一括設定ボタン625の選択で、行設定画面640を表示する。単語単位のリンク情報設定では、単語設定626ボタンの選択で、単語設定画面650を表示する。以下同様に戻るボタン627の選択で、前画面を表示する。
リンク確認画面660は、設定したリンク先URL223に対応した画像などを表示画面662に表示する。リンク先URL223が誤った場合は、リンク先フィールド661に修正したリンク先URL223を記入し、更新ボタン663を選択することによりリンク先フィールド621に反映する。
【0044】
ページ設定画面630は、登録者が追加ボタン601の選択で設定項目を追加し、追加した設定項目のページ数入力フィールド631に設定したいページ番号210、リンク先フィールド621にリンク先URL223をそれぞれ入力する。確定ボタン622の選択により、リンク先URL223、ページ番号210を、ページリンクテーブル250に登録する。
【0045】
行設定画面640は、登録者がページ設定フィールド641に設定したいページ番号210を入力し、追加ボタン601の選択により設定項目を追加する。登録者は、追加した設定項目の行数入力フィールド642に設定したい行番号211、リンク先フィールド621にリンク先URL223をそれぞれ入力する。登録者は、確定ボタン622の選択により、ページ番号210、行番号211、リンク先URL223を、行リンクテーブル260に登録する。
【0046】
単語設定画面650は、登録者がページ設定フィールド641に設定したいページ、行設定フィールド651に設定したい行を入力し、追加ボタン601の選択により設定項目を追加する。追加した設定項目の単語フィールド652にページ設定フィールド641および行設定フィールド651に入力したページと行に含まれている単語を単語情報123から取得し一覧表示する。登録者は、設定したい単語に対応したリンク先フィールド621にリンク先URL223を記入する。登録者は、確定ボタン622により、ページ設定フィールド641、行設定フィールド651、単語フィールド652、リンク先フィールド621のそれぞれに設定した値と、単語情報123の内、設定した単語の列番号233を単語リンク情報125に登録する。
【0047】
図6の実施例では、画面を切り替えて設定を行う例を示したが、図7に示すように画面を遷移することなく一画面中で全ての設定を行うことももちろん可能である。
【0048】
図7の動作を説明する。図7は本実施形態のリンク先登録のためにディスプレイ703に表示される他の画面の例である。図7において、登録画面180は、文書表示エリア181に設定を行う文書を表示し、行番号182に対応して行リンク設定フィールド185で行単位にリンク先URL223を設定する。またリンク先URL223を設定可能な単語は、文書表示エリア181に表示された文書中に設定枠183が表示され、単語リンク設定フィールド185で単語ごとにリンク先URL223を設定することができる。
【0049】
次に、リンク先登録部111において図11の行リンク情報124を作成する手順を、以下図14のフローチャート図と図13を用いて詳細に説明する。図13は、本実施形態のリンク先登録部111が作成するデータの例、図14は、本実施形態のリンク先登録部111の動作を示すフローチャート図である。
【0050】
図13において、文書リンクテーブル240は、文書毎に設定される文書リンクデータ243−1〜fから構成され、文書リンクデータ243−1〜fは、文書番号200とリンク先URL223から構成される。ページリンクテーブル250は、ページ単位に設定するページリンクデータ253−1〜gから構成され、ページリンクデータ253−1〜gは、ページ番号210、リンク先URL223から構成される。行リンクテーブル260は、行単位に設定する行リンクデータ263−1〜hから構成され、行リンクデータ263−1〜hは、ページ番号210、行番号211、リンク先URL223から構成される。
【0051】
行リンク情報124は、文書リンクテーブル240、ページリンクテーブル250、行リンクテーブル260から自動的に生成される。すなわち、行リンクテーブル260にリンク先URL223が設定しているか行単位に検査し(280)、検査した行のリンク先URL223が設定されている場合は、行リンク情報124に行リンクテーブル260の検査した行のリンク先URL223を設定する(281)。行リンクテーブル260の検査した行にリンク先URL223が設定されていない場合は、ページリンクテーブル250に、検査する行を含むページがリンク先URL223を設定しているか検査する(282)。リンク先URL223が設定されている場合は、ページリンクテーブル250の検査する行を含む指定ページのリンク先URL223を、行リンク情報124の検査する行のリンク先URL223として設定する(283)。ページリンクテーブル250の指定ページにリンク先URL223が設定していない場合は、文書リンクテーブル240の該当する文書番号200に対応するリンク先URL223を、行リンク情報124の検査する行のリンク先URL223に設定する(284)。
【0052】
図1の携帯端末装置300とサーバ装置320の詳細を、図15を用いて詳細に説明する。以下、図15の携帯端末装置300とサーバ装置320の各部の動作を、図16のフローチャート図と図20、図21を用いて説明する。図15は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すブロック図の例であり、図16は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すフローチャート図である。図20は、本実施形態の印刷した文書の例、図21は、本実施形態のカメラ303で撮影した画像がディスプレイ716に表示する例である。
【0053】
図1と図15の各ブロックの対応を説明する。撮影装置23はカメラ303に対応する。表示装置22は,表示部305に対応する。文書選択装置21は,文書選択部301に対応する。文字認識装置24は,文字認識部304,単語照合部322,認識設定部302に対応する。
図15において、最初にサーバ装置320は、文書登録装置10から文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を取得する(355)。この処理は文書登録時に一度だけ実行すればよい。
【0054】
携帯端末装置300において、文書選択部301は、サーバ装置320の文書情報120から利用者が選択した情報を文書選択情報127にコピーする(355)。さらに利用者は、文書選択情報127から検索対象の文書を選択する(340)。サーバ装置320の文書管理部321は、利用者が選択した文書の文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を選択する(350)。認識設定部302は、文書管理部321が選択した文書属性情報121から文字認識部304のパラメータの設定を行い、単語照合辞書122を単語照合辞書307にコピーする(341)。カメラ303は、利用者の操作により印刷された文書370の一部の領域371を撮影する。文字認識部304は、カメラ303で撮影した画像中に含まれる文字の認識を行い、マーカ841を含む中心行385と、中心行385の上の行386、中心行385の下の行387の文字を認識し文字候補を出力する(343)。単語照合部322は、中心行385および上の行386、下の行387の文字候補から、単語照合辞書122に登録されている単語を利用して注目単語382、上単語383、下単語384を出力する(352)。
【0055】
サーバ装置320において、検索部323は、注目単語382、上単語383、下単語384を利用し、文字情報126から単語の位置を検索し、検索の確信度を候補リスト128に登録する(353)。判定部324は、候補リストから最も確信度の高い単語と単語位置から、行リンク情報124および単語リンク情報125を利用してリンク先URL223を検索する(354)。携帯端末装置300の表示部305は、判定部324で検索したリンク先URL223の情報をブラウザを利用して表示する(344)。
【0056】
次に、検索部323の単語位置検索の詳細を図23のフローチャート図と図24を用いて以下説明する。図23は、本実施形態の検索部323の動作を示すフローチャート図であり、図24は、本実施形態の候補リスト128の例である。
【0057】
図24において、候補リスト128は、候補データ425−1〜iにより構成され、候補データ425−1〜iは、注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233と、注目単語382の場所と一致する可能性を示す確信度424からなる。
【0058】
検索部323は、注目単語382を単語情報123から検索し、注目単語382と同一の単語230の行番号211と列番号233を取得する(400)。単語情報123で検索した単語230の上下の行に含まれる単語から、上単語383、下単語384と同一の単語230を検索し(401)、上単語383、下単語384の存在の判定を行う(402)。上単語383、下単語384が見つからない場合は、単語情報123の次の単語から検索を継続する。単語情報123に上単語383または下単語384が存在した場合は、注目単語と上単語383および下単語384との位置関係を判定する(403)。位置関係が閾値内であれば、注目単語の文字位置を算出し、確信度424と共に候補リスト128に登録する(404)。候補リスト128の確信度424は、注目単語382と上単語383または下単語384との列番号233の差と、上単語383または下単語384の存在により決定する。単語情報123全てに対して、注目単語382の文字位置の検索を繰り返す(405)。
【0059】
本発明のサーバ装置300の実施形態では、検索部323は、単語情報123を使用して文字列位置を検索したが、文字情報126を利用することも可能である。すなわち、単語情報123から列番号を取得する代わりに、文字情報126の文字列から単語を検索し、単語の位置を文字列の文字数から逐次計算することにより、列番号を得ることができる。
【0060】
次に、判定部324の動作の詳細を図11、図12、図21、図22、図24および図25のフローチャート図を用いて以下説明する。図22は、本実施形態のカメラ303で撮影した画像がディスプレイ306に表示する他の例、図25は、本実施形態の判定部324の動作を示すフローチャート図である。
【0061】
判定部324は、候補リスト128中の候補データ425−1〜iから確信度424が最も大きい候補データ425−n検索する(365)。注目単語382上にマーカ381が設定されていたか判定する(361)。注目単語382上にマーカ381がある場合は、単語リンク情報125の単語リンクデータ235−1〜eより、候補データ425−nのページ番号210、行番号211、列番号233と一致する、単語リンクデータ235−mを検索する(362)。つぎに、注目単語382と単語リンクデータ235−mの単語230を照合する(363)。一致した場合は、単語リンクデータ235−mのリンク先URL223を出力する(364)。一致しない場合は、および注目単語382の判定(361)で図22に示すようにマーカ381と注目単語382がずれている場合は、行リンク情報124の行リンクデータ222−1〜bより、候補データ425−nのページ番号210、行番号211が一致する行リンクデータ222−rを検索する(365)。検索されたリンク先URL223を出力する(364)。
【0062】
本発明の実施形態では、判定部は、単語リンク情報125と行リンク情報124を用いて単語単位あるいは行単位のリンク先URL223の検索を行ったが、文リンク情報590から文単位のリンク先URL223を検索することも可能である。文単位のリンク先URL223の検索は、まず最初に注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233を単語情報123から取得する。次に取得したページ番号210と同一であり、かつ、行番号211が文字の始点の行番号273と終点の行番号271以内であり、かつ、列番号233が文字の始点の列番号274と終点の列番号272以内である文リンク情報590中のリンク先URL223を出力する。文のリンク情報としてリンク先URLとしたが、例えば日本語の文は英訳文を、英語の文は和訳を情報として出力することも可能である。
【0063】
携帯端末装置300のハードウェア構成を、図17を用いて説明する。図17は、本実施形態の携帯端末装置300のハードウェア構成図の例である。図1と図17の各ブロックの対応を説明する。入力装置20は,入力キー710に対応する。撮影装置23は,カメラ303に対応する。表示装置22は,ディスプレイ716に対応する。通信装置25は,通信回路713に対応する。文字選択装置21と文字認識装置24は,文字認識プログラム820に対応する。
【0064】
図17において、入力キー710は、検索対象の文書選択やカメラ設定を行う。通信回路713は、サーバ装置320の通信回路714とネットワーク36を介して接続し、カメラ303で撮影した画像中から文字認識にて得た文字列の送信と、文字列に関連した情報の受信を行う。ディスプレイ716は、カメラで撮影する画像の表示や文書選択を行う。文字認識プログラム820は、携帯端末装置300の動作を行うプログラムである。データメモリ801は、文書選択情報127と単語照合辞書307を格記憶する。
【0065】
サーバ装置320のハードウェア構成を、図18を用いて説明する。図18は、本実施形態のサーバ装置320のハードウェア構成図の例である。図1と図18の各ブロックの対応を説明する。通信装置30は,通信回路714に対応する。通信回路33は,第2の通信回路715に対応する。位置検索装置34と情報検索装置31は,文書検索プログラム840に対応する。記憶装置32は,データメモリ801に対応する。
【0066】
図18において、第2の通信回路715は、文書登録装置10とネットワーク26を介して接続し、文書登録装置10のデータメモリ801に記憶したデータを受信し、サーバ装置320のデータメモリ801に格納する。文書検索プログラム840は、サーバ装置320の動作を行うプログラムである。データメモリ801は、受信した、文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、単語情報123と、候補リスト128を記憶する。
【0067】
携帯端末装置300のディスプレイ716に表示される画面の遷移を、以下図19を用いて詳細に説明する。図19は、本実施形態のディスプレイ306に表示する画面遷移図の例である。以下ボタンは、入力キー710により選択される。また戻るボタン913の選択により前画面を表示する。文字認識プログラム820は、起動するとディスプレイ716に文書選択画面900を表示する。文書選択画面900は、利用可能な文書を文書選択情報127から読み出し、文書リスト901に表示する。利用者は、文書リスト901に利用する文書が表示されていない場合、追加ボタン902を選択することにより文書追加画面910を表示する。また、文書選択情報127から不要な文書情報を削除したい場合は、文書リスト901から削除する文書を選択し削除ボタン903を選択することにより文書選択情報127から該当する文書情報を削除する。検索を実行したい場合は、文書リスト901から文書を選択し選択ボタン904を選択することにより、文書確認画面930を表示する。文書追加画面910は、文書一覧911に、文書情報120に登録されている文書の一覧を表示し、文書一覧911から文書選択情報127に追加したい文書を選択し詳細ボタン912を選択することにより文書詳細画面920を表示する。文書詳細画面920は、選択した文書の詳細情報を詳細表示921に表示する。
【0068】
利用者は、タイトルや課金情報などを確認して登録ボタン922を選択することにより、文書選択情報127に選択した文書の文書情報を追加する。文書確認画面930は、詳細表示931に選択した文書の詳細情報を表示し、利用者は、タイトルや課金情報などを確認して、問題がなければ確認ボタン932を選択することにより撮影画面940を表示する。撮影画面940は、撮影する画像を表示画像380に表示し、利用者がマーカ381を検索したい文字に合わせ、検索ボタン943を選択することにより検索を実行し、検索が完了すると確認画面950を表示する。確認画面950は、リンク情報表示951に検索したリンク先URL223を表示する。利用者は、検索結果に誤りがなければ表示ボタン952を選択し、ブラウザ960を表示する。ブラウザ960は、リンク先URL223の情報を表示する。
【0069】
携帯端末装置300とサーバ装置320において、単語照合の別の方法について図26のブロック図を図27のフローチャート図を用いて詳細に説明する。図26は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すブロック図、図27は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すフローチャート図である。
【0070】
携帯端末装置300は、あらかじめ第1の単語照合辞書501を備える。第2の単語照合辞書506は、単語照合辞書122と第1の単語照合辞書501との差で作成される。文書の選択(340)により、選択した文書に対応する第2の単語照合辞書501をデータメモリ801にロードする(521)。カメラ303から入力した画像は、文字認識部304で文字認識し文字候補を出力する(343)。第1の単語照合部500は、第1の単語照合辞書501を利用して文字候補から単語を照合し(514)、第1の単語照合辞書501に登録された単語と文字候補が一致するか判定する(515)。第1の単語照合辞書501の単語と一致した場合は、単語をサーバ装置320の検索部323に送信し、検索部323は、単語の文書中の位置の検索を行う(354)。一致しない場合は、サーバ装置320の第2の単語照合部505で第2の単語照合辞書506を利用して単語を照合する(522)。本発明の実施形態では、第2の単語照合辞書506をサーバ装置320に持つ例を示したが、携帯端末装置300にダウンロードし、携帯端末300側で第1の単語照合辞書501と第2の単語照合辞書506を利用して単語照合部322で単語照合を行うことも可能である。
【0071】
次に文字認識部304と認識設定部302の動作の詳細を、図30と図31を用いて以下説明する。図30は、本実施形態の文字認識部304と認識設定部302の動作を示す図の例、図31は、本実施形態の文書属性情報121の例である。文書属性情報121は、複数の文書属性73−1〜73−jにより構成され、文書属性73−1〜73−jは、文書番号200、二値化モード70、文字方向71、文字コード72により構成する。
【0072】
認識設定部302は、サーバ装置320から受信した文書属性情報121から、選択した文書の文書番号200に対応する二値化モード70の値により、二値化処理部51の第1の画像二値化処理60と第2の画像二値化処理61を切り換える。また、文字方向71の値により、文字行切り出し部52の縦書き処理部62と横書き処理部63を切り換える。また、文字コード72の値により、識別部64が識別辞書65中の文字コード72で指定した文字コードの特徴量と比較するように設定する。なお、識別処理部55において、識別部64は、特徴抽出部54の文字ごとの特徴量と、識別辞書65に登録されている全ての文字コードの特徴量とを比較する。判定部66は、比較の差が小さい順に文字コードを出力する。
【0073】
本発明の文書情報検索システムの利用形態を、以下図35を用いて詳細に説明する。図35は、本実施形態の文書情報登録システムを運用するためのシステム利用形態の例である。出版社956は、発行する文書の著者から原稿受け取り、キーボード950よりDTP951に入力し編集を行う。DTP951は、原稿の校正のためPDFファイル952に出力し、プリンタ953で校正用原稿954を出力する。校正が終了した原稿は、DTP951から出版用印刷データ955を出力し、印刷機956にて販売用の書籍957を印刷する。文書登録装置10は、校正のため出力するPDFファイル952を入力し、文書に関連情報を付加した検索用DBを作成する。作成したDBは、ネットワーク26を経由して、コンテンツプロバイダ958のサーバ装置300に転送する。利用者は、出版した書籍957を購入し、携帯端末装置320を使用して書籍957の一部画像を撮影する。携帯端末装置320は、画像中から認識した文字列を、ネットワーク36を経由してサーバ装置300に転送する。サーバ装置300は、検索用DBから文字列に関連した情報を検索する。検索した情報は、携帯端末装置300に表示する。
【0074】
また、出版社960は、既に出版されている書籍957を、スキャナ961から各ページを画像として入力する。OCR962は、各ページの画像から文字を認識するとともに文字画像の位置も検出する。構造化958は、文字と文字位置からPDFファイル952を作成する。文書登録装置10は、PDFファイル952を入力して、文書に関連情報を付加した検索用DBを作成する。
【0075】
以上で説明した、PDAファイルから検索用DBを作成する手順は、もちろん出版社以外の第三者が請け負ってもよい。
本発明の実施形態では、文書に関連する情報としてURLを想定したが、URLの他に、直接文字、音、画像といった情報を直接送ることももちろん可能である。
【0076】
日本語文書を対象としているが、もちろん英文など各国語にも適応することは容易である。例えば英文やハングル語などは単語がスペースで区切られているため、形態素解析を行うことなく容易に単語単位に切り出すことが可能であり、また注目単語の上下行の単語に加え、注目単語の左右の単語を利用して注目単語の位置を検索することも可能である。
【0077】
実施例では、携帯端末装置とサーバ装置で分けたが処理の分担を制限することはない。例えば、単語照合を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、例えば、文字認識を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、サーバ装置と携帯端末装置に分けたが、サーバ装置の動作と携帯端末の動作が同一装置内で実行することも可能である。
【0078】
実施例では、携帯端末装置320のプログラムメモリ800に文字認識プログラム820があらかじめ記憶されていたが、サーバから文字認識プログラム820をダウンロードして実行することも可能である。また、実施例では検索対象の文書を選択したが検索対象の文書にあわせて文書に対応した文字認識プログラム820をダウンロードすることも可能である。
【0079】
実施例では、単語位置検索に注目単語382、上単語383、下単語383の3単語を使ったが、、検索に利用する単語の数を制限するものではない。
実施例では、電子ファイルから入力したが例えば既に印刷した文書をOCRを利用して文字および文字位置を取得することも可能である。
【0080】
実施例では、リンク先URL223の設定を行または単語単位としたが、文単位にリンク先URLを設定することも可能である。例えば図28に示すように、文の開始の行番号211と列番号233、および文の終了の行番号271と列番号272に体操してリンク先URL223を記憶することにより、検索した単語が設定した文と開始と終了内にあれば、該当するリンク先URL223を出力することも可能である。これにより、例えば日本語文章であれば英訳文や英語の文書なら和訳を情報とすることももちろん可能である。
【図面の簡単な説明】
【0081】
【図1】本実施形態の全体構成図の例。
【図2】本実施形態の文書登録装置の動作を示すブロック図の例。
【図3】本実施形態の文書登録装置の動作を示すフローチャート図。
【図4】本実施形態の文書登録装置のハードウェア構成図の例。
【図5】本実施形態で入力される文書ファイルの例。
【図6】本実施形態のディスプレイ703に表示される画面の例。
【図7】本実施形態のディスプレイ703に表示される他の画面の例。
【図8】本実施形態の文書情報120の例。
【図9】本実施形態の文字情報126の例。
【図10】本実施形態の単語情報123の例。
【図11】本実施形態の行リンク情報124の例。
【図12】本実施形態の単語リンク情報125の例。
【図13】本実施形態のリンク先登録部111が作成するデータの例。
【図14】本実施形態のリンク先登録部111の動作を示すフローチャート図。
【図15】本実施形態の携帯端末装置300とサーバ装置320の動作を示すブロック図の例。
【図16】本実施形態の携帯端末装置300とサーバ装置320の動作を示すフローチャート図。
【図17】本実施形態の携帯端末装置300のハードウェア構成図の例。
【図18】本実施形態のサーバ装置320のハードウェア構成図の例。
【図19】本実施形態のディスプレイ716に表示される画面遷移図の例。
【図20】本実施形態の印刷された文書の例。
【図21】本実施形態のカメラ303で撮影した画像がディスプレイ716に表示される例。
【図22】本実施形態のカメラ303で撮影した画像がディスプレイ716に表示される他の例。
【図23】本実施形態の検索部323の動作を示すフローチャート図。
【図24】本実施形態の候補リスト128の例。
【図25】本実施形態の判定部324の動作を示すフローチャート図。
【図26】本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すブロック図。
【図27】本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すフローチャート図。
【図28】本実施形態の文字情報126の作成手順を示すフローチャート図。
【図29】本実施形態の文情報580の作成手順示すフローチャート図。
【図30】本実施形態の文情報580の例。
【図31】本実施形態の文リンク情報590の例。
【図32】本実施形態の文字認識処理の例。
【図33】本実施形態の文字認識部304と認識設定部302の動作を示す図の例。
【図34】本実施形態の文書属性情報121の例。
【図35】本実施形態の文書情報登録システムを運用するためのシステム利用形態の例。
【符号の説明】
【0082】
10 文書登録装置、20 入力装置、21 文書選択装置、22 表示装置、23 撮影装置、24 文字認識装置、25 通信装置、26 ネットワーク、
30 通信装置、31 情報検索装置、32 記憶装置、33 通信装置、34 位置検索装置、36 ネットワーク、
41 文書入力装置、42 解析装置、43 登録装置、44 記憶装置、45 入力装置、46 通信装置、
300 サーバ装置、320 携帯端末装置。
【技術分野】
【0001】
本発明は、文書中の文字列に擬似的に埋め込んだ関連情報を検索するシステムに係り、あらかじめ文書中の文字列と関連情報を対応した検索用DBを作成し、出版されている文書中の一部を携帯電話などに内蔵されているカメラで撮影した文書中の一部を撮影した画像から文字認識により文字列を認識し、前記複数の文字列から前記検索用DBに登録された関連情報を検索するものである。
【背景技術】
【0002】
従来、印刷された写真や文書に情報を埋め込む方法として電子透かしが知られていた。例えば、文書などの二値化された画像に電子透かしを埋め込む一例として特開2004−289783号公報(特許文献1)がある。
従来、カメラを搭載した携帯電話等の携帯端末で撮影した画像に含まれる文字列の文字を認識して、その認識結果である文字テキストを翻訳する技術が種々提案されている。例えば、特開平09−138802号公報(特許文献2)には、携帯端末内部に文字認識機能と翻訳機能を持ち、これらの機能を利用して、カメラで撮影した画像内の文字列を認識、翻訳処理する翻訳システムが開示されている。
【0003】
また、同出願人の先の出願、特願2004−227610号および特願2004−232891号に、携帯端末で撮影した画像中の複数の単語の並びや位置関係から、文書中の撮影位置を特定し、撮影した単語に関連した翻訳結果や文書中の位置に対して設定したリンク先URLをブラウザに表示する文書翻訳システムに関する発明がある。
【0004】
【特許文献1】特開2004−289783号公報
【0005】
【特許文献2】特開平09−138802号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
特許文献1では、あらかじめ情報を埋め込んだ文書を印刷して配布する必要があった。そのため印刷済みの書籍に電子透かしを適用することができなかった。
また、特許文献2では、文書中の特定の場所を撮影し、文字認識により撮影した画像中の文字イメージを単語または文を含む文字列に変換して出力することにより、出力された単語または文を翻訳する翻訳システムが開示されている。認識範囲を文とした場合、撮影する範囲が広くなりカメラの解像度を高くするか、複数撮影した画像から文字列を認識し、細分化された文字列を再構築して文を再生する必要があった。また単語を翻訳する場合、文書中の単語の位置で訳が異なる場合があった。
【0007】
また、文字認識は、誤読の可能性があることから認識率を向上させる必要がある。図32は文字認識処理の流れの例であり、画像二値化部51は、文字を含む画像から背景と文字を分けた二値画像を作成する。文字行切り出し部52は、二値画像から1行分の文字列領域を判別する。文字切り出し部53は、1行分の文字列領域から1文字の文字領域を判別する。特徴抽出部54は、1文字の文字領域から文字の特徴を算出する。識別処理部55は、文字の特徴からあらかじめ文字毎に登録した文字の特徴と比較し、特徴が似通った順に文字の候補を出力する。単語照合部56は、連続した1文字の文字領域毎の文字の候補から単語照合辞書登録されている単語に最も近い単語を出力する。画像二値化部51では、印刷された文書は、カラー印刷や網点印刷など条件が広く、一種類の二値化方法では、正しく二値化できない場合がある。また、文字行切り出し部52や文字切り出し部53では、文字を認識する前に画像中から文字行および文字領域を予測する必要があるが、罫線、行間、文字間隔など文書により多種多様であり、判別を誤ることがある。また、識別処理部55では、類似文字(例えば日、白、目など非常に似通った文字)があり、画像のノイズやかすれなどによる悪影響により、文字候補が正しく出力されない場合がある。また、単語照合部56では、正読率の向上に全ての単語を単語照合辞書に登録する必要があるが、出版されている全ての文書の単語を登録には大きなメモリが必要であり、メモリ制限がある携帯電話などの携帯端末では全ての単語を単語照合辞書に登録できない。
【0008】
本発明の目的は、カメラを内蔵した携帯可能な情報端末で文書の一部をカメラで撮影した画像に含まれている文字列が文書中のどの場所に存在するかを特定し、その場所に関連付けられる情報を取得する文書情報検索システムを提供することにある。
【0009】
また、本発明の別の目的は、文字の場所を特定するためのデータの作成を自動化し、また文書に関連付けられる情報のデータの作成を簡素に行う、文書情報検索システムを提供することにある。
また、本発明の別の目的は、文書毎に文書の構造を定義した文書ファイルから文書の特徴を抽出することにより文字認識のパラメータを作成し、検索対象の文書に合わせて文字認識のパラメータを設定することにより、文字認識率を向上させることが可能な文書情報検索システムを提供することにある。
【課題を解決するための手段】
【0010】
本発明は、画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部を有する携帯情報端末を用いて、画像撮影部で撮影された画像に含まれる文字に関連付けられた情報を得て、その情報を表示部に表示する文書情報検索システムにおいて、
文書の構成要素に関連する情報を対応付けた関連情報を作成する文書情報登録部と、文字列の位置情報を作成する座標登録部と前記関連情報と前記位置情報を保持する記憶装置とを備えるものである。また、文書選択部を設けることにより、文書毎に記憶装置に登録された関連情報と、位置情報を選択して検索部により情報を検索できるように文書を示す情報をも保持する。
【0011】
また、本発明において、サーバ装置は、前記記憶装置、及び前記検索部を備え、携帯情報端末は、前記文字認識部より得られた文字列を、ネットワークを介して前記サーバに送信し、前記サーバにおいて前記検索部により関連情報を検索した結果得られた情報を、前記ネットワークを介して前記携帯情報端末に送信する。また、前記文字認識部は、サーバ装置に備えることもできる。
【0012】
また、本発明の文書情報登録部は、文書の構造を定義した文書ファイルを入力し、前記文書ファイルの前記文書の構造、すなわち文字、文字種、文字座標、文字サイズなどを解析して文書の構成要素(章、段、文、行、見出しなど)に分解し、前記構成要素単位に関連する情報を対応付けた関連情報を作成する。例えば、図5に示す文書ファイル15は、PDFの文書構造を持つ。 PDFファイルでは、ページオブジェクト、テキストオブジェクトなど、文書を階層化した複数のオブジェクトを持つ。テキストオブジェクトには、書体、字体、文字幅の指定、ページ上の開始位置、文字コード、文字ごとの間隔が記述されている。これらの情報を利用することにより容易に文字列の位置を推定することが可能である。
【0013】
さらに好ましくは、文書の構成要素を階層化し、上位階層から関連情報を設定し、検索時には下位階層から関連情報を検索する。さらに好ましくは、前記文書の構成要素を形態素に分解し、前記形態素単位に関連する情報を対応付けた関連情報を作成する。また、さらに好ましくは、前記形態素は、形態素の区切りを登録者が編集する編集部を有する。
【発明の効果】
【0014】
本発明によって、文書の文字列および文字位置から行、文、単語などといった関連情報を設定する単位を作成するため、登録者が文書から行や文、単語などを登録する作業が不要または簡易となる。
【発明を実施するための最良の形態】
【0015】
本発明の実施形態の文書情報登録システムは、文書登録装置、サーバ装置、携帯端末装置により構成する。検索する文書に設定する関連情報は、行と単語単位にURL(Uniform Resource Locator)を設定し、URLを使ってブラウザ上に情報を表示する。また入力を行う文書の構造を数値化して定義した文書ファイルとしてPDF(Portable Document Format)ファイルを例として説明を行う。
【実施例1】
【0016】
本発明の実施形態を、図1を用いて説明する。図1は、本実施形態の全体構成図の例である。関連情報を登録する文書は、あらかじめ文書登録者が文書登録装置10を操作し、文書入力装置41にて文書データを入力する。解析装置42は、入力された文書ファイルを行や単語などの文書を構成する構成要素に分解し、分解した構成要素を表示装置40に表示する。文書登録者は、構成要素に関連した情報を入力装置45から入力する。構成要素と構成要素に対応した関連情報を含む検索用DBは、登録装置43にて記憶装置44に記憶する。また、検索用DBは、文書登録装置10の通信装置46からサーバ装置320の通信装置33にネットワーク36を経由して送信され、サーバ装置320の記憶装置32に格納される。
【0017】
携帯端末装置300は、関連情報を登録した文書の一覧を表示装置22に表示する。携帯端末装置300の利用者は、関連情報を検索する撮影対象の文書を、入力装置20の操作で文書選択装置21により選択し、印刷された文書の一部を撮影装置23により撮影する。文字認識装置24は、撮影した画像から注目する単語とその周辺の複数の単語を認識する。携帯端末装置300は、携帯電話、PDAなどの、撮像装置を有する情報端末である。
【0018】
サーバ装置320において、位置検索装置34は、記憶装置32に記憶した検索用DBから、携帯端末装置300で撮影した注目単語の文書中の位置を特定し、情報検索装置31は、注目単語に対応する関連情報を検索用DBから検索する。携帯端末装置300の表示装置22は、情報検索装置31で得られた関連情報を表示する。携帯端末装置300とサーバ装置320間のデータ通信は、通信装置25と通信装置30間でネットワーク26を経由して接続し、携帯端末装置300で認識した注目単語と、サーバ装置320で検索した関連情報の転送を行う。
【0019】
次に本発明の実施形態における図1の文書登録装置10の詳細を、図2を用いて詳細に説明する。以下、図2の各部の動作を、図3のフローチャート図および必要に応じて図5、図8乃至図12の符号を用いて説明する。図2は、本実施形態の文書登録装置の動作を示すブロック図の例である。図3は、本実施形態の文書登録装置の動作を示すフローチャート図である。
【0020】
図1と図2の各ブロックの対応を説明する。文書入力装置41は,文書登録部101と文書入力部100に対応する。解析装置42は,属性抽出部102,文書座標抽出部106,文書抽出部103,形態素解析部104,単語編集部105,単語リスト作成部107,照合辞書作成部109に対応する。登録装置43は,リンク先登録部111に対応する。記憶装置43は,文書情報120,文書属性情報121,単語照合辞書122,単語情報123,文字情報126,行リンク情報124,単語リンク情報125に対応する。
【0021】
文書登録部101において、登録者は、文書登録部101から文書のタイトル201などを入力する(130)。登録者は、文書入力部100により文書ファイル15を入力する(131)。属性抽出部102は、文書ファイル15の文書構造を解析し、文書のページ数202、文字の背景、文字方向、使われている文字種を抽出し(132)、ページ数202と、文書登録部101により入力したタイトル201と、自動的に生成する文書番号200を文書情報120に登録する(133)。また、抽出した文字の背景、文字方向、使われている文字種から二値化モード70、文字方向71、文字コード72を作成し、文書属性情報121に登録する(150)。
【0022】
文字座標抽出部106は、ページ中の文字の位置座標を抽出(160)し、文字毎にページ番号210、行番号211、列番号233などの位置情報を出力する。文字抽出部103は、文書ファイル15から文字を抽出し(135)、文字座標抽出部106が設定した文字単位のページ番号210、行番号211から同一行の文字列を再構成し、文字情報126に登録する(139)。
【0023】
形態素解析部104は、文字情報126から、行単位に文字列を形態素解析して行を構成する複数の品詞に分解する(136)。接続詞など不用な品詞を除去し固有名詞など単語として利用可能な品詞を選択して出力する(137)。単語編集部105は、形態素解析部104が出力する品詞を構成する文字列に対し、登録者が必要に応じて行う、連続する複数の品詞を構成する文字列の結合、または品詞を構成する文字列の分割などの編集を受け付け、単語230を作成する(138)。単語リスト作成部107は、単語編集部105が出力する単語230と、単語230の先頭文字の文字座標抽出部106が出力するページ番号210、行番号211、列番号233を用いて、単語情報123に登録する(140)。
【0024】
照合辞書作成部109は、単語情報123に登録されている全ての単語230から、単語照合辞書122を作成する(171)。リンク先登録部111は、文字情報126の各文字データ212−1〜b、および単語情報123に登録してある単語データ234−1〜cに対応するリンク先URLの情報について登録者からの入力を受け付け、行リンク情報124および単語リンク情報125を作成する(143)。
【0025】
以下、文書登録装置10が作成する、文書情報120、文字情報126、単語情報123、行リンク情報124、単語リンク情報125、を図8乃至図12を用いて説明する。
文書情報120を、図8を用いて説明する。図8において、文書情報120は、文書データ203−1〜aから構成され、文書データ203−1〜aは、文書毎の文書番号200とタイトル201、ページ数202から構成する。文書番号200は、登録された文書毎に自動的に設定する番号であり、タイトル201は、文書の表題であり、ページ数202は、文書を構成する総ページ数を示す。
【0026】
次に文字情報126を、図9を用いて説明する。図9において、文字情報126は、文字データ212−1〜bから構成され、文字データ212−1〜bは、文書中の行単位毎に、文字列213と、文字列213が印刷されている、ページ番号210、行番号211、から構成される。
【0027】
次に単語情報123を、図10を用いて説明する。図10において、単語情報123は、単語データ234−1〜cから構成され、単語データ234−1〜cは、単語230と、単語230の印刷された文書中の位置を示すページ番号210、行番号211、列番号233から構成する。単語230は、単語リスト作成部107で作成する単語である。列番号233は、単語230が含まれる文書情報126中の文字列213において、単語230の先頭文字を文字列213の左の文字から数えた位置である。
【0028】
次に行リンク情報124を、図11を用いて説明する。図11において、行リンク情報124は、行リンクデータ222−1〜bから構成され、行リンクデータ222−1〜bは、文書中の全ての行に対して設定した、ページ番号210、行番号211、リンク先URL223から構成する。
【0029】
次に単語リンク情報125を、図12を用いて説明する。図12において単語リンク情報125は、単語リンクデータ235−1〜eから構成され、単語リンクデータ235−1〜eは、単語230と、単語230に設定するリンク先URL223と、単語230の印刷文書中の位置を示す、ページ番号210、行番号211、列番号233から構成する。
【0030】
以下、PDFファイルを例とする文書ファイル15から文字情報126を抽出する手順を図5と図28を用いて、詳細に説明する。図5は,本実施形態の入力する文書ファイルの例,図28は、本実施形態の文字情報126の作成手順を示すフローチャート図である。
【0031】
図5のPDFファイル例の代表的な各行の意味を,行番号16を用いて説明する。説明を分かりやすくするため,埋め込まれた文字は英文である。PDFでは,文書のレイアウトを定義するためオブジェクト単位で定義を行っている。行1と行38は,PDF形式であることを示すヘッダとフッタである。行4〜11は,ページのオブジェクトを定義する。行12〜24は,使用されている書体のオブジェクトを定義する。行16が定義する文字の開始コード,行17が定義する文字の終了コードであり,行18〜19が開始から終了文字の文字幅を定義する。行21は,書体である。行25〜37は,印刷されるテキストオブジェクトを定義する。行28は,テキストオブジェクトの開始,行34は,テキストオブジェクトの終了を示す。行30は,Tcが文字の間隔,Twが単語の間隔を定義する。行31は,印刷する文字と必要に応じて配置のオフセットを定義する。行32は,Tdが次の行へのオフセットを定義する。行33は,印刷する文字を定義する。
【0032】
文書ファイル15から文字情報126を抽出するために、まず、テキストブロックからテキストブロックに共通する書体、字体、文字毎の文字幅のパラメータを抽出する(550)。最初の文字の始点座標のパラメータを抽出する(551)。1文字ごとに文字幅と文字間隔のパラメータより終点座標を計算し、求めた終点座標を次の文字の始点座標とする(552)。552の処理を行方向の座標が異なる文字の始点座標が見つかるまで繰り返す(553)。552で処理した文字を同一行の文字列213として、文字情報126に登録する(555)。テキストブロック内が終了するまで551から555の処理を繰り返す(556)。ページオブジェクトが終了するまで550から556の処理を繰り返す(557)。文書を終了するまで、上記ページオブジェクト内の処理を繰り返す(558)。
【0033】
本発明の実施形態では、列番号233を行の先頭文字からの文字数としたが、例えば図28で求まる文字単位の始点座標を用いることも可能である。また、本発明の実施形態では、リンク先URL223の設定を行または単語単位設定し、それぞれ行リンク情報124、単語リンク情報125を作成したが、文単位にリンク先URL223を設定することも可能である。
【0034】
以下、文単位にリンク先URL223を設定した文リンク情報590の作成手順を文情報580と、文情報580の作成手順を、図29、図30、図31を用いて説明する。図29は、本実施形態の文情報580の作成手順示すフローチャート図である。
【0035】
図30は、本実施形態の文情報580の例であり、文情報580は、文データ582−1〜kから構成され、文データ582−1〜kは、文581と、文581が含まれるページのページ番号210と、文581の最初の文字が存在する文字データ212中の行番号211を始点の行番号273とし、文字列213の左から数えた文字数からなる列番号233を始点の列番号274とする。また、文581の最後の文字が存在する文字データ212中の行番号211を終点の行番号271とし、文字列213の左から数えた文字数からなる列番号233を終点の列番号272とする。
本実施形態では、列番号272、274を文字列中の左からの文字数としたが、図28で算出した文字の始点の座標を利用することも可能である。
【0036】
図31は、本実施形態の文リンク情報590の例であり、文リンク情報590は、文リンクデータ591−1〜kから構成され、文リンクデータ591−1〜kは、文データ582−1〜kに対応して、文情報580の文581の代わりに、文581に関連つけられるリンク先URL223を設定する。
【0037】
文情報580の作成では、図28で作成した文字情報126と、書体、字体、文字コード、文字サイズを利用して作成する。文字情報126の文字データ212−1〜bに登録した行毎の文字列213について、文書ファイル15から図28で抽出した書体、字体と同様に、文字の書体、字体、文字サイズなどを抽出し、次の行の書体、字体、文字サイズなどが異なるか判定する(570)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、先頭文字が記号“(1)”や見出し番号“1.1“など明らかに前後の行と異なるか判定する(571)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、見出し行でなければ、順次行の文字列213から句点“。”を探索し、句点で区切った文581として文情報580の文データ582に登録する(572)。上記の処理を文書中の全ての行を走査するまで繰り返す(574)。
【0038】
次に以下図4を用いて文書登録装置の構成を説明する。図4は、本実施形態の文書登録装置のハードウェア構成図の例である。
図1と図4の各ブロックの対応を説明する。入力装置45は,キーボード700,マウス701に対応する。表示装置40は,ディスプレイ703に対応する。通信装置320は,通信回路705に対応する。記憶装置44は,データメモリ801に対応する。文書選択装置21および文字認識装置24は,文書登録プログラム810に対応する。
【0039】
キーボード700は、登録者からテキスト入力などを行う。マウス701は、利用者からのディスプレイ画面上のボタン操作などを行う。外部記憶装置702は、文書ファイル15を記憶したフロッピー(登録商標)ディスクやコンパクトディスクなどの記憶メディアから文書ファイル15を入力したり、データメモリ801に記憶されたデータを記憶メディアに出力したりする。ディスプレイ703は、登録者に操作画面などを表示する。CPU704はプログラムメモリ800中のプログラムを実行する。通信回路705は、サーバ装置320間でネットワーク36を経由してデータメモリ801に記憶されたデータの転送を行う。プログラムメモリ800は、図2の各部の動作を実行する文書登録プログラム810を格納する。データメモリ801は、文書情報120、文書属性情報121、単語照合辞書122、単語情報123、行リンク情報124、単語リンク情報125、文字情報126と、文書登録プログラム810が使用する作業用の一時データを格納する。
【0040】
以下、本実施形態のリンク先登録のために文書登録装置300において、リンク先URL223を登録者が操作する手順を、図6を用いて説明する。図6は、本実施形態のディスプレイ703に表示する画面の例である。
CPU704で実行される文書登録プログラム810は、登録者が操作する画面をディスプレイ703に表示し、キーボード700およびマウス701を操作し入力操作を受け付ける。ボタンは、マウス701を利用して選択することができる。入力フィールドは、キーボード700を操作し文字を入力することができる。
【0041】
文書登録プログラム810を起動すると、最初に文書登録画面600を表示する。最初に文書を登録する手順を説明する。文書登録画面600は、現在登録されている文書情報120を一覧表示する。登録者は、新規に文書を追加したい場合、追加ボタン601を選択することにより文書情報画面610を表示させることができる。登録した文書中登録を削除する場合は、削除したい項目の削除ボタン603を選択することにより、文書情報120より選択した文書情報を削除し、一覧表示から削除する。文書のリンク情報を設定する場合は、設定する文書の項目の設定ボタン602を選択することにより、リンク登録画面620を表示する。
【0042】
文書情報画面610は、文書番号フィールド611に自動的に設定した文書番号200を表示し、タイトルフィールド612にタイトル201を入力する。登録者は、開くボタン613を選択することにより、文書ファイル15を入力する。入力した文書ファイル15のページ数などの文書情報は文書情報表示フィールド614に表示される。登録者は、登録内容に問題がないことを確認し、登録ボタン615を選択することにより文書の解析が開始され文書登録画面600を表示する。登録をキャンセルする場合は、キャンセルボタン616を選択することで文書情報120に登録されず、文書登録画面600を表示する。
【0043】
次にリンク情報を設定する手順を説明する。リンク登録画面620では、登録者がリンク先フィールド621に、文書全体に設定したいリンク先URL223を記入し、確定ボタン622で確定する。登録者は必要に応じて以下同様に確認ボタン623を選択することによりリンク確認画面660を表示する。登録者は、確定ボタン622を選択することにより、文書番号223および入力したリンク先URL223を、文書リンクテーブル240に登録する。ページ単位のリンク情報の設定では、ページ一括設定ボタン624の選択で、ページ設定画面630を表示する。行単位のリンク情報の設定では、行一括設定ボタン625の選択で、行設定画面640を表示する。単語単位のリンク情報設定では、単語設定626ボタンの選択で、単語設定画面650を表示する。以下同様に戻るボタン627の選択で、前画面を表示する。
リンク確認画面660は、設定したリンク先URL223に対応した画像などを表示画面662に表示する。リンク先URL223が誤った場合は、リンク先フィールド661に修正したリンク先URL223を記入し、更新ボタン663を選択することによりリンク先フィールド621に反映する。
【0044】
ページ設定画面630は、登録者が追加ボタン601の選択で設定項目を追加し、追加した設定項目のページ数入力フィールド631に設定したいページ番号210、リンク先フィールド621にリンク先URL223をそれぞれ入力する。確定ボタン622の選択により、リンク先URL223、ページ番号210を、ページリンクテーブル250に登録する。
【0045】
行設定画面640は、登録者がページ設定フィールド641に設定したいページ番号210を入力し、追加ボタン601の選択により設定項目を追加する。登録者は、追加した設定項目の行数入力フィールド642に設定したい行番号211、リンク先フィールド621にリンク先URL223をそれぞれ入力する。登録者は、確定ボタン622の選択により、ページ番号210、行番号211、リンク先URL223を、行リンクテーブル260に登録する。
【0046】
単語設定画面650は、登録者がページ設定フィールド641に設定したいページ、行設定フィールド651に設定したい行を入力し、追加ボタン601の選択により設定項目を追加する。追加した設定項目の単語フィールド652にページ設定フィールド641および行設定フィールド651に入力したページと行に含まれている単語を単語情報123から取得し一覧表示する。登録者は、設定したい単語に対応したリンク先フィールド621にリンク先URL223を記入する。登録者は、確定ボタン622により、ページ設定フィールド641、行設定フィールド651、単語フィールド652、リンク先フィールド621のそれぞれに設定した値と、単語情報123の内、設定した単語の列番号233を単語リンク情報125に登録する。
【0047】
図6の実施例では、画面を切り替えて設定を行う例を示したが、図7に示すように画面を遷移することなく一画面中で全ての設定を行うことももちろん可能である。
【0048】
図7の動作を説明する。図7は本実施形態のリンク先登録のためにディスプレイ703に表示される他の画面の例である。図7において、登録画面180は、文書表示エリア181に設定を行う文書を表示し、行番号182に対応して行リンク設定フィールド185で行単位にリンク先URL223を設定する。またリンク先URL223を設定可能な単語は、文書表示エリア181に表示された文書中に設定枠183が表示され、単語リンク設定フィールド185で単語ごとにリンク先URL223を設定することができる。
【0049】
次に、リンク先登録部111において図11の行リンク情報124を作成する手順を、以下図14のフローチャート図と図13を用いて詳細に説明する。図13は、本実施形態のリンク先登録部111が作成するデータの例、図14は、本実施形態のリンク先登録部111の動作を示すフローチャート図である。
【0050】
図13において、文書リンクテーブル240は、文書毎に設定される文書リンクデータ243−1〜fから構成され、文書リンクデータ243−1〜fは、文書番号200とリンク先URL223から構成される。ページリンクテーブル250は、ページ単位に設定するページリンクデータ253−1〜gから構成され、ページリンクデータ253−1〜gは、ページ番号210、リンク先URL223から構成される。行リンクテーブル260は、行単位に設定する行リンクデータ263−1〜hから構成され、行リンクデータ263−1〜hは、ページ番号210、行番号211、リンク先URL223から構成される。
【0051】
行リンク情報124は、文書リンクテーブル240、ページリンクテーブル250、行リンクテーブル260から自動的に生成される。すなわち、行リンクテーブル260にリンク先URL223が設定しているか行単位に検査し(280)、検査した行のリンク先URL223が設定されている場合は、行リンク情報124に行リンクテーブル260の検査した行のリンク先URL223を設定する(281)。行リンクテーブル260の検査した行にリンク先URL223が設定されていない場合は、ページリンクテーブル250に、検査する行を含むページがリンク先URL223を設定しているか検査する(282)。リンク先URL223が設定されている場合は、ページリンクテーブル250の検査する行を含む指定ページのリンク先URL223を、行リンク情報124の検査する行のリンク先URL223として設定する(283)。ページリンクテーブル250の指定ページにリンク先URL223が設定していない場合は、文書リンクテーブル240の該当する文書番号200に対応するリンク先URL223を、行リンク情報124の検査する行のリンク先URL223に設定する(284)。
【0052】
図1の携帯端末装置300とサーバ装置320の詳細を、図15を用いて詳細に説明する。以下、図15の携帯端末装置300とサーバ装置320の各部の動作を、図16のフローチャート図と図20、図21を用いて説明する。図15は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すブロック図の例であり、図16は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すフローチャート図である。図20は、本実施形態の印刷した文書の例、図21は、本実施形態のカメラ303で撮影した画像がディスプレイ716に表示する例である。
【0053】
図1と図15の各ブロックの対応を説明する。撮影装置23はカメラ303に対応する。表示装置22は,表示部305に対応する。文書選択装置21は,文書選択部301に対応する。文字認識装置24は,文字認識部304,単語照合部322,認識設定部302に対応する。
図15において、最初にサーバ装置320は、文書登録装置10から文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を取得する(355)。この処理は文書登録時に一度だけ実行すればよい。
【0054】
携帯端末装置300において、文書選択部301は、サーバ装置320の文書情報120から利用者が選択した情報を文書選択情報127にコピーする(355)。さらに利用者は、文書選択情報127から検索対象の文書を選択する(340)。サーバ装置320の文書管理部321は、利用者が選択した文書の文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を選択する(350)。認識設定部302は、文書管理部321が選択した文書属性情報121から文字認識部304のパラメータの設定を行い、単語照合辞書122を単語照合辞書307にコピーする(341)。カメラ303は、利用者の操作により印刷された文書370の一部の領域371を撮影する。文字認識部304は、カメラ303で撮影した画像中に含まれる文字の認識を行い、マーカ841を含む中心行385と、中心行385の上の行386、中心行385の下の行387の文字を認識し文字候補を出力する(343)。単語照合部322は、中心行385および上の行386、下の行387の文字候補から、単語照合辞書122に登録されている単語を利用して注目単語382、上単語383、下単語384を出力する(352)。
【0055】
サーバ装置320において、検索部323は、注目単語382、上単語383、下単語384を利用し、文字情報126から単語の位置を検索し、検索の確信度を候補リスト128に登録する(353)。判定部324は、候補リストから最も確信度の高い単語と単語位置から、行リンク情報124および単語リンク情報125を利用してリンク先URL223を検索する(354)。携帯端末装置300の表示部305は、判定部324で検索したリンク先URL223の情報をブラウザを利用して表示する(344)。
【0056】
次に、検索部323の単語位置検索の詳細を図23のフローチャート図と図24を用いて以下説明する。図23は、本実施形態の検索部323の動作を示すフローチャート図であり、図24は、本実施形態の候補リスト128の例である。
【0057】
図24において、候補リスト128は、候補データ425−1〜iにより構成され、候補データ425−1〜iは、注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233と、注目単語382の場所と一致する可能性を示す確信度424からなる。
【0058】
検索部323は、注目単語382を単語情報123から検索し、注目単語382と同一の単語230の行番号211と列番号233を取得する(400)。単語情報123で検索した単語230の上下の行に含まれる単語から、上単語383、下単語384と同一の単語230を検索し(401)、上単語383、下単語384の存在の判定を行う(402)。上単語383、下単語384が見つからない場合は、単語情報123の次の単語から検索を継続する。単語情報123に上単語383または下単語384が存在した場合は、注目単語と上単語383および下単語384との位置関係を判定する(403)。位置関係が閾値内であれば、注目単語の文字位置を算出し、確信度424と共に候補リスト128に登録する(404)。候補リスト128の確信度424は、注目単語382と上単語383または下単語384との列番号233の差と、上単語383または下単語384の存在により決定する。単語情報123全てに対して、注目単語382の文字位置の検索を繰り返す(405)。
【0059】
本発明のサーバ装置300の実施形態では、検索部323は、単語情報123を使用して文字列位置を検索したが、文字情報126を利用することも可能である。すなわち、単語情報123から列番号を取得する代わりに、文字情報126の文字列から単語を検索し、単語の位置を文字列の文字数から逐次計算することにより、列番号を得ることができる。
【0060】
次に、判定部324の動作の詳細を図11、図12、図21、図22、図24および図25のフローチャート図を用いて以下説明する。図22は、本実施形態のカメラ303で撮影した画像がディスプレイ306に表示する他の例、図25は、本実施形態の判定部324の動作を示すフローチャート図である。
【0061】
判定部324は、候補リスト128中の候補データ425−1〜iから確信度424が最も大きい候補データ425−n検索する(365)。注目単語382上にマーカ381が設定されていたか判定する(361)。注目単語382上にマーカ381がある場合は、単語リンク情報125の単語リンクデータ235−1〜eより、候補データ425−nのページ番号210、行番号211、列番号233と一致する、単語リンクデータ235−mを検索する(362)。つぎに、注目単語382と単語リンクデータ235−mの単語230を照合する(363)。一致した場合は、単語リンクデータ235−mのリンク先URL223を出力する(364)。一致しない場合は、および注目単語382の判定(361)で図22に示すようにマーカ381と注目単語382がずれている場合は、行リンク情報124の行リンクデータ222−1〜bより、候補データ425−nのページ番号210、行番号211が一致する行リンクデータ222−rを検索する(365)。検索されたリンク先URL223を出力する(364)。
【0062】
本発明の実施形態では、判定部は、単語リンク情報125と行リンク情報124を用いて単語単位あるいは行単位のリンク先URL223の検索を行ったが、文リンク情報590から文単位のリンク先URL223を検索することも可能である。文単位のリンク先URL223の検索は、まず最初に注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233を単語情報123から取得する。次に取得したページ番号210と同一であり、かつ、行番号211が文字の始点の行番号273と終点の行番号271以内であり、かつ、列番号233が文字の始点の列番号274と終点の列番号272以内である文リンク情報590中のリンク先URL223を出力する。文のリンク情報としてリンク先URLとしたが、例えば日本語の文は英訳文を、英語の文は和訳を情報として出力することも可能である。
【0063】
携帯端末装置300のハードウェア構成を、図17を用いて説明する。図17は、本実施形態の携帯端末装置300のハードウェア構成図の例である。図1と図17の各ブロックの対応を説明する。入力装置20は,入力キー710に対応する。撮影装置23は,カメラ303に対応する。表示装置22は,ディスプレイ716に対応する。通信装置25は,通信回路713に対応する。文字選択装置21と文字認識装置24は,文字認識プログラム820に対応する。
【0064】
図17において、入力キー710は、検索対象の文書選択やカメラ設定を行う。通信回路713は、サーバ装置320の通信回路714とネットワーク36を介して接続し、カメラ303で撮影した画像中から文字認識にて得た文字列の送信と、文字列に関連した情報の受信を行う。ディスプレイ716は、カメラで撮影する画像の表示や文書選択を行う。文字認識プログラム820は、携帯端末装置300の動作を行うプログラムである。データメモリ801は、文書選択情報127と単語照合辞書307を格記憶する。
【0065】
サーバ装置320のハードウェア構成を、図18を用いて説明する。図18は、本実施形態のサーバ装置320のハードウェア構成図の例である。図1と図18の各ブロックの対応を説明する。通信装置30は,通信回路714に対応する。通信回路33は,第2の通信回路715に対応する。位置検索装置34と情報検索装置31は,文書検索プログラム840に対応する。記憶装置32は,データメモリ801に対応する。
【0066】
図18において、第2の通信回路715は、文書登録装置10とネットワーク26を介して接続し、文書登録装置10のデータメモリ801に記憶したデータを受信し、サーバ装置320のデータメモリ801に格納する。文書検索プログラム840は、サーバ装置320の動作を行うプログラムである。データメモリ801は、受信した、文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、単語情報123と、候補リスト128を記憶する。
【0067】
携帯端末装置300のディスプレイ716に表示される画面の遷移を、以下図19を用いて詳細に説明する。図19は、本実施形態のディスプレイ306に表示する画面遷移図の例である。以下ボタンは、入力キー710により選択される。また戻るボタン913の選択により前画面を表示する。文字認識プログラム820は、起動するとディスプレイ716に文書選択画面900を表示する。文書選択画面900は、利用可能な文書を文書選択情報127から読み出し、文書リスト901に表示する。利用者は、文書リスト901に利用する文書が表示されていない場合、追加ボタン902を選択することにより文書追加画面910を表示する。また、文書選択情報127から不要な文書情報を削除したい場合は、文書リスト901から削除する文書を選択し削除ボタン903を選択することにより文書選択情報127から該当する文書情報を削除する。検索を実行したい場合は、文書リスト901から文書を選択し選択ボタン904を選択することにより、文書確認画面930を表示する。文書追加画面910は、文書一覧911に、文書情報120に登録されている文書の一覧を表示し、文書一覧911から文書選択情報127に追加したい文書を選択し詳細ボタン912を選択することにより文書詳細画面920を表示する。文書詳細画面920は、選択した文書の詳細情報を詳細表示921に表示する。
【0068】
利用者は、タイトルや課金情報などを確認して登録ボタン922を選択することにより、文書選択情報127に選択した文書の文書情報を追加する。文書確認画面930は、詳細表示931に選択した文書の詳細情報を表示し、利用者は、タイトルや課金情報などを確認して、問題がなければ確認ボタン932を選択することにより撮影画面940を表示する。撮影画面940は、撮影する画像を表示画像380に表示し、利用者がマーカ381を検索したい文字に合わせ、検索ボタン943を選択することにより検索を実行し、検索が完了すると確認画面950を表示する。確認画面950は、リンク情報表示951に検索したリンク先URL223を表示する。利用者は、検索結果に誤りがなければ表示ボタン952を選択し、ブラウザ960を表示する。ブラウザ960は、リンク先URL223の情報を表示する。
【0069】
携帯端末装置300とサーバ装置320において、単語照合の別の方法について図26のブロック図を図27のフローチャート図を用いて詳細に説明する。図26は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すブロック図、図27は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すフローチャート図である。
【0070】
携帯端末装置300は、あらかじめ第1の単語照合辞書501を備える。第2の単語照合辞書506は、単語照合辞書122と第1の単語照合辞書501との差で作成される。文書の選択(340)により、選択した文書に対応する第2の単語照合辞書501をデータメモリ801にロードする(521)。カメラ303から入力した画像は、文字認識部304で文字認識し文字候補を出力する(343)。第1の単語照合部500は、第1の単語照合辞書501を利用して文字候補から単語を照合し(514)、第1の単語照合辞書501に登録された単語と文字候補が一致するか判定する(515)。第1の単語照合辞書501の単語と一致した場合は、単語をサーバ装置320の検索部323に送信し、検索部323は、単語の文書中の位置の検索を行う(354)。一致しない場合は、サーバ装置320の第2の単語照合部505で第2の単語照合辞書506を利用して単語を照合する(522)。本発明の実施形態では、第2の単語照合辞書506をサーバ装置320に持つ例を示したが、携帯端末装置300にダウンロードし、携帯端末300側で第1の単語照合辞書501と第2の単語照合辞書506を利用して単語照合部322で単語照合を行うことも可能である。
【0071】
次に文字認識部304と認識設定部302の動作の詳細を、図30と図31を用いて以下説明する。図30は、本実施形態の文字認識部304と認識設定部302の動作を示す図の例、図31は、本実施形態の文書属性情報121の例である。文書属性情報121は、複数の文書属性73−1〜73−jにより構成され、文書属性73−1〜73−jは、文書番号200、二値化モード70、文字方向71、文字コード72により構成する。
【0072】
認識設定部302は、サーバ装置320から受信した文書属性情報121から、選択した文書の文書番号200に対応する二値化モード70の値により、二値化処理部51の第1の画像二値化処理60と第2の画像二値化処理61を切り換える。また、文字方向71の値により、文字行切り出し部52の縦書き処理部62と横書き処理部63を切り換える。また、文字コード72の値により、識別部64が識別辞書65中の文字コード72で指定した文字コードの特徴量と比較するように設定する。なお、識別処理部55において、識別部64は、特徴抽出部54の文字ごとの特徴量と、識別辞書65に登録されている全ての文字コードの特徴量とを比較する。判定部66は、比較の差が小さい順に文字コードを出力する。
【0073】
本発明の文書情報検索システムの利用形態を、以下図35を用いて詳細に説明する。図35は、本実施形態の文書情報登録システムを運用するためのシステム利用形態の例である。出版社956は、発行する文書の著者から原稿受け取り、キーボード950よりDTP951に入力し編集を行う。DTP951は、原稿の校正のためPDFファイル952に出力し、プリンタ953で校正用原稿954を出力する。校正が終了した原稿は、DTP951から出版用印刷データ955を出力し、印刷機956にて販売用の書籍957を印刷する。文書登録装置10は、校正のため出力するPDFファイル952を入力し、文書に関連情報を付加した検索用DBを作成する。作成したDBは、ネットワーク26を経由して、コンテンツプロバイダ958のサーバ装置300に転送する。利用者は、出版した書籍957を購入し、携帯端末装置320を使用して書籍957の一部画像を撮影する。携帯端末装置320は、画像中から認識した文字列を、ネットワーク36を経由してサーバ装置300に転送する。サーバ装置300は、検索用DBから文字列に関連した情報を検索する。検索した情報は、携帯端末装置300に表示する。
【0074】
また、出版社960は、既に出版されている書籍957を、スキャナ961から各ページを画像として入力する。OCR962は、各ページの画像から文字を認識するとともに文字画像の位置も検出する。構造化958は、文字と文字位置からPDFファイル952を作成する。文書登録装置10は、PDFファイル952を入力して、文書に関連情報を付加した検索用DBを作成する。
【0075】
以上で説明した、PDAファイルから検索用DBを作成する手順は、もちろん出版社以外の第三者が請け負ってもよい。
本発明の実施形態では、文書に関連する情報としてURLを想定したが、URLの他に、直接文字、音、画像といった情報を直接送ることももちろん可能である。
【0076】
日本語文書を対象としているが、もちろん英文など各国語にも適応することは容易である。例えば英文やハングル語などは単語がスペースで区切られているため、形態素解析を行うことなく容易に単語単位に切り出すことが可能であり、また注目単語の上下行の単語に加え、注目単語の左右の単語を利用して注目単語の位置を検索することも可能である。
【0077】
実施例では、携帯端末装置とサーバ装置で分けたが処理の分担を制限することはない。例えば、単語照合を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、例えば、文字認識を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、サーバ装置と携帯端末装置に分けたが、サーバ装置の動作と携帯端末の動作が同一装置内で実行することも可能である。
【0078】
実施例では、携帯端末装置320のプログラムメモリ800に文字認識プログラム820があらかじめ記憶されていたが、サーバから文字認識プログラム820をダウンロードして実行することも可能である。また、実施例では検索対象の文書を選択したが検索対象の文書にあわせて文書に対応した文字認識プログラム820をダウンロードすることも可能である。
【0079】
実施例では、単語位置検索に注目単語382、上単語383、下単語383の3単語を使ったが、、検索に利用する単語の数を制限するものではない。
実施例では、電子ファイルから入力したが例えば既に印刷した文書をOCRを利用して文字および文字位置を取得することも可能である。
【0080】
実施例では、リンク先URL223の設定を行または単語単位としたが、文単位にリンク先URLを設定することも可能である。例えば図28に示すように、文の開始の行番号211と列番号233、および文の終了の行番号271と列番号272に体操してリンク先URL223を記憶することにより、検索した単語が設定した文と開始と終了内にあれば、該当するリンク先URL223を出力することも可能である。これにより、例えば日本語文章であれば英訳文や英語の文書なら和訳を情報とすることももちろん可能である。
【図面の簡単な説明】
【0081】
【図1】本実施形態の全体構成図の例。
【図2】本実施形態の文書登録装置の動作を示すブロック図の例。
【図3】本実施形態の文書登録装置の動作を示すフローチャート図。
【図4】本実施形態の文書登録装置のハードウェア構成図の例。
【図5】本実施形態で入力される文書ファイルの例。
【図6】本実施形態のディスプレイ703に表示される画面の例。
【図7】本実施形態のディスプレイ703に表示される他の画面の例。
【図8】本実施形態の文書情報120の例。
【図9】本実施形態の文字情報126の例。
【図10】本実施形態の単語情報123の例。
【図11】本実施形態の行リンク情報124の例。
【図12】本実施形態の単語リンク情報125の例。
【図13】本実施形態のリンク先登録部111が作成するデータの例。
【図14】本実施形態のリンク先登録部111の動作を示すフローチャート図。
【図15】本実施形態の携帯端末装置300とサーバ装置320の動作を示すブロック図の例。
【図16】本実施形態の携帯端末装置300とサーバ装置320の動作を示すフローチャート図。
【図17】本実施形態の携帯端末装置300のハードウェア構成図の例。
【図18】本実施形態のサーバ装置320のハードウェア構成図の例。
【図19】本実施形態のディスプレイ716に表示される画面遷移図の例。
【図20】本実施形態の印刷された文書の例。
【図21】本実施形態のカメラ303で撮影した画像がディスプレイ716に表示される例。
【図22】本実施形態のカメラ303で撮影した画像がディスプレイ716に表示される他の例。
【図23】本実施形態の検索部323の動作を示すフローチャート図。
【図24】本実施形態の候補リスト128の例。
【図25】本実施形態の判定部324の動作を示すフローチャート図。
【図26】本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すブロック図。
【図27】本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すフローチャート図。
【図28】本実施形態の文字情報126の作成手順を示すフローチャート図。
【図29】本実施形態の文情報580の作成手順示すフローチャート図。
【図30】本実施形態の文情報580の例。
【図31】本実施形態の文リンク情報590の例。
【図32】本実施形態の文字認識処理の例。
【図33】本実施形態の文字認識部304と認識設定部302の動作を示す図の例。
【図34】本実施形態の文書属性情報121の例。
【図35】本実施形態の文書情報登録システムを運用するためのシステム利用形態の例。
【符号の説明】
【0082】
10 文書登録装置、20 入力装置、21 文書選択装置、22 表示装置、23 撮影装置、24 文字認識装置、25 通信装置、26 ネットワーク、
30 通信装置、31 情報検索装置、32 記憶装置、33 通信装置、34 位置検索装置、36 ネットワーク、
41 文書入力装置、42 解析装置、43 登録装置、44 記憶装置、45 入力装置、46 通信装置、
300 サーバ装置、320 携帯端末装置。
【特許請求の範囲】
【請求項1】
文書の一部である画像に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行うための情報検索システムであって、
該情報検索の対象である文書を記述した文書ファイルを入力し、文書中の文字列を抽出する文字列抽出手段と、前記文字列の前記文書中の位置を示す位置情報を登録する位置登録手段と、前記文字列に関連した情報を示す関連情報を登録する情報登録手段と、前記位置情報と前記関連情報を記憶する記憶手段とを備える文書登録装置と、
該文書登録装置と接続され、前記記憶手段とデータを共有する第2の記憶手段と、端末から入力される注目文字列及びその周辺文字列の情報に基づいて前記関連情報から前記注目文字列を含む前記構成要素に関連した情報を検索する情報検索手段と、前記検索手段に検索した情報を出力する出力手段を備える文書情報検索装置とを有することを特徴とする文書情報検索システム。
【請求項2】
請求項1記載の文書情報検索システムにおいて、前記文字列抽出手段は、文書の文書構造を記述した文書ファイルを入力し、文書構造を解析し、ページ構造、文字幅、文字間隔、始点座標、などのパラメータを抽出するパラメータ抽出手段と、前記パラメータから文字ごとに文字の始点座標を算出する座標算出手段と、前記始点座標からベースラインが同一の始点座標を持つ文字を文字列として出力することを特徴とする文書情報検索システム。
【請求項3】
請求項2記載の文書情報検索システムにおいて、前記文字列抽出手段は、前記行の文字列を形態素に分割する形態素解析手段を設け、前記形態素を文字列を出力することを特徴とする文書情報検索システム。
【請求項4】
請求項3記載の文書情報検索システムにおいて、前記形態素解析手段は、前記形態素から不要な形態素を除去した形態素を文字列を出力することを特徴とする文書情報検索システム。
【請求項5】
請求項3記載の文書情報検索システムにおいて、前記文字列抽出手段は、前記形態素を構成する文字列を分割、または隣り合う形態素を構成する文字列を合成した文字列を出力することを特徴とする文書情報検索システム。
【請求項6】
請求項2記載の文書情報検索システムにおいて、前記パラメータ抽出手段は、書体、字体、文字サイズのパラメータを抽出し、前記パラメータから見出しを抽出する見出し抽出手段と、前記行の文字列中の句点を判別し、文を抽出する文抽出手段を設け、前記見出しおよび前記文を文字列とし、前記位置登録手段は、前記文字列の前記文書中の位置を登録し、前記情報登録手段は、前記文字列に関連する情報を登録することを特徴とする文書情報検索システム。
【請求項7】
請求項1記載の文書情報検索システムにおいて、前記文書登録装置は、前記文書ファイルから行間隔および文字方向、または文字間隔を抽出する属性設定手段を設け、前記属性情報を、前記情報検索の際の文字列認識のための文字行切り出しにおいて参照するために前記記憶手段に記憶することを特徴とする文書情報検索システム。
【請求項8】
請求項1記載の文書情報検索システムにおいて、前記文書登録装置は、前記文書ファイルから前記文書ファイルで使用されている文字コードを抽出する属性設定手段を設け、前記属性情報を、前記情報検索の際の文字列認識のための文字認識において参照するために前記記憶手段に記憶するとともに、前記識別手段は、前記属性情報の前記文字コードに含まれている文字コードのみを出力することを特徴とする文書情報検索システム。
【請求項9】
請求項3記載の文書情報検索システムにおいて、前記文書登録装置は、全ての登録される前記文字列を使って単語照合辞書を作成する照合辞書作成手段を設け、前記記憶手段は前記単語照合辞書を記憶することを特徴とする文書情報検索システム。
【請求項10】
請求項9記載の文書情報検索システムにおいて、特定の文字列で作成した第1の単語照合辞書を備え、前記照合辞書作成手段は、登録する文書から抽出した前記文字列と、第1の単語照合辞書に登録されている文字列との差分の文字列から第2の単語照合辞書を作成し、前記単語照合手段は、第1の単語照合辞書を利用する第1の単語照合手段と、第2の単語照合辞書を利用する第2の単語照合手段からなり、前記第1の単語照合手段にて前記第1の単語照合辞書に登録した文字列が検索されない場合、前記第2の単語照合手段にて前記第2の単語照合辞書を利用して文字列を出力することを特徴とする文書情報検索システム。
【請求項11】
請求項1記載の文書情報検索システムにおいて、登録した文書毎に前記記憶手段に記憶した前記関連情報、前記位置情報、前記属性情報、前記単語照合辞書を選択する文書選択手段を設けることを特徴とする文書情報検索システム。
【請求項12】
請求項2記載の文書情報検索システムにおいて、前記関連情報は、文書中の構成要素が含む文字が少ない順に、前記構成要素を行単位に展開して前記記憶手段に登録し、前記情報検索手段は、行単位に前記注目文字列を含む行の前記関連情報を検索することを特徴とする文書情報検索システム。
【請求項13】
文書の一部に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行う情報検索システムのための文書登録装置であって、
該情報検索の対象である文書を記述した文書ファイルを入力し、文書中の文字列を抽出する文字列抽出手段と、前記文字列の前記文書中の位置を示す位置情報を登録する位置登録手段と、前記文字列に関連した情報を示す関連情報を登録する情報登録手段と、前記位置情報と前記関連情報を記憶する記憶手段とを備えることを特徴とする文書登録装置。
【請求項14】
文書の一部に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行う情報検索システムのための文書登録方法であって、
入力部における、
該情報検索の対象である文書を記述した文書ファイルの入力を受ける文書ファイル入力ステップと、
処理部における、
該文書中の文字列を抽出する文字列抽出ステップと、
前記文字列の前記文書中の位置を示す位置情報を登録する位置登録ステップと、
前記文字列に関連した情報を示す関連情報を記憶装置に登録する情報登録ステップとを有することを特徴とする文書登録方法。
【請求項1】
文書の一部である画像に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行うための情報検索システムであって、
該情報検索の対象である文書を記述した文書ファイルを入力し、文書中の文字列を抽出する文字列抽出手段と、前記文字列の前記文書中の位置を示す位置情報を登録する位置登録手段と、前記文字列に関連した情報を示す関連情報を登録する情報登録手段と、前記位置情報と前記関連情報を記憶する記憶手段とを備える文書登録装置と、
該文書登録装置と接続され、前記記憶手段とデータを共有する第2の記憶手段と、端末から入力される注目文字列及びその周辺文字列の情報に基づいて前記関連情報から前記注目文字列を含む前記構成要素に関連した情報を検索する情報検索手段と、前記検索手段に検索した情報を出力する出力手段を備える文書情報検索装置とを有することを特徴とする文書情報検索システム。
【請求項2】
請求項1記載の文書情報検索システムにおいて、前記文字列抽出手段は、文書の文書構造を記述した文書ファイルを入力し、文書構造を解析し、ページ構造、文字幅、文字間隔、始点座標、などのパラメータを抽出するパラメータ抽出手段と、前記パラメータから文字ごとに文字の始点座標を算出する座標算出手段と、前記始点座標からベースラインが同一の始点座標を持つ文字を文字列として出力することを特徴とする文書情報検索システム。
【請求項3】
請求項2記載の文書情報検索システムにおいて、前記文字列抽出手段は、前記行の文字列を形態素に分割する形態素解析手段を設け、前記形態素を文字列を出力することを特徴とする文書情報検索システム。
【請求項4】
請求項3記載の文書情報検索システムにおいて、前記形態素解析手段は、前記形態素から不要な形態素を除去した形態素を文字列を出力することを特徴とする文書情報検索システム。
【請求項5】
請求項3記載の文書情報検索システムにおいて、前記文字列抽出手段は、前記形態素を構成する文字列を分割、または隣り合う形態素を構成する文字列を合成した文字列を出力することを特徴とする文書情報検索システム。
【請求項6】
請求項2記載の文書情報検索システムにおいて、前記パラメータ抽出手段は、書体、字体、文字サイズのパラメータを抽出し、前記パラメータから見出しを抽出する見出し抽出手段と、前記行の文字列中の句点を判別し、文を抽出する文抽出手段を設け、前記見出しおよび前記文を文字列とし、前記位置登録手段は、前記文字列の前記文書中の位置を登録し、前記情報登録手段は、前記文字列に関連する情報を登録することを特徴とする文書情報検索システム。
【請求項7】
請求項1記載の文書情報検索システムにおいて、前記文書登録装置は、前記文書ファイルから行間隔および文字方向、または文字間隔を抽出する属性設定手段を設け、前記属性情報を、前記情報検索の際の文字列認識のための文字行切り出しにおいて参照するために前記記憶手段に記憶することを特徴とする文書情報検索システム。
【請求項8】
請求項1記載の文書情報検索システムにおいて、前記文書登録装置は、前記文書ファイルから前記文書ファイルで使用されている文字コードを抽出する属性設定手段を設け、前記属性情報を、前記情報検索の際の文字列認識のための文字認識において参照するために前記記憶手段に記憶するとともに、前記識別手段は、前記属性情報の前記文字コードに含まれている文字コードのみを出力することを特徴とする文書情報検索システム。
【請求項9】
請求項3記載の文書情報検索システムにおいて、前記文書登録装置は、全ての登録される前記文字列を使って単語照合辞書を作成する照合辞書作成手段を設け、前記記憶手段は前記単語照合辞書を記憶することを特徴とする文書情報検索システム。
【請求項10】
請求項9記載の文書情報検索システムにおいて、特定の文字列で作成した第1の単語照合辞書を備え、前記照合辞書作成手段は、登録する文書から抽出した前記文字列と、第1の単語照合辞書に登録されている文字列との差分の文字列から第2の単語照合辞書を作成し、前記単語照合手段は、第1の単語照合辞書を利用する第1の単語照合手段と、第2の単語照合辞書を利用する第2の単語照合手段からなり、前記第1の単語照合手段にて前記第1の単語照合辞書に登録した文字列が検索されない場合、前記第2の単語照合手段にて前記第2の単語照合辞書を利用して文字列を出力することを特徴とする文書情報検索システム。
【請求項11】
請求項1記載の文書情報検索システムにおいて、登録した文書毎に前記記憶手段に記憶した前記関連情報、前記位置情報、前記属性情報、前記単語照合辞書を選択する文書選択手段を設けることを特徴とする文書情報検索システム。
【請求項12】
請求項2記載の文書情報検索システムにおいて、前記関連情報は、文書中の構成要素が含む文字が少ない順に、前記構成要素を行単位に展開して前記記憶手段に登録し、前記情報検索手段は、行単位に前記注目文字列を含む行の前記関連情報を検索することを特徴とする文書情報検索システム。
【請求項13】
文書の一部に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行う情報検索システムのための文書登録装置であって、
該情報検索の対象である文書を記述した文書ファイルを入力し、文書中の文字列を抽出する文字列抽出手段と、前記文字列の前記文書中の位置を示す位置情報を登録する位置登録手段と、前記文字列に関連した情報を示す関連情報を登録する情報登録手段と、前記位置情報と前記関連情報を記憶する記憶手段とを備えることを特徴とする文書登録装置。
【請求項14】
文書の一部に含まれる注目文字列と該注目文字列の周辺の文字列を用いて情報検索を行う情報検索システムのための文書登録方法であって、
入力部における、
該情報検索の対象である文書を記述した文書ファイルの入力を受ける文書ファイル入力ステップと、
処理部における、
該文書中の文字列を抽出する文字列抽出ステップと、
前記文字列の前記文書中の位置を示す位置情報を登録する位置登録ステップと、
前記文字列に関連した情報を示す関連情報を記憶装置に登録する情報登録ステップとを有することを特徴とする文書登録方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【公開番号】特開2006−146627(P2006−146627A)
【公開日】平成18年6月8日(2006.6.8)
【国際特許分類】
【出願番号】特願2004−336856(P2004−336856)
【出願日】平成16年11月22日(2004.11.22)
【出願人】(504373093)日立オムロンターミナルソリューションズ株式会社 (1,225)
【Fターム(参考)】
【公開日】平成18年6月8日(2006.6.8)
【国際特許分類】
【出願日】平成16年11月22日(2004.11.22)
【出願人】(504373093)日立オムロンターミナルソリューションズ株式会社 (1,225)
【Fターム(参考)】
[ Back to top ]