画像処理装置、画像処理方法、プログラム、記録媒体
【課題】文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにする。
【解決手段】印刷物におけるキーワードの表示形式受付手段と、キーワード受付手段と、書類の画像データを取得する取得手段と、取得された画像データ上の文字列を抽出する抽出手段と、抽出文字列からキーワードを検索する検索手段と、検索の結果検索ヒットした場合、検索ヒットしたページ情報とキーワードの画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、記憶された配置位置情報を用いて取得された書類の画像データにおけるキーワードを含む画像領域を表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と置換手段により表示形式が置き換えられた書類の画像データと記憶されたページ情報とを印刷する印刷手段とを有する。
【解決手段】印刷物におけるキーワードの表示形式受付手段と、キーワード受付手段と、書類の画像データを取得する取得手段と、取得された画像データ上の文字列を抽出する抽出手段と、抽出文字列からキーワードを検索する検索手段と、検索の結果検索ヒットした場合、検索ヒットしたページ情報とキーワードの画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、記憶された配置位置情報を用いて取得された書類の画像データにおけるキーワードを含む画像領域を表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と置換手段により表示形式が置き換えられた書類の画像データと記憶されたページ情報とを印刷する印刷手段とを有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書の中からキーワードを含むページ情報を表示し、所望の情報を容易に探すことを可能とする技術に関するものである。
【背景技術】
【0002】
会議資料の作成、顧客への提案資料、講演会の資料、学校に提出する宿題のレポートなど、何らかの資料を作成する際に、ある特定のキーワードを基にして調査することが多い。
【0003】
例えば、ある製品についての調査レポートを作成する場合、インターネットの検索エンジンなどに、当該製品の名称を入力して検索をかける。電子データの情報(例えば製品カタログ)から探す場合も同様に、アプリケーションのキーワード検索を用いて、自分の探している文言が記述されている部分を探すことを行う。
【0004】
しかし、会議の議事録、製品のマニュアル、雑誌、新聞、手書きのノートなど、紙媒体の資料から情報を探す場合、便利な検索機能など無く、手作業で一枚一枚ページをめくり、記述内容を読んで情報を探す必要がある。この作業には膨大な手間と時間を要し、情報の検索という点では非常に非効率である。
【0005】
膨大な情報の中から、自分の目的とする情報だけを抜き出すことは、非常に困難であり、情報を見逃し、探し漏らしてしまう危険性もある。
【0006】
更に、探し出した情報を活用するには、該当部分を印刷する等して抜き出す必要があることもある。この作業を人手で実施すれば、当然こちらにも相当な時間が掛かり、抜き出し漏れが発生する危険性がある。
【0007】
このような問題を防ぐためには、目的とする情報が資料のどこにあるかが、簡単に検索でき、分かり易くまとめられる工夫が必要である。
【0008】
特許文献1に記載の発明は、HDD等に蓄積している文書の中からキーワードを含む文書を検索し、それらを縮小させて文書の一覧を印刷する。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開平07−085239
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1のシステムでは、1つの文書の中に知りたいキーワードが大量にある場合には、どのページのどの部分にキーワードが記載されているのかや、キーワード付近にどのような文章が記載されているのかを短時間に判断することは困難である。
【0011】
本発明は上記の課題を解決するためになされたものであり、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることを目的とする。
【0012】
更に別の目的として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることを目的とする。
【課題を解決するための手段】
【0013】
本願発明は、書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置であって、前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段と、前記キーワードの指定を受け付けるキーワード受付手段と、前記書類の画像データを取得する取得手段と、前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段と、前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段と、前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と、前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段とを有することを特徴とする。
【発明の効果】
【0014】
本発明によれば、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることが可能となる。
【0015】
更に別の効果として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることが可能となる。
【図面の簡単な説明】
【0016】
【図1】システム構成図である。
【図2】画像処理装置のハードウェア構成図である。
【図3】出力形式の登録処理の流れを示すフローチャートである。
【図4】画像処理装置に表示される初期メニュー画面を示す図である。
【図5】画像処理装置に表示されるキーワード検索・印刷メニュー画面を示す図である。
【図6】画像処理装置に表示されるハイライト表示形式選択画面(カラー機、モノクロ機)を示す図である。
【図7】画像処理装置に表示されるキーワード前後テキスト抽出選択画面を示す図である。
【図8】画像処理装置に表示される出力形式選択画面を示す図である。
【図9】画像処理装置に表示される検索結果表示画面を示す図である。
【図10】検索設定テーブルの一例を示す図である。
【図11】検索結果テーブルの一例を示す図である。
【図12】印刷物の出力処理の流れを示すフローチャートである。
【図13】印刷物の例を示す図である。
【発明を実施するための形態】
【0017】
図1は、本発明の情報処理システムのシステム構成の一例を示す図である。
【0018】
図1に示す通り、複合機101、サーバ102、103、クライアントPC104−1、104−2(以下まとめて「クライアントPC104」とする)、等を備えて構成されている。LAN105は上記した各装置を相互に通信可能に接続するためのネットワークである。
【0019】
複合機101は、本発明の画像処理装置として機能する装置であり、クライアントPC104で作成され、不図示の印刷データ管理サーバに登録されている印刷データや、スキャン機能を用いて作成された記憶装置に記憶されている電子画像データ、外部のFAX装置から受信したFAXデータを印刷する印刷機能、FAX送信機能、コピー機能、スキャンしたデータをクライアントPC104の所定のディレクトリに送信する送信機能等を有している。
【0020】
サーバ102、103は、スキャン機能を用いて作成された電子画像データ等を蓄積している。
【0021】
クライアントPC104は、ユーザからの印刷指示を受け付けることで印刷データを作成し、不図示の印刷データ管理サーバに蓄積させるべく、当該印刷データを送信する機能や、複合機101に当該印刷データを蓄積させるべく当該印刷データを送信する機能、複合機101から送られた電子画像データを指定されたフォルダに記憶する機能を備えている。
【0022】
以上が、本発明の情報処理システムのシステム構成の一例の説明である。
【0023】
図2は、図1の複合機101のハードウェア構成の一例を示す図である。
【0024】
図2において、216はコントローラユニットで、画像入力デバイスとして機能するスキャナ214や、画像出力デバイスとして機能するプリンタ部212と接続する一方、LAN(例えば、図1に示したLAN105)や公衆回線(WAN)(例えば、PSTNまたはISDN等)と接続することで、電子画像データやデバイス情報の入出力を行う。
【0025】
コントローラユニット216において、201はCPUで、システム全体を制御するプロセッサである。202はRAMで、CPU201が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。
【0026】
203はROMで、システムのブートプログラムや各種制御プログラムが格納されている。204はハードディスクドライブ(HDD)で、システムを制御するための各種プログラム,画像データ等を格納する。
【0027】
207は操作部インタフェース(操作部I/F)で、操作部208とのインタフェース部である。また、操作部I/F207は、操作部208から入力したキー情報(例えば、スタートボタンの押下)をCPU201に伝える役割をする。
【0028】
205はネットワークインタフェース(ネットワークI/F)で、LAN105等のネットワークに接続し、データの入出力を行う。206はモデムで、公衆回線に接続し、FAXの送受信等のデータの入出力を行う。
【0029】
218は外部インタフェース(外部I/F)で、USB、IEEE1394、プリンタポート、RS−232C等の外部入力を受け付けるI/F部であり、本実施形態においてはユーザの認証を行う際に必要となる非接触ICカード(記憶媒体)の読み取り用のカードリーダ219が外部I/F部218に接続されている。そして、CPU201は、この外部I/F218を介してカードリーダ219によるICカードからの情報読み取りを制御し、該ICカードから読み取られた情報を取得可能である。以上のデバイスがシステムバス209上に配置される。
【0030】
220はイメージバスインタフェース(イメージバスI/F)であり、システムバス209と画像データを高速で転送する画像バス215とを接続し、データ構造を変換するバスブリッジである。画像バス215は、PCIバスまたはIEEE1394で構成される。画像バス215上には以下のデバイスが配置される。
【0031】
210はラスタイメージプロセッサ(RIP)で、例えば、PDLコード等のベクトルデータをビットマップイメージに展開する。211はプリンタインタフェース(プリンタI/F)で、プリンタ部212とコントローラユニット216を接続し、画像データの同期系/非同期系の変換を行う。また、213はスキャナインタフェース(スキャナI/F)で、スキャナ214とコントローラユニット216を接続し、画像データの同期系/非同期系の変換を行う。
【0032】
217は画像処理部で、入力画像データに対し補正、加工、編集を行ったり、プリント出力画像データに対して、プリンタの補正、解像度変換等を行ったりする。また、これに加えて、画像処理部217は、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。そして、この画像処理部217は、スキャナ部214を駆動して画像読み取りされた画像データを画像処理して、ファイル出力可能な形式(例えば、PDF形式ファイル)に変換し、CPU201と連携して、ネットワークI/F205を介して、クライアントPC104等の外部装置に画像データファイルを送信することができる。
【0033】
スキャナ214は、原稿(書類)となる紙上の画像を照明し、CCDラインセンサで走査することで、ラスタイメージデータとして電気信号に変換する。原稿用紙は原稿フィーダのトレイにセットし、装置使用者が操作部208から読み取り起動指示することにより、CPU301がスキャナ214に指示を与え、フィーダは原稿用紙を1枚ずつフィードし原稿画像の読み取り動作を行う。
【0034】
プリンタ212は、ラスタイメージデータを用紙上の画像に変換する部分であり、その方式は感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式等があるが、どの方式でも構わない。プリント動作の起動は、CPU201からの指示によって開始する。なお、プリンタ212には、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセットがある。
【0035】
操作部208は、LCD表示部を有し、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報を操作部I/F207を介してCPU201に伝える。また、操作部208は、各種操作キーとして、例えば、スタートキー、ストップキー、テンキー、IDキー、リセットキー等を備える。
【0036】
ここで、操作部208のスタートキーは、原稿画像の読み取り動作を開始する時などに用いる。スタートキーの中央部には、緑と赤の2色LEDがあり、その色によってスタートキーが使える状態にあるかどうかを示す。また、操作部208のストップキーは、稼働中の動作を止める働きをする。また、操作部208のIDキーは、使用者のユーザIDを入力する時、ログインユーザのログオフを行う時に用いる。リセットキーは、操作部からの設定を初期化する時に用いる。
【0037】
カードリーダ219は、CPU201からの制御により、非接触ICカードに記憶されている情報を読み取り、該読み取った情報を外部I/F218を介してCPU201へ通知する。
【0038】
以上のような構成によって、複合機101は、スキャナ214で原稿を読み込むことで作成した電子画像データをLAN105上に送信したり、LAN105を介して受信した印刷データをプリンタ212により印刷出力したりすることができる。
【0039】
また、スキャナ214で原稿を読み込むことで作成された電子画像データをモデム206により、公衆回線上にFAX送信したり、公衆回線からFAX受信したFAXデータをプリンタ212により出力したりすることができる。
【0040】
以上が、図1の複合機101のハードウェア構成の一例の説明である。なお、複合機101のハードウェア構成は図2に示した構成を有するとして説明するが、必ずしも同図の構成を有することに限定するものではなく、複合機101が行う処理として説明する以下の処理が実行可能な構成であれば、複合機101の構成は適宜変形しても良い。
図3は、出力形式の登録処理の流れを示すフローチャートである。この処理は、画像処理装置(複合機101)において実行される。
【0041】
301において、画像処理装置は、設定機能を起動する。例えば、ユーザにより電源ONボタンが押されたり、IDカード認証が行われたりした場合に図4に示すメニューを起動する。
【0042】
図4は、メニュー画面401の一例を示す。「コピー」402、「送信」、「ボックス」403、「キーワード検索・印刷」404のそれぞれのボタンが表示画面に表示される。ユーザはタッチパネルを押すことにより選択可能である。「コピー」402、「送信」、「ボックス」403は、従来の機能である。
【0043】
本実施の形態の説明として、ユーザにより「キーワード検索・印刷」404ボタンが押下されたものとして以下説明する。
【0044】
302において、画像処理装置は、キーワード検索・印刷メニュー画面501を表示し、ユーザから入力される検索キーワードを受け付ける。具体的には、検索キーワード入力欄に入力され、ユーザにより入力ボタン502が押下された際に取得できるキーワードである。なお、画像処理装置は、検索キーワードを検索設定テーブル1001(図10)に記憶する。
【0045】
303において、画像処理装置は、ハイライト表示形式503ボタンが押されることにより、ハイライト表示形式が選択された場合、カラー機かどうかを判定する(304)。なお、ハイライト表示形式503ボタンが押されなかった場合は、この処理は行われない。
【0046】
画像処理装置は、カラー機の場合、図6に示すハイライト表示形式選択画面(カラー機)601を表示し(305)、モノクロ機の場合、図6に示すハイライト表示形式選択画面(モノクロ機)608を表示する(306)。
【0047】
ユーザは、任意の形式を選択することができる。
【0048】
カラー機の場合、ハイライトのカラーを「赤、青、緑、黄」602から選択することができる。その他、カラー文字反転603、斜体太字604、太字605から選択することができる。これによりキーワードの視認性が高くなり容易にキーワードみつけることができる。
【0049】
ユーザは、入力が終了した場合、OK606ボタンを押す。キャンセルする場合は、キャンセル607ボタンを押す。
【0050】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0051】
モノクロ機の場合は、カラー出力ができないためカラー機に比べて選択項目が少ない。画像処理装置は、カラー機同様入力された設定を検索設定テーブル1001(図10)に記憶する。
【0052】
307において、画像処理装置は、テキスト抽出表示設定504ボタンが押されることにより、図7に示すキーワード前後テキスト抽出選択画面701を表示する。なお、テキスト抽出表示設定504ボタンが押されなかった場合は、この処理は行われない。
【0053】
ユーザは、任意の選択することができる。
【0054】
キーワード前のテキスト抽出702をする場合、その抽出する文字数を入力する。キーワード後のテキスト抽出703をする場合、その抽出する文字数を入力する。これによりキーワードの前後の文字列を抽出することができるため内容の把握が容易となる。
【0055】
ユーザは、入力が終了した場合、OK703ボタンを押す。キャンセルする場合は、キャンセル704ボタンを押す。
【0056】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0057】
308において、画像処理装置は、出力形式505が押されることにより、図8に示す出力形式選択画面801を表示する。なお、出力形式505が押されなかった場合は、この処理は行われない。
【0058】
ユーザは、任意の選択することができる。
【0059】
「一覧表」を選択することができし(802)、「1 in 1」、「2 in 1」、「4 in 1」から選択することもできる(803)。また、テキスト表示するかしないかを選択することができる(804)。さらに片面出力か両面出力かを選択することもできる(805)。これによりユーザが所望する出力形式での出力が可能となる。特に「一覧表」、「n in 1」の設定および両面印刷の設定により、無駄な印刷を防ぐことにつながる。また、テキスト表示をすると文字の内容を読むことができるため、簡易に内容の把握をすることができる。
【0060】
ユーザは、入力が終了した場合、OK806ボタンを押す。キャンセルする場合は、キャンセル807ボタンを押す。
【0061】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0062】
図10は、検索設定テーブルである。このテーブルは、ユーザ毎もしくは画像処理装置毎の何れの単位で用意してもよい。また、複数のキーワードごとに設定可能である。それぞれユニークな番号により管理されている(1002)。
【0063】
項目としては、キーワード1003、ハイライト1004、文字抽出(前)1005、文字数1006、文字抽出(後)1007、文字数1008、出力1009、印刷面1010を有する。設定されない項目は「−」となる。
【0064】
以上、出力形式の登録処理の流れを説明した。
【0065】
次に、印刷物の出力処理の流れを説明する。
【0066】
図12は、印刷物の出力処理の流れを示すフローチャートである。この処理は、画像処理装置(複合機101)において実行される。
【0067】
なお、ここで出力する印刷物とは、スキャンした文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにするためのものである。
【0068】
また、この処理は、図3の登録処理が行われた後に実行されるものである。
【0069】
1201において、画像処理装置は、新たな検索を行うかを判定する。Yesの場合、1202へ進み、Noの場合、1204へ進む。具体的には、画像処理装置の原稿台に図5に示す操作画面を介して、ユーザによりスキャン開始ボタン506が押下されたかにより判定を行う。なお、既にスキャンが済みの原稿を対象とする場合は、ユーザは、スキャン済みのイメージから選択を行う。この選択は、不図示の操作画面から行うものとする。
【0070】
1202において、画像処理装置は、対象となる原稿をスキャンしてイメージデータを取得する。イメージデータは、PDF形式、JPEG形式等、どのような形式であってもよい。
【0071】
1203において、画像処理装置は、取得したイメージデータからテキストデータを生成する。具体的には、イメージデータに対してOCR処理をすることによりテキストデータを生成する。
【0072】
1204において、画像処理装置は、テキストデータに対して、キーワードの検索を実施する。
【0073】
1205において、画像処理装置は、該当するキーワードがテキストデータに存在するかを判定する。Yesの場合は、1206へ進み、Noの場合は、1214へ進む。
【0074】
1206において、画像処理装置は、スキャンしたイメージデータ上の該当文字列が配置される位置を記憶する。具体的には、文字の属性情報(フォントサイズ、フォントの種類など)、座標情報を用いて位置を記憶する。
【0075】
1207において、画像処理装置は、ハイライト文字列の画像を作成する。ハイライト文字列は、検索設定テーブルのハイライト1004の設定を反映させる(太字、斜体太字など)。また、イメージデータの文字の属性情報(フォントサイズ、フォント種別など)も用いる。なお、検索ヒットした文字列は、ページによって文字の属性情報が異なることがあるため、それぞれの文字の属性情報に応じた画像を作成する。
【0076】
1208において、画像処理装置は、スキャンしたイメージデータと、検索ヒットした文字列と、ハイライト文字列の画像とをそれぞれ対応づけてデータテーブルに登録する。ここで、複数のハイライト文字列の画像を作成した場合は、それぞれのハイライト文字列の画像は、どのページのどこの位置の文字列であるかを特定するための情報と紐付けて記憶しておく。また、検索ヒットした文字列は、キーワードを含む任意のNバイト分の文字列を検索結果として、図11に示す検索結果テーブルに登録する。No1102は、ユニークな番号を示し、文字列1103は、キーワードを含むNバイト分の文字列であり、ページNo1104は、そのキーワードがイメージデータの何ページ目に配置されているかを示すページ番号である。
【0077】
1209において、画像処理装置は、操作パネルに検索結果を表示する。具体例を図9の901に示す。この例では、0件となっているが、ヒットした場合、そのヒットした件数が表示される。また、検索結果テーブルを用いて、図9の906のように表示してもよい。この例では、No907には、検索結果テーブルのNo1102を、文字列909には、検索結果テーブルの文字列1103を、ページ910には、検索結果テーブルのページNo1104を表示する。また、キーワード908には、検索ヒットしたキーワードを表示している。
【0078】
1210において、画像処理装置は、一覧表として出力するかを判定する。Yesの場合、1211へ進み、Noの場合、1212へ進む。一覧表として出力するかの判断は、ユーザの操作指示により決まる。この操作指示は、不図示の操作画面により指定されるものである。
【0079】
1211において、画像処理装置は、一覧表を出力する。例えば、図9の906に示す一覧表を用紙に印刷する。
【0080】
1212において、画像処理装置は、ハイライト文字列画像(1207で生成した文字画像)を検索文字列画像に上書きする。つまり、スキャンしたイメージデータのうち、検索キーワードの部分(箇所または領域)を、ハイライト文字列画像に置き換えることをする。この処理を行うことにより、スキャンイメージのどこに検索キーワードが存在するかをユーザが容易に探し出すことができるようになる。
【0081】
1213において、画像処理装置は、指定形式で出力する。指定形式とは、そのキーワードに対する検索設定テーブル1001の指定形式のことである。具体的には、文字抽出(前)1005、文字数(前)1006、文字抽出(後)1007、文字数(後)1008、出力1009、印刷面1010の指定形式のことである。
【0082】
図12を用いて、出力例を説明する。まず、「1 in 1」の場合は、1ページの中に1212において生成された画像データと、検索キーワードを含む文字列と、このヒットした文字列のページ数が表示されている。また、「2 in 1」の場合は、1ページの中に2つ分の画像データとそれに対応する各種情報が表示されている。同じく、「4 in 1」の場合は、1ページの中に4つ分の画像データとそれに対応する各種情報が表示されている。レイアウトは、サイズによって任意に決めてもよい。本実施の形態では、「1 in 1」と「2 in 1」は、画像データの下に対応する文字列を表示しているが、「4 in 1」の場合は、画像の左にまとめて表示しているが、これらに限られるものではない。ユーザが、検索キーワードが含まれる、画像データとそれに対応する情報(文字列、ページ情報)を確認することができればよい。
【0083】
このように、検索キーワードがヒットしたページの画像データをハイライト表示することで、ページのどの位置に検索キーワードが存在するかを視覚的に確認することができる。また、その検索キーワードを含む文字列を合わせて表示することで、簡易に内容の把握ができるため、ユーザにとって本当に必要としている情報であるかの判断材料となる。
【0084】
以上、印刷物の出力処理の流れを説明した。
【0085】
本発明によれば、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることが可能となる。
【0086】
更に別の効果として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることが可能となる。
【0087】
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。つまりは、認証サーバ102及び課金管理サーバ103が備える各種の機能を複合機101が備える構成にしても良いし、認証サーバ102及び課金管理サーバ103を1台のサーバ装置で実現しても良い。
【0088】
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【0089】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0090】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
【0091】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
【0092】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【0093】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0094】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0095】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0096】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【0097】
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0098】
101 複合機
102 サーバ
103 サーバ
104−1、104−2 クライアントPC
105 LAN
【技術分野】
【0001】
本発明は、文書の中からキーワードを含むページ情報を表示し、所望の情報を容易に探すことを可能とする技術に関するものである。
【背景技術】
【0002】
会議資料の作成、顧客への提案資料、講演会の資料、学校に提出する宿題のレポートなど、何らかの資料を作成する際に、ある特定のキーワードを基にして調査することが多い。
【0003】
例えば、ある製品についての調査レポートを作成する場合、インターネットの検索エンジンなどに、当該製品の名称を入力して検索をかける。電子データの情報(例えば製品カタログ)から探す場合も同様に、アプリケーションのキーワード検索を用いて、自分の探している文言が記述されている部分を探すことを行う。
【0004】
しかし、会議の議事録、製品のマニュアル、雑誌、新聞、手書きのノートなど、紙媒体の資料から情報を探す場合、便利な検索機能など無く、手作業で一枚一枚ページをめくり、記述内容を読んで情報を探す必要がある。この作業には膨大な手間と時間を要し、情報の検索という点では非常に非効率である。
【0005】
膨大な情報の中から、自分の目的とする情報だけを抜き出すことは、非常に困難であり、情報を見逃し、探し漏らしてしまう危険性もある。
【0006】
更に、探し出した情報を活用するには、該当部分を印刷する等して抜き出す必要があることもある。この作業を人手で実施すれば、当然こちらにも相当な時間が掛かり、抜き出し漏れが発生する危険性がある。
【0007】
このような問題を防ぐためには、目的とする情報が資料のどこにあるかが、簡単に検索でき、分かり易くまとめられる工夫が必要である。
【0008】
特許文献1に記載の発明は、HDD等に蓄積している文書の中からキーワードを含む文書を検索し、それらを縮小させて文書の一覧を印刷する。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開平07−085239
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1のシステムでは、1つの文書の中に知りたいキーワードが大量にある場合には、どのページのどの部分にキーワードが記載されているのかや、キーワード付近にどのような文章が記載されているのかを短時間に判断することは困難である。
【0011】
本発明は上記の課題を解決するためになされたものであり、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることを目的とする。
【0012】
更に別の目的として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることを目的とする。
【課題を解決するための手段】
【0013】
本願発明は、書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置であって、前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段と、前記キーワードの指定を受け付けるキーワード受付手段と、前記書類の画像データを取得する取得手段と、前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段と、前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段と、前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と、前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段とを有することを特徴とする。
【発明の効果】
【0014】
本発明によれば、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることが可能となる。
【0015】
更に別の効果として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることが可能となる。
【図面の簡単な説明】
【0016】
【図1】システム構成図である。
【図2】画像処理装置のハードウェア構成図である。
【図3】出力形式の登録処理の流れを示すフローチャートである。
【図4】画像処理装置に表示される初期メニュー画面を示す図である。
【図5】画像処理装置に表示されるキーワード検索・印刷メニュー画面を示す図である。
【図6】画像処理装置に表示されるハイライト表示形式選択画面(カラー機、モノクロ機)を示す図である。
【図7】画像処理装置に表示されるキーワード前後テキスト抽出選択画面を示す図である。
【図8】画像処理装置に表示される出力形式選択画面を示す図である。
【図9】画像処理装置に表示される検索結果表示画面を示す図である。
【図10】検索設定テーブルの一例を示す図である。
【図11】検索結果テーブルの一例を示す図である。
【図12】印刷物の出力処理の流れを示すフローチャートである。
【図13】印刷物の例を示す図である。
【発明を実施するための形態】
【0017】
図1は、本発明の情報処理システムのシステム構成の一例を示す図である。
【0018】
図1に示す通り、複合機101、サーバ102、103、クライアントPC104−1、104−2(以下まとめて「クライアントPC104」とする)、等を備えて構成されている。LAN105は上記した各装置を相互に通信可能に接続するためのネットワークである。
【0019】
複合機101は、本発明の画像処理装置として機能する装置であり、クライアントPC104で作成され、不図示の印刷データ管理サーバに登録されている印刷データや、スキャン機能を用いて作成された記憶装置に記憶されている電子画像データ、外部のFAX装置から受信したFAXデータを印刷する印刷機能、FAX送信機能、コピー機能、スキャンしたデータをクライアントPC104の所定のディレクトリに送信する送信機能等を有している。
【0020】
サーバ102、103は、スキャン機能を用いて作成された電子画像データ等を蓄積している。
【0021】
クライアントPC104は、ユーザからの印刷指示を受け付けることで印刷データを作成し、不図示の印刷データ管理サーバに蓄積させるべく、当該印刷データを送信する機能や、複合機101に当該印刷データを蓄積させるべく当該印刷データを送信する機能、複合機101から送られた電子画像データを指定されたフォルダに記憶する機能を備えている。
【0022】
以上が、本発明の情報処理システムのシステム構成の一例の説明である。
【0023】
図2は、図1の複合機101のハードウェア構成の一例を示す図である。
【0024】
図2において、216はコントローラユニットで、画像入力デバイスとして機能するスキャナ214や、画像出力デバイスとして機能するプリンタ部212と接続する一方、LAN(例えば、図1に示したLAN105)や公衆回線(WAN)(例えば、PSTNまたはISDN等)と接続することで、電子画像データやデバイス情報の入出力を行う。
【0025】
コントローラユニット216において、201はCPUで、システム全体を制御するプロセッサである。202はRAMで、CPU201が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。
【0026】
203はROMで、システムのブートプログラムや各種制御プログラムが格納されている。204はハードディスクドライブ(HDD)で、システムを制御するための各種プログラム,画像データ等を格納する。
【0027】
207は操作部インタフェース(操作部I/F)で、操作部208とのインタフェース部である。また、操作部I/F207は、操作部208から入力したキー情報(例えば、スタートボタンの押下)をCPU201に伝える役割をする。
【0028】
205はネットワークインタフェース(ネットワークI/F)で、LAN105等のネットワークに接続し、データの入出力を行う。206はモデムで、公衆回線に接続し、FAXの送受信等のデータの入出力を行う。
【0029】
218は外部インタフェース(外部I/F)で、USB、IEEE1394、プリンタポート、RS−232C等の外部入力を受け付けるI/F部であり、本実施形態においてはユーザの認証を行う際に必要となる非接触ICカード(記憶媒体)の読み取り用のカードリーダ219が外部I/F部218に接続されている。そして、CPU201は、この外部I/F218を介してカードリーダ219によるICカードからの情報読み取りを制御し、該ICカードから読み取られた情報を取得可能である。以上のデバイスがシステムバス209上に配置される。
【0030】
220はイメージバスインタフェース(イメージバスI/F)であり、システムバス209と画像データを高速で転送する画像バス215とを接続し、データ構造を変換するバスブリッジである。画像バス215は、PCIバスまたはIEEE1394で構成される。画像バス215上には以下のデバイスが配置される。
【0031】
210はラスタイメージプロセッサ(RIP)で、例えば、PDLコード等のベクトルデータをビットマップイメージに展開する。211はプリンタインタフェース(プリンタI/F)で、プリンタ部212とコントローラユニット216を接続し、画像データの同期系/非同期系の変換を行う。また、213はスキャナインタフェース(スキャナI/F)で、スキャナ214とコントローラユニット216を接続し、画像データの同期系/非同期系の変換を行う。
【0032】
217は画像処理部で、入力画像データに対し補正、加工、編集を行ったり、プリント出力画像データに対して、プリンタの補正、解像度変換等を行ったりする。また、これに加えて、画像処理部217は、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。そして、この画像処理部217は、スキャナ部214を駆動して画像読み取りされた画像データを画像処理して、ファイル出力可能な形式(例えば、PDF形式ファイル)に変換し、CPU201と連携して、ネットワークI/F205を介して、クライアントPC104等の外部装置に画像データファイルを送信することができる。
【0033】
スキャナ214は、原稿(書類)となる紙上の画像を照明し、CCDラインセンサで走査することで、ラスタイメージデータとして電気信号に変換する。原稿用紙は原稿フィーダのトレイにセットし、装置使用者が操作部208から読み取り起動指示することにより、CPU301がスキャナ214に指示を与え、フィーダは原稿用紙を1枚ずつフィードし原稿画像の読み取り動作を行う。
【0034】
プリンタ212は、ラスタイメージデータを用紙上の画像に変換する部分であり、その方式は感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式等があるが、どの方式でも構わない。プリント動作の起動は、CPU201からの指示によって開始する。なお、プリンタ212には、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセットがある。
【0035】
操作部208は、LCD表示部を有し、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報を操作部I/F207を介してCPU201に伝える。また、操作部208は、各種操作キーとして、例えば、スタートキー、ストップキー、テンキー、IDキー、リセットキー等を備える。
【0036】
ここで、操作部208のスタートキーは、原稿画像の読み取り動作を開始する時などに用いる。スタートキーの中央部には、緑と赤の2色LEDがあり、その色によってスタートキーが使える状態にあるかどうかを示す。また、操作部208のストップキーは、稼働中の動作を止める働きをする。また、操作部208のIDキーは、使用者のユーザIDを入力する時、ログインユーザのログオフを行う時に用いる。リセットキーは、操作部からの設定を初期化する時に用いる。
【0037】
カードリーダ219は、CPU201からの制御により、非接触ICカードに記憶されている情報を読み取り、該読み取った情報を外部I/F218を介してCPU201へ通知する。
【0038】
以上のような構成によって、複合機101は、スキャナ214で原稿を読み込むことで作成した電子画像データをLAN105上に送信したり、LAN105を介して受信した印刷データをプリンタ212により印刷出力したりすることができる。
【0039】
また、スキャナ214で原稿を読み込むことで作成された電子画像データをモデム206により、公衆回線上にFAX送信したり、公衆回線からFAX受信したFAXデータをプリンタ212により出力したりすることができる。
【0040】
以上が、図1の複合機101のハードウェア構成の一例の説明である。なお、複合機101のハードウェア構成は図2に示した構成を有するとして説明するが、必ずしも同図の構成を有することに限定するものではなく、複合機101が行う処理として説明する以下の処理が実行可能な構成であれば、複合機101の構成は適宜変形しても良い。
図3は、出力形式の登録処理の流れを示すフローチャートである。この処理は、画像処理装置(複合機101)において実行される。
【0041】
301において、画像処理装置は、設定機能を起動する。例えば、ユーザにより電源ONボタンが押されたり、IDカード認証が行われたりした場合に図4に示すメニューを起動する。
【0042】
図4は、メニュー画面401の一例を示す。「コピー」402、「送信」、「ボックス」403、「キーワード検索・印刷」404のそれぞれのボタンが表示画面に表示される。ユーザはタッチパネルを押すことにより選択可能である。「コピー」402、「送信」、「ボックス」403は、従来の機能である。
【0043】
本実施の形態の説明として、ユーザにより「キーワード検索・印刷」404ボタンが押下されたものとして以下説明する。
【0044】
302において、画像処理装置は、キーワード検索・印刷メニュー画面501を表示し、ユーザから入力される検索キーワードを受け付ける。具体的には、検索キーワード入力欄に入力され、ユーザにより入力ボタン502が押下された際に取得できるキーワードである。なお、画像処理装置は、検索キーワードを検索設定テーブル1001(図10)に記憶する。
【0045】
303において、画像処理装置は、ハイライト表示形式503ボタンが押されることにより、ハイライト表示形式が選択された場合、カラー機かどうかを判定する(304)。なお、ハイライト表示形式503ボタンが押されなかった場合は、この処理は行われない。
【0046】
画像処理装置は、カラー機の場合、図6に示すハイライト表示形式選択画面(カラー機)601を表示し(305)、モノクロ機の場合、図6に示すハイライト表示形式選択画面(モノクロ機)608を表示する(306)。
【0047】
ユーザは、任意の形式を選択することができる。
【0048】
カラー機の場合、ハイライトのカラーを「赤、青、緑、黄」602から選択することができる。その他、カラー文字反転603、斜体太字604、太字605から選択することができる。これによりキーワードの視認性が高くなり容易にキーワードみつけることができる。
【0049】
ユーザは、入力が終了した場合、OK606ボタンを押す。キャンセルする場合は、キャンセル607ボタンを押す。
【0050】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0051】
モノクロ機の場合は、カラー出力ができないためカラー機に比べて選択項目が少ない。画像処理装置は、カラー機同様入力された設定を検索設定テーブル1001(図10)に記憶する。
【0052】
307において、画像処理装置は、テキスト抽出表示設定504ボタンが押されることにより、図7に示すキーワード前後テキスト抽出選択画面701を表示する。なお、テキスト抽出表示設定504ボタンが押されなかった場合は、この処理は行われない。
【0053】
ユーザは、任意の選択することができる。
【0054】
キーワード前のテキスト抽出702をする場合、その抽出する文字数を入力する。キーワード後のテキスト抽出703をする場合、その抽出する文字数を入力する。これによりキーワードの前後の文字列を抽出することができるため内容の把握が容易となる。
【0055】
ユーザは、入力が終了した場合、OK703ボタンを押す。キャンセルする場合は、キャンセル704ボタンを押す。
【0056】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0057】
308において、画像処理装置は、出力形式505が押されることにより、図8に示す出力形式選択画面801を表示する。なお、出力形式505が押されなかった場合は、この処理は行われない。
【0058】
ユーザは、任意の選択することができる。
【0059】
「一覧表」を選択することができし(802)、「1 in 1」、「2 in 1」、「4 in 1」から選択することもできる(803)。また、テキスト表示するかしないかを選択することができる(804)。さらに片面出力か両面出力かを選択することもできる(805)。これによりユーザが所望する出力形式での出力が可能となる。特に「一覧表」、「n in 1」の設定および両面印刷の設定により、無駄な印刷を防ぐことにつながる。また、テキスト表示をすると文字の内容を読むことができるため、簡易に内容の把握をすることができる。
【0060】
ユーザは、入力が終了した場合、OK806ボタンを押す。キャンセルする場合は、キャンセル807ボタンを押す。
【0061】
なお、画像処理装置は、入力された設定を検索設定テーブル1001(図10)に記憶する。
【0062】
図10は、検索設定テーブルである。このテーブルは、ユーザ毎もしくは画像処理装置毎の何れの単位で用意してもよい。また、複数のキーワードごとに設定可能である。それぞれユニークな番号により管理されている(1002)。
【0063】
項目としては、キーワード1003、ハイライト1004、文字抽出(前)1005、文字数1006、文字抽出(後)1007、文字数1008、出力1009、印刷面1010を有する。設定されない項目は「−」となる。
【0064】
以上、出力形式の登録処理の流れを説明した。
【0065】
次に、印刷物の出力処理の流れを説明する。
【0066】
図12は、印刷物の出力処理の流れを示すフローチャートである。この処理は、画像処理装置(複合機101)において実行される。
【0067】
なお、ここで出力する印刷物とは、スキャンした文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにするためのものである。
【0068】
また、この処理は、図3の登録処理が行われた後に実行されるものである。
【0069】
1201において、画像処理装置は、新たな検索を行うかを判定する。Yesの場合、1202へ進み、Noの場合、1204へ進む。具体的には、画像処理装置の原稿台に図5に示す操作画面を介して、ユーザによりスキャン開始ボタン506が押下されたかにより判定を行う。なお、既にスキャンが済みの原稿を対象とする場合は、ユーザは、スキャン済みのイメージから選択を行う。この選択は、不図示の操作画面から行うものとする。
【0070】
1202において、画像処理装置は、対象となる原稿をスキャンしてイメージデータを取得する。イメージデータは、PDF形式、JPEG形式等、どのような形式であってもよい。
【0071】
1203において、画像処理装置は、取得したイメージデータからテキストデータを生成する。具体的には、イメージデータに対してOCR処理をすることによりテキストデータを生成する。
【0072】
1204において、画像処理装置は、テキストデータに対して、キーワードの検索を実施する。
【0073】
1205において、画像処理装置は、該当するキーワードがテキストデータに存在するかを判定する。Yesの場合は、1206へ進み、Noの場合は、1214へ進む。
【0074】
1206において、画像処理装置は、スキャンしたイメージデータ上の該当文字列が配置される位置を記憶する。具体的には、文字の属性情報(フォントサイズ、フォントの種類など)、座標情報を用いて位置を記憶する。
【0075】
1207において、画像処理装置は、ハイライト文字列の画像を作成する。ハイライト文字列は、検索設定テーブルのハイライト1004の設定を反映させる(太字、斜体太字など)。また、イメージデータの文字の属性情報(フォントサイズ、フォント種別など)も用いる。なお、検索ヒットした文字列は、ページによって文字の属性情報が異なることがあるため、それぞれの文字の属性情報に応じた画像を作成する。
【0076】
1208において、画像処理装置は、スキャンしたイメージデータと、検索ヒットした文字列と、ハイライト文字列の画像とをそれぞれ対応づけてデータテーブルに登録する。ここで、複数のハイライト文字列の画像を作成した場合は、それぞれのハイライト文字列の画像は、どのページのどこの位置の文字列であるかを特定するための情報と紐付けて記憶しておく。また、検索ヒットした文字列は、キーワードを含む任意のNバイト分の文字列を検索結果として、図11に示す検索結果テーブルに登録する。No1102は、ユニークな番号を示し、文字列1103は、キーワードを含むNバイト分の文字列であり、ページNo1104は、そのキーワードがイメージデータの何ページ目に配置されているかを示すページ番号である。
【0077】
1209において、画像処理装置は、操作パネルに検索結果を表示する。具体例を図9の901に示す。この例では、0件となっているが、ヒットした場合、そのヒットした件数が表示される。また、検索結果テーブルを用いて、図9の906のように表示してもよい。この例では、No907には、検索結果テーブルのNo1102を、文字列909には、検索結果テーブルの文字列1103を、ページ910には、検索結果テーブルのページNo1104を表示する。また、キーワード908には、検索ヒットしたキーワードを表示している。
【0078】
1210において、画像処理装置は、一覧表として出力するかを判定する。Yesの場合、1211へ進み、Noの場合、1212へ進む。一覧表として出力するかの判断は、ユーザの操作指示により決まる。この操作指示は、不図示の操作画面により指定されるものである。
【0079】
1211において、画像処理装置は、一覧表を出力する。例えば、図9の906に示す一覧表を用紙に印刷する。
【0080】
1212において、画像処理装置は、ハイライト文字列画像(1207で生成した文字画像)を検索文字列画像に上書きする。つまり、スキャンしたイメージデータのうち、検索キーワードの部分(箇所または領域)を、ハイライト文字列画像に置き換えることをする。この処理を行うことにより、スキャンイメージのどこに検索キーワードが存在するかをユーザが容易に探し出すことができるようになる。
【0081】
1213において、画像処理装置は、指定形式で出力する。指定形式とは、そのキーワードに対する検索設定テーブル1001の指定形式のことである。具体的には、文字抽出(前)1005、文字数(前)1006、文字抽出(後)1007、文字数(後)1008、出力1009、印刷面1010の指定形式のことである。
【0082】
図12を用いて、出力例を説明する。まず、「1 in 1」の場合は、1ページの中に1212において生成された画像データと、検索キーワードを含む文字列と、このヒットした文字列のページ数が表示されている。また、「2 in 1」の場合は、1ページの中に2つ分の画像データとそれに対応する各種情報が表示されている。同じく、「4 in 1」の場合は、1ページの中に4つ分の画像データとそれに対応する各種情報が表示されている。レイアウトは、サイズによって任意に決めてもよい。本実施の形態では、「1 in 1」と「2 in 1」は、画像データの下に対応する文字列を表示しているが、「4 in 1」の場合は、画像の左にまとめて表示しているが、これらに限られるものではない。ユーザが、検索キーワードが含まれる、画像データとそれに対応する情報(文字列、ページ情報)を確認することができればよい。
【0083】
このように、検索キーワードがヒットしたページの画像データをハイライト表示することで、ページのどの位置に検索キーワードが存在するかを視覚的に確認することができる。また、その検索キーワードを含む文字列を合わせて表示することで、簡易に内容の把握ができるため、ユーザにとって本当に必要としている情報であるかの判断材料となる。
【0084】
以上、印刷物の出力処理の流れを説明した。
【0085】
本発明によれば、文書の中からキーワードを含むページのイメージの中でキーワードが記載されている部分をユーザが容易に探すことができるようにすることが可能となる。
【0086】
更に別の効果として、キーワードを含む文字列を表示することにより、ユーザが所望する情報であるかの判断を容易にさせることが可能となる。
【0087】
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。つまりは、認証サーバ102及び課金管理サーバ103が備える各種の機能を複合機101が備える構成にしても良いし、認証サーバ102及び課金管理サーバ103を1台のサーバ装置で実現しても良い。
【0088】
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【0089】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0090】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
【0091】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
【0092】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【0093】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0094】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0095】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0096】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【0097】
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0098】
101 複合機
102 サーバ
103 サーバ
104−1、104−2 クライアントPC
105 LAN
【特許請求の範囲】
【請求項1】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置であって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段と、
前記キーワードの指定を受け付けるキーワード受付手段と、
前記書類の画像データを取得する取得手段と、
前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段と、
前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段と、
前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、
前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と、
前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段と
を有することを特徴とする画像処理装置。
【請求項2】
前記記憶手段は、前記抽出手段により抽出された文字列から、前記検索手段による検索の結果、検索ヒットした場合、前記キーワードを含む文字列を更に記憶し、
前記印刷手段は、前記画像データと対応付けて前記文字列を印刷することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置における画像処理方法であって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付ステップと、
前記キーワードの指定を受け付けるキーワード受付ステップと、
前記書類の画像データを取得する取得ステップと、
前記取得ステップにより取得された画像データ上に記載される文字列を抽出する抽出ステップと、
前記抽出ステップにより抽出された文字列から前記キーワード受付ステップにより受け付けたキーワードを検索する検索ステップと、
前記検索ステップによる検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶手段に記憶する記憶ステップと、
前記記憶ステップにより記憶手段に記憶された前記配置位置情報を用いて、前記取得ステップにより取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付ステップによる受け付けた表示形式の画像データに置き換える置換ステップと、
前記置換ステップにより表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷ステップと
を有することを特徴とする画像処理方法。
【請求項4】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置において実行可能なプログラムであって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段、
前記キーワードの指定を受け付けるキーワード受付手段、
前記書類の画像データを取得する取得手段、
前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段、
前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段、
前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段、
前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段、
前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段
として前記画像処理装置を機能させることを特徴とするプログラム。
【請求項5】
請求項4に記載のプログラムをコンピュータ読み取り可能に記憶した記録媒体。
【請求項1】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置であって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段と、
前記キーワードの指定を受け付けるキーワード受付手段と、
前記書類の画像データを取得する取得手段と、
前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段と、
前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段と、
前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段と、
前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段と、
前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段と
を有することを特徴とする画像処理装置。
【請求項2】
前記記憶手段は、前記抽出手段により抽出された文字列から、前記検索手段による検索の結果、検索ヒットした場合、前記キーワードを含む文字列を更に記憶し、
前記印刷手段は、前記画像データと対応付けて前記文字列を印刷することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置における画像処理方法であって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付ステップと、
前記キーワードの指定を受け付けるキーワード受付ステップと、
前記書類の画像データを取得する取得ステップと、
前記取得ステップにより取得された画像データ上に記載される文字列を抽出する抽出ステップと、
前記抽出ステップにより抽出された文字列から前記キーワード受付ステップにより受け付けたキーワードを検索する検索ステップと、
前記検索ステップによる検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶手段に記憶する記憶ステップと、
前記記憶ステップにより記憶手段に記憶された前記配置位置情報を用いて、前記取得ステップにより取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付ステップによる受け付けた表示形式の画像データに置き換える置換ステップと、
前記置換ステップにより表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷ステップと
を有することを特徴とする画像処理方法。
【請求項4】
書類から所定のキーワードが記載されている個所をユーザが探すことを支援するための印刷物を印刷する画像処理装置において実行可能なプログラムであって、
前記印刷物における前記キーワードの表示形式を受け付ける表示形式受付手段、
前記キーワードの指定を受け付けるキーワード受付手段、
前記書類の画像データを取得する取得手段、
前記取得手段により取得された画像データ上に記載される文字列を抽出する抽出手段、
前記抽出手段により抽出された文字列から前記キーワード受付手段により受け付けたキーワードを検索する検索手段、
前記検索手段による検索の結果、検索ヒットした場合、検索ヒットしたページ情報と、前記キーワードの前記画像データ上の配置位置情報とを対応付けて記憶する記憶手段、
前記記憶手段により記憶された前記配置位置情報を用いて、前記取得手段により取得された書類の画像データにおける前記キーワードを含む画像領域を、前記表示形式受付手段による受け付けた表示形式の画像データに置き換える置換手段、
前記置換手段により表示形式が置き換えられた前記書類の画像データと、前記記憶されたページ情報とを印刷する印刷手段
として前記画像処理装置を機能させることを特徴とするプログラム。
【請求項5】
請求項4に記載のプログラムをコンピュータ読み取り可能に記憶した記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−34051(P2012−34051A)
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願番号】特願2010−169753(P2010−169753)
【出願日】平成22年7月28日(2010.7.28)
【出願人】(592135203)キヤノンITソリューションズ株式会社 (528)
【Fターム(参考)】
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願日】平成22年7月28日(2010.7.28)
【出願人】(592135203)キヤノンITソリューションズ株式会社 (528)
【Fターム(参考)】
[ Back to top ]