文書処理装置、文書処理方法および文書処理プログラム
【課題】注目部分の詳細な情報と文書全体の概要とのバランスを、簡便に、かつ、きめ細かに制御して出力することができる文書処理装置、文書処理方法および文書処理プログラムを提供すること。
【解決手段】文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するための階層検出部16と、検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための要素決定部24と、決定された出力要素情報を含む出力文書を作成するための出力文書作成部28とを備える。
【解決手段】文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するための階層検出部16と、検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための要素決定部24と、決定された出力要素情報を含む出力文書を作成するための出力文書作成部28とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書処理装置、文書処理方法および文書処理プログラムに関し、特に、文書データの見出し要素を検出することのできる文書処理装置、文書処理方法および文書処理プログラムに関する。
【背景技術】
【0002】
従来より、文書の構造を利用して見出しを抽出する技術が存在する。
たとえば特許文献1では次のような技術が提案されている。すなわち、スキャン文書にOCR(Optical Character Recognition)をかけた後、解析を行い、見出しを自動抽出する。そして、抽出した見出しを本文とするメールを送信する。このとき、各見出しには見出しが代表する部分文書へのリンク(リンク先はサーバに格納された文書)が埋め込まれることが記載されている。
【0003】
また、特許文献2では次のような技術が提案されている。すなわち、文書の印刷を行う場合、当該文書のデータに対してインデックスデータを検出し、検出できた場合にはインデックスデータに基づいて文章の構造を解析して、各インデックスの内容を画面に表示する。ユーザは表示インデックス内容に基づいて、印刷対象となるインデックスを指定する。印刷は指定インデックスに対応する本文位置から同じ階層レベルの次インデックスまでの部分に対して行なわれる。
【特許文献1】特開2002−290644号公報
【特許文献2】特開2007−283675号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記特許文献1では、見出しを本文とするメールを自動的に作成することができるが、見出しによる概要情報しか出力することができない。逆に、特許文献2では、見出し指定により部分的に切り取られた詳細情報しか出力することができない。
【0005】
本発明は、上記のような問題を解決するためになされたものであって、その目的は、注目部分の詳細な情報と文書全体の概要とのバランスを、簡便に、かつ、きめ細かに制御して出力することができる文書処理装置、文書処理方法および文書処理プログラムを提供することである。
【課題を解決するための手段】
【0006】
この発明のある局面に従う文書処理装置は、文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するための検出手段と、検出手段による検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための決定手段と、決定された出力要素情報を含む出力文書を作成するための作成手段と、作成された出力文書を出力するための出力手段とを備える。
【0007】
好ましくは、概要情報は、複数の見出し要素のうち、指定された見出し要素と同階層および上位階層の見出し要素のみを含む。
【0008】
あるいは、概要情報は、複数の見出し要素のうち、指定された見出し要素と同階層のレベル以上であって、ユーザにより指定された上限レベル以下の階層の見出し要素のみを含むことが望ましい。
【0009】
好ましくは、詳細情報は、特定説明要素のうち、ユーザにより指定された下限レベル以上の階層の説明要素のみを含む。
【0010】
好ましくは、検出手段は、さらに、説明要素の段落の認識処理を行ない、決定手段は、特定説明要素の種別が本文である場合には、詳細情報に含める段落をユーザに選択させる。
【0011】
あるいは、決定手段は、特定説明要素の種別が本文である場合には、文字数、行数、段落数、領域の大きさのいずれかで、詳細情報に含める量を制限することが望ましい。
【0012】
好ましくは、詳細情報は、テキスト、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含む。
【0013】
好ましくは、文書データは、光学的に読取られた文書画像であり、検出手段は、複数の文書要素のうち、特定の種別の文書要素を見出し要素として抽出するための抽出手段と、各文書要素について、従属先の見出し要素を親見出しとして検出することにより、見出し要素ごとの説明要素を検出するための説明要素検出手段とを含む。
【0014】
好ましくは、特定の種別は、表題、セクション見出し、手書き注釈およびキャプションのうち少なくとも一つを含む。
【0015】
好ましくは、説明要素検出手段は、複数の見出し要素の位置関係に基づいて、見出し要素間の階層構造を判断し、手書き注釈の見出し要素については常に、最上位の階層の見出し要素と判断する。
【0016】
好ましくは、表示手段をさらに備え、決定手段は、詳細情報の基準となる見出し要素をユーザに指定させるための指定画面に、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を基準となる見出し要素の候補として表示し、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を基準となる見出し要素の候補として表示する。
【0017】
好ましくは、文書画像中、出力要素情報として決定された部分の領域の画像データについて文字認識を実行することで、文書画像の一部の画像データのみをテキストデータに変換するための認識処理手段をさらに備え、作成手段は、テキストデータに変換された出力要素情報を含む出力文書を作成する。
【0018】
好ましくは、作成手段は、出力文書に含まれる各領域に、文書データの対応する部分へのリンク再現情報を付加し、出力手段は、リンク再現情報が付加された出力文書を、文書データとともに外部の装置に送信するための通信手段を含む。
【0019】
好ましくは、文書データを保存するための記憶手段をさらに備え、作成手段は、出力文書に含まれる各領域に、文書データの対応する部分へのリンク情報を付加し、出力手段は、リンク情報が付加された出力文書を外部の装置に送信するための通信手段を含む。
【0020】
この発明の他の局面に従う文書処理方法は、文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するステップと、検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくともに一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するステップと、決定された出力要素情報を含む出力文書を作成するステップと、作成された出力文書を出力するステップとを備える。
【0021】
この発明のさらに他の局面に従う文書処理プログラムは、上記記載の文書処理方法をコンピュータに実行させる。
【発明の効果】
【0022】
本発明によると、指定された見出し要素についての詳細部分と、他の概要とのバランスを、簡便に、かつ、きめ細かに制御して出力することができる。
【発明を実施するための最良の形態】
【0023】
本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。
【0024】
電子メールに文書を添付して送信する際、添付文書中の特定箇所をメール本文中で詳しく示しておきたい場合がよくある。例えば、クライアントに契約書をチェックしてもらいすぐに返事がほしいので、特に見てほしい部分についてはメール本文に転記する一方、全体文書もあとで確認するときのために添付するような場合である。
【0025】
こういった場合には、章や節の見出しなど文書内容の構造を利用して、簡便に該当箇所を指定して示すことができれば便利である。特に、MFP(Multi Function Peripheral)でScanToE−Mailで文書スキャンにより添付文書を送った場合には、該当箇所をコピーして本文に引用することが困難であるので、これができれば非常に便利である。また、このとき該当箇所と同時に、他の部分についても見出しにより概要を提示すれば、該当箇所の文書全体での位置づけがわかりやすくなり、さらに便利である。
【0026】
電子メールで文書を送信する以外にも、例えば、文書を印刷して他人に見せる場合に、一部のみ詳細を印刷すると同時におおよその概要を示すため他の部分については見出しだけ出力できれば便利である。
【0027】
[実施の形態1]
<構成について>
(全体システム構成)
図1は、本発明の実施の形態1に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書処理装置は、MFPに限らず、PC(Personal Computer)、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
【0028】
図1を参照して、本実施の形態に従うMFP1は、原稿300を読取るための画像読取部104と、紙媒体などへの印刷処理を行なうためのプリント部106とを含む。
【0029】
特に、本実施の形態に従うMFP1は、ScanToE−Mailの機能を有する。具体的には、画像読取部104で原稿300を読取ることで文書画像を取得し、この文書画像を含む電子化文書を生成する。そして、たとえば、生成された電子化文書を電子メールに添付して、指定された宛先に送信する。あるいは、生成された電子化文書は内部の記憶装置(図1において図示せず)に保存したまま、文書画像の特定領域へのリンク情報を付加した電子メールを、指定された宛先に送信する。
【0030】
MFP1は、インターネットを介して、メールサーバMSおよび複数の端末PC1,PC2(以下、「端末PC」という)と接続されている。
【0031】
画像読取部104は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む(いずれも図示しない)。これにより、複数枚の原稿を連続的に読取って、一つの電子化文書として生成することができる。代表的に、電子化文書にはPDF(Portable Document Format)などのフォーマットを採用できる。
【0032】
(MFP1の概略構成)
図2は、本発明の実施の形態1に従うMFP1における概略の機能構成を示すブロック図である。
【0033】
図2を参照して、MFP1の機能構成としては、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、操作パネル部110と、記憶部112とを含む。
【0034】
制御部100は、代表的にCPU(Central Processing Unit)などの演算装置から構
成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部102は、代表的にDRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、制御部100で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部108は、代表的に、インターネットを介して端末PC(図1)との間でデータを送受信するための部位であり、たとえば、LANアダプタおよびそれを制御するドライバソフトなどを含む。プリント部106は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。記憶部112は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部100の動作のためのプログラムや制御部100で生成された電子化文書などを格納する。
【0035】
操作パネル部110の外観例を図3に示す。操作パネル部110は、液晶表示装置やタッチパネルなどから構成される表示パネル110aと、ストップボタン110bと、スタートボタン110cと、英数キーなどを含む操作ボタン110dとを備えている。
【0036】
なお、本実施の形態では、表示機能と指示の入力機能とを兼ね備えた操作パネル部110を備えることとしたが、これに代えて、表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。
【0037】
(端末の構成)
図4は、本発明の実施の形態1に従う端末の概略のハードウェア構成を示す模式図である。
【0038】
図4を参照して、端末PCは、たとえば一般的なパーソナルコンピュータであり、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には、文書データ(MFP1で生成された電子化文書を含む)を表示するための閲覧アプリケーションプログラム(以下、「ビューワ」という)、および、文書データを印刷するための印刷ドライバソフトが記憶されている。このようなプログラムは、FDDドライブ217またはCD−ROMドライブ215によって、それぞれフレキシブルディスク217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られてよい。
【0039】
CPU201は、キーボードやマウスなどからなる入力部209を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部205へ出力する。また、CPU201は、LANカードなどからなる通信インターフェイス部207を介して、LANやWANに接続されたMFP1やサーバ装置(図示せず)から電子化文書を取得し、ハードディスク部211などに格納する。また、上述の各部は、内部バス203を介して相互にデータを授受する。
【0040】
なお、端末PCは、パーソナルコンピュータに限定されず、携帯電話などの携帯端末であってもよい。その場合の端末PCは、図4においてFDDドライブ217やCD−ROMドライブ215などを取り除いたものとほぼ等価であるので、詳細な説明は繰返さない。
【0041】
(MFPの機能構成)
図5は、本発明の実施の形態1に従うMFP1の機能構成を示す機能ブロック図である。
【0042】
図5を参照して、MFP1の機能構成としては、画像読取部104と、画像バッファ部12と、圧縮処理部14と、階層検出部16と、UI(User Interface)部23と、要素決定部24と、認識処理部26と、出力文書作成部28と、出力処理部30と、通信インターフェイス部108と、記憶部112とを含む。
【0043】
画像読取部104は、原稿300を読取って文書画像を取得し、その文書画像を画像バッファ部12へ出力する。画像バッファ部12は、画像読取部104が逐次的に出力する文書画像のデータを一時的に格納する部位であり、一旦格納した文書画像を圧縮処理部14および階層検出部16に出力する。
【0044】
圧縮処理部14は、画像バッファ部12から出力される文書画像を圧縮処理して、出力処理部30へ出力する。この圧縮処理による圧縮度合いは、生成される電子化文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよく、また圧縮処理はJPEG(Joint Photographic Experts Group)などの非可逆変換であってもよい。なお、高解像度が要求される場合などには、圧縮処理を省略してもよい。
【0045】
階層検出部16は、文書画像を構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出する。本実施の形態において、階層検出部16は、見出し要素抽出部20と説明要素検出部22とを含む。「文書要素」とは、文書を構成する記述要素である。
【0046】
見出し要素抽出部20は、画像バッファ部12から出力される文書画像に含まれる見出し要素を抽出する。その際に、文書画像に含まれる関連要素も検出する。具体的には、見出し要素抽出部20は、文書画像を解析し、文書画像中の以下の文書要素、すなわち、「タイトル(表題)」、「セクション(章・節・項)見出し」、「図」、「表」、「写真」、「キャプション」、「手書き注釈」、および「本文」を検出する。また、その過程において、見出し要素抽出部20は、「段(段組)」を検出し、さらに、各段の「行方向」、および、各段の「接続情報」を検出してもよい。
【0047】
「見出し要素」とは、文書の概要を示すための特定の種別の文書要素であり、上記種別のうち、少なくともタイトル、セクション見出しおよび手書き注釈を含むことが好ましく、さらにキャプションを含むことが好ましい。本実施の形態では、見出し要素はこれら4つの種別の文書要素であることとする。なお、特定の種別は、これら4つの種別のうちの一つでもよいし、複数の組合わせであってもよい。
【0048】
本実施の形態では、見出し要素の種別は、予め製造時に定められていることを前提にするが、ユーザが個別に所望の種別を選択できてもよい。
【0049】
上記「関連要素」とは、見出し要素以外の要素である。
ここで、各種の文書要素の検出手法について、簡単に説明する。
【0050】
「タイトル」は、文書画像内に配置される文字の文字サイズや隣接する領域との間隔に基づいて抽出することができる。「セクション見出し」は、「本文」との関係(「本文」に先行する領域)や、文書画像内におけるオフセット位置やインデント位置などに基づいて抽出することができる。「図」は、テキストブロック以外の領域の2値パターンをとることにより抽出することができる。「表」は、罫線とテキストとの組み合わせなどに基づいて抽出することができる。「写真」は、カラーヒストグラムにおける画像の濃淡変化の度合いなどに基づいて抽出することができる。「キャプション」は、図,表,写真に対して上または下の近傍にある孤立したテキストブロックとして抽出することができる。「手書き」は、字体や行の乱れ具合などに基づいて検出することができる。
【0051】
なお、文書画像内の共通の領域に対して、複数の文書要素が重複して抽出されてもよい。
【0052】
段はたとえば、「図書の電子のための文書認識技術(鎌田 博、藤本 克仁、黒川 浩司)、雑誌FUJITSU、VOL.49,No.6、1998」に開示された公知技術で検出することができる。各段の接続情報は、各段が、文脈等からどの段に接続されるべきかを示す情報(すなわち段の順序を示す情報)であり、たとえば特開平10−40248号公報に開示される公知の技術で検出することができる。行方向の検出は、周知の方法で検出することができる。
【0053】
見出し要素抽出部20は、このような文書要素の抽出に際して、各文書要素の文書画像内における位置も抽出する。本実施の形態では、抽出した各段の接続情報に基づき見出し要素から見出し要素までの本文要素をハンドリングする。見出し要素抽出部20は、文書要素の管理情報(以下、「文書要素管理情報」という)を記述する。文書要素管理情報は、少なくとも、文書要素の位置情報、種別情報、および、文書要素の順序情報を含む。
【0054】
説明要素検出部22は、抽出された複数の文書要素(見出し要素および関連要素)の文書構造を解析することにより、見出し要素ごとの説明要素を検出する。具体的には、各文書要素について、従属先の見出し要素を親見出しとして検出することにより、見出し要素ごとの説明要素を検出する。つまり、本実施の形態では、文書要素ごとに、複数の見出し要素のうちから、所定の位置関係にある見出し要素を親見出しとして検出する。
【0055】
UI部23は、要素決定部24と接続され、検出された複数の見出し要素の画像を含む画面を表示する。また、詳細を表示したい箇所の見出し要素(以下「注目見出し」ともいう)の指定をユーザより受付ける。また、出力対象となる階層レベルの範囲の指示を受付けてもよい。本実施の形態において、UI部23は、操作パネル部110に対応する。
【0056】
要素決定部24は、階層検出部16による検出結果に基づいて、注目見出しについての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定する。具体的には、ユーザより指定された注目見出しや階層レベルの範囲などのパラメータから出力要素情報を決定する。
【0057】
認識処理部26は、文書画像中、出力要素情報として決定された部分の領域の画像データについて文字認識を実行して、一部の画像データのみをテキストデータに変換する。つまり、出力範囲にある要素領域について、要素が文字領域であるときには、文字認識を実行しテキストデータに変換する。
【0058】
出力文書作成部28は、出力要素情報を含む出力文書を作成する。本実施の形態では、認識処理部26によりテキストデータに変換された出力要素情報を含む出力文書を作成する。具体的には、出力要素として決定された見出しテキスト(テキスト化された見出し要素)や本文テキスト(テキスト化された本文要素)などを配置し、メール本文を作成する。
【0059】
出力処理部30は、圧縮処理部14からの(圧縮された)文書画像を電子化文書として生成する。そして、出力文書作成部28により作成されたメール本文に、電子化文書(スキャンされた文書画像)を添付して、別途指定するメールアドレスに送信する。または、電子化文書は記憶部112に保存し、作成したメール本文のみを、別途指定するメールアドレスに送信する。
【0060】
上記出力文書作成部28は、メール添付文書または記憶部112に保存された文書の各領域へのリンク情報を埋め込む処理をする。なお、メールに文書画像を添付する場合には、送信先の端末PCにおいてどこにデータが保存されるかは知りえないので、厳密には、リンク情報を復元するための情報(以下「リンク復元情報」という)を各領域に埋め込む。具体的には、リンク復元情報としてスクリプトを対応する箇所に記述する。
【0061】
なお、本実施の形態において出力処理部30は、指定された宛先にメール送信することとするが、限定的ではなく、たとえば、作成された文書を印刷することとしてもよい。または、メール送信に限定されず、FTP(File Transfer Protocol)送信してもよい。つまり、図示しないFTPサーバに、作成した出力文書を送信してもよい。
【0062】
なお、図5に示した各機能ブロックの動作は、メモリ部102中に格納されたソフトウェアを実行することで実現されてもよいし、少なくとも1つについては、ハードウェアで実現されてもよい。
【0063】
<動作について>
図6は、本発明の実施の形態1に従う文書処理を示すフローチャートである。図6のフローチャートに示される文書処理は、制御部100がプログラムをメモリ部102などに読出して実行し、図5に示される各機能を制御することで実現される。
【0064】
図5および図6を参照して、まず、画像読取部104が原稿300を(光学的に)読取って文書画像を生成する(ステップS2)。この生成された文書画像は、画像バッファ部12に格納される。そして、圧縮処理部14が、画像バッファ部12に格納された文書画像を圧縮処理して、出力処理部30へ出力する。出力処理部30において、公知の手法により電子化文書が生成される。
【0065】
一方、見出し要素抽出部20が、画像バッファ部12に格納された文書画像を解析し、文書画像中の上述種別の文書要素(見出し要素および関連要素)を抽出する(ステップS4)。見出し要素抽出部20は、抽出した全ての文書要素についての管理情報を記述する。
【0066】
図7は、本発明の実施の形態1における文書要素管理情報のデータ構造の一例を示す図である。
【0067】
図7を参照して、メモリ部102には、文書要素ごとに、6つのデータ欄が設けられ、これらのうち6つのデータ欄に、それぞれ、要素ID、頁番号、領域左上座標、領域右下座標、要素種別が記録される。残りのデータ欄(親見出し要素)は、この時点では空欄(NULL)である。
【0068】
要素IDは、各文書要素を一意に特定するための識別情報である。頁番号は、対応の文書要素が存在するページを特定するための位置情報である。また、領域左上座標および領域右下座標は、対応の文書要素のページ内での領域(矩形)を特定するための位置情報である。領域左上座標および領域右下座標は、対応する文書要素の領域のサイズを特定するための情報でもある。要素種別は、対応する文書要素の種別を特定するための情報である。
【0069】
再び図6を参照して、説明要素検出部22は、各文書要素について、親見出しを検出する処理を行なう。そして、検出した親見出しの文書IDを、各文書要素に関連付けて文書要素管理情報に記憶する(ステップS6)。
【0070】
図8は、親見出し検出後の文書要素管理情報の内容例を示す図である。
図8を参照して、親見出しが検出されると、文書要素の要素IDに対応付けて親見出しとして検出された見出し要素の要素IDが記録される。
【0071】
ここで、親見出しの検出方法について具体的に説明する。説明要素検出部22は、文書要素の種別に応じて、以下のような方法により親見出しを検出する。
【0072】
文書要素の種別が「タイトル」(見出し要素)の場合、親となる見出しはないので、親見出しIDの欄は空欄のままとする。文書要素の種別が「セクション見出し」(見出し要素)の場合、先行する上位見出し(タイトルを含む)のうち最も近接するものを親見出しとして検出する。先行する見出しがないときは、親見出しIDの欄は空欄とする。なお、見出し要素間の階層レベルは、文字サイズがより大きいかまたは左インデント位置がより左側にあるとき、より上位の見出しと判断する(横書きの場合)。
【0073】
文書要素の種別が「キャプション」(見出し要素)の場合には、セクション見出しの場合と同様の処理を行なう。文書要素の種別が「手書き注釈」(見出し要素)の場合には、最上位の見出しと判断し、親見出しIDの欄は空欄とする。
【0074】
文書要素の種別が「本文」の場合には、先行する上位見出しのうち最も近接するものを親見出しとして検出する。文書要素の種別が「図、表、写真」の場合には、最も近接するキャプションを親見出しとして検出する。
【0075】
なお、文書要素の種別が「手書き注釈」(見出し要素)の場合には、位置が最も近接する他要素(図表・本文など)を検出することで、説明要素を検出する。そして、説明要素として検出された文書要素については、上述の手法により特定された親見出しの他に、手書きの文書要素の要素IDも親見出しIDに追加する。
【0076】
このように、親見出しIDの欄には、通常、0または1つの親見出しの要素IDが記録されるが、手書き注釈の説明要素については、2つの親見出しの要素IDが記録されることもある。
【0077】
説明要素検出部22により各文書要素の親見出しを検出することで、各文書要素の階層レベルおよび文書要素間の従属関係を特定することができる。なお、文書要素の階層レベルおよび従属関係が特定できれば、上記のような方法に限定されない。
【0078】
図8に示した例では、文書要素管理情報を表形式で示したが、要素間の関係は本質的には木構造であるので、XML(eXtensible Markup Language)などを使って記述可能である。
【0079】
再び図6を参照して、要素決定部24は、出力要素の決定処理を実行する(ステップS8)。まず、要素決定部24は、文書要素管理情報に基づいて、ユーザに注目見出しを指定させるための画面(以下「見出し指定画面」という)を操作パネル部110に表示する。見出し指定画面には、階層レベルおよび従属関係を示した見出し要素が表示される。このとき、見出し指定画面では、手書き注釈されている見出し、または、手書き注釈されている本文の直上位の見出しがあるときは、これらをデフォルトの注目見出し(候補)として表示することが好ましい。
【0080】
ユーザより注目見出しが指定されると、要素決定部24は、以下の文書要素を、出力要素(出力対象の文書要素)として決定する。
【0081】
(A) ユーザにより指定された見出し(注目見出し)
(B) 注目見出しが説明する要素(注目見出しの子孫の要素群)
(C) (A),(B)以外の見出し要素
(B)が注目見出しの詳細情報を表わし、(A),(C)が文書の概要情報を表わす。
【0082】
なお、注目見出しは複数選択されてもよい。その場合、出力要素は、それぞれの要素を合わせたものとして決定される。
【0083】
(B)については、注目見出しからの相対的な下限階層レベルを指定可能としてもよい。また、(C)については、注目見出しからの相対的な上限階層レベルを指定可能としてもよい。また、これに加え、出力する見出し要素の種別を指定可能としてもよい。
【0084】
出力要素が決定されると、認識処理部26は、出力要素に対応する各領域について、要素が文字領域であるときには、文字認識を実行しテキストデータに変換する(ステップS10)。このように、本実施の形態では、部分的にOCR処理を行なうことでテキスト変換にかかる時間を節約することができる。
【0085】
次に、出力文書作成部28は、出力文書すなわちメール本文を作成する(ステップS12)。具体的には、出力要素として決定された見出しテキスト、本文テキストあるいは図(画像のまま)などを配置し、メール本文を作成する。
【0086】
また、出力文書作成部28は、ユーザに対し、スキャン文書の出力方法を、メール添付およびデータ保存のうちから選択させてもよい。データ保存が選択された場合、出力処理部30に対し、記憶部112へ電子化文書を保存するよう指示する。そして、出力文書作成部28は、メール本文の各領域(各文書要素の箇所)について、保存された電子化文書の対応する位置へのリンク情報を付加する。なお、リンク情報を付加する領域は、見出し要素の領域のみであってもよい。電子化文書の保存先(ボックス)は、ユーザにより選択させてもよいし、予め設定しておいてもよい。また、本実施の形態では、装置内部の記憶部112に保存されることとしたが、装置外のサーバなどに保存することとしてもよい。
【0087】
これに対し、メール添付が選択された場合には、添付文書(電子化文書)へのリンク情報を復元するためのスクリプトを、対応する見出し箇所などに埋め込む。受信された添付文書の格納方法および格納場所は、メール受信ソフトおよび添付文書のビューワソフトに依存するが、たとえば、それをMS社製「Outlook(登録商標)」およびAdobe社の「Acrobat Reader(登録商標)」に限定することでそういったスクリプトを埋め込むことが可能である。
【0088】
次に、出力処理部30は、作成された出力文書を、通信インターフェイス部108を介して、ユーザにより指定されたメールアドレスに送信する(ステップS14)。この際、メール添付が選択されていた場合には、出力処理部30は、作成された出力文書に電子化文書を添付して送信する。
【0089】
以上で、本実施の形態における文書処理は終了される。
ここで、上記の文書処理のうち特徴的な処理について詳細に説明する。
【0090】
(説明要素の検出について)
図9は、スキャンされた文書画像500の内容例を示す図である。
【0091】
図9を参照して、文書画像500から10個の文書要素1000〜1009が検出されたとする(ステップS4)。これらの文書要素1000〜1009の要素IDが、それぞれID0〜9であるとする。ID0,2,3,5,7の種別が「セクション見出し」であり、ID9の種別が「手書き注釈」である。他のID1,4,6,8の種別は、「本文」である。
【0092】
このような文書要素に対して、説明要素検出部22よる検出処理が実行されると、図10に示すような階層構造となる。図10は、図9に示した文書画像500を構成する文書要素1000〜1009の階層構造を示す図である。
【0093】
図10を参照して、階層レベルは、文書要素管理情報には、明示的に示されないが、たとえば、親見出しのない文書要素のレベルを「0」とし、その子要素のレベルを「1」、孫要素のレベルを「2」というように規定する。なお、階層レベルは番号の小さい方が上位を表わしているものとする。上述のように、手書き注釈の文書要素は親見出しがないため、階層レベルは「0」である。
【0094】
図10に示されるように、ID4の本文(文書要素1004)は、直上の見出し要素であるID3のセクション見出し(文書要素1003)の他に、ID9の手書き注釈(文書要素1009)も親見出しとして検出される。
【0095】
(出力要素の決定について)
図11は、見出し指定画面SC10の一例を示す図である。見出し指定画面SC10は、たとえば、操作パネル部110の表示パネル110aに表示される。
【0096】
図11を参照して、見出し指定画面SC10には、検出された見出し要素の各画像が階層構造を維持して表示される。このような見出し指定画面SC10が表示される段階では、各要素についてOCR処理がなされていないため、見出し要素が文書画像の部分画像領域を使って表示される。見出し指定画面SC10には、実行を指示するためのOKボタンBT1および取消しを指示するためのCancleボタンBT2が表示される。
【0097】
ここで、手書き注釈の見出し要素については、注釈した先を見なければメール本文への挿入の必要性が判断できないため、注釈した先の文書要素が本文など見出し要素以外の要素であっても該当の画像を表示する。本実施の形態では、本文の一部を表示している。
【0098】
なお、本文の画像を表示する際には、見出し要素抽出部20で検出された行を使って、特定の行数のみ出力することとしてもよい。出力する行数はユーザに指定させてもよいし、予め定められていてもよい。同様に、ステップS4で検出された段落を利用して、表示する段落数を制限することとしてもよい。または、1文字ごとの領域を検出して文字数で本文の出力を制限してもよい。または、画像領域の大きさで本文の出力を制限することとしてもよい。なお、このように本文要素の一部のみを表示する場合には、その箇所が選択されると、表示対象となった部分のみを出力要素情報(の詳細情報)に含めてもよい。
【0099】
本実施の形態では、最初にこのような見出し指定画面SC10が表示される際に、たとえば、手書きの見出し要素2009に関連する見出し要素をデフォルトの注目見出しとして、その部分にカーソルをあててもよい。つまり、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を注目見出し(詳細情報の基準となる見出し要素)の候補として表示する。また、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を注目見出しの候補として表示してよい。
【0100】
ユーザにより操作ボタン110dが操作されて、注目する見出し要素として、見出し要素2003が選択されたとする。そうすると、見出し指定画面SC10から図12に示すような範囲指定画面SC12に移行する。
【0101】
図12は、範囲指定画面SC12の一例を示す図である。
図12を参照して、範囲指定画面SC12において、上限指定線L1および下限指定線L2は、出力範囲を指定するための線である。これらの線L1およびL2は、いずれも操作ボタン110dにより移動可能である。上限指定線L1と下限指定線L2との間の階層レベルの文書要素が出力範囲として決定される。なお、上限指定線L1は、注目見出し2003以下の階層レベルには移動不能であり、下限指定線L2は、注目見出し2003以上の階層レベルには移動不能であってよい。
【0102】
範囲指定画面SC12において、上限指定線L1を注目見出し2003の1つ上位の階層レベル(レベル0)まで含むように設定し、下限指定線L2を最下の階層レベル(レベル3)まで含むように設定したとする。その場合、図10に示した文書要素のうち出力要素として決定された要素を、図13に示す。
【0103】
図13は、出力要素として決定された文書要素を示す図である。
図13を参照して、上記(A)として、注目見出し(ID3)が出力要素として決定される。上記(B)として、注目見出しの子孫の要素群であって、下限指定線L2で指定される下限レベル以上の要素群(ID4〜ID8)が出力要素として決定される。上記(C)として、これら以外の見出し要素であって、上限指定線L1で指定される上限レベル以下かつ注目見出しの階層レベル以上の見出し要素(ID0,ID2,ID9)が出力要素として決定される。
【0104】
(出力文書作成)
上記例により決定された出力要素の画像がテキスト化されると(文字領域のみ)、出力文書作成部28によって図14に示されるような出力文書(メール本文)が作成される。図14に示されるように、出力文書には、注目見出しに関する詳細部分と、注目見出しを含む文書の概要とがバランスよく配置される。これにより、メール受信者は、注目箇所の内容を詳細に把握するとともに、文書全体における注目箇所の位置付けも認識することができる。したがって、メール受信者は、別文書(電子化文書)で確認しなくても、メール本文だけで必要な情報を得ることができる。また、本実施の形態では、ユーザが出力要素の上限レベルと下限レベルを設定できるため、ユーザ(送信者)の意図をきめ細かに出力文書に反映させることができる。
【0105】
なお、作成された文書に、追加の本文を挿入可能としてもよい。具体的には、出力文書作成部28は、操作パネル部110の操作ボタン110dからの信号に基づいて、指定された位置に追加の文字データを挿入してもよい。
【0106】
<変形例1>
なお、上記実施の形態では、本文要素は、見出しから見出しまでの本文を一つのものとしてハンドリングを想定していたが、実際にはその一部分のみをメール本文に載せたい場合も考えられる。したがって、変形例として、本文が複数の段落で構成されている場合には、ユーザに(詳細情報に含めるべき)必要な段落を選択させてもよい。
【0107】
具体的には、たとえば、図7,8の文書要素管理情報とは別に、本文要素を段落に分解して認識しておく。そうすることで、段落を個別に指定して一部の段落のみを出力することができる。段落の区切りについては、たとえば特開平6−215184号公報や特開平6−214983号公報などに開示される公知の技術で実現できる。
【0108】
図15は、本発明の実施の形態1の変形例1における見出し指定画面SC14の一例を示す図である。
【0109】
図15を参照して、見出し指定画面SC14では、見出し要素だけでなく、本文要素の画像が段落ごとに示されている。たとえば、注目見出し2003が選択されると、注目見出し2003の子孫要素がすべて選択状態とされる。そして、ユーザに、必要のない段落を指定させる。具体的には、注目見出し2003の本文を構成する2つの段落2004A,2004Bともにはじめは選択状態である。ユーザにより2つ目の段落2004Bが指定されると、要素決定部24は、指定された段落2004Bを非表示の段落として出力対象から除外する。つまり、要素決定部24は、出力範囲内にある本文要素のうち、ユーザにより指定された段落以外を注目見出しの詳細情報として決定する。
【0110】
この場合、認識処理部26は、注目見出しに従属する出力範囲内の本文要素については一部の段落(ユーザにより選択された段落)のみOCR処理する。
【0111】
このように、変形例1によると、注目見出しに従属する出力範囲内の全ての説明要素を出力文書に配置するのではなく、本文要素については一部の段落のみを出力文書に配置することができる。これにより、本当に必要な部分のみを出力文書に含めることが可能となる。
【0112】
なお、必要な段落をユーザに選択させるものに限定されず、たとえば、文字数、行数、段落、領域の大きさのいずれかのパラメータで、詳細情報に含める本文領域の量を制限してもよい。たとえば、注目見出しに従属する出力範囲内の本文要素を全て表示し、表示された本文要素ごとに、詳細情報に含める文字数や領域をユーザに指定させてもよい。
【0113】
<変形例2>
また、上記実施の形態1では、手書き注釈に関連する見出し要素を注目見出しの候補として表示し、実際の注目見出しの選択はユーザに実行させたが、手書き注釈に関連する見出し要素を注目見出しとして確定することとしてもよい。そのようにすることで、ユーザによる操作の手間を減少させることができる。なお、その場合、上限レベルは最上位(レベル0)として予め定めておいてもよい。また、下限レベルは最下位レベルとして予め定めておいてもよい。
【0114】
<変形例3>
実施の形態1では、文書処理装置(MFP1)が画像読取部104を備えており、原稿をスキャンして見出し要素の抽出等を行なったが、限定的ではなく、図8に示した文書要素管理情報をメタデータとして含んだ電子化文書を対象とすることもできる。すなわち、図6のステップS2〜S6の処理に代えて、電子化文書に付加された文書要素管理情報より各要素の階層レベルおよび従属関係を検出する処理を実行すれば、ステップS8以降に示した処理と同様の処理を行なうことができる。
【0115】
[実施の形態2]
上述の実施の形態1では、スキャン文書(文書画像)を元に、出力要素情報を決定したが、本実施の形態では、たとえばXML形式で構造化された電子文書を元に、出力要素情報を決定する。本実施の形態における文書処理装置は、端末PCであることとして説明するが、MFP1であってもよい。あるいは、携帯端末、複写機、ファクシミリ装置、スキャナ装置などであってもよい。MFP1の場合には、たとえばHTML形式で構造化された電子文書が扱われることとしてよい。
【0116】
なお、本実施の形態に従うシステムの構成については、実施の形態1と同様であるため、ここでも実施の形態1で用いた符号を参照して説明する。
【0117】
(機能構成)
図16は、本発明の実施の形態2における端末PCの機能構成を示す機能ブロック図である。
【0118】
図16を参照して、端末PCの機能構成としては、文書データ入力部42と、階層検出部16Aと、UI部23Aと、要素決定部24Aと、出力文書作成部28Aと、出力処理部30Aとを含む。
【0119】
文書データ入力部42は、XML形式の文書データを入力する。見出しや本文など文書要素の種別は、あらかじめXMLのタグとして記述されており、XMLの階層構造も見出しの階層構造に合わせて構成されているものとする。
【0120】
階層検出部16Aは、入力された文書データのタグ情報より、当該文書データを構成する複数の文書要素の階層関係を検出し、複数の見出し要素と、各見出し要素についての説明要素とを検出される。これにより、複数の見出し要素の階層構造と、文書要素間の従属関係とが検出される。
【0121】
UI部23A、要素決定部24A、および出力文書作成部28Aは、それぞれ、実施の形態1で示したUI部23、要素決定部24および出力文書作成部28と概ね同様の機能を有する。
【0122】
ただし、UI部23Aによる見出し指定画面では、画像ではなくテキストデータがそのまま利用される。本実施の形態において、UI部23は、図4に示したディスプレイ部205および入力部209に対応する。
【0123】
出力文書作成部28Aは、リンク情報やリンク再現情報を出力文書に埋め込まない。また、本実施の形態では、実施の形態1と異なり、認識処理部26は機能構成に含まれない。
【0124】
出力処理部30Aは、作成された文書データの出力処理として、たとえば印刷処理を実行する。なお、その場合、図16に示した構成部分は、より大きいコンピュータシステムの一部で、プリンタドライバおよびその周辺についてのものであってよい。以下の説明では、作成された出力文書は印刷されることとするが、限定的ではなく、実施の形態1と同様にメール送信されてもよい。
【0125】
なお、本実施の形態において、文書要素は、テキストの他、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含んでよい。つまり、出力要素情報にこれらが含まれてもよい。
【0126】
(動作について)
図17は、本発明の実施の形態2に従う文書処理を示すフローチャートである。図17のフローチャートに示される処理は、CPU201がプログラムをメモリ部213などに読出して実行し、図16に示される各機能を制御することで実現される。
【0127】
なお、図17に示す処理は、ビューワソフトにて、構造化された文書データ(電子文書)がディスプレイ部205に表示されている際に、ユーザから印刷指示が入力された場合に開始されてよい。
【0128】
図17を参照して、はじめに、文書データ入力部42は、印刷用ドライバソフトにXML形式で構造化された文書データを入力する(ステップS102)。
【0129】
次に、要素決定部24Aは、入力された文書データを構成する複数の文書要素から出力要素を決定する(ステップS108)。具体的には、まず、図11に示したような見出し指定用ポップアップダイアログを表示する。そして、ダイアログにて注目見出しをユーザが選択指定すると、出力要素情報を決定する。決定の方法は、実施の形態1と同じである。他の詳細についても実施の形態1と同様であるが、実施の形態1のステップS8では、(手書きや図写真を除いて)見出しなどの要素が基本的に画像データとして扱われていたのに対し、本実施の形態ではテキストデータとして扱われている。
【0130】
また、実施の形態1では、手書き注釈に関連する見出しを注目見出しのデフォルトとしたが、本実施の形態の場合、電子注釈やしおりなど特定の文書要素を指定する情報が印刷ドライバソフトにて検出可能である場合には、当該情報を利用して、特定の見出し要素を注目見出しのデフォルトとしてもよい。
【0131】
出力文書作成部28Aは、決定された出力要素情報すなわち、出力範囲内における、注目見出しの説明要素の少なくとも一部(たとえば段落指定など)と、注目見出しを含む複数の見出し要素とを配置して、印刷用のラスタ画像を作成する(ステップS112)。このとき、出力要素情報として決定された説明要素が動画や音声など通常印刷不可能である場合には、要素自体はたとえばサーバ(図示せず)に保存しておき、ラスタ画像にそのURL(Uniform Resource Locator)情報を入れた2次元コード(たとえばバーコード)を埋め込んでもよい。
【0132】
出力処理部30Aは、作成された画像を印刷する処理を行なう(ステップS114)。具体的には、作成された画像データを通信インターフェイス部207を介してMFP1に送信する処理を行なう。これにより、MFP1によって、ステップS112で作成された出力文書(画像)が印刷される。印刷された文書の構成例も、図14に示した例と同様となる。
【0133】
以上で、本実施の形態における文書処理は終了される。
このように、本実施の形態によると、スキャン文書でなくても構造化された文書であれば、スキャン文書の場合と同様に、入力文書の詳細部分と概要とをバランス良くかつきめ細かに出力文書に配置することができる。その結果、ユーザは、出力文書を見るだけで、元の文書を参照しなくても有用な情報を得ることができる。
【0134】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【0135】
【図1】本発明の実施の形態1に従う文書処理装置を含むシステムの概略構成図である。
【図2】本発明の実施の形態1に従うMFPにおける概略の機能構成を示すブロック図である。
【図3】本発明の実施の形態1に従うMFPが備える操作パネル部の外観例を示す図である。
【図4】本発明の実施の形態1に従うパーソナルコンピュータの概略のハードウェア構成を示す模式図である。
【図5】本発明の実施の形態1に従うMFPの機能構成を示す機能ブロック図である。
【図6】本発明の実施の形態1に従う文書処理を示すフローチャートである。
【図7】本発明の実施の形態1における文書要素管理情報のデータ構造の一例を示す図である。
【図8】本発明の実施の形態1において、説明要素検出後の文書要素管理情報の内容例を示す図である。
【図9】スキャンされた文書画像の内容例を示す図である。
【図10】図9に示した文書画像を構成する複数の文書要素の階層構造を示す図である。
【図11】見出し指定画面の一例を示す図である。
【図12】範囲指定画面一例を示す図である。
【図13】図10に示した文書要素のうち出力要素として決定された要素の例を示す図である。
【図14】出力文書(メール本文または印刷文書)の一例を示す図である。
【図15】本発明の実施の形態1の変形例1における見出し指定画面の一例を示す図である。
【図16】本発明の実施の形態2における端末の機能構成を示す機能ブロック図である。
【図17】本発明の実施の形態2に従う文書処理を示すフローチャートである。
【符号の説明】
【0136】
1 MFP、12 画像バッファ部、14 圧縮処理部、16,16A 階層検出部、20 見出し要素抽出部、22 説明要素検出部、23,23A UI(ユーザインターフェイス)部、24,24A 要素決定部、26 認識処理部、28,28A 出力文書作成部、30,30A 出力処理部、42 文書データ入力部、100 制御部、102 メモリ部、104 画像読取部、106 プリント部、108 通信インターフェイス部、110 操作パネル部、112 記憶部、201 CPU、203 内部バス、205 ディスプレイ部、207 通信インターフェイス部、209 入力部、211 ハードディスク部、213 メモリ部、215 CD−ROMドライブ、217 FDDドライブ、217a フレキシブルディスク、300 原稿、PC1,PC2 端末、MS メールサーバ。
【技術分野】
【0001】
本発明は、文書処理装置、文書処理方法および文書処理プログラムに関し、特に、文書データの見出し要素を検出することのできる文書処理装置、文書処理方法および文書処理プログラムに関する。
【背景技術】
【0002】
従来より、文書の構造を利用して見出しを抽出する技術が存在する。
たとえば特許文献1では次のような技術が提案されている。すなわち、スキャン文書にOCR(Optical Character Recognition)をかけた後、解析を行い、見出しを自動抽出する。そして、抽出した見出しを本文とするメールを送信する。このとき、各見出しには見出しが代表する部分文書へのリンク(リンク先はサーバに格納された文書)が埋め込まれることが記載されている。
【0003】
また、特許文献2では次のような技術が提案されている。すなわち、文書の印刷を行う場合、当該文書のデータに対してインデックスデータを検出し、検出できた場合にはインデックスデータに基づいて文章の構造を解析して、各インデックスの内容を画面に表示する。ユーザは表示インデックス内容に基づいて、印刷対象となるインデックスを指定する。印刷は指定インデックスに対応する本文位置から同じ階層レベルの次インデックスまでの部分に対して行なわれる。
【特許文献1】特開2002−290644号公報
【特許文献2】特開2007−283675号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記特許文献1では、見出しを本文とするメールを自動的に作成することができるが、見出しによる概要情報しか出力することができない。逆に、特許文献2では、見出し指定により部分的に切り取られた詳細情報しか出力することができない。
【0005】
本発明は、上記のような問題を解決するためになされたものであって、その目的は、注目部分の詳細な情報と文書全体の概要とのバランスを、簡便に、かつ、きめ細かに制御して出力することができる文書処理装置、文書処理方法および文書処理プログラムを提供することである。
【課題を解決するための手段】
【0006】
この発明のある局面に従う文書処理装置は、文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するための検出手段と、検出手段による検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための決定手段と、決定された出力要素情報を含む出力文書を作成するための作成手段と、作成された出力文書を出力するための出力手段とを備える。
【0007】
好ましくは、概要情報は、複数の見出し要素のうち、指定された見出し要素と同階層および上位階層の見出し要素のみを含む。
【0008】
あるいは、概要情報は、複数の見出し要素のうち、指定された見出し要素と同階層のレベル以上であって、ユーザにより指定された上限レベル以下の階層の見出し要素のみを含むことが望ましい。
【0009】
好ましくは、詳細情報は、特定説明要素のうち、ユーザにより指定された下限レベル以上の階層の説明要素のみを含む。
【0010】
好ましくは、検出手段は、さらに、説明要素の段落の認識処理を行ない、決定手段は、特定説明要素の種別が本文である場合には、詳細情報に含める段落をユーザに選択させる。
【0011】
あるいは、決定手段は、特定説明要素の種別が本文である場合には、文字数、行数、段落数、領域の大きさのいずれかで、詳細情報に含める量を制限することが望ましい。
【0012】
好ましくは、詳細情報は、テキスト、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含む。
【0013】
好ましくは、文書データは、光学的に読取られた文書画像であり、検出手段は、複数の文書要素のうち、特定の種別の文書要素を見出し要素として抽出するための抽出手段と、各文書要素について、従属先の見出し要素を親見出しとして検出することにより、見出し要素ごとの説明要素を検出するための説明要素検出手段とを含む。
【0014】
好ましくは、特定の種別は、表題、セクション見出し、手書き注釈およびキャプションのうち少なくとも一つを含む。
【0015】
好ましくは、説明要素検出手段は、複数の見出し要素の位置関係に基づいて、見出し要素間の階層構造を判断し、手書き注釈の見出し要素については常に、最上位の階層の見出し要素と判断する。
【0016】
好ましくは、表示手段をさらに備え、決定手段は、詳細情報の基準となる見出し要素をユーザに指定させるための指定画面に、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を基準となる見出し要素の候補として表示し、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を基準となる見出し要素の候補として表示する。
【0017】
好ましくは、文書画像中、出力要素情報として決定された部分の領域の画像データについて文字認識を実行することで、文書画像の一部の画像データのみをテキストデータに変換するための認識処理手段をさらに備え、作成手段は、テキストデータに変換された出力要素情報を含む出力文書を作成する。
【0018】
好ましくは、作成手段は、出力文書に含まれる各領域に、文書データの対応する部分へのリンク再現情報を付加し、出力手段は、リンク再現情報が付加された出力文書を、文書データとともに外部の装置に送信するための通信手段を含む。
【0019】
好ましくは、文書データを保存するための記憶手段をさらに備え、作成手段は、出力文書に含まれる各領域に、文書データの対応する部分へのリンク情報を付加し、出力手段は、リンク情報が付加された出力文書を外部の装置に送信するための通信手段を含む。
【0020】
この発明の他の局面に従う文書処理方法は、文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出するステップと、検出結果に基づいて、複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくともに一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するステップと、決定された出力要素情報を含む出力文書を作成するステップと、作成された出力文書を出力するステップとを備える。
【0021】
この発明のさらに他の局面に従う文書処理プログラムは、上記記載の文書処理方法をコンピュータに実行させる。
【発明の効果】
【0022】
本発明によると、指定された見出し要素についての詳細部分と、他の概要とのバランスを、簡便に、かつ、きめ細かに制御して出力することができる。
【発明を実施するための最良の形態】
【0023】
本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。
【0024】
電子メールに文書を添付して送信する際、添付文書中の特定箇所をメール本文中で詳しく示しておきたい場合がよくある。例えば、クライアントに契約書をチェックしてもらいすぐに返事がほしいので、特に見てほしい部分についてはメール本文に転記する一方、全体文書もあとで確認するときのために添付するような場合である。
【0025】
こういった場合には、章や節の見出しなど文書内容の構造を利用して、簡便に該当箇所を指定して示すことができれば便利である。特に、MFP(Multi Function Peripheral)でScanToE−Mailで文書スキャンにより添付文書を送った場合には、該当箇所をコピーして本文に引用することが困難であるので、これができれば非常に便利である。また、このとき該当箇所と同時に、他の部分についても見出しにより概要を提示すれば、該当箇所の文書全体での位置づけがわかりやすくなり、さらに便利である。
【0026】
電子メールで文書を送信する以外にも、例えば、文書を印刷して他人に見せる場合に、一部のみ詳細を印刷すると同時におおよその概要を示すため他の部分については見出しだけ出力できれば便利である。
【0027】
[実施の形態1]
<構成について>
(全体システム構成)
図1は、本発明の実施の形態1に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書処理装置は、MFPに限らず、PC(Personal Computer)、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
【0028】
図1を参照して、本実施の形態に従うMFP1は、原稿300を読取るための画像読取部104と、紙媒体などへの印刷処理を行なうためのプリント部106とを含む。
【0029】
特に、本実施の形態に従うMFP1は、ScanToE−Mailの機能を有する。具体的には、画像読取部104で原稿300を読取ることで文書画像を取得し、この文書画像を含む電子化文書を生成する。そして、たとえば、生成された電子化文書を電子メールに添付して、指定された宛先に送信する。あるいは、生成された電子化文書は内部の記憶装置(図1において図示せず)に保存したまま、文書画像の特定領域へのリンク情報を付加した電子メールを、指定された宛先に送信する。
【0030】
MFP1は、インターネットを介して、メールサーバMSおよび複数の端末PC1,PC2(以下、「端末PC」という)と接続されている。
【0031】
画像読取部104は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む(いずれも図示しない)。これにより、複数枚の原稿を連続的に読取って、一つの電子化文書として生成することができる。代表的に、電子化文書にはPDF(Portable Document Format)などのフォーマットを採用できる。
【0032】
(MFP1の概略構成)
図2は、本発明の実施の形態1に従うMFP1における概略の機能構成を示すブロック図である。
【0033】
図2を参照して、MFP1の機能構成としては、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、操作パネル部110と、記憶部112とを含む。
【0034】
制御部100は、代表的にCPU(Central Processing Unit)などの演算装置から構
成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部102は、代表的にDRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、制御部100で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部108は、代表的に、インターネットを介して端末PC(図1)との間でデータを送受信するための部位であり、たとえば、LANアダプタおよびそれを制御するドライバソフトなどを含む。プリント部106は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。記憶部112は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部100の動作のためのプログラムや制御部100で生成された電子化文書などを格納する。
【0035】
操作パネル部110の外観例を図3に示す。操作パネル部110は、液晶表示装置やタッチパネルなどから構成される表示パネル110aと、ストップボタン110bと、スタートボタン110cと、英数キーなどを含む操作ボタン110dとを備えている。
【0036】
なお、本実施の形態では、表示機能と指示の入力機能とを兼ね備えた操作パネル部110を備えることとしたが、これに代えて、表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。
【0037】
(端末の構成)
図4は、本発明の実施の形態1に従う端末の概略のハードウェア構成を示す模式図である。
【0038】
図4を参照して、端末PCは、たとえば一般的なパーソナルコンピュータであり、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には、文書データ(MFP1で生成された電子化文書を含む)を表示するための閲覧アプリケーションプログラム(以下、「ビューワ」という)、および、文書データを印刷するための印刷ドライバソフトが記憶されている。このようなプログラムは、FDDドライブ217またはCD−ROMドライブ215によって、それぞれフレキシブルディスク217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られてよい。
【0039】
CPU201は、キーボードやマウスなどからなる入力部209を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部205へ出力する。また、CPU201は、LANカードなどからなる通信インターフェイス部207を介して、LANやWANに接続されたMFP1やサーバ装置(図示せず)から電子化文書を取得し、ハードディスク部211などに格納する。また、上述の各部は、内部バス203を介して相互にデータを授受する。
【0040】
なお、端末PCは、パーソナルコンピュータに限定されず、携帯電話などの携帯端末であってもよい。その場合の端末PCは、図4においてFDDドライブ217やCD−ROMドライブ215などを取り除いたものとほぼ等価であるので、詳細な説明は繰返さない。
【0041】
(MFPの機能構成)
図5は、本発明の実施の形態1に従うMFP1の機能構成を示す機能ブロック図である。
【0042】
図5を参照して、MFP1の機能構成としては、画像読取部104と、画像バッファ部12と、圧縮処理部14と、階層検出部16と、UI(User Interface)部23と、要素決定部24と、認識処理部26と、出力文書作成部28と、出力処理部30と、通信インターフェイス部108と、記憶部112とを含む。
【0043】
画像読取部104は、原稿300を読取って文書画像を取得し、その文書画像を画像バッファ部12へ出力する。画像バッファ部12は、画像読取部104が逐次的に出力する文書画像のデータを一時的に格納する部位であり、一旦格納した文書画像を圧縮処理部14および階層検出部16に出力する。
【0044】
圧縮処理部14は、画像バッファ部12から出力される文書画像を圧縮処理して、出力処理部30へ出力する。この圧縮処理による圧縮度合いは、生成される電子化文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよく、また圧縮処理はJPEG(Joint Photographic Experts Group)などの非可逆変換であってもよい。なお、高解像度が要求される場合などには、圧縮処理を省略してもよい。
【0045】
階層検出部16は、文書画像を構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、見出し要素ごとに見出し要素に属する下位階層の文書要素である説明要素とを検出する。本実施の形態において、階層検出部16は、見出し要素抽出部20と説明要素検出部22とを含む。「文書要素」とは、文書を構成する記述要素である。
【0046】
見出し要素抽出部20は、画像バッファ部12から出力される文書画像に含まれる見出し要素を抽出する。その際に、文書画像に含まれる関連要素も検出する。具体的には、見出し要素抽出部20は、文書画像を解析し、文書画像中の以下の文書要素、すなわち、「タイトル(表題)」、「セクション(章・節・項)見出し」、「図」、「表」、「写真」、「キャプション」、「手書き注釈」、および「本文」を検出する。また、その過程において、見出し要素抽出部20は、「段(段組)」を検出し、さらに、各段の「行方向」、および、各段の「接続情報」を検出してもよい。
【0047】
「見出し要素」とは、文書の概要を示すための特定の種別の文書要素であり、上記種別のうち、少なくともタイトル、セクション見出しおよび手書き注釈を含むことが好ましく、さらにキャプションを含むことが好ましい。本実施の形態では、見出し要素はこれら4つの種別の文書要素であることとする。なお、特定の種別は、これら4つの種別のうちの一つでもよいし、複数の組合わせであってもよい。
【0048】
本実施の形態では、見出し要素の種別は、予め製造時に定められていることを前提にするが、ユーザが個別に所望の種別を選択できてもよい。
【0049】
上記「関連要素」とは、見出し要素以外の要素である。
ここで、各種の文書要素の検出手法について、簡単に説明する。
【0050】
「タイトル」は、文書画像内に配置される文字の文字サイズや隣接する領域との間隔に基づいて抽出することができる。「セクション見出し」は、「本文」との関係(「本文」に先行する領域)や、文書画像内におけるオフセット位置やインデント位置などに基づいて抽出することができる。「図」は、テキストブロック以外の領域の2値パターンをとることにより抽出することができる。「表」は、罫線とテキストとの組み合わせなどに基づいて抽出することができる。「写真」は、カラーヒストグラムにおける画像の濃淡変化の度合いなどに基づいて抽出することができる。「キャプション」は、図,表,写真に対して上または下の近傍にある孤立したテキストブロックとして抽出することができる。「手書き」は、字体や行の乱れ具合などに基づいて検出することができる。
【0051】
なお、文書画像内の共通の領域に対して、複数の文書要素が重複して抽出されてもよい。
【0052】
段はたとえば、「図書の電子のための文書認識技術(鎌田 博、藤本 克仁、黒川 浩司)、雑誌FUJITSU、VOL.49,No.6、1998」に開示された公知技術で検出することができる。各段の接続情報は、各段が、文脈等からどの段に接続されるべきかを示す情報(すなわち段の順序を示す情報)であり、たとえば特開平10−40248号公報に開示される公知の技術で検出することができる。行方向の検出は、周知の方法で検出することができる。
【0053】
見出し要素抽出部20は、このような文書要素の抽出に際して、各文書要素の文書画像内における位置も抽出する。本実施の形態では、抽出した各段の接続情報に基づき見出し要素から見出し要素までの本文要素をハンドリングする。見出し要素抽出部20は、文書要素の管理情報(以下、「文書要素管理情報」という)を記述する。文書要素管理情報は、少なくとも、文書要素の位置情報、種別情報、および、文書要素の順序情報を含む。
【0054】
説明要素検出部22は、抽出された複数の文書要素(見出し要素および関連要素)の文書構造を解析することにより、見出し要素ごとの説明要素を検出する。具体的には、各文書要素について、従属先の見出し要素を親見出しとして検出することにより、見出し要素ごとの説明要素を検出する。つまり、本実施の形態では、文書要素ごとに、複数の見出し要素のうちから、所定の位置関係にある見出し要素を親見出しとして検出する。
【0055】
UI部23は、要素決定部24と接続され、検出された複数の見出し要素の画像を含む画面を表示する。また、詳細を表示したい箇所の見出し要素(以下「注目見出し」ともいう)の指定をユーザより受付ける。また、出力対象となる階層レベルの範囲の指示を受付けてもよい。本実施の形態において、UI部23は、操作パネル部110に対応する。
【0056】
要素決定部24は、階層検出部16による検出結果に基づいて、注目見出しについての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、指定された見出し要素を含む複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定する。具体的には、ユーザより指定された注目見出しや階層レベルの範囲などのパラメータから出力要素情報を決定する。
【0057】
認識処理部26は、文書画像中、出力要素情報として決定された部分の領域の画像データについて文字認識を実行して、一部の画像データのみをテキストデータに変換する。つまり、出力範囲にある要素領域について、要素が文字領域であるときには、文字認識を実行しテキストデータに変換する。
【0058】
出力文書作成部28は、出力要素情報を含む出力文書を作成する。本実施の形態では、認識処理部26によりテキストデータに変換された出力要素情報を含む出力文書を作成する。具体的には、出力要素として決定された見出しテキスト(テキスト化された見出し要素)や本文テキスト(テキスト化された本文要素)などを配置し、メール本文を作成する。
【0059】
出力処理部30は、圧縮処理部14からの(圧縮された)文書画像を電子化文書として生成する。そして、出力文書作成部28により作成されたメール本文に、電子化文書(スキャンされた文書画像)を添付して、別途指定するメールアドレスに送信する。または、電子化文書は記憶部112に保存し、作成したメール本文のみを、別途指定するメールアドレスに送信する。
【0060】
上記出力文書作成部28は、メール添付文書または記憶部112に保存された文書の各領域へのリンク情報を埋め込む処理をする。なお、メールに文書画像を添付する場合には、送信先の端末PCにおいてどこにデータが保存されるかは知りえないので、厳密には、リンク情報を復元するための情報(以下「リンク復元情報」という)を各領域に埋め込む。具体的には、リンク復元情報としてスクリプトを対応する箇所に記述する。
【0061】
なお、本実施の形態において出力処理部30は、指定された宛先にメール送信することとするが、限定的ではなく、たとえば、作成された文書を印刷することとしてもよい。または、メール送信に限定されず、FTP(File Transfer Protocol)送信してもよい。つまり、図示しないFTPサーバに、作成した出力文書を送信してもよい。
【0062】
なお、図5に示した各機能ブロックの動作は、メモリ部102中に格納されたソフトウェアを実行することで実現されてもよいし、少なくとも1つについては、ハードウェアで実現されてもよい。
【0063】
<動作について>
図6は、本発明の実施の形態1に従う文書処理を示すフローチャートである。図6のフローチャートに示される文書処理は、制御部100がプログラムをメモリ部102などに読出して実行し、図5に示される各機能を制御することで実現される。
【0064】
図5および図6を参照して、まず、画像読取部104が原稿300を(光学的に)読取って文書画像を生成する(ステップS2)。この生成された文書画像は、画像バッファ部12に格納される。そして、圧縮処理部14が、画像バッファ部12に格納された文書画像を圧縮処理して、出力処理部30へ出力する。出力処理部30において、公知の手法により電子化文書が生成される。
【0065】
一方、見出し要素抽出部20が、画像バッファ部12に格納された文書画像を解析し、文書画像中の上述種別の文書要素(見出し要素および関連要素)を抽出する(ステップS4)。見出し要素抽出部20は、抽出した全ての文書要素についての管理情報を記述する。
【0066】
図7は、本発明の実施の形態1における文書要素管理情報のデータ構造の一例を示す図である。
【0067】
図7を参照して、メモリ部102には、文書要素ごとに、6つのデータ欄が設けられ、これらのうち6つのデータ欄に、それぞれ、要素ID、頁番号、領域左上座標、領域右下座標、要素種別が記録される。残りのデータ欄(親見出し要素)は、この時点では空欄(NULL)である。
【0068】
要素IDは、各文書要素を一意に特定するための識別情報である。頁番号は、対応の文書要素が存在するページを特定するための位置情報である。また、領域左上座標および領域右下座標は、対応の文書要素のページ内での領域(矩形)を特定するための位置情報である。領域左上座標および領域右下座標は、対応する文書要素の領域のサイズを特定するための情報でもある。要素種別は、対応する文書要素の種別を特定するための情報である。
【0069】
再び図6を参照して、説明要素検出部22は、各文書要素について、親見出しを検出する処理を行なう。そして、検出した親見出しの文書IDを、各文書要素に関連付けて文書要素管理情報に記憶する(ステップS6)。
【0070】
図8は、親見出し検出後の文書要素管理情報の内容例を示す図である。
図8を参照して、親見出しが検出されると、文書要素の要素IDに対応付けて親見出しとして検出された見出し要素の要素IDが記録される。
【0071】
ここで、親見出しの検出方法について具体的に説明する。説明要素検出部22は、文書要素の種別に応じて、以下のような方法により親見出しを検出する。
【0072】
文書要素の種別が「タイトル」(見出し要素)の場合、親となる見出しはないので、親見出しIDの欄は空欄のままとする。文書要素の種別が「セクション見出し」(見出し要素)の場合、先行する上位見出し(タイトルを含む)のうち最も近接するものを親見出しとして検出する。先行する見出しがないときは、親見出しIDの欄は空欄とする。なお、見出し要素間の階層レベルは、文字サイズがより大きいかまたは左インデント位置がより左側にあるとき、より上位の見出しと判断する(横書きの場合)。
【0073】
文書要素の種別が「キャプション」(見出し要素)の場合には、セクション見出しの場合と同様の処理を行なう。文書要素の種別が「手書き注釈」(見出し要素)の場合には、最上位の見出しと判断し、親見出しIDの欄は空欄とする。
【0074】
文書要素の種別が「本文」の場合には、先行する上位見出しのうち最も近接するものを親見出しとして検出する。文書要素の種別が「図、表、写真」の場合には、最も近接するキャプションを親見出しとして検出する。
【0075】
なお、文書要素の種別が「手書き注釈」(見出し要素)の場合には、位置が最も近接する他要素(図表・本文など)を検出することで、説明要素を検出する。そして、説明要素として検出された文書要素については、上述の手法により特定された親見出しの他に、手書きの文書要素の要素IDも親見出しIDに追加する。
【0076】
このように、親見出しIDの欄には、通常、0または1つの親見出しの要素IDが記録されるが、手書き注釈の説明要素については、2つの親見出しの要素IDが記録されることもある。
【0077】
説明要素検出部22により各文書要素の親見出しを検出することで、各文書要素の階層レベルおよび文書要素間の従属関係を特定することができる。なお、文書要素の階層レベルおよび従属関係が特定できれば、上記のような方法に限定されない。
【0078】
図8に示した例では、文書要素管理情報を表形式で示したが、要素間の関係は本質的には木構造であるので、XML(eXtensible Markup Language)などを使って記述可能である。
【0079】
再び図6を参照して、要素決定部24は、出力要素の決定処理を実行する(ステップS8)。まず、要素決定部24は、文書要素管理情報に基づいて、ユーザに注目見出しを指定させるための画面(以下「見出し指定画面」という)を操作パネル部110に表示する。見出し指定画面には、階層レベルおよび従属関係を示した見出し要素が表示される。このとき、見出し指定画面では、手書き注釈されている見出し、または、手書き注釈されている本文の直上位の見出しがあるときは、これらをデフォルトの注目見出し(候補)として表示することが好ましい。
【0080】
ユーザより注目見出しが指定されると、要素決定部24は、以下の文書要素を、出力要素(出力対象の文書要素)として決定する。
【0081】
(A) ユーザにより指定された見出し(注目見出し)
(B) 注目見出しが説明する要素(注目見出しの子孫の要素群)
(C) (A),(B)以外の見出し要素
(B)が注目見出しの詳細情報を表わし、(A),(C)が文書の概要情報を表わす。
【0082】
なお、注目見出しは複数選択されてもよい。その場合、出力要素は、それぞれの要素を合わせたものとして決定される。
【0083】
(B)については、注目見出しからの相対的な下限階層レベルを指定可能としてもよい。また、(C)については、注目見出しからの相対的な上限階層レベルを指定可能としてもよい。また、これに加え、出力する見出し要素の種別を指定可能としてもよい。
【0084】
出力要素が決定されると、認識処理部26は、出力要素に対応する各領域について、要素が文字領域であるときには、文字認識を実行しテキストデータに変換する(ステップS10)。このように、本実施の形態では、部分的にOCR処理を行なうことでテキスト変換にかかる時間を節約することができる。
【0085】
次に、出力文書作成部28は、出力文書すなわちメール本文を作成する(ステップS12)。具体的には、出力要素として決定された見出しテキスト、本文テキストあるいは図(画像のまま)などを配置し、メール本文を作成する。
【0086】
また、出力文書作成部28は、ユーザに対し、スキャン文書の出力方法を、メール添付およびデータ保存のうちから選択させてもよい。データ保存が選択された場合、出力処理部30に対し、記憶部112へ電子化文書を保存するよう指示する。そして、出力文書作成部28は、メール本文の各領域(各文書要素の箇所)について、保存された電子化文書の対応する位置へのリンク情報を付加する。なお、リンク情報を付加する領域は、見出し要素の領域のみであってもよい。電子化文書の保存先(ボックス)は、ユーザにより選択させてもよいし、予め設定しておいてもよい。また、本実施の形態では、装置内部の記憶部112に保存されることとしたが、装置外のサーバなどに保存することとしてもよい。
【0087】
これに対し、メール添付が選択された場合には、添付文書(電子化文書)へのリンク情報を復元するためのスクリプトを、対応する見出し箇所などに埋め込む。受信された添付文書の格納方法および格納場所は、メール受信ソフトおよび添付文書のビューワソフトに依存するが、たとえば、それをMS社製「Outlook(登録商標)」およびAdobe社の「Acrobat Reader(登録商標)」に限定することでそういったスクリプトを埋め込むことが可能である。
【0088】
次に、出力処理部30は、作成された出力文書を、通信インターフェイス部108を介して、ユーザにより指定されたメールアドレスに送信する(ステップS14)。この際、メール添付が選択されていた場合には、出力処理部30は、作成された出力文書に電子化文書を添付して送信する。
【0089】
以上で、本実施の形態における文書処理は終了される。
ここで、上記の文書処理のうち特徴的な処理について詳細に説明する。
【0090】
(説明要素の検出について)
図9は、スキャンされた文書画像500の内容例を示す図である。
【0091】
図9を参照して、文書画像500から10個の文書要素1000〜1009が検出されたとする(ステップS4)。これらの文書要素1000〜1009の要素IDが、それぞれID0〜9であるとする。ID0,2,3,5,7の種別が「セクション見出し」であり、ID9の種別が「手書き注釈」である。他のID1,4,6,8の種別は、「本文」である。
【0092】
このような文書要素に対して、説明要素検出部22よる検出処理が実行されると、図10に示すような階層構造となる。図10は、図9に示した文書画像500を構成する文書要素1000〜1009の階層構造を示す図である。
【0093】
図10を参照して、階層レベルは、文書要素管理情報には、明示的に示されないが、たとえば、親見出しのない文書要素のレベルを「0」とし、その子要素のレベルを「1」、孫要素のレベルを「2」というように規定する。なお、階層レベルは番号の小さい方が上位を表わしているものとする。上述のように、手書き注釈の文書要素は親見出しがないため、階層レベルは「0」である。
【0094】
図10に示されるように、ID4の本文(文書要素1004)は、直上の見出し要素であるID3のセクション見出し(文書要素1003)の他に、ID9の手書き注釈(文書要素1009)も親見出しとして検出される。
【0095】
(出力要素の決定について)
図11は、見出し指定画面SC10の一例を示す図である。見出し指定画面SC10は、たとえば、操作パネル部110の表示パネル110aに表示される。
【0096】
図11を参照して、見出し指定画面SC10には、検出された見出し要素の各画像が階層構造を維持して表示される。このような見出し指定画面SC10が表示される段階では、各要素についてOCR処理がなされていないため、見出し要素が文書画像の部分画像領域を使って表示される。見出し指定画面SC10には、実行を指示するためのOKボタンBT1および取消しを指示するためのCancleボタンBT2が表示される。
【0097】
ここで、手書き注釈の見出し要素については、注釈した先を見なければメール本文への挿入の必要性が判断できないため、注釈した先の文書要素が本文など見出し要素以外の要素であっても該当の画像を表示する。本実施の形態では、本文の一部を表示している。
【0098】
なお、本文の画像を表示する際には、見出し要素抽出部20で検出された行を使って、特定の行数のみ出力することとしてもよい。出力する行数はユーザに指定させてもよいし、予め定められていてもよい。同様に、ステップS4で検出された段落を利用して、表示する段落数を制限することとしてもよい。または、1文字ごとの領域を検出して文字数で本文の出力を制限してもよい。または、画像領域の大きさで本文の出力を制限することとしてもよい。なお、このように本文要素の一部のみを表示する場合には、その箇所が選択されると、表示対象となった部分のみを出力要素情報(の詳細情報)に含めてもよい。
【0099】
本実施の形態では、最初にこのような見出し指定画面SC10が表示される際に、たとえば、手書きの見出し要素2009に関連する見出し要素をデフォルトの注目見出しとして、その部分にカーソルをあててもよい。つまり、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を注目見出し(詳細情報の基準となる見出し要素)の候補として表示する。また、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を注目見出しの候補として表示してよい。
【0100】
ユーザにより操作ボタン110dが操作されて、注目する見出し要素として、見出し要素2003が選択されたとする。そうすると、見出し指定画面SC10から図12に示すような範囲指定画面SC12に移行する。
【0101】
図12は、範囲指定画面SC12の一例を示す図である。
図12を参照して、範囲指定画面SC12において、上限指定線L1および下限指定線L2は、出力範囲を指定するための線である。これらの線L1およびL2は、いずれも操作ボタン110dにより移動可能である。上限指定線L1と下限指定線L2との間の階層レベルの文書要素が出力範囲として決定される。なお、上限指定線L1は、注目見出し2003以下の階層レベルには移動不能であり、下限指定線L2は、注目見出し2003以上の階層レベルには移動不能であってよい。
【0102】
範囲指定画面SC12において、上限指定線L1を注目見出し2003の1つ上位の階層レベル(レベル0)まで含むように設定し、下限指定線L2を最下の階層レベル(レベル3)まで含むように設定したとする。その場合、図10に示した文書要素のうち出力要素として決定された要素を、図13に示す。
【0103】
図13は、出力要素として決定された文書要素を示す図である。
図13を参照して、上記(A)として、注目見出し(ID3)が出力要素として決定される。上記(B)として、注目見出しの子孫の要素群であって、下限指定線L2で指定される下限レベル以上の要素群(ID4〜ID8)が出力要素として決定される。上記(C)として、これら以外の見出し要素であって、上限指定線L1で指定される上限レベル以下かつ注目見出しの階層レベル以上の見出し要素(ID0,ID2,ID9)が出力要素として決定される。
【0104】
(出力文書作成)
上記例により決定された出力要素の画像がテキスト化されると(文字領域のみ)、出力文書作成部28によって図14に示されるような出力文書(メール本文)が作成される。図14に示されるように、出力文書には、注目見出しに関する詳細部分と、注目見出しを含む文書の概要とがバランスよく配置される。これにより、メール受信者は、注目箇所の内容を詳細に把握するとともに、文書全体における注目箇所の位置付けも認識することができる。したがって、メール受信者は、別文書(電子化文書)で確認しなくても、メール本文だけで必要な情報を得ることができる。また、本実施の形態では、ユーザが出力要素の上限レベルと下限レベルを設定できるため、ユーザ(送信者)の意図をきめ細かに出力文書に反映させることができる。
【0105】
なお、作成された文書に、追加の本文を挿入可能としてもよい。具体的には、出力文書作成部28は、操作パネル部110の操作ボタン110dからの信号に基づいて、指定された位置に追加の文字データを挿入してもよい。
【0106】
<変形例1>
なお、上記実施の形態では、本文要素は、見出しから見出しまでの本文を一つのものとしてハンドリングを想定していたが、実際にはその一部分のみをメール本文に載せたい場合も考えられる。したがって、変形例として、本文が複数の段落で構成されている場合には、ユーザに(詳細情報に含めるべき)必要な段落を選択させてもよい。
【0107】
具体的には、たとえば、図7,8の文書要素管理情報とは別に、本文要素を段落に分解して認識しておく。そうすることで、段落を個別に指定して一部の段落のみを出力することができる。段落の区切りについては、たとえば特開平6−215184号公報や特開平6−214983号公報などに開示される公知の技術で実現できる。
【0108】
図15は、本発明の実施の形態1の変形例1における見出し指定画面SC14の一例を示す図である。
【0109】
図15を参照して、見出し指定画面SC14では、見出し要素だけでなく、本文要素の画像が段落ごとに示されている。たとえば、注目見出し2003が選択されると、注目見出し2003の子孫要素がすべて選択状態とされる。そして、ユーザに、必要のない段落を指定させる。具体的には、注目見出し2003の本文を構成する2つの段落2004A,2004Bともにはじめは選択状態である。ユーザにより2つ目の段落2004Bが指定されると、要素決定部24は、指定された段落2004Bを非表示の段落として出力対象から除外する。つまり、要素決定部24は、出力範囲内にある本文要素のうち、ユーザにより指定された段落以外を注目見出しの詳細情報として決定する。
【0110】
この場合、認識処理部26は、注目見出しに従属する出力範囲内の本文要素については一部の段落(ユーザにより選択された段落)のみOCR処理する。
【0111】
このように、変形例1によると、注目見出しに従属する出力範囲内の全ての説明要素を出力文書に配置するのではなく、本文要素については一部の段落のみを出力文書に配置することができる。これにより、本当に必要な部分のみを出力文書に含めることが可能となる。
【0112】
なお、必要な段落をユーザに選択させるものに限定されず、たとえば、文字数、行数、段落、領域の大きさのいずれかのパラメータで、詳細情報に含める本文領域の量を制限してもよい。たとえば、注目見出しに従属する出力範囲内の本文要素を全て表示し、表示された本文要素ごとに、詳細情報に含める文字数や領域をユーザに指定させてもよい。
【0113】
<変形例2>
また、上記実施の形態1では、手書き注釈に関連する見出し要素を注目見出しの候補として表示し、実際の注目見出しの選択はユーザに実行させたが、手書き注釈に関連する見出し要素を注目見出しとして確定することとしてもよい。そのようにすることで、ユーザによる操作の手間を減少させることができる。なお、その場合、上限レベルは最上位(レベル0)として予め定めておいてもよい。また、下限レベルは最下位レベルとして予め定めておいてもよい。
【0114】
<変形例3>
実施の形態1では、文書処理装置(MFP1)が画像読取部104を備えており、原稿をスキャンして見出し要素の抽出等を行なったが、限定的ではなく、図8に示した文書要素管理情報をメタデータとして含んだ電子化文書を対象とすることもできる。すなわち、図6のステップS2〜S6の処理に代えて、電子化文書に付加された文書要素管理情報より各要素の階層レベルおよび従属関係を検出する処理を実行すれば、ステップS8以降に示した処理と同様の処理を行なうことができる。
【0115】
[実施の形態2]
上述の実施の形態1では、スキャン文書(文書画像)を元に、出力要素情報を決定したが、本実施の形態では、たとえばXML形式で構造化された電子文書を元に、出力要素情報を決定する。本実施の形態における文書処理装置は、端末PCであることとして説明するが、MFP1であってもよい。あるいは、携帯端末、複写機、ファクシミリ装置、スキャナ装置などであってもよい。MFP1の場合には、たとえばHTML形式で構造化された電子文書が扱われることとしてよい。
【0116】
なお、本実施の形態に従うシステムの構成については、実施の形態1と同様であるため、ここでも実施の形態1で用いた符号を参照して説明する。
【0117】
(機能構成)
図16は、本発明の実施の形態2における端末PCの機能構成を示す機能ブロック図である。
【0118】
図16を参照して、端末PCの機能構成としては、文書データ入力部42と、階層検出部16Aと、UI部23Aと、要素決定部24Aと、出力文書作成部28Aと、出力処理部30Aとを含む。
【0119】
文書データ入力部42は、XML形式の文書データを入力する。見出しや本文など文書要素の種別は、あらかじめXMLのタグとして記述されており、XMLの階層構造も見出しの階層構造に合わせて構成されているものとする。
【0120】
階層検出部16Aは、入力された文書データのタグ情報より、当該文書データを構成する複数の文書要素の階層関係を検出し、複数の見出し要素と、各見出し要素についての説明要素とを検出される。これにより、複数の見出し要素の階層構造と、文書要素間の従属関係とが検出される。
【0121】
UI部23A、要素決定部24A、および出力文書作成部28Aは、それぞれ、実施の形態1で示したUI部23、要素決定部24および出力文書作成部28と概ね同様の機能を有する。
【0122】
ただし、UI部23Aによる見出し指定画面では、画像ではなくテキストデータがそのまま利用される。本実施の形態において、UI部23は、図4に示したディスプレイ部205および入力部209に対応する。
【0123】
出力文書作成部28Aは、リンク情報やリンク再現情報を出力文書に埋め込まない。また、本実施の形態では、実施の形態1と異なり、認識処理部26は機能構成に含まれない。
【0124】
出力処理部30Aは、作成された文書データの出力処理として、たとえば印刷処理を実行する。なお、その場合、図16に示した構成部分は、より大きいコンピュータシステムの一部で、プリンタドライバおよびその周辺についてのものであってよい。以下の説明では、作成された出力文書は印刷されることとするが、限定的ではなく、実施の形態1と同様にメール送信されてもよい。
【0125】
なお、本実施の形態において、文書要素は、テキストの他、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含んでよい。つまり、出力要素情報にこれらが含まれてもよい。
【0126】
(動作について)
図17は、本発明の実施の形態2に従う文書処理を示すフローチャートである。図17のフローチャートに示される処理は、CPU201がプログラムをメモリ部213などに読出して実行し、図16に示される各機能を制御することで実現される。
【0127】
なお、図17に示す処理は、ビューワソフトにて、構造化された文書データ(電子文書)がディスプレイ部205に表示されている際に、ユーザから印刷指示が入力された場合に開始されてよい。
【0128】
図17を参照して、はじめに、文書データ入力部42は、印刷用ドライバソフトにXML形式で構造化された文書データを入力する(ステップS102)。
【0129】
次に、要素決定部24Aは、入力された文書データを構成する複数の文書要素から出力要素を決定する(ステップS108)。具体的には、まず、図11に示したような見出し指定用ポップアップダイアログを表示する。そして、ダイアログにて注目見出しをユーザが選択指定すると、出力要素情報を決定する。決定の方法は、実施の形態1と同じである。他の詳細についても実施の形態1と同様であるが、実施の形態1のステップS8では、(手書きや図写真を除いて)見出しなどの要素が基本的に画像データとして扱われていたのに対し、本実施の形態ではテキストデータとして扱われている。
【0130】
また、実施の形態1では、手書き注釈に関連する見出しを注目見出しのデフォルトとしたが、本実施の形態の場合、電子注釈やしおりなど特定の文書要素を指定する情報が印刷ドライバソフトにて検出可能である場合には、当該情報を利用して、特定の見出し要素を注目見出しのデフォルトとしてもよい。
【0131】
出力文書作成部28Aは、決定された出力要素情報すなわち、出力範囲内における、注目見出しの説明要素の少なくとも一部(たとえば段落指定など)と、注目見出しを含む複数の見出し要素とを配置して、印刷用のラスタ画像を作成する(ステップS112)。このとき、出力要素情報として決定された説明要素が動画や音声など通常印刷不可能である場合には、要素自体はたとえばサーバ(図示せず)に保存しておき、ラスタ画像にそのURL(Uniform Resource Locator)情報を入れた2次元コード(たとえばバーコード)を埋め込んでもよい。
【0132】
出力処理部30Aは、作成された画像を印刷する処理を行なう(ステップS114)。具体的には、作成された画像データを通信インターフェイス部207を介してMFP1に送信する処理を行なう。これにより、MFP1によって、ステップS112で作成された出力文書(画像)が印刷される。印刷された文書の構成例も、図14に示した例と同様となる。
【0133】
以上で、本実施の形態における文書処理は終了される。
このように、本実施の形態によると、スキャン文書でなくても構造化された文書であれば、スキャン文書の場合と同様に、入力文書の詳細部分と概要とをバランス良くかつきめ細かに出力文書に配置することができる。その結果、ユーザは、出力文書を見るだけで、元の文書を参照しなくても有用な情報を得ることができる。
【0134】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【0135】
【図1】本発明の実施の形態1に従う文書処理装置を含むシステムの概略構成図である。
【図2】本発明の実施の形態1に従うMFPにおける概略の機能構成を示すブロック図である。
【図3】本発明の実施の形態1に従うMFPが備える操作パネル部の外観例を示す図である。
【図4】本発明の実施の形態1に従うパーソナルコンピュータの概略のハードウェア構成を示す模式図である。
【図5】本発明の実施の形態1に従うMFPの機能構成を示す機能ブロック図である。
【図6】本発明の実施の形態1に従う文書処理を示すフローチャートである。
【図7】本発明の実施の形態1における文書要素管理情報のデータ構造の一例を示す図である。
【図8】本発明の実施の形態1において、説明要素検出後の文書要素管理情報の内容例を示す図である。
【図9】スキャンされた文書画像の内容例を示す図である。
【図10】図9に示した文書画像を構成する複数の文書要素の階層構造を示す図である。
【図11】見出し指定画面の一例を示す図である。
【図12】範囲指定画面一例を示す図である。
【図13】図10に示した文書要素のうち出力要素として決定された要素の例を示す図である。
【図14】出力文書(メール本文または印刷文書)の一例を示す図である。
【図15】本発明の実施の形態1の変形例1における見出し指定画面の一例を示す図である。
【図16】本発明の実施の形態2における端末の機能構成を示す機能ブロック図である。
【図17】本発明の実施の形態2に従う文書処理を示すフローチャートである。
【符号の説明】
【0136】
1 MFP、12 画像バッファ部、14 圧縮処理部、16,16A 階層検出部、20 見出し要素抽出部、22 説明要素検出部、23,23A UI(ユーザインターフェイス)部、24,24A 要素決定部、26 認識処理部、28,28A 出力文書作成部、30,30A 出力処理部、42 文書データ入力部、100 制御部、102 メモリ部、104 画像読取部、106 プリント部、108 通信インターフェイス部、110 操作パネル部、112 記憶部、201 CPU、203 内部バス、205 ディスプレイ部、207 通信インターフェイス部、209 入力部、211 ハードディスク部、213 メモリ部、215 CD−ROMドライブ、217 FDDドライブ、217a フレキシブルディスク、300 原稿、PC1,PC2 端末、MS メールサーバ。
【特許請求の範囲】
【請求項1】
文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、前記見出し要素ごとに前記見出し要素に属する下位階層の文書要素である説明要素とを検出するための検出手段と、
前記検出手段による検出結果に基づいて、前記複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、前記指定された見出し要素を含む前記複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための決定手段と、
決定された前記出力要素情報を含む出力文書を作成するための作成手段と、
作成された前記出力文書を出力するための出力手段とを備える、文書処理装置。
【請求項2】
前記概要情報は、前記複数の見出し要素のうち、前記指定された見出し要素と同階層および上位階層の見出し要素のみを含む、請求項1に記載の文書処理装置。
【請求項3】
前記概要情報は、前記複数の見出し要素のうち、前記指定された見出し要素と同階層のレベル以上であって、ユーザにより指定された上限レベル以下の階層の見出し要素のみを含む、請求項1に記載の文書処理装置。
【請求項4】
前記詳細情報は、前記特定説明要素のうち、ユーザにより指定された下限レベル以上の階層の説明要素のみを含む、請求項1〜3のいずれかに記載の文書処理装置。
【請求項5】
前記検出手段は、さらに、前記説明要素の段落の認識処理を行ない、
前記決定手段は、前記特定説明要素の種別が本文である場合には、前記詳細情報に含める段落をユーザに選択させる、請求項1〜4のいずれかに記載の文書処理装置。
【請求項6】
前記決定手段は、前記特定説明要素の種別が本文である場合には、文字数、行数、段落数、領域の大きさのいずれかで、前記詳細情報に含める量を制限する、請求項1〜4のいずれかに記載の文書処理装置。
【請求項7】
前記詳細情報は、テキスト、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含む、請求項1〜6のいずれかに記載の文書処理装置。
【請求項8】
前記文書データは、光学的に読取られた文書画像であり、
前記検出手段は、
前記複数の文書要素のうち、特定の種別の文書要素を前記見出し要素として抽出するための抽出手段と、
各前記文書要素について、従属先の見出し要素を親見出しとして検出することにより、前記見出し要素ごとの前記説明要素を検出するための説明要素検出手段とを含む、請求項1〜6のいずれかに記載の文書処理装置。
【請求項9】
前記特定の種別は、表題、セクション見出し、手書き注釈およびキャプションのうち少なくとも一つを含む、請求項8に記載の文書処理装置。
【請求項10】
前記説明要素検出手段は、前記複数の見出し要素の位置関係に基づいて、見出し要素間の階層構造を判断し、手書き注釈の見出し要素については常に、最上位の階層の見出し要素と判断する、請求項8または9に記載の文書処理装置。
【請求項11】
表示手段をさらに備え、
前記決定手段は、前記詳細情報の基準となる見出し要素をユーザに指定させるための指定画面に、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を前記基準となる見出し要素の候補として表示し、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を前記基準となる見出し要素の候補として表示する、請求項8〜10のいずれかに記載の文書処理装置。
【請求項12】
前記文書画像中、前記出力要素情報として決定された部分の領域の画像データについて文字認識を実行することで、前記文書画像の一部の画像データのみをテキストデータに変換するための認識処理手段をさらに備え、
前記作成手段は、前記テキストデータに変換された前記出力要素情報を含む前記出力文書を作成する、請求項8〜11のいずれかに記載の文書処理装置。
【請求項13】
前記作成手段は、前記出力文書に含まれる各領域に、前記文書データの対応する部分へのリンク再現情報を付加し、
前記出力手段は、前記リンク再現情報が付加された前記出力文書を、前記文書データとともに外部の装置に送信するための通信手段を含む、請求項1〜12のいずれかに記載の文書処理装置。
【請求項14】
前記文書データを保存するための記憶手段をさらに備え、
前記作成手段は、前記出力文書に含まれる各領域に、前記文書データの対応する部分へのリンク情報を付加し、
前記出力手段は、前記リンク情報が付加された前記出力文書を外部の装置に送信するための通信手段を含む、請求項1〜13のいずれかに記載の文書処理装置。
【請求項15】
文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、前記見出し要素ごとに前記見出し要素に属する下位階層の文書要素である説明要素とを検出するステップと、
検出結果に基づいて、前記複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくともに一部を含む詳細情報と、前記指定された見出し要素を含む前記複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するステップと、
決定された前記出力要素情報を含む出力文書を作成するステップと、
作成された前記出力文書を出力するステップとを備える、文書処理方法。
【請求項16】
請求項15に記載の文書処理方法をコンピュータに実行させる、文書処理プログラム。
【請求項1】
文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、前記見出し要素ごとに前記見出し要素に属する下位階層の文書要素である説明要素とを検出するための検出手段と、
前記検出手段による検出結果に基づいて、前記複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくとも一部を含む詳細情報と、前記指定された見出し要素を含む前記複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するための決定手段と、
決定された前記出力要素情報を含む出力文書を作成するための作成手段と、
作成された前記出力文書を出力するための出力手段とを備える、文書処理装置。
【請求項2】
前記概要情報は、前記複数の見出し要素のうち、前記指定された見出し要素と同階層および上位階層の見出し要素のみを含む、請求項1に記載の文書処理装置。
【請求項3】
前記概要情報は、前記複数の見出し要素のうち、前記指定された見出し要素と同階層のレベル以上であって、ユーザにより指定された上限レベル以下の階層の見出し要素のみを含む、請求項1に記載の文書処理装置。
【請求項4】
前記詳細情報は、前記特定説明要素のうち、ユーザにより指定された下限レベル以上の階層の説明要素のみを含む、請求項1〜3のいずれかに記載の文書処理装置。
【請求項5】
前記検出手段は、さらに、前記説明要素の段落の認識処理を行ない、
前記決定手段は、前記特定説明要素の種別が本文である場合には、前記詳細情報に含める段落をユーザに選択させる、請求項1〜4のいずれかに記載の文書処理装置。
【請求項6】
前記決定手段は、前記特定説明要素の種別が本文である場合には、文字数、行数、段落数、領域の大きさのいずれかで、前記詳細情報に含める量を制限する、請求項1〜4のいずれかに記載の文書処理装置。
【請求項7】
前記詳細情報は、テキスト、図形、音声、静止画像、動画像、および、それらを他形態に変換したものを含む、請求項1〜6のいずれかに記載の文書処理装置。
【請求項8】
前記文書データは、光学的に読取られた文書画像であり、
前記検出手段は、
前記複数の文書要素のうち、特定の種別の文書要素を前記見出し要素として抽出するための抽出手段と、
各前記文書要素について、従属先の見出し要素を親見出しとして検出することにより、前記見出し要素ごとの前記説明要素を検出するための説明要素検出手段とを含む、請求項1〜6のいずれかに記載の文書処理装置。
【請求項9】
前記特定の種別は、表題、セクション見出し、手書き注釈およびキャプションのうち少なくとも一つを含む、請求項8に記載の文書処理装置。
【請求項10】
前記説明要素検出手段は、前記複数の見出し要素の位置関係に基づいて、見出し要素間の階層構造を判断し、手書き注釈の見出し要素については常に、最上位の階層の見出し要素と判断する、請求項8または9に記載の文書処理装置。
【請求項11】
表示手段をさらに備え、
前記決定手段は、前記詳細情報の基準となる見出し要素をユーザに指定させるための指定画面に、手書き注釈の見出し要素に対応する説明要素が見出し要素であれば、当該見出し要素を前記基準となる見出し要素の候補として表示し、手書き注釈の見出し要素に対応する説明要素が見出し要素以外の文書要素であれば、当該文書要素の直上位の見出し要素を前記基準となる見出し要素の候補として表示する、請求項8〜10のいずれかに記載の文書処理装置。
【請求項12】
前記文書画像中、前記出力要素情報として決定された部分の領域の画像データについて文字認識を実行することで、前記文書画像の一部の画像データのみをテキストデータに変換するための認識処理手段をさらに備え、
前記作成手段は、前記テキストデータに変換された前記出力要素情報を含む前記出力文書を作成する、請求項8〜11のいずれかに記載の文書処理装置。
【請求項13】
前記作成手段は、前記出力文書に含まれる各領域に、前記文書データの対応する部分へのリンク再現情報を付加し、
前記出力手段は、前記リンク再現情報が付加された前記出力文書を、前記文書データとともに外部の装置に送信するための通信手段を含む、請求項1〜12のいずれかに記載の文書処理装置。
【請求項14】
前記文書データを保存するための記憶手段をさらに備え、
前記作成手段は、前記出力文書に含まれる各領域に、前記文書データの対応する部分へのリンク情報を付加し、
前記出力手段は、前記リンク情報が付加された前記出力文書を外部の装置に送信するための通信手段を含む、請求項1〜13のいずれかに記載の文書処理装置。
【請求項15】
文書データを構成する複数の文書要素の階層関係を検出することにより、複数の見出し要素と、前記見出し要素ごとに前記見出し要素に属する下位階層の文書要素である説明要素とを検出するステップと、
検出結果に基づいて、前記複数の見出し要素のうちユーザにより指定された見出し要素についての説明要素を表わす特定説明要素の少なくともに一部を含む詳細情報と、前記指定された見出し要素を含む前記複数の見出し要素の少なくとも一部を含む概要情報とを出力要素情報として決定するステップと、
決定された前記出力要素情報を含む出力文書を作成するステップと、
作成された前記出力文書を出力するステップとを備える、文書処理方法。
【請求項16】
請求項15に記載の文書処理方法をコンピュータに実行させる、文書処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2010−67187(P2010−67187A)
【公開日】平成22年3月25日(2010.3.25)
【国際特許分類】
【出願番号】特願2008−235218(P2008−235218)
【出願日】平成20年9月12日(2008.9.12)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】
【公開日】平成22年3月25日(2010.3.25)
【国際特許分類】
【出願日】平成20年9月12日(2008.9.12)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】
[ Back to top ]