説明

文書管理システム

【課題】 文サムネイルの代替となる情報を画像ではなくテキストで保存し、かつ、複数サイズの別々のデータではなく変換によってどんなサイズのサムネイルでも再構成できるような情報を保存することを可能にする。
【解決手段】 電子文書の印刷イメージを生成するイメージ生成手段と、イメージ生成手段によって生成された印刷イメージのうち、予め定められたページのイメージデータに対して矩形領域の抽出を施す矩形領域抽出手段と、抽出された矩形領域に文字情報が含まれるか否かを検出する文字情報検出手段と、抽出された矩形領域に含まれる文字情報を認識して文字情報を得る光学文字認識手段とを有し、電子文書の印刷イメージの予め定められたページに含まれる矩形領域と、その矩形領域に含まれる文字情報を保存できることを特徴とする文書管理システム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書管理システムにおいて表示に用いる縮小画像に代わる情報を保存する手法に関する。
【背景技術】
【0002】
文書管理システムに限らず、多数の画像を一覧表示するために縮小された画像を保存し表示するシステムが存在する。特に文書管理システムにおいては、文書の表示あるいは印刷イメージの縮小画像を保存し、文書管理システムのクライアントアプリケーションにおいて一覧表示するような機能を有したものがある。このような縮小画像は一般にサムネイル画像あるいはサムネイルと呼称される。サムネイルは画像情報として保存されるため、保存領域を圧迫することがある。サムネイルを恒久的な情報として保存しないで、表示する時に一時的な情報として生成する従来のシステムも存在するが、文書管理システムのクライアントアプリケーションにおける表示スピードを考慮した場合、恒久的な情報として保存されていることが望ましい。
【0003】
また、文書管理システムのクライアントアプリケーションにおいては、サムネイルを用途に応じて大サイズ、中サイズ、小サイズと違えて表示するような機能を有するものがある。そのためにはそれぞれのサイズの画像情報を保存する必要があり、さらに保存領域を圧迫する可能性がある。原稿を読み取り、その原稿サイズに基づいて、原稿画像のベクトルデータ変換を実行し、読み取り原稿画像に対応する電子ファイルとして、高画質でかつ、データ量を削減した電子ファイルを生成することができるような従来のシステムと手法が存在する(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005-174227号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら特許文献1に記載される従来技術は、すべてのイメージとフォントについてベクトルデータ変換を行い、読み取り原稿画像を忠実に再現するためのデータを保存するため、ある程度の保存データ量削減は見込めるものの、それでもデータ量は決して少なくない。元の文書の情報を把握でき、かつ、保存のためのデータ量をさらに削減するという課題が存在した。
【0006】
そこで本発明では、サムネイルの代替となる情報を画像ではなくテキストで保存し、かつ、複数サイズの別々のデータではなく変換によってどんなサイズのサムネイルでも再構成できるような情報を保存することを可能にするような文書管理システムを提供することが目的である。
【課題を解決するための手段】
【0007】
電子文書の印刷イメージを生成するイメージ生成手段(S701)と、
イメージ生成手段によって生成された印刷イメージのうち、予め定められたページのイメージデータに対して矩形領域の抽出を施す矩形領域抽出手段(S703)と、
抽出された矩形領域に文字情報が含まれるか否かを検出する文字情報検出手段(S708)と、
抽出された矩形領域に含まれる文字情報を認識して文字情報を得る光学文字認識手段(S709)とを有し、
電子文書の印刷イメージの予め定められたページに含まれる矩形領域と、その矩形領域に含まれる文字情報を保存できるような文書管理システム(101)とそのデータ保存手法(図7)。
【発明の効果】
【0008】
本発明によれば、変換によってどんなサイズのサムネイルの代替にもなる情報を保存することを可能にするような文書管理システムを提供することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施例のシステム構成を説明する図
【図2】本発明の実施例の典型的な汎用コンピューターモジュール200の構成を説明する図
【図3】文書管理クライアントのアプリケーションのソフトウエア構成を説明する図
【図4】アプリケーションのユーザーインターフェースの一例を説明する図
【図5】アプリケーションのメインウインドウ400にサムネイルを表示している際のユーザーインターフェースの一例を説明する図
【図6】文書の印刷イメージの一例を説明する図
【図7】印刷イメージからサムネイルを代替する情報を生成して保存する処理を示すフローチャート
【図8】ブロックセレクション処理を印刷イメージに対して実施した場合のイメージ図
【図9】距離情報保存を印刷イメージに対して実施した場合のイメージ図
【図10】縦横サイズ保存を印刷イメージに対して実施した場合のイメージ図
【図11】サムネイルの代替になる情報の一例を説明する図
【図12】サムネイルの代替になる情報からサムネイル表示を得るためのデータ変換の一例を説明する図
【図13】サムネイルを描画する処理を示すフローチャート
【発明を実施するための形態】
【0010】
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【0011】
[実施例1]
図1は、本発明の実施例のシステム構成を説明する概略図である。
【0012】
図1において、105は、インターネットやイントラネットなどのネットワークであり、101~102などのネットワーク対応機器が接続される。101は、文書管理サーバーであり、文書保存、検索など一般的な文書管理サービスを提供する。102は、クライアントPC(クライアントコンピューター)であり、図示しないが、ネットワーク105に複数接続される。クライアントPC102では、文書管理サーバーが提供する文書管理サービスを利用する文書管理クライアントが動作している。文書管理クライアントは、Microsoft Windows(登録商標)やLinuxなどの各種オペレーティングシステム上で動作するアプリケーションであるが、Webブラウザー上で動作するアプリケーションであってもよい。なお、ネットワーク105がインターネットとした場合、文書管理サーバー101は、クラウドサービスとして存在してもよい。その場合のシステム構成は一般的なクラウドサービス構成と同等であるため、詳細に関しては省略する。
【0013】
図2は本発明の実施例の典型的な汎用コンピューターモジュール200の構成を説明するブロック図である。文書管理サーバー101、クライアントPC102は、典型的な汎用コンピューターモジュールである。
【0014】
汎用コンピューターモジュール200には、キーボード204やマウス205のようなポインティングデバイスなどの入力装置、ディスプレイ装置213などの出力装置が接続される。
【0015】
210はネットワークコントローラー(NC)であり、所定のネットワークインターフェース211を介してネットワーク105に接続され、他のネットワーク機器との通信制御処理を実行する。201はCPUであり、少なくとも1つのプロセッサーで構成される。202はメモリであり、RAMやROMから構成される。212はビデオインターフェースであり、ディスプレイ装置213に画像を出力する。203はI/Oインターフェースであり、キーボード204やマウス205からの操作による入力を受け取る。208は記憶装置であり、典型的にハードディスクドライブ(HDD)209を含んでいる。図示されないシリコンドライブが含まれることもある。206は、CD−ROMドライブであり、不揮発性のデータソースとして用いられる。207は、相互接続バスであり、CPU201により、汎用コンピューターモジュール200で動作するMicrosoft WindowsやLinuxなどのオペレーティングシステムに従う形で各ブロック間の通信を仲介する。
【0016】
なお、実施例中の文書管理サーバー101およびクライアントPC102のフローチャートで示される各種制御プログラムは、それぞれのメモリ202、記憶装置208のいずれかの記憶手段に記憶され、それぞれのCPU201により実行される。また、文書管理サーバー101は、文書管理用のデータベースを有するが、そのデータベースも記憶装置208上に構築される。
【0017】
図3は、文書管理クライアントのアプリケーションのソフトウエア構成を説明するブロック図である。アプリケーション301は、各種の機能を実行するためのユーザーインターフェースを備え、ディスプレイ装置213の画面上でユーザーからの要求をキーボード204やマウス205により受け付けて、各機能処理を実行する。
【0018】
302~303は、アプリケーションを構成するコンポーネントを示している。
【0019】
302はアプリケーションのUI部であり、図4で示すユーザーインターフェースの構築や、ユーザーからの各種入力操作の受け付けおよび入力操作による処理結果の表示を行う。
【0020】
303は、ライブラリー管理部であり、アプリケーション301で利用するライブラリーを管理し、ライブラリーへの文書の格納や、ライブラリー内文書の閲覧、更新、属性変更、検索などの各種文書操作を実行する。ここで言うライブラリーとは、文書管理を行うための保存単位のことであり、文書データと、文書属性などの文書管理用のデータを保存する。本発明においては文書のサムネイルデータ、あるいはサムネイルを代替する情報も保存する。アプリケーション301で利用するライブラリーには、データの保存場所により、2種類の形態が存在する。
【0021】
1つ目は、ローカルのハードディスク209にデータ保存領域を作成し、アプリケーション301自体が管理するローカルライブラリーの形態である。この形態では、文書管理サーバー101を必要とせず、文書管理クライアント102のみでシステムを構成することが可能である。
【0022】
2つ目は、文書管理サーバー101が提供する文書管理サービスに文書管理を委任する共有ライブラリーの形態である。この形態では、ライブラリー管理部303は、アプリケーションUI部302から受け取った文書操作の要求を文書管理サーバー101に渡し、その結果を文書管理サーバーから受け取って、アプリケーションUI部302に渡す。この2つ目の形態では、ライブラリー管理部303が文書管理サーバー101の文書管理サービスとのデータの仲介を行うだけの簡素な構成で済むため、文書管理クライアントがWebブラウザー上で動作する構成の場合には、好適な形態となる。
【0023】
305は、ライブラリー管理部303が記憶装置208に構築したローカルライブラリー、または、共有ライブラリーが提供する文書管理サーバーに接続するためのインターフェースを示す。
【0024】
図4は、アプリケーションのユーザーインターフェースの一例を示している。400はメインウインドウを示している。
【0025】
401は、ナビゲーションペインである。ナビゲーションペイン401には、アプリケーションで登録したライブラリーとライブラリー下に配置されるフォルダーが表示される。ナビゲーションペインで、ライブラリー、または、ライブラリー下に配置されるフォルダーを選択することで、現在の場所を移動することができる。図では、ライブラリー405~407とフォルダー408~409が表示されており、フォルダー408が現在の場所として選択されている。
【0026】
402は、ナビゲーションペインで選択している場所に格納されている文書やフォルダーを表示するファイルリストペインである。図では、5つの文書がリストされている。
【0027】
403はペインの表示・非表示を切り替えるパネルであり、ナビゲーションペイン401を表示するボタン以外にも検索ペイン、プレビューペインなどに切り替えるボタンを備える。検索ペイン、プレビューペインについては詳細を省略する。
【0028】
404は、ファイルリストペイン402に表示される文書を、リスト表示、大サムネイル表示、中サムネイル表示、小サムネイル表示と切り換えるボタンである。
【0029】
図5は、アプリケーションのメインウインドウ400でファイルリストペイン402にサムネイルを表示している際のユーザーインターフェースの一例を示している。
【0030】
500は、サムネイルで表示された文書の例である。
【0031】
501は、スライダーバーであり、ファイルリストペイン402にすべての文書を一覧表示できない場合にのみ表示される。
【0032】
図6は、図5においてサムネイル表示されている文書500の印刷イメージである。
【0033】
図7は、印刷イメージからサムネイルを代替する情報を生成して保存する処理を示すフローチャートである。
【0034】
なおフローチャートにおいてこの処理は、文書保存時に文書管理クライアントのアプリケーション301で実施されて文書管理サーバー101に保存することを想定している。しかし、文書管理クライアントのアプリケーション301から格納すべき文書を受け付けた文書管理サーバー101で実施されても同じ効果が得られる。
【0035】
S701で、アプリケーション301が、保存する文書の先頭ページの印刷イメージを生成する。
【0036】
S702で、アプリケーション301が、S701で生成した先頭ページイメージデータの縦横サイズをピクセル値で保存する。
【0037】
S703で、アプリケーション301が、先頭ページイメージデータに対して矩形領域の抽出処理を実施する。なお、本実施例において、矩形領域を以下ブロックと呼称し、矩形領域の抽出処理を以下ブロックセレクション処理と呼称する。
【0038】
S704で、アプリケーション301が、抽出されたブロックのすべてに固有の番号を振る。
【0039】
S705で、アプリケーション301が、最初のブロックを選択状態にする。
【0040】
S706で、アプリケーション301が、選択したブロックの位置をピクセル値でブロックの番号と紐付けて保存する。なお、本実施例においてブロックの位置は、イメージ全体の上端および左端からブロックの上端および左端までの距離で表すものとする。
【0041】
S707で、アプリケーション301が、選択したブロックの縦横サイズをピクセル値でブロックの番号と紐付けて保存する。
【0042】
S708で、アプリケーション301が、ブロックに文字列情報が含まれているかどうかを検出する。検出されればS709に、そうでなければS711に進む。
【0043】
S709で、アプリケーション301が、ブロックのイメージに光学文字認識処理を実施する。なお、本実施例において、光学文字認識処理を以下OCR処理と呼称する。
【0044】
S710で、アプリケーション301が、OCR処理によって得られた文字列をブロックの番号と紐付けて保存する。
【0045】
S711で、アプリケーション301が、他のブロックが存在するかどうかを確認する。他のブロックが存在すればS712に進み、そうでなければ本フローチャートで示す処理を終了する。
【0046】
S712で、アプリケーション301が、次のブロックを選択状態にしてS706に進む。
【0047】
図8は、S703のブロックセレクション処理を、図6で示した印刷イメージに対して実施した場合のイメージ図である。
【0048】
図9は、S706の距離情報保存を、図6で示した印刷イメージに対して実施した場合のイメージ図である。イメージ全体の横サイズをL0、縦サイズをM0で表している。対して、S705で最初のブロックとして選択されたブロックについて、イメージ全体の左端からブロックの左端までの距離をX1、イメージ全体の上端からブロックの上端までの距離をY1で表している。同様に、S704で番号づけされたブロックについて、X2とY2、X3とY3という組み合わせで情報を保存していく。
【0049】
図10は、S707の縦横サイズ保存を、図6で示した印刷イメージに対して実施した場合のイメージ図である。図8同様イメージ全体のサイズをL0、M0で表している。対して、S705で最初のブロックとして選択されたブロックについて、横サイズをL1、縦サイズをM1で表している。同様に、S704で番号づけされたブロックについて、L2とM2、L3とM3という組み合わせで情報を保存していく。
【0050】
以上に示した動作によれば、印刷イメージからサムネイルの代替になる情報を保存することができる。
【0051】
[実施例2]
実施例1において、印刷イメージからサムネイルの代替になる情報を保存する手法を示した。以下にサムネイルの代替になる情報から図5のサムネイル500のような表示を得る手法を示す。
【0052】
図11は、図6に示した印刷イメージについて、図7に示したフローチャートで保存されたサムネイルの代替になる情報の一例である。実施例1に示したように、印刷イメージ全体のサイズがL0とM0で保存されている。そして、それぞれのブロックのサイズと位置、そしてS710で示したように、OCR処理によって得られた文字列が保存されている。本例において3番目のブロックは、S708で示した処理において文字列情報が検出されなかった、つまり、イメージのみのブロックとして認識されたことを示している。これらの情報は、XMLのような構造化された書式のテキストデータで保存される。このデータの総量はデータを構造化するための付加情報を含めても一般的なサムネイルイメージデータの保存量よりも少なく、サムネイルの代替になる情報を少ないデータ量で保存できることを示している。
【0053】
図12は、図11に示した保存データから図5のサムネイル500のような表示を得るためのデータ変換を示す。
【0054】
サムネイル表示の横幅をピクセル値でl0とし、そこからサムネイルのサイズと、すべてのブロックのサイズと位置を計算式で求めていることを示している。3番目のブロック以降も同様の計算式で算出できるため省略している。
【0055】
このように算出した値をもとに矩形を描画し、矩形内にテキストを表示することで、サムネイル500のような表示を得ることができる。
【0056】
なお、図12においては印刷イメージの横サイズL0とサムネイルの横サイズl0を基準にしてサムネイルのサイズやブロックのサイズと位置を算出しているが、印刷イメージの縦サイズM0とサムネイルの縦サイズm0を基準にしても得られる効果は同じである。
【0057】
図13は、アプリケーション301がファイルリストペイン402にサムネイルを描画する処理を示すフローチャートである。
【0058】
S1301で、アプリケーション301が、ライブラリー管理部303を経由してサムネイル代替情報を取得する。
【0059】
S1302で、アプリケーション301が、サムネイル表示領域からサムネイルの横サイズを決定する。これは図12で示したサムネイルのサイズl0に相当する。
【0060】
S1303で、アプリケーション301が、サムネイル代替情報に含まれるページイメージの縦横サイズを取得する。これは図11で示したページイメージサイズのL0とM0に相当する。
【0061】
S1304で、アプリケーション301が、サムネイル代替情報に含まれるページイメージの横サイズとサムネイルの横サイズとの比を基準値として設定する。これは図12で示したl0/L0に相当する。
【0062】
S1305で、アプリケーション301が、サムネイル代替情報に含まれるページイメージの縦サイズと設定した基準値を用いてサムネイルの縦サイズを算出する。これは図12で示したM0×(l0/L0)に相当する。
【0063】
S1306で、アプリケーション301が、S1305で算出したサムネイルの縦サイズがサムネイル表示領域に収まるかどうかを判断する。収まらなければS1307に、収まればS1310に進む。
【0064】
S1307で、アプリケーション301が、サムネイル表示領域からサムネイルの横サイズを決定する。
【0065】
S1308で、アプリケーション301が、サムネイル代替情報に含まれるページイメージの縦サイズとサムネイルの縦サイズとの比を基準値として設定する。
【0066】
S1309で、アプリケーション301が、サムネイル代替情報に含まれるページイメージの横サイズと設定した基準値を用いてサムネイルの横サイズを算出する。
【0067】
S1310で、アプリケーション301が、サムネイル表示領域にサムネイルの枠線を描画する。
【0068】
S1311で、アプリケーション301が、サムネイル代替情報に含まれる最初のブロックの情報を取得する。
【0069】
S1312で、アプリケーション301が、サムネイル代替情報に含まれるブロックの縦横サイズと設定した基準値を用いてサムネイル上のブロックの縦横サイズを算出する。これは図12で示したl1とm1に相当する。
【0070】
S1313で、アプリケーション301が、サムネイル代替情報に含まれるブロックの位置情報と設定した基準値を用いてサムネイル上のブロックの位置を算出する。これは図12で示したx1とy1に相当する。
【0071】
S1314で、アプリケーション301が、サムネイル表示領域にブロックの枠線を描画する。
【0072】
S1315で、アプリケーション301が、ブロックに文字列が含まれるかどうかを判断する。含まれればS1316に、含まれなければS1320に進む。
【0073】
S1316で、アプリケーション301が、あらかじめ定められた書体とポイント数のフォントがサムネイル上に描画されるブロック内に何文字収まるか算出する。
【0074】
S1317で、アプリケーション301が、S1316で算出された文字数分の文字列をあらかじめ定められた書体とポイント数のフォントでブロック内に描画する。
【0075】
S1318で、アプリケーション301が、次のブロックが存在するかどうかを判断する。存在すればS1319に進み、存在しなければ本フローチャートで示す処理を終了する。
【0076】
S1319で、アプリケーション301が、サムネイル代替情報に含まれる次のブロックの情報を取得する。
【0077】
S1320で、アプリケーション301が、ブロック内に塗りつぶしの処理を描画する。塗りつぶしは斜線のような効果でも、あらかじめ定められた特定の色を用いた塗りつぶしでも、どのような処理であってもよい。
【0078】
以上に示した動作によれば、複数サイズの別々のデータを保存することなく、変換によってどんなサイズのサムネイルでも再構成して表示することができる。
【0079】
[実施例3]
実施例1において、図7のS708でブロックに文字列情報が含まれないと検出された場合にはテキストの保存がスキップされる。その結果、実施例2に示した手順によれば、図13のS1320で示したように該当するブロックは塗りつぶしで表示される。
【0080】
図7のS708でブロックに文字列情報が含まれないと検出された場合には該当ブロックのイメージを保存するという処理を追加することができる。そして、図13のS1320に続いて該当ブロックに縮小イメージを表示する処理を加えることができる。
【0081】
このような手順を追加することで、サムネイルの代替となる情報のデータ量を削減するという効果は薄れるが、より可読性の高いサムネイルの表示を提供することができる。
【符号の説明】
【0082】
101 文書管理サーバー
301 文書管理クライアントのアプリケーション
402 ファイルリストペイン
500 サムネイル表示


【特許請求の範囲】
【請求項1】
電子文書の印刷イメージを生成するイメージ生成手段(S701)と、
イメージ生成手段によって生成された印刷イメージのうち、予め定められたページのイメージデータに対して矩形領域の抽出を施す矩形領域抽出手段(S703)と、
抽出された矩形領域に文字情報が含まれるか否かを検出する文字情報検出手段(S708)と、
抽出された矩形領域に含まれる文字情報を認識して文字情報を得る光学文字認識手段(S709)とを有し、
電子文書の印刷イメージの予め定められたページに含まれる矩形領域と、その矩形領域に含まれる文字情報を保存できることを特徴とする文書管理システム(101)。
【請求項2】
前記矩形領域抽出手段と前記光学文字認識手段によって得られた保存データから、矩形のサイズと位置を算出できる矩形情報再計算手段(S1312、S1313)を有し、
前記データ保存手法によって保存されたデータからサムネイルの代替となるような矩形イメージを生成して利用者に表示できるようなユーザーインターフェースをそなえることを特徴とする請求項1に記載の文書管理システム。
【請求項3】
前記文字情報検出手段によって文字情報が含まれていないと検出された場合に矩形内のイメージ情報を保存するイメージ保存手段を有し、
サムネイルの代替となるような矩形イメージにおいてイメージ情報を併せて表示できるようなユーザーインターフェースをそなえることを特徴とする請求項2に記載の文書管理システム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2013−20454(P2013−20454A)
【公開日】平成25年1月31日(2013.1.31)
【国際特許分類】
【出願番号】特願2011−153448(P2011−153448)
【出願日】平成23年7月12日(2011.7.12)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】