説明

画像読取装置、画像読取方法および画像読取プログラム

【課題】タブ紙を含む複数の原稿を読み取り画像ファイルを作成する際に、タブ紙を検出したページに基づいて生成する目次ページを有する画像ファイルを作成することができる画像読取装置を提供する。
【解決手段】タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置である。この画像読取装置は、タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成する読取手段と、読み取り順に応じたページ番号を付して画像データを記憶し、かつ読取原稿としてタブ紙が検出された場合、このタブ紙の画像データはページとして認識することなく、このタブ紙のページ番号を記憶する記憶手段と、原稿の読み取りが終了した場合、記憶手段に記録されるタブ紙のページ番号に基づいて、画像ファイルの目次を生成する目次生成手段と、生成された目次を画像ファイルの先頭ページとし、読み取った画像データを以降のページに続けて、この画像ファイルを作成する画像ファイル作成手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置、画像読取方法および画像読取プログラムに関する。
【背景技術】
【0002】
近年、データの種類別にアプリケーションを使い分ける必要がなく、各種アプリケーションを一つの統合アプリケーションとして形成するプログラムが提案されている。このプログラムによれば、各アプリケーションで生成されたデータ同士を組み合わせて一つの文書を構成し、ユーザは、各アプリケーションで作成したデータを、その統合アプリケーションに含まれる特定のアプリケーションによって一つの文書にまとめることができる。
【0003】
さらに、ユーザの所望するアプリケーションで作成されるデータをひとまとめにして、文書を作成したり編集したりするとともに、文書情報の所定ページの間にインデックス紙を挿入し、このインデックス紙のタブに印刷する文字列を設定して印刷できる情報処理装置が提供されている(例えば、特許文献1参照。)。
【0004】
特許文献1に記載の技術は、目次情報が予め埋め込まれている文書を印刷する際に、目次で示されたページにタブ紙を挿入し印刷するものである。
【特許文献1】特開2003−296312号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の技術とは逆に、インデックス紙が挿入された文書を、スキャナなどの画像読取装置で読み取って、文書データを生成する場合、タブ紙のページを取り除くため、目次ページを作成するためにページ番号を再計算したり、データを再構成することが必要であった。
【0006】
また、画像読取装置でタブ紙のページを読み取った場合であっても、タブ紙は他の原稿と区別されることなく、読み取られ文書データが生成される。そのため、本来のタブ紙の機能である章区切りを行うことができず、ユーザが目次ページを作成する際には、タブ紙が挿入されたページを指定し、目次ページを作成しなければなかった。
【0007】
本発明は上記従来の課題に鑑みてなされたものであり、本発明の目的は、タブ紙を含む複数の原稿を読み取り画像ファイルを作成する際に、タブ紙を検出したページに基づいて生成する目次ページを有する画像ファイルを作成することができる画像読取装置、画像読取方法および画像読取プログラムを提供することにある。
【課題を解決するための手段】
【0008】
本発明の上記目的は、下記の手段によって達成される。
【0009】
(1) タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置であって、タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成する読取手段と、読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶する記憶手段と、前記記憶手段に記録される前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成する目次生成手段と、生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成する画像ファイル作成手段とを有することを特徴とする画像読取装置。
【0010】
(2) 読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付ける指定手段をさらに有し、前記画像ファイル作成手段は、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルを作成し、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルを作成することを特徴とする上記(1)に記載の画像読取装置。
【0011】
(3) 読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出する手段をさらに有し、前記記憶手段は、前記タブ紙のページ番号と共に前記文字列をさらに記憶し、前記目次生成手段は、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次を生成することを特徴とする上記(1)または(2)に記載の画像読取装置。
【0012】
(4) タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取方法であって、タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成するステップ(a)と、読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶するステップ(b)と、記憶された前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成するステップ(c)と、生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成するステップ(d)とを有することを特徴とする画像読取方法。
【0013】
(5) 読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付けるステップ(e)をさらに有し、前記ステップ(d)において、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルが作成され、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルが作成されることを特徴とする上記(4)に記載の画像読取方法。
【0014】
(6)読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出するステップ(f)をさらに有し、
前記ステップ(b)において、前記タブ紙のページ番号と共に前記文字列がさらに記憶され、前記ステップ(c)において、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次が生成されることを特徴とする上記(4)または(5)に記載の画像読取方法。
【0015】
(7)タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置によって実行されるプログラムであって、タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成する手順(a)と、読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶部に記憶させる手順(b)と、記憶された前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成する手順(c)と、生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成する手順(d)とを画像読取装置に実行させることを特徴とする画像読取プログラム。
【0016】
(8)読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付ける手順(e)をさらに有し、前記手順(d)において、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルが作成され、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルが作成されることを特徴とする上記(7)に記載の画像読取プログラム。
【0017】
(9)読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出する手順(f)をさらに画像読取装置に実行させ、前記手順(b)において、前記タブ紙のページ番号と共に前記文字列がさらに前記記憶部に記憶させられ、前記手順(c)において、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次が生成されることを特徴とする上記(7)または(8)に記載の画像読取プログラム。
【0018】
(10)上記(7)〜(9)のいずれか1つに記載の画像読取プログラムを記録したコンピュータ読み取り可能な記録媒体。
【発明の効果】
【0019】
本発明では、タブ紙を含む複数の原稿を読み取り画像ファイルを作成する際に、タブ紙を検出したページに基づいて生成する目次ページを有する画像ファイルを作成することができる。
【発明を実施するための最良の形態】
【0020】
以下、本発明の実施の形態を、図面を参照して詳細に説明する。
【0021】
図1は、本発明の画像読取装置を組み込むMFPの構成を概略的に示す構成図である。
【0022】
本発明の画像読取装置は、画像形成装置としてのMFP100(Multi−Function Peripheral:多機能周辺機器)に組み込まれて実現され、MFP100の機能の一部を構成する。
【0023】
MFP100は、制御部101、記憶部102、操作パネル部103、ADF(Auto Documennt Feeder)104、画像読取部105、給紙部106、画像形成部107および画像処理部108を備えており、これらは信号をやり取りするためのバスを介して相互に接続される。
【0024】
制御部101はCPUであり、プログラムにしたがって上記各部の制御や各種の演算処理を行い、以下に示す画像読取装置200の制御も行う。記憶部102は、MFP1の基本動作を制御する各種プログラムや各種データを格納しておくROM、作業領域として一時的にプログラムやデータを記憶するRAM、オペレーティングシステムを含む各種プログラムや各種データを格納するハードディスク(HDD)等からなる。これらのROM、RAM、HDDは、以下に示すROM22、RAM23、HDD24にその一部を提供する。
【0025】
操作パネル部103は、タッチパネル、テンキー、スタートボタン、ストップボタン等を備えており、各種情報の表示および各種指示の入力に使用される。
【0026】
ADF104は、セットされたタブ紙を含む複数枚の原稿を1枚ずつ画像読取部105の所定の読み取り位置まで順次搬送し、そして画像読み取り後の原稿を順次排出する。
【0027】
画像読取部105は、所定の読み取り位置にセットされた原稿またはADF104により所定の読み取り位置に搬送された原稿に、蛍光ランプ等の光源で光を当て、その反射光をCCDイメージセンサ等の撮像装置で光電変換して、その電気信号から画像データを生成する。
【0028】
給紙部106は、印刷に使用される記録材としての用紙を収容する。給紙部106は、収容された用紙を1枚ずつ画像形成部107に送り出す。画像形成部107は、帯電、露光、現像、転写および定着の各工程を含む電子写真式プロセス等の周知の作像プロセスを用いて、各種データを用紙上に印刷する。
【0029】
画像処理部108は、画像読取部105で読み取った画像データから文字画像領域、図形画像領域および写真画像領域を分離し、各領域に適切な画像処理を施す。また、画像処理部108は、各領域を位置情報に基づいて合成し、内部ファイル形式により文書ファイルを作成し、文書ファイルをPDFファイルに変換する。
【0030】
なお、MFP100は、通信インタフェースを備えており、例えばパーソナルコンピュータ(PC)や携帯端末などの外部装置と作成したPDFファイル等のデータをやり取りする送受信機能、および原稿を複写するコピー機能を備える。
【0031】
図2は、画像読取装置の構成を機能的に示すブロック図である。
【0032】
図2に示すように、画像読取装置200は、CPU21、ROM22、RAM23、ハードディスク(HDD)24、操作パネル部25、画像処理部26および原稿読取部27を備えており、これらは信号をやり取りするためのバスを介して相互に接続される。
【0033】
CPU21は、上記制御部101の一部の機能を示し、プログラムにしたがって画像読取装置200の各部の制御や各種の演算処理等を行う。ROM22は、画像読取装置200の基本動作を制御する各種プログラムやパラメータを格納する。
【0034】
RAM23は、作業領域として一時的にプログラムやデータを記憶する。RAM23には、操作パネル部103によるタブ紙本体の画像データをPDFファイルに含むか否かの設定を記憶するための領域と、原稿読取部27で読み取った画像データを一時的に記憶するための領域と、タブ紙を検出したページに基づいて生成される目次テーブルを記憶するための領域とが確保される。ハードディスク(HDD)24には、予め用意した定型原稿サイズのデータを記憶するための領域と、生成したPDFファイルを記憶するための領域とが確保される。
【0035】
操作パネル部25は、上記操作パネル部103の一部の機能を示し、タブ紙本体の画像データをPDFファイルに含むか否かを設定する機能を備える。原稿読取部27は、ADF104および画像読取部105からなり、ADF104にセットされた原稿を、画像読取部105により連続的に読み取って、画像データを生成し、ADF104にセットされた原稿が無くなると作動を停止する。
【0036】
図3は、タブ紙を含む読取原稿の一例を示す図である。
【0037】
読取原稿は、10枚の定型サイズの原稿と3枚のタブ紙とからなり、全13ページで構成される。つまり、先頭にタブ紙が配置され、次いで定型サイズの原稿が3枚、タブ紙、定型サイズの原稿が4枚、タブ紙、定型サイズの原稿が3枚の順に配置される。
【0038】
このタブ紙は、原稿の各章を表しており、先頭のタブ紙は章1を表し、章1は4ページで構成され、次のタブ紙は章2を表し、章2は5ページで構成され、次のタブ紙は章3を表し、章3は4ページで構成される。
【0039】
タブ紙は、それぞれ矩形状の本体と、当該本体の一辺の所定位置に設けられる突出したタブとを備える。この例では、タブ紙のタブには、章を表す文字列としてIndex番号が付される。
【0040】
このタブ紙は、3枚の構成要素からなる1セットのタブ紙であり、3タブと称される。なお、タブ紙はインデックス紙とも呼ばれる。図3の例では、タブ紙の並び順は正順と呼ばれ、タブが本体の右側に位置されたときに上層のタブが下層のタブよりも図3の上側に位置するように並べられる。3タブのタブ紙の場合、各タブは、本体の一辺の上部から順に3段階にてそれぞれ下降した位置に設けられる。タブ紙は、通常複数セット分重ねられて所定の給紙トレイにセットされる。
【0041】
図4は、タブ紙を検出する方法を説明するための図である。
【0042】
原稿読取部27は、原稿を主走査方向(図中左から右)にライン単位で読み取る。原稿後端部で突出部が存在するか否かが検出され、検出された突出部が連続するか否かが判断される。その結果、突出部が存在する場合、読み取った原稿はタブ紙であると判断され、突出部が存在しない場合、読み取った原稿は定型サイズの原稿であると判断される。
【0043】
次に、タブ紙が検出された場合、タブ紙の本体とタブ紙とが分離され、目次ページと見出しの文字列とを関連付けた目次テーブルが生成される。目次テーブルは、画像読取装置200のRAM23に記憶され、PDFファイルの目次ページを生成する際に参照される。
【0044】
図3の例では、タブ紙の本体を原稿ページに含める場合、目次ページとしての原稿の1ページ目には、目次文字列「Index1」が関連付けられ、目次ページとしての原稿の5ページ目には、目次文字列「Index2」が関連付けられ、目次ページとしての原稿の10ページ目には、目次文字列「Index3」が関連付けられる。
【0045】
また、タブ紙の本体を原稿ページに含めない場合、目次ページとしての原稿の1ページ目には、目次文字列「Index1」が関連付けられ、目次ページとしての原稿の4ページ目には、目次文字列「Index2」が関連付けられ、目次ページとしての原稿の9ページ目には、目次文字列「Index3」が関連付けられる。
【0046】
タブ紙の本体とタブとを分離する方法としては、定型原稿(A4、A3、レター、タブロイド等)のサイズの情報を予め記憶させておき、タブ紙の画像データのサイズと最も近似する定型原稿を参照することにより、定型原稿のサイズに収まっている箇所が本体であると判断させ、収まっていない残りの画像データがタブであると判断させる方法がある。また、原稿読取部が原稿を読み取る際に、タブ紙のサイズや原稿の読取方法を予め指定させることにより判断させる方法もある。
【0047】
図5および図6は、PDFファイルのデータ構造の記述例を示す図である。
【0048】
PDFファイルは、ヘッダ、ボディ、相互参照表およびトレーラの4つの要素から構成される。
【0049】
ヘッダ(%PDF−1.6)は、そのファイルが準拠するPDF仕様のバージョン情報を特定する。ボディには、ファイルに格納された文書を構成するオブジェクトが記述される。相互参照表には、ファイル中の間接オブジェクトに関する情報が記述されるが、ここでは記述を省略する。トレーラ(trailer)は、ファイル終端記号(%%EOF)を含み、相互参照表の位置およびファイルのボディ内にある一部の特別なオブジェクトの位置を示す。
【0050】
ここで、PDFファイルの各ページを表現するボディについて詳細に説明する。図5および6の例では、ボディには読取原稿の1ページ目から3ページ目と目次ページの表示内容が記述される。
【0051】
オブジェクト1(「1 0 obj」で示されるオブジェクト。以下、「** 0 obj」をオブジェクト**という。)はページオブジェクト(Type/Page)であり、文書の単一ページの属性を指定する。また、オブジェクト1は、ページが必要とするリソースを含む辞書(Resources 2 0 R)、このノードの親であるページツリーノード(Parent 19 0 R)、ページ内容が表示または印刷されるときにクリッピングされる領域(CropBox[0 0 595.22 842])、ページの印刷先となる物理媒体の出力可能最大領域(MediaBox[0 0 595.22 842])などを定義する
オブジェクト2は1ページ目のリソース辞書を定義する。この例では、オブジェクト2は、カラー値が表現されるカラースペース(ColorSpace<</Cs6 32 0 R>>)、参照するフォント辞書(Font<</TT1 30 0 R/TT4 13 0 R/TT6 11 0 R>>)、PostScript出力装置に印刷する際に解釈される定義済みの手続きセット名(ProcSet[/PDF/Text])、グラフィック状態(GS1)のパラメータ辞書(ExtGState<</GS1 35 0 R>)を定義する。
【0052】
オブジェクト3はストリームオブジェクトであり、ストリームデータ(バイトの並び)を記述する辞書とそれに続くストリームデータから構成される。この例では、ストリームデータのバイト数(Length 169)、ストリームデータの処理に適用されるフィルタ名(Filter/FlateDecode)およびストリームデータ(streamとEndstreamのデータ)を定義する。なお、ストリームデータは省略する。
【0053】
このように、原稿の1ページ目は、オブジェクト1〜3に記述されるページオブジェクト、ページのリソース辞書、ストリームオブジェクトにより表現される。同様に、原稿の2ページ目は、オブジェクト4〜6に記述されるページオブジェクト、ページのリソース辞書、ストリームオブジェクトにより表現され、原稿の3ページ目は、オブジェクト7〜9に記述されるページオブジェクト、ページのリソース辞書、ストリームオブジェクトにより表現される。
【0054】
オブジェクト24はページオブジェクト(Type/Page)であり、目次ページを表現する。オブジェクト24は、オブジェクト1、4、7と同様に、ページが必要とするリソースを含む辞書、ページツリーノード、クリッピング領域、ページの印刷先の物理媒体の出力可能最大領域などを定義する。また、それ以外に、ページに関連した注釈を表現する注釈オブジェクトをオブジェクト番号25で指定する(Annots 25 0 R)。注釈機能は、オブジェクトをPDF文書のページ上の場所に関連付け、マウスやキーボードを通じてユーザと対話することができ、これによりページオブジェクトは更新される。
【0055】
オブジェクト25は配列オブジェクト([26 0 R 27 0 R 28 0 R])であり、注釈するオブジェクト番号を指定する。つまり、注釈オブジェクトとして参照する注釈辞書がオブジェクト番号26、27、28に指定される。
【0056】
オブジェクト26は注釈辞書である。注釈のタイプはリンク注釈(Subtype/Link)であり、文書内の別の場所にある宛先へのハイパーテキストリンク(ジャンプ)を表現する。また、ページ上における注釈の場所(Rect[56.4159 753.062 542.92 767.0])は、デフォルトユーザの空間の単位で定義される。また、Aエントリ(A 42 0 R/H/I)は、注釈がアクティブにされたときに実行されるアクションを表現する。つまり、この例では、注釈のアクティブ領域(BS<</S/SW 0/Type/Border>>)内でマウスボタンが押されるか、押し続けられるときに、オブジェクト番号42にジャンプする。同様に、オブジェクト27はオブジェクト番号43にジャンプし、オブジェクト28はオブジェクト番号44にジャンプすることを記述する。
【0057】
オブジェクト37はストリームオブジェクトであり、ストリームデータを記述する辞書とそれに続くストリームデータから構成される。
【0058】
オブジェクト42はGo−toアクション(S/GoTo)であり、ジャンプ先の宛先を示す。この例では、オブジェクト番号1で記述される原稿の1ページ目へジャンプする。つまり、注釈のアクティブ領域内でマウスボタンが押された場合、オブジェクト42にジャンプし(オブジェクト26)、オブジェクト番号1で記述される原稿の1ページ目が表示される(オブジェクト42)。同様に、オブジェクト42はオブジェクト番号4で記述される原稿の2ページ目へジャンプし、オブジェクト43はオブジェクト番号7で記述される原稿の3ページ目へジャンプすることを記述する。
【0059】
オブジェクト19はページツリー(Type/Pages)であり、文書内におけるページの順序を定義して、個々のページを結び付けPDFファイルのページを構成する。この例では、4ページの文書のページツリーがあることを記述する(Count 4)。また、オブジェクト番号24、1、4、7で記述されるページの順番に文書内におけるページが位置付けられる。つまり、PDFファイルは、目次ページ、原稿1ページ目、原稿2ページ目、原稿3ページ目の順にページが構成される。
【0060】
このように、目次ページはPDFファイルの1ページ目に表示される。また、目次ページでは、目次項目(注釈のアクティブ領域)がマウスボタンでクリックされた場合、目次項目にリンクされた各原稿のページが表示される。
【0061】
図7は、画像読取装置における処理の手順を示すフローチャートである。
【0062】
原稿読取部27にセットされた原稿が読み取られる(ステップS101)。原稿読取部27では、ADF104がセットされた原稿を1枚ずつ画像読取部105に順次搬送し、画像読取部105が連続的に読み取って画像データを生成する。
【0063】
生成された画像データが1ページ目であるか否かが判断される(ステップS102)。画像データが1ページ目であると判断された場合(S102:Yes)、PDFファイルが生成され、ヘッダが書き込まれる(ステップS103)。画像読取装置200は、複数の原稿のうち最初の原稿を読み取った場合、PDFファイルをHDD24上に生成し、PDF仕様のバージョン情報を特定してヘッダを書き込む。
【0064】
目次テーブルが生成され(ステップS104)、処理はステップS105に進む。画像読取装置200は、上述した目次テーブルをRAM23上に生成する。
【0065】
一方、ステップS102で、1ページ目でないと判断された場合(S102:No)、原稿後端に突起があるか否かが判断される(ステップS105)。上述したように、画像形成装置200は、原稿後端に突出部が存在するか否かにより、タブ紙であるか定型サイズの原稿であるかを判断する。
【0066】
すなわち、画像読取装置200は、最初に原稿を読み取った場合、PDFファイルおよび目次テーブルを生成し、タブ紙であるか否かを判断する。一方、2ページ目以降の原稿を読み取った場合、そのままタブ紙であるか否かを判断する。
【0067】
原稿後端に突起があると判断された場合(S105:Yes)、読み取った画像データと定型原稿サイズとが比較される(ステップS106)。画像読取装置200は、HDD24から定型原稿サイズのデータを読み出し、RAM23に記録されている読み取った画像データと比較する。
【0068】
読み取った画像データが本体とタブ部分に分離される(ステップS107)。画像読取装置200は、上述した方法で、定型原稿サイズのデータと、読み取った画像データとを比較することで、タブ紙の画像データを本体とタブとに分離して、RAM23に記憶する。
【0069】
タブの本体を含む設定であるか否かが判断される(ステップS108)。画像読取装置200は、タブ紙本体の画像データをPDFファイルに含むか否かの操作パネル部103による設定をRAM23から読み出し、タブの本体を含む設定であるか否かを判断する。
【0070】
タブの本体を含む設定でないと判断された場合(S108:No)、処理はステップS110に進む。一方、タブの本体を含む設定であると判断された場合(S108:Yes)、PDFファイルに本体の画像データが次の画像ページとして追記される(ステップS109)。
【0071】
タブ部分の画像データが文字認識される(ステップS110)。画像読取装置200は、ステップS107で分離したタブ紙のタブ部分の画像データを文字認識する。文字認識の方法としては、たとえば各文字画像の特微量と予め記憶されている辞書パターンとの一致の度合いに基づいて判別する方法等を用いることができる
ページ番号およびステップS110で認識されたタブ部分の文字列が目次テーブルに格納され(ステップS111)、処理はステップ113に進む。画像読取装置200は、ステップS104で生成した目次テーブルにページ番号とタブ部分の文字列を書き込む。
【0072】
一方、ステップS105で、原稿後端に突起がないと判断された場合(S105:No)、PDFファイルに画像データが追記され(ステップS112)、処理はステップ113に進む。
【0073】
つまり、画像読取装置200は、原稿がタブ紙である場合、設定に応じてタブ紙本体の画像データをPDFファイルに追記し、ページ番号とタブ部分の文字列を文字テーブルに格納する。一方、原稿がタブ紙でない場合、画像データを次の原稿ページとしてPDFファイルに追記する。
【0074】
最終ページであるか否かが判断される(ステップS113)。画像読取装置200は、原稿読取部27によりADF104にセットされた原稿が無くなったか否かで判断する。最終ページでないと判断された場合(S113:No)、処理はステップS101に戻り、次の原稿の読み取り処理を行う。
【0075】
一方、最終ページであると判断された場合(S113:Yes)、目次テーブルに基づいて、PDFファイルの目次オブジェクトが生成される(ステップS114)。画像読取装置200は、PDFファイルの原稿ページの書き込みを終了し、目次ページの生成を開始する。
【0076】
ステップS114で生成された目次オブジェクトがPDFファイルに追記される(ステップS115)。画像読取装置200は、PDFファイルの目次ページとして目次オブジェクトを追記する。
【0077】
PDFファイルにフッタが書き込まれ(ステップS116)、処理は終了する。画像読取装置200は、PDFファイルのフッタとしてトレーラを追記する。
【0078】
つまり、画像読取装置200は、原稿を最終ページまで読み取った後、目次テーブルに基づいてPDFファイルの目次ページを生成し追記する。なお、上記で説明したように、追記される目次テーブルは、PDFのページツリー構造を用いて先頭ページに表示される。
【0079】
以上、本実施形態によれば、タブ紙を含む複数の原稿を読み取り画像ファイルを作成する際に、タブ部分の文字列を目次項目とし、その目次項目にタブ紙を検出したページを記載する目次ページを生成することができる。さらに、この目次ページを先頭ページとする画像ファイルを作成することができる。そうすることで、ユーザは、タブ紙を含む複数の原稿を読み取る場合、タブ紙により章区切りされた目次ページ付きの画像ファイルを取得することができる。
【0080】
本発明は、上記した実施の形態のみに限定されるものではなく、特許請求の範囲内において、種々改変することができる。
【0081】
上記実施の形態では、操作パネル部103により、タブ紙本体の画像データをPDFファイルに含むか否かの設定し、タブの本体を含む設定である場合、タブ紙本体の画像データは次の画像ページとして追記された(ステップS109)が、本発明はこれに限定されない。読み取り原稿としてタブ紙が検出された場合、タブ紙本体の画像データはページとして認識されることなく、次の画像データを次の画像ページとしてPDFファイルに追記することもできる。
【0082】
そうすることにより、操作パネル部による設定を省略することができ、ユーザによる入力が不要となる。また、画像読取装置による処理においても、タブ紙の本体を含む設定である否かの判断する処理を省略することができ、処理の簡略化が図れる。
【0083】
また、上記実施の形態では、画像読取装置は、MFP100に組み込まれて実現され、MFP100の機能の一部を構成しているが、本発明はこれに限定されない。本発明の画像読取装置は、原稿読取部および画像処理部を備え、タブ紙を含む複数の原稿を読み取り画像ファイルを作成することができれば、単独の装置で実現することができ、またMFP以外の他の装置に組み込まれてもよい。
【0084】
また、本実施形態の画像処理装置における処理は、専用のハードウェア回路、またはプログラムされたコンピュータのいずれによっても実現することが可能である。上記プログラムは、たとえばフレキシブルディスクやCD−ROMなどのコンピュータ読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピュータ読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部に転送されて記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、装置の一機能としてその装置のソフトウェアに組み込まれてもよい。
【図面の簡単な説明】
【0085】
【図1】本発明の画像読取装置を組み込むMFPの構成を概略的に示す構成図である。
【図2】画像読取装置の構成を機能的に示すブロック図である。
【図3】タブ紙を含む読取原稿の一例を示す図である。
【図4】タブ紙を検出する方法を説明するための図である。
【図5】PDFデータのデータ構造の記述例を示す図である。
【図6】PDFデータのデータ構造の記述例を示す図である。
【図7】画像読取装置における処理の手順を示すフローチャートである。
【符号の説明】
【0086】
21 CPU、
22 ROM、
23 RAM、
24 HDD、
25,103 操作パネル部、
26 画像処理部、
27 原稿読取部、
100 MFP、
101 制御部、
102 記憶部、
104 ADF、
105 画像読取部、
106 給紙部、
107 画像形成部、
108 画像処理部、
200 画像読取装置。

【特許請求の範囲】
【請求項1】
タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置であって、
タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成する読取手段と、
読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶する記憶手段と、
前記記憶手段に記録される前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成する目次生成手段と、
生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成する画像ファイル作成手段と
を有することを特徴とする画像読取装置。
【請求項2】
読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付ける指定手段をさらに有し、
前記画像ファイル作成手段は、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルを作成し、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルを作成することを特徴とする請求項1に記載の画像読取装置。
【請求項3】
読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出する手段をさらに有し、
前記記憶手段は、前記タブ紙のページ番号と共に前記文字列をさらに記憶し、前記目次生成手段は、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次を生成することを特徴とする請求項1または2に記載の画像読取装置。
【請求項4】
タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取方法であって、
タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成するステップ(a)と、
読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶するステップ(b)と、
記憶された前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成するステップ(c)と、
生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成するステップ(d)と
を有することを特徴とする画像読取方法。
【請求項5】
読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付けるステップ(e)をさらに有し、
前記ステップ(d)において、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルが作成され、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルが作成されることを特徴とする請求項4に記載の画像読取方法。
【請求項6】
読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出するステップ(f)をさらに有し、
前記ステップ(b)において、前記タブ紙のページ番号と共に前記文字列がさらに記憶され、前記ステップ(c)において、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次が生成されることを特徴とする請求項4または5に記載の画像読取方法。
【請求項7】
タブ紙を含む複数の原稿を読み取り画像ファイルを作成する画像読取装置によって実行されるプログラムであって、
タブ紙を含め複数の原稿を順次読み取り、原稿の画像データを生成する手順(a)と、
読取原稿としてタブ紙が検出された場合、読み取り順に応じた当該タブ紙のページ番号を記憶部に記憶させる手順(b)と、
記憶された前記タブ紙のページ番号に基づいて、画像ファイルの目次を生成する手順(c)と、
生成された前記目次と読み取った前記画像データとを用いて画像ファイルを作成する手順(d)と
を画像読取装置に実行させることを特徴とする画像読取プログラム。
【請求項8】
読取原稿としてタブ紙が検出された場合、当該タブ紙の画像データをページとして認識するか否かの指定を受け付ける手順(e)をさらに有し、
前記手順(d)において、タブ紙の画像データをページとして認識する指定がされている場合には、当該タブ紙の本体部分の画像データを含む前記画像データを用いて画像ファイルが作成され、タブ紙の画像データをページとして認識する指定がされていない場合には、当該タブ紙の画像データを除く前記画像データを用いて画像ファイルが作成されることを特徴とする請求項7に記載の画像読取プログラム。
【請求項9】
読取原稿としてタブ紙が検出された場合、タブ紙のタブ部分を文字認識し文字列を検出する手順(f)をさらに画像読取装置に実行させ、
前記手順(b)において、前記タブ紙のページ番号と共に前記文字列がさらに前記記憶部に記憶させられ、前記手順(c)において、前記タブ紙のページ番号と前記文字列に基づいて、前記画像ファイルの目次が生成されることを特徴とする請求項7または8に記載の画像読取プログラム。
【請求項10】
請求項7〜9のいずれか1項に記載の画像読取プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate