説明

画像処理装置

【課題】 新聞・雑誌を複写した際の出展元が複写物を見て判る様にする。
【解決手段】 スキャナ101で文字列が記載された原稿を読み取り、文字列の特徴情報を検出し、記憶部104に格納されているデータを参照して、検出した文字列の特徴情報に該当する出展元情報を特定し、特定した出展元情報を読み取った原稿の複写画像に付加する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複写した原稿の出展元を判別する画像処理装置に関するものである。
【背景技術】
【0002】
従来、新聞の記事等の原稿を複数寄せ集めて複写するスクラップ作業を行なう際には、切り取った複数の原稿を一枚の台紙に貼り付けてその台紙を複写するか、切り取った複数の原稿を直接複写装置の原稿台に載せて複写している。その際に、複写された出力物には、複写された原稿画像毎に手書きで出典元を付記している。また、原稿の必要部分を画像読取装置で読み取り、読み取られた原稿の画像データをコンピュータへ取り込み、加工して出力する場合においても、原稿の出典元を付記することが必要となっている(特許文献1参照)。
【特許文献1】特開平05−292294号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、いずれの場合においても出典を確認しながら手作業で入力するのは大変時間が掛かる面倒な作業であるばかりでなく、出典を間違えてしまうことによる人為的ミスも少なからず発生する。
【0004】
そこで、本発明では、複数の原稿を寄せ集めて複写するスクラップ作業を行う場合、各原稿の出典元などの情報を出力物に容易に付加できる様にすることを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決するために、本発明の画像処理装置は、文字列を含んだ原稿の画像を読み取る読取手段と、前記読取手段により読み取られた原稿の文字列の特徴情報を検出する検出手段と、前記検出手段により検出した文字列の特徴情報と、記憶部に記憶された出展元毎の文字列の特徴情報とに基づいて、前記原稿の出展元をあらわす出展元情報を取得する取得手段と、を有することを特徴とする。
【発明の効果】
【0006】
本発明によれば、操作者の手を煩わせることなく、複数の原稿の出展元情報を出力物に付加することができ、スクラップ作業に掛かる時間を削減することができるものである。
【発明を実施するための最良の形態】
【0007】
以下、図面を参照して本発明の実施形態を説明する。
【0008】
図1は、本発明を適用できる画像処理装置の構成を示すブロック図である。100は画像処理装置に対する指示を入力するためのキーや各種情報を表示する表示部を有する操作部である。101は原稿の画像を読み取り、電子データとして出力する読取手段としてのスキャナ部である。107は像形成手段としてのプリンタ部であり、本実施の形態では周知の電子写真方式のプリンタとするが、インクジェット方式や他の方式のプリンタであっても良い。103は画像処理装置全体を制御するとともに、各種画像処理を行う制御手段としてのCPUである。102はスキャナ102が読み取った画像を記憶したり、プリンタ部107に出力する前の画像を記憶したり、CPU103の作業領域として機能するする記憶手段としてのRAMである。106はCPU103の制御プログラムや画像処理プログラム等を記憶したROMである。104は後述の出展元情報等を格納してあるデータ記憶部であり、ハードディスクドライブHDDを有している。なお、記憶部104は画像処理装置本体内に格納されていても良いし、外付けで画像処理装置本体と通信されていても構わない。105は出展元情報等の原稿情報を出力物(スクラップ)に付加するための入力デバイスである。使い方は後述する。
【0009】
次に、全体の動作について説明する。操作部100の操作によりスキャナ101によってイメージ情報として読み込まれた各原稿は、まずRAM102に格納される。次にRAM102に格納されたイメージデータに基づいて文字列の特徴情報を検出する。文字列の特徴情報の検出はCPU103が実行するが、専用の回路を設けて検出させてもよい。特徴情報については後述する。記憶部104には出展元の文字列毎に文字列の特徴情報が出展元情報と対応付けて登録されており、検出した文字列の特徴情報との照合が行われる。記憶部104に登録されている文字列の特徴情報の中に検出した文字列の特徴情報と一致したものがある場合、原稿の出典元情報等の原稿情報が取得され、RAM102に格納される。なお、RAM102とは別のメモリを設け、そこに出展元情報を記憶する様にしても良い。このように、CPU103は文字列の特徴情報を検出する検出手段、出展元情報を取得する取得手段としても機能する。
【0010】
一方、検出した文字列の特徴情報に該当する出展元情報が記憶部104に登録されていない場合は、ユーザが入力デバイス105を用いて出展元情報を入力し、入力した出展元情報がRAM102に格納される。なお、入力デバイス105は操作部100と兼用されてもよい。
【0011】
続いてCPU103は、RAMに格納されたイメージデータと出展元情報とをプリンタ107に転送する。その結果、プリンタ107で出展元情報が付加されたスクラップが作成される。
【0012】
次に、読み込まれた画像情報データと記憶部104に登録されている情報との照合方法について図2、図3、図6を用いて説明する。
【0013】
図2においては、文字列1は日本語の横書き文字列、文字列2は英語の文字列である。これらの文字列中の文字の大きさ・文字間隔・行間等の文字の割付状態や画像部と非画像部の濃度コントラスト等の文書の特徴を示す特徴情報がイメージ情報として記憶部104に登録されている。なお、この特徴情報は、出版物や新聞ごとに異なるものであり、複数の出展元情報と対応付けて登録されている。
【0014】
図3は、それら文字列情報の読み取り内容を説明した図である。先ず、各行の文字の高さ:h、各行間隔の長さ:hg、各行の各文字幅:w、各行の各文字間隔:wgをそれぞれ読み取り、縦書きか横書きかの判断を行なう。縦書きであれば列の長さ:vpを求め、横書きであれば行の長さ:wpを求めてRAM102へ登録する。また、このとき各行の各文字幅wが同じ場合、つまりw1=w2=w3=・・・=wNの場合は日本語の文字列であると判断し、横書きであれば行の文字数を求め、縦書きであれば列の文字数を求めてRAM102へ登録する。一方、英語などの西欧圏の言語では文字間隔や単語の間隔を各行で調整しているので1行の文字数は一定ではないが、この場合は、段落の幅:wpと段落同士の間隔wpgを求めてRAM102へ登録する。
【0015】
日本語における縦書きか横書きかの判断は、hgとwgの大きさで判断している。hgの方がwgより大きい場合は横書き、wgの方がhgより大きい場合は縦書きと判断している。図3の文字列1においては、横書きなので、行の文字数である10がRAM102へ登録される。
【0016】
英語などの西欧圏の言語では、文字の種類が日本語に比べて少ないので、各文字の特徴データを記憶しておき、周知の文字認識処理によりすべての文字が英語などの西欧圏の文字であるか否かを判断することにより日本語でないか否かを判断することもできる。
【0017】
図6は、複数の新聞紙(A新聞・B新聞・C新聞)と複数の情報誌(D誌・E誌・F誌)、及び英語新聞(G新聞)と英語の情報誌(H誌)の文字列の特徴情報である各種パラメータを示す図である。パラメータとしては、画像部と非画像部との濃度比、各行の文字数、各行の文字の高さh、各行間隔の長さhg、各行の各文字幅w、各行の各文字間隔のデータwg、縦書きか横書きかを示すデータである。また、画像部と非画像部との濃度比は原稿を読み取った時の光学的反射濃度であり、新聞紙や情報誌の紙質によって濃度比が異なることを利用して、より精度の高い原稿情報の区別を行なうことが可能である。
【0018】
CPU103は、図6のデータに基づき、読み取った原稿イメージ情報との照合を行ない、原稿の出典元情報などの原稿情報を確定している。
【0019】
図4は、出展元情報の判別処理を含む複写処理の手順を示すフローチャートである。以下フローチャートに従って説明する。まず、CPU103は、操作部100からの読取指示があると、スキャナ101により原稿の画像を読み取り、RAM102へ記憶する(S1)。CPU103は、RAM102に記憶された画像を解析し、原稿の画像部・非画像部の濃度を求める(S2)。続いて、CPU103は、各行の文字の高さ、各行間隔の長さ、各行の各文字幅、各行の各文字間隔を求める(S3〜S6)。CPU103は、求めた各種パラメータに基づいて、原稿の文書が縦書きか横書きかを判断し、縦書きであれば列の長さを、横書きであれば行の長さを求める(S7)。
【0020】
次に、CPU103は、各行の各文字幅が同じか否かを判断し(S8)、同じ場合は読み取った文字列が日本語の文字列であると判断し、横書きであれば行の文字数を、縦書きであれば列の文字数を求め、RAM102へ記憶する(S9)。一方、各行の各文字幅が異なる場合は、CPU103は、読み取った文字列が英語などの西欧圏の言語の文字列であると判断し、段落の幅と段落同士の間隔を求め、RAM102へ記憶する(S10,S11)。
【0021】
CPU103は、ここまでに求めた文字列の特徴情報(パラメータ)をデータ記憶部104のデータと照合(S12)し、データ記憶部に該当するデータが登録されているか否かを判断する(S13)。
【0022】
そして、該当するデータが登録されていれば、CPU103は、その原稿の出典元情報を特定し(S14)、特定した出展元情報を原稿画像に付加して出力する(S15)。即ち、出展元情報が付加された出力物が得られる。
【0023】
一方、S13で該当するデータが登録されていなければ、CPU103は、そのデータを新たに登録するか否かの判断を操作部100によりユーザに問い合わせ、その答えの入力を判断する(S16)。登録する指示が入力された場合は、CPU103は、原稿の出典元情報などが操作部100から入力されるのを待って記憶部104へ登録する(S17)。そして、CPU103は、入力された原稿情報(出展元情報など)を原稿画像に付加して出力する(S15)。即ち、出展元情報が付加された出力物が得られる。また、S16で、登録しない指示が入力された場合は、CPU103は、出典元情報を付加せずに原稿画像を出力する。即ち、出展元情報が付加されていない出力物が得られる。
【0024】
図5は本実施形態の画像処理装置で複写された出力物の一例を示す図である。501〜504それぞれG新聞、D誌、A新聞、B新聞を原稿とした複写画像である。500はそれら4つの原稿のまとめて複写した出力物である。出力物500には、各原稿毎(出展元毎)に出典元情報がそれぞれの複写画像の下側に付加されている。更に出展元情報の左側には日付情報が付加されている。日付情報は、操作部100もしくは入力デバイス105によりユーザが入力できる。
【0025】
なお、各原稿を個別に読み取り、各原稿の複写画像を画像処理装置内で合成して図5に示す出力物を形成する様にしても良い。
【0026】
本発明は、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。例えば、プリンタ、ファクシミリ、PC、サーバとクライアントとを含むコンピュータシステムなどの如くである。
【0027】
本発明は、前述した実施形態の各機能を実現するソフトウェアプログラムを、システム若しくは装置に対して直接または遠隔から供給し、そのシステム等に含まれるコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される。
【0028】
従って、本発明の機能・処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、上記機能・処理を実現するためのコンピュータプログラム自体も本発明の一つである。
【0029】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、記録媒体としては、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
【0030】
また、プログラムは、クライアントコンピュータのブラウザを用いてインターネットのホームページからダウンロードしてもよい。すなわち、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードしてもよいのである。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明の構成要件となる場合がある。
【0031】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現されてもよい。なお、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ってもよい。もちろん、この場合も、前述した実施形態の機能が実現され得る。
【図面の簡単な説明】
【0032】
【図1】本発明の実施の形態における画像処理装置のシステムブロック図である。
【図2】処理する2つの文字列を示した図である。
【図3】文字列情報の読み取り内容を説明した図である。
【図4】本発明の実施の形態における複写処理の手順を示すフローチャートである。
【図5】出力物の一例を示す図である。
【図6】新聞紙および情報誌の文字列の特徴情報を示す図である。
【符号の説明】
【0033】
100 操作部
101 スキャナ
102 RAM
103 CPU
104 記憶部
105 入力デバイス
107 プリンタ

【特許請求の範囲】
【請求項1】
文字列を含んだ原稿の画像を読み取る読取手段と、
前記読取手段により読み取られた原稿の文字列の特徴情報を検出する検出手段と、
前記検出手段により検出した文字列の特徴情報と、記憶部に記憶された出展元毎の文字列の特徴情報とに基づいて、前記原稿の出展元をあらわす出展元情報を取得する取得手段と、
を有することを特徴とする画像処理装置。
【請求項2】
前記取得手段により取得した出展元情報を前記読取手段により読み取られた原稿の画像に付加して像形成する像形成手段をさらに有することを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記検出手段は、原稿の画像に複数の出展元の文字列が含まれている場合、出展元の文字列毎に文字列の特徴情報を検出し、前記取得手段は、前記出展元の文字列毎に出展元情報を取得することを特徴とする請求項1記載の画像処理装置。
【請求項4】
前記検出手段は、文字列の中の文字の割付状態を検出することを特徴とする請求項1記載の画像処理装置。
【請求項5】
前記検出手段は、文字列中の画像部と非画像部の濃度のコントラストを検出することを特徴とする請求項1記載の画像処理装置。
【請求項6】
文字列を含んだ原稿の画像を読み取る読取ステップと、
前記読取ステップで読み取られた原稿の文字列の特徴情報を検出する検出ステップと、
前記検出手段で検出した文字列の特徴情報と、記憶部に記憶された出展元毎の文字列の特徴情報とに基づいて、前記原稿の出展元をあらわす出展元情報を取得する取得ステップと、
を有することを特徴とする画像処理方法。
【請求項7】
請求項6記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−306632(P2008−306632A)
【公開日】平成20年12月18日(2008.12.18)
【国際特許分類】
【出願番号】特願2007−153803(P2007−153803)
【出願日】平成19年6月11日(2007.6.11)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】