画像処理装置、画像処理方法、画像処理プログラム
【課題】 ユーザにより筆記された紙文書の筆記内容に基づき処理を実行する画像処理装置、画像処理方法、画像処理プログラムを提供する。
【解決手段】 コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段とを有することを特徴とする。
【解決手段】 コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段とを有することを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、筆記された文書に対し、処理を行う画像処理装置、画像処理方法、画像処理プログラムに関する。
【背景技術】
【0002】
近年、コンピュータなどの情報機器を利用して多くの電子文書が作成されており、その量や作成頻度はますます増大する傾向にある。また、既にある電子文書を利用して、新たな電子文書を作ったりまたはその中の一部の情報を後で利用することも増えてきている。
【0003】
この場合、コンピュータ上で電子文書を編集するアプリケーションを起動してその電子文書を読み込み、領域を指定して電子文書中のデータをメモリにコピーし、そのアプリケーションの別のウインドウにそれをペーストするなどして電子文書のコンテンツを再利用している。
【0004】
また、紙文書の視認性、一覧性、人への譲渡などの面から、たとえ電子文書が配信されて手元にあったとしても一度紙に印刷してからそれを読むことで思考したり、また紙文書に対して筆記することも多い。
【0005】
筆記された内容を再び電子化するには紙文書をスキャナでよみとり、イメージファイルとして格納するなどして行われる。それは人間が見ることで活字文字と筆記文字の違いなどから元々の紙文書と筆記された紙文書を区別している。
【特許文献1】特開2002−318799号公報
【特許文献2】特開平9−305701号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
このように、ユーザにより筆記された紙文書の筆記内容を電子文書に反映させようとしても従来のシステムでは容易ではない。
【0007】
特許文献1は、紙と電子による校正作業に関わるものである。画面上での校正と旧来の紙面での校正を混在させた環境を実現する技術が開示されている。この特許広報では紙に印刷された校正用原稿に対して特殊インクで校正指示を筆記し、その特殊インクのみを読み取ることで筆記のみを抽出し、電子文書に対して重畳して表示することで紙と画面上でのシームレスな校正作業を実現している。しかし、本特許広報は筆記を画像として表示の見やすさを向上させたものであり、筆記による電子文書のコンテンツ利用に及ぶものではない。
【0008】
また、特許文献2は紙の帳票画像から下線を抽出する技術が開示されている。この特許文献2は、帳票画像内の枠を校正しない横方向のランレングスデータを抽出し、ヒストグラムを作成して下線を判断するものである。また、画像内の文字を切り出て、文字データとして識別して帳票認識の判断情報としている。しかし、特許文献2においては下線は印刷されているものであり、それに帳票を識別するための特別な意味を持たせているものをコンテンツとして配置しているものあり、ユーザが意のままに筆記しているものとは用途が異り、また画像から識別しているものであり、認識誤りの危険性もある。
【0009】
本発明はこのような問題点に鑑み、ユーザにより筆記された紙文書の筆記内容に基づき処理を実行する画像処理装置、画像処理方法、画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明は、コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段とを有することを特徴とする。
【0011】
また、上記課題を解決するために、本発明は、前記筆記領域は矩形であることを特徴とする。
【0012】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする。
【0013】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする。
【0014】
また、上記課題を解決するために、本発明は、前記近傍は、前記矩形の長辺の近傍であることを特徴とする。
【0015】
また、上記課題を解決するために、本発明は、前記抽出手段は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする。
【0016】
また、上記課題を解決するために、本発明は、前記抽出手段は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする。
【0017】
また、上記課題を解決するために、本発明は、矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0018】
また、上記課題を解決するために、本発明は、前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0019】
また、上記課題を解決するために、本発明は、前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする。
【0020】
また、上記課題を解決するために、本発明は、前記抽出手段が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする。
【0021】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする。
【0022】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする。
【0023】
また、上記課題を解決するために、本発明は、前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得手段を有することを特徴とする。
【0024】
また、上記課題を解決するために、本発明は、前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理手段を有することを特徴とする。
【0025】
また、上記課題を解決するために、本発明は、コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み段階と、読み込まれた前記紙文書に筆記された領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツを抽出する抽出段階とを有することを特徴とする。
【0026】
また、上記課題を解決するために、本発明は、前記筆記領域は矩形であることを特徴とする。
【0027】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする。
【0028】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする。
【0029】
また、上記課題を解決するために、本発明は、前記近傍は、前記矩形の長辺の近傍であることを特徴とする。
【0030】
また、上記課題を解決するために、本発明は、前記抽出段階は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする。
【0031】
また、上記課題を解決するために、本発明は、前記抽出段階は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする。
【0032】
また、上記課題を解決するために、本発明は、矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0033】
また、上記課題を解決するために、本発明は、前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0034】
また、上記課題を解決するために、本発明は、前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする。
【0035】
また、上記課題を解決するために、本発明は、前記抽出段階が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする。
【0036】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする。
【0037】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする。
【0038】
また、上記課題を解決するために、本発明は、前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得段階を有することを特徴とする。
【0039】
また、上記課題を解決するために、本発明は、前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理段階を有することを特徴とする。
【0040】
また、上記課題を解決するために、本発明は、請求項15から28のいずれか1項に記載の画像処理方法をコンピュータに実行されるための画像処理プログラムであることを特徴とする。
【発明の効果】
【0041】
本発明によれば、ユーザにより筆記された紙文書の筆記内容に基づき処理を実行する画像処理装置、画像処理方法、画像処理プログラムを提供できる。
【発明を実施するための最良の形態】
【0042】
以下、本発明の実施の形態について図面に基づいて説明する。
【実施例1】
【0043】
最初に実施例1における画像処理装置の構成例について説明する。画像処理装置の構成例は、2つあり、それらを図1と図2を用いて説明する。
【0044】
図1には、画像処理部101と、入出力装置112と、紙入力装置113と、紙出力装置114と、ディスク装置115とが示されている。
【0045】
画像処理部101は、ユーザI/F制御部102と、操作解釈部103と、アプリケーション部104と、スキャナI/F制御部105と、紙処理部106と、コンテンツ処理部107と、プリンタI/F制御部108と、印刷処理部109と、ID管理部110と、ディスクI/F制御部111とで構成される。
【0046】
画像処理部101は、ユーザI/F制御部102を介してディスプレイやキーボードなどの入出力装置112からのユーザ操作命令(文書登録、印刷)や紙文書からのコンテンツを利用するアプリケーション部104との情報のやり取りをおこなっている。そして、ユーザI/F制御部102からの操作命令を操作解釈部103で受け取り、その操作の解釈と実行を行う。
【0047】
また、画像処理部101ではスキャナなどの紙入力装置113が接続され、それを操作し、紙文書の画像を取得する制御をおこなうスキャナI/F制御部105を備えている。また、紙処理部106ではスキャナI/F制御部105からの紙文書の画像から印刷されているバーコードを識別する。
【0048】
コンテンツ処理部107ではスキャンした紙画像と電子文書を画像化したものとから筆記された領域と相当の位置関係にある電子文書中のコンテンツデータを抽出する。また、プリンタなどの紙出力装置114が接続され、それを操作し、電子文書の画像を取得する制御を行うプリンタI/F制御部108を備えている。ID管理部110では電子文書と、それを特定する特定情報であるID(識別子)の関係が一対一に対応するようIDテーブルを管理し、ID登録、削除、参照などをおこなう。紙処理部106ではディスク装置115などに格納された電子文書にIDコードを付与し、プリンタで印刷するための画像を作成する。
【0049】
以上説明した画像処理部101と、それに接続された紙入力装置113とディスク装置115とが画像処理装置の最小構成である。紙文書を印刷する場合は、さらに紙出力装置114を構成に加える。入出力装置112は、画像処理部101が紙入力装置113で読み込まれたものに対して自動的に抽出処理を行う仕様となっている場合は、特に必要ない。
【0050】
次に、図2を用いて2つ目の構成例について説明する。なお、図1と同じ符号のものは説明を省略する。
【0051】
図1の画像処理部101は紙のスキャン、電子文書の印刷、電子文書の格納の機能をすべて画像処理部101に直接接続されたハードウェアで実現するように構成されていた。これに対し、図2に示す画像処理部201は、末端のハードウェアをすべてネットワークの外に配置し、それらをリモートから利用する構成のものとなっている。
【0052】
画像処理部201はネットワークI/F制御部202を介してLAN(Local Area Network)などの外部ネットワーク203に接続されている。外部ネットワーク203上には画像処理部201と通信可能なネットワークスキャナ装置204、ネットワークプリンタ装置205、ネットワークファイルサーバとして動作するコンピュータ装置206などが存在し、それらが、電子文書の格納、取得などの操作を画像処理部201とリモートで実行している。もちろん、紙文書のスキャン、電子文書の印刷、電子文書の格納の各機能の一部を、図1の画像処理部101のように内部に持ち、その他を図2の画像処理部201のように外部を利用することで実現する別の実施形態でもかまわない。
【0053】
なお、上述した紙入力装置113とネットワークスキャナ装置204は紙文書読み込み手段に対応する。コンテンツ処理部107は抽出手段に対応する。印刷処理部109は、印刷処理手段に対応する。
【0054】
以上説明した画像処理部201と、それに接続されたネットワークスキャナ装置204とコンピュータ装置206とが画像処理装置の最小構成である。紙文書を印刷する場合は、さらにネットワークプリンタ装置205を構成に加える。入出力装置112は、画像処理部201がネットワークスキャナ装置204で読み込まれたものに対して自動的に抽出処理を行う仕様となっている場合は、特に必要ない。
【0055】
次に、画像処理装置の具体的な処理について説明する。以下で説明する処理は、紙文書を印刷する処理と、筆記された紙文書を読み込み、コンテンツを抽出する処理の2つである。まず、紙文書を印刷する処理について、図3を用いて説明する。図3はユーザI/F制御部102から入力を受けたときの操作解釈部103での制御手順である。
【0056】
操作解釈部103ではまずユーザI/F制御部102からその入力を受け取る(S101)。その操作がアプリケーションへの操作か、紙文書を印刷するためのものかを判断する(S102、S104)。アプリケーションへの入力操作であればアプリケーションへ入力を渡して終了する(S103)。入力が紙文書の印刷である場合は、紙文書に対応する電子文書が入力されていればそれをディスクI/F制御部111を介してディスク装置115へ格納し、紙処理部106へ入力された内容(格納された電子文書名を含む)を渡して終了する(S105)。
【0057】
次に、図4のフローチャートの説明をする。図4のフローチャートは、操作解釈部103においてユーザI/F制御部102からの操作が紙の印刷であり、操作解釈部103より要求(S105)を受けたときの紙処理部106の制御手順である。
【0058】
まず、操作解釈部103から電子文書名を含んだ印刷要求を受け取る(S201)。その電子文書名をID管理部110にID登録依頼をしてIDを取得する(S202)。取得したIDと電子文書名と印刷するページ番号を印刷処理部109へ渡して(S203)、処理を終了する。
【0059】
図5はID管理部110で管理しているIDテーブルの格納している情報の一例を図示したものである。図5のIDテーブル801において、各行(例えば行805の範囲)がID登録の一単位であり、各列が登録要素となっている。列802にはIDテーブル内で唯一のIDが格納される。列803には電子文書を一意に決定する情報、この図では文書処理装置101内の大容量記憶装置部115内での位置を示すパス名が格納されている。また、列804には印刷したページ番号が格納されている。
【0060】
次に、図6のフローチャートについて説明する。図6は、印刷処理部109において紙処理部106から印刷要求をうけたとき(S203)の制御手順である。
【0061】
印刷処理部109では印刷要求とともに紙処理部106からIDと電子文書名、印刷ページを取得する(S301)。ディスクI/F制御部111を介してディスク装置115から渡された電子文書を取出す(S302)。そしてIDをバーコードなどに画像化する(S303)。
【0062】
またスキャンした画像のスキューを補正するためのタイミングマークとともに電子文書の印刷するページに重畳して印刷画像を作成し(S304)、その印刷画像をプリンタI/F制御部108を介してプリント装置114に送る(S305)ことで印刷が完了する。
【0063】
図7は印刷処理部109において作成された紙文書901の例である。紙文書901には電子文書内に保持しているコンテンツ部907が描画されている。さらに黒四角のタイミングマーク902、903、904、905が四隅にあり、その位置は規定されている。さらに、コード906を有し、このコードはIDを示している。
【0064】
このタイミングマークによりスキャナ装置113またはネットワークスキャナ装置204などで読み取られた画像が歪んだとしても補正が可能である。また、紙処理部106がID管理部110から取得したIDをコード画像として張り付けたコード906がある。
【0065】
以上が紙文書を印刷する処理の説明である。次に、筆記された紙文書を読み込み、コンテンツを抽出する処理について説明する。
【0066】
図8は、紙処理部106においてスキャナI/F制御部105からスキャン画像を渡されたときの制御手順である。紙処理部106では、スキャナI/F制御部105から紙文書をスキャンした画像を受け取る(S401)。このステップS401は、紙文書読み込み段階に対応する。また、ここでの画像は、図9で示す紙文書901のように、紙文書に対して加筆をおこなった筆記画像1007、1008、1009、1010を有するものとする。また、図9には、コンテンツ領域1001、1002、1003、1004、1005、1006が示されている。
【0067】
次に画像901に対して、スキュー補正をおこなう(S402)。そしてコード906を探し、デコードを行い、IDを取得する(S403)。そのIDをID管理部110に渡し、その紙文書に対応する電子文書の情報(ディスク装置115に格納されているパス名など)を受け取る(S404)。そしてスキャンした画像と電子文書の情報をコンテンツ処理部107に渡して(S405)終了する。
【0068】
図10は、コンテンツ処理部107において紙処理部106からスキャンによる情報が渡された時(S405)の制御手順である。コンテンツ処理部107では紙処理部106からスキャンした画像と少なくとも電子文書を取得するための情報(電子文書名など)を取得する(S501)。
【0069】
そしてその情報からディスクI/F制御部111を介してディスク装置115から電子文書を取得する(S502)。取得した電子文書を画像化して紙処理部106からの画像との差分をとり(S503)、筆記画像を抽出する。そして紙全面の筆記画像を領域のまとまりを考慮してクラスタリングを行う(S504)。これにより図9に示すような4つの筆記画像1007、1008、1009、1010が取れ、それら筆記画像を囲む矩形の領域の頂点の座標を得たものとする。図11は、その矩形の例を示すものであり、矩形である筆記領域1401と、筆記画像1008と、コンテンツ領域1003とが示されている。このような筆記画像を含む矩形の領域が筆記領域である。
【0070】
次に電子文書をPDF(Portable Document Format)に変換する(S505)。なお、ここでは、テキスト領域や画像領域の位置を保持し、そのコンテンツを抽出できるようなファイルフォーマットであり、そのフォーマット画像に変換するドライバが提供されているものであればPDFに限定するものではない。
【0071】
抽出段階に対応するS506〜S509では取得した筆記領域の数(n=4)だけ処理を行うため、処理されていない筆記領域が無くなった場合はS511に進み、処理する筆記領域がある場合は一つの筆記領域の処理としてS507以降に進む(S506)。対象とする筆記領域がテキスト領域かどうかを判断する(S507)。このテキスト領域とは、コンテンツ領域の1つであり、文字が書かれているものである。コンテンツ領域には他に画像領域がある。なお、筆記領域がテキスト領域とは、筆記された領域がテキスト領域という意味である。
【0072】
S507では電子文書を画像化し、領域識別しておくことで判断が可能となる。領域識別の手法については、開示されている一つの固定閾値または二つの固定閾値を用いて画素を白画素と黒画素に分類し、連結した黒画素群と連結した白画素群の両方が局所領域内に存在する画素を文字の画素として検出する方式などを利用する。
【0073】
ここでは図9に示すように、コンテンツ領域1001,1002,1004,1006をテキスト領域と判断し、コンテンツ領域1003,1005を画像領域というように判断したものとする。
【0074】
例えば、筆記領域1401とコンテンツ領域1003とが共通の領域を有するので、ステップS510で、コンテンツ領域1003のコンテンツはPDF化したファイルから抽出される。一方、そのようになっていないコンテンツ領域1005のコンテンツはステップS510で抽出されない。
【0075】
また、テキスト領域として判断されたコンテンツ領域1002、1004、1010の場合、S508に進み、筆記領域がコンテンツ領域と共通の領域を有するかどうか判断される。共通の領域を有するテキストは抽出される(S510)。
【0076】
図12は筆記画像1007の筆記領域1102が複数の文字からなるコンテンツ領域1101と共通の領域を有している例である。コンテンツ領域1101は一文字単位の複数のコンテンツ領域からなり、一文字単位で共通の領域を有するかどうかが判断される。これによりコンテンツ領域1101から文字コンテンツとして「さしすせそ」が抽出される。
【0077】
S508で共通の領域がないと判断されれば、筆記領域の近傍のコンテンツ領域を探し、そのコンテンツ領域のコンテンツを抽出する(S509)。図13は筆記領域1302がコンテンツ領域1301と共通の領域がない場合の例である。この場合、筆記領域1302の矩形の長辺の近傍にあるコンテンツ「ABC」が抽出される。また、図14も筆記領域1202がコンテンツ領域1201と共通の領域がない場合の例である。この場合も、矩形の長辺の近傍にあるコンテンツ「へと」が抽出される。S506からS509ですべての筆記領域について処理が終われば、抽出したコンテンツをアプリケーション部へ送り(S511)、処理を終了する。
【0078】
このようにすることにより、アプリケーションではコンテンツ処理部からの情報を用いて様々な処理を行うことができる。例えば、抽出した文字コンテンツをWWWサービスに検索させたり、抽出した画像コンテンツ、文字を別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。 以上説明したように、本実施例によれば、電子文書のコンテンツと関連づけるIDを含めて印刷された紙文書に、ユーザが筆記をしたものに対してその筆記領域とコンテンツの位置関係から対応するコンテンツを取得してアプリケーション利用することが可能となる。
【0079】
また、筆記領域を矩形として扱うことでコンテンツとの位置関係が明確になり、抽出するコンテンツを決定することがより容易となる。
【0080】
さらに、筆記領域がコンテンツ領域と共通の領域を有する場合に、そのコンテンツを対象とするようにするため、筆記対象としたコンテンツを不足なく抽出し、アプリケーション利用することが可能となる。
【0081】
その上、筆記領域とコンテンツ領域の共通の領域がない場合でも近傍のコンテンツを抽出するようにしたため、テキストのような行の下にアンダーラインを引いたような加筆においても間違いなく文字コンテンツを抽出し、アプリケーション利用することが可能となる。
【0082】
また、ユーザが筆記したコンテンツがテキストのコンテンツである場合、テキストを文字単位で領域を判断してコンテンツとして文字単位で抽出し、アプリケーション利用することが可能となる。これによりテキスト全体ではなく、ユーザがその一部を筆記で指定した場合にも正しく抽出することが可能となる。
【0083】
また、ユーザが筆記したコンテンツがテキストのコンテンツである場合、筆記領域の長辺の近傍の文字を抽出することにより、テキストコンテンツの行の向きに関わらずユーザが指定した所望の文字コンテンツを抽出してアプリケーション利用することが可能となる。
【0084】
また、画像処理方法をコンピュータが制御可能なOSにしたがってプログラミングすることにより、そのOSを備えたコンピュータであれば同じ処理方法により制御することができる。
【実施例2】
【0085】
実施例2において、実施例1で説明した図1から図8に示される構成や処理は変わらない。実施例2で扱う紙文書が図7であることは同じだが、図7のような横書きのみの文書であり、コンテンツへの参照指示は線分で筆記することを前提としている。また、筆記された紙文書は、図15に示されるものとする。従って、図8の説明における「図9」は図15に読み替える。
【0086】
なお、図15に示した紙文書において、横書きとは一般的に用いられる意味と変わらず、矢印6001に示される方向に書かれるものである。従って、図15に示されるテキストを横書きどおりに読むと「あいうえおかきくけこ…」となる。そして、文字が記載されている方向と垂直の辺とは、矢印6002と平行な辺である。また行の高さも一般的に用いられる意味と変わらず、矢印6002の長さとなる。
【0087】
図16は、コンテンツ処理部107において紙処理部106からスキャンによる入力が渡された時(図8のS405参照)の制御手順である。コンテンツ処理部107は、紙処理部106から画像と少なくとも電子文書を取得するための情報を受け取る(S601)。
【0088】
そしてコンテンツ処理部107は、その情報からディスクI/F制御部111を介してディスク装置115から電子文書を取得する(S602)。次にコンテンツ処理部107は、取得した電子文書を画像化して紙処理部106からの画像との差分をとり(S603)、筆記画像を抽出する。
【0089】
図17がその結果の筆記画像である。この図17に示される筆記画像から紙全面の筆記画像を領域のまとまりを考慮してクラスタリングをおこない(S604)、図17に示すような5つの筆記領域7004、7007,7008,7009,1010が取れ、その筆記領域(各波線部)の座標を取得する。
【0090】
次に電子文書をPDFに変換する(S605)。なお、ここでは、テキストや画像の位置を保持し、そのコンテンツを取出せるようなファイルフォーマットであり、そのフォーマット画像に変換するドライバが提供されているものであればPDFに限定するものではない。
【0091】
S606〜S611では取得した筆記領域の数のn回(図17の例ではn=5)処理を行うため、処理されていない筆記領域が無くなった場合はS612に進み、処理する筆記領域がある場合は一つの筆記領域の処理としてS607以降に進む(S606)。その場合まず、処理対象とする筆記画像の種類を判断する(S607)。その筆記画像種類の解釈の手段は3つあり、それについては後に説明する。
【0092】
S607の筆記画像種類の解釈の結果、それが水平線分であるかどうかを調べる(S609)。ここで水平線分の筆記画像とは、簡単にいうと横長の線分をいう。例えば下線である筆記画像は水平線分である。筆記画像が水平線分であればさらに筆記領域の近傍にコンテンツがあるかを調べる(S610)。コンテンツ領域が存在すれば、その筆記画像はコンテンツに対する指示であると判断し、その位置のコンテンツやその一部をPDFより抽出し、S606へもどる。
【0093】
図17での筆記画像1007が水平線分として解釈された場合、文字列として「いうえおか」が抽出される。S609で筆記領域が水平成分でないときやS610で近傍にコンテンツ領域がない場合は、その筆記領域はユーザが意図したコメントや絵などのデータであるとしてそのまま取出して筆記データとして保持して(S608)、S606へもどる。
【0094】
図17で筆記領域7010が水平線分でないと解釈された場合、その筆記領域の画像そのものを保存したり、文字認識処理結果を保存したりする。そしてS606からS610ですべての筆記領域について処理が終われば、抽出したコンテンツと筆記データをアプリケーション部へ送り(S612)、終了する。このように、筆記クラスタの種類の解釈をすることで、ユーザの意図したデータをその後のアプリケーションなどで利用可能となる。
【0095】
次に、上述したステップS607の筆記領域の種類を解釈する処理として、3つの処理例を説明する。まず1つ目を、図18を用いて説明する。対象としている筆記領域の形状(図17での点線で示した外接矩形である)の縦横比率(ratio=縦の長さ/横の長さ)をもとめる(S701)。これを予め定めておいた既定値と比較する(S702)。縦横比率が既定値より小さければ、その筆記領域は水平線分であると判断し(S703)、そうでなければ水平線分ではないと判断(S704)し、処理を終了する。これにより細い長い筆記領域を線分、高さのある短い筆記を単なる筆記画像として判断することができる。
【0096】
このように、矩形である筆記領域の辺の縦横比率に基づき、筆記画像が水平線分であるかどうかが判断される。
【0097】
次に2つ目の処理を、図19を用いて説明する。筆記領域の縦の長さ(height)を求める(S801)。さらにこの筆記領域の近傍のテキストコンテンツを探し、そのテキストコンテンツの行高さ(cheight)を求める(S802)。図15の筆記領域1009の場合、コンテンツ領域1002のテキストを探し、作成されたPDFからフォントの高さ属性を取り出すことでテキストの行高さを取得できる。
【0098】
そしてheightとcheightを比較し(S803)、筆記領域の縦の長さの方が大きければその筆記領域を非水平線分であると判断し(S804)、そうでなければ水平線分と判断し(S805)、処理を終了する。
【0099】
上記S803における比較はcheightにある規定値をかけた値との比較をしてもかまわない。これにより、まわりの文字の大きさとの比較の上で筆記領域を水平線分または筆記画像に判断することができるので短い筆記領域や短い水平線分であっても正確に判断できる。
【0100】
このように、紙文書に横書きで記載された文字の行の高さと、矩形である筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づいた判断が行われる。
【0101】
次に3つ目の処理を、図20を用いて説明する。筆記領域に手書き文字認識処理をおこなう(S901)。その認識結果が成功したかどうかを判断する(S902)。成功したのであれば、テキストデータ(非水平線分)であると判断し(S903)、そうでなければ非テキストデータ(水平線分の可能性あり)と判断(S904)して処理を終了する これにより筆記の大きさにはかかわらず、文字かどうかの正確な判断がされる。このように、筆記画像が文字の場合、筆記画像が水平線分ではないと判断される。
【0102】
なお、以上説明した3つの筆記領域の意味判断の処理を組合わせることも可能であり、その場合、さらに正確に水平線分と非水平線分とを判断することができる。
【0103】
以上説明してきたことから、アプリケーションではコンテンツ処理部からの情報を用いて様々な処理を行うことができる。例えば、抽出した文字コンテンツや筆記文字をWWWサービスに検索させたり、抽出した画像コンテンツ、文字や筆記コメントを別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。
また本実施例2によれば、電子文書のコンテンツと関連づけるIDを含めて印刷された紙に、ユーザが筆記をしたものに対してその筆記の意味から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツのデータを取得するかを決定して処理が行われるので、筆記者が筆記指示したデータがアプリケーションで利用することが可能となる。
【0104】
さらに本実施例2によれば、筆記の形状を矩形として扱い、その縦横の比率から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツのデータを取得するかを決定して処理が行われるので、細長い筆記を線分(コンテンツへの参照)、高さのある短い筆記を筆記データとしてより正確に判断することができる。
また、本実施例2によれば、筆記領域を矩形として扱い、その縦の長さと関係するテキストコンテンツの行高さから判断して筆記領域そのものをデータとして取得するか、筆記領域に対応するコンテンツ領域を取得するかを決定して処理が行われるので、短い筆記や短い線分であっても正確に判断できる。
【0105】
また、本実施例2によれば、筆記の内容をよみこみ、手書き文字認識処理をかけてその成否から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツデータを取得するかを決定して処理が行われるので、筆記の大きさにはかかわらず、ユーザが記述した文字かどうかの正確な判断がされる。
【0106】
このように、実施例2によれば、電子文書とリンクされた紙文書に筆記したものを読み込み、その筆記がコンテンツへの参照か、筆記データそのものに意味があるかを自動的に判断して適切なデータを取出すことができ、それを例えば、抽出した文字コンテンツや筆記文字をWWWサービスに検索させたり、抽出した画像コンテンツ、文字や筆記コメントを別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。
【実施例3】
【0107】
実施例3における画像処理装置の構成例について説明する。画像処理装置の構成例は、2つあり、それらを図21と図22を用いて説明する。なお、以下の説明において、既に説明した符号の説明は省略する。
【0108】
まず、図21から説明する。図21は、図1に記載のアプリケーション104と、操作解釈部103がなくなり、スピーカ3104と、タッチパネル3103と、キーボード3112とが加えられたものである。
【0109】
画像処理装置101は、ユーザI/F制御部102を介してキーボード3112やタッチパネル3103などの外部入力デバイスからの紙操作命令(文書印刷指示やコンテンツ処理指示)を受けとり、紙処理部106へ渡す。また、紙処理部106やコンテンツ処理部107から受けた出力要求をタッチパネル3103やスピーカ3104などの外部出力デバイスへ送るものである。
【0110】
図22は実施例3における2つ目の構成例を示す図である。図22も同様に、図2に記載のアプリケーション104と、操作解釈部103がなくなり、スピーカ3104と、タッチパネル3103と、キーボード3112と、コンピュータ装置207が加えられたものである。
【0111】
コンピュータ装置207は、画像処理装置201とネットワーク203を介してFTP(File Transfer Protocol)やリモートファイル格納、メール送受信が可能であり、そのようなコンピュータ装置が1つ以上存在しているものとする。
【0112】
以下、実施例3における紙処理部106、コンテンツ処理部107、ID管理部110、印刷処理部109の制御手順や管理形態について図を用いて詳細に説明する。まず、実施例3で読み込まれる紙文書について、図23、24を用いて説明する。図23は、印刷される元の電子文書601を示すものである。図23には、テキスト部602、603、605と、動画部604と、音声部605とをコンテンツとして有する電子文書601が示されている。
【0113】
この電子文書601を印刷処理部109の処理によって印刷された紙文書が図24である。この紙文書には、タイミングマーク902、903、904、905があり、その位置は規定されているので、スキャナ装置113、204などで読み取られた画像が歪んだとしても補正が可能である。また、紙処理部106がID管理部110から取得したIDを張り付けたコード906がある。
【0114】
この紙文書901に対して筆記を行った紙文書を示すのが、図25で示す紙文書5001である。図25には、筆記画像5002、5003、5004が示されている。これらの各文書に対して以下に説明する処理が行われる。
【0115】
図26はユーザI/F制御部102から入力を受けたときの紙処理部106での制御手順を示すフローチャートである。紙処理部106では、初めに入力がどの指示かを判断する。まずその受け取った入力が印刷要求かどうかを判断する(S1001)。
【0116】
印刷要求であれば、ユーザI/F制御部102より電子文書のパラメータ情報(電子文書名、ページ番号)を取得する(S1002)。取得した電子文書のパラメータ情報をID管理部110に登録依頼をしてIDを取得する(S1003)。取得したIDと電子文書名とページ番号を印刷処理部109へ渡して(S1004)、処理を終了する。なお、IDを管理しているIDテーブルは図5に示されているものである。
【0117】
S1001で受け取った入力が印刷要求でない場合、その入力がコンテンツ処理要求かどうかを調べる(S1005)。コンテンツ要求でなければ終了し、コンテンツ要求であればユーザI/F制御部102に処理パラメータ情報の入力を要求し、処理パラメータ情報として転送方法、転送先を取得する(S1006)。この入力はユーザによりタッチパネルで行われるが、そのタッチパネルに表示される入力画面は後に説明する。
【0118】
次にスキャナI/F制御部105(もしくはネットワークI/F制御部202)に紙文書のスキャン操作を指示し、スキャンされた画像を受け取る(S1007)。次に、スキュー補正をおこなう(S1008)。そしてコード906(図25参照)を探し、デコードを行い、IDを取得する(S1009)。そのIDをID管理部110に渡し、その紙文書の原稿である電子文書の情報(ディスク装置115に格納されているパス名、ページ番号)を受け取る(S1010)。そして画像と電子文書情報をコンテンツ処理部107に渡して(S1011)、処理を終了する。
【0119】
次に、上述した入力画面について、図27を用いて説明する。図27は、タッチパネルに表示される入力画面例を示している。この入力画面には、「転送方法」と「転送先」とが入力される。ここでは転送方法として、「コンテンツ確認」と、「FTP」と、「ネットワークフォルダ」と、「E−Mail」とを指定することができる。指定方法は、その前にあるチェックボックスで指定するものとなっている。
【0120】
「コンテンツ確認」の場合は、この画像処理装置101または201上でそのコンテンツに関連付けられた処理を実行することでコンテンツを表現する。具体的に、コンテンツを表現するとは、コンテンツが音楽データを意味するものであれば音楽をスピーカに出力したり、コンテンツがテキストを意味するものであればエディッタなどを用いて内容を表示することがコンテンツ表現の例である。すなわち、コンテンツに関連付けられた処理が実行されることである。
【0121】
「FTP」の場合は転送先に指定したFTPサーバへコンテンツをファイル送信する。「ネットワークフォルダ」の場合は転送先に指定したホストのネットワークフォルダにコンテンツをファイルとして保存する。「E−Mail」の場合は「転送先」に指定されたアドレスにコンテンツを添付したメールを送信する。
【0122】
次に、印刷処理部109において紙処理部106から印刷要求をうけたとき(S1004)の制御手順を、図28のフローチャートを用いて説明する。印刷処理部109では紙処理部106からIDと電子文書名、印刷ページを取得する(S1101)。ディスクI/F制御部111(もしくはネットワークI/F制御部202)を介してディスク装置115から渡された電子文書ファイルを取出す(S1102)。
【0123】
そしてIDをバーコードなどにコード化し(S1103)、またスキャンした画像のスキューを補正するためのタイミングマークとともに電子文書の印刷するページに重畳して印刷画像を作成する(S1104)。このとき、印刷不可能なマルチメディアデータなどのデータはその位置を示す矩形などの枠で示し、そこにはそのデータ型を表記するように印刷画像を作成するとユーザには分かりやすい。
【0124】
プリンタI/F制御部108またはネットワークI/F制御部202を介してプリント装置114もしくは205に印刷要求をする(S1105)ことで印刷が完了する。
【0125】
このようにして、上述した図24の紙文書は印刷される。他の紙文書の例を図29に示す。紙文書5200には、コンテンツ領域5201、5202、5203、5204、5205が示されている。それぞれのコンテンツ領域は、Movie、Voice、DataSheet、Textと記されている。
【0126】
この紙文書5200に対応する電子文書に示される動画、音声、データベース、テキストデータのコンテンツは、それぞれ張り付けられた位置にMovie(1201,1204,1205),Voice(1202),DataSheet(1203),Text(1205)の処理が関連付けられているとともに、それらの文字とともに矩形領域で示されている。
【0127】
ユーザは所望のコンテンツ領域に筆記することにより、動画(Movie)、音声(Voice)、表計算データ(DataSheet)、テキストデータ(Text)を閲覧や視聴することができるようになる。
【0128】
この紙文書を利用することによりユーザは抽出するコンテンツ種類を判断でき、また記入する位置を把握することが容易となる。また、コンテンツの種類を表示するのに文字ではなくアイコンなどのマークであってもよい。
【0129】
次に、図30を用いて、コンテンツ処理部107の処理を説明する。コンテンツ処理部107は紙処理部106から画像と電子文書を取得するための電子文書情報と処理パラメータとしてコンテンツの処理方法、転送先を受け取る(S1201)。そしてその電子文書情報からディスクI/F制御部111(ネットワークI/F制御部202)を介してディスク装置115から電子文書を取得する(S1202)。
【0130】
取得した電子文書を印刷処理部109により画像化して紙処理部106からの画像との差分をとり、筆記画像を抽出する(S1203)。そして紙全面の筆記画像を領域のまとまりを考慮してクラスタリングを行う(S1204)。
【0131】
図31は、差分をとりクラスタリングされた画像を示す図である。図31の場合、3つにクラスタリングされている。それらは、筆記領域5101、1102、1103と示されているものである。そして、コンテンツ処理部107は、これら矩形の筆記領域の頂点の座標を求めることで筆記位置が求まる。
【0132】
次に電子文書をPDFに変換する(S1205)。なお、ここでは、テキストや画像の位置を保持し、そのコンテンツを取出せるようなファイルフォーマットであり、そのフォーマット画像に変換することができればPDFに限定するものではない。
【0133】
S1206〜S1209では取得した筆記領域の数(n=3)だけ処理を行うため、処理されていない筆記領域が無くなった場合は終了し、処理する筆記領域がある場合はその筆記領域を処理対象としてS1207以降に進む(S1206)。
【0134】
次に、対象とする筆記領域がコンテンツ領域と共通の領域を有するかどうかを調べる(S1207)。筆記領域と共通の領域を有しているコンテンツ領域がある場合はそのコンテンツのオブジェクトをPDF化したファイルから抽出する(S1208)。そうでない場合はS1206へ戻る。
【0135】
外部とのネットワーク通信機能をもつ画像処理装置201の場合、S1201で取得していた処理パラメータの中から利用方法をとりだし、それがコンテンツ表現であるかを調べる(S1209)。
【0136】
コンテンツ表現であれば抽出したコンテンツの種類からその種類に応じた外部デバイスで表現するようにユーザI/F制御部102へ出力要求をしてS1206へ戻る(S1210)。
【0137】
外部とのネットワーク通信機能がない画像処理装置101の場合はS1209の処理は存在せずS1210の処理のみを行うことになる。例として筆記領域5002の場合、コンテンツ領域5002と共通の領域を有する。コンテンツ領域5002は動画を示しているので、コンテンツ処理部107はユーザI/F制御部102へタッチパネル3103で画像再生、動画に音声があれば、スピーカ3104で音声再生するよう要求する。
【0138】
また、筆記領域1102の場合は、コンテンツ領域1003と共通の領域を有する。コンテンツ領域1003は音声を示すものであるので、コンテンツ処理部107はユーザI/F制御部102へスピーカ3104で音声再生するよう要求する。また、筆記領域1103の場合は、コンテンツ領域5004と共通の領域を有する。コンテンツ領域5004は、表計算データを示しているので、表計算アプリケーションが起動し、その画像がタッチパネル3103で表示するよう要求する。
【0139】
一方、S1209において利用方法がコンテンツ表現でない場合は、FTPまたはネットワークファイル、E−Mailのいずれか指定された方法と転送先へそれぞれのプロトコル処理をおこない、コンテンツを送信してS1206へ戻る(S1211)。あるいは、すべてのクラスタを対象にS1207〜S128の処理をおこない、そのとき抽出したコンテンツを保持しておき、最後にコンテンツをすべてまとめてS1209,S1210,S1211の処理を行ってもよい。
【0140】
以上説明した実施例3の画像処理装置101、201は、パーソナルコンピュータ等のコンピュータにより構成することができ、その場合、紙処理部106、コンテンツ処理部107、ID管理部110はそれぞれの機能をコンピュータに実現させるプログラムとして構成される。
【0141】
本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷された紙文書に、ユーザが筆記をしたものに対してその画像を読み取り、筆記画像を抽出して、そのまとまりを判断し、その位置から対応する電子文書上のデータを抽出したのち、表現することが可能であるので、ユーザは紙文書に筆記してスキャンするだけでその電子原稿が持つマルチメディアやオリジナルデータをその場で容易に確認することが可能となる。
【0142】
また、本実施例3によれば、筆記画像の位置に対応する電子文書上のデータを抽出したのち、所望の宛先へ抽出したコンテンツデータを転送することが可能であるので、ユーザは紙文書に筆記してスキャンするだけでその電子原稿が持つマルチメディアやオリジナルデータを後で利用する環境に容易に保存しておくことが可能となる。
【0143】
さらに、本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷する際に、電子文書内のコンテンツが存在する領域に枠をつけた上で印刷することで、ユーザは抽出したいコンテンツを筆記する場所を確認することが容易になる。
【0144】
また、本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷する際に、電子文書内のコンテンツが存在する際にはそのコンテンツのデータ種類を印刷することで、ユーザが実際に必要な型のコンテンツを選択することが可能となる。
【図面の簡単な説明】
【0145】
【図1】実施例1における画像処理装置の構成例である(その1)。
【図2】実施例1における画像処理装置の構成例である(その2)。
【図3】ユーザI/F制御部から入力を受けたときの操作解釈部での処理を示すフローチャートである。
【図4】紙処理部の処理を示すフローチャートである。
【図5】IDテーブルが格納している情報の一例を示す図である。
【図6】印刷処理部が印刷要求を受けたときの処理を示すフローチャートである。
【図7】紙文書の例を示す図である。
【図8】紙処理部がスキャン画像を渡されたときの処理を示すフローチャートである。
【図9】筆記された紙文書の画像を示す図である。
【図10】コンテンツ処理部の処理を示すフローチャートである。
【図11】画像領域の場合の共通の領域を示す図である。
【図12】筆記領域が複数の文字と共通の領域を有している例を示す図である。
【図13】筆記領域が複数の文字と共通の領域を有していない例を示す図である(その1)。
【図14】筆記領域が複数の文字と共通の領域を有していない例を示す図である(その2)。
【図15】紙文書の例を示す図である。
【図16】コンテンツ処理部の処理を示すシーケンス図である。
【図17】筆記画像を示す図である。
【図18】筆記領域の種類を解釈する処理を示すフローチャートである(その1)。
【図19】筆記領域の種類を解釈する処理を示すフローチャートである(その2)。
【図20】筆記領域の種類を解釈する処理を示すフローチャートである(その3)。
【図21】実施例3における画像処理装置の構成例である(その1)。
【図22】実施例3における画像処理装置の構成例である(その2)。
【図23】電子文書を示す図である。
【図24】紙文書を示す図である。
【図25】筆記された紙文書を示す図である。
【図26】紙処理部での処理を示すフローチャートである。
【図27】タッチパネルに表示される入力画面例を示す図である。
【図28】印刷処理部での処理を示すフローチャートである。
【図29】紙文書を示す図である。
【図30】コンテンツ処理部の処理を示すフローチャートである。
【図31】差分をとりクラスタリングされた画像を示す図である。
【符号の説明】
【0146】
101、201 画像処理部
102 ユーザI/F制御部
103 操作解釈部
104 アプリケーション部
105 スキャナI/F制御部
106 紙処理部
107 コンテンツ処理部
108 プリンタI/F制御部
109 印刷処理部
110 ID管理部
111 ディスクI/F制御部
112 入出力装置
113 紙入力装置
114 紙出力装置
115 ディスク装置
203 外部ネットワーク
204 ネットワークスキャナ装置
205 ネットワークプリンタ装置
206 コンピュータ装置
801 IDテーブル
802、803、804 列
805 行
901、5200 紙文書
902、903、904、905 タイミングマーク
906 コード
907 コンテンツ部
1001、1002、1003、1004、1005、1006、1101、1201、1301、5201、5202、5203、5204、5205、5206 コンテンツ領域
1007、1008、1009、1010、2002、2004、2005、5002、5003、5004、7004、7007、7008、7009、7010 筆記画像
1102、1103、1302、1401、2001、2003、5101 筆記領域
【技術分野】
【0001】
本発明は、筆記された文書に対し、処理を行う画像処理装置、画像処理方法、画像処理プログラムに関する。
【背景技術】
【0002】
近年、コンピュータなどの情報機器を利用して多くの電子文書が作成されており、その量や作成頻度はますます増大する傾向にある。また、既にある電子文書を利用して、新たな電子文書を作ったりまたはその中の一部の情報を後で利用することも増えてきている。
【0003】
この場合、コンピュータ上で電子文書を編集するアプリケーションを起動してその電子文書を読み込み、領域を指定して電子文書中のデータをメモリにコピーし、そのアプリケーションの別のウインドウにそれをペーストするなどして電子文書のコンテンツを再利用している。
【0004】
また、紙文書の視認性、一覧性、人への譲渡などの面から、たとえ電子文書が配信されて手元にあったとしても一度紙に印刷してからそれを読むことで思考したり、また紙文書に対して筆記することも多い。
【0005】
筆記された内容を再び電子化するには紙文書をスキャナでよみとり、イメージファイルとして格納するなどして行われる。それは人間が見ることで活字文字と筆記文字の違いなどから元々の紙文書と筆記された紙文書を区別している。
【特許文献1】特開2002−318799号公報
【特許文献2】特開平9−305701号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
このように、ユーザにより筆記された紙文書の筆記内容を電子文書に反映させようとしても従来のシステムでは容易ではない。
【0007】
特許文献1は、紙と電子による校正作業に関わるものである。画面上での校正と旧来の紙面での校正を混在させた環境を実現する技術が開示されている。この特許広報では紙に印刷された校正用原稿に対して特殊インクで校正指示を筆記し、その特殊インクのみを読み取ることで筆記のみを抽出し、電子文書に対して重畳して表示することで紙と画面上でのシームレスな校正作業を実現している。しかし、本特許広報は筆記を画像として表示の見やすさを向上させたものであり、筆記による電子文書のコンテンツ利用に及ぶものではない。
【0008】
また、特許文献2は紙の帳票画像から下線を抽出する技術が開示されている。この特許文献2は、帳票画像内の枠を校正しない横方向のランレングスデータを抽出し、ヒストグラムを作成して下線を判断するものである。また、画像内の文字を切り出て、文字データとして識別して帳票認識の判断情報としている。しかし、特許文献2においては下線は印刷されているものであり、それに帳票を識別するための特別な意味を持たせているものをコンテンツとして配置しているものあり、ユーザが意のままに筆記しているものとは用途が異り、また画像から識別しているものであり、認識誤りの危険性もある。
【0009】
本発明はこのような問題点に鑑み、ユーザにより筆記された紙文書の筆記内容に基づき処理を実行する画像処理装置、画像処理方法、画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明は、コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段とを有することを特徴とする。
【0011】
また、上記課題を解決するために、本発明は、前記筆記領域は矩形であることを特徴とする。
【0012】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする。
【0013】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする。
【0014】
また、上記課題を解決するために、本発明は、前記近傍は、前記矩形の長辺の近傍であることを特徴とする。
【0015】
また、上記課題を解決するために、本発明は、前記抽出手段は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする。
【0016】
また、上記課題を解決するために、本発明は、前記抽出手段は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする。
【0017】
また、上記課題を解決するために、本発明は、矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0018】
また、上記課題を解決するために、本発明は、前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0019】
また、上記課題を解決するために、本発明は、前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする。
【0020】
また、上記課題を解決するために、本発明は、前記抽出手段が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする。
【0021】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする。
【0022】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする。
【0023】
また、上記課題を解決するために、本発明は、前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得手段を有することを特徴とする。
【0024】
また、上記課題を解決するために、本発明は、前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理手段を有することを特徴とする。
【0025】
また、上記課題を解決するために、本発明は、コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み段階と、読み込まれた前記紙文書に筆記された領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツを抽出する抽出段階とを有することを特徴とする。
【0026】
また、上記課題を解決するために、本発明は、前記筆記領域は矩形であることを特徴とする。
【0027】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする。
【0028】
また、上記課題を解決するために、本発明は、前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする。
【0029】
また、上記課題を解決するために、本発明は、前記近傍は、前記矩形の長辺の近傍であることを特徴とする。
【0030】
また、上記課題を解決するために、本発明は、前記抽出段階は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする。
【0031】
また、上記課題を解決するために、本発明は、前記抽出段階は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする。
【0032】
また、上記課題を解決するために、本発明は、矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0033】
また、上記課題を解決するために、本発明は、前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする。
【0034】
また、上記課題を解決するために、本発明は、前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする。
【0035】
また、上記課題を解決するために、本発明は、前記抽出段階が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする。
【0036】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする。
【0037】
また、上記課題を解決するために、本発明は、前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする。
【0038】
また、上記課題を解決するために、本発明は、前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得段階を有することを特徴とする。
【0039】
また、上記課題を解決するために、本発明は、前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理段階を有することを特徴とする。
【0040】
また、上記課題を解決するために、本発明は、請求項15から28のいずれか1項に記載の画像処理方法をコンピュータに実行されるための画像処理プログラムであることを特徴とする。
【発明の効果】
【0041】
本発明によれば、ユーザにより筆記された紙文書の筆記内容に基づき処理を実行する画像処理装置、画像処理方法、画像処理プログラムを提供できる。
【発明を実施するための最良の形態】
【0042】
以下、本発明の実施の形態について図面に基づいて説明する。
【実施例1】
【0043】
最初に実施例1における画像処理装置の構成例について説明する。画像処理装置の構成例は、2つあり、それらを図1と図2を用いて説明する。
【0044】
図1には、画像処理部101と、入出力装置112と、紙入力装置113と、紙出力装置114と、ディスク装置115とが示されている。
【0045】
画像処理部101は、ユーザI/F制御部102と、操作解釈部103と、アプリケーション部104と、スキャナI/F制御部105と、紙処理部106と、コンテンツ処理部107と、プリンタI/F制御部108と、印刷処理部109と、ID管理部110と、ディスクI/F制御部111とで構成される。
【0046】
画像処理部101は、ユーザI/F制御部102を介してディスプレイやキーボードなどの入出力装置112からのユーザ操作命令(文書登録、印刷)や紙文書からのコンテンツを利用するアプリケーション部104との情報のやり取りをおこなっている。そして、ユーザI/F制御部102からの操作命令を操作解釈部103で受け取り、その操作の解釈と実行を行う。
【0047】
また、画像処理部101ではスキャナなどの紙入力装置113が接続され、それを操作し、紙文書の画像を取得する制御をおこなうスキャナI/F制御部105を備えている。また、紙処理部106ではスキャナI/F制御部105からの紙文書の画像から印刷されているバーコードを識別する。
【0048】
コンテンツ処理部107ではスキャンした紙画像と電子文書を画像化したものとから筆記された領域と相当の位置関係にある電子文書中のコンテンツデータを抽出する。また、プリンタなどの紙出力装置114が接続され、それを操作し、電子文書の画像を取得する制御を行うプリンタI/F制御部108を備えている。ID管理部110では電子文書と、それを特定する特定情報であるID(識別子)の関係が一対一に対応するようIDテーブルを管理し、ID登録、削除、参照などをおこなう。紙処理部106ではディスク装置115などに格納された電子文書にIDコードを付与し、プリンタで印刷するための画像を作成する。
【0049】
以上説明した画像処理部101と、それに接続された紙入力装置113とディスク装置115とが画像処理装置の最小構成である。紙文書を印刷する場合は、さらに紙出力装置114を構成に加える。入出力装置112は、画像処理部101が紙入力装置113で読み込まれたものに対して自動的に抽出処理を行う仕様となっている場合は、特に必要ない。
【0050】
次に、図2を用いて2つ目の構成例について説明する。なお、図1と同じ符号のものは説明を省略する。
【0051】
図1の画像処理部101は紙のスキャン、電子文書の印刷、電子文書の格納の機能をすべて画像処理部101に直接接続されたハードウェアで実現するように構成されていた。これに対し、図2に示す画像処理部201は、末端のハードウェアをすべてネットワークの外に配置し、それらをリモートから利用する構成のものとなっている。
【0052】
画像処理部201はネットワークI/F制御部202を介してLAN(Local Area Network)などの外部ネットワーク203に接続されている。外部ネットワーク203上には画像処理部201と通信可能なネットワークスキャナ装置204、ネットワークプリンタ装置205、ネットワークファイルサーバとして動作するコンピュータ装置206などが存在し、それらが、電子文書の格納、取得などの操作を画像処理部201とリモートで実行している。もちろん、紙文書のスキャン、電子文書の印刷、電子文書の格納の各機能の一部を、図1の画像処理部101のように内部に持ち、その他を図2の画像処理部201のように外部を利用することで実現する別の実施形態でもかまわない。
【0053】
なお、上述した紙入力装置113とネットワークスキャナ装置204は紙文書読み込み手段に対応する。コンテンツ処理部107は抽出手段に対応する。印刷処理部109は、印刷処理手段に対応する。
【0054】
以上説明した画像処理部201と、それに接続されたネットワークスキャナ装置204とコンピュータ装置206とが画像処理装置の最小構成である。紙文書を印刷する場合は、さらにネットワークプリンタ装置205を構成に加える。入出力装置112は、画像処理部201がネットワークスキャナ装置204で読み込まれたものに対して自動的に抽出処理を行う仕様となっている場合は、特に必要ない。
【0055】
次に、画像処理装置の具体的な処理について説明する。以下で説明する処理は、紙文書を印刷する処理と、筆記された紙文書を読み込み、コンテンツを抽出する処理の2つである。まず、紙文書を印刷する処理について、図3を用いて説明する。図3はユーザI/F制御部102から入力を受けたときの操作解釈部103での制御手順である。
【0056】
操作解釈部103ではまずユーザI/F制御部102からその入力を受け取る(S101)。その操作がアプリケーションへの操作か、紙文書を印刷するためのものかを判断する(S102、S104)。アプリケーションへの入力操作であればアプリケーションへ入力を渡して終了する(S103)。入力が紙文書の印刷である場合は、紙文書に対応する電子文書が入力されていればそれをディスクI/F制御部111を介してディスク装置115へ格納し、紙処理部106へ入力された内容(格納された電子文書名を含む)を渡して終了する(S105)。
【0057】
次に、図4のフローチャートの説明をする。図4のフローチャートは、操作解釈部103においてユーザI/F制御部102からの操作が紙の印刷であり、操作解釈部103より要求(S105)を受けたときの紙処理部106の制御手順である。
【0058】
まず、操作解釈部103から電子文書名を含んだ印刷要求を受け取る(S201)。その電子文書名をID管理部110にID登録依頼をしてIDを取得する(S202)。取得したIDと電子文書名と印刷するページ番号を印刷処理部109へ渡して(S203)、処理を終了する。
【0059】
図5はID管理部110で管理しているIDテーブルの格納している情報の一例を図示したものである。図5のIDテーブル801において、各行(例えば行805の範囲)がID登録の一単位であり、各列が登録要素となっている。列802にはIDテーブル内で唯一のIDが格納される。列803には電子文書を一意に決定する情報、この図では文書処理装置101内の大容量記憶装置部115内での位置を示すパス名が格納されている。また、列804には印刷したページ番号が格納されている。
【0060】
次に、図6のフローチャートについて説明する。図6は、印刷処理部109において紙処理部106から印刷要求をうけたとき(S203)の制御手順である。
【0061】
印刷処理部109では印刷要求とともに紙処理部106からIDと電子文書名、印刷ページを取得する(S301)。ディスクI/F制御部111を介してディスク装置115から渡された電子文書を取出す(S302)。そしてIDをバーコードなどに画像化する(S303)。
【0062】
またスキャンした画像のスキューを補正するためのタイミングマークとともに電子文書の印刷するページに重畳して印刷画像を作成し(S304)、その印刷画像をプリンタI/F制御部108を介してプリント装置114に送る(S305)ことで印刷が完了する。
【0063】
図7は印刷処理部109において作成された紙文書901の例である。紙文書901には電子文書内に保持しているコンテンツ部907が描画されている。さらに黒四角のタイミングマーク902、903、904、905が四隅にあり、その位置は規定されている。さらに、コード906を有し、このコードはIDを示している。
【0064】
このタイミングマークによりスキャナ装置113またはネットワークスキャナ装置204などで読み取られた画像が歪んだとしても補正が可能である。また、紙処理部106がID管理部110から取得したIDをコード画像として張り付けたコード906がある。
【0065】
以上が紙文書を印刷する処理の説明である。次に、筆記された紙文書を読み込み、コンテンツを抽出する処理について説明する。
【0066】
図8は、紙処理部106においてスキャナI/F制御部105からスキャン画像を渡されたときの制御手順である。紙処理部106では、スキャナI/F制御部105から紙文書をスキャンした画像を受け取る(S401)。このステップS401は、紙文書読み込み段階に対応する。また、ここでの画像は、図9で示す紙文書901のように、紙文書に対して加筆をおこなった筆記画像1007、1008、1009、1010を有するものとする。また、図9には、コンテンツ領域1001、1002、1003、1004、1005、1006が示されている。
【0067】
次に画像901に対して、スキュー補正をおこなう(S402)。そしてコード906を探し、デコードを行い、IDを取得する(S403)。そのIDをID管理部110に渡し、その紙文書に対応する電子文書の情報(ディスク装置115に格納されているパス名など)を受け取る(S404)。そしてスキャンした画像と電子文書の情報をコンテンツ処理部107に渡して(S405)終了する。
【0068】
図10は、コンテンツ処理部107において紙処理部106からスキャンによる情報が渡された時(S405)の制御手順である。コンテンツ処理部107では紙処理部106からスキャンした画像と少なくとも電子文書を取得するための情報(電子文書名など)を取得する(S501)。
【0069】
そしてその情報からディスクI/F制御部111を介してディスク装置115から電子文書を取得する(S502)。取得した電子文書を画像化して紙処理部106からの画像との差分をとり(S503)、筆記画像を抽出する。そして紙全面の筆記画像を領域のまとまりを考慮してクラスタリングを行う(S504)。これにより図9に示すような4つの筆記画像1007、1008、1009、1010が取れ、それら筆記画像を囲む矩形の領域の頂点の座標を得たものとする。図11は、その矩形の例を示すものであり、矩形である筆記領域1401と、筆記画像1008と、コンテンツ領域1003とが示されている。このような筆記画像を含む矩形の領域が筆記領域である。
【0070】
次に電子文書をPDF(Portable Document Format)に変換する(S505)。なお、ここでは、テキスト領域や画像領域の位置を保持し、そのコンテンツを抽出できるようなファイルフォーマットであり、そのフォーマット画像に変換するドライバが提供されているものであればPDFに限定するものではない。
【0071】
抽出段階に対応するS506〜S509では取得した筆記領域の数(n=4)だけ処理を行うため、処理されていない筆記領域が無くなった場合はS511に進み、処理する筆記領域がある場合は一つの筆記領域の処理としてS507以降に進む(S506)。対象とする筆記領域がテキスト領域かどうかを判断する(S507)。このテキスト領域とは、コンテンツ領域の1つであり、文字が書かれているものである。コンテンツ領域には他に画像領域がある。なお、筆記領域がテキスト領域とは、筆記された領域がテキスト領域という意味である。
【0072】
S507では電子文書を画像化し、領域識別しておくことで判断が可能となる。領域識別の手法については、開示されている一つの固定閾値または二つの固定閾値を用いて画素を白画素と黒画素に分類し、連結した黒画素群と連結した白画素群の両方が局所領域内に存在する画素を文字の画素として検出する方式などを利用する。
【0073】
ここでは図9に示すように、コンテンツ領域1001,1002,1004,1006をテキスト領域と判断し、コンテンツ領域1003,1005を画像領域というように判断したものとする。
【0074】
例えば、筆記領域1401とコンテンツ領域1003とが共通の領域を有するので、ステップS510で、コンテンツ領域1003のコンテンツはPDF化したファイルから抽出される。一方、そのようになっていないコンテンツ領域1005のコンテンツはステップS510で抽出されない。
【0075】
また、テキスト領域として判断されたコンテンツ領域1002、1004、1010の場合、S508に進み、筆記領域がコンテンツ領域と共通の領域を有するかどうか判断される。共通の領域を有するテキストは抽出される(S510)。
【0076】
図12は筆記画像1007の筆記領域1102が複数の文字からなるコンテンツ領域1101と共通の領域を有している例である。コンテンツ領域1101は一文字単位の複数のコンテンツ領域からなり、一文字単位で共通の領域を有するかどうかが判断される。これによりコンテンツ領域1101から文字コンテンツとして「さしすせそ」が抽出される。
【0077】
S508で共通の領域がないと判断されれば、筆記領域の近傍のコンテンツ領域を探し、そのコンテンツ領域のコンテンツを抽出する(S509)。図13は筆記領域1302がコンテンツ領域1301と共通の領域がない場合の例である。この場合、筆記領域1302の矩形の長辺の近傍にあるコンテンツ「ABC」が抽出される。また、図14も筆記領域1202がコンテンツ領域1201と共通の領域がない場合の例である。この場合も、矩形の長辺の近傍にあるコンテンツ「へと」が抽出される。S506からS509ですべての筆記領域について処理が終われば、抽出したコンテンツをアプリケーション部へ送り(S511)、処理を終了する。
【0078】
このようにすることにより、アプリケーションではコンテンツ処理部からの情報を用いて様々な処理を行うことができる。例えば、抽出した文字コンテンツをWWWサービスに検索させたり、抽出した画像コンテンツ、文字を別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。 以上説明したように、本実施例によれば、電子文書のコンテンツと関連づけるIDを含めて印刷された紙文書に、ユーザが筆記をしたものに対してその筆記領域とコンテンツの位置関係から対応するコンテンツを取得してアプリケーション利用することが可能となる。
【0079】
また、筆記領域を矩形として扱うことでコンテンツとの位置関係が明確になり、抽出するコンテンツを決定することがより容易となる。
【0080】
さらに、筆記領域がコンテンツ領域と共通の領域を有する場合に、そのコンテンツを対象とするようにするため、筆記対象としたコンテンツを不足なく抽出し、アプリケーション利用することが可能となる。
【0081】
その上、筆記領域とコンテンツ領域の共通の領域がない場合でも近傍のコンテンツを抽出するようにしたため、テキストのような行の下にアンダーラインを引いたような加筆においても間違いなく文字コンテンツを抽出し、アプリケーション利用することが可能となる。
【0082】
また、ユーザが筆記したコンテンツがテキストのコンテンツである場合、テキストを文字単位で領域を判断してコンテンツとして文字単位で抽出し、アプリケーション利用することが可能となる。これによりテキスト全体ではなく、ユーザがその一部を筆記で指定した場合にも正しく抽出することが可能となる。
【0083】
また、ユーザが筆記したコンテンツがテキストのコンテンツである場合、筆記領域の長辺の近傍の文字を抽出することにより、テキストコンテンツの行の向きに関わらずユーザが指定した所望の文字コンテンツを抽出してアプリケーション利用することが可能となる。
【0084】
また、画像処理方法をコンピュータが制御可能なOSにしたがってプログラミングすることにより、そのOSを備えたコンピュータであれば同じ処理方法により制御することができる。
【実施例2】
【0085】
実施例2において、実施例1で説明した図1から図8に示される構成や処理は変わらない。実施例2で扱う紙文書が図7であることは同じだが、図7のような横書きのみの文書であり、コンテンツへの参照指示は線分で筆記することを前提としている。また、筆記された紙文書は、図15に示されるものとする。従って、図8の説明における「図9」は図15に読み替える。
【0086】
なお、図15に示した紙文書において、横書きとは一般的に用いられる意味と変わらず、矢印6001に示される方向に書かれるものである。従って、図15に示されるテキストを横書きどおりに読むと「あいうえおかきくけこ…」となる。そして、文字が記載されている方向と垂直の辺とは、矢印6002と平行な辺である。また行の高さも一般的に用いられる意味と変わらず、矢印6002の長さとなる。
【0087】
図16は、コンテンツ処理部107において紙処理部106からスキャンによる入力が渡された時(図8のS405参照)の制御手順である。コンテンツ処理部107は、紙処理部106から画像と少なくとも電子文書を取得するための情報を受け取る(S601)。
【0088】
そしてコンテンツ処理部107は、その情報からディスクI/F制御部111を介してディスク装置115から電子文書を取得する(S602)。次にコンテンツ処理部107は、取得した電子文書を画像化して紙処理部106からの画像との差分をとり(S603)、筆記画像を抽出する。
【0089】
図17がその結果の筆記画像である。この図17に示される筆記画像から紙全面の筆記画像を領域のまとまりを考慮してクラスタリングをおこない(S604)、図17に示すような5つの筆記領域7004、7007,7008,7009,1010が取れ、その筆記領域(各波線部)の座標を取得する。
【0090】
次に電子文書をPDFに変換する(S605)。なお、ここでは、テキストや画像の位置を保持し、そのコンテンツを取出せるようなファイルフォーマットであり、そのフォーマット画像に変換するドライバが提供されているものであればPDFに限定するものではない。
【0091】
S606〜S611では取得した筆記領域の数のn回(図17の例ではn=5)処理を行うため、処理されていない筆記領域が無くなった場合はS612に進み、処理する筆記領域がある場合は一つの筆記領域の処理としてS607以降に進む(S606)。その場合まず、処理対象とする筆記画像の種類を判断する(S607)。その筆記画像種類の解釈の手段は3つあり、それについては後に説明する。
【0092】
S607の筆記画像種類の解釈の結果、それが水平線分であるかどうかを調べる(S609)。ここで水平線分の筆記画像とは、簡単にいうと横長の線分をいう。例えば下線である筆記画像は水平線分である。筆記画像が水平線分であればさらに筆記領域の近傍にコンテンツがあるかを調べる(S610)。コンテンツ領域が存在すれば、その筆記画像はコンテンツに対する指示であると判断し、その位置のコンテンツやその一部をPDFより抽出し、S606へもどる。
【0093】
図17での筆記画像1007が水平線分として解釈された場合、文字列として「いうえおか」が抽出される。S609で筆記領域が水平成分でないときやS610で近傍にコンテンツ領域がない場合は、その筆記領域はユーザが意図したコメントや絵などのデータであるとしてそのまま取出して筆記データとして保持して(S608)、S606へもどる。
【0094】
図17で筆記領域7010が水平線分でないと解釈された場合、その筆記領域の画像そのものを保存したり、文字認識処理結果を保存したりする。そしてS606からS610ですべての筆記領域について処理が終われば、抽出したコンテンツと筆記データをアプリケーション部へ送り(S612)、終了する。このように、筆記クラスタの種類の解釈をすることで、ユーザの意図したデータをその後のアプリケーションなどで利用可能となる。
【0095】
次に、上述したステップS607の筆記領域の種類を解釈する処理として、3つの処理例を説明する。まず1つ目を、図18を用いて説明する。対象としている筆記領域の形状(図17での点線で示した外接矩形である)の縦横比率(ratio=縦の長さ/横の長さ)をもとめる(S701)。これを予め定めておいた既定値と比較する(S702)。縦横比率が既定値より小さければ、その筆記領域は水平線分であると判断し(S703)、そうでなければ水平線分ではないと判断(S704)し、処理を終了する。これにより細い長い筆記領域を線分、高さのある短い筆記を単なる筆記画像として判断することができる。
【0096】
このように、矩形である筆記領域の辺の縦横比率に基づき、筆記画像が水平線分であるかどうかが判断される。
【0097】
次に2つ目の処理を、図19を用いて説明する。筆記領域の縦の長さ(height)を求める(S801)。さらにこの筆記領域の近傍のテキストコンテンツを探し、そのテキストコンテンツの行高さ(cheight)を求める(S802)。図15の筆記領域1009の場合、コンテンツ領域1002のテキストを探し、作成されたPDFからフォントの高さ属性を取り出すことでテキストの行高さを取得できる。
【0098】
そしてheightとcheightを比較し(S803)、筆記領域の縦の長さの方が大きければその筆記領域を非水平線分であると判断し(S804)、そうでなければ水平線分と判断し(S805)、処理を終了する。
【0099】
上記S803における比較はcheightにある規定値をかけた値との比較をしてもかまわない。これにより、まわりの文字の大きさとの比較の上で筆記領域を水平線分または筆記画像に判断することができるので短い筆記領域や短い水平線分であっても正確に判断できる。
【0100】
このように、紙文書に横書きで記載された文字の行の高さと、矩形である筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づいた判断が行われる。
【0101】
次に3つ目の処理を、図20を用いて説明する。筆記領域に手書き文字認識処理をおこなう(S901)。その認識結果が成功したかどうかを判断する(S902)。成功したのであれば、テキストデータ(非水平線分)であると判断し(S903)、そうでなければ非テキストデータ(水平線分の可能性あり)と判断(S904)して処理を終了する これにより筆記の大きさにはかかわらず、文字かどうかの正確な判断がされる。このように、筆記画像が文字の場合、筆記画像が水平線分ではないと判断される。
【0102】
なお、以上説明した3つの筆記領域の意味判断の処理を組合わせることも可能であり、その場合、さらに正確に水平線分と非水平線分とを判断することができる。
【0103】
以上説明してきたことから、アプリケーションではコンテンツ処理部からの情報を用いて様々な処理を行うことができる。例えば、抽出した文字コンテンツや筆記文字をWWWサービスに検索させたり、抽出した画像コンテンツ、文字や筆記コメントを別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。
また本実施例2によれば、電子文書のコンテンツと関連づけるIDを含めて印刷された紙に、ユーザが筆記をしたものに対してその筆記の意味から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツのデータを取得するかを決定して処理が行われるので、筆記者が筆記指示したデータがアプリケーションで利用することが可能となる。
【0104】
さらに本実施例2によれば、筆記の形状を矩形として扱い、その縦横の比率から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツのデータを取得するかを決定して処理が行われるので、細長い筆記を線分(コンテンツへの参照)、高さのある短い筆記を筆記データとしてより正確に判断することができる。
また、本実施例2によれば、筆記領域を矩形として扱い、その縦の長さと関係するテキストコンテンツの行高さから判断して筆記領域そのものをデータとして取得するか、筆記領域に対応するコンテンツ領域を取得するかを決定して処理が行われるので、短い筆記や短い線分であっても正確に判断できる。
【0105】
また、本実施例2によれば、筆記の内容をよみこみ、手書き文字認識処理をかけてその成否から判断して筆記そのものをデータとして取得するか、筆記位置に対応するコンテンツデータを取得するかを決定して処理が行われるので、筆記の大きさにはかかわらず、ユーザが記述した文字かどうかの正確な判断がされる。
【0106】
このように、実施例2によれば、電子文書とリンクされた紙文書に筆記したものを読み込み、その筆記がコンテンツへの参照か、筆記データそのものに意味があるかを自動的に判断して適切なデータを取出すことができ、それを例えば、抽出した文字コンテンツや筆記文字をWWWサービスに検索させたり、抽出した画像コンテンツ、文字や筆記コメントを別ファイルに格納するような電子スクラップブックを紙から容易につくることができる。
【実施例3】
【0107】
実施例3における画像処理装置の構成例について説明する。画像処理装置の構成例は、2つあり、それらを図21と図22を用いて説明する。なお、以下の説明において、既に説明した符号の説明は省略する。
【0108】
まず、図21から説明する。図21は、図1に記載のアプリケーション104と、操作解釈部103がなくなり、スピーカ3104と、タッチパネル3103と、キーボード3112とが加えられたものである。
【0109】
画像処理装置101は、ユーザI/F制御部102を介してキーボード3112やタッチパネル3103などの外部入力デバイスからの紙操作命令(文書印刷指示やコンテンツ処理指示)を受けとり、紙処理部106へ渡す。また、紙処理部106やコンテンツ処理部107から受けた出力要求をタッチパネル3103やスピーカ3104などの外部出力デバイスへ送るものである。
【0110】
図22は実施例3における2つ目の構成例を示す図である。図22も同様に、図2に記載のアプリケーション104と、操作解釈部103がなくなり、スピーカ3104と、タッチパネル3103と、キーボード3112と、コンピュータ装置207が加えられたものである。
【0111】
コンピュータ装置207は、画像処理装置201とネットワーク203を介してFTP(File Transfer Protocol)やリモートファイル格納、メール送受信が可能であり、そのようなコンピュータ装置が1つ以上存在しているものとする。
【0112】
以下、実施例3における紙処理部106、コンテンツ処理部107、ID管理部110、印刷処理部109の制御手順や管理形態について図を用いて詳細に説明する。まず、実施例3で読み込まれる紙文書について、図23、24を用いて説明する。図23は、印刷される元の電子文書601を示すものである。図23には、テキスト部602、603、605と、動画部604と、音声部605とをコンテンツとして有する電子文書601が示されている。
【0113】
この電子文書601を印刷処理部109の処理によって印刷された紙文書が図24である。この紙文書には、タイミングマーク902、903、904、905があり、その位置は規定されているので、スキャナ装置113、204などで読み取られた画像が歪んだとしても補正が可能である。また、紙処理部106がID管理部110から取得したIDを張り付けたコード906がある。
【0114】
この紙文書901に対して筆記を行った紙文書を示すのが、図25で示す紙文書5001である。図25には、筆記画像5002、5003、5004が示されている。これらの各文書に対して以下に説明する処理が行われる。
【0115】
図26はユーザI/F制御部102から入力を受けたときの紙処理部106での制御手順を示すフローチャートである。紙処理部106では、初めに入力がどの指示かを判断する。まずその受け取った入力が印刷要求かどうかを判断する(S1001)。
【0116】
印刷要求であれば、ユーザI/F制御部102より電子文書のパラメータ情報(電子文書名、ページ番号)を取得する(S1002)。取得した電子文書のパラメータ情報をID管理部110に登録依頼をしてIDを取得する(S1003)。取得したIDと電子文書名とページ番号を印刷処理部109へ渡して(S1004)、処理を終了する。なお、IDを管理しているIDテーブルは図5に示されているものである。
【0117】
S1001で受け取った入力が印刷要求でない場合、その入力がコンテンツ処理要求かどうかを調べる(S1005)。コンテンツ要求でなければ終了し、コンテンツ要求であればユーザI/F制御部102に処理パラメータ情報の入力を要求し、処理パラメータ情報として転送方法、転送先を取得する(S1006)。この入力はユーザによりタッチパネルで行われるが、そのタッチパネルに表示される入力画面は後に説明する。
【0118】
次にスキャナI/F制御部105(もしくはネットワークI/F制御部202)に紙文書のスキャン操作を指示し、スキャンされた画像を受け取る(S1007)。次に、スキュー補正をおこなう(S1008)。そしてコード906(図25参照)を探し、デコードを行い、IDを取得する(S1009)。そのIDをID管理部110に渡し、その紙文書の原稿である電子文書の情報(ディスク装置115に格納されているパス名、ページ番号)を受け取る(S1010)。そして画像と電子文書情報をコンテンツ処理部107に渡して(S1011)、処理を終了する。
【0119】
次に、上述した入力画面について、図27を用いて説明する。図27は、タッチパネルに表示される入力画面例を示している。この入力画面には、「転送方法」と「転送先」とが入力される。ここでは転送方法として、「コンテンツ確認」と、「FTP」と、「ネットワークフォルダ」と、「E−Mail」とを指定することができる。指定方法は、その前にあるチェックボックスで指定するものとなっている。
【0120】
「コンテンツ確認」の場合は、この画像処理装置101または201上でそのコンテンツに関連付けられた処理を実行することでコンテンツを表現する。具体的に、コンテンツを表現するとは、コンテンツが音楽データを意味するものであれば音楽をスピーカに出力したり、コンテンツがテキストを意味するものであればエディッタなどを用いて内容を表示することがコンテンツ表現の例である。すなわち、コンテンツに関連付けられた処理が実行されることである。
【0121】
「FTP」の場合は転送先に指定したFTPサーバへコンテンツをファイル送信する。「ネットワークフォルダ」の場合は転送先に指定したホストのネットワークフォルダにコンテンツをファイルとして保存する。「E−Mail」の場合は「転送先」に指定されたアドレスにコンテンツを添付したメールを送信する。
【0122】
次に、印刷処理部109において紙処理部106から印刷要求をうけたとき(S1004)の制御手順を、図28のフローチャートを用いて説明する。印刷処理部109では紙処理部106からIDと電子文書名、印刷ページを取得する(S1101)。ディスクI/F制御部111(もしくはネットワークI/F制御部202)を介してディスク装置115から渡された電子文書ファイルを取出す(S1102)。
【0123】
そしてIDをバーコードなどにコード化し(S1103)、またスキャンした画像のスキューを補正するためのタイミングマークとともに電子文書の印刷するページに重畳して印刷画像を作成する(S1104)。このとき、印刷不可能なマルチメディアデータなどのデータはその位置を示す矩形などの枠で示し、そこにはそのデータ型を表記するように印刷画像を作成するとユーザには分かりやすい。
【0124】
プリンタI/F制御部108またはネットワークI/F制御部202を介してプリント装置114もしくは205に印刷要求をする(S1105)ことで印刷が完了する。
【0125】
このようにして、上述した図24の紙文書は印刷される。他の紙文書の例を図29に示す。紙文書5200には、コンテンツ領域5201、5202、5203、5204、5205が示されている。それぞれのコンテンツ領域は、Movie、Voice、DataSheet、Textと記されている。
【0126】
この紙文書5200に対応する電子文書に示される動画、音声、データベース、テキストデータのコンテンツは、それぞれ張り付けられた位置にMovie(1201,1204,1205),Voice(1202),DataSheet(1203),Text(1205)の処理が関連付けられているとともに、それらの文字とともに矩形領域で示されている。
【0127】
ユーザは所望のコンテンツ領域に筆記することにより、動画(Movie)、音声(Voice)、表計算データ(DataSheet)、テキストデータ(Text)を閲覧や視聴することができるようになる。
【0128】
この紙文書を利用することによりユーザは抽出するコンテンツ種類を判断でき、また記入する位置を把握することが容易となる。また、コンテンツの種類を表示するのに文字ではなくアイコンなどのマークであってもよい。
【0129】
次に、図30を用いて、コンテンツ処理部107の処理を説明する。コンテンツ処理部107は紙処理部106から画像と電子文書を取得するための電子文書情報と処理パラメータとしてコンテンツの処理方法、転送先を受け取る(S1201)。そしてその電子文書情報からディスクI/F制御部111(ネットワークI/F制御部202)を介してディスク装置115から電子文書を取得する(S1202)。
【0130】
取得した電子文書を印刷処理部109により画像化して紙処理部106からの画像との差分をとり、筆記画像を抽出する(S1203)。そして紙全面の筆記画像を領域のまとまりを考慮してクラスタリングを行う(S1204)。
【0131】
図31は、差分をとりクラスタリングされた画像を示す図である。図31の場合、3つにクラスタリングされている。それらは、筆記領域5101、1102、1103と示されているものである。そして、コンテンツ処理部107は、これら矩形の筆記領域の頂点の座標を求めることで筆記位置が求まる。
【0132】
次に電子文書をPDFに変換する(S1205)。なお、ここでは、テキストや画像の位置を保持し、そのコンテンツを取出せるようなファイルフォーマットであり、そのフォーマット画像に変換することができればPDFに限定するものではない。
【0133】
S1206〜S1209では取得した筆記領域の数(n=3)だけ処理を行うため、処理されていない筆記領域が無くなった場合は終了し、処理する筆記領域がある場合はその筆記領域を処理対象としてS1207以降に進む(S1206)。
【0134】
次に、対象とする筆記領域がコンテンツ領域と共通の領域を有するかどうかを調べる(S1207)。筆記領域と共通の領域を有しているコンテンツ領域がある場合はそのコンテンツのオブジェクトをPDF化したファイルから抽出する(S1208)。そうでない場合はS1206へ戻る。
【0135】
外部とのネットワーク通信機能をもつ画像処理装置201の場合、S1201で取得していた処理パラメータの中から利用方法をとりだし、それがコンテンツ表現であるかを調べる(S1209)。
【0136】
コンテンツ表現であれば抽出したコンテンツの種類からその種類に応じた外部デバイスで表現するようにユーザI/F制御部102へ出力要求をしてS1206へ戻る(S1210)。
【0137】
外部とのネットワーク通信機能がない画像処理装置101の場合はS1209の処理は存在せずS1210の処理のみを行うことになる。例として筆記領域5002の場合、コンテンツ領域5002と共通の領域を有する。コンテンツ領域5002は動画を示しているので、コンテンツ処理部107はユーザI/F制御部102へタッチパネル3103で画像再生、動画に音声があれば、スピーカ3104で音声再生するよう要求する。
【0138】
また、筆記領域1102の場合は、コンテンツ領域1003と共通の領域を有する。コンテンツ領域1003は音声を示すものであるので、コンテンツ処理部107はユーザI/F制御部102へスピーカ3104で音声再生するよう要求する。また、筆記領域1103の場合は、コンテンツ領域5004と共通の領域を有する。コンテンツ領域5004は、表計算データを示しているので、表計算アプリケーションが起動し、その画像がタッチパネル3103で表示するよう要求する。
【0139】
一方、S1209において利用方法がコンテンツ表現でない場合は、FTPまたはネットワークファイル、E−Mailのいずれか指定された方法と転送先へそれぞれのプロトコル処理をおこない、コンテンツを送信してS1206へ戻る(S1211)。あるいは、すべてのクラスタを対象にS1207〜S128の処理をおこない、そのとき抽出したコンテンツを保持しておき、最後にコンテンツをすべてまとめてS1209,S1210,S1211の処理を行ってもよい。
【0140】
以上説明した実施例3の画像処理装置101、201は、パーソナルコンピュータ等のコンピュータにより構成することができ、その場合、紙処理部106、コンテンツ処理部107、ID管理部110はそれぞれの機能をコンピュータに実現させるプログラムとして構成される。
【0141】
本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷された紙文書に、ユーザが筆記をしたものに対してその画像を読み取り、筆記画像を抽出して、そのまとまりを判断し、その位置から対応する電子文書上のデータを抽出したのち、表現することが可能であるので、ユーザは紙文書に筆記してスキャンするだけでその電子原稿が持つマルチメディアやオリジナルデータをその場で容易に確認することが可能となる。
【0142】
また、本実施例3によれば、筆記画像の位置に対応する電子文書上のデータを抽出したのち、所望の宛先へ抽出したコンテンツデータを転送することが可能であるので、ユーザは紙文書に筆記してスキャンするだけでその電子原稿が持つマルチメディアやオリジナルデータを後で利用する環境に容易に保存しておくことが可能となる。
【0143】
さらに、本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷する際に、電子文書内のコンテンツが存在する領域に枠をつけた上で印刷することで、ユーザは抽出したいコンテンツを筆記する場所を確認することが容易になる。
【0144】
また、本実施例3によれば、電子文書のコンテンツと関連づけたIDを含めて印刷する際に、電子文書内のコンテンツが存在する際にはそのコンテンツのデータ種類を印刷することで、ユーザが実際に必要な型のコンテンツを選択することが可能となる。
【図面の簡単な説明】
【0145】
【図1】実施例1における画像処理装置の構成例である(その1)。
【図2】実施例1における画像処理装置の構成例である(その2)。
【図3】ユーザI/F制御部から入力を受けたときの操作解釈部での処理を示すフローチャートである。
【図4】紙処理部の処理を示すフローチャートである。
【図5】IDテーブルが格納している情報の一例を示す図である。
【図6】印刷処理部が印刷要求を受けたときの処理を示すフローチャートである。
【図7】紙文書の例を示す図である。
【図8】紙処理部がスキャン画像を渡されたときの処理を示すフローチャートである。
【図9】筆記された紙文書の画像を示す図である。
【図10】コンテンツ処理部の処理を示すフローチャートである。
【図11】画像領域の場合の共通の領域を示す図である。
【図12】筆記領域が複数の文字と共通の領域を有している例を示す図である。
【図13】筆記領域が複数の文字と共通の領域を有していない例を示す図である(その1)。
【図14】筆記領域が複数の文字と共通の領域を有していない例を示す図である(その2)。
【図15】紙文書の例を示す図である。
【図16】コンテンツ処理部の処理を示すシーケンス図である。
【図17】筆記画像を示す図である。
【図18】筆記領域の種類を解釈する処理を示すフローチャートである(その1)。
【図19】筆記領域の種類を解釈する処理を示すフローチャートである(その2)。
【図20】筆記領域の種類を解釈する処理を示すフローチャートである(その3)。
【図21】実施例3における画像処理装置の構成例である(その1)。
【図22】実施例3における画像処理装置の構成例である(その2)。
【図23】電子文書を示す図である。
【図24】紙文書を示す図である。
【図25】筆記された紙文書を示す図である。
【図26】紙処理部での処理を示すフローチャートである。
【図27】タッチパネルに表示される入力画面例を示す図である。
【図28】印刷処理部での処理を示すフローチャートである。
【図29】紙文書を示す図である。
【図30】コンテンツ処理部の処理を示すフローチャートである。
【図31】差分をとりクラスタリングされた画像を示す図である。
【符号の説明】
【0146】
101、201 画像処理部
102 ユーザI/F制御部
103 操作解釈部
104 アプリケーション部
105 スキャナI/F制御部
106 紙処理部
107 コンテンツ処理部
108 プリンタI/F制御部
109 印刷処理部
110 ID管理部
111 ディスクI/F制御部
112 入出力装置
113 紙入力装置
114 紙出力装置
115 ディスク装置
203 外部ネットワーク
204 ネットワークスキャナ装置
205 ネットワークプリンタ装置
206 コンピュータ装置
801 IDテーブル
802、803、804 列
805 行
901、5200 紙文書
902、903、904、905 タイミングマーク
906 コード
907 コンテンツ部
1001、1002、1003、1004、1005、1006、1101、1201、1301、5201、5202、5203、5204、5205、5206 コンテンツ領域
1007、1008、1009、1010、2002、2004、2005、5002、5003、5004、7004、7007、7008、7009、7010 筆記画像
1102、1103、1302、1401、2001、2003、5101 筆記領域
【特許請求の範囲】
【請求項1】
コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、
読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段と
を有することを特徴とする画像処理装置。
【請求項2】
前記筆記領域は矩形であることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする請求項2に記載の画像処理装置。
【請求項5】
前記近傍は、前記矩形の長辺の近傍であることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
前記抽出手段は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。
【請求項7】
前記抽出手段は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする請求項6に記載の画像処理装置。
【請求項8】
矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項7に記載の画像処理装置。
【請求項9】
前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項7に記載の画像処理装置。
【請求項10】
前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする請求項7に記載の画像処理装置。
【請求項11】
前記抽出手段が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする請求項1から10のいずれか1項に記載の画像処理装置。
【請求項12】
前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする請求項11に記載の画像処理装置。
【請求項13】
前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする請求項11に記載の画像処理装置。
【請求項14】
前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得手段を有することを特徴とする請求項1から13のいずれか1項に記載の画像処理装置。
【請求項15】
前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理手段を有することを特徴とする請求項1から14のいずれか1項に記載の画像処理装置。
【請求項16】
コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み段階と、
読み込まれた前記紙文書に筆記された領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツを抽出する抽出段階と
を有することを特徴とする画像処理方法。
【請求項17】
前記筆記領域は矩形であることを特徴とする請求項16に記載の画像処理方法。
【請求項18】
前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする請求項16または17に記載の画像処理方法。
【請求項19】
前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする請求項17に記載の画像処理方法。
【請求項20】
前記近傍は、前記矩形の長辺の近傍であることを特徴とする請求項19に記載の画像処理方法。
【請求項21】
前記抽出段階は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする請求項16から20のいずれか1項に記載の画像処理方法。
【請求項22】
前記抽出段階は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする請求項21に記載の画像処理方法。
【請求項23】
矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項22に記載の画像処理方法。
【請求項24】
前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項22に記載の画像処理方法。
【請求項25】
前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする請求項22に記載の画像処理方法。
【請求項26】
前記抽出段階が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする請求項16から25のいずれか1項に記載の画像処理方法。
【請求項27】
前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする請求項26に記載の画像処理方法。
【請求項28】
前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする請求項26に記載の画像処理方法。
【請求項29】
前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得段階を有することを特徴とする請求項16から28のいずれか1項に記載の画像処理方法。
【請求項30】
前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理段階を有することを特徴とする請求項16から29のいずれか1項に記載の画像処理方法。
【請求項31】
請求項16から30のいずれか1項に記載の画像処理方法をコンピュータに実行されるための画像処理プログラム。
【請求項1】
コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み手段と、
読み込まれた前記紙文書に筆記された筆記画像を含む領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツまたは前記筆記画像を抽出する抽出手段と
を有することを特徴とする画像処理装置。
【請求項2】
前記筆記領域は矩形であることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする請求項2に記載の画像処理装置。
【請求項5】
前記近傍は、前記矩形の長辺の近傍であることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
前記抽出手段は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。
【請求項7】
前記抽出手段は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする請求項6に記載の画像処理装置。
【請求項8】
矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項7に記載の画像処理装置。
【請求項9】
前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項7に記載の画像処理装置。
【請求項10】
前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする請求項7に記載の画像処理装置。
【請求項11】
前記抽出手段が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする請求項1から10のいずれか1項に記載の画像処理装置。
【請求項12】
前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする請求項11に記載の画像処理装置。
【請求項13】
前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする請求項11に記載の画像処理装置。
【請求項14】
前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得手段を有することを特徴とする請求項1から13のいずれか1項に記載の画像処理装置。
【請求項15】
前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理手段を有することを特徴とする請求項1から14のいずれか1項に記載の画像処理装置。
【請求項16】
コンテンツが描かれたコンテンツ領域を有するとともに、ユーザにより筆記された紙文書を読み込む紙文書読み込み段階と、
読み込まれた前記紙文書に筆記された領域である筆記領域と相当の位置関係にある前記コンテンツ領域のコンテンツを抽出する抽出段階と
を有することを特徴とする画像処理方法。
【請求項17】
前記筆記領域は矩形であることを特徴とする請求項16に記載の画像処理方法。
【請求項18】
前記相当の位置関係は、前記筆記領域と前記コンテンツ領域とが共通の領域を有する関係であることを特徴とする請求項16または17に記載の画像処理方法。
【請求項19】
前記相当の位置関係は、前記コンテンツ領域が前記筆記領域の近傍に位置する関係であることを特徴とする請求項17に記載の画像処理方法。
【請求項20】
前記近傍は、前記矩形の長辺の近傍であることを特徴とする請求項19に記載の画像処理方法。
【請求項21】
前記抽出段階は、前記コンテンツが1つ以上の文字からなるテキストである場合、前記テキストに含まれる文字のうち、前記筆記領域と相当の位置関係にある文字のみを前記コンテンツとして抽出することを特徴とする請求項16から20のいずれか1項に記載の画像処理方法。
【請求項22】
前記抽出段階は、前記筆記領域に含まれる筆記画像が水平線分ではない場合、前記コンテンツを抽出せずに前記筆記画像を抽出することを特徴とする請求項21に記載の画像処理方法。
【請求項23】
矩形である前記筆記領域の辺の縦横比率に基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項22に記載の画像処理方法。
【請求項24】
前記紙文書に横書きで記載された文字の行の高さと、矩形である前記筆記領域の辺のうち、文字が記載されている方向とは垂直である辺の長さに基づき、前記筆記画像が水平線分であるかどうか判断することを特徴とする請求項22に記載の画像処理方法。
【請求項25】
前記筆記画像が文字の場合、前記筆記画像が水平線分ではないと判断することを特徴とする請求項22に記載の画像処理方法。
【請求項26】
前記抽出段階が抽出したコンテンツに関連付けられた処理が実行されることを特徴とする請求項16から25のいずれか1項に記載の画像処理方法。
【請求項27】
前記コンテンツに関連付けられた処理は、動画表示処理、音声送出処理、表計算データ表示処理、テキストデータ表示処理のいずれか1つ以上であることを特徴とする請求項26に記載の画像処理方法。
【請求項28】
前記コンテンツに関連付けられた処理は、前記コンテンツに関連付けられたファイルを所定の宛先へ送信する処理であることを特徴とする請求項26に記載の画像処理方法。
【請求項29】
前記紙文書と対応する電子文書から、前記コンテンツを取得するコンテンツ取得段階を有することを特徴とする請求項16から28のいずれか1項に記載の画像処理方法。
【請求項30】
前記紙文書を、該紙文書と対応する電子文書を特定するための特定情報とともに印刷する印刷処理段階を有することを特徴とする請求項16から29のいずれか1項に記載の画像処理方法。
【請求項31】
請求項16から30のいずれか1項に記載の画像処理方法をコンピュータに実行されるための画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【公開番号】特開2006−293970(P2006−293970A)
【公開日】平成18年10月26日(2006.10.26)
【国際特許分類】
【出願番号】特願2005−232358(P2005−232358)
【出願日】平成17年8月10日(2005.8.10)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成18年10月26日(2006.10.26)
【国際特許分類】
【出願日】平成17年8月10日(2005.8.10)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]