画像処理装置、画像処理方法及びプログラム
【課題】画像データを異なる属性領域に識別する精度を向上させ、且つ、ユーザの利便性を向上させること。
【解決手段】画像データを取得する画像読取部26と、画像読取部26により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、画像データがテンプレートデータ領域からはみだすか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定するCPU21と、画像データからベクトルデータを生成し、該生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する制御を行うCPU21と、を備える。
【解決手段】画像データを取得する画像読取部26と、画像読取部26により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、画像データがテンプレートデータ領域からはみだすか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定するCPU21と、画像データからベクトルデータを生成し、該生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する制御を行うCPU21と、を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、環境問題が叫ばれる中、オフィスにおけるペーパーレス化が急速に進んでいる。例えば、バインダ等に蓄積された紙原稿をスキャナで読み取り、データベースとして画像形成装置に蓄積することで、ペーパーレス化を実現する技術が知られている。
【0003】
しかしながら、上述の技術では、紙原稿を保存するファイルがイメージデータであるため、原稿の一部のオブジェクトを再利用する場合、図、表等を新たにアプリケーションで作成しなければならなかった。
【0004】
このため、紙原稿から読み取られたイメージデータを、文字/線画部分(以下、文字部分)の属性領域と画像部分の属性領域とに識別し、該識別された属性領域ごとにベクトル化処理を実行することで、一般のアプリケーションで編集可能な電子ファイルを生成する技術が知られている(例えば、特許文献1参照)。
具体的に特許文献1は、イメージデータを白黒画像に二値化し、二値化した黒画素の塊を抽出し、抽出した黒画素の塊の大きさ及び形状に基づいて、文字部分と画像部分との属性領域に識別をする技術である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−157905号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述の特許文献1の技術では、イメージデータ(以下、画像データ)の属性領域を識別する精度が低いという問題があった。例えば、黒画素の塊の大きさ及び形状に基づいて、画像データの属性領域を文字部分と識別した場合であっても、文字部分が異なる属性領域を有する場合、上述の特許文献1の技術では異なる属性領域の識別ができなかった。
また、属性領域の識別ができない場合、アプリケーションで編集可能な電子ファイルに変換することができず、ユーザは、データを再利用する際、データを新たにアプリケーションで作成しなければならなかった。
【0007】
本発明の課題は、画像データを異なる属性領域に識別する精度を向上させ、且つ、ユーザの利便性を向上させることである。
【課題を解決するための手段】
【0008】
上記課題を解決するため、請求項1に記載の発明の画像処理装置は、
画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、を備える。
【0009】
請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する。
【0010】
請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する。
【0011】
請求項4に記載の発明は、請求項3に記載の画像処理装置において、
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う。
【0012】
請求項5に記載の発明は、請求項1から4のいずれか一項に記載の画像処理装置において、
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する。
【0013】
請求項6に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である。
【0014】
請求項7に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のファイル形式は、OOXMLである。
【0015】
請求項8に記載の発明の画像処理方法は、
画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、を含む。
【0016】
請求項9に記載の発明のプログラムは、
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、を実現させる。
【発明の効果】
【0017】
本発明によれば、画像データを異なる属性に識別する精度を向上させ、且つ、ユーザの利便性を向上させることができる。
【図面の簡単な説明】
【0018】
【図1】本発明に係る画像処理装置を有する画像形成装置を含むネットワーク構成図である。
【図2】コンピュータの主要構成を示すブロック図である。
【図3】画像形成装置の主要構成を示すブロック図である。
【図4】(A)は、スライド形式の紙原稿を示す図である。(B)は、ノート形式の紙原稿を示す図である。(C)は、配布資料形式の紙原稿を示す図である。
【図5】ノート形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。
【図6】配布資料形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。
【図7】ファイル出力処理の流れを示すフローチャートである。
【図8】ノート形式の紙原稿を示す図である。
【図9】(A)は、スライド形式のテンプレートを示す図である。(B)は、ノート形式のテンプレートを示す図である。(C)は、配布資料形式のテンプレートを示す図である。
【図10】「サンプル.pptx」ファイルの複数のパーツファイル群の一例を示す図である。
【図11】「Content_Types」.xmlを示す図である。
【図12A】「ppt¥notesSlides¥notesSlide1.xml」を示す図である。
【図12B】「ppt¥notesSlides¥notesSlide1.xml」を示す図である。
【図13A】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13B】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13C】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13D】「ppt¥Slides¥Slide1.xml」を示す図である。
【図14】「ppt¥Slides¥_rels¥Slide1.xml.rels」を示す図である。
【図15】mediaフォルダのファイルパス「ppt¥ppt¥media¥image1.gif」を示す図である。
【図16】「サンプル.pptx」が表示された状態を示す図である。
【発明を実施するための形態】
【0019】
以下、図を参照して本発明の実施の形態の例を詳細に説明する。
図1は、本発明による画像処理装置を有する画像形成装置1を含むネットワーク構成図である。
【0020】
画像形成装置1、1、1は、回線3を介してコンピュータ2、2と通信可能に接続されている。
回線3は、画像形成装置1、1、1及びコンピュータ2、2によるネットワークを構成する。回線3は、コンピュータ2、2及び画像形成装置1、1、1を通信可能に接続するものであればその形態を問わない。例えば、回線3は、イーサネット(登録商標)、同軸ケーブル、光ファイバー等の有線接続回線や、無線通信を実現するための各種規格等、そのいずれか又は複数の組み合わせによってよい。また、回線3は、LAN(Local Area Network)、インターネット、その他のネットワーク規模を問わない。
【0021】
図2は、コンピュータ2の主要構成を示すブロック図である。
コンピュータ2、2はそれぞれ、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、記憶部14、入力インタフェース(I/F)15、出力I/F16及び通信装置17を備え、これらの各構成はバス20により接続される。
【0022】
CPU11は、ROM13内に記憶されたプログラムと協働し、RAM12に展開されたプログラムやデータ等に従ってコンピュータ2の動作制御を行う。
RAM12は、CPU11の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を格納する。
ROM13は、CPU11によって読み出されるプログラムやデータ等を記憶する。
【0023】
記憶部14は、CPU11によって読み出されるプログラムやデータ等を記憶する。記憶部14は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
【0024】
入力I/F15は、外部入力装置18による入力を受け付けるインタフェースである。外部入力装置18は、例えばキーボードやマウス等であり、ユーザの手動操作により入力指示が行われる。
【0025】
出力I/F16は、外部出力装置19に対する出力を行うインタフェースである。外部出力装置19は、例えばCRTや液晶ディスプレイ等の表示装置等であり、CPU11の処理結果に基づいた出力画面を表示する。
【0026】
通信装置17は、コンピュータ2を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置17は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
【0027】
図3は、画像形成装置1の主要構成を示すブロック図である。図1に示す画像形成装置1、1、1は全て同じ構成によるので、以下一つの画像形成装置1について説明する。
画像形成装置1は、判定部、制御部としてのCPU21、RAM22、ROM23、記憶部24、入力I/F25、取得部としての画像読取部26、画像印刷部27、通信装置28を備え、これらの各構成はバス30により接続される。
【0028】
CPU21は、ROM23内に記憶されたプログラムと協働し、RAM22に展開されたプログラムやデータ等に従って画像形成装置1の動作制御を行う。
RAM22は、CPU21の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を記憶する。
ROM23は、CPU21によって読み出されるプログラムやデータ等を記憶する。
【0029】
記憶部24は、CPU21によって読み出されるプログラムやデータ等を記憶する。記憶部24は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
【0030】
入力I/F25は、外部入力装置29等の入力装置による入力を受け付けるインタフェースである。外部入力装置29は、例えばタッチパネルディスプレイを有する入力パネル等であり、ユーザの手動操作により入力指示が行われる。
【0031】
画像読取部26は、自動原稿搬送部(ADF)、プラテンガラス、CCD等の光学系を備えて構成され、ADF又はプラテンガラスに載置された原稿の画像を光学系により読み取る機能を実現する。画像読取部26により読み取られた画像の画像データ(アナログ画像信号)は、A/D変換され各種画像処理が施された後、デジタルの画像データ(ファイル)として記憶部24に記憶されるとともに、画像印刷部27に出力される。
【0032】
画像印刷部27は、入力された画像データに基づいて画像形成(印刷)を行う。画像印刷部27に採用可能な印刷方式としては、例えば電子写真方式やインクジェット方式、熱転写方式、オフセット等が挙げられる。本実施形態では、画像印刷部27は、電子写真方式による画像形成を行うための構成を有する。
【0033】
通信装置28は、画像形成装置1を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置28は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
【0034】
次に、図4を参照して、画像読取部26で読み取る紙原稿の形式について説明する。以下、アプリケーションソフトウエア(以下、アプリケーション)としてパワーポイント(登録商標)を用いて印刷した紙原稿の形式について説明する。図4に示すように、紙原稿の形式としては、スライド形式の紙原稿(図4(A)参照)、ノート形式の紙原稿(図4(B)参照)、配布資料形式の紙原稿(図4(C)参照)がある。
【0035】
スライド形式の紙原稿は、1ページのスライド画像が印刷された原稿である。スライド画像は、パワーポイントのスライド上に形成される画像であって、文字、線、表、図形、写真等の画像を含む。ノート形式の紙原稿は、1ページのスライド画像及びノート画像が印刷された原稿である。ノート画像は、スライドに関するメモ書き等の文字で構成される画像である。配布資料形式の紙原稿は、複数ページのスライド画像が印刷された原稿である。
【0036】
次に、紙原稿をスキャンしてからパワーポイントで編集可能な電子ファイルを出力するまでの流れについて説明する。
例えば、図5に示すように、ノート形式の紙原稿が画像読取部26によりスキャンされた(読み取られた)場合、1ページ分のスライド画像データ及びノート画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータがノート形式のファイルとして出力される。すなわちノート形式のファイルとして記憶部24に記憶される。そして、ユーザにより、ノート形式のファイルを編集する指示が実行されると、ノート形式のファイルが記憶部24から読み出され、読み出されたノート形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示される(図5参照)。なお、ノート形式のファイルは、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。これにより、ユーザは、ノート形式のファイルを編集することが可能となり、利便性が向上する。
【0037】
また、図6に示すように、配布資料形式の紙原稿が画像読取部26により読み取られた場合、複数のスライド画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータが配布資料形式のファイルとして記憶部24に記憶される。そして、配布資料形式のファイルを編集する指示が実行されると、記憶部24から配布資料形式のファイルが読み出され、読み出された配布資料形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図6参照)。このため、ユーザは、配布資料形式のファイルを編集することが可能となり、利便性が向上する
【0038】
なお、図示していないが、スライド形式の紙原稿が画像読取部26により読み取られた場合は、1ページのスライド画像データで構成される画像データ(ファイル)が取得され、図5及び図6と同様の手順でスライド形式のファイルが出力される。このため、ユーザは、スライド形式のファイルを編集することが可能となり、利便性が向上する。
【0039】
次に、図7を参照して、ファイル出力処理について説明する。ファイル出力処理は、紙原稿を画像読取部26により読み取って画像データを取得し、取得した画像データのファイル形式とテンプレートのファイル形式とが一致するかを判定し、画像データからベクトルデータを生成し、生成したベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。
【0040】
予め、図8に示すノート形式の紙原稿が自動原稿搬送部(ADF)又はプラテンガラスに載置されているものとする。以下、図8に示すように、ノート形式の紙原稿において、スライド画像には、テキスト画像、イメージ画像及びグラフィック画像が含まれているものとする。また、ノート画像には、テキスト画像が含まれているものとする(ノート画像におけるテキスト画像は、「テキスト画像(ノート)」と記す)。
【0041】
また、使用するアプリケーションを選択するための画面が予め外部入力装置29のタッチパネルディスプレイ上に表示されており、ユーザにより外部入力装置29を介して、使用するアプリケーションとして「パワーポイント」が選択入力されているものとする。
【0042】
例えば、外部入力装置29を介して紙原稿の読み取りを実行開始するためのスキャンボタンが押下されたことをトリガとして、画像形成装置1においてファイル出力処理(図7参照)が実行開始される。
【0043】
先ず、画像データの取得が行われる(ステップS1)。すなわち、紙原稿が画像読取部26により読み取られて画像データが取得される。そして、読み取られた画像の画像データ(アナログ画像信号)がA/D変換される。そして、A/D変換された画像データに各種画像処理が施され、各種画像処理が施されたデジタルの画像データが記憶部24に記憶される。
【0044】
ステップS1の実行後、記憶部24に記憶された画像データが読み出され、該読み出された画像データとテンプレートとのマッチング判定が実行される(ステップS2)。マッチング判定は、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する処理である。ここで、図9を参照して、テンプレートについて説明する。テンプレートは、画像データのファイル形式を識別するための定型的なファイルである。マッチング判定によりマッチ(一致)すると判定されたテンプレートのファイル形式は、画像データのファイル形式として決定される。本処理では、テンプレートのファイル形式として、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートの3種類が予め記憶部24に記憶されており、マッチング判定の際に記憶部24から読み出されるものとする。
【0045】
スライド形式のテンプレート(図9(A)参照)は、1ページ分のスライド画像の画像データで構成されるテンプレートである。画像データがスライド形式のテンプレートと一致する場合、画像データのファイル形式は、スライド形式のファイルと判定される。
ノート形式のテンプレート(図9(B)参照)は、1ページ分のスライド画像の画像データ及びノート画像の画像データで構成されるテンプレートである。画像データがノート形式のテンプレートと一致する場合、画像データのファイル形式は、ノート形式のファイルと判定される。
配布資料形式のテンプレート(図9(C)参照)は、複数ページ分のスライド画像の画像データで構成されるテンプレートである。画像データが複数ページのテンプレートと一致する場合、画像データのファイル形式は、配布資料形式のファイルと判定される。
なお、テンプレートにおいて、1ページ分のスライド画像の画像データで構成される領域を本文領域、ノート画像の画像データで構成される領域をノート領域と定義し、本文領域及びノート領域を総称してテンプレートデータ領域と定義する。
【0046】
以下、ノート形式の紙原稿(図8参照)が読み取られ、1ページ分のスライド画像データ及びノート画像データで構成される画像データが取得された場合におけるマッチング判定について説明する。マッチング判定は、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かに応じて、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数をテンプレート毎に算出し、該算出された点数に基づいて判定を行う処理である。
【0047】
先ず、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かが判定される。ここで、取得された画像データは、1ページ分のスライド画像データ及びノート画像データで構成される。この場合、取得された画像データにおける1ページ分のスライド画像データ及びノート画像データが各テンプレートのテンプレートデータ領域からはみ出すか否かが判定される。
【0048】
例えば、画像データと、ノート形式のテンプレート(図9(B)参照)におけるテンプレート領域(本文領域及びノート領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域及びノート領域からはみ出さないと判定された場合、画像データは、テンプレートにおける本文領域及びノート領域のそれぞれからはみ出さないと判定される。この場合、画像データが本文領域からはみ出さないことにより点数「10点」が加算され、且つ、画像データがノート領域からはみ出さないことにより点数「10点」が加算される。すなわち、ノート形式のテンプレートの点数として「20点」が算出される。
【0049】
また、画像データと、スライド形式のテンプレート(図9(A)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、スライド形式のテンプレートの点数として「0点」が算出される。
【0050】
また、画像データと、配布資料形式のテンプレート(図9(C)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、配布資料形式のテンプレートの点数として「0点」が算出される。
上記の点数が算出された場合、点数の最も高いノート形式のテンプレートが画像データのファイル形式と一致すると判定される。
【0051】
また、上述のマッチング判定において、算出された点数が所定の点数以下の場合は、テンプレートのファイル形式をユーザに選択させるようにしてもよい。例えば、算出された点数が所定の点数以下の場合、テンプレートのファイル形式をユーザに選択させるための選択情報としてテンプレートのファイル形式を選択できる画面が外部入力装置29のタッチパネルディスプレイ上に表示される。また、選択情報は、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。
【0052】
図7において、ステップS2の実行後、マッチング判定結果の判別が実行される(ステップS3)。ステップS3において、マッチング判定結果がスライド形式のテンプレートにマッチすると判別された場合(ステップS3;スライド)、画像データの本文領域にOCR処理が実行される(ステップS4)。ステップS3において、マッチング判定処理がノート形式のテンプレートにマッチすると判別された場合(ステップS3;ノート)、画像データの本文領域及びノート領域にOCR処理が実行される(ステップS5)。ステップS3において、マッチング判定処理が配布資料形式のテンプレートにマッチすると判別された場合(ステップS3;配布資料)、画像データの各本文領域にOCR処理が実行される(ステップS6)。ここで、画像データの本文領域とは、テンプレートの本文領域に相当する画像データのデータ領域である。また、画像データのノート領域とは、テンプレートのノート領域に相当する画像データのデータ領域である。画像データの本文領域と画像データのノート領域との識別は、画像データ内における枠線の有無により識別される。
また、ステップS4〜S6においてOCR処理が実行されることにより、画像データからベクトルデータが生成される。
【0053】
ステップS4〜S6の実行後、ファイル出力処理が実行される(ステップS7)。ファイル出力処理は、ベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。具体的には、ファイル出力処理は、ベクトルデータを、ワード(登録商標)、エクセル(登録商標)、パワーポイント等で扱えるファイル形式であるOOXML(Office Open XML)のファイルに追記し、一致すると判定されたテンプレートのファイル形式のファイルを生成し、該生成したファイルを記憶部24に記憶する処理である。
【0054】
OOXMLは、マイクロソフト・オフィス(登録商標)2007において、新たに採用されたファイルの保存形式(ファイル形式)である。具体的には、OOXMLは、ワード、エクセル、パワーポイント等のファイル形式として採用されている。このため、OOXMLのファイル形式のファイルあれば、ワード、エクセル、パワーポイント等のアプリケーションで扱うこと、すなわち編集することが可能となる。
【0055】
また、OOXMLの拡張子はそれぞれ、「docx」、「xlsx」、「pptx」で定義される。例えば、ユーザがファイル「サンプル.pptx」の拡張子「pptx」を「zip」に変更した後、「zip」に変更したファイルを解凍ソフトにより解凍すると、ユーザは、OOXMLのファイル形式のファイル「サンプル.pptx」を参照することが可能となる。ファイル「サンプル.pptx」は、図10に示すように、複数のパーツファイル群で構成される。
【0056】
図11〜図15に、ファイル「サンプル.pptx」の複数のパーツファイル群のうち、一致すると判定されたテンプレートのファイル形式のファイルを生成するために、データの追記が必要なパーツファイルを示すとともに、追記が必要なパーツファイル内におけるデータの追記箇所を示す。以下、一致すると判定されたテンプレートのファイル形式がノート形式であり、該ノート形式のファイルを生成するためにデータの追記が必要なパーツファイル及び追記箇所の一例を示す。
【0057】
例えば、図8に示すイメージ画像のデータの種類が「image1.gif」であり、「image1.gif」のコンテンツタイプを示すデータを追記する場合、複数のパーツファイル群のうち、ファイル定義情報で構成されるパーツファイル「Content_Types」.xml(図11参照)に追記が必要となる。具体的には、コンテンツタイプ(gif)を示すデータ(図11に示す追記部分1)がパーツファイル「Content_Types」.xml内に追記される。
【0058】
また、画像データのノート領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、ノート領域のデータで構成されるパーツファイル「ppt¥notesSlides¥notesSlide1.xml」(図12A及び図12B参照)に追記が必要となる。具体的には、画像データのノート領域をOCR処理して得られたベクトルデータ(図12Bのテキスト部分のデータ)がパーツファイル「ppt¥notesSlides¥notesSlide1.xml」に追記される。なお、図12Bのテキスト部分のデータは、図8におけるテキスト画像(ノート)から得られたベクトルデータに相当する。
【0059】
また、画像データの本文領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、本文領域のデータで構成されるパーツファイル「ppt¥Slides¥Slide1.xml」(図13A〜図13D)に追記が必要となる。具体的には、画像データの本文領域をOCR処理して得られたベクトルデータ(図13Aに示すテキスト部分のデータ、図13Bに示すイメージ部分のデータ及び図13Cに示すグラフィック部分のデータ)がパーツファイル「ppt¥Slides¥Slide1.xml」に追記される。なお、図13Aのテキスト部分のデータは、図8におけるテキスト画像から得られたベクトルデータに相当し、図13Bのイメージ部分のデータは、図8におけるイメージ画像から得られたベクトルデータに相当し、図13Cのグラフィック部分のデータは、図8におけるグラフィック画像から得られたベクトルデータに相当する。
【0060】
また、本文領域の構成に関するリレーションシップ(関連性)を示すデータを追記する場合、複数のファイル群のうち、関連性を示すデータで構成されるパーツファイル「ppt¥Slides¥_rels¥Slide1.xml.rels」(図14参照)に追記が必要となる。具体的には、イメージ画像のパーツファイル「image1.gif」のリレーションシップを示すデータ(リレーションIDとファイルパス:図14に示す追記部分2)が追記される。
なお、追記部分2は、図13Bのイメージ部分においてリレーションID=rId3と定義されたイメージデータが「image1.gif」としてmediaフォルダに格納されていることを示すデータである。また、mediaフォルダは、イメージ画像のファイルで構成されるフォルダである。例えば、mediaフォルダに「image1.gif」が格納されると、ファイルパスは、「ppt¥ppt¥media¥image1.gif」となる(図15参照)。
【0061】
上述のように、画像データの本文領域及び画像データのノート領域におけるベクトルデータを、ファイル「サンプル.pptx」に追記、すなわちファイル「サンプル.pptx」における複数のパーツファイル群のうち所定のパーツファイルに追記することで、ノート形式のファイル「サンプル.pptx」が生成される。
【0062】
そして、生成されたノート形式のファイル「サンプル.pptx」が記憶部24に記憶される。そして、ユーザにより、ノート形式のファイル「サンプル.pptx」を編集する指示が実行されると、ノート形式のファイル「サンプル.pptx」が記憶部24から読み出され、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図16参照)。このため、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
【0063】
以上、本実施の形態によれば、取得された画像データと、テンプレートにおけるテンプレート領域とを比較し、画像データがテンプレート領域からはみ出さないか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する。このため、画像データのファイル形式とテンプレートのファイル形式とが一致するかを正確に判定できる。
また、画像読取部26により取得された画像データを、枠線の有無により本文領域かノート領域かに識別する。このため、例えば、文字部分が異なる属性領域(例えば、本文領域及びノート領域)を有する場合であっても、ノート領域か本文領域かについての識別ができるので、画像データを異なる属性に識別する精度を向上させることができる。
また、画像データからベクトルデータを生成し、生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力するので、ユーザは、パワーポイントを用いてファイルを編集することが可能となる。このため、ユーザの利便性を向上させることができる。
【0064】
また、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数を算出し、算出した点数の最も高いテンプレートのファイル形式を一致するテンプレートのファイル形式と判定するので、画像データのファイル形式とテンプレートのファイル形式との一致の判定をより正確に行うことができる。
【0065】
また、算出した点数が所定の点数以下の場合、テンプレートのファイル形式を選択させるための選択情報を外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示する。このため、算出した点数が所定の点数以下の場合、ユーザは、所望のテンプレートのファイル形式を選択することができる。
【0066】
また、ベクトルデータを、OOXMLのファイル形式のファイル「サンプル.pptx」に追記することで、ノート形式のファイル「サンプル.pptx」が生成される。そして、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示されると、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
【0067】
なお、上記実施の形態における記述は、本発明に係る画像形成装置の一例であり、これに限定されるものではない。
【0068】
例えば、上記実施の形態では、紙原稿を画像読取部26により読み取ることで画像データを取得することとしたが、これに限定されるものではない。例えば、PC2上で作成された画像データを通信装置28を介してPC2から受信し、該受信した画像データを取得することとしてもよい。
【0069】
また、上記実施の形態では、アプリケーションソフトとしてパワーポイントを用い、テンプレートはパワーポイントのファイル形式としたが、これに限定されるものではない。例えば、アプリケーションとしてパワーポイント以外のアプリケーション(例えば、ワード)を用いることとしてもよい。
また、テンプレートとして複数のテンプレート(例えば、N−アップ形式のテンプレート)を用いることとしてもよい。
【0070】
その他、本実施の形態における、画像形成装置の細部構造及び詳細動作に関しても、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
【符号の説明】
【0071】
1 画像形成装置
2 コンピュータ
3 回線
11 CPU
12,22 RAM
13,23 ROM
14,24 記憶部
15,25 入力I/F
16 出力I/F
17 通信装置
18 外部入力装置
19 外部出力装置(所定の出力部)
20 バス
21 CPU(判定部、制御部)
26 画像読取部(取得部)
27 画像印刷部
29 外部入力装置(所定の出力部)
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、環境問題が叫ばれる中、オフィスにおけるペーパーレス化が急速に進んでいる。例えば、バインダ等に蓄積された紙原稿をスキャナで読み取り、データベースとして画像形成装置に蓄積することで、ペーパーレス化を実現する技術が知られている。
【0003】
しかしながら、上述の技術では、紙原稿を保存するファイルがイメージデータであるため、原稿の一部のオブジェクトを再利用する場合、図、表等を新たにアプリケーションで作成しなければならなかった。
【0004】
このため、紙原稿から読み取られたイメージデータを、文字/線画部分(以下、文字部分)の属性領域と画像部分の属性領域とに識別し、該識別された属性領域ごとにベクトル化処理を実行することで、一般のアプリケーションで編集可能な電子ファイルを生成する技術が知られている(例えば、特許文献1参照)。
具体的に特許文献1は、イメージデータを白黒画像に二値化し、二値化した黒画素の塊を抽出し、抽出した黒画素の塊の大きさ及び形状に基づいて、文字部分と画像部分との属性領域に識別をする技術である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−157905号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述の特許文献1の技術では、イメージデータ(以下、画像データ)の属性領域を識別する精度が低いという問題があった。例えば、黒画素の塊の大きさ及び形状に基づいて、画像データの属性領域を文字部分と識別した場合であっても、文字部分が異なる属性領域を有する場合、上述の特許文献1の技術では異なる属性領域の識別ができなかった。
また、属性領域の識別ができない場合、アプリケーションで編集可能な電子ファイルに変換することができず、ユーザは、データを再利用する際、データを新たにアプリケーションで作成しなければならなかった。
【0007】
本発明の課題は、画像データを異なる属性領域に識別する精度を向上させ、且つ、ユーザの利便性を向上させることである。
【課題を解決するための手段】
【0008】
上記課題を解決するため、請求項1に記載の発明の画像処理装置は、
画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、を備える。
【0009】
請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する。
【0010】
請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する。
【0011】
請求項4に記載の発明は、請求項3に記載の画像処理装置において、
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う。
【0012】
請求項5に記載の発明は、請求項1から4のいずれか一項に記載の画像処理装置において、
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する。
【0013】
請求項6に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である。
【0014】
請求項7に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のファイル形式は、OOXMLである。
【0015】
請求項8に記載の発明の画像処理方法は、
画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、を含む。
【0016】
請求項9に記載の発明のプログラムは、
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、を実現させる。
【発明の効果】
【0017】
本発明によれば、画像データを異なる属性に識別する精度を向上させ、且つ、ユーザの利便性を向上させることができる。
【図面の簡単な説明】
【0018】
【図1】本発明に係る画像処理装置を有する画像形成装置を含むネットワーク構成図である。
【図2】コンピュータの主要構成を示すブロック図である。
【図3】画像形成装置の主要構成を示すブロック図である。
【図4】(A)は、スライド形式の紙原稿を示す図である。(B)は、ノート形式の紙原稿を示す図である。(C)は、配布資料形式の紙原稿を示す図である。
【図5】ノート形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。
【図6】配布資料形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。
【図7】ファイル出力処理の流れを示すフローチャートである。
【図8】ノート形式の紙原稿を示す図である。
【図9】(A)は、スライド形式のテンプレートを示す図である。(B)は、ノート形式のテンプレートを示す図である。(C)は、配布資料形式のテンプレートを示す図である。
【図10】「サンプル.pptx」ファイルの複数のパーツファイル群の一例を示す図である。
【図11】「Content_Types」.xmlを示す図である。
【図12A】「ppt¥notesSlides¥notesSlide1.xml」を示す図である。
【図12B】「ppt¥notesSlides¥notesSlide1.xml」を示す図である。
【図13A】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13B】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13C】「ppt¥Slides¥Slide1.xml」を示す図である。
【図13D】「ppt¥Slides¥Slide1.xml」を示す図である。
【図14】「ppt¥Slides¥_rels¥Slide1.xml.rels」を示す図である。
【図15】mediaフォルダのファイルパス「ppt¥ppt¥media¥image1.gif」を示す図である。
【図16】「サンプル.pptx」が表示された状態を示す図である。
【発明を実施するための形態】
【0019】
以下、図を参照して本発明の実施の形態の例を詳細に説明する。
図1は、本発明による画像処理装置を有する画像形成装置1を含むネットワーク構成図である。
【0020】
画像形成装置1、1、1は、回線3を介してコンピュータ2、2と通信可能に接続されている。
回線3は、画像形成装置1、1、1及びコンピュータ2、2によるネットワークを構成する。回線3は、コンピュータ2、2及び画像形成装置1、1、1を通信可能に接続するものであればその形態を問わない。例えば、回線3は、イーサネット(登録商標)、同軸ケーブル、光ファイバー等の有線接続回線や、無線通信を実現するための各種規格等、そのいずれか又は複数の組み合わせによってよい。また、回線3は、LAN(Local Area Network)、インターネット、その他のネットワーク規模を問わない。
【0021】
図2は、コンピュータ2の主要構成を示すブロック図である。
コンピュータ2、2はそれぞれ、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、記憶部14、入力インタフェース(I/F)15、出力I/F16及び通信装置17を備え、これらの各構成はバス20により接続される。
【0022】
CPU11は、ROM13内に記憶されたプログラムと協働し、RAM12に展開されたプログラムやデータ等に従ってコンピュータ2の動作制御を行う。
RAM12は、CPU11の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を格納する。
ROM13は、CPU11によって読み出されるプログラムやデータ等を記憶する。
【0023】
記憶部14は、CPU11によって読み出されるプログラムやデータ等を記憶する。記憶部14は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
【0024】
入力I/F15は、外部入力装置18による入力を受け付けるインタフェースである。外部入力装置18は、例えばキーボードやマウス等であり、ユーザの手動操作により入力指示が行われる。
【0025】
出力I/F16は、外部出力装置19に対する出力を行うインタフェースである。外部出力装置19は、例えばCRTや液晶ディスプレイ等の表示装置等であり、CPU11の処理結果に基づいた出力画面を表示する。
【0026】
通信装置17は、コンピュータ2を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置17は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
【0027】
図3は、画像形成装置1の主要構成を示すブロック図である。図1に示す画像形成装置1、1、1は全て同じ構成によるので、以下一つの画像形成装置1について説明する。
画像形成装置1は、判定部、制御部としてのCPU21、RAM22、ROM23、記憶部24、入力I/F25、取得部としての画像読取部26、画像印刷部27、通信装置28を備え、これらの各構成はバス30により接続される。
【0028】
CPU21は、ROM23内に記憶されたプログラムと協働し、RAM22に展開されたプログラムやデータ等に従って画像形成装置1の動作制御を行う。
RAM22は、CPU21の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を記憶する。
ROM23は、CPU21によって読み出されるプログラムやデータ等を記憶する。
【0029】
記憶部24は、CPU21によって読み出されるプログラムやデータ等を記憶する。記憶部24は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
【0030】
入力I/F25は、外部入力装置29等の入力装置による入力を受け付けるインタフェースである。外部入力装置29は、例えばタッチパネルディスプレイを有する入力パネル等であり、ユーザの手動操作により入力指示が行われる。
【0031】
画像読取部26は、自動原稿搬送部(ADF)、プラテンガラス、CCD等の光学系を備えて構成され、ADF又はプラテンガラスに載置された原稿の画像を光学系により読み取る機能を実現する。画像読取部26により読み取られた画像の画像データ(アナログ画像信号)は、A/D変換され各種画像処理が施された後、デジタルの画像データ(ファイル)として記憶部24に記憶されるとともに、画像印刷部27に出力される。
【0032】
画像印刷部27は、入力された画像データに基づいて画像形成(印刷)を行う。画像印刷部27に採用可能な印刷方式としては、例えば電子写真方式やインクジェット方式、熱転写方式、オフセット等が挙げられる。本実施形態では、画像印刷部27は、電子写真方式による画像形成を行うための構成を有する。
【0033】
通信装置28は、画像形成装置1を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置28は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
【0034】
次に、図4を参照して、画像読取部26で読み取る紙原稿の形式について説明する。以下、アプリケーションソフトウエア(以下、アプリケーション)としてパワーポイント(登録商標)を用いて印刷した紙原稿の形式について説明する。図4に示すように、紙原稿の形式としては、スライド形式の紙原稿(図4(A)参照)、ノート形式の紙原稿(図4(B)参照)、配布資料形式の紙原稿(図4(C)参照)がある。
【0035】
スライド形式の紙原稿は、1ページのスライド画像が印刷された原稿である。スライド画像は、パワーポイントのスライド上に形成される画像であって、文字、線、表、図形、写真等の画像を含む。ノート形式の紙原稿は、1ページのスライド画像及びノート画像が印刷された原稿である。ノート画像は、スライドに関するメモ書き等の文字で構成される画像である。配布資料形式の紙原稿は、複数ページのスライド画像が印刷された原稿である。
【0036】
次に、紙原稿をスキャンしてからパワーポイントで編集可能な電子ファイルを出力するまでの流れについて説明する。
例えば、図5に示すように、ノート形式の紙原稿が画像読取部26によりスキャンされた(読み取られた)場合、1ページ分のスライド画像データ及びノート画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータがノート形式のファイルとして出力される。すなわちノート形式のファイルとして記憶部24に記憶される。そして、ユーザにより、ノート形式のファイルを編集する指示が実行されると、ノート形式のファイルが記憶部24から読み出され、読み出されたノート形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示される(図5参照)。なお、ノート形式のファイルは、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。これにより、ユーザは、ノート形式のファイルを編集することが可能となり、利便性が向上する。
【0037】
また、図6に示すように、配布資料形式の紙原稿が画像読取部26により読み取られた場合、複数のスライド画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータが配布資料形式のファイルとして記憶部24に記憶される。そして、配布資料形式のファイルを編集する指示が実行されると、記憶部24から配布資料形式のファイルが読み出され、読み出された配布資料形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図6参照)。このため、ユーザは、配布資料形式のファイルを編集することが可能となり、利便性が向上する
【0038】
なお、図示していないが、スライド形式の紙原稿が画像読取部26により読み取られた場合は、1ページのスライド画像データで構成される画像データ(ファイル)が取得され、図5及び図6と同様の手順でスライド形式のファイルが出力される。このため、ユーザは、スライド形式のファイルを編集することが可能となり、利便性が向上する。
【0039】
次に、図7を参照して、ファイル出力処理について説明する。ファイル出力処理は、紙原稿を画像読取部26により読み取って画像データを取得し、取得した画像データのファイル形式とテンプレートのファイル形式とが一致するかを判定し、画像データからベクトルデータを生成し、生成したベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。
【0040】
予め、図8に示すノート形式の紙原稿が自動原稿搬送部(ADF)又はプラテンガラスに載置されているものとする。以下、図8に示すように、ノート形式の紙原稿において、スライド画像には、テキスト画像、イメージ画像及びグラフィック画像が含まれているものとする。また、ノート画像には、テキスト画像が含まれているものとする(ノート画像におけるテキスト画像は、「テキスト画像(ノート)」と記す)。
【0041】
また、使用するアプリケーションを選択するための画面が予め外部入力装置29のタッチパネルディスプレイ上に表示されており、ユーザにより外部入力装置29を介して、使用するアプリケーションとして「パワーポイント」が選択入力されているものとする。
【0042】
例えば、外部入力装置29を介して紙原稿の読み取りを実行開始するためのスキャンボタンが押下されたことをトリガとして、画像形成装置1においてファイル出力処理(図7参照)が実行開始される。
【0043】
先ず、画像データの取得が行われる(ステップS1)。すなわち、紙原稿が画像読取部26により読み取られて画像データが取得される。そして、読み取られた画像の画像データ(アナログ画像信号)がA/D変換される。そして、A/D変換された画像データに各種画像処理が施され、各種画像処理が施されたデジタルの画像データが記憶部24に記憶される。
【0044】
ステップS1の実行後、記憶部24に記憶された画像データが読み出され、該読み出された画像データとテンプレートとのマッチング判定が実行される(ステップS2)。マッチング判定は、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する処理である。ここで、図9を参照して、テンプレートについて説明する。テンプレートは、画像データのファイル形式を識別するための定型的なファイルである。マッチング判定によりマッチ(一致)すると判定されたテンプレートのファイル形式は、画像データのファイル形式として決定される。本処理では、テンプレートのファイル形式として、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートの3種類が予め記憶部24に記憶されており、マッチング判定の際に記憶部24から読み出されるものとする。
【0045】
スライド形式のテンプレート(図9(A)参照)は、1ページ分のスライド画像の画像データで構成されるテンプレートである。画像データがスライド形式のテンプレートと一致する場合、画像データのファイル形式は、スライド形式のファイルと判定される。
ノート形式のテンプレート(図9(B)参照)は、1ページ分のスライド画像の画像データ及びノート画像の画像データで構成されるテンプレートである。画像データがノート形式のテンプレートと一致する場合、画像データのファイル形式は、ノート形式のファイルと判定される。
配布資料形式のテンプレート(図9(C)参照)は、複数ページ分のスライド画像の画像データで構成されるテンプレートである。画像データが複数ページのテンプレートと一致する場合、画像データのファイル形式は、配布資料形式のファイルと判定される。
なお、テンプレートにおいて、1ページ分のスライド画像の画像データで構成される領域を本文領域、ノート画像の画像データで構成される領域をノート領域と定義し、本文領域及びノート領域を総称してテンプレートデータ領域と定義する。
【0046】
以下、ノート形式の紙原稿(図8参照)が読み取られ、1ページ分のスライド画像データ及びノート画像データで構成される画像データが取得された場合におけるマッチング判定について説明する。マッチング判定は、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かに応じて、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数をテンプレート毎に算出し、該算出された点数に基づいて判定を行う処理である。
【0047】
先ず、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かが判定される。ここで、取得された画像データは、1ページ分のスライド画像データ及びノート画像データで構成される。この場合、取得された画像データにおける1ページ分のスライド画像データ及びノート画像データが各テンプレートのテンプレートデータ領域からはみ出すか否かが判定される。
【0048】
例えば、画像データと、ノート形式のテンプレート(図9(B)参照)におけるテンプレート領域(本文領域及びノート領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域及びノート領域からはみ出さないと判定された場合、画像データは、テンプレートにおける本文領域及びノート領域のそれぞれからはみ出さないと判定される。この場合、画像データが本文領域からはみ出さないことにより点数「10点」が加算され、且つ、画像データがノート領域からはみ出さないことにより点数「10点」が加算される。すなわち、ノート形式のテンプレートの点数として「20点」が算出される。
【0049】
また、画像データと、スライド形式のテンプレート(図9(A)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、スライド形式のテンプレートの点数として「0点」が算出される。
【0050】
また、画像データと、配布資料形式のテンプレート(図9(C)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、配布資料形式のテンプレートの点数として「0点」が算出される。
上記の点数が算出された場合、点数の最も高いノート形式のテンプレートが画像データのファイル形式と一致すると判定される。
【0051】
また、上述のマッチング判定において、算出された点数が所定の点数以下の場合は、テンプレートのファイル形式をユーザに選択させるようにしてもよい。例えば、算出された点数が所定の点数以下の場合、テンプレートのファイル形式をユーザに選択させるための選択情報としてテンプレートのファイル形式を選択できる画面が外部入力装置29のタッチパネルディスプレイ上に表示される。また、選択情報は、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。
【0052】
図7において、ステップS2の実行後、マッチング判定結果の判別が実行される(ステップS3)。ステップS3において、マッチング判定結果がスライド形式のテンプレートにマッチすると判別された場合(ステップS3;スライド)、画像データの本文領域にOCR処理が実行される(ステップS4)。ステップS3において、マッチング判定処理がノート形式のテンプレートにマッチすると判別された場合(ステップS3;ノート)、画像データの本文領域及びノート領域にOCR処理が実行される(ステップS5)。ステップS3において、マッチング判定処理が配布資料形式のテンプレートにマッチすると判別された場合(ステップS3;配布資料)、画像データの各本文領域にOCR処理が実行される(ステップS6)。ここで、画像データの本文領域とは、テンプレートの本文領域に相当する画像データのデータ領域である。また、画像データのノート領域とは、テンプレートのノート領域に相当する画像データのデータ領域である。画像データの本文領域と画像データのノート領域との識別は、画像データ内における枠線の有無により識別される。
また、ステップS4〜S6においてOCR処理が実行されることにより、画像データからベクトルデータが生成される。
【0053】
ステップS4〜S6の実行後、ファイル出力処理が実行される(ステップS7)。ファイル出力処理は、ベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。具体的には、ファイル出力処理は、ベクトルデータを、ワード(登録商標)、エクセル(登録商標)、パワーポイント等で扱えるファイル形式であるOOXML(Office Open XML)のファイルに追記し、一致すると判定されたテンプレートのファイル形式のファイルを生成し、該生成したファイルを記憶部24に記憶する処理である。
【0054】
OOXMLは、マイクロソフト・オフィス(登録商標)2007において、新たに採用されたファイルの保存形式(ファイル形式)である。具体的には、OOXMLは、ワード、エクセル、パワーポイント等のファイル形式として採用されている。このため、OOXMLのファイル形式のファイルあれば、ワード、エクセル、パワーポイント等のアプリケーションで扱うこと、すなわち編集することが可能となる。
【0055】
また、OOXMLの拡張子はそれぞれ、「docx」、「xlsx」、「pptx」で定義される。例えば、ユーザがファイル「サンプル.pptx」の拡張子「pptx」を「zip」に変更した後、「zip」に変更したファイルを解凍ソフトにより解凍すると、ユーザは、OOXMLのファイル形式のファイル「サンプル.pptx」を参照することが可能となる。ファイル「サンプル.pptx」は、図10に示すように、複数のパーツファイル群で構成される。
【0056】
図11〜図15に、ファイル「サンプル.pptx」の複数のパーツファイル群のうち、一致すると判定されたテンプレートのファイル形式のファイルを生成するために、データの追記が必要なパーツファイルを示すとともに、追記が必要なパーツファイル内におけるデータの追記箇所を示す。以下、一致すると判定されたテンプレートのファイル形式がノート形式であり、該ノート形式のファイルを生成するためにデータの追記が必要なパーツファイル及び追記箇所の一例を示す。
【0057】
例えば、図8に示すイメージ画像のデータの種類が「image1.gif」であり、「image1.gif」のコンテンツタイプを示すデータを追記する場合、複数のパーツファイル群のうち、ファイル定義情報で構成されるパーツファイル「Content_Types」.xml(図11参照)に追記が必要となる。具体的には、コンテンツタイプ(gif)を示すデータ(図11に示す追記部分1)がパーツファイル「Content_Types」.xml内に追記される。
【0058】
また、画像データのノート領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、ノート領域のデータで構成されるパーツファイル「ppt¥notesSlides¥notesSlide1.xml」(図12A及び図12B参照)に追記が必要となる。具体的には、画像データのノート領域をOCR処理して得られたベクトルデータ(図12Bのテキスト部分のデータ)がパーツファイル「ppt¥notesSlides¥notesSlide1.xml」に追記される。なお、図12Bのテキスト部分のデータは、図8におけるテキスト画像(ノート)から得られたベクトルデータに相当する。
【0059】
また、画像データの本文領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、本文領域のデータで構成されるパーツファイル「ppt¥Slides¥Slide1.xml」(図13A〜図13D)に追記が必要となる。具体的には、画像データの本文領域をOCR処理して得られたベクトルデータ(図13Aに示すテキスト部分のデータ、図13Bに示すイメージ部分のデータ及び図13Cに示すグラフィック部分のデータ)がパーツファイル「ppt¥Slides¥Slide1.xml」に追記される。なお、図13Aのテキスト部分のデータは、図8におけるテキスト画像から得られたベクトルデータに相当し、図13Bのイメージ部分のデータは、図8におけるイメージ画像から得られたベクトルデータに相当し、図13Cのグラフィック部分のデータは、図8におけるグラフィック画像から得られたベクトルデータに相当する。
【0060】
また、本文領域の構成に関するリレーションシップ(関連性)を示すデータを追記する場合、複数のファイル群のうち、関連性を示すデータで構成されるパーツファイル「ppt¥Slides¥_rels¥Slide1.xml.rels」(図14参照)に追記が必要となる。具体的には、イメージ画像のパーツファイル「image1.gif」のリレーションシップを示すデータ(リレーションIDとファイルパス:図14に示す追記部分2)が追記される。
なお、追記部分2は、図13Bのイメージ部分においてリレーションID=rId3と定義されたイメージデータが「image1.gif」としてmediaフォルダに格納されていることを示すデータである。また、mediaフォルダは、イメージ画像のファイルで構成されるフォルダである。例えば、mediaフォルダに「image1.gif」が格納されると、ファイルパスは、「ppt¥ppt¥media¥image1.gif」となる(図15参照)。
【0061】
上述のように、画像データの本文領域及び画像データのノート領域におけるベクトルデータを、ファイル「サンプル.pptx」に追記、すなわちファイル「サンプル.pptx」における複数のパーツファイル群のうち所定のパーツファイルに追記することで、ノート形式のファイル「サンプル.pptx」が生成される。
【0062】
そして、生成されたノート形式のファイル「サンプル.pptx」が記憶部24に記憶される。そして、ユーザにより、ノート形式のファイル「サンプル.pptx」を編集する指示が実行されると、ノート形式のファイル「サンプル.pptx」が記憶部24から読み出され、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図16参照)。このため、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
【0063】
以上、本実施の形態によれば、取得された画像データと、テンプレートにおけるテンプレート領域とを比較し、画像データがテンプレート領域からはみ出さないか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する。このため、画像データのファイル形式とテンプレートのファイル形式とが一致するかを正確に判定できる。
また、画像読取部26により取得された画像データを、枠線の有無により本文領域かノート領域かに識別する。このため、例えば、文字部分が異なる属性領域(例えば、本文領域及びノート領域)を有する場合であっても、ノート領域か本文領域かについての識別ができるので、画像データを異なる属性に識別する精度を向上させることができる。
また、画像データからベクトルデータを生成し、生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力するので、ユーザは、パワーポイントを用いてファイルを編集することが可能となる。このため、ユーザの利便性を向上させることができる。
【0064】
また、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数を算出し、算出した点数の最も高いテンプレートのファイル形式を一致するテンプレートのファイル形式と判定するので、画像データのファイル形式とテンプレートのファイル形式との一致の判定をより正確に行うことができる。
【0065】
また、算出した点数が所定の点数以下の場合、テンプレートのファイル形式を選択させるための選択情報を外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示する。このため、算出した点数が所定の点数以下の場合、ユーザは、所望のテンプレートのファイル形式を選択することができる。
【0066】
また、ベクトルデータを、OOXMLのファイル形式のファイル「サンプル.pptx」に追記することで、ノート形式のファイル「サンプル.pptx」が生成される。そして、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示されると、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
【0067】
なお、上記実施の形態における記述は、本発明に係る画像形成装置の一例であり、これに限定されるものではない。
【0068】
例えば、上記実施の形態では、紙原稿を画像読取部26により読み取ることで画像データを取得することとしたが、これに限定されるものではない。例えば、PC2上で作成された画像データを通信装置28を介してPC2から受信し、該受信した画像データを取得することとしてもよい。
【0069】
また、上記実施の形態では、アプリケーションソフトとしてパワーポイントを用い、テンプレートはパワーポイントのファイル形式としたが、これに限定されるものではない。例えば、アプリケーションとしてパワーポイント以外のアプリケーション(例えば、ワード)を用いることとしてもよい。
また、テンプレートとして複数のテンプレート(例えば、N−アップ形式のテンプレート)を用いることとしてもよい。
【0070】
その他、本実施の形態における、画像形成装置の細部構造及び詳細動作に関しても、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
【符号の説明】
【0071】
1 画像形成装置
2 コンピュータ
3 回線
11 CPU
12,22 RAM
13,23 ROM
14,24 記憶部
15,25 入力I/F
16 出力I/F
17 通信装置
18 外部入力装置
19 外部出力装置(所定の出力部)
20 バス
21 CPU(判定部、制御部)
26 画像読取部(取得部)
27 画像印刷部
29 外部入力装置(所定の出力部)
【特許請求の範囲】
【請求項1】
画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、
を備える画像処理装置。
【請求項2】
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する請求項1に記載の画像処理装置。
【請求項3】
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する請求項1又は2に記載の画像処理装置。
【請求項4】
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う請求項3に記載の画像処理装置。
【請求項5】
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する請求項1から4のいずれか一項に記載の画像処理装置。
【請求項6】
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である請求項5に記載の画像処理装置。
【請求項7】
前記所定のファイル形式は、OOXMLである請求項5に記載の画像処理装置。
【請求項8】
画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、
を含む画像処理方法。
【請求項9】
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、
を実現させるためのプログラム。
【請求項1】
画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、
を備える画像処理装置。
【請求項2】
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する請求項1に記載の画像処理装置。
【請求項3】
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する請求項1又は2に記載の画像処理装置。
【請求項4】
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う請求項3に記載の画像処理装置。
【請求項5】
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する請求項1から4のいずれか一項に記載の画像処理装置。
【請求項6】
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である請求項5に記載の画像処理装置。
【請求項7】
前記所定のファイル形式は、OOXMLである請求項5に記載の画像処理装置。
【請求項8】
画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、
を含む画像処理方法。
【請求項9】
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、
を実現させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13A】
【図13B】
【図13C】
【図13D】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13A】
【図13B】
【図13C】
【図13D】
【図14】
【図15】
【図16】
【公開番号】特開2012−118780(P2012−118780A)
【公開日】平成24年6月21日(2012.6.21)
【国際特許分類】
【出願番号】特願2010−268194(P2010−268194)
【出願日】平成22年12月1日(2010.12.1)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】
【公開日】平成24年6月21日(2012.6.21)
【国際特許分類】
【出願日】平成22年12月1日(2010.12.1)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】
[ Back to top ]