説明

文書電子化システム

【課題】 複数のアノテーションデータが重なりあって添付されている電子文書を、アノテーションデータの情報を失うことなく印刷するのは容易ではなかった。
【解決手段】 複数のアノテーションデータが付加されている電子文書を、アノテーションデータの内容も含む、電子文書のもつすべてのコンテンツ情報を欠落することなく印刷することができる手段と、アノテーションデータのオリジナルデータ上での位置情報、階層情報等をはじめとする属性情報も失うことなく印刷することができる手段、さらにアノテーションデータが持つ属性情報を利用して自動レイアウトしたり、出力用紙の種類を変えたりして印刷することができる手段とを持つ。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は文書電子化システム及び、その方法に関するものである。
【背景技術】
【0002】
近年、病院、会社、学校などにおいて、これまで紙で管理されてきた書類の電子化が急速に進んでいる。そのような場合、一般的に紙文書をスキャナ等で読み取り、画像やPDF等の電子データに変換して保存することが行われている。
【0003】
しかし、病院のカルテなどをはじめとする書類には、付箋紙、写真、グラフのような、当該カルテに付随する別の書類が複数添付され、セットで保存されていることが多く、このような紙文書を上述したような方法で、添付書類の情報も保持したまま電子化することは容易ではなかった。もし添付書類の情報を失うことなく電子化したい場合には、添付書類を剥がしたオリジナルの文書をスキャナで読み取った後、さらに剥がした添付書類を一つ一つスキャナで読み取るか、あるいは手作業でデータを入力する等の作業を行う必要があった。また電子化した後も、オリジナル文書の電子データと、剥がした添付書類の電子データを対応づけて管理し、要求に応じて、いつでもまとめて取り出せるような状態にしておかなければならなかった。
【0004】
近年、このような付箋紙等が貼付された紙文書の電子化をサポートする技術として、例えば、下記特許文献1に記載された技術がある。この先行技術における文書管理装置では、既定の形状の付箋紙が添付された紙文書をスキャンし、スキャンした後の電子文書において、該当する形状の領域を検索することによって、付箋紙の位置情報とイメージ情報とを抽出し、抽出した結果をもとに付箋紙のアノテーション情報を作成し、付箋紙を剥がし電子データ化したオリジナル文書に対応づけて記憶できる方法が記述されている。
【0005】
一方、病院のカルテ等においては、日常業務遂行上、完全な電子化は難しく、診察時の利便性上、電子カルテシステム導入後も紙カルテを使用するケースが少なくない。また、電子カルテシステムがダウンしたときに備え、定期的に印刷した最新の紙カルテもセットで保存しておくことが一般的であり、電子文書と紙文書が共存するような状況が多い。
【特許文献1】特開2000-222394号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら従来のシステムにおいては、上述したようなアノテーション情報の付加された電子文書を再び印刷し、紙文書形式に戻すことは容易ではなかった。例えば複数のアノテーションが重なり合ってオリジナルの電子文書に添付されているような場合には、アノテーションが全部ついた状態(完全データ)で印刷するか、もしくは、はじめにオリジナルデータのみを印刷し、別途、アノテーションデータだけを数回にわけて印刷したりするなどの方法をとるしかなかった。そのため、重なりあっていたアノテーションデータの一部が印刷されなかったり、印刷作業に非常に手間がかかるなどの問題点があった。
【課題を解決するための手段】
【0007】
本発明は、上述した従来技術の問題を解決するためのものであって、
複数のアノテーションデータが付加されている電子文書を、アノテーションデータの内容も含む、電子文書のもつすべてのコンテンツ情報を欠落することなく印刷することができる手段と、
アノテーションデータのオリジナルデータ上での位置情報、階層情報等をはじめとする属性情報も失うことなく印刷することができる手段、さらにアノテーションデータが持つ属性情報を利用して自動レイアウトしたり、出力用紙の種類を変えたりして印刷することができる手段とを持つことを特徴とする。
【発明の効果】
【0008】
以上に説明したように、本発明によれば、複数のアノテーションデータが付加された電子文書を、そのアノテーションデータの情報も失うことなく、再び印刷し紙文書化することができるという効果がある。
【発明を実施するための最良の形態】
【0009】
以下、本発明を適用するのに好適である実施の形態について説明を行う。
【0010】
<本実施形態の文書電子化システムの構成例>
まず、はじめに、図1を用いて本実施形態の前提となる文書電子化システムの構成を説明する。
【0011】
図1の文書電子化システムは、ユーザからの入力を受け付けるキーボードやマウス等の入力装置101と、スキャナ等の読み取り装置102、文書に添付されている付箋紙、写真等を始めとする添付書類のアノテーションデータ変換とアノテーションデータをオリジナル原稿に対応づけて保存、管理を行うメモ解析システム100、電子化した文書を表示可能な表示装置104、さらに、プリンタ等の出力装置105で構成されている。
【0012】
メモ解析システム100は、読み取り装置102で読み込み、得られた電子データを一時的に保存する一時記憶領域104と、一時記憶領域104に記憶された複数の電子データを読み出し、各電子データの差分を抽出する差分抽出部105、前記で抽出した差分を領域解析する領域解析・分割部106、領域分割した各領域をアノテーション情報に変換するアノテーションデータ変換部107、メモを電子化したアノテーションデータを、添付書類を剥がした原稿(オリジナル原稿)に対応づけて保存するアノテーション処理部108、アノテーションデータの付加された電子データを管理する文書管理装置103、前記アノテーション変換部で全ての添付書類を漏れなく電子化できたかどうかを自動でチェックする確認チェック部113、確認チェック部において添付書類の電子化に漏れがあった場合、漏れた添付書類を追加でアノテーションデータ化しオリジナル原稿の適切な場所に自動で差し込む追加アノテーションデータ変換部115で構成されている。
【0013】
次に、図1の構成図で示した本発明の実施の形態に係る文書電子化システムにおいて、添付書類付きの紙文書を電子化する場合にユーザが行う一連の動作の流れを説明する。
【0014】
ユーザはまず添付書類のついたままの紙原稿を読み取り装置102で読み取る。ここで得られた電子データは文書管理装置103の一時記憶領域104に一時的に保存される。次に添付書類を剥がした原稿を再び読み取り装置102で読み取る。ここで得られた電子データは、紙原稿のオリジナル原稿として、文書管理装置103に保存される。
【0015】
次に、紙原稿に対し添付書類が複数重なって添付されている場合にユーザが行うフローを説明する。ユーザはまず、添付書類のすべてついた紙原稿を読み取り装置102で読み取る。次に一番上(つまり最も上側)に添付されている書類だけを剥がし、同様に読み取り装置102で読み取る。そしてここで得られた電子データBは、一時記憶領域104に一時的に保存される。同じように、重なった書類を次々に剥がしながら読み取るという操作を繰り返し、得られた電子データ(B1、B2、B3・・・)が一時記憶領域104に読み取った順番で保存されていく。そして、すべての添付書類を剥がした紙原稿を最後に読み取り装置102で読み取り、それはオリジナル原稿の電子データAとして文書管理装置103に保存される。
【0016】
次に、図2のフローチャートを用いて、前述したフローで電子化した添付書類をアノテーションデータに変換するフローを説明する。前述したようなフローでユーザが紙原稿の読み取りを終了すると、メモ解析システムは図2のフローチャートに示すような流れで、紙原稿に付与されていた添付書類をアノテーションデータに変換する処理を開始する。
【0017】
ステップ201において、差分抽出部105は、文書管理装置103から、オリジナル原稿の電子データAを取り出す。
【0018】
ステップ202において、差分抽出部105は、文書管理装置103の一時記憶領域104より、添付書類のついたまま読み取り得られた電子データのうち1ページ分の電子データB1を取り出す。
【0019】
ステップ203において、オリジナル原稿の電子データAと、電子データB1を比較し、差分領域を抽出する。
【0020】
ステップ204において、ステップ203で抽出した差分領域を領域解析・分割部106で解析し、オブジェクト単位に切り分ける。そして切り分けた各オブジェクトと、各オブジェクトの形状、そのオブジェクトがオリジナル原稿のどの位置に付加されていたかを表す座標情報を合わせて、アノテーション変換部107の一時記憶領域112に一時的に保存する。
【0021】
ステップ205において、ステップ204で切り分けた各オブジェクトを、アノテーションデータ変換部107ですべてアノテーションデータに置き換える。
【0022】
続くステップ206で、当該電子データBが、一時記憶領域104に保存されている最終ページであるかどうか判定し、最終ページとなるまで同じようにアノテーションデータ変換と一時記憶領域112への保存を繰り返す。
【0023】
ステップ206で、当該電子データBの最終ページであると判定されたら、アノテーション処理部108がオリジナル原稿である電子データAに、一時記憶領域112に保存されているすべてのアノテーションデータの情報を付加し、文書管理装置103に保存する。
【0024】
図3は、ステップ204において一時記憶領域112に保存されるオブジェクト情報の構成の1例を示す図である。図2に示すようにオブジェクト情報は、読み取り装置で読み取られた各ページ単位で保存されており、ページごとにオブジェクト情報、形状情報、座標情報を持つ。
【0025】
次に、ステップ205で行われるアノテーションデータ変換の詳細について説明する。
【0026】
図4は、ステップ205で行われるアノテーションデータ変換の流れを示すフローチャートである。
【0027】
ステップ401において、一時記憶領域112に保存されている、全ページのオブジェクトのうち、1ページ分のオブジェクト情報を読み込む。
【0028】
ステップ402において、前記ステップ401で読み込んだオブジェクト情報の中から、1つ分のオブジェクト情報を取り出し、続くステップ403において当該オブジェクトがテキストオブジェクトであるか、それ以外であるかを判定する。
【0029】
当該オブジェクトがテキストである場合には、ステップ404において、テキストのアノテーションデータに変換する。
【0030】
また、テキストでないと判定されたら、ステップ405に進み、イメージのアノテーションデータに変換する。
【0031】
続く、ステップ406において、前記ステップで生成されたアノテーションデータを文書管理装置103のアノテーション情報記憶部111に保存する。このとき、アノテーション情報として、一時記憶領域112に保存されている座標情報もともに保存される。
【0032】
ステップ407において、当該オブジェクトが当該ページに含まれる最後のオブジェクトであるかどうかを判定し、最後のオブジェクトでなかったら、再びステップ402に戻る。これを当該ページの全オブジェクトのアノテーション変換が終わるまで繰り返していく。
【0033】
そして、当該ページの全オブジェクトのアノテーション変換が終了したら、ステップ408に移り、当該ページが一時記憶領域112に保存されている最終ページであるかどうかを判定する。ここで最終ページでないと判断されたら、ステップ401に戻り、さきほどと同様の処理が全ページ終わるまで繰り返される。
【0034】
図5は、ステップ406においてアノテーション情報記憶部に保存されるアノテーションデータの構造の1例を示す図である。図5に示すようにアノテーション情報は、オリジナル原稿のページ単位で保存されており、オリジナル原稿ごとにアノテーション情報、属性情報(テキストかイメージか)、座標情報、階層情報(重なっている場合、上から第何階層目のアノテーションなのか)、作成者情報、作成日時情報、背景色情報などを持つ。
【0035】
図6は、電子化する前の様々な添付書類が貼られている紙文書の例である。ここでは、紙文書の1例としてカルテを例にあげる。
【0036】
図7は、前記紙文書から添付書類をすべて剥がした状態の例である。
【0037】
図8は、本実施の形態における手順で電子データ化した紙文書を、表示装置104で表示した例である。このように、電子データ化した後も、電子化する前に添付されていた書類の形状、位置がそのままの状態で、再現することができる。オリジナル原稿に付与されているアノテーションデータは、表示/非表示を切り替えることもでき、印刷時に印刷しないことも可能である。さらに、新しいアノテーションデータを付加することもできる。
【0038】
<第1の実施形態>
次に本発明の実施の形態に関わる文書電子化システムにおいて、アノテーション属性情報を利用して、オリジナル電子文書に付随するアノテーションデータを自動でレイアウトし、オリジナル文書とともに印刷する方法を説明する。
【0039】
まず図9、図10、図11を用いて、本発明の実施形態の1例である、オリジナル電子文書に付随するアノテーションデータを自動でレイアウトし、印刷する方法を説明する。
【0040】
図9はこの例の説明に使用する電子文書である。この例で使用する電子文書は、電子カルテであり、事前にカルテの部分がオリジナル電子文書として、カルテに添付されていた複数の書類がアノテーションデータへ変換され保存されている。
【0041】
図10、図11はこの方法を用いて、前述した電子カルテを印刷した結果の1例である。図10がオリジナル電子文書の出力結果であり、図11は、オリジナル電子文書に添付されていたアノテーションを自動レイアウトし出力した結果を示している。
【0042】
次に図12を用いて、本発明の別実施形態である、アノテーションデータが保持する位置情報を利用して自動レイアウトする方法を説明する。
【0043】
図12は、前記電子カルテを本実施例の方法を用いて印刷した結果を示す図である。
【0044】
図12に示すように、この例ではアノテーションの位置情報を利用して、電子カルテの欄の1つと、その欄の上に添付されているアノテーションデータをセットでレイアウトし印刷する。同一用紙上の左側にカルテの「手書き欄」が印刷され、右側に、その「手書き欄」上に添付されている全アノテーションデータがレイアウトされ、印刷される。
【0045】
次に図13、図14、図15を用いて、本発明の別実施形態である、各アノテーションの階層情報を利用し、アノテーションデータを階層別にレイアウトして印刷する方法を説明する。
【0046】
図13は印刷対象の電子カルテであり、カルテのオリジナルデータに対し、複数のアノテーションが付加された状態である。
【0047】
また図14、図15がこの方法を用いて図13の電子カルテを印刷した結果である。図14がオリジナルデータの印刷結果であり、図15がカルテに付加されていたアノテーションデータの印刷結果である。図15に示すように、アノテーションの属性情報の1つとして管理されている階層情報を利用して、重なりあい複数階層となって添付されているアノテーションを、階層別に印刷する。またこの例では、アノテーションのもつ階層情報をそのまま利用して印刷するが、別の実現方法として、ユーザが特定のアノテーションに対し、それを第何階層のものと印刷したいかを指定するという方法も考えられる。
【0048】
次に図16を用いて、本発明の別実施形態であり、各アノテーションの脇にアノテーションの属性情報をあらわすテキストを付加して印刷する方法を説明する。
【0049】
図16に示す例では、アノテーションのレイアウト時に、各アノテーションの下部に、アノテーションの属性情報の1つである書類の作成者情報、作成日時情報を付加して印刷を行う。
【0050】
また、図17は、本発明の別実施形態であり、各アノテーションを1枚の用紙に自動でレイアウトして印刷する際に、各アノテーションの裏側にあたる箇所にアノテーションの属性情報を印刷する方法である。ここでは電子カルテを例しており、各アノテーションの裏側に、当該アノテーションの添付されている電子カルテの患者情報を印刷している。こうすることにより、印刷後にアノテーションを切り取っても、そのアノテーションがどのカルテに付随するものなのかを特定することができる。
【0051】
また、図18は、本発明の別実施形態であり、アノテーションの属性情報の1つとして保持されているコンテンツ情報を利用して、画像(カラー)のアノテーションと、テキスト(モノクロ)のアノテーションを別用紙にレイアウトして印刷する方法を説明する。このように、カラーはカラーで、モノクロはモノクロで1枚の用紙にまとめることによって、課金を抑えられるという効果がある。
【0052】
なお、以上で説明した例は、アノテーションデータの属性情報を利用した自動レイアウト方法、印刷方法の1部であり、他にも、様々なレイアウト方法、印刷方法があることは言うまでもない。
【0053】
例えば、各アノテーションは電子化する前の添付書類の色情報、作成者情報、OCRしたテキスト情報等を保持しているので、それらの情報でアノテーションを自動で分類して用紙をわけて印刷するような方法も考えられる。
【0054】
あるいは、アノテーションの属性によって、印刷に使用するメディアタイプ(用紙タイプ、OHP等)を変えて印刷するような方法も考えられる。
【0055】
以上第1の実施形態によれば、複数のアノテーションが重なり合って添付されている電子文書においても、アノテーションデータを自動でレイアウトし印刷することができる。それにより、重なりあっているアノテーションでもその1つ1つの情報を損失することなく、オリジナル文書とともに容易に印刷することが可能となる。さらに、アノテーションデータの持つ属性情報を利用した様々な自動アウト手段を提供することによって、属性情報を反映した印刷が可能となり、またユーザの利便性を向上することができるようになる。
【図面の簡単な説明】
【0056】
【図1】本発明の1実施例による文書電子化システムの構成を示すブロック図である。
【図2】本発明の1実施例による添付書類の情報をアノテーションデータに変換する処理動作を示すフローチャートである。
【図3】本発明の1実施例によるオブジェクト情報の構成の1例を示す図である
【図4】本発明の1実施例による添付書類の情報をアノテーションデータに変換する処理動作を示すフローチャートである。
【図5】本発明の1実施例によるアノテーションデータの構造の1例を示す図である。
【図6】本発明の1実施例による添付書類の貼られた紙文書の1例を示す図である。
【図7】本発明の1実施例による紙文書の1例を示す図である。
【図8】本発明の1実施例による電子文書を表示装置で表示した1例を示す図である。
【図9】本発明の1実施例による添付書類の情報をアノテーションデータに変換する処理動作を示すフローチャートである。
【図10】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図11】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図12】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図13】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図14】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図15】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図16】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図17】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。
【図18】本発明の1実施例によるアノテーションデータの自動レイアウトの1例を示す図である。

【特許請求の範囲】
【請求項1】
複数のアノテーションが付加された電子文書を、オリジナル電子文書の内容、アノテーションの内容、アノテーションの属性情報を失うことなく自動で印刷することができる文書電子化システム。
【請求項2】
文書電子化システムは、前記アノテーション属性情報として、アノテーションデータのオリジナル電子文書上での位置情報、形状情報、階層情報、作成者情報、作成日時情報、背景色情報を保持することを特徴とする請求項1記載の文書電子化システム。
【請求項3】
文書電子化システムは、前記アノテーション属性情報を利用して、オリジナル電子文書に付随するアノテーションデータを自動でレイアウトし印刷するアノテーション自動レイアウト印刷手段を持つことを特徴とする請求項1記載の文書電子化システム。
【請求項4】
アノテーション自動レイアウト印刷手段は、前記アノテーションの位置情報を利用して、オリジナル文書の欄とその欄の位置に添付されたアノテーションをセットでレイアウトし印刷する手段を持つことを特徴とする請求項3記載の文書電子化システム。
【請求項5】
アノテーション自動レイアウト印刷手段は、アノテーションの付加された電子文書を印刷する際に、各アノテーションの階層情報を利用し、階層別に用紙を分けて印刷することのできる手段と、あるいは各アノテーションに対し、それぞれ第何階層のデータとして印刷したいかを指定することのできる手段を持つことを特徴とする請求項3記載の文書電子化システム。
【請求項6】
文書電子化システムは、アノテーションの付加された電子文書を印刷する際に、各アノテーションに対して印刷に使用するメディアタイプを指定することのできる手段を持つことを特徴とする請求項1記載の文書電子化システム。
【請求項7】
アノテーション自動レイアウト印刷手段は、アノテーションデータをレイアウトする際に、各アノテーションの脇に当該アノテーションの属性情報をあらわすテキストを付加して印刷することのできる手段を持つことを特徴とする請求項3記載の文書電子化システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2009−32075(P2009−32075A)
【公開日】平成21年2月12日(2009.2.12)
【国際特許分類】
【出願番号】特願2007−196148(P2007−196148)
【出願日】平成19年7月27日(2007.7.27)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】