手書き情報反映システム、手書き情報反映方法、およびプログラム
【課題】紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供する。
【解決手段】S1において、マーカラインが付与された紙書籍4の紙面が読み取られ、読取画像データが生成される。S2において、読取画像データが走査され、背景色が異なる領域が抽出される。S3において、抽出領域ごとに抽出領域内のエッジが算出され、2値化される。S4〜S6において、2値化領域ごとに行間を除いた行ごとの行領域が抽出され、行領域ごとに1文字ごとの文字領域が抽出され、文字領域ごとに文字認識が行われ、文字コードが特定される。S7において、抽出領域ごとに抽出領域内の文字コード群が手書き情報データとして保存される。そして、手書き情報データの抽出文字列と電子書籍データのマッチングが行われ、マッチした位置に手書き情報データが反映される。
【解決手段】S1において、マーカラインが付与された紙書籍4の紙面が読み取られ、読取画像データが生成される。S2において、読取画像データが走査され、背景色が異なる領域が抽出される。S3において、抽出領域ごとに抽出領域内のエッジが算出され、2値化される。S4〜S6において、2値化領域ごとに行間を除いた行ごとの行領域が抽出され、行領域ごとに1文字ごとの文字領域が抽出され、文字領域ごとに文字認識が行われ、文字コードが特定される。S7において、抽出領域ごとに抽出領域内の文字コード群が手書き情報データとして保存される。そして、手書き情報データの抽出文字列と電子書籍データのマッチングが行われ、マッチした位置に手書き情報データが反映される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、手書き情報反映システム、手書き情報反映方法、およびプログラムに関し、特に、紙媒体から抽出した手書き情報を電子書籍データに反映する手書き情報反映システム等に関する。
【背景技術】
【0002】
近年、紙の節約、嵩張る紙の輸送や保管費の削減のため、ディスプレイに表示して閲覧するデジタルデータによる電子書籍が提供されるようになってきている。
【0003】
書籍が電子化されることにより、様々な利用方法が可能となる。特許文献1には、読書進行状況情報に応じた実際の書籍と同様の厚みを有する縦縞模様を表示することにより、現在表示しているページが書籍全体としてどの当りの位置に相当するのかをユーザに対して直感的かつ大まかに認識させる技術が提案されている。
【0004】
また特許文献2には、ページ毎に索引としてのキーワードを抽出し、そのキーワードから目次を作成することにより、検索に必要とされる文字列の入力を不要として、それら電子化ドキュメントを容易に検索・表示する技術が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003−150618号公報
【特許文献2】特開2005−275756号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1および特許文献2の技術では、紙媒体に付与されたマーカやメモ書きを抽出し、抽出したマーカやメモ書きを手書き情報としてリフロー型電子書籍データに反映することができない課題があった。
【0007】
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することである。
【課題を解決するための手段】
【0008】
前述した目的を達成するために、第1の本発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、を具備することを特徴とする手書き情報反映システムである。
第1の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
【0009】
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する。
これにより、メモ書きとして抽出されたメモ画像と、そのメモ画像と近い位置の文字列とを対応付けて手書き情報データとして保存することができる。
【0010】
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する。
これにより、誤ってメモ画像として抽出された書籍画像をメモ画像の対象から除外することができる。
【0011】
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する。
これにより、反映させるメモ画像を確認することができるため、ユーザは、メモ画像のみを確実に電子書籍データに反映することができる。
【0012】
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する。
これにより、マーカ領域ごとにマーカ領域内の文字列を手書き情報データとして保存することができる。
【0013】
第2の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を含むことを特徴とする。
第2の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
【0014】
第3の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を実行させるためのプログラムである。
【0015】
第3の発明に係るプログラムをコンピュータにインストールすることで、第1の発明に係る手書き情報反映システムを得ることができる。
【発明の効果】
【0016】
本発明により、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の第1の実施の形態に係る手書き情報反映システムの構成例を示す図である。
【図2】第1の実施の形態における端末のハードウエア構成例を示す図である。
【図3】第1の実施の形態における端末の記憶部に記憶される情報の例である。
【図4】第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。
【図5】第1の実施の形態における読取画像データの例を示す図である。
【図6】2値化領域の行間を除いた行ごとの行領域を抽出する例を示す図である。
【図7】行領域ごとに1文字ごとの文字領域を抽出する例を示す図である。
【図8】第1の実施の形態における手書き情報データの例を示す図である。
【図9】第1の実施の形態における手書き情報反映処理を説明するフローチャートである。
【図10】マーカタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の一例を示す図である。
【図11】第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。
【図12】第2の実施の形態における読取画像データの例を示す図である。
【図13】抽出領域画像から算出されたヒストグラムの例を示す図である。
【図14】反映メモ選択画面の表示例を示す図である。
【図15】第2の実施の形態における手書き情報データの例を示す図である。
【図16】第2の実施の形態における手書き情報反映処理を説明するフローチャートである。
【図17】メモタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の例を示す図である。
【図18】変形例における読取画像データの例を示す図である。
【図19】変形例における手書き情報データの例を示す図である。
【発明を実施するための形態】
【0018】
以下、図面に基づいて、本発明の実施形態を詳細に説明する。
【0019】
[本発明の第1の実施の形態]
図1は、本発明の実施の形態に係る手書き情報反映システム1の構成例を示す図である。
【0020】
図1に示す手書き情報反映システム1は、端末2と読取装置3とが相互に接続されることで構成される。端末2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等からなるコンピュータシステムであり、例えば、パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォンである。
【0021】
端末2は、リフロー型の電子書籍データを記憶する。電子書籍データには、書誌データ(書籍の題号、著者、出版社、出版年月等)、目次データ(書籍の本文の内容を示す見出し等)、本文データ(書籍の本文に関する電子データ)、文献リストデータ(書籍の著者、題号、出版社、出版年月等)などが含まれる。
【0022】
リフロー型の電子書籍データとは、文字を大きくすればページ数が増え、文字を小さくすればページ数が減るといったように、文字の大きさを変更しても画面に合わせて文字がリフローするため、ページ送りだけで読み進めることができる電子書籍データのことである。
【0023】
端末2は、読み取り装置3が紙書籍4から読み取った読取画像のデータを受信し、記憶する。また端末2は、読取画像データから所定の抽出条件に基づいて手書き情報を抽出するとともに、電子書籍データから手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に手書き情報を反映する。第1の実施の形態でいう手書き情報とは、例えば、蛍光ペンによるマーカラインが付与された部分のことである。
【0024】
読取装置3は、例えば、スキャナやカメラなどであり、紙書籍4の紙面を読み取り、読取画像データを生成する。第1の実施の形態において、読取装置3は、紙書籍4の1頁分を画像化することができる装置であれば、何でもよい。なお、端末2にカメラが実装されている場合、端末2と読取装置3は一体とされる。
【0025】
図2は、端末2のハードウエア構成例を示す図である。尚、図2のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
【0026】
端末2は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
【0027】
制御部11は、CPU、ROM、RAM等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、端末2が行う後述する処理を実現する。ROMは、不揮発性メモリであり、端末2のブートプログラムやBIOS(Basic Input/Output System)等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
【0028】
記憶部12は、HDD等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理を端末2に実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
【0029】
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。
【0030】
通信制御部14は、通信制御装置、通信ポート等を有し、端末2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
【0031】
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、端末2に対して、操作指示、動作指示、データ入力等を行うことができる。
【0032】
表示部16は、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携して端末2のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
【0033】
周辺機器I/F(インタフェース)部17は、端末2に周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して端末2は周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE(The Institute of Electrical and
Electronics Engineers)1394やRS(Recommended Standard)−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
【0034】
図3は、端末2の記憶部12に記憶される情報の例である。
【0035】
図3に示すように、端末2の記憶部12は、読取画像データ21、電子書籍データ22、手書き情報データ23、手書き情報反映AP(アプリケーション)24、および電子書籍ビューア25を記憶している。
【0036】
読取画像データ21は、読取装置3で読み取られた紙書籍4が画像化されたデータである。電子書籍データ22は、書籍1冊分のデータであって、書誌データ、目次データ、本文データ、文献リストデータなどを含み、リフロー型に制作されたデータである。
【0037】
手書き情報データ23は、手書き情報反映アプリケーション24により、所定の抽出条件に基づいて読取画像データ21から抽出された手書き情報のデータである。
【0038】
手書き情報反映アプリケーション24は、所定の抽出条件に基づいて、読取画像データ21から手書き情報を抽出し、手書き情報データ23を生成する。また手書き情報反映アプリケーション24は、電子書籍データ22から手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に、抽出された手書き情報を反映する。
【0039】
電子書籍ビューア25は、手書き情報が反映された電子書籍データ22を取得し、その内容を表示する。
【0040】
図4は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。図4の説明に当たり、図5〜図9を参照し、具体的な処理内容も説明する。
【0041】
ステップS1において、読取装置3は、蛍光ペンなどによるマーカラインが付与された紙書籍4の紙面を読み取り、読取画像データを生成する。
【0042】
図5は、読取装置3により読み取られ、生成された読取画像データ21a、21bの例を示す図である。
【0043】
図5に示すように、読取画像データ21aには、「吾輩(わがはい)は猫」の文字にマーカ30aが付与されているとともに、「である。名前はまだ無い。」の文字にマーカ30bが付与されている。また、読取画像データ21bには、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の文字にマーカ30cが付与されている。図5の例では、読取画像データ21aに含まれるマーカ30aとマーカ30bは、互いのマーカラインが接していないが、読取画像データ21bに含まれるマーカ30cは、複数行のマーカラインが接している。
【0044】
図4の説明に戻る。ステップS2において、端末2の手書き情報反映アプリケーション24は、ステップS1の処理で読取装置3により生成された読取画像データを走査し、背景色が異なる領域(例えば、蛍光色)を抽出する。例えば、図5において、マーカ30a、30b、30c(斜線で囲まれた領域)が異なる領域と判断され、矢印S2の先に示すように、抽出領域31a、31b、31cとしてそれぞれ抽出される。
【0045】
図4の説明に戻る。ステップS3において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内のエッジを算出し、2値化する。例えば、図5において、抽出領域31a、31b、31c内のエッジが算出されて2値化され、矢印S3の先に示すように、2値化領域32a、32b、32cがそれぞれ得られる。
【0046】
図4の説明に戻る。ステップS4において、端末2の手書き情報反映アプリケーション24は、ステップS3の処理で2値化した2値化領域ごとに、行間を除いた行ごとの行領域を抽出する。
【0047】
図6は、2値化領域32cの行間を除いた行ごとの行領域を抽出する例を示す図である。
【0048】
図6に示すように、2値化領域32cには、「しかしその」の文字列が含まれる行、「当時は何という考もな」の文字列が含まれる行、「かったから別段恐ろしいと」の文字列が含まれる行、「も思わなかった。」の文字列が含まれる行、および行間(空白)が含まれている。この2値化領域32cにおいて、矢印S4の先に示すように、行間を除く行ごとの行領域33a、33b、33c、33dがそれぞれ抽出される。なお、図5における2値化領域32a、32bは、行間を含まない1行からなる文字列であるため、2値化領域32a、32bがそのまま行領域となる(図示せず)。
【0049】
図4の説明に戻る。ステップS5において、端末2の手書き情報反映アプリケーション24は、ステップS4の処理で抽出した行領域ごとに、1文字ごとの文字領域を抽出する。
【0050】
図7は、行領域33aごとに1文字ごとの文字領域を抽出する例を示す図である。
【0051】
図7に示すように、行領域33aには、「しかしその」の文字列が含まれており、矢印S5の先に示すように、「し」の文字領域34a、「か」の文字領域34b、「し」の文字領域34c、「そ」の文字領域34d、「の」の文字領域34eがそれぞれ抽出される。
【0052】
図4の説明に戻る。ステップS6において、端末2の手書き情報反映アプリケーション24は、ステップS5の処理で抽出した文字領域ごとに、文字認識を行い、文字コードを特定する。ステップS7において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内の文字コード群を手書き情報データ(マーカ)として記憶部12に保存する。
【0053】
図8は、手書き情報データ23aの例を示す図である。
【0054】
図8に示すように、No.1のデータ格納領域には、種別が「マーカ」、抽出文字列が「吾輩(わがはい)は猫」の手書き情報データ(抽出領域31a内の文字コード群)が保存され、No.2のデータ格納領域には、種別が「マーカ」、抽出文字列が「である。名前はまだ無い。」の手書き情報データ(抽出領域31b内の文字コード群)が保存され、No.3のデータ格納領域には、種別が「マーカ」、抽出文字列が「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の手書き情報データ(抽出領域31c内の文字コード群)が保存される。
【0055】
以上のようにして、手書き情報反映システム1は、蛍光ペンによるマーカラインが付与された紙書籍4の紙面を読み取り、そのマーカ領域を手書き情報として抽出し、保存することができる。
【0056】
図9は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報反映処理を説明するフローチャートである。図9の説明に当たり、図10を参照し、具体的な処理内容も説明する。
【0057】
ステップS11において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23a(図8)の抽出文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
【0058】
具体的には、端末2の手書き情報反映アプリケーション24は、手書き情報データ23aの抽出文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。例えば、19文字の抽出文字列に完全一致させる場合にはスコアが19でなければならないが、閾値(一致する割合)を設定することで、あいまい検索が可能となる。
【0059】
ステップS12において、端末2の手書き情報反映アプリケーション24は、ステップS11の処理で検索した電子書籍データ22の文字列を囲むマーカタグを追加する。
【0060】
具体的には、図5に示した読取画像データ21aにおいて、「吾輩(わがはい)は猫である。名前はまだ無い。」の一文がひとつの段落を構成している。すなわち、XML(Extensible Markup Language)の形式で記述された電子書籍データ22では、「吾輩(わがはい)は猫である。名前はまだ無い。」の前段に「<P>」が記述され、後段に「</P>」が記述されることで、<P>〜</P>で囲まれた部分がひとつの段落であることが表されている。
【0061】
図8に示すように、手書き情報データ23aにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」の抽出文字列は別々に抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。また、「である。名前はまだ無い。」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。これにより、<span class=“mark”>〜</span>で囲まれた部分にマーカタグ(マーカ機能)が追加される。
【0062】
図9の説明に戻る。ステップS13において、端末2の手書き情報反映アプリケーション24は、ステップS12の処理で追加したマーカタグのうち、連続するマーカタグを統合する。これにより、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」にそれぞれマーカタグが追加されていたが、それらが1つに統合される。
【0063】
なお、図8に示すように、手書き情報データ23aにおける「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の抽出文字列は一続きで抽出されているため、1つのマーカタグが追加され、マーカタグの統合の必要はない。
【0064】
図10は、マーカタグが追加された電子書籍データ22のXMLファイル41aと、そのファイルに基づく表示画面42aの例を示す図である。
【0065】
図10に示すように、電子書籍データ22のXMLファイル41aには、「吾輩(わがはい)は猫である。名前はまだ無い。」の前後にマーカタグが記述されているとともに、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の前後にマーカタグが記述されている。電子書籍ビューア25は、このXMLファイル41aに基づいて表示画面42aを表示部16に表示させることができる。図10の例では、紙書籍4の紙面で付与された手書きマーカが電子書籍データ22に反映され、表示されている(図中、斜線で囲まれた領域)。
【0066】
[本発明の第1の実施の形態における効果]
1.以上のように、紙書籍に付与したマーカを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にマーカした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
【0067】
2.著名人が付与したマーカをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が特にお勧めする文章がマーカされた電子書籍であれば購入することが考えられ、販促効果が期待できる。
【0068】
[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。
【0069】
第2の実施の形態において、基本的なシステム構成(図1)、端末2のハードウエア構成(図2)および記憶部12に記憶される情報(図3)は、第1の実施の形態と同様である。第2の実施の形態では、手書き情報として、メモ書きを抽出して電子書籍データ22に反映させることを特徴とするものである。
【0070】
図11は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。図11の説明に当たり、図12〜図15を参照し、具体的な処理内容も説明する。
【0071】
ステップS21において、読取装置3は、手書き文字が書き込まれた紙書籍4の紙面を読み取り、読取画像データを生成する。
【0072】
図12は、読取装置3により読み取られ、生成された読取画像データ21c、21dの例を示す図である。
【0073】
図12に示すように、読取画像データ21cには、基本版面52内の上方(「吾輩」と「である。」の行間付近)に、「メモAです。」の手書き文字51aが書き込まれている。また、読取画像データ21dには、基本版面52外の下方に、「メモBです。」の手書き文字51bが書き込まれている。なお、読取画像データ21dには、書籍画像53も含まれる。
【0074】
図11の説明に戻る。ステップS22において、端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面を取得する。例えば、手書き情報反映アプリケーション24は、紙面における本文のうち、最左端の文字列のエッジと最右端の文字列のエッジから横サイズを算出し、最上端の文字列のエッジと最下端の文字列のエッジから縦サイズを算出することで、基本版面を取得することができる。
【0075】
ステップS23において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面外におけるエッジを算出し、エッジが多い領域を抽出する。つまり、基本版面外には本文が存在しないため、エッジが多い領域がメモ書き候補として抽出される。例えば、図12において、読取画像データ21d内に含まれる手書き文字51bが抽出領域画像として抽出される。
【0076】
ステップS24において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面内におけるエッジを算出し、エッジの出現位置が不規則な領域を抽出する。
【0077】
具体的には、予め、メモ書きがない紙面に基づいて行領域と行間領域の幅を算出しておき、メモ書きがある紙面に対して行間領域を走査することで、エッジを探索していく。本文はエッジの出方が規則的であるが、メモ書きや画像等は不規則になるため、エッジの出方が不規則になる領域がメモ書き候補として抽出される。この方法によると、画像なども抽出される。例えば、図12において、読取画像データ21cに含まれる手書き文字51aと、読取画像データ21dに含まれる手書き文字51bが抽出領域画像として抽出される。
【0078】
ステップS25において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24の処理で抽出した抽出領域画像ごとにヒストグラムを算出し、ヒストグラムが幅広く分布している抽出領域画像を書籍画像と判定する。
【0079】
図13は、抽出領域画像から算出されたヒストグラムの例を示す図である。
【0080】
図13(a)は、図12に示した手書き文字51aに対応する抽出領域画像61aから算出されたヒストグラム62aを示している。図13(b)は、図12に示した書籍画像53に対応する抽出領域画像61bから算出されたヒストグラム62bを示している。図13(c)は、図12に示した手書き文字51bに対応する抽出領域画像61cから算出されたヒストグラム62cを示している。
【0081】
これらの図からもわかる通り、ヒストグラム62bだけが幅広く分布しており、ヒストグラム62a、62cは分布が両端に偏っている。従って、ヒストグラム62bを算出する上で元画像となった抽出領域画像61bは、メモ書きではなく、書籍画像と判断することができる。
【0082】
図11の説明に戻る。ステップS26において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24で抽出された抽出領域画像に基づく反映メモ選択画面を生成し、表示部16に表示させる。
【0083】
図14は、反映メモ選択画面71の表示例を示す図である。
【0084】
図14に示すように、反映メモ選択画面71には、抽出領域画像61a、61b、61cがそれぞれファイル名とともに表示されており、各画像の左側にチェックボックスが配置され、手書きメモと判断された抽出領域画像にはチェックが入れられている。図14の例の場合、ステップS25の処理で抽出領域画像61bは書籍画像であると判定されたため、チェックが外されている。
【0085】
また反映メモ選択画面71には、チェックボックスにチェックが入れられた手書きメモ(抽出領域画像)を電子書籍データ22に反映する場合に選択される決定ボタン71a、電子書籍データ22への反映をキャンセルする場合に選択されるキャンセルボタン71bも表示されている。
【0086】
図11の説明に戻る。ステップS27において、端末2の手書き情報反映アプリケーション24は、ステップS26の処理で反映メモ選択画面71に表示された抽出領域画像61a〜61cごとに、読取画像データ21における抽出領域と近い位置の文字列をそれぞれ特定する。ステップS28において、端末2の手書き情報反映アプリケーション24は、抽出領域画像61a〜61cと、ステップS27の処理で特定された抽出文字列とを対応付けて手書き情報データ(メモ)として記憶部12に保存する。
【0087】
図15は、手書き情報データ23bの例を示す図である。
【0088】
図15に示すように、No.1のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo001.png」、抽出領域と近い位置の文字列が「xx(わがはい)は」の手書き情報データが保存され、No.2のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo003.png」、抽出領域と近い位置の文字列が「見始(みはじめ)であろう。」の手書き情報データが保存される。なお、No.1のデータ格納領域に記憶される文字列のうち「xx」は、文字認識できなかった文字を示している。
【0089】
以上のようにして、手書き情報反映システム1は、メモが書き込まれた紙書籍4の紙面を読み取り、エッジが多い、またはエッジ出現位置が不規則な領域を手書き情報として抽出し、保存することができる。
【0090】
図16は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報反映処理を説明するフローチャートである。図16の説明に当たり、図17を参照し、具体的な処理内容も説明する。
【0091】
ステップS31において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23b(図15)の抽出領域と近い位置の文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
【0092】
具体的には、端末2の手書き情報反映アプリケーション24は、第1の実施の形態と同様に、手書き情報データ23bの文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。
【0093】
ステップS32において、端末2の手書き情報反映アプリケーション24は、ステップS31の処理で検索した電子書籍データ22の文字列を囲むメモタグを追加する。
【0094】
具体的には、上述した処理によって、図15に示すように、手書き情報データ23bにおける「xx(わがはい)は」と「見始(みはじめ)であろう。」が手書きメモの抽出領域と近い位置の文字列として抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は」の前段に「<memo
src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。また、「見始(みはじめ)であろう。」の前段に「<memo src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。これにより、<memo src=“Memo001.png”>〜</memo>で囲まれた領域にメモタグ(メモ機能)が追加される。
【0095】
図17は、メモタグが追加された電子書籍データ22のXMLファイル41bと、そのファイルに基づく表示画面42bの例を示す図である。
【0096】
図17に示すように、電子書籍データ22のXMLファイル41bには、「吾輩(わがはい)は」の前後にメモタグが記述されているとともに、「見始(みはじめ)であろう。」の前後にメモタグが記述されている。電子書籍ビューア25は、このXMLファイル41bに基づいて表示画面42bを表示部16に表示させることができる。図17の例では、紙書籍4の紙面でのメモ書きが電子書籍データ22に反映され、「メモAです。」と「メモBです。」の吹き出しとして表示されている。なお、図17の例では、吹き出しが表示されている状態とされているが、実際には、メモタグで囲まれた文字列がタップされる(またはマウスが通過される)ときのみ表示される。
【0097】
[本発明の第2の実施の形態における効果]
1.以上のように、紙書籍に書き込んだメモを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にメモした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
【0098】
2.著名人が書き込んだメモをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が直接書き込んだメモ入り電子書籍であれば購入することが考えられ、販促効果が期待できる。
【0099】
[変形例]
以上においては、紙書籍に付与したマーカやメモ書きをリフロー型の電子書籍データに反映するようにしたが、これに限らず、例えば、ページの隅を折り曲げてある箇所(しおり)を検出し、そのページの先頭の文字列を抽出し、電子書籍データの文字列とマッチングする文字列にしおり機能を追加するようにしてもよい。
【0100】
例えば、図18に示すように、読取装置3により、読取画像データ21e、21fが生成されたとする。読取画像データ21fには、右上方隅にしおりが折り曲げられている。
【0101】
端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面外の四隅を探索し、折り曲げ(図18の例の場合、三角形のエッジ)を検出すると、それを、しおりとして抽出するとともに、その折り曲げを抽出したページの先頭の文字列を抽出する。そして、手書き情報反映アプリケーション24は、図19に示すように、種別が「しおり」、抽出文字列が「えて煮(に)て食うという話である。」の手書き情報データ23cを記憶部12に保存することができる。
【0102】
以上のようにして、手書き情報反映システム1は、しおりが折り曲げられた紙書籍4の紙面を読み取り、折り曲げを手書き情報として抽出し、保存することができる。
【0103】
以上、添付図面を参照しながら、本発明に係る手書き情報反映システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0104】
1………手書き情報反映システム
2………端末
3………読取装置
4………紙書籍
11………制御部
12………記憶部
16………表示部
【技術分野】
【0001】
本発明は、手書き情報反映システム、手書き情報反映方法、およびプログラムに関し、特に、紙媒体から抽出した手書き情報を電子書籍データに反映する手書き情報反映システム等に関する。
【背景技術】
【0002】
近年、紙の節約、嵩張る紙の輸送や保管費の削減のため、ディスプレイに表示して閲覧するデジタルデータによる電子書籍が提供されるようになってきている。
【0003】
書籍が電子化されることにより、様々な利用方法が可能となる。特許文献1には、読書進行状況情報に応じた実際の書籍と同様の厚みを有する縦縞模様を表示することにより、現在表示しているページが書籍全体としてどの当りの位置に相当するのかをユーザに対して直感的かつ大まかに認識させる技術が提案されている。
【0004】
また特許文献2には、ページ毎に索引としてのキーワードを抽出し、そのキーワードから目次を作成することにより、検索に必要とされる文字列の入力を不要として、それら電子化ドキュメントを容易に検索・表示する技術が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003−150618号公報
【特許文献2】特開2005−275756号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1および特許文献2の技術では、紙媒体に付与されたマーカやメモ書きを抽出し、抽出したマーカやメモ書きを手書き情報としてリフロー型電子書籍データに反映することができない課題があった。
【0007】
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することである。
【課題を解決するための手段】
【0008】
前述した目的を達成するために、第1の本発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、を具備することを特徴とする手書き情報反映システムである。
第1の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
【0009】
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する。
これにより、メモ書きとして抽出されたメモ画像と、そのメモ画像と近い位置の文字列とを対応付けて手書き情報データとして保存することができる。
【0010】
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する。
これにより、誤ってメモ画像として抽出された書籍画像をメモ画像の対象から除外することができる。
【0011】
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する。
これにより、反映させるメモ画像を確認することができるため、ユーザは、メモ画像のみを確実に電子書籍データに反映することができる。
【0012】
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する。
これにより、マーカ領域ごとにマーカ領域内の文字列を手書き情報データとして保存することができる。
【0013】
第2の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を含むことを特徴とする。
第2の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
【0014】
第3の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を実行させるためのプログラムである。
【0015】
第3の発明に係るプログラムをコンピュータにインストールすることで、第1の発明に係る手書き情報反映システムを得ることができる。
【発明の効果】
【0016】
本発明により、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の第1の実施の形態に係る手書き情報反映システムの構成例を示す図である。
【図2】第1の実施の形態における端末のハードウエア構成例を示す図である。
【図3】第1の実施の形態における端末の記憶部に記憶される情報の例である。
【図4】第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。
【図5】第1の実施の形態における読取画像データの例を示す図である。
【図6】2値化領域の行間を除いた行ごとの行領域を抽出する例を示す図である。
【図7】行領域ごとに1文字ごとの文字領域を抽出する例を示す図である。
【図8】第1の実施の形態における手書き情報データの例を示す図である。
【図9】第1の実施の形態における手書き情報反映処理を説明するフローチャートである。
【図10】マーカタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の一例を示す図である。
【図11】第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。
【図12】第2の実施の形態における読取画像データの例を示す図である。
【図13】抽出領域画像から算出されたヒストグラムの例を示す図である。
【図14】反映メモ選択画面の表示例を示す図である。
【図15】第2の実施の形態における手書き情報データの例を示す図である。
【図16】第2の実施の形態における手書き情報反映処理を説明するフローチャートである。
【図17】メモタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の例を示す図である。
【図18】変形例における読取画像データの例を示す図である。
【図19】変形例における手書き情報データの例を示す図である。
【発明を実施するための形態】
【0018】
以下、図面に基づいて、本発明の実施形態を詳細に説明する。
【0019】
[本発明の第1の実施の形態]
図1は、本発明の実施の形態に係る手書き情報反映システム1の構成例を示す図である。
【0020】
図1に示す手書き情報反映システム1は、端末2と読取装置3とが相互に接続されることで構成される。端末2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等からなるコンピュータシステムであり、例えば、パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォンである。
【0021】
端末2は、リフロー型の電子書籍データを記憶する。電子書籍データには、書誌データ(書籍の題号、著者、出版社、出版年月等)、目次データ(書籍の本文の内容を示す見出し等)、本文データ(書籍の本文に関する電子データ)、文献リストデータ(書籍の著者、題号、出版社、出版年月等)などが含まれる。
【0022】
リフロー型の電子書籍データとは、文字を大きくすればページ数が増え、文字を小さくすればページ数が減るといったように、文字の大きさを変更しても画面に合わせて文字がリフローするため、ページ送りだけで読み進めることができる電子書籍データのことである。
【0023】
端末2は、読み取り装置3が紙書籍4から読み取った読取画像のデータを受信し、記憶する。また端末2は、読取画像データから所定の抽出条件に基づいて手書き情報を抽出するとともに、電子書籍データから手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に手書き情報を反映する。第1の実施の形態でいう手書き情報とは、例えば、蛍光ペンによるマーカラインが付与された部分のことである。
【0024】
読取装置3は、例えば、スキャナやカメラなどであり、紙書籍4の紙面を読み取り、読取画像データを生成する。第1の実施の形態において、読取装置3は、紙書籍4の1頁分を画像化することができる装置であれば、何でもよい。なお、端末2にカメラが実装されている場合、端末2と読取装置3は一体とされる。
【0025】
図2は、端末2のハードウエア構成例を示す図である。尚、図2のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
【0026】
端末2は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
【0027】
制御部11は、CPU、ROM、RAM等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、端末2が行う後述する処理を実現する。ROMは、不揮発性メモリであり、端末2のブートプログラムやBIOS(Basic Input/Output System)等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
【0028】
記憶部12は、HDD等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理を端末2に実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
【0029】
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。
【0030】
通信制御部14は、通信制御装置、通信ポート等を有し、端末2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
【0031】
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、端末2に対して、操作指示、動作指示、データ入力等を行うことができる。
【0032】
表示部16は、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携して端末2のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
【0033】
周辺機器I/F(インタフェース)部17は、端末2に周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して端末2は周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE(The Institute of Electrical and
Electronics Engineers)1394やRS(Recommended Standard)−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
【0034】
図3は、端末2の記憶部12に記憶される情報の例である。
【0035】
図3に示すように、端末2の記憶部12は、読取画像データ21、電子書籍データ22、手書き情報データ23、手書き情報反映AP(アプリケーション)24、および電子書籍ビューア25を記憶している。
【0036】
読取画像データ21は、読取装置3で読み取られた紙書籍4が画像化されたデータである。電子書籍データ22は、書籍1冊分のデータであって、書誌データ、目次データ、本文データ、文献リストデータなどを含み、リフロー型に制作されたデータである。
【0037】
手書き情報データ23は、手書き情報反映アプリケーション24により、所定の抽出条件に基づいて読取画像データ21から抽出された手書き情報のデータである。
【0038】
手書き情報反映アプリケーション24は、所定の抽出条件に基づいて、読取画像データ21から手書き情報を抽出し、手書き情報データ23を生成する。また手書き情報反映アプリケーション24は、電子書籍データ22から手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に、抽出された手書き情報を反映する。
【0039】
電子書籍ビューア25は、手書き情報が反映された電子書籍データ22を取得し、その内容を表示する。
【0040】
図4は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。図4の説明に当たり、図5〜図9を参照し、具体的な処理内容も説明する。
【0041】
ステップS1において、読取装置3は、蛍光ペンなどによるマーカラインが付与された紙書籍4の紙面を読み取り、読取画像データを生成する。
【0042】
図5は、読取装置3により読み取られ、生成された読取画像データ21a、21bの例を示す図である。
【0043】
図5に示すように、読取画像データ21aには、「吾輩(わがはい)は猫」の文字にマーカ30aが付与されているとともに、「である。名前はまだ無い。」の文字にマーカ30bが付与されている。また、読取画像データ21bには、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の文字にマーカ30cが付与されている。図5の例では、読取画像データ21aに含まれるマーカ30aとマーカ30bは、互いのマーカラインが接していないが、読取画像データ21bに含まれるマーカ30cは、複数行のマーカラインが接している。
【0044】
図4の説明に戻る。ステップS2において、端末2の手書き情報反映アプリケーション24は、ステップS1の処理で読取装置3により生成された読取画像データを走査し、背景色が異なる領域(例えば、蛍光色)を抽出する。例えば、図5において、マーカ30a、30b、30c(斜線で囲まれた領域)が異なる領域と判断され、矢印S2の先に示すように、抽出領域31a、31b、31cとしてそれぞれ抽出される。
【0045】
図4の説明に戻る。ステップS3において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内のエッジを算出し、2値化する。例えば、図5において、抽出領域31a、31b、31c内のエッジが算出されて2値化され、矢印S3の先に示すように、2値化領域32a、32b、32cがそれぞれ得られる。
【0046】
図4の説明に戻る。ステップS4において、端末2の手書き情報反映アプリケーション24は、ステップS3の処理で2値化した2値化領域ごとに、行間を除いた行ごとの行領域を抽出する。
【0047】
図6は、2値化領域32cの行間を除いた行ごとの行領域を抽出する例を示す図である。
【0048】
図6に示すように、2値化領域32cには、「しかしその」の文字列が含まれる行、「当時は何という考もな」の文字列が含まれる行、「かったから別段恐ろしいと」の文字列が含まれる行、「も思わなかった。」の文字列が含まれる行、および行間(空白)が含まれている。この2値化領域32cにおいて、矢印S4の先に示すように、行間を除く行ごとの行領域33a、33b、33c、33dがそれぞれ抽出される。なお、図5における2値化領域32a、32bは、行間を含まない1行からなる文字列であるため、2値化領域32a、32bがそのまま行領域となる(図示せず)。
【0049】
図4の説明に戻る。ステップS5において、端末2の手書き情報反映アプリケーション24は、ステップS4の処理で抽出した行領域ごとに、1文字ごとの文字領域を抽出する。
【0050】
図7は、行領域33aごとに1文字ごとの文字領域を抽出する例を示す図である。
【0051】
図7に示すように、行領域33aには、「しかしその」の文字列が含まれており、矢印S5の先に示すように、「し」の文字領域34a、「か」の文字領域34b、「し」の文字領域34c、「そ」の文字領域34d、「の」の文字領域34eがそれぞれ抽出される。
【0052】
図4の説明に戻る。ステップS6において、端末2の手書き情報反映アプリケーション24は、ステップS5の処理で抽出した文字領域ごとに、文字認識を行い、文字コードを特定する。ステップS7において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内の文字コード群を手書き情報データ(マーカ)として記憶部12に保存する。
【0053】
図8は、手書き情報データ23aの例を示す図である。
【0054】
図8に示すように、No.1のデータ格納領域には、種別が「マーカ」、抽出文字列が「吾輩(わがはい)は猫」の手書き情報データ(抽出領域31a内の文字コード群)が保存され、No.2のデータ格納領域には、種別が「マーカ」、抽出文字列が「である。名前はまだ無い。」の手書き情報データ(抽出領域31b内の文字コード群)が保存され、No.3のデータ格納領域には、種別が「マーカ」、抽出文字列が「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の手書き情報データ(抽出領域31c内の文字コード群)が保存される。
【0055】
以上のようにして、手書き情報反映システム1は、蛍光ペンによるマーカラインが付与された紙書籍4の紙面を読み取り、そのマーカ領域を手書き情報として抽出し、保存することができる。
【0056】
図9は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報反映処理を説明するフローチャートである。図9の説明に当たり、図10を参照し、具体的な処理内容も説明する。
【0057】
ステップS11において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23a(図8)の抽出文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
【0058】
具体的には、端末2の手書き情報反映アプリケーション24は、手書き情報データ23aの抽出文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。例えば、19文字の抽出文字列に完全一致させる場合にはスコアが19でなければならないが、閾値(一致する割合)を設定することで、あいまい検索が可能となる。
【0059】
ステップS12において、端末2の手書き情報反映アプリケーション24は、ステップS11の処理で検索した電子書籍データ22の文字列を囲むマーカタグを追加する。
【0060】
具体的には、図5に示した読取画像データ21aにおいて、「吾輩(わがはい)は猫である。名前はまだ無い。」の一文がひとつの段落を構成している。すなわち、XML(Extensible Markup Language)の形式で記述された電子書籍データ22では、「吾輩(わがはい)は猫である。名前はまだ無い。」の前段に「<P>」が記述され、後段に「</P>」が記述されることで、<P>〜</P>で囲まれた部分がひとつの段落であることが表されている。
【0061】
図8に示すように、手書き情報データ23aにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」の抽出文字列は別々に抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。また、「である。名前はまだ無い。」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。これにより、<span class=“mark”>〜</span>で囲まれた部分にマーカタグ(マーカ機能)が追加される。
【0062】
図9の説明に戻る。ステップS13において、端末2の手書き情報反映アプリケーション24は、ステップS12の処理で追加したマーカタグのうち、連続するマーカタグを統合する。これにより、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」にそれぞれマーカタグが追加されていたが、それらが1つに統合される。
【0063】
なお、図8に示すように、手書き情報データ23aにおける「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の抽出文字列は一続きで抽出されているため、1つのマーカタグが追加され、マーカタグの統合の必要はない。
【0064】
図10は、マーカタグが追加された電子書籍データ22のXMLファイル41aと、そのファイルに基づく表示画面42aの例を示す図である。
【0065】
図10に示すように、電子書籍データ22のXMLファイル41aには、「吾輩(わがはい)は猫である。名前はまだ無い。」の前後にマーカタグが記述されているとともに、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の前後にマーカタグが記述されている。電子書籍ビューア25は、このXMLファイル41aに基づいて表示画面42aを表示部16に表示させることができる。図10の例では、紙書籍4の紙面で付与された手書きマーカが電子書籍データ22に反映され、表示されている(図中、斜線で囲まれた領域)。
【0066】
[本発明の第1の実施の形態における効果]
1.以上のように、紙書籍に付与したマーカを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にマーカした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
【0067】
2.著名人が付与したマーカをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が特にお勧めする文章がマーカされた電子書籍であれば購入することが考えられ、販促効果が期待できる。
【0068】
[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。
【0069】
第2の実施の形態において、基本的なシステム構成(図1)、端末2のハードウエア構成(図2)および記憶部12に記憶される情報(図3)は、第1の実施の形態と同様である。第2の実施の形態では、手書き情報として、メモ書きを抽出して電子書籍データ22に反映させることを特徴とするものである。
【0070】
図11は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。図11の説明に当たり、図12〜図15を参照し、具体的な処理内容も説明する。
【0071】
ステップS21において、読取装置3は、手書き文字が書き込まれた紙書籍4の紙面を読み取り、読取画像データを生成する。
【0072】
図12は、読取装置3により読み取られ、生成された読取画像データ21c、21dの例を示す図である。
【0073】
図12に示すように、読取画像データ21cには、基本版面52内の上方(「吾輩」と「である。」の行間付近)に、「メモAです。」の手書き文字51aが書き込まれている。また、読取画像データ21dには、基本版面52外の下方に、「メモBです。」の手書き文字51bが書き込まれている。なお、読取画像データ21dには、書籍画像53も含まれる。
【0074】
図11の説明に戻る。ステップS22において、端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面を取得する。例えば、手書き情報反映アプリケーション24は、紙面における本文のうち、最左端の文字列のエッジと最右端の文字列のエッジから横サイズを算出し、最上端の文字列のエッジと最下端の文字列のエッジから縦サイズを算出することで、基本版面を取得することができる。
【0075】
ステップS23において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面外におけるエッジを算出し、エッジが多い領域を抽出する。つまり、基本版面外には本文が存在しないため、エッジが多い領域がメモ書き候補として抽出される。例えば、図12において、読取画像データ21d内に含まれる手書き文字51bが抽出領域画像として抽出される。
【0076】
ステップS24において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面内におけるエッジを算出し、エッジの出現位置が不規則な領域を抽出する。
【0077】
具体的には、予め、メモ書きがない紙面に基づいて行領域と行間領域の幅を算出しておき、メモ書きがある紙面に対して行間領域を走査することで、エッジを探索していく。本文はエッジの出方が規則的であるが、メモ書きや画像等は不規則になるため、エッジの出方が不規則になる領域がメモ書き候補として抽出される。この方法によると、画像なども抽出される。例えば、図12において、読取画像データ21cに含まれる手書き文字51aと、読取画像データ21dに含まれる手書き文字51bが抽出領域画像として抽出される。
【0078】
ステップS25において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24の処理で抽出した抽出領域画像ごとにヒストグラムを算出し、ヒストグラムが幅広く分布している抽出領域画像を書籍画像と判定する。
【0079】
図13は、抽出領域画像から算出されたヒストグラムの例を示す図である。
【0080】
図13(a)は、図12に示した手書き文字51aに対応する抽出領域画像61aから算出されたヒストグラム62aを示している。図13(b)は、図12に示した書籍画像53に対応する抽出領域画像61bから算出されたヒストグラム62bを示している。図13(c)は、図12に示した手書き文字51bに対応する抽出領域画像61cから算出されたヒストグラム62cを示している。
【0081】
これらの図からもわかる通り、ヒストグラム62bだけが幅広く分布しており、ヒストグラム62a、62cは分布が両端に偏っている。従って、ヒストグラム62bを算出する上で元画像となった抽出領域画像61bは、メモ書きではなく、書籍画像と判断することができる。
【0082】
図11の説明に戻る。ステップS26において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24で抽出された抽出領域画像に基づく反映メモ選択画面を生成し、表示部16に表示させる。
【0083】
図14は、反映メモ選択画面71の表示例を示す図である。
【0084】
図14に示すように、反映メモ選択画面71には、抽出領域画像61a、61b、61cがそれぞれファイル名とともに表示されており、各画像の左側にチェックボックスが配置され、手書きメモと判断された抽出領域画像にはチェックが入れられている。図14の例の場合、ステップS25の処理で抽出領域画像61bは書籍画像であると判定されたため、チェックが外されている。
【0085】
また反映メモ選択画面71には、チェックボックスにチェックが入れられた手書きメモ(抽出領域画像)を電子書籍データ22に反映する場合に選択される決定ボタン71a、電子書籍データ22への反映をキャンセルする場合に選択されるキャンセルボタン71bも表示されている。
【0086】
図11の説明に戻る。ステップS27において、端末2の手書き情報反映アプリケーション24は、ステップS26の処理で反映メモ選択画面71に表示された抽出領域画像61a〜61cごとに、読取画像データ21における抽出領域と近い位置の文字列をそれぞれ特定する。ステップS28において、端末2の手書き情報反映アプリケーション24は、抽出領域画像61a〜61cと、ステップS27の処理で特定された抽出文字列とを対応付けて手書き情報データ(メモ)として記憶部12に保存する。
【0087】
図15は、手書き情報データ23bの例を示す図である。
【0088】
図15に示すように、No.1のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo001.png」、抽出領域と近い位置の文字列が「xx(わがはい)は」の手書き情報データが保存され、No.2のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo003.png」、抽出領域と近い位置の文字列が「見始(みはじめ)であろう。」の手書き情報データが保存される。なお、No.1のデータ格納領域に記憶される文字列のうち「xx」は、文字認識できなかった文字を示している。
【0089】
以上のようにして、手書き情報反映システム1は、メモが書き込まれた紙書籍4の紙面を読み取り、エッジが多い、またはエッジ出現位置が不規則な領域を手書き情報として抽出し、保存することができる。
【0090】
図16は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報反映処理を説明するフローチャートである。図16の説明に当たり、図17を参照し、具体的な処理内容も説明する。
【0091】
ステップS31において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23b(図15)の抽出領域と近い位置の文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
【0092】
具体的には、端末2の手書き情報反映アプリケーション24は、第1の実施の形態と同様に、手書き情報データ23bの文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。
【0093】
ステップS32において、端末2の手書き情報反映アプリケーション24は、ステップS31の処理で検索した電子書籍データ22の文字列を囲むメモタグを追加する。
【0094】
具体的には、上述した処理によって、図15に示すように、手書き情報データ23bにおける「xx(わがはい)は」と「見始(みはじめ)であろう。」が手書きメモの抽出領域と近い位置の文字列として抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は」の前段に「<memo
src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。また、「見始(みはじめ)であろう。」の前段に「<memo src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。これにより、<memo src=“Memo001.png”>〜</memo>で囲まれた領域にメモタグ(メモ機能)が追加される。
【0095】
図17は、メモタグが追加された電子書籍データ22のXMLファイル41bと、そのファイルに基づく表示画面42bの例を示す図である。
【0096】
図17に示すように、電子書籍データ22のXMLファイル41bには、「吾輩(わがはい)は」の前後にメモタグが記述されているとともに、「見始(みはじめ)であろう。」の前後にメモタグが記述されている。電子書籍ビューア25は、このXMLファイル41bに基づいて表示画面42bを表示部16に表示させることができる。図17の例では、紙書籍4の紙面でのメモ書きが電子書籍データ22に反映され、「メモAです。」と「メモBです。」の吹き出しとして表示されている。なお、図17の例では、吹き出しが表示されている状態とされているが、実際には、メモタグで囲まれた文字列がタップされる(またはマウスが通過される)ときのみ表示される。
【0097】
[本発明の第2の実施の形態における効果]
1.以上のように、紙書籍に書き込んだメモを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にメモした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
【0098】
2.著名人が書き込んだメモをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が直接書き込んだメモ入り電子書籍であれば購入することが考えられ、販促効果が期待できる。
【0099】
[変形例]
以上においては、紙書籍に付与したマーカやメモ書きをリフロー型の電子書籍データに反映するようにしたが、これに限らず、例えば、ページの隅を折り曲げてある箇所(しおり)を検出し、そのページの先頭の文字列を抽出し、電子書籍データの文字列とマッチングする文字列にしおり機能を追加するようにしてもよい。
【0100】
例えば、図18に示すように、読取装置3により、読取画像データ21e、21fが生成されたとする。読取画像データ21fには、右上方隅にしおりが折り曲げられている。
【0101】
端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面外の四隅を探索し、折り曲げ(図18の例の場合、三角形のエッジ)を検出すると、それを、しおりとして抽出するとともに、その折り曲げを抽出したページの先頭の文字列を抽出する。そして、手書き情報反映アプリケーション24は、図19に示すように、種別が「しおり」、抽出文字列が「えて煮(に)て食うという話である。」の手書き情報データ23cを記憶部12に保存することができる。
【0102】
以上のようにして、手書き情報反映システム1は、しおりが折り曲げられた紙書籍4の紙面を読み取り、折り曲げを手書き情報として抽出し、保存することができる。
【0103】
以上、添付図面を参照しながら、本発明に係る手書き情報反映システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0104】
1………手書き情報反映システム
2………端末
3………読取装置
4………紙書籍
11………制御部
12………記憶部
16………表示部
【特許請求の範囲】
【請求項1】
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、
を備えることを特徴とする手書き情報反映システム。
【請求項2】
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する
ことを特徴とする請求項1に記載の手書き情報反映システム。
【請求項3】
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する
ことを特徴とする請求項2に記載の手書き情報反映システム。
【請求項4】
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する
ことを特徴とする請求項2または請求項3に記載の手書き情報反映システム。
【請求項5】
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の手書き情報反映システム。
【請求項6】
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を含むことを特徴とする手書き情報反映方法。
【請求項7】
コンピュータに、
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を実行させるためのプログラム。
【請求項1】
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、
を備えることを特徴とする手書き情報反映システム。
【請求項2】
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する
ことを特徴とする請求項1に記載の手書き情報反映システム。
【請求項3】
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する
ことを特徴とする請求項2に記載の手書き情報反映システム。
【請求項4】
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する
ことを特徴とする請求項2または請求項3に記載の手書き情報反映システム。
【請求項5】
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の手書き情報反映システム。
【請求項6】
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を含むことを特徴とする手書き情報反映方法。
【請求項7】
コンピュータに、
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2013−37419(P2013−37419A)
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願番号】特願2011−170764(P2011−170764)
【出願日】平成23年8月4日(2011.8.4)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願日】平成23年8月4日(2011.8.4)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
[ Back to top ]