説明

電子書籍管理装置及び方法

【課題】多くのユーザに閲覧されている電子書籍を、テーマ(キーワード)ごとに抽出することの可能な電子書籍管理装置及び方法を提供すること。
【解決手段】電子書籍管理装置(1)の閲覧時間集計手段(11)は、電子書籍のページごとの閲覧時間をユーザごとに集計し、スコア算出手段(13)は、集計したページごとの閲覧時間から、電子書籍の特徴度スコアを算出する。このとき、スコア算出手段(13)は、ページごとの閲覧時間に加え、ページごとのキーワードの出現頻度スコアも加味した上で特徴度スコアを算出するため、特定のキーワードについて多くのユーザに閲覧されている電子書籍が抽出可能になる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定のキーワードを含む電子書籍の閲覧状況を管理する電子書籍管理装置及び方法に関する。
【背景技術】
【0002】
近年、携帯端末の発展に伴い、小型表示装置を搭載した携帯端末に電子化した書籍を保存し、当該表示装置に表示して読書する電子書籍と呼ばれる形態が普及しつつある。紙に印刷された本ではなく電子化された書籍を専用の端末に保存すれば足りるため、電子書籍では多量の書籍を容易に持ち運びすることができる。
【0003】
書籍を電子化したことから書籍の閲覧状況を管理し、マーケティングに利用する方法が開発されており、特許文献1には、電子書籍の閲覧時間などの読書状況から客観的なマーケティング情報を算出する電子ブックシステムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−252869号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記電子ブックシステムで算出する読書状況は、電子書籍の単なる閲覧時間にすぎず、マーケティング情報として必ずしも適切なものではなかった。すなわち、上記電子ブックシステムでは、多くのユーザに閲覧されている電子書籍を抽出することはできるものの、所定のテーマについて多くのユーザに閲覧されている電子書籍を抽出することはできない。
【0006】
そこで、本発明は、多くのユーザに閲覧されている電子書籍を、テーマ(キーワード)ごとに抽出することの可能な電子書籍管理装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
(1) 所定の複数の電子書籍を構成するページごとの閲覧時間に基づいて、前記所定の複数の電子書籍に含まれるキーワードの各々について、当該キーワードを含む前記電子書籍のページの閲覧時間をキーワード閲覧時間として前記電子書籍ごとに集計する閲覧時間集計手段と、前記集計したキーワード閲覧時間に基づいて前記キーワードの特徴度スコアを前記電子書籍ごとに算出するスコア算出手段と、を含む電子書籍管理装置。
【0008】
(1)の電子書籍管理装置によれば、電子書籍のページごとのキーワードと、このページの閲覧時間と、から電子書籍のスコアを算出する。そのため、電子書籍のスコアとして、所定のテーマ(キーワード)に応じたスコアを算出することができ、所定のテーマについて多くのユーザに閲覧されている電子書籍を抽出することができる。
【0009】
(2) 前記スコア算出手段は、前記所定の複数の電子書籍を解析してTF/IDFにより出現頻度スコアを算出する出現頻度スコア算出手段と、前記出現頻度スコアの各々について、前記所定の複数の電子書籍の各ページのうち、前記出現頻度スコアを算出した前記キーワードを含むページの閲覧時間に基づいて前記出現頻度スコアを補正することにより、前記特徴度スコアを算出するスコア補正手段と、を含む(1)に記載の電子書籍管理装置。
【0010】
(2)の電子書籍管理装置によれば、電子書籍のページごとのキーワードの出現頻度スコアをTF/IDFにより算出し、当該出現頻度スコアをページごとの閲覧時間で補正する。これにより、電子書籍のスコアとして、所定のテーマ(キーワード)に応じたスコアを算出することができ、所定のテーマについて多くのユーザに閲覧されている電子書籍を抽出することができる。
【0011】
(3) 前記スコア算出手段は、前記集計したキーワード閲覧時間と、前記所定の複数の電子書籍の総閲覧時間と、前記キーワードを含む前記電子書籍の総閲覧時間と、に基づいて、前記電子書籍ごとに前記キーワードの特徴度スコアを算出する特徴スコア算出手段、を含む(1)に記載の電子書籍管理装置。
【0012】
(3)の電子書籍管理装置によれば、キーワード閲覧時間と、複数の電子書籍の総閲覧時間と、キーワードを含む電子書籍の総閲覧時間と、に基づいて電子書籍のスコアを算出する。そのため、電子書籍のスコアとして、所定のテーマ(キーワード)に応じたスコアを算出することができ、所定のテーマについて多くのユーザに閲覧されている電子書籍を抽出することができる。
【0013】
(4) コンピュータが所定のキーワードを含む電子書籍の閲覧状況を管理する方法であって、前記コンピュータが実行する、所定の複数の電子書籍を構成するページごとの閲覧時間に基づいて、前記所定の複数の電子書籍に含まれるキーワードの各々について、当該キーワードを含む前記電子書籍のページの閲覧時間をキーワード閲覧時間として前記電子書籍ごとに集計するステップと、前記集計したキーワード閲覧時間に基づいて前記キーワードの特徴度スコアを前記電子書籍ごとに算出するステップと、を含む方法。
【0014】
(4)の方法によれば、(1)の電子書籍管理装置と同様の効果を奏する。
【発明の効果】
【0015】
本発明によれば、所定のテーマについて多くのユーザに閲覧されている電子書籍を抽出することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の電子書籍管理装置の機能構成を示すブロック図である。
【図2】本発明の閲覧時間記憶手段を示す図である。
【図3】本発明のスコア算出手段による特徴度スコアの算出過程を示す図である。
【図4】本発明のスコア算出手段による特徴度スコアの算出過程を示す図である。
【図5】本発明のスコア算出手段による特徴度スコアの算出過程を示す図である。
【図6】本発明のスコア算出手段により算出された特徴度スコアを示す図である。
【図7】本発明の書籍提示手段による電子書籍の提示の一例を示す図である。
【図8】本発明の電子書籍管理装置による特徴度スコアの算出の流れを示すフローチャートである。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について図面を参照して説明する。
【0018】
[電子書籍管理装置1の機能構成]
初めに、図1を参照して、本発明の電子書籍管理装置1の機能構成について説明する。
電子書籍管理装置1は、ユーザが電子書籍を閲覧する際に用いる電子書籍閲覧端末2とネットワーク3を介して通信可能に接続され、閲覧時間集計手段11と、閲覧時間記憶手段12と、スコア算出手段13と、特徴度スコア記憶手段14と、書籍提示手段15と、を含んで構成される。
【0019】
閲覧時間集計手段11は、電子書籍の閲覧時間を電子書籍閲覧端末2のユーザごとに集計(受信)する。このとき、閲覧時間集計手段11は、電子書籍の閲覧時間として電子書籍のページごとの閲覧時間を集計する。
閲覧時間記憶手段12は、閲覧時間集計手段11が集計した閲覧時間を記憶する。具体的には、閲覧時間記憶手段12は、図2に示すように、ユーザごとに電子書籍の各ページの閲覧時間を記憶する。図2ではユーザ「A1」が電子書籍「月刊○○PC」の1ページ目を10秒、2ページ目を12秒閲覧したことが記憶され、電子書籍「週刊××通信」の1ページ目を15秒、2ページ目を8秒閲覧したことが記憶されている。
【0020】
スコア算出手段13は、閲覧時間記憶手段12に記憶されたページごとの閲覧時間から、電子書籍の特徴度スコアを算出する。ここで、「特徴度スコア」とは、特定のテーマ(キーワード)に対するユーザの閲覧状況を評価するスコアであり、ページごとの閲覧時間を、それぞれ各ページに含まれるキーワードの閲覧時間として集計して算出する。本発明では、キーワードごとの閲覧時間を算出することで、単にユーザに多く閲覧されている電子書籍ではなく、所定のテーマについてユーザに多く閲覧されている電子書籍を抽出可能となっている。なお、ページごとのキーワードは、文章中の特徴的な単語(重要とみなされる単語)を抽出するためのアルゴリズムであるTF/IDFにより抽出することができる。
【0021】
スコア算出手段13により電子書籍の特徴度スコアの算出について具体的に説明する。スコア算出手段13は、算出パターン1又は算出パターン2により電子書籍の特徴度スコアを算出する。
【0022】
<算出パターン1>
初めに、算出パターン1について具体的に説明する。算出パターン1は、ページごとのキーワードの出現頻度スコアを予め算出した後に、当該出現頻度スコアをページごとの閲覧時間で補正することにより特徴度スコアを算出する。
算出パターン1を実現するため、スコア算出手段13は、出現頻度スコア算出手段131と、スコア補正手段132と、を含んで構成される。
【0023】
出現頻度スコア算出手段131は、電子書籍のページごとに含まれるキーワードの出現頻度スコアを、TF/IDFにより算出する。具体的には、以下の式1において、「各電子書籍のページ(j)内の対象キーワード(i)の数」を「tfij」とし、「全電子書籍数」を「N」とし、「対象キーワード(i)を含む全電子書籍数」を「df」とすることで、キーワード(i)の電子書籍のページ(j)における出現頻度スコア「Wij」を算出する。
【数1】

【0024】
出現頻度スコア算出手段131により算出された出現頻度スコアを、図3に示す。図3では、電子書籍「月刊○○PC」の1ページ目について、キーワード「携帯電話」に対し出現頻度スコア「5」が算出され、キーワード「スマートフォン」に対して出現頻度スコア「4」が算出されている。また、電子書籍「週刊××通信」の1ページ目について、キーワード「携帯電話」に対し出現頻度スコア「2」が算出され、キーワード「スマートフォン」に対して出現頻度スコア「10」が算出されている。
【0025】
スコア補正手段132は、出現頻度スコア算出手段131が算出した電子書籍のページごとのキーワードの出現頻度スコア(図3)を、閲覧時間記憶手段12に記憶された当該ページごとの閲覧時間(図2)で補正し、電子書籍の特徴度スコアを算出する。なお、閲覧時間によるスコアの補正の程度及び方法は、キーワードごとの閲覧時間を反映させるものである限り様々なものが採用可能であり、管理者が適宜調整することができる。
スコア補正手段132による特徴度スコアの算出の一例について、図4から図6を参照して説明する。
【0026】
初めに、スコア補正手段132は、ページごとのキーワードの出現頻度スコアをユーザごとに集計されたページ単位の閲覧時間で補正し、ページごとの特徴度スコアをユーザごとに算出する(図4)。
図4では、ユーザ「A1」の電子書籍「月刊○○PC」の1ページ目のキーワード「携帯電話」について、出現頻度スコア「5」と閲覧時間「10秒」とから特徴度スコアとして「14」を算出し、同様にキーワード「スマートフォン」について、出現頻度スコア「4」と閲覧時間「12秒」とから特徴度スコアとして「12」を算出している。電子書籍「週刊××通信」についても同様に、1ページ目のキーワード「携帯電話」について特徴度スコアとして「8」を算出し、キーワード「スマートフォン」について特徴度スコアとして「22」を算出している。
【0027】
続いて、スコア補正手段132は、ユーザごとに算出された特徴度スコアを全ユーザでまとめ、全ユーザについてのページごとの特徴度スコアを算出する(図5)。その後、スコア補正手段132は、ページごとに算出された特徴度スコアを電子書籍単位にまとめ、全ユーザについての電子書籍ごとの特徴度スコアを算出する(図6)。
【0028】
なお、図4から図6に示したスコア補正手段132による特徴度スコアの算出手順は一例にすぎず、算出手順(順序)は適宜変更可能である。例えば、スコア補正手段132では、ユーザごとの閲覧時間で出現頻度スコアを補正することとしているが、予め全ユーザの閲覧時間を算出した上で、当該全ユーザの閲覧時間で出現頻度スコアを補正することとしてもよい。また、ユーザごとに特徴度スコアをまとめた(図5)後、電子書籍ごとに特徴度スコアをまとめているが(図6)、電子書籍ごとに特徴度スコアをまとめた後に、ユーザごとに特徴度スコアをまとめることとしてもよく、同時にまとめることとしてもよい。
【0029】
<算出パターン2>
続いて、算出パターン2について具体的に説明する。算出パターン1では、ページごとのキーワードの出現頻度スコアを算出した後に、当該出現頻度スコアをページごとの閲覧時間で補正することで特徴度スコアを算出していたが、算出パターン2では、ページごとのキーワードの出現頻度スコアを算出することなく特徴度スコアを算出する。
算出パターン2を実現するため、スコア算出手段13は、特徴スコア算出手段133を含んで構成される。
【0030】
特徴スコア算出手段133は、特徴度スコアを、電子書籍のページごとの閲覧時間に基づいてTF/IDFにより算出する。具体的には、上述の式1において、「各電子書籍の対象キーワード(i)が含まれているページ(j)の総閲覧時間」を「tfij」とし、「全電子書籍の総閲覧時間」を「N」とし、「対象キーワード(i)が含まれている全電子書籍の総閲覧時間」を「df」とすることで、対象キーワード(i)の電子書籍のページ(j)における特徴度スコア「Wij」を算出する(図5)。
その後、特徴スコア算出手段133は、ページごとに算出された特徴度スコアを電子書籍単位にまとめ、全ユーザについての電子書籍ごとの特徴度スコアを算出する(図6)。
【0031】
図1に戻り、特徴度スコア記憶手段14は、スコア算出手段13が算出した特徴度スコアを記憶する。
書籍提示手段15は、特徴度スコア記憶手段14に記憶された特徴度スコアに基づいて、特定のテーマ(キーワード)についてユーザに閲覧された時間が多い電子書籍を抽出し、当該電子書籍をユーザ(電子書籍閲覧端末2)に対して提示する。図7では、テーマ「携帯電話」についてのおススメの電子書籍を電子書籍閲覧端末2に対して提示する様子を示している。図6に示すように、キーワード「携帯電話」についての特徴度スコアは「月刊○○PC」の方が「週刊××通信」よりも高いため、書籍提示手段15は、電子書籍閲覧端末2に対して「月刊○○PC」を優先して提示する。
なお、書籍提示手段15による電子書籍の提示は任意に行うことができ、ユーザ(電子書籍閲覧端末2)からの要求(例えば、「携帯電話」についてのおススメの電子書籍の要求)に基づいて提示することとしてもよく、また、ユーザからの要求ではなく自動的に(例えば、電子書籍配信サイトにおいて自動的におススメの電子書籍を提示しておく)提示することとしてもよい。
【0032】
[電子書籍管理装置1のハードウェア構成]
以上説明した電子書籍管理装置1のハードウェアは、一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部として、中央処理装置(CPU)を備える他、記憶部として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVDなど)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイなどの各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボールなど)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、電子書籍管理装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
【0033】
[電子書籍管理装置1の処理]
続いて、図8を参照して、電子書籍管理装置1の処理について説明する。図8に示すフローチャートは、所定の周期で行われる特徴度スコア更新のためのバッチ処理であり、当該処理により特徴度スコアが算出されると、その後、自動的又はユーザからの要求に応じて、書籍提示手段15による電子書籍の提示が行われる。
【0034】
S1:初めに、閲覧時間集計手段11は、電子書籍閲覧端末2の各々から電子書籍のページごとの閲覧時間を受信し、各ユーザごとに当該閲覧時間を集計した上で閲覧時間記憶手段12に記憶する。
S2:続いて、スコア算出手段13は、閲覧時間記憶手段12に記憶されたページごとの閲覧時間から電子書籍のページごとの特徴度スコアを算出する。このとき、スコア算出手段13は、上述の算出パターン1又は算出パターン2に従い、特徴度スコアを算出する。
S3:続いて、スコア算出手段13は、ページごとに算出した特徴度スコアを電子書籍単位にまとめ、電子書籍ごとの特徴度スコアを算出し、特徴度スコア記憶手段14に記憶する。
【0035】
以上、本発明の電子書籍管理装置1について説明した。電子書籍管理装置1では、ページごとの閲覧時間とページごとのキーワードとから特徴度スコアを算出する。これにより、多くのユーザに閲覧されている電子書籍を、テーマ(キーワード)ごとに抽出することができる。
そして、このような特徴度スコアを用いてユーザに対して電子書籍を提示することで、ユーザの要望をより適格に捉えた電子書籍を提示することができる。すなわち、単に閲覧時間の多い電子書籍をユーザに対して提示したのでは、ユーザが所望するテーマに沿った電子書籍を適格に提示することはできず、また、単にキーワードの出現頻度スコアの高い電子書籍を提示したのでは、他のユーザにあまり閲覧されていない(当該キーワードについて重要度が低い内容しか記載されていない)電子書籍しか提示することができない。これに対し、本発明の電子書籍管理装置1では、キーワードの出現頻度スコアに加えて閲覧時間も加味して特徴度スコアを算出するため、ユーザが所望するテーマについて多くのユーザに閲覧されている電子書籍をユーザに対して提示することができる。
【0036】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
【0037】
例えば、書籍提示手段15は、電子書籍を提示する際に、週刊誌、月刊誌、単行本など書籍の種類ごとに特定のテーマに沿った電子書籍を提示することとしてもよい。また、スコア算出手段13が算出した特徴度スコアを、電子書籍の発行後の日数で除して、1日あたりの特徴度スコアを算出した上で、当該特徴度スコアに基づいて書籍提示手段15が電子書籍を提示することとしてもよい。
【0038】
また、閲覧時間集計手段11は、閲覧時間の集計をオンライン、すなわち、ユーザが電子書籍を閲覧している際にリアルタイムで集計することとしてもよく、また、所定の周期、例えば、電子書籍の閲覧終了時に閲覧時間を一括して集計することとしてもよい。
【符号の説明】
【0039】
1 電子書籍管理装置
11 閲覧時間集計手段
12 閲覧時間記憶手段
13 スコア算出手段
14 特徴度スコア記憶手段
15 書籍提示手段

【特許請求の範囲】
【請求項1】
所定の複数の電子書籍を構成するページごとの閲覧時間に基づいて、前記所定の複数の電子書籍に含まれるキーワードの各々について、当該キーワードを含む前記電子書籍のページの閲覧時間をキーワード閲覧時間として前記電子書籍ごとに集計する閲覧時間集計手段と、
前記集計したキーワード閲覧時間に基づいて前記キーワードの特徴度スコアを前記電子書籍ごとに算出するスコア算出手段と、
を含む電子書籍管理装置。
【請求項2】
前記スコア算出手段は、
前記所定の複数の電子書籍を解析してTF/IDFにより出現頻度スコアを算出する出現頻度スコア算出手段と、
前記出現頻度スコアの各々について、前記所定の複数の電子書籍の各ページのうち、前記出現頻度スコアを算出した前記キーワードを含むページの閲覧時間に基づいて前記出現頻度スコアを補正することにより、前記特徴度スコアを算出するスコア補正手段と、
を含む請求項1に記載の電子書籍管理装置。
【請求項3】
前記スコア算出手段は、
前記集計したキーワード閲覧時間と、前記所定の複数の電子書籍の総閲覧時間と、前記キーワードを含む前記電子書籍の総閲覧時間と、に基づいて、前記電子書籍ごとに前記キーワードの特徴度スコアを算出する特徴スコア算出手段、
を含む請求項1に記載の電子書籍管理装置。
【請求項4】
コンピュータが所定のキーワードを含む電子書籍の閲覧状況を管理する方法であって、前記コンピュータが実行する、
所定の複数の電子書籍を構成するページごとの閲覧時間に基づいて、前記所定の複数の電子書籍に含まれるキーワードの各々について、当該キーワードを含む前記電子書籍のページの閲覧時間をキーワード閲覧時間として前記電子書籍ごとに集計するステップと、
前記集計したキーワード閲覧時間に基づいて前記キーワードの特徴度スコアを前記電子書籍ごとに算出するステップと、
を含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate