説明

電子書籍分析装置及び方法及びプログラム

【課題】 多くの電子書籍の各ページの重要度を効率的に判定する。
【解決手段】 本発明は、電子書籍閲覧者による閲覧行動情報をクライアント端末から収集し、閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、重要度判定結果を出力する。ページ重要度の判定する際に、閲覧時間の長さのみならず、閲覧行動情報(ページ履歴)により、閲覧された回数、閲覧時間の総和、閲覧時間の総和を文字数で除した値のいずれか、または、組み合わせたものをページ重要度とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子書籍分析装置及び方法及びプログラムに係り、特に、電子書籍を構成する各ページの重要度を判定するための電子書籍分析装置及び方法及びプログラムに関する。
【背景技術】
【0002】
電子書籍を構成する各ページの重要度を判定する必要がある場合は多い。
【0003】
例えば、ある事柄を調査していて、その事柄に関する電子書籍を見つけたとき、その電子書籍をすべて読むことなく重要なページを把握できれば、調査は効率的に進む。あるいは、電子書籍内で重要なページが判明すれば、時間の無い読者のために、電子書籍内の重要なページのみを提示する電子書籍速読支援サービスを実現できる。
【0004】
これらの場合、電子書籍を構成する各ページの重要度を判定する必要があり、これは文書の重要度判定の問題とみなすことができる。
【0005】
従来、文書の重要度判定にはTDIDF値がよく用いられる。TFとは文書dにおける単語tの頻度、IDFとは単語tが現れる相対文書頻度の逆数の対数である。ある単語tを含む文書dにおける単語tのTFIDF値は下記のように表される。
TFIDF値=(文書dにおける単語tの出現回数) × log{(総文書数)/(単語tを含む文書数)}
TFIDF値を計算することで、ある単語tを含む文書群の中で、単語tに関する文書として重要である可能性が高い文書を特定することができる。
【0006】
また、ページ毎の重要度判定ではないが、学術論文は他論文を引用する機会が多く、他論文からの引用が多い論文を重要とみなすことができる(例えば、非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】角田裕之,小野寺夏生:論文と研究者のインパクトに対する新しい計量書誌学的指標 −論文引用グラフの固有ベクトル解析−, 情報メディア研究, Vol.5, No.1, pp.1-20, 2006.
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、膨大な量の電子書籍の各ページの重要度を、ユーザ、あるいは、電子書籍販売業者が人手で判定するのは人的・時間コストがかかりすぎて現実的ではない。
【0009】
一方で、前述のTFIDF値を用いることで、特定の単語tを含む文書群の中で、重要である可能性が高い文書を自動的に特定することができる。しかし、この方法は特定の単語tが与えられたときに、単語tに関する文書として重要であるかどうか判定できるだけである。すなわち、単語tへの関連を前提としない場合、電子書籍内のどのページが重要なのか判定することができない。
【0010】
また、非特許文献1のように引用関係に着目することで重要な電子書籍、電子書籍内のページを特定できる場合もあるが、学術論文や技術書以外では引用が頻繁に行われることは少ない。
【0011】
本発明は、上記の点に鑑みなされたもので、多くの電子書籍の各ページの重要度を効率的に判定することが可能な電子書籍分析装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
上記の課題を解決するために、本発明(請求項1)は、電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析装置であって、
電子書籍閲覧者による閲覧行動情報を収集し、ページ情報記憶手段に格納する閲覧行動収集手段と、
前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、ページ重要度記憶手段に格納する重要度判定手段と、
前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力手段と、を有する。
【0013】
また、本発明(請求項2)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
【0014】
また、本発明(請求項3)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
【0015】
また、本発明(請求項4)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
【0016】
また、本発明(請求項5)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
【0017】
また、本発明(請求項6)は、電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析方法であって、
ページ情報記憶手段、ページ重要度記憶手段、閲覧行動収集手段、重要度判定手段、重要度出力手段を有する装置において、
前記閲覧行動収集手段が、電子書籍閲覧者による閲覧行動情報を収集し、前記ページ情報記憶手段に格納する閲覧行動収集ステップと、
前記重要度判定手段が、前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、前記ページ重要度記憶手段に格納する重要度判定ステップと、
前記重要度出力手段が、前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力ステップと、を行う。
【0018】
また、本発明(請求項7)は、前記ページ情報記憶手段において、
前記閲覧行動情報として、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定ステップにおいて、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、のいずれかを行う。
【0019】
また、本発明(請求項8)は、請求項1乃至5のいずれか1項に記載の電子書籍分析装置を構成する各手段としてコンピュータを機能させるための電子書籍分析プログラムである。
【発明の効果】
【0020】
上記のように、本発明では、ページの閲覧履歴により、閲覧された回数、表示時間の総和、表示時間の総和を文字数で除した値のいずれかをページ重要度とすることが可能であるため、ユーザや電子書籍販売業者の人手をかけなくても、ユーザが電子書籍を読むだけで自動的に膨大な量の電子書籍の各ページの重要度を自動的に判定することができる。
【図面の簡単な説明】
【0021】
【図1】本発明のシステム構成図である。
【図2】本発明の第1の実施の形態におけるクライアント端末の構成図である。
【図3】本発明の第1の実施の形態におけるサーバ部の構成図である。
【図4】本発明の第1の実施の形態におけるクライアント端末の動作のフローチャートである。
【図5】本発明の第1の実施の形態における端末情報記憶部に格納されるデータ例である。
【図6】本発明の第1の実施の形態における取得した表示ページ情報の格納例である。
【図7】本発明の第1の実施の形態における表示ページ情報記憶部に格納されるデータ例である。
【図8】本発明の第1の実施の形態における更新前のページ情報記憶部のデータ例である。
【図9】本発明の第1の実施の形態における更新後のページ情報記憶部のデータ例である。
【図10】本発明の第1の実施の形態におけるサーバ部の動作のフローチャートである。
【図11】本発明の第1の実施の形態におけるページ情報記憶部に格納されるデータ例である。
【図12】本発明の第1の実施の形態におけるページ重要度判定の例である。
【図13】本発明の第1の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【図14】本発明の第1の実施の形態におけるページ重要度の出力の例である。
【図15】本発明の第2の実施の形態におけるページ重要度判定の例である。
【図16】本発明の第2の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【図17】本発明の第3の実施の形態におけるページ重要度判定の例である。
【図18】本発明の第3の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【図19】本発明の第4の実施の形態におけるページ重要度判定部での正規化の例である。
【図20】本発明の第4の実施の形態におけるページ重要度判定の例である。
【図21】本発明の第4の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【図22】本発明の第5の実施の形態におけるページ重要度判定部での正規化・集計の例である。
【図23】本発明の第5の実施の形態におけるページ重要度判定の例である。
【図24】本発明の第5の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【図25】本発明の第6の実施の形態におけるページ重要度での正規化・集計の例である。
【図26】本発明の第6の実施の形態におけるページ重要度判定の例である。
【図27】本発明の第6の実施の形態におけるページ重要度記憶部に格納されるデータ例である。
【発明を実施するための形態】
【0022】
以下図面と共に、本発明の実施の形態を説明する。
【0023】
[第1の実施の形態]
本実施の形態では、電子書籍を構成する各ページ単位の重要度を判定する際に、ページ閲覧履歴により、閲覧された回数をページ重要度とする例を説明する。なお、ページとは電子書籍端末の表示単位でもよい。
【0024】
図1は、本発明の第1の実施の形態におけるシステム構成を示す。
【0025】
同図に示すシステムは、サーバ部20、クライアント端末10、当該クライアント端末10に接続される電子書籍端末18から構成される。
【0026】
図2は、本発明の第1の実施の形態におけるクライアント端末の構成を示す。
【0027】
クライアント端末10は、端末情報判定部13、端末情報記憶部14、表示ページ判定部15、表示ページ情報記憶部16、クライアント側データ送受信部17からなり、例えば、汎用電子書籍端末に専用ソフトウェアをインストールすることで実現できる。
【0028】
電子書籍端末18は、電子書籍記憶部11と電子書籍表示部12からなり、クライアント端末10に接続されている。
【0029】
図3は、本発明の第1の実施の形態におけるサーバ部の構成を示す。
【0030】
サーバ部20は、サーバ側データ送受信部21、ページ情報記憶部22、ページ重要度判定部23、ページ重要度記憶部24、ページ重要度出力部25からなり、例えば汎用サーバ機等で実現できる。
【0031】
以下に、クライアント端末10の動作を説明する。
【0032】
図4は、本発明の第1の実施の形態におけるクライアント端末の動作のフローチャートである。
【0033】
ステップ101) クライアント端末10の端末情報判定部13は、電子書籍端末18の端末情報を取得する。ここでは、端末情報として端末IDを取得するものとする。端末IDとは、電子書籍端末18を一意に特定できる情報であり、ここでは、電子書籍端末18の製造番号とする。取得した端末情報は図5の形式で端末情報記憶部14に格納する。
【0034】
ステップ102) 電子書籍端末18の電子書籍記憶部11に格納されている電子書籍が読み込まれて電子書籍表示部12に表示されると、表示ページ情報判定部15は、電子書籍表示部12に表示されているページの表示ページ情報を取得する。表示されているページの情報は電子書籍端末18のシステムが把握していることが通常であり、ここでは、この情報を利用できるものとする。具体的には、書籍名、ページ、ページ内文字数、ページ表示時刻が表示ページ情報として取得するものとする。取得した表示ページ情報を図6の形式で表示ページ情報記憶部16に格納する。
【0035】
ステップ103) 電子書籍表示部12に表示されているページが、ステップ102の状態から他のページに変わった場合、あるいは、電子書籍の閲覧が終了した場合、表示ページ情報判定部15は、ステップ102で表示されていたページの表示が終了したと判定し、この時点の時刻をページ表示終了時刻とする。次に、表示ページ情報判定部15は、表示ページ情報記憶部16から該ページの表示開始時刻を取得し、ページの表示終了時刻との差を計算して、これをページ表示時間とする。
【0036】
表示ページ情報判定部15は、ページ表示終了時刻とページ表示時間を図7の形式でページ情報記憶部16に追記する。
【0037】
ステップ104) クライアント側データ送受信部17は、既定条件が満たされると、端末情報記憶部14、表示ページ情報記憶部16に格納されている情報を結合してサーバ部20に送信し、表示ページ情報記憶部16の中身を消去する。なお、既定条件をここでは、「前回ステップ104終了時から10ページが読まれた場合か、あるいは、電子書籍の閲覧が終了した場合」とする。
【0038】
ステップ104が実施される直前のページ情報記憶部16の状態が図8であった場合、サーバ部に送信されるデータは図9のようになる。
【0039】
次に、サーバ部20の動作を説明する。
【0040】
図10は、本発明の第1の実施の形態におけるサーバ部の動作のフローチャートである。
【0041】
ステップ201) サーバ部20のサーバ側データ送受信部21は、クライアント部10のクライアント側データ送受信部17から図9の形式で受信したデータを、同じ形式でページ情報記憶部22に格納する。
【0042】
ステップ202) 既定条件が満たされると、ページ重要度判定部23は、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。既定条件を、ここでは、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末に該ページが表示された回数とする。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図12のように各ページのページ重要度を判定し、各ページ重要度を図13の形式でページ重要度記憶部24に格納する。ここで、ページ重要度はページが表示された回数が多いほど、ページ重要度が高くなるように設定する。
【0043】
ステップ203) ページ重要度出力部26は、ページ重要度記憶部25に格納されている各ページのページ重要度を走査し、電子書籍毎にページ重要度が高い順に上位N件を抽出し、図14に示すように出力する。図14では、上位3件について、書籍名とページ、当該ページの重要度を出力する例を示している。
【0044】
[第2の実施の形態]
重要なページはユーザがじっくりと長い時間をかけて読む場合が多い。しかし、前述の第1の実施の形態では、各ページが読まれていた時間が考慮されていない。
【0045】
本実施の形態は、第1の実施の形態を一部改良し、各ページが読まれていた時間を考慮する。
【0046】
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
【0047】
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。
【0048】
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末における該ページのページ表示時間(秒数)の総和とする。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図15のように、ページ表示時間の総和に基づいて各ページのページ重要度を判定し、各ページ重要度を図16の形式でページ重要度記憶部24に格納する。
【0049】
[第3の実施の形態]
ページ内文字数が多ければ読むのには時間がかかる。これはページの内容の重要さとは独立である。しかし、前述の第2の実施の形態では、各ページが読まれていた時間のみを考慮し、ページ内文字数は考慮していない。本実施の形態は、第2の実施の形態を一部改良し、各ページのページ内文字数も考慮する。
【0050】
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
【0051】
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。
【0052】
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
【0053】
ページ重要度判定部23は、重要度として、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)の総和を、ページ内文字数で割ったものを採用する。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は、図17のように、各ページのページ内文字数に基づいて、各ページのページ重要度を判定し、各ページ重要度を図18の形式でページ重要度記憶部24に格納する。
【0054】
[第4の実施の形態]
各ユーザが電子書籍を読む速度には個人差がある。しかし、第3の実施の形態では、各ページが読まれていた時間、ページ内文字数のみを考慮し、各ユーザの読む速度の個人差は考慮していない。
【0055】
本実施の形態は、第3の実施の形態を一部改良し、各ユーザの読む速度の個人差も考慮する。なお、ここでは1台の電子書籍端末は1人のユーザが用いる場合が多いため、ユーザを端末IDで識別するが、電子書籍端末使用時のユーザID等、より各ユーザを高精度に特定できる情報が取得可能であればこれを用いても構わない。
【0056】
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
【0057】
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。
【0058】
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化したものの総和を、ページ内文字数で割ったものとする。
【0059】
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図19のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化し、メモリ(図示せず)に格納する。
【0060】
例えば、ページ情報記憶部22内の全データの中で、端末IDがABC-1234567890であるデータのページ表示時間が44sec、54sec、49sec、74secであった場合、正規化すると順に0、0.33、0.17、1となる。
【0061】
そして、ページ重要度判定部23は、メモリ(図示せず)に格納されているページ情報の端末ID内で正規化したページ表示時間に基づいて、図20のように各ページのページ重要度を判定し、各ページ重要度を図21の形式でページ重要度記憶部24に格納する。
【0062】
[第5の実施の形態]
各ユーザの知識には個人差がある。例えば、知識のある人が読んだページは重要である場合が多い。しかし、第4の実施の形態では、各ページが読まれていた時間、各ユーザの読む速度の個人差、ページ内文字数のみを考慮し、各ユーザの知識の個人差は考慮していない。
【0063】
本実施の形態は、第4の実施の形態を一部改良し、各ユーザの知識の個人差も考慮する。なお、ここでは多くの電子書籍のページを読んだユーザが知識が高いと判定しているが、各ユーザの職業等、各ユーザの知識をより高精度に特定できる情報が取得可能であればこれを用いても構わない。
【0064】
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
【0065】
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。
【0066】
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
【0067】
本実施の形態では、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化し、端末ID内で表示された全ページ数をかけたものの総和を、ページ内文字数で割ったものとする。
【0068】
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図22のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化すると同時に、各端末ID内で表示された全ページ数も集計し、メモリ(図示せず)に格納する。そして、ページ重要度判定部23は、メモリ(図示せず)に格納されたデータから、端末ID内で正規化したページ表示時間に各端末ID内で表示された全ページ数を掛けたものの総和に基づいて、図23のように各ページのページ重要度を判定し、各ページ重要度を図24の形式でページ重要度記憶部24に格納する。
【0069】
[第6の実施の形態]
同一ユーザが繰り返し閲覧するページは該ユーザが重要とみなしている場合が多い。しかし、第5の実施の形態では、各ページが読まれていた時間、各ユーザの読む速度の個人差、各ユーザの知識の個人差、ページ内文字数のみを考慮し、同一ユーザの繰り返し閲覧回数は考慮していない。例えば、図11において、書籍Bの100ページは端末ID JKL-4567890123によって2回閲覧されているが、この点が考慮されていない。
【0070】
本実施の形態は、第5の実施の形態を一部改良し、同一ユーザの繰り返し閲覧回数も考慮する。
【0071】
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
【0072】
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。
【0073】
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
【0074】
本実施の形態では、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化し、各端末ID内で表示された全ページ数をかけ、各端末IDで表示された回数をかけたものの総和を、ページ内文字数で割ったものとする。
【0075】
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は、図25のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化し、各端末ID内で表示された全ページ数を集計すると同時に、ページ表示終了時刻と端末IDに基づいてそのページが各端末ID内で何回目に表示されたか集計し、メモリ(図示せず)に格納する。
【0076】
そして、ページ重要度判定部23は、メモリ(図示せず)に格納されたデータから、図26のように、端末ID内で正規化されたページ表示時間に各端末ID内で表示されたページ数を掛け、各端末ID内で表示された回数を掛けたものの総和に基づいて、各ページのページ重要度を判定し、各ページ重要度を図27の形式でページ重要度記憶部24に格納する。
【0077】
上記の第1〜第6の実施の形態におけるサーバ部20の構成要素の動作をプログラムとして構築し、電子書籍分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0078】
また、構築されたプログラムをハードディスク、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
【0079】
なお、本発明は上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0080】
10 クライアント端末
11 電子書籍記憶部
12 電子書籍表示部
13 端末情報判定部
14 端末情報記憶部
15 表示ページ情報判定部
16 表示ページ情報記憶部
17 クライアント側データ送受信部
18 電子書籍端末
20 サーバ部
21 サーバ側データ送受信部
22 ページ情報記憶部
23 ページ重要度判定部
24 ページ重要度記憶部
25 ページ重要度出力部

【特許請求の範囲】
【請求項1】
電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析装置であって、
電子書籍閲覧者による閲覧行動情報を収集し、ページ情報記憶手段に格納する閲覧行動収集手段と、
前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、ページ重要度記憶手段に格納する重要度判定手段と、
前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力手段と、
を有することを特徴とする電子書籍分析装置。
【請求項2】
前記閲覧行動情報は、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。
【請求項3】
前記閲覧行動情報は、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。
【請求項4】
前記閲覧行動情報は、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む、
請求項1記載の電子書籍分析装置。
【請求項5】
前記閲覧行動情報は、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。
【請求項6】
電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析方法であって、
ページ情報記憶手段、ページ重要度記憶手段、閲覧行動収集手段、重要度判定手段、重要度出力手段を有する装置において、
前記閲覧行動収集手段が、電子書籍閲覧者による閲覧行動情報を収集し、前記ページ情報記憶手段に格納する閲覧行動収集ステップと、
前記重要度判定手段が、前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、前記ページ重要度記憶手段に格納する重要度判定ステップと、
前記重要度出力手段が、前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力ステップと、
を行うことを特徴とする電子書籍分析方法。
【請求項7】
前記ページ情報記憶手段は、
前記閲覧行動情報として、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定ステップにおいて、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
のいずれかを行う
請求項6記載の電子書籍分析方法。
【請求項8】
請求項1乃至5のいずれか1項に記載の電子書籍分析装置を構成する各手段としてコンピュータを機能させるための電子書籍分析プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate