説明

電子書籍用目次生成システム

【課題】電子書籍において一般ユーザが興味のある分野に即した目次を新たに生成することができ、ひいてはユーザが興味のある分野に関する記事を効率的に閲覧することが可能な電子書籍用目次生成システムを提供する。
【解決手段】電子書籍用目次生成装置100は、一般ユーザの興味のある分野に即した複数のカテゴリと、各カテゴリに関連付けられた一ないし複数の所定の単語とから構成されるカテゴリ表を予め記憶しているカテゴリ記憶部110と、電子書籍のコンテンツデータから単語を抽出する単語抽出部130と、カテゴリ記憶部110のカテゴリ表を参照することにより、単語抽出部130により抽出された単語に基づいて複数のカテゴリを設定するカテゴリ設定部140と、カテゴリ設定部140により設定された複数のカテゴリを使用して電子書籍の目次を生成する目次生成部160とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子書籍のコンテンツデータに基づいて電子書籍の目次を生成する電子書籍用目次生成システムに関する。
【背景技術】
【0002】
近年、新聞、雑誌、単行本、論文、参考書などを含む印刷物のコンテンツデータを、iPad(登録商標。アップルインコーポレイテッド社の製品)などのタッチパネル式の表示受付部を有するタブレット型パーソナルコンピュータ(以下「タブレット端末」という)によってインターネットを介してダウンロードすることにより、ユーザはいわゆる「電子書籍」として印刷物の記事を閲覧することができる。
【0003】
一般に、上述の印刷物は情報量が多いために目次が設けられており、この目次によって読者は該印刷物の概要を把握することができる。これと同様、例えば、タブレット端末のユーザが電子書籍を閲覧する場合、電子書籍のコンテンツデータには目次が付されているため、ユーザは興味のある分野の記事が記載されているかなどを該目次を参照して把握する。
【0004】
ところが、該目次は、ユーザの興味を煽るような表現を用いた出版社側の恣意に即するものであるため、ユーザは自分の興味のある分野の記事を該目次から把握できない場合があった。
【0005】
例えば、ユーザがタレント集団の「ジャニーズ」に関する記事を閲覧したい場合、雑誌の目次に「ジャニーズ」という名称や所属タレントの名前が掲載されている場合には、「ジャニーズ」に関する記事を閲覧することができる。ところが、「ジャニーズ」に関する記事であったとしても、目次に必ずしも「ジャニーズ」や所属タレントの名前が掲載されていない場合も多い。このため、結局、ユーザは雑誌の各ページを斜め読みしなければならず、非常に労力がかかるものであった。特に電子書籍が多数にわたる場合にはユーザの興味のある記事のみを閲覧することがほとんど不可能に近くなる。
【0006】
一方、下記特許文献1に開示されるように、所定のキーワードが検索対象のコンテンツデータ内に存在するか否かを検索する全文検索方式(サーチエンジン方式)という技術を電子書籍に適用することが考えられる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平5−040788号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
ところが、全文検索方式では、ユーザが希望するキーワードが掲載されている記事を検索することができるが、ユーザが興味のある分野に関する記事までも検索することは難しかった。
【0009】
例えば、ユーザがタレント集団の「ジャニーズ」に関する記事を検索したい場合、「ジャニーズ」の文言で検索すると、「ジャニーズ」の文言が掲載されている記事を検索することができる。ところが、記事には「ジャニーズ」の文言が掲載されておらず、所属タレントの名前だけが掲載されている記事は検索することができない。このため、結局、ユーザは「ジャニーズ」の文言の他に、所属タレントの名称などを全て検索しなければならず、これも非常に労力がかかるものであった。
【0010】
本発明は、上記の問題に鑑みてなされたものであって、電子書籍において一般ユーザが興味のある分野に即した目次を新たに生成することができ、ひいてはユーザが興味のある分野に関する記事を効率的に閲覧することが可能な電子書籍用目次生成システムを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明に係る電子書籍用目次生成システムは、上記目的を達成するために、一般ユーザの興味のある分野に即した複数のカテゴリと、各カテゴリに関連付けられた一ないし複数の所定の単語とから構成されるカテゴリ表を予め記憶しているカテゴリ記憶手段と、電子書籍のコンテンツデータから単語を抽出する単語抽出手段と、カテゴリ記憶手段のカテゴリ表を参照することにより、単語抽出手段により抽出された単語に基づいて複数のカテゴリを設定するカテゴリ設定手段と、カテゴリ設定手段により設定された複数のカテゴリを使用して電子書籍の目次を生成する目次生成手段とを備えることを特徴とする。
【0012】
これによれば、電子書籍のコンテンツデータから抽出された単語に基づいて、一般ユーザの興味のある分野に即したカテゴリという概念的に幅のあるものを設定することにより、電子書籍において一般ユーザの興味のある分野に即した目次を新たに生成することができる。
【0013】
また、単語抽出手段により抽出された全単語の個数に対して、カテゴリ設定手段により設定されたカテゴリの単語の個数が占める割合を該カテゴリの占有率として算出するカテゴリ占有率算出手段を備えるのが好ましい。これによれば、電子書籍に対する各カテゴリの占有率に基づいて目次を生成することより、ユーザは電子書籍に対する各カテゴリの割合を容易に把握することができるため、ユーザは興味のある分野に関する記事が電子書籍においてどれ程の割合で掲載されているかを容易に把握することが可能になる。
【0014】
また、カテゴリ占有率算出手段は、単語抽出手段により抽出された全ページの全単語の個数に対して、カテゴリ設定手段により全ページに設定されたカテゴリの単語の個数が占める割合を全ページにおける該カテゴリの占有率として算出するのが好ましい。これによれば、電子書籍の全ページに対する各カテゴリの占有率に基づいて目次を生成することより、ユーザは電子書籍の全ページに対する各カテゴリの割合を容易に把握することができるため、ユーザは興味のある分野に関する記事が電子書籍の全ページにおいてどれ程の割合で掲載されているかを容易に把握することが可能になる。
【0015】
また、目次生成手段は、カテゴリ占有率算出手段により算出された全ページにおけるカテゴリの占有率が所定の割合以上である該カテゴリを使用して電子書籍の目次を生成するのが好ましい。これによれば、全ページにおけるカテゴリの占有率が所定の割合以上であるカテゴリを使用して目次を生成するため、重要度の高いカテゴリのみによって目次を生成することができる。
【0016】
また、目次生成手段は、カテゴリ占有率算出手段により算出された全ページにおけるカテゴリの占有率の高い該カテゴリが優先される態様で電子書籍の目次を生成するのが好ましい。これによれば、全ページのカテゴリの占有率の高いカテゴリが優先される態様で目次を生成するため、電子書籍に掲載されている記事の傾向を容易に把握することができる。
【0017】
また、カテゴリ占有率算出手段は、コンテンツデータの各ページについて、単語抽出手段により抽出された該ページの全単語の個数に対して、カテゴリ設定手段により該ページに設定されたカテゴリの単語の個数が占める割合を該ページにおける該カテゴリの占有率として算出するのが好ましい。これによれば、電子書籍の各ページにおけるカテゴリの占有率に基づいて目次を生成することより、ユーザは各ページに対する各カテゴリの割合を容易に把握することができ、ユーザは興味のある分野に関する記事が各ページにおいてどれ程の割合で掲載されているかを容易に把握することが可能になる。
【0018】
また、目次生成手段は、カテゴリ占有率算出手段により算出されたページにおけるカテゴリの占有率が所定の割合以上であるページの番号を表示させるのが好ましい。これによれば、各ページにおけるカテゴリの占有率が所定の割合以上であるカテゴリのページ番号が付されるため、ユーザは興味のある分野に関する記事がどのページに掲載されているかを容易に把握することができる。
【0019】
また、目次生成手段は、カテゴリ占有率算出手段により算出されたページにおけるカテゴリの占有率の高いページの番号を優先して表示させるのが好ましい。これによれば、ページにおけるカテゴリの占有率の高いページの番号が優先されるため、ユーザは興味のある分野に関する記事が特にどのページに優先的に掲載されているかを容易に把握することができる。
【発明の効果】
【0020】
本発明によれば、電子書籍のコンテンツデータから抽出された単語に基づいて、一般ユーザの興味のあるカテゴリ(分野)という概念的に幅のあるものを設定することにより、電子書籍において一般ユーザの興味のある分野に即した目次を新たに生成することができる。
【0021】
このためユーザは、従来のような出版社側で恣意的に設定された目次にとらわれることなく、一般ユーザが興味を持っている現実的な分野に即しながら記事を探して閲覧したり、蒐集することができる。
【0022】
また、カテゴリ記憶手段に記憶させているカテゴリと所定の単語の関連付けを適宜変更することにより、時代や流行に応じて生まれる新語や流行語などにも対応することができる。
【0023】
また、従来の全文検索方式において必要であった関連するキーワードを全て指定するという煩雑な作業も省くことができる。
【図面の簡単な説明】
【0024】
【図1】電子書籍閲覧システムを示す構成概略図である。
【図2】電子書籍用目次生成装置のブロック図である。
【図3】カテゴリ記憶部に記憶されているカテゴリ表を示す図である。
【図4】第1ページに対する単語抽出部、カテゴリ設定部、カテゴリ占有率算出部の動作を説明するための図である。
【図5】第2ページに対する単語抽出部、カテゴリ設定部、カテゴリ占有率算出部の動作を説明するための図である。
【図6】第3ページに対する単語抽出部、カテゴリ設定部、カテゴリ占有率算出部の動作を説明するための図である。
【図7】目次生成部によって生成される目次を示す図である。
【図8】電子書籍閲覧システムの動作を示すフローチャートである。
【発明を実施するための形態】
【0025】
次に、本発明に係る電子書籍用目次生成装置(以下「本装置100」という)を含む電子書籍閲覧システム(以下「閲覧システム1」という)の一実施形態について図面を参照しつつ説明する。なお、本実施形態の閲覧システム1においては、電子書籍としての雑誌のコンテンツデータの目次が生成される場合について説明する。
【0026】
本実施形態に係る閲覧システム1は、図1に示すように、電子書籍用のコンテンツデータ(以下「コンテンツデータ」という)を販売する販売サーバ10と、販売サーバ10から販売されたコンテンツデータをダウンロードして電子書籍として表示するタブレット型パーソナルコンピュータ(以下「タブレット端末20」という)と、電子書籍における目次を生成する本装置100とを備えている。閲覧システム1において、販売サーバ10、タブレット端末20、本装置100の各々は、電気通信網であるインターネット30に接続され、いずれも有線通信あるいは無線通信によって各種データの送受信が可能に構成されている。
【0027】
前記販売サーバ10は、販売するための電子書籍用のコンテンツデータを記憶しており、タブレット端末20から送信されるコンテンツ要求信号を受信すると、該コンテンツ要求信号に基づいてコンテンツデータを送信する。なお、詳細な説明は省略するが、本実施形態においてコンテンツデータは商品として販売されているため、販売サーバ10は、クレジットカードによる支払いあるいはその他の方法によって支払いがあったことが確認された後に、コンテンツデータを送信するものとする。
【0028】
前記タブレット端末20は、例えば、iPad(登録商標)などであり、タッチパネル式の表示受付部(以下「タッチパネル部21」という)を備えている。このタブレット端末20は、ユーザのコンテンツデータをダウンロードする旨の命令をタッチパネル部21から受け付けて、該命令に対応するコンテンツ要求信号をインターネット30を介して販売サーバ10に送信する。また、タブレット端末20は、該コンテンツデータを受信(ダウンロード)して専用のアプリケーションソフトウェアを起動させることにより、電子書籍としてタッチパネル部21に表示する。
【0029】
前記本装置100は、図2に示すように、カテゴリ表111を予め記憶しているカテゴリ記憶部110と、インターネット30を介して送信されたコンテンツデータを受信するコンテンツ受信部120と、コンテンツデータから単語を抽出する単語抽出部130と、抽出された単語に基づいてカテゴリを設定するカテゴリ設定部140と、カテゴリ占有率を算出するカテゴリ占有率算出部150と、カテゴリを使用して電子書籍の目次を生成する目次生成部160と、目次付のコンテンツデータを送信するコンテンツ送信部170とを備える。
【0030】
なお、本装置100は、本装置100全体の動作を制御するCPU(Central Processing unit)と、カテゴリ記憶部110を含む記憶装置に記憶されているデータなどの書き込みや読み出しを行うメモリ(図示略)とを備えており、CPUがカテゴリ記憶部110あるいは記憶装置に記憶されている各種データをメモリに書き込み、メモリに書き込んだデータを読み出すことによって後述する各部の動作を実行する。以下に本装置100の各部の詳細について説明する。
【0031】
前記カテゴリ記憶部110は、図3に示すようなカテゴリ表111を予め記憶している。このカテゴリ表111は、カテゴリが設定されるカテゴリ欄111aと、名詞が設定される名詞欄111bから構成され、複数のカテゴリ毎に一ないし複数の所定の名詞が関連付けられている。例えば、カテゴリ表111の第1行目に着目すると、「ジャニーズ」のカテゴリには、「木村拓哉」、「SMAP」、「松本潤」・・・などの所定の名詞が関連付けられている。
【0032】
このカテゴリ表111のカテゴリは、一般ユーザの興味のある分野に即したカテゴリである。すなわち、雑誌を一般に閲覧するユーザの興味に沿って予め設定されており、時代や流行に応じて生まれるカテゴリにも対応可能である。
【0033】
また、カテゴリ表111の名詞は、一般ユーザの興味のあるカテゴリに属するとされる名詞である。すなわち、カテゴリと同様に、雑誌を一般に閲覧するユーザの興味に沿って予め設定されており、時代や流行に応じて生まれる新語や流行語などにも対応可能である。
【0034】
また、この名詞は、文語および口語を問わず日本語において用いられる全ての名詞である。例えば、「木村拓哉」という名詞については、一般的に「キムタク」などといった「木村拓哉」を指す別称が存在していることを踏まえて、「キムタク」という名詞が「木村拓哉」という名詞と同一であるものとして記憶されている。従って、このような称呼や表記の相違については、問題なく「ジャニーズ」というカテゴリと関連付けられているものとする。
【0035】
なお、このカテゴリ表111におけるカテゴリと名詞の対応付けは人手により行われてもよいし、コンピュータで自動的に行われてもよい。
【0036】
前記コンテンツ受信部120は、図2に示すように、インターネット30を介して送信されてきたコンテンツデータを受信する。このとき送信されてくるコンテンツデータは、タブレット端末20よって送信されたコンテンツ要求信号に応じて販売サーバ10が送信したものである。
【0037】
前記単語抽出部130は、コンテンツ受信部120から送信された雑誌のコンテンツデータを受信すると、該コンテンツデータから名詞のみを抽出する。本実施形態において、単語抽出部130は、電子書籍のコンテンツデータ全体を1単位とした名詞の抽出(第1の名詞抽出)と、雑誌のコンテンツデータの1ページを1単位とした名詞の抽出(第2の名詞抽出)とのいずれも実行する。
【0038】
具体的に説明すると、第1の名詞抽出として、単語抽出部130は、複数のページを有する雑誌のコンテンツデータ全体から名詞を抽出する。ここで抽出された名詞の集まりを、「全体の名詞群B」とする。
【0039】
一方、第2の名詞抽出として、雑誌の各ページのコンテンツデータから名詞を抽出する。例えば、図4に示すように、雑誌の任意の第1ページP1の名詞を抽出する場合、単語抽出部130は、第1ページP1に記載されているコンテンツデータA1から、「木村拓哉」、「SMAP」、「大阪市内」・・・といったように名詞を抽出する。なお、ここで抽出された名詞の集まりを、図4に示すように「名詞群B1」とする。
【0040】
また、図5に示すように、雑誌の任意の第2ページP2の名詞を抽出する場合、単語抽出部130は、第2ページP2に記載されているコンテンツデータA2から、「デビュー」、「30周年記念」、「ツアー」・・・といったように名詞を抽出する。ここで抽出された名詞の集まりを、図5に示すように「名詞群B2」とする。
【0041】
また、図6に示すように、任意の第3ページP3の名詞を抽出する場合、単語抽出部130は、第3ページP3に記載されているコンテンツデータA3から、「歌手」、「小田和正」、「菅野美穂」・・・といったように名詞を抽出する。ここで抽出された名詞の集まりを、図6に示すように「名詞群B3」とする。
【0042】
なお、上記単語抽出部130が名詞を抽出する技術は「形態素解析」等と称される公知技術であるため、詳細な説明は省略する。
【0043】
前記カテゴリ設定部140は、カテゴリ記憶部110に記憶されるカテゴリ表111を参照することにより、前記単語抽出部130により抽出された単語に基づいて複数のカテゴリを設定する。本実施形態では、カテゴリ設定部140は、第1の名詞抽出による「全体の名詞群B」ついて行う雑誌全体のカテゴリの設定(第1のカテゴリ設定)と、第2の名詞抽出による「名詞群B1〜B3」について行う各ページのカテゴリの設定(第2のカテゴリ設定)とのいずれも実行する。
【0044】
具体的に説明すると、第1のカテゴリ設定として、カテゴリ設定部140は、カテゴリ記憶部110に記憶されるカテゴリ表111を参照することにより、前記単語抽出部130により抽出された「全体の名詞群B」に基づいて、雑誌全体に複数のカテゴリを設定する。
【0045】
一方、第2のカテゴリ設定としては、カテゴリ設定部140は、カテゴリ記憶部110に記憶されるカテゴリ表111を参照することにより、前記単語抽出部130により抽出された各ページの名詞群B1、B2、B3に基づいて、各ページ毎に複数のカテゴリを設定する。
【0046】
例えば、雑誌の第1ページP1のカテゴリを設定する場合、カテゴリ設定部140は、第1ページP1において図4に示す名詞群B1のうちの「木村拓哉」という名詞に、カテゴリ記憶部110のカテゴリ表111を参照して「ジャニーズ」というカテゴリを設定する。その他の名詞群B1の各名詞についても同様、カテゴリ設定部140は、カテゴリ記憶部110のカテゴリ表111を参照して各々カテゴリを設定する。
【0047】
また、雑誌の第2ページP2のカテゴリを設定する場合、カテゴリ設定部140は、第2ページP2においても図5に示す名詞群B2のうちの「デビュー」という名詞について、カテゴリ設定部140は、カテゴリ記憶部110のカテゴリ表111を参照して「その他芸能」というカテゴリを設定する。その他の名詞群B2に含まれる各名詞についても同様、カテゴリ設定部140は、カテゴリ記憶部110のカテゴリ表111を参照して各々カテゴリを設定する。
【0048】
また、雑誌の第3ページP3のカテゴリを設定する場合、カテゴリ設定部140は、第3ページP3においても図6に示す名詞群B3のうちの「歌手」という名詞について、カテゴリ設定部140は、カテゴリ記憶部110のカテゴリ表111に基づいて「音楽」というカテゴリを設定する。その他の名詞群B3に含まれる各名詞についても同様、カテゴリ設定部140は、カテゴリ記憶部110のカテゴリ表111に参照して各々カテゴリを設定する。
【0049】
前記カテゴリ占有率算出部150は、単語抽出部130により抽出された名詞の個数に対して、カテゴリ設定部140により設定されたカテゴリ毎の名詞の個数が占める割合をカテゴリ占有率として算出する。本実施形態において、カテゴリ占有率算出部150は、第1の名詞抽出により雑誌のコンテンツデータ全体から抽出された全名詞の個数Nに対して、第1のカテゴリ設定により設定されたカテゴリ毎の名詞の個数nが占める割合を全体のカテゴリ占有率Wとする計算(第1のカテゴリ占有率の算出)と、第2の名詞抽出により抽出された各ページ毎の全名詞の個数Nk(kはページ番号:k=0、1、2、・・・)の各々に対して、第2のカテゴリ設定により各ページ毎に設定されたカテゴリ毎の名詞の個数nkが占める割合をページ単位カテゴリ占有率Wkとする計算(第2のカテゴリ占有率の算出)とのいずれも実行する。
【0050】
具体的に説明すると、カテゴリ占有率算出部150は、カテゴリ占有率をW、名詞群に含まれる全名詞の個数をN、設定されたあるカテゴリの名詞の個数をnとすると、
W=n/N ・・・[1]
という式により、各カテゴリについてのカテゴリ占有率Wを算出する。
【0051】
従って、第1のカテゴリ占有率の算出として、カテゴリ占有率算出部150は、第1のカテゴリ占有率をW0、第1の名詞抽出により抽出された雑誌全体の全名詞の個数をN0、第1のカテゴリ設定により設定されたあるカテゴリの名詞の個数をn0とすると、上式1より雑誌全体の某カテゴリのカテゴリ占有率W0=n0/W0を算出する。その他の各カテゴリも同様に各々ページ単位カテゴリ占有率が算出される。なお、ここで算出された雑誌全体のカテゴリ占有率の集まりを、「全体カテゴリ占有率群C」とする。
【0052】
一方、第2のカテゴリ占有率の算出として、カテゴリ占有率算出部150は、図4に示すように、第1ページP1において「ジャニーズ」というカテゴリのページ単位カテゴリ占有率W1を算出する場合、「ジャニーズ」というカテゴリが設定された名詞「木村拓哉」、「SMAP」・・・の個数をn1、名詞群B1に含まれる全単語の個数N1とすると、上式1より雑誌全体のあるカテゴリのカテゴリ占有率W1=n1/W1を算出する。これにより、第1ページP1において「ジャニーズ」というカテゴリが占める割合(本実施形態では18%)が算出される。その他の各カテゴリも同様に各々ページ単位カテゴリ占有率が算出される。ここで算出されたページ単位カテゴリ占有率の集まりを、図4に示すように「ページ単位カテゴリ占有率群C1」とする。
【0053】
また、カテゴリ占有率算出部150は、図5に示すように、第2ページP2において「その他芸能」というカテゴリのページ単位カテゴリ占有率W2を算出する場合、「その他芸能」というカテゴリが設定された名詞「デビュー」・・・の個数をn2、名詞群B2に含まれる全単語の個数N2とすると、上式1より雑誌全体のあるカテゴリのカテゴリ占有率W2=n2/W2を算出する。これにより、第2ページP2において「その他芸能」というカテゴリが占める割合(本実施形態では8%)が算出される。その他の各カテゴリも同様に各々ページ単位カテゴリ占有率が算出される。ここで算出されたページ単位カテゴリ占有率の集まりを、図5に示すように「ページ単位カテゴリ占有率群C2」とする。
【0054】
また、カテゴリ占有率算出部150は、図6に示すように、第3ページP3において「その他エンターテイメント全般」というカテゴリのページ単位カテゴリ占有率W3を算出する場合、「その他エンターテイメント」というカテゴリが設定された名詞「主演」・・・の個数をn3、名詞群B3に含まれる全単語の個数N3とすると、上式1より雑誌全体のあるカテゴリのカテゴリ占有率W3=n3/W3を算出する。これにより、第3ページP3において「その他芸能」というカテゴリが占める割合(本実施形態では18%)が算出される。その他の各カテゴリも同様に各々ページ単位カテゴリ占有率が算出される。ここで算出されたページ単位カテゴリ占有率の集まりを、図6に示すように「ページ単位カテゴリ占有率群C3」とする。
【0055】
前記目次生成部160は、前記カテゴリ設定部140により第1のカテゴリ設定において設定された雑誌全体の複数のカテゴリを使用して電子書籍の目次を生成する。
【0056】
具体的に説明すると、例えば、カテゴリ設定部140により第1のカテゴリ設定において「ジャニーズ」「音楽」「映画」「関西」・・・のカテゴリが設定された場合、図7(a)に示すように、目次生成部160はそれらの各カテゴリを使用して目次161を生成する。
【0057】
また、目次生成部160は、カテゴリ占有率算出部150により第1のカテゴリ占有率の算出において算出されたカテゴリ占有率が所定の割合以上である該カテゴリを使用して電子書籍の目次を生成する。例えば、「目次生成部160は、5%以上の各カテゴリ占有率を有するカテゴリに基づいて目次を生成する」というように設定されている場合、この条件を満たすカテゴリのみを目次に表示する。
【0058】
また、目次生成部160は、カテゴリ占有率算出部150により第1のカテゴリ占有率の算出において算出された各カテゴリ占有率に基づいて、カテゴリ占有率の高いカテゴリから優先させる態様で見出しを表示する。例えば、目次生成部160は、図7(a)に示すように、「ジャニーズ」、「音楽」、「映画」、「関西」・・・の順でカテゴリ占有率が高い順に上から見出しを表示する。
【0059】
また、目次生成部160は、各カテゴリを示す見出しの近傍に、カテゴリ占有率算出部150により第1のカテゴリ占有率の算出において算出されたカテゴリ占有率の各々を付している。例えば、目次生成部160は、図7(a)に示すように、「ジャニーズ」の右側には26%、「音楽」の右側には18%、「映画」の右側には14%、「関西」の右側には9%・・・というように、各カテゴリのカテゴリ占有率を付している。これによれば、雑誌全体に対する各カテゴリの割合(カテゴリ占有率)に基づいた目次161を生成することより、ユーザは目次161より雑誌全体に対する各カテゴリの割合を容易に把握することができるため、所望の記事がどれほどの割合で記載されているかを把握することが可能になる。その他に図示して説明しないが、目次生成部160は、カテゴリを示す見出しの近傍に、各カテゴリが設定された名詞を付してもよい。
【0060】
また、目次生成部160は、カテゴリ占有率算出部150により第2のカテゴリ占有率の算出において算出された各ページ単位カテゴリ占有率が所定の割合以上であるページの番号を表示する。例えば、「目次生成部160は、5%以上のページ単位カテゴリ占有率を有するカテゴリのページ番号を表示する」というように設定されている場合、この条件を満たすページ番号を目次に表示する。この場合、仮にカテゴリ「ジャニーズ」に着目すると、第1ページP1におけるカテゴリ「ジャニーズ」のページ単位カテゴリ占有率が18%、第2ページP2におけるカテゴリ「ジャニーズ」のページ単位カテゴリ占有率が33%であり、いずれも5%を超えているため、図7(a)に示すようにカテゴリ「ジャニーズ」の見出しの下にそれらのページ番号が表示される。
【0061】
また、目次生成部160は、カテゴリ占有率算出部150により第2のカテゴリ占有率の算出において算出された各ページ単位カテゴリ占有率に基づいて、ページ単位カテゴリ占有率の高いページ番号を優先的に整列させて表示している。例えば、目次生成部160は、図7(a)に示すように、カテゴリ「ジャニーズ」を示す見出しの下において、該カテゴリのページ単位カテゴリ占有率の高いページ番号を左から右に向かって順に「P2」、「P5」、「P12」、「P1」…というように整列させて表示する。これにより、ユーザは興味のある分野に関する記事が特にどのページに優先的に掲載されているかを容易に把握することができる。
【0062】
さらに、目次生成部160は、各カテゴリを示す見出しやページ番号を選択可能に構成して、ユーザがタッチパネル部21より選択した場合、所定のページや表示画面に移動させるように目次161を構成してもよい。例えば、ユーザにカテゴリ「ジャニーズ」の見出しが選択された場合、図7(b)に示すようなページ162に移動する。このページ162には、カテゴリ「ジャニーズ」が設定された名詞が記載されている各記事のタイトルが表示されている。ここにおいては、一番上方に『Page:P2 タイトル「マッチ誕生日」』という文字列とその横に「読む」という選択ボタン162aとからなる選択肢が表示されており、「読む」という選択ボタン162aをユーザが選択することにより、当該選択ボタン162aに該当する記事が記載されるページに移動する。ここにおける「タイトル」とは、雑誌の記事のタイトルのことである。なお、その他の選択肢も同様のため説明は省略する。
【0063】
なお、目次生成部160は、生成した目次をコンテンツデータに付した「目次付のコンテンツデータ」としてコンテンツ送信部170に送信する。
【0064】
前記コンテンツ送信部170は、目次生成部160から送信された目次付のコンテンツデータを受信すると、販売サーバ10にコンテンツ要求信号を送信したタブレット端末20に、インターネット30を介して送信する。
【0065】
次に、本装置100を含む閲覧システム1の動作について説明する。なお、販売サーバ10、タブレット端末20、本装置100における動作の詳細については上記したため省略する。
【0066】
まず、ユーザの操作によってタブレット端末20は、電子書籍用のコンテンツ要求信号を送信する(ステップS101。以下「ステップ」省略)。
【0067】
販売サーバ10は、タブレット端末20から送信されたコンテンツ要求信号を受信する(S102)。
【0068】
また、販売サーバ10は、コンテンツ要求信号に応じて、コンテンツデータを送信する(S103)。
【0069】
本装置100におけるコンテンツ受信部120は、販売サーバ10から送信されたコンテンツデータを受信する(S104)。その後、コンテンツ受信部120は、受信したコンテンツデータを単語抽出部130に送信する。
【0070】
本装置100における単語抽出部130は、コンテンツデータに含まれるコンテンツデータから名詞のみを抽出する(S105)。ここにおいて、単語抽出部130は、雑誌のコンテンツデータ全体を1単位とする第1の名詞抽出と、雑誌のコンテンツデータの一ページを1単位とする第2の名詞抽出とのいずれも実行する。
【0071】
本装置100におけるカテゴリ設定部140は、単語抽出部130よる第1の名詞抽出により抽出された各名詞群に基づいて第1のカテゴリ設定を実行するとともに、第2の名詞抽出により抽出された各名詞群に基づいて第2のカテゴリ設定を実行する(S106)。
【0072】
本装置100におけるカテゴリ占有率算出部150は、カテゴリ設定部140による第1のカテゴリ設定に基づいて第1のカテゴリ占有率を算出するとともに、第2のカテゴリ設定に基づいて第2のカテゴリ占有率を算出する(S107)。
【0073】
本装置100における目次生成部160は、カテゴリ占有率算出部150による第1および第2のカテゴリ占有率に基づいて目次を生成する(S108)。このとき、目次生成部160は、第1および第2のカテゴリ占有率が所定の割合以上であるカテゴリに基づいて目次を生成するとともに、第1および第2のカテゴリ占有率の高いカテゴリが優先される態様で目次を生成する(図7(a)参照)。
【0074】
本装置100におけるコンテンツ送信部170は、目次生成部160により生成された目次付のコンテンツデータを販売サーバ10にコンテンツ要求信号を送信したタブレット端末20に送信する(S109)。
【0075】
タブレット端末20は、本装置100から送信された目次付のコンテンツデータを受信する(S110)。
【0076】
上記のように閲覧システム1における各構成が動作することにより、タブレット端末20のユーザは専用のアプリケーションソフトウェアを起動させると、該目次付のコンテンツデータによる電子書籍を閲覧することができる。
【0077】
なお、上記の実施形態において、所定の単語として名詞を用いる場合について説明したが、名詞以外の品詞でもよい。
【0078】
また、カテゴリ記憶部110に記憶されている所定の名詞とそのカテゴリは、適宜変更することができるものとしてよい。これにより、時代や流行に応じて生まれる新語や流行語などにも対応することができる。
【0079】
また、カテゴリ占有率は、第1のカテゴリ占有率の算出と第2のカテゴリ占有率の算出とに分けて算出したが、その他の方法で算出してもよい。要は、コンテンツデータに含まれるコンテンツデータの全ページあるいは各ページの全名詞(単語)の個数に対して、カテゴリの名詞(単語)の個数が占める割合を算出するものであればよい。なお、カテゴリ占有率を算出しない場合には、カテゴリ占有率算出部を備えなくてもよい。
【0080】
また、所定の割合以上のカテゴリ占有率であるカテゴリを使用して目次を生成する場合について説明したが、全てのカテゴリを使用して目次を生成するようにしなくてもよい。
【0081】
また、目次生成部160の生成する目次には、カテゴリ占有率やページ番号を表示したが、それらを全てあるいは一部表示しなくてもよい。
【0082】
また、目次のカテゴリが多数にのぼる場合、カテゴリを別途検索できるようにしてもよい。このとき異なるカテゴリを複数掛け合わせることにより、ユーザはさらに興味のある分野に関する記事を閲覧することができる。
【0083】
また、雑誌のコンテンツデータの目次を生成する場合について説明したが、新聞、単行本、論文、参考書などの印刷物(紙媒体)に基づく電子書籍用のコンテンツデータであれば如何なるものでもよい。
【0084】
また、ユーザがタブレット端末(iPad)20を用いて電子書籍を閲覧する場合について説明したが、デスクトップ型のパソコンやノート型のパソコンなどの端末機器でもよい。
【0085】
以上、図面を参照してこの発明の実施形態を説明したが、この発明は、図示した実施形態のものに限定されない。図示された実施形態に対して、この発明と同一の範囲内において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
【符号の説明】
【0086】
1…電子書籍閲覧システム
10…販売サーバ10
20…タブレット端末
21…表示・受付部(タッチパネル部)
30…インターネット
100…電子書籍用目次生成装置(本装置)
110…カテゴリ記憶部
120…コンテンツ受信部
130…単語抽出部
140…カテゴリ設定部
150…カテゴリ占有率算出部
160…目次生成部
170…コンテンツ送信部

【特許請求の範囲】
【請求項1】
電子書籍のコンテンツデータに基づいて電子書籍の目次を生成する電子書籍用目次生成システムであって、
一般ユーザの興味のある分野に即した複数のカテゴリと、各カテゴリに関連付けられた一ないし複数の所定の単語とから構成されるカテゴリ表を予め記憶しているカテゴリ記憶手段と、
電子書籍のコンテンツデータから単語を抽出する単語抽出手段と、
前記カテゴリ記憶手段のカテゴリ表を参照することにより、前記単語抽出手段により抽出された単語に基づいて複数のカテゴリを設定するカテゴリ設定手段と、
前記カテゴリ設定手段により設定された複数のカテゴリを使用して電子書籍の目次を生成する目次生成手段とを備えることを特徴とする電子書籍用目次生成システム。
【請求項2】
前記単語抽出手段により抽出された全単語の個数に対して、前記カテゴリ設定手段により設定されたカテゴリの単語の個数が占める割合を該カテゴリの占有率として算出するカテゴリ占有率算出手段を備える請求項1に記載の電子書籍用目次生成システム。
【請求項3】
前記カテゴリ占有率算出手段は、前記単語抽出手段により抽出された全ページの全単語の個数に対して、前記カテゴリ設定手段により全ページに設定されたカテゴリの単語の個数が占める割合を全ページにおける該カテゴリの占有率として算出する請求項2に記載の電子書籍用目次生成システム。
【請求項4】
前記目次生成手段は、前記カテゴリ占有率算出手段により算出された全ページにおけるカテゴリの占有率が所定の割合以上である該カテゴリを使用して電子書籍の目次を生成する請求項3に記載の電子書籍用目次生成システム。
【請求項5】
前記目次生成手段は、前記カテゴリ占有率算出手段により算出された全ページにおけるカテゴリの占有率の高い該カテゴリが優先される態様で電子書籍の目次を生成する請求項3または請求項4に記載の電子書籍用目次生成システム。
【請求項6】
前記カテゴリ占有率算出手段は、コンテンツデータの各ページについて、前記単語抽出手段により抽出された該ページの全単語の個数に対して、前記カテゴリ設定手段により該ページに設定されたカテゴリの単語の個数が占める割合を該ページにおける該カテゴリの占有率として算出する請求項2に記載の電子書籍用目次生成システム。
【請求項7】
前記目次生成手段は、前記カテゴリ占有率算出手段により算出された前記ページにおけるカテゴリの占有率が所定の割合以上であるページの番号を表示させる請求項6に記載の電子書籍用目次生成システム。
【請求項8】
前記目次生成手段は、前記カテゴリ占有率算出手段により算出された前記ページにおけるカテゴリの占有率の高いページの番号を優先して表示させる請求項6または請求項7に記載の電子書籍用目次生成システム。





【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−181747(P2012−181747A)
【公開日】平成24年9月20日(2012.9.20)
【国際特許分類】
【出願番号】特願2011−45172(P2011−45172)
【出願日】平成23年3月2日(2011.3.2)
【出願人】(506378865)Jetrunテクノロジ株式会社 (2)
【Fターム(参考)】