説明

Webページ閲覧装置およびプログラム

【課題】ハイパーリンクのリンク先へジャンプしてそのWebページを開く必要なく、ユーザ所望のWebページにリンクするリンクテキストを容易に見つけることが可能になるWebページ閲覧装置を提供する。
【解決手段】現在表示中のWebページのハイパーテキストにおける任意のリンクテキストLtxtnに選択的にフォーカスを当てると、当該リンクテキストLtxtnに対応するリンク先URLに従い、そのリンク先Webページのハイパーテキストが取得されると共に、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素がリストアップされる。そして、前記リンク先Webページのハイパーテキストにおける、前記リンクテキストLtxtnと同一の文字列を有するタグ要素に基づき、それ以降のタグ要素に含まれる本文テキストHtxtが抽出され、その読み上げ音声が音声合成されて出力される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所望のWebページを閲覧するためのWebページ閲覧装置およびプログラムに関する。
【背景技術】
【0002】
従来から、LAN(Local Area Network)やWAN(Wide Area Network)、インターネットなど、通信ネットワークにおけるサーバ・クライアント・システムでは、クライアント装置が備えるWebブラウザにより、サーバ装置が生成保存している種々のWebページを取得表示して閲覧することが行われる。
【0003】
一般に、Webページは、HTML(Hyper Text Markup Language)のソースコードにより記述されており、そのドキュメント構造をWebブラウザが解析して表示するものである。
【0004】
このWebページには、ハイパーテキストとして、記述されたテキストを見出しとし、当該テキストの内容に対応する他のページへ遷移するためのハイパーリンクが設定されたテキスト部分(リンクテキスト)が複数箇所存在することが多い。
【0005】
ユーザが、前記ハイパーテキストのリンクテキストにフォーカスして決定操作することにより、そのリンク先のURLへアクセスされて対応するWebページが取得され、画面展開され表示されるものである。
【0006】
この際、前記Webページ上でユーザがフォーカスするリンクテキストは、あくまで見出しであり、その内容の詳細はリンク先のWebページが取得され画面展開されないと把握できないので、ユーザが所望のリンク先のWebページを開くまでに、幾つかの必要としないリンク先のWebページを開いてしまうことが多々ある。
【0007】
この場合、リンク先のWebページが取得され画面展開される都度、その画面展開(レンダリング)の処理に時間が掛かり、しかも画面展開されたWebページの内容を見て、ユーザ所望のリンク先であったかを判断するので、元のWebページに戻ったり、別のリンクテキストにフォーカスして新たなWebページを開いたりする繰り返し操作が多くなる。このため、特に高速にレンダリング処理できない携帯端末のWebブラウザにおいては、所望のリンク先のWebページを見つけて開くまでに、無駄な待ち時間を要してしまう。
【0008】
一方で、Webページのハイパーテキストを音声合成して読み上げたり、当該ハイパーテキストに設定されたリンクテキストのみを順次音声合成して読み上げたりするのに伴い、リンク先へのジャンプを指示するユーザ操作が行われると、その読み上げ位置に応じてフォーカスされているリンクテキストのリンク先Webページへジャンプする機能を備えたハイパーテキスト制御装置が考えられている(例えば、特許文献1参照。)。
【特許文献1】特開平10−078952号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
前記従来のハイパーテキスト制御装置では、ハイパーテキストを、ユーザが読まずしてその読み上げ音声を聞くことにより知ることができ、任意のテキスト読み上げ位置でのジャンプ指示により、関連のあるリンク先Webページへジャンプすることが可能である。しかしながら、リンク先のWebページがユーザ所望の内容であるか否かは、当該リンク先Webページが画面展開されてそれを確認するか、同リンク先Webページのハイパーテキスト先頭からの読み上げ音声を全て聞いていないと判断できない。このため、結局は各リンクテキストにフォーカスしてリンク先Webページを開く処理と元のWebページへ戻る処理とを所望のリンク先Webページが見つかるまで繰り返すことになり、ユーザの手間が多く時間的効率も悪い問題がある。
【0010】
本発明は、このような課題に鑑みなされたもので、Webページを閲覧する際に、ハイパーリンクのリンク先へジャンプしてそのWebページを開く必要なく、ユーザ所望のWebページにリンクするリンクテキストを容易に見つけることが可能になるWebページ閲覧装置およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
請求項1に記載のWebページ閲覧装置は、Webページの情報を受信するWebページ受信手段と、このWebページ受信手段により受信されたWebページの情報を画面展開して表示するWebページ表示手段と、このWebページ表示手段により表示されたWebページの情報の中で、ユーザ操作に応じて選択されたリンクテキストを記憶するリンクテキスト記憶手段と、前記Webページ受信手段により受信されたWebページの情報に基づき、前記ユーザ操作に応じて選択されたリンクテキストに対応するリンク先のWebページの情報を取得するリンク先Webページ取得手段と、このリンク先Webページ取得手段により取得されたリンク先のWebページの情報の中から、前記リンクテキスト記憶手段により記憶されたリンクテキストと同一あるいは類似の文字列を含む要素を抽出するリンク先対応要素抽出手段と、このリンク先対応要素抽出手段により抽出された前記リンクテキストと同一あるいは類似の文字列を含む要素以降の要素に含まれる本文テキストを抽出する本文テキスト抽出手段と、この本文テキスト抽出手段により抽出された本文テキストの読み上げ音声を出力する音声出力手段と、を備えたことを特徴としている。
【0012】
請求項2に記載のWebページ閲覧装置は、前記請求項1に記載のWebページ閲覧装置において、前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む複数の要素が抽出された場合に、当該複数の要素にそれぞれ含まれる文字列のうちで最も強い文字列を含む要素を抽出するリンク先最強要素抽出手段を備え、前記本文テキスト抽出手段は、前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む要素が1つだけ抽出された場合には、当該1つだけ抽出された要素以降の要素に含まれる本文テキストを抽出し、前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む複数の要素が抽出された場合には、前記リンク先最強要素抽出手段により抽出された最も強い文字列を含む要素以降の要素に含まれる本文テキストを抽出する、ことを特徴としている。
【0013】
請求項3に記載のWebページ閲覧装置は、前記請求項1または請求項2に記載のWebページ閲覧装置において、前記本文テキスト抽出手段は、予め設定された個数以上の読点を含み且つ予め設定された字数以上の長さを有するテキスト情報を本文テキストとして判断する本文テキスト判断手段を有する、ことを特徴としている。
【0014】
請求項4に記載のプログラムは、表示部と音声出力部を備えた電子装置のコンピュータを制御するためのプログラムであって、前記コンピュータを、Webページの情報を受信するWebページ受信手段、このWebページ受信手段により受信されたWebページの情報を画面展開して前記表示部に表示させるWebページ表示制御手段、このWebページ表示制御手段により表示されたWebページの情報の中で、ユーザ操作に応じて選択されたリンクテキストをメモリに記憶するリンクテキスト記憶手段、前記Webページ受信手段により受信されたWebページの情報に基づき、前記ユーザ操作に応じて選択されたリンクテキストに対応するリンク先のWebページの情報を取得するリンク先Webページ取得手段、このリンク先Webページ取得手段により取得されたリンク先のWebページの情報の中から、前記リンクテキスト記憶手段により記憶されたリンクテキストと同一あるいは類似の文字列を含む要素を抽出するリンク先対応要素抽出手段、このリンク先対応要素抽出手段により抽出された前記リンクテキストと同一あるいは類似の文字列を含む要素以降の要素に含まれる本文テキストを抽出する本文テキスト抽出手段、この本文テキスト抽出手段により抽出された本文テキストの読み上げ音声を前記音声出力部により出力させる音声出力制御手段、として機能させることを特徴としている。
【発明の効果】
【0015】
本発明によれば、Webページを閲覧する際に、ハイパーリンクのリンク先へジャンプしてそのWebページを開く必要なく、ユーザ所望のWebページにリンクするリンクテキストを容易に見つけることが可能になるWebコンテンツ閲覧装置およびプログラムを提供できる。
【発明を実施するための最良の形態】
【0016】
以下図面により本発明の実施の形態について説明する。
【0017】
図1は、本発明のWebページ閲覧装置の実施形態に係るサーバ・クライアント・システムの構成を示すブロック図である。
【0018】
このサーバ・クライアント・システムは、インターネット、WAN、LANなどからなるネットワークN上に接続された複数のサーバ装置10,…および複数のクライアント装置20,…を備える。
【0019】
サーバ装置10は、Webコンテンツ生成処理プログラム,登録ユーザ管理処理プログラム,Webページ配信処理プログラムなど、当該サーバ装置10の本体操作により機能する複数のアプリケーションプログラムを有し、例えば本サーバ装置10にユーザ登録されたクライアント装置20,…からの指定のWebサイトへのアクセス要求に応じて当該要求されたWebサイトにおけるWebコンテンツ15aのページを各クライアント装置20,…へ配信する。
【0020】
クライアント装置20,…は、携帯電話,PDA(Personal Digital Assistant),PCなどからなり、インターネット接続処理プログラム、Webブラウザプログラム23a,Web印刷プログラムなど、当該端末装置20の本体操作により機能する複数のアプリケーションプログラムを有する。そして、例えば所望のWebサイト[http://www.sight_a.co.jp/]のサーバ装置(A)10にアクセスしてそのWebコンテンツA15aを取得し、当該WebコンテンツA15aのHTML(Hyper Text Markup Language)のタグ要素から成るツリー構造を解析してWebページとして画面展開し表示したり印刷したりする。
【0021】
図2は、前記サーバ・クライアント・システムにおけるサーバ装置10の回路構成を示すブロック図である。
【0022】
サーバ装置10は、コンピュータとしてのCPU11を備え、このCPU11には、バス12を介してROM13、RAM14、外付けハードディスクなどの外部記憶装置15が接続される。
【0023】
また、CPU11には、バス12を介してキーボード,マウスなどの入力装置16、LCD(Liquid Crystal Display)などの表示装置17、クライアント装置20,…との通信I/F(インターフェイス)18が接続される。
【0024】
CPU11は、ROM13に予め記憶されているシステムプログラムや種々のアプリケーションプログラムに従ってRAM14を作業用メモリとし回路各部の動作を制御するもので、入力装置16からのキー入力信号や通信I/F18を介して受信されるクライアント装置20からのユーザ操作に応じたWebコンテンツ取得要求信号などに応じて前記種々のプログラムが起動・実行される。
【0025】
前記Webコンテンツ15aは、例えば外部記憶装置15に適宜更新生成されて記憶されている。
【0026】
図3は、前記サーバ・クライアント・システムにおけるクライアント装置20の回路構成を示すブロック図である。
【0027】
クライアント装置20は、コンピュータとしてのCPU21を備え、このCPU21には、バス22を介してROM23、RAM24、メモリカードや光ディスク読み書き部などの外部記憶装置25が接続される。
【0028】
また、CPU21には、バス22を介してキーボード,マウスなどの入力装置26、LCDからなる表示装置27、前記サーバ装置10との通信I/F(インターフェイス)28、Webページなどに記述されているテキストデータを音声データに変換する音声合成処理部29a、音声データを出力する音声出力部29bおよびスピーカSPが接続される。
【0029】
CPU21は、ROM23に予め記憶されているシステムプログラムおよび種々のアプリケーションプログラムに従ってRAM24を作業用メモリとし回路各部の動作を制御するもので、入力装置27からの入力信号に応じて前記種々のアプリケーションプログラムが起動され実行される。
【0030】
前記サーバ装置10…をインターネット(N)上のWebサイト、前記クライアント装置20,…を前記Webサイトにアクセス可能なユーザ端末とした場合、ユーザ端末(20)からWebサイト(10)へのアクセス要求に応じて、当該Webサイト(10)においてHTMLにより記述生成されたWebコンテンツ15aがアクセス要求元のユーザ端末(20)へ配信され、そのWebブラウザプログラム23aによりWebページに展開されて表示装置27に表示される。
【0031】
このクライアント装置(ユーザ端末)20のWebブラウザプログラム23aは、ユーザ指定のWebサイトのサーバ装置10へのアクセスに伴い、そのWebコンテンツ15aを取得し、当該Webコンテンツ15bのHTMLのタグから成るツリー構造を解析して、WebページとしてRAM24内のフレームバッファFBに画面展開し表示する機能を有する。そして、表示中のWebページのハイパーテキストにおけるリンクテキストがフォーカスにより指示されると、リンク先のWebページのハイパーテキストから前記リンクテキストに対応する内容の本文テキストを抽出し、その読み上げ音声を音声合成して出力する機能を有する。
【0032】
そして、前記RAM24には、リンクテキスト類似要素メモリ24aおよび読み上げ対象テキストメモリ24bが備えられる。
【0033】
前記リンクテキスト類似要素メモリ24aには、前記リンク先Webページのハイパーテキストから前記リンクテキストと同一あるいは類似の文字列を含むタグ要素がリストアップされて記憶される。
【0034】
前記読み上げ対象テキストメモリ24bには、前記リンクテキストの類似文字列を含むタグ要素の中で最も強いスタイルの文字列を含むタグ要素が判断され、それ以降のタグ要素から、設定数以上の読点を有し且つ設定数以上の文字からなるテキストが、前記リンクテキストに対応する本文テキストとして抽出されて記憶される。
【0035】
このようなリンク先本文テキストの抽出・音声出力機能は、例えば前記Webブラウザプログラム23aにプラグインあるいはアドオンするプログラムにより実現される。
【0036】
図4は、前記クライアント装置20においてサーバ装置(A)10[http://www.sight.a.co.jp]から取得されたWebページPの画面表示例を示す図である。
【0037】
図5は、前記図4におけるWebページPを記述したHTMLソースPhtmを示す図である。
【0038】
図4に示すように、クライアント装置20の表示装置27に表示させたWebページPはハイパーテキストであり、タイトルT「今日の速報ニュース」で示される5項目の見出しが何れもリンクテキストLtxt1〜Ltxt5に設定されている。そして、当該各リンクテキストLtxt1〜Ltxt5は、図5に示すHTMLソースPhtmにおいて、何れも“A”で括られるタグ要素に記述され、リンク先WebページのURLが対応付けられている。
【0039】
例えば表示装置27に表示されたWebページPにおいて、3番目のリンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスすると、当該リンクテキストLtxt3を記述したHTMLソースPhtmから、破線aで囲んで示すように、リンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得される。
【0040】
図6は、前記図5におけるリンクテキストLtxt3のリンク先URLに対応するWebページLPのHTMLソースLPhtmを示す図である。
【0041】
図7は、前記図6におけるHTMLソースLPhtmにより記述されたリンク先WebページLPの画面表示例を示す図である。
【0042】
図6に示すように、リンク先WebページLPのHTMLソースLPhtmには、前記リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の見出しテキスト「首相、内閣支持率に注文」Mtxtを含んでいる“H1”で括られるタグ要素が存在する。
【0043】
そして、前記見出しテキスト「首相、内閣支持率に注文」Mtxtに対応する本文テキストHtxtは、当該見出しテキスト「首相、内閣支持率に注文」Mtxtを含むタグ要素“H1”以降のタグ要素“P”において、幾つもの読点を有する比較的長い文字列として記述されている。
【0044】
このため、リンク先WebページLPのHTMLソースLPhtmから、前記リンク元WbページPにてフォーカスしたリンクテキストLtxtnに対応する本文テキストHtxtを抽出するには、当該リンクテキストLtxtnと同一(あるいは類似)の見出しテキストMtxtを含んでいるタグ要素“H1”を検索し、これ以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。
【0045】
図8は、リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の画面表示例を示す図である。
【0046】
このような、リンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の場合には、当該リンクテキストLtxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2から、最も「強い」文字列(フォントサイズ・フォントスタイル)からなる見出しテキストMtxt2を判断する。そして、この最も「強い」文字列からなる見出しテキストMtxt2を含んでいるタグ要素“H1”以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。
【0047】
次に、前記構成のクライアント装置20におけるWebページ閲覧機能について説明する。
【0048】
図9は、前記クライアント装置20によるWebページの閲覧に伴いリンク先Webページの本文テキストを取得してその読み上げ音声を出力するための読み上げ対象テキスト取得処理を示すフローチャートである。
【0049】
例えばサーバ装置(A)10のWebサイト[http://www.sight_a.co.jp/]から取得されたユーザ所望のWebコンテンツ(A)15aのページP(図4参照)が表示装置27に表示されると、図9における読み上げ対象テキスト取得処理が起動され、先ず、RAM24b内の読み上げ対象テキストメモリ24bの内容が初期化によりクリアされる(ステップS1)。
【0050】
そして、この表示中のWebページPにおいて、所望のリンクテキスト(例えば「首相、内閣支持率に注文」Ltxt3)にフォーカスが移動されると、当該フォーカスの当たっているリンクテキストLtxt3がRAM24に記憶される(ステップS2)。
【0051】
すると、前記表示中のWebページPのHTMLソースPhtm(図5参照)から、前記フォーカスされたリンクテキストLtxt3に対応するリンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得され、当該リンク先のHTMLソースLPhtm(図6参照)が取得される(ステップS3)。
【0052】
すると、前記取得されたリンク先WebページのHTMLソースLPhtmから、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むタグ要素を検索してリストアップする処理が、次の図10のフローチャートに従い実行される。
【0053】
図10は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴うリンクテキストと同じ文字列を含む要素のリストアップ処理を示すフローチャートである。
【0054】
このリストアップ処理が起動されると、RAM24内のリンクテキスト類似要素メモリ24aが初期化によりクリアされ(ステップA1)、前記ステップS3にて取得されたリンク先WebページのHTMLソースLPhtm(図6参照)において、テキストの記述を含むタグ要素が存在するか否か、当該HTMLソースLPhtmの先頭から各タグ要素毎に判断される(ステップA2)。
【0055】
ここで、テキストの記述を含むタグ要素が存在すると判断された場合には(ステップA2(yes))、当該タグ要素に含まれるテキストが、前記ステップS2にて記憶されたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むか否か判断される(ステップA3)。
【0056】
そして、図6におけるリンク先WebページのHTMLソースLPhtmの“H1”で括られるタグ要素において、リンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキスト「首相、内閣支持率に注文」Mtxt)を含んでいると判断されると(ステップA3(yes))、このタグ要素“H1”がRAM24内のリンクテキスト類似要素メモリ24aに登録される(ステップA4)。
【0057】
前記ステップA2において、テキストの記述を含まないタグ要素と判断された場合(ステップA2(no))、又は前記ステップA3において、テキストの記述を含んでいても前記リンクテキストLtxt3と同一(あるいは類似)の文字列を含まないと判断された場合(ステップA3(no))、又は前記ステップA4においてリンクテキストLtxt3と同一(あるいは類似)の文字列を含むタグ要素が登録されると、当該各ステップにおいて処理対象となったタグ要素がリンク先WebページのHTMLソースLPhtmにおける最後のタグ要素であるか否か判断される(ステップA5)。
【0058】
ここで、リンク先WebページのHTMLソースLPhtmにおける最後のタグ要素でないと判断された場合には(ステップA5(no))、次のタグ要素を処理対象として前記ステップA2以降の処理が繰り返される(ステップA6→A2)。
【0059】
こうした図10におけるリストアップ処理に基づき(ステップSA)、1以上のタグ要素がリストアップされたと判断されると(ステップS4(yes))、当該リストアップされたタグ要素は1つのみか否か判断される(ステップS5)。
【0060】
ここで、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含むタグ要素が1つのみでなく複数リストアップされたと判断された場合には(ステップS5(no))、当該リストアップされた複数のタグ要素にそれぞれ含まれる文字列のうち、最も「強い」文字列(フォントサイズ・フォントスタイル)を、リンク先Webページの本文テキストHtxtの直前に位置する文字列として抽出するための、図11における文字列の「強さ」の比較処理に移行される(ステップSB)。
【0061】
一方、前記図6で示したように、「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキストMtxt)を含むタグ要素が、“H1”の1つのみであると判断された場合には(ステップS5(yes))、当該1つのタグ要素“H1”に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。
【0062】
図11は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理を示すフローチャートである。
【0063】
前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したように、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含むタグ要素が複数リストアップされたWebページLP′である場合(ステップS5(no))、図11における文字列の「強さ」比較処理に移行され(ステップSB)、先ず比較対象のタグ要素を管理するための変数x,yが、それぞれx=2,y=1として初期化される(ステップB1)。
【0064】
また、変数zに、前記リストアップ処理(ステップSA)に従いRAM24内のリンクテキスト類似要素メモリ24aに登録されたタグ要素の数(図8で示すリンク先Webページの場合は“2”)が代入される(ステップB2)。
【0065】
すると、前記テキスト類似要素メモリ24aに登録されたリスト上のx番目(x=2)のタグ要素に記述された文字列について、そのフォントサイズおよびフォントスタイルが取得される(ステップB3)。
【0066】
そして、前記リスト上x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが比較され(ステップB4)、等しいか否か判断される(ステップB5)。
【0067】
ここで、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しくないと判断され(ステップB5(no))、y番目(y=1)よりx番目(x=2)が大きいと判断された場合には(ステップB6(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。
【0068】
逆に、y番目(y=1)よりx番目(x=2)が小さいと判断された場合には(ステップB6(no))、当該変数yの値はそのまま維持される。
【0069】
一方、前記ステップB5において、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しいと判断された場合には(ステップB5(yes))、さらに当該x番目(x=2)のタグ要素の文字列のフォントスタイルSTxとy番目(y=1)のタグ要素の文字列のフォントスタイルSTyとが比較され(ステップB8)、x番目のフォントスタイルSTxのみボールドか(ステップB9)、またはy番目のフォントスタイルSTyのみボールドか(ステップB10)、または何れのフォントスタイルも同じであるか(ステップB10(no))が判断される。
【0070】
ここで、x番目(x=2)のタグ要素の文字列のフォントスタイルSTxのみボールドであると判断された場合には(ステップB9(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。
【0071】
逆に、y番目(y=1)のタグ要素の文字列のフォントスタイルSTyのみボールドであると判断された場合には(ステップB10(yes))、当該変数yの値はそのまま維持される。
【0072】
そして、前記フォントサイズSZが大きい方、または当該フォンサイズSZが等しくてもそのフォンスタイルSTがボールドである方の文字列を含むタグ要素の出現番号が変数yに設定されると、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されるまで(ステップB11
)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
【0073】
一方、x番目のタグ要素の文字列のフォントサイズSZxとy番目のタグ要素の文字列のフォントサイズSZyとが等しく(ステップB5(yes))、しかも何れのフォントスタイルSTx,STyも同じであると判断された場合には(ステップB10(no))、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の数に達したと判断されるまでは(ステップB13)、変数xの値が変数yに代入された後(ステップB14)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
【0074】
なお、前記ステップB13において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断された場合には(ステップB13(yes))、リンク先WebページのHTMLソースにおいて、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含む複数のタグ要素のうち、最も「強い」文字列含むタグ要素への絞り込みは不可としてエラー処理される(ステップB15)。
【0075】
そして、前記ステップB11において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されると(ステップB11(yes))、当該登録されたリスト上のy番目のタグ要素が、最も「強い」文字列を含むタグ要素として設定される(ステップB16)。
【0076】
すなわち、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したWebページLP′であって、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含む2つのタグ要素がリストアップされた場合には、フォントサイズSZの大きい方の見出しテキストMtxt2を含むy番目(y=2)のタグ要素が、最も「強い」文字列を含むタグ要素として設定される。
【0077】
こうした前記一連の文字列の「強さ」比較処理を経て、リンクテキストLtxtnと同一(あるいは類似)の最も「強い」文字列を含むタグ要素が抽出されたと判断されると(ステップS6(yes))、当該最も「強い」文字列を含むタグ要素に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。
【0078】
図12は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う本文テキストの抽出処理を示すフローチャートである。
【0079】
この本文テキスト抽出処理が起動されると、先ず、前記リンクテキストLtxtnに対応するリンク先URLに従い取得されたWebページのHTMLソースにおいて、前記ステップSAにてリストアップされたリンクテキストLtxtnと同一(あるいは類似)の文字列を含む1つのタグ要素の次のタグ要素か、または前記ステップSBにて抽出されたリンクテキストLtxtnと同一(あるいは類似)で且つ最も「強い」文字列を含むタグ要素の次のタグ要素に注目する(ステップC1)。
【0080】
そして、前記注目したタグ要素について、テキスト情報を含むタグ要素であるか否か判断される(ステップC2)。
【0081】
ここで、前記注目したタグ要素が、テキスト情報を含むタグ要素であると判断された場合には(ステップC2(yes))、当該テキスト情報は読点を設定個数Npunc以上含むか否か判断される(ステップC3)。
【0082】
そして、前記注目したタグ要素のテキスト情報が、読点を設定個数Npunc以上含むテキスト情報であると判断された場合には(ステップC3(yes))、さらに当該テキスト情報は設定文字数Mlen以上の長さであるか判断される(ステップC4)。
【0083】
そして、前記注目したタグ要素のテキスト情報が、設定文字数Mlen以上の長さであると判断された場合には(ステップC4(yes))、当該テキスト情報が前記リンクテキストLtxtnに対応するリンク先WebページLPの読み上げ対象の本文テキストHtxtであるとして設定される(ステップC5)。
【0084】
すると、前記リンクテキストLtxtnに対応するリンク先WebページLPの本文テキストHtxtが抽出されたと判断され(ステップS7(yes))、当該リンクテキストLtxtnと抽出された本文テキストHtxtとがそれぞれRAM24内の読み上げ対象テキストメモリ24bに記憶される(ステップS8)。そして、この読み上げ対象テキストメモリ24bに記憶されたリンクテキストLtxtnと本文テキストHtxtとが、前記音声合成処理部29aにより音声信号に変換され、音声出力部29bを介してスピーカSPから音声出力される。
【0085】
すなわち、前記図4で示したWebページPにおいて、リンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスを移動させると、当該リンクテキストtxt3に対応するリンク先WebページLPのハイパーテキスト(図6参照)から本文テキスト「政権発足を受け、…と冷静に受け止めた。」Htxtが抽出され、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と共にその読み上げ音声が出力される。これにより、リンクテキストLtxtからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。
【0086】
一方、現在注目しているタグ要素がテキスト情報を含んでいないと判断された場合(ステップC2(no))、またはテキスト情報を含んでいると判断されても、当該テキスト情報は設定個数Npunc以上の読点を含まないと判断された場合(ステップC3(no))、または当該テキスト情報が設定個数Npunc以上の読点を含んでいても、設定文字数Mlen以上の長さがないと判断された場合には(ステップC4(no))、注目中のタグ要素がリンク先WebページのHTMLソースにおける最後のタグ要素か否か判断される(ステップC6)。
【0087】
ここで、最後のタグ要素でないと判断された場合には(ステップC6(no))、次のタグ要素に注目し(ステップC7)、前記ステップC2以降の処理が繰り返される(ステップC7→C2)。
【0088】
そして、前記ステップC6において、最後のタグ要素であると判断された場合には(ステップC6(yes))、前記リンクテキストtxtnに対応するリンク先WebページLPのハイパーテキストから本文テキストとしてのテキスト情報は抽出されなかったと判断され(ステップS7(no))、エラー処理される。
【0089】
したがって、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、現在表示中のWebページのハイパーテキストにおける任意のリンクテキストLtxtnに、カーソル操作などによって選択的にフォーカスを当てると、当該リンクテキストLtxtnに対応するリンク先URLに従い、そのリンク先Webページのハイパーテキスト(HTMLソース)が取得されると共に、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素がリストアップされる。そして、前記リンク先Webページのハイパーテキスト(HTMLソース)における、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素に基づき、それ以降のタグ要素に含まれる本文テキストHtxtが抽出され、その読み上げ音声が音声合成されて出力される。このため、リンクテキストLtxtnからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。
【0090】
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンク先Webページのハイパーテキスト(HTMLソース)から、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数リストアップされた場合には、当該複数のタグ要素のうち、フォンサイズSZやフォントスタイルSTにおいて最も「強い」文字列を含むタグ要素が抽出され、この抽出されたタグ要素以降のタグ要素に含まれるテキスト情報から本文テキストHtxtが判断抽出され、その読み上げ音声が出力される。このため、リンク先Webページのハイパーテキスト(HTMLソース)に、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数存在していても、当該リンクテキストLtxtnに対応する本文テキストHtxtを含んでいるタグ要素を従えたタグ要素を確実に抽出できる。
【0091】
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素以降のタグ要素に含まれるテキスト情報を本文テキストHtxtとして判断抽出するには、当該テキスト情報が設定個数Npunc以上の読点を含み、且つ設定文字数Mlen以上の長さであるかを判断して抽出する。このため、リンクテキストLtxtnに対応する本文テキストHtxtを正しく抽出してその読み上げ音声を出力できる。
【0092】
なお、前記実施形態では、通常のサーバ・クライアント・システムにおけるクライアント装置20のWebブラウザ23aに対し前記Webページ閲覧機能を搭載して、表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合について説明した。これに対し、サーバベース・コンピューティング・システムにおけるシン・クライアント端末にて表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合には、当該シン・クライアント端末からの入力イベントによって起動するサーバ装置のWebブラウザに対し、前記同様のWebページ閲覧機能を搭載すればよい。
【0093】
なお、前記各実施形態において記載したWebページ閲覧装置による各処理の手法、すなわち、図9のフローチャートに示す読み上げ対象テキスト取得処理、図10のフローチャートに示す同読み上げ対象テキスト取得処理に伴うリンクテキストと同一文字列を含むタグ要素のリストアップ処理、図11のフローチャートに示す同読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理、図12のフローチャートに示す同読み上げ対象テキスト取得処理に伴う本文テキスト抽出処理などの各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フロッピディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記憶装置25(15)の媒体に格納して配布することができる。そして、Webページ閲覧装置のコンピュータ(CPU21(11))は、この外部記憶装置25(15)の媒体に記憶されたプログラムを記憶装置(フラッシュROM23(13)やRAM24(14))に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明したWebページ閲覧機能を実現し、前述した手法による同様の処理を実行することができる。
【0094】
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に接続されたコンピュータ装置(プログラムサーバ)から前記のプログラムデータを取り込んで記憶装置(フラッシュROM23(13)やRAM24(14))に記憶させ、前述したWebページ閲覧機能を実現することもできる。
【0095】
なお、本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
【図面の簡単な説明】
【0096】
【図1】本発明のWebページ閲覧装置の実施形態に係るサーバ・クライアント・システムの構成を示すブロック図。
【図2】前記サーバ・クライアント・システムにおけるサーバ装置10の回路構成を示すブロック図。
【図3】前記サーバ・クライアント・システムにおけるクライアント装置20の回路構成を示すブロック図。
【図4】前記クライアント装置20においてサーバ装置(A)10[http://www.sight.a.co.jp]から取得されたWebページPの画面表示例を示す図。
【図5】前記図4におけるWebページPを記述したHTMLソースPhtmを示す図。
【図6】前記図5におけるリンクテキストLtxt3のリンク先URLに対応するWebページLPのHTMLソースLPhtmを示す図。
【図7】前記図6におけるHTMLソースLPhtmにより記述されたリンク先WebページLPの画面表示例を示す図。
【図8】リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の画面表示例を示す図。
【図9】前記クライアント装置20によるWebページの閲覧に伴いリンク先Webページの本文テキストを取得してその読み上げ音声を出力するための読み上げ対象テキスト取得処理を示すフローチャート。
【図10】前記クライアント装置20の読み上げ対象テキスト取得処理に伴うリンクテキストと同じ文字列を含む要素のリストアップ処理を示すフローチャート。
【図11】前記クライアント装置20の読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理を示すフローチャート。
【図12】前記クライアント装置20の読み上げ対象テキスト取得処理に伴う本文テキストの抽出処理を示すフローチャート。
【符号の説明】
【0097】
10 …サーバ装置
20 …クライアント装置
11,21…CPU
12,22…バス
13,23…ROM
23a…Webブラウザプログラム
14,24…RAM
24a…リンクテキスト類似要素メモリ
24b…読み上げ対象テキストメモリ
15,25…外部記憶装置
15a…Webコンテンツ
16,26…入力装置
17,27…表示装置
18,28…通信I/F
29a…音声合成処理部
29b…音声出力部
SP …スピーカ
N …通信ネットワーク
FB …フレームバッファ
P …Webページ
Phtm…WebページのHTMLソース
LP …リンク先Webページ
LPhtm…リンク先WebページのHTMLソース
Ltxtn…リンクテキスト
Mtxt…見出しテキスト
Htxt…本文テキスト

【特許請求の範囲】
【請求項1】
Webページの情報を受信するWebページ受信手段と、
このWebページ受信手段により受信されたWebページの情報を画面展開して表示するWebページ表示手段と、
このWebページ表示手段により表示されたWebページの情報の中で、ユーザ操作に応じて選択されたリンクテキストを記憶するリンクテキスト記憶手段と、
前記Webページ受信手段により受信されたWebページの情報に基づき、前記ユーザ操作に応じて選択されたリンクテキストに対応するリンク先のWebページの情報を取得するリンク先Webページ取得手段と、
このリンク先Webページ取得手段により取得されたリンク先のWebページの情報の中から、前記リンクテキスト記憶手段により記憶されたリンクテキストと同一あるいは類似の文字列を含む要素を抽出するリンク先対応要素抽出手段と、
このリンク先対応要素抽出手段により抽出された前記リンクテキストと同一あるいは類似の文字列を含む要素以降の要素に含まれる本文テキストを抽出する本文テキスト抽出手段と、
この本文テキスト抽出手段により抽出された本文テキストの読み上げ音声を出力する音声出力手段と、
を備えたことを特徴とするWebページ閲覧装置。
【請求項2】
前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む複数の要素が抽出された場合に、当該複数の要素にそれぞれ含まれる文字列のうちで最も強い文字列を含む要素を抽出するリンク先最強要素抽出手段を備え、
前記本文テキスト抽出手段は、前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む要素が1つだけ抽出された場合には、当該1つだけ抽出された要素以降の要素に含まれる本文テキストを抽出し、前記リンク先対応要素抽出手段により前記リンクテキストと同一あるいは類似の文字列を含む複数の要素が抽出された場合には、前記リンク先最強要素抽出手段により抽出された最も強い文字列を含む要素以降の要素に含まれる本文テキストを抽出する、
ことを特徴とする請求項1に記載のWebページ閲覧装置。
【請求項3】
前記本文テキスト抽出手段は、予め設定された個数以上の読点を含み且つ予め設定された字数以上の長さを有するテキスト情報を本文テキストとして判断する本文テキスト判断手段を有する、
ことを特徴とする請求項1または請求項2に記載のWebページ閲覧装置。
【請求項4】
表示部と音声出力部を備えた電子装置のコンピュータを制御するためのプログラムであって、
前記コンピュータを、
Webページの情報を受信するWebページ受信手段、
このWebページ受信手段により受信されたWebページの情報を画面展開して前記表示部に表示させるWebページ表示制御手段、
このWebページ表示制御手段により表示されたWebページの情報の中で、ユーザ操作に応じて選択されたリンクテキストをメモリに記憶するリンクテキスト記憶手段、
前記Webページ受信手段により受信されたWebページの情報に基づき、前記ユーザ操作に応じて選択されたリンクテキストに対応するリンク先のWebページの情報を取得するリンク先Webページ取得手段、
このリンク先Webページ取得手段により取得されたリンク先のWebページの情報の中から、前記リンクテキスト記憶手段により記憶されたリンクテキストと同一あるいは類似の文字列を含む要素を抽出するリンク先対応要素抽出手段、
このリンク先対応要素抽出手段により抽出された前記リンクテキストと同一あるいは類似の文字列を含む要素以降の要素に含まれる本文テキストを抽出する本文テキスト抽出手段、
この本文テキスト抽出手段により抽出された本文テキストの読み上げ音声を前記音声出力部により出力させる音声出力制御手段、
として機能させるようにしたコンピュータ読み込み可能なプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2010−146381(P2010−146381A)
【公開日】平成22年7月1日(2010.7.1)
【国際特許分類】
【出願番号】特願2008−324227(P2008−324227)
【出願日】平成20年12月19日(2008.12.19)
【出願人】(000001443)カシオ計算機株式会社 (8,748)
【Fターム(参考)】