説明

情報検索装置および情報検索方法

【課題】ユーザが関心を持つ蓋然性の高い語句として、未だ必ずしも常識化せず目新しい
印象を与えると予測されるような語句をある程度乃至は完全に自動的に選出し、該選出し
た語句をキーワードとして設定し、インターネット検索エンジンによって関連情報のキー
ワード検索を行なう。
【解決手段】供給されるテキスト情報の入力をテキスト情報入力部101で受け、このテ
キスト情報に含まれる語句を語句識別部104で各個に識別し、該識別された語句を予め
準備されている語句データベース110と照合して当該語句の難易度を評価し該評価によ
る難易度が所定水準を上回る語句をキーワードの候補としてキーワード選別部104で選
別し、該選別されたキーワードの候補である語句のうちからユーザによって選択された語
句をキーワードとしてキーワードネット検索部107でインターネット検索を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、デジタルテレビジョン放送で受信される字幕放送その他に含まれる
語句の中からユーザが関心を持つ蓋然性の高い語句を抽出して、該抽出された語句をキー
ワードとしてインターネットを利用した検索を実行する情報検索装置および情報検索方法
に関する。
【背景技術】
【0002】
デジタルテレビジョン受像機でデジタルテレビジョン放送を受信し、或いはまた、パー
ソナルコンピュータを用いて種々のウェブサイトをブラウズするといった場合に、目に止
まる種々の語句のうちからユーザの関心を惹くような語句について、敢えてその意味を調
べたり、更には、その語句に関係する情報を収集して該当する分野に関する知識を広げた
いといった要請が生じることがある。
【0003】
周知のとおり、インターネットを通して種々の情報を収集するといったことは極めてよ
く普及しているが、それでも、この方法で世の中のトレンドを概観しようといった場合に
は相応の習熟を要することになる。
このような目的での調査のためにインターネットを活用する技術については、既にイン
ターネット検索装置としての提案がなされている。
【0004】
この提案は、世の中のトレンドを示すキーワードを、番組情報や文字放送などから自動
的に得て、それに関する更なる情報をインターネットから簡単に得ることができるインタ
ーネット検索装置を構成しようとするものであって、テキスト情報入力手段により番組情
報や文字放送などから取り込んでテキスト情報記憶手段に記憶してある情報から、単語切
り出し手段を用いて単語を切り出し、単語出現頻度計数手段でそれら単語の出現頻度を計
数してその出現頻度の高いキーワードの候補をリストアップし、該リストアップされたキ
ーワードの候補のうちからユーザが特定のものを検索キーとして指定し、この検索キーを
入力手段によりインターネットの検索エンジンを用いて検索を実行し、関連する情報の検
索を自動的に行うといったものである。
【0005】
テキスト情報の中から出現頻度の高いトレンド単語を自動的に抽出し、それを検索エン
ジンにかけることができ、入力されたテキスト情報において重要な意味合いを持つキーワ
ードについての詳細な関連情報を簡単に閲覧することができるとされている(特許文献1
)。
【特許文献1】特開平10−69496号公報(段落0002〜段落0005、図1)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1所載の技術では、出現頻度の低い語句がキーワードとして抽
出されることがなく、ユーザが関心を惹かれた語句がこのようなものである場合にはこの
技術は適合しないことになる。また、或る視点からすれば、ユーザが関心を持つ蓋然性の
高い語句というものは、トレンドになっているような言わば常識化してしまっているよう
な頻出語句ではなく、目新しい印象を与えるものであって、敢えてインターネットを通し
て広く且つ掘り下げた情報を得たいといったニーズはそのような語句についてこそ顕著で
あるとも言うことができる。
【0007】
一方、それでは、例えばデジタルテレビジョン放送の字幕放送におけるように多くの語
句が滔々と時系列で受信されるといった状況下で、ユーザが専ら自らの手作業によって逐
一関心を惹く語句の関連情報をインターネットで検索するといったことを考えると、これ
も余りに煩雑であり、且つ、見落しなくこのような語句の抽出を行なうことは実際には困
難である。
【0008】
本発明はこのような状況に鑑みてなされたものであり、ユーザが関心を持つ蓋然性の高
い語句として、未だ必ずしも常識化せず目新しい印象を与えると予測されるような語句を
ある程度乃至は完全に自動的に選出し、該選出した語句をキーワードとして設定し、関連
情報のキーワード検索を行なうことのできる情報検索装置および情報検索方法を提供する
ことを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するべく、本願では次に列記するような技術を提案する
(1)供給されるテキスト情報の入力を受けるテキスト情報入力部と、前記テキスト情報
入力部から入力されたテキスト情報に含まれる語句を各個に識別する語句識別部と、前記
語句識別部によって識別された語句を予め準備されている語句データベースと照合して当
該語句の難易度を評価し該評価による難易度が所定水準を上回る語句をキーワードの候補
として選別するキーワード選別部と、前記キーワード選別部によって選別されたキーワー
ドの候補である語句のうちからユーザによる所望の語句をキーワードとして選択する操作
を受付けるキーワード選択部と、前記キーワード選択部によってユーザに選択された語句
をキーワードとしてインターネットを利用した検索を実行するキーワードネット検索部と
、を備えていることを特徴とする情報検索装置。
【0010】
上記(1)の情報検索装置では、テキスト情報入力部によって、供給されるテキスト情
報の入力を受け、語句識別部によって、テキスト情報入力部から入力されたテキスト情報
に含まれる語句を各個に識別し、キーワード選別部によって、該識別された語句を予め準
備されている語句データベースと照合して当該語句の難易度を評価し該評価による難易度
が所定水準を上回る語句をキーワードの候補として選別し、キーワードネット検索部によ
って、該選別されたキーワードの候補である語句のうちからユーザによってキーワード選
択部を通して選択された語句をキーワードとしてインターネットを利用した検索を実行す
る。
【0011】
例えば、デジタルテレビジョン放送の字幕放送やデータ放送などを供給源として供給さ
れるテキスト情報から、インターネットを利用したキーワード検索のキーワードとする語
句の候補が自動的に抽出され、これらキーワードの候補のうちからユーザによって選択さ
れた語句をキーワードとして情報検索が実行される。ユーザから見て難易度の高い語句で
あるということは、未だ常識化せず目新しい印象を与える蓋然性の高い語句であるため、
それらがインターネット検索におけるキーワードの候補として抽出され、その中からユー
ザが選択した語句がキーワードとして設定されてインターネットを利用した検索が実行さ
れるため、ユーザの関心や意図をよく反映した情報検索が実行され得る。
【0012】
(2)供給されるテキスト情報の入力を受けるテキスト情報入力部と、前記テキスト情報
入力部から入力されたテキスト情報に含まれる語句を各個に識別する語句識別部と、前記
語句識別部によって識別された語句を予め準備されている語句データベースと照合して当
該語句の難易度を評価し該評価による難易度が所定水準を上回る語句をキーワードの候補
として選別するキーワード選別部と、前記キーワード選別部によって選別されたキーワー
ドの候補である語句のうちの一部または全部の語句をキーワードとしてそれぞれインター
ネットを利用した検索を自動的に実行するキーワードネット検索部と、を備えていること
を特徴とする情報検索装置。
【0013】
上記(2)の情報検索装置では、テキスト情報入力部によって、供給されるテキスト情
報の入力を受け、語句識別部によって、テキスト情報入力部から入力されたテキスト情報
に含まれる語句を各個に識別し、キーワード選別部によって、該識別された語句を予め準
備されている語句データベースと照合して当該語句の難易度を評価し該評価による難易度
が所定水準を上回る語句をキーワードの候補として選別し、キーワードネット検索部によ
って、該選別されたキーワードの候補である語句のうちの一部または全部の語句をキーワ
ードとしてそれぞれインターネットを利用した検索を自動的に実行する。
【0014】
例えば、デジタルテレビジョン放送の字幕放送やデータ放送などを供給源として供給さ
れるテキスト情報から、インターネットを利用したキーワード検索のキーワードとする語
句の候補が自動的に抽出され、それらキーワードの候補のうちの一部または全部の語句を
キーワードとしてインターネットを利用した検索が自動的に実行される。
未だ常識化せず目新しい印象を与える語句であってインターネット検索におけるキーワ
ードに相応しい難易度の高い語が、キーワードとして設定されて、インターネットを利用
した検索が実行されるため、ユーザの関心を惹く蓋然性の高い語句をキーワードとした情
報検索が略全自動で実行され得る。
【0015】
(3)前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデー
タと現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含
む情報を語句毎に対応して更新可能に保有する語句データベースを適用して、当該キーワ
ードの候補を選別するように構成されていることを特徴とする(1)または(2)の何れ
か一の情報検索装置。
【0016】
上記(3)の情報検索装置では、(1)または(2)の何れか一の情報検索装置による
作用において特に、キーワード選別部は、当該語句データベースとして、既定の難易度を
表すデータと現在時点以前にキーワードの候補として選別された回数を表すデータとの各
データ含む情報を語句毎に対応して更新可能に保有する語句データベースを適用して、当
該キーワードの候補を選別する。
過去にキーワードの候補として選別された履歴等も勘案して、出現頻度が低く、未だ常
識化せず目新しい印象を与える語句が敢えてインターネットによる検索のキーワードとし
て選出され易くなり、ユーザのニーズによく合致した情報検索が実行され得る。
【0017】
(4)前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデー
タと現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含
む情報を語句毎に対応して更新可能に保有する語句データベースを適用し、該語句データ
ベースに既登録の語句については当該登録に係る難易度を表すデータに依拠した難易度に
、該語句データベースに未登録の語句については高い難易度に、各該当する語句の難易度
を評価して、キーワードの候補を選別するように構成されていることを特徴とする(1)
または(2)の何れか一の情報検索装置。
【0018】
上記(4)の情報検索装置では、(1)または(2)の何れか一の情報検索装置による
作用において特に、キーワード選別部は、当該語句データベースとして、既定の難易度を
表すデータと現在時点以前にキーワードの候補として選別された回数を表すデータとの各
データ含む情報を語句毎に対応して更新可能に保有する語句データベースを適用して、該
語句データベースに既登録の語句については当該登録に係る難易度を表すデータに依拠し
た難易度に、該語句データベースに未登録の語句については高い難易度に、各該当する語
句の難易度を評価して、当該キーワードの候補を選別する。
【0019】
過去にキーワードの候補として選別された履歴等も勘案し、且つ、該語句データベース
に登録がない語句については高い難易度に、各該当する語句の難易度を評価するため、出
現頻度が低く、未だ常識化せず目新しい印象を与える語句が敢えてインターネットによる
検索のキーワードとして選出され易くなり、ユーザのニーズによく合致した情報検索が実
行され得る。
【0020】
(5)前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデー
タと現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含
む情報を語句毎に対応して更新可能に保有する語句データベースを適用し、該語句データ
ベースに既登録の語句については当該登録に係る難易度を表すデータに依拠した難易度に
、該語句データベースに未登録の語句については高い難易度に、各該当する語句の難易度
を評価して、キーワードの候補を選別すると共に、キーワードの候補として選別された回
数が所定の閾値に到った語句については前記語句データベースにおける難易度の階位を下
げるべくデータを更新するように構成されていることを特徴とする(1)または(2)の
何れか一の情報検索装置。
【0021】
上記(5)の情報検索装置では、(1)または(2)の何れか一の情報検索装置による
作用において特に、キーワード選別部は、当該語句データベースとして、既定の難易度を
表すデータと現在時点以前にキーワードの候補として選別された回数を表すデータとの各
データ含む情報を語句毎に対応して更新可能に保有する語句データベースを適用して、該
語句データベースに既登録の語句については当該登録に係る難易度を表すデータに依拠し
た難易度に、該語句データベースに未登録の語句については高い難易度に、各該当する語
句の難易度を評価して、当該キーワードの候補を選別するようにし、更に、キーワードの
候補として選別された回数が所定の閾値に到った語句については当該語句データベースに
おける難易度の階位を下げるべくデータを更新する。
【0022】
過去にキーワードの候補として選別された履歴等も勘案し、且つ、該語句データベース
に登録がない語句については高い難易度に、各該当する語句の難易度を評価するため、出
現頻度が低く、未だ常識化せず目新しい印象を与える語句が敢えてインターネットによる
検索のキーワードとして選出され易くなり、ユーザのニーズによく合致した情報検索が実
行され得る。更に、キーワードの候補として選別された回数が多くなった語句については
語句データベースにおける難易度の階位を下げるようにデータが更新されるため、一層的
確に難易度が評価され、従って、キーワード候補としての選出もより当を得たものとなる

【0023】
(6)前記テキスト情報入力部は、受信された字幕放送やデータ放送などに含まれるテキ
ストデータを周期的に記憶装置に供給して所定の記憶部に記憶させるように構成されてい
ることを特徴とする(1)〜(5)の何れか一の情報検索装置。
上記(6)の情報検索装置では、(1)〜(5)の何れか一の情報検索装置による作用
において特に、字幕放送やデータ放送などに含まれるテキストデータを検索のキーワード
候補選出の源としてキーワードの抽出が行なわれる。時間の経過に従って流れ移り変わる
ような情報源から適切にキーワード(その候補)を捕捉することができる。
【0024】
(7)受信された放送の映像データと音声データとを含む高周波データ変調信号のうちか
ら所望の特定周波数の信号を抽出してトランスポートストリームを出力するチューナ部と
、適用されたICカードから読取った鍵情報を用いて前記チューナ部の出力であるトラン
スポートストリームのスクランブルを解除してビデオトランスポートパケットおよびオー
ディオトランスポートパケットを得るデスクランブル部と、前記ビデオトランスポートパ
ケットおよびオーディオトランスポートパケットに対してデコード処理を施して映像デー
タおよび音声データを生成するAVデコーダ部と、前記AVデコーダ部の出力映像データ
に基づく表示を行なうと共にユーザインターフェースのための表示を行なう表示器と、を
更に備え、デジタルテレビジョン放送を受信可能に構成されていることを特徴とする(1
)〜(6)の何れか一の情報検索装置。
上記(7)の情報検索装置では、(1)〜(6)の何れか一の情報検索装置による作用
において特に、当該情報検索装置がデジタルテレビジョン受像機としても機能し、その中
で、上述のようなインターネットによる情報検索機能を発揮することが可能である。
【0025】
(8)供給されるテキスト情報の入力を受けて保持するステップと、前記入力されて保持
されたテキスト情報に含まれる語句を各個に識別するステップと、前記識別された語句を
予め準備されている語句データベースと照合して当該語句の難易度を評価し該評価による
難易度が所定水準を上回る語句をキーワードの候補として選別するステップと、前記選別
されたキーワードの候補である語句のうちのから選択された語句をキーワードとしてイン
ターネットを利用した検索を実行するステップと、を含むことを特徴とする情報検索方法

【0026】
上記(8)の情報検索方法では、供給されるテキスト情報の入力を受け、該テキスト情
報に含まれる語句を各個に識別し、該識別した語句を、予め準備されている語句データベ
ースと照合して当該語句の難易度を評価し該評価による難易度が所定水準を上回る語句を
キーワードの候補として選別し、該選別したキーワードの候補である語句のうちから選択
した語句をキーワードとして用いてインターネットを利用した検索を実行する。
【0027】
例えば、デジタルテレビジョン放送の字幕放送やデータ放送などを供給源として供給さ
れるテキスト情報から、インターネットを利用したキーワード検索のキーワードとする語
句の候補が抽出され、これらキーワードの候補のうちからユーザによって選択された語句
をキーワードとして情報検索が実行される。ユーザから見て難易度の高い語句であるとい
うことは、未だ常識化せず目新しい印象を与える蓋然性の高い語句であることを意味する
ため、それらがインターネット検索におけるキーワードの候補として抽出され、その中か
ら選択された語句がキーワードとして設定されてインターネットを利用した検索が実行さ
れるため、ユーザの関心や意図をよく反映した情報検索が実行され得る。
【発明を実施するための最良の形態】
【0028】
以下、本発明の実施の形態を図面を参照して説明する。尚、以下に参照する図において
は、便宜上、説明の主題となる要部は適宜誇張し、要部以外については適宜簡略化し乃至
省略されている。
図1は、本発明の実施の形態としての情報検索装置を表す概念図である。図1において
、例えば、デジタルテレビジョン放送の字幕放送やデータ放送などを供給源として供給さ
れるテキスト情報の入力を受けるテキスト情報入力部101が設けられ、このテキスト情
報入力部101で受けたテキスト情報は、テキスト情報記憶部102に一時的に格納され
る。
【0029】
この一時的な格納は、例えば、データ放送に含まれるテキストデータを周期的にテキス
ト情報記憶部102に供給して記憶するように実行され得る。
テキスト情報入力部101で受け、テキスト情報記憶部102に一旦保持されたテキス
ト情報は、該テキスト情報に含まれる語句を各個に識別する語句識別部103に供給され
、ここで個々の語句(単語、熟語、フレーズなど)に区分され、識別される状態に変換さ
れる。
【0030】
この語句識別部103によって識別された語句を、予め準備されている語句データベー
ス110と照合して当該語句の難易度を評価し、該評価による難易度が所定水準を上回る
語句をキーワードの候補として選別するキーワード選別部104が設けられ、このキーワ
ード選別部104によって選別されたキーワードの候補たる語句がキーワード一時記憶部
105に記憶されるように構成されている。
【0031】
更に、キーワード選別部104によって選別されキーワード一時記憶部105に記憶さ
れたキーワードの候補である語句のうちから特定の語句をキーワードとして設定するべく
ユーザが選択操作を行うためのキーワード選択部106(例えばリモコン)が設けられ、
このようにしてキーワードとして設定された語句も当該キーワードであることが識別可能
にキーワード一時記憶部105に保持される。
【0032】
上述のようにしてキーワードとして選択された語句、即ち、キーワード一時記憶部10
5にキーワードとして保持されている語句をキーワードとして、キーワードネット検索部
107がインターネット120を利用した検索を実行する。
キーワードネット検索部107は、インターネット120と接続可能であり、該インタ
ーネット120上の検索エンジン、あるいは、該キーワードネット検索部107に内蔵の
検索エンジンに、選択されたキーワードを入力して、インターネット検索を実行し、検索
結果を画面130に表示する機能を有している。このとき検索に利用する検索エンジンは
1つでも複数でもよい。
【0033】
尚、この実施の形態では、キーワード一時記憶部105に記憶されたキーワードの候補
である各語句を表示してユーザによるキーワード選択操作を画面を見ながら行うことを可
能にするために、また、キーワードとして選択した語句を表示しておくために、更には、
そのキーワードを用いて実行したキーワードネット検索部107による検索結果を表示す
るために、例えば液晶表示器のような表示画面を持つ表示部130が適用される。
【0034】
図2は、図1を参照して説明した語句データベース110に格納されているデータの構
造を表す概念図である。この語句データベース110には、既定の難易度を表すデータ(
この例では、降順に、A,B,C,D,Eの階位)と現在時点以前にキーワードの候補と
して選別された回数(図中、リストアップ回数と表記。詳細は後述)を表すデータとの各
データ含む情報を語句毎に対応して更新可能に保有されている。
【0035】
図3は、図1を参照して説明した情報検索装置の動作を表すフローチャートである。こ
の情報検索装置が起動すると、先ず、例えば、デジタルテレビジョン放送の字幕放送やデ
ータ放送などを供給源として供給されるテキスト情報がテキスト情報入力部101から読
み込まれ、テキスト情報記憶部102に一時的に格納される(ステップS301)。
テキスト情報記憶部102に一旦保持されたテキスト情報は、次いで、該テキスト情報
に含まれる語句を各個に識別する語句識別部103に供給され、ここで個々の語句(単語
、熟語、フレーズなど)に区分され、識別される状態に変換される(ステップS302)

【0036】
ステップS302で抽出された語句は、それらが語句データベース110(図では「D
B」と表記)に登録済みのものであるか否かが判定される(ステップS303)。
ステップS303で、当該語句が、語句データベース110に登録済みのものであると
判定されたときには(ステップS303:Yes)、次いで、その語句について語句デー
タベース110に登録されている現在時点での難易度が所定のランク(階位)以下である
か否かが判定される(ステップS304)。
【0037】
ステップS304で、その語句について語句データベース110に登録されている現在
時点での難易度が所定のランク(階位)以下であると判定されたときには(ステップS3
04:Yes)、更に、ステップS304での判定処理が、テキスト情報記憶部102に
一時的に格納されている全ての判定対象とされる語句について(即ち、最初の語句から終
りの語句まで)実行されたか否かが判定される(ステップS305)。
【0038】
この実施の形態においては、ステップS304での難易度の判定基準たる所定のランク
(階位)は、所要に応じてユーザが任意に設定することができるように構成されている。
ステップS305で、全ての語句について難易度のランク(階位)についての評価が行
なわれたと判定されたときには(ステップS305:Yes)、次のステップS306に
進み、未だ全ての語句については難易度のランク(階位)についての評価処理が実行され
ていないと判定されたときには(ステップS305:No)、ステップS302に戻って
、これ以降の処理が繰り返される。
【0039】
ステップS306では、後述するようにしてキーワードの候補としてキーワードリスト
にリストアップされる形でキーワード一時記憶部105に記憶された語句を表示部130
に表示する。このステップS306でのキーワードの候補である各語句の表示を見ながら
ユーザがキーワード選択部106から操作を行って特定の語句を情報検索のためのキーワ
ードとして設定する(ステップS307)。
【0040】
更に、ステップS307で選択的に設定された語句をキーワードとしてキーワードネッ
ト検索部107がインターネット120を利用した検索を実行して、その検索結果が表示
部130に表示される(ステップS308)。
既述のステップS304で、その語句について、語句データベース110に登録されて
いる現在時点での難易度が所定のランク(階位)を上回ると判定されたときには(ステッ
プS304:No)、更に、その語句が、キーワードリストに未だリストアップされてい
ないものであるか否かが判定される(ステップS311)。
【0041】
ここに、キーワードリストとは、キーワード一時記憶部105に設定され、インターネ
ットによる情報検索のためのキーワードの候補として列挙される語句を網羅的に記載した
リストであって、このキーワードリスト所載のキーワードの候補の中からユーザによって
選択された語句が当該キーワードとして上述の検索に利用されることになる。
ステップS311で、その語句が、キーワードリストに未だリストアップされていない
ものであると判定されたときには(ステップS311:Yes)、次のステップS312
に進み、一方、その語句が、キーワードリストに既にリストアップされているものである
と判定されたときには(ステップS311:No)、既述のステップS305に移行する

【0042】
ステップS312では、語句データベース110上での、その語句に関するリストアッ
プ回数のデータを、1だけ加算する処理を実行する。
次いで、ステップS311で加算処理されたその語句に関するリストアップ回数の値が
、後述する閾値以上であるか否かが判定され(ステップS313)、当該閾値以上と判定
されたときには(ステップS313:Yes)、語句データベース110上での、その語
句に関する難易度のランク(階位)を一つ下げる(ステップS314)。
【0043】
その後、キーワードリストにその語句を追加して(ステップS315)、既述のステッ
プS305に移行する。
上述のステップS313→ステップS314において使用される、リストアップ回数の
閾値は、例えば図6のように、各難易度に応じて、難易度が下がるほど大きな値となるよ
うに、あらかじめ設定されている。
【0044】
図7は、図6の閾値を参照して上述のステップS313→ステップS314の処理を行
った際の、語句データベース110に格納されている語句に関するリストアップ回数と難
易度ランクの変遷を説明している。当初、難易度ランクがAであった、「デジカルビ」と
いう語句は、リストアップ回数が3回となった段階で、ステップS313により難易度A
の閾値(3回)以上であると判別され、ステップS314でその難易度ランクは一つ下の
Bに下げられる。その後、リストアップ回数が5回となったとき、同様に、ステップS3
13で難易度Bの閾値(5回)以上であると判別されて、ステップS314により難易度
ランクは更に一つ下のCに下げられる。その後も同様にして、リストアップ回数が閾値に
達する毎に難易度が一つずつ下げられる。
【0045】
このようにして、ある語句のリストアップ回数が増すにつれて、その語句に関する難易
度ランクは漸次下がっていくことなるので、同じ語句が何度もリストアップされてしまう
不都合が回避されることになる。
ここで、最初から語句データベース110に登録される語句のリストアップ回数は、そ
の初期値を0回と設定しても良いし、該語句の難易度ランクの一つ上のランクにおけるリ
ストアップ回数閾値をもって初期値と設定しても良い(例えば、図6の閾値を参照すると
、難易度Eの語句のリストアップ回数初期値は15回、難易度Dの語句の初期値は10回、難
易度Cの語句の初期値は5回、…)。
【0046】
また一方、既述のステップS303で、当該語句が、語句データベース110には未登
録であると判定されたときには(ステップS303:No)、当該語句を新たに語句デー
タベース110に登録すると共に、該登録時における難易度のランクを最高ランク(A)
に位置付け、リストアップ回数を1とする(ステップS321)。その後、既述のステッ
プS315に移行して、当該語句をキーワードリストに追加する。
【0047】
このように、語句データベース110に登録されていないような全く新しく出現した語
句については、その全てがキーワード候補としてリストアップされ、さらに当該語句が最
高ランク(A)の難易度の語句として語句データベース110に登録されるため、そのよ
うな全く新しい語句に対しても、見落としがなく、且つ、比較的数多くのキーワード検索
の機会をユーザに提供することが可能となる。
【0048】
尚、上述のステップS307を敢えて必須の処理とはぜず、キーワードリストにリスト
アップされたキーワードの候補のうちの一部または全部の語句をキーワードとしてそれぞ
れインターネットを利用した検索が自動的に実行されるように構成してもよい。この場合
は、未だ常識化せず目新しい印象を与える語句であってインターネット検索におけるキー
ワードに相応しい難易度の高い語が、キーワードとして設定されて、インターネットを利
用した検索が実行されるため、ユーザの関心を惹く蓋然性の高い語句をキーワードとした
情報検索が略全自動で実行され得る。
【0049】
図4は、図3のフローチャートを参照して説明したキーワードリストの表示(ステップ
S306)状況を象徴的に例示する図である。この場合、適用される表示部は、パネルデ
ィスプレイ装置の表示器、或いは、デジタルテレビジョン受像機の表示器(多くの場合、
本体の筐体内に設けられている)であって、ニュース解説等が放映されている間に、その
放送に付随する字幕放送などからのテキスト情報や、あるいは、そのとき表示される語句
や音声で発音される語句を何らかの方法でテキスト情報に変換したデータを、図3のフロ
ーチャートに従った処理によって選別し、図示のように、表示画面の右上の所定領域に上
下に順次列記するが如く表示する。
【0050】
ユーザは、この順次列記されたキーワードリストの表示、従って、キーワードの候補と
なる語句の表示の中から、所望のものを、例えばリモートコントローラを用いて指定する
(図では、上から2番目の「ユビキタス」が指定された場合が示されている)ことによっ
てキーワードを設定することができる。
以上説明した実施の形態の特徴を要約すれば、例えば、デジタルテレビジョン放送の字
幕放送やデータ放送などを供給源として供給されるテキスト情報から、インターネットを
利用したキーワード検索のキーワードとする語句の候補が自動的に抽出され、これらキー
ワードの候補のうちからユーザによって選択された語句をキーワードとして情報検索が実
行される。
【0051】
ユーザから見て難易度の高い語句であるということは、未だ常識化せず目新しい印象を
与える蓋然性の高い語句であるため、それらがインターネット検索におけるキーワードの
候補として抽出され、その中からユーザが選択した語句がキーワードとして設定されてイ
ンターネットを利用した検索が実行されるため、ユーザの関心や意図をよく反映した情報
検索が実行され得る。尚、ユーザによる選択を俟たないで略全自動でキーワード検索を実
行する実施の形態については既述の通りである。
【0052】
また、過去にキーワードの候補として選別された履歴等も勘案し、且つ、該語句データ
ベース110に登録がない語句については高い難易度に、各該当する語句の難易度を評価
するため、出現頻度が低く、未だ常識化せず目新しい印象を与える語句が敢えてインター
ネットによる検索のキーワードとして選出され易くなり、ユーザのニーズによく合致した
情報検索が実行され得る。更に、キーワードの候補として選別された回数が多くなった語
句については語句データベースにおける難易度の階位を下げるようにデータが更新される
ため、一層的確に難易度が評価され、従って、キーワード候補としての選出もより当を得
たものとなる。
【0053】
更に、デジタルテレビジョン放送の字幕放送に含まれるテキスト情報、あるいは、表示
部に表示される文字や音声で発音される語句を何らかの方法でテキスト情報に変換したデ
ータ、を検索のキーワード候補選出の源としてキーワードの抽出が行なわれるように構成
することにより、時間の経過に従って流れ移り変わるような情報源から適切にキーワード
(その候補)を捕捉することができる。
【0054】
以上説明した本発明の技術思想は、供給されるテキスト情報の入力を受けて保持するス
テップ(S301)と、前記入力されて保持されたテキスト情報に含まれる語句を各個に
識別するステップ(S302)と、前記識別された語句を予め準備されている語句データ
ベースと照合して当該語句の難易度を評価し該評価による難易度が所定水準を上回る語句
をキーワードの候補として選別するステップ(ステップS303〜ステップS306)と
、前記選別されたキーワードの候補である語句のうちのから選択された語句をキーワード
としてインターネットを利用した検索を実行するステップ(ステップS307〜ステップ
S308)と、を含むことを特徴とする情報検索方法として見ることができる。
【0055】
この情報検索方法の実施により、供給されるテキスト情報の入力を受け、該テキスト情
報に含まれる語句が各個に識別され、該識別された語句が、予め準備されている語句デー
タベースと照合されて当該語句の難易度が評価され、該評価による難易度が所定水準を上
回る語句がキーワードの候補として選別され、該選別されたキーワードの候補である語句
のうちから選択された語句がキーワードとして用いられて、インターネットを利用したキ
ーワード検索が実行される。
【0056】
例えば、デジタルテレビジョン放送のデータ放送などを供給源として供給されるテキス
ト情報から、インターネットを利用したキーワード検索のキーワードとする語句の候補が
抽出され、これらキーワードの候補のうちからユーザによって選択された語句をキーワー
ドとして情報検索が実行される。
ユーザから見て難易度の高い語句であるということは、未だ常識化せず目新しい印象を
与える蓋然性の高い語句であることを意味するため、それらがインターネット検索におけ
るキーワードの候補として抽出され、その中から選択された語句がキーワードとして設定
されてインターネットを利用した検索が実行されるため、ユーザの関心や意図をよく反映
した情報検索が実行され得る。
【0057】
図5は、本発明の情報検索装置がデジタルテレビジョン受像機としても機能し得るよう
に構成した実施の形態を表すブロック図である。
図5において、本発明の情報検索装置がデジタルテレビジョン受像機500としても機
能するように構成され、リモートコントローラ600によって操作可能に構成されている

【0058】
周波数変換器を備えたアンテナ510で受信され周波数変換された放送波はチューナ部
520に供給される。チューナ部520では、映像データと音声データとを含む高周波デ
ータ変調信号のうちから所望の特定周波数の信号を抽出し、復調処理、逆インターリーブ
処理、誤り訂正処理等を行って上記抽出した信号を復調してトランスポートストリームを
出力する。更に、チューナ部520は、誤り訂正処理の過程で得られる受信状態を表すエ
ラーレートまたはC/N比のデータを生成する。
【0059】
チューナ部520の出力であるトランスポートストリームはデスクランブル部530に
供給される。デスクランブル部530は、適用されたICカード531からICカード読
取り部532が読取った鍵情報を用いてトランスポートストリームのスクランブルを解除
する。
デスクランブル部530は、更に、デマルチプレクス処理機能を備えており、デスクラ
ンブル処理されたトランスポートストリームを、MPEG2(Moving Picture Experts G
roup2)のビデオトランスポートパケット、オーディオトランスポートパケット、及びP
SI/SI(Program Specific Information/Service Information)に分離する。
【0060】
このように分離されたビデオトランスポートパケットとオーディオトランスポートパケ
ットはAVデコーダ部540に供給される。
このデジタルテレビジョン受像機500の系全体を統括的に制御するべく、マイクロプ
ロセッサを主体に構成されたシステムコントローラ550が設けられ、このシステムコン
トローラ550に、既述の受信状態を表すエラーレートまたはC/N比のデータ、および
、PSI/SIのデータも入力される。
【0061】
システムコントローラ550は、後述するように、その各該当する自己の機能部および
関連する他の機能部との共働によって本発明の枢要な構成要件としての各手段を構成する
ようになされている。
トランスポートストリームには複数のチャンネルが多重化されており、これらのうちか
ら所望のチャンネルを選択することは、既述のPSI/SIから当該所望のチャンネルが
トランスポートストリーム中でどのパケットIDで多重化されているかといったデータを
判読することによって達成される。
【0062】
AVデコーダ部540は、ビデオトランスポートパケットに対してデコードを行うビデ
オデコーダ、および、オーディオトランスポートパケットに対してデコードを行うオーデ
ィオデコーダを備えている。ビデオデコーダは、入力された可変長符号を復号して量子化
係数や動きベクトルを求め、逆DCT変換や動きベクトルに基づく動き補償制御などを行
う。また、オーディオデコーダは、入力された符号化信号を復号して音声データを生成す
る。
【0063】
AVデコーダ部540の上述のビデオデコーダの出力は、加算器541を介して映像処
理部542に供給され、一方、上述のオーディオデコーダの出力は、音声処理部543に
供給される。
映像処理部542は、AVデコーダ部540から映像データを受け取ってD/A変換を
行い、例えばコンポジット映像信号に変換する。一方、音声処理部543は、AVデコー
ダ部540から音声データを受け取ってD/A変換を行い、例えば右(R)音のアナログ
信号および左(L)音のアナログ信号を生成する。
【0064】
映像処理部542の出力は映像出力部544を介して表示器560に供給されて映像が
画面に表示され、音声処理部543の出力は音声出力部545を介してスピーカ561に
供給されて音声が出力される。
システムコントローラ550の制御下で作動するOSD部551が設けられ、システム
コントローラ550から出力指示されたアイコン、メニュー、文字、および表示色等を表
す映像パターンデータを生成して加算器541に出力する。
【0065】
加算器541は映像パターンデータをAVデコーダ540から出力される受信映像デー
タに組み込む処理を行う。
リモートコントローラ600からの赤外光による操作指令信号(リモートコントロール
信号)を受信するためのリモートコントロール信号受信部552が設けられ、その出力が
リモートコントロール信号デコード部553でデコード処理されてシステムコントローラ
550に供給されるように構成されている。
【0066】
システムコントローラ550と種々のデータの授受を行い得るようにメモリ555が設
けられ、更に、このデジタルテレビジョン受像機500に対してリモートコントローラ6
00を介さずに直接操作を行うための操作ボタンやその他の操作子を備えた操作部556
がシステムコントローラ550に接続されている。
更に、システムコントローラ550には、この種の映像機器において通常の仕様とされ
るIP網(インターネット)700との接続を可能にするためのIP網インターフェース
部571が接続されている。本例のデジタルテレビジョン受像機500は、このIP網イ
ンターフェース部571を通してIP網700と、従って、IP網700を介してサーバ
710のような情報源と結ばれて広範囲に情報の検索を行うことが可能である。
【0067】
この実施の形態の情報検索装置たるデジタルテレビジョン受像機500は、その表示器
560が、図1の実施の形態における表示部130に該当するように機能する。即ち、表
示器560は、AVデコーダ部540の出力映像データに基づく表示を行なうと共に図4
に例示したようなユーザインターフェースのための表示を行ない得るように構成されてい
る。
【0068】
また、メモリ555が、システムコントローラ550の制御下で、図1の情報検索装置
におけるテキスト情報記憶部102、および、語句データベース110、ならびに、キー
ワード一時記憶部105としても機能するように構成されている。
チューナ部520がシステムコントローラ550との共働により供給されるテキスト情
報の入力を受けるテキスト情報入力部として機能する。また、システムコントローラ55
0が、テキスト情報入力部から入力されたテキスト情報に含まれる語句を各個に識別する
語句識別部、および、語句識別部によって識別された語句を予め準備されている語句デー
タベースと照合して当該語句の難易度を評価し該評価による難易度が所定水準を上回る語
句をキーワードの候補として選別するキーワード選別部として機能する。
【0069】
更に、IP網インターフェース部571がシステムコントローラ550との共働により
キーワード選別部によって選別されたキーワードの候補である語句のうちからユーザによ
って選択された語句をキーワードとしてインターネットを利用した検索を実行するキーワ
ードネット検索部として機能する。
以上、図1以下の図面を参照して本発明の情報検索装置がデジタルテレビジョン受像機
の形態をとって具現された場合について詳述したが、本発明の技術思想はこのような形で
具現される技術に限定されるものではなく、例えば、パーソナルコンピュータによってウ
ェブサイトやメールを通してテキスト情報を取得し、該取得されたテキスト情報中から上
述と同様にして選別される語句のうちから選択した語句をキーワードとして検索を実行す
るような形態にも具現され得る。
【図面の簡単な説明】
【0070】
【図1】本発明の実施の形態としての情報検索装置を表す概念図である。
【図2】図1の単語・熟語データベースに格納されているデータの構造を表す概念図である。
【図3】図1を参照して説明した情報検索装置の動作を表すフローチャートである。
【図4】図3のフローチャートを参照して説明したキーワードリストの表示状況を象徴的に例示する図である。
【図5】本発明の情報検索装置がデジタルテレビジョン受像機としても機能し得るように構成した実施の形態を表すブロック図である。
【図6】語句の難易度の設定について説明するための図である。
【図7】図3のフローチャートを参照して説明した語句の難易度の変遷について説明するための図である。
【符号の説明】
【0071】
101…テキスト情報入力部 102…テキスト情報記憶部 103…語句識別部
104…キーワード選別部 105…キーワード一時記憶部 106…キーワード選択部
107…キーワードネット検索部 110…語句データベース 120…インターネット
130…表示部

【特許請求の範囲】
【請求項1】
供給されるテキスト情報の入力を受けるテキスト情報入力部と、前記テキスト情報入力
部から入力されたテキスト情報に含まれる語句を各個に識別する語句識別部と、前記語句
識別部によって識別された語句を予め準備されている語句データベースと照合して当該語
句の難易度を評価し該評価による難易度が所定水準を上回る語句をキーワードの候補とし
て選別するキーワード選別部と、前記キーワード選別部によって選別されたキーワードの
候補である語句のうちからユーザによる所望の語句をキーワードとして選択する操作を受
付けるキーワード選択部と、前記キーワード選択部によってユーザに選択された語句をキ
ーワードとしてインターネットを利用した検索を実行するキーワードネット検索部と、を
備えていることを特徴とする情報検索装置。
【請求項2】
供給されるテキスト情報の入力を受けるテキスト情報入力部と、前記テキスト情報入力
部から入力されたテキスト情報に含まれる語句を各個に識別する語句識別部と、前記語句
識別部によって識別された語句を予め準備されている語句データベースと照合して当該語
句の難易度を評価し該評価による難易度が所定水準を上回る語句をキーワードの候補とし
て選別するキーワード選別部と、前記キーワード選別部によって選別されたキーワードの
候補である語句のうちの一部または全部の語句をキーワードとしてそれぞれインターネッ
トを利用した検索を自動的に実行するキーワードネット検索部と、を備えていることを特
徴とする情報検索装置。
【請求項3】
前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデータと
現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含む情
報を語句毎に対応して更新可能に保有する語句データベースを適用して、当該キーワード
の候補を選別するように構成されていることを特徴とする請求項1または2の何れか一項
に記載の情報検索装置。
【請求項4】
前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデータと
現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含む情
報を語句毎に対応して更新可能に保有する語句データベースを適用し、該語句データベー
スに既登録の語句については当該登録に係る難易度を表すデータに依拠した難易度に、該
語句データベースに未登録の語句については高い難易度に、各該当する語句の難易度を評
価して、キーワードの候補を選別するように構成されていることを特徴とする請求項1ま
たは2の何れか一項に記載の情報検索装置。
【請求項5】
前記キーワード選別部は、前記語句データベースとして、既定の難易度を表すデータと
現在時点以前にキーワードの候補として選別された回数を表すデータとの各データ含む情
報を語句毎に対応して更新可能に保有する語句データベースを適用し、該語句データベー
スに既登録の語句については当該登録に係る難易度を表すデータに依拠した難易度に、該
語句データベースに未登録の語句については高い難易度に、各該当する語句の難易度を評
価して、キーワードの候補を選別すると共に、キーワードの候補として選別された回数が
所定の閾値に到った語句については前記語句データベースにおける難易度の階位を下げる
べくデータを更新するように構成されていることを特徴とする請求項1または2の何れか
一項に記載の情報検索装置。
【請求項6】
前記テキスト情報入力部は、受信された字幕放送やデータ放送などに含まれるテキスト
データを周期的に記憶装置に供給して所定の記憶部に記憶させるように構成されているこ
とを特徴とする請求項1〜5の何れか一項に記載の情報検索装置。
【請求項7】
受信された放送の映像データと音声データとを含む高周波データ変調信号のうちから所
望の特定周波数の信号を抽出してトランスポートストリームを出力するチューナ部と、適
用されたICカードから読取った鍵情報を用いて前記チューナ部の出力であるトランスポ
ートストリームのスクランブルを解除してビデオトランスポートパケットおよびオーディ
オトランスポートパケットを得るデスクランブル部と、前記ビデオトランスポートパケッ
トおよびオーディオトランスポートパケットに対してデコード処理を施して映像データお
よび音声データを生成するAVデコーダ部と、前記AVデコーダ部の出力映像データに基
づく表示を行なうと共にユーザインターフェースのための表示を行なう表示器と、を更に
備え、デジタルテレビジョン放送を受信可能に構成されていることを特徴とする請求項1
〜6の何れか一項に記載の情報検索装置。
【請求項8】
供給されるテキスト情報の入力を受けて保持するステップと、前記入力されて保持され
たテキスト情報に含まれる語句を各個に識別するステップと、前記識別された語句を予め
準備されている語句データベースと照合して当該語句の難易度を評価し該評価による難易
度が所定水準を上回る語句をキーワードの候補として選別するステップと、前記選別され
たキーワードの候補である語句のうちから選択された語句をキーワードとしてインターネ
ットを利用した検索を実行するステップと、を含むことを特徴とする情報検索方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−27186(P2008−27186A)
【公開日】平成20年2月7日(2008.2.7)
【国際特許分類】
【出願番号】特願2006−198918(P2006−198918)
【出願日】平成18年7月21日(2006.7.21)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】