説明

話題出力装置及び方法及びプログラム

【課題】 一定期間よりも大きな周期の既によく知られた話題に関する語句を出力しないよう選択する。
【解決手段】 本発明は、時刻情報、階層カテゴリ情報が付与された一定期間の文書を取得し、文書集合に含まれる語句の出現数を求め、該出現数に基づいて、該一定期間に話題になった語句の話題度を算出し、話題度の高い語句に対して、周期性があるかどうかを判断し、周期性があると判断した各語句に対して、階層カテゴリの上位階層から順に、同一階層カテゴリ間において語句の出現に偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与する。利用者に指示された認知レベルや、予めシステムに設定した認知レベルに合わせて、語句を選択して出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、話題出力装置及び方法及びプログラムに係り、特に、階層構造をもつカテゴリ情報を付与された文書集合から特定の期間において話題になった語句を出力するための話題出力装置及び方法及びプログラムに関する。
【背景技術】
【0002】
近年、インターネット上には様々な分野において大量の電子化された文書が発信され続けている。最近流行している物や事柄を知りたい場合、常に増え続けるこれらの文書を日々チェックすることは困難である。そのため、例えば検索キーワードの週間ランキングや注目キーワードを提示するサービスがある。これらの検索キーワードランキングでは、毎週検索数の多い語が特定の語が存在し、経験的にそれらの語を排除してランキングを生成している。
【0003】
また、逐次更新される文書集合から指定した期間における話題語を抽出する技術も多数提案されており、例えば、カタカナの連続した新語も抽出可能とする単語抽出方法(例えば、特許文献1参照)や、話題の周期性に着目し、これから盛り上がりそうな語句の出現数の増加を強調して語句の話題度を算出する方法(例えば、特許文献2参照)がある。これらの技術は、新しい話題を表す語句、新たに盛り上がりそうな語句を高精度に抽出することに着目している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許4208550号公報
【特許文献2】特開2006−72840号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、周期的に繰り返される話題については、その話題を代表する話題語を提示しても、人によっては当たり前の話題だと感じる語が存在する。例えば、クリスマス、正月、お盆など、暦に関連した語句は、日本人の殆どが、話題になる時期を既に知っており、12月の話題語として「クリスマス」が提示されても、当たり前だと感じる。また、経済カテゴリなどでは、四半期ごとの決算についての発表記事などが、3か月ごとに話題になることが多い。
【0006】
このように、1週間単位の話題や1ヶ月単位の話題を出力する際に、それよりも大きな周期の既によく知られた話題に関する語句の話題度が高く算出され、出力されてしまうという問題がある。
【0007】
本発明は、上記の点に鑑みなされたもので、一定期間よりも大きな周期の既によく知られた話題に関する語句を出力しないよう選択することが可能な話題出力装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するため、本発明(請求項1)は、時刻情報付きの文書の集合から指定した期間における話題語を出力する話題語出力装置であって、
時刻情報、階層カテゴリ情報が付与された文書を格納する文書蓄積手段と、
話題語と該話題度を算出する期間の開始日と終了日、及び、該話題語の話題度を格納する話題語蓄積手段と、
語句毎の認知度を格納する認知度蓄積手段と、
前記文書蓄積手段から、定期的(ユーザが指定できる期間の最小単位)に一定期間の文書集合を取得し、文書集合に含まれる語句の出現数を求め、該出現数に基づいて、該一定期間に話題になった語句の話題度を算出して前記話題語蓄積手段に記録する話題度算出手段と、
前記話題語蓄積手段から、指定された期間において話題度の高い上位K件の語句を取得し、語句毎に、前記話題度蓄積手段に蓄積されている該語句の過去の話題度を用いて周期性があるかどうかを判断する周期性判断手段と、
周期性のある各語句に対して、指定された期間の文書集合に含まれる該語句の出現頻度を階層カテゴリの各カテゴリに対して求め、上位階層から順に同一階層カテゴリ間に出現の偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与し、語句毎に前記認知度蓄積手段に格納する認知度付与手段と、を有する。
【0009】
また、本発明(請求項2)は、前記話題語蓄積手段から、指定した期間における話題度の高い上位K件の語句とその話題度を取得し、取得した各語句の認知レベルを前記認知度蓄積手段から取得し、指定した認知レベルに合った語句を選択して出力する語句出力手段を、更に有する。
【0010】
また、本発明(請求項3)は、時刻情報付きの文書の集合から指定した期間における話題語を出力する話題語出力方法であって、
時刻情報、階層カテゴリ情報が付与された文書を格納する文書蓄積手段と、
話題語と該話題度を算出する期間の開始日と終了日、及び、該話題語の話題度を格納する話題語蓄積手段と、
語句毎の認知度を格納する認知度蓄積手段と、
を有する装置において、
話題度算出手段が、前記文書蓄積手段から、定期的(ユーザが指定できる期間の最小単位)に一定期間の文書集合を取得し、文書集合に含まれる語句の出現数を求め、該出現数に基づいて、該一定期間に話題になった語句の話題度を算出して前記話題語蓄積手段に記録する話題度算出ステップと、
周期性判断手段が、前記話題語蓄積手段から、指定された期間において話題度の高い上位K件の語句を取得し、該語句毎に、前記話題度蓄積手段に蓄積されている該語句の過去の話題度を用いて周期性があるかどうかを判断する周期性判断ステップと、
認知度付与手段が、周期性のある各語句に対して、指定された期間の文書集合に含まれる該語句の出現頻度を階層カテゴリの各カテゴリに対して求め、上位階層から順に同一階層カテゴリ間に出現の偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与し、語句毎に前記認知度蓄積手段に格納する認知度付与ステップと、を行う。
【0011】
また、本発明(請求項4)は、語句出力手段が、前記話題語蓄積手段から、指定した期間における話題度の高い上位K件の語句とその話題度を取得し、取得した各語句の認知レベルを前記認知度蓄積手段から取得し、指定した認知レベルに合った語句を選択して出力する語句出力ステップを、更に行う。
【0012】
また、本発明(請求項5)は、請求項1または2記載の話題語出力装置を構成する各手段としてコンピュータを機能させるための話題語出力プログラムである。
【発明の効果】
【0013】
上記のように本発明によれば、最新のある一定期間に対する話題語を出力する際に、話題語に付与された認知レベルを利用することで、一定期間よりも大きな周期の既によく知られた話題に関する語句を出力しないよう選択することが可能となる。
【図面の簡単な説明】
【0014】
【図1】本発明の概要を説明するための図である。
【図2】本発明の第1の実施の形態における話題語出力装置の構成図である。
【図3】本発明の第1の実施の形態における文書蓄積部のデータ例である。
【図4】本発明の第1の実施の形態における話題語蓄積部のデータ例である。
【図5】本発明の第1の実施の形態における周期性判定部の処理フローチャートである。
【図6】本発明の第1の実施の形態における認知度蓄積部のデータ例である。
【図7】本発明の第1の実施の形態における認知度付与部の処理フローチャートである。
【図8】本発明の第1の実施の形態における語句出力部の処理フローチャートである。
【図9】本発明の第2の実施の形態における認知度付与部の処理フローチャートである。
【発明を実施するための形態】
【0015】
以下図面と共に、本発明の実施の形態を説明する。
【0016】
まず、本発明の概要を説明する。
【0017】
本発明では、語句が何時話題になるのか広く知られているほど高い値をもつ認知レベルを語句に付与することで、最新の話題を知りたい利用者が認知レベルを選択して、話題語を取得可能とする。語句が何時話題になるのかは、過去に周期的に話題度が高くなっている語であるかどうかで判断する。広く知られているかどうかは、文書に付与された階層カテゴリを利用して、より多くのカテゴリで語句が出現しているほど、広く知られていると判断する。
【0018】
以下に、一連の動作の概要を図1に沿って説明する。
【0019】
まず、時刻情報、階層カテゴリ情報が付与された一定期間の文書を取得し、文書集合に含まれる語句の出現数を求め、当該出現数に基づいて、該一定期間に出現した語句の話題度を算出する(S1)。次に、話題度の高い語句に対して、過去の話題度を用いて周期性があるかどうかを判断する(S2)。周期性があると判断した各語句に対して、階層カテゴリの上位階層から順に、同一階層カテゴリ間において語句の出現に偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与する(S3)。
最後に、利用者に指示された認知レベルや、予めシステムに設定した認知レベルに合わせて、語句を選択して出力する(S4)。
【0020】
[第1の実施の形態]
図2は、本発明の第1の実施の形態における話題語出力装置の構成を示す。
【0021】
話題語出力装置10は、外部記憶装置として文書蓄積部20が接続され、文書蓄積部20からの情報を入力とし、話題語を出力するものである。
【0022】
話題語出力装置10は、話題度算出部11、話題語蓄積部12、周期性判定部13、認知度付与部14、認知度蓄積部15、語句出力部16から構成される。
【0023】
文書蓄積部20は、時刻情報と階層カテゴリ情報が付与された文書を蓄積しており、日々新しい文書が追加格納されている。図3は、本発明の第1の実施の形態における文書蓄積部のデータ例を示す。文書蓄積部20は、文書ID201、日時202、カテゴリA203、カテゴリB204、タイトル205、本文206から構成される。文書ID201は、文書を識別するための一意な番号であり、日時202は、文書の作成/更新日時や文書が取得された日時などの文書に関連した日時である。カテゴリA203とカテゴリB204は、2階層に分類されている階層カテゴリの例であり、文書が属する階層カテゴリを示す。カテゴリAがカテゴリBの上位カテゴリを示す。2階層より多くの階層構造をもつカテゴリの場合は、カテゴリC、カテゴリDと、順次下位カテゴリ情報を追加して格納したり、別途階層カテゴリの各カテゴリにカテゴリ識別子を付与して、カテゴリA、カテゴリBの代わりにカテゴリ識別子を格納するように構成してもよい。タイトル205、本文206は、ニュース記事やブログ記事などのようなタイトルと本文が分割して発信されている文書の場合、タイトル部分のテキストと、本文をそれぞれ格納する。
【0024】
話題度算出部11は、定期的に一定期間の文書集合を文書蓄積部20から取得し、文書集合に含まれる語句とその話題度を算出する。例えば、1週間ごとに直前の1週間分の文書集合を取得し、該1週間に話題になった語句を抽出し、その出現頻度からその語句の話題度を算出する。なお、話題度の算出方法については、従来から提案されている手法(例えば、特許文献1)を用い、語句とその話題度を、話題度算出期間と対応付けて話題語蓄積部12に格納する。
【0025】
図4は、本発明の第1の実施の形態における話題語蓄積部のデータ例を示す。話題語蓄積部12は、期間開始日101、期間終了日102、語句103、頻度104、話題度105から構成される。期間開始日と期間終了日は、話題度を算出する期間の開始日と終了日であり、語句103は話題度算出部11で対象期間の文書集合から抽出された語句、頻度104はその語句の対象期間における頻度、話題度105はその語句に付与された対象期間における話題度である。
【0026】
話題度算出部11の処理が終了すると、次に周期性判定部13が語句の周期性判定の処理を開始する。最終的に利用者が閲覧する語句の数は限られるため、周期性判定部13では、ある程度話題度の高い上位K件の語句に対してのみ処理を行う。
【0027】
話題度算出部11は、処理対象期間の文書集合すべてに対して話題度の算出処理が終了すると、処理対象期間を周期性判定部13に送り、処理を終了する。
【0028】
図5は、本発明の第1の実施の形態における周期性判定部の処理のフローチャートである。周期性判定部13は、話題度算出部11から期間を受け取り、処理を開始する。周期性判定部13の処理の流れを図5を用いて説明する。図6は、本発明の第1の実施の形態における認知度蓄積部のデータ例である。認知度蓄積部15には、語句111、周期112、認知度113からなるデータが格納される。
【0029】
まず、話題語蓄積部12から指定された期間の語句であって、話題度の高い上位K個の語句を取得する(S20)。取得したK個の語句に対して、1語句ずつ以下の処理を行う。未処理の語句があれば(S21,YES)、未処理の語句を1つ取り出し(S22)、該語句が認知度蓄積部15に存在するかどうか調べる(S23)。存在する場合(S23、YES)、周期性の判定を行わない。存在しない場合(S23,NO)、語句に周期性があるかどうか話題語蓄積部12の過去の情報を検索して判断する(S24)。すなわち、話題度蓄積部12に記録されている該語句の期間開始日と期間終了日を過去に遡って取得し、語句の話題度が高くなる期間が周期的かどうかを調べる。周期的に語句の話題度が高くなっている場合に、周期性があると判断する。語句が認知度蓄積部15に存在する場合(S23、YES)と、認知度蓄積部15には存在しないが周期性があると判断された場合(S25,YES)、該語句と周期をメモリ(図示せず)上に記録する(S26)。周期性判定部13は、未処理の語句がなくなると(S21、NO)、メモリ(図示せず)上に記録した語句と周期の情報とS20で入力された期間を認知度付与部に送り(S27)、メモリ(図示せず)をクリアして処理を終了する。
【0030】
認知度付与部14は、周期性判定部13から語句と周期を受け取り、該語句に認知レベルを付与して認知度蓄積部15に記録する。
【0031】
図7は、本発明の第1の実施の形態における認知度付与部の処理のフローチャートである。
【0032】
以下では、認知レベルを階層カテゴリ情報の階層数+1の範囲で設定する例を、図7を用いて説明する。階層カテゴリ情報の階層数は、文書蓄積部20の階層カテゴリ情報の階層数であり、予め与えられているものとする。階層数が図4に示すように2階層の場合、認知レベルは最も高い場合に3、最も低い場合で1となる。
【0033】
まず、認知レベルの最高値Nを「階層数+1」とし(S30)、最も上位レベルのカテゴリに対して、語句の出現にカテゴリ間の偏りがあるかどうか調べる。調査対象の語句は、周期性判定部13から入力された期間とし、話題語蓄積部12から調査対象期間における語句の頻度を取得して偏りがあるかどうか調べる。対象期間の語句をすべて対象とすることで、日々に変化する語句の認知度を常に最新に保つことを可能とする。そこで、周期性判定部13から入力された語句の集合に対して、1語句ずつ以下の処理を行う。
【0034】
未処理の語句があれば(S31,YES)、未処理の語句を1つ取り出し、処理する階層を下げる度に値を増やす変数としてiを1に初期化する(S32)。
【0035】
まず、該語句の出現頻度を第1階層のカテゴリ毎に求める(S33)。図3の例では、第1階層のカテゴリは、カテゴリA(203)を示し、「政治」、「社会」などのカテゴリがある。出現頻度は、文書蓄積部20から入力された期間の文書を対象として取得する。
【0036】
求めた第1階層の各カテゴリの出現頻度を用いて、第1階層カテゴリ間で出現頻度に偏りがあるかどうか調べ(S34)、偏りが少なければ(S34,NO)、広く認知されている語であると判断し、認知レベルをN-1+1(すなわちN)に設定する(S37)。
【0037】
偏りがあれば(S34,YES)、カテゴリの階層を1つ下げi=i+1(S35)、iが階層数以下であれば(S36)、第i階層のカテゴリごとに語句の出現頻度を求め(S33)、第i階層のカテゴリ間で、語句の出現頻度に偏りがあるか調べる(S34)。出現頻度の偏りが少なければ(S34,NO)、認知レベルをN-i+1に設定して(S37)、S31に戻る。出現頻度に偏りがあれば(S34,YES)、さらに下位の階層のカテゴリについて調べ、最終的に最下位階層のカテゴリにおいて、偏りがあった場合(S37,NO)、認知レベルを1に設定し、認知度蓄積部15に記録し(S37)、S31に戻る。
【0038】
認知度蓄積部15に記録する際(S37)、語句が存在しない場合は新たに語句と周期と認知レベルを記録し、語句が既に存在する場合は、認知レベルを今回の値に更新する。そのため、初めは限られたカテゴリでのみ話題になっていた語が、多くのカテゴリで出現するようになると、認知レベルが上がる。また、逆に多くのカテゴリで出現していた語句が、限られたカテゴリでのみ話題になると、認知レベルが下がる。
【0039】
S34におけるカテゴリ間での出現頻度の偏りを調べる方法としては、特定の1カテゴリにのみ語句が出現する場合に、偏りがあると判定する方法が最も単純な方法である。また、以下のような評価値を利用して、評価値が予め設定した閾値を超えるカテゴリci,jが存在する場合に偏りがあると判定する方法もある。
【0040】
評価値=f(w, ci,j)×log(第i階層のカテゴリ総数/wが出現する第i階層のカテゴリ数)
式(1)
ここで、f(w, ci,j)は、語句wの第i階層のカテゴリci,jにおける出現頻度であり、式(2)で定義されているとする。
【0041】
f(w, ci,j)=カテゴリci,jにおいて語句wが出現する文書数/カテゴリci,jの総文書数
式(2)
語句出力部16は、利用者が指定した、あるいは予め設定された数の語句を出力する。
図8は、本発明の第1の実施の形態における語句出力部の処理のフローチャートである。図8を用いて、語句出力部16の処理フローを説明する。
【0042】
まず、話題語蓄積部12から、最新の期間における語句と話題度を取得する(S40)。取得した語句集合に対して、話題度の高い順に、認知度蓄積部15を検索して認知レベルを取得し、語句と話題度と認知レベルとを対応づけてメモリ(図示せず)上に記録する(S41)。利用者によって指定された、または、予め設定された認知レベル以下の語句を、話題度の高い順に出力する(S42)。
【0043】
第1の実施の形態により、利用者は初めて話題語を閲覧する際には、認知レベルを最も高くし、その後、徐々に認知レベルを下げて、新しい話題に出会う機会を増やす、といった認知レベルを選択して話題語を閲覧することが可能となる。
【0044】
[第2の実施の形態]
本実施の形態では、認知レベルをより詳細に変化させて設定する例を説明するが、話題語出力装置の構成は、図2と同様であるので、その説明は省略し、第1の実施の形態と異なる部分のみを説明する。
【0045】
前述の第1の実施の形態における語句出力部15は、認知レベルの最高値Nを「階層数+1」とし、認知レベルは1ずつ変化させる例であった。図9を用いて認知レベルをより細かく変化させて設定する例を説明する。
【0046】
本実施の形態では、式(1)の評価値を用いて語句wのカテゴリci,jにおける偏りの強さを求め、偏りの強さに応じで変化させる変数αjに0以上1以下の値を設定する。評価値がある閾値TH(h)以上に高い場合に偏りが強いとしてα=1を設定し、ある閾値TH(l)以下の場合に偏りが少ないとしてαj=0を設定する。評価値がTH(h)〜TH(l)の間である場合に、評価値に応じてαj (0<αj <1)を設定する。また、評価値がTH(h)より高いカテゴリにおいては、下位階層のカテゴリ間で偏りがある可能性があるため、下位カテゴリ間での語句wの偏りを調べる。
【0047】
まず、認知レベルの最高値Nを「階層数+1」とし(S50)、最も上位レベルのカテゴリに対して、語句の出現にカテゴリ間の偏りがあるかどうか調べる。周期性判定部13から入力された語句の集合に対して、1語句ずつ以下の処理を行う。
【0048】
未処理の語句があれば(S51,YES)、未処理の語句を1つ取り出し、処理する階層を下げる度に値を増やす変数としてiを1に初期化する(S52)。指定カテゴリがないため(S53,NO)、該語句の出現頻度を第1階層のカテゴリ毎に求める(S54)。前述の式(1)により語句wのカテゴリc1jの評価値を求め、評価値に応じてαjを設定する(S55)。jは評価するカテゴリを識別するための添え字である。偏りが強いαj=1となるカテゴリが存在し、i<=Nを満たす場合は(S56,YES)、αj=1を満たすカテゴリを指定カテゴリに設定し(S57)、S53に戻る。指定カテゴリが存在する場合(S53,YES)は、指定カテゴリの下位カテゴリに対してのみ、語句の出現頻度を求め(S58)、出現頻度を求めたカテゴリにおいて、語句wの出現頻度の偏りの強さを算出する(S55)。αj=1となるカテゴリが存在しない、あるいは最下位カテゴリの処理が終了した場合に(S56,NO)、認知レベルをN-i-max(αj)+1に設定し、認知度蓄積部15に記録し、指定カテゴリをクリアして(S59)、S51に戻る。
【0049】
このように、認知レベルを連続値として設定することで、利用者は出力する認知レベルを自由に選択することができる。また、単語の出現頻度の偏りが強いカテゴリの下位カテゴリについてのみ、さらに単語の出現頻度の偏りを算出するため、処理の効率化が図れる。
【0050】
上記の図2に示す話題語出力装置の各構成要素の動作をプログラムとして構築し、話題語出力装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0051】
また、構築されたプログラムをハードディスクや、フレキシブルディスク、CD-ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
【0052】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0053】
10 話題語出力装置
11 話題度算出部
12 話題語蓄積部
13 周期性判定部
14 認知度付与部
15 認知度蓄積部
16 語句出力部
20 文書蓄積部
101 期間開始日
102 期間終了日
103 語句
104 頻度
105 話題度
111 語句
112 周期
113 認知度
201 文書ID
202 日時
203 カテゴリA
204 カテゴリB
205 タイトル
206 本文

【特許請求の範囲】
【請求項1】
時刻情報付きの文書の集合から指定した期間における話題語を出力する話題語出力装置であって、
時刻情報、階層カテゴリ情報が付与された文書を格納する文書蓄積手段と、
話題語と該話題度を算出する期間の開始日と終了日、及び、該話題語の話題度を格納する話題語蓄積手段と、
語句毎の認知度を格納する認知度蓄積手段と、
前記文書蓄積手段から、定期的(ユーザが指定できる期間の最小単位)に一定期間の文書集合を取得し、文書集合に含まれる語句の出現数を求め、該出現数に基づいて、該一定期間に話題になった語句の話題度を算出して前記話題語蓄積手段に記録する話題度算出手段と、
前記話題語蓄積手段から、指定された期間において話題度の高い上位K件の語句を取得し、語句毎に、前記話題度蓄積手段に蓄積されている該語句の過去の話題度を用いて周期性があるかどうかを判断する周期性判断手段と、
周期性のある各語句に対して、指定された期間の文書集合に含まれる該語句の出現頻度を階層カテゴリの各カテゴリに対して求め、上位階層から順に同一階層カテゴリ間に出現の偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与し、語句毎に前記認知度蓄積手段に格納する認知度付与手段と、
を有することを特徴とする話題語出力装置。
【請求項2】
前記話題語蓄積手段から、指定した期間における話題度の高い上位K件の語句と話題度を取得し、取得した各語句の認知レベルを前記認知度蓄積手段から取得し、指定した認知レベルに合った語句を選択して出力する語句出力手段を、
更に有することを特徴とする請求項1記載の話題語出力装置。
【請求項3】
時刻情報付きの文書の集合から指定した期間における話題語を出力する話題語出力方法であって、
時刻情報、階層カテゴリ情報が付与された文書を格納する文書蓄積手段と、
話題語と該話題度を算出する期間の開始日と終了日、及び、該話題語の話題度を格納する話題語蓄積手段と、
語句毎の認知度を格納する認知度蓄積手段と、
を有する装置において、
話題度算出手段が、前記文書蓄積手段から、定期的(ユーザが指定できる期間の最小単位)に一定期間の文書集合を取得し、文書集合に含まれる語句の出現数を求め、該出現数に基づいて、該一定期間に話題になった語句の話題度を算出して前記話題語蓄積手段に記録する前記話題語蓄積手段に記録する話題度算出ステップと、
周期性判断手段が、前記話題語蓄積手段から、指定された期間において話題度の高い上位K件の語句を取得し、語句毎に、前記話題度蓄積手段に蓄積されている該語句の過去の話題度を用いて周期性があるかどうかを判断する周期性判断ステップと、
認知度付与手段が、周期性のある各語句に対して、指定された期間の文書集合に含まれる該語句の出現頻度を階層カテゴリの各カテゴリに対して求め、上位階層から順に同一階層カテゴリ間に出現の偏りがあるかどうか調べ、上位階層において偏りが少ないほど高い認知レベルを付与し、語句毎に前記認知度蓄積手段に格納する認知度付与ステップと、
を行うことを特徴とする話題語出力方法。
【請求項4】
語句出力手段が、前記話題語蓄積手段から、指定した期間における話題度の高い上位K件の語句と話題度を取得し、取得した各語句の認知レベルを前記認知度蓄積手段から取得し、指定した認知レベルに合った語句を選択して出力する語句出力ステップを、
更に行うことを特徴とする請求項3記載の話題語出力方法。
【請求項5】
請求項1または2記載の話題語出力装置を構成する各手段としてコンピュータを機能させるための話題語出力プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate