説明

情報提示装置、プログラム及び情報提示方法

【課題】特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させる可能な情報提示装置、プログラム及び情報提示方法を提供する。
【解決手段】一又は複数の文書に含まれた各用語の使用頻度を、当該文書を操作したユーザのユーザ名毎に算出し、この用語毎の使用頻度に基づき、特定のユーザ名と他のユーザ名とについて、当該各用語毎の使用頻度の相対的な差異を比較し、この差異が所定値以上となった用語を提示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、組織内での情報供給に供することのできる情報提示装置、プログラム及び情報提示方法に関する。
【背景技術】
【0002】
近年の計算機器ネットワークの普及に伴い、組織の中で複数の人が共同で仕事を行ったり、互いにコミュニケーションを行う際の情報共有の手段として、電子メールや文書データベースなどの電子的な手段が用いられることが多くなってきている。しかしながら、このような電子的な情報共有手段を用いた場合、従来のように会議の場で対面して打ち合わせを行う場合や、電話を使って相談しあう場合と比べ、円滑な情報共有が行えないことがある。例えば、あまりよく知らない人と初めてコミュニケーションを行うときや、ある仕事の担当者として新たなプロジェクトに参加したとき等、自分以外の人が作成した文書や電子メールの文面に、自分が知らない用語(専門用語、書類名、作業名、固有名など)が含まれているために、その内容を十分に理解できないことがある。また、自身が文書や電子メールを作成する際に使用した用語の意味が、相手にとって理解できないこともある。
【0003】
組織内での情報共有方法としては、仕事やコミュニケーションを行う上で必要な用語とこれに関する知識を、例えば用語集という形で整理し、この用語集を仕事の担当者間で共有することで、情報共有の円滑化を図った方法がある。しかし、用語集を一から作成したり、新しい用語を逐次追加したりする作業は煩雑であり、労力を要するという問題があった。
【0004】
そこで、上記の問題を解決するための技術として、Know Whoシステムと呼ばれるものが用いられている。このKnow Whoシステムは、一般に人手もしくは自動で作成された専門家データベース(人の氏名、連絡先等の情報と、その人が持つ専門知識を表すプロファイル等の情報とを、組にしてデータベース化したもの)を備えており、ユーザから知りたい用語などについての質問が入力されると、この質問とプロファイルとが合致する人物を専門家データベースから検索し、この人物を質問の内容について知識を持った専門家としてユーザに提示するというものである。
【0005】
このようなKnow Whoシステムについては種々の態様が提案されており、例えば、特許文献1には、専門家データベースを陽には用いず、ユーザが入力した質問に対して、各ユーザが作成した文書等の情報を検索し、この情報から抽出される人物情報を質問について知識を持った専門家に関する情報としてユーザに提示する技術が開示されている。
【0006】
また、上記したKnow Whoシステムや、従来の情報フィルタリングシステムなどで用いるユーザプロファイル、すなわち、各個人が持つ専門知識や関心等を表す情報を、自動的に作成するための種々の方法が提案されている。
【0007】
また例えば、特許文献2には、ユーザが作成した文書や閲覧した文書、送受信した電子メールなどを用い、これらの複数のテキスト情報から、統計的に有意に頻出する語句を抽出し、これらの語句を、当該ユーザが持つ専門知識や関心等を表す特徴的な語句とみなし、例えばそのベクトル表現(すなわち、各々の語句をベクトルの次元とし、語句が文書中に出現した頻度などに基づいて計算した値を、各次元成分の大きさとする表現方法)によって、ユーザプロファイルを求める技術が開示されている。また、特許文献3には、複数のユーザからなる所定のユーザ集団において、各ユーザのプロファイルを、当該ユーザを特徴付けるような単語を用いて動的に作成する技術が開示されている。
【0008】
【特許文献1】特開2001−117940号公報
【特許文献2】特開2000−113064号公報
【特許文献3】特開2000−259529号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
ところで、不慣れな分野について理解を進める場合、ユーザは、ユーザ自身が知りたいこと、すなわち、自分は今知らないが、今後仕事やコミュニケーションを行う上で知るべきことがあるということ自体を、認識していないことが多い。このような場合、上記した特許文献1等のKnow Whoシステムを用いた技術では、ユーザは適切な検索条件を入力できないどころか、そもそもKnow Whoシステムを用いて調べるべき用語があること自体を認識できないという問題がある。また、自分は知っているが、他のユーザが知らない用語や知識について、認識することができないという問題もある。
【0010】
また、特許文献2、3に記載の技術においても、あるユーザが有する知識や関心についての情報を提示することを目的としているため、他のユーザとの相対的な関係性については何ら考慮されておらず、例えば、ユーザ自身が現在知識や関心を持ってはいないが、今後仕事やコミュニケーションを行う上で必要となるような用語を、ユーザに認識させることができないという問題がある。また同様に、ある用語についてユーザ自身は知識や関心を持っているが、このユーザと仕事やコミュニケーションを行う相手が、その用語について知識や関心を持っていないということをユーザ自身は認識することができないという問題がある。
【0011】
本発明は、上記に鑑みてなされたものであって、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させる可能な情報提示装置、プログラム及び情報提示方法を提供することである。
【課題を解決するための手段】
【0012】
上述した課題を解決し、目的を達成するために、本発明は、一又は複数の文書を記憶する文書情報記憶手段と、前記文書毎に当該文書に含まれた用語を抽出する用語抽出手段と、前記抽出された用語を、当該用語を含む文書の文書識別情報と対応付けて記憶する用語情報記憶手段と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得手段と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶手段と、前記用語情報記憶手段に記憶された文書名毎の用語に基づき、前記履歴情報記憶手段に記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出手段と、前記用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択手段と、前記選択された用語を提示する情報提示手段と、を備える。
【0013】
また、本発明は、コンピュータに、一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出機能と、前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶機能と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得機能と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶機能と、前記用語情報記憶機能により記憶された文書名毎の用語に基づき、前記履歴情報記憶機能により記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出機能と、前記用語毎の使用頻度に基づき、前記履歴情報記憶機能により記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択機能と、前記選択された用語を提示する情報提示機能と、を実現させる。
【0014】
また、本発明は、一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出工程と、前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶工程と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得工程と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶工程と、前記用語情報記憶工程で記憶された文書名毎の用語に基づき、前記履歴情報記憶工程で記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出工程と、前記用語毎の使用頻度に基づき、前記履歴情報記憶工程で記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択工程と、前記選択された用語を提示する情報提示工程と、を含む。
【発明の効果】
【0015】
本発明によれば、各用語毎の使用頻度に基づき、特定のユーザと他のユーザとについて、当該各用語毎の使用頻度の相対的な差異が所定値以上となった用語を選択し、提示することで、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させることができる。
【発明を実施するための最良の形態】
【0016】
以下に添付図面を参照して、情報提示装置、プログラム及び情報提示方法の最良な実施形態を詳細に説明する。
【0017】
図1は、本実施形態の情報提示装置100のハードウェア構成を示したブロック図である。図1に示すように、情報提示装置100は、CPU(Central Processing Unit)1、ROM(Read Only Memory)2、RAM(Random Access Memory)3、HDD(Hard Disk Drive)4、操作部5、表示部6、通信I/F7等から構成されており、各部はバス8により接続されている。
【0018】
CPU1は、RAM3の所定領域を作業領域として、ROM2やHDD4(以下、総称して記憶部という)に予め記憶された各種制御プログラムとの協働により各種処理(例えば、後述する用語抽出処理、頻度算出処理、ベクトル算出処理、用語情報提示処理等)を実行し、情報提示装置100を構成する各部の動作を統括的に制御する。
【0019】
ROM2は、情報提示装置100の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
【0020】
RAM3は、SDRAM(Synchronous DRAM)等の記憶装置であって、各種データを書換え可能に記憶する性質を有していることから、CPU1の作業エリアとして機能し、バッファ等の役割を果たす。
【0021】
HDD4は、磁気的又は光学的に記録可能な記録媒体を有し、後述する文書情報記憶部11、ユーザ情報記憶部12、用語情報記憶部14、履歴情報記憶部16(図2参照)として機能して、各種データを記憶する。
【0022】
操作部5は、各種入力キー等を備え、ユーザから操作入力された情報を入力信号として受け付け、その入力信号をCPU1に出力する。
【0023】
表示部6は、LCD(Liquid Crystal Display)等により構成され、CPU1からの表示信号に基づいて、各種情報を表示する。なお、表示部6は、操作部5と一体的にタッチパネルを構成する態様としてもよい。
【0024】
通信I/F7は、外部の機器(システム)との間で通信を行うインターフェースであって、外部機器から送信された各種情報をCPU1に出力し、また、CPU1から出力される各種情報を外部機器に送信する。
【0025】
図2は、情報提示装置100の機能構成を示したブロック図である。図2に示すように、情報提示装置100は、文書情報記憶部11、ユーザ情報記憶部12、用語情報抽出部13、用語情報記憶部14、履歴情報取得部15、履歴情報記憶部16、用語使用頻度算出部17、用語情報提示部18を備えている。ここで、用語情報抽出部13、履歴情報取得部15、用語使用頻度算出部17及び用語情報提示部18は、CPU1と記憶部に予め記憶された所定のプログラムとの協働により実現される機能部である。
【0026】
文書情報記憶部11は、情報提示装置100が提示する用語を含んだ文書を記憶する。また、文書情報記憶部11は、文書の作成者や、作成日時等の情報を含んだ文書情報を記憶する。ここで、記憶の対象となる文書は、情報提示装置100内に予め存在する文書とは限らず、図示しない計算機ネットワークを介して接続された外部の計算機上に存在する文書であってもよい。具体的には、電子メールシステムで送受信される電子メールや、外部の電子掲示板システム等で共有される記事、外部のファイルシステムや文書データベースに格納された文書等が挙げられる。これらの文書は、本情報提示装置100を利用するユーザ自身が作成したものであってもよいし、例えば、インターネットやイントラネット上のウェブサイトが提供するウェブページ等のように、本情報提示装置100とは独立した各々のウェブサイトにて作成され一般に公開されているものであってもよい。
【0027】
文書情報記憶部11では、これら文書の内容全てを永続的に記憶する必要はなく、例えば電子メール等のような文書の内容は、その送受信等の際に後述する用語情報抽出部13によって処理を行う間だけ一時的に記憶するようにしてもよい。
【0028】
ユーザ情報記憶部12は、情報提示装置100を利用するユーザの氏名やメールアドレス等のユーザに関するユーザ情報を記憶する。
【0029】
用語情報抽出部13は、文書情報記憶部11に記憶された文書情報から用語を抽出する手段であり、抽出結果を用語情報として用語情報記憶部14に記憶させる。
【0030】
履歴情報取得部15は、複数のユーザが文書を作成して文書情報記憶部11に登録したり、文書情報記憶部11に記憶されている文書を閲覧したりした際の、操作の履歴を示した履歴情報を取得する手段であり、取得した履歴情報を履歴情報記憶部16に記憶させる。また、履歴情報取得部15は、ユーザ情報記憶部12からユーザ情報を取得する。
【0031】
用語使用頻度算出部17は、用語情報記憶部14に記憶された用語情報と、履歴情報記憶部16に記憶された履歴情報とを用いて、特定のユーザ又はユーザ群(以下、ユーザ集合という)によって各用語が使用された頻度を算出する。即ち、用語使用頻度算出部17による算出結果から、どのようなユーザ又はユーザ集合が、どのような用語をどのくらいの頻度で使用しているのかを求めることができる。
【0032】
用語情報提示部18は、用語使用頻度算出部17の算出結果に基づき、ユーザに対して有用な用語を表示部6に表示させるとともに、ユーザ情報記憶部12に記憶されたユーザ情報から、その用語について習熟した専門家を特定し、表示部6に表示させることで、ユーザに情報の提示を行う。
【0033】
なお、図2で示した情報提示装置100の構成は、最小かつ本質的な構成である。実際に仕事やコミュニケーションを行う上でより効果的な他の態様としては、図3に示すように、情報共有システム200と情報提示装置100とを組み合わせた構成とすることができる。
【0034】
ここで、情報共有システム200は従来技術に属するものでよく、その具体例としては、ワークフロー管理システムやプロジェクト管理システム、スケジュール管理システムといった業務システムや、文書検索サービス、文書のリビジョン管理システム、あるいは、メーリングリストシステムや電子掲示板システムのようなコミュニケーションシステム等が挙げられる。
【0035】
このような情報共有システム200では、一般的に当該情報共有システム200を利用するユーザ情報を記憶・管理する記憶装置(ユーザ情報記憶部)や、文書情報を記憶する記憶装置(文書情報記憶部)が備えられている。また、ユーザは、情報共有システム200を用いて、文書の作成や登録、閲覧といった操作を行うため、履歴情報取得部15は、文書に対する操作の履歴情報を情報共有システム200を介して取得する。
【0036】
図4は、本実施形態の他の態様を示した図である。図4に示したように、情報共有システム200は、図2に示した情報提示装置100の文書情報記憶部11及びユーザ情報記憶部12に相当する各記憶装置(文書情報記憶部201、ユーザ情報記憶部202)を備えている。また、情報提示装置100の、用語情報抽出部21は、情報共有システム200の文書情報記憶部201に記憶された文書情報(文書)から用語を抽出する。さらに、履歴情報取得部22は、文書に対する操作の履歴情報を情報共有システム200を介して取得するとともに、情報共有システム200のユーザ情報記憶部202から、ユーザ情報を取得する。このような構成とすることで、情報提示装置100の機能を既存の情報共有システム200の一機能として実現させることが可能である。
【0037】
また、図4の構成とした場合、ユーザと情報提示装置100との間や、ユーザと情報共有システム200との間は、LAN(Local Area Network)やインターネット等の計算機ネットワークを介して接続する態様としてもよい。一般的には、情報提示装置100及び情報共有システム200をサーバ装置とし、ユーザはPC(Personal Computer)等の情報処理端末を介して、サーバ装置にアクセスを行うクライアント・サーバ構成とすることが好ましい。なお、クライアント側の情報処理端末においてユーザが実際に使用するソフトウェアは、具体的には、ウェブブラウザやメーラー等のような一般的に普及しているアプリケーションソフトウェアであってよく、これらのソフトウェア上でユーザが行った操作を、履歴情報取得部22によって取得することが好ましい。
【0038】
以下、図5〜図8を参照して、前述した各情報記憶部に記憶される情報について説明する。なお、各情報記憶部に記憶された情報は、例えばリレーショナルデータベース等により、共通する項目について相互に関連付けて記憶・管理されているものとする。
【0039】
図5は、ユーザ情報記憶部12に記憶されたユーザ情報の一例を示した図である。図5に示すように、ユーザ情報は、本情報提示装置100を利用する各ユーザを識別するためのユーザID、アカウント、パスワード、氏名、メールアドレス等の項目を有している。
【0040】
ここで、アカウントとパスワードは、ユーザ認証等に用いるデータであって、情報提示装置100又は図3又は図4で示した情報共有システム200にて、ユーザ認証を行う場合、アカウントとパスワードにより、各ユーザを認証が行われるものとする。なお、本実施形態の情報提示装置100では、ユーザ認証にかかる機能部(ユーザ認証部)を備えない態様としたが、これに限らず、ユーザ認証部を別途備えた態様としてもよい。また、図3又は図4で示した情報共有システム200にてユーザ認証を行う場合には、当該情報共有システム200はユーザ認証部を備えるものとする。
【0041】
図6は、文書情報記憶部11に記憶された文書情報の一例を示した図である。ここで、文書情報は、各文書の作成にかかる種々の情報が含まれており、各文書を識別するための文書ID、文書を作成したユーザのユーザID(作成者ユーザID)、作成を行った日時(作成日時)、各文書にユニークな名称等の項目を有している。
【0042】
名称には、文書の種別や記憶管理方法に応じ、例えば電子メールの場合にはそのメッセージIDが、ファイルシステム上のファイルの場合にはそのパス名が、FTPやHTTPサービスにかかるファイルの場合にはURL等の格納場所が記述される。これらの項目の他に、例えば最終更新日時やサイズ、MIMEタイプ、タイトル等の項目を記述する態様としてもよい。また、文書の内容すなわちテキストデータ自体は、文書情報記憶部11に記憶してもよいし、上述のように、用語を抽出する処理で利用する際にのみ一時的に記憶してもよい。
【0043】
図7は、履歴情報記憶部16に記憶された履歴情報の一例を示した図である。履歴情報は、操作を行ったユーザのユーザID、操作対象となった文書の文書ID、操作が行われた日時、操作の種別を表す種別等の項目を有する。なお、文書に対する操作の種別は、「作成」と「閲覧」が一般的であるが、これらの種別に加え、例えば電子メールの場合には「返信」や「転送」といった操作、文書情報のリビジョン管理システムの場合には「改訂」の操作等、文書情報の種類に応じた操作を取得して記憶するようにしてもよい。
【0044】
図8−1及び図8−2は、用語情報記憶部14に記憶された用語情報の一例を示した図である。なお、本実施形態では、用語情報を、図8−1及び図8−2に示したような2種類のデータテーブルで構成する。
【0045】
図8−1のデータテーブルは、各文書に含まれた各々の用語について、用語毎に各用語を含む文書を対応付けて記憶しており、各用語のID(用語ID)、表記、及びこの用語を含む文書のID(文書ID)の項目から構成されている。一方、図8−2のデータテーブルは、各々の文書について、文書毎に各文書に含まれた用語を対応付けて記憶しており、各文書の文書IDと、この文書中に出現した用語の用語IDの項目から構成されている。なお、図8−2のデータテーブルに記憶される用語IDは、各文書中における出現順序に応じた順序で記憶されている。
【0046】
例えば、文書ID「d1」の内容が、「本日の会議の議題は、プロジェクトとの企画書を・・・」というテキストデータであった場合、後述する用語の抽出処理により、このテキストデータから「本日」t1、「会議」t2、「議題」t3、「プロジェクト」t4、「企画書」t5といった語が抽出され、その結果として、図8−1に示したように、t1〜t5の各用語に文書d1が対応付けて記憶される。
【0047】
また、図8−2に示したように、例えば、文書ID「d1」については、当該文書ID「d1」に含まれたt1〜t5の用語が、出現順序に応じた順序で対応付けて記憶されている。なお、本実施形態では、文書中に出現する用語を出現順序に応じて記憶する態様としたが、この態様に限らず、各用語の出現順序が分かればよく、例えば、文書中における用語の出現位置(オフセット)を記憶するようにしてもよいし、また、後述するように、用語の種類(例えば単一の形態素か、複数の形態素からなる合成語か)に応じ区別して記憶するようにしてもよい。
【0048】
次に、図9を参照して、用語情報抽出部13の動作を説明する。図9は、用語情報抽出部13において、文書から用語を抽出する際の処理(用語抽出処理)の流れを示した図である。
【0049】
まず、用語情報抽出部13は、文書情報記憶部11に記憶された文書情報からテキストデータ(いわゆるプレーンテキストと呼ばれる文字列)を取得する(ステップS11)。例えば、ワードプロセッサ等のアプリケーションにより作成された書類やプレゼンテーション資料等の文書は、リッチテキストと呼ばれる形式で作成されるが、このような文書ファイルからは、所定のAPI(アプリケーション・プログラム・インタフェース)を用いてテキストデータを取得する。また、例えばHTML形式の文書については、タグの除去等の処理を行ってテキストデータを取得する。電子メールにおいては、サブジェクト(件名)やボディ(本文)等の部分のテキストデータを取得する。
【0050】
次に、用語情報抽出部13は、テキストデータを形態素解析して、形態素及びその品詞等の情報を取得する(ステップS12)。ここで、形態素解析は、公知の技術を用いることが可能である。
【0051】
続いて用語情報抽出部13は、形態素解析されたテキストデータ(以下、形態素解析結果という)から、不要な品詞である助詞等の形態素を除き、名詞等の有用な形態素のみを抽出する(ステップS13)。
【0052】
また、テキストデータ中には、例えば組織名や書類名、商品名などの固有名が含まれることが多く、これらの語は文書を理解する上で重要である。そのため、用語情報抽出部13は、形態素解析結果に対し、一般的な情報抽出技術を用いることで、例えば「(株)○○製作所」や「ソフトウェア検査仕様書」、「RD−X11」といった特定の用語を、所定の接頭語、接尾語、文字種等に基づいて抽出する(ステップS14)。
【0053】
さらに、用語情報抽出部13は、形態素解析結果から、隣接する形態素をつなげて合成語(用語)を生成する(ステップS15)。例えば、「内部統制」「リスクマネジメント」といった言葉は、それぞれ「内部」と「統制」、「リスク」と「マネジメント」という複数の形態素から成る合成語であるが、このような語も文書を理解する上で重要であるので、ステップS15では隣接する形態素をつなげて合成語を生成する。
【0054】
次いで、用語情報抽出部13は、ステップS13、S14、S15で抽出・生成した語を、用語情報記憶部14に記憶し(ステップS16)、本処理を終了する。
【0055】
なお、上述した用語抽出処理において、ステップS13、S14、S15の処理を実行する順序は、図9の例に限らず、適宜変更可能であるものとする。
【0056】
また、ステップS15において、ある複数の形態素の組が合成語であるかどうかを判定する処理としては、公知の技術を用いることとしてもよい。例えば、各形態素が単独で出現する頻度と、隣接する形態素が共起する頻度とを比較し、後者の頻度が統計的に有意に高い場合には合成語であると見なす方法がある。このような処理は比較的多数の文書が存在することを前提とするため、ステップS15の処理は、他のステップの処理とは別に、例えば、新規に登録された文書が数百件といった規模に達した都度、まとめて実行するようにしてもよい。
【0057】
以上のステップS13、S14、S15で得られた語は、図8−1、図8−2で説明したような形態で用語情報記憶部14に記憶される。なお、上記で触れたように、例えば、単一の形態素か、複数の形態素からなる合成語か、といった区別を設けて記憶してもよい。また、ステップS14で説明した情報抽出の手法で抽出した場合には、例えば、組織名、書類名、商品名といった語の種類を表す情報を付して記憶してもよい。
【0058】
次に、図10を参照して、基準となるユーザの特性に応じて、文書に含まれた用語から、特定の用語を提示する際の動作について説明する。図10は、用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザxが、複数のユーザuからなるユーザ集合Uに新たに参加し、仕事やコミュニケーションを始めるような状況を想定している。
【0059】
まず、ユーザxから操作部5を介してユーザ集合Uが指定され、その指示信号がCPU1に入力されると(ステップS21)、用語使用頻度算出部17は、ユーザ集合U及び当該ユーザ集合Uに所属する各ユーザuについて、ベクトル算出処理(ステップS22)を実行し、後述するベクトルv[d]、v[u,DU]及びv[U,DU]を夫々導出する。
【0060】
ここで、ユーザ集合Uが共有する文書集合DUとは、例えば、各ユーザuが互いに共有する文書の集合としてもよいし、ユーザ集合Uに所属するユーザuのうち、ある人数以上のユーザが共通に使用したことのある文書の集合としてもよい。また、図3又は4で示したように外部の情報共有システム200と連携した形で本情報提示装置100を構成する場合には、情報共有システム200によって、ユーザ集合Uと、当該ユーザ集合Uが所有する文書集合DUとの範囲が定められる態様としてもよい。以下、図11を参照して、ステップS21のベクトル算出処理について説明する。
【0061】
図11は、ベクトル算出処理の手順を示したフローチャートである。まず、用語使用頻度算出部17は、下記(1)式と(2)式に基づき、ユーザ集合Uが共有する文書集合DUに含まれた各文書dについて、そのベクトルv[d]を導出する(ステップS221)。
【0062】
【数1】

【0063】
【数2】

【0064】
以下、上記(1)式と(2)式について説明する。主に情報検索の分野では、文書中に出現する語が、その文書の内容をよく表す特徴的な語であるかどうかを判断するための指標値として、上記(1)式から導出されるTF・IDFと呼ばれる語の重みが用いられている。(1)式で示したように(以下、本文中の[ ]は添え字を表す)、語tの文書dにおける重みw[t,d]は、語tが文書d中に出現する頻度tf[t,d]と、対象とする文書集合Dのうちtが出現する文書の個数df[t]と、によって導出される。ここで、|D|は対象とする文書集合D中の全文書数を意味し、(1)式におけるDは本発明では文書情報記憶部に記憶された全文書(一般にはD⊇DU)とする。ここで、tf[t,d]の値は、図8−2で説明したデータテーブルから導出されており、df[t]の値は、図8−1で説明したデータテーブルから導出される。
【0065】
なお、TF・IDFの計算式は(1)式で示した以外にもいくつか考案されているが、基本的には、tf[t,d]が大きいほど、またdf[t]が小さいほど、語tの文書dにおける重みw[t,d]は大きくなる傾向を有している。
【0066】
さらに、導出された重みw[t,d]を、上記(2)式を用いて表すことで、文書の特徴をベクトル量で表現することができる。これは情報検索の分野においてベクトル空間モデルと呼ばれるものである。ここで、mは語の異なりの数を意味し、文書dの特徴はm次元のベクトルv[d]で表現される。
【0067】
次に、用語使用頻度算出部17は、ユーザ集合Uに含まれる各ユーザuについて、下記(3)式を用い、ユーザuが操作した文書集合DU中の各文書dのベクトルv[d]に対し、操作の種類に応じた重みを乗じて和をとることで、ユーザuのベクトルv[u,DU]を導出する(ステップS222)。
【0068】
【数3】

【0069】
上記(3)式において、a[u,d]は、履歴情報記憶部16に記憶された履歴情報に基づき、ユーザuが文書dに対して行った操作の種別に応じて予め定めた定数値である。例えば、操作の種別が「作成」、「閲覧」の場合を例に挙げると、操作が文書の「作成」である場合には、文書の「閲覧」である場合と比較して、a[u,d]の値を大きな値とすることが好ましい。このように、操作の種別に応じてa[u,d]の値を定義することで、各ユーザが操作対象となった文書について持っている知識や関心の度合い(習熟度)を適切に表すことができる。なお、ユーザuが文書dに対して何も操作を行ったことのない場合はa[u,d]=0とする。また、a[u,d]を定数値とするのでなく、操作を行った日時から現在までの時間経過に応じて、例えば単調減少するような値とすることで、過去に操作してから長い時間が経過した文書に含まれる用語ほどベクトルの重みが小さくなるようにしてもよい。
【0070】
ステップS22の処理により、ユーザuが使用する用語の特徴を表すベクトルを得られる。計算の対象となるユーザが1人の場合はここで本処理を終了する。また、複数のユーザからなるユーザ集合Uについて、当該ユーザ集合Uが使用する用語の特徴を表すベクトルを得る場合には、用語使用頻度算出部17は、下記(4)式により、各ユーザuのベクトルv[u,DU]の和をとることで、ユーザ集合Uのベクトルv[U,DU]を導出し(ステップS223)、図10のステップS23に移行する。
【0071】
【数4】

【0072】
次に、用語使用頻度算出部17は、上記(1)〜(3)式に基づいて、ユーザxが使用した全文書集合Dxにおけるベクトルv[x,Dx]を算出する(ステップS23)。ここで算出されたベクトルv[x,Dx]は、ユーザxが所属するユーザ集合等に依らず、ユーザxが全般的に使用する用語の特徴を表したベクトルを意味している。
【0073】
用語情報提示部18は、ベクトルv[U,DU]とベクトルv[x,Dx]との差を求め、ベクトルvを導出する(ステップS24)。ここで、2つのベクトルの差を求める数式は下記(5)式のように表される。なお、v1はベクトルv[U,DU]に対応し、v2はベクトルv[x,Dx]に対応する。
【0074】
【数5】

【0075】
上記(5)式では、ベクトルv1とv2の差のベクトルvを求める際に、v1とv2の大きさをそれぞれ正規化してから差をとるようにしている。つまり|v1|と|v2|はそれぞれベクトルv1とv2の大きさである。
【0076】
このようにして得たベクトルvの各次元の成分の値は、(2)式で示したように、その次元に相当する用語の重みであるため、ベクトルvにおいて重みの値が大きい用語は、ユーザ集合Uにおいて使用頻度が高く、且つ、ユーザxにおいて使用頻度が低い用語となる。これはすなわち、ユーザxが、ユーザ集合Uにおける平均的なユーザと比べて、その用語についての知識や関心が少ない可能性があるということを意味する。
【0077】
したがって、用語情報提示部18は、ベクトルvの各次元に相当する用語tのうち、次元の成分の値、即ち、重みが所定値以上となった用語tを選択する(ステップS25)。そして、用語情報提示部18は、選択した用語tの各々について、その重みがv[u,DU]において所定値以上となったユーザuを、1人または複数人特定する(ステップS26)。このようにして求めたユーザuは、ユーザ集合Uの中でも特に用語tの使用頻度が高く、その用語についての知識や関心を多く持っている可能性の高いユーザ、即ちその用語についての専門家である。
【0078】
なお、ステップS25において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ベクトルv[x,Dx]における各用語の重みの2倍以上の値とするなど、ベクトルv[x,Dx]における用語の重みを上回る用語がベクトルv[U,DU]から選択される値であることが好ましい。また、ステップS26において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Uにおける各用語の重みの平均値(V1/|V1|)より大きな値とするなど、使用頻度の平均的なユーザより使用頻度の高いユーザ(即ち、専門家)が選択される値であることが好ましい。
【0079】
続いて用語情報提示部18は、ステップS25で選択した用語tと、ステップS26で特定したユーザuとを組にした情報を、表示部6に表示させることで、当該情報をユーザxに提示し(ステップS27)、本処理は終了する。
【0080】
なお、ステップS25で選択される用語tは一般には複数あり得るが、その中でも特にユーザxに提示すべき用語を提示するため、ベクトルvにおける用語tの重みをそのまま用い、この重みが大きいものから優先的に選択し、この選択順に応じた順序で提示することとしてもよい。また、別の態様としては、複数の用語のうち、使用したユーザ数が多い用語から優先的に選択し、この選択順に応じて提示することとしてもよいし、文書集合DUの文書のうち、より多くの文書に含まれた用語から優先的に選択し、この選択順に応じた順序で提示することとしてもよい。このように、ユーザxがユーザ集合Uの各ユーザとコミュニケーションを行ったり、ユーザ集合Uによって使用されている文書集合DUを閲覧して理解する上で、必要性の高い用語についての情報を優先して提示することが好ましい。
【0081】
図12は、用語情報提示部18により表示部6に提示された画面の例を示す図である。ここではより実際的な例として、図3又は4に示した、情報共有システム200と情報提示装置100とを組み合わせた構成での画面例を示す。すなわちこの例では、電子掲示板や文書共有、スケジュール共有などの機能を併せ持つウェブアプリケーションに、本情報提示装置100を具備させたシステムにおいて、ユーザ「井上」が、ある仕事上のユーザ集合「○○開発チーム」に加わって、仕事に関わる文書の共有やコミュニケーションを行うという場面での情報の提示例を示している。
【0082】
上記した用語情報提示処理により、ユーザ「井上」に対して、図12の領域A1に示したように、このユーザがあまりよく知らない可能性が高い用語として、「個人情報保護法」「××株式会社」「ウェブアプリ」などの用語が領域A11に提示されるとともに、その用語について習熟した知識と、多くの関心を持つ専門家として、「○○開発チーム」のメンバーである「山田」「佐藤」「高橋」などの人名が領域A12に提示される。これにより、ユーザ「井上」は、情報提示装置100により提示された画面を参照することで、まず、「○○開発チーム」で仕事やコミュニケーションを行う上で、領域A12に提示された用語が重要であることを認識することができる。
【0083】
さらに必要に応じて、ユーザが「山田」「佐藤」などの各用語に関する専門家に問い合わせることが可能な構成とし、これらの用語についての知識を、情報提示装置100を介して取得することとしてもよい。具体的には、情報提示装置100を、例えばインターネット上の情報検索サービスなどと連携させ、画面上に表示した用語の位置をクリックすることでその用語に関する情報をウェブページ等から検索できるようにしてもよい。
【0084】
また、図10で説明した用語情報提示処理に、いくつかの変形を加えることで、別の有用な情報提示機能を実現することができる。以下、情報提示装置の他の態様として、特定の文書dに含まれた用語のうち、ユーザxについて未習熟な用語を、その用語の専門家とともにユーザxに提示する場合の用語情報提示処理について説明する。
【0085】
図13は、特定の文書dにかかる重要な用語と、その用語の専門家をユーザxに提示する場合の用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザxが、特定の文書dを閲覧するときに、この文書dを理解する上で重要な用語とその専門家を提示するような場合を想定している。
【0086】
まず、ユーザxから操作部5等を介して、特定の文書dが指定され、その指示信号がCPU1に入力されると(ステップS31)、用語使用頻度算出部17は、所定のユーザ集合U及び当該ユーザ集合Uに所属する各ユーザuについて、ベクトル算出処理(ステップS32)を実行し、ベクトルv[d]、v[u,DU]及びv[U,DU]を夫々導出する。
【0087】
ここで、ユーザ集合Uは、操作部5等を介してユーザxにより指定された複数のユーザuから構成する態様としてもよいし、予め定められた複数のユーザuから構成する態様としてもよい。なお、ステップS32のベクトル算出処理は、上述したステップS22のベクトル算出処理と同様であるため、その説明は省略する。
【0088】
次に、用語使用頻度算出部17は、ユーザxが使用した全文書集合Dxにおけるベクトルv[x,Dx]を算出する(ステップS33)。
【0089】
用語情報提示部18は、ベクトルv[U,DU]とベクトルv[x,Dx]との差を求め、ベクトルvを導出する(ステップS34)。
【0090】
次に、用語情報提示部18は、ベクトルvとベクトルv[d]との両方で成分が0でない次元、すなわち、両方のベクトルに含まれた用語tを選択し(ステップS35)、この選択した用語tの各々について、その重みがv[u,DU]において所定値以上となったユーザuを、1人または複数人特定する(ステップS36)。
【0091】
なお、ステップS36において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Uにおける各用語の重みの平均値(V1/|V1|)より大きな値とする等、使用頻度の平均的なユーザより使用頻度の高いユーザ(即ち専門家)が選択される値であることが好ましい。
【0092】
そして、用語情報提示部18は、ステップS35で選択した用語tと、ステップS36で特定したユーザuとを組にした情報を、表示部6に表示させることで、当該情報をユーザxに提示し(ステップS37)、本処理は終了する。
【0093】
上記した図13の用語情報提示処理より提示される画面の一例を図14に示す。図14に示すように、ユーザxが閲覧している文書d(図14のD1)について、ステップS35で選択された用語、即ち、ユーザxが知らない可能性の高い用語が強調されて表示される(図14のE1〜E3参照)。また、図14の領域A2に示したように、ステップS35で選択された用語と、ステップS36で特定されたその専門家が、図12の領域A1と同様の方法で表示される。ユーザはこれらの情報を参照することで、文書を理解する上で重要な用語の存在を認識するとともに、必要に応じてその用語についての専門家に問い合わせることで、知識を得ることができる。
【0094】
さらに、図10で説明した用語情報提示処理に、いくつかの変形を加えることで、別の有用な情報提示機能を実現することができる。以下、情報提示装置の他の態様として、ユーザxが作成した特定の文書dに含まれる用語のうち、ユーザ集合Uを構成する複数のユーザのうち、特定のユーザuについて未習熟な用語を提示する際の用語情報提示処理について説明する。
【0095】
図15は、特定の文書dに含まれる用語のうち、ユーザ集合Uを構成する複数のユーザのうち、特定のユーザuについて未習熟な用語を提示する際の用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザxが作成した文書dを、あるユーザ集合Uに対して提出する際、その提出先のユーザ集合Uにとって未習熟な用語が文書d中に存在するような場合を想定している。
【0096】
まず、ユーザxが作成した文書dが、文書情報記憶部11に記憶されると(ステップS41)、用語使用頻度算出部17は、ユーザ集合U及び当該ユーザ集合Uに所属する各ユーザuについて、ベクトル算出処理(ステップS42)を実行し、ベクトルv[d]、v[u,DU]及びv[U,DU]を夫々導出する。
【0097】
ここで、ユーザ集合Uは、操作部5等を介してユーザxにより指定された複数のユーザuから構成する態様としてもよいし、予め定められた複数のユーザuから構成する態様としてもよい。なお、ステップS42のベクトル算出処理は、上述したステップS22のベクトル算出処理と同様であるため、その説明は省略する。
【0098】
次に、用語使用頻度算出部17は、ユーザxが使用した全文書集合Dxにおけるベクトルv[x,Dx]を算出する(ステップS43)。
【0099】
用語情報提示部18は、ベクトルv[U,DU]とベクトルv[x,Dx]との差を求め、ベクトルvを導出する(ステップS44)。
【0100】
次に、用語情報提示部18は、ベクトルvにおいて重みが所定値以下の用語で、且つ、ベクトルvとベクトルv[d]との両方で成分が0でない次元、すなわち、両方のベクトルに含まれた用語を選択する(ステップS45)。このようにして選択された用語tは、図10で説明した用語情報提示処理とは全く逆に、ユーザ集合Uによる使用頻度が低く、ユーザxによる使用頻度が高い用語である。
【0101】
なお、ステップS45において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、負の値とするなど、ベクトルv[x,Dx]における用語の重みを下回る用語がベクトルv[U,DU]から選択される値であることが好ましい。
【0102】
続いて用語情報提示部18は、この選択した用語tの各々について、その重みがv[u,DU]において所定値以下となるユーザuを、1人または複数人特定する(ステップS46)。なお、ステップS46において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Uにおける各用語の重みの平均値(V1/|V1|)より小さな値とするなど、使用頻度の平均的なユーザより使用頻度の低いユーザ(即ち未習熟者)が選択される値であることが好ましい。ここで求められるユーザuは、ユーザ集合Uの中でも特に用語tの使用頻度が低く、その用語についての知識や関心をほとんど持っていない可能性の高いユーザである。
【0103】
そして、用語情報提示部18は、ステップS45で選択した用語tと、ステップS46で特定したユーザuとを組にした情報を、表示部6に表示させることで、当該情報をユーザxに提示し(ステップS47)、本処理は終了する。
【0104】
上記した図15の用語情報提示処理より提示される画面の一例を図16に示す。図16に示すように、ユーザが作成した文書(図16のD2)を、他のユーザである「青木」「黒田」「白川」に提出するとき、ステップS45で選択された用語、即ち、提出先のユーザにとって理解できない可能性のある用語が、E4〜E6のような形で強調して表示されるとともに、各用語が特にどのユーザにとって理解できないかが、領域A3に提示される。
【0105】
文書を作成するユーザはこのような情報を参照することで、文書の提出先のユーザにとって適切でない用語や説明を要する用語が、文書に含まれていることを認識することができる。したがって、必要に応じて文書中に使用する用語を変えたり、用語についての説明を追加することで、より円滑な情報共有やコミュニケーションを行えるという効果を奏する。
【0106】
以上のように、本実施形態によれば、各用語毎の使用頻度に基づき、特定のユーザと他のユーザとについて、当該各用語毎の使用頻度の相対的な差異を比較し、この差異が所定値以上となった用語を選択して提示することで、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語及び他のユーザが相対的に未習熟な用語を認識させることができる。
【0107】
これにより、特定のユーザが、他のユーザや他の組織と仕事やコミュニケーションを行うときに、一方がよく使用していて他方があまり使用していない用語を認識できるとともに、仕事を行う上で知識を得ておくべき用語についてはその専門家に問い合わせたり、使用すべきでない用語については別の表現を用いる等の対処を行うことができ、仕事上の情報共有やコミュニケーションを円滑化することができるという効果を奏する。
【0108】
なお、本実施形態の情報提示装置100で実行されるプログラムは、ROM2等に予め組み込まれて提供するものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
【図面の簡単な説明】
【0109】
【図1】情報提示装置のハードウェア構成を示した図である。
【図2】情報提示装置の一実施形態の機能構成を示した図である。
【図3】情報提示装置の一実施形態の機能構成を示した図である。
【図4】情報提示装置の一実施形態の機能構成を示した図である。
【図5】ユーザ情報の一例を示した図である。
【図6】文書情報の一例を示した図である。
【図7】履歴情報の一例を示した図である。
【図8−1】用語情報の例を示した図である。
【図8−2】用語情報の例を示した図である。
【図9】用語抽出処理の流れを示したフローチャートである。
【図10】用語情報提示処理の流れの一例を示したフローチャートである。
【図11】ベクトル算出処理の流れを示したフローチャートである。
【図12】用語情報の提示を行う画面の一例を示した図である。
【図13】用語情報提示処理の流れの一例を示したフローチャートである。
【図14】用語情報の提示を行う画面の一例を示した図である。
【図15】用語情報提示処理の流れの一例を示したフローチャートである。
【図16】用語情報の提示を行う画面の一例を示した図である。
【符号の説明】
【0110】
100 情報提示装置
1 CPU
2 ROM
3 RAM
4 HDD
5 操作部
6 表示部
7 通信I/F
8 バス
11 文書情報記憶部
12 ユーザ情報記憶部
13 用語情報抽出部
14 用語情報記憶部
15 履歴情報取得部
16 履歴情報記憶部
17 用語使用頻度算出部
18 用語情報提示部
21 用語情報抽出部
22 履歴情報取得部
200 情報共有サーバ
201 文書情報記憶部
202 ユーザ情報記憶部

【特許請求の範囲】
【請求項1】
一又は複数の文書を記憶する文書情報記憶手段と、
前記文書毎に当該文書に含まれた用語を抽出する用語抽出手段と、
前記抽出された用語を、当該用語を含む文書の文書識別情報と対応付けて記憶する用語情報記憶手段と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得手段と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶手段と、
前記用語情報記憶手段に記憶された文書名毎の用語に基づき、前記履歴情報記憶手段に記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出手段と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択手段と、
前記選択された用語を提示する情報提示手段と、
を備えたことを特徴とする情報提示装置。
【請求項2】
前記用語選択手段は、前記各用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、前記特定のユーザ識別情報による使用頻度が、前記他のユーザ識別情報による使用頻度に比べて低い用語を選択することを特徴とする請求項1に記載の情報提示装置。
【請求項3】
前記選択された用語について、前記他のユーザ識別情報のうち、当該用語の使用頻度が所定値以上のユーザ識別情報を選択するユーザ選択手段をさらに備え、
前記情報提示手段は、前記選択された用語と、当該用語に対応するユーザ識別情報とを関連づけて提示することを特徴と請求項1又は2に記載の情報提示装置。
【請求項4】
前記情報提示手段は、前記選択された用語のうち、当該用語を使用したユーザ数が多い用語から、優先的に提示することを特徴とすることを特徴とする請求項1〜3の何れか一項に記載の情報提示装置。
【請求項5】
前記情報提示手段は、前記選択された用語のうち、当該用語を含む文書数が多い用語から、優先的に提示することを特徴とすることを特徴とする請求項1〜4の何れか一項に記載の情報提示装置。
【請求項6】
前記用語選択手段は、前記各用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、前記特定のユーザ識別情報による使用頻度が、前記他のユーザ識別情報による使用頻度に比べて高い用語を選択することを特徴とする請求項1に記載の情報提示装置。
【請求項7】
前記選択された用語について、前記他のユーザ識別情報のうち、当該用語の使用頻度が所定値以下のユーザ識別情報を選択するユーザ選択手段をさらに備え、
前記情報提示手段は、前記選択された用語と、当該用語に対応するユーザ識別情報とを関連づけて提示することを特徴と請求項1又は6に記載の情報提示装置。
【請求項8】
前記情報提示手段は、前記選択された用語のうち、当該用語を使用したユーザ数が少ない用語から、優先的に提示することを特徴とすることを特徴とする請求項1、6又は7の何れか一項に記載の情報提示装置。
【請求項9】
前記情報提示手段は、前記選択された用語のうち、当該用語を含む文書数が少ない用語から、優先的に提示することを特徴とすることを特徴とする請求項1、6、7又は8の何れか一項に記載の情報提示装置。
【請求項10】
コンピュータに、
一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出機能と、
前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶機能と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得機能と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶機能と、
前記用語情報記憶機能により記憶された文書名毎の用語に基づき、前記履歴情報記憶機能により記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出機能と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶機能により記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択機能と、
前記選択された用語を提示する情報提示機能と、
を実現させることを特徴とするプログラム。
【請求項11】
一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出工程と、
前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶工程と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得工程と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶工程と、
前記用語情報記憶工程で記憶された文書名毎の用語に基づき、前記履歴情報記憶工程で記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出工程と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶工程で記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択工程と、
前記選択された用語を提示する情報提示工程と
を含むことを特徴とする情報提示方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8−1】
image rotate

【図8−2】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2008−217067(P2008−217067A)
【公開日】平成20年9月18日(2008.9.18)
【国際特許分類】
【出願番号】特願2007−49433(P2007−49433)
【出願日】平成19年2月28日(2007.2.28)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】