情報提示装置、プログラム及び情報提示方法

【課題】特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させる可能な情報提示装置、プログラム及び情報提示方法を提供する。
【解決手段】一又は複数の文書に含まれた各用語の使用頻度を、当該文書を操作したユーザのユーザ名毎に算出し、この用語毎の使用頻度に基づき、特定のユーザ名と他のユーザ名とについて、当該各用語毎の使用頻度の相対的な差異を比較し、この差異が所定値以上となった用語を提示する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、組織内での情報供給に供することのできる情報提示装置、プログラム及び情報提示方法に関する。
【背景技術】
【０００２】
近年の計算機器ネットワークの普及に伴い、組織の中で複数の人が共同で仕事を行ったり、互いにコミュニケーションを行う際の情報共有の手段として、電子メールや文書データベースなどの電子的な手段が用いられることが多くなってきている。しかしながら、このような電子的な情報共有手段を用いた場合、従来のように会議の場で対面して打ち合わせを行う場合や、電話を使って相談しあう場合と比べ、円滑な情報共有が行えないことがある。例えば、あまりよく知らない人と初めてコミュニケーションを行うときや、ある仕事の担当者として新たなプロジェクトに参加したとき等、自分以外の人が作成した文書や電子メールの文面に、自分が知らない用語（専門用語、書類名、作業名、固有名など）が含まれているために、その内容を十分に理解できないことがある。また、自身が文書や電子メールを作成する際に使用した用語の意味が、相手にとって理解できないこともある。
【０００３】
組織内での情報共有方法としては、仕事やコミュニケーションを行う上で必要な用語とこれに関する知識を、例えば用語集という形で整理し、この用語集を仕事の担当者間で共有することで、情報共有の円滑化を図った方法がある。しかし、用語集を一から作成したり、新しい用語を逐次追加したりする作業は煩雑であり、労力を要するという問題があった。
【０００４】
そこで、上記の問題を解決するための技術として、ＫｎｏｗＷｈｏシステムと呼ばれるものが用いられている。このＫｎｏｗＷｈｏシステムは、一般に人手もしくは自動で作成された専門家データベース（人の氏名、連絡先等の情報と、その人が持つ専門知識を表すプロファイル等の情報とを、組にしてデータベース化したもの）を備えており、ユーザから知りたい用語などについての質問が入力されると、この質問とプロファイルとが合致する人物を専門家データベースから検索し、この人物を質問の内容について知識を持った専門家としてユーザに提示するというものである。
【０００５】
このようなＫｎｏｗＷｈｏシステムについては種々の態様が提案されており、例えば、特許文献１には、専門家データベースを陽には用いず、ユーザが入力した質問に対して、各ユーザが作成した文書等の情報を検索し、この情報から抽出される人物情報を質問について知識を持った専門家に関する情報としてユーザに提示する技術が開示されている。
【０００６】
また、上記したＫｎｏｗＷｈｏシステムや、従来の情報フィルタリングシステムなどで用いるユーザプロファイル、すなわち、各個人が持つ専門知識や関心等を表す情報を、自動的に作成するための種々の方法が提案されている。
【０００７】
また例えば、特許文献２には、ユーザが作成した文書や閲覧した文書、送受信した電子メールなどを用い、これらの複数のテキスト情報から、統計的に有意に頻出する語句を抽出し、これらの語句を、当該ユーザが持つ専門知識や関心等を表す特徴的な語句とみなし、例えばそのベクトル表現（すなわち、各々の語句をベクトルの次元とし、語句が文書中に出現した頻度などに基づいて計算した値を、各次元成分の大きさとする表現方法）によって、ユーザプロファイルを求める技術が開示されている。また、特許文献３には、複数のユーザからなる所定のユーザ集団において、各ユーザのプロファイルを、当該ユーザを特徴付けるような単語を用いて動的に作成する技術が開示されている。
【０００８】
【特許文献１】特開２００１−１１７９４０号公報
【特許文献２】特開２０００−１１３０６４号公報
【特許文献３】特開２０００−２５９５２９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００９】
ところで、不慣れな分野について理解を進める場合、ユーザは、ユーザ自身が知りたいこと、すなわち、自分は今知らないが、今後仕事やコミュニケーションを行う上で知るべきことがあるということ自体を、認識していないことが多い。このような場合、上記した特許文献１等のＫｎｏｗＷｈｏシステムを用いた技術では、ユーザは適切な検索条件を入力できないどころか、そもそもＫｎｏｗＷｈｏシステムを用いて調べるべき用語があること自体を認識できないという問題がある。また、自分は知っているが、他のユーザが知らない用語や知識について、認識することができないという問題もある。
【００１０】
また、特許文献２、３に記載の技術においても、あるユーザが有する知識や関心についての情報を提示することを目的としているため、他のユーザとの相対的な関係性については何ら考慮されておらず、例えば、ユーザ自身が現在知識や関心を持ってはいないが、今後仕事やコミュニケーションを行う上で必要となるような用語を、ユーザに認識させることができないという問題がある。また同様に、ある用語についてユーザ自身は知識や関心を持っているが、このユーザと仕事やコミュニケーションを行う相手が、その用語について知識や関心を持っていないということをユーザ自身は認識することができないという問題がある。
【００１１】
本発明は、上記に鑑みてなされたものであって、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させる可能な情報提示装置、プログラム及び情報提示方法を提供することである。
【課題を解決するための手段】
【００１２】
上述した課題を解決し、目的を達成するために、本発明は、一又は複数の文書を記憶する文書情報記憶手段と、前記文書毎に当該文書に含まれた用語を抽出する用語抽出手段と、前記抽出された用語を、当該用語を含む文書の文書識別情報と対応付けて記憶する用語情報記憶手段と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得手段と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶手段と、前記用語情報記憶手段に記憶された文書名毎の用語に基づき、前記履歴情報記憶手段に記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出手段と、前記用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択手段と、前記選択された用語を提示する情報提示手段と、を備える。
【００１３】
また、本発明は、コンピュータに、一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出機能と、前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶機能と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得機能と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶機能と、前記用語情報記憶機能により記憶された文書名毎の用語に基づき、前記履歴情報記憶機能により記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出機能と、前記用語毎の使用頻度に基づき、前記履歴情報記憶機能により記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択機能と、前記選択された用語を提示する情報提示機能と、を実現させる。
【００１４】
また、本発明は、一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出工程と、前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶工程と、前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得工程と、前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶工程と、前記用語情報記憶工程で記憶された文書名毎の用語に基づき、前記履歴情報記憶工程で記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出工程と、前記用語毎の使用頻度に基づき、前記履歴情報記憶工程で記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択工程と、前記選択された用語を提示する情報提示工程と、を含む。
【発明の効果】
【００１５】
本発明によれば、各用語毎の使用頻度に基づき、特定のユーザと他のユーザとについて、当該各用語毎の使用頻度の相対的な差異が所定値以上となった用語を選択し、提示することで、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語又は他のユーザが相対的に未習熟な用語を認識させることができる。
【発明を実施するための最良の形態】
【００１６】
以下に添付図面を参照して、情報提示装置、プログラム及び情報提示方法の最良な実施形態を詳細に説明する。
【００１７】
図１は、本実施形態の情報提示装置１００のハードウェア構成を示したブロック図である。図１に示すように、情報提示装置１００は、ＣＰＵ（Central Processing Unit）１、ＲＯＭ（Read Only Memory）２、ＲＡＭ（Random Access Memory）３、ＨＤＤ（Hard Disk Drive）４、操作部５、表示部６、通信Ｉ／Ｆ７等から構成されており、各部はバス８により接続されている。
【００１８】
ＣＰＵ１は、ＲＡＭ３の所定領域を作業領域として、ＲＯＭ２やＨＤＤ４（以下、総称して記憶部という）に予め記憶された各種制御プログラムとの協働により各種処理（例えば、後述する用語抽出処理、頻度算出処理、ベクトル算出処理、用語情報提示処理等）を実行し、情報提示装置１００を構成する各部の動作を統括的に制御する。
【００１９】
ＲＯＭ２は、情報提示装置１００の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
【００２０】
ＲＡＭ３は、ＳＤＲＡＭ（Synchronous DRAM）等の記憶装置であって、各種データを書換え可能に記憶する性質を有していることから、ＣＰＵ１の作業エリアとして機能し、バッファ等の役割を果たす。
【００２１】
ＨＤＤ４は、磁気的又は光学的に記録可能な記録媒体を有し、後述する文書情報記憶部１１、ユーザ情報記憶部１２、用語情報記憶部１４、履歴情報記憶部１６（図２参照）として機能して、各種データを記憶する。
【００２２】
操作部５は、各種入力キー等を備え、ユーザから操作入力された情報を入力信号として受け付け、その入力信号をＣＰＵ１に出力する。
【００２３】
表示部６は、ＬＣＤ（Liquid Crystal Display）等により構成され、ＣＰＵ１からの表示信号に基づいて、各種情報を表示する。なお、表示部６は、操作部５と一体的にタッチパネルを構成する態様としてもよい。
【００２４】
通信Ｉ／Ｆ７は、外部の機器（システム）との間で通信を行うインターフェースであって、外部機器から送信された各種情報をＣＰＵ１に出力し、また、ＣＰＵ１から出力される各種情報を外部機器に送信する。
【００２５】
図２は、情報提示装置１００の機能構成を示したブロック図である。図２に示すように、情報提示装置１００は、文書情報記憶部１１、ユーザ情報記憶部１２、用語情報抽出部１３、用語情報記憶部１４、履歴情報取得部１５、履歴情報記憶部１６、用語使用頻度算出部１７、用語情報提示部１８を備えている。ここで、用語情報抽出部１３、履歴情報取得部１５、用語使用頻度算出部１７及び用語情報提示部１８は、ＣＰＵ１と記憶部に予め記憶された所定のプログラムとの協働により実現される機能部である。
【００２６】
文書情報記憶部１１は、情報提示装置１００が提示する用語を含んだ文書を記憶する。また、文書情報記憶部１１は、文書の作成者や、作成日時等の情報を含んだ文書情報を記憶する。ここで、記憶の対象となる文書は、情報提示装置１００内に予め存在する文書とは限らず、図示しない計算機ネットワークを介して接続された外部の計算機上に存在する文書であってもよい。具体的には、電子メールシステムで送受信される電子メールや、外部の電子掲示板システム等で共有される記事、外部のファイルシステムや文書データベースに格納された文書等が挙げられる。これらの文書は、本情報提示装置１００を利用するユーザ自身が作成したものであってもよいし、例えば、インターネットやイントラネット上のウェブサイトが提供するウェブページ等のように、本情報提示装置１００とは独立した各々のウェブサイトにて作成され一般に公開されているものであってもよい。
【００２７】
文書情報記憶部１１では、これら文書の内容全てを永続的に記憶する必要はなく、例えば電子メール等のような文書の内容は、その送受信等の際に後述する用語情報抽出部１３によって処理を行う間だけ一時的に記憶するようにしてもよい。
【００２８】
ユーザ情報記憶部１２は、情報提示装置１００を利用するユーザの氏名やメールアドレス等のユーザに関するユーザ情報を記憶する。
【００２９】
用語情報抽出部１３は、文書情報記憶部１１に記憶された文書情報から用語を抽出する手段であり、抽出結果を用語情報として用語情報記憶部１４に記憶させる。
【００３０】
履歴情報取得部１５は、複数のユーザが文書を作成して文書情報記憶部１１に登録したり、文書情報記憶部１１に記憶されている文書を閲覧したりした際の、操作の履歴を示した履歴情報を取得する手段であり、取得した履歴情報を履歴情報記憶部１６に記憶させる。また、履歴情報取得部１５は、ユーザ情報記憶部１２からユーザ情報を取得する。
【００３１】
用語使用頻度算出部１７は、用語情報記憶部１４に記憶された用語情報と、履歴情報記憶部１６に記憶された履歴情報とを用いて、特定のユーザ又はユーザ群（以下、ユーザ集合という）によって各用語が使用された頻度を算出する。即ち、用語使用頻度算出部１７による算出結果から、どのようなユーザ又はユーザ集合が、どのような用語をどのくらいの頻度で使用しているのかを求めることができる。
【００３２】
用語情報提示部１８は、用語使用頻度算出部１７の算出結果に基づき、ユーザに対して有用な用語を表示部６に表示させるとともに、ユーザ情報記憶部１２に記憶されたユーザ情報から、その用語について習熟した専門家を特定し、表示部６に表示させることで、ユーザに情報の提示を行う。
【００３３】
なお、図２で示した情報提示装置１００の構成は、最小かつ本質的な構成である。実際に仕事やコミュニケーションを行う上でより効果的な他の態様としては、図３に示すように、情報共有システム２００と情報提示装置１００とを組み合わせた構成とすることができる。
【００３４】
ここで、情報共有システム２００は従来技術に属するものでよく、その具体例としては、ワークフロー管理システムやプロジェクト管理システム、スケジュール管理システムといった業務システムや、文書検索サービス、文書のリビジョン管理システム、あるいは、メーリングリストシステムや電子掲示板システムのようなコミュニケーションシステム等が挙げられる。
【００３５】
このような情報共有システム２００では、一般的に当該情報共有システム２００を利用するユーザ情報を記憶・管理する記憶装置（ユーザ情報記憶部）や、文書情報を記憶する記憶装置（文書情報記憶部）が備えられている。また、ユーザは、情報共有システム２００を用いて、文書の作成や登録、閲覧といった操作を行うため、履歴情報取得部１５は、文書に対する操作の履歴情報を情報共有システム２００を介して取得する。
【００３６】
図４は、本実施形態の他の態様を示した図である。図４に示したように、情報共有システム２００は、図２に示した情報提示装置１００の文書情報記憶部１１及びユーザ情報記憶部１２に相当する各記憶装置（文書情報記憶部２０１、ユーザ情報記憶部２０２）を備えている。また、情報提示装置１００の、用語情報抽出部２１は、情報共有システム２００の文書情報記憶部２０１に記憶された文書情報（文書）から用語を抽出する。さらに、履歴情報取得部２２は、文書に対する操作の履歴情報を情報共有システム２００を介して取得するとともに、情報共有システム２００のユーザ情報記憶部２０２から、ユーザ情報を取得する。このような構成とすることで、情報提示装置１００の機能を既存の情報共有システム２００の一機能として実現させることが可能である。
【００３７】
また、図４の構成とした場合、ユーザと情報提示装置１００との間や、ユーザと情報共有システム２００との間は、ＬＡＮ（Local Area Network）やインターネット等の計算機ネットワークを介して接続する態様としてもよい。一般的には、情報提示装置１００及び情報共有システム２００をサーバ装置とし、ユーザはＰＣ（Personal Computer）等の情報処理端末を介して、サーバ装置にアクセスを行うクライアント・サーバ構成とすることが好ましい。なお、クライアント側の情報処理端末においてユーザが実際に使用するソフトウェアは、具体的には、ウェブブラウザやメーラー等のような一般的に普及しているアプリケーションソフトウェアであってよく、これらのソフトウェア上でユーザが行った操作を、履歴情報取得部２２によって取得することが好ましい。
【００３８】
以下、図５〜図８を参照して、前述した各情報記憶部に記憶される情報について説明する。なお、各情報記憶部に記憶された情報は、例えばリレーショナルデータベース等により、共通する項目について相互に関連付けて記憶・管理されているものとする。
【００３９】
図５は、ユーザ情報記憶部１２に記憶されたユーザ情報の一例を示した図である。図５に示すように、ユーザ情報は、本情報提示装置１００を利用する各ユーザを識別するためのユーザＩＤ、アカウント、パスワード、氏名、メールアドレス等の項目を有している。
【００４０】
ここで、アカウントとパスワードは、ユーザ認証等に用いるデータであって、情報提示装置１００又は図３又は図４で示した情報共有システム２００にて、ユーザ認証を行う場合、アカウントとパスワードにより、各ユーザを認証が行われるものとする。なお、本実施形態の情報提示装置１００では、ユーザ認証にかかる機能部（ユーザ認証部）を備えない態様としたが、これに限らず、ユーザ認証部を別途備えた態様としてもよい。また、図３又は図４で示した情報共有システム２００にてユーザ認証を行う場合には、当該情報共有システム２００はユーザ認証部を備えるものとする。
【００４１】
図６は、文書情報記憶部１１に記憶された文書情報の一例を示した図である。ここで、文書情報は、各文書の作成にかかる種々の情報が含まれており、各文書を識別するための文書ＩＤ、文書を作成したユーザのユーザＩＤ（作成者ユーザＩＤ）、作成を行った日時（作成日時）、各文書にユニークな名称等の項目を有している。
【００４２】
名称には、文書の種別や記憶管理方法に応じ、例えば電子メールの場合にはそのメッセージＩＤが、ファイルシステム上のファイルの場合にはそのパス名が、ＦＴＰやＨＴＴＰサービスにかかるファイルの場合にはＵＲＬ等の格納場所が記述される。これらの項目の他に、例えば最終更新日時やサイズ、ＭＩＭＥタイプ、タイトル等の項目を記述する態様としてもよい。また、文書の内容すなわちテキストデータ自体は、文書情報記憶部１１に記憶してもよいし、上述のように、用語を抽出する処理で利用する際にのみ一時的に記憶してもよい。
【００４３】
図７は、履歴情報記憶部１６に記憶された履歴情報の一例を示した図である。履歴情報は、操作を行ったユーザのユーザＩＤ、操作対象となった文書の文書ＩＤ、操作が行われた日時、操作の種別を表す種別等の項目を有する。なお、文書に対する操作の種別は、「作成」と「閲覧」が一般的であるが、これらの種別に加え、例えば電子メールの場合には「返信」や「転送」といった操作、文書情報のリビジョン管理システムの場合には「改訂」の操作等、文書情報の種類に応じた操作を取得して記憶するようにしてもよい。
【００４４】
図８−１及び図８−２は、用語情報記憶部１４に記憶された用語情報の一例を示した図である。なお、本実施形態では、用語情報を、図８−1及び図８−２に示したような２種類のデータテーブルで構成する。
【００４５】
図８−1のデータテーブルは、各文書に含まれた各々の用語について、用語毎に各用語を含む文書を対応付けて記憶しており、各用語のＩＤ（用語ＩＤ）、表記、及びこの用語を含む文書のＩＤ（文書ＩＤ）の項目から構成されている。一方、図８−２のデータテーブルは、各々の文書について、文書毎に各文書に含まれた用語を対応付けて記憶しており、各文書の文書ＩＤと、この文書中に出現した用語の用語ＩＤの項目から構成されている。なお、図８−２のデータテーブルに記憶される用語ＩＤは、各文書中における出現順序に応じた順序で記憶されている。
【００４６】
例えば、文書ＩＤ「ｄ１」の内容が、「本日の会議の議題は、プロジェクトとの企画書を・・・」というテキストデータであった場合、後述する用語の抽出処理により、このテキストデータから「本日」ｔ１、「会議」ｔ２、「議題」ｔ３、「プロジェクト」ｔ４、「企画書」ｔ５といった語が抽出され、その結果として、図８−１に示したように、ｔ１〜ｔ５の各用語に文書ｄ１が対応付けて記憶される。
【００４７】
また、図８−２に示したように、例えば、文書ＩＤ「ｄ１」については、当該文書ＩＤ「ｄ１」に含まれたｔ１〜ｔ５の用語が、出現順序に応じた順序で対応付けて記憶されている。なお、本実施形態では、文書中に出現する用語を出現順序に応じて記憶する態様としたが、この態様に限らず、各用語の出現順序が分かればよく、例えば、文書中における用語の出現位置（オフセット）を記憶するようにしてもよいし、また、後述するように、用語の種類（例えば単一の形態素か、複数の形態素からなる合成語か）に応じ区別して記憶するようにしてもよい。
【００４８】
次に、図９を参照して、用語情報抽出部１３の動作を説明する。図９は、用語情報抽出部１３において、文書から用語を抽出する際の処理（用語抽出処理）の流れを示した図である。
【００４９】
まず、用語情報抽出部１３は、文書情報記憶部１１に記憶された文書情報からテキストデータ（いわゆるプレーンテキストと呼ばれる文字列）を取得する（ステップＳ１１）。例えば、ワードプロセッサ等のアプリケーションにより作成された書類やプレゼンテーション資料等の文書は、リッチテキストと呼ばれる形式で作成されるが、このような文書ファイルからは、所定のＡＰＩ（アプリケーション・プログラム・インタフェース）を用いてテキストデータを取得する。また、例えばＨＴＭＬ形式の文書については、タグの除去等の処理を行ってテキストデータを取得する。電子メールにおいては、サブジェクト（件名）やボディ（本文）等の部分のテキストデータを取得する。
【００５０】
次に、用語情報抽出部１３は、テキストデータを形態素解析して、形態素及びその品詞等の情報を取得する（ステップＳ１２）。ここで、形態素解析は、公知の技術を用いることが可能である。
【００５１】
続いて用語情報抽出部１３は、形態素解析されたテキストデータ（以下、形態素解析結果という）から、不要な品詞である助詞等の形態素を除き、名詞等の有用な形態素のみを抽出する（ステップＳ１３）。
【００５２】
また、テキストデータ中には、例えば組織名や書類名、商品名などの固有名が含まれることが多く、これらの語は文書を理解する上で重要である。そのため、用語情報抽出部１３は、形態素解析結果に対し、一般的な情報抽出技術を用いることで、例えば「（株）○○製作所」や「ソフトウェア検査仕様書」、「ＲＤ−Ｘ１１」といった特定の用語を、所定の接頭語、接尾語、文字種等に基づいて抽出する（ステップＳ１４）。
【００５３】
さらに、用語情報抽出部１３は、形態素解析結果から、隣接する形態素をつなげて合成語（用語）を生成する（ステップＳ１５）。例えば、「内部統制」「リスクマネジメント」といった言葉は、それぞれ「内部」と「統制」、「リスク」と「マネジメント」という複数の形態素から成る合成語であるが、このような語も文書を理解する上で重要であるので、ステップＳ１５では隣接する形態素をつなげて合成語を生成する。
【００５４】
次いで、用語情報抽出部１３は、ステップＳ１３、Ｓ１４、Ｓ１５で抽出・生成した語を、用語情報記憶部１４に記憶し（ステップＳ１６）、本処理を終了する。
【００５５】
なお、上述した用語抽出処理において、ステップＳ１３、Ｓ１４、Ｓ１５の処理を実行する順序は、図９の例に限らず、適宜変更可能であるものとする。
【００５６】
また、ステップＳ１５において、ある複数の形態素の組が合成語であるかどうかを判定する処理としては、公知の技術を用いることとしてもよい。例えば、各形態素が単独で出現する頻度と、隣接する形態素が共起する頻度とを比較し、後者の頻度が統計的に有意に高い場合には合成語であると見なす方法がある。このような処理は比較的多数の文書が存在することを前提とするため、ステップＳ１５の処理は、他のステップの処理とは別に、例えば、新規に登録された文書が数百件といった規模に達した都度、まとめて実行するようにしてもよい。
【００５７】
以上のステップＳ１３、Ｓ１４、Ｓ１５で得られた語は、図８−１、図８−２で説明したような形態で用語情報記憶部１４に記憶される。なお、上記で触れたように、例えば、単一の形態素か、複数の形態素からなる合成語か、といった区別を設けて記憶してもよい。また、ステップＳ１４で説明した情報抽出の手法で抽出した場合には、例えば、組織名、書類名、商品名といった語の種類を表す情報を付して記憶してもよい。
【００５８】
次に、図１０を参照して、基準となるユーザの特性に応じて、文書に含まれた用語から、特定の用語を提示する際の動作について説明する。図１０は、用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザｘが、複数のユーザｕからなるユーザ集合Ｕに新たに参加し、仕事やコミュニケーションを始めるような状況を想定している。
【００５９】
まず、ユーザｘから操作部５を介してユーザ集合Ｕが指定され、その指示信号がＣＰＵ１に入力されると（ステップＳ２１）、用語使用頻度算出部１７は、ユーザ集合Ｕ及び当該ユーザ集合Ｕに所属する各ユーザｕについて、ベクトル算出処理（ステップＳ２２）を実行し、後述するベクトルｖ［ｄ］、ｖ［ｕ，ＤＵ］及びｖ［Ｕ，ＤＵ］を夫々導出する。
【００６０】
ここで、ユーザ集合Ｕが共有する文書集合ＤＵとは、例えば、各ユーザｕが互いに共有する文書の集合としてもよいし、ユーザ集合Ｕに所属するユーザｕのうち、ある人数以上のユーザが共通に使用したことのある文書の集合としてもよい。また、図３又は４で示したように外部の情報共有システム２００と連携した形で本情報提示装置１００を構成する場合には、情報共有システム２００によって、ユーザ集合Ｕと、当該ユーザ集合Ｕが所有する文書集合ＤＵとの範囲が定められる態様としてもよい。以下、図１１を参照して、ステップＳ２１のベクトル算出処理について説明する。
【００６１】
図１１は、ベクトル算出処理の手順を示したフローチャートである。まず、用語使用頻度算出部１７は、下記（１）式と（２）式に基づき、ユーザ集合Ｕが共有する文書集合ＤＵに含まれた各文書ｄについて、そのベクトルｖ［ｄ］を導出する（ステップＳ２２１）。
【００６２】
【数１】

【００６３】
【数２】

【００６４】
以下、上記（１）式と（２）式について説明する。主に情報検索の分野では、文書中に出現する語が、その文書の内容をよく表す特徴的な語であるかどうかを判断するための指標値として、上記（１）式から導出されるＴＦ・ＩＤＦと呼ばれる語の重みが用いられている。（１）式で示したように（以下、本文中の［］は添え字を表す）、語ｔの文書ｄにおける重みｗ［ｔ，ｄ］は、語ｔが文書ｄ中に出現する頻度ｔｆ［ｔ，ｄ］と、対象とする文書集合Ｄのうちｔが出現する文書の個数ｄｆ［ｔ］と、によって導出される。ここで、｜Ｄ｜は対象とする文書集合Ｄ中の全文書数を意味し、（１）式におけるＤは本発明では文書情報記憶部に記憶された全文書（一般にはＤ⊇ＤＵ）とする。ここで、ｔｆ［ｔ，ｄ］の値は、図８−２で説明したデータテーブルから導出されており、ｄｆ［ｔ］の値は、図８−１で説明したデータテーブルから導出される。
【００６５】
なお、ＴＦ・ＩＤＦの計算式は（１）式で示した以外にもいくつか考案されているが、基本的には、ｔｆ［ｔ，ｄ］が大きいほど、またｄｆ［ｔ］が小さいほど、語ｔの文書ｄにおける重みｗ［ｔ，ｄ］は大きくなる傾向を有している。
【００６６】
さらに、導出された重みｗ［ｔ，ｄ］を、上記（２）式を用いて表すことで、文書の特徴をベクトル量で表現することができる。これは情報検索の分野においてベクトル空間モデルと呼ばれるものである。ここで、ｍは語の異なりの数を意味し、文書ｄの特徴はｍ次元のベクトルｖ［ｄ］で表現される。
【００６７】
次に、用語使用頻度算出部１７は、ユーザ集合Ｕに含まれる各ユーザｕについて、下記（３）式を用い、ユーザｕが操作した文書集合ＤＵ中の各文書ｄのベクトルｖ［ｄ］に対し、操作の種類に応じた重みを乗じて和をとることで、ユーザｕのベクトルｖ［ｕ，ＤＵ］を導出する（ステップＳ２２２）。
【００６８】
【数３】

【００６９】
上記（３）式において、ａ［ｕ，ｄ］は、履歴情報記憶部１６に記憶された履歴情報に基づき、ユーザｕが文書ｄに対して行った操作の種別に応じて予め定めた定数値である。例えば、操作の種別が「作成」、「閲覧」の場合を例に挙げると、操作が文書の「作成」である場合には、文書の「閲覧」である場合と比較して、ａ［ｕ，ｄ］の値を大きな値とすることが好ましい。このように、操作の種別に応じてａ［ｕ，ｄ］の値を定義することで、各ユーザが操作対象となった文書について持っている知識や関心の度合い（習熟度）を適切に表すことができる。なお、ユーザｕが文書ｄに対して何も操作を行ったことのない場合はａ［ｕ，ｄ］＝０とする。また、ａ［ｕ，ｄ］を定数値とするのでなく、操作を行った日時から現在までの時間経過に応じて、例えば単調減少するような値とすることで、過去に操作してから長い時間が経過した文書に含まれる用語ほどベクトルの重みが小さくなるようにしてもよい。
【００７０】
ステップＳ２２の処理により、ユーザｕが使用する用語の特徴を表すベクトルを得られる。計算の対象となるユーザが１人の場合はここで本処理を終了する。また、複数のユーザからなるユーザ集合Ｕについて、当該ユーザ集合Ｕが使用する用語の特徴を表すベクトルを得る場合には、用語使用頻度算出部１７は、下記（４）式により、各ユーザｕのベクトルｖ［ｕ，ＤＵ］の和をとることで、ユーザ集合Ｕのベクトルｖ［Ｕ，ＤＵ］を導出し（ステップＳ２２３）、図１０のステップＳ２３に移行する。
【００７１】
【数４】

【００７２】
次に、用語使用頻度算出部１７は、上記（１）〜（３）式に基づいて、ユーザｘが使用した全文書集合Ｄｘにおけるベクトルｖ［ｘ，Ｄｘ］を算出する（ステップＳ２３）。ここで算出されたベクトルｖ［ｘ，Ｄｘ］は、ユーザｘが所属するユーザ集合等に依らず、ユーザｘが全般的に使用する用語の特徴を表したベクトルを意味している。
【００７３】
用語情報提示部１８は、ベクトルｖ［Ｕ，ＤＵ］とベクトルｖ［ｘ，Ｄｘ］との差を求め、ベクトルｖを導出する（ステップＳ２４）。ここで、２つのベクトルの差を求める数式は下記（５）式のように表される。なお、ｖ１はベクトルｖ［Ｕ，ＤＵ］に対応し、ｖ２はベクトルｖ［ｘ，Ｄｘ］に対応する。
【００７４】
【数５】

【００７５】
上記（５）式では、ベクトルｖ１とｖ２の差のベクトルｖを求める際に、ｖ１とｖ２の大きさをそれぞれ正規化してから差をとるようにしている。つまり｜ｖ１｜と｜ｖ２｜はそれぞれベクトルｖ１とｖ２の大きさである。
【００７６】
このようにして得たベクトルｖの各次元の成分の値は、（２）式で示したように、その次元に相当する用語の重みであるため、ベクトルｖにおいて重みの値が大きい用語は、ユーザ集合Ｕにおいて使用頻度が高く、且つ、ユーザｘにおいて使用頻度が低い用語となる。これはすなわち、ユーザｘが、ユーザ集合Ｕにおける平均的なユーザと比べて、その用語についての知識や関心が少ない可能性があるということを意味する。
【００７７】
したがって、用語情報提示部１８は、ベクトルｖの各次元に相当する用語ｔのうち、次元の成分の値、即ち、重みが所定値以上となった用語ｔを選択する（ステップＳ２５）。そして、用語情報提示部１８は、選択した用語ｔの各々について、その重みがｖ［ｕ，ＤＵ］において所定値以上となったユーザｕを、１人または複数人特定する（ステップＳ２６）。このようにして求めたユーザｕは、ユーザ集合Ｕの中でも特に用語ｔの使用頻度が高く、その用語についての知識や関心を多く持っている可能性の高いユーザ、即ちその用語についての専門家である。
【００７８】
なお、ステップＳ２５において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ベクトルｖ［ｘ，Ｄｘ］における各用語の重みの２倍以上の値とするなど、ベクトルｖ［ｘ，Ｄｘ］における用語の重みを上回る用語がベクトルｖ［Ｕ，ＤＵ］から選択される値であることが好ましい。また、ステップＳ２６において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Ｕにおける各用語の重みの平均値（Ｖ１／｜Ｖ１｜）より大きな値とするなど、使用頻度の平均的なユーザより使用頻度の高いユーザ（即ち、専門家）が選択される値であることが好ましい。
【００７９】
続いて用語情報提示部１８は、ステップＳ２５で選択した用語ｔと、ステップＳ２６で特定したユーザｕとを組にした情報を、表示部６に表示させることで、当該情報をユーザｘに提示し（ステップＳ２７）、本処理は終了する。
【００８０】
なお、ステップＳ２５で選択される用語ｔは一般には複数あり得るが、その中でも特にユーザｘに提示すべき用語を提示するため、ベクトルｖにおける用語ｔの重みをそのまま用い、この重みが大きいものから優先的に選択し、この選択順に応じた順序で提示することとしてもよい。また、別の態様としては、複数の用語のうち、使用したユーザ数が多い用語から優先的に選択し、この選択順に応じて提示することとしてもよいし、文書集合ＤＵの文書のうち、より多くの文書に含まれた用語から優先的に選択し、この選択順に応じた順序で提示することとしてもよい。このように、ユーザｘがユーザ集合Ｕの各ユーザとコミュニケーションを行ったり、ユーザ集合Ｕによって使用されている文書集合ＤＵを閲覧して理解する上で、必要性の高い用語についての情報を優先して提示することが好ましい。
【００８１】
図１２は、用語情報提示部１８により表示部６に提示された画面の例を示す図である。ここではより実際的な例として、図３又は４に示した、情報共有システム２００と情報提示装置１００とを組み合わせた構成での画面例を示す。すなわちこの例では、電子掲示板や文書共有、スケジュール共有などの機能を併せ持つウェブアプリケーションに、本情報提示装置１００を具備させたシステムにおいて、ユーザ「井上」が、ある仕事上のユーザ集合「○○開発チーム」に加わって、仕事に関わる文書の共有やコミュニケーションを行うという場面での情報の提示例を示している。
【００８２】
上記した用語情報提示処理により、ユーザ「井上」に対して、図１２の領域Ａ１に示したように、このユーザがあまりよく知らない可能性が高い用語として、「個人情報保護法」「××株式会社」「ウェブアプリ」などの用語が領域Ａ１１に提示されるとともに、その用語について習熟した知識と、多くの関心を持つ専門家として、「○○開発チーム」のメンバーである「山田」「佐藤」「高橋」などの人名が領域Ａ１２に提示される。これにより、ユーザ「井上」は、情報提示装置１００により提示された画面を参照することで、まず、「○○開発チーム」で仕事やコミュニケーションを行う上で、領域Ａ１２に提示された用語が重要であることを認識することができる。
【００８３】
さらに必要に応じて、ユーザが「山田」「佐藤」などの各用語に関する専門家に問い合わせることが可能な構成とし、これらの用語についての知識を、情報提示装置１００を介して取得することとしてもよい。具体的には、情報提示装置１００を、例えばインターネット上の情報検索サービスなどと連携させ、画面上に表示した用語の位置をクリックすることでその用語に関する情報をウェブページ等から検索できるようにしてもよい。
【００８４】
また、図１０で説明した用語情報提示処理に、いくつかの変形を加えることで、別の有用な情報提示機能を実現することができる。以下、情報提示装置の他の態様として、特定の文書ｄに含まれた用語のうち、ユーザｘについて未習熟な用語を、その用語の専門家とともにユーザｘに提示する場合の用語情報提示処理について説明する。
【００８５】
図１３は、特定の文書ｄにかかる重要な用語と、その用語の専門家をユーザｘに提示する場合の用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザｘが、特定の文書ｄを閲覧するときに、この文書ｄを理解する上で重要な用語とその専門家を提示するような場合を想定している。
【００８６】
まず、ユーザｘから操作部５等を介して、特定の文書ｄが指定され、その指示信号がＣＰＵ１に入力されると（ステップＳ３１）、用語使用頻度算出部１７は、所定のユーザ集合Ｕ及び当該ユーザ集合Ｕに所属する各ユーザｕについて、ベクトル算出処理（ステップＳ３２）を実行し、ベクトルｖ［ｄ］、ｖ［ｕ，ＤＵ］及びｖ［Ｕ，ＤＵ］を夫々導出する。
【００８７】
ここで、ユーザ集合Ｕは、操作部５等を介してユーザｘにより指定された複数のユーザｕから構成する態様としてもよいし、予め定められた複数のユーザｕから構成する態様としてもよい。なお、ステップＳ３２のベクトル算出処理は、上述したステップＳ２２のベクトル算出処理と同様であるため、その説明は省略する。
【００８８】
次に、用語使用頻度算出部１７は、ユーザｘが使用した全文書集合Ｄｘにおけるベクトルｖ［ｘ，Ｄｘ］を算出する（ステップＳ３３）。
【００８９】
用語情報提示部１８は、ベクトルｖ［Ｕ，ＤＵ］とベクトルｖ［ｘ，Ｄｘ］との差を求め、ベクトルｖを導出する（ステップＳ３４）。
【００９０】
次に、用語情報提示部１８は、ベクトルｖとベクトルｖ［ｄ］との両方で成分が０でない次元、すなわち、両方のベクトルに含まれた用語ｔを選択し（ステップＳ３５）、この選択した用語ｔの各々について、その重みがｖ［ｕ，ＤＵ］において所定値以上となったユーザｕを、１人または複数人特定する（ステップＳ３６）。
【００９１】
なお、ステップＳ３６において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Ｕにおける各用語の重みの平均値（Ｖ１／｜Ｖ１｜）より大きな値とする等、使用頻度の平均的なユーザより使用頻度の高いユーザ（即ち専門家）が選択される値であることが好ましい。
【００９２】
そして、用語情報提示部１８は、ステップＳ３５で選択した用語ｔと、ステップＳ３６で特定したユーザｕとを組にした情報を、表示部６に表示させることで、当該情報をユーザｘに提示し（ステップＳ３７）、本処理は終了する。
【００９３】
上記した図１３の用語情報提示処理より提示される画面の一例を図１４に示す。図１４に示すように、ユーザｘが閲覧している文書ｄ（図１４のＤ１）について、ステップＳ３５で選択された用語、即ち、ユーザｘが知らない可能性の高い用語が強調されて表示される（図１４のＥ１〜Ｅ３参照）。また、図１４の領域Ａ２に示したように、ステップＳ３５で選択された用語と、ステップＳ３６で特定されたその専門家が、図１２の領域Ａ１と同様の方法で表示される。ユーザはこれらの情報を参照することで、文書を理解する上で重要な用語の存在を認識するとともに、必要に応じてその用語についての専門家に問い合わせることで、知識を得ることができる。
【００９４】
さらに、図１０で説明した用語情報提示処理に、いくつかの変形を加えることで、別の有用な情報提示機能を実現することができる。以下、情報提示装置の他の態様として、ユーザｘが作成した特定の文書ｄに含まれる用語のうち、ユーザ集合Ｕを構成する複数のユーザのうち、特定のユーザｕについて未習熟な用語を提示する際の用語情報提示処理について説明する。
【００９５】
図１５は、特定の文書ｄに含まれる用語のうち、ユーザ集合Ｕを構成する複数のユーザのうち、特定のユーザｕについて未習熟な用語を提示する際の用語情報提示処理の手順を示したフローチャートである。なお、本処理では、基準となるユーザｘが作成した文書ｄを、あるユーザ集合Ｕに対して提出する際、その提出先のユーザ集合Ｕにとって未習熟な用語が文書ｄ中に存在するような場合を想定している。
【００９６】
まず、ユーザｘが作成した文書ｄが、文書情報記憶部１１に記憶されると（ステップＳ４１）、用語使用頻度算出部１７は、ユーザ集合Ｕ及び当該ユーザ集合Ｕに所属する各ユーザｕについて、ベクトル算出処理（ステップＳ４２）を実行し、ベクトルｖ［ｄ］、ｖ［ｕ，ＤＵ］及びｖ［Ｕ，ＤＵ］を夫々導出する。
【００９７】
ここで、ユーザ集合Ｕは、操作部５等を介してユーザｘにより指定された複数のユーザｕから構成する態様としてもよいし、予め定められた複数のユーザｕから構成する態様としてもよい。なお、ステップＳ４２のベクトル算出処理は、上述したステップＳ２２のベクトル算出処理と同様であるため、その説明は省略する。
【００９８】
次に、用語使用頻度算出部１７は、ユーザｘが使用した全文書集合Ｄｘにおけるベクトルｖ［ｘ，Ｄｘ］を算出する（ステップＳ４３）。
【００９９】
用語情報提示部１８は、ベクトルｖ［Ｕ，ＤＵ］とベクトルｖ［ｘ，Ｄｘ］との差を求め、ベクトルｖを導出する（ステップＳ４４）。
【０１００】
次に、用語情報提示部１８は、ベクトルｖにおいて重みが所定値以下の用語で、且つ、ベクトルｖとベクトルｖ［ｄ］との両方で成分が０でない次元、すなわち、両方のベクトルに含まれた用語を選択する（ステップＳ４５）。このようにして選択された用語ｔは、図１０で説明した用語情報提示処理とは全く逆に、ユーザ集合Ｕによる使用頻度が低く、ユーザｘによる使用頻度が高い用語である。
【０１０１】
なお、ステップＳ４５において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、負の値とするなど、ベクトルｖ［ｘ，Ｄｘ］における用語の重みを下回る用語がベクトルｖ［Ｕ，ＤＵ］から選択される値であることが好ましい。
【０１０２】
続いて用語情報提示部１８は、この選択した用語ｔの各々について、その重みがｖ［ｕ，ＤＵ］において所定値以下となるユーザｕを、１人または複数人特定する（ステップＳ４６）。なお、ステップＳ４６において、重み判定の指標となる所定値は、任意の値が設定可能であるものとするが、例えば、ユーザ集合Ｕにおける各用語の重みの平均値（Ｖ１／｜Ｖ１｜）より小さな値とするなど、使用頻度の平均的なユーザより使用頻度の低いユーザ（即ち未習熟者）が選択される値であることが好ましい。ここで求められるユーザｕは、ユーザ集合Ｕの中でも特に用語ｔの使用頻度が低く、その用語についての知識や関心をほとんど持っていない可能性の高いユーザである。
【０１０３】
そして、用語情報提示部１８は、ステップＳ４５で選択した用語ｔと、ステップＳ４６で特定したユーザｕとを組にした情報を、表示部６に表示させることで、当該情報をユーザｘに提示し（ステップＳ４７）、本処理は終了する。
【０１０４】
上記した図１５の用語情報提示処理より提示される画面の一例を図１６に示す。図１６に示すように、ユーザが作成した文書（図１６のＤ２）を、他のユーザである「青木」「黒田」「白川」に提出するとき、ステップＳ４５で選択された用語、即ち、提出先のユーザにとって理解できない可能性のある用語が、Ｅ４〜Ｅ６のような形で強調して表示されるとともに、各用語が特にどのユーザにとって理解できないかが、領域Ａ３に提示される。
【０１０５】
文書を作成するユーザはこのような情報を参照することで、文書の提出先のユーザにとって適切でない用語や説明を要する用語が、文書に含まれていることを認識することができる。したがって、必要に応じて文書中に使用する用語を変えたり、用語についての説明を追加することで、より円滑な情報共有やコミュニケーションを行えるという効果を奏する。
【０１０６】
以上のように、本実施形態によれば、各用語毎の使用頻度に基づき、特定のユーザと他のユーザとについて、当該各用語毎の使用頻度の相対的な差異を比較し、この差異が所定値以上となった用語を選択して提示することで、特定のユーザが他のユーザとの情報共有を行うに際し、当該特定のユーザが相対的に未習熟な用語及び他のユーザが相対的に未習熟な用語を認識させることができる。
【０１０７】
これにより、特定のユーザが、他のユーザや他の組織と仕事やコミュニケーションを行うときに、一方がよく使用していて他方があまり使用していない用語を認識できるとともに、仕事を行う上で知識を得ておくべき用語についてはその専門家に問い合わせたり、使用すべきでない用語については別の表現を用いる等の対処を行うことができ、仕事上の情報共有やコミュニケーションを円滑化することができるという効果を奏する。
【０１０８】
なお、本実施形態の情報提示装置１００で実行されるプログラムは、ＲＯＭ２等に予め組み込まれて提供するものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
【図面の簡単な説明】
【０１０９】
【図１】情報提示装置のハードウェア構成を示した図である。
【図２】情報提示装置の一実施形態の機能構成を示した図である。
【図３】情報提示装置の一実施形態の機能構成を示した図である。
【図４】情報提示装置の一実施形態の機能構成を示した図である。
【図５】ユーザ情報の一例を示した図である。
【図６】文書情報の一例を示した図である。
【図７】履歴情報の一例を示した図である。
【図８−１】用語情報の例を示した図である。
【図８−２】用語情報の例を示した図である。
【図９】用語抽出処理の流れを示したフローチャートである。
【図１０】用語情報提示処理の流れの一例を示したフローチャートである。
【図１１】ベクトル算出処理の流れを示したフローチャートである。
【図１２】用語情報の提示を行う画面の一例を示した図である。
【図１３】用語情報提示処理の流れの一例を示したフローチャートである。
【図１４】用語情報の提示を行う画面の一例を示した図である。
【図１５】用語情報提示処理の流れの一例を示したフローチャートである。
【図１６】用語情報の提示を行う画面の一例を示した図である。
【符号の説明】
【０１１０】
１００情報提示装置
１ＣＰＵ
２ＲＯＭ
３ＲＡＭ
４ＨＤＤ
５操作部
６表示部
７通信Ｉ／Ｆ
８バス
１１文書情報記憶部
１２ユーザ情報記憶部
１３用語情報抽出部
１４用語情報記憶部
１５履歴情報取得部
１６履歴情報記憶部
１７用語使用頻度算出部
１８用語情報提示部
２１用語情報抽出部
２２履歴情報取得部
２００情報共有サーバ
２０１文書情報記憶部
２０２ユーザ情報記憶部

【特許請求の範囲】
【請求項１】
一又は複数の文書を記憶する文書情報記憶手段と、
前記文書毎に当該文書に含まれた用語を抽出する用語抽出手段と、
前記抽出された用語を、当該用語を含む文書の文書識別情報と対応付けて記憶する用語情報記憶手段と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得手段と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶手段と、
前記用語情報記憶手段に記憶された文書名毎の用語に基づき、前記履歴情報記憶手段に記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出手段と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択手段と、
前記選択された用語を提示する情報提示手段と、
を備えたことを特徴とする情報提示装置。
【請求項２】
前記用語選択手段は、前記各用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、前記特定のユーザ識別情報による使用頻度が、前記他のユーザ識別情報による使用頻度に比べて低い用語を選択することを特徴とする請求項１に記載の情報提示装置。
【請求項３】
前記選択された用語について、前記他のユーザ識別情報のうち、当該用語の使用頻度が所定値以上のユーザ識別情報を選択するユーザ選択手段をさらに備え、
前記情報提示手段は、前記選択された用語と、当該用語に対応するユーザ識別情報とを関連づけて提示することを特徴と請求項１又は２に記載の情報提示装置。
【請求項４】
前記情報提示手段は、前記選択された用語のうち、当該用語を使用したユーザ数が多い用語から、優先的に提示することを特徴とすることを特徴とする請求項１〜３の何れか一項に記載の情報提示装置。
【請求項５】
前記情報提示手段は、前記選択された用語のうち、当該用語を含む文書数が多い用語から、優先的に提示することを特徴とすることを特徴とする請求項１〜４の何れか一項に記載の情報提示装置。
【請求項６】
前記用語選択手段は、前記各用語毎の使用頻度に基づき、前記履歴情報記憶手段に記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、前記特定のユーザ識別情報による使用頻度が、前記他のユーザ識別情報による使用頻度に比べて高い用語を選択することを特徴とする請求項１に記載の情報提示装置。
【請求項７】
前記選択された用語について、前記他のユーザ識別情報のうち、当該用語の使用頻度が所定値以下のユーザ識別情報を選択するユーザ選択手段をさらに備え、
前記情報提示手段は、前記選択された用語と、当該用語に対応するユーザ識別情報とを関連づけて提示することを特徴と請求項１又は６に記載の情報提示装置。
【請求項８】
前記情報提示手段は、前記選択された用語のうち、当該用語を使用したユーザ数が少ない用語から、優先的に提示することを特徴とすることを特徴とする請求項１、６又は７の何れか一項に記載の情報提示装置。
【請求項９】
前記情報提示手段は、前記選択された用語のうち、当該用語を含む文書数が少ない用語から、優先的に提示することを特徴とすることを特徴とする請求項１、６、７又は８の何れか一項に記載の情報提示装置。
【請求項１０】
コンピュータに、
一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出機能と、
前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶機能と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得機能と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶機能と、
前記用語情報記憶機能により記憶された文書名毎の用語に基づき、前記履歴情報記憶機能により記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出機能と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶機能により記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択機能と、
前記選択された用語を提示する情報提示機能と、
を実現させることを特徴とするプログラム。
【請求項１１】
一又は複数の文書毎に当該文書に含まれた用語を抽出する用語抽出工程と、
前記抽出された用語を、当該用語を含む文書の文書名と対応付けて記憶する用語情報記憶工程と、
前記文書に対する操作の履歴を示した履歴情報を取得する履歴情報取得工程と、
前記履歴情報を、当該操作を指示したユーザのユーザ識別情報と、操作対象となった文書の文書識別情報と対応付けて記憶する履歴情報記憶工程と、
前記用語情報記憶工程で記憶された文書名毎の用語に基づき、前記履歴情報記憶工程で記憶されたユーザ識別情報毎に、当該ユーザ識別情報に対応付けられた文書識別情報の文書に含まれる用語毎の使用頻度を夫々算出する使用頻度算出工程と、
前記用語毎の使用頻度に基づき、前記履歴情報記憶工程で記憶された特定のユーザ識別情報と他のユーザ識別情報とについて、当該用語毎の使用頻度の相対的な差異を算出し、この差異が所定値以上となった用語を選択する用語選択工程と、
前記選択された用語を提示する情報提示工程と
を含むことを特徴とする情報提示方法。

【図１】