説明

計算機、文書提示方法及び文書提示プログラム

【課題】情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示する計算機を提供する。
【解決手段】文書を格納する文書データベースに接続された計算機であって、プロセッサは、文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、興味語を第1ワード、抽出された単語を第2ワードとした場合における第1ワードと、第2ワードとに基づいて、文書の見出しを作成し、作成された見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、計算機、文書提示方法及び文書提示プログラムに関し、計算機の利用者に対して文書を提示する技術に関する。
【背景技術】
【0002】
計算機を使用して作業する作業者に対して、作業の助けとなるような文書(補助資料)を計算機上で提示することによって、作業を支援する技術が知られている(特許文献1参照)。特許文献1には、見出しを付与した文書を提示することによって、作業者の取捨選択や情報に対する概要把握を支援する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−117790号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された技術において文書に付与される見出しは、作業者の作業状況を考慮したものではない。そのため、情報の取捨選択の判断材料として適切でない問題があった。
【0005】
本発明は、上述した課題を考慮したものであって、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示する計算機を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。
【0007】
本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機であって、前記プロセッサは、前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする。
【発明の効果】
【0008】
本発明によれば、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示することができる。
【0009】
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態の計算機システムの利用者の操作概要を示すフローチャートである。
【図2】本発明の実施形態の計算機システムの構成例を説明する図である。
【図3】本発明の実施形態の計算機システムのハードウェア構成例を示す図である。
【図4A】本発明の実施形態の個人作業状態データの例を示す図である。
【図4B】本発明の実施形態の個人作業履歴データの例を示す図である。
【図4C】本発明の実施形態の個人プロフィールデータの例を示す図である。
【図5】本発明の実施形態の情報提供サーバの全体処理を示すフローチャートである。
【図6】本発明の実施形態の熟練度判定部の制御ロジックを示すフローチャートである。
【図7】本発明の実施形態の多義性解決部の制御ロジックを示すフローチャートである。
【図8】本発明の実施形態の因果抽出部の制御ロジックを示すフローチャートである。
【図9】本発明の実施形態の因果抽出部によって作成される因果ネットワークデータの例を説明する図である。
【図10】本発明の実施形態の興味語抽出部の制御ロジックを示すフローチャートである。
【図11】本発明の実施形態の見出し作成部の制御ロジックを示すフローチャートである。
【図12】本発明の実施形態の見出し作成部によって作成される見出しの一例を示す図である。
【図13】本発明の実施形態の見出しリスト表示部の制御ロジックを示すフローチャートである。
【図14】本発明の実施形態の見出しリスト表示部による表示画面の例を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について図面を参照して説明する。
【0012】
本発明の実施形態の計算機システム1(図2参照)では、製造現場においてクライアントコンピュータ40を用いて作業する作業者(以下、「利用者」という。)に、過去の不具合事例や作業ノウハウに関する文書を提示することによって、不具合再発防止や作業の効率化を実現する。
【0013】
図1は、本発明の実施形態の計算機システム1の利用者の操作概要を示すフローチャートである。利用者の操作概要について、図2を適宜参照して説明する。
【0014】
はじめに、利用者は、業務管理システムクライアント402を介して、業務管理システム201にログインし、ユーザIDを入力する(S101)。その後、クライアントコンピュータ40の出力部(ディスプレイ等)に業務の一覧が提示されるので、利用者は実行する業務を選択し、業務を開始する(S102)。そうすると、クライアントコンピュータ40上で、選択された業務の作業状態に関連する情報の見出し一覧が表示される(S103)。
【0015】
利用者は、表示された見出し一覧の中で、興味を引く見出しがあるか否かを判断する(S104)。興味を引く見出しがある場合(S104でYES)、利用者は、この見出しを選択し、情報提供サーバ10から業務に有用な情報を取得する(S105)。一方、興味を引く見出しがない場合(S104でNO)、利用者は業務を継続する(S106)。
【0016】
その後、業務中の場合(S107でNO)、ステップ103に戻る。この場合、表示される見出し一覧が、その時点における業務の作業状態に応じて更新される。一方、業務が終了すると(S107でYES)、利用者は業務管理システム201からログアウトする(S108)。
【0017】
以下、ステップ103の処理、すなわち見出し一覧の表示方法について説明する。
【0018】
図2は、本発明の実施形態の計算機システム1の構成例を説明する図である。
【0019】
図2において、実線長方形で示すブロック(熟練度判定部101等)は、プログラムモジュールである。平行四辺形で示すブロック(ユーザID111等)は、データである。破線長方形で示すブロック(業務管理システム201等)は、情報提供サーバ10と別の独立した外部システムである。円柱で示すブロック(業務情報DB50等)は、データベースである。
【0020】
計算機システム1は、情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40、業務情報DB50、個人情報DB60、文書DB70を備える。
【0021】
情報提供サーバ10は、クライアントコンピュータ40に見出し付き文書データ118を提供するコンピュータ装置である。この情報提供サーバ10は、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105を備える。各機能部については詳細に後述する。
【0022】
この情報提供サーバ10は、業務管理サーバ20から受信したユーザID111に基づいて、業務管理サーバ20を介して又は介さずに、業務情報DB50、個人情報DB60から、それぞれ個人作業状態データ112、個人プロフィールデータ114を入力する。
【0023】
業務管理サーバ20は、クライアントコンピュータ40からの要求に応じて、業務管理システムクライアント402にサービスを提供する業務管理システム201を備えたコンピュータ装置である。この業務管理サーバ20は、クライアントコンピュータ40から、利用者のユーザID411、業務の作業状態に関するデータ412を受信する。
【0024】
検索サーバ30は、情報を検索する検索エンジン301を備えたコンピュータ装置である。この検索サーバ30は、情報提供サーバ10から興味語データ117を受信し、興味語データ117に基づいて、文書DB70中に記録された文書データに対して検索を実行し、検索結果として抽出される文書データ311を情報提供サーバ10に送信する。
【0025】
クライアントコンピュータ40は、見出しリスト表示部401、業務管理システムクライアント402を備えたコンピュータ装置である。利用者は、クライアントコンピュータ40を用いて自身の業務を実行する。
【0026】
業務情報DB50は、クライアントコンピュータ40の各利用者によって遂行される業務に関する情報(業務名、関連文書一覧、関連語一覧等、詳細は後述)が記録されたデータベースである。個人情報DB60は、クライアントコンピュータ40の各利用者の個人プロフィールデータ114が記録されたデータベースである。文書DB70は、各種文書データが記録されたデータベースである。
【0027】
図3は、本発明の実施形態の計算機システム1のハードウェア構成例を説明する図である。なお、図3では、図2と同様の機能を果たす部分には同一の符号を付して重複する説明を適宜省略する。
【0028】
図3に示す計算機システム1は、ネットワーク80を介して互いに接続された情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40を備える。なお、ネットワーク80は、LAN(Local Area Network)、WAN(Wide Area Network)、又は、インターネット等のグローバルネットワークである。
【0029】
以下、各装置のハードウェア構成について説明する。
【0030】
情報提供サーバ10は、ネットワークインタフェース11、CPU(Central Processing Unit)12、主記憶装置13、二次記憶装置14、及び、これらを相互に接続するバス15を備える。
【0031】
ネットワークインタフェース11は、情報提供サーバ10がネットワーク80に接続するためのインタフェースである。CPU12は、主記憶装置13に記憶されているプログラムを実行する演算処理装置である。主記憶装置13は、CPU12によって実行されるプログラム、及び、プログラムの実行に必要なデータを記憶するRAM(Random Access Memory)等の記憶装置である。プログラムとは、例えば、不図示のOS(Operating System)である。二次記憶装置14は、ハードディスク装置などの磁気記憶媒体である。
【0032】
業務管理サーバ20、検索サーバ30、クライアントコンピュータ40のそれぞれのハードウェア構成は、情報提供サーバ10と同様であるとして、ここでは説明を省略する。
【0033】
図4Aは、本発明の実施形態の個人作業状態データ112の例を示す図である。
【0034】
個人作業状態データ112は、各利用者の作業状態を示すデータである。この個人作業状態データ112は、業務ID112A、作成中文書112B、閲覧中文書112C、検索エンジン状態112Dを含む。
【0035】
業務ID112Aとは、利用者が従事している業務を一意に識別する識別子である。この業務ID112Aは、あらかじめ工場内又は製造工程内の全ての業務に振られている。作成中文書112Bとは、利用者が作業時間中にクライアントコンピュータ40上で作成している文書、例えば設計図、仕様書等である。この作成中文書112Bは、常駐ソフトによる監視や、一定のタイミングで業務管理サーバ20にアップロードする規則の制定などによって取得される。閲覧中文書112Cとは、利用者が作業時間中にクライアントコンピュータ40上で閲覧している文書、例えば仕様書、手順書、Webページ等である。この閲覧中文書112Cは、常駐ソフトによる監視や、ブラウザの履歴の抽出などによって取得される。検索エンジン状態112Dとは、検索エンジン301に入力された単語や検索オプションのことである。この検索エンジン状態112Dは、常駐ソフトによる監視やブラウザからの情報抽出によって取得される。
【0036】
図4Bは、本発明の実施形態の個人作業履歴データ113の例を示す図である。
【0037】
個人作業履歴データ113は、各利用者の作業状態の履歴を示すデータである。この個人作業履歴データ113は、作成文書履歴113A、閲覧文書履歴113Bを含む。
【0038】
作成文書履歴113Aとは、個人作業状態データ112の作成中文書112Bのうち、同じ業務IDの作成中文書112Bに、時刻情報を加えたものである。閲覧文書履歴113Bとは、個人作業状態データ112の閲覧中文書112Cのうち、同じ業務IDの閲覧中文書112Cに、時刻情報を加えたものである。
【0039】
図4Cは、本発明の実施形態の個人プロフィールデータ114の例を示す図である。
【0040】
個人プロフィールデータ114は、各利用者のプロフィールを示すデータである。この個人プロフィールデータ114は、担当業務データ114A、所属部署データ114B、過去作成文書データ114C、過去閲覧文書データ114Dを含む。
【0041】
担当業務データ114Aとは、利用者の担当業務に関するデータである。この担当業務データ114Aは、担当業務の業務名、担当業務に関連する文書(以下、「関連文書」という。)の一覧と関連係数、担当業務に関連する語(以下、「関連語」という。)の一覧と関連係数、担当業務に関連する業務のID(以下、「関連業務ID」という。)の一覧、担当業務の担当期間を含む。関連係数とは、業務に携わる全ての利用者の閲覧文書や作成文書における単語の出現頻度を用いること等によって算出される。この担当業務データ114Aは、業務IDを用いて読み出すことができる。
【0042】
所属部署データ114Bとは、利用者の所属部署に関するデータである。この所属部署データ114Bは、所属部署の部署名、所属部署の関連業務IDの一覧と関連係数、所属部署の所属メンバの一覧、所属部署における所属期間を含む。過去作成文書データ114Cとは、業務IDに関わらず過去の全ての作成文書に、時刻情報を加えたものである。過去閲覧文書データ114Dとは、業務IDに関わらず過去の全ての閲覧文書に、時刻情報を加えたものである。
【0043】
図5は、本発明の実施形態の情報提供サーバ10の全体処理を示すフローチャートである。ここでは、情報提供サーバ10の全体処理について、図2を適宜参照して説明する。
【0044】
はじめに、利用者がクライアントコンピュータ40を用いて業務管理システム201にログインすると、情報提供サーバ10はユーザID111を受理する(S501)。以降ステップ502〜504の処理により、情報提供サーバ10は、ステップ501で受理したユーザID111をキーとして、各情報を読み出す。
【0045】
ステップ502において、情報提供サーバ10は、業務管理システム201から、利用者の担当業務の業務IDを受理する(S502)。その後ステップ503において、因果ネットワークデータ106を読み出す(S503)。因果ネットワークデータ106とは、文書DB70内の複数の文書に含まれる事象の因果関係を表すネットワーク構造のデータである。図9を用いて詳細に後述する。
【0046】
その後ステップ504において、情報提供サーバ10は、個人情報DB60から個人プロフィールデータ114を読み出す(S504)。その後ステップ505において、情報提供サーバ10(熟練度判定部101)は、ステップ504で読み出された個人プロフィールデータ114を基に、利用者の熟練度を計算する(S505)。このステップ505の処理については、図6を用いて詳細に後述する。
【0047】
その後ステップ506において、情報提供サーバ10は、業務管理システム201から、その時点での個人作業状態データ112を受理する(S506)。
【0048】
その後ステップ507において、情報提供サーバ10は、個人作業履歴データ113を更新する(S507)。具体的には、ステップ506で受信した個人作業状態データ112に含まれる作成中文書112B、閲覧中文書112Cを、個人作業履歴データ113に追加する。その後ステップ508において、興味語抽出部102が、利用者の興味語を抽出する(S508)。このステップ508の処理については、図10を用いて詳細に後述する。
【0049】
その後ステップ509において、情報提供サーバ10は、ステップ508で抽出された興味語に基づき、当該興味語に関連する文書を、文書DB70から検索する(S509)。ここでは、既存の検索エンジン301を用いて検索する。興味語に関連する文書とは、興味語と因果関係にあるキーワードを有する文書である。その後ステップ510において、多義性解決部103が、興味語の多義性を解決する(S510)。このステップ510の処理については、図7を用いて詳細に後述する。
【0050】
その後ステップ511において、見出し作成部105が、ステップ509で検索された文書に対して付与する見出しを作成する(S511)。このステップ511の処理については、図11を用いて詳細に後述する。
【0051】
その後ステップ512において、見出しリスト表示部401は、ステップ511で作成された見出しを、出力部(ディスプレイ等)に表示することによって、利用者に提示する(S512)。
【0052】
その後ステップ513において、情報提供サーバ10は、利用者の入力を受け付ける(S513)。ここでいう利用者の入力とは、ステップ512で提示された見出しに対する利用者の閲覧要求である。その後ステップ514において、情報提供サーバ10は、文書閲覧要求があるか否かを判定する(S514)。
【0053】
文書閲覧要求がある場合(S514でYES)、情報提供サーバ10は、当該要求に対応する文書を提示し(S515)、ステップ512に戻って処理を繰り返す。一方、文書閲覧要求がない場合(S514でNO)、情報提供サーバ10は、待機状態になり、利用者がログアウトしたか否かを判定する(S516)。
【0054】
ログアウトした場合(S516でYES)、情報提供サーバ10の待機状態は終了し、処理を終了する。一方、ログアウトしていない場合(S516でNO)、情報提供サーバ10は、個人作業状態データ112が変化したか否か(更新されたか否か)を判定する(S517)。個人作業状態データ112が変化した場合(S517でYES)、ステップ506へ戻って処理を繰り返す。個人作業状態データ112が変化していない場合(S517でNO)、ステップ516へ戻って処理を繰り返す。
【0055】
以下、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105、見出しリスト表示部401の処理フローについて説明する。
【0056】
図6は、本発明の実施形態の熟練度判定部101の制御ロジックを示すフローチャートである。ここでは、図5のステップ505の処理について、図2を適宜参照して説明する。
【0057】
はじめに、熟練度判定部101は、ユーザID111をキーに、個人情報DB60から個人プロフィールデータ114を読み込む(S601)。次に、業務管理システム201から業務IDを受信し、受信した業務IDをキーに、業務情報DB50から業務関連語一覧を読み込む(S602)。
【0058】
その後ステップ603において、熟練度判定部101は、ステップ601で読み込まれた個人プロフィールデータ114内の過去作成文書データ114Cが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S603)。その後ステップ604において、ステップ601で読み込まれた個人プロフィールデータ114内の過去閲覧文書データ114Dが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S604)。
【0059】
その後ステップ605において、熟練度判定部101は、個人プロフィールデータ114内の所属部署データ114Bのうち、関連業務ID一覧と所属期間を取得する(S605)。その後ステップ606において、個人プロフィールデータ114内の担当業務データ114Aのうち、関連業務IDと担当期間を取得する(S606)。その後ステップ607において、取得された各種データに基づき、式(1)に従って、業務IDで示される業務に対する利用者の熟練度を計算し、利用者熟練度データ115として出力する(S607)。
【0060】
【数1】

【0061】
式(1)は、業務に対する利用者の熟練度を算出するための式である。式(1)において、部署関連度(業務ID、部署ID)とは、部署への所属期間による関連業務への知識習得度(業務と部署の関連の深さ)である。Lとは、部署や業務に従事した期間と、関連知識の習熟度との相関を示す習熟関数である。L(所属期間(部署ID))とは、部署に所属した期間による業務への習熟度である。L(担当期間(業務ID))とは、業務に従事した期間による業務への習熟度である。p(w)は、過去に作成した文書(過去作成文書データ114C)における業務関連語の出現頻度である。D(w)は、業務IDの関連語一覧に基づく単語の専門性である。すなわち、Σ(p(w)×D(w))は、過去に作成した文書から推定される業務への習熟度である。なお、過去に作成した文書が業務関連語を多く含むほど、習熟度は高いと判断される。q(w)は、過去に閲覧した文書(過去閲覧文書データ114D)における業務関連語の出現頻度である。すなわち、Σ(q(w)×D(w))は、過去に閲覧した文書から推定される業務への習熟度である。なお、過去に閲覧した文書が業務関連語を多く含むほど、習熟度は高いと判断される。また、α、β、γ、δは、それぞれα≧0、β≧0、γ≧δ≧0の定数である。
【0062】
以上に示す処理により、熟練度判定部101は、業務に対する利用者の熟練度を判定し、数値化することができる。
【0063】
図7は、本発明の実施形態の多義性解決部103の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。
【0064】
はじめに、多義性解決部103は、個人作業履歴データ113、因果ネットワークデータ106、興味語データ116を読み込む(S701〜S703)。次にステップ704において、入力された興味語データ116が因果ネットワークデータ106(図9参照)内の2箇所以上のノードに登場するかどうかを判定する(S704)。
【0065】
1箇所以下のノードに登場する場合(S704でNO)、この興味語データ116が新出単語、又は一つの意味しかない単語であるので、ステップ705に進み、多義性解決部103は、この興味語データ116をそのまま出力し(S705)、処理を終了する。一方、2箇所以上(複数)のノードに登場する場合(S704でYES)、複数のノードのそれぞれについて、式(2)によって、ノードの文脈適合度を計算する(S706)。文脈適合度とは、文書における興味語の適合性を示す指標である。
【0066】
【数2】

【0067】
式(2)は、ノードの文脈適合度を計算するための式である。式(2)において、d(w、i)は、個人作業履歴データ113に登場する単語wと、興味語データ116で示される興味語iとの、因果ネットワークデータ106上の(意味的)距離である。このd(
w、i)は、ノードと単語とが強い因果関係にあるほど小さな値になる。t(w)は、単
語wが最後に文脈に登場してからの経過時間(文脈内での時間的距離)である。C1、C2は定数である。なお、該当する興味語のノードの近辺に位置する単語が、個人作業履歴データ113上に多く登場するほど、及び、個人作業履歴データ113上での登場時刻が新しいほど、式(2)によって計算される文脈適合度は高くなる。
【0068】
その後ステップ707において、多義性解決部103は、ステップ706で計算された各ノードの文脈適合度を比較し、文脈適合度の高いノードを採用する(S707)。その後ステップ708において、ステップ707で採用されたノード(意味を限定した興味語)を出力する(S708)。
【0069】
以上に示す処理により、多義性解決部103は、興味語が複数の意味を有する場合、この多義性を解決して、最も適した興味語に意味を限定し、この興味語を出力することができる。
【0070】
図8は、本発明の実施形態の因果抽出部104の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。
【0071】
はじめに、因果抽出部104は、文書DB70から未処理の文書(処理対象の文書)を一つ読み出す(S801)。次にステップ802において、因果抽出部104は、ステップ601で読み出された文書から、因果関係を有する単語ペアを一つ抽出する(S802)。
【0072】
その後ステップ803において、因果抽出部104は、抽出された単語ペアを構成する2単語が、共に因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S803)。
【0073】
2単語が共に登録されている場合(S803でYES)、ステップ804に進み、因果抽出部104は、登録されている二つのノードをリンク(リンクの強度1)で結合する(S804)。リンクの強度とは、ノード間の因果関係の強さを示す指標である。なお、このステップ804では、既に二つのノードがリンクで結合されている場合、リンクの強度に1を加算する。一方、2単語共に登録されてはいない場合(S803でNO)、ステップ805に進み、因果抽出部104は、いずれか片方の単語が因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S805)。
【0074】
片方の単語のみ登録されている場合(S805でYES)、ステップ806に進み、因果抽出部104は、登録されていない方の単語を新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S806)。一方、2単語がいずれも登録されていない場合(S805でNO)、ステップ807に進み、因果抽出部104は、2単語をそれぞれ新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S807)。
【0075】
その後ステップ808により、因果抽出部104は、因果関係を有する他の単語ペアがあるか否かを判定し(S808)、他の単語ペアがある場合(S808でYES)、ステップ802に戻って処理を繰り返す。またステップ809により、因果抽出部104は、文書DB70に未処理の文書があるか否かを判定し(S809)、他の未処理の文書がある場合(S809でYES)、ステップ801に戻って処理を繰り返す。
【0076】
以上に示す処理により、因果抽出部104は、文書DB70中の全ての文書における単語間の因果関係を抽出し、因果ネットワークデータ106を作成する。
【0077】
特に、製造現場における技術文書から因果関係を抽出することによって、設計支援、不具合の原因究明、不良の再発防止等の目的で過去の文書を活用することができる。
【0078】
図9は、本発明の実施形態の因果抽出部104によって作成される因果ネットワークデータ106の例を説明する図である。因果抽出部104は、文書DB70に格納された製造現場における事故・不良報告書に基づいて、図9に示すような因果ネットワークデータ106を作成する。
【0079】
図9において、長方形はノードを示している。また、矢印はリンク、すなわちノード間の因果関係を表している。例えば「摩擦901」と「発熱902」とは、「摩擦901」が「発熱902」を引き起こす因果関係であることを示している。また、「発熱902」と「部品変形903」とは、「発熱902」が「部品変形903」を引き起こす因果関係であることを示している。
【0080】
図10は、本発明の実施形態の興味語抽出部102の制御ロジックを示すフローチャートである。ここでは、図5のステップ508の処理について、図2を適宜参照して説明する。
【0081】
はじめに、興味語抽出部102は、個人作業状態データ112を読み込む(S1001)。次にステップ1002において、利用者熟練度データ115を読み込む(S1002)。その後ステップ1003において、個人作業履歴データ113を読み込む(S1003)。その後ステップ1004において、興味語候補を初期化する(S1004)。興味語候補とは、興味語抽出部102が興味語を抽出するための候補となる興味語群である。
【0082】
その後ステップ1005〜1008により、興味語抽出部102は、個人プロフィールデータ114中の関連語一覧、個人作業状態データ112中の作成中文書112B内の特徴語、閲覧中文書112C内の特徴語、検索エンジン状態112D中の検索エンジン301に入力された検索式に含まれる単語を、興味語候補に加える(S1005〜1008)。ここで、文書内の特徴語とは、その文書内に多く含まれるなど、文書との関連の高い単語のことであり、例えばTF(Term Frequency)−IDF(Inverse Document Frequency)の高い単語を特徴語として扱うことができる。TF(Term Frequency)−IDF(Inverse Document Frequency)とは、文書中の特徴語らしさを表す値であって、TFをDF(Document Frequency)で除算することによって求められる。TFは、該当文書中の単語の出現頻度である。DFは、全文書中の単語の出現頻度である。その後ステップ1009において、興味語抽出部102は、全ての興味語候補のそれぞれの興味度を、式(3)に従って計算する(S809)。興味度とは、興味語に対する利用者の興味の度合いを示す指標である。
【0083】
【数3】

【0084】
式(3)は、興味語候補の興味度を算出するための式である。式(3)において、業務関連係数とは、業務IDによって呼び出される関連語の関連係数である。利用者熟練度とは、ステップ1002で読み込まれた利用者熟練度データ115である。適正熟練度とは、単語の専門性であり、その単語に興味を持つ可能性が高い利用者の熟練度である。専門性の高い単語は出現頻度が低いと仮定すれば、単語の専門性は、DFに基づいて算出することができる。
【0085】
検索式内重要度とは、検索式における単語の各々に割り振られる単語の重要度である。例えば検索式がAND検索である場合、ANDで結ばれた各単語に重要度を等分に分配する。一方、検索式がOR検索の場合、ORで結ばれた各単語に重要度を等分せずにそのまま付する。
【0086】
例えば検索式が(A∨B)∧C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、0.5)である。また、検索式が(A∧B)∨C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、1.0)である。また、α、β、γ、δ、εは、それぞれ0以上の定数である。
【0087】
この式(3)によれば、作業中の業務に関連が深い単語、作成文書中や閲覧文書中で特に多く出現する単語、作業者の熟練度と同程度の専門性を持つ単語、作業者が検索システムを使っている場合は検索式に含まれる単語ほど、興味度が高くなる。
【0088】
その後ステップ810において、興味語抽出部102は、興味度が一定以上の興味語候補を抽出し、興味語データ116として出力する(S810)。
【0089】
以上に示す処理により、興味語抽出部102は、個人作業履歴データ113、個人プロフィールデータ114等に基づいて、その時点において利用者が興味を持つ可能性が高い単語を抽出することができる。
【0090】
図11は、本発明の実施形態の見出し作成部105の制御ロジックを示すフローチャートである。ここでは、図5のステップ511の処理について、図2を適宜参照して説明する。
【0091】
はじめに、見出し作成部105は、因果ネットワークデータ106を読み込む(S1101)。次にステップ1102において、検索エンジン301による検索結果の文書データ311と、興味語データ117に示される興味語(以下、「検索語」という。)とのセットを読み込む(S1102)。
【0092】
その後ステップ1103において、見出し作成部105は、因果ネットワークデータ106上で、検索語と一定距離内の因果関係にある単語を抽出する(S1103)。その後ステップ1104において、検索語を第1ワード、ステップ1103で抽出された単語を第2ワードとする(S1104)。
【0093】
具体的には、利用者とコンテンツとの関連性の根拠となる興味語を、第1ワードとする。この第1ワードは複数でもよい。利用者が実行中の業務に関連する単語、作成中文書内の単語、閲覧文書履歴の特徴語、検索キーワード等が第1ワードの候補である。このような第1ワードを見出しの一部にすることによって、提示するコンテンツに対する納得感(透過性)を高めることができる。次に、コンテンツの内容において、第1ワードと最も関係の深い第2ワードを決定する。
【0094】
その後ステップ1105において、見出し作成部105は、第1ワード、第2ワード、補間表現を組み合わせて文書の見出しを作成する(S1105)。ここでの補間表現とは、第1ワードと第2ワードとの因果関係を表す、「〜による…」、「〜を原因とする…」、「〜を引き起こす…」のような表現を示す。
【0095】
このように、見出し作成部105は、第1ワードと第2ワードを組み合わせ、これらのワードの関係性を表す表現を補間して見出しを作成する。例えば製造現場における技術文書を扱う場合、技術文書は、原因、現象、対策の構造を有する確率が高い。文書の中で、第1ワードと原因−現象、原因−対策、現象−対策のいずれかの関係にある単語を、第2ワードとして選択する。
【0096】
図12は、本発明の実施形態の見出し作成部105によって作成される見出しの一例を示す図である。
【0097】
第1ワード(興味語)が「短絡」、第2ワードが「経年動作」である場合、作成される見出しは、図12に示すように「経年動作による短絡」となる。また、第2ワードが複数(「ボルト緩み」、「局部過熱」、「ボルト通電」、「溶融物」等)抽出された場合、作成される見出しも複数(「ボルト緩みによる短絡」、「局部過熱による短絡」、「ボルト通電による短絡」、「溶融物による短絡」等)である。一つの文書から複数の見出しが作成された場合、他の文書にも多く登場する因果関係の見出しを優先する。つまり、因果ネットワークデータ106上で最もリンク強度の強い2単語によって作成された見出し(図12に示す例では、「溶融物による短絡」)を採用する。第1ワードと第2ワードとを直接結ぶリンクがない場合、経由する全てのリンクの強度の逆数の総和を計算し、逆数の総和を因果関係の強弱を判定するための指標としてもよい。
【0098】
図11に戻り、その後ステップ1106において、見出し作成部105は、ステップ1105で作成された見出しを文書に付与し、見出し付き文書データ118として出力する(S1106)。その後ステップ1107において、検索結果の他の文書があるか否かを判定し(S1107)、他の文書がある場合(S1107でYES)、ステップ1102に戻って処理を繰り返す。
【0099】
以上に示す処理により、見出し作成部105は、利用者の作業状況や知識に適合した見出しを作成し、作成された見出しを文書に付与して出力する。なお、見出し作成部105は、複数のコンテンツから同一の見出しを作成する場合がある。この場合、これら複数のコンテンツを、同質のコンテンツとして同一の見出しを付与してグルーピングしてもよい。これにより、内容が重複する文書の閲覧を防ぐことができる。
【0100】
図13は、本発明の実施形態の見出しリスト表示部401の制御ロジックを示すフローチャートである。ここでは図5のステップ512の処理について、図2を適宜参照して説明する。
【0101】
はじめに、見出しリスト表示部401は、見出し作成部105から出力された見出し付き文書データ118を全て読み込む(S1301)。次にステップ1302において、ステップ1301で読み込まれた見出し付き文書データ118のうち、重複しない全ての見出しを表示する(S1302)。その後ステップ1303において、利用者の入力を待機する(S1303)。
【0102】
その後ステップ1304において、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が二つ以上ある場合(S1305でYES)、見出しリスト表示部401は、一つの文書を表示し、さらに閲覧要求があった場合に他の文書を表示する(S1306)。
【0103】
一方、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が一つである場合(S1305でNO)、見出しリスト表示部401は、当該見出しに対応する文書を表示する(S1307)。文書を表示した後は、ステップ1303に戻って、再び利用者の入力を待機する。なお、ステップ1304において、利用者の閲覧要求がない場合(S1304でNO)、処理を終了する。
【0104】
以上に示す処理により、見出しリスト表示部401は、見出し作成部105によって作成された見出し付き文書データ118を表示する。
【0105】
図14は、本発明の実施形態の見出しリスト表示部401による表示画面1401の例を示す図である。
【0106】
図14に示す表示画面1401において、タイトル1402には、見出し作成部105によって作成された見出しが表示される。本文確認ボタン1403は、タイトル1402に対応する文書の本文を確認するためのボタンである。事業者名1404、製品名1405には、タイトル1402に関する事業者名、製品名が表示される。関連ワード1406には、タイトル1402に関連するワードが表示される。
【0107】
図14に示すような表示画面1401を表示することにより、利用者は、表示された情報の要不要を迅速且つ正確に判断することができる。
【0108】
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一つを示したものであり、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。本発明の要旨を逸脱しない範囲において種々変更可能である。
【符号の説明】
【0109】
1 計算機システム
10 情報提供サーバ
20 業務管理サーバ
30 検索サーバ
40 クライアントコンピュータ
50 業務情報DB
60 個人情報DB
70 文書DB
101 熟練度判定部
102 興味語抽出部
103 多義性解決部
104 因果抽出部
105 見出し作成部
106 因果ネットワークデータ
112 個人作業状態データ
113 個人作業履歴データ
114 個人プロフィールデータ
115 利用者熟練度データ
116 興味語データ
118 見出し付き文書データ
401 見出しリスト表示部

【特許請求の範囲】
【請求項1】
プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機であって、
前記プロセッサは、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする計算機。
【請求項2】
前記プロセッサは、所定の業務に対する前記利用者の作業状態を示す作業状態データ、及び、前記利用者のプロフィールを示すプロフィールデータに基づいて、当該利用者の興味語を抽出することを特徴とする請求項1に記載の計算機。
【請求項3】
前記プロセッサは、前記プロフィールデータに基づいて、前記所定の業務に対する前記利用者の熟練度を示す利用者熟練度データを作成し、
さらに、前記作業者熟練度データに基づいて、当該利用者の興味語を抽出することを特徴とする請求項2に記載の計算機。
【請求項4】
前記プロセッサは、前記興味語が複数ある場合、前記複数の興味語のうち、前記因果ネットワークデータ中の当該興味語の周辺の単語が、前記作業状態データにおいて最も高い出現頻度で出現する興味語を、当該利用者の興味語とすることを特徴とする請求項1に記載の計算機。
【請求項5】
前記プロセッサは、前記第1ワードと、前記第2ワードと、前記第1ワードと前記第2ワードとの因果関係を表す補間表現とによって、前記文書の見出しを作成することを特徴とする請求項1に記載の計算機。
【請求項6】
プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機における文書提示方法であって、
前記プロセッサが、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を実行することを特徴とする文書提示方法。
【請求項7】
プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機において実行される文書提示プログラムであって、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を前記計算機に実行させることを特徴とする文書提示プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−141928(P2012−141928A)
【公開日】平成24年7月26日(2012.7.26)
【国際特許分類】
【出願番号】特願2011−1220(P2011−1220)
【出願日】平成23年1月6日(2011.1.6)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】