説明

文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置

【課題】属性が付与されていない新たな語句に対する属性を容易に付与することができ、新規の語句を含む新たな文書および既存の文書における属性付与を容易に行う。
【解決手段】文書情報提示装置は、語句に対応する前記属性を付与する属性付与部221と、属性付与部221により対応づけられた属性と語句の情報を用語集データベース203に登録する登録部と、新たな文書の閲覧表示をおこなうとともに、用語集データベース203を参照して表示されている文書の語句に対応する属性を表示させる出力部204と、出力部204により表示された文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出部222とを備え、属性付与部221は、追加属性検出部222によって検出された語句に対する新たな属性を付与することにより、用語集データベース203を構築する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、文書に対し、語句単位で属性を付与し、語句に対する属性の提示を行うことにより、文書の情報の把握を支援する文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置に関する。
【背景技術】
【0002】
従来、ユーザが検索装置等を用いて技術文書の内容を参照する際に、あらかじめ語句毎に定めた属性別に語句を振り分けることにより、語句に付された属性が判るとともに、属性別の語句を抽出でき、技術文書の参照を支援することができるようになっている。
【0003】
たとえば、建築用の技術文書を例に取ると、あらかじめ属性として、建物、工程等の各属性を定めることができ、これらの属性が付与された語句を技術文書のなかから抽出できる。技術文書のなかからユーザが属性を指定することにより、この属性に対応する語句を提示するため、ユーザは、長文の技術文書に記載されたなかから必要な情報を属性を基に簡単に把握できるようになる。このように、文書に付加情報を付与する方法としてアノテーションが用いられ、表示処理システム等に適用されている(たとえば、下記特許文献1参照。)。
【0004】
【特許文献1】特開2004−151898号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、語句に付与された属性は、一度付与されたまま運用されていた。この場合、技術の進歩等で文書の内容に変化が生じ使用される語句が異なってきた場合、特に、新たな文書に新たな語句が登場してもこの新たな語句に対して適切な属性の付与が行えず、文書閲覧時における属性の提示を適切に行えなかった。
【0006】
また、新たな語句が生じたとき、この語句が記載されている文書に対して新たな属性を付与するだけでは、関連する他の文書に記載された同様の語句に対する属性についてもそれぞれ個別に付与する作業が必要となった。
【0007】
この発明は、上述した従来技術による問題点を解消するため、属性が付与されていない新たな語句に対する属性を容易に付与することができ、新規の語句を含む新たな文書および既存の文書における属性付与を容易に行うことができる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、この発明にかかる文書情報提示方法は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示方法において、前記語句に対応する前記属性を付与する属性付与工程と、前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。
【0009】
この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。
【0010】
また、前記属性付与工程は、前記新たな文書の閲覧表示の際に表示された語句に対して前記属性を付与することを特徴とする。
【0011】
この発明によれば、新規文書の語句に対する属性の付与を容易に行うことができるようになる。
【0012】
また、前記属性付与工程は、複数の前記属性別に所定の重み付けを設定し、前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする。
【0013】
この発明によれば、属性に重みを付与できるため、検索時に指定した属性に対応する語句が多く含まれる文書を優先的に検索結果として得ることができるようになる。
【0014】
また、入力された複数の前記文書を保存する文書保存工程を含み、前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする。
【0015】
この発明によれば、新規の文書の語句に対する属性の付与を行うと、この新規の文書だけに限らず、保存されている他の文書の語句に対しても属性を付与でき、保存されている文書全体に対して一括して属性の変更が行える。
【0016】
また、前記表示工程は、前記検索時に、前記重み付けされた前記属性に対応する語句が含まれる割合が高い前記文書を優先的に表示させることを特徴とする。
【0017】
この発明によれば、検索時の検索結果として適切な文書が優先的に表示されるため、ユーザが所望する文書を提示できるようになる。
【0018】
また、前記表示工程は、前記文書を構成する語句のうち前記属性が付与された語句を、当該属性別に強調表示させることを特徴とする。
【0019】
この発明によれば、検索後の文書閲覧時において、文書中に記載されている語句の属性を容易に把握することができ、文書中における属性の割合についても容易に把握できるようになる。
【0020】
また、この発明にかかる文書情報提示プログラムによれば、上記の文書情報提示方法をコンピュータに実行させることができる。
【0021】
また、この発明の文書情報提供装置は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示装置において、前記語句に対応する前記属性を付与する属性付与手段と、前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。
【0022】
この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。
【発明の効果】
【0023】
本発明によれば、属性が付与されていない新たな語句に対する属性を容易に付与することができ、検索時に参照される用語集データベースを構築していくことができ、適切な文書を検索でき、閲覧用として適切な情報を提示できるという効果を奏する。
【発明を実施するための最良の形態】
【0024】
以下に添付図面を参照して、この発明にかかる文書情報提示装置、文書情報提示方法お
よび文書情報提示プログラムの好適な実施の形態を詳細に説明する。
【0025】
(文書情報提示装置のハードウェア構成)
まず、この発明の実施の形態にかかる文書情報提示装置のハードウェア構成について説明する。図1は、本実施の形態にかかる文書情報提示装置のハードウェア構成を示すブロック図である。図1のように、文書情報提示装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、FD(フレキシブルディスク)107と、CD−RWD(CD−RWドライブ)108と、CD−RW109と、ディスプレイ110と、キーボード111と、マウス112と、ネットワークI/F113とを含んで構成されている。なお、上記の各構成101〜113は、それぞれバス120に接続されている。また、ネットワークI/F(インターフェース)113には、NET(ネットワーク)に接続するための通信ケーブル114が備えられている。
【0026】
上述のような構成の文書情報提示装置100において、CPU101は、文書情報提示装置100全体を制御する。また、ROM102は、基本入出力プログラムや、本発明にかかる文書情報提示プログラムを記憶している。ROM102に記憶されたCPU101からの制御に応じて読み出しされ実行される。また、RAM103は、CPU101のワークエリアとして使用される。
【0027】
HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御にしたがって書き込まれたデータを記憶する記憶媒体である。また、HD105に記憶されたデータは、HDD104の制御に応じて適宜読み出される。
【0028】
FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御にしたがって書き込まれたデータを記憶する着脱自在の記憶媒体である。また、FD107に記録されたデータは、FDD106の制御に応じて適宜読み出される。
【0029】
CD−RWD108は、CPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御する。CD−RW109は、CD−RWD108の制御にしたがって書き込まれたデータを記憶する着脱自在な記憶媒体である。また、CD−RW109に記録されたデータは、CD−RWD108の制御に応じて適宜読み出される。
【0030】
ディスプレイ110は、CPU101の制御によって、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。また、キーボード111は、文字、数値、各種指示などの入力のための複数のキーを備えた入力ディバイスであり、マウス112は、各種指示の選択や実行、処理対象の選択、マウスポインタの移動などを行うポインティングディバイスである。
【0031】
ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。
【0032】
本実施の形態にかかる文書情報提示装置100は、上述したようなハードウェアを備えており、CPU101の制御によりROM102に記憶された文書情報提示プログラムを実行することにより、ユーザが検索により閲覧した文書の内容と、文書把握のための情報を提示する。
【0033】
(文書情報提示装置の機能的構成)
次に、文書情報提示装置100の機能的構成について説明する。図2は、本実施の形態にかかる文書情報提示装置の機能的構成を示すブロック図である。図2に示す文書情報提示装置100は、入力部201aと、操作部201bと、検索部202と、用語集データベース(DB)203と、出力部204とを備えている。
【0034】
入力部201aには、対象となる文書のデータが入力される。文書のデータは、たとえば汎用のワープロにより作成されたものが入力され、この文書のデータは、複数の語句(単語)によって構成されている。この入力部201aを介して複数の文書のデータが文書情報提示装置100に保存されていく。操作部201bは、一般ユーザによる文書のデータの検索と閲覧時、および特権ユーザによる用語集DB203の構築時の操作用として設けられる。
【0035】
検索部202は、検索時の検索要求を受けて検索条件に適合した文書の検索を行う。この検索の際、文書に含まれた語句が、用語集DB203に設定、登録されている属性のどれに属するかを併せて提示する。検索部202は、不図示の検索エンジンと、用語集の構築に用いる用語集構築部211と、検索結果を提示するとともに、語句と属性の対応関係を提示する属性提示部212によって構成されている。
【0036】
用語集構築部211は、文書に記述されている語句に対応した属性を付与(追加、修正削除を含む)し、用語集DB203を構築していくための機能部である。この用語集構築部211は、属性付与部221と、追加属性検出部222と、重み設定部223と、検索条件作成部224とによって構成されている。属性付与部221は、既に用語集DB203に登録されている属性があればこの属性を用いて、文書の語句単位でこの語句に対応した属性を付与する。語句に対する属性の付与はアノテーションの技術が利用される。
【0037】
追加属性検出部222は、属性付与部221のアノテーション実行により付与されなかった属性の語句を検出する。用語集DB203がまだ構築されていない初期時には、アノテーションを行うと、文書に含まれる大部分の語句について、追加属性検出部222が属性未付与の語句を検出することになる。検出された新たな属性の語句は、属性付与部221によって新たな属性として付与することができる。属性付与の具体例については後述する。
【0038】
重み設定部223は、属性付与部221が有する属性別に、文書の検索時における重要度の重み付けを行う。検索条件作成部224は、用語集DB203に対し、重み付け後の各属性別の語句を登録する。この登録により、用語集DB203が構築されていく。
【0039】
属性提示部212は、文書の閲覧時に機能する。この際、用語集DB203を参照して、文書のデータに含まれる語句に対する属性に基づいて、検索条件に適合した文書から順に優先的に表示する等の処理が行える。また、選択された文書の情報と、この文書に含まれる語句のうち、検索条件として設定された属性に該当する語句、および属性は、出力部204を介して検索要求したユーザに提示される。これらの内容の詳細は後述する。
【0040】
上記構成の検索部202の機能は、図1に記載のROM102、RAM103、HDD104等に記憶されたプログラムをCPU101が実行することによってその機能を実現する。入力部201aによる、文書のデータの入力は、図1に記載のFDD106、CD−RW109、ネットワークI/F113を介して入力して機能を実現できる。また、操作部201bの機能は、キーボード111、マウス112により実現できる。この際、属性付与部221において新たに付与する属性名の入力と、重み設定部223における属性別の重み付け設定、属性付与部221において提示する文書と属性の設定は、キーボード111、マウス112の操作により行うことができる。出力部204の機能は、図1に記載のディスプレイ110によってその機能を実現する。用語集DB203は、図1に記載のHDD104等によってその機能を実現する。
【0041】
(文書情報提示の手順について)
図3−1は、本発明による文書情報提示の全体の流れを示す概要図である。以下の説明では、上記説明の文書として、建築現場における不具合を記載した不具合文書を例に説明する。この不具合文書は、一般ユーザである生産支援部門Cや、工事事務所A,Dが行う現場での施工に有効な情報である。
【0042】
まず、工事事務所Aの担当者が工事中に発生した不具合を特権ユーザである品質管理部門Bに報告する(ステップS301)。この不具合報告は、工事事務所Aの担当者あるいは品質管理部門Bの担当者が汎用のワープロ等を用いて文書データ310として作成する。品質管理部門Bでは、この文書データ310を、文書検索時における文書情報(属性)提示のための処理に有用なデータ形式に変換して不具合改善シート311を作成する(ステップS302)。この不具合改善シート311は、作成される都度、文書情報提示装置100に入力される(ステップS303)。この作業を繰り返すことにより、文書情報提示装置100には、多数の不具合改善シートが文書のデータベース(DB)として保存される(不図示)。
【0043】
一般ユーザである生産支援部門Cあるいは工事事務所Dの担当者は、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる(ステップS304)。この際、文書情報提示装置100は、用語集DB203を参照して、不具合改善シート311に含まれている語句毎に検索用の属性を付与して提示する。この属性は、不具合に関連する語句に対し付与されている。
【0044】
この閲覧時に不具合改善シート311の語句に付与された属性を把握することができる。すなわち、工事事務所Dの担当者は、この不具合改善シート311を読む際に、不具合に関する語句の提示を受け、以降の工事作業時の参考にできる。
【0045】
また、特権ユーザである品質管理部門Bの担当者についても、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる。この閲覧時に、不具合改善シート311の語句に対し属性を付与することができる(ステップS305)。語句に対する属性の付与を行うことにより用語集DB203を構築することができる(ステップS305)。
【0046】
図3−2は、本発明による文書情報提示装置が行う内部処理を示すフローチャートである。文書情報提示装置100は、文書である不具合改善シート311を多数保持しており、一般ユーザ(上述の工事事務所Dの担当者)が検索および閲覧できる。また、特権ユーザ(上述の品質管理部門Bの担当者)による用語集DB203の構築が行われる。文書情報提示装置100は、ログイン時に一般ユーザであるか、特権ユーザであるかを判断し、それぞれ個別の処理を行う。
【0047】
まず、一般ユーザ(上述の工事事務所Dの担当者等)に対する処理の流れを説明する。一般ユーザは、検索クエリを作成する(ステップS321)。具体的には、必要な属性を入力し、文書情報提示装置100に入力する。文書情報提示装置100は、この属性に該当する語句が含まれる不具合改善シート311を検索し、用語集DB203を参照して検索結果として適しているものを検索結果一覧として出力する(ステップS322)。この際、複数の不具合改善シート311を後述するランキングコントロールを行ったスコア値の高いものから優先的に出力することができる。
【0048】
そして、一覧のなかから選択した文書について閲覧のための表示を行う(ステップS323)。この閲覧の際、所望する属性の語句が記載された不具合改善シート311を閲覧することができるようになり、この不具合の内容を確認して以降の作業に有効利用できるようになる。
【0049】
次に、特権ユーザ(上述の品質管理部門Bの担当者)に対する処理の流れを説明する。特権ユーザにおいても、ステップS321〜ステップS323までの処理の流れは同じである。そして、閲覧した、ある一つの文書(不具合改善シート311)に対し、上述したアノテーションを加える(ステップS324)。このアノテーションの際に、用語集DB203を参照し、この用語集DB203に登録されている、語句と属性の関係を表示することができる。そして、特権ユーザにより、表示されている語句と属性の関係を追加、修正することにより、検索結果のチューニングが行える。
【0050】
たとえば、追加属性検出部222により、語句に対する属性の設定が登録されていない場合、新たな属性が検出され、属性付与部221により任意の属性を追加して付与することができる。修正の場合、語句に対する属性自体の変更、および後述する重み付けの変更等が行える。
【0051】
これら語句と属性の関係を設定することにより、アノテーション内容を文書情報提示装置100に格納されている文書DB全体(複数の不具合改善シート311)における語句と属性の関係の変更に反映させる(ステップS325)。この処理は、複数の不具合改善シート311に記述されている文字列一致を判断して処理できる。そして、用語集DB203に保存される語句と属性の関係についても設定され、用語集DB203が生成される(ステップS326)。特権ユーザによる次回以降の文書閲覧時には、この新たな用語集DB203を用いたアノテーションが行われることになる。以上説明した特権ユーザによる処理を何度も重ねていくほど、用語集DB203の語句と属性の関係を生成していくことができ、用語集DB203の構築できる。
【0052】
(用語集DBの構築の具体例)
次に、用語集DB203の構築について説明する。用語集DB203には、不具合情報として複数の属性が登録される。図4は、用語集DBに登録される不具合情報の内容を属性別に分類した図である。
【0053】
図示のように、建築の工事に関する不具合情報は、大きく分けて建物、工程、不具合、評価の各分類項目401〜404に分類される。各分類項目401〜404は、それぞれ上記の属性を有している。
【0054】
建物の分類項目401には、構造411、延床面積412、用途413等が属性としてそれぞれ設定されている。工程の分類項目402には、工種421、部位422、材料423等が属性としてそれぞれ設定されている。不具合の分類項目403には、現象431、概要432、原因433、処置434、対策435等が属性としてそれぞれ設定されている。評価の分類項目404には、重要指定441等が属性として設定されている。図4の記載では、便宜上、分類項目別の表記としてあるが、XML等の階層データ形式で記述されている。
【0055】
図5は、文書情報提示装置に入力される文書のデータを示す図である。図示のように、入力される文書のデータである不具合改善シート311には、過去の建築作業時に発生した不具合に関する情報として、ある不具合の原因、について記述されている。
【0056】
図6は、文書情報提示装置が属性を付与した状態の内部データを示す図である。文書の情報は、図5と同様であるが(一部省略)、アノテーションにより、不具合を示す語句と、この語句の属性とが対応付けられた状態が示されている。たとえば、「外壁」という語句601については、用語集DB203にあらかじめ属性が「部位」(図4の符号422)として登録されているため、この属性「部位」に語句「外壁」が属すると判断処理されている。この処理は、図2に記載の属性付与部221が実行する。
【0057】
なお、図示の例では、属性「ピックアップ」610とは、用語集DB203に登録されていない属性である。アノテーションの実行により、どの属性にも属していない新たな用語のうち、不具合に関する語句である「拘束」602は、適当な仮の属性(上記例では「」ピックアップ」610)に属するものと判断され、提示される。この処理は、図2に記載の追加属性検出部222が実行する。この後、この「拘束」602について、新たな属性として設定するかどうかは、不具合改善シート311を管理する品質管理部門Bの担当者が決定する。この「拘束」602について、新たな属性として設定する場合には、属性付与部221に対し、「拘束」602に該当する属性を新たに設定することにより、用語集DB203に新たな属性が登録される。
【0058】
図7は、用語集DB構築時に表示される検索条件設定画面を示す図である。用語集の構築は、特権ユーザ(品質管理部門Bの担当者)が不具合改善シート311を閲覧しながら行う。この担当者に対して図7に示す設定画面701が表示される。図示の左上には、検索条件702が表示される。この検索条件702は、用語集DB203に既に登録されている属性(既存属性)と、用語集DB203に登録されていない属性(追加属性)とからなる。
【0059】
たとえば、既存属性としては、工種421の属性に属する語句として、閲覧している不具合改善シート311に記載されている「鉄筋」が表示されている。追加属性としては、たとえば、図6を用いて説明した仮属性の「ピックアップ」610に属する語句「誘発目地」がある。図示のように、不具合改善シート311に記載されている語句のうち、各属性に対応する語句が表示部703に表示されるようになっている。
【0060】
これらの属性一覧は、一般ユーザ(工事事務所Dの担当者)が文書である不具合改善シート311の検索時に適した文書(必要とする不具合が記載されている文書)を検索する際の検索処理に用いられる。検索後においては、語句毎に付与された属性がこの一般ユーザに情報提示される。
【0061】
加えて、この検索条件702に表示されている属性別に重み付けの係数704を設定することができる(ランキングコントロール)。重み付けを重く設定した属性ほど該当する語句の重要度を高くできる。図示の例では、属性「工種」421の語句「鉄筋」に対して40、属性「現象」431の語句「ひびわれ」に対しては50、属性「自然現象」(仮の属性設定状態)の語句「乾燥収縮」に対して50、属性未定状態(追加属性)「長い建物」、「誘発目地」に対して50という重み付けを行った状態である。この重み付け(0〜100までの任意の数値)は、文書である不具合改善シート311を検索する際に、重み付けが重い属性に該当する語句が多く含まれる不具合改善シート311を優先的に一般ユーザに提示するために行われる。
【0062】
図7の右上には、属性スコア内訳712が表示される。この属性スコア内訳712は、検索条件702によって重み付けされた属性別のスコアである。この属性スコア内訳712の左半部の数値表示部713には、各属性と重み付け後における全体に占める割合(%)が数値表示される。たとえば、属性の「工種」421は28%、「現象」431および「自然現象」はそれぞれ35%である。属性スコア内訳712の右半部のグラフ表示部714には、左半部の数値がグラフ化して表示される。図示の例では円グラフとしたが、グラフの形態はこれに限らずバーグラフ等他の形態であってもよい。
【0063】
図7の下半部には、複数の不具合改善シート311の情報一覧715が表示される。図示の例では、3タイトル分の不具合改善シート311だけしか表示されていないが、スクロールバーの操作により、ランキングが低い他の不具合改善シート311を表示させることもできる。うち、ランキングが高い最上部の不具合改善シート311{タイトル:デッキ合成床のひびわれ(施工中)}がスコア15であり、最も高いスコアである。以下スコア順に下方に表示される。このように、検索結果として、ランキングが高い属性に対応する語句が含まれる割合が高い文書(不具合改善シート311)を優先的(上部位置)に表示させることができる。
【0064】
2番目に表示されている不具合改善シート311{タイトル:長い建物の外壁のひびわれ、スコア14}は、選択されてチェックマーク716が付いており、この不具合改善シート311の記載における属性(現象、部位、工種、用途、タイトル等)毎の語句が抽出して表示されている。なお、図7の上半部に表示されている検索条件702と、属性スコア内訳712のそれぞれの内容は、この選択された2番目の不具合改善シート311に関する情報である。
【0065】
たとえば、この情報一覧715の属性「現象」431の語句「ひびわれ」と、属性「工種」421の語句「鉄筋」は上記の既存属性に相当する。また、タイトルについても属性として扱い、上述したアノテーションにより語句「長い建物」が追加属性として検出される。このスコア14が情報の属性スコア内訳712に表示されている。図7の検索条件702の表示枠において表示部703に表示される語句は、用語集DB203から適宜選択することができる。
【0066】
図8は、属性に対する語句の選択状態を示す図である。たとえば、属性の「工種」421としての語句は、表示部703に表示されている「鉄筋」だけではなく、ほかに「コンクリート」、「タイル仕上げ」などもある。これらの語句は用語集DB203場内部に、属性「工種」421に関連付けて保存されており、図示のように、属性「工種」421に関連するこれらの語句が用語集DB203から読み出され、この表示部703に、ドロップダウン表示部703aにより一覧表示可能である。特権ユーザは、属性毎に必要な語句をこのドロップダウン表示された語句のなかから一つ、あるいは複数選択して表示部703に設定することができる。これにより属性に対応する語句を間違いなく、簡単に設定することができる。
【0067】
図9は、文書情報の提示画面を示す図である。一般ユーザ(工事事務所Dの担当者)が文書の検索を行い、不具合改善シート311を閲覧した際に表示される閲覧画面901である。図の左半部には、検索後の文書表示部902が設けられ、不具合改善シート311の内容が表示される。また、右半部には、属性一覧表示部903が設けられる。
【0068】
属性一覧表示部903には、属性の一覧が表示される。各属性は選択可能であり、たとえば、図の例では、属性「工種」903aを選択した状態である。そして下部には、この属性「工種」に対応付けられている語句の一覧903cが表示される。この一覧903cには、文書表示部902に表示されている不具合改善シート311に含まれる語句と、カウント数が表示される。たとえば、語句「鉄筋、コンクリート」は、不具合改善シート311中で2個カウントされている。
【0069】
また、文書表示部902に表示されている不具合改善シート311上には、この属性「工種」に対応する語句の部分が強調表示される(図中902a〜902cの部分)。強調表示は、図示の例では所定色のマーカーを用いて強調表示されているが、これに限らず、アンダーラインや、文字色を変更して強調表示することもできる。これにより、一般ユーザが文書表示部902の内容を読むとき、文書全体における不具合の語句の割合を容易に把握できるようになる。
【0070】
また、属性一覧表示部903に表示されたほかの属性、たとえば「部位」を選択したときにおいても、この部位に対応する語句の一覧が属性一覧表示部903にカウント付けで表示され、また、文書表示部902の不具合改善シート311上では、属性「部位」に対応する語句の部分が強調表示される。このように、属性を変更することにより、同一の文書に対して異なる属性の語句を抽出して表示させることができる。この際、この「部位」の強調表示は、「工種」の強調表示に用いた色と異なる配色にしてもよい。さらには、属性一覧表示部903において属性として「すべて」903dを選択したときには、文書表示部902の不具合改善シート311上に、各属性別に異なる配色で強調表示することができる。
【0071】
上記の説明では、文書情報提示装置100に既に格納されている文書(不具合改善シート311)を読み出して閲覧する際に、属性と語句を対応付け、用語集DB203を構築する構成とした。これに限らず、新たな文書が文書情報提示装置100に入力される都度、アノテーションを自動実行し、追加属性を自動検出する構成とし、複数回の文書入力毎に追加属性に対する属性と語句の割り当てを促す報知を行う構成としてもよい。
【0072】
また、技術分野別等に文書の格納先を別領域に保存し、これら各文書DB毎に対応した複数の用語集DBを有する構成にもできる。これにより、単一の文書情報提示装置100を用いて複数の技術文書に対する上記の情報提示を切り替えて行えるようになる。
【0073】
以上説明した実施の形態では、文書として建築現場における不具合を記載した不具合文書を例に説明したが他の業種における文書に対しても同様に用いることができる。たとえば、自動車、機械、電気機器、電子部品等の製造時における不具合文書にも適用できる他、技術文献等に適用して同様に文書内容の把握を容易に行えるようになる。
【0074】
また、上記実施の形態では、単一の文書情報提示装置100を一般ユーザおよび特権ユーザが操作する構成例について説明したが、文書情報提示装置100はネットワークを介して一般ユーザおよび特権ユーザの端末装置に接続され、端末装置の操作に基づいて上述した文書情報の提示を行う構成とすることができる。
【0075】
なお、本実施の形態で説明した文書情報提示方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
【産業上の利用可能性】
【0076】
以上のように、本発明にかかる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置は、文書を構成する語句に属性を付与して検索時の条件とするコンピュータ装置により構成される検索装置に適している。
【図面の簡単な説明】
【0077】
【図1】本実施の形態にかかる文書情報提示装置のハードウェア構成を示すブロック図である。
【図2】本実施の形態にかかる文書情報提示装置の機能的構成を示すブロック図である。
【図3−1】本発明による文書情報提示の全体の流れを示す概要図である。
【図3−2】本発明による文書情報提示装置が行う内部処理を示すフローチャートである。
【図4】用語集DBに登録される不具合情報の内容を属性別に分類した図である。
【図5】文書情報提示装置に入力される文書のデータを示す図である。
【図6】文書情報提示装置が属性を付与した状態の内部データを示す図である。
【図7】用語集DB構築時に表示される検索条件設定画面を示す図である。
【図8】属性に対する語句の選択状態を示す図である。
【図9】文書情報の提示画面を示す図である。
【符号の説明】
【0078】
100 文書情報提示装置
101 CPU
102 ROM
103 RAM
201a 入力部
201b 操作部
202 検索部
203 用語集データベース
204 出力部
211 用語集構築部
221 属性付与部
222 追加属性検出部
223 重み設定部
224 検索条件作成部

【特許請求の範囲】
【請求項1】
文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示方法において、
前記語句に対応する前記属性を付与する属性付与工程と、
前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、
前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、
前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示方法。
【請求項2】
前記属性付与工程は、前記新たな文書の閲覧表示の際に表示された語句に対して前記属性を付与することを特徴とする請求項1に記載の文書情報提示方法。
【請求項3】
前記属性付与工程は、複数の前記属性別に所定の重み付けを設定し、
前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする請求項1または2に記載の文書情報提示方法。
【請求項4】
入力された複数の前記文書を保存する文書保存工程を含み、
前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする請求項1〜3のいずれか一つに記載の文書情報提示方法。
【請求項5】
前記表示工程は、前記検索時に、前記重み付けされた前記属性に対応する語句が含まれる割合が高い前記文書を優先的に表示させることを特徴とする請求項1〜4のいずれか一つに記載の文書情報提示方法。
【請求項6】
前記表示工程は、前記文書を構成する語句のうち前記属性が付与された語句を、当該属性別に強調表示させることを特徴とする請求項1〜4のいずれか一つに記載の文書情報提示方法。
【請求項7】
請求項1〜6のいずれか一つに記載の方法をコンピュータに実行させることを特徴とする文書情報提示プログラム。
【請求項8】
文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示装置において、
前記語句に対応する前記属性を付与する属性付与手段と、
前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、
前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、
前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示装置。

【図1】
image rotate

【図2】
image rotate

【図3−1】
image rotate

【図3−2】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2009−199192(P2009−199192A)
【公開日】平成21年9月3日(2009.9.3)
【国際特許分類】
【出願番号】特願2008−38056(P2008−38056)
【出願日】平成20年2月19日(2008.2.19)
【出願人】(000000549)株式会社大林組 (1,758)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】