説明

テキスト解析システムおよびテキスト解析方法

【課題】危険度の高い不具合の認識に必要な重要文書を見逃さないようにする。
【解決手段】シート解析部42は、シート読出部41が読み出したFMEAシートの各行のテキストデータを解析し、単語間の共起関係およびその関係の強度を求めると共に、行単位での解析結果を統合することにより、複数組の単語の組み合わせにそれぞれの組み合わせの重要度を対応づけた特徴データを作成する。単語注目度算出部43は、特徴データ中の各単語について、それぞれ当該単語が関わる全ての単語の組み合わせの重要度の累計値を求め、その累計値に基づき当該単語の重要度(単語注目度)を設定する。辞書データ作成・表示部44は、これらの単語と単語注目度とを対応づけた辞書データを作成して表示する。辞書データ登録部45は、この表示に対してユーザが選択した辞書データを注目ワード辞書40に登録する処理を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、不具合に関する記述がなされている種々の文書の中から、危険度の高い不具合を認識する上で参照する必要のある文書を検索するためのテキスト解析技術に関する。
【背景技術】
【0002】
近年、様々な製造分野において、故障モード影響解析(Failure Mode Effects Analysis;略してFMEAと呼ばれる。)という品質管理手法が取り入れている。
FMEAとは、各種の不具合の内容や不具合に対する具体的な処置方法などが、複数の項目に分けて設定された表形式の管理シート(「FMEAシート」と呼ばれる。)に、各種の不具合に関する情報を記述するものである。
【0003】
図16は、FMEAシートの具体例を示す。
この例のFMEAシートでは、不具合の発生箇所を示す項目として「品目」「サブ品目」「部品」の各項目が、発生した不具合の状態を示す項目として「故障モード」が、それぞれ設定され、さらに「原因」「影響」「対策」の各項目が設定されている。また発生し得る不具合にそれぞれ1行が割り当てられ、各項目に対応する欄(セル)内にそれぞれその項目に関する情報が書き込まれる。
【0004】
さらに、この例のFMEAシートには、「頻度」「影響度」「検出難易度」「危険度」の4つの項目が設定され、これらの項目に対応する欄に、それぞれ度数を示す数値が設定される。
「頻度」は、該当する不具合に関する具体的事例の数を意味する。「影響度」とは、該当する不具合が人身事故などの危険状態につながる可能性を示す度合いを意味し、「検出難易度」とは、該当する不具合を検出するのが困難な度合いを意味する。「危険度」は、頻度、影響度、検出難易度の各度数を掛け合わせて得られる数値に相当する。
【0005】
上記4種類の度数は、各行に記述の事故や不良に対する重要度を示す指標、すなわち、事故や不良の発生を回避する上で各行の不具合にどの程度注目すれば良いかを判断するための目安となるものである。この趣旨をふまえ、以下では、これらの度数を「不具合注目度」と呼ぶことにする。
【0006】
従来のFMEAシートは、作業者自身の知識や経験、過去に生じたトラブル事例などから書き起こされることが多いが、作業者の知識や経験に頼りすぎると、作業者によってFMEAシートの内容にばらつきが生じ、また作業者が経験していない不具合が抜け落ちるおそれがある。また過去の事例を参照する場合にも、多数の文書の中からシートの作成に適した記述がなされた文書を特定するのは容易ではなく、作業時間や労力が膨大なものになる。また、ここで作業時間を限定すると、高いリスクを表す文書を参照できないまま、不十分な内容のFMEAシートが作成されてしまうおそれがある。
【0007】
上記の問題点に鑑み、出願人は先般、過去の事例を参照しながらFMEAシートを作成する作業を支援するシステムを開発した。このシステムは、過去のトラブル事例を示す文書が多数蓄積されたデータベースを、部品名、不良名などの知識名称により検索し、検索により抽出された文書のテキストデータを読み出して表示するものである(特許文献1参照。)。
【0008】
しかし、特許文献1に記載されたシステムによっても、参照対象の文書が多数読み出されると、作業者はどの文書を優先的に参照すれば良いかを判断するのが困難になる。この結果、文書をチェックするのにかかる労力が増大したり、重要な文書を見落としたためにFMEAシートの精度が低下するおそれがある。
【0009】
上記の問題を解決する方法として、高いリスクを示す可能性のある単語(影響度が高い単語)や、検出が困難な不具合を示している可能性がある単語(検出難易度が高い単語)を、あらかじめ重要語として登録しておき、各文書中に占める重要語の割合などに基づいて、参照する必要性の高い文書を絞り込む方法が考えられる。
この方法を示唆する文献として、たとえば、特許文献2がある。この特許文献2には、あらかじめ、管理者が重要語であると判断した単語をその重要度とともに登録しておき、参照対象の文書データ中の各文に含まれるキーワードの重要度に基づいて、それぞれの文の重要度を求め、重要度が所定値以上の文を表示することが記載されている。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2008−84242号公報
【特許文献2】特開2009−265770号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
特許文献2に記載されている方法を実施するには、あらかじめ重要語を登録する必要があるが、豊富な経験や知識を持つ人間でなければ、重要語や重要度を定めることは困難である。また、熟練者であっても、重要語のリストに漏れが生じたり、重要度の決定における判断を誤る可能性がある。このような不十分な重要語のリストを用いて文書の絞り込みを行っても、危険度の高い不具合を認識する上で参照する必要性の高い文書を精度良く検出するのは困難である。
【0012】
また、単語の単位での重要度に基づいて文書の重要度を決定すると、単独で用いられる場合はさほど高いリスクを示さないが、他の単語と組み合わせて用いられた場合に高いリスクを示唆するような表現を抽出するのが困難になる。
たとえば、自動車に関する不具合を示す記述として、「ブレーキの利きが悪い。」という文があった場合、この文に含まれる各自立語(ブレーキ,利き,悪い)は、それぞれ単独では大きな事故を示すとは考えられない。しかし、これらの語が組み合わせられると、事故の発生の可能性を示唆する概念が生じる。この例のような単語の組み合わせを構成する各単語を網羅的に登録するのは困難である。
【0013】
本発明は上記の2つの問題点に着目し、不具合に関する記述がなされた種々の文書の中から、危険度の高い不具合を認識する上で参照すべき価値が高い文書を自動的に抽出できるようにすることによって、ユーザが重要な文書を見逃さずに参照できるようにすることを課題とする。
また本発明は、単独ではさほど高い危険を示さない単語を複数組み合わせることによって危険度の高い不具合に関する記述がなされている文書を、容易に検出できるような検索を実現することを、第2の課題とする。
【課題を解決するための手段】
【0014】
本発明では、不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているFMEAシートの電子データを利用する。
本発明による第1のテキスト解析システムは、上記構成のFMEAシートの電子データを入力する第1の入力手段;データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第1の解析手段;危険を表す記述に用いられ得る単語を登録するための単語辞書データベース;第1の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された複数の単語について、それぞれその単語が含まれる行の記述と当該行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出する単語注目度算出手段;形態素解析処理により抽出され、単語注目度が算出された複数の単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて単語辞書データベースに登録する登録手段;不具合に関する記述がなされた文書のテキストデータを入力する第2の入力手段;第2の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第2の解析手段;第2の解析手段により処理された文書について、第2の解析手段の形態素解析によりその文書のテキストデータから抽出され、かつ単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を算出する文書注目度算出手段;第2の解析手段および文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段;の各手段を具備する。
【0015】
上記のシステムにおいて、第1の入力手段は、たとえば、複数種のFMEAシートの電子データが格納されたデータベースからいずれかのFMEAシートの電子データを読み出す手段として構成することができる。第2の入力手段も同様に、複数の文書のテキストデータが蓄積された文書データベースから解析対象のテキストデータを読み出す手段として構成することができる。これらのデータベースは、テキスト解析システムの内部に含まれる場合もあれば、外部のシステムに設けられ、各入力手段が外部機器との通信によりデータを取得する場合もある。
【0016】
また、処理結果出力手段による処理では、たとえば、各文書の識別情報(文書の一部を示すテキストデータや文書ファイル名など。以下も同じ。)を文書注目度とともに表示したり、各文書の識別情報を評価値の高い順に表示したり、所定の基準値より高い評価値が得られた文書のみに表示対象を絞って、絞り込まれた文書の識別情報を表示するなど、評価値の高い文書を優先的にチェックするのに適した表示を実施することができる。また、この種の表示を外部のシステムにおいて実施する場合には、処理結果出力手段は、たとえば、各文書の識別情報と文書注目度とを対応づけたデータを外部システムに送信する手段として構成することができる。
【0017】
上記した第1の入力手段、第2の入力手段、処理結果出力手段にかかる構成は、後記する第2のテキスト解析システムでも同様である。
【0018】
上記のテキスト解析システムによれば、十分な記述がなされ、影響度、検出難易度等の不具合の重要度を表す数値(不具合注目度)が適切に設定されたFMEAシートを解析することによって、事故や不良に関係する記述の危険度の高さを認識する上で注目する必要性の高い単語をその注目の必要性の高さ(単語注目度)に対応づけて、単語辞書データベースに登録することができる。また、新たなFMEAシートを作成する際などに、危険度の高い不具合について記述された文献を参照する必要が生じた場合には、参照候補の文書のテキストデータを第2の入力手段から入力することによって、このテキストデータに対し、第2の解析手段および文書注目度算出手段による処理を実施することによって、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を自動的に算出することが可能になる。
【0019】
よって、参照対象の文書が多数ある場合でも、これらの文書のテキストデータの自動解析によって、各文書の文書注目度が算出され、各文書または各文書の識別情報(たとえばファイル名)の出力にその算出結果が反映されるので、ユーザは、各文書の文書注目度により、参照する必要性の高い文書を容易に判別することが可能になる。
【0020】
上記のテキスト解析システムの好ましい一実施態様では、単語注目度算出手段は、第1の解析手段の形態素解析の結果に基づき、形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、単語注目度を算出する。これにより、FMEAシート内で高い重要度が設定されている行の記述において他の単語と関連づけられて使用される頻度の高い単語に、高い単語注目度を設定することが可能になる。
【0021】
他の好ましい実施態様では、第1の解析手段は、不具合に関する記述部分のテキストデータを、FMEAシートの行単位のデータに分けて前記形態素解析を実行する。さらに、単語注目度算出手段は、以下の第1演算手段、第2演算手段、統合手段、第3演算手段および度数導出手段を具備する。
【0022】
第1演算手段は、第1の解析手段の形態素解析の結果に基づき、FMEAシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める。第2演算手段は、第1演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める。
【0023】
統合手段は、FMEAシートの各行に対する第1演算手段および第2演算手段の処理により求められた単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する。第3演算手段は、統合手段により統合された各単語の組み合わせに含まれる個々の単語について、それぞれ当該単語が関わる全ての単語の組み合わせに対応する重要度の累計値または平均値を算出する。
度数導出手段は、第3演算手段により処理された単語毎に、その単語につき第3演算手段が求めた値に基づき、当該単語の単語注目度を示す度数を導出する。
【0024】
上記の実施態様によれば、第1および第2の演算手段の処理によって、FMEAシートの各行の記述において、何らかの概念を表すために組み合わせられた可能性が高く、かつ重要度の高い不具合表現に利用された単語の組み合わせに、高い重要度を設定することが可能になる。さらに、統合手段、第3演算手段、および度数導出手段の処理により、他の単語と共に高い危険度を示す記述に使用される頻度が高い単語に、高い単語注目度を設定することができる。また、単独では高い危険を示すことはないが、他の単語との組み合わせにより高い危険を示唆する記述に用いられる可能性がある単語にも、高い単語注目度を設定することが可能になる。よって、この単語注目度が設定された単語による単語辞書データベースを利用することによって、危険度の高い不具合を認識する上で参照すべき価値の高い文書に対し、高い文書注目度を導出することが可能になる。
【0025】
つぎに、本発明による第2のテキスト解析システムは、第1のテキスト解析システムと同様の第1の入力手段および第1の解析手段と、第2の入力手段および第2の解析手段とを具備する。
さらに、第2のテキスト解析システムは、第1の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された単語間の共起関係に基づき各単語を複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出する重要度算出手段;重要度算出手段により処理された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データが登録される登録手段;第2の解析手段の形態素解析により解析対象の文書のテキストデータから抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出し、各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成する文書解析手段;文書解析手段により処理された文書につき、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度として、特徴データ登録手段に登録されている特徴データに対する文書解析手段が作成した特徴データの類似度を求める文書注目度算出手段;第2の解析手段および文書解析手段ならびに文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段;の各手段を具備する。
【0026】
第2のテキスト解析システムによれば、あらかじめ、十分な記述がなされたFMEAシートに対する解析処理により、複数の単語の組み合わせにそれぞれの重要度を対応づけた特徴データを作成して、これを登録した後に、危険度の高い不具合を認識する上での参照候補となる個々の文書毎に、その文書に対する解析処理により、複数の単語の組み合わせと共起強度とを対応づけた特徴データを作成し、この特徴データの登録された特徴データに対する類似度を算出して、これを文書注目度として採用する。FMEAシートの特徴データでは、危険度の高い記述に用いられる頻度の高い単語の組み合わせに高い重要度が設定されるので、特徴データ間の単語の組み合わせの一致度合いや、一致した組み合わせにおける重要度の強弱と共起強度の強弱との類似度合いが高い文書に高い文書注目度が設定される。よって、危険や事故の発生を示唆する場合に使用される頻度が高い単語の組み合わせを含む文書を高い単語評価値とともにユーザに提示することが可能になる。
【0027】
上記第2のテキスト解析システムの好ましい一実施態様では、重要度算出手段は、第1の解析手段の形態素解析の結果に基づき、FMEAシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第1演算手段と、第1演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第2演算手段と、FMEAシートの各行に対する第1演算手段および第2演算手段の処理により求められた単語の組み合わせの重要度を、単語の組合せが一致するもの毎に統合する統合手段とを、具備する。
【0028】
上記の実施態様によれば、FMEAシート内の複数の行において、それぞれ何らかの概念を表すために組み合わせて用いられる単語の組み合わせのうち、高い重要度が設定されている行における不具合の記述に含まれている単語の組み合わせに対して、高い重要度を設定することが可能になる。よってデータベースに登録される特徴データの信頼度を高めることができる。
【0029】
本発明による第1のテキスト解析方法は、前述した構成のFMEAシートの電子データを入力して、この電子データから、危険を表す記述に用いられ得る単語が登録された単語辞書データベースを作成する第1のテキスト解析ステップと、不具合に関する記述がなされた文書のテキスデータを入力して、このテキストデータに対する形態素解析を実行し、この形態素解析により前記文書のテキストデータから抽出され、かつ単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第2のテキスト解析ステップと、第2のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行する。
【0030】
上記第1のテキスト解析ステップでは、FMEAシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、この形態素解析の結果に基づき、この形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出するステップと、単語注目度が算出された単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて単語辞書データベースに登録するステップとを、実行する。
【0031】
上記の方法によれば、FMEAシートにおける記述中で注目する必要性の高い単語をその単語注目度に対応づけて単語辞書データベースに登録した後に、この単語辞書データベースを用いた第2テキスト解析ステップを実行し、ついで出力処理ステップを実行することにより、ユーザに対し、危険度の高い不具合を確認する上で注目する必要性が高い文書を示すことが可能になる。
【0032】
本発明による第2のテキスト解析方法は、前述した構成のFMEAシートの電子データを入力して、この電子データから、FMEAシート内の記述に関する特徴データが登録されたデータベースを作成する第1のテキスト解析ステップと、不具合に関する記述がなされた文書のテキストデータを入力して当該テキストデータに対する解析処理を実行し、この解析処理の結果と上記のデータベースに登録された特徴データとを用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第2のテキスト解析ステップと、第2のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行する。
【0033】
上記第2の方法における第1のテキスト解析ステップでは、FMEAシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、この形態素解析により抽出された単語を、これらの単語間の共起関係に基づき複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出するステップと、重要度が算出された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データを、データベースに登録するステップとを実行する。
【0034】
また、第2のテキスト解析ステップでは、入力された文書のテキストデータに対する形態素解析を実行するステップと、文書のテキストデータに対する形態素解析により抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出するステップと、各単語の組み合わせと共起強度とを対応づけた特徴データを作成し、文書注目度として、前記データベースに登録された特徴データに対する前記文書のテキストデータから作成された特徴データの類似度を求めるステップとを、実行する。
【0035】
上記の方法によれば、第1のテキスト解析ステップにおいて、FMEAシートに対する解析処理によって、危険度の高い記述に使用されている単語の組み合わせや、多数の行に出現している単語の組み合わせに対して高い重要度を対応づけた特徴データを作成し、これを登録した上で、第2のテキスト解析ステップおよび出力処理ステップを実行することにより、FMEAシート中の重要度の高い記述に近い概念の記述がなされた文書を、高い文書評価値をもってユーザに提示することが可能になる。
【発明の効果】
【0036】
本発明によれば、十分な記述がされたFMEAシートの電子データの解析処理により得た単語辞書データベースまたは特徴データを用いて、危険度の高い不具合を認識する上での参照候補となる文書毎に、その文書に注目する必要性の高さを示す文書注目度を自動で算出し、その算出結果に基づき、注目する必要性の高い文書を優先的にユーザに提示することが可能になる。よって、ユーザは、高いリスクを示唆する文書を特定する処理を容易に行うことが可能になり、参照用の文書を探すユーザの負荷が大幅に軽減される。
また、本発明によれば、単独ではさほど高い危険を示さない単語を複数組み合わせることによって危険度の高い不具合に関する記述がなされている文書を、検索により容易に検出することが可能になる。
【図面の簡単な説明】
【0037】
【図1】FMEAシート作成システムの第1形態を示す機能ブロック図である。
【図2】注目意味ネットの構成例を示す図である。
【図3】注目意味ネットを作成する処理の手順を示すフローチャートである。
【図4】FMEAシートの1行分のデータから解析対象のテキストデータを作成する処理の例を示す図である。
【図5】テキスト解析により生成される解析データの構成例を示す図である。
【図6】単語間の距離の算出処理の具体例を示す図である。
【図7】意味ネットを統合して注目意味ネットを作成する処理の具体例を示す図である。
【図8】単語注目度を算出する処理を具体例を用いて説明した図である。
【図9】注目ワードの登録用画面の例を示す図である。
【図10】参照文書提示処理部により実行される処理の概要を示す図である。
【図11】文書抽出部が文書リストを作成するために実行する処理の手順を示すフローチャートである。
【図12】文書注目度の算出処理の手順を示すフローチャートである。
【図13】FMEAシート作成システムの第2形態を示す機能ブロック図である。
【図14】文書注目度の算出処理の手順を示すフローチャートである。
【図15】図14の手順による文書注目度の算出処理の具体例を示す図である。
【図16】FMEAシートの具体例を示す図である。
【発明を実施するための形態】
【0038】
(1)第1実施形態
図1は、本発明が適用されたFMEAシート作成システムの一実施形態を示す機能ブロック図である。
このシステムは、ユーザの編集操作に応じてFMEAシートの電子データを編集し、編集後のFMEAシートを図中のFMEAシートデータベース1に格納するもので、主要な機能として、FMEAシート編集・表示部2、注目ワード辞書作成処理部3,および参照文書提示処理部4を具備する。
【0039】
FMEAシート編集・表示処理部2は、図示しないモニタに作成中のFMEAシートを表示し、このシートの構成の変更を指定する操作やテキストデータの入力を受け付けると共に、受け付けた内容が反映されるようにFMEAシートのデータおよび表示を更新する。またユーザによりFMEAシートを登録する操作が行われた場合には、FMEAシート編集・表示処理部2は、表示中のFMEAシートのデータファイルをFMEAシートデータベース1に登録する処理を実行する。
【0040】
参照文書提示処理部3には、過去に生じたトラブルの内容を記述した文書が蓄積された不具合事例文書データベース30と、指定受付部31、テキスト解析部32、文書抽出部33、文書表示処理部34、注目度算出部35の各処理部が含まれる。各処理部は、ユーザがFMEAシートに情報を入力する際に、不具合事例文書データベース30から参考になる文書を抽出してモニタに表示する処理を実行する。
【0041】
注目ワード辞書作成処理部4には、シート読出部41、シート解析部42、単語注目度算出部43、辞書データ作成・表示部44、辞書データ登録部45の各処理部と、これらの処理部の働きにより作成される注目ワード辞書40とが含まれる。注目ワード辞書40には、危険や事故に関する記述を抽出する上で注目する必要性の高い単語が、その必要性の高さを示す度数(以下、「単語注目度)という。)、すなわち単語の重要度に対応づけられて登録されている。
【0042】
参照文書提示処理部3の注目度算出部35は、この注目ワード辞書40を用いて、抽出された各文書について、それぞれその文書を参照する必要度合いを示す評価値(以下、「文書注目度」という。)を算出する。さらに、注目度算出部35は、抽出された各文書の文書注目度を用いて、編集中のFMEAシートの各行に設定すべき不具合注目度を算出することもできる。
【0043】
以下では、まず注目ワード辞書作成処理部4による処理を詳細に説明し、その後に、参照文書提示処理部3による処理を説明する。
【0044】
[注目ワード辞書作成処理部4について]
この実施例の注目ワード辞書作成処理部4では、FMEAシートデータベース1から既に完成しているFMEAシートを読み出し、このFMEAシートのデータを解析することによって、注目ワード辞書40に登録する対象の単語および単語注目度を導出する。
なお、この実施例のFMEAシートデータベース1に、製品の種類や作業内容などに基づき分類された複数の分野毎にその分野のFMEAシートが登録されている場合には、注目ワード辞書40にも、各分野別の注目ワード辞書ファイルを登録することができる。
【0045】
シート読出部41は、FMEAシートデータベース1に格納されているFMEAシートの一覧をモニタに表示し、その中からユーザにより選択されたFMEAシートのデータを読み出す。読み出されたデータはシート解析部42により解析され、図2に示すような特徴データが作成される。
【0046】
この特徴データは、FMEAシートの記述に使用されている各種単語の関係を、単語の組み合わせの重要度合いに紐付けて表したもので、図2に示すように、ある概念を示すものとして関連づけて用いられている可能性のある単語同士をその共起関係の強度に応じた太さの線により連結した構成の共起ネットワークとして表現される。以下では、この特徴データを「注目意味ネット」と呼ぶ。
【0047】
この注目意味ネットでは、FMEAシートに使用されている各種単語(名詞などの自立語に限る。以下も同じ。)のうち、シート内の同じ行に記入されている単語同士、およびFMEAシートの項目名とその項目名の欄に記入されている単語という関係にあるもの同士が2個ずつ組み合わせられる。また、各単語の組み合わせ(以下、「単語ペア」という。)の重要度は、当該単語ペアを構成する単語間の関係の強さ、FMEAシート全体における当該単語ペアの出現頻度、および当該単語ペアを含む行に設定されている不具合注目度に基づき設定される。この単語ペアに設定される重要度は、危険や事故に関する記述を抽出する上で当該単語ペアに注目する必要度合いを示すと考えられるので、以下ではこの重要度を「単語ペア注目度」と呼ぶ。
なお、この実施例では、同じ行内の単語の組み合わせのほかに、FMEAシートの項目名とその項目名の欄に記入されている単語という関係にあるもの同士の組み合わせを単語ペアとして設定するが、後者の組み合わせによる単語ペアは必ずしも必要ではない。
【0048】
図3は、注目意味ネットを作成するためにシート解析処理部42が実行する処理の流れを示す。以下、このフローチャートの各ステップの処理を、適宜、図4〜7を参照しながら詳細に説明する。
【0049】
図3に示す処理は、シート読出部41により解析対象のFMEAシートが読み出されたことに応じて開始されるもので、まず、解析対象の行を特定するカウンタiを初期値の「1」に設定し(ステップS1)、このiの値により特定される1行目の行から順番に、ステップS2〜14の処理を実行する。このステップS2〜S14のループは、FMEAシートを行単位で解析する第1の解析処理と、行単位の解析結果を統合して注目意味ネットを構築する第2の解析処理とを実行するものとなる。
【0050】
まず、i=1のときの処理、すなわちFMEAシートの1行目に対して実行される処理について、説明する。
ステップS2では、1行目のテキストから解析対象のテキストシートを作成する。具体的には、図4に示すように、着目中の行の各欄のテキストデータにそれぞれ当該欄の項目名を組み合わせ、各組み合わせをまとめたものを、行単位のテキストデータに設定する。
【0051】
なお、従来技術の説明に使用した図16のFMEAシートでは、「品目」「サブ品目」「部品」の各項目に関しては、情報が共通する複数の行の欄が統合されているが、このような統合された欄内のテキストデータは、各行に個別に記入されているものとして、行単位のテキストデータに反映させることができる。
【0052】
ステップS3では、上記のテキストデータに対する形態素解析を実行し、図5に示すような解析データを作成する。
この解析データは、テキストデータから抽出された単語を同一のもの毎にまとめて、各単語の出現回数および出現位置を表したものである。出現回数は、解析対象のテキストデータに含まれる単語の数である。出現位置は、テキストデータ中の各単語の位置であり、ここではテキストデータの先頭から数えた単語の順位を出現位置としている。すなわち先頭から数えて何番目の単語であるかを意味する数値を出現位置とする。
【0053】
上記の解析データの作成が終了すると、ステップS4では、解析データ中の各単語を2つずつ組み合わせることにより単語ペアを設定し(異なる単語同士を組み合わせることになる。)、単語ペア毎に、そのペアを構成する単語間の共起関係の強さを示す度数(以下、「単語ペア関連度」という。)を算出する。
【0054】
この実施例では、単語間の距離を、各単語の出現位置の差の絶対値により表すこととして、単語ペアを構成する単語間の距離および単語ペアの出現頻度を反映させた数値を、単語ペア関連度として求める。
【0055】
ここで、単語ペアを構成する2つの単語をA,Bとして具体的に説明すると、解析対象のテキストデータから抽出された全ての単語Aについて、それぞれその単語Aから最も近い位置にある単語Bまでの距離dAを算出する。また、解析対象のテキストデータから抽出された全ての単語Bについても同様に、それぞれのその単語Bから最も近い位置にある単語Aまでの距離dBを算出する。そして、各距離dA,dBを、以下の演算式(1)にあてはめることにより単語ペア関連度を算出する。
【0056】
【数1】

【0057】
図6は、図5の解析データに示した2つの単語「コネクタ」と「機能」とを例として、上記の距離dA,dBを算出する方法を具体的に示す。
図中の(a)は、テキスト中の「2」「10」「26」「36」の各位置にある「コネクタ」について、それぞれ最も近い位置にある「機能」までの距離を求めた結果(それぞれ6,2,2,6となる。)である。また(b)は、テキスト中の「8」「12」「28」「42」「46」の各位置にある「機能」について、それぞれ最も近い位置にある「コネクタ」までの距離を求めた結果(それぞれ2,2,2,6となる。)である。よってこの場合には、(a)で求めた各距離をdAにあてはめ、(b)で求めた各距離をdBにあてはめて(1)式の演算を行うことにより、「コネクタ」と「機能」との間の単語ペア関連度を算出することができる。
【0058】
上記の単語間の距離の求め方によれば、最も近い関係にある単語間の距離は1となるから、(1)式中のe1−dA,e1−dBは、それぞれ距離dA,dBが最小値の1になるときに最大になり、dA,dBの値が大きくなるほど0に近づく。
したがって、単語A,Bによる単語ペアとして、距離dA,dBが小さい組み合わせがより多く出現するほど、単語ペア関連度の値は大きくなる。
【0059】
上記のステップS4の処理により設定された単語ペアおよび単語ペア関連度の関係は、図2と同様に、共起ネットワークとして表現することができる。以下では、このネットワークを「意味ネット」という。
【0060】
ステップS5では、上記の意味ネット内の各単語ペア関連度を、それぞれ元のFMEAシートの該当行(1行目)に設定されている不具合注目度を掛け合わせることによって、その単語ペア関連度を重み付けする。この重み付け後の単語ペア関連度を、以下では、「意味ネット単位での単語ペア注目度」という。
【0061】
なお、この実施例では、不具合注目度として、影響度および検出難易度のいずれか一方を選択し、選択された方の度数を用いてステップS5を実行した後に、この度数に基づき注目辞書40に格納する辞書データを作成する。ただし、これら2種類の度数データを順に選択して、それぞれの注目辞書ファイルを作成することもできる。
また、不具合注目度として、危険度(頻度,影響度,検出難易度の積)を使用してもよい。
【0062】
ステップS2〜S5により、1行目のテキストデータから単語ペアと単語ペア注目度との組み合わせが複数設定されると、以下では、カウンタjを用いて各単語ペアに順に着目し、着目した単語ペアおよびその単語注目度を、注目意味ネットに反映させる処理を実行する(ステップS6〜S12)。
【0063】
具体的には、j番目の単語ペアを構成する単語A,B、およびこれらの単語ペア注目度G(A,B)に着目し(ステップS7)、注目意味ネットに単語A,Bによる単語ペアが既に設定されているかどうかをチェックする(ステップS8)。
i=1のとき、すなわちFMEAシートの1行目を処理対象としている場合の注目意味ネットは空の状態であるから、ステップS8の判定は「NO」となって、ステップS9に進む。ステップS9では、単語A,Bによる単語ペアを注目意味ネットに追加すると共に、その重要度G(A,B)に単語ペア注目度G(A,B)の値を格納する。
【0064】
1行目のテキストデータから作成された意味ネットでは、全ての単語ペアに対して上記のステップS9が実行される。したがって、1行目に対する処理を終えた時点では、この1行目の重み付け後の意味ネットと同じ構成の注目意味ネットが設定される。
【0065】
この後、カウンタiによりFMEAシート内の各行に順に着目して(ステップS13,S14)、各行に対し、上記と同様の処理を繰り返す。これにより、毎回の解析対象の行から解析対象のテキストデータが作成され(ステップS2)、そのテキストデータに対する解析処理が実行され(ステップS3)、単語ペアおよび単語ペア関連度が導出される(ステップS4)。さらに解析対象の行の各単語ペアの単語ペア関連度を当該行の不具合注目度により重み付けする処理が行われて、各単語ペアの単語ペア注目度が算出される(ステップS5)。
【0066】
さらに、ステップS6〜S12において、各単語ペアおよびその単語ペア注目度が順に注目意味ネットに統合されるが、処理対象の単語ペアが既に注目意味ネットに含まれている場合(ステップS8が「YES」)には、当該単語ペアの単語ペア注目度G(A,B)を注目意味ネットの単語ペア注目度G(A,B)に加算し、加算後の値によりG(A,B)を更新する。
着目中の単語ペアが注目意味ネットに含まれていない場合(ステップS8が「NO」)には、ステップS9を実行する(ステップS10)。
【0067】
この結果、全ての行の処理が終了したとき(ステップS13が「YES」)、各行の意味ネットに含まれていた単語ペアが全て注目意味ネットに組み込まれると共に、各単語ペアに、それぞれその単語ペアを含む意味ネットにおける当該単語ペアの注目度を累計した値が単語ペア注目度として設定される。
【0068】
図7は、簡単な構成の意味ネットG1,G2を用いて、これらの意味ネットG1,G2に上記図3の処理を適用して注目意味ネットを作成する処理をされるまでに設定される情報の変遷を示す。
【0069】
図7の例では、解析対象のFMEAシートの各行のうち、意味ネットG1に対応する行に不具合注目度として値3が設定され、意味ネットG2に対応する行に不具合注目度として値5が設定されている。よって、これらの意味ネットG1,G2内の単語ペア関連度をそれぞれ対応する不具合注目度により重み付けして、意味ネット単位での単語ペア注目度を求めると、図中の中段のようになる。さらに、重み付け後の意味ネットG1,G2に対し、それぞれ図3のステップS6〜S12を実行することによって、図中の最下段に示すような注目意味ネットが作成される。
【0070】
図7の例の意味ネットG1,G2では、「コネクタ−工程」という単語ペアが共通に含まれているので、注目意味ネットの「コネクタ−工程」には、各意味ネットG1,G2における単語ペア注目度(45と25)を加算した値70が設定されている。その他の単語ペアは、意味ネットG1,G2のいずれか一方から導入されているため、単語ペア注目度は元の意味ネットに設定されている値と同じ値になる。
【0071】
実際に上記の処理に利用されるFMEAシートからは、図7の例より複雑な構成の意味ネットが多数作成され、各意味ネットに共通に含まれる単語ペアが、かなりの数で発生すると考えられる。
上記したように、意味ネット単位での単語ペア注目度は、そのペアを構成する単語間の共起強度(単語間の距離および単語の組み合わせの出現頻度を反映したもの)を当該意味ネットに対応する不具合注目度により重み付けしたものである。注目意味ネットの単語ペア注目度は、意味ネット単位での単語ペア注目度を単語ペアの種毎に累計したものであるから、多くの意味ネットに含まれる単語ペアや、不具合注目度の高い意味ネットに含まれる単語ペアには、高い値の単語ペア注目度が設定されると考えられる。
【0072】
シート解析部42による処理(図3に示したもの)が終了すると、つぎは、単語注目度算出部43により、注目意味ネットに含まれる各単語の単語注目度が算出される。この処理を、図8を用いて説明する。
【0073】
図8は、図7に示した注目意味ネットを例に、各単語の単語注目度を求める方法を示したものである。この例に示すように、単語注目度算出部43は、注目意味ネットに含まれる個々の単語に順に着目し、着目した単語により構成される全ての単語ペアの単語ペア注目度を累計し、その累計値を着目中の単語の単語注目度に設定する。
【0074】
上記のように、この実施例では、単語ペア毎に、そのペアを構成する単語間の共起強度を不具合注目度により重み付けした後に、単語毎に、単語注目度として、当該単語が関わる全ての単語ペアの単語ペア注目度の総和を求めるので、他の単語と組み合わせて不具合に関する何らかの概念を示す記述に使用される頻度が高い単語や、高い不具合注目度が設定されている行に記入されている単語の単語注目度を高めることができる。また、単独ではあまり高いリスクを示さなくとも、他の単語と組み合わせて高いリスクを示唆する表現に用いられる単語に対して、高い単語注目度を設定することが可能になる。
【0075】
なお、この実施例では、単語ペア注目度の累計値(総和)そのものを単語注目度として求めたが、これに限らず、各単語ペア注目度の平均値を単語ペア注目度としてもよい。または、単語毎に単語ペア注目度の累計値を求め、その中の最大値が100となるように、この最大値により各累計値を正規化してもよい。
【0076】
各単語の単語注目度が算出されると、辞書データ作成・表示部44により、各単語をそれぞれ算出された単語注目度に組み合わせた辞書データが作成される。さらに、辞書データ作成・表示部44は、作成された辞書データを用いて、モニタに図9に示すような画面を立ち上げ、ユーザの選択操作を受け付ける。
【0077】
図9の例の画面には、辞書データ(括弧内の数値が単語注目度である。)のリストを表示する欄51と、この欄51から選択された辞書データを表示する欄52とが左右に並べて設けられている。辞書データは、注目意味ネットから抽出された各単語に単語注目度を示す数値を組み合わせた構成のものである。各欄51,52の間には、2つの移動ボタン53,54が設定され、画面の下部には、登録ボタン55および終了ボタン56が設定されている。
なお、欄51には、注目意味ネットから抽出された全ての単語の辞書データが単語注目度の昇順に表示されるが、この表示対象を、あらかじめ定められた基準値を上回る単語注目度が得られた単語のみに限定してもよい。
【0078】
この画面表示に対し、ユーザが、右の欄51の辞書データの中から登録したいものをマウスにより選択し、移動ボタン53を操作すると、辞書データ作成・表示部44は、選択された辞書データを左の欄52に移動させる。また、上記とは逆に、ユーザが左の欄52の辞書データの中から登録をキャンセルしたいものを選択し、移動ボタン54を操作すると、辞書データ作成・表示部44は、選択された辞書データを右の欄51に戻す。
【0079】
所定の時点でユーザが登録ボタン55を操作すると、辞書データ登録部45が起動して、その時点で左の欄52内に表示されている辞書データを取り込み、注目ワード辞書40に登録する。
【0080】
上記の辞書データの選択操作や登録操作は、終了ボタン56が操作されるまで繰り返し行うことができる。終了ボタン56が操作されると、上記の画面表示は閉じられ、これをもって注目ワード辞書作成処理部4による処理も終了する。
【0081】
なお、不具合注目度として、影響度、検出難易度のそれぞれを順に選択して、これらのデータ種毎に、シート解析部42および単語注目度算出部43による処理を実行した場合には、図9に示すように、画面の上部に、不具合注目度の種別を選択するためのコンボボックス57が設けられ、各欄51,52には、コンボボックス57に表示中の種別に対応する辞書データが表示される。また、登録ボタン55の操作に応じて辞書データを登録する場合にも、選択されたデータ種別毎に注目ワード辞書ファイルが作成される。
【0082】
[参照文書提示処理部について]
ここで図1に参照を戻して、参照文書提示処理部3について説明する。
この実施例の参照文書提示処理部3は、FMEAシート編集・表示部2による処理が実行されている状態下で、ユーザにより、文書呼び出し操作が行われたことに応じて起動する。
【0083】
起動後は、まず指定受付部31が、FMEAシートの編集画面において、参考文書の読み出しの対象となる行の指定を受け付ける。この指定は、ある程度の情報が記述されているが、ユーザがさらに記述を補足したいと考えている行や、現在編集中の行に関係のある記述がなされている行に対して行われる。
【0084】
上記の指定が受け付けられると、テキスト解析部32、文書抽出部33、文書表示処理部34により、図10に示すような処理が順に実行されて、指定された行の記述に近い概念の文書が抽出される。
【0085】
以下、図10を用いて、テキスト解析部32,文書抽出部33,文書表示処理部34による処理を説明する。
テキスト解析部32は、FMEAシートで指定された行を対象に、シート解析部42が意味ネットを作成したときと同様の処理(図3のステップS2,S3,S4)を実行することにより、指定された行からテキストデータを作成し(図10(イ))、その意味ネットを作成する(図10(ロ))。
以下では、この意味ネットを「基本意味ネット」という。
【0086】
さらにテキスト解析部32は、不具合事例文書データベース30に格納されている個々の文書のテキストデータを順に読み出して、図3のステップS3,S4と同様の処理を実行する。これにより文書毎に、その文書に用いられている単語間の関係およびその共起強度を表す意味ネットが作成される(図10(ハ)(ニ))。以下、この文書毎に作成される意味ネットを、「文書意味ネット」という。
【0087】
文書抽出部33は、テキスト解析部32により作成された各文書意味ネットを順に処理対象として、基本意味ネットに対する処理対象の文書意味ネットの類似度を算出する。そして、上記の類似度が所定の基準値を超えた文書を抽出し、抽出された文書のリストを作成する(図10(ホ))。このリストの作成に応じて、文書表示処理部34は、リスト中の各文書を不具合事例文書データベース30から読み出し、モニタにこれらの文書を一覧表示する画面を立ち上げる(図10(ヘ))。
なお、この一覧表示では、各文書の表示を先頭の数行分のテキストデータの表示にとどめているが、ファイル名(図10(ヘ)の×××.docの部分)の選択操作に応じて、選択されたファイルの全文を表示するウィンドウを立ち上げることができる。
【0088】
図11は、図10に示した処理のうち、文書抽出部33が文書リストを作成するために実行する処理を示す。
図示例のフローチャートは、1つの文書意味ネットに対する処理手順を示すもので、不具合事例文書データベース30内の全ての文書の文書意味ネットを対象に、順に実行される。
【0089】
図11を参照して説明すると、まず、類似度Rに初期値の0を設定し(ステップS101)、基本意味ネット内の単語ペアの1つに着目し(ステップS102)、処理対象の文書意味ネットに同じ単語ペアが存在するかどうかをチェックする(ステップS103)。該当する組み合わせがない場合には、次の単語ペアに着目対象を変更し(ステップS103→S106→S102)、同様の処理を実行する。
【0090】
処理対象の文書意味ネットに着目中の単語ペアが含まれている場合(ステップS103が「YES」)には、この単語ペアにつき、文書意味ネットに設定されている単語ペア関連度と基本意味ネットに設定されている単語ペア関連度との積Sを算出する(ステップS104)。さらに、類似度Rを、現在値に積Sを加えた値に更新する(ステップS105)。
【0091】
以下、同様にして、基本意味ネット内の単語ペアに順に着目し、文書意味ネットに着目中の単語ペアと同じものがあれば、双方の単語ペア関連度の積Sを算出し、この積Sを類似度Rに加算することによって、類似度Rの値を更新する。
【0092】
基本意味ネットの全ての単語ペアに着目し終えると(ステップS106)、その時点での類似度Rの値をあらかじめ定めた基準値R0と比較する。ここで、R>R0であれば、処理対象の文書を文書リストに加える旨を決定し(ステップS107→S108)、R≦R0であれば、処理対象の文書を文書リストから除外する旨を決定する(ステップS107→S109)。
【0093】
上記のステップS102〜106のループの演算は、基本意味ネットおよび文書意味ネットを、それぞれ単語ペア関連度を要素とする多次元ベクトルとしてとらえて、基本意味ネットを構成する多次元ベクトルと文書意味ネットを構成する多次元ベクトルとの内積を求めていることに相当する。
この演算によれば、基本意味ネットおよび文書意味ネットの双方に共通する単語ペアに対し、共に高い単語ペア関連度が設定されている場合に、高い類似度Rを得ることができ、そのような単語ペアの数が増えるほど、類似度Rを高めることができる。これに対し、文書意味ネットにおいて、基本意味ネットと共通する単語ペアの数が少ない場合や、ある程度の数の単語ペアが共通するが、これらにおける単語ペア関連度の強弱のパターンが類似しない場合には、類似度Rは低い値になる。したがって、上記の類似度Rによれば、FMEAシート中のユーザにより指定された行に記述されているテキストデータに類似する概念を有する文書に、高い類似度を設定することができる。
【0094】
つぎに、この実施例の参照文書提示処理部3では、上記の類似度Rに基づき抽出された文書が表示されたことに応じて、注目度算出部35により、これらの文書の文書注目度を算出することができる。この算出処理に応じて、文書表示処理部34は、各文書を文書注目度の高い順に並べ替える。
【0095】
図12は、文書の抽出後に注目度算出部35により実行される処理を示す。
この処理は、図10(ヘ)に示した文書の一覧表示が行われた後に、ユーザが、不具合注目度による並べ替えを指定したことに応じて開始される。
【0096】
まず、注目度算出部35は、注目ワード辞書40に格納されている各辞書ファイルのファイル名を一覧表示するなどして、ユーザに、以下の処理に使用する注目ワード辞書ファイルを選択させ、選択された辞書ファイルを読み出す(ステップS301)。
たとえば、製品や作業などの別に設定された分野毎に注目ワード辞書ファイルが作成されている場合には、ユーザは、ここで該当する分野の注目ワード辞書ファイルを選択する。また、不具合注目度の種別(影響度、検出難易度、危険度)毎に注目ワード辞書ファイルが登録されている場合には、ユーザはいずれかの種別の注目ワード辞書ファイルを選択する。
【0097】
この後は、文書抽出部33により作成された文書リスト中の1文書を処理対象文書に設定し、その文書の文書注目度Pとして、初期値の0をセットする(ステップS302)。
【0098】
つぎに、処理対象文書の文書意味ネットに含まれる単語の1つ(単語X)に着目し、この単語Xが注目ワード辞書40に登録されているかどうかをチェックする。ここで、該当する単語Xが登録されていない場合には、次の単語に着目する(ステップS304→S308→S303)。
【0099】
着目中の単語Xが辞書ファイルに登録されている場合(ステップS304が「YES」)には、処理対象の文書意味ネット中の単語Xに対応づけられている単語ペア関連度の総和Tを算出し(ステップS305)、その総和Tと注目ワード辞書40内の単語Xの単語注目度との積Qを求める(ステップS306)。さらに、ステップS307において、文書注目度Pの現在値に上記の積Qを加えた値により、文書注目度Pを更新する。
【0100】
以下も同様に、処理対象文書の文書意味ネットに含まれている単語に順に着目し、着目中の単語Xが注目ワード辞書40に含まれていることを条件に、その単語Xに対応する全ての単語ペアの単語ペア関連度の総和Tを求める処理(ステップS305)、当該単語につき注目ワード辞書に登録されている単語注目度と総和Tとの積Qを求める処理(ステップS306)、積Qを文書注目度Pに加算する処理(ステップS307)を、それぞれ実行する。さらに、全ての単語を処理し終えると(ステップS308)、そのときのPの値を処理対象文書の文書注目度として保存し(ステップ309)、次の文書の処理に移る(ステップS310→S302)。
【0101】
上記の処理のステップS305で算出される総和Tは、処理対象の文書において、着目中の単語Xと他の単語との単語ペア関連度が高くなるほど、高い値を示すと考えられる。また、ステップS306およびS307の演算によれば、注目ワード辞書40において高い単語注目度に対応づけられて登録されている単語が、処理対象の文書においても、高い単語ペア関連度による単語ペアを構成している場合に、処理対象の文書の文書注目度Pが高められることになる。一方、注目ワード辞書40に登録されている単語が処理対象の文書に含まれていても、その単語による単語ペアに高い単語ペア関連度が設定されていない場合や、注目ワード辞書における当該単語の単語注目度が低い場合には、処理対象の文書の文書注目度Pは低い値に設定される。
【0102】
上記の文書注目度Pによれば、文書抽出部33により抽出された各文書の参考文献としての価値を、文書注目度として数値化し、価値の高いものから順に表示することができる。これにより、ユーザは、表示された文書の中から参照の必要度が高い文書を容易に特定することができ、FMEAシートの作成に有用な情報を高い確度で抽出することができる。
【0103】
なお、各文書の文書注目度を算出した後の処理としては、文書の表示順序を文書注目度に基づきソートする処理のほか、表示する対象の文書を、あらかじめ定めた値を超える文書注目度が得られた文書のみに絞り込んでもよい。また、注目ワード辞書40に、不具合注目度の種毎に注目ワード辞書ファイルが登録されている場合には、それぞれの不具合注目度毎に、文書注目度を算出するようにしてもよい。
【0104】
さらに、注目度処理部35は、個々の文書に対して求めた文書注目度の総和を算出し、この総和を指定された行の不具合注目度として、FMEAシート編集・表示部2に提示することができる。FMEAシート編集・表示部2では、提示された不具合注目度を、参考文書の呼び出しのためにユーザが指定された行の当該不具合注目度の入力欄に表示する。
このような処理により、従来は、知識や経験が豊富な人でなければ定められなかった不具合注目度を、演算により自動的に求めることが可能になり、ユーザの負担を大幅に軽減することができる。
【0105】
なお、上記の実施例では、注目ワード辞書40に登録された辞書データを、不具合事例文書データベース30に対する検索により抽出された文書から重要な文書を絞り込む目的に使用しているが、これに限らず、これらの辞書データからキーワードとなる単語を選択して、不具合事例文書データベースに対する検索処理を行うことも可能である。
【0106】
(2)第2実施形態
図13は、FMEAシート作成システムの第2形態を示す機能ブロック図である。
このシステムも、図1に示した第1形態のシステムと同様に、FMEAシートデータベース1、FMEAシート編集・表示部2、および参照文書提示処理部3を具備する。また、この実施例では、注目ワード辞書作成処理部4に代えて、注目意味ネット作成処理部400が設けられるが、この注目意味ネット作成処理部400は、第1形態のシステムと同様の構成のシート読出部41およびシート解析部42、ならびにシート解析部42により作成された注目意味ネットを登録するための注目意味ネットデータベース46により構成される。
【0107】
この実施例のシステムでは、あらかじめ分野別に作成されたFMEAシートの中の1つをシート読出部41により読み出して、シート解析部42による解析処理を行うことにより、分野ごとの注目意味ネットを作成して注目意味ネットデータベース46に登録することができる。また、注目意味ネットの作成において、不具合注目度として、影響度、検出難易度、および危険度のいずれかを選択することができる。また、不具合注目度の種毎に注目意味ネットを作成することもできる。
【0108】
参照文書提示処理部3は、第1形態のシステムと同様に、不具合事例文書データベース30、指定受付部31,テキスト解析部32、文書抽出部33、文書表示処理部34、注目度算出部35を備える。これらのうち、注目度算出部35以外の処理部により実行される処理は、第1形態のシステムと同様であるが、注目度算出部35は、注目ワード辞書40が作成されないことに伴い、第1形態とは異なる内容の処理を実行する。
【0109】
図14は、この実施例の注目度算出部35が文書注目度を算出するために実行する処理の手順を示す。この処理も、図12に示した処理と同様に、FMEAシートに対する行指定操作に応じてテキスト解析部32、文書抽出部33、文書表示処理部34による処理が実行されて、不具合事例文書データベース30から所定数の文書が抽出および表示された後に、この表示を文書注目度に基づいて並べ替えることを指示する操作が行われたことに応じて開始される。
【0110】
まず、注目意味ネットデータベース46に格納されている注目意味ネットの中から、ユーザにより選択された注目意味ネットを読み出し(ステップS401)、この注目意味ネットの大きさV0を算出する(ステップS402)。具体的に、ステップS402では、注目意味ネットを各単語ペア注目度を要素とする多次元ベクトルとみなして、この多次元ベクトルの長さを求める演算を実行する。すなわち、各単語ペア注目度の自乗の総和を求める演算と、この総和の平方根を求める演算とを実行する。
【0111】
つぎに、文書抽出部33により作成された文書リスト中の1文書を処理対象文書として、その文書注目度Pに初期値の0を設定する(ステップS403)。また、ステップS402と同様の演算により、処理対象文書の文書意味ネットの大きさVを算出する(ステップS404)。
【0112】
つぎに、処理対象文書の文書意味ネットから1つの単語ペア(A,B)およびその単語ペア関連度C(A,B)を読み出す(ステップS405)。そしてこの単語ペア(A,B)がステップS401で読み出された注目意味ネットに含まれているかどうかを判別し、含まれている場合(ステップS406が「YES」)には、その単語ペアの単語ペア注目度G(A,B)を読み出す(ステップS407)。そして、この単語ペア注目度G(A,B)とステップS405で読み出した単語ペア関連度C(A,B)との積を文書注目度Pに加算する演算を実行し、加算後の値により文書注目度Pを更新する(ステップ408)。
【0113】
一方、着目中の単語ペア(A,B)が注目意味ネットに含まれていない場合(ステップS406が「NO」)には、上記のステップS407およびS408をスキップする。
【0114】
以下、同様に、処理対象文書の文書意味ネットの各単語ペアに順に着目し、着目中の単語ペアが注目意味ネットにも含まれている場合には、ステップS407およびステップ408を実行する。全ての単語ペアを処理し終えると(ステップS409が「YES」)、その時点でのPの値をV0とVとの積により正規化し(ステップS410)、正規化後のPを処理対象文書の文書注目度として保存する(ステップ411)。
以下、つぎの文書の処理に移行し(ステップS412→S403)、同様の手順を繰り返す。
【0115】
上記ステップS405〜409のループでは、注目意味ネットを構成する多次元ベクトルと処理対象文書の文書意味ネットを構成する多次元ベクトルとの内積を求めていることになる。さらに、ステップS410では、算出された内積を各多次元ベクトルの長さの積で除算しているから、正規化後のPの値は、各多次元ベクトルがなす角度θの余弦(cosθ)に相当することになる。
上記の正規化処理によれば、各文書意味ネットのサイズのばらつきによる影響を除外できると共に、文書注目度を1以下の値に収めることができる。
【0116】
図15は、図7と同様の構成の注目意味ネットと、簡単な構成の文書意味ネットとを提示して、図14の手順に基づき、これらに対して実行される演算を具体的に示す。
注目意味ネットの大きさV0および文書意味ネットの大きさVの算出式は、図中の(a)(b)のとおりである。また、(c)に示すように、この例の注目意味ネットと文書意味ネットとの間では4組の単語ペアが共通するので、前出のステップS405〜410の処理により、図中の(d)式が実行されることになる。
【0117】
上記のとおり、第2形態のシステムでは、既存のFMEAシートに対する解析処理により作成された注目意味ネットに対する文書意味ネットの類似度を、文書注目度として算出するので、注目意味ネットにおいて高い単語ペア注目度が設定されている単語ペアが文書意味ネットでも高い単語ペア関連度をもって出現している文書に対して、高い文書注目度を設定することができる。また、このような単語ペアをより多く含む文書により高い文書注目度を設定することができる。
よって、不具合の記述において注目すべき必要度の高い単語が多く含まれる文書に対して、高い文書注目度を設定することができる。また、単独では事故や危険の可能性をさほど表さない単語を複数組み合わせることによって、高いリスクを示す表現が構成されている文書にも、高い文書注目度を設定することが可能となるから、文書注目度として、信頼度が高い指標を提示することができる。
【0118】
よって、第1形態、第2形態のシステムとも、危険度の高い不具合を認識する処理における各文書の価値を評価するのに適した文書注目度を求めることができる。また、単独での重要度合いは低いが、他の単語と組み合わせて使用されることによって、事故や危険の発生を示唆する可能性の高い単語を含む文書に高い文書注目度を設定することが可能になる。したがって、文書注目度が所定の値を超える文書にユーザの注意を向けさせるような表示を行うようにすることによって、品質管理のために参照する必要性の高い文書が見逃されるのを防止することが可能になる。
【0119】
[各実施形態の変形例]
上記第1、第2の実施形態では、いずれも、完成体のFMEAシートを解析することにより注目意味ネットを作成しているが、これに限らず、未完成のFMEAシートであっても、十分な情報が記入されている行が相当数含まれる場合には、これらの行のテキストデータを用いて注目意味ネットを作成することが可能である。また、各実施形態では、FMEAシートデータベース1をシステム内に設けて、このデータベース1から解析対象のデータを読み出すようにしているが、これに限らず、外部のシステムとの通信によりFMEAシートの電子データを入力し、解析することも可能である。不具合事例文書に関しても同様である。
【0120】
また、各実施形態では、FMEAシートおよび文書のテキストデータに含まれる単語を2個ずつ組み合わせて、その組み合わせ単位での重要度(単語ペア注目度)を求めたが、単語の組み合わせはこれに限定されるものではない。たとえば各行において、それぞれその行のテキストデータに含まれる3個以上の単語を組み合わせて、その組み合わせにおける単語間の共起強度を対応する行の不具合注目度の値により重み付けすると共に、重み付け後の共起強度を、行間で単語の組み合わせが共通するもの毎に累計することにより、各単語の組み合わせの重要度を求めてもよい。
【0121】
また、注目ワード辞書40や注目意味ネットデータベース46の作成のために解析するテキストデータはFMEAシートとして編集されたものに限らず、不具合に関する記述がなされた複数のテキストデータを、それぞれFMEAシートの1行分のテキストデータと同様に処理して意味ネットを作成し、これらの意味ネットから注目意味ネットを作成してもよい。なお、このテキストデータとして、不具合事例文書データベース30内の文書ファイルを利用してもよい。
【0122】
FMEAシートに代えて一般的なテキストデータを使用する場合にも、それぞれのデータに不具合注目度に相当する重要度が設定されているのが望ましいが、重要度は必ずしも必要ではなく、各テキストデータの意味ネット内の単語ペア関連度を同じもの毎に累計する方法により、注目意味ネットを設定してもよい。テキストデータ毎の重要度に基づいて単語ペア関連度を重み付けしなくとも、同じテーマに関して複数のテキストデータを入力したり、十分な容量のテキストデータを使用することによって、各テキストデータの単語ペア関連度を、重み付けされたのと同様の強度にすることができるのであれば、単語ペア注目度の信頼度を確保することができ、これにより文書注目度の値の信頼度を確保することが可能になる。
【符号の説明】
【0123】
1 FMEAシートデータベース
2 FMEAシート編集・表示部
3 参照文書提示処理部
4 注目ワード辞書作成処理部
400 注目意味ネット作成処理部
30 不具合事例文書データベース
33 文書抽出部
34 文書表示処理部
35 注目度算出部
40 注目ワード辞書
41 シート読出部
42 シート解析部
43 単語注目度算出部
44 辞書データ作成・表示部
45 辞書データ登録部
46 注目意味ネットデータベース

【特許請求の範囲】
【請求項1】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているFMEAシートの電子データを入力する第1の入力手段と、
前記データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第1の解析手段と、
危険を表す記述に用いられ得る単語を登録するための単語辞書データベースと、
前記第1の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された複数の単語について、それぞれその単語が含まれる行の記述と当該行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出する単語注目度算出手段と、
前記形態素解析処理により抽出され、前記単語注目度が算出された複数の単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて前記単語辞書データベースに登録する登録手段と、
不具合に関する記述がなされた文書のテキストデータを入力する第2の入力手段と、
前記第2の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第2の解析手段と、
前記第2の解析手段により処理された文書について、第2の解析手段の形態素解析によりその文書のテキストデータから抽出され、かつ前記単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を算出する文書注目度算出手段と、
前記第2の解析手段および文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段とを、
具備することを特徴とするテキスト解析システム。
【請求項2】
前記単語注目度算出手段は、前記第1の解析手段の形態素解析の結果に基づき、形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、前記単語注目度を算出する、請求項1に記載されたテキスト解析システム。
【請求項3】
前記第1の解析手段は、前記不具合に関する記述部分のテキストデータを前記FMEAシートの行単位のデータに分けて前記形態素解析を実行し、
前記単語注目度算出手段は、
前記第1の解析手段の形態素解析の結果に基づき、前記FMEAシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第1演算手段と、
前記第1演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第2演算手段と、
前記FMEAシートの各行に対する第1演算手段および第2演算手段の処理により求められた各単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する統合手段と、
前記統合手段により統合された各単語の組み合わせに含まれる個々の単語について、それぞれ当該単語が関わる全ての単語の組み合わせに対応する重要度の累計値または平均値を算出する第3演算手段と、
前記第3演算手段により処理された単語毎に、その単語につき第3演算手段が求めた値に基づき、当該単語の単語注目度を示す度数を導出する度数導出手段とを、具備する、請求項1に記載されたテキスト解析システム。
【請求項4】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているFMEAシートの電子データを入力する第1の入力手段と、
前記データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第1の解析手段と、
前記第1の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された単語間の共起関係に基づき各単語を複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出する重要度算出手段と、
前記重要度算出手段により処理された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データが登録される登録手段と、
不具合に関する記述がなされた文書のテキストデータを入力する第2の入力手段と、
前記第2の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第2の解析手段と、
前記第2の解析手段の形態素解析により解析対象の文書のテキストデータから抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出し、各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成する文書解析手段と、
前記文書解析手段により処理された文書につき、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度として、前記特徴データ登録手段に登録されている特徴データに対する前記文書解析手段が作成した特徴データの類似度を求める文書注目度算出手段と、
前記第2の解析手段および文書解析手段ならびに文書注目度算出手段により処理された
所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段とを、
具備することを特徴とするテキスト解析システム。
【請求項5】
前記重要度算出手段は、
前記第1の解析手段の形態素解析の結果に基づき、前記FMEAシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第1演算手段と、
前記第1演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第2演算手段と、
前記FMEAシートの各行に対する前記第1演算手段および第2演算手段の処理により求められた単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する統合手段とを具備する、請求項4に記載されたテキスト解析システム。
【請求項6】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているFMEAシートの電子データを入力して、この電子データから、危険を表す記述に用いられ得る単語が登録された単語辞書データベースを作成する第1のテキスト解析ステップと、
不具合に関する記述がなされた文書のテキストデータを入力して、このテキストデータに対する形態素解析を実行し、この形態素解析により前記文書のテキストデータから抽出され、かつ前記単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第2のテキスト解析ステップと、
前記第2のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行し、
前記第1のテキスト解析ステップでは、
前記FMEAシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、
前記形態素解析の結果に基づき、この形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出するステップと、
前記単語注目度が算出された単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて前記単語辞書データベースに登録するステップとを、実行する、
テキスト解析方法。
【請求項7】
不具合の内容および解決方法に関する言語表現をテキストにより記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているFMEAシートの電子データを入力して、この電子データから、FMEAシート内の記述に関する特徴データが登録されたデータベースを作成する第1のテキスト解析ステップと、
不具合に関する記述がなされた文書のテキストデータを入力して当該テキストデータに対する解析処理を実行し、この解析処理の結果と前記データベースに登録された特徴データとを用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第2のテキスト解析ステップと、
前記第2のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行し、
前記第1のテキスト解析ステップでは、
前記FMEAシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、
前記形態素解析により抽出された単語を、これらの単語間の共起関係に基づき複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出するステップと、
前記重要度が算出された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データを、前記データベースに登録するステップとを、実行し、
前記第2のテキスト解析ステップでは、
前記入力された文書のテキストデータに対する形態素解析を実行するステップと、
前記文書のテキストデータに対する形態素解析により抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出するステップと、
各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成し、前記文書注目度として、前記データベースに登録された特徴データに対する前記文書のテキストデータから作成された特徴データの類似度を求めるステップとを、実行する、テキスト解析方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate