テキスト解析システムおよびテキスト解析方法

【課題】危険度の高い不具合の認識に必要な重要文書を見逃さないようにする。
【解決手段】シート解析部４２は、シート読出部４１が読み出したＦＭＥＡシートの各行のテキストデータを解析し、単語間の共起関係およびその関係の強度を求めると共に、行単位での解析結果を統合することにより、複数組の単語の組み合わせにそれぞれの組み合わせの重要度を対応づけた特徴データを作成する。単語注目度算出部４３は、特徴データ中の各単語について、それぞれ当該単語が関わる全ての単語の組み合わせの重要度の累計値を求め、その累計値に基づき当該単語の重要度（単語注目度）を設定する。辞書データ作成・表示部４４は、これらの単語と単語注目度とを対応づけた辞書データを作成して表示する。辞書データ登録部４５は、この表示に対してユーザが選択した辞書データを注目ワード辞書４０に登録する処理を実行する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、不具合に関する記述がなされている種々の文書の中から、危険度の高い不具合を認識する上で参照する必要のある文書を検索するためのテキスト解析技術に関する。
【背景技術】
【０００２】
近年、様々な製造分野において、故障モード影響解析（Failure Mode Effects Analysis；略してＦＭＥＡと呼ばれる。）という品質管理手法が取り入れている。
ＦＭＥＡとは、各種の不具合の内容や不具合に対する具体的な処置方法などが、複数の項目に分けて設定された表形式の管理シート（「ＦＭＥＡシート」と呼ばれる。）に、各種の不具合に関する情報を記述するものである。
【０００３】
図１６は、ＦＭＥＡシートの具体例を示す。
この例のＦＭＥＡシートでは、不具合の発生箇所を示す項目として「品目」「サブ品目」「部品」の各項目が、発生した不具合の状態を示す項目として「故障モード」が、それぞれ設定され、さらに「原因」「影響」「対策」の各項目が設定されている。また発生し得る不具合にそれぞれ１行が割り当てられ、各項目に対応する欄（セル）内にそれぞれその項目に関する情報が書き込まれる。
【０００４】
さらに、この例のＦＭＥＡシートには、「頻度」「影響度」「検出難易度」「危険度」の４つの項目が設定され、これらの項目に対応する欄に、それぞれ度数を示す数値が設定される。
「頻度」は、該当する不具合に関する具体的事例の数を意味する。「影響度」とは、該当する不具合が人身事故などの危険状態につながる可能性を示す度合いを意味し、「検出難易度」とは、該当する不具合を検出するのが困難な度合いを意味する。「危険度」は、頻度、影響度、検出難易度の各度数を掛け合わせて得られる数値に相当する。
【０００５】
上記４種類の度数は、各行に記述の事故や不良に対する重要度を示す指標、すなわち、事故や不良の発生を回避する上で各行の不具合にどの程度注目すれば良いかを判断するための目安となるものである。この趣旨をふまえ、以下では、これらの度数を「不具合注目度」と呼ぶことにする。
【０００６】
従来のＦＭＥＡシートは、作業者自身の知識や経験、過去に生じたトラブル事例などから書き起こされることが多いが、作業者の知識や経験に頼りすぎると、作業者によってＦＭＥＡシートの内容にばらつきが生じ、また作業者が経験していない不具合が抜け落ちるおそれがある。また過去の事例を参照する場合にも、多数の文書の中からシートの作成に適した記述がなされた文書を特定するのは容易ではなく、作業時間や労力が膨大なものになる。また、ここで作業時間を限定すると、高いリスクを表す文書を参照できないまま、不十分な内容のＦＭＥＡシートが作成されてしまうおそれがある。
【０００７】
上記の問題点に鑑み、出願人は先般、過去の事例を参照しながらＦＭＥＡシートを作成する作業を支援するシステムを開発した。このシステムは、過去のトラブル事例を示す文書が多数蓄積されたデータベースを、部品名、不良名などの知識名称により検索し、検索により抽出された文書のテキストデータを読み出して表示するものである（特許文献１参照。）。
【０００８】
しかし、特許文献１に記載されたシステムによっても、参照対象の文書が多数読み出されると、作業者はどの文書を優先的に参照すれば良いかを判断するのが困難になる。この結果、文書をチェックするのにかかる労力が増大したり、重要な文書を見落としたためにＦＭＥＡシートの精度が低下するおそれがある。
【０００９】
上記の問題を解決する方法として、高いリスクを示す可能性のある単語（影響度が高い単語）や、検出が困難な不具合を示している可能性がある単語（検出難易度が高い単語）を、あらかじめ重要語として登録しておき、各文書中に占める重要語の割合などに基づいて、参照する必要性の高い文書を絞り込む方法が考えられる。
この方法を示唆する文献として、たとえば、特許文献２がある。この特許文献２には、あらかじめ、管理者が重要語であると判断した単語をその重要度とともに登録しておき、参照対象の文書データ中の各文に含まれるキーワードの重要度に基づいて、それぞれの文の重要度を求め、重要度が所定値以上の文を表示することが記載されている。
【先行技術文献】
【特許文献】
【００１０】
【特許文献１】特開２００８−８４２４２号公報
【特許文献２】特開２００９−２６５７７０号公報
【発明の概要】
【発明が解決しようとする課題】
【００１１】
特許文献２に記載されている方法を実施するには、あらかじめ重要語を登録する必要があるが、豊富な経験や知識を持つ人間でなければ、重要語や重要度を定めることは困難である。また、熟練者であっても、重要語のリストに漏れが生じたり、重要度の決定における判断を誤る可能性がある。このような不十分な重要語のリストを用いて文書の絞り込みを行っても、危険度の高い不具合を認識する上で参照する必要性の高い文書を精度良く検出するのは困難である。
【００１２】
また、単語の単位での重要度に基づいて文書の重要度を決定すると、単独で用いられる場合はさほど高いリスクを示さないが、他の単語と組み合わせて用いられた場合に高いリスクを示唆するような表現を抽出するのが困難になる。
たとえば、自動車に関する不具合を示す記述として、「ブレーキの利きが悪い。」という文があった場合、この文に含まれる各自立語（ブレーキ，利き，悪い）は、それぞれ単独では大きな事故を示すとは考えられない。しかし、これらの語が組み合わせられると、事故の発生の可能性を示唆する概念が生じる。この例のような単語の組み合わせを構成する各単語を網羅的に登録するのは困難である。
【００１３】
本発明は上記の２つの問題点に着目し、不具合に関する記述がなされた種々の文書の中から、危険度の高い不具合を認識する上で参照すべき価値が高い文書を自動的に抽出できるようにすることによって、ユーザが重要な文書を見逃さずに参照できるようにすることを課題とする。
また本発明は、単独ではさほど高い危険を示さない単語を複数組み合わせることによって危険度の高い不具合に関する記述がなされている文書を、容易に検出できるような検索を実現することを、第２の課題とする。
【課題を解決するための手段】
【００１４】
本発明では、不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているＦＭＥＡシートの電子データを利用する。
本発明による第１のテキスト解析システムは、上記構成のＦＭＥＡシートの電子データを入力する第１の入力手段；データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第１の解析手段；危険を表す記述に用いられ得る単語を登録するための単語辞書データベース；第１の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された複数の単語について、それぞれその単語が含まれる行の記述と当該行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出する単語注目度算出手段；形態素解析処理により抽出され、単語注目度が算出された複数の単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて単語辞書データベースに登録する登録手段；不具合に関する記述がなされた文書のテキストデータを入力する第２の入力手段；第２の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第２の解析手段；第２の解析手段により処理された文書について、第２の解析手段の形態素解析によりその文書のテキストデータから抽出され、かつ単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を算出する文書注目度算出手段；第２の解析手段および文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段；の各手段を具備する。
【００１５】
上記のシステムにおいて、第１の入力手段は、たとえば、複数種のＦＭＥＡシートの電子データが格納されたデータベースからいずれかのＦＭＥＡシートの電子データを読み出す手段として構成することができる。第２の入力手段も同様に、複数の文書のテキストデータが蓄積された文書データベースから解析対象のテキストデータを読み出す手段として構成することができる。これらのデータベースは、テキスト解析システムの内部に含まれる場合もあれば、外部のシステムに設けられ、各入力手段が外部機器との通信によりデータを取得する場合もある。
【００１６】
また、処理結果出力手段による処理では、たとえば、各文書の識別情報（文書の一部を示すテキストデータや文書ファイル名など。以下も同じ。）を文書注目度とともに表示したり、各文書の識別情報を評価値の高い順に表示したり、所定の基準値より高い評価値が得られた文書のみに表示対象を絞って、絞り込まれた文書の識別情報を表示するなど、評価値の高い文書を優先的にチェックするのに適した表示を実施することができる。また、この種の表示を外部のシステムにおいて実施する場合には、処理結果出力手段は、たとえば、各文書の識別情報と文書注目度とを対応づけたデータを外部システムに送信する手段として構成することができる。
【００１７】
上記した第１の入力手段、第２の入力手段、処理結果出力手段にかかる構成は、後記する第２のテキスト解析システムでも同様である。
【００１８】
上記のテキスト解析システムによれば、十分な記述がなされ、影響度、検出難易度等の不具合の重要度を表す数値（不具合注目度）が適切に設定されたＦＭＥＡシートを解析することによって、事故や不良に関係する記述の危険度の高さを認識する上で注目する必要性の高い単語をその注目の必要性の高さ（単語注目度）に対応づけて、単語辞書データベースに登録することができる。また、新たなＦＭＥＡシートを作成する際などに、危険度の高い不具合について記述された文献を参照する必要が生じた場合には、参照候補の文書のテキストデータを第２の入力手段から入力することによって、このテキストデータに対し、第２の解析手段および文書注目度算出手段による処理を実施することによって、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を自動的に算出することが可能になる。
【００１９】
よって、参照対象の文書が多数ある場合でも、これらの文書のテキストデータの自動解析によって、各文書の文書注目度が算出され、各文書または各文書の識別情報（たとえばファイル名）の出力にその算出結果が反映されるので、ユーザは、各文書の文書注目度により、参照する必要性の高い文書を容易に判別することが可能になる。
【００２０】
上記のテキスト解析システムの好ましい一実施態様では、単語注目度算出手段は、第１の解析手段の形態素解析の結果に基づき、形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、単語注目度を算出する。これにより、ＦＭＥＡシート内で高い重要度が設定されている行の記述において他の単語と関連づけられて使用される頻度の高い単語に、高い単語注目度を設定することが可能になる。
【００２１】
他の好ましい実施態様では、第１の解析手段は、不具合に関する記述部分のテキストデータを、ＦＭＥＡシートの行単位のデータに分けて前記形態素解析を実行する。さらに、単語注目度算出手段は、以下の第１演算手段、第２演算手段、統合手段、第３演算手段および度数導出手段を具備する。
【００２２】
第１演算手段は、第１の解析手段の形態素解析の結果に基づき、ＦＭＥＡシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める。第２演算手段は、第１演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める。
【００２３】
統合手段は、ＦＭＥＡシートの各行に対する第１演算手段および第２演算手段の処理により求められた単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する。第３演算手段は、統合手段により統合された各単語の組み合わせに含まれる個々の単語について、それぞれ当該単語が関わる全ての単語の組み合わせに対応する重要度の累計値または平均値を算出する。
度数導出手段は、第３演算手段により処理された単語毎に、その単語につき第３演算手段が求めた値に基づき、当該単語の単語注目度を示す度数を導出する。
【００２４】
上記の実施態様によれば、第１および第２の演算手段の処理によって、ＦＭＥＡシートの各行の記述において、何らかの概念を表すために組み合わせられた可能性が高く、かつ重要度の高い不具合表現に利用された単語の組み合わせに、高い重要度を設定することが可能になる。さらに、統合手段、第３演算手段、および度数導出手段の処理により、他の単語と共に高い危険度を示す記述に使用される頻度が高い単語に、高い単語注目度を設定することができる。また、単独では高い危険を示すことはないが、他の単語との組み合わせにより高い危険を示唆する記述に用いられる可能性がある単語にも、高い単語注目度を設定することが可能になる。よって、この単語注目度が設定された単語による単語辞書データベースを利用することによって、危険度の高い不具合を認識する上で参照すべき価値の高い文書に対し、高い文書注目度を導出することが可能になる。
【００２５】
つぎに、本発明による第２のテキスト解析システムは、第１のテキスト解析システムと同様の第１の入力手段および第１の解析手段と、第２の入力手段および第２の解析手段とを具備する。
さらに、第２のテキスト解析システムは、第１の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された単語間の共起関係に基づき各単語を複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出する重要度算出手段；重要度算出手段により処理された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データが登録される登録手段；第２の解析手段の形態素解析により解析対象の文書のテキストデータから抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出し、各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成する文書解析手段；文書解析手段により処理された文書につき、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度として、特徴データ登録手段に登録されている特徴データに対する文書解析手段が作成した特徴データの類似度を求める文書注目度算出手段；第２の解析手段および文書解析手段ならびに文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段；の各手段を具備する。
【００２６】
第２のテキスト解析システムによれば、あらかじめ、十分な記述がなされたＦＭＥＡシートに対する解析処理により、複数の単語の組み合わせにそれぞれの重要度を対応づけた特徴データを作成して、これを登録した後に、危険度の高い不具合を認識する上での参照候補となる個々の文書毎に、その文書に対する解析処理により、複数の単語の組み合わせと共起強度とを対応づけた特徴データを作成し、この特徴データの登録された特徴データに対する類似度を算出して、これを文書注目度として採用する。ＦＭＥＡシートの特徴データでは、危険度の高い記述に用いられる頻度の高い単語の組み合わせに高い重要度が設定されるので、特徴データ間の単語の組み合わせの一致度合いや、一致した組み合わせにおける重要度の強弱と共起強度の強弱との類似度合いが高い文書に高い文書注目度が設定される。よって、危険や事故の発生を示唆する場合に使用される頻度が高い単語の組み合わせを含む文書を高い単語評価値とともにユーザに提示することが可能になる。
【００２７】
上記第２のテキスト解析システムの好ましい一実施態様では、重要度算出手段は、第１の解析手段の形態素解析の結果に基づき、ＦＭＥＡシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第１演算手段と、第１演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第２演算手段と、ＦＭＥＡシートの各行に対する第１演算手段および第２演算手段の処理により求められた単語の組み合わせの重要度を、単語の組合せが一致するもの毎に統合する統合手段とを、具備する。
【００２８】
上記の実施態様によれば、ＦＭＥＡシート内の複数の行において、それぞれ何らかの概念を表すために組み合わせて用いられる単語の組み合わせのうち、高い重要度が設定されている行における不具合の記述に含まれている単語の組み合わせに対して、高い重要度を設定することが可能になる。よってデータベースに登録される特徴データの信頼度を高めることができる。
【００２９】
本発明による第１のテキスト解析方法は、前述した構成のＦＭＥＡシートの電子データを入力して、この電子データから、危険を表す記述に用いられ得る単語が登録された単語辞書データベースを作成する第１のテキスト解析ステップと、不具合に関する記述がなされた文書のテキスデータを入力して、このテキストデータに対する形態素解析を実行し、この形態素解析により前記文書のテキストデータから抽出され、かつ単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第２のテキスト解析ステップと、第２のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行する。
【００３０】
上記第１のテキスト解析ステップでは、ＦＭＥＡシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、この形態素解析の結果に基づき、この形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出するステップと、単語注目度が算出された単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて単語辞書データベースに登録するステップとを、実行する。
【００３１】
上記の方法によれば、ＦＭＥＡシートにおける記述中で注目する必要性の高い単語をその単語注目度に対応づけて単語辞書データベースに登録した後に、この単語辞書データベースを用いた第２テキスト解析ステップを実行し、ついで出力処理ステップを実行することにより、ユーザに対し、危険度の高い不具合を確認する上で注目する必要性が高い文書を示すことが可能になる。
【００３２】
本発明による第２のテキスト解析方法は、前述した構成のＦＭＥＡシートの電子データを入力して、この電子データから、ＦＭＥＡシート内の記述に関する特徴データが登録されたデータベースを作成する第１のテキスト解析ステップと、不具合に関する記述がなされた文書のテキストデータを入力して当該テキストデータに対する解析処理を実行し、この解析処理の結果と上記のデータベースに登録された特徴データとを用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第２のテキスト解析ステップと、第２のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行する。
【００３３】
上記第２の方法における第１のテキスト解析ステップでは、ＦＭＥＡシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、この形態素解析により抽出された単語を、これらの単語間の共起関係に基づき複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出するステップと、重要度が算出された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データを、データベースに登録するステップとを実行する。
【００３４】
また、第２のテキスト解析ステップでは、入力された文書のテキストデータに対する形態素解析を実行するステップと、文書のテキストデータに対する形態素解析により抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出するステップと、各単語の組み合わせと共起強度とを対応づけた特徴データを作成し、文書注目度として、前記データベースに登録された特徴データに対する前記文書のテキストデータから作成された特徴データの類似度を求めるステップとを、実行する。
【００３５】
上記の方法によれば、第１のテキスト解析ステップにおいて、ＦＭＥＡシートに対する解析処理によって、危険度の高い記述に使用されている単語の組み合わせや、多数の行に出現している単語の組み合わせに対して高い重要度を対応づけた特徴データを作成し、これを登録した上で、第２のテキスト解析ステップおよび出力処理ステップを実行することにより、ＦＭＥＡシート中の重要度の高い記述に近い概念の記述がなされた文書を、高い文書評価値をもってユーザに提示することが可能になる。
【発明の効果】
【００３６】
本発明によれば、十分な記述がされたＦＭＥＡシートの電子データの解析処理により得た単語辞書データベースまたは特徴データを用いて、危険度の高い不具合を認識する上での参照候補となる文書毎に、その文書に注目する必要性の高さを示す文書注目度を自動で算出し、その算出結果に基づき、注目する必要性の高い文書を優先的にユーザに提示することが可能になる。よって、ユーザは、高いリスクを示唆する文書を特定する処理を容易に行うことが可能になり、参照用の文書を探すユーザの負荷が大幅に軽減される。
また、本発明によれば、単独ではさほど高い危険を示さない単語を複数組み合わせることによって危険度の高い不具合に関する記述がなされている文書を、検索により容易に検出することが可能になる。
【図面の簡単な説明】
【００３７】
【図１】ＦＭＥＡシート作成システムの第１形態を示す機能ブロック図である。
【図２】注目意味ネットの構成例を示す図である。
【図３】注目意味ネットを作成する処理の手順を示すフローチャートである。
【図４】ＦＭＥＡシートの１行分のデータから解析対象のテキストデータを作成する処理の例を示す図である。
【図５】テキスト解析により生成される解析データの構成例を示す図である。
【図６】単語間の距離の算出処理の具体例を示す図である。
【図７】意味ネットを統合して注目意味ネットを作成する処理の具体例を示す図である。
【図８】単語注目度を算出する処理を具体例を用いて説明した図である。
【図９】注目ワードの登録用画面の例を示す図である。
【図１０】参照文書提示処理部により実行される処理の概要を示す図である。
【図１１】文書抽出部が文書リストを作成するために実行する処理の手順を示すフローチャートである。
【図１２】文書注目度の算出処理の手順を示すフローチャートである。
【図１３】ＦＭＥＡシート作成システムの第２形態を示す機能ブロック図である。
【図１４】文書注目度の算出処理の手順を示すフローチャートである。
【図１５】図１４の手順による文書注目度の算出処理の具体例を示す図である。
【図１６】ＦＭＥＡシートの具体例を示す図である。
【発明を実施するための形態】
【００３８】
（１）第１実施形態
図１は、本発明が適用されたＦＭＥＡシート作成システムの一実施形態を示す機能ブロック図である。
このシステムは、ユーザの編集操作に応じてＦＭＥＡシートの電子データを編集し、編集後のＦＭＥＡシートを図中のＦＭＥＡシートデータベース１に格納するもので、主要な機能として、ＦＭＥＡシート編集・表示部２、注目ワード辞書作成処理部３，および参照文書提示処理部４を具備する。
【００３９】
ＦＭＥＡシート編集・表示処理部２は、図示しないモニタに作成中のＦＭＥＡシートを表示し、このシートの構成の変更を指定する操作やテキストデータの入力を受け付けると共に、受け付けた内容が反映されるようにＦＭＥＡシートのデータおよび表示を更新する。またユーザによりＦＭＥＡシートを登録する操作が行われた場合には、ＦＭＥＡシート編集・表示処理部２は、表示中のＦＭＥＡシートのデータファイルをＦＭＥＡシートデータベース１に登録する処理を実行する。
【００４０】
参照文書提示処理部３には、過去に生じたトラブルの内容を記述した文書が蓄積された不具合事例文書データベース３０と、指定受付部３１、テキスト解析部３２、文書抽出部３３、文書表示処理部３４、注目度算出部３５の各処理部が含まれる。各処理部は、ユーザがＦＭＥＡシートに情報を入力する際に、不具合事例文書データベース３０から参考になる文書を抽出してモニタに表示する処理を実行する。
【００４１】
注目ワード辞書作成処理部４には、シート読出部４１、シート解析部４２、単語注目度算出部４３、辞書データ作成・表示部４４、辞書データ登録部４５の各処理部と、これらの処理部の働きにより作成される注目ワード辞書４０とが含まれる。注目ワード辞書４０には、危険や事故に関する記述を抽出する上で注目する必要性の高い単語が、その必要性の高さを示す度数（以下、「単語注目度）という。）、すなわち単語の重要度に対応づけられて登録されている。
【００４２】
参照文書提示処理部３の注目度算出部３５は、この注目ワード辞書４０を用いて、抽出された各文書について、それぞれその文書を参照する必要度合いを示す評価値（以下、「文書注目度」という。）を算出する。さらに、注目度算出部３５は、抽出された各文書の文書注目度を用いて、編集中のＦＭＥＡシートの各行に設定すべき不具合注目度を算出することもできる。
【００４３】
以下では、まず注目ワード辞書作成処理部４による処理を詳細に説明し、その後に、参照文書提示処理部３による処理を説明する。
【００４４】
［注目ワード辞書作成処理部４について］
この実施例の注目ワード辞書作成処理部４では、ＦＭＥＡシートデータベース１から既に完成しているＦＭＥＡシートを読み出し、このＦＭＥＡシートのデータを解析することによって、注目ワード辞書４０に登録する対象の単語および単語注目度を導出する。
なお、この実施例のＦＭＥＡシートデータベース１に、製品の種類や作業内容などに基づき分類された複数の分野毎にその分野のＦＭＥＡシートが登録されている場合には、注目ワード辞書４０にも、各分野別の注目ワード辞書ファイルを登録することができる。
【００４５】
シート読出部４１は、ＦＭＥＡシートデータベース１に格納されているＦＭＥＡシートの一覧をモニタに表示し、その中からユーザにより選択されたＦＭＥＡシートのデータを読み出す。読み出されたデータはシート解析部４２により解析され、図２に示すような特徴データが作成される。
【００４６】
この特徴データは、ＦＭＥＡシートの記述に使用されている各種単語の関係を、単語の組み合わせの重要度合いに紐付けて表したもので、図２に示すように、ある概念を示すものとして関連づけて用いられている可能性のある単語同士をその共起関係の強度に応じた太さの線により連結した構成の共起ネットワークとして表現される。以下では、この特徴データを「注目意味ネット」と呼ぶ。
【００４７】
この注目意味ネットでは、ＦＭＥＡシートに使用されている各種単語（名詞などの自立語に限る。以下も同じ。）のうち、シート内の同じ行に記入されている単語同士、およびＦＭＥＡシートの項目名とその項目名の欄に記入されている単語という関係にあるもの同士が２個ずつ組み合わせられる。また、各単語の組み合わせ（以下、「単語ペア」という。）の重要度は、当該単語ペアを構成する単語間の関係の強さ、ＦＭＥＡシート全体における当該単語ペアの出現頻度、および当該単語ペアを含む行に設定されている不具合注目度に基づき設定される。この単語ペアに設定される重要度は、危険や事故に関する記述を抽出する上で当該単語ペアに注目する必要度合いを示すと考えられるので、以下ではこの重要度を「単語ペア注目度」と呼ぶ。
なお、この実施例では、同じ行内の単語の組み合わせのほかに、ＦＭＥＡシートの項目名とその項目名の欄に記入されている単語という関係にあるもの同士の組み合わせを単語ペアとして設定するが、後者の組み合わせによる単語ペアは必ずしも必要ではない。
【００４８】
図３は、注目意味ネットを作成するためにシート解析処理部４２が実行する処理の流れを示す。以下、このフローチャートの各ステップの処理を、適宜、図４〜７を参照しながら詳細に説明する。
【００４９】
図３に示す処理は、シート読出部４１により解析対象のＦＭＥＡシートが読み出されたことに応じて開始されるもので、まず、解析対象の行を特定するカウンタｉを初期値の「１」に設定し（ステップＳ１）、このｉの値により特定される１行目の行から順番に、ステップＳ２〜１４の処理を実行する。このステップＳ２〜Ｓ１４のループは、ＦＭＥＡシートを行単位で解析する第１の解析処理と、行単位の解析結果を統合して注目意味ネットを構築する第２の解析処理とを実行するものとなる。
【００５０】
まず、ｉ＝１のときの処理、すなわちＦＭＥＡシートの１行目に対して実行される処理について、説明する。
ステップＳ２では、１行目のテキストから解析対象のテキストシートを作成する。具体的には、図４に示すように、着目中の行の各欄のテキストデータにそれぞれ当該欄の項目名を組み合わせ、各組み合わせをまとめたものを、行単位のテキストデータに設定する。
【００５１】
なお、従来技術の説明に使用した図１６のＦＭＥＡシートでは、「品目」「サブ品目」「部品」の各項目に関しては、情報が共通する複数の行の欄が統合されているが、このような統合された欄内のテキストデータは、各行に個別に記入されているものとして、行単位のテキストデータに反映させることができる。
【００５２】
ステップＳ３では、上記のテキストデータに対する形態素解析を実行し、図５に示すような解析データを作成する。
この解析データは、テキストデータから抽出された単語を同一のもの毎にまとめて、各単語の出現回数および出現位置を表したものである。出現回数は、解析対象のテキストデータに含まれる単語の数である。出現位置は、テキストデータ中の各単語の位置であり、ここではテキストデータの先頭から数えた単語の順位を出現位置としている。すなわち先頭から数えて何番目の単語であるかを意味する数値を出現位置とする。
【００５３】
上記の解析データの作成が終了すると、ステップＳ４では、解析データ中の各単語を２つずつ組み合わせることにより単語ペアを設定し（異なる単語同士を組み合わせることになる。）、単語ペア毎に、そのペアを構成する単語間の共起関係の強さを示す度数（以下、「単語ペア関連度」という。）を算出する。
【００５４】
この実施例では、単語間の距離を、各単語の出現位置の差の絶対値により表すこととして、単語ペアを構成する単語間の距離および単語ペアの出現頻度を反映させた数値を、単語ペア関連度として求める。
【００５５】
ここで、単語ペアを構成する２つの単語をＡ，Ｂとして具体的に説明すると、解析対象のテキストデータから抽出された全ての単語Ａについて、それぞれその単語Ａから最も近い位置にある単語Ｂまでの距離ｄＡを算出する。また、解析対象のテキストデータから抽出された全ての単語Ｂについても同様に、それぞれのその単語Ｂから最も近い位置にある単語Ａまでの距離ｄＢを算出する。そして、各距離ｄＡ，ｄＢを、以下の演算式（１）にあてはめることにより単語ペア関連度を算出する。
【００５６】
【数１】

【００５７】
図６は、図５の解析データに示した２つの単語「コネクタ」と「機能」とを例として、上記の距離ｄＡ，ｄＢを算出する方法を具体的に示す。
図中の（ａ）は、テキスト中の「２」「１０」「２６」「３６」の各位置にある「コネクタ」について、それぞれ最も近い位置にある「機能」までの距離を求めた結果（それぞれ６，２，２，６となる。）である。また（ｂ）は、テキスト中の「８」「１２」「２８」「４２」「４６」の各位置にある「機能」について、それぞれ最も近い位置にある「コネクタ」までの距離を求めた結果（それぞれ２，２，２，６となる。）である。よってこの場合には、（ａ）で求めた各距離をｄＡにあてはめ、（ｂ）で求めた各距離をｄＢにあてはめて（１）式の演算を行うことにより、「コネクタ」と「機能」との間の単語ペア関連度を算出することができる。
【００５８】
上記の単語間の距離の求め方によれば、最も近い関係にある単語間の距離は１となるから、（１）式中のｅ^１−ｄＡ，ｅ^１−ｄＢは、それぞれ距離ｄＡ，ｄＢが最小値の１になるときに最大になり、ｄＡ，ｄＢの値が大きくなるほど０に近づく。
したがって、単語Ａ，Ｂによる単語ペアとして、距離ｄＡ，ｄＢが小さい組み合わせがより多く出現するほど、単語ペア関連度の値は大きくなる。
【００５９】
上記のステップＳ４の処理により設定された単語ペアおよび単語ペア関連度の関係は、図２と同様に、共起ネットワークとして表現することができる。以下では、このネットワークを「意味ネット」という。
【００６０】
ステップＳ５では、上記の意味ネット内の各単語ペア関連度を、それぞれ元のＦＭＥＡシートの該当行（１行目）に設定されている不具合注目度を掛け合わせることによって、その単語ペア関連度を重み付けする。この重み付け後の単語ペア関連度を、以下では、「意味ネット単位での単語ペア注目度」という。
【００６１】
なお、この実施例では、不具合注目度として、影響度および検出難易度のいずれか一方を選択し、選択された方の度数を用いてステップＳ５を実行した後に、この度数に基づき注目辞書４０に格納する辞書データを作成する。ただし、これら２種類の度数データを順に選択して、それぞれの注目辞書ファイルを作成することもできる。
また、不具合注目度として、危険度（頻度，影響度，検出難易度の積）を使用してもよい。
【００６２】
ステップＳ２〜Ｓ５により、１行目のテキストデータから単語ペアと単語ペア注目度との組み合わせが複数設定されると、以下では、カウンタｊを用いて各単語ペアに順に着目し、着目した単語ペアおよびその単語注目度を、注目意味ネットに反映させる処理を実行する（ステップＳ６〜Ｓ１２）。
【００６３】
具体的には、ｊ番目の単語ペアを構成する単語Ａ，Ｂ、およびこれらの単語ペア注目度Ｇ_ｉ（Ａ，Ｂ）に着目し（ステップＳ７）、注目意味ネットに単語Ａ，Ｂによる単語ペアが既に設定されているかどうかをチェックする（ステップＳ８）。
ｉ＝１のとき、すなわちＦＭＥＡシートの１行目を処理対象としている場合の注目意味ネットは空の状態であるから、ステップＳ８の判定は「ＮＯ」となって、ステップＳ９に進む。ステップＳ９では、単語Ａ，Ｂによる単語ペアを注目意味ネットに追加すると共に、その重要度Ｇ（Ａ，Ｂ）に単語ペア注目度Ｇ_ｉ（Ａ，Ｂ）の値を格納する。
【００６４】
１行目のテキストデータから作成された意味ネットでは、全ての単語ペアに対して上記のステップＳ９が実行される。したがって、１行目に対する処理を終えた時点では、この１行目の重み付け後の意味ネットと同じ構成の注目意味ネットが設定される。
【００６５】
この後、カウンタｉによりＦＭＥＡシート内の各行に順に着目して（ステップＳ１３，Ｓ１４）、各行に対し、上記と同様の処理を繰り返す。これにより、毎回の解析対象の行から解析対象のテキストデータが作成され（ステップＳ２）、そのテキストデータに対する解析処理が実行され（ステップＳ３）、単語ペアおよび単語ペア関連度が導出される（ステップＳ４）。さらに解析対象の行の各単語ペアの単語ペア関連度を当該行の不具合注目度により重み付けする処理が行われて、各単語ペアの単語ペア注目度が算出される（ステップＳ５）。
【００６６】
さらに、ステップＳ６〜Ｓ１２において、各単語ペアおよびその単語ペア注目度が順に注目意味ネットに統合されるが、処理対象の単語ペアが既に注目意味ネットに含まれている場合（ステップＳ８が「ＹＥＳ」）には、当該単語ペアの単語ペア注目度Ｇ_ｉ（Ａ，Ｂ）を注目意味ネットの単語ペア注目度Ｇ（Ａ，Ｂ）に加算し、加算後の値によりＧ（Ａ，Ｂ）を更新する。
着目中の単語ペアが注目意味ネットに含まれていない場合（ステップＳ８が「ＮＯ」）には、ステップＳ９を実行する（ステップＳ１０）。
【００６７】
この結果、全ての行の処理が終了したとき（ステップＳ１３が「ＹＥＳ」）、各行の意味ネットに含まれていた単語ペアが全て注目意味ネットに組み込まれると共に、各単語ペアに、それぞれその単語ペアを含む意味ネットにおける当該単語ペアの注目度を累計した値が単語ペア注目度として設定される。
【００６８】
図７は、簡単な構成の意味ネットＧ１，Ｇ２を用いて、これらの意味ネットＧ１，Ｇ２に上記図３の処理を適用して注目意味ネットを作成する処理をされるまでに設定される情報の変遷を示す。
【００６９】
図７の例では、解析対象のＦＭＥＡシートの各行のうち、意味ネットＧ１に対応する行に不具合注目度として値３が設定され、意味ネットＧ２に対応する行に不具合注目度として値５が設定されている。よって、これらの意味ネットＧ１，Ｇ２内の単語ペア関連度をそれぞれ対応する不具合注目度により重み付けして、意味ネット単位での単語ペア注目度を求めると、図中の中段のようになる。さらに、重み付け後の意味ネットＧ１，Ｇ２に対し、それぞれ図３のステップＳ６〜Ｓ１２を実行することによって、図中の最下段に示すような注目意味ネットが作成される。
【００７０】
図７の例の意味ネットＧ１，Ｇ２では、「コネクタ−工程」という単語ペアが共通に含まれているので、注目意味ネットの「コネクタ−工程」には、各意味ネットＧ１，Ｇ２における単語ペア注目度（４５と２５）を加算した値７０が設定されている。その他の単語ペアは、意味ネットＧ１，Ｇ２のいずれか一方から導入されているため、単語ペア注目度は元の意味ネットに設定されている値と同じ値になる。
【００７１】
実際に上記の処理に利用されるＦＭＥＡシートからは、図７の例より複雑な構成の意味ネットが多数作成され、各意味ネットに共通に含まれる単語ペアが、かなりの数で発生すると考えられる。
上記したように、意味ネット単位での単語ペア注目度は、そのペアを構成する単語間の共起強度（単語間の距離および単語の組み合わせの出現頻度を反映したもの）を当該意味ネットに対応する不具合注目度により重み付けしたものである。注目意味ネットの単語ペア注目度は、意味ネット単位での単語ペア注目度を単語ペアの種毎に累計したものであるから、多くの意味ネットに含まれる単語ペアや、不具合注目度の高い意味ネットに含まれる単語ペアには、高い値の単語ペア注目度が設定されると考えられる。
【００７２】
シート解析部４２による処理（図３に示したもの）が終了すると、つぎは、単語注目度算出部４３により、注目意味ネットに含まれる各単語の単語注目度が算出される。この処理を、図８を用いて説明する。
【００７３】
図８は、図７に示した注目意味ネットを例に、各単語の単語注目度を求める方法を示したものである。この例に示すように、単語注目度算出部４３は、注目意味ネットに含まれる個々の単語に順に着目し、着目した単語により構成される全ての単語ペアの単語ペア注目度を累計し、その累計値を着目中の単語の単語注目度に設定する。
【００７４】
上記のように、この実施例では、単語ペア毎に、そのペアを構成する単語間の共起強度を不具合注目度により重み付けした後に、単語毎に、単語注目度として、当該単語が関わる全ての単語ペアの単語ペア注目度の総和を求めるので、他の単語と組み合わせて不具合に関する何らかの概念を示す記述に使用される頻度が高い単語や、高い不具合注目度が設定されている行に記入されている単語の単語注目度を高めることができる。また、単独ではあまり高いリスクを示さなくとも、他の単語と組み合わせて高いリスクを示唆する表現に用いられる単語に対して、高い単語注目度を設定することが可能になる。
【００７５】
なお、この実施例では、単語ペア注目度の累計値（総和）そのものを単語注目度として求めたが、これに限らず、各単語ペア注目度の平均値を単語ペア注目度としてもよい。または、単語毎に単語ペア注目度の累計値を求め、その中の最大値が１００となるように、この最大値により各累計値を正規化してもよい。
【００７６】
各単語の単語注目度が算出されると、辞書データ作成・表示部４４により、各単語をそれぞれ算出された単語注目度に組み合わせた辞書データが作成される。さらに、辞書データ作成・表示部４４は、作成された辞書データを用いて、モニタに図９に示すような画面を立ち上げ、ユーザの選択操作を受け付ける。
【００７７】
図９の例の画面には、辞書データ（括弧内の数値が単語注目度である。）のリストを表示する欄５１と、この欄５１から選択された辞書データを表示する欄５２とが左右に並べて設けられている。辞書データは、注目意味ネットから抽出された各単語に単語注目度を示す数値を組み合わせた構成のものである。各欄５１，５２の間には、２つの移動ボタン５３，５４が設定され、画面の下部には、登録ボタン５５および終了ボタン５６が設定されている。
なお、欄５１には、注目意味ネットから抽出された全ての単語の辞書データが単語注目度の昇順に表示されるが、この表示対象を、あらかじめ定められた基準値を上回る単語注目度が得られた単語のみに限定してもよい。
【００７８】
この画面表示に対し、ユーザが、右の欄５１の辞書データの中から登録したいものをマウスにより選択し、移動ボタン５３を操作すると、辞書データ作成・表示部４４は、選択された辞書データを左の欄５２に移動させる。また、上記とは逆に、ユーザが左の欄５２の辞書データの中から登録をキャンセルしたいものを選択し、移動ボタン５４を操作すると、辞書データ作成・表示部４４は、選択された辞書データを右の欄５１に戻す。
【００７９】
所定の時点でユーザが登録ボタン５５を操作すると、辞書データ登録部４５が起動して、その時点で左の欄５２内に表示されている辞書データを取り込み、注目ワード辞書４０に登録する。
【００８０】
上記の辞書データの選択操作や登録操作は、終了ボタン５６が操作されるまで繰り返し行うことができる。終了ボタン５６が操作されると、上記の画面表示は閉じられ、これをもって注目ワード辞書作成処理部４による処理も終了する。
【００８１】
なお、不具合注目度として、影響度、検出難易度のそれぞれを順に選択して、これらのデータ種毎に、シート解析部４２および単語注目度算出部４３による処理を実行した場合には、図９に示すように、画面の上部に、不具合注目度の種別を選択するためのコンボボックス５７が設けられ、各欄５１，５２には、コンボボックス５７に表示中の種別に対応する辞書データが表示される。また、登録ボタン５５の操作に応じて辞書データを登録する場合にも、選択されたデータ種別毎に注目ワード辞書ファイルが作成される。
【００８２】
［参照文書提示処理部について］
ここで図１に参照を戻して、参照文書提示処理部３について説明する。
この実施例の参照文書提示処理部３は、ＦＭＥＡシート編集・表示部２による処理が実行されている状態下で、ユーザにより、文書呼び出し操作が行われたことに応じて起動する。
【００８３】
起動後は、まず指定受付部３１が、ＦＭＥＡシートの編集画面において、参考文書の読み出しの対象となる行の指定を受け付ける。この指定は、ある程度の情報が記述されているが、ユーザがさらに記述を補足したいと考えている行や、現在編集中の行に関係のある記述がなされている行に対して行われる。
【００８４】
上記の指定が受け付けられると、テキスト解析部３２、文書抽出部３３、文書表示処理部３４により、図１０に示すような処理が順に実行されて、指定された行の記述に近い概念の文書が抽出される。
【００８５】
以下、図１０を用いて、テキスト解析部３２，文書抽出部３３，文書表示処理部３４による処理を説明する。
テキスト解析部３２は、ＦＭＥＡシートで指定された行を対象に、シート解析部４２が意味ネットを作成したときと同様の処理（図３のステップＳ２，Ｓ３，Ｓ４）を実行することにより、指定された行からテキストデータを作成し（図１０（イ））、その意味ネットを作成する（図１０（ロ））。
以下では、この意味ネットを「基本意味ネット」という。
【００８６】
さらにテキスト解析部３２は、不具合事例文書データベース３０に格納されている個々の文書のテキストデータを順に読み出して、図３のステップＳ３，Ｓ４と同様の処理を実行する。これにより文書毎に、その文書に用いられている単語間の関係およびその共起強度を表す意味ネットが作成される（図１０（ハ）（ニ））。以下、この文書毎に作成される意味ネットを、「文書意味ネット」という。
【００８７】
文書抽出部３３は、テキスト解析部３２により作成された各文書意味ネットを順に処理対象として、基本意味ネットに対する処理対象の文書意味ネットの類似度を算出する。そして、上記の類似度が所定の基準値を超えた文書を抽出し、抽出された文書のリストを作成する（図１０（ホ））。このリストの作成に応じて、文書表示処理部３４は、リスト中の各文書を不具合事例文書データベース３０から読み出し、モニタにこれらの文書を一覧表示する画面を立ち上げる（図１０（ヘ））。
なお、この一覧表示では、各文書の表示を先頭の数行分のテキストデータの表示にとどめているが、ファイル名（図１０（ヘ）の×××．ｄｏｃの部分）の選択操作に応じて、選択されたファイルの全文を表示するウィンドウを立ち上げることができる。
【００８８】
図１１は、図１０に示した処理のうち、文書抽出部３３が文書リストを作成するために実行する処理を示す。
図示例のフローチャートは、１つの文書意味ネットに対する処理手順を示すもので、不具合事例文書データベース３０内の全ての文書の文書意味ネットを対象に、順に実行される。
【００８９】
図１１を参照して説明すると、まず、類似度Ｒに初期値の０を設定し（ステップＳ１０１）、基本意味ネット内の単語ペアの１つに着目し（ステップＳ１０２）、処理対象の文書意味ネットに同じ単語ペアが存在するかどうかをチェックする（ステップＳ１０３）。該当する組み合わせがない場合には、次の単語ペアに着目対象を変更し（ステップＳ１０３→Ｓ１０６→Ｓ１０２）、同様の処理を実行する。
【００９０】
処理対象の文書意味ネットに着目中の単語ペアが含まれている場合（ステップＳ１０３が「ＹＥＳ」）には、この単語ペアにつき、文書意味ネットに設定されている単語ペア関連度と基本意味ネットに設定されている単語ペア関連度との積Ｓを算出する（ステップＳ１０４）。さらに、類似度Ｒを、現在値に積Ｓを加えた値に更新する（ステップＳ１０５）。
【００９１】
以下、同様にして、基本意味ネット内の単語ペアに順に着目し、文書意味ネットに着目中の単語ペアと同じものがあれば、双方の単語ペア関連度の積Ｓを算出し、この積Ｓを類似度Ｒに加算することによって、類似度Ｒの値を更新する。
【００９２】
基本意味ネットの全ての単語ペアに着目し終えると（ステップＳ１０６）、その時点での類似度Ｒの値をあらかじめ定めた基準値Ｒ０と比較する。ここで、Ｒ＞Ｒ０であれば、処理対象の文書を文書リストに加える旨を決定し（ステップＳ１０７→Ｓ１０８）、Ｒ≦Ｒ０であれば、処理対象の文書を文書リストから除外する旨を決定する（ステップＳ１０７→Ｓ１０９）。
【００９３】
上記のステップＳ１０２〜１０６のループの演算は、基本意味ネットおよび文書意味ネットを、それぞれ単語ペア関連度を要素とする多次元ベクトルとしてとらえて、基本意味ネットを構成する多次元ベクトルと文書意味ネットを構成する多次元ベクトルとの内積を求めていることに相当する。
この演算によれば、基本意味ネットおよび文書意味ネットの双方に共通する単語ペアに対し、共に高い単語ペア関連度が設定されている場合に、高い類似度Ｒを得ることができ、そのような単語ペアの数が増えるほど、類似度Ｒを高めることができる。これに対し、文書意味ネットにおいて、基本意味ネットと共通する単語ペアの数が少ない場合や、ある程度の数の単語ペアが共通するが、これらにおける単語ペア関連度の強弱のパターンが類似しない場合には、類似度Ｒは低い値になる。したがって、上記の類似度Ｒによれば、ＦＭＥＡシート中のユーザにより指定された行に記述されているテキストデータに類似する概念を有する文書に、高い類似度を設定することができる。
【００９４】
つぎに、この実施例の参照文書提示処理部３では、上記の類似度Ｒに基づき抽出された文書が表示されたことに応じて、注目度算出部３５により、これらの文書の文書注目度を算出することができる。この算出処理に応じて、文書表示処理部３４は、各文書を文書注目度の高い順に並べ替える。
【００９５】
図１２は、文書の抽出後に注目度算出部３５により実行される処理を示す。
この処理は、図１０（ヘ）に示した文書の一覧表示が行われた後に、ユーザが、不具合注目度による並べ替えを指定したことに応じて開始される。
【００９６】
まず、注目度算出部３５は、注目ワード辞書４０に格納されている各辞書ファイルのファイル名を一覧表示するなどして、ユーザに、以下の処理に使用する注目ワード辞書ファイルを選択させ、選択された辞書ファイルを読み出す（ステップＳ３０１）。
たとえば、製品や作業などの別に設定された分野毎に注目ワード辞書ファイルが作成されている場合には、ユーザは、ここで該当する分野の注目ワード辞書ファイルを選択する。また、不具合注目度の種別（影響度、検出難易度、危険度）毎に注目ワード辞書ファイルが登録されている場合には、ユーザはいずれかの種別の注目ワード辞書ファイルを選択する。
【００９７】
この後は、文書抽出部３３により作成された文書リスト中の１文書を処理対象文書に設定し、その文書の文書注目度Ｐとして、初期値の０をセットする（ステップＳ３０２）。
【００９８】
つぎに、処理対象文書の文書意味ネットに含まれる単語の１つ（単語Ｘ）に着目し、この単語Ｘが注目ワード辞書４０に登録されているかどうかをチェックする。ここで、該当する単語Ｘが登録されていない場合には、次の単語に着目する（ステップＳ３０４→Ｓ３０８→Ｓ３０３）。
【００９９】
着目中の単語Ｘが辞書ファイルに登録されている場合（ステップＳ３０４が「ＹＥＳ」）には、処理対象の文書意味ネット中の単語Ｘに対応づけられている単語ペア関連度の総和Ｔを算出し（ステップＳ３０５）、その総和Ｔと注目ワード辞書４０内の単語Ｘの単語注目度との積Ｑを求める（ステップＳ３０６）。さらに、ステップＳ３０７において、文書注目度Ｐの現在値に上記の積Ｑを加えた値により、文書注目度Ｐを更新する。
【０１００】
以下も同様に、処理対象文書の文書意味ネットに含まれている単語に順に着目し、着目中の単語Ｘが注目ワード辞書４０に含まれていることを条件に、その単語Ｘに対応する全ての単語ペアの単語ペア関連度の総和Ｔを求める処理（ステップＳ３０５）、当該単語につき注目ワード辞書に登録されている単語注目度と総和Ｔとの積Ｑを求める処理（ステップＳ３０６）、積Ｑを文書注目度Ｐに加算する処理（ステップＳ３０７）を、それぞれ実行する。さらに、全ての単語を処理し終えると（ステップＳ３０８）、そのときのＰの値を処理対象文書の文書注目度として保存し（ステップ３０９）、次の文書の処理に移る（ステップＳ３１０→Ｓ３０２）。
【０１０１】
上記の処理のステップＳ３０５で算出される総和Ｔは、処理対象の文書において、着目中の単語Ｘと他の単語との単語ペア関連度が高くなるほど、高い値を示すと考えられる。また、ステップＳ３０６およびＳ３０７の演算によれば、注目ワード辞書４０において高い単語注目度に対応づけられて登録されている単語が、処理対象の文書においても、高い単語ペア関連度による単語ペアを構成している場合に、処理対象の文書の文書注目度Ｐが高められることになる。一方、注目ワード辞書４０に登録されている単語が処理対象の文書に含まれていても、その単語による単語ペアに高い単語ペア関連度が設定されていない場合や、注目ワード辞書における当該単語の単語注目度が低い場合には、処理対象の文書の文書注目度Ｐは低い値に設定される。
【０１０２】
上記の文書注目度Ｐによれば、文書抽出部３３により抽出された各文書の参考文献としての価値を、文書注目度として数値化し、価値の高いものから順に表示することができる。これにより、ユーザは、表示された文書の中から参照の必要度が高い文書を容易に特定することができ、ＦＭＥＡシートの作成に有用な情報を高い確度で抽出することができる。
【０１０３】
なお、各文書の文書注目度を算出した後の処理としては、文書の表示順序を文書注目度に基づきソートする処理のほか、表示する対象の文書を、あらかじめ定めた値を超える文書注目度が得られた文書のみに絞り込んでもよい。また、注目ワード辞書４０に、不具合注目度の種毎に注目ワード辞書ファイルが登録されている場合には、それぞれの不具合注目度毎に、文書注目度を算出するようにしてもよい。
【０１０４】
さらに、注目度処理部３５は、個々の文書に対して求めた文書注目度の総和を算出し、この総和を指定された行の不具合注目度として、ＦＭＥＡシート編集・表示部２に提示することができる。ＦＭＥＡシート編集・表示部２では、提示された不具合注目度を、参考文書の呼び出しのためにユーザが指定された行の当該不具合注目度の入力欄に表示する。
このような処理により、従来は、知識や経験が豊富な人でなければ定められなかった不具合注目度を、演算により自動的に求めることが可能になり、ユーザの負担を大幅に軽減することができる。
【０１０５】
なお、上記の実施例では、注目ワード辞書４０に登録された辞書データを、不具合事例文書データベース３０に対する検索により抽出された文書から重要な文書を絞り込む目的に使用しているが、これに限らず、これらの辞書データからキーワードとなる単語を選択して、不具合事例文書データベースに対する検索処理を行うことも可能である。
【０１０６】
（２）第２実施形態
図１３は、ＦＭＥＡシート作成システムの第２形態を示す機能ブロック図である。
このシステムも、図１に示した第１形態のシステムと同様に、ＦＭＥＡシートデータベース１、ＦＭＥＡシート編集・表示部２、および参照文書提示処理部３を具備する。また、この実施例では、注目ワード辞書作成処理部４に代えて、注目意味ネット作成処理部４００が設けられるが、この注目意味ネット作成処理部４００は、第１形態のシステムと同様の構成のシート読出部４１およびシート解析部４２、ならびにシート解析部４２により作成された注目意味ネットを登録するための注目意味ネットデータベース４６により構成される。
【０１０７】
この実施例のシステムでは、あらかじめ分野別に作成されたＦＭＥＡシートの中の１つをシート読出部４１により読み出して、シート解析部４２による解析処理を行うことにより、分野ごとの注目意味ネットを作成して注目意味ネットデータベース４６に登録することができる。また、注目意味ネットの作成において、不具合注目度として、影響度、検出難易度、および危険度のいずれかを選択することができる。また、不具合注目度の種毎に注目意味ネットを作成することもできる。
【０１０８】
参照文書提示処理部３は、第１形態のシステムと同様に、不具合事例文書データベース３０、指定受付部３１，テキスト解析部３２、文書抽出部３３、文書表示処理部３４、注目度算出部３５を備える。これらのうち、注目度算出部３５以外の処理部により実行される処理は、第１形態のシステムと同様であるが、注目度算出部３５は、注目ワード辞書４０が作成されないことに伴い、第１形態とは異なる内容の処理を実行する。
【０１０９】
図１４は、この実施例の注目度算出部３５が文書注目度を算出するために実行する処理の手順を示す。この処理も、図１２に示した処理と同様に、ＦＭＥＡシートに対する行指定操作に応じてテキスト解析部３２、文書抽出部３３、文書表示処理部３４による処理が実行されて、不具合事例文書データベース３０から所定数の文書が抽出および表示された後に、この表示を文書注目度に基づいて並べ替えることを指示する操作が行われたことに応じて開始される。
【０１１０】
まず、注目意味ネットデータベース４６に格納されている注目意味ネットの中から、ユーザにより選択された注目意味ネットを読み出し（ステップＳ４０１）、この注目意味ネットの大きさＶ０を算出する（ステップＳ４０２）。具体的に、ステップＳ４０２では、注目意味ネットを各単語ペア注目度を要素とする多次元ベクトルとみなして、この多次元ベクトルの長さを求める演算を実行する。すなわち、各単語ペア注目度の自乗の総和を求める演算と、この総和の平方根を求める演算とを実行する。
【０１１１】
つぎに、文書抽出部３３により作成された文書リスト中の１文書を処理対象文書として、その文書注目度Ｐに初期値の０を設定する（ステップＳ４０３）。また、ステップＳ４０２と同様の演算により、処理対象文書の文書意味ネットの大きさＶを算出する（ステップＳ４０４）。
【０１１２】
つぎに、処理対象文書の文書意味ネットから１つの単語ペア（Ａ，Ｂ）およびその単語ペア関連度Ｃ（Ａ，Ｂ）を読み出す（ステップＳ４０５）。そしてこの単語ペア（Ａ，Ｂ）がステップＳ４０１で読み出された注目意味ネットに含まれているかどうかを判別し、含まれている場合（ステップＳ４０６が「ＹＥＳ」）には、その単語ペアの単語ペア注目度Ｇ（Ａ，Ｂ）を読み出す（ステップＳ４０７）。そして、この単語ペア注目度Ｇ（Ａ，Ｂ）とステップＳ４０５で読み出した単語ペア関連度Ｃ（Ａ，Ｂ）との積を文書注目度Ｐに加算する演算を実行し、加算後の値により文書注目度Ｐを更新する（ステップ４０８）。
【０１１３】
一方、着目中の単語ペア（Ａ，Ｂ）が注目意味ネットに含まれていない場合（ステップＳ４０６が「ＮＯ」）には、上記のステップＳ４０７およびＳ４０８をスキップする。
【０１１４】
以下、同様に、処理対象文書の文書意味ネットの各単語ペアに順に着目し、着目中の単語ペアが注目意味ネットにも含まれている場合には、ステップＳ４０７およびステップ４０８を実行する。全ての単語ペアを処理し終えると（ステップＳ４０９が「ＹＥＳ」）、その時点でのＰの値をＶ０とＶとの積により正規化し（ステップＳ４１０）、正規化後のＰを処理対象文書の文書注目度として保存する（ステップ４１１）。
以下、つぎの文書の処理に移行し（ステップＳ４１２→Ｓ４０３）、同様の手順を繰り返す。
【０１１５】
上記ステップＳ４０５〜４０９のループでは、注目意味ネットを構成する多次元ベクトルと処理対象文書の文書意味ネットを構成する多次元ベクトルとの内積を求めていることになる。さらに、ステップＳ４１０では、算出された内積を各多次元ベクトルの長さの積で除算しているから、正規化後のＰの値は、各多次元ベクトルがなす角度θの余弦（ｃｏｓθ）に相当することになる。
上記の正規化処理によれば、各文書意味ネットのサイズのばらつきによる影響を除外できると共に、文書注目度を１以下の値に収めることができる。
【０１１６】
図１５は、図７と同様の構成の注目意味ネットと、簡単な構成の文書意味ネットとを提示して、図１４の手順に基づき、これらに対して実行される演算を具体的に示す。
注目意味ネットの大きさＶ０および文書意味ネットの大きさＶの算出式は、図中の（ａ）（ｂ）のとおりである。また、（ｃ）に示すように、この例の注目意味ネットと文書意味ネットとの間では４組の単語ペアが共通するので、前出のステップＳ４０５〜４１０の処理により、図中の（ｄ）式が実行されることになる。
【０１１７】
上記のとおり、第２形態のシステムでは、既存のＦＭＥＡシートに対する解析処理により作成された注目意味ネットに対する文書意味ネットの類似度を、文書注目度として算出するので、注目意味ネットにおいて高い単語ペア注目度が設定されている単語ペアが文書意味ネットでも高い単語ペア関連度をもって出現している文書に対して、高い文書注目度を設定することができる。また、このような単語ペアをより多く含む文書により高い文書注目度を設定することができる。
よって、不具合の記述において注目すべき必要度の高い単語が多く含まれる文書に対して、高い文書注目度を設定することができる。また、単独では事故や危険の可能性をさほど表さない単語を複数組み合わせることによって、高いリスクを示す表現が構成されている文書にも、高い文書注目度を設定することが可能となるから、文書注目度として、信頼度が高い指標を提示することができる。
【０１１８】
よって、第１形態、第２形態のシステムとも、危険度の高い不具合を認識する処理における各文書の価値を評価するのに適した文書注目度を求めることができる。また、単独での重要度合いは低いが、他の単語と組み合わせて使用されることによって、事故や危険の発生を示唆する可能性の高い単語を含む文書に高い文書注目度を設定することが可能になる。したがって、文書注目度が所定の値を超える文書にユーザの注意を向けさせるような表示を行うようにすることによって、品質管理のために参照する必要性の高い文書が見逃されるのを防止することが可能になる。
【０１１９】
［各実施形態の変形例］
上記第１、第２の実施形態では、いずれも、完成体のＦＭＥＡシートを解析することにより注目意味ネットを作成しているが、これに限らず、未完成のＦＭＥＡシートであっても、十分な情報が記入されている行が相当数含まれる場合には、これらの行のテキストデータを用いて注目意味ネットを作成することが可能である。また、各実施形態では、ＦＭＥＡシートデータベース１をシステム内に設けて、このデータベース１から解析対象のデータを読み出すようにしているが、これに限らず、外部のシステムとの通信によりＦＭＥＡシートの電子データを入力し、解析することも可能である。不具合事例文書に関しても同様である。
【０１２０】
また、各実施形態では、ＦＭＥＡシートおよび文書のテキストデータに含まれる単語を２個ずつ組み合わせて、その組み合わせ単位での重要度（単語ペア注目度）を求めたが、単語の組み合わせはこれに限定されるものではない。たとえば各行において、それぞれその行のテキストデータに含まれる３個以上の単語を組み合わせて、その組み合わせにおける単語間の共起強度を対応する行の不具合注目度の値により重み付けすると共に、重み付け後の共起強度を、行間で単語の組み合わせが共通するもの毎に累計することにより、各単語の組み合わせの重要度を求めてもよい。
【０１２１】
また、注目ワード辞書４０や注目意味ネットデータベース４６の作成のために解析するテキストデータはＦＭＥＡシートとして編集されたものに限らず、不具合に関する記述がなされた複数のテキストデータを、それぞれＦＭＥＡシートの１行分のテキストデータと同様に処理して意味ネットを作成し、これらの意味ネットから注目意味ネットを作成してもよい。なお、このテキストデータとして、不具合事例文書データベース３０内の文書ファイルを利用してもよい。
【０１２２】
ＦＭＥＡシートに代えて一般的なテキストデータを使用する場合にも、それぞれのデータに不具合注目度に相当する重要度が設定されているのが望ましいが、重要度は必ずしも必要ではなく、各テキストデータの意味ネット内の単語ペア関連度を同じもの毎に累計する方法により、注目意味ネットを設定してもよい。テキストデータ毎の重要度に基づいて単語ペア関連度を重み付けしなくとも、同じテーマに関して複数のテキストデータを入力したり、十分な容量のテキストデータを使用することによって、各テキストデータの単語ペア関連度を、重み付けされたのと同様の強度にすることができるのであれば、単語ペア注目度の信頼度を確保することができ、これにより文書注目度の値の信頼度を確保することが可能になる。
【符号の説明】
【０１２３】
１ＦＭＥＡシートデータベース
２ＦＭＥＡシート編集・表示部
３参照文書提示処理部
４注目ワード辞書作成処理部
４００注目意味ネット作成処理部
３０不具合事例文書データベース
３３文書抽出部
３４文書表示処理部
３５注目度算出部
４０注目ワード辞書
４１シート読出部
４２シート解析部
４３単語注目度算出部
４４辞書データ作成・表示部
４５辞書データ登録部
４６注目意味ネットデータベース

【特許請求の範囲】
【請求項１】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているＦＭＥＡシートの電子データを入力する第１の入力手段と、
前記データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第１の解析手段と、
危険を表す記述に用いられ得る単語を登録するための単語辞書データベースと、
前記第１の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された複数の単語について、それぞれその単語が含まれる行の記述と当該行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出する単語注目度算出手段と、
前記形態素解析処理により抽出され、前記単語注目度が算出された複数の単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて前記単語辞書データベースに登録する登録手段と、
不具合に関する記述がなされた文書のテキストデータを入力する第２の入力手段と、
前記第２の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第２の解析手段と、
前記第２の解析手段により処理された文書について、第２の解析手段の形態素解析によりその文書のテキストデータから抽出され、かつ前記単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度を算出する文書注目度算出手段と、
前記第２の解析手段および文書注目度算出手段により処理された所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段とを、
具備することを特徴とするテキスト解析システム。
【請求項２】
前記単語注目度算出手段は、前記第１の解析手段の形態素解析の結果に基づき、形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、前記単語注目度を算出する、請求項１に記載されたテキスト解析システム。
【請求項３】
前記第１の解析手段は、前記不具合に関する記述部分のテキストデータを前記ＦＭＥＡシートの行単位のデータに分けて前記形態素解析を実行し、
前記単語注目度算出手段は、
前記第１の解析手段の形態素解析の結果に基づき、前記ＦＭＥＡシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第１演算手段と、
前記第１演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第２演算手段と、
前記ＦＭＥＡシートの各行に対する第１演算手段および第２演算手段の処理により求められた各単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する統合手段と、
前記統合手段により統合された各単語の組み合わせに含まれる個々の単語について、それぞれ当該単語が関わる全ての単語の組み合わせに対応する重要度の累計値または平均値を算出する第３演算手段と、
前記第３演算手段により処理された単語毎に、その単語につき第３演算手段が求めた値に基づき、当該単語の単語注目度を示す度数を導出する度数導出手段とを、具備する、請求項１に記載されたテキスト解析システム。
【請求項４】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているＦＭＥＡシートの電子データを入力する第１の入力手段と、
前記データ入力手段により入力された電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行する第１の解析手段と、
前記第１の解析手段の形態素解析の結果に基づき、この形態素解析により抽出された単語間の共起関係に基づき各単語を複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出する重要度算出手段と、
前記重要度算出手段により処理された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データが登録される登録手段と、
不具合に関する記述がなされた文書のテキストデータを入力する第２の入力手段と、
前記第２の入力手段により入力された文書のテキストデータに対する形態素解析を実行する第２の解析手段と、
前記第２の解析手段の形態素解析により解析対象の文書のテキストデータから抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出し、各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成する文書解析手段と、
前記文書解析手段により処理された文書につき、危険度の高い不具合を認識する上で当該文書に注目する必要性の高さを示す文書注目度として、前記特徴データ登録手段に登録されている特徴データに対する前記文書解析手段が作成した特徴データの類似度を求める文書注目度算出手段と、
前記第２の解析手段および文書解析手段ならびに文書注目度算出手段により処理された
所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する処理結果出力手段とを、
具備することを特徴とするテキスト解析システム。
【請求項５】
前記重要度算出手段は、
前記第１の解析手段の形態素解析の結果に基づき、前記ＦＭＥＡシートの各行毎に、その行における不具合の記述に含まれる単語を複数とおりに組み合わせて、各組み合わせにおける単語間の共起強度を求める第１演算手段と、
前記第１演算手段が求めた共起強度をそれぞれ対応する行に設定されている重要度の値により重み付けすることにより、各単語の組み合わせ毎の重要度を求める第２演算手段と、
前記ＦＭＥＡシートの各行に対する前記第１演算手段および第２演算手段の処理により求められた単語の組み合わせの重要度を、単語の組み合わせが一致するもの毎に統合する統合手段とを具備する、請求項４に記載されたテキスト解析システム。
【請求項６】
不具合の内容および解決方法に関する言語表現を記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているＦＭＥＡシートの電子データを入力して、この電子データから、危険を表す記述に用いられ得る単語が登録された単語辞書データベースを作成する第１のテキスト解析ステップと、
不具合に関する記述がなされた文書のテキストデータを入力して、このテキストデータに対する形態素解析を実行し、この形態素解析により前記文書のテキストデータから抽出され、かつ前記単語辞書データベースに登録されている単語の単語注目度を用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第２のテキスト解析ステップと、
前記第２のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行し、
前記第１のテキスト解析ステップでは、
前記ＦＭＥＡシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、
前記形態素解析の結果に基づき、この形態素解析により抽出された単語毎に、その単語が含まれる行の記述における当該単語と他の単語との共起強度と、当該単語が含まれる行に設定されている重要度とを用いて、この単語を用いた記述が示唆する危険度の高さを認識する上で当該単語に注目する必要性の高さを示す単語注目度を算出するステップと、
前記単語注目度が算出された単語のうちの一部または全ての単語を、それぞれその単語の単語注目度に対応づけて前記単語辞書データベースに登録するステップとを、実行する、
テキスト解析方法。
【請求項７】
不具合の内容および解決方法に関する言語表現をテキストにより記入するための複数の項目と、不具合の重要度の高さを表す数値を記入するための項目とが設けられ、各項目に対する情報が複数行にわたって記入されているＦＭＥＡシートの電子データを入力して、この電子データから、ＦＭＥＡシート内の記述に関する特徴データが登録されたデータベースを作成する第１のテキスト解析ステップと、
不具合に関する記述がなされた文書のテキストデータを入力して当該テキストデータに対する解析処理を実行し、この解析処理の結果と前記データベースに登録された特徴データとを用いて、危険度の高い不具合を認識する上で前記文書に注目する必要性の高さを示す文書注目度を算出する第２のテキスト解析ステップと、
前記第２のテキスト解析ステップの処理対象とされた所定数の文書またはこれらの文書の識別情報を、各文書の文書注目度を反映した形式で出力する出力処理ステップとを実行し、
前記第１のテキスト解析ステップでは、
前記ＦＭＥＡシートの電子データのうち不具合に関する記述部分のテキストデータに対して形態素解析を実行するステップと、
前記形態素解析により抽出された単語を、これらの単語間の共起関係に基づき複数とおりに組み合わせ、組み合わせ毎に、その組み合わせにおける単語間の共起強度と当該組み合わせが含まれる行に設定されている重要度とを用いて当該組み合わせの重要度を算出するステップと、
前記重要度が算出された複数の単語の組み合わせと各組み合わせの重要度とが対応づけられた特徴データを、前記データベースに登録するステップとを、実行し、
前記第２のテキスト解析ステップでは、
前記入力された文書のテキストデータに対する形態素解析を実行するステップと、
前記文書のテキストデータに対する形態素解析により抽出された複数の単語を複数とおりに組み合わせて、組み合わせ毎に当該組み合わせにおける単語間の共起強度を算出するステップと、
各単語の組み合わせと前記共起強度とを対応づけた特徴データを作成し、前記文書注目度として、前記データベースに登録された特徴データに対する前記文書のテキストデータから作成された特徴データの類似度を求めるステップとを、実行する、テキスト解析方法。

【図１】