説明

知識情報処理装置および知識情報処理方法

【課題】 汎用性が高いデータ形式で表現された情報を知識情報として生成する新たな技術が要望されている。
【解決手段】 知識情報処理装置100は、複数のデータを含む表データを入力する入力部102と、入力された表データに含まれるそれぞれのデータの表データにおける所在を一意に特定するための所在特定情報を設定する所在設定部112と、所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付ける関連付け部116と、関連付けられたそれぞれのデータを一つの知識情報として生成する知識情報生成部118と、を備える。これにより、汎用性が高い表データ形式で表現された情報を知識情報として生成できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、蓄積された知識情報を利用し推論を行う知識情報処理装置および知識情報処理方法に関する。
【背景技術】
【0002】
近年、特定分野に特化した専門知識やノウハウをデータベースに蓄積し、当該蓄積された専門知識やノウハウを元に推論を行い、その分野の専門家に近い判断を下すことができるエキスパートシステムが注目されつつある。例えば、病気に関する知識がほとんどない患者が、医者による病気に関する専門知識を蓄積したデータベースを利用することで、専門家である医者の助けを借りることができる。
【0003】
一般に、データベースに蓄積する前の専門知識やノウハウはコンピュータにとって理解しにくい形式で表現されることが多い。例えば、特許文献1には、自動登録できない配管計装線図、機器構造図や配管図などのCAD(Computer Aided Design)データをユーザの入力支援により登録させる技術が開示されている。
【特許文献1】特開平6−83678号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
確かに、特許文献1によれば、CADデータに記載された情報をデータベースに登録できるが、入力の対象をCADデータに限定しており、その他のデータ形式で表現された知識やノウハウなどの情報には適用できないことがある。さらに、CADデータはその性質上、用途が限定されるため、汎用性が高いデータ形式とは必ずしも言えないことがある。そのため、汎用性が高いデータ形式で表現された情報をデータベースに登録できる新たな技術が要望されている。
【0005】
本発明はこうした課題に鑑みてなされたものであり、その目的は汎用性が高いデータ形式で表現された情報を知識情報としてデータベースに登録できる知識情報処理装置および知識情報処理方法の提供にある。
【課題を解決するための手段】
【0006】
本発明のある態様は、知識情報処理装置に関する。この装置は、複数のデータを含む表データを入力する入力部と、入力された表データに含まれるそれぞれのデータの表データにおける所在を一意に特定するための所在特定情報を設定する所在設定部と、所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付ける関連付け部と、関連付けられたそれぞれのデータを一つの知識情報として生成する知識情報生成部と、を備える。この態様によれば、汎用性が高い表データ形式で表現された情報を知識情報として生成できるため、ユーザメリットの高い知識情報処理装置を提供できる。
【0007】
所在設定部は、表データにおける行位置の項目を特定するための第1キーと列位置の項目を特定するための第2キーとを生成するキー生成部を備え、データの所在は、第1キーにより特定された行位置の項目と第2キーにより特定された列位置の項目とにより二次元的に表現されてもよい。
【0008】
入力部は複数の表データを入力するものであり、所在設定部は、入力された複数の表データのうちいずれかの表データを特定するための識別情報をさらに設定してもよい。第1キーおよび第2キーの少なくともいずれか一方は、複数のキーで形成されてもよい。
【0009】
表データは単独で有意となる部分表データが複数組み合わされたものであり、所在特定情報は、所在設定部により部分表データごとに設定されてもよい。この装置は、入力された表データの定義情報を生成する定義情報生成部と、知識情報と定義情報とを比較し知識情報が正規化されているか否かを検証する検証部とをさらに備えてもよい。
【0010】
関連付け部は、関連付けた複数のデータの中から、少なくとも、第1キーにより特定された行位置の項目が同一であり、さらに第2キーにより特定された列位置の項目が同一であるデータを複数抽出する抽出部を備え、知識情報生成部は、抽出部により抽出された複数のデータを統合して一つの知識情報を生成する。知識情報のそれぞれは同一の形式で表現されてもよい。その形式は述語論理型の言語形式であってもよい。また、その形式はXML言語形式であってもよい。
【0011】
本発明の別の態様も、知識情報処理装置に関する。この装置は、複数のデータを含む表データを入力する表データ入力部と、入力された表データに含まれるそれぞれのデータの表データにおける行位置の項目を特定するための第1キーと列位置の項目を特定するための第2キーとを生成するキー生成部と、第1キーにより特定された行位置の項目と第2キーにより特定された列位置の項目とにより二次元的に表現されるそれぞれのデータの所在を当該データに関連付ける関連付け部と、関連付けられたそれぞれのデータを一つの知識情報として生成する知識情報生成部と、述語論理型の言語形式で記述された推論ルールを入力する推論ルール入力部と、質問検索式を入力する検索式入力部と、質問検索式に基づいて、推論ルールおよび知識情報により推論を行う推論部と、推論部による推論結果を提示する提示部と、を備える。
【0012】
本発明のさらに別の態様は、知識情報処理方法に関する。この方法は、複数のデータを含む表データを入力するステップと、入力された表データに含まれるそれぞれのデータの表データにおける所在を一意に特定するための所在特定情報を設定するステップと、所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付けるステップと、関連付けられたそれぞれのデータを一つの知識情報として生成するステップと、を備える。
【発明の効果】
【0013】
本発明によれば、ユーザメリットの高い知識情報処理装置および方法を提供できる。
【発明を実施するための最良の形態】
【0014】
実施の形態1
図1は、実施の形態1に係る知識情報処理装置の構成を示す。この構成は、ハードウエア的には、任意のコンピュータのCPU(Central Processing Unit)、メモリ、その他のLSI(Large Scale Integration)で実現でき、ソフトウエア的にはGUI(Graphical User Interface)機能、知識情報処理機能その他の機能をもつプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
【0015】
実施の形態1に係る知識情報処理装置100は、入力された表データに含まれるそれぞれのデータを当該データのそれぞれの所在と関連づけ、当該関連づけられたデータを知識情報として生成する。このとき、生成された知識情報は同一の形式で表現される。知識情報とは、単なるデータである「形式知」だけでなく、データの所在といった、通常は明示化されない「暗黙知」までを含んだ情報を指す。知識情報処理装置100は、ユーザから質問検索式による問題解決の要求があったとき、内部に蓄積された知識情報を利用して推論を実行し、推論結果をユーザに提示する。これにより、知識情報処理装置100は問題解決の要求を満足する解をユーザに提供できる。
【0016】
実施の形態1における表データとは、行と列とにより二次元的に整理されていると視覚的に理解しやすい、例えばエクセル形式などの表形式で表現されるデータである。また、他の例として、データ間がカンマ記号で区切られるとともにデータ行が改行で区切られる、いわゆるCSV(Comma Separated Value)形式で保持されたデータを指してもよい。いずれにしても、表データは、行と列とによって二次元的にデータの所在が特徴づけられるデータ形式であればよい。
【0017】
実施の形態1に係る知識情報処理装置100は、入力部102と、提示部104と、知識ベース部106と、定義情報保持部108と、制御部110と、を備える。制御部110は、所在設定部112と、関連付け部116と、知識情報生成部118と、推論部120と、定義情報生成部122と、検証部124と、を備える。入力部102は、キーボード、マウス、ボタン、タッチパネル等の不図示の入力デバイスを介して、ユーザからの表データの入力を受け付ける。さらに、入力部102は、ユーザからの質問検索式や推論ルールの入力を受け付ける。この場合、入力部102は、図示しない表データ入力部と、検索式入力部と、推論ルール入力部とを備え、それぞれが別々に、表データ、質問検索式、推論ルールの入力を受け付けてもよい。
【0018】
なお、表データは電子化されたものである必要はなく、例えば、紙原稿上に記載されたものなど、その保存形式は問わない。表データが紙原稿上に記載されている場合、知識情報処理装置100は、まず、外部の不図示のスキャナなどで表データが記載された原稿を電子化された図面データとして読み取る。次に、外部の不図示の文字認識変換装置は、図面データとして読み取った表データ中の文字やデータ構造を認識し、当該表データをCSV形式に変換する。最後に、入力部102は、こうして生成されたCSV形式の表データの入力を受け付ける。これにより、紙原稿上の表データを入力できる。
【0019】
所在設定部112は、入力部102により入力された表データに含まれる複数のデータの表データにおける所在を一意に特定するための所在特定情報を設定する。所在特定情報の設定はユーザからの指示により行われてもよい。所在特定情報とは、例えば、データの表データにおける行位置の項目を特定するための第1キー(以下、単に「列キー」という)とデータの表データにおける列位置の項目を特定するための第2キー(以下、単に「行キー」という)とを指す。なお、行位置とは表データ上の縦方向の位置を、一方、列位置とは表データ上の横方向の位置を指す。
【0020】
所在設定部112内部のキー生成部114は、列キーと行キーとを生成する。列キーと行キーの生成はユーザからの指示により行われてもよい。これにより、表データ中のデータの所在は、列キーにより特定された行位置の項目と行キーにより特定された列位置の項目とにより二次元的に表現される。また、所在設定部112は、入力された複数の表データのうちいずれかの表データを特定するための、表データ固有の表IDや表データの名称などの識別情報をさらに設定してもよい。これにより、入力部102に入力される表データが複数であっても、表データの識別情報をさらに設定することで、データの所在を一意に特定できる。なお、識別情報は所在特定情報として設定されてもよい。
【0021】
関連付け部116は、所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付ける。例えば、表データに含まれるデータ「A」の所在が、所在特定情報により表IDが「1」、行位置が「第3行」、列位置が「第4列」、と特定されていれば、関連付け部116は、データ「A」に表ID「1」、「第3行」、および「第4列」を関連づける。
【0022】
知識情報生成部118は、関連付け部116により関連づけられたそれぞれのデータを一つの知識情報として生成する。知識情報生成部118により生成された知識情報は知識ベース部106に格納される。実施の形態1におけるそれぞれの知識情報は、以下に示す同一形式の「gimt」関数で表現される。実施の形態1によれば、知識情報は同一形式で記述されている。そのため、データベース管理者による知識情報の管理を容易にできる。なお、「gimt」は関数の一名称であるが、当該名称はこれに限られない。
【0023】
【数1】

【0024】
定義情報生成部122は、入力部102を介して入力された表データの定義情報を生成する。定義情報はユーザからの入力指示に基づいて生成されてもよい。表データの定義情報とは、表データのデータ構造、項目間の関係、あるいはデータ間の関係を示す情報である。定義情報生成部122により生成された定義情報は定義情報保持部108に格納される。以下、定義情報の一例を示す。
(ア)表データの識別情報
(イ)表データの最大行数および最大列数
(ウ)表データのファイルパス
(エ)列キーが割り当てられた列番号、列キー名
(オ)行キーが割り当てられた行番号、行キー名
【0025】
検証部124は、知識情報生成部118により生成された知識情報と定義情報生成部122により生成された定義情報とを比較し、知識情報が正規化されているか否かを検証する。正規化されている状態とは、表データの名称、および列キーと行キーとにより、データを一意に特定できる状態を示す。具体的には、検証部124は、定義情報に含まれる表データの名称、列キーおよび行キーを検索キーとして利用して、知識情報の集合の中から、一意に知識情報を抽出できるか否かに応じて、生成された知識情報が正規化されているか否かを判断する。
【0026】
推論部120は、入力部102を介してのユーザからの質問検索式の入力があった場合、推論ルールを参照しながら、知識ベース部106に蓄積された知識情報に基づいて推論を行う。この推論ルールは、ユーザにより記述され、入力部102を介して知識ベース部106に登録される。なお、推論ルールは、知識情報を利用できる記述形式であればよく、例えば、知識情報と同様の形式である述語論理型の言語形式で表現される。提示部104は、推論部120による推論結果を外部の不図示のディスプレイを介してユーザに提示する。
【0027】
実施の形態1によれば、行位置の項目と列位置の項目を指定すれば、知識情報を一意に特定できる。すなわち、一つの事実に対し一つの知識情報の状態、いわゆる正規化の状態を実現しており、知識情報の内容の修正作業や追加作業にかかる負担を軽減できる。さらに、質問検索式により行位置の項目と列位置の項目が指定されたとき、推論部120は的確に一つの知識情報を特定し利用できるため、アクセス効率の良い、誤差の少ない推論結果を提示できる。これにより質問に対する回答の信頼性を高めることができる。
【0028】
一般に、データベースの設計や構築に関する知識を有する者でなければデータベースにおけるデータの正規化作業を行うことは困難である。さらに、データベースの設計に携わった者でも、非効率な構造を設計して、アクセス効率の悪いシステムを構築してしまうことがある。実施の形態1によれば、少なくともデータの所在を特定する列キーと行キーを設定すれば知識情報を生成できるため、簡単に正規化された知識情報の集合を生成できる。
【0029】
以下、実施の形態1に係る知識情報処理装置100による表データの入力から知識情報の生成までの動作を図2〜図4を用いて説明する。図2は、入力部に入力される5行4列の複数のセルを有する表データの一例を示す。表データ200がCSV形式で記述されているのであれば、見やすさを考慮して、エクセル形式などの見やすい表形式に変換したものを図として示すものとする。図2に示す表データ200には、道路交差点においてあるイベントが発生したときの歩行者の次に取るべき行動パターンが示されている。なお、この表データ200の名称は「歩行者の行動パターン」である。
【0030】
第1行の第2列〜第4列の項目で構成される第1項目群202は、それぞれ「停止」、「歩く」、および「走る」といった歩行者の現在の行動パターンを示している。一方、第1列の第2行〜第5行の項目で構成される第2項目群204は、それぞれ赤、青、青点滅の信号機の信号の変化のイベントの他、「横断完了」という歩行者の状態推移に関するイベントをも含む。さらに第2行第2列を左上端とし、縦方向に4つ分のセル、横方向に3つ分のセルに格納されるデータで構成されるデータ群206は、イベントが発生したときに、現在の歩行者の行動パターンに応じて次に取るべき歩行者の行動パターンを示している。なお、図2に示すように第1行第1列のセルには何のデータも設定されていないものとする。
【0031】
図2には、例えば、現在の歩行者の行動パターンが第1行第2列で示す「停止」であり、第3行第1列で示す「青」に変化するというイベントが発生したとき、歩行者は次に取るべき行動として第3行第2列で示す「歩く」行動パターンを選択することが示されている。人間は、この表データ200を見れば、「現在の行動パターン」と「次に取るべき行動パターン」と「イベント」との対応関係を認識できるため、表データ200が指し示す情報の内容を簡単に理解できる。実施の形態1では、さらにコンピュータにとっても表データ200が指し示す情報の内容を理解できるように、知識情報処理装置100は以下に示す設定処理を行う。
【0032】
図3は、所在特定情報が設定された歩行者の行動パターンの表データを示す。図2と同等の構成には同じ符号を与え適宜説明を略す。また、見やすさのため、所在特定情報が格納されたセルを斜線で明示する。図3に示すごとく、第0行第0列、第0行第1列、第1行第0列のセルに所在特定情報が格納されている。この所在特定情報が格納されるセルは、歩行者の行動パターンの表データ200が記載されている範囲の外側のセルであるため、表データ200の配置位置に影響を与えずに済む。
【0033】
なお、所在特定情報はダイアログによる対話形式で入力できるものとしてもよい。例えば、「表データの名称は何ですか?」という知識情報処理装置100からの問いに対し、ユーザが「歩行者の行動パターン表」と入力部102を介して応答することで第0行第0列に所在特定情報が設定されてもよい。また、「列キーは第何列に割り当てますか?」、「何という名称で設定しますか?」という知識情報処理装置100からの問いに対し、ユーザが「1列」、「イベント」と入力部102を介して応答することで第0行第1列に所在特定情報が設定されてもよい。さらに、この場合、設定された所在特定情報は制御部110内部の不図示のメモリなどの記憶部が保持し、実際のディスプレイ上には表示されなくてもよい。
【0034】
以下、実施の形態1に係る知識情報処理装置100による所在特定情報の具体的な設定作業を順番に示す。
(1)表データ200の名称「歩行者の行動パターン」を第0行第0列に設定する。
(2)列キー名が「イベント」である列キーを生成し第1列に割り当てる。
(3)行キー名が「現在の行動パターン」である行キーを生成し第1行に割り当てる。
【0035】
すなわち、(2)ではデータ群206に含まれる、あるデータの行位置の項目を特定するための列キーを第1列に割り当て、列キー名を第1列の第2行〜第5行を示す「イベント」に設定する。同様に、(3)ではデータ群206に含まれる、あるデータの列位置の項目を特定するための行キーを第1行に割り当て、行キー名を第1行の第2列〜第4列を示す「現在の行動パターン」に設定する。これにより、表データ200の名称、列キーおよび行キーによりデータ群206に含まれるデータの所在を特定できる。
【0036】
図4は、知識情報生成部により生成された知識情報の集合の一例を示す。例えば、図4に示す知識情報群300内の知識情報302は、図3に示す第3行第2列のデータ「歩く」が知識化されたものである。すなわち、知識情報302の情報供給源となる表データの名称は「歩行者の行動パターン」であり、現在の歩行者の行動パターンが「停止」である場合において、信号機の信号が「青」になるというイベントが発生した場合、歩行者は次に取るべき行動として「歩く」を選択することを示す。これにより、単なる「形式知」のデータ「歩く」を生成するのではなく、「信号が青に変化した場合、歩行者は停止状態から歩く状態に変化させる」という知識やノウハウを含む知識情報を生成できる。
【0037】
図5は、ユーザにより入力部を介して入力された推論ルールの一例を示す。以下、第1推論ルールR1〜第4推論ルールR4が示す意味について説明する。第1推論ルールR1および第2推論ルールR2は初期化処理を行うためのルールであり、一方、第3推論ルールR3および第4推論ルールR4は推論結果の出力処理を行うためのルールである。
(R1)歩行者の現在の行動パターン「Y」が、すでに「歩く」等の何らかの値に設定されている場合、当該設定された状態を削除して歩行者の行動パターンを「停止」に設定する。
(R2)歩行者の現在の行動パターン「Y」がいずれの値も設定されていない場合、歩行者の行動パターン「Y」を「停止」に設定する。
(R3)イベント「X」と歩行者の現在の行動パターン「Y」を検索キーにして、知識情報群を参照し、対応する歩行者の取るべき次の行動パターン「Z」に当たるデータが存在すれば、当該データを推論結果として出力する。
(R4)イベント「X」と歩行者の現在の行動パターン「Y」を検索キーにして、知識情報群を参照し、対応する歩行者の取るべき次の行動パターン「Z」に当たるデータが存在しなければ、「ルールなし」という推論結果を出力する。
【0038】
以下、推論部120により第1推論ルールR1〜第4推論ルールR4が解釈実行され、推論結果が出力されるまでの処理を示す。なお、推論部120は内部に不図示のコンパイル部を備え、当該コンパイル部がそれぞれの推論ルールを解釈実行してもよい。
(あ)推論部120は、ユーザから入力部102を介して「init」という命令を取得したとき、第1推論ルールR1および第2推論ルールR2を解釈実行し、歩行者の現在の行動パターン「Y」を「停止」状態に設定する。
(い)推論部120は、ユーザから入力部102を介して「act(青、Y、Z)」という命令を取得したとき、第3推論ルールR3および第4推論ルールR4を解釈実行する。
(う)推論部120は、イベント「X」が「青」であり、歩行者の現在の行動パターン「Y」が「停止」である知識情報302を参照する。
(え)推論部120は、歩行者の取るべき次の行動パターン「Z」として「歩く」を推論結果として出力する。
【0039】
図6は、実施の形態1に係る知識情報処理装置の処理の流れを示す。入力部102はユーザから表データ200の入力を受け付ける(S10)。キー生成部114は入力部102により受け付けた表データ200を参照し、列キーおよび行キーを生成する(S12)。関連付け部116は、キー生成部114により生成された列キーおよび行キーで特定されるデータの表データにおける所在とデータとを関連づける(S14)。定義情報生成部122は入力部102を介してのユーザからの指示に従い、表データの定義情報を生成し定義情報保持部に保持する(S16)。
【0040】
知識情報生成部118は、所在が関連づけられたデータを知識情報として生成する(S18)。検証部124は、知識情報と定義情報とを比較し、知識情報が正規化されているか否かを判断する(S20)。検証部124により知識情報が正規化されていないと判断された場合(S20のN)、提示部はS12以降の処理の実行をユーザに指示する。検証部124により知識情報が正規化されていると判断された場合(S20のY)、知識情報生成部118は知識情報を知識ベース部106に格納する(S22)。
【0041】
入力部102はユーザから推論ルールの入力を受け付ける(S24)。推論部120はユーザから受け付けた推論ルールを解釈実行するとともに、知識ベース部106に格納された知識情報を参照し推論を行う(S26)。提示部104は、推論部120により出力された推論結果をユーザに提示する(S28)。
【0042】
一昔では、プラント設備や金融システムなどの設計図面や設計書などを積極的に公開する企業や団体は少なかったが、近年になり、情報公開制度の制定に後押しされるように、世間は蓄積された情報を公開するような風潮になりつつある。そのため、企業や団体は、設計書や資料に記載された情報をオンラインで公開するため、積極的にそれら情報をデータベースに登録する作業を行っている。しかしながら、設計書や資料の中には表を取り入れたものも多く、その場合、プログラマが、例えばSQL(Structured Query Language)言語を利用したデータベースへの登録プログラムを新たに作成しなければならないことがある。実施の形態1によれば、表データにおいて少なくともデータの所在を特定する列キーと行キーを設定することで、簡単に正規化された知識情報の集合を生成できる。これにより、プログラムの作成作業にかかる手間やコストを大幅に軽減できる。
【0043】
さらに、実施の形態1によれば、データベースに関する知識を有さない者でも、簡単に知識情報を登録できるため、例えば、人事部の者が採用情報が記述された表を容易に知識化して知識ベース部106に登録したり、経理部の者が財務情報が記述された表を容易に知識化して知識ベース部106に登録したりできる。このように、知識化作業に要する作業を容易にすることで、各分野の専門家からの知識の収集が容易になり、知識の活用の幅が広がる。
【0044】
一般に、リレーショナル型データベースのテーブル内では、レコード単位でデータが管理されており、フィールドに割り当てられた列キーを利用することで、レコードのテーブルにおける所在を一意に特定できる。すなわち、行位置により一次元的にレコードの所在を特定できる。しかしながら、表データにおけるデータの所在は、二次元的に列位置と行位置により特徴づけられており、当該データの所在を一意に特定するためには、列キーと行キーを設定する必要がある。すなわち、表データとリレーショナル型データベース内のテーブルでは、そのデータ構造が異なっているため、表データをリレーショナル型データベース内のテーブルに格納する場合、二次元的なデータ構造を解析し一次元的なデータ構造に変換するプログラムが必要となる。実施の形態1によれば、表データにおいて少なくともデータの所在を特定する列キーと行キーを設定することで、簡便に表データに含まれるデータを知識ベース部に格納できる。これにより、変換プログラムを作成する必要がないため、変換プログラムの作成作業にかかる手間やコストを省くことができる。
【0045】
また、一般に、リレーショナル型データベース内のテーブルは、単なるデータがレコード単位で配列されている構造を有するため、データベース管理者によるデータ構造の管理が容易でない場合がある。特に、データ量やテーブル数が膨大になると、データベースの管理作業にさらなる手間やコストがかかる。さらに、データベース管理者が、既存のデータベースにさらなるテーブルの追加や削除を行うとき、データベース全体を再設計したり再構築をする必要が生じることがある。実施の形態1によれば、人間が理解しやすい述語論理型の言語形式の知識情報を生成するため、知識ベース部106の管理が容易になる。また、知識情報の追加、修正および削除も容易に行うことができるため、知識ベース部106の拡張やメンテナンスを容易にできる。
【0046】
さらに、表データは、医者の利用する患者カルテ、栄養士の献立、鉄道やバスの時刻表、あるいは株価表など、ありとあらゆる分野において利用されるものであり、汎用性の高いデータ形式であると言える。実施の形態1によれば、その汎用性の高いデータ形式の表データに記載された情報を容易に知識化できるため、ユーザ利便性の高い知識情報処理装置100を提供できる。
【0047】
実施の形態2
実施の形態1に係る知識情報処理装置100により生成された列キーおよび行キーはそれぞれ一つであったが、実施の形態2に係る知識情報処理装置100によれば、列キーおよび行キーの少なくともいずれか一方は、複数のキーで形成される。詳細は後述するが、一つの列キーでデータの表データにおける行位置を特定できない場合や一つの行キーでデータの表データにおける列位置を特定できない場合において、実施の形態2に係る知識情報処理装置100は好都合である。なお、実施の形態2に係る知識情報処理装置100の構成は、実施の形態1に係る知識情報処理装置100の構成と同様である。また、実施の形態1と同様の符号を付した構成については適宜説明を省略する。
【0048】
キー生成部114は、データの表データにおける行位置および列位置をそれぞれ特定するための列キーおよび行キーの少なくともいずれか一方を複数のキーで形成する。この場合、知識情報生成部118が生成する知識情報の形式は以下のように表現される。列キー群とは少なくとも一つ以上のキーで形成される列キーを示し、行キー群とは少なくとも一つ以上のキーで形成される行キーを示す。
【0049】
【数2】

【0050】
定義情報生成部122は、実施の形態1に示す定義情報群に含まれる(エ)と(オ)にかわり、以下の定義情報を生成する。
(カ)列キー群が割り当てられたそれぞれの列番号、それぞれの列キー名
(キ)行キー群が割り当てられたそれぞれの行番号、それぞれの行キー名
【0051】
以下、実施の形態2に係る知識情報処理装置100による表データの入力から知識情報の生成までの動作を図7〜図9を用いて説明する。図7は、入力部に入力される9行7列の複数のセルを有する表データの一例を示す。図7に示す表データ210は、プラントなどに配設された配管部品の材質、型や肉厚に関するデータを行列形式にまとめたものである。なお、この表データ210の名称は「配管クラス」である。
【0052】
図7に示すように、第1行には「配管クラス」、「配管部品」といった項目が設定されており、さらに第2行には第1行「材質」の詳細項目として「本体」と「要部」の項目が設定されている。一方、第1列には「1P1」の項目、第2列には「1P1」の詳細項目として「ゲート弁」等の項目、さらに第3列には「ゲート弁」の詳細項目として「1 1/2>」等の項目が設定されている。さらに第3行第4列を左上端、第3行第7列を右上端、第9行第4列を左下端、第9行第7列を右下端とする範囲に含まれるセルに格納されるデータで構成されるデータ群212には、型名などのデータが含まれている。
【0053】
図7に示すごとく、キー生成部114は、例えば、「scph2」のデータの行位置、すなわち「第4行」を特定するために、「1P1」、「ゲート弁」、「1 1/2=」の3つの項目をそれぞれ指定する列キー群を生成する。さらに、キー生成部114は、当該データの列位置、すなわち「第4列」を特定するために、「材質」、「本体」の2つの項目をそれぞれ指定する行キー群を生成する。
【0054】
図8は、所在特定情報が設定された配管クラスの表データを示す。図7と同等の構成には同じ符号を与え適宜説明を略す。また、見やすさのため、所在特定情報が格納されたセルを斜線で明示する。図8に示すごとく、第0行第0列、第0行第1列〜第0行第3列、第1行第0列および第1行第2列のセルに所在特定情報が格納されている。
【0055】
以下、実施の形態2に係る知識情報処理装置100による所在特定情報の具体的な設定作業を順番に示す。
(1)表データ210の名称「配管クラス」を第0行第0列に設定する。
(2)列キー名が「配管クラス」、「配管部品」、「サイズ範囲」である3つの列キーを生成し、それぞれ第1列〜第3列に割り当てる。
(3)行キー名が「属性」、「詳細」である3つの行キーを生成し、それぞれ第1行〜第3行に割り当てる。
【0056】
すなわち、(2)ではデータ群206に含まれる、あるデータの行位置を特定するための3つの列キーをそれぞれ第1列〜第3列に割り当てる。このとき、列キー名をそれぞれ第1列〜第3列の項目を示す「配管クラス」、「配管部品」、「サイズ範囲」に設定する。同様に、(3)ではデータ群206に含まれる、あるデータの列位置を特定するための二つの行キーを第1行および第2行に割り当てる。このとき、行キー名をそれぞれ第1行および第2行の項目名を示す「属性」、「詳細」に設定する。これにより、表データ210の名称、列キー群および行キー群によりデータ群212に含まれるデータの所在を特定できる。
【0057】
図9は、知識情報生成部により生成された知識情報の集合の一例を示す。例えば、図9に示す知識情報群310内の知識情報312は、図8に示す第4行第4列のデータが知識化されたものである。すなわち、知識情報312の情報供給源となる表データの名称は「配管クラス」であり、当該データの行位置は「1P1」、「ゲート弁」、「1 1/2>」の項目、一方、列位置は「材質」、「本体」の項目により特定されることを示す。図9に示すごとく、図8に示すデータ群212に含まれるそれぞれのデータは、それぞれのデータの所在に関連づけられて知識情報として生成されている。
【0058】
企業や団体が有する設計書や手順書などに記載された表データは、列項目がさらに複数の列項目に分かれるといった複雑なデータ構造を有する場合がある。実施の形態2によれば、複雑なデータ構造を有する表データから知識情報を生成することができ、知識情報処理装置100の利便性が高まる。また、実施の形態2でも、実施の形態1と同様の効果を享受できる。
【0059】
実施の形態3
実施の形態1および実施の形態2では、一つの入力された表データに対し一組の列キーおよび行キーのペアを生成したが、実施の形態3では、表データは単独で有意となる部分表データが複数組み合わされており、部分表データごとに、列キーおよび行キーのペアを生成する。なお、実施の形態3に係る知識情報処理装置100の構成は、実施の形態2に係る知識情報処理装置100の構成と同様である。また、実施の形態2と同様の符号を付した構成については適宜説明を省略する。
【0060】
入力部102は単独で有意となる部分表データが複数組み合わされた表データを入力する。所在設定部112は、部分表データごとに所在特定情報を設定する。具体的には、キー生成部114は部分表データごとに列キーおよび行キーのペアを生成する。
【0061】
以下、実施の形態3に係る知識情報処理装置100による表データの入力から知識情報の生成までの動作を図10および図11を用いて説明する。図10は、入力部に入力される複数の部分表データを有する表データの一例を示す。図10の表データ220は、単独で有意となる部分表データとして、第1部分表データ222、第2部分表データ224、第3部分表データ226、および第4部分表データ228を備える。なお、それら部分表データが示す名称は、当該部分表データで形成される表データ220の名称と同一であり、当該名称は「熱交換器」である。
【0062】
例えば、キー生成部114は、第1部分表データ222の「中村」データの所在を特定するために、項目「チェック」を指定する列キーを生成する。「中村」データについては、列キーにより第1部分表データ222における所在を特定できるため、行キーを生成する必要はない。
【0063】
図11は、知識情報生成部により生成された知識情報の集合の一例を示す。知識情報群320は、第1知識情報部分群322〜第4知識情報部分群328を含み、それぞれの知識情報部分群は、図10に示す第1部分表データ222〜第4部分表データ228が知識化されたものである。図11に示すごとく、知識情報生成部118は、データがどの部分表データに属していたかを明示するため、「熱交換器」の表データの名称の後に、それぞれの部分表データに対応するユニークな番号、例えば「1」を付加して知識情報を生成する。これにより正規化を維持できる。
【0064】
第1知識情報部分群322に含まれる知識情報329を例に挙げれば、当該情報は図10に示す「中村」データが知識化されたものである。すなわち、知識情報329の情報供給源は「熱交換器」の表データの第1部分表データであり、当該データの行位置は「チェック」の項目で特定されることを示す。なお、キー生成部により行キーは生成されないため、図示のごとく、アンダーバー記号で表現されている。実施の形態3によれば、複数の部分表データを含む表データから知識情報を生成することができ、知識情報処理装置の汎用性が高まる。
【0065】
企業や団体が有する設計書や手順書などに記載された表データの中には、複数の部分表データで構成されるといった複雑なデータ構造を有する場合がある。実施の形態3によれば、複雑なデータ構造を有する表データから知識情報を生成することができ、知識情報処理装置100の利便性が高まる。また、実施の形態3でも、実施の形態1と同様の効果を享受できる。
【0066】
実施の形態4
実施の形態1では、所在特定情報として表データの名称、一組の列キーおよび行キーを生成したが、実施の形態4では、さらにどの列とどの列が対応しているかの設定を行うとともに、統合処理の対象のデータを指定する。なお、実施の形態4に係る知識情報処理装置100の構成は、実施の形態1に係る知識情報処理装置100の構成と同様である。実施の形態1と同様の符号を付した構成については適宜説明を省略する。
【0067】
関連付け部116は、関連付けた複数のデータの中から、少なくとも、列キーにより特定された行位置の項目が同一であり、さらに行キーにより特定された列位置の項目が同一であるデータを複数抽出する不図示の抽出部を備える。複数の表データが入力部102に入力された場合であれば、関連付け部116は、列キーおよび行キーだけでなく、表データの名称が同一であるデータを複数抽出してもよい。また、詳細は後述するが、知識情報生成部118は、抽出部により抽出された複数のデータを統合して一つの知識情報を生成する。
【0068】
以下、実施の形態4に係る知識情報処理装置100による表データの入力から知識情報の生成までの動作を図12〜図14を用いて説明する。図12は、入力部102に入力される表データの一例を示す。図12に示す表データ230は、それぞれの用語に対する意味および使用例を行列形式の表にまとめたものである。なお、この表データ230の名称は「用語辞書」である。図12に示すように、第1行には「用語ID」、「登録ID」といった項目が設定されている。また、「用語ID」の列は「用語」の列と対応し、一方、「登録ID」は「意味」の列と対応している。
【0069】
図13は、所在特定情報が設定された「用語辞書」の表データを示す。図12と同等の構成には同じ符号を与え適宜説明を略す。また、見やすさのため、所在特定情報が格納されたセルを斜線で明示する。図13に示すごとく、第0行第0列、第0行第1列〜第0行第4列、第1行第0列のセルに所在特定情報が格納されている。
【0070】
図13に示すごとく、キー生成部114は、例えば、「(1)山の名に付けていう」のデータの行位置、すなわち「第2行」を特定するために、「用語ID」、「登録ID」の二つの項目をそれぞれ指定する列キー群を生成する。さらに、キー生成部114は、当該データの列位置、すなわち「第4列」を特定するために、「ラベル」の項目を指定する行キーを生成する。
【0071】
所在設定部112は、さらに第3列が第1列に対応づけられていることを示すために第0行第3列に、第1列に割り当てられた列キーの名称である「用語」を設定する。同様に、所在設定部112は、さらに第4列が第2列に対応づけられていることを示すために第0行第4列に、第2列に割り当てられた列キーの名称である「意味」を設定する。これにより、例えば、「用語」キーを検索キーとして利用すれば、第3列のデータを取得できる。
【0072】
また、他の例として、知識情報処理装置100は、列キー「用語」で「2」を、行キー「ラベル」で「使用例」を指定することで、第4行第5列の「阿武隈川」を特定できる。一方、第5行第5列の「かっぱの川流れ」も第4行第5列の「阿武隈川」と同様のキーで特定できる。すなわち、「阿武隈川」および「かっぱの川流れ」は同一のキーの項目により所在が特定されるため、この場合、知識情報生成部118は、データを知識化する際に、「阿武隈川」を含む知識情報と「かっぱの川流れ」を含む知識情報とを統合して一つの知識情報にする。
【0073】
定義情報生成部122は、実施の形態1あるいは実施の形態2に示す定義情報群に、さらに以下の定義情報を生成する。
(ク)統合対象のデータの所在と、統合対象のデータ間の位置関係
(ケ)同期する列または行の番号と、列キーまたは行キーの名称
例えば、先の例で言えば、(ク)に関しては「第4行第5列、上」、「第5行第5列、下」であり、(ケ)に関しては「第1列と第3列、用語」、「第2列と第4列、意味」を示す定義情報を生成する。
【0074】
図14は、知識情報生成部により生成された知識情報の集合の一例を示す。例えば、図14に示す知識情報群330内の知識情報332は、図13に示す第4行第5列および第5行第5列のデータが知識化され統合されたものである。すなわち、知識情報332の情報供給源となる表データの名称は「用語辞書」であり、データ「阿武隈川、かっぱの川流れ」の行位置は項目「2」、一方、列位置は項目「使用例」により特定されることを示す。
【0075】
図示のごとく、「阿武隈川」および「かっぱの川流れ」は同一のキーの項目により所在が特定されるため、「阿武隈川」の知識情報と「かっぱの川流れ」の知識情報とが統合され、一つの知識情報データとして生成されている。これにより、同一のキーの項目に対して、複数の知識情報が存在することはなく、正規化された状態を維持できる。その結果、推論部120が、知識情報の集合に対して列キーと行キーとにより検索を行ったとき、知識情報を一意に特定でき、検索効率を向上させることができる。
【0076】
企業や団体が有する設計書や手順書などに記載された表データの中には、結合セルが存在するといった複雑なデータ構造を有する場合がある。実施の形態4によれば、複雑なデータ構造を有する表データから知識情報を生成することができ、知識情報処理装置100の利便性が高まる。また、実施の形態4でも、実施の形態1と同様の効果を享受できる。
【0077】
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下、変形例を挙げる。
【0078】
実施の形態1では、表データに含まれるデータ群を知識情報の集合に変換したが、変形例として、逆に、知識情報処理装置100の内部の図示しない表データ生成部が、定義情報を参照し、知識情報の集合から表データを作成する。具体的には、表データ生成部は、まず、定義情報に記載された情報に基づいて表の枠組みや項目を設定する。次に、表データ生成部は知識情報内のデータと当該データに関連づけられた所在を参照し、それぞれのデータを関連づけられた所在で特定されるセルに格納する。これにより、知識情報処理装置100は、知識ベース部106に格納されている知識情報をユーザがより理解しやすい表形式に変換して提示できる。
【0079】
定義情報生成部122は、実施の形態1に列挙する定義情報の他、例えば、点線や二重線などのデータの態様や、データのフォントや色、データの文字サイズなどを定義情報として生成してもよい。
【0080】
実施の形態1では、入力部102はすでに完成された表データを入力したが、ユーザがディスプレイ上で新規にデータを含む表データを作成して、当該表データを知識化してもよい。
【0081】
実施の形態1では、表データに含まれるデータを知識化して知識情報を生成したが、変形例として、知識情報処理装置100の知識情報生成部118は、関連付け部116により所在が関連づけられたデータのそれぞれをXML言語の形式の知識情報に変換する。なお、知識情報生成部118内部の図示しないXML(eXtensible Markup Language)変換部が上述の変換動作を行ってもよい以下、変換規則の一例である。XML変換部はこの変換規則に基づいて、表データに含まれるデータをXML言語に変換する。また、XML変換部は、以下の変換規則を利用し、知識情報生成部118により生成された知識情報のそれぞれをXML言語の形式に変換してもよい。
【0082】
(1)表データに含まれるそれぞれのデータを、<タグ名 属性=”値”/>のデータ形式に変換する。
(2)属性は、列キー名あるいは行キー名を指す。列キーあるいは行キーが複数のキーで形成されていれば、複数のキーごとに「属性=”値”」を設定。この場合、「属性=”値”」の要素間は、スペースで区切られる。
(3)値は、列キーで特定される行位置の項目あるいは行キーで特定される列位置の項目を指す。
【0083】
例えば、図9に示す第3行第6列のデータ「ISRW」で言えば、「<gimt 配管クラス=”1P1” 配管部品=”ゲート弁” サイズ範囲=”1 1/2>” 属性=”型” データ=”ISRW”/>」がXML変換部により生成される。本変形例によれば、述語論理型の言語形式で記述された知識情報だけでなく、汎用性の高いXML言語形式で記述された知識情報を生成できる。
【0084】
実施の形態4では、同一の列キーおよび行キーを有するデータを統合して一つの知識情報を生成したが、変形例として、知識情報生成部118は、列キーで特定される行位置の項目あるいは行キーで特定される列位置の項目の一部を省略した形式の知識情報を生成してもよい。例えば、図13を例として挙げると、知識情報生成部118は、図14に示す知識情報群330に加えてさらに、以下の知識情報を生成してもよい。すなわち、列キーにより特定される行位置の項目が一部省かれている。
gimt(’用語辞書’,[’3’],[’使用例’],’カスピ海,あたりは火の海だった,嵐の海’).
【0085】
この場合、推論部120は、表データ名称として「用語辞書」、列キーの項目として「3」、行キーの項目として「使用例」を指定することで「カスピ海,あたりは火の海だった,嵐の海」と、データをまとめて取得できる。これにより、ユーザ利便性の高い知識情報処理装置を提供できる。
【図面の簡単な説明】
【0086】
【図1】実施の形態1に係る知識情報処理装置の構成を示す図である。
【図2】実施の形態1に係る入力部に入力される複数のセルを有する表データの一例を示す図である。
【図3】実施の形態1に係る所在特定情報が設定された歩行者の行動パターンの表データを示す図である。
【図4】実施の形態1に係る知識情報生成部により生成された知識情報の集合の一例を示す図である。
【図5】ユーザにより入力部を介して入力された推論ルールの一例を示す図である。
【図6】実施の形態1に係る知識情報処理装置の処理の流れを示す。
【図7】実施の形態2に係る入力部に入力される複数のセルを有する表データの一例を示す図である。
【図8】実施の形態2に係る所在特定情報が設定された配管クラスの表データを示す図である。
【図9】実施の形態2に係る知識情報生成部により生成された知識情報の集合の一例を示す図である。
【図10】実施の形態3に係る入力部に入力される複数の部分表データを有する表データの一例を示す図である。
【図11】実施の形態3に係る知識情報生成部により生成された知識情報の集合の一例を示す図である。
【図12】実施の形態4に係る入力部に入力される表データの一例を示す図である。
【図13】実施の形態4に係る所在特定情報が設定された「用語辞書」の表データを示す図である。
【図14】実施の形態4に係る知識情報生成部により生成された知識情報の集合の一例を示す図である。
【符号の説明】
【0087】
100 知識情報処理装置、 102 入力部、 104 提示部、 112 所在設定部、 114 キー生成部、 116 関連付け部、 118 知識情報生成部、 120 推論部、 122 定義情報生成部、 124 検証部、 200,210,220,230 表データ、 222,224,226,228 部分表データ、 302,312,329,332 知識情報。

【特許請求の範囲】
【請求項1】
複数のデータを含む表データを入力する入力部と、
前記入力された表データに含まれるそれぞれのデータの表データにおける所在を一意に特定するための所在特定情報を設定する所在設定部と、
前記所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付ける関連付け部と、
前記関連付けられたそれぞれのデータを一つの知識情報として生成する知識情報生成部と、
を備えることを特徴とする知識情報処理装置。
【請求項2】
前記所在設定部は、前記表データにおける行位置の項目を特定するための第1キーと列位置の項目を特定するための第2キーとを生成するキー生成部を備え、
前記データの所在は、前記第1キーにより特定された行位置の項目と前記第2キーにより特定された列位置の項目とにより二次元的に表現されることを特徴とする請求項1に記載の知識情報処理装置。
【請求項3】
前記第1キーおよび前記第2キーの少なくともいずれか一方は、複数のキーで形成されることを特徴とする請求項2に記載の知識情報処理装置。
【請求項4】
前記入力部は複数の表データを入力するものであり、前記所在設定部は、前記入力された複数の表データのうちいずれかの表データを特定するための識別情報をさらに設定することを特徴とする請求項1から3のいずれかに記載の知識情報処理装置。
【請求項5】
前記表データは単独で有意となる部分表データが複数組み合わされたものであり、前記所在特定情報は、前記所在設定部により前記部分表データごとに設定されることを特徴とする請求項1から4のいずれかに記載の知識情報処理装置。
【請求項6】
前記入力された表データの定義情報を生成する定義情報生成部と、
前記知識情報と前記定義情報とを比較し前記知識情報が正規化されているか否かを検証する検証部と、
をさらに備えることを特徴とする請求項1から5のいずれかに記載の知識情報処理装置。
【請求項7】
前記関連付け部は、前記関連付けた複数のデータの中から、少なくとも、前記第1キーにより特定された行位置の項目が同一であり、さらに前記第2キーにより特定された列位置の項目が同一であるデータを複数抽出する抽出部を備え、
前記知識情報生成部は、前記抽出部により抽出された複数のデータを統合して一つの知識情報を生成することを特徴とする請求項2から6のいずれかに記載の知識情報処理装置。
【請求項8】
前記知識情報のそれぞれは同一の形式で表現されることを特徴とする請求項1から7のいずれかに記載の知識情報処理装置。
【請求項9】
前記形式は述語論理型の言語形式であることを特徴とする請求項8に記載の知識情報処理装置。
【請求項10】
前記形式はXML言語形式であることを特徴とする請求項8に記載の知識情報処理装置。
【請求項11】
複数のデータを含む表データを入力する表データ入力部と、
前記入力された表データに含まれるそれぞれのデータの表データにおける行位置の項目を特定するための第1キーと列位置の項目を特定するための第2キーとを生成するキー生成部と、
前記第1キーにより特定された行位置の項目と前記第2キーにより特定された列位置の項目とにより二次元的に表現されるそれぞれのデータの所在を当該データに関連付ける関連付け部と、
前記関連付けられたそれぞれのデータを一つの知識情報として生成する知識情報生成部と、
述語論理型の言語形式で記述された推論ルールを入力する推論ルール入力部と、
質問検索式を入力する検索式入力部と、
前記質問検索式に基づいて、前記推論ルールおよび前記知識情報により推論を行う推論部と、
前記推論部による推論結果を提示する提示部と、
を備えることを特徴とする知識情報処理装置。
【請求項12】
複数のデータを含む表データを入力するステップと、
前記入力された表データに含まれるそれぞれのデータの表データにおける所在を一意に特定するための所在特定情報を設定するステップと、
前記所在特定情報により特定されるそれぞれのデータの所在を当該データに関連付けるステップと、
前記関連付けられたそれぞれのデータを一つの知識情報として生成するステップと、
を備えることを特徴とする知識情報処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2006−146374(P2006−146374A)
【公開日】平成18年6月8日(2006.6.8)
【国際特許分類】
【出願番号】特願2004−332499(P2004−332499)
【出願日】平成16年11月16日(2004.11.16)
【出願人】(599102376)株式会社 エー・アイ・イー研究社 (2)
【Fターム(参考)】