説明

データ構築方法とシステム

【課題】概念関連ネットワークに基づくデータタグ構築システムを提供する。
【解決手段】タギングモジュールがユーザーからの入力タグを収集し、タグ表を形成する。タグの使用回数を計算し、所定のスレショルド値と比較して、二つのタグ計数表を形成する。各タグと他の間の関連度を計算する。この他、増加した概念が概念関連ネットワーク中のタグを維持するのに適用される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データタグ構築方法とシステムに関するものであって、特に、概念関係ネットワークに基づくデータタグ構築方法とシステムに関するものである。
【背景技術】
【0002】
通信ネットワークと情報技術の一般的な利用、大衆への適用が進むことに伴って、デジタルドキュメント(電子化された文書情報)が非常に早い速度で生成され蓄積されており、大量のデジタルドキュメントの管理、組織化(体系化)、アクセス及び利用に関する問題点や要求とが増加することになっている。その結果、これらの問題を解決し、使用上の要求を満たすため、情報検索(Information retrieval)、 自然言語処理(natural language processing)、 学習機械(自動学習)(machine learning)等の技術分野が含まれる「デジタルドキュメントの自動情報体系化と主題分析」"Automatic Information Organization and Subject Analysis for Digital Documents"、あるいは「テキスト知識発見」"Text Knowledge Discovery"というような技術が出現し進展している。
【0003】
知識発見(Knowledge discovery、KD )技術は、多数の異種のデータベースの中に埋もれている(蓄積されている)新しく組み込まれた、新しく有用な見識を得ることの多い情報を抽出し、その知識を体系化する能力を通して、次世代のデータベース管理と情報システムの発展に大きく貢献する。
【0004】
知識発見は、異なるデータの特徴により、データマイニングDMとテキストマイニングTMとに分けられる。データマイニングは、各データ片がデータベースに記録されるべきコモン領域を有するような構造化されたデータに対して使用される。テキストマイニングは、各データ片の間に適用される構造を有していない構造化されていないデータを処理する。
知識発見は、データを収集し、データをソートし、データを変換し、マイニング処理を実行し、保存、転換し、マイニング工程を実行し、関連付け(association)、分類(classification)、クラスタリング(clustering)、要約(summarization)、予測(prediction)、シーケンス分析(sequence analysis)により結果を表現し分析する。
【0005】
データ特徴の相違に基づいて、データマイニングとテキストマイニングは、詳細において異なる工程と方法を提供する。データマイニングは、大量のデータを記録して、関連情報を抽出する原理である。一般に、ビジネスインテリジェンス組織、及び、経済アナリストにより使用されるが、次第に科学に用いられて、現在の実験と観察法により生成される膨大なデータから情報を抽出する。それは、“データからの今まで知られていなかった、潜在的に有用性のある情報のトポロジー的な抽出”と“大きいデータセット、或いは、データベースから、役に立つ情報を抽出する科学”と言われている。テキストマイニングは、時に、テキストデータマイニングと称され、テキストからの高品質情報を抽出する工程を引用する。高品質情報は、パターンを区分することにより抽出され、統計的パターン学習などの手段に動向する。テキストマイニングは、入力テキストを構築する工程に関わり(通常は、構文解析で、抽出された言語特性の追加とその他の除去、及び、後続のデータベースへの挿入)、構築されたデータ中のパターンを抽出し、最後に、出力の評価と解釈をする。テキストマイニングの“高品質”は通常、関連度、新規性、興味深さの結合に言及する。一般のテキストマイニングタスクは、テキスト分類、テキストのクラスタリング、概念/構成要素の抽出、粒度分類の提示、感情分析、文書要約、及び、全体の関連度モデリング(即ち、指名された実体物間の関係学習)等がある。
【0006】
データマイニングとテキストマイニングは、更に、例えば、階層概念空間構造であるインターネット検索のブラウジングタグ等の、データタグの構築に適用される。階層概念空間構造は、フォークソノミー分類の共同タグに適用し、タグ間の関連強度を予測することにより階層概念空間を構築する。
【0007】
しかし、公知のタグ構築方法は、以下のような欠点がある。“タグ組織方法とシステム”はメンテナンスコストが高い。“ソーシャルネットワーク情報から生成される検索結果のビジュアルタグ”は重み概念を提供せず、検索が困難である。“自動タグ分類のタグ空間中の改善検索と調査”に関しては、数値が標準化されず、ツリー構造のメンテナンスコストが増加する。
【発明の開示】
【発明が解決しようとする課題】
【0008】
本発明は、そのような問題を解決する、概念関連ネットワークに基づくデータタグの構築システムと方法を提供する。
【課題を解決するための手段】
【0009】
本発明の概念関連ネットワークに基づくデータタグの構築システムの具体例は、タギングモジュールと、第一タグ生成器と、第二タグ生成器と、信頼性生成器と、を有する。タギングモジュールは、ユーザーにより入力されたタグを収集し、タグデータ表を形成する。第一タグ生成器は、タグデータ表に従って、各タグの使用回数を計算し、第一タグ計算表を形成し、第一タグ計算表中の各タグの計数値と第一所定スレショルド値を比較し、各タグ計算値が第一所定スレショルド値より小さいか判断し、第一所定スレショルド値より小さいタグ計数値のタグを捨てて、第二タグ計数表を生成する。第二タグ生成器は、第二タグデータ表に従って、同時に使用されるタグペアの回数を計算し、第三タグペア計数表を形成し、第三タグペア計数表中の各タグペアの各タグペア計数値と第二所定スレショルド値を比較し、各タグペア計算値が第二所定スレショルド値より小さいか判断し、第二所定スレショルド値より小さいタグペア計数値のタグを捨てて、第四タグペア計数表を生成する。信頼性生成器は、第一タグデータ表と第三タグデータ表に従って、各タグ、或いは、タグペアとその他の関連度を計算し、タグ関連表を形成する。
【0010】
本発明の概念関連ネットワークに基づくデータタグの構築方法の具体例は、以下のようである。ユーザーにより入力されたタグが収集され、タグデータ表を形成する。タグデータ表に従って、各タグの使用回数を計算し、第一タグデータ表を形成する。第一タグデータ表中の各タグの計数値と第一所定スレショルド値をそれぞれ比較し、タグ計数値が第一所定スレショルド値より小さいか判断する。第一所定スレショルド値より小さいタグ計数値のタグを捨てて、第二タグ計数表を形成する。第二タグデータ表に従って、各タグペアの使用回数が計算されて、第三タグペア計数表を形成する。第三タグペア計数表中の各タグペアのタグペア計数値と第二所定スレショルド値を比較し、タグペア計数値が第二所定スレショルド値より小さいか判断する。第二所定スレショルド値より小さいタグペア計数値のタグペアを捨て、第四タグペア計数表を形成する。第一タグペアデータ表と第三タペア計数表に従って、各タグ、或いは、タグペアとその他の関連度を計算し、タグ関連表を形成する。
【発明の効果】
【0011】
本発明の概念関連ネットワークに基づくデータタグの構築システムと方法により、メンテナンスコストを減少させることができる。また、重み概念を提供して検索を可能とし、数値を標準化することができ、ツリー構造のメンテナンスコストの増加を防ぐことができる。
【発明を実施するための最良の形態】
【0012】
図1は、概念関連ネットワークに基づくデータタグの構築システムを示す図である。
データ構築システムの具体例は、タギングモジュール110、シングルタグ生成器120、タグペア生成器130、信頼性生成器140、概念空間増分維持器150、概念空間調整器160、個人化概念空間アダプター170、及び、サインアップモジュール180、を有する。
【0013】
図2は、本発明の概念空間を構築するタグ関連ルールを示す図である。
図2と図3で示されるように、タギングモジュール110は、ユーザーが入力したタグ、或いは、選択されたキーワード(即ち、タグデータ)を収集し、タグデータ表115を形成する。生成されたタグデータ表115は、少なくとも、コンテンツID(Content ID)とタグ領域(Tag )を有する。コンテンツIDはT001、T002、T003、、、で示される。本具体例において、入力、或いは、選択されたタグは、これに制限されないが、少なくとも、java、j2me、sun 、example 、及び、sdk があり、T001〜T009で示される。タグデータ表115で示されるように、T001は、java、j2me、及び、sun の3つのキーワードを同時に使用してデータを検索し、T002は、j2me、及び、example の2つのキーワードを同時に使用して、データを検索することを示す。
【0014】
第一タグ生成器120は、タグデータ表115に従って、各タグ(即ち、キーワード)の使用回数を計算し、シングルタグ計数表C1を形成する。シングルタグ計数表C1は、少なくとも、タグ領域と計数領域を有し、各計数領域の数値は、対応するタグの使用回数を表示する。
【0015】
シングルタグ生成器120は、シングルタグ計数表C1中の各タグのタグ計数値と所定スレショルド値を比較し、タグ計数値が所定のスレショルド値より小さいか判断する。注意すべきことは、所定のスレショルド値は、これに制限されないが、本具体例では2である。シングルタグ生成器120は、所定スレショルド値より小さいタグ計数値のタグを捨て、シングルタグ計数表L1を形成する(図1では図示しない)。シングルタグ計数表L1は、少なくとも、タグ領域と計数領域を有し、各計数領域の値は、対応するタグの使用回数を示し、所定スレショルド値より大きい。java、 j2me、 sun、 example、 及び、 sdk等のタグ計数値は2以上なので、シングルタグ計数表C1中の全タグは捨てられず、シングルタグ計数表C1とL1は、相同のデータコンテンツを含む。
【0016】
タグペア生成器130は、ユーザーによる入力/選択とシングルタグデータ表L1に従って、java、j2me、sun 、example 、及び、sdk 等の任意の二タグ(タグペア)の同時に使用される回数を計算し、タグペア計数表C2を形成する。タグペア計数表C2は、少なくとも、タグ領域と計数領域を有し、各計数領域の値は、対応するタグペアの使用回数を表示する。タグペア計数表C2で示されるように、sdk、example とsunタグはそれぞれ、6回、2回と二回使用されるが、[sdk/example] 、 [sdk/sun]、及び、[example/sun] タグペアが同時に入力/選択される回数は、0回、1回、及び、1回である。
【0017】
タグペア生成器130は、タグペア計数表C2中の各タグペアの計数値と所定スレショルド値を比較して、タグペア計数値が所定スレショルド値より小さいか判断する。注意すべきことは、本実施例中のスレショルド値は同様に2に設定されているが、これに制限されない。タグペア生成器130は、所定スレショルド値より小さいタグ計数値のタグを捨て、タグペア計数表L2を形成する。タグペア計数表L2は、少なくとも、タグ領域と計数領域を有し、各計数領域の数値は、対応するタグペアの使用回数を表示し、所定スレショルド値より大きい。[java/example]、 [sdk/example]、 [sdk/sun]、及び、[example/sun] 等のタグペアの計数値は2以下であり、タグペアは捨てられなければならず、よって、タグペア計数表L2に記録された全タグペアの計数値は2以上である。
【0018】
シングルタグ計数表C1とL1とタグペア計数表C2とL2の形成後、信頼性生成器140は、シングルタグ計数表C1とタグペア計数表C2に従って、公式を利用し、各タグ、或いは、タグペアとその他の間の関連度を計算すると共に、タグ関連表145を形成する。本実施形態においては、公式は次の式(1)である。
【0019】
【数1】

【0020】
Aは、シングルタグ計数表C1に記録されるタグ(例えば、タグA)を示し、Bは、タグAに関連するタグペア計数表C2に記録されるタグを示す。よって、概念空間の現在のデータタグに関連する関連操作が完了し、異なるデータタグ間の関連が定められ、データが検索される時、入力タグに対応する関連データがすぐに提供される。
【0021】
図4は、本発明の概念空間の追加データタグを示す図である。
図4と図5を参照すると、ユーザーが新しいキーワード(即ち、タグデータ)を入力、或いは、選択する時、タギングモジュール110が新しいタグを収集し、概念空間増分維持器150に転送する。新しいタグの受信時、概念空間増分維持器150は新しいタグをシングルタグ計数表C1に追加する。図3と図5のシングルタグ計数表C1を比較すると、新しく追加されたタグは、java、sun 、及び、api を含み、計数値は1を加えて、7、3、及び、1になる。続いて、概念空間増分維持器150は、シングルタグ計数表C1中の各更新タグのタグ計数値と所定スレショルド値を比較し、更新タグのタグ計数値が所定スレショルド値より小さいか判断し、シングルタグ計数表L1の内容を変更するか決定する。注意すべきことは、更新タグは、新しく追加されたタグ、或いは、計数値が増加したタグを示すことである。
【0022】
シングルタグ計数表L1の内容が変化した場合、概念空間増分維持器150は、ユーザーの入力/選択とシングルタグ計数表L1に従って、更新タグをタグペア計数表C2に追加し、タグの内容と計数領域を更新する。タグペア計数表C2で示されるように、[java/sun]タグペアの計数値は1が加えられる。概念空間増分維持器150は、タグペア計数表C2中の各更新タグペアのタグペア計数値と所定スレショルド値を比較し、所定スレショルド値より小さいタグペア計数値のタグペアを捨て、シングルタグペア計数表L1を更新する。注意すべきことは、更新されたタグペアは、新しく追加されたタグペア、或いは、計数値が増加したタグペアを示すことである。
【0023】
同様に、信頼性生成器140は、シングルタグ計数表C1とタグペア計数表C2に従って、前述の公式(1)を利用し、各タグ、或いは、タグペアとその他の間の関連度を計算し、タグ関連表145の内容を更新する。
【0024】
注意すべきことは、新しいタグが受信される時、概念空間増分維持器150は、シングルタグ計数表C1とタグペア計数表C2を更新し、これにより、各タグ、或いは、タグペアの計数値の再計算と再比較は必要なく、よって、システムパフォーマンスを改善する。
【0025】
シングルタグ計数表L1の内容が変化しない場合、概念空間増分維持器150は、新しいタグ(タグペア)だけをタグペア計数表C2に追加し、タグペア計数表L2の更新が必要か判断する。注意すべきことは、本実施例中、シングルタグとタグペアで説明しているが、これに制限するものではない。同時に、3、4、或いは、それ以上のタグを使用することができる。よって、各タグセットの計数値が計算され、タグセット計数表Cnを形成し、所定スレショルド値と比較して、タグセット計数表Lnを形成する。
【0026】
図6は、本発明の概念空間の更新タグ関連度を示す図である。
入力タグが受信される時、概念空間調整器160は、タグ関連表145に従って、入力タグの好ましい関連度を含むタグをユーザーに提供する。入力タグに関連するタグ(例えば、タグA)が選択されるとき、概念空間調整器160は、公式を用いるか、或いは、プリセット重み付けに従って、タグAと入力タグ間の関連度を調整し、関連調整表165を形成す。本実施形態において、公式は、次の式(2)である。
【0027】
【数2】

【0028】
Aは、シングルタグ計数表C1に記録されるタグ(例えば、タグA)を示し、Bは、タグAに関連するタグペア計数表C2に記録されるタグを示す。よって、概念空間のタグ関連度の更新が完成する。
【0029】
図7は、本発明の概念空間個人化のタグ重み付け実行を示す図である。
ユーザーが本発明の検索システムにログインする時、サインアップモジュール180は、タグ関連表145に対応する個人プロファイル185を読み出す。タグと個人プロファイル185に記録された対応関連度は、個人プロファイルグラフィックチャートG(図示しない)を形成する。各タグはノードを示し、対応する関連度は、二関連度タグに接続するエッジを示す。タギングモジュール110は、ユーザー入力に従って、新しいタグを得て、新しいタグを個人化概念空間アダプター170に伝送する。新しいタグを受信する時、個人化概念空間アダプター170は、公式により、固定比率で、個人プロファイル185に関連するタグの関連度を減少させる。本実施形態において、公式は次の式(3)である。
【0030】
【数3】

【0031】
受信したタグ(例えば、タグti)がタグ関連表145に記録されない場合、タグtiはタグ関連表145に加えられ、対応するノードは個人プロファイルグラフィックチャートG(図示しない)に加えられる。tiと存在するタグtj間の関連度が計算され、対応するエッジが個人プロファイルグラフィックチャートG(図示しない)に加えられ、ノードtiとtjのエッジは最初の重み付けαが割り与えられる。受信されたタグ(例えば、タグtj)がタグ関連表145に記録される場合、タグ関連表145中のタグtiとtjの関連度が増加し、ノードtiとtjの個人化プロファイルグラフィックチャートG(図示しない)間のエッジが重み付けβにより増加する。システムは、異なる操作190、検索、意見等をユーザーに提供する。
【0032】
図8は、本発明の概念関連ネットワークに基づくデータタグの構築方法のフローチャートである。
【0033】
ユーザーにより入力されたタグは、タギングモジュールにより収集され、タグデータ表を形成する(工程81)。各タグの使用回数が、タグデータ表に従って計算され、第一タグ計数表(シングルタグ計数表C1)を形成する(工程82)。第一タグ計数表に記録された各タグの各タグ計数値と第一所定スレショルド値を比較し、第一所定スレショルド値より小さいタグ計数値のタグが捨てられ、第二タグ計数表(シングルタグ計数表L1)を形成する(工程83)。第二タグデータ表に従って、各タグペアの使用回数が計算され、第三タグペア計数表(タグペア計数表C2)を形成する(工程84)。第三タグペア計数表に記録された各タグペアのタグペア計数値と第二所定スレショルド値を比較し、第二所定スレショルド値より小さいタグペア計数値のタグペアが捨てられ、第四タグペア計数表(タグペア計数表L2)を形成する(工程85)。第一、及び、第三タグペア計数表に従って、各タグ、或いは、タグペアとその他の間の関連度が、前述した公式(1)により計算され、タグ関連表を形成する(工程86)。
【0034】
これにより、概念空間の現在のデータタグ関連の関連操作が完成し、異なるデータタグ間の関連度を決定し、データが検索される時、入力タグに対応する関連データが即時に提供される。
【0035】
概念関連ネットワークに基づくデータタグの追加の実行、タグ間の関係度の計算、或いは、調整、タグ重み付けの個人化調整は、図4〜図7を参照し、ここに詳述しない。
【0036】
本発明のシステムと方法は、フロッピーディスク、CD−ROM、ハードドライブ、ファームウェア、或いは、その他の機械読み取り可能な記憶媒体に統合されるプログラムコードの形式を取り、プログラムコードがロードされ、コンピュータ等の機械により実行される時、機械は、具体例を実行する装置となる。本発明の方法と装置は、電気配線、或いは、ケーブル等の伝送媒体、或いは、その他の伝送形式を介して伝送されるプログラムコードの形式で統合され、プログラムコードが受信され、ロードされ、コンピュータ等の機械により実行される時、機械は、具体例を実行する装置となる。一般目的の処理器に実行されるとき、プログラムコードは処理器と結合して、同じように操作する特別な装置を特定のロジック回路に提供する。
【0037】
本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明に限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない範囲内で各種の変動や潤色を加えることができ、従って本発明の保護範囲は、特許請求の範囲で指定した内容を基準とする。
【図面の簡単な説明】
【0038】
【図1】本発明の概念関連ネットワークに基づくデータタグの構築システムを示す図である。
【図2】本発明の概念空間を構築するタグ関連ルールを示す図である。
【図3】本発明のタグ計算表の構築を示す図である。
【図4】本発明の概念空間の追加データタグを示す図である。
【図5】本発明の追加タグ計数表を示す図である。
【図6】本発明の概念空間の更新タグ関係を示す図である。
【図7】本発明の概念空間個人化のタグ重みを実行する図である。
【図8】本発明の概念関連ネットワークに基づくデータ構築方法のフローチャート図である。
【符号の説明】
【0039】
110 タギングモジュール
115 タグデータ表
120 シングルタグ生成器
130 タグペア生成器
140 信頼性生成器
145 タグ関連表
150 概念空間増分維持器
160 概念空間調整器
165 関連調整表
170 個人化概念空間アダプター
180 サインアップモジュール
185 個人プロファイル
190 操作
C1、L1 シングルタグ計数表
C2、L2 タグペア計数表

【特許請求の範囲】
【請求項1】
概念関連ネットワークに基づくデータタグの構築システムであって、
ユーザーにより入力されたタグを収集し、タグデータ表を形成するタギングモジュールと、
前記タグデータ表に従って、各タグの使用回数を計算し、第一タグ計算表を形成し、前記第一タグ計算表中の各タグの計数値と第一所定スレショルド値を比較し、各タグ計算値が前記第一所定スレショルド値より小さいか判断し、前記第一所定スレショルド値より小さいタグ計数値のタグを捨てて、第二タグ計数表を生成する第一タグ生成器と、
前記第二タグデータ表に従って、同時に使用されるタグペアの回数を計算し、第三タグペア計数表を形成し、前記第三タグペア計数表中の各タグペアの各タグペア計数値と第二所定スレショルド値を比較し、各タグペア計算値が前記第二所定スレショルド値より小さいか判断し、前記第二所定スレショルド値より小さいタグペア計数値のタグを捨てて、第四タグペア計数表を生成する第二タグ生成器と、
前記第一タグデータ表と前記第三タグデータ表に従って、各タグ、或いは、タグペアとその他の関連度を計算し、タグ関連表を形成する信頼性生成器と、
を有することを特徴とする概念関連ネットワークに基づくデータタグの構築システム。
【請求項2】
更に、概念空間増分維持器を有し、受信タグを前記第一タグ計数表に追加し、前記第一タグ計数表中の更新タグの各タグ計数値と前記第一所定スレショルド値を比較して、前記更新タグのタグ計数値が前記第一所定スレショルド値より小さいか判断して、前記第二タグ計数表の内容が変化したか判断し、もし変化した場合、前記第二タグ計数表に従って、更新タグを前記第三タグペア計数表に追加し、前記第三タグペア計数表中の更新タグペアの各タグペア計数値と前記第二所定スレショルド値を比較し、前記第二所定スレショルド値より小さいタグペア計数値のタグペアを捨て、前記第四タグペア計数表を更新することを特徴とする請求項1に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項3】
前記信頼性生成器は、前記第一、第三タグペア計数表に従って、各タグ、或いは、タグペアとその他間の関連度を計算し、前記タグ関連表を更新することを特徴とする請求項2に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項4】
前記第二タグ計数表の内容が変化しない場合、前記空間増分維持器は、前記更新タグを前記第三タグペア計数表に追加し、前記第四タグペア計数表の更新が必要か判断することを特徴とする請求項2に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項5】
更に、概念空間調整器を有し、前記ユーザーにより入力された少なくとも一つのタグが受信される時、前記タグ関連表に従って、前記入力タグの好ましい関連度を含むタグをユーザーに提供し、前記入力タグに関連する少なくとも一つのタグが選択される時、前記選択タグと前記入力タグ間の関連度を調整し、関連調整表を形成することを特徴とする請求項1に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項6】
更に、
ユーザーがログインする時、前記タグ関連表に対応する個人プロファイルを読み出すサインアップモジュールと、
前記ユーザーにより入力されるタグを読み出し、固定比率により、前記個人プロファイルに関連するタグの関連度を減少させ、前記タグ関連表中に前記入力タグと同様のタグがない場合、前記入力タグを前記個人プロファイルに追加し、前記入力タグと少なくとも一つの存在するタグ間の関連度を計算し、前記入力タグに最初の重み付けする個人化概念空間アダプターと、
を有することを特徴とする請求項1に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項7】
前記タグ関連表が前記入力タグと同様のタグを含む場合、前記個人化概念空間アダプターは、前記入力タグの重み付けを増加することを特徴とする請求項6に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項8】
前記第一タグデータ表は、少なくとも、タグ領域と計数領域を含み、各計数領域の値は対応するタグの使用回数を示し、前記第二タグデータ表は、少なくとも、タグ領域と計数領域を含み、各計数領域の値は対応するタグの使用回数を示し、且つ前記第一所定スレショルド値より大きいことを特徴とする請求項1に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項9】
前記第三タグデータ表は、少なくとも、タグ領域と計数領域を含み、各計数領域の値は対応するタグの使用回数を示し、前記第四タグデータ表は、少なくとも、タグ領域と計数領域を含み、各計数領域の値は対応するタグの使用回数を示し、且つ前記第二所定スレショルド値より大きいことを特徴とする請求項1に記載の概念関連ネットワークに基づくデータタグの構築システム。
【請求項10】
概念関連ネットワークに基づくデータタグの構築方法であって、
ユーザーにより入力されたタグを収集し、タグデータ表を形成する工程と、
前記タグデータ表に従って、各タグの使用回数を計算し、第一タグデータ表を形成する工程と、
前記第一タグデータ表中の各タグの計数値と第一所定スレショルド値をそれぞれ比較する工程と、
前記タグ計数値が第一所定スレショルド値より小さいか判断する工程と、
前記第一所定スレショルド値より小さいタグ計数値のタグを捨てて、第二タグ計数表を形成する工程と、
前記第二タグデータ表に従って、各タグペアの使用回数を計算し、第三タグペア計数表を形成する工程と、
前記第三タグペア計数表中の各タグペアのタグペア計数値と第二所定スレショルド値を比較する工程と、
前記タグペア計数値が第二所定スレショルド値より小さいか判断する工程と、
前記第二所定スレショルド値より小さいタグペア計数値のタグペアを捨て、第四タグペア計数表を形成する工程と、
前記第一タグペアデータ表と前記第三タペア計数表に従って、各タグ、或いは、タグペアとその他の関連度を計算し、タグ関連表を形成する工程と、
を有することを特徴とする概念関連ネットワークに基づくデータタグの構築方法。
【請求項11】
更に、
更新した受信タグを前記第一タグ計数表に追加する工程と、
前記第一タグ計数表中の更新タグの各タグ計数値と前記第一所定スレショルド値を比較する工程と、
前記更新タグの前記タグ計数値が前記第一所定スレショルド値より小さいか判断し、前記第二タグ計数値の内容が変化したか判断する工程と、
変化がある場合、前記第二タグ計数表に従って、前記更新タグを前記第三タグペア計数表に追加する工程と、
前記第三タグペア計数表中の各更新タグペアのタグ計数値と前記第二所定スレショルド値を比較する工程と、
前記第二所定スレショルド値より小さいタグペア計数値のタグペアを捨てて、前記第四タグペア計数表を更新する工程と、
を有することを特徴とする請求項10に記載の概念関連ネットワークに基づくデータタグの構築方法。
【請求項12】
更に、
前記第一、第三タグペア計数表に従って、各タグ、或いは、タグペアとその他間の関連度を計算し、前記タグ関連表を更新する工程と、
前記第二タグ計数表の内容が変化しない場合、前記更新タグを前記第三タグペア計数表に追加して、前記第四タグペア計数表の更新が必要か判断する工程を含むことを特徴とする請求項11に記載の概念関連ネットワークに基づくデータタグの構築方法。
【請求項13】
更に、
前記ユーザーにより入力された少なくとも一つのタグが受信される時、前記タグ関連表に従って、好ましい関連度を有するタグを前記入力タグに提供する工程と、
前記入力タグに関連する少なくとも一つのタグが選択される時、前記選択されたタグと前記入力タグ間の関連度を調整し、関連調整表を形成する工程と、
を含むことを特徴とする請求項10に記載の概念関連ネットワークに基づくデータタグの構築方法。
【請求項14】
更に、
ユーザーがログインする時、前記タグ関連表に対応する個人プロファイルを読み出す工程と、
前記ユーザーにより入力されたタグを読み取り、固定比率により、前記個人プロファイルに関連する各タグの関連度を減少させる工程と、
前記タグ関連表中に前記入力タグと同じタグがない場合、前記入力タグを前記個人プロファイルに追加する工程と、
前記入力タグと少なくとも一つの存在するタグ間の関連度を計算する工程と、
最初の重み付けを前記入力タグに割り当てる工程と、
を有することを特徴とする請求項10に記載の概念関連ネットワークに基づくデータタグの構築方法。
【請求項15】
概念関連ネットワークに基づくデータタグ構築方法を提供するコンピュータプログラムを記録するコンピュータ読み取り可能記録媒体であって、コンピュータにより実行する工程は、
ユーザーにより入力されるタグを収集し、タグデータ表を形成する工程と、
前記タグデータ表に従って、各タグの使用回数を計算し、第一タグデータ表を形成する工程と、
前記第一タグデータ表中の各タグの計数値と第一所定スレショルド値をそれぞれ比較する工程と、
前記タグ計数値が第一所定スレショルド値より小さいか判断する工程と、
前記第一所定スレショルド値より小さいタグ計数値のタグを捨てて、第二タグ計数表を形成する工程と、
前記第二タグデータ表に従って、各タグペアの使用回数を計算し、第三タグペア計数表を形成する工程と、
前記第三タグペア計数表中の各タグペアのタグペア計数値と第二所定スレショルド値を比較する工程と、
前記タグペア計数値が第二所定スレショルド値より小さいか判断する工程と、
前記第二所定スレショルド値より小さいタグペア計数値のタグペアを捨て、第四タグペア計数表を形成する工程と、
前記第一タグペアデータ表と前記第三タペア計数表に従って、各タグ、或いは、タグペアとその他の関連度を計算し、タグ関連表を形成する工程と、
を有することを特徴とするコンピュータ読み取り可能記録媒体。
【請求項16】
更に、
更新した受信タグを前記第一タグ計数表に追加する工程と、
前記第一タグ計数表中の更新タグの各タグ計数値と前記第一所定スレショルド値を比較する工程と、
前記更新タグの前記タグ計数値が前記第一所定スレショルド値より小さいか判断し、前記第二タグ計数値の内容が変化したか判断する工程と、
変化がある場合、前記第二タグ計数表に従って、前記更新タグを前記第三タグペア計数表に追加する工程と、
前記第三タグペア計数表中の各更新タグペアのタグ計数値と前記第二所定スレショルド値を比較する工程と、
前記第二所定スレショルド値より小さいタグペア計数値のタグペアを捨てて、前記第四タグペア計数表を更新する工程と、
を有することを特徴とする請求項15に記載のコンピュータ読み取り可能記録媒体。
【請求項17】
更に、前記第一、第三タグペア計数表に従って、各タグ、或いは、タグペアとその他間の関連度を計算し、前記タグ関連表を更新する工程と、前記第二タグ計数表の内容が変化しない場合、前記更新タグを前記第三タグペア計数表に追加して、前記第四タグペア計数表の更新が必要か判断する工程を含むことを特徴とする請求項16に記載のコンピュータ読み取り可能記録媒体。
【請求項18】
更に、
前記ユーザーにより入力された少なくとも一つのタグが受信される時、前記タグ関連表に従って、好ましい関連度を有するタグを前記入力タグに提供する工程と、
前記入力タグに関連する少なくとも一つのタグが選択される時、前記選択されたタグと前記入力タグ間の関連度を調整し、関連調整表を形成する工程と、
を含むことを特徴とする請求項15に記載のコンピュータ読み取り可能記録媒体。
【請求項19】
更に、
ユーザーがログインする時、前記タグ関連表に対応する個人プロファイルを読み出す工程と、
前記ユーザーにより入力されたタグを読み取り、固定比率により、前記個人プロファイルに関連する各タグの関連度を減少させる工程と、
前記タグ関連表中に前記入力タグと同じタグがない場合、前記入力タグを前記個人プロファイルに追加する工程と、
前記入力タグと少なくとも一つの存在するタグ間の関連度を計算する工程と、
最初の重み付けを前記入力タグに割り当てる工程と、
を有することを特徴とする請求項15に記載のコンピュータ読み取り可能記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−99124(P2009−99124A)
【公開日】平成21年5月7日(2009.5.7)
【国際特許分類】
【出願番号】特願2008−169066(P2008−169066)
【出願日】平成20年6月27日(2008.6.27)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(599064731)インスティチュート フォー インフォメイション インダストリ (24)
【氏名又は名称原語表記】INSTITUTE FOR INFORMATION INDUSTRY
【Fターム(参考)】