説明

符号付与プログラム

【課題】符号付与の手間が省け、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更できるようにする。
【解決手段】コンピュータに、文書から一文字を分離する手順Aと、分離した一文字に属性を付与する手順Bと、分離した一文字を連結する手順Cと、連結分断属性を検出したらそれまで連結した文字列を一次文字列として記憶する手順Dと、一次文字列から非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、キーワードの記憶順に符号を対応させて生成し記憶する手順Gと、文書からいずれかのキーワードを検出したならキーワードの末尾の後に符号を挿入する手順Hと、を実行させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、キーワードに記述順で符号の付される文書の作成に用いて好適な符号付与プログラムに関する。
【背景技術】
【0002】
文書の作成には、文書中に含まれる複数のキーワードに符号を付し、別の図面等の相当部分に同一の符号を付すことにより、情報の理解を容易にする書面の作成手法の採られることがある。例えば特許明細書においては、「プラグ11は、プラグケース13に設けた保持部15に、端子状の金具17を装着して成る。」の記載に対応した符号「11」、「13」、「15」、「17」が別途図面の相当部位に応じて記載される。
【0003】
しかし、特許明細書は、複雑な内容を記載した文書であるから、特許明細書の作成者は、同一の符号を異なる部材に用いるという誤りをしばしば起こしてしまう。このような誤りがあると、特許明細書の理解に混乱を来たし好ましくないことから、作成者は、特許明細書を書き上げた後に何度も用語と符号を見直す作業を強いられることになる。
【0004】
これに対し、例えば特許文献1記載の特許明細書作成支援プログラムは、符号が一致しつつ、用語が不一致の場合は、符号および用語の少なくとも一方を強調表示し、符号の付け間違いまたは用語の記載ミスを作成者に容易に知らせることを可能としている。
【0005】
また、キーワード数が100個以上と多くなる場合、重複付与を回避するために、例えば単語登録手段等を用いて「プラグ11」を「プ」等の呼び出し文字で登録し、「プ」を入力して文字変換することで符号と一体のキーワード「プラグ11」が呼び出されるようにして、符号の付け間違いが生じないようになされることもある。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2006−344053号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記した従来の特許明細書作成支援プログラムを用いて、符号の付け間違いまたは用語の記載ミスが回避できても、作文中に次々に必要となるキーワードに符号を付して行く作業は依然煩雑な作業として残る。また、仮に上記のように、符号一体キーワードを「呼び出し文字」で呼び出し可能としても、最初に出現するキーワードに符号を付与する手間、符号を付与した符号一体キーワードを登録する手間は残る。さらに、文書の作成においては、その表現の違いから記述するキーワードが前後する場合がある。例えば上記した文書が推考の結果「プラグケース13には端子状の金具17を収容する保持部15が形成され、保持部15に端子状の金具17を装着してプラグ11が構成される…」とされた場合、各キーワードに符号が一体的に記憶されていると、符号が文書の記述順で昇順とならず、初めて文書を読む者には違和感が生じて読みにくくなる。このような事情から、符号付与の手間が省け、しかも、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更される技術の開発が望まれていた。
【0008】
本発明は上記状況に鑑みてなされたもので、その第一の目的は符号付与の手間が省ける符号付与プログラムを提供することにある。第二の目的は、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更される符号付与プログラムを提供することにある。
【課題を解決するための手段】
【0009】
本発明に係る上記目的は、下記構成により達成される。
(1) コンピュータに、
入力した文書から一文字を記述順に分離する手順Aと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Bと、
分離した一文字を分離した順に連結する手順Cと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を一次文字列として記憶する手順Dと、
順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、
キーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Gと、
前記文書からいずれかの前記キーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Hと、
を実行させるための符号付与プログラム。
【0010】
この符号付与プログラムでは、文書が先頭から一文字ずつ分離される。分離された一文字には、文字属性記憶手段の文字別属性と比較して一致する文字の属性が付与される。例えば分離された一文字が「プ」であると、文字属性記憶手段に記憶されている「プ」の属性「カタカナ」が付与される。属性は例えば1,2,3の整数等としてもよい。属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される(但し、一文字であってもよい)。連結の際、連結される一文字の属性が連結分断属性を有する文字(例えば「ひらがな」)であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。例えば「プラグは、プラグケースに設けた…」では、「プラグ」が一次文字列となる。同様に、「プラグケース」も二個目の一次文字列として記憶される。この際、「設け」も、連結分断属性を有する文字であるひらがな「け」で分断され、「設」が抽出されるが、予め記憶した非生成語に「設」が存在すれば、「設」が排除された二次文字列として「プラグ」と、「プラグケース」とが記憶される。また、「プラグ」が再び生成されたときには、重複する文字列として排除され、最終的に、「プラグ」と、「プラグケース」との2つがキーワードとして記憶される。この2つのキーワードに対応させて、記憶順から例えば数値符号である「11」、「13」を生成する。符号はその他の「a」、「b」や、「イ」、「ロ」、であってもよい。最後に、元の文書である「プラグは、プラグケースに設けた…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「11」、「13」が挿入されることで、「プラグ11は、プラグケース13に設けた…」とする符号入り文書が作成される。
【0011】
(2) コンピュータに、
入力した文書から一文字を記述順に分離する手順Aと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Bと、
分離した一文字を分離した順に連結する手順Cと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Dと、
順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、
符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Iと、
文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Jと、
符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Gと、
符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの前記符号の削除されたキーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Hと、
を実行させるための符号付与プログラム。
【0012】
この符号付与プログラムでは、上記した(1)の構成により文書からキーワードを生成する際に、符号付きのキーワードで生成する。符号付きのキーワードは(1)の構成と同様の構成で生成できる。すなわち、文字属性記憶手段に記憶されている「プ」の属性「カタカナ」が付与されるのと同様に、「1」や「3」に属性「数字」を付与し、「カタカナ」と同様に「数字」も連結の対象属性とする。この他、「a」、「b」の「英字」も連結の対象属性とすれば、例えば「13a」等の英字を付した符号付き文字列も生成することができる。したがって、上記同様の手順により「プラグケース11」と、「プラグ17」が符号付きのキーワードとして生成される。生成された符号付きのキーワードは、キーワードに含まれる符号属性に一致する文字(「数字」、「英字」)のみがこのキーワードの末尾から一文字ずつ削除されて符号の削除されたキーワードとして記憶される。次に、文書の符号付きのキーワードを一旦符号の削除されたキーワードに書き換える。これにより、元の符号付きの文書が、符号無しの文書となる。最後に、符号の削除された文書である「プラグは、プラグケースに設けた…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「11」、「13」が挿入されることで、「プラグ11は、プラグケース13に設けた…」とする符号入り文書が作成される。本構成で重要なことの一つに、符号付き文書から一旦符号が消されることにある。元の符号入り文書の符号が昇順でなかった場合であっても、キーワードは記述順に昇順で符号が振り直されることになる。例えば、符号入り文書「プラグケース11には端子状の金具13を収容する保持部15が形成され、保持部15に端子状の金具13を装着してプラグ17が構成される…」を、推考の結果、符号入り文書「プラグ17は、プラグケース11の保持部15に端子状の金具13を装着して構成される…」に変更した場合、符号が記述順とならなくなる。この場合、一旦、符号の削除された文書は「プラグは、プラグケースの保持部に端子状の金具を装着して構成される…」となる。そして、各キーワードに記述順に生成された符号が挿入されることで、符号の再付与された文書は「プラグ11は、プラグケース13の保持部15に端子状の金具17を装着して構成される…」となる。これにより、符号一体キーワードが含まれる文書を幾度変更しても、符号を文書の記述順に自動的に変更することが可能となる。
【0013】
(3) (1)又は(2)の符号付与プログラムであって、
前記連結分断属性がひらがなであることを特徴とする符号付与プログラム。
【0014】
この符号付与プログラムでは、漢字、数字、英字、カタカナ、ひらがな等の文字が混用される日本語文書において、文書中の「ひらがな」により連結を止めることで、単語(自立語を含む)の中の特にキーワードとなり得る文字列を生成する確率を高めることができる。
【0015】
(4) (1)又は(2)の符号付与プログラムであって、
コンピュータに、
前記手順Fの次に前記キーワードを表示器に表示する手順Kと、
新たな非生成語を追加して記憶する手順Lと、
を実行させるための符号付与プログラム。
【0016】
この符号付与プログラムでは、(1)又は(2)の符号付与プログラムをコンピュータに実行させることで、キーワードに符号の付与された文書が作成された結果、予め記憶した非生成語に含まれていない排除したいキーワードが生成されて符号が付与されてしまったとき、その排除したいキーワードが新たに非生成語に加えられることで、再び符号付与プログラムをコンピュータに実行させると、そのキーワードが生成されなくなり、符号が付与されなくなる。以下のキーワードには符号が繰り上がって付与される。このようにして符号付与プログラムは、使用者の選択した非生成語が、その都度ファイルメモリに蓄積されて行くことで、使用者の使用分野に合わせた符号生成能力が備わって行くことになる。すなわち、使用分野に即応した学習が可能となっている。
【0017】
(5) (1)又は(2)の符号付与プログラムであって、
コンピュータに、
手順Hを実行する前に、前記キーワードの末尾に連結される文字の属性を判定し、該属性が連結分断属性でないときには、前記符号を挿入しない手順M、
を実行させるための符号付与プログラム。
【0018】
この符号付与プログラムでは、手順Hにおいて、文書からいずれかのキーワードを検出し、このキーワードの末尾の後に対応する符号を挿入する際に、キーワードに連結される文字の属性が判定され、その連結文字が連結分断属性でないときには、符号が挿入されない。例えば、文書が「施錠装置は、錠と鍵とからなる…」である場合、「施錠装置」、「錠」、「鍵」がキーワードとして生成され、それぞれのキーワードに対応して「11」、「13」、「15」の符号が生成された場合、そのまま文書中のキーワードに符号が挿入されると、符号の挿入された文書は、「施錠13装置11は、錠13と鍵15とからなる…」となり、一旦「11」の挿入された「施錠装置11」に、「錠」の符号「13」が再び挿入され、「施錠13装置11」となってしまう。逆に「錠」が先に出現する「錠は施錠装置と…」の文書では「錠11は施錠11装置と…」となり、「施錠装置」が判別できなくなり符号が挿入されなくなる。本構成では、「錠」の連結文字「装」が連結分断属性(「ひらがな」)でないときには、符号「13」が挿入されないので、前段、後段の例のように「施錠13装置11」や「施錠11装置」とはならず「施錠装置11は、錠13と鍵15とからなる…」となる。
【0019】
(6) (1)又は(2)の符号付与プログラムであって、
コンピュータに、
予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Nと、
文書に強制生成語と一致するキーワードが含まれていたなら該キーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Oと、
手順Bの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した前記一文字ごとに強制生成語属性を付与する手順Pと、
を実行させるための符号付与プログラム。
【0020】
この符号付与プログラムでは、入力した文書が「プラグケースには端子状の金具を…」であった場合、「端子状の金具」に符号を付すことが可能となる。上述のように、(1)、(2)の構成では、属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される。連結の際、連結される一文字の属性が連結分断属性を有する文字(例えば「ひらがな」)であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。したがって、「の」によって「端子状の金具」は、「端子状」と「金具」とに分断されることになる。このように、「ひらがな」を連結分断属性文字とした場合、「ひらがな」を含むキーワードの生成ができなくなる。例えば「第1の突起」、「位置合わせ部」、「外れ止め部」、「筋交い」、「巻取りボビン」、「遊び部」等々である。本構成では「ひらがな」を含む文字列をキーワードとして生成したい場合、強制生成語として記憶させておく。強制生成語が文書に存在すると、キーワードの先頭に属性変更開始記号「↓」が挿入されるとともに末尾の後に属性変更終了記号「↑」が挿入される。例えば「プラグケースには↓端子状の金具↑を…」とする。次に、検出した文字に属性を付与する際、「↓」の検出で「強制生成語」の属性である例えば「5」等の整数が付与される。この属性の付与は、「↑」を検出したなら止める。これを属性の配列で見れば、「ひらがな」の属性を「3」、「強制生成語」の属性を「5」とすると、「には↓端子状の金具↑を」は「335555553」となる。なお、「↑」「↓」はこの時点で排除してもよいし或いは記号属性「8」「9」等を付与しておいて後に排除してもよい。後に排除の場合は、上記属性配列は、「33855555593」となる。これにより、「ひらがな」が含まれた文字列であっても属性「5」を連結の対象として判断させることで「端子状の金具」が「の」で分断されずに連結されてキーワードとして生成されることとなる。
【0021】
(7) (1)又は(2)の符号付与プログラムであって、
生成した符号付与対象のキーワードを表示させ、
表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【0022】
この符号付与プログラムでは、生成されたキーワードのうち、特に今回作成している文書において、符号の付与の必要のないキーワードは、生成したキーワードから排除される。これにより、例えば図面に表れない部材に無用な符号が付されてしまうことが防止される。また、この本稿非生成語は、ファイルメモリには記憶させず、データメモリに記憶させることで、プログラムの終了後にはリセットされるので、非生成語とは異なり、次に符号付与プログラムを起動させたときの他の文書には影響を及ぼさない。
【0023】
(8) (1)又は(2)の符号付与プログラムであって、
生成した符号付与対象のキーワードのうち、含まれたならキーワードとして記憶しない非生成含有語を含むときは、該非生成含有語を含むキーワードを符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【0024】
この符号付与プログラムでは、非生成含有語がファイルメモリに記憶され、プログラムの起動によって自動的にファイルメモリが参照される。生成されたキーワードのうち、この非生成含有語を含んだキーワードは排除されることになる。例えば「μ」のような単位文字が含まれたキーワードは排除される。上述した非生成語のみにより対応した場合、「10μ」、「22μ」、「31μ」等々、一致する全ての非生成語を記憶させておかなければならず多くのメモリが必要となって現実には不可能となる。このような場合に、「μ」を含むキーワードは全て排除することとすれば、少ないメモリで、不要なキーワードを排除して、より有効なキーワードを高精度に生成することが可能となる。
【発明の効果】
【0025】
本発明に係る符号付与プログラムによれば、符号付与の手間を省くことができる。
【図面の簡単な説明】
【0026】
【図1】本発明に係る符号付与プログラムによって動作を実行するコンピュータを、符号付与プログラムの構成と共に表したブロック図である。
【図2】本発明に係る符号付与プログラムの実行の手順を表したフローチャートである。
【図3】(a)は読み込み文字列の例、(b)は分離される一文字、(c)は文字種別属性、(d)は配列内格納値を表した説明図である。
【図4】(a)は連結分断属性、(b)は一次文字列、(c)は二次文字列、(d)はキーワードを表した説明図である。
【図5】(a)はキーワード別生成符号、(b)は符号挿入のなされた文書の説明図である。
【図6】(a)は符号が記述順でない文書の説明図、(b)は符号が削除された文書の説明図、(c)は新たな符号が記述順に付された文書の説明図である。
【図7】(a)は属性変更記号の挿入された文書の説明図、(b)は強制生成語属性の配列内格納状況の説明図である。
【発明を実施するための形態】
【0027】
以下、本発明の実施の形態を図面を参照して説明する。
図1は本発明に係る符号付与プログラムによって動作を実行するコンピュータを、符号付与プログラムの構成と共に表したブロック図である。
先ず、本発明の第一の実施の形態に係る符号付与プログラムから説明する。本実施の形態に係る符号付与プログラムは、ハードウエア資源であるコンピュータ10と協働して処理を実現する。コンピュータ10は、CPU、メモリ、入力装置、出力装置を基本構成要素として備える。CPUは、演算装置及び制御装置11からなり、制御装置11からの指示にしたがって演算装置が演算を実行する。メモリは、演算装置が直接操作できるメインメモリ(本明細書中では「プログラムメモリ13」と称す)、その読み込み元や保管先などに補助的に使用する補助記憶装置を有する。補助記憶装置は、さらにデータメモリ15、ファイルメモリ17に分かれる。入力装置は、外部からコンピュータ10に対し、処理情報を入力するもので、具体的にはキー入力装置19、マウス21である。出力装置は、コンピュータ10から外部に処理した結果を出力するもので、具体的には表示器23、印刷装置25である。符号付与プログラムは、機能実現手段である上記コンピュータ10との結合により、あらかじめ決められた命令にしたがってCPUが演算を行うことで、文書からキーワードを生成し、この生成したキーワードに符号を付す処理をコンピュータ10に実行させる。
【0028】
符号付与プログラムは、文書編集プログラムとして構成することができる。また、文書編集プログラムの一機能として追加的に構成してもよい。また、文書編集プログラムでまとまった動作を指示する所謂マクロと称されるコマンド群を用いて記述し、既存の文書編集プログラム上で動作させてもよい。さらに、文書編集プログラム上で実行させるのではなく、一旦文書ファイルとして記憶させた文書データを、通信回線を介して外部メモリに記憶された本プログラムで読み込み、その文書データを処理させることでキーワードを生成し、符号を付す構成としてもよい。なお、符号付与プログラムを記述するプログラム言語としては、BASIC、C#、C++等とすることができる。
【0029】
符号付与プログラムは、第一プログラム100を基本の手続き(プロシージャ)として有する。第一プログラム100は、複数の手順を有する。それぞれの手順は、単一又は複数の具体的手段(ステートメント)によって構成されている。第一プログラム100は、例えば表示器23に表示される「ボタン」のクリックが手続き開始の宣言となる。つまり、「ボタン」のクリックにより第一プログラム100の手続きは完結する。
【0030】
符号付与プログラムは、第一プログラム100の中に、他の第二プログラム200、第三プログラム300、第四プログラム400、第五プログラム500が組み込まれていることが好ましい。この場合、「ボタン」のクリックにより第一プログラム100〜第五プログラム500までの手続きが完結する。つまり、本発明に係る符号付与プログラムは、第一プログラム100をその構成の全てとしてもよく、第一プログラム100〜第五プログラム500をその構成の全てとしてもよい。なお、後述するように、第三プログラム300と第五プログラム500は、他の「ボタン」のクリックによって開始が宣言される別の手続きとしてもよい。
【0031】
第一の実施の形態では、第一プログラム100の構成を説明する。その後、第二の実施の形態から第五の実施の形態にて、第二プログラム200〜第五プログラム500の構成を説明する。
第一プログラム100は、1文字分離手段27、属性付与手段29、文字列連結手段31、重複文字排除手段33、キーワード検出手段35、符号生成手段37、符号挿入手段39をプログラムメモリ13に格納する。また、第一プログラム100は、文字属性記憶手段41、一次文字列記憶手段43、二次文字列記憶手段45、キーワード記憶手段47、符号記憶手段49をデータメモリ15に格納する。また、第一プログラム100は、非生成語記憶手段51をファイルメモリ17に格納する。
【0032】
1文字分離手段27は、入力された文書から一文字を記述順に分離する。入力は、表示器23に設けた入力窓に一文字ずつキー入力装置19により入力されても、マウス21によりコピーされた文字列を貼り付けして入力されてもよい。入力窓に入力された文書のデータは、文字型のデータとして格納される。このデータを、最初の位置から一文字ずつ取得して、一文字ずつ配列に格納して行く。一文字は如何なる文字、記号、全角、半角であってもよい。配列は多次元配列とする。列は分離の順番(インデックス)を数値で格納する。一行目は分離された一文字を格納する。二行目は後述の属性を格納する。
【0033】
文字属性記憶手段41は、一文字ずつに属性を与えている。文字種により複数のグループに分け、そのグループごとに数値等の属性を付与する。属性は例えば1,2,3の整数等としてもよい。属性は、より具体的に「カタカナ」を「1」、「ひらがな」を「2」、「英字」を「3」、「数字」を「8」、「記号」を「9」、その他「漢字等」を「4」とすることができる。本明細書では以下、この例により説明する。
【0034】
属性付与手段29は、分離した一文字に予め格納した文字属性記憶手段41の文字別属性と比較して一致する文字の属性を付与する。これにより、分離された一文字には、その文字の属性が付与され、例えば分離された一文字が「プ」であると、文字属性記憶手段41に格納されている「プ」の属性である「カタカナ」の「1」が付与されることになる。
【0035】
文字列連結手段31は、配列に格納した一文字ずつをインデックス順に取得して連結して行く。この連結は、読み込んだ文書の全文字数を取得し、その文字数の数分、一文字ずつ連結を繰り返すことにより行われる。したがって、途中、連結が中断されなければ入力した文書と同一のデータとなるが、連結分断属性を有する文字が存在すれば連結がその存在位置で中断されることとなる。
【0036】
連結分断属性は、日本語の文書の場合、「ひらがな」であることが好ましい。これにより、漢字、数字、英字、カタカナ、ひらがな等の文字が混用される日本語文書において、単語(自立語を含む)の中の特にキーワードとなり得る文字列を生成する確率を高めることができる。この具体的なひらがなとしては、格助詞(「が」、「の」、「を」、「に」)、並立助詞(「と」、「や」)、副助詞(「ま(で)」)、係助詞(「は」、「も」)などの助詞等が挙げられる。なお、英文の場合には、「スペース(空白)」、「動詞」、「弱動詞」、「形容詞」、「副詞」、「接続詞」等を連結分断属性を有する文字、文字列とすることができる。
【0037】
属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される(但し、一文字であってもよい)。連結の際、連結される一文字の属性が連結分断属性を有する文字(本実施の形態では上記した属性「2」の「ひらがな」とする)であったときには、連結を止めてそれまで連結した文字列がキーワードとして確定する前段階の一次文字列として一次文字列記憶手段43に格納される。なお、本実施の形態では、「ひらがな」を連結分断属性を有する文字とするが、連結分断属性を有する文字はこれに限定されるものではない。
【0038】
一次文字列記憶手段43は、連結分断属性を有する文字で分断されることにより生成された最初の一次文字列を記憶する。この一次文字列には符号の付与対象とはなり得ない文字列や、同一の文字列も含まれることになる。これらの不要な文字列は後述の手順により順次排除されて行くことになる。
【0039】
非生成語記憶手段51は、連結により生成された文字列のうち、生成しない文字列、すなわち、非生成語をファイルメモリ17に記憶している。非生成語記憶手段51に格納される非生成語は、一文字であっても文字列であってもよい。この非生成語記憶手段51には、符号が明らかに付されることのないものが格納される。非生成語としては例えば、「コスト」、「安価」、「向上」、「緻密」等が挙げられる。この非生成語は、ファイルメモリ17に記憶される。すなわち、プログラムの終了によって消えるデータメモリ15とは異なり、プログラムの終了によっても磁気データとして記憶される例えばハードディスク等に格納される。したがって、プログラムの実行の都度、読み込まれることになる。
【0040】
二次文字列記憶手段45は、一次文字列記憶手段43から非生成語を排除した文字列を二次文字列として格納する。したがって、この二次文字列記憶手段45に格納された文字列は、符号の付与対象となり得る候補となる。しかし、この二次文字列記憶手段45には、まだ同一の文字列が重複して記憶されている。
【0041】
重複文字排除手段33は、二次文字列記憶手段45に格納された重複する文字列を排除する。重複文字排除手段33による重複する文字列の排除は、最初に記憶した文字列を残し、2回目以降に重複して記憶されている全ての同一文字列を消去する。
【0042】
キーワード記憶手段47は、二次文字列記憶手段45から重複する文字列を排除した結果、残った文字列を新たに生成したインデックスの順番に記憶して行く。すなわち、記憶されるキーワード同士の間には、重複文字排除手段33によって排除された空の文字列データのインデックスが付与されないようにする。本明細書中、この文字列を「キーワード」と称する。このキーワード記憶手段47に記憶されるキーワードは、上記したこれまでの構成から明らかなように、入力された文書の記述順で格納されることになる。
【0043】
符号生成手段37は、キーワード記憶手段47に格納されたキーワードに、インデックス順に数値符号を生成する。符号はその他の「a」、「b」や、「イ」、「ロ」であってもよい。生成する数値符号は、開始値を任意とすることができる。例えば最初の数値符号は「1」、「11」、「501」であってもよい。また、増加分も「1」、「2」、「10」であってもよい。例えば開始符号を「11」として増加分を2とすれば、符号は「11,13,15…」と生成されて行く。
【0044】
符号記憶手段49は、符号生成手段37にて生成した符号を、インデックス順で格納する。この場合のインデックスは、キーワード記憶手段47のインデックスと同一となる。つまり、同一のインデックスを指定することでそのキーワードの数値符号が取り出し可能となる。ここで重要なことは、キーワード記憶手段47には上述したように文書の記述順でキーワードが記憶されていることである。これにより、符号記憶手段49にもキーワードの記述順に小さい数から順に数値符号が格納される。
【0045】
符号挿入手段39は、文書のデータからキーワードを検出し、検出したキーワードの後に、そのキーワードのインデックスに対応する同一インデックスの符号を符号記憶手段49から読み取って挿入する。符号の挿入は、文書のデータに含まれる全ての同一のキーワードについて行われ、且つ格納されている異なる全てのキーワードの数分行われる。
【0046】
次に、上記のように構成された第一プログラム100の作用を説明する。
図2は本発明に係る符号付与プログラムの実行の手順を表したフローチャート、図3(a)は読み込み文字列の例、(b)は分離される一文字、(c)は文字種別属性、(d)は配列内格納値を表した説明図、図4(a)は連結分断属性、(b)は一次文字列、(c)は二次文字列、(d)はキーワードを表した説明図、図5(a)はキーワード別生成符号、(b)は符号挿入のなされた文書の説明図である。なお、図2には第一プログラム100に組み入れ可能な後述の第二プログラム200〜第五プログラム500を併記している。ここではこれら第二プログラム200〜第五プログラム500の手順の説明は省略する。また、同フローチャートにおいては特に主要な構成となる手順には英大文字A〜Hの符号を付した。
【0047】
第一プログラム100は、以下の手順をコンピュータ10に実行させる。先ず、表示器23に設けた入力窓に文書の文字列を入力する。入力は、上記のように表示器23に設けた入力窓に一文字ずつキー入力装置19により入力されても、マウス21によりコピーされた文字列を貼り付けして入力されてもよい。次に、手順S1にて入力した図3(a)に示す文字列を読み込む。
【0048】
次に、手順Aにおいて、入力した文書から一文字を図3(b)に示すように、記述順に分離する。文書は先頭から一文字ずつが分離される。手順S2にて、分離された一文字は、文字属性記憶手段41との比較により属性の一致が判定される。
【0049】
手順Bにおいて、文字別属性と比較して一致する文字の属性を付与する。これにより、図3(c)に示すように、分離された全ての一文字には属性が付与されることになる。
【0050】
次に、手順Cにおいて、分離した一文字を分離した順に連結する。つまり、手順Aにて一旦分離して属性を付与した一文字を今度は連結していく。ここでは例えば図3(d)に示す2次元配列を用い、0行に一文字をインデックス順に格納し、1行に属性をインデックス順に格納する。したがって、n番目の文字の属性は、1行目のインデックスn番目に格納される値を読み込めばよい。
【0051】
ここで、連結される一文字は、その属性が図4(a)に示す分断文字であるか否かが手順S3にて判定される。そして、手順Dにおいて、属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を図4(b)に示す一次文字列として記憶する。例えば「プラグケースには端子状の…」では、連結分断属性を有する文字であるひらがな「に」で分断され、「プラグケース」が一次文字列となる。同様に、「端子状」も「の」で分断され、二個目の一次文字列として一次文字列記憶手段43に格納される。
【0052】
次に、手順S4にて一次文字列記憶手段43に格納される一次文字列が図4(b)に下線で示した非生成語と一致するか否かが判定される。一致していたならその一次文字列は排除される。そして、手順Eにおいて、順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して図4(c)に示す二次文字列として記憶する。例えば、「端子状」も、連結分断属性を有する文字であるひらがな「の」で分断され生成される。したがって、一次文字列記憶手段43には「端子状」も格納される。この「端子状」は、予め非生成語記憶手段51に格納させておいた非生成語に「端子状」が存在すれば、「端子状」が排除された二次文字列として「プラグケース」と、「金具」…とが二次文字列記憶手段45に格納される。つまり、フィルタリングされることになる。この非生成語記憶手段51に格納される非生成語は、一文字であっても文字列であってもよい。符号が明らかに付されることのないものが格納される。非生成語としては例えば、「コスト」、「安価」、「向上」、「緻密」等が挙げられる。
【0053】
次に、S6にて図4(c)に下線で示した重複文字列が排除される。そして、手順Fにおいて、二次文字列から重複する文字列が排除された後、残った文字列が図4(d)に示すキーワードとして記憶されることとなる。重複文字排除手段33は、二次文字列記憶手段45に格納された重複する文字列を排除し、キーワード記憶手段47に格納する。文書が図4(a)に示した「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」であった場合、一次文字列記憶手段43には「プラグケース」、「端子状」、「金具」、「収容」「保持部」、「形成」「保持部」、「端子状」、「金具」、「装着」、「プラグ」、「構成」が格納される。二次文字列記憶手段45には、非生成語である「端子状」、「収容」、「形成」、「装着」、「構成」が排除された「プラグケース」、「金具」、「保持部」、「保持部」、「金具」、「プラグ」が格納される。キーワード記憶手段47には、重複する文字列である「金具」、「保持部」の重複記憶が排除された「プラグケース」、「金具」、「保持部」、「プラグ」が最終的に4つのキーワードとして格納されることとなる。
【0054】
次に、手順Gにおいて、キーワードの記憶順にそれぞれのキーワードで異なる図5(a)に示す符号を対応させて生成し記憶する。この4つのキーワードに対応させて、記憶順から例えば数値符号である「11」、「13」、「15」、「17」を生成する。
【0055】
次に、手順S7において、文書の中からキーワードを検出する。手順Hにおいて、文書からキーワードを検出したならキーワードの末尾の後にキーワードに対応して生成した符号を挿入する。
【0056】
すなわち、元の文書である「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」からキーワード「プラグケース」、「金具」、「保持部」、「プラグ」を検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「11」、「13」、「15」、「17」を挿入する。これにより、図5(b)に示す「プラグケース11には端子状の金具13を収容する保持部15が形成され、保持部15に端子状の金具13を装着してプラグ17が構成される…」とする符号入り文書が作成されることになる。
【0057】
次に、本発明に係る符号付与プログラムの第二の実施の形態を説明する。
本実施の形態に係る符号付与プログラムは、第一プログラム100の中に第二プログラム200が組み込まれている。したがって、既に述べた第一プログラム100の構成についての説明は省略する。
【0058】
第二プログラム200は、図1に示した符号削除手段53、文字列書き換え手段55、符号無し文書記憶手段57をプログラムメモリ13に備える。
符号削除手段53は、語尾に符号の付されたキーワードから符号のみを削除する。符号付きのキーワードは、上記した第一の実施の形態による第一プログラム100にて生成することができる。すなわち、数字や英字を上記の「ひらがな」と同様にして連結して行けばよい。
【0059】
文字列書き換え手段55は、文書の符号付きのキーワードを符号の削除されたキーワードに書き換える。文書の中から符号付きのキーワードを検出し、検出したなら、符号を削除した符号削除済みのキーワードに置き換える。これを、文書中の全てのキーワードについて実行することで、符号の削除された文書が得られる。
【0060】
符号無し文書記憶手段57は、上記の文字列書き換え手段55によって得られた符号の削除された文書を記憶する。なお、元の文書のキーワードに符号が付されていない場合には、符号削除手段53は何も削除しない。したがって、文字列書き換え手段55も何も書き換えは行わず、元の文書と符号無し文書記憶手段57に記憶された文書とは同一となる。
【0061】
符号削除手段53、文字列書き換え手段55、及び符号無し文書記憶手段57を備えた第二プログラム200は、符号付きの一次文字列に含まれる符号属性に一致する文字のみを、一次文字列の末尾から一文字ずつ削除して符号の削除された一次文字列として記憶する手順Iと、文書の符号付きのキーワードを符号の削除されたキーワードに書き換える文字列書き換え手順Jと、をコンピュータ10に実行させる。
【0062】
この第二プログラム200の組み込まれた第一プログラム100では、手順Iが手順Fの後に実行され、手順Jが手順Iの後に実行される。したがって、第二プログラム200を組み込んだ符号付与プログラムは、コンピュータ10に、入力した文書から一文字を記述順に分離する手順Aと、分離した一文字に予め記憶した文字属性記憶手段41の文字別属性と比較して一致する文字の属性を付与する手順Bと、分離した一文字を分離した順に連結する手順Cと、属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Dと、順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Iと、文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Jと、符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Gと、符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの符号の削除されたキーワードを検出したならキーワードの末尾の後にキーワードに対応して新たに生成した符号を挿入する手順Hと、を実行させることになる。
【0063】
次に、第一プログラム100に第二プログラム200が組み込まれた符号付与プログラムの作用を説明する。
この実施の形態に係る符号付与プログラムでは、上記した第一の実施の形態の構成により文書からキーワードを生成するに際し、符号付きのキーワードで生成する。符号付きのキーワードは第一の実施の形態の構成と同様の構成で生成できる。すなわち、文字属性記憶手段41に記憶されている「プ」の属性「カタカナ」が付与されるのと同様に、「1」や「3」に属性「数字」を付与し、「カタカナ」と同様に「数字」も連結の対象属性とする。この他、「a」、「b」の「英字」も連結の対象属性とすれば、例えば「13a」等の英字を付した符号付きの文字列も生成されることとなる。
【0064】
したがって、上記同様の手順により、図5(b)に示した文書「プラグケース11には端子状の金具13を収容する保持部15が形成され、保持部15に端子状の金具13を装着してプラグ17が構成される…」が入力されれば、「プラグケース11」、「金具13」、「保持部15」、「プラグ17」が符号付きのキーワードとして生成される。その後、上記と同様に重複する文字列が排除され、最終的に、例えば「プラグケース11」、「金具13」、「保持部15」、「プラグ17」がキーワードとして記憶される。
【0065】
次に、生成された符号付きのキーワードは、キーワードに含まれる符号属性に一致する文字(「数字」、「英字」)のみがこのキーワードの末尾から一文字ずつ順に削除されて符号の削除されたキーワードとして記憶される。つまり、手順Iによって符号削除キーワードへ書き換えが行われる。そして、手順Jによって、文書の符号付きのキーワードは、符号の削除されたキーワード、すなわち、「プラグケース」、「金具」、「保持部」、「プラグ」に書き換えられ、符号無し文書として記憶される。
【0066】
これにより、元の符号付きの文書が、符号無しの文書となる。次に、符号の削除された文書である「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「11」、「13」が挿入されることで、「プラグケース11には端子状の金具13を…」とする符号入り文書が再び作成される。本構成で重要なことの一つに、符号付き文書から一旦符号が消されることにある。
【0067】
図6(a)は符号が記述順でない文書の説明図、(b)は符号が削除された文書の説明図、(c)は新たな符号が記述順に付された文書の説明図である。
第二プログラム200を組み込んだ符号付与プログラムは、元の符号入り文書の符号が昇順でなかった場合であっても、キーワードは記述順に昇順で符号が振り直されることになる。例えば、図5(b)に示す符号入り文書「プラグケース11には端子状の金具13を収容する保持部15が形成され、保持部15に端子状の金具13を装着してプラグ17が構成される…」を、推考の結果、図6(a)に示す符号入り文書「プラグ17は、プラグケース11の保持部15に端子状の金具13を装着して構成される…」に変更した場合、符号が記述順とならなくなる。この場合、例えば更新ボタンなどの操作により、手順S8で符号付与プログラムを再実行させる。すると、文書は一旦、符号が削除されて図6(b)に示す「プラグは、プラグケースの保持部に端子状の金具を装着して構成される…」となる。そして上記した手順I、手順J以降の手順Gにより各キーワードの記述順に、新たに生成された符号が挿入されることで、符号の再付与された文書は図6(c)に示すように「プラグ11は、プラグケース13の保持部15に端子状の金具17を装着して構成される…」となる。これにより、符号一体キーワードが含まれる文書を幾度変更しても、更新ボタンをワンクリックするのみで、符号を文書の記述順に自動的に変更することが可能となる。
【0068】
次に、第一プログラム100に第三プログラム300が組み込まれた本発明の第三の実施の形態に係る符号付与プログラムを説明する。
第三プログラム300は、図1に示したキーワード表示手段59、非生成語追加手段61をプログラムメモリ13に備える。
手順Fにてキーワードが記憶された後、キーワードの変更がキー入力装置19又はマウス21によって選択されると、手順S9でキーワード表示へと処理が移る。キーワード表示手段59は、手順Fにて生成したキーワードを表示器23に一覧表示させる。
【0069】
非生成語追加手段61は、非生成語記憶手段51に新たな非生成語を記憶させる。非生成語記憶手段51は、ファイルメモリ17にデータを格納するので、プログラムの再起動によっても再び読み込まれ、他の文書においても格納内容が参照されることとなる。
【0070】
第三プログラム300は、手順Fの次にキーワードを表示器23に表示する手順Kと、新たな非生成語を追加して記憶する手順Lと、をコンピータに実行させる。
【0071】
第一プログラム100に第三プログラム300が組み込まれた符号付与プログラムでは、キーワードに符号の付与された文書が作成された結果、非生成語に含まれていない排除したいキーワードが生成されて符号が付与されてしまったとき、その排除したいキーワードを新たに非生成語に加えることができる。その結果、再び符号付与プログラムをコンピュータ10に実行させると、そのキーワードが生成されなくなり、符号も付与されなくなる。このように第三プログラム300が組み込まれた符号付与プログラムは、使用者の選択した非生成語が、その都度ファイルメモリに蓄積されて行くことで、使用者の使用分野に合わせた符号生成能力が備わって行くことになる。すなわち、使用分野に即応した学習が可能となっている。
【0072】
次に、第一プログラム100に第四プログラム400が組み込まれた本発明の第四の実施の形態に係る符号付与プログラムを説明する。
第四プログラム400は、図1に示した連結文字判定手段63をプログラムメモリ13に備える。
連結文字判定手段63は、キーワードの末尾に連結される文字の属性を判定する。
【0073】
第一プログラム100に第四プログラム400が組み込まれた符号付与プログラムは、コンピュータ10に、手順Hを実行する前に、キーワードの末尾に連結される文字の属性を判定し、この属性が連結分断属性でないときには、符号を挿入しない手順M、を実行させる。
【0074】
手順Hにおいて、文書からいずれかのキーワードを検出し、このキーワードの末尾の後に対応する符号を挿入する際に、キーワードに連結される文字の属性が判定され、その連結文字が連結分断属性でないときには、符号が挿入されない。例えば、文書が「施錠装置は、錠と鍵とからなる…」である場合、「施錠装置」、「錠」、「鍵」がキーワードとして生成され、それぞれのキーワードに対応して「11」、「13」、「15」の符号が生成された場合、そのまま文書中のキーワードに符号が挿入されると、符号の挿入された文書は、「施錠13装置11は、錠13と鍵15とからなる…」となり、一旦「11」の挿入された「施錠装置11」に、「錠」の符号「13」が再び挿入され、「施錠13装置11」となってしまう。逆に「錠」が先に出現する「錠は施錠装置と…」の文書では「錠11は施錠11装置と…」となり、「施錠装置」が判別できなくなり符号が挿入されなくなる。本構成では、「錠」の連結文字「装」が連結分断属性(「ひらがな」)でないときには、符号「13」が挿入されないので、前段、後段の例のように「施錠13装置11」や「施錠11装置」とはならず「施錠装置11は、錠13と鍵15とからなる…」となる。
【0075】
次に、第一プログラム100に第五プログラム500が組み込まれた本発明の第五の実施の形態に係る符号付与プログラムを説明する。
第五プログラム500は、図1に示した強制生成語有無判定手段65、属性変更記号挿入手段67、強制生成語属性付与手段69をプログラムメモリ13に備え、強制生成語記憶手段71をファイルメモリ17に備える。
強制生成語有無判定手段65は、文書の中に強制生成語が含まれているか否かを判断する。ここで、強制生成語とは、連結分断属性を有していても強制的に生成するキーワードを言う。
【0076】
属性変更記号挿入手段67は、文書の中の強制生成語の直前に属性変更開始記号、属性変更終了記号を挿入する。属性変更開始記号、属性変更終了記号は文書に含まれない記号、例えば「↓」や「↑」などとする。挿入は、強制生成語の位置を検出し、その文字列の一つ前と、末尾の後の位置を指定して行う。
【0077】
強制生成語属性付与手段69は、属性変更記号の後の文字に、強制生成語属性を付与する。属性変更開始記号を検出したなら、それ以降一文字ずつ付される属性は、特定の属性、例えば「5」とする。特定の属性の付与は、属性変更終了記号を検出したなら中止される。それ以降は通常の属性付与に戻る。
【0078】
強制生成語記憶手段71は、強制生成語を記憶する。この強制生成語は、ファイルメモリ17に記憶される。すなわち、プログラムの終了によって消えるデータメモリ15とは異なり、プログラムの終了によっても磁気データとして記憶される例えばハードディスクに格納される。したがって、プログラムの実行の都度、読み込まれることになる。
【0079】
第一プログラム100に第五プログラム500が組み込まれた符号付与プログラムでは、コンピュータ10に、予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Nと、文書に強制生成語と一致するキーワードが含まれていたならこのキーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Oと、手順Bの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した一文字ごとに強制生成語属性を付与する手順Pと、を実行させる。
【0080】
入力した文書が「プラグケースには端子状の金具を…」であった場合、「端子状の金具」に符号を付すことが可能となる。上述の構成では、属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される。この連結の際、連結される一文字の属性が連結分断属性を有する文字(例えば「ひらがな」)であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。
【0081】
したがって、「の」によって「端子状の金具」は、「端子状」と「金具」とに分断されることになる。このように、「ひらがな」を連結分断属性文字とした場合、「ひらがな」を含むキーワードの生成ができなくなる。例えば「第1の突起」、「位置合わせ部」、「外れ止め部」、「筋交い」、「巻取りボビン」、「遊び部」等々である。本構成では「ひらがな」を含む文字列をキーワードとして生成したい場合、強制生成語として記憶させておく。
【0082】
図7(a)は属性変更記号の挿入された文書の説明図、(b)は強制生成語属性の配列内格納状況の説明図である。
強制生成語が文書に存在すると、キーワードの先頭に属性変更開始記号「↓」が挿入されるとともに末尾の後に属性変更終了記号「↑」が挿入される。例えば図7(a)に示すように、「プラグケースには↓端子状の金具↑を…」とする。次に、検出した文字に属性を付与する際、「↓」の検出で「強制生成語」の属性である例えば「5」等の整数が付与される。この属性の付与は、「↑」を検出したなら止める。これを属性の配列で見れば、「ひらがな」の属性を「3」、「強制生成語」の属性を「5」とすると、「には↓端子状の金具↑を」は図7(b)に示すように、「335555553」となる。なお、「↑」「↓」はこの時点で排除してもよいし或いは記号属性「8」「9」等を付与しておいて後に排除してもよい。後に排除の場合は、上記属性配列は、「33855555593」となる。これにより、「ひらがな」が含まれた文字列であっても属性「5」を連結の対象として判断させることで「端子状の金具」が「の」で分断されずに連結されてキーワードとして生成され、「の」入りキーワードの符号の付与が可能となる。なお、ひらがなの「の」は一例であり、この強制生成語は英字、例えば「LED」のキーワード生成及び符号付けも可能にする。
【0083】
次に、上記した各実施の形態の第一変形例に係る符号付与プログラムを説明する。
上記した各実施の形態に係る符号付与プログラムは、さらに以下の構成を備えたものとすることができる。
すなわち、第一変形例に係る符号付与プログラムは、生成した符号付与対象のキーワードを表示させ、表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除する手順を備えることが好ましい。「本稿非生成語」とは、符号付与プログラムの動作中に作成の原稿(本稿)において生成されたキーワードのうち、本稿のみでその生成がキャンセルされる生成語(すなわち、キーワード)を言う。
【0084】
生成されたキーワードのうち、特に今回作成している文書において、符号の付与の必要のないキーワードは、生成したキーワードから排除される。これにより、例えば図面に表れない部材に無用な符号が付されてしまうことが防止される。また、この本稿非生成語は、ファイルメモリ17には記憶させず、データメモリ15に記憶させることで、プログラムの終了後にはリセットされるので、非生成語とは異なり、次に符号付与プログラムを起動させたときにはキーワードが本構成により排除されることなく生成され、他の文書に影響を及ぼすことがない。
【0085】
次に、上記した各実施の形態の第二変形例に係る符号付与プログラムを説明する。
第二変形例に係る符号付与プログラムは、生成した符号付与対象のキーワードのうち、含まれたならキーワードとして生成しない非生成含有語を含むときには、この非生成含有語を含むキーワードを符号付与対象のキーワードから排除する。
【0086】
非生成含有語はファイルメモリ17に記憶され、プログラムの起動によって自動的に読み込まれる。この変形例では、生成されたキーワードのうち、この非生成含有語を含んだキーワードは排除されることになる。例えば「μ」のような単位文字が含まれたキーワードは排除される。上述した非生成語のみにより対応した場合、「10μ」、「22μ」、「31μ」等々、一致する全ての非生成語を記憶させておかなければならず多くのメモリが必要となって現実には不可能となる。このような場合に、「μ」を含むキーワードは全て排除することとすれば、少ないメモリで、不要なキーワードを排除して、より有効なキーワードを高精度に生成することが可能となる。
【0087】
したがって、本実施の形態に係る符号付与プログラムによれば、符号付与の手間を省くことができる。
【符号の説明】
【0088】
10…コンピュータ
27…1文字分離手段
29…属性付与手段
31…文字連結手段
33…重複文字排除手段
37…符号生成手段
39…符号挿入手段
41…文字属性記憶手段
43…一次文字列記憶手段
45…二次文字列記憶手段
47…キーワード記憶手段
51…非生成語記憶手段

【特許請求の範囲】
【請求項1】
コンピュータに、
入力した文書から一文字を記述順に分離する手順Aと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Bと、
分離した一文字を分離した順に連結する手順Cと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を一次文字列として記憶する手順Dと、
順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、
キーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Gと、
前記文書からいずれかの前記キーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Hと、
を実行させるための符号付与プログラム。
【請求項2】
コンピュータに、
入力した文書から一文字を記述順に分離する手順Aと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Bと、
分離した一文字を分離した順に連結する手順Cと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Dと、
順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Eと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Fと、
符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Iと、
文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Jと、
符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Gと、
符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの前記符号の削除されたキーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Hと、
を実行させるための符号付与プログラム。
【請求項3】
請求項1又は請求項2記載の符号付与プログラムであって、
前記連結分断属性がひらがなであることを特徴とする符号付与プログラム。
【請求項4】
請求項1又は請求項2記載の符号付与プログラムであって、
コンピュータに、
前記手順Fの次に前記キーワードを表示器に表示する手順Kと、
新たな非生成語を追加して記憶する手順Lと、
を実行させるための符号付与プログラム。
【請求項5】
請求項1又は請求項2記載の符号付与プログラムであって、
コンピュータに、
手順Hを実行する前に、前記キーワードの末尾に連結される文字の属性を判定し、該属性が連結分断属性でないときには、前記符号を挿入しない手順M、
を実行させるための符号付与プログラム。
【請求項6】
請求項1又は請求項2記載の符号付与プログラムであって、
コンピュータに、
予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Nと、
文書に強制生成語と一致するキーワードが含まれていたなら該キーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Oと、
手順Bの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した前記一文字ごとに強制生成語属性を付与する手順Pと、
を実行させるための符号付与プログラム。
【請求項7】
請求項1又は請求項2記載の符号付与プログラムであって、
生成した符号付与対象のキーワードを表示させ、
表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【請求項8】
請求項1又は請求項2記載の符号付与プログラムであって、
生成した符号付与対象のキーワードのうち、含まれたならキーワードとして記憶しない非生成含有語を含むときは、該非生成含有語を含むキーワードを符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−63819(P2012−63819A)
【公開日】平成24年3月29日(2012.3.29)
【国際特許分類】
【出願番号】特願2010−205263(P2010−205263)
【出願日】平成22年9月14日(2010.9.14)
【出願人】(506251638)
【Fターム(参考)】