符号付与プログラム

【課題】符号付与の手間が省け、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更できるようにする。
【解決手段】コンピュータに、文書から一文字を分離する手順Ａと、分離した一文字に属性を付与する手順Ｂと、分離した一文字を連結する手順Ｃと、連結分断属性を検出したらそれまで連結した文字列を一次文字列として記憶する手順Ｄと、一次文字列から非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、キーワードの記憶順に符号を対応させて生成し記憶する手順Ｇと、文書からいずれかのキーワードを検出したならキーワードの末尾の後に符号を挿入する手順Ｈと、を実行させる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、キーワードに記述順で符号の付される文書の作成に用いて好適な符号付与プログラムに関する。
【背景技術】
【０００２】
文書の作成には、文書中に含まれる複数のキーワードに符号を付し、別の図面等の相当部分に同一の符号を付すことにより、情報の理解を容易にする書面の作成手法の採られることがある。例えば特許明細書においては、「プラグ１１は、プラグケース１３に設けた保持部１５に、端子状の金具１７を装着して成る。」の記載に対応した符号「１１」、「１３」、「１５」、「１７」が別途図面の相当部位に応じて記載される。
【０００３】
しかし、特許明細書は、複雑な内容を記載した文書であるから、特許明細書の作成者は、同一の符号を異なる部材に用いるという誤りをしばしば起こしてしまう。このような誤りがあると、特許明細書の理解に混乱を来たし好ましくないことから、作成者は、特許明細書を書き上げた後に何度も用語と符号を見直す作業を強いられることになる。
【０００４】
これに対し、例えば特許文献１記載の特許明細書作成支援プログラムは、符号が一致しつつ、用語が不一致の場合は、符号および用語の少なくとも一方を強調表示し、符号の付け間違いまたは用語の記載ミスを作成者に容易に知らせることを可能としている。
【０００５】
また、キーワード数が１００個以上と多くなる場合、重複付与を回避するために、例えば単語登録手段等を用いて「プラグ１１」を「プ」等の呼び出し文字で登録し、「プ」を入力して文字変換することで符号と一体のキーワード「プラグ１１」が呼び出されるようにして、符号の付け間違いが生じないようになされることもある。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開２００６−３４４０５３号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
しかしながら、上記した従来の特許明細書作成支援プログラムを用いて、符号の付け間違いまたは用語の記載ミスが回避できても、作文中に次々に必要となるキーワードに符号を付して行く作業は依然煩雑な作業として残る。また、仮に上記のように、符号一体キーワードを「呼び出し文字」で呼び出し可能としても、最初に出現するキーワードに符号を付与する手間、符号を付与した符号一体キーワードを登録する手間は残る。さらに、文書の作成においては、その表現の違いから記述するキーワードが前後する場合がある。例えば上記した文書が推考の結果「プラグケース１３には端子状の金具１７を収容する保持部１５が形成され、保持部１５に端子状の金具１７を装着してプラグ１１が構成される…」とされた場合、各キーワードに符号が一体的に記憶されていると、符号が文書の記述順で昇順とならず、初めて文書を読む者には違和感が生じて読みにくくなる。このような事情から、符号付与の手間が省け、しかも、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更される技術の開発が望まれていた。
【０００８】
本発明は上記状況に鑑みてなされたもので、その第一の目的は符号付与の手間が省ける符号付与プログラムを提供することにある。第二の目的は、符号一体キーワードが含まれる文書を変更しても、符号が文書の記述順に自動的に変更される符号付与プログラムを提供することにある。
【課題を解決するための手段】
【０００９】
本発明に係る上記目的は、下記構成により達成される。
（１）コンピュータに、
入力した文書から一文字を記述順に分離する手順Ａと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Ｂと、
分離した一文字を分離した順に連結する手順Ｃと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を一次文字列として記憶する手順Ｄと、
順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、
キーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Ｇと、
前記文書からいずれかの前記キーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Ｈと、
を実行させるための符号付与プログラム。
【００１０】
この符号付与プログラムでは、文書が先頭から一文字ずつ分離される。分離された一文字には、文字属性記憶手段の文字別属性と比較して一致する文字の属性が付与される。例えば分離された一文字が「プ」であると、文字属性記憶手段に記憶されている「プ」の属性「カタカナ」が付与される。属性は例えば１，２，３の整数等としてもよい。属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される（但し、一文字であってもよい）。連結の際、連結される一文字の属性が連結分断属性を有する文字（例えば「ひらがな」）であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。例えば「プラグは、プラグケースに設けた…」では、「プラグ」が一次文字列となる。同様に、「プラグケース」も二個目の一次文字列として記憶される。この際、「設け」も、連結分断属性を有する文字であるひらがな「け」で分断され、「設」が抽出されるが、予め記憶した非生成語に「設」が存在すれば、「設」が排除された二次文字列として「プラグ」と、「プラグケース」とが記憶される。また、「プラグ」が再び生成されたときには、重複する文字列として排除され、最終的に、「プラグ」と、「プラグケース」との２つがキーワードとして記憶される。この２つのキーワードに対応させて、記憶順から例えば数値符号である「１１」、「１３」を生成する。符号はその他の「ａ」、「ｂ」や、「イ」、「ロ」、であってもよい。最後に、元の文書である「プラグは、プラグケースに設けた…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「１１」、「１３」が挿入されることで、「プラグ１１は、プラグケース１３に設けた…」とする符号入り文書が作成される。
【００１１】
（２）コンピュータに、
入力した文書から一文字を記述順に分離する手順Ａと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Ｂと、
分離した一文字を分離した順に連結する手順Ｃと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Ｄと、
順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、
符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Ｉと、
文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Ｊと、
符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Ｇと、
符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの前記符号の削除されたキーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Ｈと、
を実行させるための符号付与プログラム。
【００１２】
この符号付与プログラムでは、上記した（１）の構成により文書からキーワードを生成する際に、符号付きのキーワードで生成する。符号付きのキーワードは（１）の構成と同様の構成で生成できる。すなわち、文字属性記憶手段に記憶されている「プ」の属性「カタカナ」が付与されるのと同様に、「１」や「３」に属性「数字」を付与し、「カタカナ」と同様に「数字」も連結の対象属性とする。この他、「ａ」、「ｂ」の「英字」も連結の対象属性とすれば、例えば「１３ａ」等の英字を付した符号付き文字列も生成することができる。したがって、上記同様の手順により「プラグケース１１」と、「プラグ１７」が符号付きのキーワードとして生成される。生成された符号付きのキーワードは、キーワードに含まれる符号属性に一致する文字（「数字」、「英字」）のみがこのキーワードの末尾から一文字ずつ削除されて符号の削除されたキーワードとして記憶される。次に、文書の符号付きのキーワードを一旦符号の削除されたキーワードに書き換える。これにより、元の符号付きの文書が、符号無しの文書となる。最後に、符号の削除された文書である「プラグは、プラグケースに設けた…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「１１」、「１３」が挿入されることで、「プラグ１１は、プラグケース１３に設けた…」とする符号入り文書が作成される。本構成で重要なことの一つに、符号付き文書から一旦符号が消されることにある。元の符号入り文書の符号が昇順でなかった場合であっても、キーワードは記述順に昇順で符号が振り直されることになる。例えば、符号入り文書「プラグケース１１には端子状の金具１３を収容する保持部１５が形成され、保持部１５に端子状の金具１３を装着してプラグ１７が構成される…」を、推考の結果、符号入り文書「プラグ１７は、プラグケース１１の保持部１５に端子状の金具１３を装着して構成される…」に変更した場合、符号が記述順とならなくなる。この場合、一旦、符号の削除された文書は「プラグは、プラグケースの保持部に端子状の金具を装着して構成される…」となる。そして、各キーワードに記述順に生成された符号が挿入されることで、符号の再付与された文書は「プラグ１１は、プラグケース１３の保持部１５に端子状の金具１７を装着して構成される…」となる。これにより、符号一体キーワードが含まれる文書を幾度変更しても、符号を文書の記述順に自動的に変更することが可能となる。
【００１３】
（３）（１）又は（２）の符号付与プログラムであって、
前記連結分断属性がひらがなであることを特徴とする符号付与プログラム。
【００１４】
この符号付与プログラムでは、漢字、数字、英字、カタカナ、ひらがな等の文字が混用される日本語文書において、文書中の「ひらがな」により連結を止めることで、単語（自立語を含む）の中の特にキーワードとなり得る文字列を生成する確率を高めることができる。
【００１５】
（４）（１）又は（２）の符号付与プログラムであって、
コンピュータに、
前記手順Ｆの次に前記キーワードを表示器に表示する手順Ｋと、
新たな非生成語を追加して記憶する手順Ｌと、
を実行させるための符号付与プログラム。
【００１６】
この符号付与プログラムでは、（１）又は（２）の符号付与プログラムをコンピュータに実行させることで、キーワードに符号の付与された文書が作成された結果、予め記憶した非生成語に含まれていない排除したいキーワードが生成されて符号が付与されてしまったとき、その排除したいキーワードが新たに非生成語に加えられることで、再び符号付与プログラムをコンピュータに実行させると、そのキーワードが生成されなくなり、符号が付与されなくなる。以下のキーワードには符号が繰り上がって付与される。このようにして符号付与プログラムは、使用者の選択した非生成語が、その都度ファイルメモリに蓄積されて行くことで、使用者の使用分野に合わせた符号生成能力が備わって行くことになる。すなわち、使用分野に即応した学習が可能となっている。
【００１７】
（５）（１）又は（２）の符号付与プログラムであって、
コンピュータに、
手順Ｈを実行する前に、前記キーワードの末尾に連結される文字の属性を判定し、該属性が連結分断属性でないときには、前記符号を挿入しない手順Ｍ、
を実行させるための符号付与プログラム。
【００１８】
この符号付与プログラムでは、手順Ｈにおいて、文書からいずれかのキーワードを検出し、このキーワードの末尾の後に対応する符号を挿入する際に、キーワードに連結される文字の属性が判定され、その連結文字が連結分断属性でないときには、符号が挿入されない。例えば、文書が「施錠装置は、錠と鍵とからなる…」である場合、「施錠装置」、「錠」、「鍵」がキーワードとして生成され、それぞれのキーワードに対応して「１１」、「１３」、「１５」の符号が生成された場合、そのまま文書中のキーワードに符号が挿入されると、符号の挿入された文書は、「施錠１３装置１１は、錠１３と鍵１５とからなる…」となり、一旦「１１」の挿入された「施錠装置１１」に、「錠」の符号「１３」が再び挿入され、「施錠１３装置１１」となってしまう。逆に「錠」が先に出現する「錠は施錠装置と…」の文書では「錠１１は施錠１１装置と…」となり、「施錠装置」が判別できなくなり符号が挿入されなくなる。本構成では、「錠」の連結文字「装」が連結分断属性（「ひらがな」）でないときには、符号「１３」が挿入されないので、前段、後段の例のように「施錠１３装置１１」や「施錠１１装置」とはならず「施錠装置１１は、錠１３と鍵１５とからなる…」となる。
【００１９】
（６）（１）又は（２）の符号付与プログラムであって、
コンピュータに、
予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Ｎと、
文書に強制生成語と一致するキーワードが含まれていたなら該キーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Ｏと、
手順Ｂの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した前記一文字ごとに強制生成語属性を付与する手順Ｐと、
を実行させるための符号付与プログラム。
【００２０】
この符号付与プログラムでは、入力した文書が「プラグケースには端子状の金具を…」であった場合、「端子状の金具」に符号を付すことが可能となる。上述のように、（１）、（２）の構成では、属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される。連結の際、連結される一文字の属性が連結分断属性を有する文字（例えば「ひらがな」）であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。したがって、「の」によって「端子状の金具」は、「端子状」と「金具」とに分断されることになる。このように、「ひらがな」を連結分断属性文字とした場合、「ひらがな」を含むキーワードの生成ができなくなる。例えば「第１の突起」、「位置合わせ部」、「外れ止め部」、「筋交い」、「巻取りボビン」、「遊び部」等々である。本構成では「ひらがな」を含む文字列をキーワードとして生成したい場合、強制生成語として記憶させておく。強制生成語が文書に存在すると、キーワードの先頭に属性変更開始記号「↓」が挿入されるとともに末尾の後に属性変更終了記号「↑」が挿入される。例えば「プラグケースには↓端子状の金具↑を…」とする。次に、検出した文字に属性を付与する際、「↓」の検出で「強制生成語」の属性である例えば「５」等の整数が付与される。この属性の付与は、「↑」を検出したなら止める。これを属性の配列で見れば、「ひらがな」の属性を「３」、「強制生成語」の属性を「５」とすると、「には↓端子状の金具↑を」は「３３５５５５５５３」となる。なお、「↑」「↓」はこの時点で排除してもよいし或いは記号属性「８」「９」等を付与しておいて後に排除してもよい。後に排除の場合は、上記属性配列は、「３３８５５５５５５９３」となる。これにより、「ひらがな」が含まれた文字列であっても属性「５」を連結の対象として判断させることで「端子状の金具」が「の」で分断されずに連結されてキーワードとして生成されることとなる。
【００２１】
（７）（１）又は（２）の符号付与プログラムであって、
生成した符号付与対象のキーワードを表示させ、
表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【００２２】
この符号付与プログラムでは、生成されたキーワードのうち、特に今回作成している文書において、符号の付与の必要のないキーワードは、生成したキーワードから排除される。これにより、例えば図面に表れない部材に無用な符号が付されてしまうことが防止される。また、この本稿非生成語は、ファイルメモリには記憶させず、データメモリに記憶させることで、プログラムの終了後にはリセットされるので、非生成語とは異なり、次に符号付与プログラムを起動させたときの他の文書には影響を及ぼさない。
【００２３】
（８）（１）又は（２）の符号付与プログラムであって、
生成した符号付与対象のキーワードのうち、含まれたならキーワードとして記憶しない非生成含有語を含むときは、該非生成含有語を含むキーワードを符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【００２４】
この符号付与プログラムでは、非生成含有語がファイルメモリに記憶され、プログラムの起動によって自動的にファイルメモリが参照される。生成されたキーワードのうち、この非生成含有語を含んだキーワードは排除されることになる。例えば「μ」のような単位文字が含まれたキーワードは排除される。上述した非生成語のみにより対応した場合、「１０μ」、「２２μ」、「３１μ」等々、一致する全ての非生成語を記憶させておかなければならず多くのメモリが必要となって現実には不可能となる。このような場合に、「μ」を含むキーワードは全て排除することとすれば、少ないメモリで、不要なキーワードを排除して、より有効なキーワードを高精度に生成することが可能となる。
【発明の効果】
【００２５】
本発明に係る符号付与プログラムによれば、符号付与の手間を省くことができる。
【図面の簡単な説明】
【００２６】
【図１】本発明に係る符号付与プログラムによって動作を実行するコンピュータを、符号付与プログラムの構成と共に表したブロック図である。
【図２】本発明に係る符号付与プログラムの実行の手順を表したフローチャートである。
【図３】（ａ）は読み込み文字列の例、（ｂ）は分離される一文字、（ｃ）は文字種別属性、（ｄ）は配列内格納値を表した説明図である。
【図４】（ａ）は連結分断属性、（ｂ）は一次文字列、（ｃ）は二次文字列、（ｄ）はキーワードを表した説明図である。
【図５】（ａ）はキーワード別生成符号、（ｂ）は符号挿入のなされた文書の説明図である。
【図６】（ａ）は符号が記述順でない文書の説明図、（ｂ）は符号が削除された文書の説明図、（ｃ）は新たな符号が記述順に付された文書の説明図である。
【図７】（ａ）は属性変更記号の挿入された文書の説明図、（ｂ）は強制生成語属性の配列内格納状況の説明図である。
【発明を実施するための形態】
【００２７】
以下、本発明の実施の形態を図面を参照して説明する。
図１は本発明に係る符号付与プログラムによって動作を実行するコンピュータを、符号付与プログラムの構成と共に表したブロック図である。
先ず、本発明の第一の実施の形態に係る符号付与プログラムから説明する。本実施の形態に係る符号付与プログラムは、ハードウエア資源であるコンピュータ１０と協働して処理を実現する。コンピュータ１０は、ＣＰＵ、メモリ、入力装置、出力装置を基本構成要素として備える。ＣＰＵは、演算装置及び制御装置１１からなり、制御装置１１からの指示にしたがって演算装置が演算を実行する。メモリは、演算装置が直接操作できるメインメモリ（本明細書中では「プログラムメモリ１３」と称す）、その読み込み元や保管先などに補助的に使用する補助記憶装置を有する。補助記憶装置は、さらにデータメモリ１５、ファイルメモリ１７に分かれる。入力装置は、外部からコンピュータ１０に対し、処理情報を入力するもので、具体的にはキー入力装置１９、マウス２１である。出力装置は、コンピュータ１０から外部に処理した結果を出力するもので、具体的には表示器２３、印刷装置２５である。符号付与プログラムは、機能実現手段である上記コンピュータ１０との結合により、あらかじめ決められた命令にしたがってＣＰＵが演算を行うことで、文書からキーワードを生成し、この生成したキーワードに符号を付す処理をコンピュータ１０に実行させる。
【００２８】
符号付与プログラムは、文書編集プログラムとして構成することができる。また、文書編集プログラムの一機能として追加的に構成してもよい。また、文書編集プログラムでまとまった動作を指示する所謂マクロと称されるコマンド群を用いて記述し、既存の文書編集プログラム上で動作させてもよい。さらに、文書編集プログラム上で実行させるのではなく、一旦文書ファイルとして記憶させた文書データを、通信回線を介して外部メモリに記憶された本プログラムで読み込み、その文書データを処理させることでキーワードを生成し、符号を付す構成としてもよい。なお、符号付与プログラムを記述するプログラム言語としては、ＢＡＳＩＣ、Ｃ＃、Ｃ＋＋等とすることができる。
【００２９】
符号付与プログラムは、第一プログラム１００を基本の手続き（プロシージャ）として有する。第一プログラム１００は、複数の手順を有する。それぞれの手順は、単一又は複数の具体的手段（ステートメント）によって構成されている。第一プログラム１００は、例えば表示器２３に表示される「ボタン」のクリックが手続き開始の宣言となる。つまり、「ボタン」のクリックにより第一プログラム１００の手続きは完結する。
【００３０】
符号付与プログラムは、第一プログラム１００の中に、他の第二プログラム２００、第三プログラム３００、第四プログラム４００、第五プログラム５００が組み込まれていることが好ましい。この場合、「ボタン」のクリックにより第一プログラム１００〜第五プログラム５００までの手続きが完結する。つまり、本発明に係る符号付与プログラムは、第一プログラム１００をその構成の全てとしてもよく、第一プログラム１００〜第五プログラム５００をその構成の全てとしてもよい。なお、後述するように、第三プログラム３００と第五プログラム５００は、他の「ボタン」のクリックによって開始が宣言される別の手続きとしてもよい。
【００３１】
第一の実施の形態では、第一プログラム１００の構成を説明する。その後、第二の実施の形態から第五の実施の形態にて、第二プログラム２００〜第五プログラム５００の構成を説明する。
第一プログラム１００は、１文字分離手段２７、属性付与手段２９、文字列連結手段３１、重複文字排除手段３３、キーワード検出手段３５、符号生成手段３７、符号挿入手段３９をプログラムメモリ１３に格納する。また、第一プログラム１００は、文字属性記憶手段４１、一次文字列記憶手段４３、二次文字列記憶手段４５、キーワード記憶手段４７、符号記憶手段４９をデータメモリ１５に格納する。また、第一プログラム１００は、非生成語記憶手段５１をファイルメモリ１７に格納する。
【００３２】
１文字分離手段２７は、入力された文書から一文字を記述順に分離する。入力は、表示器２３に設けた入力窓に一文字ずつキー入力装置１９により入力されても、マウス２１によりコピーされた文字列を貼り付けして入力されてもよい。入力窓に入力された文書のデータは、文字型のデータとして格納される。このデータを、最初の位置から一文字ずつ取得して、一文字ずつ配列に格納して行く。一文字は如何なる文字、記号、全角、半角であってもよい。配列は多次元配列とする。列は分離の順番（インデックス）を数値で格納する。一行目は分離された一文字を格納する。二行目は後述の属性を格納する。
【００３３】
文字属性記憶手段４１は、一文字ずつに属性を与えている。文字種により複数のグループに分け、そのグループごとに数値等の属性を付与する。属性は例えば１，２，３の整数等としてもよい。属性は、より具体的に「カタカナ」を「１」、「ひらがな」を「２」、「英字」を「３」、「数字」を「８」、「記号」を「９」、その他「漢字等」を「４」とすることができる。本明細書では以下、この例により説明する。
【００３４】
属性付与手段２９は、分離した一文字に予め格納した文字属性記憶手段４１の文字別属性と比較して一致する文字の属性を付与する。これにより、分離された一文字には、その文字の属性が付与され、例えば分離された一文字が「プ」であると、文字属性記憶手段４１に格納されている「プ」の属性である「カタカナ」の「１」が付与されることになる。
【００３５】
文字列連結手段３１は、配列に格納した一文字ずつをインデックス順に取得して連結して行く。この連結は、読み込んだ文書の全文字数を取得し、その文字数の数分、一文字ずつ連結を繰り返すことにより行われる。したがって、途中、連結が中断されなければ入力した文書と同一のデータとなるが、連結分断属性を有する文字が存在すれば連結がその存在位置で中断されることとなる。
【００３６】
連結分断属性は、日本語の文書の場合、「ひらがな」であることが好ましい。これにより、漢字、数字、英字、カタカナ、ひらがな等の文字が混用される日本語文書において、単語（自立語を含む）の中の特にキーワードとなり得る文字列を生成する確率を高めることができる。この具体的なひらがなとしては、格助詞（「が」、「の」、「を」、「に」）、並立助詞（「と」、「や」）、副助詞（「ま（で）」）、係助詞（「は」、「も」）などの助詞等が挙げられる。なお、英文の場合には、「スペース（空白）」、「動詞」、「弱動詞」、「形容詞」、「副詞」、「接続詞」等を連結分断属性を有する文字、文字列とすることができる。
【００３７】
属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される（但し、一文字であってもよい）。連結の際、連結される一文字の属性が連結分断属性を有する文字（本実施の形態では上記した属性「２」の「ひらがな」とする）であったときには、連結を止めてそれまで連結した文字列がキーワードとして確定する前段階の一次文字列として一次文字列記憶手段４３に格納される。なお、本実施の形態では、「ひらがな」を連結分断属性を有する文字とするが、連結分断属性を有する文字はこれに限定されるものではない。
【００３８】
一次文字列記憶手段４３は、連結分断属性を有する文字で分断されることにより生成された最初の一次文字列を記憶する。この一次文字列には符号の付与対象とはなり得ない文字列や、同一の文字列も含まれることになる。これらの不要な文字列は後述の手順により順次排除されて行くことになる。
【００３９】
非生成語記憶手段５１は、連結により生成された文字列のうち、生成しない文字列、すなわち、非生成語をファイルメモリ１７に記憶している。非生成語記憶手段５１に格納される非生成語は、一文字であっても文字列であってもよい。この非生成語記憶手段５１には、符号が明らかに付されることのないものが格納される。非生成語としては例えば、「コスト」、「安価」、「向上」、「緻密」等が挙げられる。この非生成語は、ファイルメモリ１７に記憶される。すなわち、プログラムの終了によって消えるデータメモリ１５とは異なり、プログラムの終了によっても磁気データとして記憶される例えばハードディスク等に格納される。したがって、プログラムの実行の都度、読み込まれることになる。
【００４０】
二次文字列記憶手段４５は、一次文字列記憶手段４３から非生成語を排除した文字列を二次文字列として格納する。したがって、この二次文字列記憶手段４５に格納された文字列は、符号の付与対象となり得る候補となる。しかし、この二次文字列記憶手段４５には、まだ同一の文字列が重複して記憶されている。
【００４１】
重複文字排除手段３３は、二次文字列記憶手段４５に格納された重複する文字列を排除する。重複文字排除手段３３による重複する文字列の排除は、最初に記憶した文字列を残し、２回目以降に重複して記憶されている全ての同一文字列を消去する。
【００４２】
キーワード記憶手段４７は、二次文字列記憶手段４５から重複する文字列を排除した結果、残った文字列を新たに生成したインデックスの順番に記憶して行く。すなわち、記憶されるキーワード同士の間には、重複文字排除手段３３によって排除された空の文字列データのインデックスが付与されないようにする。本明細書中、この文字列を「キーワード」と称する。このキーワード記憶手段４７に記憶されるキーワードは、上記したこれまでの構成から明らかなように、入力された文書の記述順で格納されることになる。
【００４３】
符号生成手段３７は、キーワード記憶手段４７に格納されたキーワードに、インデックス順に数値符号を生成する。符号はその他の「ａ」、「ｂ」や、「イ」、「ロ」であってもよい。生成する数値符号は、開始値を任意とすることができる。例えば最初の数値符号は「１」、「１１」、「５０１」であってもよい。また、増加分も「１」、「２」、「１０」であってもよい。例えば開始符号を「１１」として増加分を２とすれば、符号は「１１，１３，１５…」と生成されて行く。
【００４４】
符号記憶手段４９は、符号生成手段３７にて生成した符号を、インデックス順で格納する。この場合のインデックスは、キーワード記憶手段４７のインデックスと同一となる。つまり、同一のインデックスを指定することでそのキーワードの数値符号が取り出し可能となる。ここで重要なことは、キーワード記憶手段４７には上述したように文書の記述順でキーワードが記憶されていることである。これにより、符号記憶手段４９にもキーワードの記述順に小さい数から順に数値符号が格納される。
【００４５】
符号挿入手段３９は、文書のデータからキーワードを検出し、検出したキーワードの後に、そのキーワードのインデックスに対応する同一インデックスの符号を符号記憶手段４９から読み取って挿入する。符号の挿入は、文書のデータに含まれる全ての同一のキーワードについて行われ、且つ格納されている異なる全てのキーワードの数分行われる。
【００４６】
次に、上記のように構成された第一プログラム１００の作用を説明する。
図２は本発明に係る符号付与プログラムの実行の手順を表したフローチャート、図３（ａ）は読み込み文字列の例、（ｂ）は分離される一文字、（ｃ）は文字種別属性、（ｄ）は配列内格納値を表した説明図、図４（ａ）は連結分断属性、（ｂ）は一次文字列、（ｃ）は二次文字列、（ｄ）はキーワードを表した説明図、図５（ａ）はキーワード別生成符号、（ｂ）は符号挿入のなされた文書の説明図である。なお、図２には第一プログラム１００に組み入れ可能な後述の第二プログラム２００〜第五プログラム５００を併記している。ここではこれら第二プログラム２００〜第五プログラム５００の手順の説明は省略する。また、同フローチャートにおいては特に主要な構成となる手順には英大文字Ａ〜Ｈの符号を付した。
【００４７】
第一プログラム１００は、以下の手順をコンピュータ１０に実行させる。先ず、表示器２３に設けた入力窓に文書の文字列を入力する。入力は、上記のように表示器２３に設けた入力窓に一文字ずつキー入力装置１９により入力されても、マウス２１によりコピーされた文字列を貼り付けして入力されてもよい。次に、手順Ｓ１にて入力した図３（ａ）に示す文字列を読み込む。
【００４８】
次に、手順Ａにおいて、入力した文書から一文字を図３（ｂ）に示すように、記述順に分離する。文書は先頭から一文字ずつが分離される。手順Ｓ２にて、分離された一文字は、文字属性記憶手段４１との比較により属性の一致が判定される。
【００４９】
手順Ｂにおいて、文字別属性と比較して一致する文字の属性を付与する。これにより、図３（ｃ）に示すように、分離された全ての一文字には属性が付与されることになる。
【００５０】
次に、手順Ｃにおいて、分離した一文字を分離した順に連結する。つまり、手順Ａにて一旦分離して属性を付与した一文字を今度は連結していく。ここでは例えば図３（ｄ）に示す２次元配列を用い、０行に一文字をインデックス順に格納し、１行に属性をインデックス順に格納する。したがって、ｎ番目の文字の属性は、１行目のインデックスｎ番目に格納される値を読み込めばよい。
【００５１】
ここで、連結される一文字は、その属性が図４（ａ）に示す分断文字であるか否かが手順Ｓ３にて判定される。そして、手順Ｄにおいて、属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を図４（ｂ）に示す一次文字列として記憶する。例えば「プラグケースには端子状の…」では、連結分断属性を有する文字であるひらがな「に」で分断され、「プラグケース」が一次文字列となる。同様に、「端子状」も「の」で分断され、二個目の一次文字列として一次文字列記憶手段４３に格納される。
【００５２】
次に、手順Ｓ４にて一次文字列記憶手段４３に格納される一次文字列が図４（ｂ）に下線で示した非生成語と一致するか否かが判定される。一致していたならその一次文字列は排除される。そして、手順Ｅにおいて、順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して図４（ｃ）に示す二次文字列として記憶する。例えば、「端子状」も、連結分断属性を有する文字であるひらがな「の」で分断され生成される。したがって、一次文字列記憶手段４３には「端子状」も格納される。この「端子状」は、予め非生成語記憶手段５１に格納させておいた非生成語に「端子状」が存在すれば、「端子状」が排除された二次文字列として「プラグケース」と、「金具」…とが二次文字列記憶手段４５に格納される。つまり、フィルタリングされることになる。この非生成語記憶手段５１に格納される非生成語は、一文字であっても文字列であってもよい。符号が明らかに付されることのないものが格納される。非生成語としては例えば、「コスト」、「安価」、「向上」、「緻密」等が挙げられる。
【００５３】
次に、Ｓ６にて図４（ｃ）に下線で示した重複文字列が排除される。そして、手順Ｆにおいて、二次文字列から重複する文字列が排除された後、残った文字列が図４（ｄ）に示すキーワードとして記憶されることとなる。重複文字排除手段３３は、二次文字列記憶手段４５に格納された重複する文字列を排除し、キーワード記憶手段４７に格納する。文書が図４（ａ）に示した「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」であった場合、一次文字列記憶手段４３には「プラグケース」、「端子状」、「金具」、「収容」「保持部」、「形成」「保持部」、「端子状」、「金具」、「装着」、「プラグ」、「構成」が格納される。二次文字列記憶手段４５には、非生成語である「端子状」、「収容」、「形成」、「装着」、「構成」が排除された「プラグケース」、「金具」、「保持部」、「保持部」、「金具」、「プラグ」が格納される。キーワード記憶手段４７には、重複する文字列である「金具」、「保持部」の重複記憶が排除された「プラグケース」、「金具」、「保持部」、「プラグ」が最終的に４つのキーワードとして格納されることとなる。
【００５４】
次に、手順Ｇにおいて、キーワードの記憶順にそれぞれのキーワードで異なる図５（ａ）に示す符号を対応させて生成し記憶する。この４つのキーワードに対応させて、記憶順から例えば数値符号である「１１」、「１３」、「１５」、「１７」を生成する。
【００５５】
次に、手順Ｓ７において、文書の中からキーワードを検出する。手順Ｈにおいて、文書からキーワードを検出したならキーワードの末尾の後にキーワードに対応して生成した符号を挿入する。
【００５６】
すなわち、元の文書である「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」からキーワード「プラグケース」、「金具」、「保持部」、「プラグ」を検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「１１」、「１３」、「１５」、「１７」を挿入する。これにより、図５（ｂ）に示す「プラグケース１１には端子状の金具１３を収容する保持部１５が形成され、保持部１５に端子状の金具１３を装着してプラグ１７が構成される…」とする符号入り文書が作成されることになる。
【００５７】
次に、本発明に係る符号付与プログラムの第二の実施の形態を説明する。
本実施の形態に係る符号付与プログラムは、第一プログラム１００の中に第二プログラム２００が組み込まれている。したがって、既に述べた第一プログラム１００の構成についての説明は省略する。
【００５８】
第二プログラム２００は、図１に示した符号削除手段５３、文字列書き換え手段５５、符号無し文書記憶手段５７をプログラムメモリ１３に備える。
符号削除手段５３は、語尾に符号の付されたキーワードから符号のみを削除する。符号付きのキーワードは、上記した第一の実施の形態による第一プログラム１００にて生成することができる。すなわち、数字や英字を上記の「ひらがな」と同様にして連結して行けばよい。
【００５９】
文字列書き換え手段５５は、文書の符号付きのキーワードを符号の削除されたキーワードに書き換える。文書の中から符号付きのキーワードを検出し、検出したなら、符号を削除した符号削除済みのキーワードに置き換える。これを、文書中の全てのキーワードについて実行することで、符号の削除された文書が得られる。
【００６０】
符号無し文書記憶手段５７は、上記の文字列書き換え手段５５によって得られた符号の削除された文書を記憶する。なお、元の文書のキーワードに符号が付されていない場合には、符号削除手段５３は何も削除しない。したがって、文字列書き換え手段５５も何も書き換えは行わず、元の文書と符号無し文書記憶手段５７に記憶された文書とは同一となる。
【００６１】
符号削除手段５３、文字列書き換え手段５５、及び符号無し文書記憶手段５７を備えた第二プログラム２００は、符号付きの一次文字列に含まれる符号属性に一致する文字のみを、一次文字列の末尾から一文字ずつ削除して符号の削除された一次文字列として記憶する手順Ｉと、文書の符号付きのキーワードを符号の削除されたキーワードに書き換える文字列書き換え手順Ｊと、をコンピュータ１０に実行させる。
【００６２】
この第二プログラム２００の組み込まれた第一プログラム１００では、手順Ｉが手順Ｆの後に実行され、手順Ｊが手順Ｉの後に実行される。したがって、第二プログラム２００を組み込んだ符号付与プログラムは、コンピュータ１０に、入力した文書から一文字を記述順に分離する手順Ａと、分離した一文字に予め記憶した文字属性記憶手段４１の文字別属性と比較して一致する文字の属性を付与する手順Ｂと、分離した一文字を分離した順に連結する手順Ｃと、属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Ｄと、順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Ｉと、文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Ｊと、符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Ｇと、符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの符号の削除されたキーワードを検出したならキーワードの末尾の後にキーワードに対応して新たに生成した符号を挿入する手順Ｈと、を実行させることになる。
【００６３】
次に、第一プログラム１００に第二プログラム２００が組み込まれた符号付与プログラムの作用を説明する。
この実施の形態に係る符号付与プログラムでは、上記した第一の実施の形態の構成により文書からキーワードを生成するに際し、符号付きのキーワードで生成する。符号付きのキーワードは第一の実施の形態の構成と同様の構成で生成できる。すなわち、文字属性記憶手段４１に記憶されている「プ」の属性「カタカナ」が付与されるのと同様に、「１」や「３」に属性「数字」を付与し、「カタカナ」と同様に「数字」も連結の対象属性とする。この他、「ａ」、「ｂ」の「英字」も連結の対象属性とすれば、例えば「１３ａ」等の英字を付した符号付きの文字列も生成されることとなる。
【００６４】
したがって、上記同様の手順により、図５（ｂ）に示した文書「プラグケース１１には端子状の金具１３を収容する保持部１５が形成され、保持部１５に端子状の金具１３を装着してプラグ１７が構成される…」が入力されれば、「プラグケース１１」、「金具１３」、「保持部１５」、「プラグ１７」が符号付きのキーワードとして生成される。その後、上記と同様に重複する文字列が排除され、最終的に、例えば「プラグケース１１」、「金具１３」、「保持部１５」、「プラグ１７」がキーワードとして記憶される。
【００６５】
次に、生成された符号付きのキーワードは、キーワードに含まれる符号属性に一致する文字（「数字」、「英字」）のみがこのキーワードの末尾から一文字ずつ順に削除されて符号の削除されたキーワードとして記憶される。つまり、手順Ｉによって符号削除キーワードへ書き換えが行われる。そして、手順Ｊによって、文書の符号付きのキーワードは、符号の削除されたキーワード、すなわち、「プラグケース」、「金具」、「保持部」、「プラグ」に書き換えられ、符号無し文書として記憶される。
【００６６】
これにより、元の符号付きの文書が、符号無しの文書となる。次に、符号の削除された文書である「プラグケースには端子状の金具を収容する保持部が形成され、保持部に端子状の金具を装着してプラグが構成される…」からキーワードを検出し、そのキーワードの末尾の後にキーワードに対応して生成した符号「１１」、「１３」が挿入されることで、「プラグケース１１には端子状の金具１３を…」とする符号入り文書が再び作成される。本構成で重要なことの一つに、符号付き文書から一旦符号が消されることにある。
【００６７】
図６（ａ）は符号が記述順でない文書の説明図、（ｂ）は符号が削除された文書の説明図、（ｃ）は新たな符号が記述順に付された文書の説明図である。
第二プログラム２００を組み込んだ符号付与プログラムは、元の符号入り文書の符号が昇順でなかった場合であっても、キーワードは記述順に昇順で符号が振り直されることになる。例えば、図５（ｂ）に示す符号入り文書「プラグケース１１には端子状の金具１３を収容する保持部１５が形成され、保持部１５に端子状の金具１３を装着してプラグ１７が構成される…」を、推考の結果、図６（ａ）に示す符号入り文書「プラグ１７は、プラグケース１１の保持部１５に端子状の金具１３を装着して構成される…」に変更した場合、符号が記述順とならなくなる。この場合、例えば更新ボタンなどの操作により、手順Ｓ８で符号付与プログラムを再実行させる。すると、文書は一旦、符号が削除されて図６（ｂ）に示す「プラグは、プラグケースの保持部に端子状の金具を装着して構成される…」となる。そして上記した手順Ｉ、手順Ｊ以降の手順Ｇにより各キーワードの記述順に、新たに生成された符号が挿入されることで、符号の再付与された文書は図６（ｃ）に示すように「プラグ１１は、プラグケース１３の保持部１５に端子状の金具１７を装着して構成される…」となる。これにより、符号一体キーワードが含まれる文書を幾度変更しても、更新ボタンをワンクリックするのみで、符号を文書の記述順に自動的に変更することが可能となる。
【００６８】
次に、第一プログラム１００に第三プログラム３００が組み込まれた本発明の第三の実施の形態に係る符号付与プログラムを説明する。
第三プログラム３００は、図１に示したキーワード表示手段５９、非生成語追加手段６１をプログラムメモリ１３に備える。
手順Ｆにてキーワードが記憶された後、キーワードの変更がキー入力装置１９又はマウス２１によって選択されると、手順Ｓ９でキーワード表示へと処理が移る。キーワード表示手段５９は、手順Ｆにて生成したキーワードを表示器２３に一覧表示させる。
【００６９】
非生成語追加手段６１は、非生成語記憶手段５１に新たな非生成語を記憶させる。非生成語記憶手段５１は、ファイルメモリ１７にデータを格納するので、プログラムの再起動によっても再び読み込まれ、他の文書においても格納内容が参照されることとなる。
【００７０】
第三プログラム３００は、手順Ｆの次にキーワードを表示器２３に表示する手順Ｋと、新たな非生成語を追加して記憶する手順Ｌと、をコンピータに実行させる。
【００７１】
第一プログラム１００に第三プログラム３００が組み込まれた符号付与プログラムでは、キーワードに符号の付与された文書が作成された結果、非生成語に含まれていない排除したいキーワードが生成されて符号が付与されてしまったとき、その排除したいキーワードを新たに非生成語に加えることができる。その結果、再び符号付与プログラムをコンピュータ１０に実行させると、そのキーワードが生成されなくなり、符号も付与されなくなる。このように第三プログラム３００が組み込まれた符号付与プログラムは、使用者の選択した非生成語が、その都度ファイルメモリに蓄積されて行くことで、使用者の使用分野に合わせた符号生成能力が備わって行くことになる。すなわち、使用分野に即応した学習が可能となっている。
【００７２】
次に、第一プログラム１００に第四プログラム４００が組み込まれた本発明の第四の実施の形態に係る符号付与プログラムを説明する。
第四プログラム４００は、図１に示した連結文字判定手段６３をプログラムメモリ１３に備える。
連結文字判定手段６３は、キーワードの末尾に連結される文字の属性を判定する。
【００７３】
第一プログラム１００に第四プログラム４００が組み込まれた符号付与プログラムは、コンピュータ１０に、手順Ｈを実行する前に、キーワードの末尾に連結される文字の属性を判定し、この属性が連結分断属性でないときには、符号を挿入しない手順Ｍ、を実行させる。
【００７４】
手順Ｈにおいて、文書からいずれかのキーワードを検出し、このキーワードの末尾の後に対応する符号を挿入する際に、キーワードに連結される文字の属性が判定され、その連結文字が連結分断属性でないときには、符号が挿入されない。例えば、文書が「施錠装置は、錠と鍵とからなる…」である場合、「施錠装置」、「錠」、「鍵」がキーワードとして生成され、それぞれのキーワードに対応して「１１」、「１３」、「１５」の符号が生成された場合、そのまま文書中のキーワードに符号が挿入されると、符号の挿入された文書は、「施錠１３装置１１は、錠１３と鍵１５とからなる…」となり、一旦「１１」の挿入された「施錠装置１１」に、「錠」の符号「１３」が再び挿入され、「施錠１３装置１１」となってしまう。逆に「錠」が先に出現する「錠は施錠装置と…」の文書では「錠１１は施錠１１装置と…」となり、「施錠装置」が判別できなくなり符号が挿入されなくなる。本構成では、「錠」の連結文字「装」が連結分断属性（「ひらがな」）でないときには、符号「１３」が挿入されないので、前段、後段の例のように「施錠１３装置１１」や「施錠１１装置」とはならず「施錠装置１１は、錠１３と鍵１５とからなる…」となる。
【００７５】
次に、第一プログラム１００に第五プログラム５００が組み込まれた本発明の第五の実施の形態に係る符号付与プログラムを説明する。
第五プログラム５００は、図１に示した強制生成語有無判定手段６５、属性変更記号挿入手段６７、強制生成語属性付与手段６９をプログラムメモリ１３に備え、強制生成語記憶手段７１をファイルメモリ１７に備える。
強制生成語有無判定手段６５は、文書の中に強制生成語が含まれているか否かを判断する。ここで、強制生成語とは、連結分断属性を有していても強制的に生成するキーワードを言う。
【００７６】
属性変更記号挿入手段６７は、文書の中の強制生成語の直前に属性変更開始記号、属性変更終了記号を挿入する。属性変更開始記号、属性変更終了記号は文書に含まれない記号、例えば「↓」や「↑」などとする。挿入は、強制生成語の位置を検出し、その文字列の一つ前と、末尾の後の位置を指定して行う。
【００７７】
強制生成語属性付与手段６９は、属性変更記号の後の文字に、強制生成語属性を付与する。属性変更開始記号を検出したなら、それ以降一文字ずつ付される属性は、特定の属性、例えば「５」とする。特定の属性の付与は、属性変更終了記号を検出したなら中止される。それ以降は通常の属性付与に戻る。
【００７８】
強制生成語記憶手段７１は、強制生成語を記憶する。この強制生成語は、ファイルメモリ１７に記憶される。すなわち、プログラムの終了によって消えるデータメモリ１５とは異なり、プログラムの終了によっても磁気データとして記憶される例えばハードディスクに格納される。したがって、プログラムの実行の都度、読み込まれることになる。
【００７９】
第一プログラム１００に第五プログラム５００が組み込まれた符号付与プログラムでは、コンピュータ１０に、予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Ｎと、文書に強制生成語と一致するキーワードが含まれていたならこのキーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Ｏと、手順Ｂの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した一文字ごとに強制生成語属性を付与する手順Ｐと、を実行させる。
【００８０】
入力した文書が「プラグケースには端子状の金具を…」であった場合、「端子状の金具」に符号を付すことが可能となる。上述の構成では、属性の付与された一文字はその属性が判断されながら一文字ずつ順番に連結される。この連結の際、連結される一文字の属性が連結分断属性を有する文字（例えば「ひらがな」）であったときには、連結を止めてそれまで連結した文字列が一次文字列として記憶される。
【００８１】
したがって、「の」によって「端子状の金具」は、「端子状」と「金具」とに分断されることになる。このように、「ひらがな」を連結分断属性文字とした場合、「ひらがな」を含むキーワードの生成ができなくなる。例えば「第１の突起」、「位置合わせ部」、「外れ止め部」、「筋交い」、「巻取りボビン」、「遊び部」等々である。本構成では「ひらがな」を含む文字列をキーワードとして生成したい場合、強制生成語として記憶させておく。
【００８２】
図７（ａ）は属性変更記号の挿入された文書の説明図、（ｂ）は強制生成語属性の配列内格納状況の説明図である。
強制生成語が文書に存在すると、キーワードの先頭に属性変更開始記号「↓」が挿入されるとともに末尾の後に属性変更終了記号「↑」が挿入される。例えば図７（ａ）に示すように、「プラグケースには↓端子状の金具↑を…」とする。次に、検出した文字に属性を付与する際、「↓」の検出で「強制生成語」の属性である例えば「５」等の整数が付与される。この属性の付与は、「↑」を検出したなら止める。これを属性の配列で見れば、「ひらがな」の属性を「３」、「強制生成語」の属性を「５」とすると、「には↓端子状の金具↑を」は図７（ｂ）に示すように、「３３５５５５５５３」となる。なお、「↑」「↓」はこの時点で排除してもよいし或いは記号属性「８」「９」等を付与しておいて後に排除してもよい。後に排除の場合は、上記属性配列は、「３３８５５５５５５９３」となる。これにより、「ひらがな」が含まれた文字列であっても属性「５」を連結の対象として判断させることで「端子状の金具」が「の」で分断されずに連結されてキーワードとして生成され、「の」入りキーワードの符号の付与が可能となる。なお、ひらがなの「の」は一例であり、この強制生成語は英字、例えば「ＬＥＤ」のキーワード生成及び符号付けも可能にする。
【００８３】
次に、上記した各実施の形態の第一変形例に係る符号付与プログラムを説明する。
上記した各実施の形態に係る符号付与プログラムは、さらに以下の構成を備えたものとすることができる。
すなわち、第一変形例に係る符号付与プログラムは、生成した符号付与対象のキーワードを表示させ、表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除する手順を備えることが好ましい。「本稿非生成語」とは、符号付与プログラムの動作中に作成の原稿（本稿）において生成されたキーワードのうち、本稿のみでその生成がキャンセルされる生成語（すなわち、キーワード）を言う。
【００８４】
生成されたキーワードのうち、特に今回作成している文書において、符号の付与の必要のないキーワードは、生成したキーワードから排除される。これにより、例えば図面に表れない部材に無用な符号が付されてしまうことが防止される。また、この本稿非生成語は、ファイルメモリ１７には記憶させず、データメモリ１５に記憶させることで、プログラムの終了後にはリセットされるので、非生成語とは異なり、次に符号付与プログラムを起動させたときにはキーワードが本構成により排除されることなく生成され、他の文書に影響を及ぼすことがない。
【００８５】
次に、上記した各実施の形態の第二変形例に係る符号付与プログラムを説明する。
第二変形例に係る符号付与プログラムは、生成した符号付与対象のキーワードのうち、含まれたならキーワードとして生成しない非生成含有語を含むときには、この非生成含有語を含むキーワードを符号付与対象のキーワードから排除する。
【００８６】
非生成含有語はファイルメモリ１７に記憶され、プログラムの起動によって自動的に読み込まれる。この変形例では、生成されたキーワードのうち、この非生成含有語を含んだキーワードは排除されることになる。例えば「μ」のような単位文字が含まれたキーワードは排除される。上述した非生成語のみにより対応した場合、「１０μ」、「２２μ」、「３１μ」等々、一致する全ての非生成語を記憶させておかなければならず多くのメモリが必要となって現実には不可能となる。このような場合に、「μ」を含むキーワードは全て排除することとすれば、少ないメモリで、不要なキーワードを排除して、より有効なキーワードを高精度に生成することが可能となる。
【００８７】
したがって、本実施の形態に係る符号付与プログラムによれば、符号付与の手間を省くことができる。
【符号の説明】
【００８８】
１０…コンピュータ
２７…１文字分離手段
２９…属性付与手段
３１…文字連結手段
３３…重複文字排除手段
３７…符号生成手段
３９…符号挿入手段
４１…文字属性記憶手段
４３…一次文字列記憶手段
４５…二次文字列記憶手段
４７…キーワード記憶手段
５１…非生成語記憶手段

【特許請求の範囲】
【請求項１】
コンピュータに、
入力した文書から一文字を記述順に分離する手順Ａと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Ｂと、
分離した一文字を分離した順に連結する手順Ｃと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を一次文字列として記憶する手順Ｄと、
順次記憶した一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、
キーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Ｇと、
前記文書からいずれかの前記キーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Ｈと、
を実行させるための符号付与プログラム。
【請求項２】
コンピュータに、
入力した文書から一文字を記述順に分離する手順Ａと、
分離した一文字に予め記憶した文字属性記憶手段の文字別属性と比較して一致する文字の属性を付与する手順Ｂと、
分離した一文字を分離した順に連結する手順Ｃと、
属性の一つである連結分断属性を検出した時に連結を止めてそれまで連結した文字列を符号付きの一次文字列として記憶する手順Ｄと、
順次記憶した符号の削除された一次文字列から予め記憶した非生成語と一致する一次文字列を排除して二次文字列として記憶する手順Ｅと、
二次文字列から重複する文字列を排除してキーワードとして記憶する手順Ｆと、
符号付きのキーワードに含まれる符号属性に一致する文字のみをキーワードの末尾から一文字ずつ削除して符号の削除されたキーワードに書き換える符号削除キーワード書き換え手順Ｉと、
文書の符号付きのキーワードを符号の削除されたキーワードに置き換えて記憶する符号無し文書記憶手順Ｊと、
符号の削除されたキーワードの記憶順にそれぞれのキーワードで異なる符号を対応させて生成し記憶する手順Ｇと、
符号付きのキーワードが符号の削除されたキーワードに書き換えられた文書からいずれかの前記符号の削除されたキーワードを検出したなら該キーワードの末尾の後に該キーワードに対応して生成した前記符号を挿入する手順Ｈと、
を実行させるための符号付与プログラム。
【請求項３】
請求項１又は請求項２記載の符号付与プログラムであって、
前記連結分断属性がひらがなであることを特徴とする符号付与プログラム。
【請求項４】
請求項１又は請求項２記載の符号付与プログラムであって、
コンピュータに、
前記手順Ｆの次に前記キーワードを表示器に表示する手順Ｋと、
新たな非生成語を追加して記憶する手順Ｌと、
を実行させるための符号付与プログラム。
【請求項５】
請求項１又は請求項２記載の符号付与プログラムであって、
コンピュータに、
手順Ｈを実行する前に、前記キーワードの末尾に連結される文字の属性を判定し、該属性が連結分断属性でないときには、前記符号を挿入しない手順Ｍ、
を実行させるための符号付与プログラム。
【請求項６】
請求項１又は請求項２記載の符号付与プログラムであって、
コンピュータに、
予め記憶させた強制生成語と一致するキーワードが文書に含まれるか否かを判断する手順Ｎと、
文書に強制生成語と一致するキーワードが含まれていたなら該キーワードの先頭に属性変更開始記号を挿入するとともに末尾の後に属性変更終了記号を挿入する手順Ｏと、
手順Ｂの属性を付与するに際し、属性変更開始記号から属性変更終了記号までの属性として分離した前記一文字ごとに強制生成語属性を付与する手順Ｐと、
を実行させるための符号付与プログラム。
【請求項７】
請求項１又は請求項２記載の符号付与プログラムであって、
生成した符号付与対象のキーワードを表示させ、
表示させたキーワードのうち選択された本稿非生成語を、符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。
【請求項８】
請求項１又は請求項２記載の符号付与プログラムであって、
生成した符号付与対象のキーワードのうち、含まれたならキーワードとして記憶しない非生成含有語を含むときは、該非生成含有語を含むキーワードを符号付与対象のキーワードから排除することを特徴とする符号付与プログラム。

【図１】