辞書登録装置、辞書更新方法およびプログラム

【課題】アクセント情報を付与する必要のある辞書に単語を登録する際のユーザの負担を軽減する。
【解決手段】辞書登録装置は、辞書に登録する単語群の入力を受け付ける入力部と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、辞書登録装置、辞書更新方法およびプログラムに関し、特に、収録語にアクセント情報が付与されている辞書登録装置、辞書更新方法およびプログラムに関する。
【背景技術】
【０００２】
テキスト音声合成を行うに際し、新語や専門用語の読みが正しく行われないことを補うために、ユーザが独自の追加辞書を定義できる機能（辞書登録機能）を備えるテキスト音声合成エンジンが多く存在する。
【０００３】
テキスト音声合成に用いる辞書の場合、ユーザが登録したい単語について、表記情報・読み情報・アクセント情報を登録する作業が行われる。テキスト音声合成エンジンは、このようにして登録された辞書中の読み・アクセントを用いてテキストの読み上げを行う。
【０００４】
特許文献１には、単語の言語情報と当該単語のアクセント位置の組みを格納した学習用データに基づいてアクセント位置を推定するアクセント位置推定規則を識別学習アルゴリズムによって学習する学習部を備えて、未登録語のアクセント位置を推定する機能を備えたアクセント位置推定装置が開示されている。
【０００５】
特許文献２には、単語の読みの長さによって異ならない規則を備えることにより、アクセント位置をより正確に推定できるというアクセント位置推定装置が開示されている。
【０００６】
特許文献３には、音声認識に用いる音声認識辞書に、文書ファイルに含まれる未知語を一括して登録できる未知語登録装置が開示されている。
【先行技術文献】
【特許文献】
【０００７】
【特許文献１】特開２００５−１２２０５４号公報
【特許文献２】特開２００４−３０９７５３号公報
【特許文献３】特開２００３−３１６３７６号公報
【非特許文献】
【０００８】
【非特許文献１】金田一春彦監修、秋永一枝編、「明解日本語アクセント辞典第二版」、三省堂、１９８１年、ｐ．１１−１５「１．アクセントについて」
【発明の概要】
【発明が解決しようとする課題】
【０００９】
以下の分析は、本発明によって与えられたものである。
【００１０】
登録しようとする単語にアクセント情報の付与を要する辞書への辞書登録作業は、例えば、テキスト音声合成を採用したシステムを構築する際に、一度に大量に作業が発生することがある。
【００１１】
上記した特許文献１、２のようにアクセント位置の推定等ができるようになっているものの、ユーザは、推定されたアクセント位置が正しいかどうかを確認した上で、登録操作を行う必要があり、大量の単語を登録する場合には大きな負担となっている。
【００１２】
この点、特許文献３は音声認識用の辞書ということもあり、一覧表示してユーザに確認する項目の中には、アクセント情報は含まれていない。また仮に、アクセント情報を一覧表示の対象に加えたとしても、アクセント情報の確認に要する負担を軽減することは困難である。
【００１３】
本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、上記したアクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することのできる辞書登録装置、辞書更新方法およびプログラムを提供することにある。
【課題を解決するための手段】
【００１４】
本発明の第１の視点によれば、辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置が提供される。
【００１５】
本発明の第２の視点によれば、辞書登録装置を構成するコンピュータが、辞書に登録する単語群の入力を受け付けるステップと、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法が提供される。本方法は、アクセント情報を付与する必要のある辞書への登録を受け付けるコンピュータという、特定の機械に結びつけられている。
【００１６】
本発明の第３の視点によれば、辞書登録装置を構成するコンピュータに、辞書に登録する単語群の入力を受け付ける処理と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラムが提供される。なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。即ち、本発明は、コンピュータプログラム製品として具現することも可能である。
【発明の効果】
【００１７】
本発明によれば、アクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することが可能となる。
【図面の簡単な説明】
【００１８】
【図１】本発明の概要を説明するための図である。
【図２】本発明の第１の実施形態の辞書登録装置の構成を示すブロック図である。
【図３】本発明の第１の実施形態の辞書登録装置に入力される単語群の例である。
【図４】本発明の第１の実施形態の辞書登録装置による分類結果の例である。
【図５】本発明の第１の実施形態の辞書登録装置が分類の際に適用する第１の規則（ルール）を説明するための図である。
【図６】本発明の第１の実施形態の辞書登録装置が分類の際に適用する第２の規則（ルール）を説明するための図である。
【図７】分類の際に適用する規則（ルール）の別の一例を説明するための図である。
【図８】本発明の第１の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図９】本発明の第１の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図１０】本発明の第２の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図１１】本発明の第３の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図１２】本発明の第３の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図１３】本発明の第４の実施形態の辞書登録装置の構成を示すブロック図である。
【図１４】本発明の第４の実施形態の辞書登録装置の参照語格納部に格納される参照語情報を説明するための図である。
【図１５】本発明の第４の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図１６】本発明の第４の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【発明を実施するための形態】
【００１９】
はじめに、本発明の概要について説明する。本発明は、図１に示すように、単語群の入力や辞書登録可否を受け付ける入力部１１と、入力された各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部１２と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部１３と、入力された複数の単語を分類表示する表示部１４とを備える情報処理装置にて実現できる。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではない。
【００２０】
ユーザは、前記表示部１４における、入力された複数の単語の分類表示の結果（図８参照）を参照して、各単語について辞書格納部２０に格納された辞書へ登録を行うか否かを判断する。なお、アクセント情報推定部におけるアクセント情報の推定方法としては、辞書格納部に格納された辞書を参照して特許文献１、２の方法を用いる方法や、非特許文献１の第２表にあるような規則を適用して推定する方法等を適宜採用することができる。また、図１の例では、辞書格納部が辞書登録装置と独立した構成となっているが、辞書登録装置が、辞書格納部を内蔵する構成も当然に採用可能である。
【００２１】
以上のように、入力された複数の単語が、アクセント情報という観点で分類されてカテゴリー毎にまとめて提示されるため、ユーザとしては、分類されたカテゴリー毎に、辞書登録をするか否かを判断することが可能となり、効率よく辞書登録操作を進めることができる。
【００２２】
［第１の実施形態］
続いて、本発明の第１の実施形態について図面を参照して詳細に説明する。図２は、本発明の第１の実施形態の辞書登録装置の構成を示すブロック図である。図２を参照すると、単語群入力部１１１と、アクセント情報を求めるアクセント情報推定部１２と、単語分類部１３と、表示部１４と、辞書登録可否入力部１１２とを備える辞書登録装置１０ａの構成が示されている。
【００２３】
単語群入力部１１１は、辞書格納部２０に格納された辞書への登録候補となる複数の単語からなる単語群を入力する装置である。例えば、単語の表記と読み情報の組を、テキストファイルや、カンマや空白等をデリミタとして用いたファイル等により入力する装置である。また、単語群入力部１１１は、辞書登録可否入力部１１２から指示された単語と読み情報の組を辞書格納部２０に格納された辞書に登録する動作を行う。
【００２４】
アクセント情報推定部１２は、単語群入力部１１１から入力された複数の単語群を入力とし、各単語の表記情報と読み情報から、アクセント情報を推定する。また、アクセント情報推定部１２は、辞書登録可否入力部１１２から指示された単語のアクセント情報を辞書格納部２０に格納された辞書に登録する動作を行う。
【００２５】
以下の説明では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとする。
【００２６】
アクセント位置の情報は、例えば、非特許文献１に示すように、アクセント位置、即ちアクセントの強弱や高低のない「平板型」、アクセント位置が先頭音素にある「頭高型」、「中高型」と分類することもできる。また、アクセントの下がる直前の音素の先頭から数えたモーラ数で、「０型」、「１型」、「２型」、「３型」．．．と分類しても良い。ここで、「０型」は、「平板型」と同じ、「１型」は「頭高型」と同じ、それ以外の「２型」「３型」．．．などは「中高型」に分類される。以下の説明では、両者を併用するものとする。
【００２７】
表記情報および読み情報からアクセント情報を推定する方法は、特許文献１、２に開示されている方法や、非特許文献１の第２表にあるような規則を適用して推定する方法等を適宜採用することができる。
【００２８】
単語分類部１３は、前記アクセント情報推定部１２にて推定されたアクセント情報と、各単語の表記および読みから一意に得られる情報と、を用いて、予め定められたルールに従って、入力された単語を分類する。
【００２９】
本実施形態では、上記単語の表記および読みから一意に得られる情報として、読みのモーラ数を用いるものとする。その他、前記単語の表記および読みから一意に得られる情報としては、読みのモーラ数、読みの音節数、読み中の長音の存在有無および位置、読み中の促音の存在有無および位置、読み中の撥音の存在有無および位置、読み中の単独母音の存在有無および位置、表記の文字種類の並びおよびそれらの組み合わせを用いることができる。
【００３０】
例えば、図３に示す表記と読みが与えられた単語群が入力されている場合、本実施形態の単語分類部１３は、前記アクセント情報推定部１２にて推定されたアクセント情報（アクセント型）と、モーラ数とを用いて、図４に示すように入力された単語群を分類する。
【００３１】
ここで、本実施形態の単語分類部１３が、表示部１４に前記分類結果を渡す際に適用する分類表示上のルールについて説明する。
【００３２】
第１のルールは、図５の破線内に示すように、０型アクセント句はモーラ数に依らず、全て同じ分類「平板型」として分類表示するというものである。これは、平板型の場合、ユーザはアクセントの位置を知覚しないため、モーラ数による分類があまり意味を持たないという知見に基づき、一つの分類にまとめて（集約して）分かりやすくすることを目的としている。なお、図５の例では、「仏説」、「波羅蜜多」の単語は４モーラとなっているが、例えば、入力された単語群に１〜３モーラで「平板型」のアクセント情報を持つ単語がある場合、これらも「平板型」としてまとめて表示されることになる。
【００３３】
第２のルールは、図６の破線内に示すように、１型アクセント句は、モーラ数に依らず全て同じ分類「頭高型」として分類表示するというものである。これは、頭高型ではユーザは語の先頭がアクセントの位置であると知覚するため、それ以降のモーラ数があまり意味を持たないという知見に基づき、一つの分類にまとめて（集約して）分かりやすくすることを目的としている。
【００３４】
第３のルールは、上記第１、第２のルールに当てはまらない単語について、それぞれ個別にアクセント情報とモーラ数による分類表示するというものである。例えば、図３の「心経」は、上記第１、第２のルールのいずれにも当てはまらないので、「４モーラ３型」として分類表示される。
【００３５】
なお、本実施形態では、説明の簡単のため用いていないが、例えば、図７のように、モーラ数より１少ないアクセント型の番号を持つものを、分類「Ｎ−１型」としてまとめても良い。同様に「Ｎ−２型」、「Ｎ−３型」なども考えることができる。
【００３６】
なお、上記のような分類を増やすと、図６、図７における「摩訶」のように、複数の分類に属するものが発生するので、併せて分類の優先度を定めることもできる。
【００３７】
表示部１４は、図８に示すように、入力された単語群を、前記単語分類部１３によって分類された分類毎に表示する。
【００３８】
辞書登録可否入力部１１２は、マウスやキーボード等の入力装置によって構成され、ユーザから辞書に登録する単語の指定を受け付け、単語群入力部１１１およびアクセント推定部１２に辞書への登録動作を行わせる。
【００３９】
図８の例では、各単語についてチェックボックスが設けられており、辞書登録可否入力部１１２を用いて、登録したい単語にチェックを付け、「登録」ボタンを起動することで、チェックされた単語の辞書への登録が完了するようになっている。
【００４０】
なお、図８には図示されていないが、チェックが付けられなかった単語については、単に登録しないのではなく、例えば、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【００４１】
なお、図２に示した辞書登録装置１０ａの各部（処理手段）は、辞書登録装置１０ａを構成するコンピュータに、そのハードウェアを用いて、上記した各処理を実行させるコンピュータプログラムにより実現することもできる。
【００４２】
続いて、本実施形態の動作について図９を参照して詳細に説明する。図９を参照すると、まず、単語群が入力されると、アクセント情報推定部１２が、入力された各単語について、アクセント情報を推定し、付与する（ステップＳ００１）。例えば、図３の単語群が入力されている場合、仏説、摩訶、般若、波羅蜜多、心経について、それぞれ、０型、１型、１型、０型、３型というアクセント情報が付与される。
【００４３】
次に、単語分類部１３が、前記アクセント情報と、モーラ数を用いて、図４に示すような一次分類を行った後、上述した第１〜第３のルールを適用して、まとめたものを表示部１４に出力する（ステップＳ００２）。この段階で、図５にて説明したように、仏説、波羅蜜多は平板型にまとめられる。また、摩訶、般若は、図６にて説明したように頭高型に分類される。そして、心経は、上記いずれのグループにも該当しないので、４モーラ３型として分類される。
【００４４】
次に、表示部１４が、単語分類部１３による単語の分類表示の結果を表示する（ステップＳ００３；図８参照）。
【００４５】
ユーザが、辞書登録可否入力部１１２から辞書登録要否を入力すると（ステップＳ００４）、その内容に応じて、辞書への登録が行われる（ステップＳ００６、Ｓ００７）。
【００４６】
以上のように、本実施形態によれば、アクセントの位置やモーラ数という観点で分類し、さらに、上記した第１、第２のルールを適用して、まとめて提示された内容を見て、辞書への登録を行なうことが可能になる。このため、大量の単語を効率よく、かつ、容易に登録する際の負担が著しく軽減される。
【００４７】
なお、上記した実施形態では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとして説明したが、単語が複数のアクセント句から構成されることを許容する場合は、各アクセント句の境界の情報と、各アクセント句のそれぞれのアクセント位置の情報をアクセント情報とすることもできる。この場合も同様の構成にて実現可能であり、単語がアクセント句から構成されることを許容する場合にも、容易に適用可能であることは明らかである。
【００４８】
［第２の実施形態］
続いて、表示部１４における表示態様に変更を加えた本発明の第２の実施形態について説明する。上記した第１の実施形態では、単語を「頭高型」、「平板型」、「それ以外の型」に分けて分類表示したが、本実施形態では、各分類をモーラ数で細分化して階層表示できるようにしている。本実施形態は、上記した第１の実施形態と同様の構成にて実現可能であり、その動作も同様であるので、以下、その表示上の相違について詳細に説明する。
【００４９】
図１０は、本発明の第２の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。図１０を参照すると、「頭高型」に分類される「摩訶」、「般若」について、それぞれのモーラ数により、「２モーラ１型」と「３モーラ１型」の細かい分類も含めて表示されている。
【００５０】
同様に、「平板型」に分類される単語は、「仏説」、「波羅蜜多」の２つがあるが、それぞれのモーラ数は同じ４モーラなので、「４モーラ０型」として一緒に表示されている。
【００５１】
以上のような階層表示を行う本実施形態によれば、同じ分類（大分類）に分類される単語が多い場合も、その中の関係をより適切に把握することが可能となる。
【００５２】
また、図１０の例では、それぞれの単語についてチェックボックスを設けずに、「登録」ボタンを起動することで、分類表示されたすべての単語の一括登録ができるようになっている。このような態様によれば、ユーザは、分類確認結果全体が合っていれば、「登録」ボタンを起動すれば済むので、ユーザの操作負担が軽減される。また、上記した第１の実施形態で説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報に修正、画面を更新できるようにしてもよい。
【００５３】
［第３の実施形態］
続いて、複数のアクセント情報を推定し、ユーザに提示できるようにした本発明の第３の実施形態について説明する。本実施形態は、上記した第１の実施形態と同様の構成にて実現可能であるので、以下、その相違点を中心に説明する。
【００５４】
図１１は、本発明の第３の実施形態の辞書登録装置の動作を説明するための流れ図である。第１の実施形態の動作を表した図９の流れ図と相違している点は、図１１のステップＳ００１ａのアクセント情報推定処理において、アクセント情報推定部１２が各単語について、優先順位付きの複数のアクセント情報を求める点、続くステップＳ００２ａの分類処理で、当該優先順位に従って、ステップＳ００４でチェックがなされなかった単語の分類を行う点、ステップＳ００８、Ｓ００９で辞書登録可否を受け付ける際にチェックされた単語については辞書への登録を行ない、未チェックの単語が残っている場合には再度分類を行う点で相違している。
【００５５】
図１２は、本発明の第３の実施形態のステップＳ００４で辞書登録装置の表示部に表示される内容を説明するための図である。図１２の例では、ユーザは、各単語について設けられたチェックボックスにチェックを行ない、「次へ」ボタンを起動することで、チェックした単語の辞書への登録を行うことができる。
【００５６】
「次へ」ボタンが起動されると、本実施形態に係る辞書登録装置は、チェックされた単語を辞書に登録するとともに、チェックがなされなかった単語について、アクセント情報推定部１２で推定された当該単語の次順位のアクセント情報による再分類を行う（ステップＳ００２ａ）。
【００５７】
このように、チェックがなされなかった単語に対して、正しいアクセント情報が得られるまで、新しいアクセント情報による分類表示が繰り返される。
【００５８】
以上のようなアクセント情報を複数提示する本実施形態によれば、効率的に分類の誤りを見つけつつ、最終的に正しい分類により、辞書登録を行うことが可能となる。
【００５９】
なお、上記した説明では、ステップＳ００４で「次へ」ボタンを起動された時点で、チェックされた単語を辞書に登録するものとして説明したが、チェックされた単語を直ちに辞書に登録せずに、すべての単語のアクセント情報の確認が終わった後でまとめて辞書に登録することも可能である。
【００６０】
また、このようにまとめて、あるいは、ユーザに登録順序の変更を許容することで、単語群の辞書登録順序が、音声合成の解析結果に影響を及ぼす場合でも、意図通りの登録順序で登録することが可能となる。
【００６１】
また、本実施形態では、図１１のステップＳ００２ａに戻ることによりアクセント情報の再推定を自動で行っているが、先の第１、第２の実施形態でも説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【００６２】
［第４の実施形態］
続いて、上記した各実施形態に、分類の典型例となる参照語の表示機能を追加した本発明の第４の実施形態について図面を参照して詳細に説明する。本実施形態は、上記した第１の実施形態に変更を加えた構成にて実現可能であるので、以下、その相違点を中心に説明する。
【００６３】
図１３は、本発明の第４の実施形態の辞書登録装置の構成を示すブロック図である。図１３を参照すると、図２に示した第１の実施形態の辞書登録装置の構成に参照語抽出部１５と、参照語格納部１６とを追加した構成となっている。
【００６４】
図１４は、参照語格納部１６に格納される分類済みの参照語群の例である。図１４の例では、例えば、平板型の参照語として「こんにちは」、頭高型の参照語として「嵐」、それ以外の参照語として「三蔵」などがそれぞれのアクセント情報と対応付けて格納されている。
【００６５】
参照語抽出部１５は、上記した参照語格納部１６から、単語分類部１３により分類された単語の分類結果に従って、各分類の典型例となる参照語群を抽出し、表示部１４に送信する。
【００６６】
なお、図１４の例では、同一のアクセント情報に対し、複数の参照語が格納されているが、これらのすべてを表示しても良いし、予め定められた個数の参照語を適宜選択（収録順やランダム）して表示するようにしてもよい。またより好ましくは、参照語抽出部１５が、参照語の中から、アクセント情報の確認を求める単語に類似性の高い参照語を抽出させるようにしてもよい。前記類似性の高い参照語を選択する基準としては、使用されている文字に一致するものがある、読みの中の促音・長音の位置が等しいものがある、モーラ数が等しい・近い、などの基準を用いることができる。
【００６７】
図１５は、本発明の第４の実施形態の辞書登録装置の動作を説明するための流れ図である。図９に示した第１の実施形態の動作との相違点は、ステップＳ００２の分類処理の後、上述した参照語抽出処理Ｓ０１１が追加され、分類結果の表示において、参照語付きの分類結果が表示される点である（ステップＳ００３ａ）。
【００６８】
図１６は、本発明の第４の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。本実施形態によれば、図１６に示すように、各分類の意味を理解していなくても、併記された参照語との対照によって、分類が正しいかどうかを判断することが可能になる。
【００６９】
以上のように本実施形態によれば、上記した各実施形態の効果に加えて、利用者がアクセント情報を確認する際の容易性を向上させることができる。
【００７０】
なお、上記した実施形態では、分類済みの参照語を格納する参照語格納部１６を用意するものとして説明したが、ユーザが本実施形態の辞書登録装置を用いて登録した単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。このような構成によれば、ユーザが既に登録作業を行った分の経験を生かして、より作業を円滑に行うことが可能となる。
【００７１】
また、その他、初期設定時に辞書に登録済みの単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。例えば、ユーザが、どちらのアクセント情報を付与すべきか判断に迷った場合に、該当参照語を図示省略するテキスト音声合成装置で発声させることで、同じ読み・アクセントであるか否かを確認することができ、理解を深めることができる。
【００７２】
また、上記した実施形態では、参照語にも、単語分類部１３が持つルールを同様に適用したアクセント情報が予め付与されているものとして説明したが、未分類の参照語群から、単語分類部１３と同じ手法を用いてリアルタイムに分類を行い、分類済参照語群と同じ情報を生成しても構わない。このような構成とすれば、単語分類部１３が持つルールが変更される場合にも容易に追従し、参照語を正しい位置に表示させることが可能になる。
【００７３】
以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、上記した各実施形態に示した、辞書登録装置の構成は、本発明の理解を助けるために簡略化したものであり、種々の態様を取りうることはもちろんである。
【００７４】
また、上記した各実施形態では、辞書登録装置単体の構成であるものとして説明したが、テキスト音声合成装置に、本発明の辞書登録装置の構成を付加し、テキスト音声合成装置の一機能として本発明を実現することも可能である。
【００７５】
また、上記した各実施形態では、テキスト音声合成用の辞書への登録を想定して説明したが、新語を登録する際にアクセント情報を付与できるその他の辞書にも適用することが可能である。
【符号の説明】
【００７６】
１０、１０ａ、１０ｂ辞書登録装置
１１入力部
１２アクセント情報推定部
１３単語分類部
１４表示部
１５参照語抽出部
１６参照語格納部
１１１単語群入力部
１１２辞書登録可否入力部
２０辞書格納部

【特許請求の範囲】
【請求項１】
辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、
前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置。
【請求項２】
前記入力部において、単語の表記と読みの情報の入力を受け付け、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける請求項１の辞書登録装置。
【請求項３】
前記単語分類部は、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類よりも大きな括りで、前記入力された複数の単語を分類し、
前記大きな括りによる分類表示と、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類表示との階層表示を行う請求項１または２の辞書登録装置。
【請求項４】
前記単語分類部は、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて分類された単語のうち、アクセント型が所定の型である単語をまとめて分類表示する請求項２または３の辞書登録装置。
【請求項５】
前記まとめて分類表示するアクセント型は、アクセント位置のないアクセント型およびアクセントが先頭にあるアクセント型である請求項４の辞書登録装置。
【請求項６】
前記各分類の典型例となる参照語を格納した参照語格納部を備え、
前記入力された複数の単語を分類表示する際に、前記各分類毎に、前記参照語も表示する請求項１から５いずれか一の辞書登録装置。
【請求項７】
前記アクセント情報推定部は、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報の候補を複数求め、
入力された複数の単語のうち、辞書登録操作が行われなかった単語について、別のアクセント情報による分類表示を行ない、再度辞書登録操作を受け付ける請求項１から６いずれか一の辞書登録装置。
【請求項８】
辞書登録装置を構成するコンピュータが、
辞書に登録する単語群の入力を受け付けるステップと、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法。
【請求項９】
辞書登録装置を構成するコンピュータに、
辞書に登録する単語群の入力を受け付ける処理と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラム。

【図１】