辞書登録装置、辞書更新方法およびプログラム
【課題】アクセント情報を付与する必要のある辞書に単語を登録する際のユーザの負担を軽減する。
【解決手段】辞書登録装置は、辞書に登録する単語群の入力を受け付ける入力部と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける。
【解決手段】辞書登録装置は、辞書に登録する単語群の入力を受け付ける入力部と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、辞書登録装置、辞書更新方法およびプログラムに関し、特に、収録語にアクセント情報が付与されている辞書登録装置、辞書更新方法およびプログラムに関する。
【背景技術】
【0002】
テキスト音声合成を行うに際し、新語や専門用語の読みが正しく行われないことを補うために、ユーザが独自の追加辞書を定義できる機能(辞書登録機能)を備えるテキスト音声合成エンジンが多く存在する。
【0003】
テキスト音声合成に用いる辞書の場合、ユーザが登録したい単語について、表記情報・読み情報・アクセント情報を登録する作業が行われる。テキスト音声合成エンジンは、このようにして登録された辞書中の読み・アクセントを用いてテキストの読み上げを行う。
【0004】
特許文献1には、単語の言語情報と当該単語のアクセント位置の組みを格納した学習用データに基づいてアクセント位置を推定するアクセント位置推定規則を識別学習アルゴリズムによって学習する学習部を備えて、未登録語のアクセント位置を推定する機能を備えたアクセント位置推定装置が開示されている。
【0005】
特許文献2には、単語の読みの長さによって異ならない規則を備えることにより、アクセント位置をより正確に推定できるというアクセント位置推定装置が開示されている。
【0006】
特許文献3には、音声認識に用いる音声認識辞書に、文書ファイルに含まれる未知語を一括して登録できる未知語登録装置が開示されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2005−122054号公報
【特許文献2】特開2004−309753号公報
【特許文献3】特開2003−316376号公報
【非特許文献】
【0008】
【非特許文献1】金田一春彦監修、秋永一枝編、「明解日本語アクセント辞典 第二版」、三省堂、1981年、p.11−15「1.アクセントについて」
【発明の概要】
【発明が解決しようとする課題】
【0009】
以下の分析は、本発明によって与えられたものである。
【0010】
登録しようとする単語にアクセント情報の付与を要する辞書への辞書登録作業は、例えば、テキスト音声合成を採用したシステムを構築する際に、一度に大量に作業が発生することがある。
【0011】
上記した特許文献1、2のようにアクセント位置の推定等ができるようになっているものの、ユーザは、推定されたアクセント位置が正しいかどうかを確認した上で、登録操作を行う必要があり、大量の単語を登録する場合には大きな負担となっている。
【0012】
この点、特許文献3は音声認識用の辞書ということもあり、一覧表示してユーザに確認する項目の中には、アクセント情報は含まれていない。また仮に、アクセント情報を一覧表示の対象に加えたとしても、アクセント情報の確認に要する負担を軽減することは困難である。
【0013】
本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、上記したアクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することのできる辞書登録装置、辞書更新方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0014】
本発明の第1の視点によれば、辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置が提供される。
【0015】
本発明の第2の視点によれば、辞書登録装置を構成するコンピュータが、辞書に登録する単語群の入力を受け付けるステップと、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法が提供される。本方法は、アクセント情報を付与する必要のある辞書への登録を受け付けるコンピュータという、特定の機械に結びつけられている。
【0016】
本発明の第3の視点によれば、辞書登録装置を構成するコンピュータに、辞書に登録する単語群の入力を受け付ける処理と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラムが提供される。なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。即ち、本発明は、コンピュータプログラム製品として具現することも可能である。
【発明の効果】
【0017】
本発明によれば、アクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本発明の概要を説明するための図である。
【図2】本発明の第1の実施形態の辞書登録装置の構成を示すブロック図である。
【図3】本発明の第1の実施形態の辞書登録装置に入力される単語群の例である。
【図4】本発明の第1の実施形態の辞書登録装置による分類結果の例である。
【図5】本発明の第1の実施形態の辞書登録装置が分類の際に適用する第1の規則(ルール)を説明するための図である。
【図6】本発明の第1の実施形態の辞書登録装置が分類の際に適用する第2の規則(ルール)を説明するための図である。
【図7】分類の際に適用する規則(ルール)の別の一例を説明するための図である。
【図8】本発明の第1の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図9】本発明の第1の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図10】本発明の第2の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図11】本発明の第3の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図12】本発明の第3の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図13】本発明の第4の実施形態の辞書登録装置の構成を示すブロック図である。
【図14】本発明の第4の実施形態の辞書登録装置の参照語格納部に格納される参照語情報を説明するための図である。
【図15】本発明の第4の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図16】本発明の第4の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【発明を実施するための形態】
【0019】
はじめに、本発明の概要について説明する。本発明は、図1に示すように、単語群の入力や辞書登録可否を受け付ける入力部11と、入力された各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部12と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部13と、入力された複数の単語を分類表示する表示部14とを備える情報処理装置にて実現できる。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではない。
【0020】
ユーザは、前記表示部14における、入力された複数の単語の分類表示の結果(図8参照)を参照して、各単語について辞書格納部20に格納された辞書へ登録を行うか否かを判断する。なお、アクセント情報推定部におけるアクセント情報の推定方法としては、辞書格納部に格納された辞書を参照して特許文献1、2の方法を用いる方法や、非特許文献1の第2表にあるような規則を適用して推定する方法等を適宜採用することができる。また、図1の例では、辞書格納部が辞書登録装置と独立した構成となっているが、辞書登録装置が、辞書格納部を内蔵する構成も当然に採用可能である。
【0021】
以上のように、入力された複数の単語が、アクセント情報という観点で分類されてカテゴリー毎にまとめて提示されるため、ユーザとしては、分類されたカテゴリー毎に、辞書登録をするか否かを判断することが可能となり、効率よく辞書登録操作を進めることができる。
【0022】
[第1の実施形態]
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図2は、本発明の第1の実施形態の辞書登録装置の構成を示すブロック図である。図2を参照すると、単語群入力部111と、アクセント情報を求めるアクセント情報推定部12と、単語分類部13と、表示部14と、辞書登録可否入力部112とを備える辞書登録装置10aの構成が示されている。
【0023】
単語群入力部111は、辞書格納部20に格納された辞書への登録候補となる複数の単語からなる単語群を入力する装置である。例えば、単語の表記と読み情報の組を、テキストファイルや、カンマや空白等をデリミタとして用いたファイル等により入力する装置である。また、単語群入力部111は、辞書登録可否入力部112から指示された単語と読み情報の組を辞書格納部20に格納された辞書に登録する動作を行う。
【0024】
アクセント情報推定部12は、単語群入力部111から入力された複数の単語群を入力とし、各単語の表記情報と読み情報から、アクセント情報を推定する。また、アクセント情報推定部12は、辞書登録可否入力部112から指示された単語のアクセント情報を辞書格納部20に格納された辞書に登録する動作を行う。
【0025】
以下の説明では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとする。
【0026】
アクセント位置の情報は、例えば、非特許文献1に示すように、アクセント位置、即ちアクセントの強弱や高低のない「平板型」、アクセント位置が先頭音素にある「頭高型」、「中高型」と分類することもできる。また、アクセントの下がる直前の音素の先頭から数えたモーラ数で、「0型」、「1型」、「2型」、「3型」...と分類しても良い。ここで、「0型」は、「平板型」と同じ、「1型」は「頭高型」と同じ、それ以外の「2型」「3型」...などは「中高型」に分類される。以下の説明では、両者を併用するものとする。
【0027】
表記情報および読み情報からアクセント情報を推定する方法は、特許文献1、2に開示されている方法や、非特許文献1の第2表にあるような規則を適用して推定する方法等を適宜採用することができる。
【0028】
単語分類部13は、前記アクセント情報推定部12にて推定されたアクセント情報と、各単語の表記および読みから一意に得られる情報と、を用いて、予め定められたルールに従って、入力された単語を分類する。
【0029】
本実施形態では、上記単語の表記および読みから一意に得られる情報として、読みのモーラ数を用いるものとする。その他、前記単語の表記および読みから一意に得られる情報としては、読みのモーラ数、読みの音節数、読み中の長音の存在有無および位置、読み中の促音の存在有無および位置、読み中の撥音の存在有無および位置、読み中の単独母音の存在有無および位置、表記の文字種類の並びおよびそれらの組み合わせを用いることができる。
【0030】
例えば、図3に示す表記と読みが与えられた単語群が入力されている場合、本実施形態の単語分類部13は、前記アクセント情報推定部12にて推定されたアクセント情報(アクセント型)と、モーラ数とを用いて、図4に示すように入力された単語群を分類する。
【0031】
ここで、本実施形態の単語分類部13が、表示部14に前記分類結果を渡す際に適用する分類表示上のルールについて説明する。
【0032】
第1のルールは、図5の破線内に示すように、0型アクセント句はモーラ数に依らず、全て同じ分類「平板型」として分類表示するというものである。これは、平板型の場合、ユーザはアクセントの位置を知覚しないため、モーラ数による分類があまり意味を持たないという知見に基づき、一つの分類にまとめて(集約して)分かりやすくすることを目的としている。なお、図5の例では、「仏説」、「波羅蜜多」の単語は4モーラとなっているが、例えば、入力された単語群に1〜3モーラで「平板型」のアクセント情報を持つ単語がある場合、これらも「平板型」としてまとめて表示されることになる。
【0033】
第2のルールは、図6の破線内に示すように、1型アクセント句は、モーラ数に依らず全て同じ分類「頭高型」として分類表示するというものである。これは、頭高型ではユーザは語の先頭がアクセントの位置であると知覚するため、それ以降のモーラ数があまり意味を持たないという知見に基づき、一つの分類にまとめて(集約して)分かりやすくすることを目的としている。
【0034】
第3のルールは、上記第1、第2のルールに当てはまらない単語について、それぞれ個別にアクセント情報とモーラ数による分類表示するというものである。例えば、図3の「心経」は、上記第1、第2のルールのいずれにも当てはまらないので、「4モーラ3型」として分類表示される。
【0035】
なお、本実施形態では、説明の簡単のため用いていないが、例えば、図7のように、モーラ数より1少ないアクセント型の番号を持つものを、分類「N−1型」としてまとめても良い。同様に「N−2型」、「N−3型」なども考えることができる。
【0036】
なお、上記のような分類を増やすと、図6、図7における「摩訶」のように、複数の分類に属するものが発生するので、併せて分類の優先度を定めることもできる。
【0037】
表示部14は、図8に示すように、入力された単語群を、前記単語分類部13によって分類された分類毎に表示する。
【0038】
辞書登録可否入力部112は、マウスやキーボード等の入力装置によって構成され、ユーザから辞書に登録する単語の指定を受け付け、単語群入力部111およびアクセント推定部12に辞書への登録動作を行わせる。
【0039】
図8の例では、各単語についてチェックボックスが設けられており、辞書登録可否入力部112を用いて、登録したい単語にチェックを付け、「登録」ボタンを起動することで、チェックされた単語の辞書への登録が完了するようになっている。
【0040】
なお、図8には図示されていないが、チェックが付けられなかった単語については、単に登録しないのではなく、例えば、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【0041】
なお、図2に示した辞書登録装置10aの各部(処理手段)は、辞書登録装置10aを構成するコンピュータに、そのハードウェアを用いて、上記した各処理を実行させるコンピュータプログラムにより実現することもできる。
【0042】
続いて、本実施形態の動作について図9を参照して詳細に説明する。図9を参照すると、まず、単語群が入力されると、アクセント情報推定部12が、入力された各単語について、アクセント情報を推定し、付与する(ステップS001)。例えば、図3の単語群が入力されている場合、仏説、摩訶、般若、波羅蜜多、心経について、それぞれ、0型、1型、1型、0型、3型というアクセント情報が付与される。
【0043】
次に、単語分類部13が、前記アクセント情報と、モーラ数を用いて、図4に示すような一次分類を行った後、上述した第1〜第3のルールを適用して、まとめたものを表示部14に出力する(ステップS002)。この段階で、図5にて説明したように、仏説、波羅蜜多は平板型にまとめられる。また、摩訶、般若は、図6にて説明したように頭高型に分類される。そして、心経は、上記いずれのグループにも該当しないので、4モーラ3型として分類される。
【0044】
次に、表示部14が、単語分類部13による単語の分類表示の結果を表示する(ステップS003;図8参照)。
【0045】
ユーザが、辞書登録可否入力部112から辞書登録要否を入力すると(ステップS004)、その内容に応じて、辞書への登録が行われる(ステップS006、S007)。
【0046】
以上のように、本実施形態によれば、アクセントの位置やモーラ数という観点で分類し、さらに、上記した第1、第2のルールを適用して、まとめて提示された内容を見て、辞書への登録を行なうことが可能になる。このため、大量の単語を効率よく、かつ、容易に登録する際の負担が著しく軽減される。
【0047】
なお、上記した実施形態では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとして説明したが、単語が複数のアクセント句から構成されることを許容する場合は、各アクセント句の境界の情報と、各アクセント句のそれぞれのアクセント位置の情報をアクセント情報とすることもできる。この場合も同様の構成にて実現可能であり、単語がアクセント句から構成されることを許容する場合にも、容易に適用可能であることは明らかである。
【0048】
[第2の実施形態]
続いて、表示部14における表示態様に変更を加えた本発明の第2の実施形態について説明する。上記した第1の実施形態では、単語を「頭高型」、「平板型」、「それ以外の型」に分けて分類表示したが、本実施形態では、各分類をモーラ数で細分化して階層表示できるようにしている。本実施形態は、上記した第1の実施形態と同様の構成にて実現可能であり、その動作も同様であるので、以下、その表示上の相違について詳細に説明する。
【0049】
図10は、本発明の第2の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。図10を参照すると、「頭高型」に分類される「摩訶」、「般若」について、それぞれのモーラ数により、「2モーラ1型」と「3モーラ1型」の細かい分類も含めて表示されている。
【0050】
同様に、「平板型」に分類される単語は、「仏説」、「波羅蜜多」の2つがあるが、それぞれのモーラ数は同じ4モーラなので、「4モーラ0型」として一緒に表示されている。
【0051】
以上のような階層表示を行う本実施形態によれば、同じ分類(大分類)に分類される単語が多い場合も、その中の関係をより適切に把握することが可能となる。
【0052】
また、図10の例では、それぞれの単語についてチェックボックスを設けずに、「登録」ボタンを起動することで、分類表示されたすべての単語の一括登録ができるようになっている。このような態様によれば、ユーザは、分類確認結果全体が合っていれば、「登録」ボタンを起動すれば済むので、ユーザの操作負担が軽減される。また、上記した第1の実施形態で説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報に修正、画面を更新できるようにしてもよい。
【0053】
[第3の実施形態]
続いて、複数のアクセント情報を推定し、ユーザに提示できるようにした本発明の第3の実施形態について説明する。本実施形態は、上記した第1の実施形態と同様の構成にて実現可能であるので、以下、その相違点を中心に説明する。
【0054】
図11は、本発明の第3の実施形態の辞書登録装置の動作を説明するための流れ図である。第1の実施形態の動作を表した図9の流れ図と相違している点は、図11のステップS001aのアクセント情報推定処理において、アクセント情報推定部12が各単語について、優先順位付きの複数のアクセント情報を求める点、続くステップS002aの分類処理で、当該優先順位に従って、ステップS004でチェックがなされなかった単語の分類を行う点、ステップS008、S009で辞書登録可否を受け付ける際にチェックされた単語については辞書への登録を行ない、未チェックの単語が残っている場合には再度分類を行う点で相違している。
【0055】
図12は、本発明の第3の実施形態のステップS004で辞書登録装置の表示部に表示される内容を説明するための図である。図12の例では、ユーザは、各単語について設けられたチェックボックスにチェックを行ない、「次へ」ボタンを起動することで、チェックした単語の辞書への登録を行うことができる。
【0056】
「次へ」ボタンが起動されると、本実施形態に係る辞書登録装置は、チェックされた単語を辞書に登録するとともに、チェックがなされなかった単語について、アクセント情報推定部12で推定された当該単語の次順位のアクセント情報による再分類を行う(ステップS002a)。
【0057】
このように、チェックがなされなかった単語に対して、正しいアクセント情報が得られるまで、新しいアクセント情報による分類表示が繰り返される。
【0058】
以上のようなアクセント情報を複数提示する本実施形態によれば、効率的に分類の誤りを見つけつつ、最終的に正しい分類により、辞書登録を行うことが可能となる。
【0059】
なお、上記した説明では、ステップS004で「次へ」ボタンを起動された時点で、チェックされた単語を辞書に登録するものとして説明したが、チェックされた単語を直ちに辞書に登録せずに、すべての単語のアクセント情報の確認が終わった後でまとめて辞書に登録することも可能である。
【0060】
また、このようにまとめて、あるいは、ユーザに登録順序の変更を許容することで、単語群の辞書登録順序が、音声合成の解析結果に影響を及ぼす場合でも、意図通りの登録順序で登録することが可能となる。
【0061】
また、本実施形態では、図11のステップS002aに戻ることによりアクセント情報の再推定を自動で行っているが、先の第1、第2の実施形態でも説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【0062】
[第4の実施形態]
続いて、上記した各実施形態に、分類の典型例となる参照語の表示機能を追加した本発明の第4の実施形態について図面を参照して詳細に説明する。本実施形態は、上記した第1の実施形態に変更を加えた構成にて実現可能であるので、以下、その相違点を中心に説明する。
【0063】
図13は、本発明の第4の実施形態の辞書登録装置の構成を示すブロック図である。図13を参照すると、図2に示した第1の実施形態の辞書登録装置の構成に参照語抽出部15と、参照語格納部16とを追加した構成となっている。
【0064】
図14は、参照語格納部16に格納される分類済みの参照語群の例である。図14の例では、例えば、平板型の参照語として「こんにちは」、頭高型の参照語として「嵐」、それ以外の参照語として「三蔵」などがそれぞれのアクセント情報と対応付けて格納されている。
【0065】
参照語抽出部15は、上記した参照語格納部16から、単語分類部13により分類された単語の分類結果に従って、各分類の典型例となる参照語群を抽出し、表示部14に送信する。
【0066】
なお、図14の例では、同一のアクセント情報に対し、複数の参照語が格納されているが、これらのすべてを表示しても良いし、予め定められた個数の参照語を適宜選択(収録順やランダム)して表示するようにしてもよい。またより好ましくは、参照語抽出部15が、参照語の中から、アクセント情報の確認を求める単語に類似性の高い参照語を抽出させるようにしてもよい。前記類似性の高い参照語を選択する基準としては、使用されている文字に一致するものがある、読みの中の促音・長音の位置が等しいものがある、モーラ数が等しい・近い、などの基準を用いることができる。
【0067】
図15は、本発明の第4の実施形態の辞書登録装置の動作を説明するための流れ図である。図9に示した第1の実施形態の動作との相違点は、ステップS002の分類処理の後、上述した参照語抽出処理S011が追加され、分類結果の表示において、参照語付きの分類結果が表示される点である(ステップS003a)。
【0068】
図16は、本発明の第4の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。本実施形態によれば、図16に示すように、各分類の意味を理解していなくても、併記された参照語との対照によって、分類が正しいかどうかを判断することが可能になる。
【0069】
以上のように本実施形態によれば、上記した各実施形態の効果に加えて、利用者がアクセント情報を確認する際の容易性を向上させることができる。
【0070】
なお、上記した実施形態では、分類済みの参照語を格納する参照語格納部16を用意するものとして説明したが、ユーザが本実施形態の辞書登録装置を用いて登録した単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。このような構成によれば、ユーザが既に登録作業を行った分の経験を生かして、より作業を円滑に行うことが可能となる。
【0071】
また、その他、初期設定時に辞書に登録済みの単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。例えば、ユーザが、どちらのアクセント情報を付与すべきか判断に迷った場合に、該当参照語を図示省略するテキスト音声合成装置で発声させることで、同じ読み・アクセントであるか否かを確認することができ、理解を深めることができる。
【0072】
また、上記した実施形態では、参照語にも、単語分類部13が持つルールを同様に適用したアクセント情報が予め付与されているものとして説明したが、未分類の参照語群から、単語分類部13と同じ手法を用いてリアルタイムに分類を行い、分類済参照語群と同じ情報を生成しても構わない。このような構成とすれば、単語分類部13が持つルールが変更される場合にも容易に追従し、参照語を正しい位置に表示させることが可能になる。
【0073】
以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、上記した各実施形態に示した、辞書登録装置の構成は、本発明の理解を助けるために簡略化したものであり、種々の態様を取りうることはもちろんである。
【0074】
また、上記した各実施形態では、辞書登録装置単体の構成であるものとして説明したが、テキスト音声合成装置に、本発明の辞書登録装置の構成を付加し、テキスト音声合成装置の一機能として本発明を実現することも可能である。
【0075】
また、上記した各実施形態では、テキスト音声合成用の辞書への登録を想定して説明したが、新語を登録する際にアクセント情報を付与できるその他の辞書にも適用することが可能である。
【符号の説明】
【0076】
10、10a、10b 辞書登録装置
11 入力部
12 アクセント情報推定部
13 単語分類部
14 表示部
15 参照語抽出部
16 参照語格納部
111 単語群入力部
112 辞書登録可否入力部
20 辞書格納部
【技術分野】
【0001】
本発明は、辞書登録装置、辞書更新方法およびプログラムに関し、特に、収録語にアクセント情報が付与されている辞書登録装置、辞書更新方法およびプログラムに関する。
【背景技術】
【0002】
テキスト音声合成を行うに際し、新語や専門用語の読みが正しく行われないことを補うために、ユーザが独自の追加辞書を定義できる機能(辞書登録機能)を備えるテキスト音声合成エンジンが多く存在する。
【0003】
テキスト音声合成に用いる辞書の場合、ユーザが登録したい単語について、表記情報・読み情報・アクセント情報を登録する作業が行われる。テキスト音声合成エンジンは、このようにして登録された辞書中の読み・アクセントを用いてテキストの読み上げを行う。
【0004】
特許文献1には、単語の言語情報と当該単語のアクセント位置の組みを格納した学習用データに基づいてアクセント位置を推定するアクセント位置推定規則を識別学習アルゴリズムによって学習する学習部を備えて、未登録語のアクセント位置を推定する機能を備えたアクセント位置推定装置が開示されている。
【0005】
特許文献2には、単語の読みの長さによって異ならない規則を備えることにより、アクセント位置をより正確に推定できるというアクセント位置推定装置が開示されている。
【0006】
特許文献3には、音声認識に用いる音声認識辞書に、文書ファイルに含まれる未知語を一括して登録できる未知語登録装置が開示されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2005−122054号公報
【特許文献2】特開2004−309753号公報
【特許文献3】特開2003−316376号公報
【非特許文献】
【0008】
【非特許文献1】金田一春彦監修、秋永一枝編、「明解日本語アクセント辞典 第二版」、三省堂、1981年、p.11−15「1.アクセントについて」
【発明の概要】
【発明が解決しようとする課題】
【0009】
以下の分析は、本発明によって与えられたものである。
【0010】
登録しようとする単語にアクセント情報の付与を要する辞書への辞書登録作業は、例えば、テキスト音声合成を採用したシステムを構築する際に、一度に大量に作業が発生することがある。
【0011】
上記した特許文献1、2のようにアクセント位置の推定等ができるようになっているものの、ユーザは、推定されたアクセント位置が正しいかどうかを確認した上で、登録操作を行う必要があり、大量の単語を登録する場合には大きな負担となっている。
【0012】
この点、特許文献3は音声認識用の辞書ということもあり、一覧表示してユーザに確認する項目の中には、アクセント情報は含まれていない。また仮に、アクセント情報を一覧表示の対象に加えたとしても、アクセント情報の確認に要する負担を軽減することは困難である。
【0013】
本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、上記したアクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することのできる辞書登録装置、辞書更新方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0014】
本発明の第1の視点によれば、辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置が提供される。
【0015】
本発明の第2の視点によれば、辞書登録装置を構成するコンピュータが、辞書に登録する単語群の入力を受け付けるステップと、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法が提供される。本方法は、アクセント情報を付与する必要のある辞書への登録を受け付けるコンピュータという、特定の機械に結びつけられている。
【0016】
本発明の第3の視点によれば、辞書登録装置を構成するコンピュータに、辞書に登録する単語群の入力を受け付ける処理と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラムが提供される。なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。即ち、本発明は、コンピュータプログラム製品として具現することも可能である。
【発明の効果】
【0017】
本発明によれば、アクセント情報を付与する必要のある辞書に多くの単語を登録する際のユーザの負担を軽減することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本発明の概要を説明するための図である。
【図2】本発明の第1の実施形態の辞書登録装置の構成を示すブロック図である。
【図3】本発明の第1の実施形態の辞書登録装置に入力される単語群の例である。
【図4】本発明の第1の実施形態の辞書登録装置による分類結果の例である。
【図5】本発明の第1の実施形態の辞書登録装置が分類の際に適用する第1の規則(ルール)を説明するための図である。
【図6】本発明の第1の実施形態の辞書登録装置が分類の際に適用する第2の規則(ルール)を説明するための図である。
【図7】分類の際に適用する規則(ルール)の別の一例を説明するための図である。
【図8】本発明の第1の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図9】本発明の第1の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図10】本発明の第2の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図11】本発明の第3の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図12】本発明の第3の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【図13】本発明の第4の実施形態の辞書登録装置の構成を示すブロック図である。
【図14】本発明の第4の実施形態の辞書登録装置の参照語格納部に格納される参照語情報を説明するための図である。
【図15】本発明の第4の実施形態の辞書登録装置の動作を説明するための流れ図である。
【図16】本発明の第4の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。
【発明を実施するための形態】
【0019】
はじめに、本発明の概要について説明する。本発明は、図1に示すように、単語群の入力や辞書登録可否を受け付ける入力部11と、入力された各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部12と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部13と、入力された複数の単語を分類表示する表示部14とを備える情報処理装置にて実現できる。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではない。
【0020】
ユーザは、前記表示部14における、入力された複数の単語の分類表示の結果(図8参照)を参照して、各単語について辞書格納部20に格納された辞書へ登録を行うか否かを判断する。なお、アクセント情報推定部におけるアクセント情報の推定方法としては、辞書格納部に格納された辞書を参照して特許文献1、2の方法を用いる方法や、非特許文献1の第2表にあるような規則を適用して推定する方法等を適宜採用することができる。また、図1の例では、辞書格納部が辞書登録装置と独立した構成となっているが、辞書登録装置が、辞書格納部を内蔵する構成も当然に採用可能である。
【0021】
以上のように、入力された複数の単語が、アクセント情報という観点で分類されてカテゴリー毎にまとめて提示されるため、ユーザとしては、分類されたカテゴリー毎に、辞書登録をするか否かを判断することが可能となり、効率よく辞書登録操作を進めることができる。
【0022】
[第1の実施形態]
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図2は、本発明の第1の実施形態の辞書登録装置の構成を示すブロック図である。図2を参照すると、単語群入力部111と、アクセント情報を求めるアクセント情報推定部12と、単語分類部13と、表示部14と、辞書登録可否入力部112とを備える辞書登録装置10aの構成が示されている。
【0023】
単語群入力部111は、辞書格納部20に格納された辞書への登録候補となる複数の単語からなる単語群を入力する装置である。例えば、単語の表記と読み情報の組を、テキストファイルや、カンマや空白等をデリミタとして用いたファイル等により入力する装置である。また、単語群入力部111は、辞書登録可否入力部112から指示された単語と読み情報の組を辞書格納部20に格納された辞書に登録する動作を行う。
【0024】
アクセント情報推定部12は、単語群入力部111から入力された複数の単語群を入力とし、各単語の表記情報と読み情報から、アクセント情報を推定する。また、アクセント情報推定部12は、辞書登録可否入力部112から指示された単語のアクセント情報を辞書格納部20に格納された辞書に登録する動作を行う。
【0025】
以下の説明では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとする。
【0026】
アクセント位置の情報は、例えば、非特許文献1に示すように、アクセント位置、即ちアクセントの強弱や高低のない「平板型」、アクセント位置が先頭音素にある「頭高型」、「中高型」と分類することもできる。また、アクセントの下がる直前の音素の先頭から数えたモーラ数で、「0型」、「1型」、「2型」、「3型」...と分類しても良い。ここで、「0型」は、「平板型」と同じ、「1型」は「頭高型」と同じ、それ以外の「2型」「3型」...などは「中高型」に分類される。以下の説明では、両者を併用するものとする。
【0027】
表記情報および読み情報からアクセント情報を推定する方法は、特許文献1、2に開示されている方法や、非特許文献1の第2表にあるような規則を適用して推定する方法等を適宜採用することができる。
【0028】
単語分類部13は、前記アクセント情報推定部12にて推定されたアクセント情報と、各単語の表記および読みから一意に得られる情報と、を用いて、予め定められたルールに従って、入力された単語を分類する。
【0029】
本実施形態では、上記単語の表記および読みから一意に得られる情報として、読みのモーラ数を用いるものとする。その他、前記単語の表記および読みから一意に得られる情報としては、読みのモーラ数、読みの音節数、読み中の長音の存在有無および位置、読み中の促音の存在有無および位置、読み中の撥音の存在有無および位置、読み中の単独母音の存在有無および位置、表記の文字種類の並びおよびそれらの組み合わせを用いることができる。
【0030】
例えば、図3に示す表記と読みが与えられた単語群が入力されている場合、本実施形態の単語分類部13は、前記アクセント情報推定部12にて推定されたアクセント情報(アクセント型)と、モーラ数とを用いて、図4に示すように入力された単語群を分類する。
【0031】
ここで、本実施形態の単語分類部13が、表示部14に前記分類結果を渡す際に適用する分類表示上のルールについて説明する。
【0032】
第1のルールは、図5の破線内に示すように、0型アクセント句はモーラ数に依らず、全て同じ分類「平板型」として分類表示するというものである。これは、平板型の場合、ユーザはアクセントの位置を知覚しないため、モーラ数による分類があまり意味を持たないという知見に基づき、一つの分類にまとめて(集約して)分かりやすくすることを目的としている。なお、図5の例では、「仏説」、「波羅蜜多」の単語は4モーラとなっているが、例えば、入力された単語群に1〜3モーラで「平板型」のアクセント情報を持つ単語がある場合、これらも「平板型」としてまとめて表示されることになる。
【0033】
第2のルールは、図6の破線内に示すように、1型アクセント句は、モーラ数に依らず全て同じ分類「頭高型」として分類表示するというものである。これは、頭高型ではユーザは語の先頭がアクセントの位置であると知覚するため、それ以降のモーラ数があまり意味を持たないという知見に基づき、一つの分類にまとめて(集約して)分かりやすくすることを目的としている。
【0034】
第3のルールは、上記第1、第2のルールに当てはまらない単語について、それぞれ個別にアクセント情報とモーラ数による分類表示するというものである。例えば、図3の「心経」は、上記第1、第2のルールのいずれにも当てはまらないので、「4モーラ3型」として分類表示される。
【0035】
なお、本実施形態では、説明の簡単のため用いていないが、例えば、図7のように、モーラ数より1少ないアクセント型の番号を持つものを、分類「N−1型」としてまとめても良い。同様に「N−2型」、「N−3型」なども考えることができる。
【0036】
なお、上記のような分類を増やすと、図6、図7における「摩訶」のように、複数の分類に属するものが発生するので、併せて分類の優先度を定めることもできる。
【0037】
表示部14は、図8に示すように、入力された単語群を、前記単語分類部13によって分類された分類毎に表示する。
【0038】
辞書登録可否入力部112は、マウスやキーボード等の入力装置によって構成され、ユーザから辞書に登録する単語の指定を受け付け、単語群入力部111およびアクセント推定部12に辞書への登録動作を行わせる。
【0039】
図8の例では、各単語についてチェックボックスが設けられており、辞書登録可否入力部112を用いて、登録したい単語にチェックを付け、「登録」ボタンを起動することで、チェックされた単語の辞書への登録が完了するようになっている。
【0040】
なお、図8には図示されていないが、チェックが付けられなかった単語については、単に登録しないのではなく、例えば、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【0041】
なお、図2に示した辞書登録装置10aの各部(処理手段)は、辞書登録装置10aを構成するコンピュータに、そのハードウェアを用いて、上記した各処理を実行させるコンピュータプログラムにより実現することもできる。
【0042】
続いて、本実施形態の動作について図9を参照して詳細に説明する。図9を参照すると、まず、単語群が入力されると、アクセント情報推定部12が、入力された各単語について、アクセント情報を推定し、付与する(ステップS001)。例えば、図3の単語群が入力されている場合、仏説、摩訶、般若、波羅蜜多、心経について、それぞれ、0型、1型、1型、0型、3型というアクセント情報が付与される。
【0043】
次に、単語分類部13が、前記アクセント情報と、モーラ数を用いて、図4に示すような一次分類を行った後、上述した第1〜第3のルールを適用して、まとめたものを表示部14に出力する(ステップS002)。この段階で、図5にて説明したように、仏説、波羅蜜多は平板型にまとめられる。また、摩訶、般若は、図6にて説明したように頭高型に分類される。そして、心経は、上記いずれのグループにも該当しないので、4モーラ3型として分類される。
【0044】
次に、表示部14が、単語分類部13による単語の分類表示の結果を表示する(ステップS003;図8参照)。
【0045】
ユーザが、辞書登録可否入力部112から辞書登録要否を入力すると(ステップS004)、その内容に応じて、辞書への登録が行われる(ステップS006、S007)。
【0046】
以上のように、本実施形態によれば、アクセントの位置やモーラ数という観点で分類し、さらに、上記した第1、第2のルールを適用して、まとめて提示された内容を見て、辞書への登録を行なうことが可能になる。このため、大量の単語を効率よく、かつ、容易に登録する際の負担が著しく軽減される。
【0047】
なお、上記した実施形態では、各単語は単一のアクセント句を構成するものとし、アクセント情報は該当単語のアクセント位置の情報であるものとして説明したが、単語が複数のアクセント句から構成されることを許容する場合は、各アクセント句の境界の情報と、各アクセント句のそれぞれのアクセント位置の情報をアクセント情報とすることもできる。この場合も同様の構成にて実現可能であり、単語がアクセント句から構成されることを許容する場合にも、容易に適用可能であることは明らかである。
【0048】
[第2の実施形態]
続いて、表示部14における表示態様に変更を加えた本発明の第2の実施形態について説明する。上記した第1の実施形態では、単語を「頭高型」、「平板型」、「それ以外の型」に分けて分類表示したが、本実施形態では、各分類をモーラ数で細分化して階層表示できるようにしている。本実施形態は、上記した第1の実施形態と同様の構成にて実現可能であり、その動作も同様であるので、以下、その表示上の相違について詳細に説明する。
【0049】
図10は、本発明の第2の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。図10を参照すると、「頭高型」に分類される「摩訶」、「般若」について、それぞれのモーラ数により、「2モーラ1型」と「3モーラ1型」の細かい分類も含めて表示されている。
【0050】
同様に、「平板型」に分類される単語は、「仏説」、「波羅蜜多」の2つがあるが、それぞれのモーラ数は同じ4モーラなので、「4モーラ0型」として一緒に表示されている。
【0051】
以上のような階層表示を行う本実施形態によれば、同じ分類(大分類)に分類される単語が多い場合も、その中の関係をより適切に把握することが可能となる。
【0052】
また、図10の例では、それぞれの単語についてチェックボックスを設けずに、「登録」ボタンを起動することで、分類表示されたすべての単語の一括登録ができるようになっている。このような態様によれば、ユーザは、分類確認結果全体が合っていれば、「登録」ボタンを起動すれば済むので、ユーザの操作負担が軽減される。また、上記した第1の実施形態で説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報に修正、画面を更新できるようにしてもよい。
【0053】
[第3の実施形態]
続いて、複数のアクセント情報を推定し、ユーザに提示できるようにした本発明の第3の実施形態について説明する。本実施形態は、上記した第1の実施形態と同様の構成にて実現可能であるので、以下、その相違点を中心に説明する。
【0054】
図11は、本発明の第3の実施形態の辞書登録装置の動作を説明するための流れ図である。第1の実施形態の動作を表した図9の流れ図と相違している点は、図11のステップS001aのアクセント情報推定処理において、アクセント情報推定部12が各単語について、優先順位付きの複数のアクセント情報を求める点、続くステップS002aの分類処理で、当該優先順位に従って、ステップS004でチェックがなされなかった単語の分類を行う点、ステップS008、S009で辞書登録可否を受け付ける際にチェックされた単語については辞書への登録を行ない、未チェックの単語が残っている場合には再度分類を行う点で相違している。
【0055】
図12は、本発明の第3の実施形態のステップS004で辞書登録装置の表示部に表示される内容を説明するための図である。図12の例では、ユーザは、各単語について設けられたチェックボックスにチェックを行ない、「次へ」ボタンを起動することで、チェックした単語の辞書への登録を行うことができる。
【0056】
「次へ」ボタンが起動されると、本実施形態に係る辞書登録装置は、チェックされた単語を辞書に登録するとともに、チェックがなされなかった単語について、アクセント情報推定部12で推定された当該単語の次順位のアクセント情報による再分類を行う(ステップS002a)。
【0057】
このように、チェックがなされなかった単語に対して、正しいアクセント情報が得られるまで、新しいアクセント情報による分類表示が繰り返される。
【0058】
以上のようなアクセント情報を複数提示する本実施形態によれば、効率的に分類の誤りを見つけつつ、最終的に正しい分類により、辞書登録を行うことが可能となる。
【0059】
なお、上記した説明では、ステップS004で「次へ」ボタンを起動された時点で、チェックされた単語を辞書に登録するものとして説明したが、チェックされた単語を直ちに辞書に登録せずに、すべての単語のアクセント情報の確認が終わった後でまとめて辞書に登録することも可能である。
【0060】
また、このようにまとめて、あるいは、ユーザに登録順序の変更を許容することで、単語群の辞書登録順序が、音声合成の解析結果に影響を及ぼす場合でも、意図通りの登録順序で登録することが可能となる。
【0061】
また、本実施形態では、図11のステップS002aに戻ることによりアクセント情報の再推定を自動で行っているが、先の第1、第2の実施形態でも説明したように、ユーザが正しい分類に単語をドラッグアンドドロップできるようにしたり、正しいアクセント情報の入力を受け付け登録できるようにしてもよい。
【0062】
[第4の実施形態]
続いて、上記した各実施形態に、分類の典型例となる参照語の表示機能を追加した本発明の第4の実施形態について図面を参照して詳細に説明する。本実施形態は、上記した第1の実施形態に変更を加えた構成にて実現可能であるので、以下、その相違点を中心に説明する。
【0063】
図13は、本発明の第4の実施形態の辞書登録装置の構成を示すブロック図である。図13を参照すると、図2に示した第1の実施形態の辞書登録装置の構成に参照語抽出部15と、参照語格納部16とを追加した構成となっている。
【0064】
図14は、参照語格納部16に格納される分類済みの参照語群の例である。図14の例では、例えば、平板型の参照語として「こんにちは」、頭高型の参照語として「嵐」、それ以外の参照語として「三蔵」などがそれぞれのアクセント情報と対応付けて格納されている。
【0065】
参照語抽出部15は、上記した参照語格納部16から、単語分類部13により分類された単語の分類結果に従って、各分類の典型例となる参照語群を抽出し、表示部14に送信する。
【0066】
なお、図14の例では、同一のアクセント情報に対し、複数の参照語が格納されているが、これらのすべてを表示しても良いし、予め定められた個数の参照語を適宜選択(収録順やランダム)して表示するようにしてもよい。またより好ましくは、参照語抽出部15が、参照語の中から、アクセント情報の確認を求める単語に類似性の高い参照語を抽出させるようにしてもよい。前記類似性の高い参照語を選択する基準としては、使用されている文字に一致するものがある、読みの中の促音・長音の位置が等しいものがある、モーラ数が等しい・近い、などの基準を用いることができる。
【0067】
図15は、本発明の第4の実施形態の辞書登録装置の動作を説明するための流れ図である。図9に示した第1の実施形態の動作との相違点は、ステップS002の分類処理の後、上述した参照語抽出処理S011が追加され、分類結果の表示において、参照語付きの分類結果が表示される点である(ステップS003a)。
【0068】
図16は、本発明の第4の実施形態の辞書登録装置の表示部に表示される内容を説明するための図である。本実施形態によれば、図16に示すように、各分類の意味を理解していなくても、併記された参照語との対照によって、分類が正しいかどうかを判断することが可能になる。
【0069】
以上のように本実施形態によれば、上記した各実施形態の効果に加えて、利用者がアクセント情報を確認する際の容易性を向上させることができる。
【0070】
なお、上記した実施形態では、分類済みの参照語を格納する参照語格納部16を用意するものとして説明したが、ユーザが本実施形態の辞書登録装置を用いて登録した単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。このような構成によれば、ユーザが既に登録作業を行った分の経験を生かして、より作業を円滑に行うことが可能となる。
【0071】
また、その他、初期設定時に辞書に登録済みの単語や、これら単語から選択された単語を参照語として用いる構成も採用可能である。例えば、ユーザが、どちらのアクセント情報を付与すべきか判断に迷った場合に、該当参照語を図示省略するテキスト音声合成装置で発声させることで、同じ読み・アクセントであるか否かを確認することができ、理解を深めることができる。
【0072】
また、上記した実施形態では、参照語にも、単語分類部13が持つルールを同様に適用したアクセント情報が予め付与されているものとして説明したが、未分類の参照語群から、単語分類部13と同じ手法を用いてリアルタイムに分類を行い、分類済参照語群と同じ情報を生成しても構わない。このような構成とすれば、単語分類部13が持つルールが変更される場合にも容易に追従し、参照語を正しい位置に表示させることが可能になる。
【0073】
以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、上記した各実施形態に示した、辞書登録装置の構成は、本発明の理解を助けるために簡略化したものであり、種々の態様を取りうることはもちろんである。
【0074】
また、上記した各実施形態では、辞書登録装置単体の構成であるものとして説明したが、テキスト音声合成装置に、本発明の辞書登録装置の構成を付加し、テキスト音声合成装置の一機能として本発明を実現することも可能である。
【0075】
また、上記した各実施形態では、テキスト音声合成用の辞書への登録を想定して説明したが、新語を登録する際にアクセント情報を付与できるその他の辞書にも適用することが可能である。
【符号の説明】
【0076】
10、10a、10b 辞書登録装置
11 入力部
12 アクセント情報推定部
13 単語分類部
14 表示部
15 参照語抽出部
16 参照語格納部
111 単語群入力部
112 辞書登録可否入力部
20 辞書格納部
【特許請求の範囲】
【請求項1】
辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、
前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置。
【請求項2】
前記入力部において、単語の表記と読みの情報の入力を受け付け、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける請求項1の辞書登録装置。
【請求項3】
前記単語分類部は、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類よりも大きな括りで、前記入力された複数の単語を分類し、
前記大きな括りによる分類表示と、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類表示との階層表示を行う請求項1または2の辞書登録装置。
【請求項4】
前記単語分類部は、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて分類された単語のうち、アクセント型が所定の型である単語をまとめて分類表示する請求項2または3の辞書登録装置。
【請求項5】
前記まとめて分類表示するアクセント型は、アクセント位置のないアクセント型およびアクセントが先頭にあるアクセント型である請求項4の辞書登録装置。
【請求項6】
前記各分類の典型例となる参照語を格納した参照語格納部を備え、
前記入力された複数の単語を分類表示する際に、前記各分類毎に、前記参照語も表示する請求項1から5いずれか一の辞書登録装置。
【請求項7】
前記アクセント情報推定部は、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報の候補を複数求め、
入力された複数の単語のうち、辞書登録操作が行われなかった単語について、別のアクセント情報による分類表示を行ない、再度辞書登録操作を受け付ける請求項1から6いずれか一の辞書登録装置。
【請求項8】
辞書登録装置を構成するコンピュータが、
辞書に登録する単語群の入力を受け付けるステップと、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法。
【請求項9】
辞書登録装置を構成するコンピュータに、
辞書に登録する単語群の入力を受け付ける処理と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラム。
【請求項1】
辞書に登録する単語群の入力を受け付ける入力部と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、
前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける辞書登録装置。
【請求項2】
前記入力部において、単語の表記と読みの情報の入力を受け付け、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける請求項1の辞書登録装置。
【請求項3】
前記単語分類部は、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類よりも大きな括りで、前記入力された複数の単語を分類し、
前記大きな括りによる分類表示と、前記アクセント情報と表記または読みから一意に求まる情報とを用いた分類表示との階層表示を行う請求項1または2の辞書登録装置。
【請求項4】
前記単語分類部は、
前記アクセント情報と表記または読みから一意に求まる情報とを用いて分類された単語のうち、アクセント型が所定の型である単語をまとめて分類表示する請求項2または3の辞書登録装置。
【請求項5】
前記まとめて分類表示するアクセント型は、アクセント位置のないアクセント型およびアクセントが先頭にあるアクセント型である請求項4の辞書登録装置。
【請求項6】
前記各分類の典型例となる参照語を格納した参照語格納部を備え、
前記入力された複数の単語を分類表示する際に、前記各分類毎に、前記参照語も表示する請求項1から5いずれか一の辞書登録装置。
【請求項7】
前記アクセント情報推定部は、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報の候補を複数求め、
入力された複数の単語のうち、辞書登録操作が行われなかった単語について、別のアクセント情報による分類表示を行ない、再度辞書登録操作を受け付ける請求項1から6いずれか一の辞書登録装置。
【請求項8】
辞書登録装置を構成するコンピュータが、
辞書に登録する単語群の入力を受け付けるステップと、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるステップと、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類するステップと、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付けるステップとを含む、辞書更新方法。
【請求項9】
辞書登録装置を構成するコンピュータに、
辞書に登録する単語群の入力を受け付ける処理と、
前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求める処理と、
前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する処理と、
前記分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける処理とを実行させるプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2012−185365(P2012−185365A)
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願番号】特願2011−49036(P2011−49036)
【出願日】平成23年3月7日(2011.3.7)
【出願人】(000004237)日本電気株式会社 (19,353)
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願日】平成23年3月7日(2011.3.7)
【出願人】(000004237)日本電気株式会社 (19,353)
[ Back to top ]