ユーザ辞書作成システム、方法、及び、プログラム

【課題】新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ、登録の効率が高い、ユーザ辞書登録に関するシステム、方法およびプログラムを提供する。
【解決手段】ユーザ辞書作成システムは、文字列を入力するテキスト入力手段１１と、入力された文字列から未知語を抽出する未知語抽出手段２２と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段３２と、類似度が所定値以上のときには、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段３３と、未知語及び環境情報を辞書に登録する登録手段４１とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、ユーザ辞書作成システム、方法、及び、プログラムに関し、更に詳しくは、音声認識システムに好適に用いられるユーザ辞書作成システム、ユーザ辞書作成方法、及び、プログラムに関する。
【背景技術】
【０００２】
音声認識装置を利用して、音声で読み上げられた文章から文書を作成する音声認識システムが知られている。音声認識システムは、音声認識装置と、音声認識装置側で予め用意されている音声認識用辞書と、音声認識辞書に含まれていない単語をユーザ側で登録するためのユーザ辞書作成機能とを有する。
【０００３】
ところで、音声認識用辞書で認識しない単語を、ユーザ辞書作成機能を利用して、その読みと形態素情報とを正しく付与して辞書に登録する作業は、ユーザに多大の負担を強いるという問題があった。また、音声認識辞書で認識しない単語を無条件に登録すると、同じ読みを含む単語や、類似する読みを持つ単語が既に辞書に登録されている場合には、双方の単語を区別することができなくなり、類似性の高い単語に誤って出力する誤認識を誘発するという問題もあった。
【０００４】
特許文献１には、上記問題を解決するユーザ辞書作成システムが記載されている。図７は、このユーザ辞書作成システムのブロック図である。ユーザ辞書作成システムは、音声入力部７０１と、音声認識部７０２と、類似度算出部７０３と、辞書登録部７０４と、音声認識用辞書７０５と、ユーザ辞書７０６とから構成されている。ユーザ辞書作成システム７００は次のように動作する。まず、予め単語音声を音声入力部７０１より入力し、音声認識部７０２において文字列に変換し、その文字列を音声認識用辞書７０５に登録しておく。ユーザが新しい単語を入力すると、類似度算出部７０３は、音声認識用辞書７０５と入力音声とを比較し、類似している場合には、ユーザ辞書７０６への登録を却下する。
【０００５】
特許文献１に記載のユーザ辞書作成システムでは、辞書内の単語と新たに登録しようとする単語との類似性を判定し、類似性が高い場合には、一律に登録できないという方式を採用している。しかし、この方式を採用すると、登録できない単語については、その認識率を改善することができなかった。
【０００６】
特許文献２には、辞書作成時に、登録したい単語と識別させたい単語の音声パターンを比較し、類似していることが判明すると、ユーザに誤認識をする可能性がある旨を提示するユーザ辞書作成システムが記載されている。ユーザは、問い合わせを受けると、その単語の登録の可否を判断する。この方法では、特許文献１とは異なり、登録できない単語はなくなるが、ユーザの誤った判断に起因して、誤認識の発生が考えられる。
【０００７】
特許文献３には、ユーザ辞書に登録したい単語と、既に登録されている単語との類似度を判定し、双方の単語の類似度が所定以上の場合には、個々のユーザが自身の辞書に登録するか否かを判断する辞書登録装置を有する音声認識システムが記載されている。このユーザ辞書作成システムでは、登録可と判断したユーザのＩＤ番号がその登録した単語と共に登録され、他のユーザにはその登録の効果を及ばない。このため、ユーザ各自の判断で登録が可能となり、また、他のユーザに誤認識を発生させるおそれが除かれる。
【０００８】
特許文献４には、ワードプロセッサにおいて、ユーザ辞書に登録したい単語に同音異義語があると、その登録したい単語の前後に付属する単語やその品詞などを付加して登録する旨が記載されている。
【先行技術文献】
【特許文献】
【０００９】
【特許文献１】特開平８−１１０７９０号公報
【特許文献２】特開平７−４４１８８号公報
【特許文献３】特開２０００−２５９１７２号公報
【特許文献４】特開平２−２９７２４７号公報
【発明の概要】
【発明が解決しようとする課題】
【００１０】
特許文献３の音声認識システムでは、ユーザが登録した単語の効果はユーザ自身にのみ及ぶので、他のユーザに誤認識が発生する可能性がなくなる。しかし、ユーザがそれぞれ単独に同じ単語を登録する必要が生じ、ユーザ辞書作成における効率が低下する。
【００１１】
また、特許文献４のワードプロセッサでは、同音異義語がある単語について、その前後に付属する単語やその品詞が付加されるものの、音声認識システムでは、誤認識が発生するのは、同音異義語の単語間ばかりではなく、同じような発音を有する単語間でも発生する。
【００１２】
本発明は、上述の点に鑑み、新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ且つ登録の効率が高いユーザ辞書登録システム、及び、そのようなユーザ辞書登録システムで用いられる辞書登録方法、及び、プログラムを提供することを目的とする。
【課題を解決するための手段】
【００１３】
本発明は、上記目的を達成するために、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システムを提供する。
【発明の効果】
【００１４】
本発明のユーザ辞書作成システム、方法、及び、プログラムは、既知語との間で類似性が高い未知語を登録する際に、効率が高い登録を可能にしつつ、その後に未知語と既知語との間で発生しがちな誤認識を抑制できる効果がある。
【図面の簡単な説明】
【００１５】
【図１】本発明の第１の実施形態に係るユーザ辞書作成システムを含む音声認識システムのブロック図。
【図２】本発明の第２の実施形態に係るユーザ辞書作成システムのブロック図。
【図３】本発明の第３の実施形態に係るユーザ辞書作成システムのブロック図。
【図４】本発明の第４の実施形態に係るユーザ辞書作成システムのブロック図。
【図５】類似語間で誤りが発生しやすい例を示すグラフ。
【図６】第１の実施形態で採用される登録例を示すグラフ。
【図７】特許文献１に記載のユーザ辞書作成システムのブロック図。
【発明を実施するための形態】
【００１６】
本発明の最小構成のユーザ辞書作成システムは、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、算出された類似度が所定値以上のときには、文字列中の未知語の前後の文章の形態解析に基づいて、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、未知語及び環境情報を辞書に登録する登録手段と、を備える。
【００１７】
本発明のユーザ辞書作成システムでは、辞書に既に登録されている登録語と所定の類似度以上の類似性を有する未知語が抽出されると、入力文字列中の未知語の前後の文章から未知語の環境情報を抽出し、その環境情報を未知語と共に辞書に登録する構成を採用する。本構成を採用することにより、その後の辞書参照の際に発生しがちな誤認識の発生を防止する。
【００１８】
本発明のユーザ辞書作成システムでは、前記未知語の読みを決定する未知語読み付け手段を更に有する構成を採用できる。この場合、未知語を選択する際に、その判定が容易になる。また、実際に登録する際の処理も簡素化できる。
【００１９】
本発明のユーザ辞書作成システムでは、入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する構成を採用することが出来る。この場合、既に作成された辞書の登録語の認識率の向上が可能となる。
【００２０】
本発明のユーザ辞書作成システムでは、前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である構成も採用できる。未知語を登録した際に類似度が高いと判定された登録語が次に出現すると、その登録語について環境情報が付加できるので、登録語についても認識率が向上する。
【００２１】
本発明のユーザ辞書作成システムでは、前記登録される環境情報が前記未知語の品詞に依存する構成を採用することが出来る。品詞によって未知語の環境が異なるため、認識率の向上が可能となる。
【００２２】
本発明のユーザ辞書作成システムでは、前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも１語だけ長くする構成を採用することが出来る。この場合には、新たに登録される未知語の環境情報をよりきめ細かに登録することで、誤認識の低減が可能になる。
【００２３】
以下、本発明の例示的な実施形態について図面を参照して詳細に説明する。図１は、本発明の第１の実施形態に係るユーザ辞書作成システムを含む音声認識システムを示している。ユーザ辞書作成システムは、テキスト入力部１０と、入力したテキストに音声認識用辞書５０とユーザ辞書６０を用いて未知語を抽出する未知語抽出部２０と、抽出した未知語の中からユーザ辞書に登録する単語を抽出する未知語選択部３０と、未知語を登録するユーザ辞書登録部４０とを有する。音声認識システムは、このユーザ辞書作成システムと、音声認識用辞書５０と、ユーザ辞書６０と、音声認識手段７０と、文書作成手段８０とを含む。
【００２４】
テキスト入力部１０は、過去の議事録や発言録、報告書などのデジタル化されたファイルを入力するとテキスト情報のみを抽出し、出力するテキスト入力手段１１を備えている。
【００２５】
未知語抽出部２０は、形態素解析手段２１と、未知語抽出手段２２とを含む。形態素解析手段２１は、テキスト入力部１０より入力されたテキストに対し、音声認識用辞書５０とユーザ辞書６０とを用いて形態素解析を行い、品詞を付与する。未知語抽出手段２２では、形態素解析手段２１で、品詞を付与できなかった単語を未知語として抽出し、未知語と該当する未知語を含む文章を保存しリスト化して、未知語選択部３０に供給する。
【００２６】
未知語選択部３０は、未知語選択手段３１と、類似度算出手段３２と、環境情報抽出手段３３とを含む。これらの手段はそれぞれ概略、次のように動作する。未知語選択手段３１は、未知語抽出手段２２で作成された未知語のリストを参照しながら、登録するか否かのユーザの判断を受け付ける。ユーザが登録すると判断した未知語には、その読みと品詞の付与をユーザ自身が行う。
【００２７】
類似度算出手段３２では、未知語の読みと辞書中の単語の読みの音響的特長の類似度を音素間の距離を定義したテーブルを用いて計算する。また、類似度算出手段３２は、未知語の品詞と音響的特長が類似する辞書中の単語（既知語）の品詞の類似度を形態素間の距離を定義したテーブルを用いて類似度を計算する。環境情報抽出手段３３では、辞書中に類似度が高い既知語が存在する未知語のみに、未知語選択手段３１で付与した品詞を用いて、未知語が含まれている文の形態素解析を再度行い、未知語の前後の単語の品詞など、未知語の前後の環境条件を求める。
【００２８】
ユーザ辞書登録部４０は、未知語の登録手段４１を含む。登録手段４１は、未知語選択部３０でユーザが選択した未知語をユーザ辞書６０に登録する。ユーザ辞書登録部４０は、未知語を登録する際に、辞書に類似度の高い単語があるものは、未知語の品詞と読み以外に、環境情報抽出手段３３で求めた未知語の前後の品詞を環境情報としてユーザ辞書６０に登録する。
【００２９】
音声認識手段７０は、音声をリアルタイムに入力して記録し、その記録した音声から５０音やアルファベットなどの表音文字を認識する機能を有する。文書作成手段８０は、音声認識手段７０から表音文字を入力し、音声認識用辞書５０及びユーザ辞書６０に基づいて、表音文字から文書を作成する。
【００３０】
文書作成手段８０は、ユーザ辞書６０を参照して文書を作成する際に、ユーザ辞書中の単語が選択されるのは、環境情報まで一致した場合のみとすることで、ユーザ辞書に類似度の高い単語を登録したことによる悪影響を極力抑えることができる。
【００３１】
以下、上記第１の実施形態に係るユーザ辞書作成装置の具体的動作について詳細に説明する。まず、ユーザは、図１のテキスト入力部１０のテキスト入力手段１１から、認識させたい単語を含むテキストや話題が近いテキストを大量に入力する。未知語抽出部２０は、形態素解析手段２１にて入力されたテキストに対し音声認識用辞書５０とユーザ辞書６０を用いて形態素解析を行い、未知語抽出手段２２で未知語を抽出し、未知語リストを作成する。
【００３２】
作成された未知語リストは、未知語選択部３０の未知語選択手段３１を用いて、ユーザが登録の有無を選択する。登録が決まった未知語は、辞書に類似する単語があるか否かの判断を類似度算出手段３２にて行う。類似する単語が発見された場合には、環境情報抽出手段３３が、登録する単語の前後の品詞情報を取得する。ユーザ辞書登録部４０では、未知語選択部３０で選択された単語の情報をユーザ辞書６０に登録する。
【００３３】
図５に、環境制限を加えないで未知語を登録する際に発生しがちな誤り例を示す。図５は、ユーザが未知語“Sun”（読み：サン）を登録すると、入力された“佐藤さん。”の“さん”を“Sun”と誤認識し、“佐藤Sun。”という認識結果が出ることを示す。同様に、ユーザが未知語“ARIS”（読み：アリス）を登録すると、入力された“そうであります”の“あります”を、“ARIS”と誤認識し、“そうでARIS。”となることを示している。
【００３４】
図６は、本実施形態において、既に辞書に類似度の高い単語があった場合に、登録される単語の環境情報を考慮して行われた未知語のユーザ辞書への登録内容のサンプルを示している。図６では、未知語“Sun”を登録する際には、“Sun”を固有名詞として、その読みと、記号−固有名詞−記号とを登録する旨が示されている。つまり、単語“Sun”の前後に環境情報を考慮して記号（句点）を登録することが示されている。また、語頭−固有名詞−助詞と登録する旨が示されており、未知語“Sun”が語頭にあった場合には、環境情報を考慮して、その固有名詞の後ろの助詞“が”が登録される旨が示されている。
【００３５】
図６には、更に、未知語“ARIS”の登録の際には、その読みに加えて、記号−固有名詞−記号、語頭−固有名詞−助詞、又は、語頭−固有名詞−名詞が登録する旨が示されている。“ARIS”を登録する際には、このルールに従って環境情報の登録を行い、その後に“ARIS”が入力された際に、その前後の環境を調べることで、“あります”などとの間で発生する誤認識を防止する。
【００３６】
第１の実施形態では、未知語を登録する際には、その登録すべき未知語と類似度の高い単語が既に辞書に登録されているか否かを判定する。次いで、既に登録されている登録後と類似度が高いと判定された未知語を登録する際には、未知語の表記、読み、品詞情報だけでなく、その未知語が出現しうる前後の品詞の環境を登録している。この構成を採用することで、未知語と類似する単語との区別を図り、認識結果に悪影響を及ぼさないように図っている。
【００３７】
次に、本発明の第２の実施形態について説明する。図２を参照すると、本発明の第２の実施形態に係るユーザ辞書作成システムは、第１の実施形態のユーザ辞書作成システムとは未知語抽出手段の構成が異なっている。詳しくは、第２の実施形態の未知語抽出部２０Ａは、第１の実施形態における未知語抽出部２０の構成に加えて、未知語読み付け手段２３と未知語読み付け辞書９０とを有する。その他の構成、動作については、第１の実施形態と同様である。
【００３８】
未知語読み付け手段２３は、未知語抽出手段２２で抽出された未知語に対し、未知語読み付け辞書９０を用いて未知語の読みを自動的に付与する。未知語読み付け辞書９０は、１文字ごとに読みを定義したテーブルで、未知語の先頭から順にこのテーブルにある読みを付与していく。例えば、文字列“ＡＢＣ”が未知語として抽出された場合には、“ＡＢＣ”を１文字ずつに分割し、未知語読み付け辞書９０にある“Ａ（えー）”、“Ｂ（びー）”、“Ｃ（しー）”の読みを付与する。
【００３９】
上記構成により、ユーザが未知語選択手段３１で、登録する未知語を選んだ時には、既になんらかの読みがその未知語に付与された状態である。このため、最初から全ての読みを登録する場合に比べ、登録する手間を軽減することができる。
【００４０】
次に、本発明の第３の実施形態について図面を参照して詳細に説明する。図３を参照すると、本発明の第３の実施形態に係るユーザ辞書作成システムは、第１の実施形態におけるユーザ辞書作成システムとは、未知語選択部の構成が異なる。詳しくは、本実施形態の未知語選択部３０Ａは、未知語選択手段３１と、類似度算出手段３４と、環境情報抽出手段３５とを有する。未知語選択手段３１の構成及び動作は、第１の実施形態の未知語選択手段と同様である。
【００４１】
本実施形態では、類似度算出手段３４は、第１の実施形態における類似度算出手段３２と同様に類似度を算出する機能を有し、且つ、辞書中に類似する単語が見つかったときには、その単語が音声認識用辞書５０とユーザ辞書６０のどちらに存在しているかを判別する。環境情報抽出手段３５は、類似度算出手段３４により類似する単語がユーザ辞書６０に登録されていると判定されると、新しく登録する単語はユーザ辞書に登録されている類似する単語の環境情報よりも前及び／又は後に、１語ずつ多くの環境情報を保持させるようにする。
【００４２】
第３の実施形態では、登録したい単語が、音声認識用辞書ではなく、ユーザ辞書に既に登録された単語との間で類似性が高い場合でも、誤認識の発生を低減することができる。
【００４３】
次に、本発明の第４の実施形態について説明する。図４を参照すると、第４の実施形態に係るユーザ辞書作成システムでは、未知語抽出部２０Ｂが、第１の実施形態の未知語抽出部２０の構成に加えて、登録単語抽出手段２４を有する。本実施形態における他の構成および動作については第１の実施形態と同様である。
【００４４】
登録単語抽出手段２４は、ユーザ辞書６０に登録されている単語の環境情報を追加するための手段である。登録単語抽出手段２４は、形態素解析手段２１により解析された文字列中にユーザ辞書に既に登録された単語が含まれていると、ユーザ辞書６０の中身を検索し当該単語の環境情報を確認し、登録されていない環境情報である場合には、ユーザ辞書登録部４０を介してユーザ辞書６０に登録する。また、環境情報が登録されていても、識別が充分でない場合には、登録されている環境情報に加えて、又は、これに代えて、新たに環境情報を登録する。
【００４５】
第４の実施形態では、既にユーザ辞書に登録された単語の環境情報を、その後の情報に基づいて、後からでも拡充又は変更することが出来る。このため、更なる認識率の向上が期待できる。
【００４６】
本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付の特許請求の範囲に規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。
【産業上の利用可能性】
【００４７】
本発明は、ユーザ辞書を用いてシステム構築後もユーザの用途に合わせて必要な単語を随時登録することができる高精度な音声認識性能が要求される音声認識システム、及び、その辞書登録装置に適している。
【符号の説明】
【００４８】
１０：テキスト入力部
１１：テキスト入力手段
２０、２０Ａ、２０Ｂ：未知語抽出部
２１：形態素解析手段
２２：未知語抽出手段
２３：未知語読み付け手段
２４：登録単語抽出手段
３０、３０Ａ：未知語選択部
３１：未知語選択手段
３２、３４：類似度算出手段
３３、３５：環境情報抽出手段
４０：ユーザ辞書登録部
４１：登録手段
５０：音声認識用辞書
６０：ユーザ辞書
７０：音声認識手段
８０：文章作成手段
９０：未知語読み付け辞書

【特許請求の範囲】
【請求項１】
文字列を入力するテキスト入力手段と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、
前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システム。
【請求項２】
前記未知語の読みを決定する未知語読み付け手段を更に有する、請求項１に記載のユーザ辞書作成システム。
【請求項３】
入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、
前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、
前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する、請求項１又は２に記載のユーザ辞書作成システム。
【請求項４】
前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である、請求項３に記載のユーザ辞書作成システム。
【請求項５】
前記登録される環境情報が前記未知語の品詞に依存する、請求項１〜４の何れか一に記載のユーザ辞書作成システム。
【請求項６】
前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも１語だけ長くする、請求項１〜５の何れか一に記載のユーザ辞書作成システム。
【請求項７】
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を有するユーザ辞書作成方法。
【請求項８】
コンピュータに、
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を実行させるユーザ辞書作成プログラム。

【図１】