説明

ユーザ辞書作成システム、方法、及び、プログラム

【課題】新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ、登録の効率が高い、ユーザ辞書登録に関するシステム、方法およびプログラムを提供する。
【解決手段】ユーザ辞書作成システムは、文字列を入力するテキスト入力手段11と、入力された文字列から未知語を抽出する未知語抽出手段22と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段32と、類似度が所定値以上のときには、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段33と、未知語及び環境情報を辞書に登録する登録手段41とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザ辞書作成システム、方法、及び、プログラムに関し、更に詳しくは、音声認識システムに好適に用いられるユーザ辞書作成システム、ユーザ辞書作成方法、及び、プログラムに関する。
【背景技術】
【0002】
音声認識装置を利用して、音声で読み上げられた文章から文書を作成する音声認識システムが知られている。音声認識システムは、音声認識装置と、音声認識装置側で予め用意されている音声認識用辞書と、音声認識辞書に含まれていない単語をユーザ側で登録するためのユーザ辞書作成機能とを有する。
【0003】
ところで、音声認識用辞書で認識しない単語を、ユーザ辞書作成機能を利用して、その読みと形態素情報とを正しく付与して辞書に登録する作業は、ユーザに多大の負担を強いるという問題があった。また、音声認識辞書で認識しない単語を無条件に登録すると、同じ読みを含む単語や、類似する読みを持つ単語が既に辞書に登録されている場合には、双方の単語を区別することができなくなり、類似性の高い単語に誤って出力する誤認識を誘発するという問題もあった。
【0004】
特許文献1には、上記問題を解決するユーザ辞書作成システムが記載されている。図7は、このユーザ辞書作成システムのブロック図である。ユーザ辞書作成システムは、音声入力部701と、音声認識部702と、類似度算出部703と、辞書登録部704と、音声認識用辞書705と、ユーザ辞書706とから構成されている。ユーザ辞書作成システム700は次のように動作する。まず、予め単語音声を音声入力部701より入力し、音声認識部702において文字列に変換し、その文字列を音声認識用辞書705に登録しておく。ユーザが新しい単語を入力すると、類似度算出部703は、音声認識用辞書705と入力音声とを比較し、類似している場合には、ユーザ辞書706への登録を却下する。
【0005】
特許文献1に記載のユーザ辞書作成システムでは、辞書内の単語と新たに登録しようとする単語との類似性を判定し、類似性が高い場合には、一律に登録できないという方式を採用している。しかし、この方式を採用すると、登録できない単語については、その認識率を改善することができなかった。
【0006】
特許文献2には、辞書作成時に、登録したい単語と識別させたい単語の音声パターンを比較し、類似していることが判明すると、ユーザに誤認識をする可能性がある旨を提示するユーザ辞書作成システムが記載されている。ユーザは、問い合わせを受けると、その単語の登録の可否を判断する。この方法では、特許文献1とは異なり、登録できない単語はなくなるが、ユーザの誤った判断に起因して、誤認識の発生が考えられる。
【0007】
特許文献3には、ユーザ辞書に登録したい単語と、既に登録されている単語との類似度を判定し、双方の単語の類似度が所定以上の場合には、個々のユーザが自身の辞書に登録するか否かを判断する辞書登録装置を有する音声認識システムが記載されている。このユーザ辞書作成システムでは、登録可と判断したユーザのID番号がその登録した単語と共に登録され、他のユーザにはその登録の効果を及ばない。このため、ユーザ各自の判断で登録が可能となり、また、他のユーザに誤認識を発生させるおそれが除かれる。
【0008】
特許文献4には、ワードプロセッサにおいて、ユーザ辞書に登録したい単語に同音異義語があると、その登録したい単語の前後に付属する単語やその品詞などを付加して登録する旨が記載されている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開平8−110790号公報
【特許文献2】特開平7−44188号公報
【特許文献3】特開2000−259172号公報
【特許文献4】特開平2−297247号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
特許文献3の音声認識システムでは、ユーザが登録した単語の効果はユーザ自身にのみ及ぶので、他のユーザに誤認識が発生する可能性がなくなる。しかし、ユーザがそれぞれ単独に同じ単語を登録する必要が生じ、ユーザ辞書作成における効率が低下する。
【0011】
また、特許文献4のワードプロセッサでは、同音異義語がある単語について、その前後に付属する単語やその品詞が付加されるものの、音声認識システムでは、誤認識が発生するのは、同音異義語の単語間ばかりではなく、同じような発音を有する単語間でも発生する。
【0012】
本発明は、上述の点に鑑み、新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ且つ登録の効率が高いユーザ辞書登録システム、及び、そのようなユーザ辞書登録システムで用いられる辞書登録方法、及び、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明は、上記目的を達成するために、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システムを提供する。
【発明の効果】
【0014】
本発明のユーザ辞書作成システム、方法、及び、プログラムは、既知語との間で類似性が高い未知語を登録する際に、効率が高い登録を可能にしつつ、その後に未知語と既知語との間で発生しがちな誤認識を抑制できる効果がある。
【図面の簡単な説明】
【0015】
【図1】本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムのブロック図。
【図2】本発明の第2の実施形態に係るユーザ辞書作成システムのブロック図。
【図3】本発明の第3の実施形態に係るユーザ辞書作成システムのブロック図。
【図4】本発明の第4の実施形態に係るユーザ辞書作成システムのブロック図。
【図5】類似語間で誤りが発生しやすい例を示すグラフ。
【図6】第1の実施形態で採用される登録例を示すグラフ。
【図7】特許文献1に記載のユーザ辞書作成システムのブロック図。
【発明を実施するための形態】
【0016】
本発明の最小構成のユーザ辞書作成システムは、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、算出された類似度が所定値以上のときには、文字列中の未知語の前後の文章の形態解析に基づいて、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、未知語及び環境情報を辞書に登録する登録手段と、を備える。
【0017】
本発明のユーザ辞書作成システムでは、辞書に既に登録されている登録語と所定の類似度以上の類似性を有する未知語が抽出されると、入力文字列中の未知語の前後の文章から未知語の環境情報を抽出し、その環境情報を未知語と共に辞書に登録する構成を採用する。本構成を採用することにより、その後の辞書参照の際に発生しがちな誤認識の発生を防止する。
【0018】
本発明のユーザ辞書作成システムでは、前記未知語の読みを決定する未知語読み付け手段を更に有する構成を採用できる。この場合、未知語を選択する際に、その判定が容易になる。また、実際に登録する際の処理も簡素化できる。
【0019】
本発明のユーザ辞書作成システムでは、入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する構成を採用することが出来る。この場合、既に作成された辞書の登録語の認識率の向上が可能となる。
【0020】
本発明のユーザ辞書作成システムでは、前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である構成も採用できる。未知語を登録した際に類似度が高いと判定された登録語が次に出現すると、その登録語について環境情報が付加できるので、登録語についても認識率が向上する。
【0021】
本発明のユーザ辞書作成システムでは、前記登録される環境情報が前記未知語の品詞に依存する構成を採用することが出来る。品詞によって未知語の環境が異なるため、認識率の向上が可能となる。
【0022】
本発明のユーザ辞書作成システムでは、前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも1語だけ長くする構成を採用することが出来る。この場合には、新たに登録される未知語の環境情報をよりきめ細かに登録することで、誤認識の低減が可能になる。
【0023】
以下、本発明の例示的な実施形態について図面を参照して詳細に説明する。図1は、本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムを示している。ユーザ辞書作成システムは、テキスト入力部10と、入力したテキストに音声認識用辞書50とユーザ辞書60を用いて未知語を抽出する未知語抽出部20と、抽出した未知語の中からユーザ辞書に登録する単語を抽出する未知語選択部30と、未知語を登録するユーザ辞書登録部40とを有する。音声認識システムは、このユーザ辞書作成システムと、音声認識用辞書50と、ユーザ辞書60と、音声認識手段70と、文書作成手段80とを含む。
【0024】
テキスト入力部10は、過去の議事録や発言録、報告書などのデジタル化されたファイルを入力するとテキスト情報のみを抽出し、出力するテキスト入力手段11を備えている。
【0025】
未知語抽出部20は、形態素解析手段21と、未知語抽出手段22とを含む。形態素解析手段21は、テキスト入力部10より入力されたテキストに対し、音声認識用辞書50とユーザ辞書60とを用いて形態素解析を行い、品詞を付与する。未知語抽出手段22では、形態素解析手段21で、品詞を付与できなかった単語を未知語として抽出し、未知語と該当する未知語を含む文章を保存しリスト化して、未知語選択部30に供給する。
【0026】
未知語選択部30は、未知語選択手段31と、類似度算出手段32と、環境情報抽出手段33とを含む。これらの手段はそれぞれ概略、次のように動作する。未知語選択手段31は、未知語抽出手段22で作成された未知語のリストを参照しながら、登録するか否かのユーザの判断を受け付ける。ユーザが登録すると判断した未知語には、その読みと品詞の付与をユーザ自身が行う。
【0027】
類似度算出手段32では、未知語の読みと辞書中の単語の読みの音響的特長の類似度を音素間の距離を定義したテーブルを用いて計算する。また、類似度算出手段32は、未知語の品詞と音響的特長が類似する辞書中の単語(既知語)の品詞の類似度を形態素間の距離を定義したテーブルを用いて類似度を計算する。環境情報抽出手段33では、辞書中に類似度が高い既知語が存在する未知語のみに、未知語選択手段31で付与した品詞を用いて、未知語が含まれている文の形態素解析を再度行い、未知語の前後の単語の品詞など、未知語の前後の環境条件を求める。
【0028】
ユーザ辞書登録部40は、未知語の登録手段41を含む。登録手段41は、未知語選択部30でユーザが選択した未知語をユーザ辞書60に登録する。ユーザ辞書登録部40は、未知語を登録する際に、辞書に類似度の高い単語があるものは、未知語の品詞と読み以外に、環境情報抽出手段33で求めた未知語の前後の品詞を環境情報としてユーザ辞書60に登録する。
【0029】
音声認識手段70は、音声をリアルタイムに入力して記録し、その記録した音声から50音やアルファベットなどの表音文字を認識する機能を有する。文書作成手段80は、音声認識手段70から表音文字を入力し、音声認識用辞書50及びユーザ辞書60に基づいて、表音文字から文書を作成する。
【0030】
文書作成手段80は、ユーザ辞書60を参照して文書を作成する際に、ユーザ辞書中の単語が選択されるのは、環境情報まで一致した場合のみとすることで、ユーザ辞書に類似度の高い単語を登録したことによる悪影響を極力抑えることができる。
【0031】
以下、上記第1の実施形態に係るユーザ辞書作成装置の具体的動作について詳細に説明する。まず、ユーザは、図1のテキスト入力部10のテキスト入力手段11から、認識させたい単語を含むテキストや話題が近いテキストを大量に入力する。未知語抽出部20は、形態素解析手段21にて入力されたテキストに対し音声認識用辞書50とユーザ辞書60を用いて形態素解析を行い、未知語抽出手段22で未知語を抽出し、未知語リストを作成する。
【0032】
作成された未知語リストは、未知語選択部30の未知語選択手段31を用いて、ユーザが登録の有無を選択する。登録が決まった未知語は、辞書に類似する単語があるか否かの判断を類似度算出手段32にて行う。類似する単語が発見された場合には、環境情報抽出手段33が、登録する単語の前後の品詞情報を取得する。ユーザ辞書登録部40では、未知語選択部30で選択された単語の情報をユーザ辞書60に登録する。
【0033】
図5に、環境制限を加えないで未知語を登録する際に発生しがちな誤り例を示す。図5は、ユーザが未知語“Sun”(読み:サン)を登録すると、入力された“佐藤さん。”の“さん”を“Sun”と誤認識し、“佐藤Sun。”という認識結果が出ることを示す。同様に、ユーザが未知語“ARIS”(読み:アリス)を登録すると、入力された“そうであります”の“あります”を、“ARIS”と誤認識し、“そうでARIS。”となることを示している。
【0034】
図6は、本実施形態において、既に辞書に類似度の高い単語があった場合に、登録される単語の環境情報を考慮して行われた未知語のユーザ辞書への登録内容のサンプルを示している。図6では、未知語“Sun”を登録する際には、“Sun”を固有名詞として、その読みと、記号−固有名詞−記号とを登録する旨が示されている。つまり、単語“Sun”の前後に環境情報を考慮して記号(句点)を登録することが示されている。また、語頭−固有名詞−助詞と登録する旨が示されており、未知語“Sun”が語頭にあった場合には、環境情報を考慮して、その固有名詞の後ろの助詞“が”が登録される旨が示されている。
【0035】
図6には、更に、未知語“ARIS”の登録の際には、その読みに加えて、記号−固有名詞−記号、語頭−固有名詞−助詞、又は、語頭−固有名詞−名詞が登録する旨が示されている。“ARIS”を登録する際には、このルールに従って環境情報の登録を行い、その後に“ARIS”が入力された際に、その前後の環境を調べることで、“あります”などとの間で発生する誤認識を防止する。
【0036】
第1の実施形態では、未知語を登録する際には、その登録すべき未知語と類似度の高い単語が既に辞書に登録されているか否かを判定する。次いで、既に登録されている登録後と類似度が高いと判定された未知語を登録する際には、未知語の表記、読み、品詞情報だけでなく、その未知語が出現しうる前後の品詞の環境を登録している。この構成を採用することで、未知語と類似する単語との区別を図り、認識結果に悪影響を及ぼさないように図っている。
【0037】
次に、本発明の第2の実施形態について説明する。図2を参照すると、本発明の第2の実施形態に係るユーザ辞書作成システムは、第1の実施形態のユーザ辞書作成システムとは未知語抽出手段の構成が異なっている。詳しくは、第2の実施形態の未知語抽出部20Aは、第1の実施形態における未知語抽出部20の構成に加えて、未知語読み付け手段23と未知語読み付け辞書90とを有する。その他の構成、動作については、第1の実施形態と同様である。
【0038】
未知語読み付け手段23は、未知語抽出手段22で抽出された未知語に対し、未知語読み付け辞書90を用いて未知語の読みを自動的に付与する。未知語読み付け辞書90は、1文字ごとに読みを定義したテーブルで、未知語の先頭から順にこのテーブルにある読みを付与していく。例えば、文字列“ABC”が未知語として抽出された場合には、“ABC”を1文字ずつに分割し、未知語読み付け辞書90にある“A(えー)”、“B(びー)”、“C(しー)”の読みを付与する。
【0039】
上記構成により、ユーザが未知語選択手段31で、登録する未知語を選んだ時には、既になんらかの読みがその未知語に付与された状態である。このため、最初から全ての読みを登録する場合に比べ、登録する手間を軽減することができる。
【0040】
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。図3を参照すると、本発明の第3の実施形態に係るユーザ辞書作成システムは、第1の実施形態におけるユーザ辞書作成システムとは、未知語選択部の構成が異なる。詳しくは、本実施形態の未知語選択部30Aは、未知語選択手段31と、類似度算出手段34と、環境情報抽出手段35とを有する。未知語選択手段31の構成及び動作は、第1の実施形態の未知語選択手段と同様である。
【0041】
本実施形態では、類似度算出手段34は、第1の実施形態における類似度算出手段32と同様に類似度を算出する機能を有し、且つ、辞書中に類似する単語が見つかったときには、その単語が音声認識用辞書50とユーザ辞書60のどちらに存在しているかを判別する。環境情報抽出手段35は、類似度算出手段34により類似する単語がユーザ辞書60に登録されていると判定されると、新しく登録する単語はユーザ辞書に登録されている類似する単語の環境情報よりも前及び/又は後に、1語ずつ多くの環境情報を保持させるようにする。
【0042】
第3の実施形態では、登録したい単語が、音声認識用辞書ではなく、ユーザ辞書に既に登録された単語との間で類似性が高い場合でも、誤認識の発生を低減することができる。
【0043】
次に、本発明の第4の実施形態について説明する。図4を参照すると、第4の実施形態に係るユーザ辞書作成システムでは、未知語抽出部20Bが、第1の実施形態の未知語抽出部20の構成に加えて、登録単語抽出手段24を有する。本実施形態における他の構成および動作については第1の実施形態と同様である。
【0044】
登録単語抽出手段24は、ユーザ辞書60に登録されている単語の環境情報を追加するための手段である。登録単語抽出手段24は、形態素解析手段21により解析された文字列中にユーザ辞書に既に登録された単語が含まれていると、ユーザ辞書60の中身を検索し当該単語の環境情報を確認し、登録されていない環境情報である場合には、ユーザ辞書登録部40を介してユーザ辞書60に登録する。また、環境情報が登録されていても、識別が充分でない場合には、登録されている環境情報に加えて、又は、これに代えて、新たに環境情報を登録する。
【0045】
第4の実施形態では、既にユーザ辞書に登録された単語の環境情報を、その後の情報に基づいて、後からでも拡充又は変更することが出来る。このため、更なる認識率の向上が期待できる。
【0046】
本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付の特許請求の範囲に規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。
【産業上の利用可能性】
【0047】
本発明は、ユーザ辞書を用いてシステム構築後もユーザの用途に合わせて必要な単語を随時登録することができる高精度な音声認識性能が要求される音声認識システム、及び、その辞書登録装置に適している。
【符号の説明】
【0048】
10:テキスト入力部
11:テキスト入力手段
20、20A、20B:未知語抽出部
21:形態素解析手段
22:未知語抽出手段
23:未知語読み付け手段
24:登録単語抽出手段
30、30A:未知語選択部
31:未知語選択手段
32、34:類似度算出手段
33、35:環境情報抽出手段
40:ユーザ辞書登録部
41:登録手段
50:音声認識用辞書
60:ユーザ辞書
70:音声認識手段
80:文章作成手段
90:未知語読み付け辞書

【特許請求の範囲】
【請求項1】
文字列を入力するテキスト入力手段と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、
前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システム。
【請求項2】
前記未知語の読みを決定する未知語読み付け手段を更に有する、請求項1に記載のユーザ辞書作成システム。
【請求項3】
入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、
前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、
前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する、請求項1又は2に記載のユーザ辞書作成システム。
【請求項4】
前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である、請求項3に記載のユーザ辞書作成システム。
【請求項5】
前記登録される環境情報が前記未知語の品詞に依存する、請求項1〜4の何れか一に記載のユーザ辞書作成システム。
【請求項6】
前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも1語だけ長くする、請求項1〜5の何れか一に記載のユーザ辞書作成システム。
【請求項7】
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を有するユーザ辞書作成方法。
【請求項8】
コンピュータに、
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を実行させるユーザ辞書作成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−237351(P2010−237351A)
【公開日】平成22年10月21日(2010.10.21)
【国際特許分類】
【出願番号】特願2009−84096(P2009−84096)
【出願日】平成21年3月31日(2009.3.31)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】