禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ

【課題】ユーザの発した不用意な発言の発信をリアルタイムに防止する方法及び電話機を提供すること。
【解決手段】禁止語発信防止電話（１０）は、ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部（３１）と、蓄積した音声を音声認識し、単語レベルに分析する音声分析部（３２）と、分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部（３３）と、一致すると判定された部分を特定する禁止語音声発話時間測定部（３５）と、特定された部分をダミー音に置換する禁止語置換部（３６）と、置換した部分を含む音声を送信する送信部（１３）と、を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、ユーザの発した不用意な発言を相手先に発信することを防止する方法、当該機能を有する電話、及び当該機能を有するサーバに関する。
【背景技術】
【０００２】
近年、通信回線を用いた通話は、携帯電話の普及に伴い子供から老人まで幅広い年齢のユーザに用いられるようになった。ここで、年少の子供が電話を用いると、うっかり自宅の住所や電話番号を発してしまう場合があり、このような場合には意図せずにユーザの個人情報が流出してしまう。また、通話中に感情が昂ぶったときには、相手方を不快にさせる発言をしてしまう場合があり、このような場合には相手との人間関係をこじらせる原因となってしまうおそれがあった。そのため、通話の際に使用が禁止されている語句を適切に管理する技術が求められている。
【０００３】
このような現実のもと、特許文献１には、コールセンタにおいて使用が禁止されている語句を発言した場合に、この語句を顕著化し確認作業の効率を向上させる技術が開示されている。
【特許文献１】特開２００７−６８０４４号公報
【発明の開示】
【発明が解決しようとする課題】
【０００４】
しかしながら、上記のような技術は、禁止された語句を発していたか否かを、業務終了後の確認作業において容易にチェックすることを目的とするものであり、禁止された語句を発すること自体を防止することはできない。
【０００５】
本発明は、このような問題に鑑みて提案されたものであり、その目的は、ユーザの発した不用意な発言の発信をリアルタイムに防止する方法及び電話機を提供することにある。
【課題を解決するための手段】
【０００６】
本発明では、以下のような解決手段を提供する。
【０００７】
（１）ユーザが発した不用意な発言についての音声の発信を防止する方法であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声蓄積ステップと、
前記音声を音声認識し、単語レベルに分析する音声分析ステップと、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する判定ステップと、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する時間特定ステップと、
前記特定された部分の音声をダミー音に置換する置換ステップと、
置換した部分を含む音声を発信する発信ステップと、
を含むことを特徴とする方法。
【０００８】
（１）記載の方法によれば、判定ステップは、一時的に蓄積された音声の認識結果である単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する。そして、一致すると判定した場合には、一時的に蓄積された音声は、時間特定ステップが特定した当該部分を、置換ステップがダミー音（例えば、「ピーッ」という音）に置換した上で、発信ステップにより発信される。これにより、ユーザが不用意な発言をした場合であっても、リアルタイムにこの不用意な発言をダミー音に置換することができ、不用意な発言の発信を防止することができる。
【０００９】
（２）（１）記載の方法において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換するテキスト変換ステップを更に含み、
前記判定ステップは、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記時間特定ステップは、前記判定ステップにより一致すると判定された部分を特定することを特徴とする方法。
【００１０】
（２）記載の方法によれば、判定ステップは、音声を用いた判定のほか、言語モデルを用いて変換されたテキストを用いて、不用意な発言であるか否かを判定することができる。これにより、（１）記載の方法に比べてより精度を高めることができる。
【００１１】
（３）（１）又は（２）記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記アドレス帳に記載された情報に基づいて、前記不用意な発言についての音声の発信を防止するか否かを判定するステップを更に含むことを特徴とする方法。
【００１２】
（３）記載の方法によれば、不用意な発言の防止を行うか否かについて、対人関係を考慮することができる。
【００１３】
（４）（１）又は（２）記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記不用意な発言のカテゴリーとして、個人情報及び他者を不快にさせる使用禁止語を少なくとも含み、
前記判定ステップは、前記アドレス帳及び前記カテゴリーを参照して、前記判定を行うことを特徴とする方法。
【００１４】
（４）記載の方法によれば、不用意な発言のカテゴリー及び対人関係を考慮して、不用意な発言の防止を行うことができる。例えば、知人には個人情報の発信を行う一方で、不快にさせる発言の発信を防止することができる。
【００１５】
（５）ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止電話であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止電話。
【００１６】
（６）（５）記載の禁止語発信防止電話において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換する音声／テキスト変換部を更に備え、
前記禁止語判定部は、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記禁止語音声発話時間測定部は、前記禁止語判定部により一致すると判定された部分を特定することを特徴とする禁止語発信防止電話。
【００１７】
（５）、（６）記載の禁止語発信防止電話によれば、（１）、（２）記載の方法と同様の効果を奏することができる。
【００１８】
（７）通信回線を解した音声の通信を管理し、ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止サーバであって、
音声を発信したユーザを判定する発信ユーザ判定部と、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、前記発信ユーザ判定部により判定されたユーザについての予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止サーバ。
【００１９】
（７）記載の禁止語発信防止サーバによれば、（１）記載の方法と同様の効果を奏することができる。
【発明の効果】
【００２０】
本発明によれば、ユーザの発した不用意な発言の発信をリアルタイムに防止することができる。
【発明を実施するための最良の形態】
【００２１】
［第１実施形態］
図１〜図５を参照して、本発明の好適な一実施形態である禁止語発信防止方法及び禁止語発信防止電話について説明する。なお、本実施の形態では、禁止語発信防止装置３０が組み込まれた携帯電話を用いて禁止語発信防止電話について説明するが、禁止語発信防止電話は携帯電話に限らず、固定電話に用いることも可能である。
【００２２】
［禁止語発信防止電話１０の全体構成］
図１は、本実施の形態における禁止語発信防止電話１０の概略を示した図である。禁止語発信防止電話１０は、ユーザが発した音声の入力を受け付けるマイク１１と、入力された音声を既存の通信回線を解して相手ユーザに送信する送信部１３と、ユーザが発した音声のうち不用意な発言である禁止語を除外する機能を有する禁止語発信防止装置３０と、を備える。なお、図示は省略するが、携帯電話１０は、ユーザの発した音声をデジタル信号に変換するＡ／Ｄ変換部も備えている。
【００２３】
「禁止語」とは、例えば、住所、電話番号、誕生日などの個人情報や、相手を不快にさせる言葉、例えば、卑猥語、侮辱語、差別語など予め定められた使用禁止語が挙げられる。なお、個人情報及び使用禁止語は禁止語の一例であり、禁止語の種別は個人情報及び使用禁止語に限定されるものではない。
【００２４】
禁止語発信防止装置３０は、音声一時蓄積部３１と、音声分析部３２と、禁止語音声判定部３３と、禁止語音素モデル３４と、禁止語音声発話時間測定部３５と、禁止語置換部３６と、を備える。
【００２５】
音声一時蓄積部３１は、デジタル化された音声を一時的に蓄積する。音声分析部３２は、蓄積された音声を連続音声認識により分析する。なお、音声分析部３２の概要については図２において後述する。禁止語音声判定部３３は、音声認識の結果が禁止語音素モデル３４（図３参照）に挙げられた音素モデルと一致するか否かを判定する。即ち、禁止語音声判定部３３は、禁止語か否かを音声のまま判定する。禁止語音声発話時間測定部３５は、禁止語と判定された音声の発話時間、即ち、蓄積された音声のうち禁止語に該当する部分を特定する。禁止語置換部３６は、特定された禁止語に該当する部分の音声をダミー音に置換する。
【００２６】
［音声分析部３２の概要］
図２を参照して、音声分析部３２による連続音声認識について説明する。なお、この技術は従来公知の技術であり、例えば、「ねっとテクノロジー解体新書５画像・音声処理技術（古井貞熙・酒井善則著株式会社電波新聞社２００４年１月２５日第１版発行）」に記載されているため、図中の以下のステップＳ１〜Ｓ４ではその概略のみ説明する。
【００２７】
Ｓ１：蓄積されたデジタル音声を所定の時間間隔（２ｍｓ〜４ｍｓ）で複数のフレームに区分し、区分した各フレームからパワー成分を抽出する。抽出したパワー成分が所定の閾値を超えたフレームを音声区間として検出する。
【００２８】
Ｓ２：検出された音声区間の音声スペクトルをフーリエ変換し、音響特徴ベクトルを抽出する。
【００２９】
Ｓ３：抽出した音響特徴ベクトルと音素モデルとを参照して、フレーム毎の連続音素認識を行い、音素レベルの認識を行う。なお、音素モデルとしては、隠れマルコフモデル（ＨＭＭ）を適用することができる。
【００３０】
Ｓ４：音素レベルにまで認識された音声を、各単語の発音をモデル化した単語辞書を参照して、単語レベルに分析する。
【００３１】
［禁止語音素モデル３４］
図３は、禁止語音素モデル３４の一例を示す図である。
【００３２】
禁止語音素モデル３４は、禁止語カテゴリー毎に禁止語音素モデルを格納している。例えば、禁止語カテゴリーの個人情報には、住所を示す「ｔｏｏｋｊｏｏｔｏ・・・(東京都・・・)」などが格納されている。音声分析部３２による音声認識の結果出力される単語レベルの分析が、禁止語音素モデル３４に格納される禁止語音素モデルと一致する場合には、禁止語であると判定される。
【００３３】
［禁止語発信防止電話１０の主なハードウェア構成］
図４は、禁止語発信防止電話１０の主なハードウェア構成を示す概略図である。
【００３４】
禁止語発信防止電話１０はバス２２を有する。バス２２には、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２３、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２４、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２５、入力装置２６、通信装置２７及び表示装置２８が接続されている。
【００３５】
ＣＰＵ２３は、ＲＯＭ２５に記憶された各種プログラムを適宜読み出して実行することにより、各ハードウェアと協働し、各種機能を実現している。ＲＡＭ２４は、プログラムの実行に使用するローカルメモリである。入力装置２６は、ユーザによる入力の受付を行うものであり、マイク、キーボードなどを含んでよい。表示装置２８は、ユーザにデータの入力を受け付ける画面を表示するものであり、液晶表示装置（ＬＣＤ）などのディスプレイ装置を含む。
【００３６】
［禁止語発信防止電話１０の基本動作］
図５は、禁止語発信防止電話１０における処理の流れの詳細（ステップＳ２０１〜Ｓ２０７）を示した図である。
【００３７】
Ｓ２０１：ＣＰＵ２３は、ＲＡＭ２４（音声一時蓄積部３１）にユーザが発した音声をデジタル化したデジタル音声データを蓄積する。
【００３８】
Ｓ２０２：ＣＰＵ２３（音声分析部３２）は、ＲＡＭ２４に蓄積したデジタル音声データの音声認識を行う。なお、音声認識の概要は図２において説明したとおりである。この処理により、ユーザが発した音声を単語レベルで認識することができる。
【００３９】
Ｓ２０３、Ｓ２０４：ＣＰＵ２３（禁止語音声判定部３３）は、認識された各単語についての音声が、予め定められた禁止語音素モデルと一致するか否かを判定する。即ち、ユーザが発した音声に個人情報や使用禁止語などからなる禁止語が含まれるか否かを判定する。
【００４０】
Ｓ２０５：上記判定の結果、禁止語が含まれる場合には、ＣＰＵ２３（禁止語音声発話時間測定部３５）は、禁止語と判定された音声の発話時間を測定する。
【００４１】
Ｓ２０６：ＣＰＵ２３（禁止語置換部３６）は、禁止語と判定された部分の音声をダミー音に置換する。
【００４２】
Ｓ２０７：通信装置２７（送信部１３）は、置換されたダミー音を含むデジタル音声データを通信回線を解して相手ユーザに送信する。
【００４３】
これにより、通話中の音声に禁止語が含まれる場合に、リアルタイムでこの禁止語をダミー音に置換することができる。その結果、住所・電話番号などの個人情報を相手ユーザに伝えてしまうことを防止でき、防犯に貢献することができる。また、相手を不快にさせる使用禁止語を誤って発声してしまった場合であっても、この使用禁止語をリアルタイムでダミー音に置換することができるため、相手を不快にさせずにすむ。
【００４４】
［第２実施形態］
次に、図６を参照して、本発明の第２実施形態の禁止語発信防止方法及び禁止語発信防止電話について説明する。近年における電話機には知人の電話番号などを記憶したアドレス帳が設けられているところ、第２実施形態では禁止語をダミー音に置換するか否かをアドレス帳を用いて判定する点に特徴を有している。
なお、禁止語発信防止電話１０Ａのハードウェア構成は、禁止語発信防止電話１０のハードウェア構成と同じであるため、説明を省略する。
【００４５】
［禁止語発信防止電話１０Ａの全体構成］
図６（１）は、第２実施形態における禁止語発信防止電話１０Ａの概略を示した図である。禁止語発信防止電話１０Ａは、第１実施形態の禁止語発信防止電話１０に加え、アドレス帳１５を備えている。アドレス帳１５には、ユーザの知人の電話番号などの情報が格納されている。禁止語発信防止装置３０は、アドレス帳１５に格納されている情報を用いて禁止語をダミー音に置換するか否かを判定する。
【００４６】
［禁止語発信防止電話１０Ａの基本動作］
図６（２）は、禁止語発信防止電話１０Ａにおける処理の流れの詳細（ステップＳ２０１〜Ｓ２０７、Ｓ２１１）を示した図である。なお、禁止語発信防止電話１０Ａにおける処理では、禁止語発信防止電話１０における処理のうちＳ２０２とＳ２０３との間の処理にアドレス帳を用いた判定処理が設けられている（Ｓ２１１）。以下、禁止語発信防止電話１０における処理との相違部分について説明する。
【００４７】
Ｓ２１１：音声分析部３２が、音声一時蓄積部３１に蓄積されたデジタル音声データの音声認識を行うと、ＣＰＵ２３（登録判定部４１）は、通信先の相手ユーザの電話番号がアドレス帳１５に登録された電話番号であるか否かを判定する。この判定がＹＥＳのときは、ＣＰＵ２３は禁止語判定（Ｓ２０３）〜音声送信（Ｓ２０７）の処理を行い、ＮＯのときはダミー音に置換することなく音声送信（Ｓ２０７）の処理を行う。
【００４８】
このように、本実施の形態における禁止語発信防止方法及び禁止語発信防止電話１０Ａによれば、未登録の通話先に通話するときだけ禁止語発信防止機能を作動させるようにすることができる。なお、アドレス帳における判定の処理（Ｓ２１１）を音声認識の処理（Ｓ２０２）の後に行っているが、これに限られるものではない。例えば、音声認識の処理の前に行うこととしてもよい。これにより、禁止語発信防止機能を作動させる必要がない場合には、音声認識を行うことなく直ちに音声データを送信することができる。
【００４９】
また、アドレス帳に登録された通話先である場合には禁止語発信防止機能を作動させないこととしているが、これに限られるものではない。具体的には、禁止語カテゴリー「個人情報」については、アドレス帳に登録された知人に知らせてもよいが、アドレス帳に未登録の通話先には知られては問題となる場合がある。他方、禁止語カテゴリー「使用禁止語」については、アドレス帳に登録された知人に使用した場合に人間関係において問題となる場合がある。
【００５０】
そこで、アドレス帳の登録と禁止語カテゴリーの情報とを参照し、禁止語発信防止機能を作動させるか否かを判定することとしてもよい。この場合には、禁止語判定の処理（Ｓ２０３）が行われた後、ＣＰＵ２３（登録判定部４１、禁止語音声判定部３３）が、アドレス帳の登録と禁止語カテゴリーの情報とを参照した判定を行うことで実現することができる。
【００５１】
［第３実施形態］
次に、図７〜図９を参照して、第３実施形態における禁止語発信防止電話１０Ｃについて説明する。上記実施形態においては、禁止語であるか否かの判定を、（１）音声（禁止語音素モデル）により判定していたが、本実施の形態では、（１）音声に基づく判定に加え、（２）言語モデルを考慮したテキストに基づく判定を行うことに特徴を有している。
なお、禁止語発信防止電話１０Ｃのハードウェア構成は、禁止語発信防止電話１０のハードウェア構成と同じであるため、説明を省略する。
【００５２】
［禁止語発信防止電話１０Ｃの全体構成］
図７は、第３実施形態における禁止語発信防止電話１０Ｃの概略を示した図である。なお、上記実施形態における禁止語発信防止電話１０と同様の構成については同一の符号を付し説明を省略する。
【００５３】
禁止語発信防止電話１０Ｃは、禁止語発信防止電話１０の構成に加え、言語モデル５１と、音声／テキスト変換部５２と、禁止語テキスト判定部５３と、禁止語テキストリスト５４と、を備える。
【００５４】
言語モデル５１は、単語のそれぞれについて出現確率・接続確率をデータ化したものであり、構文知識（文法的構造）、意味知識（単語間の関係や属性）、文脈知識（会話の流れ）、会話の一般的知識をモデル化したものである。禁止語（特に使用禁止語）は訛りや方言によって異なることがあり、全ての禁止語の音声データを予め網羅的に洗い出すことができない場合に言語モデルを用いると好適である。
【００５５】
なお、２００８年度の日本音響学会春季大会において掲載された論文「複数の話題言語モデルによる音声認識結果の事後統合（著磯健一）」に記載されているように、複数の話題言語モデルを用いて独立に発話をデコードし、発話単位に最良スコアの仮説を事後選択することで、単一の汎用言語モデルや話題言語モデルを用いるよりも、認識結果について高い精度を得ることができる。よって、言語モデル５１には、複数の話題言語モデルが用いられることが好ましい。
【００５６】
音声／テキスト変換部５２は、音声分析部３２が分析した音声を、言語モデル５１を用いてテキストに変換する。禁止語テキスト判定部５３は、変換されたテキストが禁止語テキストリスト５４に挙げられた禁止語テキストと一致するか否かを判定する。なお、禁止語テキストリスト５４は、図８に示すように、禁止語カテゴリー毎に禁止語テキストを格納している。
【００５７】
［禁止語発信防止電話１０Ｃの基本動作］
図９は、禁止語発信防止電話１０Ｃにおける処理の流れの詳細（ステップＳ２０１〜Ｓ２０７、Ｓ２５１〜Ｓ２５３）を示した図である。なお、禁止語発信防止電話１０Ｃは、（１）音声に基づく判定に加え、（２）言語モデルを考慮したテキストに基づく判定を行うところ、（１）音声に基づく判定（Ｓ２０２〜Ｓ２０５）については第１実施形態の処理と同一であるため、説明を省略する。以下では、本実施の形態における特徴部分である（２）言語モデルを考慮したテキストに基づく判定の処理について説明する。
【００５８】
Ｓ２５１：ＣＰＵ２３（音声／テキスト変換部５２）は、音声分析部３２により認識された音声を言語モデル５１を用いてテキストに変換する。
【００５９】
Ｓ２５２、Ｓ２５３：ＣＰＵ２３（禁止語テキスト判定部５３）は、変換されたテキストが、予め定められた禁止語テキストと一致するか否かを判定する。そして、禁止語テキストと一致する場合には、Ｓ２０５、Ｓ２０６の処理が行われる。
【００６０】
このように、本実施の形態における禁止語発信防止電話１０Ｃによれば、音声だけでなく、音声を言語モデルを用いて変換したテキストをも用いて禁止語の判定を行うことができる。そのため、ユーザが発した音声に禁止語が含まれるか否かの判定を、音声のみによる判定よりも高い精度で行うことができる。
【００６１】
なお、本実施の形態においても、アドレス帳を用いた判定を行うことができ、また、アドレス帳及び禁止語カテゴリーを用いた判定を行うことができる。
【００６２】
（変形形態）
上記実施形態においては、禁止語発信防止装置がユーザの所有する電話に格納されるものを一例として説明したが、電話回線を相互接続し電話網を構成するための交換機やＩＰ電話におけるサーバに格納することとしてもよい。
【００６３】
［禁止語発信防止交換機／サーバ６０の全体構成］
図１０は、禁止語発信防止装置３０Ｃを格納した禁止語発信防止交換機／サーバ６０の概略を示した図である。なお、上記実施形態における禁止語発信防止電話１０と同様の構成については同一の符号を付し説明を省略する。また、禁止語発信防止交換機／サーバ６０は、ユーザの電話と通信するための通信部を備えているが図示は省略する。
【００６４】
禁止語発信防止交換機／サーバ６０の禁止語発信防止装置３０Ｃは、禁止語発信防止装置３０の構成に加え、発信ユーザ判定部６１と禁止語音素モデルＤＢ３４Ｃとを備える。発信ユーザ判定部６１は、音声を発信したユーザを特定する。禁止語音素モデルＤＢ３４Ｃは、禁止語カテゴリー毎の禁止語音素モデルをユーザ毎に対応付けて格納する。
【００６５】
なお、禁止語発信防止交換機／サーバ６０においても、（１）音声に基づく判定に加え、（２）言語モデルを考慮したテキストに基づく判定を行うこととしてもよく、また、ユーザ毎のアドレス帳を備え、アドレス帳を用いた判定、アドレス帳及び禁止語カテゴリーを用いた判定を行うこととしてもよい。
【００６６】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。例えば、ＴＶやラジオの生放送において放送禁止用語を出演者がうっかり発言してしまうことを防止する手段としても用いることができる。
【図面の簡単な説明】
【００６７】
【図１】本発明の実施形態における禁止語発信防止電話の機能構成を示す図である。
【図２】上記実施形態における音声分析部の模式図である。
【図３】上記実施形態における禁止語音素モデルを示す図である。
【図４】上記実施形態における禁止語発信防止電話のハードウェア構成を示す図である。
【図５】上記実施形態における禁止語発信防止電話の処理のフローチャートである。
【図６】第２実施形態における禁止語発信防止電話の機能構成及び処理を示す図である。
【図７】第３実施形態における禁止語発信防止電話の機能構成を示す図である。
【図８】上記実施形態における禁止語テキストリストを示す図である。
【図９】上記実施形態における禁止語発信防止電話の処理のフローチャートである。
【図１０】禁止語発信防止交換機及びサーバの機能構成を示す図である。
【符号の説明】
【００６８】
１０禁止語発信防止電話
３０禁止語発信防止装置
３１音声一時蓄積部
３２音声分析部
３３禁止語音声判定部
３４禁止語音素モデル
３５禁止語音声発話時間測定部
３６禁止語置換部

【特許請求の範囲】
【請求項１】
ユーザが発した不用意な発言についての音声の発信を防止する方法であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声蓄積ステップと、
前記音声を音声認識し、単語レベルに分析する音声分析ステップと、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する判定ステップと、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する時間特定ステップと、
前記特定された部分の音声をダミー音に置換する置換ステップと、
置換した部分を含む音声を発信する発信ステップと、
を含むことを特徴とする方法。
【請求項２】
請求項１記載の方法において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換するテキスト変換ステップを更に含み、
前記判定ステップは、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記時間特定ステップは、前記判定ステップにより一致すると判定された部分を特定することを特徴とする方法。
【請求項３】
請求項１又は２記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記アドレス帳に記載された情報に基づいて、前記不用意な発言についての音声の発信を防止するか否かを判定するステップを更に含むことを特徴とする方法。
【請求項４】
請求項１又は２記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記不用意な発言のカテゴリーとして、個人情報及び他者を不快にさせる使用禁止語を少なくとも含み、
前記判定ステップは、前記アドレス帳及び前記カテゴリーを参照して、前記判定を行うことを特徴とする方法。
【請求項５】
ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止電話であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止電話。
【請求項６】
請求項５記載の禁止語発信防止電話において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換する音声／テキスト変換部を更に備え、
前記禁止語判定部は、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記禁止語音声発話時間測定部は、前記禁止語判定部により一致すると判定された部分を特定することを特徴とする禁止語発信防止電話。
【請求項７】
通信回線を解した音声の通信を管理し、ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止サーバであって、
音声を発信したユーザを判定する発信ユーザ判定部と、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、前記発信ユーザ判定部により判定されたユーザについての予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止サーバ。

【図１】