説明

禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ

【課題】ユーザの発した不用意な発言の発信をリアルタイムに防止する方法及び電話機を提供すること。
【解決手段】禁止語発信防止電話(10)は、ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部(31)と、蓄積した音声を音声認識し、単語レベルに分析する音声分析部(32)と、分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部(33)と、一致すると判定された部分を特定する禁止語音声発話時間測定部(35)と、特定された部分をダミー音に置換する禁止語置換部(36)と、置換した部分を含む音声を送信する送信部(13)と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの発した不用意な発言を相手先に発信することを防止する方法、当該機能を有する電話、及び当該機能を有するサーバに関する。
【背景技術】
【0002】
近年、通信回線を用いた通話は、携帯電話の普及に伴い子供から老人まで幅広い年齢のユーザに用いられるようになった。ここで、年少の子供が電話を用いると、うっかり自宅の住所や電話番号を発してしまう場合があり、このような場合には意図せずにユーザの個人情報が流出してしまう。また、通話中に感情が昂ぶったときには、相手方を不快にさせる発言をしてしまう場合があり、このような場合には相手との人間関係をこじらせる原因となってしまうおそれがあった。そのため、通話の際に使用が禁止されている語句を適切に管理する技術が求められている。
【0003】
このような現実のもと、特許文献1には、コールセンタにおいて使用が禁止されている語句を発言した場合に、この語句を顕著化し確認作業の効率を向上させる技術が開示されている。
【特許文献1】特開2007−68044号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記のような技術は、禁止された語句を発していたか否かを、業務終了後の確認作業において容易にチェックすることを目的とするものであり、禁止された語句を発すること自体を防止することはできない。
【0005】
本発明は、このような問題に鑑みて提案されたものであり、その目的は、ユーザの発した不用意な発言の発信をリアルタイムに防止する方法及び電話機を提供することにある。
【課題を解決するための手段】
【0006】
本発明では、以下のような解決手段を提供する。
【0007】
(1) ユーザが発した不用意な発言についての音声の発信を防止する方法であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声蓄積ステップと、
前記音声を音声認識し、単語レベルに分析する音声分析ステップと、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する判定ステップと、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する時間特定ステップと、
前記特定された部分の音声をダミー音に置換する置換ステップと、
置換した部分を含む音声を発信する発信ステップと、
を含むことを特徴とする方法。
【0008】
(1)記載の方法によれば、判定ステップは、一時的に蓄積された音声の認識結果である単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する。そして、一致すると判定した場合には、一時的に蓄積された音声は、時間特定ステップが特定した当該部分を、置換ステップがダミー音(例えば、「ピーッ」という音)に置換した上で、発信ステップにより発信される。これにより、ユーザが不用意な発言をした場合であっても、リアルタイムにこの不用意な発言をダミー音に置換することができ、不用意な発言の発信を防止することができる。
【0009】
(2) (1)記載の方法において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換するテキスト変換ステップを更に含み、
前記判定ステップは、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記時間特定ステップは、前記判定ステップにより一致すると判定された部分を特定することを特徴とする方法。
【0010】
(2)記載の方法によれば、判定ステップは、音声を用いた判定のほか、言語モデルを用いて変換されたテキストを用いて、不用意な発言であるか否かを判定することができる。これにより、(1)記載の方法に比べてより精度を高めることができる。
【0011】
(3) (1)又は(2)記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記アドレス帳に記載された情報に基づいて、前記不用意な発言についての音声の発信を防止するか否かを判定するステップを更に含むことを特徴とする方法。
【0012】
(3)記載の方法によれば、不用意な発言の防止を行うか否かについて、対人関係を考慮することができる。
【0013】
(4) (1)又は(2)記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記不用意な発言のカテゴリーとして、個人情報及び他者を不快にさせる使用禁止語を少なくとも含み、
前記判定ステップは、前記アドレス帳及び前記カテゴリーを参照して、前記判定を行うことを特徴とする方法。
【0014】
(4)記載の方法によれば、不用意な発言のカテゴリー及び対人関係を考慮して、不用意な発言の防止を行うことができる。例えば、知人には個人情報の発信を行う一方で、不快にさせる発言の発信を防止することができる。
【0015】
(5) ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止電話であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止電話。
【0016】
(6) (5)記載の禁止語発信防止電話において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換する音声/テキスト変換部を更に備え、
前記禁止語判定部は、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記禁止語音声発話時間測定部は、前記禁止語判定部により一致すると判定された部分を特定することを特徴とする禁止語発信防止電話。
【0017】
(5)、(6)記載の禁止語発信防止電話によれば、(1)、(2)記載の方法と同様の効果を奏することができる。
【0018】
(7) 通信回線を解した音声の通信を管理し、ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止サーバであって、
音声を発信したユーザを判定する発信ユーザ判定部と、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、前記発信ユーザ判定部により判定されたユーザについての予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止サーバ。
【0019】
(7)記載の禁止語発信防止サーバによれば、(1)記載の方法と同様の効果を奏することができる。
【発明の効果】
【0020】
本発明によれば、ユーザの発した不用意な発言の発信をリアルタイムに防止することができる。
【発明を実施するための最良の形態】
【0021】
[第1実施形態]
図1〜図5を参照して、本発明の好適な一実施形態である禁止語発信防止方法及び禁止語発信防止電話について説明する。なお、本実施の形態では、禁止語発信防止装置30が組み込まれた携帯電話を用いて禁止語発信防止電話について説明するが、禁止語発信防止電話は携帯電話に限らず、固定電話に用いることも可能である。
【0022】
[禁止語発信防止電話10の全体構成]
図1は、本実施の形態における禁止語発信防止電話10の概略を示した図である。禁止語発信防止電話10は、ユーザが発した音声の入力を受け付けるマイク11と、入力された音声を既存の通信回線を解して相手ユーザに送信する送信部13と、ユーザが発した音声のうち不用意な発言である禁止語を除外する機能を有する禁止語発信防止装置30と、を備える。なお、図示は省略するが、携帯電話10は、ユーザの発した音声をデジタル信号に変換するA/D変換部も備えている。
【0023】
「禁止語」とは、例えば、住所、電話番号、誕生日などの個人情報や、相手を不快にさせる言葉、例えば、卑猥語、侮辱語、差別語など予め定められた使用禁止語が挙げられる。なお、個人情報及び使用禁止語は禁止語の一例であり、禁止語の種別は個人情報及び使用禁止語に限定されるものではない。
【0024】
禁止語発信防止装置30は、音声一時蓄積部31と、音声分析部32と、禁止語音声判定部33と、禁止語音素モデル34と、禁止語音声発話時間測定部35と、禁止語置換部36と、を備える。
【0025】
音声一時蓄積部31は、デジタル化された音声を一時的に蓄積する。音声分析部32は、蓄積された音声を連続音声認識により分析する。なお、音声分析部32の概要については図2において後述する。禁止語音声判定部33は、音声認識の結果が禁止語音素モデル34(図3参照)に挙げられた音素モデルと一致するか否かを判定する。即ち、禁止語音声判定部33は、禁止語か否かを音声のまま判定する。禁止語音声発話時間測定部35は、禁止語と判定された音声の発話時間、即ち、蓄積された音声のうち禁止語に該当する部分を特定する。禁止語置換部36は、特定された禁止語に該当する部分の音声をダミー音に置換する。
【0026】
[音声分析部32の概要]
図2を参照して、音声分析部32による連続音声認識について説明する。なお、この技術は従来公知の技術であり、例えば、「ねっとテクノロジー解体新書5 画像・音声処理技術(古井貞熙・酒井善則 著 株式会社 電波新聞社 2004年1月25日 第1版発行)」に記載されているため、図中の以下のステップS1〜S4ではその概略のみ説明する。
【0027】
S1:蓄積されたデジタル音声を所定の時間間隔(2ms〜4ms)で複数のフレームに区分し、区分した各フレームからパワー成分を抽出する。抽出したパワー成分が所定の閾値を超えたフレームを音声区間として検出する。
【0028】
S2:検出された音声区間の音声スペクトルをフーリエ変換し、音響特徴ベクトルを抽出する。
【0029】
S3:抽出した音響特徴ベクトルと音素モデルとを参照して、フレーム毎の連続音素認識を行い、音素レベルの認識を行う。なお、音素モデルとしては、隠れマルコフモデル(HMM)を適用することができる。
【0030】
S4:音素レベルにまで認識された音声を、各単語の発音をモデル化した単語辞書を参照して、単語レベルに分析する。
【0031】
[禁止語音素モデル34]
図3は、禁止語音素モデル34の一例を示す図である。
【0032】
禁止語音素モデル34は、禁止語カテゴリー毎に禁止語音素モデルを格納している。例えば、禁止語カテゴリーの個人情報には、住所を示す「tookjooto・・・(東京都・・・)」などが格納されている。音声分析部32による音声認識の結果出力される単語レベルの分析が、禁止語音素モデル34に格納される禁止語音素モデルと一致する場合には、禁止語であると判定される。
【0033】
[禁止語発信防止電話10の主なハードウェア構成]
図4は、禁止語発信防止電話10の主なハードウェア構成を示す概略図である。
【0034】
禁止語発信防止電話10はバス22を有する。バス22には、CPU(Central Processing Unit)23、RAM(Random Access Memory)24、ROM(Read Only Memory)25、入力装置26、通信装置27及び表示装置28が接続されている。
【0035】
CPU23は、ROM25に記憶された各種プログラムを適宜読み出して実行することにより、各ハードウェアと協働し、各種機能を実現している。RAM24は、プログラムの実行に使用するローカルメモリである。入力装置26は、ユーザによる入力の受付を行うものであり、マイク、キーボードなどを含んでよい。表示装置28は、ユーザにデータの入力を受け付ける画面を表示するものであり、液晶表示装置(LCD)などのディスプレイ装置を含む。
【0036】
[禁止語発信防止電話10の基本動作]
図5は、禁止語発信防止電話10における処理の流れの詳細(ステップS201〜S207)を示した図である。
【0037】
S201:CPU23は、RAM24(音声一時蓄積部31)にユーザが発した音声をデジタル化したデジタル音声データを蓄積する。
【0038】
S202:CPU23(音声分析部32)は、RAM24に蓄積したデジタル音声データの音声認識を行う。なお、音声認識の概要は図2において説明したとおりである。この処理により、ユーザが発した音声を単語レベルで認識することができる。
【0039】
S203、S204:CPU23(禁止語音声判定部33)は、認識された各単語についての音声が、予め定められた禁止語音素モデルと一致するか否かを判定する。即ち、ユーザが発した音声に個人情報や使用禁止語などからなる禁止語が含まれるか否かを判定する。
【0040】
S205:上記判定の結果、禁止語が含まれる場合には、CPU23(禁止語音声発話時間測定部35)は、禁止語と判定された音声の発話時間を測定する。
【0041】
S206:CPU23(禁止語置換部36)は、禁止語と判定された部分の音声をダミー音に置換する。
【0042】
S207:通信装置27(送信部13)は、置換されたダミー音を含むデジタル音声データを通信回線を解して相手ユーザに送信する。
【0043】
これにより、通話中の音声に禁止語が含まれる場合に、リアルタイムでこの禁止語をダミー音に置換することができる。その結果、住所・電話番号などの個人情報を相手ユーザに伝えてしまうことを防止でき、防犯に貢献することができる。また、相手を不快にさせる使用禁止語を誤って発声してしまった場合であっても、この使用禁止語をリアルタイムでダミー音に置換することができるため、相手を不快にさせずにすむ。
【0044】
[第2実施形態]
次に、図6を参照して、本発明の第2実施形態の禁止語発信防止方法及び禁止語発信防止電話について説明する。近年における電話機には知人の電話番号などを記憶したアドレス帳が設けられているところ、第2実施形態では禁止語をダミー音に置換するか否かをアドレス帳を用いて判定する点に特徴を有している。
なお、禁止語発信防止電話10Aのハードウェア構成は、禁止語発信防止電話10のハードウェア構成と同じであるため、説明を省略する。
【0045】
[禁止語発信防止電話10Aの全体構成]
図6(1)は、第2実施形態における禁止語発信防止電話10Aの概略を示した図である。禁止語発信防止電話10Aは、第1実施形態の禁止語発信防止電話10に加え、アドレス帳15を備えている。アドレス帳15には、ユーザの知人の電話番号などの情報が格納されている。禁止語発信防止装置30は、アドレス帳15に格納されている情報を用いて禁止語をダミー音に置換するか否かを判定する。
【0046】
[禁止語発信防止電話10Aの基本動作]
図6(2)は、禁止語発信防止電話10Aにおける処理の流れの詳細(ステップS201〜S207、S211)を示した図である。なお、禁止語発信防止電話10Aにおける処理では、禁止語発信防止電話10における処理のうちS202とS203との間の処理にアドレス帳を用いた判定処理が設けられている(S211)。以下、禁止語発信防止電話10における処理との相違部分について説明する。
【0047】
S211:音声分析部32が、音声一時蓄積部31に蓄積されたデジタル音声データの音声認識を行うと、CPU23(登録判定部41)は、通信先の相手ユーザの電話番号がアドレス帳15に登録された電話番号であるか否かを判定する。この判定がYESのときは、CPU23は禁止語判定(S203)〜音声送信(S207)の処理を行い、NOのときはダミー音に置換することなく音声送信(S207)の処理を行う。
【0048】
このように、本実施の形態における禁止語発信防止方法及び禁止語発信防止電話10Aによれば、未登録の通話先に通話するときだけ禁止語発信防止機能を作動させるようにすることができる。なお、アドレス帳における判定の処理(S211)を音声認識の処理(S202)の後に行っているが、これに限られるものではない。例えば、音声認識の処理の前に行うこととしてもよい。これにより、禁止語発信防止機能を作動させる必要がない場合には、音声認識を行うことなく直ちに音声データを送信することができる。
【0049】
また、アドレス帳に登録された通話先である場合には禁止語発信防止機能を作動させないこととしているが、これに限られるものではない。具体的には、禁止語カテゴリー「個人情報」については、アドレス帳に登録された知人に知らせてもよいが、アドレス帳に未登録の通話先には知られては問題となる場合がある。他方、禁止語カテゴリー「使用禁止語」については、アドレス帳に登録された知人に使用した場合に人間関係において問題となる場合がある。
【0050】
そこで、アドレス帳の登録と禁止語カテゴリーの情報とを参照し、禁止語発信防止機能を作動させるか否かを判定することとしてもよい。この場合には、禁止語判定の処理(S203)が行われた後、CPU23(登録判定部41、禁止語音声判定部33)が、アドレス帳の登録と禁止語カテゴリーの情報とを参照した判定を行うことで実現することができる。
【0051】
[第3実施形態]
次に、図7〜図9を参照して、第3実施形態における禁止語発信防止電話10Cについて説明する。上記実施形態においては、禁止語であるか否かの判定を、(1)音声(禁止語音素モデル)により判定していたが、本実施の形態では、(1)音声に基づく判定に加え、(2)言語モデルを考慮したテキストに基づく判定を行うことに特徴を有している。
なお、禁止語発信防止電話10Cのハードウェア構成は、禁止語発信防止電話10のハードウェア構成と同じであるため、説明を省略する。
【0052】
[禁止語発信防止電話10Cの全体構成]
図7は、第3実施形態における禁止語発信防止電話10Cの概略を示した図である。なお、上記実施形態における禁止語発信防止電話10と同様の構成については同一の符号を付し説明を省略する。
【0053】
禁止語発信防止電話10Cは、禁止語発信防止電話10の構成に加え、言語モデル51と、音声/テキスト変換部52と、禁止語テキスト判定部53と、禁止語テキストリスト54と、を備える。
【0054】
言語モデル51は、単語のそれぞれについて出現確率・接続確率をデータ化したものであり、構文知識(文法的構造)、意味知識(単語間の関係や属性)、文脈知識(会話の流れ)、会話の一般的知識をモデル化したものである。禁止語(特に使用禁止語)は訛りや方言によって異なることがあり、全ての禁止語の音声データを予め網羅的に洗い出すことができない場合に言語モデルを用いると好適である。
【0055】
なお、2008年度の日本音響学会春季大会において掲載された論文「複数の話題言語モデルによる音声認識結果の事後統合(著 磯健一)」に記載されているように、複数の話題言語モデルを用いて独立に発話をデコードし、発話単位に最良スコアの仮説を事後選択することで、単一の汎用言語モデルや話題言語モデルを用いるよりも、認識結果について高い精度を得ることができる。よって、言語モデル51には、複数の話題言語モデルが用いられることが好ましい。
【0056】
音声/テキスト変換部52は、音声分析部32が分析した音声を、言語モデル51を用いてテキストに変換する。禁止語テキスト判定部53は、変換されたテキストが禁止語テキストリスト54に挙げられた禁止語テキストと一致するか否かを判定する。なお、禁止語テキストリスト54は、図8に示すように、禁止語カテゴリー毎に禁止語テキストを格納している。
【0057】
[禁止語発信防止電話10Cの基本動作]
図9は、禁止語発信防止電話10Cにおける処理の流れの詳細(ステップS201〜S207、S251〜S253)を示した図である。なお、禁止語発信防止電話10Cは、(1)音声に基づく判定に加え、(2)言語モデルを考慮したテキストに基づく判定を行うところ、(1)音声に基づく判定(S202〜S205)については第1実施形態の処理と同一であるため、説明を省略する。以下では、本実施の形態における特徴部分である(2)言語モデルを考慮したテキストに基づく判定の処理について説明する。
【0058】
S251:CPU23(音声/テキスト変換部52)は、音声分析部32により認識された音声を言語モデル51を用いてテキストに変換する。
【0059】
S252、S253:CPU23(禁止語テキスト判定部53)は、変換されたテキストが、予め定められた禁止語テキストと一致するか否かを判定する。そして、禁止語テキストと一致する場合には、S205、S206の処理が行われる。
【0060】
このように、本実施の形態における禁止語発信防止電話10Cによれば、音声だけでなく、音声を言語モデルを用いて変換したテキストをも用いて禁止語の判定を行うことができる。そのため、ユーザが発した音声に禁止語が含まれるか否かの判定を、音声のみによる判定よりも高い精度で行うことができる。
【0061】
なお、本実施の形態においても、アドレス帳を用いた判定を行うことができ、また、アドレス帳及び禁止語カテゴリーを用いた判定を行うことができる。
【0062】
(変形形態)
上記実施形態においては、禁止語発信防止装置がユーザの所有する電話に格納されるものを一例として説明したが、電話回線を相互接続し電話網を構成するための交換機やIP電話におけるサーバに格納することとしてもよい。
【0063】
[禁止語発信防止交換機/サーバ60の全体構成]
図10は、禁止語発信防止装置30Cを格納した禁止語発信防止交換機/サーバ60の概略を示した図である。なお、上記実施形態における禁止語発信防止電話10と同様の構成については同一の符号を付し説明を省略する。また、禁止語発信防止交換機/サーバ60は、ユーザの電話と通信するための通信部を備えているが図示は省略する。
【0064】
禁止語発信防止交換機/サーバ60の禁止語発信防止装置30Cは、禁止語発信防止装置30の構成に加え、発信ユーザ判定部61と禁止語音素モデルDB34Cとを備える。発信ユーザ判定部61は、音声を発信したユーザを特定する。禁止語音素モデルDB34Cは、禁止語カテゴリー毎の禁止語音素モデルをユーザ毎に対応付けて格納する。
【0065】
なお、禁止語発信防止交換機/サーバ60においても、(1)音声に基づく判定に加え、(2)言語モデルを考慮したテキストに基づく判定を行うこととしてもよく、また、ユーザ毎のアドレス帳を備え、アドレス帳を用いた判定、アドレス帳及び禁止語カテゴリーを用いた判定を行うこととしてもよい。
【0066】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。例えば、TVやラジオの生放送において放送禁止用語を出演者がうっかり発言してしまうことを防止する手段としても用いることができる。
【図面の簡単な説明】
【0067】
【図1】本発明の実施形態における禁止語発信防止電話の機能構成を示す図である。
【図2】上記実施形態における音声分析部の模式図である。
【図3】上記実施形態における禁止語音素モデルを示す図である。
【図4】上記実施形態における禁止語発信防止電話のハードウェア構成を示す図である。
【図5】上記実施形態における禁止語発信防止電話の処理のフローチャートである。
【図6】第2実施形態における禁止語発信防止電話の機能構成及び処理を示す図である。
【図7】第3実施形態における禁止語発信防止電話の機能構成を示す図である。
【図8】上記実施形態における禁止語テキストリストを示す図である。
【図9】上記実施形態における禁止語発信防止電話の処理のフローチャートである。
【図10】禁止語発信防止交換機及びサーバの機能構成を示す図である。
【符号の説明】
【0068】
10 禁止語発信防止電話
30 禁止語発信防止装置
31 音声一時蓄積部
32 音声分析部
33 禁止語音声判定部
34 禁止語音素モデル
35 禁止語音声発話時間測定部
36 禁止語置換部

【特許請求の範囲】
【請求項1】
ユーザが発した不用意な発言についての音声の発信を防止する方法であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声蓄積ステップと、
前記音声を音声認識し、単語レベルに分析する音声分析ステップと、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する判定ステップと、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する時間特定ステップと、
前記特定された部分の音声をダミー音に置換する置換ステップと、
置換した部分を含む音声を発信する発信ステップと、
を含むことを特徴とする方法。
【請求項2】
請求項1記載の方法において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換するテキスト変換ステップを更に含み、
前記判定ステップは、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記時間特定ステップは、前記判定ステップにより一致すると判定された部分を特定することを特徴とする方法。
【請求項3】
請求項1又は2記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記アドレス帳に記載された情報に基づいて、前記不用意な発言についての音声の発信を防止するか否かを判定するステップを更に含むことを特徴とする方法。
【請求項4】
請求項1又は2記載の方法において、
ユーザの対人関係を示す情報を記載したアドレス帳を備え、
前記不用意な発言のカテゴリーとして、個人情報及び他者を不快にさせる使用禁止語を少なくとも含み、
前記判定ステップは、前記アドレス帳及び前記カテゴリーを参照して、前記判定を行うことを特徴とする方法。
【請求項5】
ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止電話であって、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止電話。
【請求項6】
請求項5記載の禁止語発信防止電話において、
分析された単語レベルの音声を言語モデルを用いてテキストに変換する音声/テキスト変換部を更に備え、
前記禁止語判定部は、前記分析された単語レベルの音声が予め定められた禁止語音素モデルと一致するか否かに加え、変換されたテキストが予め定められた禁止語テキストと一致するか否かを判定し、
前記禁止語音声発話時間測定部は、前記禁止語判定部により一致すると判定された部分を特定することを特徴とする禁止語発信防止電話。
【請求項7】
通信回線を解した音声の通信を管理し、ユーザが発した不用意な発言についての音声の発信を防止する禁止語発信防止サーバであって、
音声を発信したユーザを判定する発信ユーザ判定部と、
ユーザの発した音声を受け付け、一時的に蓄積する音声一時蓄積部と、
前記音声を音声認識し、単語レベルに分析する音声分析部と、
分析された単語レベルの音声が、前記発信ユーザ判定部により判定されたユーザについての予め定められた禁止語音素モデルと一致するか否かを判定する禁止語判定部と、
ユーザの発した音声のうち、前記禁止語音素モデルと一致すると判定された部分を特定する禁止語音声発話時間測定部と、
前記特定された部分の音声をダミー音に置換する禁止語置換部と、
置換した部分を含む音声を送信する送信部と、
備えることを特徴とする禁止語発信防止サーバ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2010−103751(P2010−103751A)
【公開日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2008−273173(P2008−273173)
【出願日】平成20年10月23日(2008.10.23)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】