音声出力装置、音声出力方法およびプログラム
【課題】携帯電話の通話等における発話者が、他者のいない場所に移動せずに、比較的大きい音量で発話を行っても発話内容を周囲の他者に聞き取られ難くし、かつ、携帯電話機等の装置の消費電力を削減し得るようにする。
【解決手段】送話部11が、発話者の発話(周囲の音声)を取得し、送話音声解析部172が、送話部11の取得する音声を解析する。そして、ノイズ出力部13は、送話音声解析部172の解析結果に基づいて発話者の発話をマスクするノイズを出力する。例えば、送話音声解析部172が、送話部11の取得する音声の周波数を検出し、ノイズ出力部13が、当該音声に近い周波数のノイズを出力することで、比較的小音量のノイズで発話者の発話を周囲の他者に対して隠すことができ、消費電力を抑制し得る。
【解決手段】送話部11が、発話者の発話(周囲の音声)を取得し、送話音声解析部172が、送話部11の取得する音声を解析する。そして、ノイズ出力部13は、送話音声解析部172の解析結果に基づいて発話者の発話をマスクするノイズを出力する。例えば、送話音声解析部172が、送話部11の取得する音声の周波数を検出し、ノイズ出力部13が、当該音声に近い周波数のノイズを出力することで、比較的小音量のノイズで発話者の発話を周囲の他者に対して隠すことができ、消費電力を抑制し得る。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声出力装置、当該音声出力装置の音声出力方法およびプログラムに関する。
【背景技術】
【0002】
携帯電話機を用いた通話などにおいて、周囲の他者に聞かれたくない発話を行う場合がある。かかる場合、発話者としては、他者のいない場所に移動して発話(通話)を行う、あるいは、周囲の他者に聞かれない小さい音量で発話を行うことが考えられる。
しかし、他者のいない場所に移動しようとする場合、発話者の近辺に適当な場所がない場合がある。また、周囲の他者に聞かれない音量で発話を行う場合、通話相手が発話者の声を聞き取れなくなるおそれがある。
【0003】
一方、特許文献1に記載のハンズフリー通話装置は、自動車内において、運転者がハンズフリー通話を行なうと、通話音声をマスクするマスク音を同乗者に向けて出力する。このハンズフリー通話装置を用いることで、通話相手からの音声が助手席の同乗者に聞こえてしまうのを抑制し、プライバシー保護を実現できるとされている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−96664号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載のハンズフリー通話装置では、大音量のマスク音を出力する必要が生じて、消費電力が増大するおそれがある。例えば、マスク音として特許文献1に記載のロードノイズ(自動車が走行することで、回転するタイヤと路面との間に発生する音)を、通話相手からの音声が助手席の同乗者に聞こえなくなる音量で出力すると、当該ロードノイズが大音量となり、消費電力が増大するおそれがある。
【0006】
本発明は、上述の課題を解決することのできる音声出力装置、音声出力方法およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による音声出力装置は、音声を取得する音声取得部と、前記音声取得部の取得する音声を解析する音声解析部と、前記音声解析部の解析結果に基づいて、前記音声取得部の取得する音声とは異なる音声を出力する音声出力部と、を具備することを特徴とする。
【0008】
また、本発明の一態様による音声出力方法は、音声出力装置の音声出力方法であって、音声を取得する音声取得ステップと、前記音声取得ステップにて取得する音声を解析する音声解析ステップと、前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、を具備することを特徴とする。
【0009】
また、本発明の一態様によるプログラムは、音声出力装置としてのコンピュータに、音声を取得する音声取得ステップと、前記音声取得ステップにて取得する音声を解析する音声解析ステップと、前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、を実行させるためのプログラムである。
【発明の効果】
【0010】
本発明によれば、発話者が、他者のいない場所に移動せずに、比較的大きい音量で発話を行うことができ、かつ、消費電力を削減し得る。
【図面の簡単な説明】
【0011】
【図1】本発明の第1の実施形態における携帯電話機の概略構成を示す構成図である。
【図2】同実施形態における、携帯電話機を用いた通話の説明図である。
【図3】同実施形態において、携帯電話機が行うノイズ音声出力の説明図である。
【図4】同実施形態において、携帯電話機が行う送話音声解析の説明図である。
【図5】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図6】本発明の第2の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。
【図7】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図8】本発明の第3の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。
【図9】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図10】本発明の第4の実施形態における音声出力装置の概略構成を示す構成図である。
【発明を実施するための形態】
【0012】
<第1の実施形態>
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明の第1の実施形態における携帯電話機の概略構成を示す構成図である。同図において、携帯電話機1は、送話部(音声取得部)11と、受話部12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部16と、制御部17とを具備する。制御部17は、音声処理部171を具備する。音声処理部171は、送話音声解析部(音声解析部)172と、ノイズ取得部173とを具備する。
【0013】
送話部11は、マイクを有し、周囲音を取得して音声データ(デジタルの音声信号)に変換する。特に、送話部11は、通話時に、発話者(携帯電話機1のユーザ)の発話を取得して音声データに変換する。
受話部12は、スピーカを有し、音声処理部171から出力される音声データに従って音声を出力する。特に、受話部12は、通話時に、音声処理部171から出力される音声データに従って、通話相手の音声を出力する。
【0014】
ノイズ出力部13は、受話部12と同様、スピーカを有し、音声処理部171から出力される音声データに従って、ノイズ音声(以下、単に「ノイズ」と称する)を出力する。このノイズ出力部13が出力するノイズは、発話者の発話に対するマスク(発話者の発話内容を、発話者の周囲の他者に対して隠すための音声、すなわち、周囲の他者が聞き取り難くするための音声)として用いられる。
【0015】
キー操作部14は、テンキーや方向キーや決定ボタンなどの押ボタンを有し、ユーザの操作入力を受け付ける。
表示部15は、液晶パネル等の表示画面を有し、制御部17の制御に従って、静止画像や動画像やテキストなどの各種データを表示する。
【0016】
無線通信部16は、無線アンテナを有し、携帯電話通信網(電気通信事業者の提供する、携帯電話機用の通信ネットワーク)に無線通信にて接続する。無線通信部16は、通話時の音声データや、電子メール着信時ないし送信時の電子メールデータなど、各種データの送受信を行う。
【0017】
制御部17は、携帯電話機1の各部を制御する。
制御部17は、例えば携帯電話機1の具備する中央処理装置(Central Processing Unit;CPU)が、携帯電話機1の具備する記憶デバイスからプログラムを読み出して実行することにより実現される。あるいは、制御部17を、専用のハードウェアで実現するなど、他の方法で実現するようにしてもよい。
【0018】
音声処理部171は、音声に関する各種処理を行う。特に、音声処理部171は、通話時に、送話部11の生成する発話者の音声データを無線通信部16に出力して送信させ、また、当該発話者の音声データに基づいてノイズの音声データを取得し、ノイズ出力部13にノイズを出力させる。音声処理部171(ノイズ取得部173)がノイズの音声データを取得する方法については後述する。
さらに、音声処理部171は、無線通信部16の受信する通話相手の音声データを受話部12に出力して音声を出力させる。
【0019】
送話音声解析部172は、送話部11の生成する発話者の音声データを解析する。
ノイズ取得部173は、送話音声解析部172の解析結果に基づいて、ノイズの音声データを取得する。
【0020】
図2は、携帯電話機1を用いた通話の説明図である。同図において、送話部11が、その有するマイクで周囲音P11を取得して音声データに変換し、音声処理部171に出力する。ここで、送話部11が取得する周囲音P11には、発話者の発話が含まれ、携帯電話機1の周囲の騒音が特に大きい場合を除き、送話部11が取得する周囲音P11は、発話者の発話と同視し得る。以下では、特に区別の必要が無い限り、送話部11が取得する周囲音と発話者の発話とを同視する。
また、受話部12は、音声処理部171の出力する通話相手の音声データに基づいて、当該通話相手の音声P12を出力する。
【0021】
図3は、携帯電話機1が行うノイズ音声出力の説明図である。同図において、ノイズ取得部173がノイズの音声データを取得してノイズ出力部13に出力し、当該音声データに従って、ノイズ出力部13がノイズP13を出力する。
この、ノイズ出力部13の出力するノイズP13は、携帯電話機1のユーザの発話P11に重ね合わせられて周囲の他者に届くことで、発話P11のマスクとなる。
【0022】
図4は、携帯電話機1が行う送話音声解析の説明図である。同図において、送話音声解析部172は、送話部11が周囲音を取得して出力する音声データを解析して、当該音声の周波数を検出する。そして、ノイズ取得部173は、送話音声解析部172の検出する周波数に基づいてノイズの音声データを取得する。そして、図3で説明したように、ノイズ出力部13は、ノイズ取得部173の取得する音声データに従ってノイズを出力する。
【0023】
送話音声解析部172が、この発話者の発話P11の周波数(発話者の声の周波数)を検出し、ノイズ取得部173が、当該周波数に基づいて、当該周波数に近い周波数のノイズの音声データを取得してノイズ出力部13に出力することで、ノイズ出力部13は、発話者の声に近い周波数のノイズP13を出力することができる。
ノイズ出力部13が、発話者の声に近い周波数のノイズを出力することで、比較的小音量のノイズで、発話者の発話内容を、発話者の周囲の他者に対して隠すことができる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0024】
なお、ノイズ出力部13は、ノイズとして、発話者の発話とは異なる音声を出力する。ここでいうノイズは、発話者の発話内容を、発話者の周囲の他者に対して隠すための音声であればよく、自然発生的な音声(例えば風の音や水の音などを録音した音声)など、伝達すべき情報を有しない音声であってもよいし、発話者の発話を遅延させた音声など、伝達すべき情報を有する音声であっても、発話者の発話に干渉する音声であればよい。
【0025】
ここで、ノイズ出力部13が、送話部11の取得する発話者の発話を遅延させずにそのまま出力すると、ノイズ出力部13の出力する音声が発話者の発話を増幅させ、かえって発話者の周囲の第三者に聞き取り易くしてしまう結果となる。これを避けるために、ノイズ出力部13は、発話者の発話とは異なる内容の音声、あるいは、発話者の発話を遅延させた音声など、送話部11の取得する発話者の発話とは異なる音声を出力する。
【0026】
例えば、ノイズ取得部173は、シンセサイザ等の音声データ生成手段を有し、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを生成することで、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを取得する。ノイズ取得部173が、シンセサイザ等で生成する音声データは、例えば、発話者の声の、「あー」など言語として意味の無い音声データとすることができる。
【0027】
あるいは、ノイズ取得部173が、携帯電話機1が予め備える複数のノイズの音声データの中からいずれかのノイズの音声データを選択することで、ノイズの音声データを取得するようにしてもよい。例えば、携帯電話機1が記憶デバイスを具備し、当該記憶デバイスが、複数の周波数のノイズの音声データを予め記憶しておく。そして、ノイズ取得部173は、送話音声解析部172の検出する周波数に最も近い周波数のノイズの音声データを記憶デバイスから読み出してノイズ出力部13に出力する。
このように、ノイズ取得部173が、携帯電話機1が予め備える複数のノイズの中からいずれかのノイズを選択することで、ノイズ取得部173がシンセサイザ等の音声データ生成手段を有する必要が無くなり、携帯電話機1の構成を簡単にできる。
【0028】
なお、携帯電話機1の周囲の騒音が大きい場合でも、送話部11が取得する周囲音には発話者の発話が含まれており、ノイズ出力部13が、発話者の声の周波数に近い周波数のノイズを出力することを期待できる。また、携帯電話機1の周囲の騒音が大きい場合、ノイズ出力部13の出力するノイズの周波数が発話者の声と異なる場合でも、この騒音がマスクとなって、発話者の周囲の他者が、発話者の発話内容を聞き取り難いことを期待できる。
【0029】
なお、送話音声解析部172が行う音声データの解析は、周波数を検出するものに限らない。例えば、送話音声解析部172が、送話部11の取得する音声が発せられるタイミング(発話者が発話を行うタイミング)を検出するようにしてもよい。例えば、送話音声解析部172は、送話部11から出力される音声データが所定の閾値以上の音量を示す場合に、音声が発せられていると判定する。
そして、ノイズ取得部173は、送話音声解析部172の解析結果に基づいて、送話部11の取得する音声が発せられるタイミングで、ノイズの音声データをノイズ出力部13に出力する。そして、ノイズ出力部13は、ノイズ取得部173から出力される音声データに従って、ノイズ取得部173から音声データが出力されるときにノイズを出力し、ノイズ取得部173から音声データが出力されないときはノイズを出力しないことで、送話部11の取得する音声が発せられるタイミングでノイズを出力する。すなわち、送話音声解析部172が、音声が発せられていると判定したときに、ノイズ出力部13が、ノイズを出力する。一方、送話音声解析部172が、音声が発せられていないと判定したときは、ノイズ出力部13は、ノイズを出力しない。
【0030】
これにより、例えば、呼が確立されている間常にノイズ出力部13がノイズを出力する場合との比較において、ノイズ出力部13がノイズを出力する時間(呼が確立されている時間に対する、ノイズ出力部13がノイズを出力する時間の割合)を減少させることができる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0031】
また、ノイズ出力部13が、発話者の発話(送話部11の取得する音声)を一定時間遅延させてノイズとして出力する場合、発話者が発話を行わない状態で、ノイズ出力部13が当該ノイズを出力すると、発話者の周囲の他者が当該ノイズを聞き取ることで、発話者の発話内容が当該他者に聞き取られてしまうおそれがある。
そこで、送話音声解析部172が、発話者が発話を行うタイミングを検出し、発話者が発話を行うタイミングでのみノイズを出力する。これにより、ノイズ出力部13が、発話者が発話を行わない状態で、発話者の発話を遅延させた音声(ノイズ)を出力し、発話者の周囲の他者が当該ノイズを聞き取ることで、発話者の発話内容が当該他者に聞き取られてしまうことを防止できる。
【0032】
なお、ノイズ出力部13が、送話部11の取得する音声が発せられるタイミングで出力するノイズとしては、様々なものを用いることができる。
例えば、上述したように、発話者の発話を一定時間遅延させた音声であってもよいし、ホワイトノイズまたはピンクノイズまたはレッドノイズなど、他のノイズであってもよい。
【0033】
あるいは、送話音声解析部172が、送話部11の取得する音声が発せられるタイミングと共に、上述したように、送話部11の取得する音声の周波数を検出するようにしてもよい。そして、ノイズ出力部13は、送話部11の取得する音声が発せられるタイミングで、送話部11の取得する音声に近い周波数のノイズの音声データを出力する。
【0034】
この場合、上述したように、ノイズ取得部173は、携帯電話機1の予め備える複数のノイズの音声データの中から何れかのノイズの音声データを取得するようにしてもよいし、あるいは、ノイズ取得部173が音声データ生成手段を有して、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを生成するようにしてもよい。そして、ノイズ出力部13は、ノイズ取得部173の取得する音声データに従ってノイズを出力する。
このように、ノイズ出力部13が、送話部11の取得する音声が発せられるタイミングで、送話部11の取得する音声に近い周波数のノイズの音声データを出力することで、ノイズ出力に伴う携帯電話機1の消費電力増大を、さらに抑制できる。
【0035】
あるいは、送話音声解析部172が、送話部11の取得する音声の音量を検出し、ノイズ出力部13が、送話音声解析部172の検出する音量に基づいてノイズを出力するようにしてもよい。例えば、ノイズ出力部13は、送話部11の取得する音声の音量が大きいほど大きい音量のノイズを出力する。
これにより、ノイズ出力部13が必要以上に大きい音量のノイズを出力することを抑制できる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0036】
次に、図5を参照して携帯電話機1の動作について説明する。
図5は、通話時に携帯電話機1が行う処理の手順を示すフローチャートである。携帯電話機1は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
まず、制御部17は、携帯電話機1自らのユーザによる通信切断操作や、通話相手の電話機からの通話終了を示す信号の受信など、通話終了か否か(通話終了事象の有無)を判定する(ステップS101)。
【0037】
通話終了と判定した場合(ステップS101:YES)、同図の処理を終了する。その後、携帯電話機1は、携帯電話機1自らのユーザによる通信切断操作を受け付けた場合は通話終了を示す信号を出力し、通話終了を示す信号を受信した場合は通話終了表示を行うなど、通信終了時の処理を行う。
【0038】
一方、ステップS101において、通話終了でないと判定した場合(ステップS101:NO)、携帯電話機1は、受信処理を行う(ステップS102)。具体的には、無線通信部16が、通話相手の音声信号を無線信号にて受信して音声データに変換し、制御部17に出力する。そして、制御部17は、無線通信部16から出力される通話相手の音声データを受話部12に出力する。
【0039】
また、送話音声解析部172は、送話部11が周囲音(発話者の発話)を取得して出力する音声データを解析して、当該音声の周波数を検出し、検出した周波数をノイズ取得部173に出力する(ステップS103)。
ノイズ取得部173は、送話音声解析部172から出力される周波数に基づいてノイズの音声データを取得し、取得した音声データをノイズ出力部13に出力する(ステップS104)。
【0040】
そして、受話部12が、制御部17から出力される音声データに従って、通話相手の音声を出力する(ステップS105)。また、ノイズ出力部13が、ノイズ取得部173から出力される音声データに従って、ノイズを出力する(ステップS106)。
また、携帯電話機1は、送信処理を行う(ステップS107)。具体的には、制御部17が、ステップS103で送話部11から取得する音声データを無線通信部16に出力し、無線通信部16は、制御部17から出力される音声データを無線信号にて送信する。
その後、ステップS101に戻り、同図の処理を繰り返す。
【0041】
以上のように、送話音声解析部172が、送話部11の取得する音声を解析し、ノイズ出力部13が、送話部11の取得する音声に似た周波数のノイズを出力する、あるいは、送話部11の取得する音声が発せられるタイミングでノイズを出力する、あるいは、送話部11の取得する音声の音量に応じた音量のノイズを出力するなど、送話音声解析部172の解析結果に基づいてノイズを出力する。
これにより、ノイズの音量を比較的小さくでき、あるいは、ノイズ出力部13がノイズを出力する時間を減少させることができ、あるいは、ノイズ出力部13が必要以上に大きい音量のノイズを出力することを抑制できる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
すなわち、発話者は、他者のいない場所に移動せずに、比較的大きい音量で発話を行うことができ、かつ、携帯電話機1の消費電力を削減し得る。
【0042】
<第2の実施形態>
図6は、本発明の第2の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。同図において、携帯電話機2は、送話部(音声取得部)11と、受話部(第2音声出力部)12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部(音声信号取得部)16と、制御部27とを具備する。制御部27は、音声処理部271を具備する。音声処理部271は、送話音声解析部(音声解析部)172と、ノイズ取得部173と、逆位相取得部274と、重ね合わせ部275とを具備する。
同図において、図1の各部に対応して同様の機能を有する部分には同一の符号(11〜16、172、173)を付し、説明を省略する。
【0043】
制御部27は、送話部11の取得する音声(図6の音声P11)を解析して、制御部17(図1)と同様にノイズの音声データを生成する。また、制御部27は、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせることで、通話相手の音声に対するノイズキャンセルを行う。
【0044】
逆位相取得部274は、ノイズ取得部173の取得するノイズ(の音声データ)を逆位相にした音声のデータ(以下、「逆位相データ」と称する)を取得する。
ここで、逆位相取得部274は、ノイズ取得部173が取得するノイズの音声データの出力を受け、このノイズを逆位相にした音声データを生成することで、逆位相データを取得する。
【0045】
なお、逆位相取得部274が逆位相データを取得する方法は、上記の逆位相データを生成する方法に限らない。例えば、携帯電話機1が記憶デバイスを具備し、当該記憶デバイスが、ノイズの音声データと、当該ノイズを逆位相にした逆位相データとを予め記憶しておくようにしてもよい。そして、ノイズ取得部173は、記憶デバイスからノイズの音声データを取得し、逆位相取得部274は、記憶デバイスから逆位相データを読み出す。
【0046】
重ね合わせ部275は、複数の音声を重ね合わせた音声データを生成する。本実施形態では、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、無線通信部16が受信して出力する通話相手の音声データに重ね合わせた音声データ(すなわち、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、受話部12に出力する。
【0047】
この携帯電話機2では、ノイズ出力部13は、携帯電話機1(図1)の場合と同様、ノイズP13を出力する。一方、受話部12は、通話相手の音声に、ノイズP13を逆位相にした音声を重ね合わせた音声P22を出力する。
そして、ノイズ出力部13の出力するノイズP13と、受話部12の出力する音声P22に含まれる、ノイズP13を逆位相にした音声とが、互いに打ち消しあう。その結果、受話部12の出力する音声に含まれる、通話相手の音声P12が残って、携帯電話機2のユーザに取得(聴取)される。
【0048】
このように、逆位相取得部274が取得する逆位相データは、ノイズ出力部13の出力するノイズを打ち消すノイズキャンセル信号として作用する。
【0049】
次に、図7を参照して携帯電話機2の動作について説明する。
図7は、通話時に携帯電話機2が行う処理の手順を示すフローチャートである。携帯電話機2は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
【0050】
ステップS201は、図5のステップS101と同様である。
ステップS202において、携帯電話機1は、受信処理を行う。ここでいう受話処理は、図5のステップS102における受話処理のうち、無線通信部16が、通話相手の音声信号を無線信号にて受信して音声データに変換し、制御部27に出力する部分である。
ステップS203〜S204は、図5のステップS103〜S104と同様である。
【0051】
ステップS205において、逆位相取得部274は、逆位相データ(ステップS204でノイズ取得部173が取得するノイズを逆位相にした音声のデータ)を取得する。そして、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、無線通信部16が受信して出力する通話相手の音声データに重ね合わせた音声データ(すなわち、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、受話部12に出力する。受話部12は、重ね合わせ部275から出力される音声データに従って音声を出力する。
【0052】
上述したように、この逆位相データを、ステップS204でノイズ取得部173が取得するノイズに重ね合わせると、当該ノイズを打ち消す。すなわち、逆位相データは、ノイズキャンセル信号として作用する。
ステップS206〜S208は、図5のステップS105〜S107と同様である。
【0053】
以上のように、重ね合わせ部275が、通話相手の音声にノイズを逆位相にした音声を重ね合わせ、受話部12が、当該音声を出力する。このノイズを逆位相にした音声と、ノイズ出力部13の出力する音声とが互いに打ち消しあって、携帯電話機2のユーザは、ノイズを含まない(あるいはノイズの音量が小さい)通話相手の音声を取得(聴取)できる。
【0054】
<第3の実施形態>
図8は、本発明の第3の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。同図において、携帯電話機3は、送話部(音声取得部)11と、受話部(第2音声出力部)12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部(音声信号取得部)16と、制御部37とを具備する。制御部37は、音声処理部371を具備する。音声処理部371は、送話音声解析部(音声解析部)172と、ノイズ取得部173と、逆位相取得部274と、重ね合わせ部(音声信号生成部)275とを具備する。
同図において、図6の各部に対応して同様の機能を有する部分には同一の符号(11〜16、172、173、274、275)を付し、説明を省略する。
制御部37は、その具備する音声処理部371が送話部11の取得する音声に対してノイズキャンセルを行う点で、制御部27(図6)と異なる。
本実施形態では、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、送話部11が出力する音声データに重ね合わせた音声データ(すなわち、発話者の発話音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、無線通信部16に出力する。
【0055】
この携帯電話機3では、ノイズ出力部13は、携帯電話機1(図1)の場合と同様、ノイズP13を出力する。このノイズP13が送話部11に取得され、通話相手にとって、発話者の発話P11に対するノイズとなることが考えられる。
そこで、重ね合わせ部275が、送話部11の出力する音声データに逆位相データを重ね合わせるノイズキャンセルを行う。
【0056】
これにより、重ね合わせ部275は、発話者の発話P11(を示す音声データ)を生成する。あるいは、重ね合わせ部275は、送話部11の取得した音声に含まれるノイズを低減した音声データを生成する。
そして、無線通信部16が、重ね合わせ部275の生成した音声データを無線にて送信する。
【0057】
次に、図9を参照して携帯電話機3の動作について説明する。
図9は、通話時に携帯電話機3が行う処理の手順を示すフローチャートである。携帯電話機3は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
ステップS301〜S306は、図1のステップS101〜S106と同様である。
【0058】
ステップS307において、重ね合わせ部275は、送話部11から出力される音声データに逆位相データを重ね合わせる。
ステップS308は、図1のステップS107と同様である。すなわち、制御部37(重ね合わせ部275)が、ステップS306で生成した音声データを無線通信部16に出力し、無線通信部16は、制御部37から出力される音声データを無線信号にて送信する。
【0059】
以上のように、重ね合わせ部275が、送話部11の出力する音声データに逆位相データを重ね合わせるノイズキャンセルを行うので、通話相手は、発話者の発話音声(あるいはノイズを低減した発話者の発話音声)を取得(聴取)できる。
【0060】
なお、携帯電話機が、第2の実施形態で説明した、通話相手の音声に対するノイズキャンセルと、第3の実施形態で説明した、発話者(携帯電話機3のユーザ)の発話に対するノイズキャンセルとの両方を行うようにしてもよい。
【0061】
<第4の実施形態>
なお本発明の適用範囲は、上述した携帯電話機に限らない。本発明は、周囲の音声を取得する様々な機器に適用し得る。
図10は、本発明の第4の実施形態における音声出力装置の概略構成を示す構成図である。同図において、音声出力装置4は、音声取得部41と、音声処理部171と、ノイズ出力部(音声出力部)13とを具備する。音声処理部171は、音声解析部472と、ノイズ取得部173とを具備する。
【0062】
音声取得部41は、送話部11(図1)と同様、マイクを有し、周囲音を取得して音声データに変換する。特に、音声取得部41は、発話者(音声出力装置4のユーザ)の発話を取得して音声データに変換する。
音声解析部472は、送話音声解析部172(図1)と同様、音声取得部41の生成する発話者の音声データを解析する。
また、音声出力装置4の、音声取得部41や音声解析部472以外の各部も、図1で説明した各部に対応して同様の機能を有する。そこで、図1の各部に対応する部分に、図1の場合と同一の符号(13、171、173)を付して説明を省略する。
【0063】
この音声出力装置4は、ゲーム機や、タブレットPC(Personal Computer)や、ノートPCや、PDA(Personal Digital Assistant)など、周囲の音声を取得する様々な機器に適用可能である。これらの機器が音声出力装置4を具備することで、上述した携帯電話機の場合と同様、発話者の発話内容を、発話者の周囲の他者に対して隠すことができる。
【0064】
なお、制御部17〜371の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0065】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0066】
1〜3 携帯電話機
11 送話部
12 受話部
13 ノイズ出力部
14 キー操作部
15 表示部
16 無線通信部
17〜37 制御部
171〜371 音声処理部
172 送話音声解析部
173 ノイズ取得部
274 逆位相取得部
275 重ね合わせ部
【技術分野】
【0001】
本発明は、音声出力装置、当該音声出力装置の音声出力方法およびプログラムに関する。
【背景技術】
【0002】
携帯電話機を用いた通話などにおいて、周囲の他者に聞かれたくない発話を行う場合がある。かかる場合、発話者としては、他者のいない場所に移動して発話(通話)を行う、あるいは、周囲の他者に聞かれない小さい音量で発話を行うことが考えられる。
しかし、他者のいない場所に移動しようとする場合、発話者の近辺に適当な場所がない場合がある。また、周囲の他者に聞かれない音量で発話を行う場合、通話相手が発話者の声を聞き取れなくなるおそれがある。
【0003】
一方、特許文献1に記載のハンズフリー通話装置は、自動車内において、運転者がハンズフリー通話を行なうと、通話音声をマスクするマスク音を同乗者に向けて出力する。このハンズフリー通話装置を用いることで、通話相手からの音声が助手席の同乗者に聞こえてしまうのを抑制し、プライバシー保護を実現できるとされている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−96664号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載のハンズフリー通話装置では、大音量のマスク音を出力する必要が生じて、消費電力が増大するおそれがある。例えば、マスク音として特許文献1に記載のロードノイズ(自動車が走行することで、回転するタイヤと路面との間に発生する音)を、通話相手からの音声が助手席の同乗者に聞こえなくなる音量で出力すると、当該ロードノイズが大音量となり、消費電力が増大するおそれがある。
【0006】
本発明は、上述の課題を解決することのできる音声出力装置、音声出力方法およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による音声出力装置は、音声を取得する音声取得部と、前記音声取得部の取得する音声を解析する音声解析部と、前記音声解析部の解析結果に基づいて、前記音声取得部の取得する音声とは異なる音声を出力する音声出力部と、を具備することを特徴とする。
【0008】
また、本発明の一態様による音声出力方法は、音声出力装置の音声出力方法であって、音声を取得する音声取得ステップと、前記音声取得ステップにて取得する音声を解析する音声解析ステップと、前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、を具備することを特徴とする。
【0009】
また、本発明の一態様によるプログラムは、音声出力装置としてのコンピュータに、音声を取得する音声取得ステップと、前記音声取得ステップにて取得する音声を解析する音声解析ステップと、前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、を実行させるためのプログラムである。
【発明の効果】
【0010】
本発明によれば、発話者が、他者のいない場所に移動せずに、比較的大きい音量で発話を行うことができ、かつ、消費電力を削減し得る。
【図面の簡単な説明】
【0011】
【図1】本発明の第1の実施形態における携帯電話機の概略構成を示す構成図である。
【図2】同実施形態における、携帯電話機を用いた通話の説明図である。
【図3】同実施形態において、携帯電話機が行うノイズ音声出力の説明図である。
【図4】同実施形態において、携帯電話機が行う送話音声解析の説明図である。
【図5】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図6】本発明の第2の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。
【図7】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図8】本発明の第3の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。
【図9】同実施形態において、通話時に携帯電話機が行う処理の手順を示すフローチャートである。
【図10】本発明の第4の実施形態における音声出力装置の概略構成を示す構成図である。
【発明を実施するための形態】
【0012】
<第1の実施形態>
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明の第1の実施形態における携帯電話機の概略構成を示す構成図である。同図において、携帯電話機1は、送話部(音声取得部)11と、受話部12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部16と、制御部17とを具備する。制御部17は、音声処理部171を具備する。音声処理部171は、送話音声解析部(音声解析部)172と、ノイズ取得部173とを具備する。
【0013】
送話部11は、マイクを有し、周囲音を取得して音声データ(デジタルの音声信号)に変換する。特に、送話部11は、通話時に、発話者(携帯電話機1のユーザ)の発話を取得して音声データに変換する。
受話部12は、スピーカを有し、音声処理部171から出力される音声データに従って音声を出力する。特に、受話部12は、通話時に、音声処理部171から出力される音声データに従って、通話相手の音声を出力する。
【0014】
ノイズ出力部13は、受話部12と同様、スピーカを有し、音声処理部171から出力される音声データに従って、ノイズ音声(以下、単に「ノイズ」と称する)を出力する。このノイズ出力部13が出力するノイズは、発話者の発話に対するマスク(発話者の発話内容を、発話者の周囲の他者に対して隠すための音声、すなわち、周囲の他者が聞き取り難くするための音声)として用いられる。
【0015】
キー操作部14は、テンキーや方向キーや決定ボタンなどの押ボタンを有し、ユーザの操作入力を受け付ける。
表示部15は、液晶パネル等の表示画面を有し、制御部17の制御に従って、静止画像や動画像やテキストなどの各種データを表示する。
【0016】
無線通信部16は、無線アンテナを有し、携帯電話通信網(電気通信事業者の提供する、携帯電話機用の通信ネットワーク)に無線通信にて接続する。無線通信部16は、通話時の音声データや、電子メール着信時ないし送信時の電子メールデータなど、各種データの送受信を行う。
【0017】
制御部17は、携帯電話機1の各部を制御する。
制御部17は、例えば携帯電話機1の具備する中央処理装置(Central Processing Unit;CPU)が、携帯電話機1の具備する記憶デバイスからプログラムを読み出して実行することにより実現される。あるいは、制御部17を、専用のハードウェアで実現するなど、他の方法で実現するようにしてもよい。
【0018】
音声処理部171は、音声に関する各種処理を行う。特に、音声処理部171は、通話時に、送話部11の生成する発話者の音声データを無線通信部16に出力して送信させ、また、当該発話者の音声データに基づいてノイズの音声データを取得し、ノイズ出力部13にノイズを出力させる。音声処理部171(ノイズ取得部173)がノイズの音声データを取得する方法については後述する。
さらに、音声処理部171は、無線通信部16の受信する通話相手の音声データを受話部12に出力して音声を出力させる。
【0019】
送話音声解析部172は、送話部11の生成する発話者の音声データを解析する。
ノイズ取得部173は、送話音声解析部172の解析結果に基づいて、ノイズの音声データを取得する。
【0020】
図2は、携帯電話機1を用いた通話の説明図である。同図において、送話部11が、その有するマイクで周囲音P11を取得して音声データに変換し、音声処理部171に出力する。ここで、送話部11が取得する周囲音P11には、発話者の発話が含まれ、携帯電話機1の周囲の騒音が特に大きい場合を除き、送話部11が取得する周囲音P11は、発話者の発話と同視し得る。以下では、特に区別の必要が無い限り、送話部11が取得する周囲音と発話者の発話とを同視する。
また、受話部12は、音声処理部171の出力する通話相手の音声データに基づいて、当該通話相手の音声P12を出力する。
【0021】
図3は、携帯電話機1が行うノイズ音声出力の説明図である。同図において、ノイズ取得部173がノイズの音声データを取得してノイズ出力部13に出力し、当該音声データに従って、ノイズ出力部13がノイズP13を出力する。
この、ノイズ出力部13の出力するノイズP13は、携帯電話機1のユーザの発話P11に重ね合わせられて周囲の他者に届くことで、発話P11のマスクとなる。
【0022】
図4は、携帯電話機1が行う送話音声解析の説明図である。同図において、送話音声解析部172は、送話部11が周囲音を取得して出力する音声データを解析して、当該音声の周波数を検出する。そして、ノイズ取得部173は、送話音声解析部172の検出する周波数に基づいてノイズの音声データを取得する。そして、図3で説明したように、ノイズ出力部13は、ノイズ取得部173の取得する音声データに従ってノイズを出力する。
【0023】
送話音声解析部172が、この発話者の発話P11の周波数(発話者の声の周波数)を検出し、ノイズ取得部173が、当該周波数に基づいて、当該周波数に近い周波数のノイズの音声データを取得してノイズ出力部13に出力することで、ノイズ出力部13は、発話者の声に近い周波数のノイズP13を出力することができる。
ノイズ出力部13が、発話者の声に近い周波数のノイズを出力することで、比較的小音量のノイズで、発話者の発話内容を、発話者の周囲の他者に対して隠すことができる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0024】
なお、ノイズ出力部13は、ノイズとして、発話者の発話とは異なる音声を出力する。ここでいうノイズは、発話者の発話内容を、発話者の周囲の他者に対して隠すための音声であればよく、自然発生的な音声(例えば風の音や水の音などを録音した音声)など、伝達すべき情報を有しない音声であってもよいし、発話者の発話を遅延させた音声など、伝達すべき情報を有する音声であっても、発話者の発話に干渉する音声であればよい。
【0025】
ここで、ノイズ出力部13が、送話部11の取得する発話者の発話を遅延させずにそのまま出力すると、ノイズ出力部13の出力する音声が発話者の発話を増幅させ、かえって発話者の周囲の第三者に聞き取り易くしてしまう結果となる。これを避けるために、ノイズ出力部13は、発話者の発話とは異なる内容の音声、あるいは、発話者の発話を遅延させた音声など、送話部11の取得する発話者の発話とは異なる音声を出力する。
【0026】
例えば、ノイズ取得部173は、シンセサイザ等の音声データ生成手段を有し、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを生成することで、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを取得する。ノイズ取得部173が、シンセサイザ等で生成する音声データは、例えば、発話者の声の、「あー」など言語として意味の無い音声データとすることができる。
【0027】
あるいは、ノイズ取得部173が、携帯電話機1が予め備える複数のノイズの音声データの中からいずれかのノイズの音声データを選択することで、ノイズの音声データを取得するようにしてもよい。例えば、携帯電話機1が記憶デバイスを具備し、当該記憶デバイスが、複数の周波数のノイズの音声データを予め記憶しておく。そして、ノイズ取得部173は、送話音声解析部172の検出する周波数に最も近い周波数のノイズの音声データを記憶デバイスから読み出してノイズ出力部13に出力する。
このように、ノイズ取得部173が、携帯電話機1が予め備える複数のノイズの中からいずれかのノイズを選択することで、ノイズ取得部173がシンセサイザ等の音声データ生成手段を有する必要が無くなり、携帯電話機1の構成を簡単にできる。
【0028】
なお、携帯電話機1の周囲の騒音が大きい場合でも、送話部11が取得する周囲音には発話者の発話が含まれており、ノイズ出力部13が、発話者の声の周波数に近い周波数のノイズを出力することを期待できる。また、携帯電話機1の周囲の騒音が大きい場合、ノイズ出力部13の出力するノイズの周波数が発話者の声と異なる場合でも、この騒音がマスクとなって、発話者の周囲の他者が、発話者の発話内容を聞き取り難いことを期待できる。
【0029】
なお、送話音声解析部172が行う音声データの解析は、周波数を検出するものに限らない。例えば、送話音声解析部172が、送話部11の取得する音声が発せられるタイミング(発話者が発話を行うタイミング)を検出するようにしてもよい。例えば、送話音声解析部172は、送話部11から出力される音声データが所定の閾値以上の音量を示す場合に、音声が発せられていると判定する。
そして、ノイズ取得部173は、送話音声解析部172の解析結果に基づいて、送話部11の取得する音声が発せられるタイミングで、ノイズの音声データをノイズ出力部13に出力する。そして、ノイズ出力部13は、ノイズ取得部173から出力される音声データに従って、ノイズ取得部173から音声データが出力されるときにノイズを出力し、ノイズ取得部173から音声データが出力されないときはノイズを出力しないことで、送話部11の取得する音声が発せられるタイミングでノイズを出力する。すなわち、送話音声解析部172が、音声が発せられていると判定したときに、ノイズ出力部13が、ノイズを出力する。一方、送話音声解析部172が、音声が発せられていないと判定したときは、ノイズ出力部13は、ノイズを出力しない。
【0030】
これにより、例えば、呼が確立されている間常にノイズ出力部13がノイズを出力する場合との比較において、ノイズ出力部13がノイズを出力する時間(呼が確立されている時間に対する、ノイズ出力部13がノイズを出力する時間の割合)を減少させることができる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0031】
また、ノイズ出力部13が、発話者の発話(送話部11の取得する音声)を一定時間遅延させてノイズとして出力する場合、発話者が発話を行わない状態で、ノイズ出力部13が当該ノイズを出力すると、発話者の周囲の他者が当該ノイズを聞き取ることで、発話者の発話内容が当該他者に聞き取られてしまうおそれがある。
そこで、送話音声解析部172が、発話者が発話を行うタイミングを検出し、発話者が発話を行うタイミングでのみノイズを出力する。これにより、ノイズ出力部13が、発話者が発話を行わない状態で、発話者の発話を遅延させた音声(ノイズ)を出力し、発話者の周囲の他者が当該ノイズを聞き取ることで、発話者の発話内容が当該他者に聞き取られてしまうことを防止できる。
【0032】
なお、ノイズ出力部13が、送話部11の取得する音声が発せられるタイミングで出力するノイズとしては、様々なものを用いることができる。
例えば、上述したように、発話者の発話を一定時間遅延させた音声であってもよいし、ホワイトノイズまたはピンクノイズまたはレッドノイズなど、他のノイズであってもよい。
【0033】
あるいは、送話音声解析部172が、送話部11の取得する音声が発せられるタイミングと共に、上述したように、送話部11の取得する音声の周波数を検出するようにしてもよい。そして、ノイズ出力部13は、送話部11の取得する音声が発せられるタイミングで、送話部11の取得する音声に近い周波数のノイズの音声データを出力する。
【0034】
この場合、上述したように、ノイズ取得部173は、携帯電話機1の予め備える複数のノイズの音声データの中から何れかのノイズの音声データを取得するようにしてもよいし、あるいは、ノイズ取得部173が音声データ生成手段を有して、送話音声解析部172の検出する周波数に近い周波数のノイズの音声データを生成するようにしてもよい。そして、ノイズ出力部13は、ノイズ取得部173の取得する音声データに従ってノイズを出力する。
このように、ノイズ出力部13が、送話部11の取得する音声が発せられるタイミングで、送話部11の取得する音声に近い周波数のノイズの音声データを出力することで、ノイズ出力に伴う携帯電話機1の消費電力増大を、さらに抑制できる。
【0035】
あるいは、送話音声解析部172が、送話部11の取得する音声の音量を検出し、ノイズ出力部13が、送話音声解析部172の検出する音量に基づいてノイズを出力するようにしてもよい。例えば、ノイズ出力部13は、送話部11の取得する音声の音量が大きいほど大きい音量のノイズを出力する。
これにより、ノイズ出力部13が必要以上に大きい音量のノイズを出力することを抑制できる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
【0036】
次に、図5を参照して携帯電話機1の動作について説明する。
図5は、通話時に携帯電話機1が行う処理の手順を示すフローチャートである。携帯電話機1は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
まず、制御部17は、携帯電話機1自らのユーザによる通信切断操作や、通話相手の電話機からの通話終了を示す信号の受信など、通話終了か否か(通話終了事象の有無)を判定する(ステップS101)。
【0037】
通話終了と判定した場合(ステップS101:YES)、同図の処理を終了する。その後、携帯電話機1は、携帯電話機1自らのユーザによる通信切断操作を受け付けた場合は通話終了を示す信号を出力し、通話終了を示す信号を受信した場合は通話終了表示を行うなど、通信終了時の処理を行う。
【0038】
一方、ステップS101において、通話終了でないと判定した場合(ステップS101:NO)、携帯電話機1は、受信処理を行う(ステップS102)。具体的には、無線通信部16が、通話相手の音声信号を無線信号にて受信して音声データに変換し、制御部17に出力する。そして、制御部17は、無線通信部16から出力される通話相手の音声データを受話部12に出力する。
【0039】
また、送話音声解析部172は、送話部11が周囲音(発話者の発話)を取得して出力する音声データを解析して、当該音声の周波数を検出し、検出した周波数をノイズ取得部173に出力する(ステップS103)。
ノイズ取得部173は、送話音声解析部172から出力される周波数に基づいてノイズの音声データを取得し、取得した音声データをノイズ出力部13に出力する(ステップS104)。
【0040】
そして、受話部12が、制御部17から出力される音声データに従って、通話相手の音声を出力する(ステップS105)。また、ノイズ出力部13が、ノイズ取得部173から出力される音声データに従って、ノイズを出力する(ステップS106)。
また、携帯電話機1は、送信処理を行う(ステップS107)。具体的には、制御部17が、ステップS103で送話部11から取得する音声データを無線通信部16に出力し、無線通信部16は、制御部17から出力される音声データを無線信号にて送信する。
その後、ステップS101に戻り、同図の処理を繰り返す。
【0041】
以上のように、送話音声解析部172が、送話部11の取得する音声を解析し、ノイズ出力部13が、送話部11の取得する音声に似た周波数のノイズを出力する、あるいは、送話部11の取得する音声が発せられるタイミングでノイズを出力する、あるいは、送話部11の取得する音声の音量に応じた音量のノイズを出力するなど、送話音声解析部172の解析結果に基づいてノイズを出力する。
これにより、ノイズの音量を比較的小さくでき、あるいは、ノイズ出力部13がノイズを出力する時間を減少させることができ、あるいは、ノイズ出力部13が必要以上に大きい音量のノイズを出力することを抑制できる。従って、ノイズ出力に伴う携帯電話機1の消費電力増大を抑制できる。
すなわち、発話者は、他者のいない場所に移動せずに、比較的大きい音量で発話を行うことができ、かつ、携帯電話機1の消費電力を削減し得る。
【0042】
<第2の実施形態>
図6は、本発明の第2の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。同図において、携帯電話機2は、送話部(音声取得部)11と、受話部(第2音声出力部)12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部(音声信号取得部)16と、制御部27とを具備する。制御部27は、音声処理部271を具備する。音声処理部271は、送話音声解析部(音声解析部)172と、ノイズ取得部173と、逆位相取得部274と、重ね合わせ部275とを具備する。
同図において、図1の各部に対応して同様の機能を有する部分には同一の符号(11〜16、172、173)を付し、説明を省略する。
【0043】
制御部27は、送話部11の取得する音声(図6の音声P11)を解析して、制御部17(図1)と同様にノイズの音声データを生成する。また、制御部27は、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせることで、通話相手の音声に対するノイズキャンセルを行う。
【0044】
逆位相取得部274は、ノイズ取得部173の取得するノイズ(の音声データ)を逆位相にした音声のデータ(以下、「逆位相データ」と称する)を取得する。
ここで、逆位相取得部274は、ノイズ取得部173が取得するノイズの音声データの出力を受け、このノイズを逆位相にした音声データを生成することで、逆位相データを取得する。
【0045】
なお、逆位相取得部274が逆位相データを取得する方法は、上記の逆位相データを生成する方法に限らない。例えば、携帯電話機1が記憶デバイスを具備し、当該記憶デバイスが、ノイズの音声データと、当該ノイズを逆位相にした逆位相データとを予め記憶しておくようにしてもよい。そして、ノイズ取得部173は、記憶デバイスからノイズの音声データを取得し、逆位相取得部274は、記憶デバイスから逆位相データを読み出す。
【0046】
重ね合わせ部275は、複数の音声を重ね合わせた音声データを生成する。本実施形態では、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、無線通信部16が受信して出力する通話相手の音声データに重ね合わせた音声データ(すなわち、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、受話部12に出力する。
【0047】
この携帯電話機2では、ノイズ出力部13は、携帯電話機1(図1)の場合と同様、ノイズP13を出力する。一方、受話部12は、通話相手の音声に、ノイズP13を逆位相にした音声を重ね合わせた音声P22を出力する。
そして、ノイズ出力部13の出力するノイズP13と、受話部12の出力する音声P22に含まれる、ノイズP13を逆位相にした音声とが、互いに打ち消しあう。その結果、受話部12の出力する音声に含まれる、通話相手の音声P12が残って、携帯電話機2のユーザに取得(聴取)される。
【0048】
このように、逆位相取得部274が取得する逆位相データは、ノイズ出力部13の出力するノイズを打ち消すノイズキャンセル信号として作用する。
【0049】
次に、図7を参照して携帯電話機2の動作について説明する。
図7は、通話時に携帯電話機2が行う処理の手順を示すフローチャートである。携帯電話機2は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
【0050】
ステップS201は、図5のステップS101と同様である。
ステップS202において、携帯電話機1は、受信処理を行う。ここでいう受話処理は、図5のステップS102における受話処理のうち、無線通信部16が、通話相手の音声信号を無線信号にて受信して音声データに変換し、制御部27に出力する部分である。
ステップS203〜S204は、図5のステップS103〜S104と同様である。
【0051】
ステップS205において、逆位相取得部274は、逆位相データ(ステップS204でノイズ取得部173が取得するノイズを逆位相にした音声のデータ)を取得する。そして、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、無線通信部16が受信して出力する通話相手の音声データに重ね合わせた音声データ(すなわち、通話相手の音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、受話部12に出力する。受話部12は、重ね合わせ部275から出力される音声データに従って音声を出力する。
【0052】
上述したように、この逆位相データを、ステップS204でノイズ取得部173が取得するノイズに重ね合わせると、当該ノイズを打ち消す。すなわち、逆位相データは、ノイズキャンセル信号として作用する。
ステップS206〜S208は、図5のステップS105〜S107と同様である。
【0053】
以上のように、重ね合わせ部275が、通話相手の音声にノイズを逆位相にした音声を重ね合わせ、受話部12が、当該音声を出力する。このノイズを逆位相にした音声と、ノイズ出力部13の出力する音声とが互いに打ち消しあって、携帯電話機2のユーザは、ノイズを含まない(あるいはノイズの音量が小さい)通話相手の音声を取得(聴取)できる。
【0054】
<第3の実施形態>
図8は、本発明の第3の実施形態における携帯電話機の概略構成および当該携帯電話機が行うノイズ音声出力を示す説明図である。同図において、携帯電話機3は、送話部(音声取得部)11と、受話部(第2音声出力部)12と、ノイズ出力部(音声出力部)13と、キー操作部14と、表示部15と、無線通信部(音声信号取得部)16と、制御部37とを具備する。制御部37は、音声処理部371を具備する。音声処理部371は、送話音声解析部(音声解析部)172と、ノイズ取得部173と、逆位相取得部274と、重ね合わせ部(音声信号生成部)275とを具備する。
同図において、図6の各部に対応して同様の機能を有する部分には同一の符号(11〜16、172、173、274、275)を付し、説明を省略する。
制御部37は、その具備する音声処理部371が送話部11の取得する音声に対してノイズキャンセルを行う点で、制御部27(図6)と異なる。
本実施形態では、重ね合わせ部275は、逆位相取得部274が取得する逆位相データを、送話部11が出力する音声データに重ね合わせた音声データ(すなわち、発話者の発話音声に、ノイズを逆位相にした音声を重ね合わせた音声を示すデータ)を生成し、無線通信部16に出力する。
【0055】
この携帯電話機3では、ノイズ出力部13は、携帯電話機1(図1)の場合と同様、ノイズP13を出力する。このノイズP13が送話部11に取得され、通話相手にとって、発話者の発話P11に対するノイズとなることが考えられる。
そこで、重ね合わせ部275が、送話部11の出力する音声データに逆位相データを重ね合わせるノイズキャンセルを行う。
【0056】
これにより、重ね合わせ部275は、発話者の発話P11(を示す音声データ)を生成する。あるいは、重ね合わせ部275は、送話部11の取得した音声に含まれるノイズを低減した音声データを生成する。
そして、無線通信部16が、重ね合わせ部275の生成した音声データを無線にて送信する。
【0057】
次に、図9を参照して携帯電話機3の動作について説明する。
図9は、通話時に携帯電話機3が行う処理の手順を示すフローチャートである。携帯電話機3は、発信時や着信時に呼が確立して通話可能な状態になると、同図の処理を開始する。
ステップS301〜S306は、図1のステップS101〜S106と同様である。
【0058】
ステップS307において、重ね合わせ部275は、送話部11から出力される音声データに逆位相データを重ね合わせる。
ステップS308は、図1のステップS107と同様である。すなわち、制御部37(重ね合わせ部275)が、ステップS306で生成した音声データを無線通信部16に出力し、無線通信部16は、制御部37から出力される音声データを無線信号にて送信する。
【0059】
以上のように、重ね合わせ部275が、送話部11の出力する音声データに逆位相データを重ね合わせるノイズキャンセルを行うので、通話相手は、発話者の発話音声(あるいはノイズを低減した発話者の発話音声)を取得(聴取)できる。
【0060】
なお、携帯電話機が、第2の実施形態で説明した、通話相手の音声に対するノイズキャンセルと、第3の実施形態で説明した、発話者(携帯電話機3のユーザ)の発話に対するノイズキャンセルとの両方を行うようにしてもよい。
【0061】
<第4の実施形態>
なお本発明の適用範囲は、上述した携帯電話機に限らない。本発明は、周囲の音声を取得する様々な機器に適用し得る。
図10は、本発明の第4の実施形態における音声出力装置の概略構成を示す構成図である。同図において、音声出力装置4は、音声取得部41と、音声処理部171と、ノイズ出力部(音声出力部)13とを具備する。音声処理部171は、音声解析部472と、ノイズ取得部173とを具備する。
【0062】
音声取得部41は、送話部11(図1)と同様、マイクを有し、周囲音を取得して音声データに変換する。特に、音声取得部41は、発話者(音声出力装置4のユーザ)の発話を取得して音声データに変換する。
音声解析部472は、送話音声解析部172(図1)と同様、音声取得部41の生成する発話者の音声データを解析する。
また、音声出力装置4の、音声取得部41や音声解析部472以外の各部も、図1で説明した各部に対応して同様の機能を有する。そこで、図1の各部に対応する部分に、図1の場合と同一の符号(13、171、173)を付して説明を省略する。
【0063】
この音声出力装置4は、ゲーム機や、タブレットPC(Personal Computer)や、ノートPCや、PDA(Personal Digital Assistant)など、周囲の音声を取得する様々な機器に適用可能である。これらの機器が音声出力装置4を具備することで、上述した携帯電話機の場合と同様、発話者の発話内容を、発話者の周囲の他者に対して隠すことができる。
【0064】
なお、制御部17〜371の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0065】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0066】
1〜3 携帯電話機
11 送話部
12 受話部
13 ノイズ出力部
14 キー操作部
15 表示部
16 無線通信部
17〜37 制御部
171〜371 音声処理部
172 送話音声解析部
173 ノイズ取得部
274 逆位相取得部
275 重ね合わせ部
【特許請求の範囲】
【請求項1】
音声を取得する音声取得部と、
前記音声取得部の取得する音声を解析する音声解析部と、
前記音声解析部の解析結果に基づいて、前記音声取得部の取得する音声とは異なる音声を出力する音声出力部と、
を具備することを特徴とする音声出力装置。
【請求項2】
前記音声解析部は、前記音声取得部の取得する音声の周波数を検出し、
前記音声出力部は、前記音声解析部の検出する周波数に基づいて取得される音声を出力する、
ことを特徴とする音声出力装置。
【請求項3】
前記音声解析部は、前記音声取得部の取得する音声が発せられるタイミングを検出し、
前記音声出力部は、前記音声解析部の検出結果に基づいて、前記音声取得部の取得する音声が発せられるタイミングで、前記音声取得部の取得する音声とは異なる音声を出力する、
ことを特徴とする請求項1または2に記載の音声出力装置。
【請求項4】
音声信号を取得する音声信号取得部と、
前記音声出力部の出力する音声と逆位相の音声信号を取得する逆位相取得部と、
前記音声信号取得部の取得する前記音声信号の示す音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を出力する第2音声出力部と、
を具備することを特徴とする請求項1から3のいずれか一項に記載の音声出力装置、
【請求項5】
前記音声出力部の出力する音声と逆位相の音声信号を取得する逆位相取得部と、
前記音声取得部の取得する音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を示す音声信号を生成する音声信号生成部と、
を具備することを特徴とする請求項1から3のいずれか一項に記載の音声出力装置。
【請求項6】
前記音声取得部の取得する音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を示す音声信号を生成する音声信号生成部と、
を具備することを特徴とする請求項4に記載の音声出力装置。
【請求項7】
音声出力装置の音声出力方法であって、
音声を取得する音声取得ステップと、
前記音声取得ステップにて取得する音声を解析する音声解析ステップと、
前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、
を具備することを特徴とする音声出力方法。
【請求項8】
音声出力装置としてのコンピュータに、
音声を取得する音声取得ステップと、
前記音声取得ステップにて取得する音声を解析する音声解析ステップと、
前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、
を実行させるためのプログラム。
【請求項1】
音声を取得する音声取得部と、
前記音声取得部の取得する音声を解析する音声解析部と、
前記音声解析部の解析結果に基づいて、前記音声取得部の取得する音声とは異なる音声を出力する音声出力部と、
を具備することを特徴とする音声出力装置。
【請求項2】
前記音声解析部は、前記音声取得部の取得する音声の周波数を検出し、
前記音声出力部は、前記音声解析部の検出する周波数に基づいて取得される音声を出力する、
ことを特徴とする音声出力装置。
【請求項3】
前記音声解析部は、前記音声取得部の取得する音声が発せられるタイミングを検出し、
前記音声出力部は、前記音声解析部の検出結果に基づいて、前記音声取得部の取得する音声が発せられるタイミングで、前記音声取得部の取得する音声とは異なる音声を出力する、
ことを特徴とする請求項1または2に記載の音声出力装置。
【請求項4】
音声信号を取得する音声信号取得部と、
前記音声出力部の出力する音声と逆位相の音声信号を取得する逆位相取得部と、
前記音声信号取得部の取得する前記音声信号の示す音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を出力する第2音声出力部と、
を具備することを特徴とする請求項1から3のいずれか一項に記載の音声出力装置、
【請求項5】
前記音声出力部の出力する音声と逆位相の音声信号を取得する逆位相取得部と、
前記音声取得部の取得する音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を示す音声信号を生成する音声信号生成部と、
を具備することを特徴とする請求項1から3のいずれか一項に記載の音声出力装置。
【請求項6】
前記音声取得部の取得する音声と、前記逆位相取得部の取得する音声信号の示す音声とを重ね合わせた音声を示す音声信号を生成する音声信号生成部と、
を具備することを特徴とする請求項4に記載の音声出力装置。
【請求項7】
音声出力装置の音声出力方法であって、
音声を取得する音声取得ステップと、
前記音声取得ステップにて取得する音声を解析する音声解析ステップと、
前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、
を具備することを特徴とする音声出力方法。
【請求項8】
音声出力装置としてのコンピュータに、
音声を取得する音声取得ステップと、
前記音声取得ステップにて取得する音声を解析する音声解析ステップと、
前記音声解析ステップでの解析結果に基づいて、前記音声取得ステップにて取得する音声とは異なる音声を出力する音声出力ステップと、
を実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公開番号】特開2012−203172(P2012−203172A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−67273(P2011−67273)
【出願日】平成23年3月25日(2011.3.25)
【出願人】(310006855)NECカシオモバイルコミュニケーションズ株式会社 (1,081)
【Fターム(参考)】
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願日】平成23年3月25日(2011.3.25)
【出願人】(310006855)NECカシオモバイルコミュニケーションズ株式会社 (1,081)
【Fターム(参考)】
[ Back to top ]