説明

端末装置および音声処理プログラム

【課題】片方の耳を用いて通話するユーザに通話の相手の方向を的確に知覚させることを課題とする。
【解決手段】端末装置200は、片方の耳での通話状態を検出すると、右耳通話時および左耳通話時について予め設定された補正値を用いて、通話の相手側の端末装置100に向かう方向と、端末装置200の端末方向とのなす相対角度を補正する。そして、端末装置200は、補正した相対角度が小さくなるほど音量が大きくなる特徴音を生成し、生成した特徴音を通話音声にミキシングする。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、端末装置および音声処理プログラムに関する。
【背景技術】
【0002】
従来、例えば、携帯電話やスマートフォンなどの端末装置を用いた通話を行う場合に、通話の相手の方向を求め、この方向に応じて通話音声を加工することにより、通話の相手の方向をユーザに知らせる従来技術がある。以下、図16および図17を参照しつつ従来技術を説明する。図16および図17は、従来技術の説明に用いる図である。例えば、図16に示すU1およびU2は通話を行っている当事者を示すものとする。
【0003】
この従来技術は、まず、U2が使用している端末装置の位置情報を取得し、U1が使用している端末装置とU2が使用している端末装置との位置関係を求める。なお、位置情報は、例えば、GPS(Global Positioning System)などを用いて取得される。
【0004】
続いて、この従来技術は、図16に示すように、U1が使用する端末装置の位置からU2が使用する端末装置の位置へ向かう方向と北方向とがなす角度θ1を求める。続いて、この従来技術は、図16に示すように、U1の正面方向であるFとU1が使用する端末装置の端末方向とが一致していることを前提として、U1が使用する端末装置の端末方向と北方向とがなす角度θ2を求める。端末方向は、例えば、端末装置の長手方向に相当する。角度θ2は、端末装置に搭載された電子コンパスなどにより求められる。
【0005】
続いて、この従来技術は、図16に示すように、角度θ1および角度θ2に基づいて、U1の使用する端末装置の端末方向に対する、U1が使用する端末装置の位置からU2が使用する端末装置の位置へ向かう方向の相対角度θを求める。続いて、この従来技術は、相対角度θに応じて出力音声を生成する。例えば、この従来技術は、図17に示すように、相対角度θに応じて、左耳用の音声および右耳用の音声にそれぞれ生成し、左耳用の音声および右耳用の音声を左右別系統で出力する。例えば、端末装置に搭載されたスピーカ、あるいは端末装置に接続されたヘッドホンやイヤホンなどを介して左右別系統で出力する。このように、この従来技術は、出力する左耳用の音声および右耳用の音声の違いで通話の相手の方向を表現することで、通話の相手の端末装置の方向から音声が聞こえてくるようにユーザに知覚させる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008−184621号公報
【特許文献2】特開2005−341092号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述した従来技術は、図17にも示すように、左耳用の音声および右耳用の音声の違いで通話の相手の方向を表現し、通話の相手の方向をユーザに知覚させる。このため、片方の耳を用いて通話する場合には、左耳用の音声および右耳用の音声の違いで通話の相手の方向を表現するという方法が利用できないので、通話の相手の方向をユーザに知覚させることができないという問題がある。
【0008】
また、上述した従来技術では、ユーザの正面方向と端末方向とが一致しているという前提で上述した相対角度θを求め、この相対角度θに応じて出力音声を生成する。このため、ユーザの正面方向と端末方向とが一致していない状況では、通話の相手の方向をユーザに対して的確に知覚させることができない。なお、片方の耳を用いて通話する場合には、ユーザの正面方向と端末方向とが一致しない場合がほとんどである。このため、ユーザの正面方向と端末方向とが一致していない状況下で、上述した相対角度θを精度よく導出することができなければ、片方の耳を用いて通話するユーザに対して通話の相手の方向を的確に知覚させることができない。
【0009】
そこで、本発明は、1側面において、片方の耳を用いて通話するユーザに通話の相手の方向を的確に知覚させることが可能な端末装置および音声処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
本願の開示する端末装置は、1つの態様において、他端末位置取得部と、自端末位置取得部と、第1方向取得部と、第2方向取得部と、傾斜方向取得部と、補正部と、決定部とを有する。他端末位置取得部は相手装置の位置を示す位置情報を取得する。自端末位置取得部は自端末装置の位置を示す位置情報を取得する。第1方向取得部は前記取得した自端末装置の位置を基点として算出される前記取得した相手装置の位置へ向かう方向である第1の方向を取得する。第2方向取得部は自端末装置が向く方向である第2の方向を取得する。傾斜方向取得部は自端末装置の傾き方向を検出するセンサーから自端末装置が右方向に傾いているか左方向に傾いているかを示す傾斜情報を取得する。補正部は前記取得した傾斜情報が右方向を示すか左方向を示すかに応じて、前記第1の方向と前記第2の方向とのなす相対角度に対する補正量を切り替える。決定部は前記補正量により補正された相対角度に応じて、音出力部から出力される出力音の属性を決定する。
【発明の効果】
【0011】
本発明の1つの態様によれば、片方の耳を用いて通話するユーザに通話の相手の方向を的確に知覚させることができる。
【図面の簡単な説明】
【0012】
【図1】図1は、実施例1に係る端末装置の構成を示す機能ブロック図である。
【図2】図2は、実施例1に係る方向取得部の説明に用いる図である。
【図3】図3は、実施例1に係る算出部の説明に用いる図である。
【図4A】図4Aは、実施例1に係る判定部の説明に用いる図である。
【図4B】図4Bは、実施例1に係る判定部の説明に用いる図である。
【図5A】図5Aは、実施例1に係る補正部の説明に用いる図である。
【図5B】図5Bは、実施例1に係る補正部の説明に用いる図である。
【図6】図6は、実施例1に係る補正部の説明に用いる図である。
【図7】図7は、実施例1に係る生成部の説明に用いる図である。
【図8】図8は、実施例1に係る生成部の説明に用いる図である。
【図9】図9は、実施例1に係るミキシング部の説明に用いる図である。
【図10】図10は、実施例1に係る生成部の説明に用いる図である。
【図11】図11は、実施例1に係る端末装置の全体的な処理の流れを示す図である。
【図12】図12は、実施例1に係る通話状態検出処理の流れを示す図である。
【図13】図13は、実施例1に係る持ち方判定処理の流れを示す図である。
【図14】図14は、実施例1に係る方角補正処理の流れを示す図である。
【図15】図15は、端末装置のハードウェア構成の一例を示す図である。
【図16】図16は、従来技術の説明に用いる図である。
【図17】図17は、従来技術の説明に用いる図である。
【発明を実施するための形態】
【0013】
以下に、図面を参照しつつ、本願の開示する端末装置および音声処理プログラムの一実施形態について詳細に説明する。なお、本願の開示する端末装置および音声処理プログラムの一実施形態として後述する実施例により、本願が開示する技術が限定されるものではない。
【実施例1】
【0014】
[端末装置の構成(実施例1)]
図1は、実施例1に係る端末装置の構成を示す機能ブロック図である。図1には、端末装置100は通話の相手が使用する装置であり、端末装置200は自分が使用する装置である例を図示する。端末装置100および端末装置200は、例えば、携帯電話やスマートフォン、PHS(Personal Handy-phone System)など通話可能で、位置情報を取得可能な携帯端末である。なお、図1に示す端末装置100および端末装置200は同一の構成を有する装置であるが、以下の実施例1では、端末装置100から送信された音声を端末装置200が受信する場合の一実施形態の説明に必要な処理機能部のみを図示する。
【0015】
図1に示すように、端末装置100は、マイク101と、符号化部110と、位置取得部120と、位置送信部130とを有する。マイク101は、端末装置100のユーザの発話音声を入力する。符号化部110は、マイク101が入力するユーザの発話音声を符号化する。なお、符号化部110により符号化された音声は、端末装置200に送信される。
【0016】
位置取得部120は、端末装置100の位置情報を取得する。例えば、位置情報取得部120は、例えば、GPS(Global Positioning System)などを用いて得られる緯度および経度から、平面直角座標上における端末装置100の位置を求める。以下では、端末装置の位置を、例えば、「sender_pos(x_sender,y_sender)」と表記する。なお、既存技術を利用することにより、緯度および経度から平面直角座標上における端末装置100の位置を求めることができる。この既存技術の一例としては、例えば、「TOTAL INVERSE SOLUTIONS FOR THE GEODESIC AND GREAT ELLIPTIC」 B.R.Bowring Survey Review33,261(July,1996)461-476,URL「http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm/(2010年9月1日検索)」がある。また、この既存技術の他の一例としては、URL「http://vldb.gsi.go.jp/sokuchi/surveycalc/algorithm/bl2xy/bl2xy.htm(2010年9月1日検索)」もある。位置送信部130は、位置取得部120により取得された端末装置100の位置情報を端末装置200に送信する。
【0017】
図1に示すように、端末装置200は、マイク201と、スピーカ202と、符号化部210と、位置取得部220と、位置送信部230と、位置受信部240と、方向取得部250と、算出部260と、復号化部270とを有する。さらに、端末装置200は、検出部280Aと、判定部280Bと、補正部280Cと、生成部280Dと、ミキシング部280Eと、加工部290とを有する。
【0018】
図1に示すマイク201、符号化部210、位置取得部220および位置送信部230は、上述した端末装置100のマイク101、符号化部110、位置取得部120および位置送信部130とそれぞれ同様の処理を行う。例えば、位置取得部220は、GPS(Global Positioning System)などを用いて得られる緯度および経度から、平面直角座標上における端末装置200の位置を求める。位置情報取得部220は自端末位置取得部の一例である。以下では、端末装置の位置を、例えば、「receiver_pos(x_receiver,y_receiver)」と表記する。位置送信部230は、位置取得部220により取得された端末装置200の位置情報を端末装置100に送信する。なお、マイク201、符号化部210の説明は省略する。
【0019】
図1に示す位置受信部240は、端末装置100から送信された位置情報を受信する。位置受信部240は他端末位置取得部の一例である。
【0020】
図1に示す方向取得部250は、電子コンパスを用いて、端末装置200の端末方向の情報を取得する。図2を参照しつつ、方向取得部250について説明する。図2は、実施例1に係る方向取得部の説明に用いる図である。
【0021】
図2に示すように、方向取得部250は、電子コンパスを用いて、端末装置200の中心縦軸2Aの方向に対応する端末方向D3と、北方向(0°)とがなす角度「ang1(receiver_angle)」を取得する。
【0022】
図1に示す算出部260は、端末装置200の端末方向に対する、端末装置200の位置から端末装置100の位置へ向かう方向の相対角度を求める。以下では、算出部260により算出される相対角度を、例えば「ang3(relative angle1)」と表記する。図3を参照しつつ、算出部260について説明する。図3は、実施例1に係る算出部の説明に用いる図である。図3に記載のU1は端末装置200を使用しているユーザを示し、図3に記載のU2は端末装置100を使用しているユーザを示す。また、図3に記載のD1は、端末装置200から端末装置100へ向かう方向を示す。また、図3に記載のD2は端末装置200を使用するユーザ方向、つまりユーザの正面の方向を示す。また、図3に記載のD3は端末装置200の端末方向を示す。なお、図3に記載のD3は、図2に記載のD3に対応する。
【0023】
まず、算出部260は、位置取得部220から端末装置200の位置情報(x_receiver,y_receiver)を取得し、位置受信部240から端末装置100の位置情報(x_sender,y_sender)を取得する。続いて、算出部260は、図3に示すように、端末装置200および端末装置100の位置情報に基づいて、端末装置200から端末装置100へ向かう方向D1を求める。そして、算出部260は、図3に示すように、方向D1と北方向(0°)とがなす角度「ang2(sender_angle)」を求める。例えば、算出部260は、以下の式(1)により、「ang2(sender_angle)」を求めることができる。
【数1】

【0024】
続いて、算出部260は、端末方向D3と北方向とがなす角度「ang1(receiver_angle)」を方向取得部250から取得する。そして、算出部260は、図3に示すように、「ang1(receiver_angle)」と、「ang2(sender_angle)」とに基づいて、上述した相対角度「relative angle1」を求める。例えば、算出部260は、以下の式(2)により、相対角度「ang3(relative angle1)」を求めることができる。なお、算出部260は第1方向取得部、第2方向取得部の一例である。
【数2】

【0025】
図1に示す復号化部270は、符号化された音声を端末装置100から受信し、受信した音声を復号する。
【0026】
図1に示す検出部280Aは、ユーザの通話状態を検出する。例えば、検出部280Aは、音声出力パスのチャネル数、つまり音声の出力信号の数を監視し、チャネル数が1chである場合には、片方の耳を用いた通話状態にあると判定する。検出部280Aは、片方の耳を用いた通話状態にあると判定した場合、片方の耳を用いた通話状態であることを示す所定値を所定のフラグにセットする(receiver_flag=1)。
【0027】
また、検出部280Aは、チャネル数が2chである場合には、片方の耳を用いた通話状態以外、例えば、ヘッドホンやイヤホンなどを用いた通話状態にあると判定する。検出部280Aは、例えば、ヘッドホンやイヤホンなどを用いた通話状態にあると判定した場合、ヘッドホンやイヤホンなどを用いた通話状態であることを示す所定値を所定のフラグにセットする(receiver_flag=2)。なお、検出部280Aは通話状態判定部の一例である。
【0028】
なお、検出部280Aは、例えば、音声の出力信号数や、モノラルやステレオなどの音声の出力状態を示す情報が記憶されているレジスタを参照して、通話を開始するユーザが片方の耳を用いた通話状態にあるか否かを判定するようにもできる。
【0029】
図1に示す判定部280Bは、ユーザの通話状態が片方の耳を用いた通話状態にある場合には、ユーザが右耳または左耳のどちらの耳を用いて通話を行っているかを判定する。図4Aおよび図4Bを参照しつつ、判定部280Bについて説明する。図4Aおよび図4Bは、実施例1に係る判定部の説明に用いる図である。図4Aおよび図4Bに記載のU1は端末装置200のユーザを示し、図3に記載のU1と対応する。図4Aに記載のacce1は端末装置200のX軸方向の負の加速度を示す。図4Bに記載のacce2は端末装置200のX軸方向の正の加速度を示す。
【0030】
例えば、判定部280Bは、検出部280Aによりセットされたフラグの値を取得し、取得したフラグの値が、片方の耳を用いた通話状態にあることを示す値(receiver_flag=1)であるか否かを判定する。判定の結果、片方の耳を用いた通話状態にあることを示す値である場合には、判定部280Bは、加速度センサーから端末装置200の加速度を取得する。
【0031】
続いて、判定部280Bは、取得した加速度に基づいて、ユーザが右耳または左耳のどちらの耳を用いて通話を行っているかを判定する。例えば、図4Aに示すように、判定部280Bは、加速度センサーから取得したX軸方向の加速度acce1が負の値である場合には、右耳を用いて通話を行っていると判定する。判定部280Bは、右耳を用いて通話を行っていると判定した場合、右耳での通話であることを示す所定値を所定のフラグにセットする(hold_flag=0)。
【0032】
一方、図4Bに示すように、判定部280Bは、加速度センサーから取得したX軸方向の加速度acce2が正の値である場合には、左耳を用いて通話を行っていると判定する。判定部280Bは、左耳を用いて通話を行っていると判定した場合、左耳での通話であることを示す所定値を所定のフラグにセットする(hold_flag=1)。判定部280Bは傾斜方向取得部の一例である。
【0033】
図1に示す補正部280Cは、右耳通話時および左耳通話時のそれぞれについて予め設定された補正値を用いて、算出部260により算出された相対角度「ang3(relative angle1)」を補正した補正相対角度を求める。以下では、補正部280Cにより補正された補正相対角度を「ang6(relative angle2)」と表記する。図5A、図5Bおよび図6を参照しつつ、補正部280Cについて説明する。
【0034】
図5A、図5Bおよび図6は、実施例1に係る補正部の説明に用いる図である。図5Aは、端末装置200を用いてユーザが通話している状態を左側面から見た様子を示す。また、図5Bは、端末装置200を用いてユーザが通話している状態を上方から見た様子を示す。また、図5Aおよび図5Bに記載のD2はユーザ方向を示し、図3に記載のD2に対応する。また、図5Aおよび図5Bに記載のD3は端末装置200の端末方向を示し、図2および図3に記載のD3に対応する。
【0035】
例えば、補正部280Cは、検出部280Aによりセットされたフラグの値を取得し、取得したフラグの値が、片方の耳を用いた通話状態にあることを示す値(receiver_flag=1)であるか否かを判定する。
【0036】
判定の結果、片方の耳を用いた通話状態にあることを示す値である場合には、補正部280Cは、判定部280Bによりセットされたフラグの値を取得し、取得したフラグの値が、右耳による通話または左耳による通話のどちらを示す値であるか否かを判定する。判定の結果、補正部280Cは、左耳での通話であることを示す値(hold_flag=1)である場合には、図5Bに示すように、左耳通話時の補正値「ang4(delta_angle_L)」を取得する。続いて、補正部280Cは、算出部260により算出された相対角度「relative angle1」を取得する。そして、補正部280Cは、図6に示すように、補正値「ang4(delta_angle_L)」を用いて、相対角度「relative angle1」を補正し、補正相対角度「ang6(relative angle2)」を求める。このようにして、補正部280Cは、左耳通話時の補正相対角度を求める。
【0037】
なお、右耳通話時についても同様にして補正相対角度を求めることができる。例えば、補正部280Cは、判定部280Bによりセットされたフラグの値が、右耳での通話であることを示す値(hold_flag=0)である場合には、図5Bに示すように、右耳通話時の補正値「ang5(delta_angle_R)」を取得する。続いて、補正部280Cは、算出部260により算出された相対角度「relative angle1」を取得する。そして、補正部280Cは、補正値「ang5(delta_angle_R)」を用いて、相対角度「relative angle1」を補正し、補正相対角度「ang6(relative angle2)」を求める。補正部280Cは補正部の一例である。
【0038】
図1に示す生成部280Dは、端末装置100から受信した音声に重畳する特徴音を、補正部280Cから取得した補正相対角度に応じて生成する。図7および図8を参照しつつ、生成部280Dについて説明する。図7および図8は、実施例1に係る生成部の説明に用いる図である。図7に記載のD2はユーザ方向を示し、図3、図5Aおよび図5Bに記載のD2に対応する。また、図7に記載のD1は端末装置100の方角を示し、図3および図6に記載のD1に対応する。図8は、特徴音を生成する時に用いるゲインを示す。
【0039】
図7に示すように、生成部280Dは、補正部280Cから取得した補正相対角度に応じて、ユーザ方向D2が、端末装置200から端末装置100へ向かう方向D1に近いほど音が大きくなるような特徴音を生成する。例えば、生成部280Dは、以下の式(3)に基づいて特徴音を生成する。
【数3】

【0040】
例えば、図8に示すように、生成部280Dが特徴音の生成に用いるゲインには、補正相対角度「ang6(relative angle2)」が180°、または−180°であるときに音量が最も小さく調整されるように最小値の「1」が設定されている。また、図8に示すように、補正相対角度「ang6(relative angle2)」が0°であるときに特徴音の音量が最も大きく調整されるように最大値の「2」が設定されている。また、図8に示すように、生成部280Dは、補正相対角度「ang6(relative angle2)」が0°に近づくほど音量が大きく調整されるようにゲインが設定されている。つまり、生成部280Dは、図8に示すゲインを用いて、端末装置200のユーザが端末装置100の方向を向くほど音量の大きい特徴音を生成することとなる。
【0041】
ミキシング部280Eは、ユーザが片方の耳を用いた通話状態にある場合には、後述する加工部290から入力される音声に、生成部280により生成された特徴音を重畳する。図9を用いて、ミキシング部280Eについて説明する。図9は、実施例1に係るミキシング部の説明に用いる図である。図9に記載のSpOut(n)は加工部290からの入力音声を示し、図9に記載のSigOut(n)はミキシング部280Eにより音声に特徴音が重畳された出力音声を示す。また、図9に記載のartSig(n)は生成部280Dにより生成された特徴音を示し、図9に記載のreceiver_flagは上述した検出部280Aから入力されるフラグである。また、図9に記載のSWは上述した検出部280Aから入力されるフラグに応じて切り替えられるスイッチを示す。
【0042】
例えば、ミキシング部280Eは、検出部280Aによりセットされたフラグの値を取得し、取得したフラグの値が、片方の耳を用いた通話状態にあることを示す値(receiver_flag=1)であるか否かを判定する。判定の結果、片方の耳を用いた通話状態にあることを示す値である場合(receiver_flag=1の場合)には、ミキシング部280Eは、スイッチSWをオンにする。続いて、ミキシング部280Eは、加工部290からの入力音声「SpOut(n)」に、生成部280により生成された特徴音「artSig(n)」を重畳して「SigOut(n)」を生成する。そして、ミキシング部280Eは、「SigOut(n)」を再生し、出力系統が1系統であるモノラル出力でスピーカ202から出力する。
【0043】
また、ミキシング部280Eは、上述した検出部280Aから入力されるフラグに、ヘッドホンやイヤホンなどを用いた通話状態であることを示す所定値がセットされている場合(receiver_flag=2の場合)には、スイッチSWをオフにする。この場合、ミキシング部280Eは、加工部290からの入力音声「SpOut(n)」を再生し、出力系統が左右別の2系統であるステレオ出力でスピーカ202から出力する。なお、生成部280D、ミキシング部280Eは決定部の一例である。
【0044】
加工部290は、ユーザの通話状態について検出部280Aによりセットされたフラグの内容に応じて、復号化部270から復号された音声を加工する。図10を用いて加工部290について説明する。図10は、実施例1に係る生成部の説明に用いる図である。図10に記載のU1は端末装置200を使用するユーザを示す。また、図10に記載の「H(θ)」は音源1からユーザU1の右耳に音声が入力される場合の頭部伝達関数(インパルス応答)を示す。また、図10に記載の「H(θ)」は音源1からユーザU1の左耳に音声が入力される場合の頭部伝達関数(インパルス応答)を示す。また、図10に記載の「in_R」は音源1から右耳に入力される音声を示す。また、図10に記載の「in_L」は音源1から左耳に入力される音声を示す。
【0045】
例えば、加工部290は、上述した検出部280Aから入力されるフラグに、片方の耳を用いた通話状態であることを示す所定値がセットされている場合(receiver_flag=1の場合)には、次にように処理する。すなわち、加工部290は、復号化部270から復号された音声をそのままミキシング部280Eに送り出す。
【0046】
一方、加工部290は、上述した検出部280Aから入力されるフラグに、ヘッドホンやイヤホンなどを用いた通話状態であることを示す所定値がセットされている場合(receiver_flag=2の場合)には、次のように処理する。すなわち、加工部290は、算出部260により算出された相対角度を「θ」に代入し、以下の式(4−1)および(4−2)を用いて、右耳用および左耳用の音声をそれぞれ生成する。なお、式(4−1)および(4−2)は、頭部伝達関数(インパルス応答)と音源Sの音声信号との畳み込み演算を示し、例えば、FIRフィルタ(Finite impulse response)を用いる。
【数4】

【0047】
そして、加工部290は、上述した式(4)を用いて生成した右耳用および左耳用の音声をミキシング部280Eに送り出す。なお、上述したように、ヘッドホンやイヤホンなどを用いた通話状態である場合には、ミキシング部280Eにて音声への特徴音の重畳が行われることはなく、右耳用および左耳用の音声がミキシング部280Eからそのまま出力されることとなる。
【0048】
上述した端末装置100および端末装置200は、例えば、RAM(Random Access Memory)やフラッシュメモリ(flash memory)などの半導体メモリ素子を有し、各種処理に利用する。また、上述した端末装置100および端末装置200は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路を有し、RAMやフラッシュメモリを用いて各種処理を実行する。なお、上述した端末装置100および端末装置200は、CPUやMPUの代わりに、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路を有してもよい。
【0049】
[端末装置による処理(実施例1)]
図11〜14を用いて、上述した端末装置200による処理の流れを説明する。図11は、実施例1に係る端末装置の全体的な処理の流れを示す図である。図12は、実施例1に係る通話状態検出処理の流れを示す図である。図13は、実施例1に係る持ち方判定処理の流れを示す図である。図14は、実施例1に係る方角補正処理の流れを示す図である。
【0050】
まず、図11を用いて、端末装置200の全体的な処理の流れを説明する。図11に示すように、例えば、端末装置200は、通話ボタンの操作の有無を監視し、通話開始の検出を行う。そして、通話開始が検出されると(ステップS101,Yes)、位置取得部220は、端末装置200の位置情報を取得する(ステップS102)。なお、通話開始を検出していない場合に(ステップS101,No)、端末装置200は、通話開始を検出するまで、通話ボタンの操作の有無について監視を継続する。
【0051】
続いて、方向取得部250は、端末装置200の端末方向の情報を取得する(ステップS103)。続いて、算出部260は、相手方角、つまり、端末装置200の端末方向に対する、端末装置200の位置から端末装置100の位置へ向かう方向の相対角度を算出する(ステップS104)。
【0052】
続いて、検出部280Aは、通話状態検出処理を実行する(ステップS105)。続いて、検出部280Aは、ステップS105の通話状態検出処理の結果、ユーザの通話状態が片方の耳を用いた通話状態にあるか否かを判定する(ステップS106)。例えば、片方の耳を用いた通話状態にあると検出部280Aにより判定された場合には(ステップS106,Yes)、判定部280Bは、右耳または左耳のどちらの耳を用いて通話を行っているかを判定する持ち方判定処理を実行する(ステップS107)。
【0053】
続いて、補正部280Cは、右耳による通話時および左耳による通話時について予め設定された補正値を用いて、ステップS104にて算出された相手方角、つまり相対角度を補正する方角補正処理を実行する(ステップS108)。続いて、生成部280Dは、端末装置100から受信した音声にミキシングする特徴音を、ステップS108により補正された相手方角に応じて生成する(ステップS109)。
【0054】
続いて、ミキシング部280Eは、ユーザが片方の耳を用いた通話状態にある場合には、端末装置100から受信した音声に、ステップS109にて生成された特徴音をミキシングする(ステップS110)。そして、ミキシング部280Eは、ステップS110でミキシングした音声を1系統のモノラルで出力し(ステップS111)、上述したステップS102の処理に戻る。
【0055】
ここで、ステップS106の説明に戻る。片方の耳を用いた通話状態以外、例えば、ヘッドホンやイヤホンなどを用いた通話状態にあると検出部280Aにより判定された場合には(ステップS106,No)、加工部290は次の処理を実行する。すなわち、加工部290は、ステップS104にて算出された相対角度に基づいて、端末装置100から受信した音声から右耳用および左耳用の音声をそれぞれ生成する(ステップS112)。そして、ミキシング部280Eは、ステップS112にて生成された右耳用および左耳用の音声を左右別の出力系統であるステレオでそのまま出力し(ステップS113)、上述したステップS102の処理に戻る。
【0056】
なお、端末装置200を用いた通話が、必ず片方の耳を用いて行なわれることを前提とする場合には、必ずしも上述した図11に示す流れで処理を実行しなくてもよい。例えば、上述したステップS101〜ステップS104、ステップS107〜ステップS111の順に処理を実行してもよい。
【0057】
次に、図12を用いて、通話状態検出処理の流れを説明する。図12に示すように、検出部280Aは、音声出力パスのチャネル数を取得し(ステップS201)、チャネル数が1chであるか否かを判定する(ステップS202)。判定の結果、チャネル数が1chである場合には(ステップS202,Yes)、検出部280Aは、片方の耳を用いた通話状態にあると判定する。そして、検出部280Aは、片方の耳を用いた通話状態であることを示す所定値を所定のフラグにセットする(receiver_flag=1,ステップS203)。
【0058】
ステップS202の説明に戻り、判定の結果、チャネル数が1chではない場合には(ステップS202,No)、検出部280Aは、片方の耳を用いた通話状態以外、例えば、ヘッドホンやイヤホンなどを用いた通話状態にあると判定する。そして、検出部280Aは、例えば、ヘッドホンやイヤホンなどを用いた通話状態であることを示す所定値を所定のフラグにセットする(receiver_flag=2,ステップS204)。
【0059】
次に、図13を用いて、持ち方判定処理の流れを説明する。なお、持ち方判定処理とは、ユーザが右耳または左耳のどちらの耳を用いて通話を行っているかを判定する処理に該当する。
【0060】
図13に示すように、判定部280Bは、加速度センサーから取得したX軸方向の加速度を取得する(ステップS301)。続いて、判定部280Bは、取得したX軸方向の加速度が正の値であるか否かを判定する(ステップS302)。
【0061】
判定の結果、X軸方向の加速度が正の値である場合には(ステップS302,Yes)、判定部280Bは、左耳を用いて通話を行っていると判定する。そして、判定部280Bは、左耳での通話であることを示す所定値を所定のフラグにセットする(hold_flag=1,ステップS303)。
【0062】
ステップS302の説明に戻り、判定の結果、X軸方向の加速度が正の値ではない、つまり負の値ある場合には(ステップS302,No)、判定部280Bは、右耳を用いて通話を行っていると判定する。そして、判定部280Bは、右耳での通話であることを示す所定値を所定のフラグにセットする(hold_flag=0,ステップS304)。
【0063】
次に、図14を用いて、方角補正処理の流れを説明する。なお、方角補正処理とは、右耳通話時および左耳通話時について予め設定された補正値を用いて、算出部260により算出された相対角度を補正した補正相対角度「ang6(relative angle2)」を求める処理に該当する。
【0064】
図14に示すように、補正部280Cは、図12を用いて上述した通話状態検出処理の結果、検出部280Aによりセットされたフラグの値を取得する(ステップS401)。続いて、補正部280Cは、取得したフラグの値が、片方の耳を用いた通話状態にあることを示す値(receiver_flag=1)であるか否かを判定する(ステップS402)。
【0065】
判定の結果、片方の耳を用いた通話状態にあることを示す値である場合には(ステップS402,Yes)、補正部280Cは、判定部280Bによりセットされたフラグの値を取得する。そして、補正部280Cは、取得したフラグの値が左耳による通話を示す値(hold_flag=1)であるか否かを判定する(ステップS403)。判定の結果、左耳での通話であることを示す値である場合には(ステップS403,Yes)、補正部280Cは、左耳通話時の補正値「ang4(delta_angle_L)」を取得する。そして、補正部480Cは、左耳通話時の補正値を用いて、算出部260により算出された相対角度「relative angle1」について左耳での通話に応じた補正を行う(ステップS404)。この補正により、例えば、図6に示すような補正相対角度「ang6(relative angle2)」が算出される。
【0066】
ここで、ステップS403の説明に戻る。判定の結果、左耳での通話であることを示す値ではない、つまり右耳での通話であることを示す値(hold_flag=0)である場合には(ステップS403,No)、補正部280Cは、次のように処理する。すなわち、補正部280Cは、右耳通話時の補正値「ang5(delta_angle_R)」を取得する。そして、補正部280Cは、右耳通話時の補正値を用いて、算出部260により算出された相対角度「relative angle1」について右耳での通話に応じた補正を行う(ステップS405)。この補正により、例えば、図6に示すような補正相対角度「ang6(relative angle2)」が算出される。
【0067】
ここで、ステップS402の説明に戻る。判定の結果、検出部280Aによりセットされたフラグの値が片方の耳を用いた通話状態にあることを示す値ではない場合には(ステップS402,No)、補正部280Cは、そのまま方角補正処理を終了する。
【0068】
[実施例1による効果]
上述してきたように、実施例1に係る端末装置200は、片方の耳での通話状態を検出すると、通話の相手側の端末装置100に向かう方向と、端末装置200の端末方向とのなす相対角度を所定角度分補正する。そして、端末装置200は、補正した相対角度に応じて出力音声の属性を決定する。このようなことから、実施例1によれば、片方の耳を用いて通話するユーザに通話の相手の方向を的確に知覚させることができる。
【0069】
また、実施例1によれば、右耳通話時および左耳通話時について予め設定された補正値を用いて、通話の相手側の端末装置100に向かう方向と、端末装置200の端末方向とのなす相対角度を補正する。このようなことから、片方の耳での通話であっても、右耳通話時および左耳通話時のそれぞれについて、端末装置200の端末方向とユーザの正面方向と一致させたときの相対角度を精度よく導出できる。この結果、ユーザに知覚させる通話の相手の方向の精度を向上できる。なお、右耳通話時および左耳通話時について予め設定された補正値を用いて、通話の相手側の端末装置100に向かう方向と、端末装置200の端末方向とのなす相対角度を補正する場合に限られない。例えば、端末方向とユーザの正面方向とのなす角度がおおよそ180°となる場合を多いことに鑑み、例えば、通話の相手側の端末装置100に向かう方向と、端末装置200の端末方向とのなす相対角度を180°補正するようにしてもよい。
【0070】
また、実施例1によれば、補正した相対角度が小さくなるほど音量が大きくなる特徴音を生成し、生成した特徴音を通話音声にミキシングする。このようなことから、左耳用の音声および右耳用の音声の違いで通話の相手の方向を表現することなく、片方の耳を用いて通話するユーザに通話の相手の方向を的確に知覚させることができる。なお、端末装置100からの受信する無言の通話音声に特徴音をミキシングすることにより、通話の相手が無言の状態であっても、通話の相手の方向を知覚させることができる。
【0071】
なお、上記の実施例1において、例えば、ミキシング部280Eは、加工部290から入力される音声に、生成部280Dにより生成された特徴音をミキシングする場合に、頭部伝達関数を用いた音響加工を行ってもよい。例えば、ミキシング部280Eは、加工部290から入力される音声、および生成部280Dにより生成された特徴音が、異なる位置を仮想的な音源として伝達されるように音響加工した後、重畳して出力する。このようにすれば、相手の音声(出力音声)と特徴音を異なる方向(例えば、上下方向)から再生可能となり、音声と特徴音を聞き分けやすくすることができる。つまり、片耳を用いて通話状態において、相手の音声に特徴音を重畳させる結果、それぞれの音が聞きわけにくくなるのを抑制する。
【実施例2】
【0072】
以下、本願の開示する端末装置および音声処理プログラムの他の実施形態を説明する。
【0073】
(1)装置構成等
例えば、上述した図1に示す端末装置200の構成は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。例えば、図1に示す検出部280Aと、判定部280Bと、補正部280Cと、生成部280Dと、ミキシング部280Eとを機能的または物理的に統合した一つのユニットとしてもよい。このように、端末装置200が有する処理機能部の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0074】
(2)端末装置のハードウェア構成
次に、図15を用いて、実施例1に係る端末装置のハードウェアの構成例について説明する。図15は、端末装置のハードウェア構成の一例を示す図である。図15に示すように、端末装置300は、無線通信部310と、アンテナ311と、表示部320と、音声入出力部330と、マイク331と、スピーカ332と、入力部340と、記憶部350と、プロセッサ360とを有する。
【0075】
無線通信部310、表示部320、音声入出力部330、入力部340、記憶部350は、プロセッサ360と接続される。また、アンテナ311は、無線通信部310と接続される。また、マイク331及びスピーカ332は、音声入出力部330と接続される。
【0076】
無線通信部310は、図1には示していないが、例えば、端末装置200が有する通信制御部に対応する。また、表示部320は、図1には示していないが、例えば、端末装置200が有するディスプレイに対応する。音声入出力部330、マイク331及びスピーカ332は、例えば、図1に示したマイク201及びスピーカ202、図1には示していないが、例えば、端末装置200が有する入出力制御部に対応する。また、入力部340は、図1には示していないが、例えば、端末装置200が有するキー制御部に対応する。
【0077】
記憶部350及びプロセッサ360は、例えば、図1に示した検出部280Aと、判定部280Bと、補正部280Cと、生成部280Dと、ミキシング部280E等の機能を実現する。具体的には、記憶部350のプログラム記憶部351は、例えば、図11〜図14等に示す処理を実現する音声処理プログラム等の各種プログラムを記憶している。そして、プロセッサ360は、プログラム記憶部351に記憶されている各プログラムを読み出して実行することで、上述の各機能を実現するプロセスを生成する。また、データ記憶部352は、例えば、図11〜図14等に示す処理に用いる各種データを保持する。また、RAM(Random Access Memory)353は、例えば、図11〜図14等に示す処理を実行する場合に、プロセッサ360により生成されたプロセスに使用される記憶領域を有する。
【符号の説明】
【0078】
1 音源
100 端末装置
101 マイク
110 符号化部
120 位置取得部
130 位置送信部
200 端末装置
201 マイク
202 スピーカ
210 符号化部
220 位置取得部
230 位置送信部
240 位置受信部
250 方向取得部
260 算出部
270 復号化部
280A 検出部
280B 判定部
280C 補正部
280D 生成部
280E ミキシング部
290 加工部
300 端末装置
310 無線通信部
311 アンテナ
320 表示部
330 音声入出力部
331 マイク
332 スピーカ
340 入力部
350 記憶部
360 プロセッサ

【特許請求の範囲】
【請求項1】
相手装置の位置を示す位置情報を取得する他端末位置取得部と、
自端末装置の位置を示す位置情報を取得する自端末位置取得部と、
前記取得した自端末装置の位置を基点として算出される前記取得した相手装置の位置へ向かう方向である第1の方向を取得する、第1方向取得部と、
自端末装置が向く方向である第2の方向を取得する、第2方向取得部と、
自端末装置の傾き方向を検出するセンサーから自端末装置が右方向に傾いているか左方向に傾いているかを示す傾斜情報を取得する、傾斜方向取得部と、
前記取得した傾斜情報が右方向を示すか左方向を示すかに応じて、前記第1の方向と前記第2の方向とのなす相対角度に対する補正量を切り替える補正部と、
前記補正量により補正された相対角度に応じて、音出力部から出力される出力音の属性を決定する決定部と
を有することを特徴とする端末装置。
【請求項2】
通話の音出力時の信号数が単数であるか否かを判定する信号数判定部を備え、
前記補正部は、前記信号数判定部により前記信号数が複数であると判定された場合、前記補正量により前記相対角度を補正する処理を実行しない、
ことを特徴とする請求項1に記載の端末装置。
【請求項3】
前記補正部により補正された相対角度に応じた特徴音を生成する生成部をさらに有し、
前記決定部は、前記通話の音に対して前記特徴音の重畳した音を前記出力音の属性として決定することを特徴とする請求項2に記載の端末装置。
【請求項4】
前記決定部は、頭部伝達関数を用いて、前記通話の音と前記特徴音とが異なる位置を仮想的な音源として伝達されるように加工し、加工した音を重畳したものを前記出力音の属性として決定することを特徴とする請求項3に記載の端末装置。
【請求項5】
コンピュータに、
相手装置の位置を示す位置情報を取得する他端末位置取得部と、
自端末装置の位置を示す位置情報を取得する自端末位置取得部と、
前記取得した自端末装置の位置を基点として算出される前記取得した相手装置の位置へ向かう方向である第1の方向を取得する、第1方向取得部と、
自端末装置が向く方向である第2の方向を取得する、第2方向取得部と、
自端末装置の傾き方向を検出するセンサーから自端末装置が右方向に傾いているか左方向に傾いているかを示す傾斜情報を取得する、傾斜方向取得部と、
前記取得した傾斜情報が右方向を示すか左方向を示すかに応じて、前記第1の方向と前記第2の方向とのなす相対角度に対する補正量を切り替える補正部と、
前記補正量により補正された相対角度に応じて、音出力部から出力される出力音の属性を決定する決定部、
として動作させることを特徴とする音声処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−65279(P2012−65279A)
【公開日】平成24年3月29日(2012.3.29)
【国際特許分類】
【出願番号】特願2010−209936(P2010−209936)
【出願日】平成22年9月17日(2010.9.17)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】