説明

音声多重化装置、音声聴取装置、および音声多重化方法

【課題】処理負荷を抑えた状態で注目音を聞き取り易くすることができる音声多重化装置を提供すること。
【解決手段】第1の音声信号および第2の音声信号を入力する音声入力部110と、第1の音声信号と第2の音声信号とを第1の多重化位置関係で多重化して得られる、第1の多重音声信号を生成する第1の音声多重化部120と、第1の音声信号と第2の音声信号とを第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して得られる、第2の多重音声信号を生成する第2の音声多重化部130と、第1の多重音声信号および第2の多重音声信号を出力する音声出力部140とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の音声信号を多重化して出力する音声多重化装置、音声聴取装置、および音声多重化方法に関する。
【背景技術】
【0002】
音声チャットや電話会議などの音声コミュニケーション、および、複数の音声データを多重化して配信するラジオ放送など、複数の音が同時に出力されるケースが増えている。
【0003】
ところが、聴取者にとっては、複数の音の中から所望の音(以下「注目音」という)を選択して聴取しようとするとき、当該注目音以外の音は、ノイズ(雑音)に感じられる。
【0004】
そこで、例えば、特許文献1には、各音声信号の、注目音がないときの状態に基づいてフィルタを作成し、作成したフィルタを用いて注目音のみを抽出する技術が記載されている。また、例えば、特許文献2には、注目音以外の音(以下「非注目音」)の音声信号に対して、環境音として聞こえるように音声処理を行う技術が記載されている。これらの従来技術では、注目音のみを聞き取り易く再生しつつ、複数の音を再生することができる。また、公知の技術としては、音声を個別に符号化するオブジェクト符号化によって、複数の音声を多重化して送受信し、ユーザが音声を個別にコントロールする技術が知られている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平5−87619号公報
【特許文献2】特開平8−186648号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記従来技術は、複数の音声信号を多重化して送受信し、重畳して再生するシステムによって、処理負荷が高くなるという課題を有する。すなわち、特許文献1記載の技術は、非注目音が発話音声などの非連続音の場合、非注目音の変化に応じて、フィルタを何度も繰り返し作成する必要が生じ、処理負荷が高くなる。また、特許文献1および特許文献2記載の技術は、音声チャットなどにおいて、不特定多数人から音声信号が送られてくる場合、その数に応じて処理負荷が高くなる。また、オブジェクト符号化技術では、個別にデータ圧縮した音声信号を多重化して送受信するが、音声を個別にコントロールする際の処理負荷は、音声の数に応じて高くなる。
【0007】
複数の音声を重畳して出力する技術は、様々な分野への適用が期待されるが、処理負荷が高いと、携帯電話機などの小型携帯端末への適用が困難となる。したがって、かかる技術は、処理負荷を抑えた状態で注目音を聞き取り易くすることが可能であることが望まれる。
【0008】
本発明の目的は、処理負荷を抑えた状態で注目音を聞き取り易くすることができる音声多重化装置、音声聴取装置、および音声多重化方法を提供することである。
【課題を解決するための手段】
【0009】
本発明の音声多重化装置は、第1の音声信号および第2の音声信号を入力する音声入力部と、前記第1の音声信号と前記第2の音声信号とを第1の多重化位置関係で多重化して得られる、第1の多重音声信号を生成する第1の音声多重化部と、前記第1の音声信号と前記第2の音声信号とを前記第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して得られる、第2の多重音声信号を生成する第2の音声多重化部と、前記第1の多重音声信号および前記第2の多重音声信号を出力する音声出力部とを有する。
【0010】
本発明の音声聴取装置は、上記音声多重化装置から、前記第1の多重音声信号および前記第2の多重音声信号を取得する多重音声受信部と、前記第1の多重音声信号と前記第2の多重音声信号とを調整可能な所定の重畳位置関係で重畳して得られる、重畳音声信号を生成する時間調整部と、ユーザ操作に基づいて、前記第1の多重音声信号と前記第2の多重音声信号のそれぞれに含まれる前記第1の音声信号の任意の位置が一致する第1の重畳位置関係と、前記第1の多重音声信号と前記第2の多重音声信号のそれぞれに含まれる前記第2の音声信号の任意の位置が一致する第2の重畳位置関係との間で、前記所定の重畳位置関係を切り替える操作部と、前記重畳音声信号を音声出力装置へ出力する音声出力部とを有する。
【0011】
本発明の音声多重化方法は、第1の音声信号および第2の音声信号を入力するステップと、前記第1の音声信号と前記第2の音声信号とを第1の多重化位置関係で多重化して、第1の多重音声信号を生成するステップと、前記第1の音声信号と前記第2の音声信号とを前記第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して、第2の多重音声信号を生成するステップと、前記第1の多重音声信号および前記第2の多重音声信号を出力するステップとを有する。
【発明の効果】
【0012】
本発明は、処理負荷を抑えた状態で注目音を聞き取り易くすることができる。
【図面の簡単な説明】
【0013】
【図1】本発明の実施の形態1に係る音声多重化装置の構成の一例を示すブロック図
【図2】本発明の実施の形態2に係る音声多重化装置および音声聴取装置ならびに音声多重化システムの構成の一例を示すブロック図
【図3】本発明の実施の形態2における入力音声信号の構成の一例を模式的に示す図
【図4】本発明の実施の形態2における第1および第2の多重音声信号の構成の一例を模式的に示す図
【図5】本発明の実施の形態2における重畳音声信号の構成の例を模式的に示す図
【図6】本発明の実施の形態2に係る音声多重化装置の動作の一例を示すフローチャート
【図7】本発明の実施の形態2に係る音声聴取装置の動作の一例を示すフローチャート
【図8】本発明の実施の形態3に係る音声多重化装置および音声聴取装置ならびに音声多重化システムの構成の一例を示すブロック図
【図9】本発明の実施の形態3における第1および第2の多重音声信号の構成の一例を模式的に示す図
【図10】本発明の実施の形態3における重畳音声信号の構成の例を模式的に示す図
【図11】本発明の実施の形態4に係る音声多重化装置および音声聴取装置ならびに音声多重化システムの構成の一例を示すブロック図
【図12】本発明の実施の形態4に係る音声多重化装置の動作の一例を示すフローチャート
【発明を実施するための形態】
【0014】
以下、本発明の各実施の形態について、図面を参照して詳細に説明する。
【0015】
なお、各実施の形態において、複数の音声信号の多重化、および、複数の多重化音声信号の重畳は、各音声信号の時間軸上の位置(以下単に「位置」という)の相対的な関係を設定することを、少なくとも含むものとする。また、多重化において設定される相対的な関係は、「多重化位置関係」といい、重畳において設定される相対的な関係は、「重畳位置関係」というものとする。
【0016】
(実施の形態1)
本発明の実施の形態1は、本発明に係る音声多重化装置の基本的態様の一例である。
【0017】
図1は、本実施の形態に係る音声多重化装置の構成の一例を示すブロック図である。
【0018】
図1において、音声多重化装置100は、音声入力部110、第1の音声多重化部120、第2の音声多重化部130、および音声出力部140を有する。
【0019】
音声入力部110は、第1の音声信号および第2の音声信号を入力する。
【0020】
第1の音声多重化部120は、第1の音声信号と第2の音声信号とを第1の多重化位置関係で多重化して得られる、第1の多重音声信号を生成する。
【0021】
第2の音声多重化部130は、第1の音声信号と第2の音声信号とを第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して得られる、第2の多重音声信号を生成する。
【0022】
音声出力部140は、第1の多重音声信号および第2の多重音声信号を出力する。
【0023】
音声多重化装置100は、例えば、CPU(central processing unit)、およびRAM(random access memory)等の記憶媒体などを有する。この場合、上述の各機能部は、CPUにより制御プログラムが実行することにより実現される。
【0024】
このような音声多重化装置100は、第1の音声信号に対する第2の音声信号の多重化位置が異なる、二種類の多重音声信号を出力することができる。
【0025】
このような二種類の多重音声信号は、第1の音声信号のみ、あるいは、第2の音声信号のみを、選択的に一致させた状態で、重畳することができる。一致した音声信号の音声は、一致していない音声信号の音声に比べて、より明瞭となり、より聞き取り易くなる。すなわち、このような二種類の多重音声信号は、重畳する際の相対位置関係を調整するだけで、第1の音声信号および第2の音声信号を、選択的に聞き取り易くすることができる。
【0026】
したがって、音声多重化装置100は、処理負荷を抑えた状態で、注目音を聞き取り易くすることができる。
【0027】
(実施の形態2)
本発明の実施の形態2は、本発明を、不特定多数の話者が同時に複数の話題について会話する、音声チャットシステムに適用した場合の、具体的態様の一例である。
【0028】
まず、本実施の形態に係る各装置およびシステムの構成について説明する。
【0029】
図2は、本実施の形態に係る音声多重化装置および音声聴取装置の構成ならびに音声多重化システムの構成の一例を示すブロック図である。
【0030】
図2において、音声多重化システム200は、第1〜第4の音声提供装置300−1〜300−4、音声多重化装置100、音声聴取装置400、および音声出力装置500を有する。
【0031】
なお、複数の音声提供装置300と音声多重化装置100、音声多重化装置100と音声聴取装置400、および音声聴取装置400と音声出力装置500は、それぞれ無線または有線により通信可能に接続されているものとする。そして、音声多重化装置100から音声聴取装置400への送信帯域は、2つの多重音声信号を分離可能な第1のチャンネルと第2のチャンネルを含むものとする。2つの多重音声信号の伝送方法は、個別の回線を有しても良いし、時分割多重方式、周波数分割多重方式であってもよい。
【0032】
また、第1〜第4の音声提供装置300−1〜300−4は、同一の構成を有するものとし、以下、適宜「音声提供装置300」としてまとめて説明する。
【0033】
更に、第1〜第4の音声提供装置300−1〜300−4および音声聴取装置400は、同一の構成とすることができるが、ここでは、音声の供給側か聴取側かの区別に従い、これらを区別して説明する。
【0034】
音声提供装置300は、例えば、音声チャットを行うユーザが携帯する情報通信端末である。音声提供装置300は、マイクロフォンを有し、ユーザの発話音声を含む音声を入力して電気信号である音声信号に変換し、音声多重化装置100へ送信する。本実施の形態では、音声信号はデジタルとする。
【0035】
音声多重化装置100は、例えば、音声チャットサーバである。音声多重化装置100は、第1〜第4の音声提供装置300−1〜300−4から送られてくる4種類の音声信号(以下、順に「第1〜第4の音声信号」という)を受信する。そして、音声多重化装置100は、受信した第1〜第4の音声信号を、多重化方法の異なる2チャンネルの(2種類の)多重音声信号に多重化して、音声聴取装置400へ送信する。以下、受信時の第1〜第4の音声信号の一まとまりは、以下「入力音声信号」という。
【0036】
図3は、本実施の形態において想定する、入力音声信号の構成の一例を模式的に示す図である。
【0037】
図3に示すように、入力音声信号610は、ここでは、第1〜第4の音声信号611〜614から構成されるものとする。入力音声信号610上の任意の時間t0における第1〜第4の音声信号611〜614のそれぞれの位置は、順に、Vta、Vtb、Vtc、Vtdであるものとする。
【0038】
図2の音声多重化装置100は、音声入力部110、第1の音声多重化部120、第2の音声多重化部130、および多重音声送信部141を有する。
【0039】
音声入力部110は、第1〜第4の音声信号を入力する。
【0040】
具体的には、音声入力部110は、第1〜第4の音声提供装置300−1〜300−4から送信された第1〜第4の音声信号を受信し、音声圧縮部111により、第1〜第4の音声信号の振幅をそれぞれ圧縮する。そして、音声入力部110は、圧縮した第1〜第4の音声信号(以下単に「第1〜第4の音声信号」という)を、第1の音声多重化部120および第2の音声多重化部130へそれぞれ出力する。
【0041】
この際、音声入力部110は、第1の音声信号の任意の位置に対して、当該位置と同一のタイミングで受信した第2〜第4の音声信号のそれぞれの位置が一致するように、第1〜第4の音声信号を出力する。
【0042】
なお、本実施の形態における圧縮とは、音声信号を同時に送信している音声提供装置300の数(本実施の形態では4、以下「音声信号の数」という)に応じて、各音声信号の振幅(音圧レベル)を小さくすることを含む。例えば、圧縮は、各音声信号の振幅を、音声信号の数で除算することにより行う。
【0043】
また、圧縮は、各音声信号の振幅の最大値が、予め定めた上限値に一致するように、音量の小さい音声信号の振幅を低減あるいは増大させることを含んでもよい。
【0044】
第1の音声多重化部120は、第1〜第4の音声信号を第1の多重化位置関係で多重化して得られる、第1の多重音声信号を生成する。
【0045】
具体的には、第1の音声多重化部120は、入力された第1〜第4の音声信号を、その入力タイミングに沿って、第1のチャンネルでの送信の対象として、そのまま多重音声送信部141へ出力する。
【0046】
すなわち、上述の第1の多重化位置関係では、受信(入力)された第1〜第4の音声信号の相対的な位置が変化せず、送信(出力)は受信(入力)と同一のタイミングとなる。
【0047】
第2の音声多重化部130は、第1〜第4の音声信号を第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して得られる、第2の多重音声信号を生成する。
【0048】
すなわち、上述の第2の多重化位置関係では、受信(入力)された第1〜題の音声信号の相対的な位置が変化し、送信(出力)は受信(入力)とはタイミングが異なる。
【0049】
具体的には、第2の音声多重化部130は、遅延処理部131により、第2〜第4の音声信号を、それぞれ異なる所定時間で遅延させる。遅延処理部131は、例えば、任意の時間だけ音声信号を保存した後に出力する、デジタルディレイである。そして、第2の音声多重化部130は、第1の音声信号と、遅延した第2〜第4の音声信号とを、その遅延されたタイミングに沿って、第2のチャンネルでの送信の対象として、多重音声送信部141へ出力する。
【0050】
すなわち、上述の第2の多重化位置関係は、第1の音声信号の任意の位置に対して、当該位置と同一のタイミングで受信(入力)された第2〜第4の音声信号の位置がそれぞれに対応する所定時間遅延する関係となる。
【0051】
図4は、本実施の形態における第1および第2の多重音声信号の構成の一例を模式的に示す図であり、図3に対応するものである。図4(A)は、第1の多重音声信号の構成を示す。図4(B)は、第2の多重音声信号の構成を示す。
【0052】
図4(A)に示すように、第1の多重音声信号620における第1〜第4の音声信号611〜614の相対的な位置関係(第1の多重化位置関係)は、図3に示す入力音声信号610における相対的な位置関係とほぼ同一となる。
【0053】
すなわち、第2〜第4の音声信号612〜614の上述の各位置Vtb、Vtc、Vtdは、第1の音声信号311の位置Vtaに対応する時刻t1に対して、一致している。
【0054】
一方、図4(B)に示すように、第2の多重音声信号630における第1〜第4の音声信号611〜614の相対的な位置関係(第2の多重化位置関係)は、図3に示す入力音声信号610における相対的な位置関係と異なる。
【0055】
すなわち、第2〜第4の音声信号612〜614の上述の各位置Vtb、Vtc、Vtdは、第1の音声信号311の位置Vtaに対応する時刻t1に対して、それぞれ遅延している。
【0056】
なお、第2〜第4の音声信号612〜614の遅延時間d1〜d3は、それぞれ異なるものとする。そして、遅延時間d3は遅延時間d2よりも長く、遅延時間d2は遅延時間d1よりも長いものとする。また、遅延時間d1〜d3を示す情報は、第2の多重音声信号に付加されるなどして、音声多重化装置100が取得可能であるものとする。
【0057】
図2の多重音声送信部141は、第1の多重音声信号および第2の多重音声信号を出力する。
【0058】
具体的には、多重音声送信部141は、入力された第1の多重音声信号および第2の多重音声信号を、それぞれ第1のチャンネルと第2のチャンネルを用いて、音声聴取装置400へ送信する。
【0059】
音声聴取装置400は、例えば、音声チャットを行うユーザが使用するパーソナルコンピュータ(音声チャットクライアント)である。
【0060】
音声聴取装置400は、多重音声受信部410、時間調整部420、操作部430、および音声出力部440を有する。
【0061】
多重音声受信部410は、音声多重化装置100から、第1の多重音声信号および第2の多重音声信号を取得する。
【0062】
具体的には、多重音声受信部410は、音声多重化装置100から上述の2チャンネルを用いて送信された第1の多重音声信号および第2の多重音声信号を受信する。そして、多重音声受信部410は、受信した第1の多重音声信号および第2の多重音声信号を、時間調整部420へ出力する。
【0063】
時間調整部420は、第1の多重音声信号と第2の多重音声信号とを調整可能な所定の重畳位置関係で重畳して得られる、重畳音声信号を生成する。
【0064】
具体的には、時間調整部420は、操作部430による制御を受けて、第1の多重音声信号および第2の多重音声信号の一方を遅延させる。これにより、時間調整部420は、第1の多重音声信号と第2の多重音声信号との相対位置関係を調整する。そして、時間調整部420は、調整された相対位置関係で第1の多重音声信号と第2の多重音声信号とを重畳して重畳音声信号を生成し、音声出力部440へ出力する。
【0065】
操作部430は、ユーザ操作に基づいて、少なくとも、第1の重畳位置関係、第2の重畳位置関係、第3の重畳位置関係、および第4の重畳位置関係の間で、上述の所定の重畳位置関係を切り替える。
【0066】
具体的には、操作部430は、例えば、ダイヤルやスライダーなど、プラス方向とマイナス方向の入力値を得ることができる操作インタフェースを有する。そして、操作部430は、入力値に応じて音を聞き取り易くする対象として指定された音声信号の任意の位置が、第1の多重音声信号と第2の多重音声信号との間で一致するように、所定の重畳位置関係を切り替える。
【0067】
第1の重畳位置関係は、第1の多重音声信号と第2の多重音声信号とに含まれる第1の音声信号の任意の位置が一致する重畳位置関係である。
【0068】
第2の重畳位置関係は、第1の多重音声信号と第2の多重音声信号とに含まれる第2の音声信号の任意の位置が一致する重畳位置関係である。
【0069】
第3の重畳位置関係は、第1の多重音声信号と第2の多重音声信号とに含まれる第3の音声信号の任意の位置が一致する重畳位置関係である。
【0070】
第4の重畳位置関係は、第1の多重音声信号と第2の多重音声信号とに含まれる第4の音声信号の任意の位置が一致する重畳位置関係である。
【0071】
なお、第1〜第4の音声信号には、順に、1〜4の音声番号が割り当てられているものとする。そして、操作部430は、入力値にしたがって、あたかも音声番号を指定するポインタを移動させるように、第1の多重音声信号と第2の多重音声信号との重畳位置関係を切り替える。
【0072】
また、第1〜第4の重畳位置関係は、例えば、時間調整部420が、音声多重化装置100から遅延時間d1〜d3を示す情報を取得して保持しておき、遅延時間d1〜d3に基づいて設定するものとする。
【0073】
図5は、本実施の形態における重畳音声信号の構成の例を模式的に示す図であり、図4に対応するものである。図5(A)は、音声番号1が指定されたとき(つまり第1の重畳位置関係で重畳が行われたとき)の重畳音声信号の構成を示す。図5(B)は、音声番号2が指定されたとき(つまり第2の重畳位置関係で重畳が行われたとき)の重畳音声信号の構成を示す。
【0074】
図5(A)に示すように、音声番号1が指定されたときの重畳音声信号640では、第1の音声信号611の位置Vtaは、第1の多重音声信号620と第2の多重音声信号630との間で一致する。そして、他の第2〜第4の音声信号612〜614の各位置Vtb、Vtc、Vtdは、第1の多重音声信号620と第2の多重音声信号630との間で、いずれも一致しない。
【0075】
位置が一致した状態で同一の2つの音声信号が重畳された重畳音声信号640は、振幅は倍になり、音量が増すことになる。一方、位置が一致していない状態で同一の2つの音声信号が重畳された重畳音声信号640は、振幅は倍にはならず、その音声は、残響あるいは反響を伴っているように聴こえ、輪郭がぼやけた音となる。
【0076】
したがって、図5(A)に示すような重畳音声信号640の音声(以下「重畳音声」という)では、第1の音声信号611の音声のみが明瞭に聞こえ、第2〜第4の音声信号612〜614の各音声は、不明瞭に聞こえることになる。
【0077】
図5(B)に示すように、音声番号2が指定されたときの重畳音声信号650では、第2の音声信号612の位置Vtbのみが、第1の多重音声信号620と第2の多重音声信号630との間で一致する。このような重畳音声では、第2の音声信号612の音声のみが明瞭に聞こえることになる。
【0078】
したがって、音声聴取装置400は、多重化位置関係を切り替えることにより、明瞭に聞こえる音声を切り替え、任意の音声信号を選択的に聞こえ易くすることができる。
【0079】
なお、多重化位置関係は、非注目音声の遅延時間が短過ぎると、注目音声と非注目音声との聞こえ方の差が小さくなる。多重化位置関係は、逆に、非注目音声の遅延時間が長すぎると、第1の多重音声信号620における当該非注目音声と第2の多重音声信号630における当該非注目音声とが独立して、同じ音声が2度出力されたように聞こえてしまう。そこで、0以外の全ての遅延時間(図4(B)の遅延時間d1〜d3)は、数十ミリ秒から数百ミリ秒など、実験などによって予め定められた数値範囲に収まることが望ましい。
【0080】
更にいえば、第1〜第4の音声信号は、所定の時間ずつずれていることが望ましい。すなわち、遅延時間d2は、遅延時間d1の2倍であり、遅延時間d3は遅延時間d1の3倍であることが望ましい。これにより、時間調整部420は、重畳位置関係の調整を、遅延時間d1を単位として行うことができ、その処理が容易となる。
【0081】
図2の音声出力部440は、重畳音声信号を音声出力装置500へ出力する。
【0082】
具体的には、音声出力部440は、入力された重畳音声信号を、音声出力装置500へ送信する。
【0083】
音声出力装置500は、例えば、ユーザがパーソナルコンピュータに接続して使用するヘッドフォンである。音声出力装置500は、音声聴取装置400から送信された重畳音声信号を受信し、音声に変換して出力する。
【0084】
音声提供装置300、音声多重化装置100、および音声聴取装置400は、例えば、CPU、およびRAM(random access memory)などの記憶媒体等を有する。この場合、上述の各機能部は、CPUにより制御プログラムが実行することにより実現される。
【0085】
このような音声多重化システム200は、複数の音声信号の多重化位置が異なる、二種類の多重音声信号を出力することができる。
【0086】
このような二種類の多重音声信号は、複数の音声信号のうちの任意の1つのみを選択的に一致させた状態で、重畳することができる。一致した音声信号の音声は、一致していない音声信号の音声に比べて、より明瞭となり、より聞き取り易くなる。すなわち、このような二種類の多重音声信号は、重畳の際の相対位置関係を調整するだけで、任意の音声信号を、選択的に聞き取り易くすることができる。
【0087】
音声多重化システム200は、特許文献1記載の技術のようにフィルタを何度も作成したり、特許文献2記載の技術のように音声信号ごとの音声処理を行ったりする必要がない。したがって、音声多重化システム200は、従来技術に比べて、処理負荷を抑えた状態で、注目音を聞き取り易くすることができる。
【0088】
また、音声多重化システム200は、ユーザが指定した音声番号の音声信号が一致するように、二種類の多重音声信号の重畳位置を調整することができる。これにより、音声多重化システム200は、ユーザの所望の音声(注目音)のみを聞き取り易くすることができる。
【0089】
また、音声多重化システム200は、複数のユーザから発話音声を取得し、これを多重化して再生することができる。これにより、音声多重化システム200は、多数人での音声チャットを、注目音のみを聞き取り易くした状態で実現することができる。
【0090】
また、音声多重化システム200は、音声信号の多重化の際に、音声の振幅の圧縮を行うので、多重化された音声信号の振幅が大きくなり過ぎて再生音が歪むのを防ぐことができる。
【0091】
以上で、本実施の形態に係る各装置およびシステムの構成についての説明を終える。
【0092】
次に、本実施の形態に係る各装置の動作について説明する。
【0093】
図6は、音声多重化装置100の動作の一例を示すフローチャートである。
【0094】
まず、ステップS1010において、音声入力部110は、第1〜第4の音声提供装置300−1〜300−4から送信された各音声信号(第1〜第4の音声信号)を、受信する。例えば、音声入力部110は、予め定められた周期毎に、音声信号の受信を行い、次のステップ1020へ進む。
【0095】
そして、ステップS1020において、音声圧縮部111は、受信した受信した各音声信号(第1〜第4の音声信号)の振幅を、それぞれ圧縮する。
【0096】
そして、ステップS1030において、第1の音声多重化部120は、第1の多重音声信号を生成し、第1のチャンネルでの送信の対象として出力する。すなわち、第1のチャンネルは、全ての音声が遅延なく多重化されたチャンネルなる。
【0097】
そして、ステップS1040において、遅延処理部131は、音声信号ごとに定めた遅延を、各音声信号に設定する。すなわち、遅延処理部131は、各音声信号を、適宜、それぞれ異なる遅延時間で遅延させる処理(以下「遅延処理」という)を行う。
【0098】
そして、ステップS1050において、第2の音声多重化部130は、遅延処理後の音声信号(第1〜第4の音声信号)から第2の多重音声信号を生成し、第2のチャンネルでの送信の対象として出力する。すなわち、第2のチャンネルは、各音声が他の全ての音声とずれた状態で多重化されたチャンネルなる。
【0099】
そして、ステップS1060において、多重音声送信部141は、第1および第2の多重音声信号を、音声聴取装置400へと送信する。
【0100】
そして、ステップS1070において、音声入力部110は、ユーザ操作などにより、音声の多重化の処理の終了要求があったか否かを判断する。
【0101】
音声入力部110は、終了要求がない場合(S1070:NO)、ステップS1010へ戻る。また、音声入力部110は、終了要求があった場合(S1070:YES)、一連の処理を終了する。
【0102】
このような動作により、音声多重化装置100は、音声提供装置300から複数の音声信号を受信し、複数の音声信号の多重化位置関係が異なる二種類の多重音声信号を、音声聴取装置400へ連続的に送信することができる。
【0103】
図7は、音声聴取装置400の動作の一例を示すフローチャートである。なお、時間調整部420は、例えば、第1の重畳位置関係を、所定の重畳位置関係の初期状態とする。
【0104】
まず、ステップS2010において、多重音声受信部410は、音声多重化装置100から送信された第1の多重音声信号および第2の多重音声信号を受信する。例えば、多重音声受信部410は、予め定められた周期毎に、第1の多重音声信号および第2の多重音声信号の受信を行い、次のステップS2020へ進む。
【0105】
そして、ステップS2020において、時間調整部420は、第1の多重音声信号および第2の多重音声信号から重畳音声信号を生成する。そして、音声出力部440は、この重畳音声信号を、音声出力装置500へ送信する。重畳音声信号は、上述の通り、第1の多重音声信号および第2の多重音声信号を、現在の所定の重畳位置関係で重畳したものである。
【0106】
そして、ステップS2030において、多重音声受信部410は、ユーザ操作などにより、音声の多重化の処理の終了要求があったか否かを判断する。
【0107】
多重音声受信部410は、終了要求がない場合(S2030:NO)、ステップS2040へ進む。また、多重音声受信部410は、終了要求があった場合(S2030:YES)、一連の処理を終了する。
【0108】
ステップS2040において、操作部430は、プラス方向またはマイナス方向の入力値があったか、つまり、音声番号を指定するポインタ移動の操作の入力があったか否かを判断する。
【0109】
操作部430は、移動操作があった場合(S2040:YES)、ステップS2050へ進む。また、操作部430は、移動操作がない場合(S2040:NO)、ステップS2010へ戻る。
【0110】
ステップS2050において、操作部430は、ポインタ移動がプラス方向であるか否かを判断する。
【0111】
すなわち、操作部430は、音声番号1から音声番号2へというように、音声番号が増大する方向にポインタが移動されたか否かを判断する。
【0112】
操作部430は、ポインタ移動がプラス方向である場合(S2050:YES)、ステップS2060へ進む。また、操作部430は、ポインタ移動がマイナス方向である場合(S2050:NO)、ステップS2070へ進む。
【0113】
ステップS2060において、操作部430は、現状よりも第1の多重音声信号(つまり第1のチャンネルの信号)を相対的に遅延させるように、時間調整部420の所定の重畳位置関係を切り替えて、ステップS2010へ戻る。
【0114】
すなわち、操作部430は、第1の音声信号から第2の音声信号へというように、1つ大きい音声番号に対応する音声信号の任意の位置を、第1の多重音声信号と第2の多重音声信号との間で一致させる。これは、重畳音声信号を、図5(A)に示す状態から、図5(B)に示す状態へと切り替えることに相当する。
【0115】
ステップS2070において、操作部430は、現状よりも第2の多重音声信号(つまり第2のチャンネルの信号)を相対的に遅延させるように、時間調整部420の所定の重畳位置関係を切り替えて、ステップS2010へ戻る。
【0116】
すなわち、操作部430は、第2の音声信号から第1の音声信号へというように、1つ小さい音声番号に対応する音声信号の任意の位置を、第1の多重音声信号と第2の多重音声信号との間で一致させる。これは、重畳音声信号を、図5(B)に示す状態から、図5(A)に示す状態へと切り替えることに相当する。
【0117】
このような動作により、音声聴取装置400は、複数の音声信号の多重化位置関係が異なる二種類の多重音声信号を重畳した重畳音声信号を、音声出力装置500へ連続的に送信することができる。また、音声聴取装置400は、ユーザが所望する音声信号が聞こえ易くなるように、重畳位置関係を調整することができる。
【0118】
なお、操作部430は、入力値の累積値の上限および下限の判定を行うことが望ましいが、ここでは省略している。入力値の累積値の上限は、音声信号の数から1引いた数(本実施の形態では4−1=3)となる。また、入力値の累積値の下限は、0となる。
【0119】
また、操作部430は、入力値の累積値に上限および下限を設けず、累積値が上限を超えたとき累積値を下限(0)にし、累積値が下限を下回ったとき累積値を上限(3)にするようにしてもよい。また、この場合、操作部430は、プラス方向の入力値、および、マイナス方向の入力値の一方のみを受け付けるようにすることができる。
【0120】
また、操作部430は、1方向の入力値のみを受け付ける場合、累積値が上限に達したとき、入力値をマイナス方向の値として扱い、累積値が下限に達したとき、入力値をプラス方向の値として扱うようにしてもよい。
【0121】
以上で、本実施の形態に係る各装置の動作についての説明を終える。
【0122】
以上のように、本実施の形態に係る音声多重化システム200は、複数の音声信号の多重化位置が異なる二種類の多重音声信号を生成し、これらの重畳音声信号を、その重畳位置関係を調整して出力することができる。これにより、音声多重化システム200は、従来技術に比べて、処理負荷を抑えた状態で、複数の音声を同時に出力しつつ、注目音を聞き取り易くすることができる。
【0123】
なお、音声多重化システム200は、3種類以上の多重音声信号を生成し、これらを、それぞれの重畳位置関係を調整して出力するようにしてもよい。この場合、時間調整部420は、聞き取り易くする対象として指定された音声信号のみが全ての多重音声信号間で一致するように、重畳位置関係を調整すればよい。
【0124】
また、音声多重化システム200は、音声信号がデジタルの場合、多重音声信号単位(チャンネル単位)で、サンプリング周波数を下げてもよい。例えば、音声多重化装置100は、第1の多重音声信号については、高品質の音声信号のままで送信し、第2の多重音声信号については、そのサンプリング周波数を下げてから、送信する。これにより、音声多重化システム200は、重畳音声信号の音声の音質を劣化させずに、扱うデータ量を低減し、処理負荷を低減することが可能となる。
【0125】
また、音声多重化システム200は、多重音声信号の数(チャンネル数)が2である場合、それぞれの多重音声信号を、従来のステレオ音声の左右チャンネルに割り当ててもよい。これにより、音声多重化システム200は、多重音声信号の通信処理を従来のステレオ音声のシステムと共通化することができる。
【0126】
また、音声多重化システム200は、各音声信号を、ステレオ音声の左右チャンネルに割り当ててもよく、また、ステレオ音声により実現される仮想音響空間に立体的に配置してもよい。これにより、音声多重化システム200は、注目音声を更に聞き分け易くすることができる。
【0127】
また、音声多重化システム200は、遅延時間が上述の定められた数値範囲に収まるように、遅延時間の上限値を遅延時間の下限値で除算した数以下に、出力対象とする音声信号の数を制限しても良い。これにより、音声多重化システム200は、音声が聞き取り辛くなるのを防ぐことができる。
【0128】
なお、音声多重化システム200は、複数の音声信号のうち、互いに聞き分け易い複数の音声信号が存在するとき、それらの音声信号の遅延時間をずらさないようにしてもよい。
【0129】
例えば、音声多重化システム200aは、複数の音声信号を、仮想音源空間に円弧状に配置して出力する場合、位置が離れている音声信号については、遅延時間を一致させる。また、例えば、音声多重化システム200aは、音程が大きく異なる発話音声の音声信号については、遅延時間を一致させる。
【0130】
これにより、音声多重化システム200は、音声が聞き取り辛くなるのを防ぎつつ、同時に出力する音声信号の数を増やすことができる。
【0131】
(実施の形態3)
本発明の実施の形態3は、第2の多重音声信号の位相を反転させることにより、非注目音声の打ち消しを行う例である。
【0132】
図8は、本実施の形態に係る音声多重化装置および音声聴取装置ならびに音声多重化システムの構成の一例を示すブロック図であり、実施の形態2の図2に対応するものである。図2と同一部分には同一符号を付し、これについての説明を省略する。
【0133】
図8において、音声多重化システム200aは、図1の音声多重化装置100に代えて、音声多重化装置100aを有する。音声多重化装置100aの第2の音声多重化部130aは、遅延処理部131に加えて、位相反転部132aを有する。
【0134】
位相反転部132aは、第1の多重音声信号および第2の多重音声信号の一方に含まれる、第1の音声信号および第2の音声信号の位相を、それぞれ反転させる。本実施の形態において、位相反転部132aは、第2の多重音声信号の第1〜第4の音声信号の位相を、全て反転させるものとする。位相反転部132aは、位相反転を、遅延処理の前に行ってもよいし、遅延処理の後に行ってもよい。
【0135】
なお、本実施の形態において、遅延処理部131は、第2の多重音声信号に含まれる音声信号を2グループに分け、そのうちの1つのグループの音声信号を、全て同一の遅延時間で遅延させるものとする。
【0136】
具体的には、遅延処理部131は、第1および第3の音声信号を非遅延グループとし、第2および第4の音声信号を遅延グループとして、第2および第4の音声信号を、第1の遅延時間で遅延させるものとする。
【0137】
図9は、本実施の形態における第1および第2の多重音声信号の構成の一例を模式的に示す図であり、実施の形態2の図4に対応するものである。
【0138】
図9(A)に示す、第1の多重音声信号620における第1〜第4の音声信号611〜614の相対的な位置関係(第1の多重化位置関係)は、実施の形態2と同様、図3に示す入力音声信号610における相対的な位置関係と同一となる。
【0139】
一方、図9(B)に示す、本実施の形態の第2の多重音声信号630は、第1〜第4の音声信号611〜614をそれぞれ位相反転した、第1〜第4の反転音声信号611'〜614'により構成される。そして、第1〜第4の反転音声信号611'〜614'の相対的な位置関係(第2の多重化位置関係)は、実施の形態2と異なり、遅延グループである第2と第4の反転音声信号612'、614'のみが、第1の遅延時間d1で遅延している。
【0140】
すなわち、第3の反転音声信号613'の上述の位置Vtcは、第1の反転音声信号611'の位置Vtaと一致している。そして、第2および第4の反転音声信号612'、614'の上述の各位置Vtb、Vtdは、位置Vtaに対応する時刻t1に対して、それぞれ第1の遅延時間d1だけ遅延している。
【0141】
音声聴取装置400は、このような第1の多重音声信号および第2の多重音声信号を受信し、これらを重畳して、重畳音声信号を生成する。この際、音声聴取装置400の時間調整部420は、操作部430からの制御を受けて、上述の第1の重畳位置関係と第2の重畳位置関係との間で、上述の所定の重畳位置関係を切り替える。
【0142】
なお、本実施の形態において、遅延グループ(第2および第4音声信号)には音声番号1が割り当てられ、非遅延グループ(第1および第3の音声信号)には音声番号2が割り当てられているものとする。
【0143】
図10は、本実施の形態における重畳音声信号の構成の例を模式的に示す図であり、図5に対応するものである。
【0144】
図10(A)に示すように、音声番号1(遅延グループ)が指定されたときの重畳音声信号660において、第1の音声信号611の位置Vtaと、これを位相反転した第1の反転音声信号611'の位置Vtaとは、一致する。また、同様に、第3の音声信号613の位置Vtcと、第3の反転音声信号613'の位置Vtaとは、一致する。
【0145】
音声信号に、その位相が反転した関係にある音声信号が重畳されると、音声信号は、相殺される。したがって、音声番号1が指定されたときの重畳音声信号660の重畳音声では、第1の音声信号611の音声および第3の音声信号613の音声(非遅延グループの音声)は聞こえなくなる。
【0146】
また、音声番号1が指定されたときの重畳音声信号660において、第2の音声信号612の位置Vtbと、第2の反転音声信号612'の位置Vtbとは、第1の遅延時間d1だけずれる。また、同様に、第4の音声信号614の位置Vtdと、第4の反転音声信号614'の位置Vtdとは、第1の遅延時間d1だけずれる。したがって、第2の音声信号612の音声および第4の音声信号614の音声(遅延グループの音声)は、多少輪郭がぼやけるものの、聞こえることになる。
【0147】
一方、図10(B)に示すように、音声番号2(非遅延グループ)が指定されたときの重畳音声信号670における各位置Vta、Vtb,Vtc,Vtdの一致不一致は、図10(A)に示す重畳音声信号660の場合と逆のパターンとなる。したがって、音声番号2が指定されたときの重畳音声信号670の重畳音声では、遅延グループの音声はほとんど聞こえなくなり、非遅延グループの音声のみが聞こえることになる。
【0148】
したがって、音声聴取装置400は、多重化位置関係を切り替えることにより、音声の間引き方を切り替えることができ、2つのグループのうちの任意のグループの音声信号のみを、選択的に聞こえるようにすることができる。
【0149】
このような音声多重化システム200aは、複数の音声信号の多重化位置が異なる二種類の多重音声信号のうち、一方を位相反転させておき、その重畳位置関係を調整して出力することができる。これにより、音声多重化システム200aは、非注目音を聞こえないようにし、相対的に注目音を聞き取り易くすることができる。
【0150】
なお、音声多重化システム200aは、特に聞き分け辛い2つの音声信号が存在するとき、それらの音声信号が異なるグループに属するように、グループ分けを行うことが望ましい。
【0151】
例えば、音声多重化システム200aは、複数の音声信号を、仮想音源空間に円弧状に配置して出力する場合、各音声信号が属するグループが、その並びの順序において交互に異なるように、グループ分けを行う。また、例えば、音声多重化システム200aは、音程が近い発話音声を異なるグループに属するように、グループ分けを行う。
【0152】
これにより、音声多重化システム200aは、音声が聞き取り辛くなるのを防ぎつつ、同時に出力する音声信号の数を増やすことができる。
【0153】
(実施の形態4)
本発明の実施の形態4は、本発明を、多数の音声信号(音声データ)を格納して再生するポータブルプレイヤーに適用した場合の、具体的態様の一例である。
【0154】
まず、本実施の形態に係る各装置およびシステムの構成について説明する。
【0155】
図11は、本実施の形態に係る音声多重化装置および音声聴取装置ならびに音声多重化システムの構成の一例を示すブロック図であり、実施の形態2の図2に対応するものである。図2と同一部分には、同一符号を付し、これについての説明を省略する。
【0156】
図11において、音声多重化システム200bは、音声多重化装置100bおよび音声出力装置500を有する。
【0157】
音声多重化装置100bは、実施の形態2の音声入力部110に代えて、音声入力部110bを有し、更に、時間調整部420、操作部430、および音声出力部440を有する。本実施の形態において、音声多重化装置100bは、例えば、ポータブルプレイヤーである。
【0158】
音声入力部110bは、多数の音声信号を格納するデータベースを保持し、かかるデータベースから複数の音声信号を取得する。音声入力部110bは、音声圧縮部111、音声保持部112b、および音声検索部113bを有する。
【0159】
音声保持部112bは、上述のデータベースである。音声保持部112bが格納する各音声信号には、音声信号のメタ情報が付加されている。
【0160】
メタ情報としては、各種の情報を適用することができる。
【0161】
データベースが多数の楽曲の音声データを集めたものである場合、メタ情報は、例えば、アーティスト名、およびジャンルを含むことができる。また、データベースが多数の講演の音声データを集めたものである場合、メタ情報は、例えば、日付、講演者名、および講演テーマを含むことができる。更に、メタ情報は、講演テーマが分類されるジャンルを含んでもよい。
【0162】
なお、音声入力部110b自体が、例えば、各音声データに対して音声認識処理を行い、その認識結果を、メタ情報として、各音声信号に付与してもよい。
【0163】
音声検索部113bは、例えば、ユーザから音声信号の条件を入力し、当該入力条件を満たすメタ情報が付加された音声信号を、音声保持部112bにて検索する。そして、音声検索部113bは、検索された音声信号を、音声圧縮部111へ出力する。
【0164】
なお、以下の説明においては、複数の音声信号が常に検索されるものとする。1つの音声信号のみが検索された場合、例えば、後段の音声圧縮部111は、当該音声信号を、直接に音声出力部440へ出力すればよい。
【0165】
本実施の形態において、第1の音声多重化部120は、音声出力部440へ、第1の多重音声信号を出力する。また、第2の音声多重化部130は、時間調整部420へ、第2の多重音声信号を出力する。
【0166】
なお、本実施の形態において、第1の音声多重化部120は、例えば、全ての音声信号の開始位置を揃えて再生する。
【0167】
この場合、上述の第1の多重化位置関係は、第1の音声信号の開始位置に対して、他の全ての音声信号(第2の音声信号)の開始位置が一致する関係となる。そして、上述の第2の多重化位置関係は、第1の音声信号の開始位置に対して、他の全ての音声信号(第2の音声信号)の開始位置が所定時間遅延する関係となる。
【0168】
このような音声多重化システム200bは、保持する多数の音声信号の中から複数の音声信号を選択し、選択した音声信号の音声を、同時に出力することができる。また、音声多重化システム200bは、複数の音声信号の多重化位置が異なる二種類の多重音声信号を生成し、これら二種類の多重音声信号の重畳位置関係を調整して出力する。したがって、音声多重化システム200bは、任意の音声信号を聞き取り易くすることができる。
【0169】
以上で、本実施の形態に係る各装置およびシステムの構成についての説明を終える。
【0170】
次に、本実施の形態に係る音声多重化装置100bの動作について説明する。
【0171】
図12は、音声多重化装置100bの動作の一例を示すフローチャートであり、実施の形態2の図6および図7に対応するものである。図6および図7と同一部分には同一ステップ番号を付し、これについての説明を省略する。なお、音声多重化装置100bは、たとえば、音声信号の検索の開始が指示されるごとに、以下の図12に示す処理を実行する。
【0172】
まず、ステップS1011bにおいて、音声検索部113bは、音声保持部112bにおいて音声信号を検索する。
【0173】
そして、ステップS1012bにおいて、音声検索部113bは、検索された複数の音声信号を取得する。
【0174】
そして、ステップS1020〜S1050において、音声多重化装置100bは、実施の形態2と同様に、複数の音声信号から、第1の多重音声信号と、これとは多重化位置関係が異なる第2の多重音声信号とを生成する。
【0175】
そして、ステップS2020〜2070において、音声多重化装置100bは、実施の形態2の音声聴取装置400と同様に、ユーザ操作に応じてその重畳位置関係を調整しつつ、重畳音声信号を生成して、音声出力装置500へ出力する。
【0176】
例えば、時間調整部420は、予め定められた周期毎に、第2の多重音声信号に対する処理を行う。この周期が非常に短い場合、音声多重化装置100bは、音声信号の再生の途中で、音を聞き取り易くする対象を切り替えることができる。
【0177】
このような動作により、音声多重化装置100bは、複数の音声信号の音声を、特定の音声を聞き取り易くした状態で出力し、その出力の最中に、聞き取り易くする対象を切り替えることができる。
【0178】
以上で、本実施の形態に係る音声多重化装置100bの動作についての説明を終える。
【0179】
このように、本実施の形態に係る音声多重化システム200bは、検索結果が多い場合など、音声信号の数が多い場合であっても、ユーザに対して、複数の音声を同時に確認させることができ、所望の音声を探し出し易くすることができる。
【0180】
また、音声多重化システム200bは、実施の形態1の音声多重化装置100と音声聴取装置400とを一体化したので、これらの間の通信回路や個別の筐体などを不要とすることができる。すなわち、音声多重化システム200bは、システム全体を簡素化することができる。
【0181】
なお、音声多重化装置100bは、実施の形態2のように、位相反転部132aを有してもよい。この場合、実施の形態2と同様の効果を得ることができる。
【0182】
なお、以上説明した各実施の形態のうち、実施の形態2および実施の形態3では、音声信号を入力する装置として音声提供装置300を備えた例について説明した。また、実施の形態4では、重畳音声信号を音声化する装置として音声出力装置500を備えた例について説明した。しかし、本発明の適用は、これらに限定されない。
【0183】
例えば、本発明にかかる音声多重化装置は、マイクロフォンなどの音声入力機能と、音声聴取装置の機能と、スピーカなどの音声出力機能とを備えた、ヘッドセットとすることができる。
【0184】
また、第1の多重音声号と第2の多重音声号との重畳位置関係の切り替えの手法は、上記各実施の形態において、指定する音声番号をその番号の順番に従って切り替える手法としたが、これに限定されない。
【0185】
本発明にかかる音声聴取装置は、例えば、数値入力やキースイッチの押下などにより音声番号の指定を受け付け、指定された音声番号の音声信号が聞き取り易くなるように、上記重畳位置関係を切り替えてもよい。
【0186】
また、音声聴取装置は、例えば、各音声番号を配置した仮想軸上のポインタを移動させ、ポインタ位置がいずれかの音声番号の位置に一致したとき、その音声番号の音声信号が聞き取り易くなるように、上記重畳位置関係を切り替えてもよい。
【0187】
また、音声聴取装置は、例えば、第1の多重音声号の時間軸に対して第2の多重音声号の時間軸をスライドさせる操作を、ユーザから受け付けることにより、上記重畳位置関係を切り替えてもよい。
【0188】
また、本発明は、上述の音声チャットシステムやポータブルプレイヤー以外の各種システムおよび装置に適用することができる。例えば、本発明は、同時に複数のラジオ放送を受けて、所望のラジオ放送の音声を選択することができるラジオ受信機に適用してもよい。
【産業上の利用可能性】
【0189】
本発明に係る音声多重化装置、音声聴取装置、および音声多重化方法は、処理負荷を抑えた状態で注目音を聞き取り易くすることができる音声多重化装置、音声聴取装置、および音声多重化方法として有用である。
【符号の説明】
【0190】
100、100a、100b 音声多重化装置
110、110b 音声入力部
111 音声圧縮部
112b 音声保持部
113b 音声検索部
120 第1の音声多重化部
130、130a 第2の音声多重化部
131 遅延処理部
132a 位相反転部
140、440 音声出力部
141 多重音声送信部
200、200a、200b 音声多重化システム
300 音声提供装置
400 音声聴取装置
410 多重音声受信部
420 時間調整部
430 操作部
500 音声出力装置

【特許請求の範囲】
【請求項1】
第1の音声信号および第2の音声信号を入力する音声入力部と、
前記第1の音声信号と前記第2の音声信号とを第1の多重化位置関係で多重化して得られる、第1の多重音声信号を生成する第1の音声多重化部と、
前記第1の音声信号と前記第2の音声信号とを前記第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して得られる、第2の多重音声信号を生成する第2の音声多重化部と、
前記第1の多重音声信号および前記第2の多重音声信号を出力する音声出力部と、を有する、
音声多重化装置。
【請求項2】
前記第2の音声多重化部は、
前記第2の音声信号を遅延させる遅延処理部、を有する、
請求項1記載の音声多重化装置。
【請求項3】
前記第1の多重化位置関係は、前記第1の音声信号の任意の位置と、当該位置と同一のタイミングで入力された前記第2の音声信号の位置とが一致する関係であり、
前記第2の多重化位置関係は、前記第1の音声信号の任意の位置に対して、当該位置と同一のタイミングで入力された前記第2の音声信号の位置が所定時間遅延する関係である、
請求項1記載の音声多重化装置。
【請求項4】
前記第1の多重化位置関係は、前記第1の音声信号の開始位置と、前記第2の音声信号の開始位置が一致する関係であり、
前記第2の多重化位置関係は、前記第1の音声信号の開始位置に対して、前記第2の音声信号の開始位置が所定時間遅延する関係である、
請求項1記載の音声多重化装置。
【請求項5】
前記第1の多重音声信号および前記第2の多重音声信号の一方に含まれる、前記第1の音声信号および前記第2の音声信号の位相を、それぞれ反転させる位相反転部、を更に有する、
請求項1記載の音声多重化装置。
【請求項6】
前記音声出力部は、
前記第1の多重音声信号と前記第2の多重音声信号とを調整可能な所定の重畳位置関係で重畳して出力する音声聴取装置へ、前記第1の多重音声信号および前記第2の多重音声信号を送信する、
請求項1記載の音声多重化装置。
【請求項7】
前記第1の多重音声信号と前記第2の多重音声信号とを調整可能な所定の重畳位置関係で重畳して得られる、重畳音声信号を生成する時間調整部と、
ユーザ操作に基づいて、少なくとも、前記第1の音声信号の任意の位置が前記第1の多重音声信号と前記第2の多重音声信号との間で一致する第1の重畳位置関係と、前記第2の音声信号の任意の位置が前記第1の多重音声信号と前記第2の多重音声信号との間で一致する第2の重畳位置関係との間で、前記所定の重畳位置関係を切り替える操作部と、を更に有し、
前記音声出力部は、
前記重畳音声信号を、音声出力装置へ出力する、
請求項1記載の音声多重化装置。
【請求項8】
請求項1記載の音声多重化装置から、前記第1の多重音声信号および前記第2の多重音声信号を取得する多重音声受信部と、
前記第1の多重音声信号と前記第2の多重音声信号とを調整可能な所定の重畳位置関係で重畳して得られる、重畳音声信号を生成する時間調整部と、
ユーザ操作に基づいて、前記第1の多重音声信号と前記第2の多重音声信号のそれぞれに含まれる前記第1の音声信号の任意の位置が一致する第1の重畳位置関係と、前記第1の多重音声信号と前記第2の多重音声信号のそれぞれに含まれる前記第2の音声信号の任意の位置が一致する第2の重畳位置関係との間で、前記所定の重畳位置関係を切り替える操作部と、
前記重畳音声信号を音声出力装置へ出力する音声出力部と、を有する、
音声聴取装置。
【請求項9】
第1の音声信号および第2の音声信号を入力するステップと、
前記第1の音声信号と前記第2の音声信号とを第1の多重化位置関係で多重化して、第1の多重音声信号を生成するステップと、
前記第1の音声信号と前記第2の音声信号とを前記第1の多重化位置関係とは異なる第2の多重化位置関係で多重化して、第2の多重音声信号を生成するステップと、
前記第1の多重音声信号および前記第2の多重音声信号を出力するステップと、を有する、
音声多重化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−235379(P2012−235379A)
【公開日】平成24年11月29日(2012.11.29)
【国際特許分類】
【出願番号】特願2011−103539(P2011−103539)
【出願日】平成23年5月6日(2011.5.6)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】