音声通信装置及びプログラム

【課題】高音質を期して外付けした外部オーディオデバイスとの音声データの授受にＯＳを介在させても音声信号の処理遅延を抑える。
【解決手段】本発明は、汎用ＯＳを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置に関する。外部オーディオデバイスは、スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する。音声通信プログラムの一機能として、外部オーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、汎用ＯＳにおける音声データの処理ルートを介さず、汎用ＯＳを単に通過させて、外部オーディオデバイスと授受する音声データ入出力部が設けられている。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は音声通信装置及びプログラムに関し、例えば、市販のパソコンを電話端末（ソフトフォン）として利用する場合に適用し得るものである。
【背景技術】
【０００２】
近年、パソコンにソフトフォン用アプリケーションを搭載し、パソコンを電話端末として使用することもなされるようになってきている。例えば、外部装置を取り付けられるパソコンのコネクタ（例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）インタフェースのコネクタ）に、ヘッドセットやハンドセット等のマイクロフォン及びスピーカを有する音声入出力装置を接続させ、この外部音声入出力装置を利用して、オペレータが通話を行う。また例えば、音響信号を取り扱う音響装置を、上述した外部音声入出力装置として用い、高音質の音声通信を楽しむことも行われている。
【０００３】
パソコンと、上記外部音声入出力装置との音声信号の授受は、従来においては、以下の２点の要因により、パソコン上のＯＳ（オペレーティングシステム）に実装されている標準的なオーディオインタフェースを使用して音声の入出力を行っていた。
【０００４】
（１）市販されているパソコンの大半には内蔵サウンドデバイス（アナログ入出力）が搭載されており、ＯＳに対応したドライバがプレインストールされているため、ユーザの多くはこれを用いていた。また、音質を重視する一部のユーザはＵＳＢヘッドセット等の外部音声入出力装置（外部デバイス）を別途使用することもあったが、ドライバ、ＰｎＰ（プラグ＆プレイ）動作を含めＯＳの標準的な仕組みはそのまま利用していたため、結果として内蔵デバイスと同様のオーディオルートを経由して音声の入出力が行われていた。
【０００５】
（２）音量調整、可聴音生成のためのファイル再生、ミキシング機能等の実現、及び、他のアプリケーションとの共存のために、ＯＳが用意しているＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ）を利用して実現していた。
【０００６】
なお、特許文献１には、電話網とパソコンとの間に介在し、音声信号を処理することにより、ヘッドセット等が接続されているパソコンでの処理を軽減し、処理遅延を抑えることができるアダプタ装置が提案されている。
【先行技術文献】
【特許文献】
【０００７】
【特許文献１】特開２００４−３３６７５６号公報
【発明の概要】
【発明が解決しようとする課題】
【０００８】
しかし、ＯＳが標準的に実装している音声入出力インタフェース、ドライバを使用する場合、音楽再生等の他のアプリケーションとの共存を前提としているため、汎用性が高い反面、過剰なオーバヘッドとなる可能性のあるソフトウェア処理等を多く経由することとなり、結果として遅延が発生する原因となっていた。これらを改善するために、一部遅延を考慮したインタフェース（例えばＡＳＩＯ（ＡｕｄｉｏＳｔｒｅａｍｉｎｇＩｎｐｕｔＯｕｔｐｕｔ））のようなものもあったが、音楽再生・演奏用に特化したものであり、双方向リアルタイム通信に配慮したものではなかった。
【０００９】
また、新しいＯＳになるほど過剰なオーバヘッドによる遅延傾向が強く、ＣＰＵを含めたハードウェア性能が大幅に上がっているにも関わらず、従来以上に大幅に遅延が増大することがあった。
【００１０】
発生する遅延自体も様々であり、同時に起動しているアプリケーションの起動時にバックグラウンドの処理に依存して遅延が急激に増減するような場合には、例えば、エコーキャンセラ等の動作に悪影響を及ぼすことも多かった。
【００１１】
上述のような問題が多々発生するため、音声通信サービスを展開する際の大きな障壁となっており、ソフトフォンの使用範囲は限定的であった。
【００１２】
特許文献１の記載技術は低遅延を意図したものではあるが、専用装置としてのアダプタ装置が必要となり、多くの利用者に適用可能な解決方法とは言い難いものである。
【００１３】
そのため、ＯＳを介在しても音声信号の処理遅延を抑えることができる音声通信装置及びプログラムが望まれている。
【課題を解決するための手段】
【００１４】
かかる課題を解決するため、第１の本発明は、汎用オペレーティングシステムを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置において、（１）スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第１のオーディオデバイスと、（２）上記第１のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第１のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第１の音声データ入出力部とを備えることを特徴とする。
【００１５】
第２の本発明は、スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する第１のオーディオデバイスが外付けされている、しかも、汎用オペレーティングシステムを搭載したコンピュータにインストールされて音声通信装置を構成させる音声通信プログラムであって、上記コンピュータを、上記第１のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第１のオーディオデバイスと授受する第１の音声データ入出力部として機能させることを特徴とする。
【発明の効果】
【００１６】
本発明の音声通信装置及びプログラムによれば、高音質を期して外付けした外部オーディオデバイスとの音声データの授受にＯＳを介在させても音声信号の処理遅延を抑えることができるようになる。
【図面の簡単な説明】
【００１７】
【図１】第１の実施形態に係る音声通信装置の機能的構成を示すブロック図である。
【図２】第２の実施形態に係る音声通信装置の機能的構成を示すブロック図である。
【発明を実施するための形態】
【００１８】
（Ａ）第１の実施形態
以下、本発明による音声通信装置及びプログラムを、市販のパソコンを電話端末（ソフトフォン）として利用する場合に適用した第１の実施形態を、図面を参照しながら詳述する。
【００１９】
（Ａ−１）第１の実施形態の構成
図１は、第１の実施形態に係る音声通信装置の機能的構成を示すブロック図である。
【００２０】
図１において、第１の実施形態に係る音声通信装置１は、主として、パソコン２と、このパソコン２に接続されている専用ＵＳＢオーディオデバイス３とを備えている。
【００２１】
専用ＵＳＢオーディオデバイス３は、ＵＳＢインタフェースを採用した音声（及び音響）の入出力機能を備えたデバイスであり、スピーカ１０及びマイクロフォン１１を内蔵しているものであっても良く、また、スピーカ１０及びマイクロフォン１１が外付けのものであっても良い。
【００２２】
専用ＵＳＢオーディオデバイス３は、今日市販されている一般的なオーディオデバイス（例えば、ＡＣ９７ＣＯＤＥＣやＨＤ−Ａｕｄｉｏ等を採用しているオーディオデバイス）に比較すると、パソコン２側との音声データの授受が、音声データであることをＯＳ３０が意識しないデータの授受になっている点が機能的には異なっている。専用ＵＳＢオーディオデバイス３は、例えば、ＵＳＢメモリとパソコン２とのデータ授受と同様な形態で、パソコン２側と音声データを授受する。
【００２３】
専用ＵＳＢオーディオデバイス３は、パソコン２との転送を制御、実行するＵＳＢコントローラ１２と、マイクロフォン１１が捕捉したアナログ音声信号をデジタル音声データに変換すると共に、パソコン２から与えられたデジタル音声データをアナログ音声信号に変換するアナログ／デジタル相互変換部（ＡＤＣ／ＤＡＣ）１３と、スピーカ１０及びマイクロフォン１１とのインタフェース部（Ｉ／Ｆ）１４とを有する。ＵＳＢコントローラ１２が、音声データを、ＯＳ３０が音声データとして意識しない形態で転送するものである。
【００２４】
例えば、後述するように、専用ＵＳＢオーディオデバイス３として、一般的なＵＳＢオーディオデバイス（例えば、ＡＣ９７ＣＯＤＥＣやＨＤ−Ａｕｄｉｏ等を採用しているオーディオデバイス）を利用し、ＯＳ３０側の認識処理により、専用ＵＳＢオーディオデバイス３として機能させる。
【００２５】
パソコン２は、電話通信に関係している部分として、ＶｏＩＰ（ＶｏｉｃｅｏｖｅｒＩＰ）エンジン２０と、ＯＳ３０と、ＵＳＢコントローラ４０と、内蔵スピーカ４１と、内蔵マイクロフォン４２と、内蔵オーディオデバイス４３とを有している。ＶｏＩＰエンジン２０及びＯＳ３０はソフトウェアでなる部分であるが、この第１の実施形態の説明では、かかるソフトウェアを実行するＣＰＵ等をも含めて、ＶｏＩＰエンジン２０、ＯＳ３０と表記している。
【００２６】
ＶｏＩＰエンジン２０は、主として、パケット組立分解部２１と、呼制御部２２と、コーデック部２３と、音声制御部２４と、音声データ入出力部２５と、可聴音データ出力部２６とを有している。
【００２７】
パケット組立分解部２１は、図示しない通信部が受信した電話網からのパケットを分解するものである。パケット組立分解部２１は、受信パケットが呼制御パケットであれば、分解して得られた呼制御データを呼制御部２２に与え、また、受信パケットが音声パケットであれば、分解して得られた符号化音声データをコーデック部２３に与える。パケット組立分解部２１は、呼制御部２２から与えられた呼制御データや、コーデック部２３から与えられた符号化音声データを含むパケットを組み立てて、図示しない通信部から電話網に送信させるものである。
【００２８】
呼制御部２２は、発着信時に通話路を確立したり、切断時に通話路を切断したりする等の呼制御を実行するものである。なお、図１では省略しているが、呼制御部２２には、キーボードなどが検知した操作信号等がＯＳ３０を介して与えられるようになされている。呼制御部２２は、そのときの呼制御の段階によって、所定の可聴音（例えばリンギングトーン）の発音出力が必要となった場合には、内部に記憶している可聴音データを取り出し、可聴音データ出力部２５に与えるものである。
【００２９】
コーデック部２３は、受信した符号化音声データを復号して音声制御部２４経由で音声データ入出力部２５に与え、音声データ入出力部２５から音声制御部２４経由で与えられた音声データを符号化し、符号化音声データをパケット組立分解部２１に与えるものである。
【００３０】
音声制御部２４は、第１の実施形態の場合、音声データがＯＳ３０内のオーディオ制御部３３を経由しないために、ＶｏＩＰエンジン２０内に設けられたものである。音声制御部２４は、音声データに対し、音量調整、ファイル再生・録音、ミキシングなどの処理を施すものである。
【００３１】
音声データ入出力部２５は、ＯＳ３０経由で、専用ＵＳＢオーディオデバイス３と音声データを授受するものである。この第１の実施形態の場合、上述したように、専用ＵＳＢオーディオデバイス３との音声データの授受では、専用ＵＳＢオーディオデバイス３が音声データであることを意図しない形態で授受するものとなっており、音声データ入出力部２５は、そのような一般的なデータと同様な授受をできるように、音声データを処理するものである。例えば、音声データ入出力部２５と、専用ＵＳＢオーディオデバイス３のＵＳＢコントローラ１２との間では、音声データ（ＰＣＭ音声データ）が挿入されているＵＳＢパケットの形態で音声データを授受し、ＯＳ３０に音声データであることを意識させないようにする。
【００３２】
可聴音データ出力部２６は、呼制御部２２から与えられた可聴音データを、ＯＳ３０の標準的インタフェースに従う形式でＯＳ３０に与えるものである。
【００３３】
ＵＳＢコントローラ４０は、専用ＵＳＢオーディオデバイス３のＵＳＢコントローラ１２に対向し、データのＵＳＢ転送を実行するものである。
【００３４】
内蔵スピーカ４１及び内蔵マイクロフォン４２は、パソコン２が内蔵しているスピーカ、マイクロフォンであり、電話端末として機能しているときには、可聴音の発音動作程度の機能しか担当していない。内蔵オーディオデバイス４３は、内蔵マイクロフォン４１が捕捉したアナログ音声信号をデジタル音声データに変換すると共に、ＯＳ３０から与えられたデジタル音声データをアナログ音声信号に変換したり、また、内蔵スピーカ４１や内蔵マイクロフォン４２との信号を授受したりするものである。
【００３５】
ＯＳ３０としては、例えば、既存の汎用ＯＳ（例えば、ＷＩＮＤＯＷＳ（登録商標）、ＬＩＮＵＸ、マックＯＳ等）を適用することができる。
【００３６】
ＯＳ３０は、電話端末（ソフトフォン）としての機能から見れば、専用デバイスドライバ３１、ＵＳＢドライバ３２、オーディオ制御部３３、内蔵デバイスドライバ３４を有する。専用デバイスドライバ３１及びＵＳＢドライバ３２は音声データの授受に介在するものであり、オーディオ制御部３３及び内蔵デバイスドライバ３４は可聴音の報知に介在するものである。
【００３７】
専用デバイスドライバ３１は、専用ＵＳＢオーディオデバイス３が接続された際に、標準オーディオインタフェースではなく専用インタフェースとしてデータの送受信を実現するものである。専用デバイスドライバ３１（及びＵＳＢドライバ３２）は、ＶｏＩＰエンジン２０及び専用ＵＳＢオーディオデバイス３間のデータ（音声データ）の転送をトランスペアレントに実行する。すなわち、なんら処理することなく、単に、ＶｏＩＰエンジン２０及び専用ＵＳＢオーディオデバイス３間の転送データ（例えば、音声データを挿入したＵＳＢパケット）を通過させる。専用デバイスドライバ３１は、例えば、ＵＳＢオーディオデバイス用ドライバ（Ｗｉｎｄｏｗｓの場合、ＵＳＢＡＵＤＩＯ．ＳＹＳ）と同等機能を実現するものであるが、音声処理等の転送以外の処理に対応していないものである。
【００３８】
ＵＳＢドライバ３２は、ＵＳＢコントローラ４０と、専用ＵＳＢオーディオデバイス３のＵＳＢコントローラ１２とのＵＳＢ転送を駆動するものである。また、ＵＳＢドライバ３２は、ＵＳＢコネクタに挿入されたデバイスが専用ＵＳＢオーディオデバイス３であることを認識するものである。
【００３９】
市販のＵＳＢオーディオデバイスのうち、標準的オーディオデバイスではなく専用デバイス（専用ＵＳＢオーディオデバイス３）として認識させようとする製品のＩＤ情報（例えば、ベンダＩＤやプロダクトＩＤ等）に、予めＰｎＰ機能が動作するために必要な、ＵＳＢドライバ３２内のデバイス情報（例えば、Ｗｉｎｄｏｗｓの場合“ＩＮＦファイル”等）を書き換えておく。専用デバイスドライバ３１は、ＵＳＢコネクタにデバイスが挿入され、ＵＳＢドライバ３２が、挿入されたデバイスのＩＤ情報が専用ＵＳＢオーディオデバイス３のＩＤ情報であると認識したときに有効となるものである。
【００４０】
以上の方法を適用すると、汎用のＵＳＢオーディオデバイスに特別な変更、改造等を加えることなく、専用ＵＳＢオーディオデバイス３として識別、起動させることが可能となる。
【００４１】
オーディオ制御部３３は、ＯＳ３０が有する標準的なオーディオ制御部であり、音量調整、ファイル再生・録音、ミキシングなどの処理を施すものである。
【００４２】
内蔵デバイスドライバ３４は、内蔵スピーカ４１及び内蔵マイクロフォン４２を収容している内蔵オーディオデバイス４３を駆動するものである。
【００４３】
（Ａ−２）第１の実施形態の動作
次に、第１の実施形態に係る音声通信装置１の動作を説明する。
【００４４】
当該音声通信装置１が発信側であろうと着信側であろうと、呼を接続しようとするときには、呼制御部２２が呼を確立するためのシーケンスを実行する。
【００４５】
この呼制御のいずれかの段階で、可聴音の発音出力が必要となったときには、呼制御部２２は該当する可聴音データを可聴音データ出力部２６に与える。このとき、可聴音データ出力部２６は、音響データであることを表す情報と共に可聴音データをＯＳ３０に与える。これにより、ＯＳ３０では音響データや音声データに対する標準的なインタフェースであるオーディオ制御部３３や内蔵デバイスドライバ３４が機能して処理し、その後、可聴音データが内蔵オーディオデバイス４３に与えられ、アナログ信号に変換されて内蔵スピーカ４１から発音出力される。
【００４６】
以上のように、呼制御段階であって、処理遅延がほとんど問題とならない可聴音はＯＳ３０の標準インタフェースが利用されて発音出力される。
【００４７】
呼制御部２２の呼制御によって対向装置との呼を確立すると、両装置の話者（遠端話者及び近端話者）が通話を行う。
【００４８】
対向装置からの遠端話者の音声情報を含む音声パケットは、パケット組立分解部２１に与えられ、分解されて符号化音声データが取り出され、この符号化音声データがコーデック部２３によって復号され、音声データが再生される。この音声データは、音声制御部２４によって音量調整等の処理が施された後、音声データ入出力部２５によって、ＯＳ３０をそのまま通過する形態（例えばＵＳＢパケット）の転送データに変換されてＯＳ３０に与えられる。ＯＳ３０において、専用デバイスドライバ３１及びＵＳＢドライバ３２は、このようにして入力された転送データをそのまま通過させ、その後、ＵＳＢコントローラ４０から、専用ＵＳＢオーディオデバイス３のＵＳＢコントローラ１２に与えられる。ＵＳＢコントローラ１２において、転送形態（例えばＵＳＢパケット）が解除されて音声データに戻される。この音声データは、アナログ／デジタル相互変換部１３によってアナログ音声信号に変換された後、インタフェース部１４を介してスピーカ１０に与えられて発音出力される。
【００４９】
一方、近端話者の音声は、マイクロフォン１１が捕捉し、インタフェース部１４を介してアナログ／デジタル相互変換部１３に与えられ、デジタル信号（音声データ）に変換される。ＵＳＢコントローラ１２は、この音声データを、ＯＳ３０をそのまま通過する形態（例えばＵＳＢパケット）の転送データに変換してパソコン２に与える。パソコン２においては、この転送データをＵＳＢコントローラ４０が受けるが、専用ＵＳＢオーディオデバイス３からの転送データであるので、専用デバイスドライバ３１及びＵＳＢドライバ３２の制御下で、転送形態を解除することなく、ＵＳＢドライバ３２に与える。この転送データは、ＵＳＢドライバ３２及び専用デバイスドライバ３１をそのまま通過して、音声データ入出力部２５に与えられる。音声データ入出力部２５は、転送データの転送形態（例えばＵＳＢパケット）を解除して音声データに戻して音声制御部２４に与える。音声制御部２４は、音声データに対して、必要な音声処理を施した後（音声処理がなされない場合を含む）、コーデック部２３に与える。音声データは、コーデック部２３によって符号化され、さらに、パケット組立分解部２１によってパケットに組み立てられ、電話網に送信される。
【００５０】
（Ａ−３）第１の実施形態の効果
以上のように、第１の実施形態によれば、専用の送受信インタフェース（主に論理的なもの）を準備することで、ＯＳ標準搭載のオーディオデバイスを使用するメディア処理（例えば、可聴音処理）については汎用インタフェースを使用しつつ、リアルタイム性を要求される音声データのみを専用ルート経由としたので、音声データの送受信時の遅延をＯＳの音声処理構成を通過させない分、最低限に抑えることができる。また、ＩＰ網を介するので、広帯域音声データを送受信することが可能であるが、ＯＳでの音声処理が広帯域対応でなければ高音質を実現できない。しかし、第１の実施形態では、音声データはＯＳをスルーであるので、外部の専用ＵＳＢオーディオデバイス３を適用したことと相まって高音質を実現することができる。
【００５１】
すなわち、第１の実施形態によれば、ＶｏＩＰが前提としている双方向メディアストリームの送受信を、ほぼリアルタイムで高音質で実現することができる。
【００５２】
（Ｂ）第２の実施形態
次に、本発明による音声通信装置及びプログラムを、市販のパソコンを電話端末（ソフトフォン）として利用する場合に適用した第２の実施形態を、図面を参照しながら詳述する。
【００５３】
図２は、第１の実施形態に係る音声通信装置の機能的構成を示すブロック図であり、第１の実施形態に係る図１との同一、対応部分には、同一、対応符号を付して示している。
【００５４】
図２において、第２の実施形態に係る音声通信装置１Ａを搭載しているパソコン２Ａは、複数（図２では２個を示している）のＵＳＢコネクタを有し、これらＵＳＢコネクタには、低遅延ＵＳＢオーディオデバイス３と標準ＵＳＢオーディオデバイス４とが接続可能である。図２は、低遅延ＵＳＢオーディオデバイス３と標準ＵＳＢオーディオデバイス４とが接続された状態を示している。
【００５５】
低遅延ＵＳＢオーディオデバイス３は、第１の実施形態の専用ＵＳＢオーディオデバイスと同一なものであり、ネーミングだけを変更したものである。標準ＵＳＢオーディオデバイス４は、既存の一般的なＵＳＢオーディオデバイスである。低遅延ＵＳＢオーディオデバイス３及び標準ＵＳＢオーディオデバイス４は、ＯＳ３０Ａにおいて、利用される要素が異なるものである。標準ＵＳＢオーディオデバイス４は、スピーカ５０及びマイクロフォン５１を収容していると共に、ＵＳＢコントローラ５２と、アナログ／デジタル相互変換部（ＡＤＣ／ＤＡＣ）５３と、インタフェース部（Ｉ／Ｆ）５４とを有する。
【００５６】
図２では、低遅延ＵＳＢオーディオデバイス３のＵＳＢコントローラ１２は、接続時に、パソコン２のＵＳＢコントローラ４０と対向し、標準ＵＳＢオーディオデバイス４のＵＳＢコントローラ４２は、接続時に、パソコン２のＵＳＢコントローラ４４と対向している状態を示している。
【００５７】
なお、図２では、内蔵スピーカ４１、内蔵マイクロフォン４２、内蔵オーディオデバイス４３の図示を省略している。
【００５８】
第２の実施形態の場合、ＯＳ３０Ａは、第１の実施形態と同様な専用デバイスドライバ３１及びＵＳＢドライバ３２に加え、標準ＵＳＢオーディオデバイス４との音声又は音響データの転送時に機能するオーディオ制御部６０、デバイスドライバ６１及びＵＳＢドライバ６２を有する。ここで、オーディオ制御部６０は、第１の実施形態のオーディオ制御部３３と同一のものである。ＯＳ３０Ａは、さらに、接続デバイス管理部６３を有する。接続デバイス管理部６３は、どのＵＳＢコネクタにどのようなＵＳＢデバイスが接続されているかを管理しているものである。
【００５９】
第２の実施形態のＶｏＩＰエンジン２０Ａは、パケット組立分解部２１と、呼制御部２２と、コーデック部２３と、音声制御部２４と、低遅延音声データ入出力部２５と、標準音声データ入出力部２６Ａと、使用デバイス決定部２７とを有している。
【００６０】
標準音声データ入出力部２６Ａは、第１の実施形態の可聴音データ出力部２６に代えて設けられたものであり、ＯＳ３０Ａ内のオーディオ制御部６０、デバイスドライバ６１及びＵＳＢドライバ６２でなる処理系との間で、音声データ（可聴音データを含む）を授受するものである。言い換えると、標準ＵＳＢオーディオデバイス４が接続されているときに有効となるものである。
【００６１】
使用デバイス決定部２７は、ＯＳ３０Ａの接続デバイス管理部６３の管理情報などに基づき、使用するデバイスを決定するものである。
【００６２】
使用デバイス決定部２７は、呼の確立中や切断中の呼制御段階において可聴音の発音出力が必要なときに、標準ＵＳＢオーディオデバイス４が接続されていれば標準ＵＳＢオーディオデバイス４を使用するものに決定し、標準ＵＳＢオーディオデバイス４が接続されていなければ内蔵スピーカ４１を使用するものに決定する。
【００６３】
使用デバイス決定部２７は、通話段階においては、低遅延ＵＳＢオーディオデバイス３が接続されていれば（この場合、標準ＵＳＢオーディオデバイス４が接続されていてもいなくても良い）、音声の入出力デバイスとして低遅延ＵＳＢオーディオデバイス３を使用するものに決定する。また、使用デバイス決定部２７は、通話段階においては、低遅延ＵＳＢオーディオデバイス３が接続されておらず、標準ＵＳＢオーディオデバイス４が接続されている場合には、音声の入出力デバイスとして標準ＵＳＢオーディオデバイス４を使用するものに決定する。さらに、使用デバイス決定部２７は、通話段階においては、低遅延ＵＳＢオーディオデバイス３も標準ＵＳＢオーディオデバイス４も接続されていない場合には、音声の入出力デバイスとして内蔵スピーカ４１及び内蔵マイクロフォン４２を使用するものに決定する。
【００６４】
使用デバイス決定部２７は、通話音声の入出力デバイスとして低遅延ＵＳＢオーディオデバイス３を使用する場合には、パケット組立分解部２１、コーデック部２３、音声制御部２４及び低遅延音声データ入出力部２５の処理系を有効に機能させ、音声の入出力デバイスとして標準ＵＳＢオーディオデバイス４を使用する場合には、パケット組立分解部２１、コーデック部２３及び標準音声データ入出力部２６Ａの処理系を有効に機能させる。
【００６５】
ここで、標準ＵＳＢオーディオデバイス４の接続状態において、ＶｏＩＰエンジン２０Ａ以外のオーディオアプリケーション（例えばバックミュージックを流すソフトウェア）７０が機能しているときには、標準ＵＳＢオーディオデバイス４が利用される。この場合において、標準ＵＳＢオーディオデバイス４が通話音声の入出力デバイスとして利用されていなければ、オーディオアプリケーション７０からの音響データ又は音声データが標準ＵＳＢオーディオデバイス４から発音出力され、一方、標準ＵＳＢオーディオデバイス４が通話音声の入出力デバイスとして利用されていれば、通話音声データと、オーディオアプリケーション７０からの音響データ又は音声データとがオーディオ制御部６０によって合成され、標準ＵＳＢオーディオデバイス４から発音出力される。
【００６６】
使用デバイス決定部２７は、例えば、ＯＳ３０Ａとの間で音声データ送受信を行う際に、標準ＵＳＢオーディオデバイス４への制御は標準音声データ入出力部２６Ａ（ＰＣＭ送受信用ＡＰＩ）を使用し、低遅延ＵＳＢオーディオデバイス３については低遅延音声データ入出力部２５（ＵＳＢデバイス制御用ＡＰＩ）を使用するといったように、オープンしている各々のデバイスに合わせてＯＳ３０ＡのＡＰＩ（Linuxの場合はシステムコール）を切り替え（若しくは選択）する。
【００６７】
第２の実施形態によれば、通話音声の入出力デバイスとして低遅延ＵＳＢオーディオデバイス３を使用する場合には、第１の実施形態と同様な効果を奏することができる。
【００６８】
また、第２の実施形態によれば、外部デバイスの接続状態に応じた最適な形で通話音声を送受信することができる。
【００６９】
さらに、第２の実施形態によれば、ＶｏＩＰエンジン２０Ａと他のオーディオアプリケーション７０とを併用することができる。
【００７０】
（Ｃ）他の実施形態
上記第２の実施形態においては、低遅延ＵＳＢオーディオデバイス３及び標準ＵＳＢオーディオデバイス４の接続状態に応じて、通話音声の入出力に用いるデバイスを定めるものを示したが、低遅延ＵＳＢオーディオデバイス３及び標準ＵＳＢオーディオデバイス４の接続状態に加え、ＶｏＩＰエンジン２０Ａ以外の他のアプリケーション（例えば、ＶｏＩＰエンジン２０Ａより上位階層のアプリケーション）の指令に応じて、通話音声の入出力に用いるデバイスを定めるようにしても良い。
【００７１】
また、第２の実施形態の変形例として（第１の実施形態の変形例ともなり得る）、以下のようなものを挙げることができる。ＶｏＩＰエンジン２０Ａに使用可能なＵＳＢオーディオデバイスのリストを用意しておき、パソコン２Ａに接続されていても、そのリストに掲載されていないＵＳＢオーディオデバイスを接続されていないと取り扱うようにしても良い。
【００７２】
上記各実施形態においては、ＯＳが有するオーディオ制御部を利用しないこと、ＶｏＩＰエンジンに音声制御部を設けることで補償するものを示したが、他の方法で補償するようにしても良い。例えば、専用（低遅延）ＵＳＢオーディオデバイス３が音量調整機能を備えている場合には、ＶｏＩＰエンジンから音量調整指令を専用（低遅延）ＵＳＢオーディオデバイス３に発行して音量を調整させるようにしても良い。
【００７３】
また、上記各実施形態では、専用（低遅延）ＵＳＢオーディオデバイス３は標準ＵＳＢオーディオデバイス４として利用できないものを示したが、専用（低遅延）ＵＳＢオーディオデバイス３としても標準ＵＳＢオーディオデバイス４としても利用できるＵＳＢオーディオデバイスを利用するようにしても良い。例えば、１つのＵＳＢオーディオデバイスが複数のＩＤ情報を備え、設定用スイッチによって、ユーザがそのＵＳＢオーディオデバイスを専用（低遅延）ＵＳＢオーディオデバイス３として用いるか標準ＵＳＢオーディオデバイス４として用いるかを設定できるようにしても良い。
【００７４】
さらに、上記各実施形態では、専用デバイスドライバ３１は転送データのトランスペアレントな送受信を行うものであったが、専用（低遅延）ＵＳＢオーディオデバイス３の装着時に、付加機能を発揮するようなものであっても良い。例えば、専用（低遅延）ＵＳＢオーディオデバイス３にＶｏＩＰエンジン２０の制御下で予めユーザ情報などを書き込んで記憶させておき、専用（低遅延）ＵＳＢオーディオデバイス３の装着時に、記憶されているユーザ情報を取り出してユーザ認証を行うようにしても良い。
【００７５】
上記各実施形態では、近年、最も一般的な汎用ＰＣインタフェースであるＵＳＢを用いたものを示したが、Ｆｉｒｅｗｉｒｅ（ＩＥＥＥ．１３９４）、Ｂｌｕｅｔｏｏｔｈ、ＰＣカード（ＰＣＭＣＩＡ、カードＢＵＳ）、ＰＣＩ等の他の汎用インタフェースを適用しても良い。
【００７６】
また、上記各実施形態では、ＯＳを搭載したコンピュータ（情報処理装置）がパソコンであるものを示したが、汎用的なＯＳを搭載した装置であれば本発明を適用することができる。例えば、一般的なパソコンだけでなく、いわゆるネットブックやモバイルパソコンに本発明を適用することができる。また例えば、マルチメディアインターネットデバイス（ＭＩＤ）やウルトラモバイルＰＣ（ＵＭＰＣ）などに対しても本発明を適用することができる。
【符号の説明】
【００７７】
１、１Ａ…音声通信装置、２、２Ａ…パソコン、３…専用ＵＳＢオーディオデバイス（低遅延ＵＳＢオーディオデバイス）、４…標準ＵＳＢオーディオデバイス、１０、５０…スピーカ、１１、５１…マイクロフォン、１２、５２…ＵＳＢコントローラ、１３、５３…アナログ／デジタル相互変換部（ＡＤＣ／ＤＡＣ）、１４、５４…インタフェース部（Ｉ／Ｆ）、２０…ＶｏＩＰエンジン、２１…パケット組立分解部、２２…呼制御部、２３…コーデック部、２４…音声制御部、２５…音声データ入出力部（低遅延音声データ入出力部）、２６…可聴音データ出力部、２６Ａ…標準音声データ入出力部、２７…使用デバイス決定部、３０、３０Ａ…ＯＳ、３１…専用デバイスドライバ、３２…ＵＳＢドライバ、３３、６０…オーディオ制御部、３４…内蔵デバイスドライバ、４０、４４…ＵＳＢコントローラ、４１…内蔵スピーカ、４２…内蔵マイクロフォン、４３…内蔵オーディオデバイス、６１…デバイスドライバ、６２…ＵＳＢドライバ、７０…オーディオアプリケーション。

【特許請求の範囲】
【請求項１】
汎用オペレーティングシステムを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置において、
スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第１のオーディオデバイスと、
上記第１のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第１のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第１の音声データ入出力部と
を備えることを特徴とする音声通信装置。
【請求項２】
スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第２のオーディオデバイスと、
上記第２のオーディオデバイスが外付けされていることを条件とし、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介して、上記第２のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第２の音声データ入出力部と、
音声データの授受では、上記第１の音声データ入出力部と上記第２の音声データ入出力部との一方を有効とする、上記音声通信プログラムの一機能として設けられた選択部と
を備えることを特徴とする音声通信装置。
【請求項３】
上記選択部は、上記第１のオーディオデバイスが外付けされているとき、上記第１の音声データ入出力部を有効とし、上記第１のオーディオデバイスが外付けされておらず、上記第２のオーディオデバイスが外付けされているとき、上記第２の音声データ入出力部を有効とすることを特徴とする請求項２に記載の音声通信装置。
【請求項４】
上記選択部は、階層上、上記音声通信プログラムの上位に位置する上位プログラムの指示に応じて、上記第１の音声データ入出力部又は上記第２の音声データ入出力部の一方を有効とすることを特徴とする請求項２に記載の音声通信装置。
【請求項５】
スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する第１のオーディオデバイスが外付けされている、しかも、汎用オペレーティングシステムを搭載したコンピュータにインストールされて音声通信装置を構成させる音声通信プログラムであって、
上記コンピュータを、
上記第１のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第１のオーディオデバイスと授受する第１の音声データ入出力部として機能させる
ことを特徴とする音声通信プログラム。

【図１】

【図２】

【公開番号】特開２０１１−７１８７５（Ｐ２０１１−７１８７５Ａ）
【公開日】平成２３年４月７日（２０１１．４．７）
【国際特許分類】

電気 (1,674,590)
- 電気通信技術 (544,871)
  - 電話通信 (58,612)
    - サブステーション装置，例．加入者が使用するもの (30,275)
      - デジタル音声通信を用いる電話機 (59)

【出願番号】特願２００９−２２２６６４（Ｐ２００９−２２２６６４）
【出願日】平成２１年９月２８日（２００９．９．２８）
【公序良俗違反の表示】
（特許庁注：以下のものは登録商標）
１．Ｌｉｎｕｘ
２．Ｂｌｕｅｔｏｏｔｈ
【出願人】（００００００２９５）沖電気工業株式会社 (6,645)
【Ｆターム（参考）】

[ Back to top ]

音声通信装置及びプログラム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

音声通信装置及びプログラム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク