オーディオエンハンス型装置
【課題】 コンピュータ及び出力装置を備えた、オーディオを向上させるシステムを提供する。
【解決手段】 コンピュータは、コンピュータに対するユーザの位置を決定するよう構成されたセンサを備えている。又、センサは、コンピュータの環境に対応する環境データを収集するようにも構成される。又、コンピュータは、センサと通信するプロセッサであって、ユーザの位置及び環境データを処理しそしてオーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサも備えている。出力装置は、プロセッサと通信し、そしてオーディオ出力又はビデオ出力の少なくとも一方を出力するように構成される。
【解決手段】 コンピュータは、コンピュータに対するユーザの位置を決定するよう構成されたセンサを備えている。又、センサは、コンピュータの環境に対応する環境データを収集するようにも構成される。又、コンピュータは、センサと通信するプロセッサであって、ユーザの位置及び環境データを処理しそしてオーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサも備えている。出力装置は、プロセッサと通信し、そしてオーディオ出力又はビデオ出力の少なくとも一方を出力するように構成される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的に、電子装置に係り、より詳細には、電子装置のオーディオ出力に係る。
【背景技術】
【0002】
コンピュータ、移動電話、オーディオプレーヤ、ラップトップ、タブレットコンピュータ、テレビジョン、等の電子装置(以下「電子装置」)は、典型的に、一体化されたオーディオ出力装置(例えば、スピーカ)を有するか、又はオーディオ出力装置と通信できるようにされる。更に、多くの電子装置は、ビジュアル又はビデオ出力装置も備え、或いはビデオディスプレイ装置と通信する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
多くのオーディオ/ビジュアル出力装置は、環境、周囲、状況、番組及び/又は環境に対しオーディオ出力を調整できる場合には、改良されたオーディオ又はビデオ出力を得ることができる。しかしながら、多くのオーディオ及びビデオ出力装置は、特定出力を変化させるためにユーザ入力又は相互作用を必要とするか、或いは可変出力設定を有していない。これらの場合には、オーディオ及び/又はビデオ出力が、特定の環境、番組、状況、等に対し最良品質の音響又は画像を形成し又は出力することができない。
【課題を解決するための手段】
【0004】
本開示の一例は、コンピューティング装置からオーディオを出力するための方法の形態をとる。この方法は、センサによってユーザを検出することを含む。ユーザが検出されると、プロセスは、ユーザがオーディオ出力装置の現在オーディオ出力に対して最適な範囲であるかどうか決定する。ユーザが最適な範囲内でない場合には、プロセッサがオーディオ出力を変更する。更に、センサは、ユーザがコンピューティング装置を向いているかどうかも決定する。ユーザの向きに基づき、プロセッサは、オーディオ装置を調整する。
【0005】
本開示の他の例は、コンピュータのオーディオを向上(エンハンス)させるための方法の形態をとる。この方法は、コンピュータに対するユーザの位置をセンサにより決定することを含む。ユーザの位置が決定されると、センサは、コンピュータの環境に対応する環境データを収集する。次いで、プロセッサは、環境データのオーディオビジュアル設定ビュー及びユーザの位置を調整する。
【0006】
本開示の更に別の例は、コンピュータ及び出力装置を備えた、オーディオを向上させるシステムの形態をとる。コンピュータは、コンピュータに対するユーザの位置を決定するように構成されたセンサを備えている。又、センサは、コンピュータの環境に対応する環境データを収集するようにも構成される。又、コンピュータは、センサと通信するプロセッサであって、ユーザの位置及び環境データを処理しそしてオーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサも備えている。出力装置は、プロセッサと通信し、そしてオーディオ出力又はビデオ出力の少なくとも一方を出力するように構成される。
【図面の簡単な説明】
【0007】
【図1A】オーディオ出力を向上させるシステムを示す図である。
【図1B】図1Aのシステムのコンピュータのブロック図である。
【図1C】コンピュータがネットワークを経て第2のコンピュータと通信するところを示す図である。
【図2】選択オーディオ及びビデオ処理経路が示された図1Aのシステムのブロック図である。
【図3】ユーザ場所及び位置に基づいてオーディオ出力を調整するための規範的な方法を示すフローチャートである。
【図4】オーディオ及び/又はビデオ出力を向上させるための規範的な方法を示すフローチャートである。
【図5A】複数の人のビデオ会議を表示するコンピュータの図である。
【図5B】図5Aのコンピュータに表示されたユーザを第2のコンピュータで捕獲したところを示す上面図である。
【図5C】個人A及び個人Bのオーディオ及びビデオが向上された図5Aのコンピュータを示す図である。
【図6】図5A−5Cに示すビデオ会議セッション中に特定の個人のオーディオ及び/又はビデオを向上されための規範的な方法を示すフローチャートである。
【図7A】インスタントメッセージング、ボイス、又は複数のインスタンスを実行及び表示するビデオチャットプログラムを伴うコンピュータの図である。
【図7B】図7Aの複数のオーディオ/ビデオインスタンスに対応するオーディオA、B、C、Dに対するオーディオ方向の図である。
【図8】特定のオーディオ/ビデオインスタンスのオーディオを指向するための規範的な方法を示すフローチャートである。
【発明を実施するための形態】
【0008】
概略
ここに述べる幾つかの実施形態では、この開示は、電子装置からのオーディオ出力を、1つ以上の基準、例えば、アクティブなアプリケーション、ユーザ相互作用、及び環境パラメータに基づいて向上させるための方法の形態をとる。又、この方法は、(もしあっても)著しいアクティブなユーザ相互作用を伴わずにユーザ入力を与えることを含む。換言すれば、このシステムは、ユーザがユーザ入力を物理的に又は故意にシステムに入力する必要がないように、ユーザ入力を補間するのにセンサ及び画像形成装置に依存する。これは、ユーザから直接アクティブな入力を要求せずにオーディオ出力を向上させるように、オーディオ出力装置が異なるユーザパラメータに対して動的に調整を行えるようにする。
【0009】
1つの実施形態において、このシステムは、ビデオ会議又はチャットに対しオーディオ出力を向上させることができる。あるユーザは、ビデオ会議を使用して、人々のグループと会話をすることができる。例えば、旅行中の親が、子供や配偶者を含む全家族とビデオ会議をすることができる。人々のグループでは、ある人々は、コンピュータの近くに又はコンピュータから離れて位置してもよい。更に、一度に複数の異なる人々が話をしてもよい。ビデオ会議の間に、受信端のユーザは、特に、一度に複数の人々が話をする場合に各人が何と言っているか決定することが困難である。
【0010】
このシステムは、異なるユーザの画像を捕獲し(例えば、ビデオカメラを経て)そして受信側ユーザは、特定ユーザの音声を向上させることができる。例えば、受信側ユーザは、この実施形態で焦点を当てようとする特定のユーザの画像をタップし(さもなければ、ユーザを選択又は指示し)、そしてこのシステムは、音声をデジタルで向上させると共に、マイクロホンをユーザに向けて、ユーザの音声入力を良好に捕獲する。1つの例において、このシステムは、ディスプレイスクリーンの周囲に離間された複数のマイクロホンを有するコンピュータを備え、そして特定のマイクロホンは、ターンオン/オフされると共に、望ましいオーディオ信号を最良に捕獲するために回転される。
【0011】
同様に、このシステムは、マイクロホンを指向し、オーディオを向上させ、及び/又は話をしている個人にビデオ画像の焦点を合わせる。口追跡又はスピーチ認識を使用して、話をしている特定のユーザにオーディオ及び/又はビデオの焦点を合わせる。これは、オーディオデータストリームを受け取るユーザが、ユーザの話(例えば、システムの送信側ユーザ)を良く聞きとれるようにする。従って、ユーザの音声又はビデオ画像の一方又は両方の向上特徴は、自動的であってもよいし(例えば、口追跡又はスピーチ認識に基づく)、或いはユーザ入力に基づくものでもよい(例えば、ユーザは、ユーザ又は焦点エリアを選択できる)。
【0012】
出力オーディオの音質は、環境に少なくとも一部分依存する。例えば、エコー打ち消しが望ましく、及び/又は部屋のサイズ及び音響によって影響を受ける。出力オーディオの音質に影響する2つのファクタは、部屋の大きさ及び反響の質を含む。1つの実施形態では、このシステムは、オーディオ出力装置に対するユーザの場所、オーディオ出力装置に対するユーザの位置(例えば、頭を正面に向けた又はそむけた)、及び環境入力(部屋のサイズ、部屋の反響、温度、等)に基づきオーディオ出力を調整するように構成される。ユーザの入力は、室内の自分の場所、オーディオ出力装置に向いているかどうか、等を含む。更に、このシステムは、ユーザ及び環境入力に基づくだけでなく、コンピュータ又はオーディオ出力装置が動作している現在アプリケーションにも基づいて、オーディオ出力を変化させる。例えば、アプリケーションが電話コールである場合には、音楽プレーヤアプリケーションと比較して応答が変化される。
【0013】
種々の実施形態において、このシステムは、ビデオ、オーディオ、及び環境センサを含む。例えば、画像センサ(例えば、カメラ)、奥行きセンサ(超音波、赤外線、高周波、等)、等が使用される。更に、望ましい出力は、コンピュータに対するユーザの場所に基づいて変化され、例えば、ユーザが広い部屋の中でコンピュータから離れている場合・対・ユーザが小さな部屋の中でコンピュータに接近している場合、に基づいて変化される。例えば、ある物体がユーザから離れて位置されてビデオに存在する場合には、特定の物体(又はユーザ)の出力オーディオは、物体が離れているかのようにユーザに音を発するように変化される。この具現化では、ユーザの全オーディオ/ビジュアル経験を向上させるために遠フィールド画像のローカルオーディオに奥行きが与えられる。
【0014】
更に別の実施形態では、このシステムは、ユーザに基づいて出力オーディオを調整するように構成される。男性、女性及び子供は、全て、異なる聴力スペクトルを有し、一般的に、女性は、男性よりも聴力が優れ、そして子供は、大人の男女より聴力が優れている。このシステムは、スピーチ又は顔認識或いは他の性別識別技術を利用して、出力オーディオを特定のユーザに基づいて変化させる。
【0015】
規範的なシステム
規範的な実施形態において、本開示は、ユーザのオーディオ経験を向上させるシステムの形態である。図1Aは、向上したオーディオを与える規範的なシステム100のブロック図である。このシステム100は、コンピュータ102又は他の電子装置及びオーディオ出力装置106、110(これは、コンピュータ102と一体的であるか、それとは個別であるか、又はその両方の組合せである)を備えている。コンピュータ102は、処理能力をもつ実質的に任意の形式の電子装置であり、ラップトップ、タブレット、スマートホン、オーディオプレーヤ、及びテレビジョンを含むが、これに限定されない。この実施形態では、コンピュータ102は、外部オーディオ出力装置110及び一体化されたオーディオ出力装置106と通信する。しかしながら、ある例において、システム100は、単一のオーディオ出力装置106、110を含んでもよいし、又は複数の他のオーディオ出力装置(例えば、サラウンドサウンド5スピーカシステム)を含んでもよいことに注意されたい。オーディオ出力装置106、110は、スピーカ、スピーカのセット、ヘッドホン、又は電子信号に応答してサウンドを発生できる他の装置である。
【0016】
オーディオ装置106、110は、コンピュータ102の上及び/又はコンピュータ102の周囲の実質的にどこにでも配置することができる。オーディオ装置106、110の形式、電力及び構造は、コンピュータ102から発生されるオーディオの音質に影響すると共に、最良のサウンドを発生するのに必要な種々のソフトウェア交換にも影響する。
【0017】
図1Bは、規範的なコンピュータ102のブロック図である。コンピュータ102は、プロセッサ118、ネットワーク/通信インターフェイス120、入力/出力インターフェイス126、ビデオ入力/出力インターフェイス128、センサ124、メモリ130、オーディオ入力/出力インターフェイス132、ビデオセンサ134、及び/又はマイクロホン136を備えている。コンピュータ102の種々のコンポーネントは、システムバス122(又は複数のシステムバス)を経て電子的に一緒に接続される。種々のコンポーネントは、いずれも、省略及び/又は結合されてもよいことに注意されたい。例えば、ビデオ入力/出力インターフェイス128は、オーディオ入力/出力インターフェイス132及び汎用入力/出力インターフェイス126の一方又は両方と結合されてもよい。更に、コンピュータ102は、図示されていない付加的なローカル又はリモートコンポーネントを含み、そして図2は、例示に過ぎない。
【0018】
プロセッサ118は、コンピュータ102及びそのコンポーネントの動作を制御する。プロセッサ118は、実質的に、受信及び/又は送信インストラクションを処理することのできる電子装置である。例えば、プロセッサ118は、マイクロプロセッサ又はマイクロコンピュータである。
【0019】
ネットワーク/通信インターフェイス120は、種々の電気信号を受信及び送信する。例えば、ネットワーク/通信インターフェイス120は、コンピュータ102をネットワークに接続して、ネットワークを経て他のコンピュータ又は電子装置との間で信号を送信及び受信するのに使用される。又、ネットワーク/通信インターフェイス120は、ワイヤレス又はワイヤード接続(インターネット、WiFi、Bluetooth(登録商標)、Ethernet(登録商標)、USB、及びFirewireを含むが、これらに限定されない)を経て電子信号を送信及び送出するのにも使用される。
【0020】
メモリ130は、コンピュータ102により使用される電子データを記憶する。例えば、メモリ130は、これに限定されないが、オーディオファイル、ビデオファイル、ドキュメントファイル、及びデータファイルを含む任意の形式のコンテンツを含む電子データを記憶する。記憶データは、コンピュータの1つ以上の種々のアプリケーション及び/又はオペレーションに対応する。メモリ130は、一般的に、これに限定されないが、不揮発性記憶装置、磁気記憶媒体、光学記憶媒体、磁気光学記憶媒体、電気的記憶媒体、リードオンリメモリ、ランダムアクセスメモリ、消去可能なプログラマブルメモリ、及びフラッシュメモリを含む任意のフォーマットである。又、メモリ130は、コンピュータ102に対してローカル位置に及び/又はそこからリモート位置に設けられてもよい。
【0021】
種々の入力/出力インターフェイス126、128、132は、入力/出力装置との間の通信を与える。例えば、オーディオ入力/出力インターフェイス132は、オーディオ装置106、110へ入力を与え、及びそこから出力を受け取る。同様に、ビデオ入力/出力インターフェイス128は、ディスプレイ装置(例えば、コンピュータモニタ、ディスプレイスクリーン又はテレビジョン)へ入力及び出力を与える。更に、汎用入力/出力インターフェイス126、128、132は、コントロールボタン、スイッチ、等から入力を受け取る。ある実施形態では、入力インターフェイスが結合されてもよい。例えば、入力/出力インターフェイス126、128、132は、(例えば、キーボード、タッチ感知面、マウス、聴覚入力又は他の装置を経て)ユーザ、コンピュータ102のコントロールボタン(例えば、電源ボタン、ボリュームボタン)、等からデータを受け取る。更に、入力/出力インターフェイス112は、例えば、ユニバーサルシリアルバス(USB)又は他のビデオ/オーディオ/データ入力のような外部装置へデータを送信し/そこからデータを受信する。
【0022】
図1Cにおいて明らかなように、ある場合には、コンピュータ102は、ネットワーク138を経て第2のコンピュータ103と通信する。更に、図1Cに示すように、ある場合には、コンピュータ102は、ネットワーク140を経て別の又は第2のコンピュータ103(又はサーバー)に接続される。例えば、コンピュータ102は、会議又はチャットアプリケーションのために第2のコンピュータ103に接続される。更に、コンピュータ102は、第2のコンピュータ103からストリーミングオーディオ及び/又はビデオを受信する。
【0023】
ネットワーク138は、第1のコンピュータ102と第2のコンピュータ103との間に電子的な通信を与える。ネットワーク138は、実質上、任意の形式の電子通信メカニズム/経路でよく、そしてワイヤレスでも、ワイヤードでも、又はそれらの組み合わせでもよい。ネットワーク138は、インターネット、イーサネット(登録商標)、ユニバーサルシリアルバス(USB)ケーブル、又は無線信号(例えば、WiFi、Bluetooth(登録商標))を含む。
【0024】
マイクロホン136は、コンピュータ102に一体化されてもよいし、又は個別に取り付けられてプロセッサ118と通信してもよい。マイクロホン136は、音響又は電気的送信器であり、オーディオ入力を受信して、そのオーディオに対応する電気的出力を発生するように構成される。複数のマイクロホン136がコンピュータ102に合体されてもよいし、さもなければ、それと通信するようにされてもよい。例えば、ある具現化において、コンピュータ102の周囲の種々の場所に配置された複数のマイクロホンのマイクロホンアレイが設けられる。
【0025】
ビデオセンサ134は、ビデオ又は画像捕獲装置(1つ又は複数)である。ビデオセンサ134は、コンピュータ102に一体化(例えば、コンピュータ102のエンクロージャーに接続)されてもよく、及び/又はコンピュータ102の外部にあってそれと通信されてもよい。ビデオセンサ134は、ビデオ会議/チャットのような種々のアプリケーションに使用されるビデオ及びスチール画像を捕獲するのに使用できるものである。
【0026】
図2は、入力から出力への規範的なオーディオ/ビデオ処理経路を示すシステム100のブロック図である。図1A、1B及び2を参照すれば、システム100は、オーディオ及びビデオ出力を向上させ調整するために種々のセンサ間で通信を行う。ビデオセンサ134は、プロセッサ118にビデオ入力を与え、雑多なセンサ124は、プロセッサ118にユーザ及び環境データを与え、そしてオーディオ入力132は、プロセッサ118に入力オーディオを与える。プロセッサ118は、種々の入力の処理と、ビデオ及びオーディオ出力の調整とを別々に又は一緒に行って、スピーカ110及び/又はディスプレイ104に与える。
【0027】
一例において、ビデオセンサ134、センサ124、及びオーディオ入力132は、ユーザ及び/又はコンピュータ102の環境(例えば、部屋、周囲)に関する画像データを与える。プロセッサ118は、次いで、スピーカ110に送られるオーディオ出力特性を向上又は変更させ、向上したオーディオ経験を与えることができる。オーディオ出力がユーザに音を発する仕方は、ユーザがオーディオ出力装置に対してどこに位置するか、及び部屋又は環境の特性に依存し、又はそれによって影響される。オーディオ特性又は設定が変更されない場合、第1の部屋に特定のサウンドを生じさせるオーディオ信号は、第2の部屋には著しく異なる音を発生させる。例えば、第1の部屋が第2の部屋より小さいか、又は第1の部屋がカーペットで第2の部屋が木製フローリングの場合に、そうである。
【0028】
それ故、ビデオ及び画像入力並びにオーディオ入力132(例えば、エコー特性、コンピュータ102に対するユーザの位置、コンピュータ102に対するユーザの方向)を受信した後に、オーディオ及びビデオ出力を、プロセッサ118により向上させることができる。これは、コンピュータ102が、ユーザ及び/又は環境を最良に受け容れるようにオーディオ及び/又はビデオを調整できるようにする。
【0029】
図2において明らかなように、プロセッサ118は、個別の処理ユニット、例えば、画像処理ユニット142、ユーザ/環境インターフェイス処理ユニット144、オーディオ処理ユニット146、及び出力処理ユニット145を備えている。これらの処理ユニット142、144、145、146は、プロセッサ118に一体化されてもよいし、個別の装置であってもよい。各処理ユニット142、144、145、146は、センサから出力を受け取り、及びセンサ入力を調整するために特定のセンサと通信することができる。例えば、オーディオ処理ユニット146は、話をしている特定のユーザにマイクロホン136を向け又は操向してユーザの音声を良好に捕獲する。同様に、画像処理ユニット142は、ビデオセンサ134を特定のユーザに焦点を合わせ又はズーミングすることができる。更に別の例では、ユーザ/インターフェイス処理ユニット144は、付加的な環境/ユーザデータを収集するように特定のセンサ124を指向する。更に、出力処理ユニット145は、オーディオ信号を後処理し(例えば、ノイズ周波数を減少し、特定の周波数を向上させ、等)、オーディオレベルのエラーを修正し、大きさを特定レベルに調整し(例えば、オーディオ信号をイコライズし)、エコー打ち消しを行い、ピークフィルタリングを行い、等々を行うための周波数フィルタを含む。
【0030】
ユーザの場所及び位置に基づくオーディオ出力の調整
図3は、ユーザ場所及び位置に基づいてオーディオ出力を調整するための規範的な方法200を示すフローチャートである。この方法200は、動作202で始まり、コンピュータ102は、ユーザ(1人又は複数)を検出する。コンピュータ102は、センサ124を使用して、動きを捕獲するか、ビデオセンサ134を使用して、画像を捕獲しそして分析する(例えば、顔認識)か、或いはオーディオセンサ132を使用してユーザによるノイズを捕獲する。
【0031】
ユーザが検出されると、方法200は、動作204へ進み、コンピュータ102は、現在のオーディオ出力設定及びスピーカ110の配置に基づきユーザが最適な範囲内にいるかどうか決定する。例えば、コンピュータ102は、種々のセンサを使用してユーザの場所を決定する。コンピュータ102は、同じセンサ及び方法を使用して、ユーザの存在を検出し、コンピュータ102及び/又はスピーカ110に対するユーザの場所を決定する。ユーザの場所の検出は、推定又は単一入力であり、例えば、コンピュータは、ユーザがコンピュータ102の真ん前にいないことを単純に検出するか、或いは検出がより詳細に行われて、コンピュータ102は、より進歩した感知技術を使用して、コンピュータ102に対するユーザのおおよその場所を決定する。
【0032】
ユーザの場所が決定されると、コンピュータ102は、ユーザの場所を現在のオーディオ出力設定と比較し、ユーザの位置に基づいてオーディオが最適な範囲内にあるかどうか決定する。一例として、ユーザがコンピュータ102から数ヤード離れて位置し、そしてユーザがスピーカ110又はコンピュータ102の真ん前にいるかのようにオーディオが出力される構成である場合には、オーディオを調整する必要がある。オーディオは、ボリュームが増加されるか、外部スピーカ110がターンオンされるか、内部スピーカ106がターンオフされるか、サラウンドサウンドが「スクリーンチャンネル」設定からサラウンドサウンドフォーマットにスイッチされるか、或いはサラウンドサウンドチャンネルが内部スピーカから外部スピーカ、並びに左サラウンドチャンネル及び右サラウンドチャンネルに再指向されるように、ユーザに対して調整される。他方、オーディオが既に調整されているか、又は距離設定で構成された場合には、オーディオは、ユーザの場所に基づいて調整される必要はない。
【0033】
ユーザの場所に最も適するようにするためオーディオを調整する必要がある場合には、方法200は、動作206へ進む。動作206は、ユーザの場所に基づいてオーディオを調整する。ユーザがコンピュータ102又はスピーカ106、110から離れて位置する場合には、コンピュータ102は、外部スピーカ110をアクチベートし、そして内部スピーカ106をターンオフする。例えば、外部スピーカ110は、サラウンドサウンドスピーカアレイの一部分を形成し、それ故、内部コンピュータスピーカ106に比して良好な「部屋」サウンド経験を与えることができる。同様に、ユーザがコンピュータ102の真ん前にいる場合には、コンピュータ102は、内部スピーカ106がアクチベートされるようにオーディオを調整する。
【0034】
更に、コンピュータ102は、これに限定されないが、ボリューム、低音、高音、周波数帯域レベルを含む種々のオーディオ設定を調整する。[[発明者−調整できる他の特性があるか?]]これは、スピーカ106、110の単一セットしかなくても、及び/又はスピーカ106、110が調整されなくても、オーディオ信号を調整できるようにする。
【0035】
オーディオがユーザの場所に基づき調整されると、又は設定されたオーディオ範囲内にユーザが既にいるために動作204においてオーディオを調整する必要がない場合には、方法200は、動作208へ進む。動作208において、この実施形態は、ユーザがコンピュータ102に向けられたかどうか決定する。これは、ユーザがコンピュータ102から離れた距離に位置する場合に、ユーザがコンピュータ102に向いているかどうか決定することが(パワフルなセンサなしに)困難であるような任意な動作である。しかしながら、他の実施形態では、ユーザがコンピュータ102に比較的接近しているか、又はシステム100が適当なセンサを含む場合に、コンピュータ102は、コンピュータ102に対するユーザの各方向を決定する。又、ある実施形態では、スピーカ106、110に対するユーザの方向を決定できることに注意されたい。これは、スピーカ106、110にセンサを含ませるか、又はコンピュータ102に対するユーザの方向を、コンピュータ102に対するスピーカ106、110の場所と比較することで、行われる。
【0036】
動作208において、コンピュータ102は、ビデオセンサ134を経てユーザの画像を捕獲し、さもなければ、それを与える。画像処理ユニット146は、ユーザの目の凝視を追跡する凝視追跡、顔認識、又は他の同様の方法を使用して、コンピュータ102に対するユーザの頭の方向を決定する。コンピュータ102に対するユーザの方向が決定されると、方法200は、動作210へ進む。
【0037】
動作210は、ユーザの新たな場所を受け容れるようにオーディオ出力装置、及び任意であるが、ユーザ入力装置を調整する。例えば、コンピュータ102は、ユーザの方向を良好に受け容れるようにスピーカ106、110及び/又はオーディオ信号を変化させる。更に、ユーザが(例えば、電話コール、ビデオチャット、口述のために)マイクロホン136を使用する場合には、コンピュータ102は、ユーザの口の方向に向けてマイクロホン136を操向する。動作210の後に、コンピュータ102は、オーディオ信号をスピーカ106、110に与える。
【0038】
ユーザ又は番組に基づく向上
他の実施形態では、システム100は、ユーザ及び番組の好みに基づきオーディオ及び/又はビデオ出力を向上させるのに使用される。図4は、オーディオ及び/又はビデオ出力を向上させるための規範的な方法300のフローチャートである。この方法300は、動作302で開始し、そしてコンピュータ102は、コンピュータ102を使用する特定ユーザを決定する。動作302は、ユーザがユーザ名及び/又はパスワードを入れる開始時に決定される。それとは別に又はそれに加えて、コンピュータ102は、例えば、デフォールトユーザ、セキュリティシステム、顔認識、等の別の仕方で、装置を使用するユーザを決定する。ユーザが決定された後、方法300は、動作304へ進み、ユーザ(又はコンピュータ102)は、特定のアプリケーションを起動する。このアプリケーションは、ビデオ会議/チャットプログラム、音楽プレーヤ、ビデオプレーヤ、等である。このアプリケーションは、オーディオ及び/又はビデオ/画像の観点を含む。
【0039】
アプリケーションが起動された後、又はアプリケーションが起動されている間に、方法300は、動作306へ進む。この動作306は、コンピュータ102、スピーカ106、110及び/又はディスプレイ装置104のオーディオ及び/又はビデオ設定が特定のアプリケーションに対して構成されたかどうか決定する。例えば、コンピュータ102、及びスピーカ106、110のオーディオ設定は、音楽を再生するように構成され、一方、起動されるアプリケーションは、ビデオ会議又は遠隔会議プログラムである。この例では、オーディオ及びスピーカ106、110は、音楽の周波数又は他の特性ではなく、ボイス周波数を良好に受け容れるように調整される。例えば、ボイス周波数は、一般的に、高く且つ大きな範囲を含む音楽周波数に比して、低く且つ小さな範囲を有する。それ故、オーディオがほとんど人々の話である場合に、オーディオは、ボイス周波数の小さな範囲を向上させるように、バンドパスフィルタを通して処理される。同様に、オーディオが音楽である場合には、オーディオは、フィルタリングされないか、又は全ての周波数範囲を出力できるようにノイズフィルタを含む。
【0040】
動作306において、オーディオ或いはビデオ設定又は出力装置(スピーカ106、110、ディスプレイ104)を調整する必要があるとコンピュータ102が決定する場合には、方法300は、動作308へ進む。この動作308は、相対的な出力信号、設定、及び/又は出力装置を、特定のアプリケーションに良好に相関させるように調整する。
【0041】
オーディオ及び/又はビデオが特定のアプリケーションに対して構成されると、方法300は、動作310へ進む。この動作310は、ユーザが以前に好みを記憶したかどうか決定する。コンピュータ102は、動作302においてコンピュータ102を使用すると決定された特定のユーザによって以前に調整された設定を記憶する。コンピュータ102は、選択アプリケーション(又は全てのアプリケーション)に対して特定のユーザにより調整された設定を自動的に記憶する。又は、ユーザは、特定アプリケーションに対して、又は一般的にはユーザがいつコンピュータ102を使用するかに対して、入力設定を能動的に調整してもよい。
【0042】
コンピュータ102がユーザの好みに関する情報を以前に記憶した場合には、方法300は、動作312へ進む。この動作312は、ユーザの特定の好みを起動する。動作312は、選択出力装置(例えば、外部スピーカ110)をアクチベートし、ボリューム、最低音、高音又は周波数レベルを調整することを含む。ユーザの好みを受け容れるように特定の装置及び設定を自動的に調整することにより、コンピュータ102は、ユーザの希望に基づいてオーディオ及び/又はビデオ出力を自動的に向上させることができる。又、ユーザの好みは、一般的にはオーディオ/ビデオ出力設定に基づき、又は特定のアプリケーションに対するものであることに注意されたい。例えば、あるユーザは、遠隔会議又はビデオ会議が著しく低いボリュームであり且つ内部スピーカ106しか使用しないことを好むが、音楽アプリケーションを利用するときには、ユーザは、ボリュームが大きく且つ外部スピーカ110及び一体化スピーカ106を使用することを好む。
【0043】
更に、ユーザの好みは、複数の個別のアプリケーションがいつ同時に起動されるかについての設定を含むことに注意されたい。複数の個別のアプリケーションは、ユーザがいつ音楽プレーヤ及びビデオチャットアプリケーションを使用するかを含み、そして各アプリケーションとは個々に異なる変更された設定を含む。
【0044】
ユーザの好みがアクチベートされるか、又は以前に記憶/セーブされたユーザの好みがないとき、方法300は、動作314へ進む。動作314は、コンピュータ102に対するユーザの距離、位置及び/又は場所を決定する。これは、図2に示す方法200と同様である。例えば、コンピュータ102は、ビデオセンサ134を使用して、ユーザの画像を捕獲し、及び/又はユーザの動きを追跡する。凝視追跡機能を使用して、ビデオ画像を処理し、ユーザの凝視方向、即ち、ユーザが見ようとしている方向を決定する。同様に、コンピュータ102は、赤外線、熱、温度、超音波、又は動きセンサのような他のセンサ124を使用して、ユーザのおおよその場所を決定する。
【0045】
コンピュータ102からユーザの位置、距離及び/又は場所が決定されると、方法300は、動作316へ進む。動作316は、コンピュータ102に対するユーザの距離、場所及び/又は位置に基づき、オーディオ及び/又はビデオ出力をいつ調整する必要があるか決定する。コンピュータ102は、ユーザの位置情報を現在オーディオ及び/又はビデオ設定と比較して、良好な出力を与えるためにオーディオ及び/又はビデオ設定及び/又は装置を調整するかどうか調べる。設定及び/又は装置情報は、特定の範囲の場所、位置及び/又は距離に対してメモリ130に記憶される。又は、設定及び装置は、フィードバックループ又は他のアクティブな調整メカニズムに基づいて動的に調整されてもよい。
【0046】
動作316において、オーディオ及び/又はビデオ出力をユーザの位置に基づいて調整すべき場合には、方法300は、動作318へ進む。この動作318は、ユーザの特定の場所及び/又はアプリケーションに対して最良の出力を与える設定を受け容れるようにオーディオ及び/又はビデオの出力を調整する。例えば、ユーザの手をコンピュータ102から離れる(ひいては、内部スピーカ106から離れる)ように回転した場合に、ユーザの位置及び距離を受け容れるようにオーディオ経験が向上されるようオーディオを調整することができる。同様に、ユーザがコンピュータ102から離れるように位置される場合には、異なる出力プロフィールを有するようにオーディオ出力を調整し、及び/又はビデオ出力表示を拡大することができる。
【0047】
オーディオ出力は、複数の異なる方法を通して調整することができる。オーディオ出力信号は、出力される前に、後処理される。例えば、オーディオは、特定の周波数を向上させ又は減少するためにフィルタリングされてもよく、異なるチャンネル信号(例えば、サラウンドサウンドチャンネル)を含んでもよく、異なる最低音又は高音を含んでもよく、等々である。同様に、オーディオが入力されるときにオーディオ調整が行われてもよい。例えば、マイクロホン136は、ビーム操向を通して入力ソースに向けられてもよく、又、マイクロホン136は、特定のユーザボイス周波数に対して高い感度を有してもよく、話をしているユーザに向けられない他のマイクロホン136又はオーディオ入力センサ132がターンオフされるか下げられてもよく、等々である。
【0048】
オーディオ及び/又はビデオ出力並びに装置が調整されると、方法300は、動作314へ戻る。方法300が動作314へ戻ると、オーディオ及び/又はビデオ出力並びに装置は、ユーザが自分の位置、場所、及び/又はコンピュータ102からの距離を変更する場合に、動的に調整される。それ故、オーディオ及び/又はビデオ出力は、ユーザが動きまわるときに自動的に調整され、ユーザに基づいて得られる最良のオーディオ及び/又はビデオ出力を与えることができる。
【0049】
動作316において、オーディオ及び/又はビデオ出力がユーザの位置に基づいて既に調整された場合には、方法300は、動作320へ進み、環境データが収集される。例えば、センサ134、ビデオセンサ134、及び/又はオーディオ入力132を使用するコンピュータ102は、コンピュータ102を取り巻く環境の特性を収集する。この環境特性は、コンピュータ102が位置する部屋/空間の推定サイズ、グローバルポジショニング情報、温度、湿度、反響の質、大きな物体までの距離、等の情報を含む。
【0050】
一例において、コンピュータ102は、(オーディオ入力/出力132、又はスピーカ106、110を経て)音を放射し、そして音及びそれにより生じるエコー(もしあれば)は、マイクロホン132及び/又は他のセンサ134により感知される。反響オーディオサウンドの感知されたエコー応答及び他の特性は、部屋のサイズ、部屋の反響性、又は他の同様の特性に関する情報を与える。
【0051】
別の例では、グローバルポジショニング情報又は信号強度分析のような情報を使用して、コンピュータ102の場所を決定することができる。この場所は、ユーザのオフィス、家、屋外の場所、等であると決定される(例えば、ユーザ、マッピング又は他の参照情報でプログラムされることにより)。
【0052】
環境データが収集されると、方法300は動作322へ進み、コンピュータ102は、オーディオ及び/又はビデオ出力が特定の環境に対してセットされるかどうか決定する。例えば、コンピュータ102の位置がユーザのオフィスであると決定された場合には、オーディオ及び/又はビデオ設定は、低いボリュームとなるように調整される。ユーザは、オフィスにいるときに比して、家では、より高いボリュームでオーディオを再生することを望む。同様に、オフィスにおける一般的な部屋のサイズは、ユーザの家でオーディオを再生するためにコンピュータ102が使用される場合より小さい(例えば、ユーザの特定のオフィス)。更に、ある場合に、コンピュータ102の場所に基づき、オーディオ及び/又はビデオは、例えば、オフィス又は教室では、ミュートされるか又は再生が防止される。
【0053】
別の例では、スピーカ106、110のオーディオ出力設定は、コンピュータ102の部屋の反響の質又はサイズを考慮するように調整することが必要である。これは、エコーを除去し、反響し得る周波数を減少するためのオーディオのフィルタリング、又はオーディオの他の後処理を含む。同様に、室内の周囲光の量、例えば、ディスプレイスクリーン又はビデオ信号の輝度の増減に基づいてビデオの画質を調整する必要がある。
【0054】
動作322において、特定の環境に対してオーディオ及び/又はビデオ設定を調整する必要があるとコンピュータ102が決定する場合には、この方法は、動作324へ進む。動作324において、コンピュータは、スピーカ106、110及び/又はディスプレイスクリーン104から、考えられる最良のサウンド及び/又は画像を出力するように当該設定を調整する。動作324は、特定の設定(例えば、輝度、コントラスト、高音、最低音、ボリューム)を増加/減少すること、出力信号を特定の仕方で変化させること(例えば、ある周波数を減少し又は向上させるために信号をフィルタリングすること)、出力信号を別の信号と合成すること、或いはオーディオ又はビデオの一方又は両方の出力を調整する他の形式のメカニズムを伴う。
【0055】
オーディオ及び/又はビデオが調整されると、方法300は、動作320に戻る。このように、コンピュータ102は、オーディオ及び/又はビデオの調整と調整との間に環境の状態が変化した場合に環境データを収集し続ける。同様に、動作320へ戻ることにより、変更されたオーディオ及び/又はビデオ設定は、特定の環境に対して充分であることが検証される。これは、設定を調整して再テスト(及び必要に応じて再調整)できるようなフィードバックループを与える。
【0056】
動作322の後に、特定の環境に対してオーディオ及び/又はビデオ設定が充分であるとコンピュータ102が決定する場合には、方法300は、動作326へ進む。コンピュータ102は、出力装置(例えば、テレビジョン、又はスピーカ106、110)へオーディオ及び/又はビデオを提示又は転送する。
【0057】
コンピュータ102がオーディオ及び/又はビデオを提示するとき、方法300は動作328へ続く。この動作328において、コンピュータ102は、動きが検出されるかどうか監視する(センサ134を経て)。例えば、センサ134は、ユーザが自分の位置を変化させる場合に追跡する動き検出器又は他の移動感知装置を含む。同様に、センサ134は、ユーザがコンピュータ102を持ち運ぶか又は移動するかをコンピュータ102が決定するように、コンピュータ102が移動するかどうかを決定する加速度計も含む。
【0058】
動作328において、動きが検出されない場合には、方法300は動作326へ戻る。しかしながら、動作328において、動きが検出された場合には、方法300は動作314へ戻る。それ故、オーディオ及び/又はビデオが提示されている間にユーザ及び/又はコンピュータ102が移動する場合には、コンピュータ102は、オーディオ及び/又はビデオ設定が、更新された環境及びユーザの位置に対して充分にセットされたかどうか更に決定する。それ故、コンピュータ102は、オーディオ及びビデオ再生の設定を動的に調整することができる。これは、コンピュータ102がオーディオ及び/又はビデオを調整し続けて、オーディオ及び/又はビデオを最良の(又は望ましい)設定で提示できるようにする。
【0059】
ビデオ会議
他の例では、システム100は、エンハンス(向上)型で且つユーザ調整可能なビデオ会議システムを提供するのに使用される。図5Aは、複数人ビデオ会議を表示するコンピュータ102の一例である。明らかなように、ディスプレイ104は、個人A、個人B、個人C、及び個人Dの画像を含む。個人は、より多くても少なくてもよく、又、システムは、人を伴わずに(例えば、監視システムとして)使用されてもよいことに注意されたい。図5Bは、各個人A−Dの位置に対するコンピュータ102の上面図である。図5Bに示すように、各個人A−Dは、コンピュータ102に対して異なる場所に位置する。
【0060】
各個人A−Dは、異なる場所に且つコンピュータ102から変化する距離に位置するので、図5Aのコンピュータ102における各個人A−Dの表示も、同様に、個人A−Dを、彼等が実際にそうであるように、即ち異なる場所に表示する。更に、マイクロホン136も、個人A−Dのボイス及び他のサウンドを、コンピュータ102に対する個人の位置に基づいてピックアップする。それ故、個人A及びBは、図5Aの個人Cに比して小さく示され、そして個人A及びBからのサウンドも、一般的に、個人Cからのサウンドより静かなものとして出力される。しかしながら、ある場合には、ビデオ会議を見ているユーザは、個人A及びBをより良好に又は大きく聞き及び/又は見ることを希望する。例えば、個人A及びBが瞬間的に話をし、そしてユーザは、出力サウンドを彼等のボイスに焦点を当てることを希望する。
【0061】
図5Cは、個人A及びBのオーディオ及びビデオを向上させた図5Aのコンピュータ102を示す。図5Cにおいて明らかなように、個人A及びBの画像が拡大され、個人Cの画像とほぼ等しいサイズにされている。同様に、図5Cには示されていないが、各個人A及びBからのオーディオも向上される。更に、個人A及び個人Bを更に大きく向上させるために、非向上の個人C及びDを最小にし又は隠してもよい。又は、個人C及びDをほぼ同じままとし、個人A及びBが個人C及びDとほぼ同じサイズになるようにしてもよい。更に、個人A及び個人Bの向上は、彼等の画像だけでなく、他の設定も含んでもよい。例えば、各個人が個別のチャットウインドウにある場合には、話をしている個人(例えば、個人A又は個人B)のウインドウが向上され、例えば、チャットウインドウがカラーを変化させ、境界を含み、又は境界を変更し、ウインドウが拡大され、ディスプレイの前方へ引っ張られ、等々である。
【0062】
図6は、図5A−5Cに示すビデオ会議セッション中に特定の個人のオーディオ及び/又はビデオを向上させるための規範的方法を示すフローチャートである。この方法400は、動作402で始まり、コンピュータ102は、特定のビデオ会議セッションに関連した複数のユーザ又は人がいるかどうか決定する。コンピュータ102は、ユーザが人数を入力できるようにするためのオプションをユーザに提示し、又はコンピュータ102は、顔認識、音声認識、全会議セッション又はディスプレイコンピュータ、等によりユーザの数を決定する。ビデオ会議セッションに参加している個人又はユーザは、個別(例えば、各々が個別のコンピュータ)であるか、集合的(例えば、コンピュータ当たり複数のユーザ)であるか、又は個別及び集合的の組合せ(例えば、あるユーザは個別、あるユーザは集合的)であるか決定されることに注意されたい。
【0063】
一例において、図5A−5Cに示すように、コンピュータ102は、4人の個人(個人A−D)がいるが、各個人A−Dは、単一のコンピュータ102の前にいることを決定する。コンピュータ102は、顔認識、音声認識、及び他の種々のセンサを使用して、コンピュータ102の前にいる個人の人数を決定する。しかしながら、他の場合には、個人A−Dの各々が個別のコンピュータの前にいるが、コンピュータ102のディスプレイ上で一緒にグループ編成され、ビデオ会議の単一インターフェイスを提示することができる。
【0064】
方法200は、ユーザの人数を決定すると、動作404へ進む。この動作404は、話をしているユーザがもしいれば、どのユーザ(ユーザの人数のうちの)であるか決定する。コンピュータ102は、ユーザが話をしているかどうか、音声認識、オーディオセンサ、画像データ、等で決定する。話をしているユーザが決定されると、方法400は、動作406へ進み、コンピュータ102は、オーディオ入力センサ(マイクロホン)のようなセンサを、話をしているユーザへ向け又は操向する。例えば、オーディオ入力センサが、話をしているユーザに向けて回転されるか、又は指向性マイクロホンが、話をしているユーザに向けてアクチベートされ又は操向される。
【0065】
オーディオ入力センサが、話をしているユーザへ操向されるか、又は向けられた後に、方法400は、動作408へ進む。この動作408は、ユーザ(又はコンピュータ102)が、話をしているユーザに焦点を合わせるために出力ビデオを向上させることを望むかどうか決定する。例えば、話をしているユーザが決定された後、コンピュータ102は、話をしているユーザのビデオ画像に焦点を合わせたいかどうかについてのオプションを、見ているユーザに提示する。或いは又、コンピュータ102は、話をしているユーザの出力を自動的に向上させてもよく、これは、ビデオ会議アプリケーションの設定である。
【0066】
動作408において、話をしているユーザのビデオ出力を向上させるべき場合に、方法400は、動作410へ進み、そして話をしているユーザにズームインするか又は焦点を合わせるようにビデオ出力及び/又はビデオ入力(例えば、ビデオセンサ134)を向上させることができる。例えば、図5Cに示すように、個人A及びBが個人Cよりスクリーンに接近して見えるように、個人A及び個人Bの出力ビデオを向上させることができる。
【0067】
動作410の後に、又は動作408において、話をしているユーザに出力ビデオの焦点が合わせられない場合には、方法400は、動作412へ進む。この動作412は、話をしているユーザがディスプレイ104の中央部からオフセットして位置しているかどうか決定する。例えば、コンピュータ102は、顔認識、音声認識、等を使用して、話をしているユーザがディスプレイ104上のどこに位置するか決定する。例えば、コンピュータ102は、個人Aが話をしていること、及びその個人がディスプレイ104においてスクリーンの右側に表示されることを決定する。しかしながら、動作412において、個人Cが話をしているユーザである場合には、コンピュータ102は、話をしているユーザが実質的にディスプレイ104の中央部に位置することを決定する。
【0068】
動作412において、話をしているユーザがディスプレイ104の中央部からオフセットして位置している場合には、方法400は、動作414へ進む。この動作414は、話をしているユーザの音声が、話をしているユーザが表示されるディスプレイ104の側部に向けて傾くようにビデオ会議のオーディオ出力を向上させる。例えば、図5Cに示す構成では、オーディオ出力装置106、110は、話をしているユーザの場所、即ちディスプレイスクリーン104の右側から到来するようにオーディオサウンドを生じさせるようセットされる。このように、視聴し/見ているユーザは、話をしているユーザが表示された場所からそのユーザの音声を聞くことができる。
【0069】
場所を伴う対応オーディオ
他の実施形態では、システム100は、ビデオ会議ウインドウ又はインスタンスの場所に基づいてオーディオ出力を変更するように構成される。図7Aは、インスタントメッセージング、ボイス又はビデオチャットプログラムの実行を伴うコンピュータ102を示す。例えば、コンピュータ102は、アップル社によるiCHAT又はFacetimeのようなプログラムを実行する。ディスプレイは、複数のチャットインスタンス430、432、434、436を含み、各ウインドウは、それ自身のオーディオ、各々、オーディオA、オーディオB、オーディオC、及びオーディオDを含む。更に、各チャットインスタンスは、ビデオ画像又は写真のような対応画像を含む。
【0070】
図8は、チャットインスタンスの場所に対応する場所から発生するかのように音を発する出力として特定チャットインスタンスのオーディオを指向するための規範的な方法500を示すフローチャートである。この方法500は、動作502で始まり、コンピュータ102は、2つ以上のチャットインスタンスがあるかどうか決定する。例えば、コンピュータ102は、異なるチャットインスタンスに対応する複数のオーディオインスタンスがあるかどうか決定する。2つ以上のオーディオインスタンスもチャットインスタンスもない場合には、方法500は、動作512へ進み、これについては、以下に詳細に述べる。
【0071】
動作502において、2つ以上のオーディオインスタンス又はチャットインスタンスがある場合には、方法500は、動作504へ進む。この動作504は、チャットインスタンスがディスプレイ104上の異なる場所に配置されるかどうか決定する。例えば、チャットインスタンスは、互いに上にオーバーレイされ、最小化され、又は(図7Aに示すように)ディスプレイスクリーン104上の種々の場所に分散されてもよい。動作504において、チャットインスタンスがディスプレイ104上の異なる位置に配置されたとコンピュータ102が決定した場合には、方法500は、動作506へ進む。
【0072】
動作506は、ユーザが話をしていること、又はどのインスタンスがオーディオ出力を有するか決定する。例えば、コンピュータ102は、オーディオA、オーディオB、オーディオC、又はオーディオDが現在サウンドを発生しているかどうか決定し、これは、ユーザが話をしているか、さもなければ、視聴ユーザへ伝達するサウンドを発しているかどうかに相関している。動作506で、現在出力を有するオーディオが決定されると、方法500は、動作508へ進む。この動作508は、出力オーディオの場所を決定し、即ちどのチャットインスタンス(及びその場所)が各オーディオに相関するか決定する。例えば、オーディオAが現在出力を有する場合には、コンピュータ102は、チャットインスタンス430の場所(ディスプレイ104に対する)を決定する。
【0073】
動作508の後、方法500は、動作510へ進み、コンピュータ102は、スピーカ106、110又は他の出力装置からのオーディオ出力を、チャットインスタンスの場所から出るように(又は出るよう見えるように)変更する。例えば、図7Aに示すように、オーディオAが出力を有する場合には、スピーカ110は、オーディオAのオーディオがチャットインスタンスのエリアから指向されて見えるように変更される。図7Bは、チャットインスタンス430、432、434、436に各々対応するオーディオA−Dのオーディオ方向を示す。図7Bにおいて明らかなように、オーディオは、ディスプレイ104上のチャットインスタンスの場所に相関する仕方でユーザに向けられる。これは、ユーザが、オーディオA−Dからのいずれのオーディオも、それらがチャットインスタンスの場所から出力されたかのように聞こえるようにする。これは、ビデオ会議又はビデオチャットアプリケーションにおいてユーザにより現実的なチャット経験を与える。更に、指向性オーディオも、チャットセッション中にユーザのオーディオ経験を向上させる。
【0074】
動作510の後、又は動作504の後、方法500は、動作512へ進む。動作512は、現在オーディオが終了したかどうか、例えば、特定の個人が話し終えたかどうか決定する。コンピュータ102は、チャットがビデオ映像を含む場合には顔認識によってこれを決定するか、或いはオーディオ処理、スピーチ認識、又は他の処理技術によって行う。特定チャットインスタンスのオーディオが終了しない場合には、方法500は、動作514へ進み、コンピュータ102は、選択時間中、待機又は休止となる。他方、選択されたチャットインスタンスのオーディオが終了した場合には、方法500は、動作516へ進む。この動作516は、チャットインスタンスの1つに対しアクティブな新たなオーディオがあるかどうか決定する。新たなオーディオがある場合には、方法500は動作504へ戻る。しかしながら、別のオーディオがない場合には、方法500は終了となる。
【0075】
結論
以上の説明は、広く適用することができる。実施形態の説明は、単なる例示に過ぎず、請求項を含む本開示の範囲がこれらの例に限定されることを示唆するものではない。
【符号の説明】
【0076】
100:システム
102:コンピュータ
106、110:オーディオ出力装置
118:プロセッサ
120:ネットワーク/通信インターフェイス
122:システムバス
124:センサ
126:入力/出力インターフェイス
128:ビデオ入力/出力インターフェイス
130:メモリ
132:オーディオ入力/出力インターフェイス
134:ビデオセンサ
136:マイクロホン
138:ネットワーク
142:画像処理ユニット
144:ユーザ/環境インターフェイス処理ユニット
145:出力処理ユニット
146:オーディオ処理ユニット
【技術分野】
【0001】
本発明は、一般的に、電子装置に係り、より詳細には、電子装置のオーディオ出力に係る。
【背景技術】
【0002】
コンピュータ、移動電話、オーディオプレーヤ、ラップトップ、タブレットコンピュータ、テレビジョン、等の電子装置(以下「電子装置」)は、典型的に、一体化されたオーディオ出力装置(例えば、スピーカ)を有するか、又はオーディオ出力装置と通信できるようにされる。更に、多くの電子装置は、ビジュアル又はビデオ出力装置も備え、或いはビデオディスプレイ装置と通信する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
多くのオーディオ/ビジュアル出力装置は、環境、周囲、状況、番組及び/又は環境に対しオーディオ出力を調整できる場合には、改良されたオーディオ又はビデオ出力を得ることができる。しかしながら、多くのオーディオ及びビデオ出力装置は、特定出力を変化させるためにユーザ入力又は相互作用を必要とするか、或いは可変出力設定を有していない。これらの場合には、オーディオ及び/又はビデオ出力が、特定の環境、番組、状況、等に対し最良品質の音響又は画像を形成し又は出力することができない。
【課題を解決するための手段】
【0004】
本開示の一例は、コンピューティング装置からオーディオを出力するための方法の形態をとる。この方法は、センサによってユーザを検出することを含む。ユーザが検出されると、プロセスは、ユーザがオーディオ出力装置の現在オーディオ出力に対して最適な範囲であるかどうか決定する。ユーザが最適な範囲内でない場合には、プロセッサがオーディオ出力を変更する。更に、センサは、ユーザがコンピューティング装置を向いているかどうかも決定する。ユーザの向きに基づき、プロセッサは、オーディオ装置を調整する。
【0005】
本開示の他の例は、コンピュータのオーディオを向上(エンハンス)させるための方法の形態をとる。この方法は、コンピュータに対するユーザの位置をセンサにより決定することを含む。ユーザの位置が決定されると、センサは、コンピュータの環境に対応する環境データを収集する。次いで、プロセッサは、環境データのオーディオビジュアル設定ビュー及びユーザの位置を調整する。
【0006】
本開示の更に別の例は、コンピュータ及び出力装置を備えた、オーディオを向上させるシステムの形態をとる。コンピュータは、コンピュータに対するユーザの位置を決定するように構成されたセンサを備えている。又、センサは、コンピュータの環境に対応する環境データを収集するようにも構成される。又、コンピュータは、センサと通信するプロセッサであって、ユーザの位置及び環境データを処理しそしてオーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサも備えている。出力装置は、プロセッサと通信し、そしてオーディオ出力又はビデオ出力の少なくとも一方を出力するように構成される。
【図面の簡単な説明】
【0007】
【図1A】オーディオ出力を向上させるシステムを示す図である。
【図1B】図1Aのシステムのコンピュータのブロック図である。
【図1C】コンピュータがネットワークを経て第2のコンピュータと通信するところを示す図である。
【図2】選択オーディオ及びビデオ処理経路が示された図1Aのシステムのブロック図である。
【図3】ユーザ場所及び位置に基づいてオーディオ出力を調整するための規範的な方法を示すフローチャートである。
【図4】オーディオ及び/又はビデオ出力を向上させるための規範的な方法を示すフローチャートである。
【図5A】複数の人のビデオ会議を表示するコンピュータの図である。
【図5B】図5Aのコンピュータに表示されたユーザを第2のコンピュータで捕獲したところを示す上面図である。
【図5C】個人A及び個人Bのオーディオ及びビデオが向上された図5Aのコンピュータを示す図である。
【図6】図5A−5Cに示すビデオ会議セッション中に特定の個人のオーディオ及び/又はビデオを向上されための規範的な方法を示すフローチャートである。
【図7A】インスタントメッセージング、ボイス、又は複数のインスタンスを実行及び表示するビデオチャットプログラムを伴うコンピュータの図である。
【図7B】図7Aの複数のオーディオ/ビデオインスタンスに対応するオーディオA、B、C、Dに対するオーディオ方向の図である。
【図8】特定のオーディオ/ビデオインスタンスのオーディオを指向するための規範的な方法を示すフローチャートである。
【発明を実施するための形態】
【0008】
概略
ここに述べる幾つかの実施形態では、この開示は、電子装置からのオーディオ出力を、1つ以上の基準、例えば、アクティブなアプリケーション、ユーザ相互作用、及び環境パラメータに基づいて向上させるための方法の形態をとる。又、この方法は、(もしあっても)著しいアクティブなユーザ相互作用を伴わずにユーザ入力を与えることを含む。換言すれば、このシステムは、ユーザがユーザ入力を物理的に又は故意にシステムに入力する必要がないように、ユーザ入力を補間するのにセンサ及び画像形成装置に依存する。これは、ユーザから直接アクティブな入力を要求せずにオーディオ出力を向上させるように、オーディオ出力装置が異なるユーザパラメータに対して動的に調整を行えるようにする。
【0009】
1つの実施形態において、このシステムは、ビデオ会議又はチャットに対しオーディオ出力を向上させることができる。あるユーザは、ビデオ会議を使用して、人々のグループと会話をすることができる。例えば、旅行中の親が、子供や配偶者を含む全家族とビデオ会議をすることができる。人々のグループでは、ある人々は、コンピュータの近くに又はコンピュータから離れて位置してもよい。更に、一度に複数の異なる人々が話をしてもよい。ビデオ会議の間に、受信端のユーザは、特に、一度に複数の人々が話をする場合に各人が何と言っているか決定することが困難である。
【0010】
このシステムは、異なるユーザの画像を捕獲し(例えば、ビデオカメラを経て)そして受信側ユーザは、特定ユーザの音声を向上させることができる。例えば、受信側ユーザは、この実施形態で焦点を当てようとする特定のユーザの画像をタップし(さもなければ、ユーザを選択又は指示し)、そしてこのシステムは、音声をデジタルで向上させると共に、マイクロホンをユーザに向けて、ユーザの音声入力を良好に捕獲する。1つの例において、このシステムは、ディスプレイスクリーンの周囲に離間された複数のマイクロホンを有するコンピュータを備え、そして特定のマイクロホンは、ターンオン/オフされると共に、望ましいオーディオ信号を最良に捕獲するために回転される。
【0011】
同様に、このシステムは、マイクロホンを指向し、オーディオを向上させ、及び/又は話をしている個人にビデオ画像の焦点を合わせる。口追跡又はスピーチ認識を使用して、話をしている特定のユーザにオーディオ及び/又はビデオの焦点を合わせる。これは、オーディオデータストリームを受け取るユーザが、ユーザの話(例えば、システムの送信側ユーザ)を良く聞きとれるようにする。従って、ユーザの音声又はビデオ画像の一方又は両方の向上特徴は、自動的であってもよいし(例えば、口追跡又はスピーチ認識に基づく)、或いはユーザ入力に基づくものでもよい(例えば、ユーザは、ユーザ又は焦点エリアを選択できる)。
【0012】
出力オーディオの音質は、環境に少なくとも一部分依存する。例えば、エコー打ち消しが望ましく、及び/又は部屋のサイズ及び音響によって影響を受ける。出力オーディオの音質に影響する2つのファクタは、部屋の大きさ及び反響の質を含む。1つの実施形態では、このシステムは、オーディオ出力装置に対するユーザの場所、オーディオ出力装置に対するユーザの位置(例えば、頭を正面に向けた又はそむけた)、及び環境入力(部屋のサイズ、部屋の反響、温度、等)に基づきオーディオ出力を調整するように構成される。ユーザの入力は、室内の自分の場所、オーディオ出力装置に向いているかどうか、等を含む。更に、このシステムは、ユーザ及び環境入力に基づくだけでなく、コンピュータ又はオーディオ出力装置が動作している現在アプリケーションにも基づいて、オーディオ出力を変化させる。例えば、アプリケーションが電話コールである場合には、音楽プレーヤアプリケーションと比較して応答が変化される。
【0013】
種々の実施形態において、このシステムは、ビデオ、オーディオ、及び環境センサを含む。例えば、画像センサ(例えば、カメラ)、奥行きセンサ(超音波、赤外線、高周波、等)、等が使用される。更に、望ましい出力は、コンピュータに対するユーザの場所に基づいて変化され、例えば、ユーザが広い部屋の中でコンピュータから離れている場合・対・ユーザが小さな部屋の中でコンピュータに接近している場合、に基づいて変化される。例えば、ある物体がユーザから離れて位置されてビデオに存在する場合には、特定の物体(又はユーザ)の出力オーディオは、物体が離れているかのようにユーザに音を発するように変化される。この具現化では、ユーザの全オーディオ/ビジュアル経験を向上させるために遠フィールド画像のローカルオーディオに奥行きが与えられる。
【0014】
更に別の実施形態では、このシステムは、ユーザに基づいて出力オーディオを調整するように構成される。男性、女性及び子供は、全て、異なる聴力スペクトルを有し、一般的に、女性は、男性よりも聴力が優れ、そして子供は、大人の男女より聴力が優れている。このシステムは、スピーチ又は顔認識或いは他の性別識別技術を利用して、出力オーディオを特定のユーザに基づいて変化させる。
【0015】
規範的なシステム
規範的な実施形態において、本開示は、ユーザのオーディオ経験を向上させるシステムの形態である。図1Aは、向上したオーディオを与える規範的なシステム100のブロック図である。このシステム100は、コンピュータ102又は他の電子装置及びオーディオ出力装置106、110(これは、コンピュータ102と一体的であるか、それとは個別であるか、又はその両方の組合せである)を備えている。コンピュータ102は、処理能力をもつ実質的に任意の形式の電子装置であり、ラップトップ、タブレット、スマートホン、オーディオプレーヤ、及びテレビジョンを含むが、これに限定されない。この実施形態では、コンピュータ102は、外部オーディオ出力装置110及び一体化されたオーディオ出力装置106と通信する。しかしながら、ある例において、システム100は、単一のオーディオ出力装置106、110を含んでもよいし、又は複数の他のオーディオ出力装置(例えば、サラウンドサウンド5スピーカシステム)を含んでもよいことに注意されたい。オーディオ出力装置106、110は、スピーカ、スピーカのセット、ヘッドホン、又は電子信号に応答してサウンドを発生できる他の装置である。
【0016】
オーディオ装置106、110は、コンピュータ102の上及び/又はコンピュータ102の周囲の実質的にどこにでも配置することができる。オーディオ装置106、110の形式、電力及び構造は、コンピュータ102から発生されるオーディオの音質に影響すると共に、最良のサウンドを発生するのに必要な種々のソフトウェア交換にも影響する。
【0017】
図1Bは、規範的なコンピュータ102のブロック図である。コンピュータ102は、プロセッサ118、ネットワーク/通信インターフェイス120、入力/出力インターフェイス126、ビデオ入力/出力インターフェイス128、センサ124、メモリ130、オーディオ入力/出力インターフェイス132、ビデオセンサ134、及び/又はマイクロホン136を備えている。コンピュータ102の種々のコンポーネントは、システムバス122(又は複数のシステムバス)を経て電子的に一緒に接続される。種々のコンポーネントは、いずれも、省略及び/又は結合されてもよいことに注意されたい。例えば、ビデオ入力/出力インターフェイス128は、オーディオ入力/出力インターフェイス132及び汎用入力/出力インターフェイス126の一方又は両方と結合されてもよい。更に、コンピュータ102は、図示されていない付加的なローカル又はリモートコンポーネントを含み、そして図2は、例示に過ぎない。
【0018】
プロセッサ118は、コンピュータ102及びそのコンポーネントの動作を制御する。プロセッサ118は、実質的に、受信及び/又は送信インストラクションを処理することのできる電子装置である。例えば、プロセッサ118は、マイクロプロセッサ又はマイクロコンピュータである。
【0019】
ネットワーク/通信インターフェイス120は、種々の電気信号を受信及び送信する。例えば、ネットワーク/通信インターフェイス120は、コンピュータ102をネットワークに接続して、ネットワークを経て他のコンピュータ又は電子装置との間で信号を送信及び受信するのに使用される。又、ネットワーク/通信インターフェイス120は、ワイヤレス又はワイヤード接続(インターネット、WiFi、Bluetooth(登録商標)、Ethernet(登録商標)、USB、及びFirewireを含むが、これらに限定されない)を経て電子信号を送信及び送出するのにも使用される。
【0020】
メモリ130は、コンピュータ102により使用される電子データを記憶する。例えば、メモリ130は、これに限定されないが、オーディオファイル、ビデオファイル、ドキュメントファイル、及びデータファイルを含む任意の形式のコンテンツを含む電子データを記憶する。記憶データは、コンピュータの1つ以上の種々のアプリケーション及び/又はオペレーションに対応する。メモリ130は、一般的に、これに限定されないが、不揮発性記憶装置、磁気記憶媒体、光学記憶媒体、磁気光学記憶媒体、電気的記憶媒体、リードオンリメモリ、ランダムアクセスメモリ、消去可能なプログラマブルメモリ、及びフラッシュメモリを含む任意のフォーマットである。又、メモリ130は、コンピュータ102に対してローカル位置に及び/又はそこからリモート位置に設けられてもよい。
【0021】
種々の入力/出力インターフェイス126、128、132は、入力/出力装置との間の通信を与える。例えば、オーディオ入力/出力インターフェイス132は、オーディオ装置106、110へ入力を与え、及びそこから出力を受け取る。同様に、ビデオ入力/出力インターフェイス128は、ディスプレイ装置(例えば、コンピュータモニタ、ディスプレイスクリーン又はテレビジョン)へ入力及び出力を与える。更に、汎用入力/出力インターフェイス126、128、132は、コントロールボタン、スイッチ、等から入力を受け取る。ある実施形態では、入力インターフェイスが結合されてもよい。例えば、入力/出力インターフェイス126、128、132は、(例えば、キーボード、タッチ感知面、マウス、聴覚入力又は他の装置を経て)ユーザ、コンピュータ102のコントロールボタン(例えば、電源ボタン、ボリュームボタン)、等からデータを受け取る。更に、入力/出力インターフェイス112は、例えば、ユニバーサルシリアルバス(USB)又は他のビデオ/オーディオ/データ入力のような外部装置へデータを送信し/そこからデータを受信する。
【0022】
図1Cにおいて明らかなように、ある場合には、コンピュータ102は、ネットワーク138を経て第2のコンピュータ103と通信する。更に、図1Cに示すように、ある場合には、コンピュータ102は、ネットワーク140を経て別の又は第2のコンピュータ103(又はサーバー)に接続される。例えば、コンピュータ102は、会議又はチャットアプリケーションのために第2のコンピュータ103に接続される。更に、コンピュータ102は、第2のコンピュータ103からストリーミングオーディオ及び/又はビデオを受信する。
【0023】
ネットワーク138は、第1のコンピュータ102と第2のコンピュータ103との間に電子的な通信を与える。ネットワーク138は、実質上、任意の形式の電子通信メカニズム/経路でよく、そしてワイヤレスでも、ワイヤードでも、又はそれらの組み合わせでもよい。ネットワーク138は、インターネット、イーサネット(登録商標)、ユニバーサルシリアルバス(USB)ケーブル、又は無線信号(例えば、WiFi、Bluetooth(登録商標))を含む。
【0024】
マイクロホン136は、コンピュータ102に一体化されてもよいし、又は個別に取り付けられてプロセッサ118と通信してもよい。マイクロホン136は、音響又は電気的送信器であり、オーディオ入力を受信して、そのオーディオに対応する電気的出力を発生するように構成される。複数のマイクロホン136がコンピュータ102に合体されてもよいし、さもなければ、それと通信するようにされてもよい。例えば、ある具現化において、コンピュータ102の周囲の種々の場所に配置された複数のマイクロホンのマイクロホンアレイが設けられる。
【0025】
ビデオセンサ134は、ビデオ又は画像捕獲装置(1つ又は複数)である。ビデオセンサ134は、コンピュータ102に一体化(例えば、コンピュータ102のエンクロージャーに接続)されてもよく、及び/又はコンピュータ102の外部にあってそれと通信されてもよい。ビデオセンサ134は、ビデオ会議/チャットのような種々のアプリケーションに使用されるビデオ及びスチール画像を捕獲するのに使用できるものである。
【0026】
図2は、入力から出力への規範的なオーディオ/ビデオ処理経路を示すシステム100のブロック図である。図1A、1B及び2を参照すれば、システム100は、オーディオ及びビデオ出力を向上させ調整するために種々のセンサ間で通信を行う。ビデオセンサ134は、プロセッサ118にビデオ入力を与え、雑多なセンサ124は、プロセッサ118にユーザ及び環境データを与え、そしてオーディオ入力132は、プロセッサ118に入力オーディオを与える。プロセッサ118は、種々の入力の処理と、ビデオ及びオーディオ出力の調整とを別々に又は一緒に行って、スピーカ110及び/又はディスプレイ104に与える。
【0027】
一例において、ビデオセンサ134、センサ124、及びオーディオ入力132は、ユーザ及び/又はコンピュータ102の環境(例えば、部屋、周囲)に関する画像データを与える。プロセッサ118は、次いで、スピーカ110に送られるオーディオ出力特性を向上又は変更させ、向上したオーディオ経験を与えることができる。オーディオ出力がユーザに音を発する仕方は、ユーザがオーディオ出力装置に対してどこに位置するか、及び部屋又は環境の特性に依存し、又はそれによって影響される。オーディオ特性又は設定が変更されない場合、第1の部屋に特定のサウンドを生じさせるオーディオ信号は、第2の部屋には著しく異なる音を発生させる。例えば、第1の部屋が第2の部屋より小さいか、又は第1の部屋がカーペットで第2の部屋が木製フローリングの場合に、そうである。
【0028】
それ故、ビデオ及び画像入力並びにオーディオ入力132(例えば、エコー特性、コンピュータ102に対するユーザの位置、コンピュータ102に対するユーザの方向)を受信した後に、オーディオ及びビデオ出力を、プロセッサ118により向上させることができる。これは、コンピュータ102が、ユーザ及び/又は環境を最良に受け容れるようにオーディオ及び/又はビデオを調整できるようにする。
【0029】
図2において明らかなように、プロセッサ118は、個別の処理ユニット、例えば、画像処理ユニット142、ユーザ/環境インターフェイス処理ユニット144、オーディオ処理ユニット146、及び出力処理ユニット145を備えている。これらの処理ユニット142、144、145、146は、プロセッサ118に一体化されてもよいし、個別の装置であってもよい。各処理ユニット142、144、145、146は、センサから出力を受け取り、及びセンサ入力を調整するために特定のセンサと通信することができる。例えば、オーディオ処理ユニット146は、話をしている特定のユーザにマイクロホン136を向け又は操向してユーザの音声を良好に捕獲する。同様に、画像処理ユニット142は、ビデオセンサ134を特定のユーザに焦点を合わせ又はズーミングすることができる。更に別の例では、ユーザ/インターフェイス処理ユニット144は、付加的な環境/ユーザデータを収集するように特定のセンサ124を指向する。更に、出力処理ユニット145は、オーディオ信号を後処理し(例えば、ノイズ周波数を減少し、特定の周波数を向上させ、等)、オーディオレベルのエラーを修正し、大きさを特定レベルに調整し(例えば、オーディオ信号をイコライズし)、エコー打ち消しを行い、ピークフィルタリングを行い、等々を行うための周波数フィルタを含む。
【0030】
ユーザの場所及び位置に基づくオーディオ出力の調整
図3は、ユーザ場所及び位置に基づいてオーディオ出力を調整するための規範的な方法200を示すフローチャートである。この方法200は、動作202で始まり、コンピュータ102は、ユーザ(1人又は複数)を検出する。コンピュータ102は、センサ124を使用して、動きを捕獲するか、ビデオセンサ134を使用して、画像を捕獲しそして分析する(例えば、顔認識)か、或いはオーディオセンサ132を使用してユーザによるノイズを捕獲する。
【0031】
ユーザが検出されると、方法200は、動作204へ進み、コンピュータ102は、現在のオーディオ出力設定及びスピーカ110の配置に基づきユーザが最適な範囲内にいるかどうか決定する。例えば、コンピュータ102は、種々のセンサを使用してユーザの場所を決定する。コンピュータ102は、同じセンサ及び方法を使用して、ユーザの存在を検出し、コンピュータ102及び/又はスピーカ110に対するユーザの場所を決定する。ユーザの場所の検出は、推定又は単一入力であり、例えば、コンピュータは、ユーザがコンピュータ102の真ん前にいないことを単純に検出するか、或いは検出がより詳細に行われて、コンピュータ102は、より進歩した感知技術を使用して、コンピュータ102に対するユーザのおおよその場所を決定する。
【0032】
ユーザの場所が決定されると、コンピュータ102は、ユーザの場所を現在のオーディオ出力設定と比較し、ユーザの位置に基づいてオーディオが最適な範囲内にあるかどうか決定する。一例として、ユーザがコンピュータ102から数ヤード離れて位置し、そしてユーザがスピーカ110又はコンピュータ102の真ん前にいるかのようにオーディオが出力される構成である場合には、オーディオを調整する必要がある。オーディオは、ボリュームが増加されるか、外部スピーカ110がターンオンされるか、内部スピーカ106がターンオフされるか、サラウンドサウンドが「スクリーンチャンネル」設定からサラウンドサウンドフォーマットにスイッチされるか、或いはサラウンドサウンドチャンネルが内部スピーカから外部スピーカ、並びに左サラウンドチャンネル及び右サラウンドチャンネルに再指向されるように、ユーザに対して調整される。他方、オーディオが既に調整されているか、又は距離設定で構成された場合には、オーディオは、ユーザの場所に基づいて調整される必要はない。
【0033】
ユーザの場所に最も適するようにするためオーディオを調整する必要がある場合には、方法200は、動作206へ進む。動作206は、ユーザの場所に基づいてオーディオを調整する。ユーザがコンピュータ102又はスピーカ106、110から離れて位置する場合には、コンピュータ102は、外部スピーカ110をアクチベートし、そして内部スピーカ106をターンオフする。例えば、外部スピーカ110は、サラウンドサウンドスピーカアレイの一部分を形成し、それ故、内部コンピュータスピーカ106に比して良好な「部屋」サウンド経験を与えることができる。同様に、ユーザがコンピュータ102の真ん前にいる場合には、コンピュータ102は、内部スピーカ106がアクチベートされるようにオーディオを調整する。
【0034】
更に、コンピュータ102は、これに限定されないが、ボリューム、低音、高音、周波数帯域レベルを含む種々のオーディオ設定を調整する。[[発明者−調整できる他の特性があるか?]]これは、スピーカ106、110の単一セットしかなくても、及び/又はスピーカ106、110が調整されなくても、オーディオ信号を調整できるようにする。
【0035】
オーディオがユーザの場所に基づき調整されると、又は設定されたオーディオ範囲内にユーザが既にいるために動作204においてオーディオを調整する必要がない場合には、方法200は、動作208へ進む。動作208において、この実施形態は、ユーザがコンピュータ102に向けられたかどうか決定する。これは、ユーザがコンピュータ102から離れた距離に位置する場合に、ユーザがコンピュータ102に向いているかどうか決定することが(パワフルなセンサなしに)困難であるような任意な動作である。しかしながら、他の実施形態では、ユーザがコンピュータ102に比較的接近しているか、又はシステム100が適当なセンサを含む場合に、コンピュータ102は、コンピュータ102に対するユーザの各方向を決定する。又、ある実施形態では、スピーカ106、110に対するユーザの方向を決定できることに注意されたい。これは、スピーカ106、110にセンサを含ませるか、又はコンピュータ102に対するユーザの方向を、コンピュータ102に対するスピーカ106、110の場所と比較することで、行われる。
【0036】
動作208において、コンピュータ102は、ビデオセンサ134を経てユーザの画像を捕獲し、さもなければ、それを与える。画像処理ユニット146は、ユーザの目の凝視を追跡する凝視追跡、顔認識、又は他の同様の方法を使用して、コンピュータ102に対するユーザの頭の方向を決定する。コンピュータ102に対するユーザの方向が決定されると、方法200は、動作210へ進む。
【0037】
動作210は、ユーザの新たな場所を受け容れるようにオーディオ出力装置、及び任意であるが、ユーザ入力装置を調整する。例えば、コンピュータ102は、ユーザの方向を良好に受け容れるようにスピーカ106、110及び/又はオーディオ信号を変化させる。更に、ユーザが(例えば、電話コール、ビデオチャット、口述のために)マイクロホン136を使用する場合には、コンピュータ102は、ユーザの口の方向に向けてマイクロホン136を操向する。動作210の後に、コンピュータ102は、オーディオ信号をスピーカ106、110に与える。
【0038】
ユーザ又は番組に基づく向上
他の実施形態では、システム100は、ユーザ及び番組の好みに基づきオーディオ及び/又はビデオ出力を向上させるのに使用される。図4は、オーディオ及び/又はビデオ出力を向上させるための規範的な方法300のフローチャートである。この方法300は、動作302で開始し、そしてコンピュータ102は、コンピュータ102を使用する特定ユーザを決定する。動作302は、ユーザがユーザ名及び/又はパスワードを入れる開始時に決定される。それとは別に又はそれに加えて、コンピュータ102は、例えば、デフォールトユーザ、セキュリティシステム、顔認識、等の別の仕方で、装置を使用するユーザを決定する。ユーザが決定された後、方法300は、動作304へ進み、ユーザ(又はコンピュータ102)は、特定のアプリケーションを起動する。このアプリケーションは、ビデオ会議/チャットプログラム、音楽プレーヤ、ビデオプレーヤ、等である。このアプリケーションは、オーディオ及び/又はビデオ/画像の観点を含む。
【0039】
アプリケーションが起動された後、又はアプリケーションが起動されている間に、方法300は、動作306へ進む。この動作306は、コンピュータ102、スピーカ106、110及び/又はディスプレイ装置104のオーディオ及び/又はビデオ設定が特定のアプリケーションに対して構成されたかどうか決定する。例えば、コンピュータ102、及びスピーカ106、110のオーディオ設定は、音楽を再生するように構成され、一方、起動されるアプリケーションは、ビデオ会議又は遠隔会議プログラムである。この例では、オーディオ及びスピーカ106、110は、音楽の周波数又は他の特性ではなく、ボイス周波数を良好に受け容れるように調整される。例えば、ボイス周波数は、一般的に、高く且つ大きな範囲を含む音楽周波数に比して、低く且つ小さな範囲を有する。それ故、オーディオがほとんど人々の話である場合に、オーディオは、ボイス周波数の小さな範囲を向上させるように、バンドパスフィルタを通して処理される。同様に、オーディオが音楽である場合には、オーディオは、フィルタリングされないか、又は全ての周波数範囲を出力できるようにノイズフィルタを含む。
【0040】
動作306において、オーディオ或いはビデオ設定又は出力装置(スピーカ106、110、ディスプレイ104)を調整する必要があるとコンピュータ102が決定する場合には、方法300は、動作308へ進む。この動作308は、相対的な出力信号、設定、及び/又は出力装置を、特定のアプリケーションに良好に相関させるように調整する。
【0041】
オーディオ及び/又はビデオが特定のアプリケーションに対して構成されると、方法300は、動作310へ進む。この動作310は、ユーザが以前に好みを記憶したかどうか決定する。コンピュータ102は、動作302においてコンピュータ102を使用すると決定された特定のユーザによって以前に調整された設定を記憶する。コンピュータ102は、選択アプリケーション(又は全てのアプリケーション)に対して特定のユーザにより調整された設定を自動的に記憶する。又は、ユーザは、特定アプリケーションに対して、又は一般的にはユーザがいつコンピュータ102を使用するかに対して、入力設定を能動的に調整してもよい。
【0042】
コンピュータ102がユーザの好みに関する情報を以前に記憶した場合には、方法300は、動作312へ進む。この動作312は、ユーザの特定の好みを起動する。動作312は、選択出力装置(例えば、外部スピーカ110)をアクチベートし、ボリューム、最低音、高音又は周波数レベルを調整することを含む。ユーザの好みを受け容れるように特定の装置及び設定を自動的に調整することにより、コンピュータ102は、ユーザの希望に基づいてオーディオ及び/又はビデオ出力を自動的に向上させることができる。又、ユーザの好みは、一般的にはオーディオ/ビデオ出力設定に基づき、又は特定のアプリケーションに対するものであることに注意されたい。例えば、あるユーザは、遠隔会議又はビデオ会議が著しく低いボリュームであり且つ内部スピーカ106しか使用しないことを好むが、音楽アプリケーションを利用するときには、ユーザは、ボリュームが大きく且つ外部スピーカ110及び一体化スピーカ106を使用することを好む。
【0043】
更に、ユーザの好みは、複数の個別のアプリケーションがいつ同時に起動されるかについての設定を含むことに注意されたい。複数の個別のアプリケーションは、ユーザがいつ音楽プレーヤ及びビデオチャットアプリケーションを使用するかを含み、そして各アプリケーションとは個々に異なる変更された設定を含む。
【0044】
ユーザの好みがアクチベートされるか、又は以前に記憶/セーブされたユーザの好みがないとき、方法300は、動作314へ進む。動作314は、コンピュータ102に対するユーザの距離、位置及び/又は場所を決定する。これは、図2に示す方法200と同様である。例えば、コンピュータ102は、ビデオセンサ134を使用して、ユーザの画像を捕獲し、及び/又はユーザの動きを追跡する。凝視追跡機能を使用して、ビデオ画像を処理し、ユーザの凝視方向、即ち、ユーザが見ようとしている方向を決定する。同様に、コンピュータ102は、赤外線、熱、温度、超音波、又は動きセンサのような他のセンサ124を使用して、ユーザのおおよその場所を決定する。
【0045】
コンピュータ102からユーザの位置、距離及び/又は場所が決定されると、方法300は、動作316へ進む。動作316は、コンピュータ102に対するユーザの距離、場所及び/又は位置に基づき、オーディオ及び/又はビデオ出力をいつ調整する必要があるか決定する。コンピュータ102は、ユーザの位置情報を現在オーディオ及び/又はビデオ設定と比較して、良好な出力を与えるためにオーディオ及び/又はビデオ設定及び/又は装置を調整するかどうか調べる。設定及び/又は装置情報は、特定の範囲の場所、位置及び/又は距離に対してメモリ130に記憶される。又は、設定及び装置は、フィードバックループ又は他のアクティブな調整メカニズムに基づいて動的に調整されてもよい。
【0046】
動作316において、オーディオ及び/又はビデオ出力をユーザの位置に基づいて調整すべき場合には、方法300は、動作318へ進む。この動作318は、ユーザの特定の場所及び/又はアプリケーションに対して最良の出力を与える設定を受け容れるようにオーディオ及び/又はビデオの出力を調整する。例えば、ユーザの手をコンピュータ102から離れる(ひいては、内部スピーカ106から離れる)ように回転した場合に、ユーザの位置及び距離を受け容れるようにオーディオ経験が向上されるようオーディオを調整することができる。同様に、ユーザがコンピュータ102から離れるように位置される場合には、異なる出力プロフィールを有するようにオーディオ出力を調整し、及び/又はビデオ出力表示を拡大することができる。
【0047】
オーディオ出力は、複数の異なる方法を通して調整することができる。オーディオ出力信号は、出力される前に、後処理される。例えば、オーディオは、特定の周波数を向上させ又は減少するためにフィルタリングされてもよく、異なるチャンネル信号(例えば、サラウンドサウンドチャンネル)を含んでもよく、異なる最低音又は高音を含んでもよく、等々である。同様に、オーディオが入力されるときにオーディオ調整が行われてもよい。例えば、マイクロホン136は、ビーム操向を通して入力ソースに向けられてもよく、又、マイクロホン136は、特定のユーザボイス周波数に対して高い感度を有してもよく、話をしているユーザに向けられない他のマイクロホン136又はオーディオ入力センサ132がターンオフされるか下げられてもよく、等々である。
【0048】
オーディオ及び/又はビデオ出力並びに装置が調整されると、方法300は、動作314へ戻る。方法300が動作314へ戻ると、オーディオ及び/又はビデオ出力並びに装置は、ユーザが自分の位置、場所、及び/又はコンピュータ102からの距離を変更する場合に、動的に調整される。それ故、オーディオ及び/又はビデオ出力は、ユーザが動きまわるときに自動的に調整され、ユーザに基づいて得られる最良のオーディオ及び/又はビデオ出力を与えることができる。
【0049】
動作316において、オーディオ及び/又はビデオ出力がユーザの位置に基づいて既に調整された場合には、方法300は、動作320へ進み、環境データが収集される。例えば、センサ134、ビデオセンサ134、及び/又はオーディオ入力132を使用するコンピュータ102は、コンピュータ102を取り巻く環境の特性を収集する。この環境特性は、コンピュータ102が位置する部屋/空間の推定サイズ、グローバルポジショニング情報、温度、湿度、反響の質、大きな物体までの距離、等の情報を含む。
【0050】
一例において、コンピュータ102は、(オーディオ入力/出力132、又はスピーカ106、110を経て)音を放射し、そして音及びそれにより生じるエコー(もしあれば)は、マイクロホン132及び/又は他のセンサ134により感知される。反響オーディオサウンドの感知されたエコー応答及び他の特性は、部屋のサイズ、部屋の反響性、又は他の同様の特性に関する情報を与える。
【0051】
別の例では、グローバルポジショニング情報又は信号強度分析のような情報を使用して、コンピュータ102の場所を決定することができる。この場所は、ユーザのオフィス、家、屋外の場所、等であると決定される(例えば、ユーザ、マッピング又は他の参照情報でプログラムされることにより)。
【0052】
環境データが収集されると、方法300は動作322へ進み、コンピュータ102は、オーディオ及び/又はビデオ出力が特定の環境に対してセットされるかどうか決定する。例えば、コンピュータ102の位置がユーザのオフィスであると決定された場合には、オーディオ及び/又はビデオ設定は、低いボリュームとなるように調整される。ユーザは、オフィスにいるときに比して、家では、より高いボリュームでオーディオを再生することを望む。同様に、オフィスにおける一般的な部屋のサイズは、ユーザの家でオーディオを再生するためにコンピュータ102が使用される場合より小さい(例えば、ユーザの特定のオフィス)。更に、ある場合に、コンピュータ102の場所に基づき、オーディオ及び/又はビデオは、例えば、オフィス又は教室では、ミュートされるか又は再生が防止される。
【0053】
別の例では、スピーカ106、110のオーディオ出力設定は、コンピュータ102の部屋の反響の質又はサイズを考慮するように調整することが必要である。これは、エコーを除去し、反響し得る周波数を減少するためのオーディオのフィルタリング、又はオーディオの他の後処理を含む。同様に、室内の周囲光の量、例えば、ディスプレイスクリーン又はビデオ信号の輝度の増減に基づいてビデオの画質を調整する必要がある。
【0054】
動作322において、特定の環境に対してオーディオ及び/又はビデオ設定を調整する必要があるとコンピュータ102が決定する場合には、この方法は、動作324へ進む。動作324において、コンピュータは、スピーカ106、110及び/又はディスプレイスクリーン104から、考えられる最良のサウンド及び/又は画像を出力するように当該設定を調整する。動作324は、特定の設定(例えば、輝度、コントラスト、高音、最低音、ボリューム)を増加/減少すること、出力信号を特定の仕方で変化させること(例えば、ある周波数を減少し又は向上させるために信号をフィルタリングすること)、出力信号を別の信号と合成すること、或いはオーディオ又はビデオの一方又は両方の出力を調整する他の形式のメカニズムを伴う。
【0055】
オーディオ及び/又はビデオが調整されると、方法300は、動作320に戻る。このように、コンピュータ102は、オーディオ及び/又はビデオの調整と調整との間に環境の状態が変化した場合に環境データを収集し続ける。同様に、動作320へ戻ることにより、変更されたオーディオ及び/又はビデオ設定は、特定の環境に対して充分であることが検証される。これは、設定を調整して再テスト(及び必要に応じて再調整)できるようなフィードバックループを与える。
【0056】
動作322の後に、特定の環境に対してオーディオ及び/又はビデオ設定が充分であるとコンピュータ102が決定する場合には、方法300は、動作326へ進む。コンピュータ102は、出力装置(例えば、テレビジョン、又はスピーカ106、110)へオーディオ及び/又はビデオを提示又は転送する。
【0057】
コンピュータ102がオーディオ及び/又はビデオを提示するとき、方法300は動作328へ続く。この動作328において、コンピュータ102は、動きが検出されるかどうか監視する(センサ134を経て)。例えば、センサ134は、ユーザが自分の位置を変化させる場合に追跡する動き検出器又は他の移動感知装置を含む。同様に、センサ134は、ユーザがコンピュータ102を持ち運ぶか又は移動するかをコンピュータ102が決定するように、コンピュータ102が移動するかどうかを決定する加速度計も含む。
【0058】
動作328において、動きが検出されない場合には、方法300は動作326へ戻る。しかしながら、動作328において、動きが検出された場合には、方法300は動作314へ戻る。それ故、オーディオ及び/又はビデオが提示されている間にユーザ及び/又はコンピュータ102が移動する場合には、コンピュータ102は、オーディオ及び/又はビデオ設定が、更新された環境及びユーザの位置に対して充分にセットされたかどうか更に決定する。それ故、コンピュータ102は、オーディオ及びビデオ再生の設定を動的に調整することができる。これは、コンピュータ102がオーディオ及び/又はビデオを調整し続けて、オーディオ及び/又はビデオを最良の(又は望ましい)設定で提示できるようにする。
【0059】
ビデオ会議
他の例では、システム100は、エンハンス(向上)型で且つユーザ調整可能なビデオ会議システムを提供するのに使用される。図5Aは、複数人ビデオ会議を表示するコンピュータ102の一例である。明らかなように、ディスプレイ104は、個人A、個人B、個人C、及び個人Dの画像を含む。個人は、より多くても少なくてもよく、又、システムは、人を伴わずに(例えば、監視システムとして)使用されてもよいことに注意されたい。図5Bは、各個人A−Dの位置に対するコンピュータ102の上面図である。図5Bに示すように、各個人A−Dは、コンピュータ102に対して異なる場所に位置する。
【0060】
各個人A−Dは、異なる場所に且つコンピュータ102から変化する距離に位置するので、図5Aのコンピュータ102における各個人A−Dの表示も、同様に、個人A−Dを、彼等が実際にそうであるように、即ち異なる場所に表示する。更に、マイクロホン136も、個人A−Dのボイス及び他のサウンドを、コンピュータ102に対する個人の位置に基づいてピックアップする。それ故、個人A及びBは、図5Aの個人Cに比して小さく示され、そして個人A及びBからのサウンドも、一般的に、個人Cからのサウンドより静かなものとして出力される。しかしながら、ある場合には、ビデオ会議を見ているユーザは、個人A及びBをより良好に又は大きく聞き及び/又は見ることを希望する。例えば、個人A及びBが瞬間的に話をし、そしてユーザは、出力サウンドを彼等のボイスに焦点を当てることを希望する。
【0061】
図5Cは、個人A及びBのオーディオ及びビデオを向上させた図5Aのコンピュータ102を示す。図5Cにおいて明らかなように、個人A及びBの画像が拡大され、個人Cの画像とほぼ等しいサイズにされている。同様に、図5Cには示されていないが、各個人A及びBからのオーディオも向上される。更に、個人A及び個人Bを更に大きく向上させるために、非向上の個人C及びDを最小にし又は隠してもよい。又は、個人C及びDをほぼ同じままとし、個人A及びBが個人C及びDとほぼ同じサイズになるようにしてもよい。更に、個人A及び個人Bの向上は、彼等の画像だけでなく、他の設定も含んでもよい。例えば、各個人が個別のチャットウインドウにある場合には、話をしている個人(例えば、個人A又は個人B)のウインドウが向上され、例えば、チャットウインドウがカラーを変化させ、境界を含み、又は境界を変更し、ウインドウが拡大され、ディスプレイの前方へ引っ張られ、等々である。
【0062】
図6は、図5A−5Cに示すビデオ会議セッション中に特定の個人のオーディオ及び/又はビデオを向上させるための規範的方法を示すフローチャートである。この方法400は、動作402で始まり、コンピュータ102は、特定のビデオ会議セッションに関連した複数のユーザ又は人がいるかどうか決定する。コンピュータ102は、ユーザが人数を入力できるようにするためのオプションをユーザに提示し、又はコンピュータ102は、顔認識、音声認識、全会議セッション又はディスプレイコンピュータ、等によりユーザの数を決定する。ビデオ会議セッションに参加している個人又はユーザは、個別(例えば、各々が個別のコンピュータ)であるか、集合的(例えば、コンピュータ当たり複数のユーザ)であるか、又は個別及び集合的の組合せ(例えば、あるユーザは個別、あるユーザは集合的)であるか決定されることに注意されたい。
【0063】
一例において、図5A−5Cに示すように、コンピュータ102は、4人の個人(個人A−D)がいるが、各個人A−Dは、単一のコンピュータ102の前にいることを決定する。コンピュータ102は、顔認識、音声認識、及び他の種々のセンサを使用して、コンピュータ102の前にいる個人の人数を決定する。しかしながら、他の場合には、個人A−Dの各々が個別のコンピュータの前にいるが、コンピュータ102のディスプレイ上で一緒にグループ編成され、ビデオ会議の単一インターフェイスを提示することができる。
【0064】
方法200は、ユーザの人数を決定すると、動作404へ進む。この動作404は、話をしているユーザがもしいれば、どのユーザ(ユーザの人数のうちの)であるか決定する。コンピュータ102は、ユーザが話をしているかどうか、音声認識、オーディオセンサ、画像データ、等で決定する。話をしているユーザが決定されると、方法400は、動作406へ進み、コンピュータ102は、オーディオ入力センサ(マイクロホン)のようなセンサを、話をしているユーザへ向け又は操向する。例えば、オーディオ入力センサが、話をしているユーザに向けて回転されるか、又は指向性マイクロホンが、話をしているユーザに向けてアクチベートされ又は操向される。
【0065】
オーディオ入力センサが、話をしているユーザへ操向されるか、又は向けられた後に、方法400は、動作408へ進む。この動作408は、ユーザ(又はコンピュータ102)が、話をしているユーザに焦点を合わせるために出力ビデオを向上させることを望むかどうか決定する。例えば、話をしているユーザが決定された後、コンピュータ102は、話をしているユーザのビデオ画像に焦点を合わせたいかどうかについてのオプションを、見ているユーザに提示する。或いは又、コンピュータ102は、話をしているユーザの出力を自動的に向上させてもよく、これは、ビデオ会議アプリケーションの設定である。
【0066】
動作408において、話をしているユーザのビデオ出力を向上させるべき場合に、方法400は、動作410へ進み、そして話をしているユーザにズームインするか又は焦点を合わせるようにビデオ出力及び/又はビデオ入力(例えば、ビデオセンサ134)を向上させることができる。例えば、図5Cに示すように、個人A及びBが個人Cよりスクリーンに接近して見えるように、個人A及び個人Bの出力ビデオを向上させることができる。
【0067】
動作410の後に、又は動作408において、話をしているユーザに出力ビデオの焦点が合わせられない場合には、方法400は、動作412へ進む。この動作412は、話をしているユーザがディスプレイ104の中央部からオフセットして位置しているかどうか決定する。例えば、コンピュータ102は、顔認識、音声認識、等を使用して、話をしているユーザがディスプレイ104上のどこに位置するか決定する。例えば、コンピュータ102は、個人Aが話をしていること、及びその個人がディスプレイ104においてスクリーンの右側に表示されることを決定する。しかしながら、動作412において、個人Cが話をしているユーザである場合には、コンピュータ102は、話をしているユーザが実質的にディスプレイ104の中央部に位置することを決定する。
【0068】
動作412において、話をしているユーザがディスプレイ104の中央部からオフセットして位置している場合には、方法400は、動作414へ進む。この動作414は、話をしているユーザの音声が、話をしているユーザが表示されるディスプレイ104の側部に向けて傾くようにビデオ会議のオーディオ出力を向上させる。例えば、図5Cに示す構成では、オーディオ出力装置106、110は、話をしているユーザの場所、即ちディスプレイスクリーン104の右側から到来するようにオーディオサウンドを生じさせるようセットされる。このように、視聴し/見ているユーザは、話をしているユーザが表示された場所からそのユーザの音声を聞くことができる。
【0069】
場所を伴う対応オーディオ
他の実施形態では、システム100は、ビデオ会議ウインドウ又はインスタンスの場所に基づいてオーディオ出力を変更するように構成される。図7Aは、インスタントメッセージング、ボイス又はビデオチャットプログラムの実行を伴うコンピュータ102を示す。例えば、コンピュータ102は、アップル社によるiCHAT又はFacetimeのようなプログラムを実行する。ディスプレイは、複数のチャットインスタンス430、432、434、436を含み、各ウインドウは、それ自身のオーディオ、各々、オーディオA、オーディオB、オーディオC、及びオーディオDを含む。更に、各チャットインスタンスは、ビデオ画像又は写真のような対応画像を含む。
【0070】
図8は、チャットインスタンスの場所に対応する場所から発生するかのように音を発する出力として特定チャットインスタンスのオーディオを指向するための規範的な方法500を示すフローチャートである。この方法500は、動作502で始まり、コンピュータ102は、2つ以上のチャットインスタンスがあるかどうか決定する。例えば、コンピュータ102は、異なるチャットインスタンスに対応する複数のオーディオインスタンスがあるかどうか決定する。2つ以上のオーディオインスタンスもチャットインスタンスもない場合には、方法500は、動作512へ進み、これについては、以下に詳細に述べる。
【0071】
動作502において、2つ以上のオーディオインスタンス又はチャットインスタンスがある場合には、方法500は、動作504へ進む。この動作504は、チャットインスタンスがディスプレイ104上の異なる場所に配置されるかどうか決定する。例えば、チャットインスタンスは、互いに上にオーバーレイされ、最小化され、又は(図7Aに示すように)ディスプレイスクリーン104上の種々の場所に分散されてもよい。動作504において、チャットインスタンスがディスプレイ104上の異なる位置に配置されたとコンピュータ102が決定した場合には、方法500は、動作506へ進む。
【0072】
動作506は、ユーザが話をしていること、又はどのインスタンスがオーディオ出力を有するか決定する。例えば、コンピュータ102は、オーディオA、オーディオB、オーディオC、又はオーディオDが現在サウンドを発生しているかどうか決定し、これは、ユーザが話をしているか、さもなければ、視聴ユーザへ伝達するサウンドを発しているかどうかに相関している。動作506で、現在出力を有するオーディオが決定されると、方法500は、動作508へ進む。この動作508は、出力オーディオの場所を決定し、即ちどのチャットインスタンス(及びその場所)が各オーディオに相関するか決定する。例えば、オーディオAが現在出力を有する場合には、コンピュータ102は、チャットインスタンス430の場所(ディスプレイ104に対する)を決定する。
【0073】
動作508の後、方法500は、動作510へ進み、コンピュータ102は、スピーカ106、110又は他の出力装置からのオーディオ出力を、チャットインスタンスの場所から出るように(又は出るよう見えるように)変更する。例えば、図7Aに示すように、オーディオAが出力を有する場合には、スピーカ110は、オーディオAのオーディオがチャットインスタンスのエリアから指向されて見えるように変更される。図7Bは、チャットインスタンス430、432、434、436に各々対応するオーディオA−Dのオーディオ方向を示す。図7Bにおいて明らかなように、オーディオは、ディスプレイ104上のチャットインスタンスの場所に相関する仕方でユーザに向けられる。これは、ユーザが、オーディオA−Dからのいずれのオーディオも、それらがチャットインスタンスの場所から出力されたかのように聞こえるようにする。これは、ビデオ会議又はビデオチャットアプリケーションにおいてユーザにより現実的なチャット経験を与える。更に、指向性オーディオも、チャットセッション中にユーザのオーディオ経験を向上させる。
【0074】
動作510の後、又は動作504の後、方法500は、動作512へ進む。動作512は、現在オーディオが終了したかどうか、例えば、特定の個人が話し終えたかどうか決定する。コンピュータ102は、チャットがビデオ映像を含む場合には顔認識によってこれを決定するか、或いはオーディオ処理、スピーチ認識、又は他の処理技術によって行う。特定チャットインスタンスのオーディオが終了しない場合には、方法500は、動作514へ進み、コンピュータ102は、選択時間中、待機又は休止となる。他方、選択されたチャットインスタンスのオーディオが終了した場合には、方法500は、動作516へ進む。この動作516は、チャットインスタンスの1つに対しアクティブな新たなオーディオがあるかどうか決定する。新たなオーディオがある場合には、方法500は動作504へ戻る。しかしながら、別のオーディオがない場合には、方法500は終了となる。
【0075】
結論
以上の説明は、広く適用することができる。実施形態の説明は、単なる例示に過ぎず、請求項を含む本開示の範囲がこれらの例に限定されることを示唆するものではない。
【符号の説明】
【0076】
100:システム
102:コンピュータ
106、110:オーディオ出力装置
118:プロセッサ
120:ネットワーク/通信インターフェイス
122:システムバス
124:センサ
126:入力/出力インターフェイス
128:ビデオ入力/出力インターフェイス
130:メモリ
132:オーディオ入力/出力インターフェイス
134:ビデオセンサ
136:マイクロホン
138:ネットワーク
142:画像処理ユニット
144:ユーザ/環境インターフェイス処理ユニット
145:出力処理ユニット
146:オーディオ処理ユニット
【特許請求の範囲】
【請求項1】
コンピューティング装置からオーディオを出力する方法において、
センサによりユーザを検出する段階と、
オーディオ出力装置の現在オーディオ出力に対して最適な範囲にユーザがいるかどうかプロセッサにより決定する段階と、
ユーザが最適な範囲内にいない場合には、前記オーディオ出力を変更する段階と、
ユーザが前記コンピューティング装置に向いているかどうか前記センサにより決定する段階と、
ユーザの方向に基づいてオーディオ装置を調整する段階と、
を備えた方法。
【請求項2】
第1センサはユーザの存在を決定し、第2センサはユーザの方向を決定する、請求項1に記載の方法。
【請求項3】
前記第1センサは動きセンサであり、前記第2センサはカメラである、請求項2に記載の方法。
【請求項4】
前記オーディオ出力装置は、第1スピーカ及び第2スピーカを含む、請求項1に記載の方法。
【請求項5】
オーディオ装置を調整する前記段階は、ボリュームの調整、サウンド位置の調整、出力装置のアクチベーション及びデアクチベーション、又は周波数のフィルタリングの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
コンピュータのためのオーディオを向上させる方法において、
コンピュータのアプリケーションを起動する段階と、
コンピュータに対するユーザの位置をセンサにより決定する段階と、
コンピュータの環境に対応する環境データをセンサにより収集する段階と、
前記環境データ及びユーザの位置に鑑みオーディオビジュアル設定をプロセッサにより調整する段階と、
を備えた方法。
【請求項7】
前記オーディオビジュアル設定が前記ユーザの位置に対して最適であるかどうか決定する段階と、
前記オーディオビジュアル設定が最適でない場合には、前記ユーザの位置に基づき前記オーディオビジュアル設定を最適となるように調整する段階と、
を更に備えた請求項6に記載の方法。
【請求項8】
前記センサは、第1センサ及び第2センサを含む、請求項6に記載の方法。
【請求項9】
前記第1センサはユーザ位置を検出し、前記第2センサは環境データを収集する、請求項8に記載の方法。
【請求項10】
前記環境データは、コンピュータの位置の推定サイズ、グローバルポジショニングデータ、温度、湿度、コンピュータの位置の反響の質、又はコンピュータから大きな物体までの距離、のうちの少なくとも1つを含む、請求項6に記載の方法。
【請求項11】
前記オーディオビジュアル設定は、オーディオ出力及びビデオ出力の少なくとも1つを含む、請求項6に記載の方法。
【請求項12】
前記オーディオビジュアル設定は、オーディオ出力又はビデオ出力の1つのみを含む、請求項6に記載の方法。
【請求項13】
ユーザが移動したかどうかを動きセンサにより決定する段階を更に備えた、請求項6に記載の方法。
【請求項14】
オーディオを向上させるシステムにおいて、
コンピュータであって、
このコンピュータに対するユーザの位置を決定し、そしてこのコンピュータの環境に対応する環境データを収集するように構成されたセンサ、及び
前記センサと通信し、そして前記ユーザの位置及び環境データを処理して、オーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサ、
を含むコンピュータと、
前記プロセッサと通信し、そして前記オーディオ出力又はビデオ出力の少なくとも一方を出力するように構成された出力装置と、
を備えたシステム。
【請求項15】
前記環境データは、環境の反響の質、又はおおよその大きさのうちの少なくとも1つを含む、請求項14に記載のシステム。
【請求項16】
前記環境データは、反響の質、及びおおよその大きさの両方を含む、請求項14に記載のシステム。
【請求項17】
前記出力装置は、コンピュータの外部にある、請求項14に記載のシステム。
【請求項18】
前記プロセッサは、更に、
前記ユーザの位置に対してオーディオビジュアル設定が最適であるかどうか決定し、
オーディオビジュアル設定が最適でない場合には、前記ユーザの位置に基づきオーディオビジュアル設定を最適となるよう調整する、
ように構成された請求項14に記載のシステム。
【請求項19】
前記オーディオビジュアル設定は、オーディオ設定及びビデオ設定の少なくとも一方を含む、請求項18に記載のシステム。
【請求項20】
前記出力装置は、スピーカである、請求項14に記載のシステム。
【請求項1】
コンピューティング装置からオーディオを出力する方法において、
センサによりユーザを検出する段階と、
オーディオ出力装置の現在オーディオ出力に対して最適な範囲にユーザがいるかどうかプロセッサにより決定する段階と、
ユーザが最適な範囲内にいない場合には、前記オーディオ出力を変更する段階と、
ユーザが前記コンピューティング装置に向いているかどうか前記センサにより決定する段階と、
ユーザの方向に基づいてオーディオ装置を調整する段階と、
を備えた方法。
【請求項2】
第1センサはユーザの存在を決定し、第2センサはユーザの方向を決定する、請求項1に記載の方法。
【請求項3】
前記第1センサは動きセンサであり、前記第2センサはカメラである、請求項2に記載の方法。
【請求項4】
前記オーディオ出力装置は、第1スピーカ及び第2スピーカを含む、請求項1に記載の方法。
【請求項5】
オーディオ装置を調整する前記段階は、ボリュームの調整、サウンド位置の調整、出力装置のアクチベーション及びデアクチベーション、又は周波数のフィルタリングの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
コンピュータのためのオーディオを向上させる方法において、
コンピュータのアプリケーションを起動する段階と、
コンピュータに対するユーザの位置をセンサにより決定する段階と、
コンピュータの環境に対応する環境データをセンサにより収集する段階と、
前記環境データ及びユーザの位置に鑑みオーディオビジュアル設定をプロセッサにより調整する段階と、
を備えた方法。
【請求項7】
前記オーディオビジュアル設定が前記ユーザの位置に対して最適であるかどうか決定する段階と、
前記オーディオビジュアル設定が最適でない場合には、前記ユーザの位置に基づき前記オーディオビジュアル設定を最適となるように調整する段階と、
を更に備えた請求項6に記載の方法。
【請求項8】
前記センサは、第1センサ及び第2センサを含む、請求項6に記載の方法。
【請求項9】
前記第1センサはユーザ位置を検出し、前記第2センサは環境データを収集する、請求項8に記載の方法。
【請求項10】
前記環境データは、コンピュータの位置の推定サイズ、グローバルポジショニングデータ、温度、湿度、コンピュータの位置の反響の質、又はコンピュータから大きな物体までの距離、のうちの少なくとも1つを含む、請求項6に記載の方法。
【請求項11】
前記オーディオビジュアル設定は、オーディオ出力及びビデオ出力の少なくとも1つを含む、請求項6に記載の方法。
【請求項12】
前記オーディオビジュアル設定は、オーディオ出力又はビデオ出力の1つのみを含む、請求項6に記載の方法。
【請求項13】
ユーザが移動したかどうかを動きセンサにより決定する段階を更に備えた、請求項6に記載の方法。
【請求項14】
オーディオを向上させるシステムにおいて、
コンピュータであって、
このコンピュータに対するユーザの位置を決定し、そしてこのコンピュータの環境に対応する環境データを収集するように構成されたセンサ、及び
前記センサと通信し、そして前記ユーザの位置及び環境データを処理して、オーディオ出力又はビデオ出力の少なくとも一方を調整するように構成されたプロセッサ、
を含むコンピュータと、
前記プロセッサと通信し、そして前記オーディオ出力又はビデオ出力の少なくとも一方を出力するように構成された出力装置と、
を備えたシステム。
【請求項15】
前記環境データは、環境の反響の質、又はおおよその大きさのうちの少なくとも1つを含む、請求項14に記載のシステム。
【請求項16】
前記環境データは、反響の質、及びおおよその大きさの両方を含む、請求項14に記載のシステム。
【請求項17】
前記出力装置は、コンピュータの外部にある、請求項14に記載のシステム。
【請求項18】
前記プロセッサは、更に、
前記ユーザの位置に対してオーディオビジュアル設定が最適であるかどうか決定し、
オーディオビジュアル設定が最適でない場合には、前記ユーザの位置に基づきオーディオビジュアル設定を最適となるよう調整する、
ように構成された請求項14に記載のシステム。
【請求項19】
前記オーディオビジュアル設定は、オーディオ設定及びビデオ設定の少なくとも一方を含む、請求項18に記載のシステム。
【請求項20】
前記出力装置は、スピーカである、請求項14に記載のシステム。
【図1A】
【図1B】
【図1C】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図6】
【図7A】
【図7B】
【図8】
【図1B】
【図1C】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図6】
【図7A】
【図7B】
【図8】
【公開番号】特開2013−48412(P2013−48412A)
【公開日】平成25年3月7日(2013.3.7)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−179944(P2012−179944)
【出願日】平成24年7月27日(2012.7.27)
【出願人】(503260918)アップル インコーポレイテッド (568)
【Fターム(参考)】
【公開日】平成25年3月7日(2013.3.7)
【国際特許分類】
【出願番号】特願2012−179944(P2012−179944)
【出願日】平成24年7月27日(2012.7.27)
【出願人】(503260918)アップル インコーポレイテッド (568)
【Fターム(参考)】
[ Back to top ]