説明

Fターム[5C122FJ09]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音源方向検出 (121)

Fターム[5C122FJ09]に分類される特許

41 - 60 / 121


【課題】現場において、測定データの任意の部分を抽出して音源位置の推定を行う方法とその装置を提供する。
【解決手段】複数のマイクロフォンM1〜M5とカメラ12とを一体化した音・映像採取ユニット10を用いて音の情報と映像の情報とを同時に採取し、音の情報である音声波形データと映像の情報である画像データとを記憶手段24に保存するとともに、音圧波形データのみを記憶手段24から抽出して表示手段25の表示画面25Mに音圧レベルの時系列波形のグラフを表示し、このグラフ上で音源方向の解析を行う時刻tzを指定した後、この指定された時刻tzを中心とした解析時間長Twの音圧波形データを用いて、複数のマイクロフォンM1〜M5で採取した音の音圧信号間の位相差を算出して音源の方向を推定するようにした。 (もっと読む)


【課題】突発的な音や間欠的な音が発生した場合でも、音源の推定を確実に行うことのできる方法とその装置を提供する。
【解決手段】複数のマイクロフォンとカメラとを一体化した音・映像採取ユニットを用いて音と映像とを同時に採取した後、音圧波形データと画像データとをバッファに一時保存しておき、時刻t0にて、制御ユニットから測定開始信号の指令が発せられたときには、時刻t0から所定の遡行時間長Tz分だけ遡った時刻t1=t0−Tzと時刻t2=t0+(Tw−Tz)との間にバッファに保存されたデータを取出して音ファイルと動画ファイルとを作成してメモリーに保存し、この保存された音ファイルの音圧波形データを用いて、複数のマイクロフォンで採取した音の音圧信号間の位相差を算出して音源方向を推定するようにした。 (もっと読む)


【課題】5個のマイクロフォンの位置関係を正確に維持でき、かつ、5個のマイクロフォンと1つのカメラとを一緒に固定可能で、音源位置推定の精度を向上できる固定装置を提供する。
【解決手段】4つのマイクロフォンを固定する第1のマイクロフォン固定部と、1つのマイクロフォンを固定する第2のマイクロフォン固定部と、カメラ取付部と、カメラ取付部及び第1;第2のマイクロフォン固定部を支持する支持フレームと、マイクロフォン固定部品とを備え、第1;第2のマイクロフォン固定部は、マイクロフォンの軸部を貫通させて軸部を固定する固定孔を備え、マイクロフォンは、固定孔からの引き抜けが防止されるようにマイクロフォン固定部品によりマイクロフォン固定部に固定されたことを特徴とする固定装置。 (もっと読む)


【課題】本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することである。
【解決手段】カメラ10は、ユーザの発する音声を後方音声取得部16で取得し、対象物であるペットの発する音声を前方音声取得部15で取得する。これら前方音声取得部15及び後方音声取得部16で得られた音声に従って、信号処理及び制御部11が表示内容を決定する。そして、この信号処理及び制御部11で決定された表示内容が、表示部23に表示される。 (もっと読む)


【課題】断続的に音声を発生する音源についてもノイズを減衰させて良好な音声を得る。
【解決手段】画像音声特徴情報を記憶する画像音声特徴情報記憶部31と、被写体画像の特徴情報を検出する物体検出部24aと、音声の特徴情報を検出する音声検出部14a,14bと、被写体までの距離及び方向を算出する物体位置検出部24bと、音源までの距離及び方向を算出する音声位置検出部12と、被写体画像の特徴情報と音声の特徴情報と被写体までの距離及び方向と音源までの距離及び方向とに基づいて、被写体と音源とを同一の物体として関連付ける関連付け部40aと、物体の特徴情報が画像音声特徴情報に一致するか否かを判定する特徴情報判定部40bと、被写体画像の追跡を行う追跡制御部40dと、追跡結果と被写体又は音源の距離及び方向とに基づいてマイクロフォンアレイ11の指向特性を調整する指向特性調整部13a,13bとを備える。 (もっと読む)


【課題】断続的に音声を発生する音源についてもノイズを減衰させて良好な音声を得ると共に、音声を発した人間に応じて適切に文字表示を行う。
【解決手段】被写体までの距離及び方向を算出する物体位置検出部24bと、音源までの距離及び方向を算出する音声位置検出部12と、被写体までの距離及び方向と音源までの距離及び方向とに基づいて、被写体と音源とを同一の物体として関連付ける関連付け部40aと、関連付けられた被写体画像の追跡を行う追跡制御部40bと、追跡結果と被写体又は音源の距離及び方向とに基づいてマイクロフォンアレイ11の指向特性を調整する指向特性調整部13a,13bと、指向特性が調整されたマイクロフォンアレイ11により生成された音声データに基づいて音声を文字列に変換する音声認識部15a,15bと、変換された文字列を被写体画像に応じて画面に表示するための出力データを生成する出力制御部40dとを備える。 (もっと読む)


【課題】被写体の検出精度の向上を図る。
【解決手段】被写体を撮像して主要被写体を含む被写体画像の画像データを取得する撮像部1と、被写体画像内の主要被写体である人物から発せられた音声を集音する集音部6とを備える撮像装置100に、撮像部により取得された画像データ及び集音部により集音された音声に基づいて、被写体画像内の主要被写体を検出する処理を行うCPU71を備え、CPUは、集音部により集音された音に基づいて主要被写体の属性を特定し、当該属性に基づいて、検出すべき当該主要被写体の検出基準を変更する。 (もっと読む)


【課題】録画データの再生時に、雑音除去を行なっていない元の音データの再生や、雑音除去を行う角度の変更が可能な記録装置及び再生装置を提供する。
【解決手段】本発明の記録装置及び再生装置は、複数のマイクロフォンを備え、操作者が設定した映像上の座標から三次元空間上の角度を算出する機能と、各マイクロフォンの設置位置と各マイクロファンから取り込んだ音データを用いて、雑音除去を行う機能とを有する。録画時は、各マイクロフォンの設置位置や、撮影者が設定した映像上の座標などが記録できる録画ファイルフォーマットに従い録画データを記録する。再生時には、録画データと共に記録された座標、或いはユーザが指定した映像上の座標に基づいて、雑音除去を行なう。 (もっと読む)


【課題】 従来、ユーザがデジタルカメラを操作する際の口(音源)の位置を推定し、推定された音源から発せられる音を好適に取得するための対策が望まれていた。
【解決手段】 本発明に係る撮像装置は、ファインダとディスプレイとを備え、前記ファインダに画像を表示する表示モードと、前記ディスプレイに画像を表示する表示モードとを切替え、前記ファインダに画像を表示している場合、音声入力の処理を接話用のモードに設定し、前記ディスプレイに画像を表示している場合、音声入力の処理を非接話用のモードに設定し、設定された音声入力のモードに従って、予め設定された制御コマンドを音声入力する。 (もっと読む)


【課題】 ビデオ会議システム(テレビ会議システム)において、発言者の発声開始時点からその発言者を撮影・表示できるようにする。
【解決手段】 カメラ203による撮影を制御する撮影制御装置100において、会議の参加者に係る情報であって、当該参加者の位置情報を含む参加者情報を格納する情報格納部212と、会議の参加者のうちの第1の参加者が発した音声の内容を音声認識する音声認識部213と、音声認識部213によって音声認識された内容と参加者情報とに基づいて、会議の参加者の中から第2の参加者を特定する特定部214と、特定部214によって特定された第2の参加者の位置情報に基づいて、カメラ203を制御するカメラ制御部217を具備する。 (もっと読む)


【課題】入力画像から主要被写体を含む切り出し領域を容易かつ正確に選択して切り出すことを可能とする画像処理装置や、当該画像処理装置を備えた電子機器を提供する。
【解決手段】切り出し処理部60は、入力画像から主要被写体を検出する主要被写体検出部61と、検出された主要被写体を含む切り出し領域を決定する切り出し領域決定部62と、入力画像から切り出し領域の部分を切り出して切り出し画像を生成する切り出し部63と、を備える。切り出し領域決定部62は、検出された主要被写体の位置が、切り出し領域中の所定の位置となるように切り出し領域を決定する。 (もっと読む)


【課題】複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果となる音声収録を可能としたカメラ、また複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果で音声再生する再生装置、および再生方法を提供する。
【解決手段】被写体を連続撮影する撮像部2と、被写体方向からの音声の収音範囲を変更可能な左右音声収録部7を有し、撮像部2で連続して得られた複数の画像を合成し、合成画像を生成可能であり、複数の画像を連続撮影する際に、画像の動きに基づいて左右音声収録部7において収音範囲33a、33bを変更する。 (もっと読む)


【課題】 より簡易にマイクからの音声情報を用いて話者の方向を決定することが可能なプロジェクター等を提供すること。
【解決手段】 プロジェクター100が、音声を入力して音声情報を生成する4つのマイク110−1〜110−4と、前記音声情報に基づき、前記音声の音源(参加者30−1〜30−3)の方向を決定する音源方向決定部を含み、4つのマイク110−1〜110−4がプロジェクター100の外部または内部の前記音源の方向を決定可能な位置に配置される。 (もっと読む)


【課題】臨場感を維持しつつ、会議を効率的に再現可能とすること。
【解決手段】反射鏡によって入力された全周囲の画像を撮影する広角画像入力部801と、音声を入力する音声入力部802と、音声入力部802により入力された音声に基づいて音源方向を検出する音源方向検出部803と、広角画像入力部801により入力された画像をパノラマ画像に変形する画像変形部805と、前記パノラマ画像を構成する領域に含まれる画像のうち、音声入力部802から入力した音声の時間差もしくは強度に基づいて音源方向検出部803が検出した音源方向に対応する領域のパノラマ画像を抽出して、前記パノラマ画像ととともに部分画像として表示する画像音声出力部808と、を備える。 (もっと読む)


【課題】 一台のカメラで、複数の画像をディスプレイ一画面に並べて表示することはができない。
【解決手段】 第1の撮像対象物の映像を表示させている最中に撮像して取得した第1の撮像対象物の映像を記憶装置に記憶させる(S302)。撮影方向の制御により前記第1の撮像対象物よりも後に撮像された第1の撮像対象物とは異なる第2の撮像対象物の映像を表示装置に表示させる場合(S303)に、記憶装置に記憶された第1の撮像対象物の映像を、第2の撮像対象物の映像と併せて表示させるよう表示装置を制御する(S304)。 (もっと読む)


【課題】これまでよりも優れた全周映像の表示を実現する。
【解決手段】全周映像のうち特定の範囲の表示を行う映像表示技術と、特定の人物の箇所のみの映像を抜き出して表示する映像表示技術を組み合わせることにより、誰がどこへ向かって話しているか、3次元的な位置関係はどういうものであるかなどを容易に把握しうる全周映像表示を可能とする。人物が3次元的な位置関係を保って表示されることから、会話の流れを容易に把握することができる。実施形態によっては、抜き出した映像を表示するにおいて、位置調整や左右反転などの処理を入れることもでき、誰が誰に話しているかをさらに容易に把握することが可能となる。 (もっと読む)


【課題】
カメラ制御に際して生じる画像の揺れを低減するようにした撮影制御装置、その撮影方法及びプログラム、及びシステムを提供する。
【解決手段】
カメラによる撮影に基づく画像を表示器に出力する撮影制御装置は、カメラによる撮影の範囲を制御し、カメラにより撮影された画像から特定パターンを認識し、当該認識された特定パターンに基づいて撮影ターゲットを決定する決定し、カメラが制御されている間、当該決定された撮影ターゲットの位置又は大きさに基づいてカメラにより撮影される画像を処理する。表示器には、カメラが制御されている間、撮影ターゲットの位置又は大きさに基づいて画像処理がなされた整形画像が表示され、それ以外には、カメラにより撮影された画像が表示される。 (もっと読む)


【課題】 撮影時にズームレンズの拡大率を高倍率とした場合であっても、集音マイクによる画面上での音源からの集音を簡単かつ確実に行えるようにする。
【解決手段】 撮像装置10は、指向性を有する集音マイク34と、撮像手段18と、表示手段23を備える。さらに、撮像手段の撮像画像を表示手段に表示する画像表示手段20,21と、指向性を有する集音マイクの集音範囲を表示手段に撮像画像とともに表示する集音範囲表示手段44を備える。さらに、撮像手段はズーム手段11,12,16,19を備えるとともに、集音マイクはズーム手段のズーム動作に連動して集音範囲が変化し、これにより集音範囲表示手段は、該ズーム動作に連動して変化する集音範囲を表示手段に表示するように構成されている。 (もっと読む)


【課題】所定の被写体を自動的に撮影できるようにする。
【解決手段】撮影を行う撮像部を備え、前記撮像部の撮影方向を可変とした撮像装置であって、前記撮像部の撮影方向を変えながら撮影を行う第1の撮影処理手段と、前記第1の撮影処理手段により撮影された画像から被写体を識別する被写体識別手段と、前記被写体識別手段により識別された被写体のうち、外部からの情報に基づいて被写体を特定する被写体特定手段と、前記被写体特定手段により特定された被写体を撮影するように前記撮像部の撮影方向を変えて撮影を行う第2の撮影処理手段と、前記第1の撮影処理手段により撮影された画像及び前記第2の撮影処理手段により撮影された画像のうち少なくとも何れか一方の画像情報を送信する送信処理手段とを有する。 (もっと読む)


【課題】顔検出処理の精度を向上させることができる撮像装置を提供する。
【解決手段】撮像装置は、被写体像を光電変換することにより画像データを取得する撮像手段(撮像部104)を備える。また、撮像手段によって得られた撮影画像から、顔を検出するための評価値を演算し、評価値をしきい値と比較して顔判定を行い、評価値がしきい値より大きければ顔であると判定する顔検出手段(システム制御部110)を備える。また、音声を検出する音声検出手段(マイク21)を備える。顔検出手段は、音声検出手段の検出結果に応じてしきい値を変更する。 (もっと読む)


41 - 60 / 121