説明

Fターム[5C122FJ04]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音声分析/認識 (264)

Fターム[5C122FJ04]に分類される特許

21 - 40 / 264


【課題】ビデオ会議において適切にカメラを選択する。
【解決手段】ビデオ会議用のカメラに関連した複数の音声入力の各々が、第1および第2の周波数範囲のそれぞれについての第1および第2の音声エネルギに処理(加工)される。カメラ選択は、前記音声入力のうちのどれが、前記第2の音声エネルギに対する前記第1の音声エネルギの比率が最も高いかが判定し、ビデオ会議のための映像を出力するための関連したカメラ視野を選択する。さらに、前記選択は、単独でまたは音声処理との組合せで、前記カメラからの映像入力を処理することができる。いずれにしても、前記選択は、少なくとも1つの顔の特性について各前記映像入力を処理し、前記映像入力のうちのどれが人の顔を映している可能性が最も高いかを判定する。結局、前記選択は、少なくとも部分的にこの映像に基づく判定に基づいて、ビデオ会議のための映像を出力するための関連したカメラ視野を選択する。 (もっと読む)


【課題】利用者を新しい撮影方法で撮影し、撮影画像の出力方法の面白さを向上した撮影装置を提供する。
【解決手段】撮影システム1は、利用者を囲むように配置された撮影室10と、撮影室10内に位置する利用者を複数の角度から撮影可能な撮影部と、撮影室10内に設けられ、撮影部が取得した各撮影位置からの各撮影情報を表示するプレビューモニタ12とを備え、撮影部は、撮影室10内の利用者の位置である撮影中心を中心とし水平面内の円周上の所定間隔を隔てた複数の撮影位置に配置された複数のカメラ11を備え、複数のカメラ11を円周の所定の周方向の順番に順次撮影動作させて、利用者を各撮影位置から撮影し、各撮影位置の各撮影情報を取得可能であり、プレビューモニタ12は、各撮影位置の各撮影情報を、円周の所定の周方向の順番に順次表示する。 (もっと読む)


【課題】動作部によりノイズが発生したタイミングをより正確に判定すること。
【解決手段】構成部材の動作状態に応じた信号を出力するエンコーダと、前記動作検出部からの検出結果に基づき、予め決められた判定期間内において、予め決められた回数以上のパルス信号が前記動作検出部から出力されたか否かを判定し、前記判定期間内において前記回数以上のパルス信号の出力があったと判定された場合、前記構成部材が動作していると判定する動作タイミング判定部とを備えることを特徴とする。 (もっと読む)


【課題】ノイズ低減処理におけるノイズ推定の精度を向上させること。
【解決手段】予め決められた動作パターンに応じて動作部を動作させるタイミングを示す動作タイミング信号を検出するタイミング信号検出部と、音信号を取得する音信号取得部と、前記動作タイミング信号に基づき、前記動作部が動作する可能性の高い期間に取得された音信号の第1周波数スペクトルを得て、前記第1周波数スペクトルの音信号が、前記動作パターンに応じて予め決められているノイズ推定を実行するためのノイズ推定条件を満たすか否かを判定するノイズ推定判定部と、前記推定ノイズ算出判定処理部による判定結果に従って、前記第1周波数スペクトルに基づき、前記動作部の動作によって発生する駆動音を示す推定ノイズを決定するノイズ推定部と、前記第1周波数スペクトルから前記推定ノイズの周波数スペクトルを減算するスペクトル減算を行うノイズ低減処理部と、を備える。 (もっと読む)


【課題】連写撮影機能を備えたデジタルカメラなどの画像音声記録装置で、連写撮影の際、実際に音声のあったタイミングの撮影画像に対応付けて入力音声を記憶管理する。
【解決手段】連写撮影制御手段による複数枚の静止画像(A〜D)の連続撮影制御に伴い音声入力手段により入力される音声を記録し、前記連続撮影された複数枚の静止画像(A〜D)のうち、音声レベル判断手段により一定レベルを超える実際の音声が入力されたと判断されたところで撮影された静止画像データ(B)に対して、前記音声記録手段により記録された音声データを対応付けて記憶管理する。これにより、個別の静止画像データを音声付きで再生する場合でも、実際に音声が発せられたタイミングで撮影された静止画像(B)を再生表示するときにだけ前記記録した音声データを再生出力して違和感のない音声付き個別静止画再生を行うことができる。 (もっと読む)


【課題】レンズ交換を行うことなく、容易に、かつ効率的に広角画像の生成に必要な画像を取得可能とする。
【解決手段】CPU11は、ユーザが画角の長手方向を縦方向になるように、デジタルカメラ1を縦方向に構え、デジタルカメラ1を水平方向に動かしている間に、所定のトリガが検出される度に、移動方向の変化を判別し、所定の移動方向にあるときに、所定の周期(時間間隔)で複数枚の画像を連写する。そして、水平方向(左端から右方向)への移動で撮像した複数の画像から第1のパノラマ画像を合成し、水平方向(右端から左方向)への移動で撮影した複数の画像から第2のパノラマ画像を合成し、さらに、第1のパノラマ画像と第2のパノラマ画像とを合成し、最終的に、所望する広角画像を生成する。 (もっと読む)


【課題】録音中に代表的な静止画像を自動的に撮影及び記録する。
【解決手段】スクリーン上の映像が撮影領域内に収まるように、撮像部を備えた録音装置を録音現場に設置し、音声信号の記録を開始する。周期的に撮像部に撮影を行わせ、得られたテンポラリ画像を一時的に保存する。撮像部の出力に基づき、撮影領域内において映像(スライドショー用の映像)が表示されているスライド領域を検出すると共に、スライドタイトルが表示されているタイトル領域を検出する。その後、タイトル領域内における文字の変化を監視し、文字の変化が認められた場合、変化の直前に得られたテンポラリ画像を対象静止画像として取得する。対象静止画像の画像信号は、文字の変化タイミングを基準とした区間の音声信号に関連付けられて記録媒体に記録される。 (もっと読む)


【課題】スピーカの指向性を高める。
【解決手段】このスピーカ装置は、人数検出部110、周波数設定部120、変調部130、及びパラメトリックスピーカ140を有している。パラメトリックスピーカ140は、音声信号を超音波帯域に変調した変調信号が入力される。人数検出部110は、スピーカ装置の周囲に位置する人の人数を検出する。周波数設定部120は、人数検出部110が検出した人数に基づいて、変調信号の周波数を設定する。変調部130は、周波数設定部120が設定した周波数の変調信号を生成する。この変調信号は、パラメトリックスピーカ140に入力される。 (もっと読む)


【課題】展示品の撮影時に最適な撮影条件を設定することができるデジタルカメラを提供する。
【解決手段】被写体光を撮像して撮像信号を出力する撮像素子32と、撮影の方位を検出する方位検出部38と、位置情報を計測する位置計測部40と、前記位置情報及び前記撮影の方位を外部装置に送信する送信部44と、前記位置情報及び前記撮影の方位により特定される被写体を撮影する撮影条件の情報を前記外部装置から受信する受信部44と、前記撮影条件の情報に基づいて撮影条件の設定を行う撮影条件設定部30とを備える。 (もっと読む)


【課題】特定の音声と同期して、各種動作を実行することのできる撮影装置を提供すること。
【解決手段】外部からの外部音声を入力する音声入力手段140と、前記外部音声を解析して、前記外部音声の特性である外部音声特性を抽出する音声解析手段171と、第1の特定音声の特性を、第1特定音声特性として記憶する第1音声特性記憶手段172と、前記外部音声特性と、前記第1特定音声特性とを比較し、該比較結果に基づいて、撮影準備動作を起動するか否かを判定する第1判定手段173とを備えることを特徴とする撮影装置。 (もっと読む)


【課題】撮影時の状況や雰囲気に応じて撮影画像を自動的に加工するカメラ付き携帯電話端末において、撮影画像に人物の顔が写っておらず、撮影画像から人物の感情が抽出できない場合でも撮影時の状況や雰囲気を反映した適切な画像加工が行えるようにする。
【解決手段】携帯電話端末100は、無線を介して外部に存在する携帯電話端末を検出する周辺装置検出手段10と、撮像手段31が取得した画像データ302の加工方法を決定する加工方法決定手段20を具備し、周辺装置検出手段10における検出結果である周辺装置情報101に基づいて画像データ302の加工方法を決定するよう構成した。 (もっと読む)


【課題】 マイクホン入力信号からのオートフォーカス音やズーム音など機械音の高精度な除去が困難であった。
【解決手段】 本発明では、オートフォーカス音やズーム音といった機械音が,主にモータの回転周期によって決まる一定周期でスペクトルが変動する周期性の雑音であることに着目し、周期性の強い音源を検出することを特徴とする機械音検出部し検出した音源を機械音として記録することにより、事前に雑音測定・設定を行うことなく機械音除去が可能とする。 (もっと読む)


【課題】オートフォーカス動作や、ズーム動作を行う電気モーターの騒音を除去し、被写体からの所望の音信号のみを抽出することができる電子機器を提供する。
【解決手段】集音マイクa12は、被写体から到来する外部音Aと、機器動作に伴って発生し、機器筐体の外部から到来する第1の雑音yBとを集音する。集音マイクa13は、被写体から到来する外部音Aと、機器動作に伴って発生し、機器筐体の外部を回り込んで到来する第1の雑音と、機器動作に伴って発生し、機器筐体内部から到来する第2の雑音とからなる雑音xBを集音する。信号処理回路は、第1の集音マイクa12の第1の音声信号と第2の集音マイクa13の第2の音声信号とから、機器動作に伴って発生する第1、第2の雑音を除去し、被写体から到来する外部音Aのみを抽出する。 (もっと読む)


【課題】写っている人物の体調/気分をわかりやすく撮影すること。
【解決手段】デジタルカメラは、被写体を撮像して画像データを生成する撮像手段13と、被写体画像データに基づいて人物の顔の表情を検出する表情検出手段17と、撮影開始前に撮像手段13で生成された画像データを用いて表情検出手段17が検出した表情に基づいて人物の体調/気分を判定する体調/気分判定手段17と、体調/気分判定手段17による判定結果に基づいて所定の撮影開始条件を選択する撮影開始条件選択手段17と、選択された撮影開始条件を満たす場合に撮影を開始させる撮影制御手段17と、を備える。 (もっと読む)


【課題】 監視システムと警備員が存在する監視環境において、監視の隙を作らない事と、撮影する映像中で不要なパン/チルト/ズームを軽減する事の二つを両立させる。
【解決手段】 監視システムが監視領域内での異常状態を検知し、警備員の注目領域を検知した場合に、警備員の注意が払われていない領域が監視領域となるようにパン/チルト/ズーム処理を実行することにより、監視の隙を作らない事と、撮影する映像中で不要なパン/チルト/ズームを軽減する事の二つを両立する事を可能とした。 (もっと読む)


【課題】モノラルマイクしか搭載することができない場合であっても、音声の臨場感を高めて雰囲気豊かな音響効果を実現できるようにする。
【解決手段】顔検出部7は、撮像部6により撮影された画像内から被写体の顔を検出する。制御部1は、この被写体の顔の撮影画像内での位置を音源位置として特定した後、モノラルマイク8を介して集音部9により集音されたモノラル音声を特定音源位置に応じて疑似ステレオ化する。疑似ステレオ化する場合に、音源位置の画面左右端からの比率に合わせて左右チャンネルの音量差を調整することにより疑似ステレオ化する。 (もっと読む)


【課題】機械音スペクトルを予め測定することなく、録音時に駆動装置の動作に伴って外部音声に混入する作動音を適切に低減する。
【解決手段】音声を収音して第1、第2の音声信号x、xを出力する第1、第2のマイクロホンと、前記第1、第2の音声信号x、xを第1の音声スペクトル信号X、Xに変換する第1、第2の周波数変換部と、作動音を発生する発音体と前記第1及び第2のマイクロホンとの相対位置関係に基づいて、前記第1及び第2の音声スペクトル信号X、Xを演算することにより、前記作動音を表す作動音スペクトル信号Zを推定する作動音推定部と、前記第1及び第2の音声スペクトル信号X、Xから、前記推定された作動音スペクトル信号Zを低減する作動音低減部と、を備える、音声信号処理装置が提供される。 (もっと読む)


【課題】動画像における時系列的な変化態様に応じた動画効果を演出することが可能な画像処理装置、電子カメラ、及び画像処理プログラムを提供する。
【解決手段】第1の動画像に対して第2の動画像を重畳して表示可能に構成された画像処理装置において、前記第1の動画像における時系列的な変化態様を解析した解析情報を取得する取得手段と、前記取得手段によって取得された前記解析情報に応じて表示態様を変化させる動画像を前記第2の動画像として生成する動画像生成手段とを備える。 (もっと読む)


【構成】イメージセンサ16は、撮像面によって捉えられたシーンを表す画像を出力する。マイクロフォン48および音声処理回路50は、撮像面の近傍で発生した音声を継続的に取り込む。CPU36は、条件調整指示を受け付けたときイメージセンサ16から出力された画像に基づいて1または2以上のシーン候補を選択し、選択されたシーン候補の数が2以上であるときいずれか1つのシーン候補を確定シーンとして抽出する処理をマイクロフォン48および音声処理回路50の取り込み時間に応じて異なる態様で実行する。CPU36はまた、確定シーンに適合する態様で撮像条件を調整する。
【効果】条件調整指示に対する応答特性の向上とシーン判別精度の向上とを両立させる。 (もっと読む)


【課題】使用者の聴感上の違和感を低減しつつ、入力される音声信号のS/N比を向上させることが可能な音声処理装置を提供する。
【解決手段】音声処理装置は、音声信号を入力する音声入力部と、音声信号の通過帯域を制限する帯域制限フィルタを有し、帯域制限フィルタから出力される音声信号に対して所定の信号処理を行う信号処理部と、帯域制限フィルタの通過帯域幅を制御する制御部と、を備える。制御部は、音声信号のレベルに応じて通過帯域幅を変化させ、かつ、通過帯域幅を広げるときの速度を、通過帯域幅を狭めるときの速度よりも速くする。 (もっと読む)


21 - 40 / 264