説明

Fターム[5C122FJ04]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音声分析/認識 (264)

Fターム[5C122FJ04]に分類される特許

1 - 20 / 264



【課題】外部からの取得信号に基づく位置情報を取得することが困難である場合にも撮像地点の位置情報取得が可能な画像処理装置、位置情報付加方法およびプログラムを提供する。
【解決手段】外部からの取得信号に基づいて位置情報を取得する第1の取得部と、ユーザ入力に基づいた位置情報を取得する第2の取得部と、前記第1の取得部により取得した位置情報を撮像画像に付加する付加部と、を備え、前記付加部は、前記第1の取得部により前記位置情報を取得できなかった場合、前記第2の取得部により取得した位置情報を前記撮像画像に付加する、画像処理装置。 (もっと読む)


【課題】
録音時のALC増幅率を記録せずに記録後に音声信号の駆動雑音を低減する。
【解決手段】
レンズ(102)は駆動時に駆動雑音を発生する。カメラ制御部(119)はレンズ(102)の駆動時にスピーカ(120)から可聴音でない一定音圧の基準音を発生させる。マイク(115)は周囲音を取り込み、音声信号処理回路(137)はALC回路によりマイク(115)の出力音声信号を音圧レベルに応じた増幅率で増幅する。増幅された音声信号はメモリ手段(134)に記録される。カメラ制御部(119)はメモリ手段(134)から音声信号を読み出し、含まれる基準音の音圧により記録時の増幅率を算定する。カメラ制御部(119)は、別途記憶する駆動雑音信号を算定増幅率で増幅し、メモリ手段(134)からの音声信号から減算する。減算の前後でFFT(フーリエ変換)と逆FFTを適用する。 (もっと読む)


【課題】本発明は、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置、若しくは携帯機器に適用する、音声表示方法と、音声表示プログラムを提供することである。
【解決手段】本発明の音声表示方法を適用した音声表示装置の一例となるカメラ10は、ユーザの発する音声を後方音声取得部16で取得して、対象物であるペットの発する音声を前方音声取得部15で取得する音声取得ステップと。これら前方音声取得部15及び後方音声取得部16で得られた音声に従って、信号処理及び制御部11が表示内容を決定する表示内容決定ステップ、そして、この表示内容決定ステップで決定された表示内容が、表示部23に表示される表示ステップを有している。 (もっと読む)


【構成】イメージセンサ16は、撮像面で捉えられた光学像に対応する電子画像を出力する。CPU26は、繰り返し発行されるカウント信号を受け付け、カウント信号が特定カウント値を示す時期を受け付け時期に基づいて予測する。CPU26はまた、予測された時期に撮像面で捉えられた光学像に対応する電子画像をイメージセンサ16から取得する。
【効果】セルフタイマ撮影に関する操作性が向上する。 (もっと読む)


【課題】
複数のマイクを利用可能な環境で、マイク操作アイコンで画面が見にくくならないようにする。
【解決手段】
複数のワイヤレスマイクが通信装置(107)を介して利用可能であり、撮影対象となりうる人物に装着されている。CPU(101)は、画面に表示可能なアイコン数の範囲内で、撮影視野内の人物に装着されたマイクか否か、録音中か否か、画面から消えたか、画面に入ったか等に従い、アイコンの表示の要否を決定する。CPU(101)は、撮像部(120)の撮影画像に決定したアイコンを重畳した表示制御信号を表示制御部104に供給する。 (もっと読む)


【課題】電子カメラにおいて、動画を撮影する場合、マイク等より得られた音声から、予めメモリに記憶しておいた減算したい特定音を自動で減算することができない。
【解決手段】電子カメラにおいて、予め音の特徴情報を記憶しておく。そして、マイク等より得られた音声から特徴情報を自動で検出し、減算することにより音質が上がる。また、既に記録済みの動画においても、特徴情報を自動で検出し、減算することにより雑音の少ない動画を新規のファイルとして記録することができる。 (もっと読む)


【課題】記憶容量の増加を抑制可能な車両室外撮像装置等を提供する。
【解決手段】車両室外撮像装置は、車両の室の内部の人の所定の状況変化を検知する検知用マイク10、検知用カメラ20等の検知部と、車両の室の外部を連続的に撮像して一連の外部画像を生成する外部撮像部40と、人の所定の状況変化が検知部によって検知される場合、一連の外部画像のうちの一部を記憶する記憶部60と、を備える。車両室外撮像装置は、車両の室の内部を連続的に撮像して一連の内部画像を生成する内部撮像部70を備えることができる。この場合、記憶部60は、一連の内部画像のうちの一部も記憶することができる。 (もっと読む)


【課題】周囲に迷惑のかからない小声の操作でも、誤動作のない音声判定を可能とした撮影装置を提供する。
【解決手段】撮影装置10は、被写体を撮像する撮像部2と、上記撮像部2で得られた撮像結果を表示する接眼式の表示部30と、上記撮像部2で得られた画像を記録する記録部4と、音声を収音するマイクと、上記接眼式表示部30内に上記マイクによる音声操作が可能であるかどうかを知らせる表示を合成する表示制御部1dとを有する。 (もっと読む)


【課題】手ブレ補正機構の駆動音を簡単な構成で除去できる撮像装置及び撮像装置のノイズ低減方法を提供する。
【解決手段】本発明の撮像装置10は、ブレ補正動作を行うブレ補正機構21と、前記ブレ補正機構21の駆動時の音声を集音可能な集音部15M,15と、前記ブレ補正機構21の駆動時の音声より、前記ブレ補正機構21の駆動音を求める駆動音抽出部33と、前記駆動音抽出部33で求められた前記駆動音を記憶する記憶部16と、前記記憶部16に記憶された前記駆動音に基づいて、動画撮影時において前記集音部15M,15で集音される音声から、前記ブレ補正機構21の駆動音によるノイズを除去するノイズ低減処理を行う低減処理部34と、を備えること、を特徴とする。 (もっと読む)


【課題】撮影対象のシーンをより細かく特定することを可能にした撮影装置を提供する。
【解決手段】画像データに基づいてシーンを検出する画像検出手段と、音声データに基づいてシーンを検出する音声検出手段と、画像検出手段で検出されたシーンと音声検出手段で検出されたシーンとに基づいてシーンを特定するシーン検出手段と、を有する。 (もっと読む)


【課題】マイクの特性によらずエコーを低減することができるエコーキャンセル装置、それを用いた会議システム、およびエコーキャンセル方法を提供することを目的とする。
【解決手段】スピーカ信号を出力するスピーカ15a、15bと、スピーカー15a、15bからの音を収音しマイク素子を有するマイク3a、3bが接続されたTV会議端末1において、マイク素子から得られる複数のマイク信号を基にマイク3a、3bの指向性を示す感度パターンが異なる複数の相関関数を生成し、複数の相関関数からそれぞれ求められる遅延時間のうち最短の遅延時間を推定する遅延制御回路9と、最短の遅延時間を用いて複数のマイク信号のエコーを抑圧するエコー抑圧部8a、8bと、を備えることを特徴とする。 (もっと読む)


【課題】視聴者が違和感を覚えないように動画像を編集可能な動画編集装置及び撮影装置を提供すること。
【解決手段】ユーザが編集画面上で編集の開始位置及び編集の終了位置をそれぞれ指定すると、編集の開始位置及び編集の終了位置の音声レベルがそれぞれ検出される。その後、編集の開始位置の音声レベルと編集の終了位置の音声レベルとが比較され、比較の結果、編集の開始位置の音声レベルと編集の終了位置の音声レベルとの差が所定範囲を超える場合に、編集によって音声の接続が悪くなる旨がユーザに対して告知される。 (もっと読む)


【課題】撮像範囲内に人物が含まれない場合でも人物の発する音声を集音することができる撮像装置、撮像方法およびプログラムを提供する。
【解決手段】参加者53〜55を撮像する会議端末1がパンされて撮像方向がA3となり、カメラの撮像範囲B1内に参加者が含まれなくなった場合、画像P3には参加者53〜55が映らず、人物の顔を検出できない。このとき、アレイマイクの指向方向をC3に設定し、その集音範囲を、会議端末1を中心とする360°全方向から、撮像方向A3および撮像範囲B1によって特定される領域を除外した領域であるD3に設定する。これにより、参加者53〜55のいる領域が確実に集音対象の領域となり、さらに、参加者53〜55がいないとわかっている領域からは集音することを避けることができるので、参加者53〜55の発する音声を確実且つ明瞭に集音することができる。 (もっと読む)


【課題】 精度良く音を検出する音検出装置及びその制御方法、プログラムを提供する。
【解決手段】 音を検出するための閾値を用いて、音入力部から入力した音から特定の音を検出する。撮像部が撮像した画像を記録する。記録した画像と撮像部が撮像した現在の画像との差分をとり、現在の画像から、動体のある箇所を検出する。撮像部が撮像する画像中の特定位置を示す情報とその特定位置で起こり得る音を示す情報との対応を管理する。動体が検出された場合には、位置・音対応情報管理部で管理される音を検出するための閾値を変更し、その変更した閾値を用いて、該位置・音対応情報管理部で管理される対応を参照して、音入力部から入力した音から特定の音を検出する。 (もっと読む)


【課題】ノイズ低減処理における目的音の劣化を低減すること。
【解決手段】動作部が動作するタイミングを示す動作タイミング信号を検出するタイミング信号検出部と、音信号を取得する音信号取得部と、前記動作タイミング信号を検出して、前記動作部の動作によって生じるノイズ音が発生する可能性の高い期間に取得される音信号の第1周波数スペクトルと、前記ノイズが発生しない可能性の高い期間に取得される音信号の第2周波数スペクトルとを算出し、前記算出した第1周波数スペクトルの少なくとも一部を前記算出した第2周波数スペクトルの対応する部分に置き換えた周波数スペクトルに基づき、前記音信号に対してノイズ低減を行ったノイズ低減音信号を算出するノイズ低減処理部と、を備えることを特徴とする。 (もっと読む)


【課題】
従来、発音してペットなどの顔をカメラの方に向けさせる場合、どのような音が最適かわからないという問題があった。
【解決手段】
本発明では、被写体画像を撮像する撮像手段と、前記撮像手段に撮像指示を与える操作手段と、前記撮像手段が撮像する画像から顔を検出する顔検出手段と、予め登録された複数種類の音を発生する発音手段と、前記発音手段が音を発生してから前記顔検出手段で顔を検出するまでの時間を測定する時間測定手段と、前記時間測定手段により測定された時間を前記音の種類に対応させて保存する保存手段と、前記保存手段に保存された時間が最小となる音の種類を判別する判別手段とを有し、前記発音手段は、本撮影時に前記判別手段が判別した種類の音を発生させることを特徴とする。 (もっと読む)


【課題】音信号のノイズ低減処理を行う撮像装置、プログラム、記憶媒体を提供する。
【解決手段】推定ノイズ(N)および演算結果を記憶する記憶部(18)と、 音声入力部(21)で検出された音信号(S)と前記推定ノイズ(N)との演算を行う演算部(11)とを含み、前記演算部(11)は、前記推定ノイズ(N)と前記音信号(S)との類似度(Ip)に基づき推定ノイズ範囲を決定するとともに、前記推定ノイズ範囲と前記音信号(S)との関係に基づき前記推定ノイズ(N)を更新する撮影装置。 (もっと読む)


【課題】撮影者が意図する対象に合焦された撮影画像を、容易に取得することができる撮像装置を提供する。
【解決手段】
光学系による画像を取得する画像取得部(13)と、前記画像に含まれる顔画像である第1顔画像(68)を認識する顔画像認識部(56)と、周囲環境の音声の特徴に関する第1音声情報(80)を取得する音声取得部(28)と、特定の顔画像の特徴に関する第2顔情報(72〜78)と、特定の音声の特徴に関する第2音声情報(82〜88)とを、予め互いに関連付けて記憶する記憶部(32)と、前記音声取得部で取得された前記第1音声情報と、前記記憶部に記憶された前記第2音声情報との類似性に基づき、前記第1音声情報と前記第2音声情報とを関連付ける音声判定部(54)と、前記音声判定部による関連付けの結果と、前記顔画像認識部による認識の結果とを用いて、前記光学系の合焦位置を制御する合焦位置制御部(52)と、を有する撮像装置。 (もっと読む)


【課題】ビデオ会議において適切にカメラを選択する。
【解決手段】ビデオ会議用のカメラに関連した複数の音声入力の各々が、第1および第2の周波数範囲のそれぞれについての第1および第2の音声エネルギに処理(加工)される。カメラ選択は、前記音声入力のうちのどれが、前記第2の音声エネルギに対する前記第1の音声エネルギの比率が最も高いかが判定し、ビデオ会議のための映像を出力するための関連したカメラ視野を選択する。さらに、前記選択は、単独でまたは音声処理との組合せで、前記カメラからの映像入力を処理することができる。いずれにしても、前記選択は、少なくとも1つの顔の特性について各前記映像入力を処理し、前記映像入力のうちのどれが人の顔を映している可能性が最も高いかを判定する。結局、前記選択は、少なくとも部分的にこの映像に基づく判定に基づいて、ビデオ会議のための映像を出力するための関連したカメラ視野を選択する。 (もっと読む)


1 - 20 / 264