説明

Fターム[5C122HA04]の内容

スタジオ装置 (397,422) | 一般技術 (37,735) | 画像データと他の信号の対応付け (2,311) | 画像データと音声データとの対応付け (209)

Fターム[5C122HA04]に分類される特許

1 - 20 / 209



【課題】撮影者の意図を反映させた音を用いて、撮影時の背景や感情を強く共有することができる画像情報を生成することが可能な画像編集装置を提供する。
【解決手段】撮影した画像情報11に含まれる撮像対象情報に関連付けられた音情報を該画像情報11に付与する画像編集装置であって、撮影した画像情報11から撮像対象情報と構図情報とを撮像対象判別手段12により抽出し、前記撮像対象情報を基にして該撮像対象情報に関連付けられる音情報を音情報取得手段13により取得した後、音情報編集手段14により、撮像対象判別手段12からの前記構図情報に基づき、音情報取得手段13からの前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力し、撮像・音情報統合手段15によって、前記画像情報と前記調整後音情報とを統合して画像・音統合情報16として出力する。 (もっと読む)


【課題】異なる複数の周波数の音波の信号の位相を一致させる各周波数毎の調整値を、効率的に算出する画像表示装置、マイクロフォンの調整方法を提供する。
【解決手段】音源が発する音波を検出するマイクロフォンM1等を有するマイクロフォン群と、音波がマイクロフォン群に到達する時間差に基づき、音源位置を算出する音源位置算出手段とを備えた画像表示装置1で、各マイクロフォンから等距離だけ離れた位置に配置して、音波として、異なる複数の周波数の音波を含むホワイトノイズを発する試験音波発生手段80、85と、音源位置算出手段によって算出した試験音波発生手段の位置に基づき、異なる複数の周波数の音波がマイクロフォン群に到達する時間差を、各周波数毎に算出し、時間差を零にするようにマイクロフォン群によって検出した音波の信号の位相を一致させる各周波数毎の調整値を、一括して算出する調整値算出手段と、を有する。 (もっと読む)


【課題】
複数のマイクを利用可能な環境で、マイク操作アイコンで画面が見にくくならないようにする。
【解決手段】
複数のワイヤレスマイクが通信装置(107)を介して利用可能であり、撮影対象となりうる人物に装着されている。CPU(101)は、画面に表示可能なアイコン数の範囲内で、撮影視野内の人物に装着されたマイクか否か、録音中か否か、画面から消えたか、画面に入ったか等に従い、アイコンの表示の要否を決定する。CPU(101)は、撮像部(120)の撮影画像に決定したアイコンを重畳した表示制御信号を表示制御部104に供給する。 (もっと読む)


【課題】
撮影者のナレーションを再生時においても撮影目標の音声とは独立に音量のコントロールを可能にする。さらにナレーションの記録、再生の有無の選択を可能にする
【解決手段】
撮影者のナレーションを録音するナレーションマイクを備え、オーディオエンコーダはLch記録用マイクと、Rch記録用マイクと、ナレーションマイクから得られる計3chの音声を各チャネルごとに独立にエンコードし、オーディオストリームを生成する。 (もっと読む)


【課題】 複数の人物に対してそれぞれが所望する画像を容易に分配することができる画像処理装置を提供する。
【解決手段】 集音された音声を入力する音声入力部22と、前記音声入力部から入力された音声の人物特定要素を抽出する音声処理部24と、特定の人物の声が有する固有のパターンを記録する音声記録部26と、前記人物特定要素と前記パターンとの特徴を比較することにより話者を特定する話者特定部4と、画像データを取得する画像取得部4と、前記画像データに基づく画像を出力する画像出力部20と、前記画像出力部により前記画像を出力している間に前記話者特定部により特定された前記話者を示す情報と前記画像データとを関連付けた分類データを作成する画像分類部4とを備える。 (もっと読む)


【課題】撮影者が意図する対象に合焦された撮影画像を、容易に取得することができる撮像装置を提供する。
【解決手段】
光学系による画像を取得する画像取得部(13)と、前記画像に含まれる顔画像である第1顔画像(68)を認識する顔画像認識部(56)と、周囲環境の音声の特徴に関する第1音声情報(80)を取得する音声取得部(28)と、特定の顔画像の特徴に関する第2顔情報(72〜78)と、特定の音声の特徴に関する第2音声情報(82〜88)とを、予め互いに関連付けて記憶する記憶部(32)と、前記音声取得部で取得された前記第1音声情報と、前記記憶部に記憶された前記第2音声情報との類似性に基づき、前記第1音声情報と前記第2音声情報とを関連付ける音声判定部(54)と、前記音声判定部による関連付けの結果と、前記顔画像認識部による認識の結果とを用いて、前記光学系の合焦位置を制御する合焦位置制御部(52)と、を有する撮像装置。 (もっと読む)


【課題】電子機器を扱いやすい学習器として動作させること。
【解決手段】電子機器は、被写体像を撮像する撮像部12と、撮像部12で撮像された画像から所定の対象物を認識する第1認識部16と、対象物に対応する音声情報を記憶する音声情報記憶部14と、音声情報を再生する音声再生部22,23と、指示に応じて、第1認識部16で認識された対象物に対応する音声情報を再生するように音声再生部22,23および音声情報記憶部14をそれぞれ制御する第1制御部16と、を備える。 (もっと読む)


【目的】検査箇所ごとに異なる妥当性条件に合致した証拠となる画像を得る。
【構成】検査箇所の検査が終了すると,証拠となる静止画として採用されるための妥当性条件33が検査端末の表示画面13に表示されながら,検査が終了した箇所が動画で撮像される。撮像された動画を構成する静止画の撮像状況をチェックしながら,撮像状況と妥当性条件とが比較され,スコア85が算出される。算出されたスコア85が所定値以上である静止画が撮像されている動画の中から抽出され,証拠の画像とされる。 (もっと読む)


【課題】録音中に代表的な静止画像を自動的に撮影及び記録する。
【解決手段】スクリーン上の映像が撮影領域内に収まるように、撮像部を備えた録音装置を録音現場に設置し、音声信号の記録を開始する。周期的に撮像部に撮影を行わせ、得られたテンポラリ画像を一時的に保存する。撮像部の出力に基づき、撮影領域内において映像(スライドショー用の映像)が表示されているスライド領域を検出すると共に、スライドタイトルが表示されているタイトル領域を検出する。その後、タイトル領域内における文字の変化を監視し、文字の変化が認められた場合、変化の直前に得られたテンポラリ画像を対象静止画像として取得する。対象静止画像の画像信号は、文字の変化タイミングを基準とした区間の音声信号に関連付けられて記録媒体に記録される。 (もっと読む)


【課題】
記録日時が異なる音声を再生する場合、重複する音声内容が続けて再生されないようにする。
【解決手段】
記録日時の異なる複数の音声データを再生対象とする選択に対し、プレイリスト生成部(104)は、選択された複数の音声データに対して重複する音声内容の有無を判定し、重複する音声内容が一つの音声データのみに残るように再生範囲を決定する。プレイリスト生成部(104)は、再生対象の音声データと、その音声データの再生範囲を示すプレイリストを生成する。フォトフレーム制御部(105)は、プレイリスト生成部(104)のプレイリストに従い、音声再生制御部(107)及びスピーカ(108)により音声データを再生出力させる。 (もっと読む)


【課題】特定の音声と同期して、各種動作を実行することのできる撮影装置を提供すること。
【解決手段】外部からの外部音声を入力する音声入力手段140と、前記外部音声を解析して、前記外部音声の特性である外部音声特性を抽出する音声解析手段171と、第1の特定音声の特性を、第1特定音声特性として記憶する第1音声特性記憶手段172と、前記外部音声特性と、前記第1特定音声特性とを比較し、該比較結果に基づいて、撮影準備動作を起動するか否かを判定する第1判定手段173とを備えることを特徴とする撮影装置。 (もっと読む)


【課題】別の録音装置により録音された音声と撮影された動画の同期を容易に取ることができる撮像装置を提供する。
【解決手段】音声を出力するスピーカ6と、動画を撮影する動画撮影部20と、前記音声と前記動画の同期位置を指示する指示手段14と、前記動画撮影部による撮影中に前記指示手段による指示が行われた場合に前記スピーカから前記音声を出力する音声出力制御部8と、前記動画撮影部により撮影されている動画を構成するフレーム画像の中で、前記音声の出力時に撮像されているフレーム画像を同期フレーム画像として特定するフレーム画像特定手段4とを備える。 (もっと読む)


【課題】臨場感のあるパノラマ映像の再生を行う。
【解決手段】撮像装置を水平方向に振りながら複数の入力画像(静止画像)を撮影し、複数の入力画像を合成することでパノラマ画像を生成する。複数の入力画像を撮影する際、マイク部の出力信号を記録しておく。パノラマ画像の再生時には、パノラマ画像内に抽出枠を設定し、パノラマ画像上で抽出枠を移動させながら抽出枠内の画像を表示部に更新表示させることで、パノラマ画像の全体を、一定時間(PREP)をかけて再生する。この際、記録音響信号に基づくリンク音響信号を同時に再生する。例えば、楽器321の表示時には楽器321の発生音が同時に再生されるように、人物323の表示時には人物323の発生音が同時に再生されるように、指向性制御を利用してリンク音響信号を生成する。 (もっと読む)


【課題】撮像された画像に関連付けられている音信号のノイズを適切に低減することができる信号処理装置を提供する。
【解決手段】信号処理装置は、撮像装置により撮像された画像に関連付けられている音信号に対して、画像が動画である場合と静止画である場合とに応じて、それぞれに応じたノイズ低減処理をする処理部、を備える。 (もっと読む)


【課題】カラオケ演奏曲の演奏時に実行された演出効果を別のカラオケ装置においても再現可能とし、ユーザの一体感を向上する。
【解決手段】カラオケ装置10は、カラオケ演奏曲を特定する曲ID、そのカラオケ演奏曲を過去に歌唱した歌唱者を含む所定範囲の映像データ、及び、上記過去の歌唱時に実行された照明データを記憶したホストサーバ20に対し、通信可能に接続されている。カラオケ装置10は、楽曲データ記憶手段と、カラオケ演奏曲の予約受付手段と、楽曲再生手段と、曲IDをホストサーバ20に送信して、その曲IDに対応した映像データ及び照明データを取得するデータ取得手段と、楽曲データの再生にしたがい、映像データを表示可能な表示部109と、照明装置50に照明データに対応した照明を実行させるための制御信号を出力する、制御信号出力手段とを有する。 (もっと読む)


【課題】
臨場感のある音声の再生または記録を行う手段を提供する。
【解決手段】
一例として、撮像し、映像信号を出力する撮像部と、音声が入力され、音声信号を出力
する音声取得部と、該撮像部から出力された映像信号と該音声取得部から出力された音声
信号とを記録する記録部と、映像信号から特定被写体の位置を検出する物体検出部と、音
声信号から検出された特定被写体に対応する音声を抽出する音声抽出部と、物体検出部で
検出された特定被写体の位置によって、音声抽出部によって抽出された音声信号の調整を
行う音声信号処理部と、を有する。 (もっと読む)


【課題】複数の記録媒体に連続して記録された動画ファイルが、音声を欠落させることなく再生されるようにする。
【解決手段】ストリーム生成器であって、符号化音声データと符号化映像データとを多重化して、第1ストリームと第2ストリームとを生成するパケット多重化部と、分割指示を受けると、前記第1ストリームの最後に表示されるべき前記符号化映像データに対応する最終ビデオフレームと、前記最終ビデオフレームの提示期間の終了時刻を提示期間内に有するオーディオフレームである最終オーディオフレームとを決定する分割タイミング生成部と、前記最終ビデオフレームの提示時刻までの提示時刻を有するビデオフレーム及び前記最終オーディオフレームの提示時刻までの提示時刻を有するオーディオフレームが前記第1ストリームに含まれるように前記パケット多重化部を制御する多重化制御部とを有する。 (もっと読む)


【課題】 雑音低減処理を効果的に実施する。
【解決手段】 画像拡大の指示があると、光学ズームを断続的に実行し、補完的に電子ズームを行い、画像が一定の割合で拡大しているように見える画像を生成し、光学ズームの駆動している期間の前および/または後の音声信号に基づいて、光学ズームの駆動している期間の音声信号に含まれる光学ズームの駆動音を低減する。 (もっと読む)


【課題】
従来技術では、別機材で記録された動画像と音声とを精度良く同期させることが難しかった。
【解決手段】
本発明に係るカメラは、被写体像を撮像し、撮像信号を出力する撮像部と、記録開始指示に基づいて前記撮像部により出力された撮像信号を動画像として記憶媒体に記録させる動画記録制御部と、前記記録開始指示に基づいて第1識別音を発する音発生部と、前記第1識別音が発せられたタイミングを示す識別情報を前記動画像に関連付けて前記記憶媒体に記録させる識別情報記録制御部とを有することを特徴とする。 (もっと読む)


1 - 20 / 209