説明

Fターム[5C122FJ04]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音声分析/認識 (264)

Fターム[5C122FJ04]に分類される特許

161 - 180 / 264


【課題】他人に見せたくなるような画像か否かについて分類することが可能となるカメラおよび画像分類情報記録方法を提供する。
【解決手段】撮像部2によって取得した画像データを記録する記録部4と、画像データを再生表示するための表示部8、この表示部8に画像を表示中のカメラの動きを判定する動き判定部7を有している。この動き判定部7による動き情報に基づいて、撮影後に友人等に画像を見せた回数をカウントし、この回数に基づいて他人に見せたくなるような画像かどうか分類する。分類結果は、表示部8に表示する。
(もっと読む)


【課題】使用者毎にパラメータを簡易に設定することができる撮像装置を提供する。
【解決手段】一時記憶部1013は、所定の機能の実行に係るパラメータと使用者の属性を関連付けて記憶する。使用者識別部1012は、音声入力部1011に入力された使用者の音声に基づいて使用者の属性を識別する。システムコントローラ1001は、使用者識別部1012によって検出された使用者の属性に対応したパラメータを一時記憶部1013から読み出して設定する。 (もっと読む)


【課題】撮影画像から選別条件を判定することが困難な場合においても、複数の撮影画像の中から所望の画像の選択を容易にすることができるカメラを提供することを目的とする。
【解決手段】被写体の像を撮影する撮像部と、撮影時における周囲の音を検出する音検出部と、前記撮像部により取得された画像を、前記音検出部により検出された音の情報と関連付けて記録する画像記録部と、前記音の情報に基づいて、前記画像記録部に記録されている画像の並び替えを行う画像ソート部と、該画像ソート部により並び替えられた順序で画像を表示する表示部とを備えるカメラを採用する。 (もっと読む)


【課題】音声付き映像を非破壊編集する場合において、編集結果のうちの所望の発言者の音声に容易に所定の加工を施す。
【解決手段】カメラ74は被写体を撮影する。マイクロフォン21Aは、周囲の音声を取得する。マイコン62は、音声のレベルが所定の時間以上の間所定の閾値以上になった場合と、その後に所定の時間以上の間所定の閾値未満になった場合に、その音声に対応する音声付き映像の位置に、音声の特徴を示す発言者未定EM(start)または発言者未定(end)を付与する。本発明は、例えばビデオカメラに適用することができる。 (もっと読む)


【課題】被写体の検出精度の向上を図る。
【解決手段】被写体を撮像して主要被写体を含む被写体画像の画像データを取得する撮像部1と、被写体画像内の主要被写体である人物から発せられた音声を集音する集音部6とを備える撮像装置100に、撮像部により取得された画像データ及び集音部により集音された音声に基づいて、被写体画像内の主要被写体を検出する処理を行うCPU71を備えている。 (もっと読む)


【課題】画像解析により、高精度かつ有効な判別結果を得る視線判別処理の実行構成を実現する
【解決手段】画像中の顔領域、目鼻口を検出し、目鼻口の検出された顔画像の視線判別処理を実行する。視線判別処理は、(a)視線がカメラ方向を向いているポジティブ状態、(b)視線がカメラ方向を向いていないネガティブ状態、上記(a),(b)のいずれであるかを、各状態に対応する分類データからなる学習データを格納した視線判別辞書を利用して行う。具体的には、画像の画素ペアの差分値を比較照合データとして利用するPixDifアルゴリズムを適用する。本構成によれば、視線がカメラ方向を向いているかいないかの2つの状態判別という明確な区分による視線判別であり、判別処理の精度が高く、また判別結果の利用価値も高い構成が実現される。 (もっと読む)


【課題】撮像装置において、手ぶれの影響の少ない撮像画像を得ると共に、製造コストを抑制する。
【解決手段】ユーザによりシャッターボタンが押下されると(S1でYES)、DSPが撮像ユニットを駆動させ、撮像ユニットにより被写体が撮像されて、第1の撮像画像が生成される(S2)。上記S2により第1の撮像画像が撮像された直後、DSPは、マイクロフォンを駆動させて音声認識処理を開始し(S3)、マイクロフォンから入力された音声の中から所定の音声が認識されたとき(S4でYES)、撮像ユニットを駆動させると共にフラッシュ装置を用いて光を被写体に照射して、撮像ユニットにより被写体を撮像し、第2の撮像画像を生成する(S5)。第1の撮像画像に手ぶれが発生した場合でも、第2の撮像画像を撮像しているので、手ぶれの影響の少ない撮像画像を得ることができる。 (もっと読む)


【課題】近くに人がいるか否かに応じて適切な動作設定で自動撮像を行う。
【解決手段】例えば焦電型の赤外線センサや撮像画像解析などによって近くに人がいるか否かを判別する。そしてこの判別の結果に応じて、画像品質(圧縮率や画サイズ)や撮像間隔の設定を変更する。例えば近くに人がいるとした場合には高品位の撮像画像データが保存されるようにして、ユーザにとって価値があるとされる画像が高品位で記録されるようにし、近くに人がいないとした場合には低品位(小容量)の撮像画像データが保存されるようにして、ユーザにとってあまり価値がないとされる画像については記録容量をセーブすることができる。 (もっと読む)


【課題】ユーザが所望の音声付き画像を容易に検索することができるようにする。
【解決手段】判定部174は、音声付き動画像の音声の特徴量が、所定の閾値を超えるまたは下回るという検索条件を満たすかどうかを判定する。算出部175は、特徴量が条件を満たすと判定された場合、その特徴量と閾値との差分に基づいて、その特徴量に対応する音声付き動画像に対する評価値を算出する。選択部は、その評価値に基づいて、音声に対応する音声付き画像の画像を表示させる。本発明は、例えば、カムコーダに適用することができる。 (もっと読む)


【課題】
撮影者のナレーションを再生時においても撮影目標の音声とは独立に音量のコントロールを可能にする。さらにナレーションの記録、再生の有無の選択を可能にする
【解決手段】
撮影者のナレーションを録音するナレーションマイクを備え、オーディオエンコーダはLch記録用マイクと、Rch記録用マイクと、ナレーションマイクから得られる計3chの音声を各チャネルごとに独立にエンコードし、オーディオストリームを生成する。 (もっと読む)


本願は、画像を捕捉する画像捕捉装置及び技法に関連する。該技法は、画像捕捉装置を学習モードに設定し、該画像捕捉装置周囲において少なくとも1つの変数を検出し、該少なくとも1つの変数の通常状態を規定することを含む。さらに該技法は、少なくとも1つの変数が、通常状態から新たな状態へ所定の閾値レベルを超える遷移を行ったことを検出した場合、画像の捕捉を開始し、新たな状態を通常状態に再定義する。
(もっと読む)


【課題】番組を構成するナレーションを語った時のナレータの気分や感情などを、番組に使用されるコンテンツの選択に反映した番組を制作することができる番組制作システムと制作プログラムを得る。
【解決手段】ナレーションと音楽データとを含む番組を制作する装置であって、ナレータの基本音声データとナレーションのそれぞれの音声成分を比較し、比較結果に対応する音楽データを選択するコンテンツ選択部と、選択された音楽データと、音声成分を比較されたナレーションとを、番組を特定する番組識別子と関連付けて記憶する番組情報記憶部と、を有してなる。 (もっと読む)


【課題】特に複雑な操作を必要とせず、送信した画像情報の安全性を高めることができる撮像装置、画像提供システム、及び画像提供方法を提供すること。
【解決手段】撮影前に、撮影者による質問と被写体による応答とを入力させてMPU101に記憶させておく。撮影後に得られる画像情報に質問情報と応答情報とを含む認識情報を付帯させ、この画像情報をデジタルカメラ100からサーバ300に送信する。サーバへのアクセスがなされた場合には、質問と応答とによる認証を行って、画像情報の閲覧の可否を決定する。 (もっと読む)


【課題】本発明は、簡易な操作でユーザ所望の検出顔領域をフォーカス対象に決定することができる。
【解決手段】本発明のカムコーダ1は、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス機能を有しており、レンズ群7を介して取得した撮像光に基づいて生成された映像データから人物の顔領域FAを検出顔領域として検出し、検出顔領域に対応するテキスト情報を映像データに重畳することにより、当該映像データに基づく撮像画像における検出顔領域に順位テキスト情報TMを付加し、検出顔領域のうち、ユーザ所望の一の検出顔領域である選択顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。 (もっと読む)


【課題】本発明は、安価で普及しやすく、さらに公共モード機能の利用促進となるドライブレコーダシステムを提供することを目的としている。
【解決手段】静止画または動画を継続して撮影する撮影部110と、撮影したデータを順次記憶する端末記憶部120と、サーバと通信する端末通信部114と、事故を検知する加速度センサ118と、端末制御部112とを備え、端末制御部112は、加速度センサ118によって事故を検知した場合に、事故検知時刻からさらに少なくとも所定時間は撮影部110による撮影を継続し、撮影したデータを端末記憶部120に記憶すると共に、事故検知時刻の前後に撮影され端末記憶部120に記憶されたデータを、端末通信部114を用いてサーバ200に送信することを特徴とする。 (もっと読む)


【課題】プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かを精度良く推定して分類可能にすること。
【解決手段】動画像解析部1は、入力動画像の特徴を解析する。動画像分類部2は、動画像解析部1による解析結果を基に、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する。動画像解析部1は、画面切り替わり頻度測定部11、手ブレ有無判定部12、ボケ有無判定部13、コントラスト測定部14を備える。さらに、入力動画像に付随する音響の特徴を解析する音響解析手段を備えさせ、有音か無音か、雑音の有無、背景音楽の有無を、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかの判断材料として利用することもできる。 (もっと読む)


【課題】非定常的な雑音の多い環境であっても観測音から目的の環境音を高精度に認識するとともに、監視システムの監視効率を向上させる。
【解決手段】複数のマイク2a,2bによって周囲の音を観測することにより、複数の音源9a,9bから発せられた音が混合された観測音を表現する信号x1(t),x2(t)を取得する。そして、信号処理回路3に、信号x1(t),x2(t)を入力して音源9a,9bごとの分離信号を生成し、雑音除去回路4を経て、音認識回路5によって、音源9a,9bごとの分離信号によって表現される音が目的の環境音であるか否かを判定する。目的の環境音であると認識された場合、機器制御部6は、信号処理回路3から得られる当該音の音源方向に基づいて、カメラ80、マイク81およびスピーカ82を制御する。 (もっと読む)


【課題】天候や時間等の変化に対して違和感のないパノラマ画像を得る。
【解決手段】撮像手段としての撮像装置10からの映像信号がコンピュータ装置30のビデオキャプチャーボード31に供給される。レンズブロック部11はカメラコントローラ41からの駆動命令によって変倍用レンズが駆動される。撮像装置10は回転雲台50に設置され、パンチルタコントローラ43からの駆動命令によって各方向に駆動される。モードコントローラ42はコンピュータ装置30からの絶対位置駆動要求に対して撮像装置10及び回転雲台50の制御を行う。コンピュータ装置30には記憶装置32と画像処理装置33と制御装置34とが設けられ、これらの装置によってパノラマ画像の形成のための映像信号処理及び制御が行われる。このコンピュータ装置30で形成された映像信号がコンピュータモニタ60に供給されてユーザーインターフェースとされる。 (もっと読む)


【課題】カメラ撮影の際に、より有効に盗撮を防止できるようにすること。
【解決手段】カメラ撮影の際の盗撮防止機能を有する携帯端末1において、操作部22におけるシャッターキーの押下によりスピーカ部17からシャッター音を出力するように制御するとともに、前記シャッター音の出力の際にカメラ部12によるカメラ撮影を実行するように制御する制御部11と、スピーカ部17から出力された出力シャッター音と、マイク部18で集音された音とを比較し、出力シャッター音がマイク部18に集音されたか否かを判定する音認識部21と、を備える。制御部11は、音認識部21で出力シャッター音が集音されたと判定された場合にのみカメラ撮影を実行し、かつ、撮影された画像データを記憶部13に保存するように制御する。 (もっと読む)


【課題】膨大な枚数の画像それぞれに、それら膨大な枚数の画像の中から必要な画像を抽出するのに役立つ情報を付加して記録することができる撮影装置を提供すること、またその撮影装置で撮影された画像の被写体側の情報を参照して膨大な枚数の画像の中から必要な画像のみを抽出して再生表示することができる画像再生方法を有する画像再生装置を提供する。
【解決手段】音声検出モードが指定されたら、撮影時に被写体側の音声をマイクロフォンで拾って音声の音の大きさを撮影画像に結び付けて記録する。再生時には、その音の大きさが所定の大きさ以上の画像のみ(点線で囲まれた3コマ)を再生表示する。 (もっと読む)


161 - 180 / 264