説明

Fターム[5C122FJ04]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音声分析/認識 (264)

Fターム[5C122FJ04]に分類される特許

101 - 120 / 264


【課題】操作者と周囲の人の反応を反映させた画像データの分類を可能とすること。
【解決手段】カメラ制御部20は、画像データの表示中の、当該画像データの表示時間に関する表示情報と、複数人の当該画像データに対する関心度に関する関心度情報とを取得し、記録部15によって、それら取得した表示情報及び関心度情報を、その表示中の画像データに関連付けて記録媒体に記録する。そして、その記録媒体に記録されている表示情報と関心度情報とに基づいて、記録媒体に記録されている画像データを分類する。 (もっと読む)


【課題】音センサにより取得された音情報を反映させた表示制御を可能にするデジタルフォトフレーム、情報処理システム、プログラム及び情報記憶媒体の提供。
【解決手段】デジタルフォトフレーム300は、画像を表示する表示部340と、表示部340の表示制御を行う表示制御部318と、周囲音を検知する音センサにより検知された音情報を取得する音情報取得部304を含む。表示制御部318は、取得された音情報に応じて、表示部340に表示される画像の表示態様を変化させる表示制御を行う。 (もっと読む)


【課題】指示タイミングに基づいて撮影タイミングを適応的に決定できる制御装置及び撮像装置等の提供。
【解決手段】制御装置は、時系列の指示タイミングである第1〜第nの指示タイミングを取得する指示タイミング取得部と、取得された前記第1〜第nの指示タイミングのうちの少なくとも第iの指示タイミングと第kの指示タイミングとに基づいて、前記第nの指示タイミングと撮影タイミングとの間の時間差を算出する時間差算出部と、第nの指示タイミングから時間差に対応する時間が経過したタイミングで撮影が行われるように、撮像部を制御する撮影制御部を含む。 (もっと読む)


【課題】映像と音声がずれることなく記録することができる撮影システムおよび通信端末を提供する。
【解決手段】被写体を撮影する撮像手段と、撮像手段による撮影に合わせて、第1の録音環境で被写体の音声を録音する録音手段と、第1の録音環境と異なる録音環境で録音された音声データを、無線ネットワークを介して外部装置から受信するネットワーク接続手段と、第1の録音環境で録音された音声データと、ネットワーク接続手段によって受信した音声データとの相関を検出する相関検出手段と、相関検出手段が検出した相関検出の結果に基づいて、ネットワーク接続手段によって受信した音声データを、撮像手段が撮影した映像に同期して関連付けた動画データを生成する動画生成手段と、を備えることを特徴とする。 (もっと読む)


【課題】簡単な構成で雑音を除去できる音声処理装置を提供する。
【解決手段】音声を集音し、音声信号を出力する集音手段60と、音源となる部材15,16,17,63,64,65の動作状態を検出する検出手段56と、前記検出手段により前記部材の動作が検出された場合に、前記音声信号から前記部材に応じて設定された周波数の信号を、前記音声信号から低減する処理を行う信号処理手段61と、を備える。 (もっと読む)


【課題】画像供給側装置が有する大量の画像から画像要求側装置が所望する画像を選別して画像要求側装置に送信することを可能とする。
【解決手段】画像供給側装置のCPU102は画像要求側装置から送信されたPHOTOリクエスト情報をSDRAM104に記憶する。CPU102はPHOTOリクエスト情報を受信した後に撮影された被写体の画像情報が、PHOTOリクエスト情報の被写体認識情報に合致するか否かを判別する。CPU102は画像情報が被写体認識情報に合致する場合、画像情報をPHOTOリクエスト情報の送信先情報で示される画像要求側装置に送信する。 (もっと読む)


【課題】本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することである。
【解決手段】カメラ10は、ユーザの発する音声を後方音声取得部16で取得し、対象物であるペットの発する音声を前方音声取得部15で取得する。これら前方音声取得部15及び後方音声取得部16で得られた音声に従って、信号処理及び制御部11が表示内容を決定する。そして、この信号処理及び制御部11で決定された表示内容が、表示部23に表示される。 (もっと読む)


【課題】被写体の検出精度の向上を図る。
【解決手段】被写体を撮像して主要被写体を含む被写体画像の画像データを取得する撮像部1と、被写体画像内の主要被写体である人物から発せられた音声を集音する集音部6とを備える撮像装置100に、撮像部により取得された画像データ及び集音部により集音された音声に基づいて、被写体画像内の主要被写体を検出する処理を行うCPU71を備え、CPUは、集音部により集音された音に基づいて主要被写体の属性を特定し、当該属性に基づいて、検出すべき当該主要被写体の検出基準を変更する。 (もっと読む)


【課題】電子機器本体の釦操作によって発する音に起因する誤動作を防止できる、電子機器を提供する。
【解決手段】電子機器101は、マイク40を含む。音はマイク40によって捉えられ、キー操作はサブマイコン46によって検出される。マイク40およびサブマイコン46の各々の出力に従う処理は、メインマイコン42によって実行される。メインマイコン42は、キー操作に応答してスピーカから効果音を出力する。ただし、効果音の出力設定は、起動状態および停止状態の間で変更される。メインマイコン42は、音の抽出特性を効果音出力の設定状態に応じて変更する。 (もっと読む)


【課題】撮影時の聴覚から得られる情感を撮影画像に表現できるようにする。
【解決手段】音声情報を取り込むマイクと、音声信号の特徴量を分析する音声分析回路と、前記マイクによって取得した音声信号の特徴量に基づいて画像処理パラメータ及び撮影パラメータを制御するシステム制御手段とを設け、撮影時の聴覚から得られる情感を撮影画像に表現できるようにして、臨場感のある撮影画像を生成できるようにする。 (もっと読む)


【課題】所定の場所に固定され、被撮影者を撮影するとともに、その撮影時の音声も記録することができる撮影装置、通信端末、サーバ、撮影方法及び通信方法を提供する。
【解決手段】所定の撮影エリアAを撮影可能な撮影装置10であって、撮影エリアAに被撮影者Pが存在するときに、被撮影者Pを撮影するための撮影信号を受信する通信手段と、撮影信号に含まれている位置情報に応じて撮影エリアAにいる被撮影者Pを特定し、撮影を実行する撮影部13と、撮影部13の撮影に基いて撮影データを生成する撮影データ生成手段14と、被撮影者側から音声を取得し、音声データを生成する音声データ生成手段15と、撮影データ及び音声データを関連付けて記録するように指示する記録制御手段16を備える。 (もっと読む)


【課題】ユーザが求める文字列を迅速かつ簡単に画像中に記録可能な撮像装置を得る。
【解決手段】サンプリング部がマイクを介して「かわいい」という音声をサンプリングする。サンプリング部は音声をデジタル音声信号に変換して、認識部に送信する。認識部は、「かわいい」というデジタル音声信号を、音声認識メモリに記憶された音声認識辞書データを参照しながら、「かわいい」というテキストデータに変換し、テキスト処理部に送信する。音声認識辞書データは、ペットを撮影する場合、「かわいい」という言葉を使用する頻度が高いと記憶している。そのため、マイクから入力された音声が認識しづらい場合であっても、「かわいい」という音声を容易に認識することができる。テキスト処理部は、「かわいい」というテキストデータを画像に変換する。合成部は、テキスト形状データを撮影画像と合成し合成撮影画像を作成する。 (もっと読む)


【課題】多数の画像データを、簡便な処理によって、被写体に因んだ音声データの特性に応じて分類したり、特性が顕著な順番に並べたりして、再生順序に反映させ、興趣性のある再生順序で画像データを再生する。
【解決手段】デジタルカメラ100は、画像データ102A〜102D各々に関連付けられた音声データ104A〜104Dの周波数を解析する周波数解析部106と、解析された周波数に応じて、話者の性別を含む音声データの特性情報108A〜108Dを判定する音声判定部110と、特性情報を1つ以上の画像データ各々に関連付ける関連付け部112と、1つ以上の画像データのなかから、各々に関連付けられた特性情報に基づいて、再生対象となる再生対象画像データを選択する画像選択部116と、選択された再生対象画像データをLCD380に再生する再生制御部118と、を備えることを特徴とする。 (もっと読む)


【課題】準備作業の負担が小さく適切な音声信号の選択が可能な技術を提供する。
【解決手段】情報処理装置は、撮像手段101と、撮像手段101による撮像方向501に連動して指向性502の方向を変更し、複数のマイクからそれぞれ送出された複数の音声信号を検知するためのアンテナ202と、アンテナ202が検知した各音声信号の強度を測定する測定手段と、測定手段が測定した各音声信号の強度を比較して、復調の対象とする音声信号を選択する選択手段と、選択手段が選択した音声信号を復調して出力する出力手段と、を備える。 (もっと読む)


【課題】 ビデオ会議システム(テレビ会議システム)において、発言者の発声開始時点からその発言者を撮影・表示できるようにする。
【解決手段】 カメラ203による撮影を制御する撮影制御装置100において、会議の参加者に係る情報であって、当該参加者の位置情報を含む参加者情報を格納する情報格納部212と、会議の参加者のうちの第1の参加者が発した音声の内容を音声認識する音声認識部213と、音声認識部213によって音声認識された内容と参加者情報とに基づいて、会議の参加者の中から第2の参加者を特定する特定部214と、特定部214によって特定された第2の参加者の位置情報に基づいて、カメラ203を制御するカメラ制御部217を具備する。 (もっと読む)


【課題】従来の動画再生編集装置は、ユーザの好みにあった箇所を抽出するのが困難であった。
【解決手段】記録媒体108に記録された動画を再生する動画再生装置であって、音声を集音する集音部103と、集音部103による音声を解析する音声解析部104と、動画の再生時に、音声解析部104の解析結果を再生位置とともに記録する音声記録部105と、音声記録部105における解析結果に基づき、動画の再生位置毎の優先順位を算出する優先順位算出部107と、優先順位を基に、動画を再生する再生部109と、を備えることにより、ユーザの興味のあるシーンのみを簡単に再生、及び、編集することが可能となる。 (もっと読む)


【課題】顔認証機能を有するカメラシステムにおいて、複数の被写体が存在しても次々と各被写体に容易にフォーカスを合わせる。
【解決手段】被写体を撮像する撮像手段と、撮影画像のうち、所定のAFエリア内でフォーカス調整を行うオートフォーカス手段と、フォーカス対象とすべき複数の被写体を、その顔認証に必要な情報と、撮影時にフォーカス対象とする順番とともに、予め登録するフォーカス対象登録手段と、前記予め登録された複数のフォーカス対象とすべき被写体の中から撮影中にフォーカス対象とする被写体を指定するフォーカス対象指定手段と、前記撮像中の被写体と、前記指定されたフォーカス対象とする被写体とを顔認証する顔認証手段とを備え、前記顔認証により、前記撮像中の被写体が前記指定されたフォーカス対象とする被写体と同一人物であると判定された場合に、該撮像中の被写体に対してフォーカス調整を実行する。 (もっと読む)


【課題】 音声入力した文字列を画像に重畳する際の表示位置の適正化を図った撮像装置、撮像制御方法及びプログラムを提供する。
【解決手段】 撮像装置(1)は、画像を撮像する撮像手段(2)と、入力音声を文字列に変換する変換手段(11)と、前記文字列を前記画像に重畳表示する際の表示位置を決定する決定手段(11)とを備え、好ましくは、前記決定手段(11)は、前記画像内の主要被写体に重ならない位置を、前記文字列の表示位置として決定し、または、前記画像内の主要被写体が人物である場合に、その人物の顔に重ならない位置を、前記文字列の表示位置として決定し、または、前記画像内の主要被写体に重なる位置を、前記文字列の表示位置として決定する。 (もっと読む)


【課題】設定されている撮影モードが適切であるか否かを動画像の撮影中でも判定することができる撮像装置を提供する。
【解決手段】複数の撮影モードを有する撮像装置であって、動画像の撮影中に、撮影シーンに適した撮影モードを自動的に判定する適切撮影モード自動判定部231と、動画像の撮影中に、現在設定されている撮影モードと、適切撮影モード自動判定部231によって自動的に判定された撮影モードとを比較し、現在設定されている撮影モードが前記適切撮影モード自動判定部によって自動的に判定された撮影モードに含まれているか否かを確認するモード比較部232とを備える撮像装置。 (もっと読む)


【課題】カメラ本体だけで音声認識による字幕つきのディスク作成し、かつ顔認識により人別に表示できるようなメニューを生成することで、ユーザにとって使い勝手の良い情報記録再生装置を提供する。
【解決手段】複数の記録媒体に対応したドライブ装置を複数搭載し、前記記録媒体に応じた規格に準拠した記録再生を行なうことが可能な情報記録再生装置において、前記情報記録再生装置内に入力された映像信号から顔や人を認識する顔及び人物認識装置と、入力された音声信号から人の声を認識する音声認識装置と、前記顔及び人物認識装置と前記音声認識装置からの認識された結果を管理する認識制御部と、前記音声認識装置で認識された言葉をテキスト化する音声テキスト化装置と、複数の媒体同士でのデータのやり取りを管理するダビング管理装置とから構成されており、ダビング時に音声から字幕を生成する。 (もっと読む)


101 - 120 / 264