説明

Fターム[5C122FJ04]の内容

スタジオ装置 (397,422) | 音声 (3,835) | 音声分析/認識 (264)

Fターム[5C122FJ04]に分類される特許

41 - 60 / 264


【課題】使用者の聴感上の違和感を低減しつつ、入力される音声信号のS/N比を向上させることが可能な音声処理装置を提供する。
【解決手段】音声処理装置は、音声信号を入力する音声入力部と、音声信号の通過帯域を制限する帯域制限フィルタを有し、帯域制限フィルタから出力される音声信号に対して所定の信号処理を行う信号処理部と、帯域制限フィルタの通過帯域幅を制御する制御部と、を備える。制御部は、音声信号のレベルに応じて通過帯域幅を変化させ、かつ、通過帯域幅を広げるときの速度を、通過帯域幅を狭めるときの速度よりも速くする。 (もっと読む)


【課題】音声信号から、該音声信号を取得した音声信号取得装置における駆動装置の動作に起因する雑音を適切に除去する。
【解決手段】音声付き動画撮像装置において、雑音期間設定部122は、撮像により取得された音声信号Aにおける、レンズを駆動する駆動部に対する駆動命令S1のタイミングからの所定の期間である第1の期間の終点(t1またはt2)から、該駆動部が上記駆動命令に応じた駆動を停止した時点t3までの期間である第2の期間を設定する。雑音レベル推定部124は、雑音期間設定部122が設定した第2の期間の信号を用いて雑音レベルの推定を行う。雑音除去部126は、雑音推定部124により推定した雑音レベルを用いて、第2の期間の信号に対して雑音の除去を行う。 (もっと読む)


【課題】
撮像光学系の駆動に伴う駆動雑音を精度良く除去する。
【解決手段】
カメラ制御部(119)はレンズ制御部(107)に撮影レンズ(102)の光学要素を駆動する駆動命令を送る。レンズ制御部(107)は、駆動部(106a,106b,106c)により撮像光学系(104)の光学要素を駆動する。マイク(115)は周囲の音声を取り込む。マイク(115)の出力音声信号には、レンズ駆動の駆動雑音が混入する。カメラ制御部(119)は、駆動命令から一定の期間内で、マイク(115)の出力音声から光学要素の駆動に特徴的な周波数成分を抽出し、一定レベル以上になる区間を検出し、雑音除去処理区間とする。カメラ制御部(119)は、雑音除去処理区間の音声を除去し、雑音除去処理区間の前後の音声から予測して補間する。 (もっと読む)


【課題】資料提示装置に関する技術を提供する。
【解決手段】資料提示装置であって、所定領域を撮像し、該撮像した撮像画像を撮像画像データとして取得する撮像画像データ取得部と、音声を表す音声データを外部から取得する音声データ取得部と、取得した音声データに基づいて、音声に対応した所定言語の文字列を文字列データとして取得する文字列データ取得部と、撮像画像データと文字列データとに基づいて、撮像画像と文字列とを含む合成画像を合成画像データとして生成する画像合成部と、合成画像データを外部に出力する出力部とを備える。 (もっと読む)


【課題】 本発明は、撮影条件を音声入力により容易に設定できる手段を提供する。
【解決手段】 撮像装置は、撮像部と、撮影条件設定部と、表示制御部と、音声受付部と、撮影条件変更部とを備える。撮像部は、被写体の像を撮像して画像を生成する。撮影条件設定部は、画像の撮影条件を設定する。表示制御部は、撮像部により撮像された画像に対応する表示画像を表示装置に表示させる。音声受付部は、表示画像に対応する撮影条件の補正を施す指示入力を音声で受け付ける。撮影条件変更部は、音声受付部により受け付けられた指示入力に応じて、撮影条件を変更させる。 (もっと読む)


【課題】自動撮影時、本番の撮影中に意図しない動作を行う恐れをなくし、かつ自動撮影の設定負荷を簡素化した撮影システムを提供する。
【解決手段】事前準備撮影時、音声・操作情報同期部8は、話者の音声と操作情報を、同期して音声・操作情報記憶部9に記憶する。本番の撮影時、音声同期操作情報識別部11は、話者の音声に同期して、音声・操作情報記憶部9に記憶した操作情報を用いて自動撮影を行う。 (もっと読む)


【課題】撮影時における撮影装置の焦点距離の情報やマイク間距離の情報が未知の音声付き動画像であっても、動画像中の所望の被写体から発せられる音声を強調して動画像とともに利用者に呈示できるようにする。
【解決手段】実施の形態の音声付き動画像呈示装置では、入力部が、複数チャンネルの音声と動画像とを含む音声付き動画像データを入力する。設定部は、利用者の操作に応じて、所望の方向から到達する音声の複数チャンネル間における時間差である到達時間差を設定し、主ビームフォーマ部は、設定部が設定した到達時間差を持つ方向の音声を強調した音声である指向性音声を生成する。出力制御部は、主ビームフォーマ部が生成した指向性音声を動画像とともに出力して、利用者に呈示する。 (もっと読む)


【課題】動画の観賞者が意識を集中すると考えられるタイミングにおいて、記録される音声信号に機械的な動作音等が混入することがない撮像装置を提供する。
【解決手段】動画撮影時において、マイク107を介してフィルタ回路109に入力された音声信号の解析が行われる。この解析の結果、所定時間の間、人の音声が検出されない場合に、NDフィルタ103の動作が許可される。人の音声が検出されている間は、NDフィルタ103の動作が禁止される。 (もっと読む)


【課題】駆動音による影響を適応的に抑制する撮像装置を提供する。
【解決手段】撮像装置は、駆動することで任意の状態の光学像を形成する光学部と、光学部が形成する光学像を画像信号として取得するセンサ部と、集音により音響信号を取得する集音部と、センサ部が画像信号を取得する際の環境である撮像環境を判定する撮像環境判定部1511と、光学部の駆動速度と光学部が駆動する際に集音部で取得された音響信号の処理方法との少なくとも一方を撮像環境判定部が判定する撮像環境に基づいて決定する動作決定部1512と、を備える。 (もっと読む)


【課題】 撮像装置によって撮像した画像をパソコン側に送信している場合、さらに音声信号をすべて転送すると、画像を送信するための通信帯域が圧迫されてしまうし、音声信号の転送のためのシーケンスを実行する必要があり、通信処理が複雑になってしまう。
【解決手段】 画像要求指示を受信する前の所定期間における音声信号のレベルの最大値を検出し音声信号のレベルに関する情報として送信する。 (もっと読む)


【課題】必要なタイミングを逃すことなく撮像を実行することが可能となる。
【解決手段】画像を撮像する撮像系11〜13と、特定の被写体に対応する画像上の特徴情報と、上記特定の被写体の探索を開始するためのトリガ情報とを記憶するプログラムメモリ21と、トリガ情報を入力するマイクロホン16L,16R及び音声処理部17と、入力したトリガ情報とプログラムメモリ21が記憶するトリガ情報との一致を判断し、その判断結果に基づいて撮像系11〜13が撮像する画像から特徴情報を探察するCPU19メインメモリ20及び音声認識部17aとを備える。 (もっと読む)


【課題】光学ズームに伴うレンズモータ系のノイズの影響を軽減しながら、画質の劣化を抑止して画像を撮影する。
【解決手段】ズームレンズ(11A)を含む光学レンズユニット11と、光学レンズユニット11を介した光像の画像信号を出力する撮像素子12と、ズームレンズ(11A)を高低2速度の一方で移動して撮像素子12に入射される光像をズームするレンズ用DCモータ27及びレンズ駆動部23と、撮像素子12からの画像信号の読出し領域を変更してズームするイメージセンサ駆動部25、AGC・A/D変換部13及び画像処理部14と、高速でズームレンズ(11A)を移動してズームする第1の制御処理と、低速でズームレンズ(11A)を移動してズームし、且つ撮像素子12からの画像信号の読出し領域を変更し、総合的なズーム速度を第1の制御処理と同等に制御する第2の制御処理とを切換えるCPU19とを備える。 (もっと読む)


【課題】複数の撮像モードのうち、ユーザが所望の撮像モードに簡単な操作で切り替える。
【解決手段】現在設定されている撮像モードが、当該撮像モードから他の撮像モードに変更可能な操作入力として所定の操作入力が関連付けられているか否かを判断する。そして、現在設定されている撮像モードに所定の操作入力が関連付けられている場合に、ユーザからなされた操作入力が所定の操作入力であるか否かを判別する。なされた操作入力が所定の操作入力であると判別された場合、撮像装置には現在設定されている撮像モードから、所定の操作入力が関連付けられている他の撮像モードが選択され、設定される。 (もっと読む)


【課題】音声に含まれる雑音をスペクトル減算により低減する際に、必要以上に多くのスペクトルを減算してしまう可能性を低減する。
【解決手段】複数の駆動部を備える音声信号処理装置であって、前記音声信号処理装置の周囲の音声から音声信号を生成する生成手段と、前記音声信号に含まれる前記複数の駆動部の動作に伴う駆動音を低減するために、前記音声信号の周波数スペクトルに対してスペクトル減算を適用する減算手段と、を備え、前記減算手段は、前記複数の駆動部が同時に動作している場合、周波数毎に、前記音声信号の周波数成分から、前記複数の駆動部それぞれの動作に伴う複数の駆動音それぞれの周波数成分の最大値を減算することを特徴とする音声信号処理装置を提供する。 (もっと読む)


【課題】撮像制御装置と物理的に接触することなく画像を取込むことができる遠隔写真モードを有する撮像制御装置を提供する。
【解決手段】装置は、ユーザがキーワードを発話することにより起動される。撮像制御装置は、遠隔取込み動作モードで初期設定された後、ある期間にわたり、発話に応答しない待機状態に入り、ある期間の後に、発話されるキーワードの検出に応答して画像を取込むことができる聴取状態に設定されるように構成される。 (もっと読む)


【課題】カメラで撮影した画像データを電話帳データに登録する際の信頼性を向上させ、画像データの登録に必要な制約条件を従来よりも緩和する。
【解決手段】携帯情報端末1は、音声を収音するマイク10と、画像を撮影するカメラ11と、画像撮影時にマイク10で収音した音声情報の音声認識処理を行って音声情報をテキスト化する音声認識部14と、カメラ11によって撮影された画像の解析処理を行い、この画像から人物画像を抽出する画像情報解析部18と、電話帳データを記憶する電話帳記憶部20と、音声認識部14から出力されたテキスト情報と関係する電話帳データを検索し、検索した電話帳データに画像情報解析部18によって抽出された人物画像を登録するデータ関連付け部21とを備える。 (もっと読む)


【課題】動作の容易な解析を可能とする。
【解決手段】運動としてゴルフ練習の場合、ゴルフクラブがボールに衝撃を加えたときにインパクト音が発生する。インパクト検出部16は、この各タイミングをインパクト点として検出し、ゴルフ練習の成果を比較するためのインパクト情報をインパクト情報格納部17に格納する。ダイジェスト動画の再生時に並べ替えに用いるインパクト情報が選択されると、CPU21は、インパクト情報格納部17を参照し、格納されたこのインパクト情報に基づいて、生成した複数のダイジェスト動画を並べ替える。 (もっと読む)


【課題】動画像の中から重要なシーンを推定し、重要なシーンを含む要約映像を作成する信号処理装置を提供する。
【解決手段】 複数の画像を含む動画像を入力する入力部と、前記動画像を解析して代表画像を抽出する抽出部と、前記代表画像を含む部分動画の変化量を算出する算出部と、前記変化量と所定の閾値とを比較して、動画像で出力するか画像として出力するかを判定する判定部と、判定した出力の形式に従って動画像または静止画像を出力する出力部と、を備える。 (もっと読む)


【課題】携帯機器を利用して動画を撮影する際に、被写体が発する音も撮影者が発するコメント等の音声も鮮明に録音できるようにする。
【解決手段】本体マイク76は、被写体が発する音を集音し、外部マイク101は撮影者が発する音声を集音する。入力レベル検出部82は、本体マイク76からの入力レベルを検出し、制御部81は、入力レベル検出部82が検出した入力レベルと予め定められているレベル閾値とを比較する。そして、本体マイク76からの入力レベルが入力レベル閾値以上である場合は、本体マイク76から入力された音声と外部マイク101から入力された音声とを合成して記憶部93に記録し、本体マイク76の入力レベルが入力レベル閾値未満の場合は、本体マイク76から入力された音声を記憶部93に記録する。 (もっと読む)


【課題】
静止画像と動画像を同時記録した後、静止画または動画像のどちらを視聴するのかを選択する煩雑さを解消する。
【解決手段】
再生形式判定部(127)は、動画像の顔認識位置の時間的変化が所定値より大きい場合、又は、動画像に付随する音声の音圧の時間的変化が所定値より大きい場合に、再生形式を動画像とし、それ以外では、再生形式を静止画とする。記録/再生制御部(104)は、操作者により選択された撮影データに対して、判定された再生形式で動画像又は静止画像を再生し、LCD(109)に表示する。 (もっと読む)


41 - 60 / 264