説明

国際特許分類[G10L15/26]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声をテキストに変換するシステム (3)

国際特許分類[G10L15/26]に分類される特許

1 - 3 / 3


【課題】リソースが制限された環境のための一組のアプリケーション・プログラム・インターフェース(Application Program Interface)(API)を提供する。
【解決手段】APIは、リソースが制限された環境のためのオペレーティング・システムの様々なコンポーネント及びモジュールと接続するためのメカニズムを、コンピュータ・アプリケーションに供給する。前記APIはさらに、リソースが制限された環境においてランする埋め込み型システムにおいて共通して見られる入力/出力装置と接続するためのメカニズムを供給する。 (もっと読む)


【課題】撮影映像とテキスト情報とを容易に同期させて表示できるヘッドマウントディスプレイを提供する。
【解決手段】ヘッドマウントディスプレイ200のカメラ7は、使用者3〜5が視認する説明者6を撮影することができる。ヘッドマウントディスプレイ200のマイクは、説明者6の発話音声を収録できる。マイクによって収録された発話音声は音声認識され、発話内容を示す音声テキストが作成される。作成された音声テキストは、カメラ7によって撮影された撮影映像に重ねられ、表示映像が作成される。音声テキストの開始時点と、撮影映像の開始時点とをそろえることで、音声テキストと撮影映像とは同期付けられる。表示映像は、使用者3〜5が視認可能なように表示される。使用者3〜5は、表示映像を視認することで、説明者6の映像と音声テキストとを関連付けて認識できる。 (もっと読む)


【課題】複数の音声入力部から入力された音声から、特定方向から発せられる目的音と撮影者音声とを抽出し、当該撮影者音声を含むシーンの切れ目情報からなるチャプター情報を再生時に利用する音声処理装置等を提供する。
【解決手段】本発明に係る音声処理装置は、複数の音声を取得する音声取得部と、取得される複数の音声から、所定の音声を抽出する音声抽出部と、抽出される所定の音声に基づいて、複数の音声の区切りを判定する判定部と、判定される区切りに基づいて、所定の音声に対応付けられる区切りを示す情報を生成する生成部と、生成される区切りを示す情報を表示する表示部と、を備える。 (もっと読む)


1 - 3 / 3