説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

41 - 50 / 925


【課題】リソースが制限された環境のための一組のアプリケーション・プログラム・インターフェース(Application Program Interface)(API)を提供する。
【解決手段】APIは、リソースが制限された環境のためのオペレーティング・システムの様々なコンポーネント及びモジュールと接続するためのメカニズムを、コンピュータ・アプリケーションに供給する。前記APIはさらに、リソースが制限された環境においてランする埋め込み型システムにおいて共通して見られる入力/出力装置と接続するためのメカニズムを供給する。 (もっと読む)


【課題】適切な音声装置の制御が可能な電子機器を提供する。
【解決手段】対象者を含む画像を撮像可能な撮像装置の撮像結果を取得する取得装置と、前記撮像装置による撮像結果から前記対象者の大きさ情報を検出する第1検出装置と、前記第1検出装置が検出した前記大きさ情報に基づいて、指向性を有する音声装置の位置及び/又は姿勢を調節する駆動制御装置と、を備えている。 (もっと読む)


【課題】
複数の文から抽出した情報を利用して発話スタイルを推定する文書読み上げ支援装置を提供することである。
【解決手段】
実施形態の文書読み上げ支援装置は、学習用の文書から抽出された複数文の素性情報と発話スタイルの対応付けを学習したモデルを格納するモデル格納手段と、読み上げ対象となる文書を取得する文書取得手段と、前記文書取得手段で取得された文書の各文から素性情報を抽出する素性情報抽出手段と、前記素性情報抽出手段で抽出された複数文の素性情報と前記モデル格納手段に格納されたモデルとを照合して、前記各文の発話スタイルを推定する発話スタイル推定手段とを備える。 (もっと読む)


【課題】音声の再生に同期して音声の内容を表示させる。
【解決手段】音声データの再生に同期して、再生される音声の内容を記録したテキストを表示させるために、その音声において各語句が発音されるタイミングを推定するシステムであって、再生される音声の内容を予め記録したテキストを入力し、その入力したテキストを読み上げる合成音声を生成する音声合成部と、生成したその合成音声において、その入力したテキストに含まれる複数の語句のそれぞれが発音される時間の比率を算出する比率算出部と、それらの複数の語句のそれぞれに、算出したその比率に応じて、その音声データが再生される時間の一部をそれぞれ対応付けて、その対応付けを示すデータを出力する出力部とを備えるシステムを提供する。 (もっと読む)


【課題】不正確な読み上げの発生を抑制する。
【解決手段】自動取引装置1では、漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。これにより、読み上げ対象の対象文字列の、不自然な発音で不正確な読み上げの発生が低減する。 (もっと読む)


【課題】 文字/音声変換の応答性を維持しつつコストダウンを図り、さらには、特徴のあるサービスを実現する。
【解決手段】音声変換支援装置はキャッシュデータ保存部、インデックス情報記憶部、検索部、データ処理部を備える。前記データ処理部は前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去に使用された音声データを前記キャッシュデータ保存部から読み出して前記変換要求元へ返す一方、いずれのインデックス情報にも存在しない前記テキストデータを前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返す。 (もっと読む)


【課題】音声操作装置から入力された操作音及びデフォルト音量値に応じて、音声読み上げ装置の読上げ音声の読上げ音量及び読上げ速度を制御する。
【解決手段】音声操作装置と音声読上げ装置からなる音声読上げシステムであって、音声操作装置は、操作情報を入力する入力部と、デフォルト音量値を送信する送信部と、操作音を出力する第1出力部とを備え、音声読上げ装置は、操作音を入力する音声入力部と、デフォルト音量値を受信する受信部と、読上げ音声を出力する第2出力部と、操作音の音量及びデフォルト音量値によって音量差を算出する算出部と、音量差から読上げ音量を設定する音量制御部と、操作音の発生頻度を算出する頻度検出部と、発生頻度から読上げ速度を設定する速度制御部と、読上げ音声を生成する生成部と、設定された読上げ音量及び読上げ速度で読上げ音声を第2出力部から出力させる音声出力制御部と、を備える。 (もっと読む)


【課題】 表示されているテキストの記号に対応する音を出力することができる再生装置、再生方法、プログラムおよび記録媒体を提供する。
【解決手段】 タッチイベント&タッチ座標生成部12は、入力部11によって入力された接触状態情報および位置情報に基づいて、タッチイベントおよびタッチ座標を生成する。選択範囲決定部13は、タッチイベントおよびタッチ座標に基づいて、選択範囲を決定するとともに、対応テーブル19を参照して、決定した選択範囲に含まれる各記号に対応する記号音の時間的位置を決定する。アクション決定部14は、タッチイベントおよび選択範囲に基づいて、どのアクションを行うかを決定し、決定したアクションに従って、選択範囲内の記号を表示部15に表示させるとともに、時間的位置が示す時間に、選択範囲内の記号に対応する記号音をオーディオ再生部16に出力させる。 (もっと読む)


【課題】共演動画を自動合成するシステムを提供する。
【解決手段】ユーザの検索要求に合致する所定数の動画コンテンツを外部データベースより検索して入手し、所定数の素材動画とする素材動画検索部21と、素材動画より特徴量時系列を抽出する素材動画特徴抽出部22と、所与の関係を用いて特徴量時系列より前記素材動画の盛況度時系列を算出する盛況度算出部23と、盛況度時系列に基づいて所定数の素材動画を組み合わせた共演動画を合成する動画合成部24とを備えて動画合成システム10を提供する。所与の関係は予め学習データ保存部31の学習データを用いて、重回帰分析などにより盛況度モデル構築部32で構築してから、盛況度算出部23にて利用する。検索部21を利用せず、ユーザが素材動画を準備してもよい。 (もっと読む)


【課題】少ない消費電力量で情報を処理する。
【解決手段】ユーザ操作を受け付ける受け付手段と、テキストを音声に変換して読み上げるプレーヤ部404と、テキストにリンクされたリンク情報の所在を示すリンク先データに基づき、当該テキストのリンク情報を取得するブラウザ401と、取得されたリンク情報を含む情報を表示する表示手段と、表示手段を、情報を表示可能な通電状態と非通電状態とに切替える状態切替手段と、を備え、非通電状態におけるテキストの読み上げ中に、受け付手段が通電状態への遷移を指示するための遷移操作を受け付けると、ブラウザ401にリンク情報を取得させる。 (もっと読む)


41 - 50 / 925