説明

国際特許分類[G10L13/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464)

国際特許分類[G10L13/02]の下位に属する分類

国際特許分類[G10L13/02]に分類される特許

51 - 60 / 365



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】雑音の誤検出による応答音声の中断の発生を抑えること。
【解決手段】音声対話装置は、入力音声に含まれる応答音声のエコーを除去したエコー除去音声の始端と終端を検出する音声検出部8と、前記始端が検出されてから所定期間が経過した時点で前記終端が検出されていないときに応答中断指令を出力する応答中断制御部11と、応答中断制御部11から前記応答中断指令を受け取ると応答音声出力部に応答音声の出力を中断させる対話制御部3と、を備える。 (もっと読む)


【課題】 話者が音声入力に用いる入力手段に関わらず、話者の特性に応じた応答音声信号を出力することができる音声応答装置を提供する。
【解決手段】 本発明は、ユーザの発話に基づく入力音声信号の発話内容に応答する応答音声信号を出力する音声応答装置に関する。そして、本発明の音声応答装置は、1又は複数の判定項目の各パラメータに対応する判定用発話特徴データを記憶する手段と、ユーザ発話特徴データを抽出する手段と、抽出したユーザ発話特徴データとそれぞれの判定用発話特徴データとを照合し、ユーザが、それぞれの判定項目について、いずれのパラメータに対応するかを判定する手段と、判定結果に対応する発話特徴を備える応答音声信号を保持する手段とを有することを特徴とする。 (もっと読む)


【課題】
合成音声において、自然な発話にとどまらず、作品の特徴や話者の個性や感情を表現する音声合成装置の実現することが、本発明の課題である。
【解決手段】
合成音声において、自然な発話にとどまらず、作品の特徴や話者の個性や感情を表現する音声合成装置を実現するために、音律や抑揚によるパターン化などの試みが始まっているが、それらに欠落しているもので、かつ、作品の特徴や話者の個性や感情を表現する上で重要な役割を果たしている呼気段落をパラメータとして取り込む。そのために、呼気段落における語数、継続時間、話速、そして内容に関するデータベースから、作品の特徴や話者の個性や感情に応じた呼気段落制御関数を構築し、それを組み込んだ音声合成装置を手段とする。 (もっと読む)


【課題】違和感を感じさせずに各曲の紹介を行うことができるカラオケ装置を提供する。
【解決手段】文字抽出部103は、曲名ライブラリ104から受け付けた曲番号の曲名等のテキスト情報を読み出す。文字抽出部103で読み出したテキスト情報は、メロディ生成部105に入力される。メロディ生成部105は、メロディライブラリ106に記憶されたメロディデータをランダムに読み出し、読み出したメロディデータをテキスト情報とともに合成エンジン107に出力する。合成エンジン107は、メロディ生成部105から入力されたテキスト情報およびメロディデータに基づいて音声ライブラリ102から音声素片を読み出し、歌唱音を合成する。歌唱音は、各音声素片を接続することにより生成される。例えば「さーいーたー」という歌唱を合成する場合、「sa,a,ai,i,it,ta,a」という音声素片を接続する。 (もっと読む)


【課題】ノイズキャンセリング機能がオンにされている場合において、乗り物に乗車中のユーザに対して、降車タイミングを把握させることができる音声再生装置を提供する。
【解決手段】音声再生装置100は、ノイズを収音するためのマイクロホン102と、マイクロホン102が収音して得たノイズの音声信号から、ノイズと音響的に合成することで当該ノイズをキャンセルするようにするためのノイズキャンセル用音声信号を生成するNC用フィルタ回路106と、ノイズキャンセル用音声信号を音響再生してノイズと音響的に合成するようにするヘッドホンドライバ114と、ユーザにより入力された目的地に関する情報に基づいて、目的地へ到着したか否かを判断するための条件を設定する設定部122と、設定された条件を満たしたときに、ノイズキャンセル用音声信号のヘッドホンドライバ114への供給を遮断するようにする制御部120とを備える。 (もっと読む)


【課題】小売店等において、外国人店員の作業効率を向上することができる音声出力装置、音声出力装置の制御方法、印刷装置および装着ボードを提供する。
【解決手段】プリントデータを取得するデータ送受信部191と、データ送受信部191により取得したデータの少なくとも一部のデータを解析し、テキストデータに変換するデータ解析部193と、テキストデータを、予め指定した1以上の言語に変換する言語変換部194と、言語変換部194により言語変換したテキストデータに対応した1以上の合成音声データを生成する音声合成部195と、音声合成部195により生成した1以上の合成音声データを、ヘッドフォン104に対して出力する音声データ出力部196と、を備える。 (もっと読む)


【課題】効率的に合成音声の修正を行うことのできる合成音声修正装置を提供する。
【解決手段】任意のテキストの読みを示す表音文字列データに対応する合成音声を出力するとともに、当該テキストを画面表示する合成音声出力表示部と、画面表示した前記テキストにおいて、ユーザが指摘した修正位置を取得する修正位置取得部と、前記修正位置に基づいて、前記合成音声にかかる再合成区間を特定する再合成区間特定部と、特定した前記再合成区間のテキストの読みを示す表音文字列データに対応する合成音声の候補を再合成候補として生成する再合成候補生成部と、前記再合成候補を識別可能にしてユーザに提示する再合成候補提示部と、識別可能にしてユーザに提示した前記再合成候補の中からユーザが選択した再合成候補を少なくとも含む合成音声を出力する再合成音声出力部とを備える。 (もっと読む)


【課題】画像化コードで文字情報などを比較的大量に格納できるが、音声や音楽などの情報を格納するのに容量が足りないことがある。画像化コード技術を音声や音楽情報の伝達にも使えることを課題とする。
【解決手段】文字などの情報を音声や音楽の符号として画像化コードに格納し、画像化コードのデコード部分に音声合成や音楽合成機能を追加して実現させる。 (もっと読む)


【課題】適切なタイミングで応答できる音声対話装置および方法を提供
【解決手段】まず、入力した音声から単語列を抽出する(S30)。また、入力した音声の話速を算出する(S40)。そして、現在の入力単語列に後続すると予測される単語列(以下、後続予測単語列という)とこの後続予測単語列に対応した出現確率とを記憶する出現確率リストと、抽出した単語列とを比較して、抽出した単語列に後続すると予測される後続予測単語列の中で最も出現確率の高い後続予測単語列を抽出する(S50)。更に、算出した話速を用い、後続予測単語列が入力されるのにかかる時間(以下、後続入力時間という)を算出する(S60)。その後、抽出した後続予測単語列の出現確率を確信度とし、抽出した後続予測単語列に付与する(S70)。その後、付与された確信度が応答判定値以上である場合に、この後続入力時間で、出力タイミング予測を確定させる(S80)。 (もっと読む)


51 - 60 / 365