読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム
【課題】テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することが可能な読み生成装置を提供すること。
【解決手段】読み決定装置900は、テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定部901を備える。
【解決手段】読み決定装置900は、テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定部901を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストが有する読みを決定する読み決定装置に関する。
【背景技術】
【0002】
テキスト(文字列)を受け付け、受け付けられたテキストが有する読みを決定する読み決定装置が知られている。この種の読み決定装置の一つとして特許文献1に記載の読み決定装置は、予め定められた不適切な読みである禁止読みを記憶する。
【0003】
そして、読み決定装置は、決定された読みが、記憶されている禁止読みを含む場合、当該決定された読みのうちの当該禁止読みに対応する部分を変更する。これによれば、例えば、変更後の読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−271727号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記読み決定装置においては、変更後の読みが不自然な読みになってしまう虞があった。即ち、上記読み決定装置においては、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避した場合に、テキストを表す読みとして自然な読みを決定することができない場合が生じる、という問題があった。
【0006】
このため、本発明の目的は、上述した課題である「テキストを表す読みとして決定された読みが不適切な読みを含むことを回避した場合に、テキストを表す読みとして自然な読みを決定することができない場合が生じること」を解決することが可能な読み決定装置を提供することにある。
【課題を解決するための手段】
【0007】
かかる目的を達成するため本発明の一形態である読み決定装置は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える。
【0008】
また、本発明の他の形態である読み決定方法は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する方法である。
【0009】
また、本発明の他の形態である読み決定プログラムは、
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を実現させるためのプログラムである。
【0010】
また、本発明の他の形態である音声合成装置は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
上記決定された読みを有する音声を生成する音声合成手段と、
を備える。
【0011】
また、本発明の他の形態である音声合成方法は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
上記決定された読みを有する音声を生成する方法である。
【0012】
また、本発明の他の形態である音声合成プログラムは、
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
上記決定された読みを有する音声を生成する音声合成手段と、
を実現させるためのプログラムである。
【発明の効果】
【0013】
本発明は、以上のように構成されることにより、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1実施形態に係る読み決定装置の機能の概略を表すブロック図である。
【図2】本発明の第1実施形態に係る読み決定装置が実行する読み決定プログラムを示したフローチャートである。
【図3】本発明の第1実施形態に係る読み決定装置が記憶する禁止読みを示したテーブルである。
【図4】本発明の第1実施形態に係る読み決定装置が実行する読み評価プログラムを示したフローチャートである。
【図5】本発明の第1実施形態に係る読み決定装置が実行する第1の判定処理プログラムを示したフローチャートである。
【図6】本発明の第1実施形態に係る読み決定装置が実行する第2の判定処理プログラムを示したフローチャートである。
【図7】本発明の第1実施形態に係る読み決定装置が実行する第3の判定処理プログラムを示したフローチャートである。
【図8】本発明の第2実施形態に係る読み決定装置が記憶する、禁止読み、表記、及び、品詞を示したテーブルである。
【図9】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補を概念的に示した説明図である。
【図10】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図11】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図12】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図13】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図14】本発明の第4実施形態に係る読み決定装置が記憶する、アクセントの位置を含む禁止読み、表記、及び、品詞を示したテーブルである。
【図15】本発明の第5実施形態に係る音声合成装置の機能の概略を表すブロック図である。
【図16】本発明の第6実施形態に係る読み決定装置の機能の概略を表すブロック図である。
【発明を実施するための形態】
【0015】
以下、本発明に係る、読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム、の各実施形態について図1〜図16を参照しながら説明する。
【0016】
<第1実施形態>
(構成)
第1実施形態に係る読み決定装置1は、情報処理装置である。なお、読み決定装置1は、パーソナル・コンピュータ、携帯電話端末、PHS(Personal Handyphone System)、PDA(Personal Data Assistance、Personal Digital Assistant)、カーナビゲーション端末、又は、ゲーム端末等であってもよい。
【0017】
読み決定装置1は、図示しない中央処理装置(CPU;Central Processing Unit)、記憶装置(メモリ及びハードディスク駆動装置(HDD;Hard Disk Drive))、入力装置(キーボード及びマウス等)及び出力装置(ディスプレイ及びスピーカ等)を備える。
【0018】
読み決定装置1は、記憶装置に記憶されているプログラムをCPUが実行することにより、後述する機能を実現するように構成されている。
【0019】
(機能)
図1は、上記のように構成された読み決定装置1の機能を表すブロック図である。
読み決定装置1の機能は、形態素列候補生成部(テキスト受付手段、読み生成手段の一部)101と、読み候補生成部(読み生成手段の一部)102と、禁止読み記憶部(禁止読み記憶手段)103と、読み決定部(読み決定手段)104と、を含む。
【0020】
形態素列候補生成部101は、テキストを受け付ける。更に、形態素列候補生成部101は、受け付けられたテキストに基づいて複数の形態素列候補を生成する。形態素列候補は、受け付けられたテキストを表す形態素列の候補である。
【0021】
本例では、形態素列候補に含まれる(を構成する)形態素のそれぞれは、表記及び品詞により一意に定められる。また、本例では、形態素列候補生成部101は、非特許文献1に記載された方法を用いて、形態素列候補を生成する。
【非特許文献1】北 研二、他2名、「音声言語処理」、森北出版、1996年11月、pp.91-98
【0022】
読み候補生成部102は、形態素列候補生成部101により生成された複数の形態素列候補のそれぞれに対して、当該形態素列候補が有する読み(読み候補)を生成する。読み(読音)は、発音を表す情報であり、本例では、読み仮名である。
【0023】
また、本例では、読み候補生成部102は、形態素と、当該形態素が有する読みと、を対応付けた情報を予め記憶するとともに、形態素列候補に含まれる形態素が有する読みを当該記憶されている情報に基づいて推定し、推定された読みを統合する(連結する)ことにより、読み候補を生成する。
【0024】
本例では、読み候補生成部102は、非特許文献2に記載された方法を用いて、読み候補を生成する。即ち、読み候補生成部102は、連濁、及び、アクセントに係る処理を行うことにより、読み候補を生成する。
【非特許文献2】古井 貞煕、「ディジタル音声処理」、東海大学出版会、1985年9月、pp.144-146
【0025】
なお、読み決定装置1は、形態素列候補を生成する際に、同時に読み候補も生成する(即ち、形態素列候補と当該形態素列候補が有する読み候補とをともに生成する)ように構成されていてもよい。
【0026】
禁止読み記憶部103は、禁止読みを記憶する。禁止読みは、予め定められた不適切な読みである。
【0027】
読み決定部104は、読み評価部104aと、読み選択部104bと、を含む。
読み評価部104aは、読み候補生成部102により生成された読みを受け付ける。読み評価部104aは、受け付けた読みのそれぞれに対して、当該読み(即ち、各形態素列候補が有する読み)が、禁止読み記憶部103に記憶されている禁止読みを含むか否かを判定する。
【0028】
本例では、読み評価部104aは、第1の条件、又は、第2の条件が成立する場合に、読みが禁止読みを含むと判定する。
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0029】
読み選択部104bは、読み評価部104aによる判定の結果に基づいて、形態素列候補生成部101により受け付けられたテキストを表す読みを決定する。具体的には、読み選択部104bは、読み候補生成部102により生成された読みのうちの、禁止読みを含むと読み評価部104aにより判定された読み以外の読みの中から、上記テキストを表す読みを決定する。そして、読み選択部104bは、決定された読みを出力する。
【0030】
(作動)
次に、上述した読み決定装置1の作動について図2〜図7を参照しながら説明する。
読み決定装置1は、図2にフローチャートにより示した読み決定プログラムを実行する。
【0031】
先ず、読み決定装置1は、テキスト(本例では、漢字仮名混じり文(漢字、片仮名、及び、平仮名が混用された文))を受け付ける(図2のステップS101)。例えば、読み決定装置1は、ユーザにより入力されたテキストを受け付ける。
【0032】
次いで、読み決定装置1は、受け付けたテキストに基づいてN個の形態素列候補を生成する(図2のステップS102)。ここで、Nは、正の整数である。なお、読み決定装置1は、比較的多数の形態素列候補を生成可能な場合、予め定められた上限数以下の形態素列候補を生成するように構成されていてもよい。
【0033】
本例では、読み決定装置1は、ノードとしての形態素により構成されるグラフ構造によって複数の形態素列候補を表した情報を生成する。なお、読み決定装置1は、グラフ構造以外の構造(例えば、複数の形態素列候補を単に含む構造)によって複数の形態素列候補を表した情報を生成してもよい。
【0034】
次いで、読み決定装置1は、ステップS102にて生成された複数の形態素列候補のそれぞれに対して、当該形態素列候補が有する読み(読み候補)C1〜CNを生成する(図2のステップS103)。
【0035】
本例では、禁止読み記憶部103は、図3に示したように、識別子(ID)と、禁止読みと、を対応付けて記憶している。また、本例では、禁止読み記憶部103は、受験生に対して不適切な読みを禁止読みとして記憶している。
【0036】
そして、読み決定装置1は、ステップS103にて生成された読み候補のそれぞれに対して、当該読み候補が、禁止読み記憶部103に記憶されている禁止読みを含むか否かを判定する(即ち、読み候補を評価する)(図2のステップS104)。なお、ステップS104の処理の詳細については後述する。
【0037】
次いで、読み決定装置1は、ステップS104における評価(判定)の結果に基づいて、受け付けられたテキストを表す読みを決定する(図2のステップS105)。具体的には、読み決定装置1は、読み候補のうちの、禁止読みを含むと判定された読み以外の読みの中から、上記テキストを表す読みを決定する。そして、読み決定装置1は、決定された読みを出力する(図2のステップS106)。
【0038】
なお、本例では、読み決定装置1は、複数の形態素列候補のそれぞれに対する、ステップS103〜ステップS104の処理を並列に(即ち、同時に)実行するように構成される。これによれば、処理時間を短縮することができる。
【0039】
なお、読み決定装置1は、複数の形態素列候補のそれぞれに対する、ステップS103〜ステップS104の処理を逐次(即ち、順に)実行するように構成されていてもよい。この場合、読み決定装置1は、複数の形態素列候補のうちの、尤もらしさの程度が高い形態素列候補から順に処理するとともに、ある形態素列候補の読みが禁止読みを含まないと判定された場合に以降の処理をスキップする(実行しない)ように構成されることが好適である。
【0040】
次に、ステップS104の処理の詳細について図4〜図7を参照しながら説明する。
読み決定装置1は、複数(本例では、N個)の読み候補C1〜CNのそれぞれに対して、図4にフローチャートにより示した読み評価プログラムを実行する。ここでは、n番目の読み候補Cnに対する処理について説明する。なお、nは、1〜Nの整数である。
【0041】
先ず、読み決定装置1は、フラグFnを初期値(本例では、「0」)に設定する(図4のステップS201)。フラグFnは、読み候補Cnが禁止読みを含むか否かを表す情報であり、「0」に設定されている場合には、読み候補Cnが禁止読みを含まない旨を表し、一方、「1」に設定されている場合には、読み候補Cnが禁止読みを含む旨を表す。
【0042】
次いで、読み決定装置1は、値mを1からMまで1ずつ増加させながら、ステップS203〜ステップS211の処理を繰り返し実行する。ここで、値Mは、禁止読み記憶部103に記憶されている禁止読みの総数(禁止読み数)である。
【0043】
読み決定装置1は、禁止読み記憶部103に記憶されている禁止読みPmを取得する。そして、読み決定装置1は、取得された禁止読みPmを有する形態素列の数である形態素数Lを取得する(図4のステップS203)。
【0044】
次いで、読み決定装置1は、値iを初期値(本例では、「1」)に設定する(図4のステップS204)。値iは、読み候補Cnを有する形態素列候補における、処理の対象となる形態素の先頭からの順序を表す。
【0045】
そして、読み決定装置1は、取得された形態素数Lが1である場合、ステップS206へ進み、第1の判定処理を行う。また、読み決定装置1は、取得された形態素数Lが2である場合、ステップS208へ進み、第2の判定処理を行う。読み決定装置1は、取得された形態素数Lが3以上である場合、ステップS209へ進み、第3の判定処理を行う。なお、第1の判定処理、第2の判定処理、及び、第3の判定処理の詳細については後述する。
【0046】
そして、読み決定装置1は、値iに1を加算する(図4のステップS210)。次いで、読み決定装置1は、値iに形態素数Lを加えた値から1を減じた値i+L−1が、禁止読み数Mよりも大きいか否かを判定する(図4のステップS211)。
【0047】
読み決定装置1は、値i+L−1が、禁止読み数M以下である場合、ステップS205へ戻り、ステップS205〜ステップS211の処理を繰り返し実行する。一方、値i+L−1が、禁止読み数Mよりも大きい場合、読み決定装置1は、ステップS212へ進む。
【0048】
次に、第1の判定処理の詳細について図5を参照しながら説明する。
読み決定装置1は、図4のステップS206に進んだとき、図5にフローチャートにより示した第1の判定処理プログラムを実行する。
【0049】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の少なくとも一部(即ち、全体、前方部分、又は、後方部分)と、禁止読みPm(1)の全体と、が一致しているか否かを判定する(図5のステップS301)。
【0050】
読みCn(i)の少なくとも一部と、禁止読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS302へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第1の判定処理を終了する。
【0051】
一方、読みCn(i)の少なくとも一部と、禁止読みPm(1)の全体と、が一致していない場合、読み決定装置1は、ステップS302の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第1の判定処理を終了する。
【0052】
次に、第2の判定処理の詳細について図6を参照しながら説明する。
読み決定装置1は、図4のステップS208に進んだとき、図6にフローチャートにより示した第2の判定処理プログラムを実行する。
【0053】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の全体、又は、後方部分と、禁止読みPmを有する形態素列における、先頭の形態素が有する読みPm(1)の全体と、が一致しているか否かを判定する(図6のステップS401)。
【0054】
読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS402へ進む。そして、読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi+1番目の形態素が有する読みCn(i+1)の全体、又は、前方部分と、禁止読みPmを有する形態素列における、先頭から2番目の形態素が有する読みPm(2)の全体と、が一致しているか否かを判定する。
【0055】
読みCn(i+1)の全体、又は、前方部分と、読みPm(2)の全体と、が一致している場合、読み決定装置1は、ステップS403へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第2の判定処理を終了する。
【0056】
一方、読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致していない場合、若しくは、読みCn(i+1)の全体、又は、前方部分と、読みPm(2)の全体と、が一致していない場合、読み決定装置1は、ステップS403の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第2の判定処理を終了する。
【0057】
次に、第3の判定処理の詳細について図7を参照しながら説明する。
読み決定装置1は、図4のステップS209に進んだとき、図7にフローチャートにより示した第3の判定処理プログラムを実行する。
【0058】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の全体、又は、後方部分と、禁止読みPmを有する形態素列における、先頭の形態素が有する読みPm(1)の全体と、が一致しているか否かを判定する(図7のステップS501)。
【0059】
読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS502へ進む。そして、読み決定装置1は、読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致しているか否かを判定する。
【0060】
読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致していることは、1〜L−2の整数jのそれぞれに対して、読みCn(i+j)の全体と読みPm(j+1)の全体とが一致していることを表す。
【0061】
読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致している場合、読み決定装置1は、ステップS503へ進む。そして、読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi+L−1番目の形態素が有する読みCn(i+L−1)の全体、又は、前方部分と、禁止読みPmを有する形態素列における、先頭からL番目の形態素が有する読みPm(L)の全体と、が一致しているか否かを判定する。
【0062】
読みCn(i+L−1)の全体、又は、前方部分と、読みPm(L)の全体と、が一致している場合、読み決定装置1は、ステップS504へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第3の判定処理を終了する。
【0063】
一方、読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致していない場合、読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致していない場合、若しくは、読みCn(i+L−1)の全体、又は、前方部分と、読みPm(L)の全体と、が一致していない場合、読み決定装置1は、ステップS504の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第3の判定処理を終了する。
【0064】
以上、説明したように、本発明の第1実施形態に係る読み決定装置1によれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0065】
更に、第1実施形態に係る読み決定装置1は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0066】
加えて、第1実施形態に係る読み決定装置1は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0067】
<第2実施形態>
次に、本発明の第2実施形態に係る読み決定装置について説明する。第2実施形態に係る読み決定装置は、上記第1実施形態に係る読み決定装置に対して、読みに加えて、表記及び品詞にも基づいて、テキストを表す読みを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0068】
(機能)
第2実施形態に係る禁止読み記憶部103は、図8に示したように、識別子(ID)と、禁止読みと、表記と、品詞と、を対応付けて記憶している。本例では、禁止読み記憶部103は、受験生に対して不適切な読みを禁止読みとして記憶している。ここで、表記は、漢字仮名混じり文である。
【0069】
第2実施形態に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立する場合に、読みが禁止読みを含むと判定する。
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0070】
第3の条件は、禁止読みと対応付けられた表記と同一の表記を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
第4の条件は、禁止読みと対応付けられた品詞と同一の品詞を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0071】
(作動)
次に、第2実施形態に係る読み決定装置1の作動について図8〜図13を参照しながら説明する。いま、読み決定装置1が、「この山桜散る風景が、素晴らしい」というテキストを受け付けた場合を想定して説明を続ける。
【0072】
読み決定装置1は、テキストを受け付けると、図9に示したグラフ構造によって複数の形態素列候補を表した情報を生成する。このグラフ構造におけるすべての経路が、複数の形態素列候補を表している。
【0073】
図10は、生成された複数の形態素列候補のうちの1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。この形態素列候補が有する読み候補の全体、及び、一部は、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含まないと判定する。
【0074】
図11は、生成された複数の形態素列候補のうちの他の1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0075】
この形態素列候補が有する読み候補の一部である「さくらちる」は、禁止読み記憶部103にID「2」と対応付けて記憶されている禁止読み「さくらちる」と一致する。更に、この形態素列候補内の禁止読み「さくらちる」に対応する部分が有する表記「桜散る」は、禁止読み記憶部103にID「2」と対応付けて記憶されている表記「桜散る」と一致する。加えて、この形態素列候補内の禁止読み「さくらちる」に対応する部分が有する品詞「名詞」は、禁止読み記憶部103にID「2」と対応付けて記憶されている品詞「名詞」と一致する。
【0076】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0077】
図12は、生成された複数の形態素列候補のうちの他の1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0078】
この形態素列候補が有する読み候補の一部である「さくら/ち」は、禁止読み記憶部103にID「1」と対応付けて記憶されている禁止読み「さくら/ち」と一致する。ここで、「/」は、形態素間の境界を表す。
【0079】
更に、この形態素列候補内の禁止読み「さくら/ち」に対応する部分が有する表記「桜散」は、禁止読み記憶部103にID「1」と対応付けて記憶されている表記「桜散」と一致する。加えて、この形態素列候補内の禁止読み「さくら/ち」に対応する部分が有する品詞「名詞/動詞」は、禁止読み記憶部103にID「1」と対応付けて記憶されている品詞「名詞/動詞」と一致する。
【0080】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0081】
このようにして、読み決定装置1は、生成された複数の形態素列候補のすべてに対して、読み候補が禁止読みを含むか否かを判定する。
そして、読み決定装置1は、生成された複数の形態素列候補のうちの、禁止読みを含むと判定された読み候補以外の読み候補(即ち、禁止読みを含まないと判定された読み候補)を有する形態素列候補を取得する。
【0082】
そして、読み決定装置1は、非特許文献1に記載された方法を用いて、取得された形態素列候補の中から、最も適切な(尤もらしい)形態素列候補を1つだけ選択し、選択された形態素列候補が有する読み候補を、テキストを表す読みとして出力する。
これによれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【0083】
次に、読み決定装置1が、「これは夢落ちです」というテキストを受け付けた場合を想定して説明を続ける。読み決定装置1は、テキストを受け付けると、複数の形態素列候補を生成する。
【0084】
図13は、生成された複数の形態素列候補のうちの1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0085】
この形態素列候補に含まれる任意の形態素が有する読みの全体は、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。同様に、この形態素列候補に含まれる任意の形態素列が有する読みの全体も、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。
【0086】
一方、この形態素列候補に含まれる形態素「夢落ち」の一部である「落ち」が有する読み「おち」は、禁止読み記憶部103にID「4」と対応付けて記憶されている禁止読み「おち」と一致する。更に、この形態素列候補内の禁止読み「おち」に対応する部分が有する表記「落ち」は、禁止読み記憶部103にID「4」と対応付けて記憶されている表記「落ち」と一致する。加えて、この形態素列候補内の禁止読み「おち」に対応する部分が有する品詞「名詞」は、禁止読み記憶部103にID「4」と対応付けて記憶されている品詞「名詞」と一致する。
【0087】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0088】
このようにして、読み決定装置1は、生成された複数の形態素列候補のすべてに対して、読み候補が禁止読みを含むか否かを判定し、その判定結果に基づいてテキストを表す読みを決定し、決定された読みを出力する。
これによれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【0089】
以上、説明したように、本発明の第2実施形態に係る読み決定装置1によれば、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第2実施形態に係る読み決定装置1は、読みに加えて、表記及び品詞にも基づいて、テキストを表す読みを決定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0090】
なお、第2実施形態に係る読み決定装置1は、形態素列候補に含まれ且つ連続する複数の形態素(形態素列)が有する読みの少なくとも一部と、禁止読みと、が一致しているか否かを判定するために、禁止読みとしての形態素毎の読みと、形態素毎の品詞と、を記憶するように構成されている。
【0091】
ところで、第2実施形態の変形例に係る読み決定装置1は、予め定められた規則に従って、連続する複数の形態素を1つの形態素に統合し、統合された形態素が有する読みの少なくとも一部と、禁止読みと、が一致しているか否かを判定するように構成されていてもよい。
【0092】
この場合、読み決定装置1は、統合された形態素が有する読みとして、統合前の形態素列が有する読みを連結した読みを用いることが好適である。更に、読み決定装置1は、統合された形態素が有する品詞として、統合前の形態素列が有する品詞が同一である場合には、当該品詞を用いることが好適である。加えて、読み決定装置1は、統合された形態素が有する品詞として、統合前の形態素列が有する品詞が互いに異なる場合には、予め定められた規則に従って品詞を決定する(例えば、「名詞」と「動詞」の場合には、「動詞」とする)ことが好適である。
【0093】
<第3実施形態>
次に、本発明の第3実施形態に係る読み決定装置1について説明する。第3実施形態に係る読み決定装置1は、第1実施形態に係る読み決定装置1に対して、読み候補のうちの、禁止読みと一致する部分の数が最も少ない読み候補を、テキストを表す読みとして決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0094】
第3実施形態に係る読み決定装置1は、フラグFnに代えて、スコア値Snを用いる。
スコア値Snは、読み候補Cnのうちの、禁止読みと一致する部分の数を表す情報である。本例では、スコア値Snは、読み候補Cnのうちの、禁止読みと一致する部分の数が多くなるほど大きくなる値を有する。
【0095】
第3実施形態に係る読み決定装置1は、図4のステップS201の処理に代えて、スコア値Snを初期値(本例では、「0」)に設定する処理を行う。更に、読み決定装置1は、図5のステップS302、図6のステップS403、及び、図7のステップS504の処理に代えて、スコア値Snから予め設定された減点値(本例では、「1」)を減じた値により当該スコア値Snを更新する処理を行う。
【0096】
そして、読み決定装置1は、算出されたスコア値Snが最大である(即ち、最も0に近い、又は、0である)読み候補Cnを、テキストを表す読みとして決定する。
なお、読み決定装置1は、算出されたスコア値Snが最大である読み候補Cnが複数存在している場合、そのうちの一つをランダムに選択することが好適である。
【0097】
この第3実施形態に係る読み決定装置1によっても、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
【0098】
なお、読み決定装置1は、禁止読みと対応付けて減点値を記憶するように構成されていてもよい。これによれば、読み決定装置1は、禁止読み毎に異なる減点値を用いてスコア値Snを算出することができる。従って、禁止読み毎の不適切さの程度に基づいて、テキストを表す読みを決定することができる。
【0099】
また、第3実施形態の変形例に係る読み決定部104は、読み候補のそれぞれに対して、当該読み候補がテキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付けるように構成されていてもよい。この場合、読み決定装置1は、スコア値Snの初期値として、受け付けたスコア値を用いる。
【0100】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0101】
<第4実施形態>
次に、本発明の第4実施形態に係る読み決定装置について説明する。第4実施形態に係る読み決定装置は、上記第2実施形態に係る読み決定装置に対して、読み、表記及び品詞に加えて、アクセントの位置にも基づいて、テキストを表す読みを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0102】
(機能)
第4実施形態に係る禁止読み記憶部103は、図14に示したように、識別子(ID)と、アクセントの位置を含む禁止読みと、表記と、品詞と、を対応付けて記憶している。本例では、アクセントの位置は、禁止読みにおいて記号「#」が挿入された位置の直前の読みの位置である。また、本例では、禁止読み記憶部103は、結婚式において不適切な読みを禁止読みとして記憶している。
【0103】
第4実施形態に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立する場合に、読みが禁止読みを含むと判定する。
【0104】
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0105】
第3の条件は、禁止読みと対応付けられた表記と同一の表記を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
第4の条件は、禁止読みと対応付けられた品詞と同一の品詞を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0106】
第5の条件は、禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0107】
この第4実施形態に係る読み決定装置1によっても、第2実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第4実施形態に係る読み決定装置1は、読み、表記及び品詞に加えて、アクセントの位置にも基づいて、テキストを表す読みを決定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0108】
即ち、読み候補の少なくとも一部が禁止読みと一致するが、アクセントの位置が異なることによって不適切な読みとならない読み候補が排除されることを回避することができる。
【0109】
なお、第4実施形態の変形例に係る読み決定装置1は、アクセントの位置に加えて、アクセントの強さを表す情報、及び/又は、アクセントの長さを表す情報にも基づいて、テキストを表す読みを決定するように構成されていてもよい。
【0110】
また、第4実施形態の他の変形例に係る読み決定装置1は、平板型のアクセント及び尾高型のアクセントのように、条件によっては同じアクセントに聞こえる組み合わせを同一視したり、中高型のアクセントをすべて同一視したり、することにより、明らかに異なって聞こえるアクセントと、聞き間違える可能性のあるアクセントと、の違いを明確にすることも可能である。
【0111】
また、第4実施形態の他の変形例に係る読み決定装置1は、フラグFnの値を、読み候補の不適切さの程度に応じた値に設定するように構成される。
具体的には、この変形例に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立する場合に、フラグFnの値を「0」に設定する。
【0112】
また、この変形例に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立しない場合に、フラグFnの値を「1」に設定する。
【0113】
また、この変形例に係る読み評価部104aは、第1の条件、及び、第2の条件の両方が成立しない場合、第3の条件が成立しない場合、及び、第4の条件が成立しない場合、フラグFnの値を「2」に設定する。
【0114】
そして、読み選択部104bは、読み評価部104aにより設定されたフラグFnの値と、読み候補Cnを有する形態素列候補の適切さ(尤もらしさ)の程度を表す値と、を重み付け加算することにより評価値を算出し、算出された評価値に基づいてテキストを表す読みを決定する。形態素列候補の適切さの程度を表す値は、例えば、非特許文献1に記載された方法を用いて算出され得る。
これにより、読み候補の不適切さの程度を反映させながら、テキストを表す読みを決定することができる。
【0115】
<第5実施形態>
次に、本発明の第5実施形態に係る音声合成装置について説明する。第5実施形態に係る音声合成装置は、第1実施形態に係る読み決定装置に対して、決定された読みを有する音声を合成する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0116】
図15に示したように、第5実施形態に係る音声合成装置1Aの機能は、第1実施形態に係る読み決定装置1の機能に加えて、音声合成部(音声合成手段)105を含む。
音声合成部105は、読み選択部104bにより決定された読みを有する音声を生成(合成)する(即ち、音声合成処理を行う)。音声合成部105は、生成された音声を出力装置を介して出力する。
【0117】
本例では、音声合成部105は、非特許文献2に記載された方法を用いて、読みに基づいて音声を生成する。
【0118】
以上、説明したように、本発明の第5実施形態に係る音声合成装置1Aによれば、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第5実施形態に係る音声合成装置1Aによれば、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0119】
なお、第5実施形態の変形例に係る読み決定部104は、フラグFnとともに、禁止読みが検出された位置を表す情報を出力するように構成されることが好適である。この場合、音声合成部105は、禁止読みが検出された位置において合成される音声の大きさを他の位置(禁止読みが検出されなかった位置)において合成される音声の大きさよりも小さくするように構成されることが好適である。これによれば、合成された音声が不適切な音声を含む場合であっても、合成された音声を聞いた時の不適切さが緩和される効果が得られる。
【0120】
<第6実施形態>
次に、本発明の第6実施形態に係る読み決定装置について図16を参照しながら説明する。
第6実施形態に係る読み決定装置900は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定部(読み決定手段)901を備える。
【0121】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0122】
以上、上記実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成及び詳細に、本願発明の範囲内において当業者が理解し得る様々な変更をすることができる。
【0123】
なお、上記実施形態において読み決定装置1及び音声合成装置1Aの各機能は、CPUがプログラム(ソフトウェア)を実行することにより実現されていたが、回路等のハードウェアにより実現されていてもよい。
【0124】
また、上記実施形態においてプログラムは、記憶装置に記憶されていたが、コンピュータが読み取り可能な記録媒体に記憶されていてもよい。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
【0125】
また、上記実施形態の他の変形例として、上述した実施形態及び変形例の任意の組み合わせが採用されてもよい。
【0126】
<付記>
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
【0127】
(付記1)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える読み決定装置。
【0128】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0129】
(付記2)
付記1に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【0130】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0131】
(付記3)
付記1又は付記2に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【0132】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0133】
(付記4)
付記1乃至付記3のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた表記と同一の表記を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0134】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0135】
(付記5)
付記1乃至付記4のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた品詞と同一の品詞を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0136】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0137】
(付記6)
付記1乃至付記5のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0138】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0139】
(付記7)
付記1乃至付記6のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのそれぞれに対して、当該読みが前記テキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付け、当該読みが前記禁止読みを含む場合に、当該受け付けられたスコア値から、当該禁止読みに対応付けられた減点値を減じた値により当該スコア値を更新し、当該スコア値が最大となる読みを、前記テキストを表す読みとして決定するように構成された読み決定装置。
【0140】
(付記8)
付記1乃至付記7のいずれか一項に記載の読み決定装置であって、
前記テキストを受け付けるテキスト受付手段と、
前記受け付けられたテキストを表す前記形態素列候補を生成するとともに、当該形態素列候補のそれぞれが有する読みを生成する読み生成手段と、
を備え、
前記読み決定手段は、前記生成された読みを受け付けるように構成された読み決定装置。
【0141】
(付記9)
付記1乃至付記8のいずれか一項に記載の読み決定装置であって、
前記禁止読みを記憶する禁止読み記憶手段を備え、
前記読み決定手段は、前記記憶されている禁止読みに基づいて前記テキストを表す読みを決定するように構成された読み決定装置。
【0142】
(付記10)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する、読み決定方法。
【0143】
(付記11)
付記10に記載の読み決定方法であって、
前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定方法。
【0144】
(付記12)
付記10又は付記11に記載の読み決定方法であって、
前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定方法。
【0145】
(付記13)
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を実現させるための読み決定プログラム。
【0146】
(付記14)
付記13に記載の読み決定プログラムであって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定プログラム。
【0147】
(付記15)
付記13又は付記14に記載の読み決定プログラムであって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定プログラム。
【0148】
(付記16)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を備える音声合成装置。
【0149】
(付記17)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
前記決定された読みを有する音声を生成する、音声合成方法。
【0150】
(付記18)
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を実現させるための音声合成プログラム。
【産業上の利用可能性】
【0151】
本発明は、テキストが有する読みを決定する読み決定装置、及び、テキストに基づいて音声を合成する音声合成装置等に適用可能である。
【符号の説明】
【0152】
1 読み決定装置
1A 音声合成装置
101 形態素列候補生成部
102 読み候補生成部
103 禁止読み記憶部
104 読み決定部
104a 読み評価部
104b 読み選択部
105 音声合成部
900 読み決定装置
901 読み決定部
【技術分野】
【0001】
本発明は、テキストが有する読みを決定する読み決定装置に関する。
【背景技術】
【0002】
テキスト(文字列)を受け付け、受け付けられたテキストが有する読みを決定する読み決定装置が知られている。この種の読み決定装置の一つとして特許文献1に記載の読み決定装置は、予め定められた不適切な読みである禁止読みを記憶する。
【0003】
そして、読み決定装置は、決定された読みが、記憶されている禁止読みを含む場合、当該決定された読みのうちの当該禁止読みに対応する部分を変更する。これによれば、例えば、変更後の読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−271727号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記読み決定装置においては、変更後の読みが不自然な読みになってしまう虞があった。即ち、上記読み決定装置においては、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避した場合に、テキストを表す読みとして自然な読みを決定することができない場合が生じる、という問題があった。
【0006】
このため、本発明の目的は、上述した課題である「テキストを表す読みとして決定された読みが不適切な読みを含むことを回避した場合に、テキストを表す読みとして自然な読みを決定することができない場合が生じること」を解決することが可能な読み決定装置を提供することにある。
【課題を解決するための手段】
【0007】
かかる目的を達成するため本発明の一形態である読み決定装置は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える。
【0008】
また、本発明の他の形態である読み決定方法は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する方法である。
【0009】
また、本発明の他の形態である読み決定プログラムは、
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を実現させるためのプログラムである。
【0010】
また、本発明の他の形態である音声合成装置は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
上記決定された読みを有する音声を生成する音声合成手段と、
を備える。
【0011】
また、本発明の他の形態である音声合成方法は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
上記決定された読みを有する音声を生成する方法である。
【0012】
また、本発明の他の形態である音声合成プログラムは、
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
上記決定された読みを有する音声を生成する音声合成手段と、
を実現させるためのプログラムである。
【発明の効果】
【0013】
本発明は、以上のように構成されることにより、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1実施形態に係る読み決定装置の機能の概略を表すブロック図である。
【図2】本発明の第1実施形態に係る読み決定装置が実行する読み決定プログラムを示したフローチャートである。
【図3】本発明の第1実施形態に係る読み決定装置が記憶する禁止読みを示したテーブルである。
【図4】本発明の第1実施形態に係る読み決定装置が実行する読み評価プログラムを示したフローチャートである。
【図5】本発明の第1実施形態に係る読み決定装置が実行する第1の判定処理プログラムを示したフローチャートである。
【図6】本発明の第1実施形態に係る読み決定装置が実行する第2の判定処理プログラムを示したフローチャートである。
【図7】本発明の第1実施形態に係る読み決定装置が実行する第3の判定処理プログラムを示したフローチャートである。
【図8】本発明の第2実施形態に係る読み決定装置が記憶する、禁止読み、表記、及び、品詞を示したテーブルである。
【図9】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補を概念的に示した説明図である。
【図10】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図11】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図12】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図13】本発明の第2実施形態に係る読み決定装置が生成した複数の形態素列候補の1つを概念的に示した説明図である。
【図14】本発明の第4実施形態に係る読み決定装置が記憶する、アクセントの位置を含む禁止読み、表記、及び、品詞を示したテーブルである。
【図15】本発明の第5実施形態に係る音声合成装置の機能の概略を表すブロック図である。
【図16】本発明の第6実施形態に係る読み決定装置の機能の概略を表すブロック図である。
【発明を実施するための形態】
【0015】
以下、本発明に係る、読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム、の各実施形態について図1〜図16を参照しながら説明する。
【0016】
<第1実施形態>
(構成)
第1実施形態に係る読み決定装置1は、情報処理装置である。なお、読み決定装置1は、パーソナル・コンピュータ、携帯電話端末、PHS(Personal Handyphone System)、PDA(Personal Data Assistance、Personal Digital Assistant)、カーナビゲーション端末、又は、ゲーム端末等であってもよい。
【0017】
読み決定装置1は、図示しない中央処理装置(CPU;Central Processing Unit)、記憶装置(メモリ及びハードディスク駆動装置(HDD;Hard Disk Drive))、入力装置(キーボード及びマウス等)及び出力装置(ディスプレイ及びスピーカ等)を備える。
【0018】
読み決定装置1は、記憶装置に記憶されているプログラムをCPUが実行することにより、後述する機能を実現するように構成されている。
【0019】
(機能)
図1は、上記のように構成された読み決定装置1の機能を表すブロック図である。
読み決定装置1の機能は、形態素列候補生成部(テキスト受付手段、読み生成手段の一部)101と、読み候補生成部(読み生成手段の一部)102と、禁止読み記憶部(禁止読み記憶手段)103と、読み決定部(読み決定手段)104と、を含む。
【0020】
形態素列候補生成部101は、テキストを受け付ける。更に、形態素列候補生成部101は、受け付けられたテキストに基づいて複数の形態素列候補を生成する。形態素列候補は、受け付けられたテキストを表す形態素列の候補である。
【0021】
本例では、形態素列候補に含まれる(を構成する)形態素のそれぞれは、表記及び品詞により一意に定められる。また、本例では、形態素列候補生成部101は、非特許文献1に記載された方法を用いて、形態素列候補を生成する。
【非特許文献1】北 研二、他2名、「音声言語処理」、森北出版、1996年11月、pp.91-98
【0022】
読み候補生成部102は、形態素列候補生成部101により生成された複数の形態素列候補のそれぞれに対して、当該形態素列候補が有する読み(読み候補)を生成する。読み(読音)は、発音を表す情報であり、本例では、読み仮名である。
【0023】
また、本例では、読み候補生成部102は、形態素と、当該形態素が有する読みと、を対応付けた情報を予め記憶するとともに、形態素列候補に含まれる形態素が有する読みを当該記憶されている情報に基づいて推定し、推定された読みを統合する(連結する)ことにより、読み候補を生成する。
【0024】
本例では、読み候補生成部102は、非特許文献2に記載された方法を用いて、読み候補を生成する。即ち、読み候補生成部102は、連濁、及び、アクセントに係る処理を行うことにより、読み候補を生成する。
【非特許文献2】古井 貞煕、「ディジタル音声処理」、東海大学出版会、1985年9月、pp.144-146
【0025】
なお、読み決定装置1は、形態素列候補を生成する際に、同時に読み候補も生成する(即ち、形態素列候補と当該形態素列候補が有する読み候補とをともに生成する)ように構成されていてもよい。
【0026】
禁止読み記憶部103は、禁止読みを記憶する。禁止読みは、予め定められた不適切な読みである。
【0027】
読み決定部104は、読み評価部104aと、読み選択部104bと、を含む。
読み評価部104aは、読み候補生成部102により生成された読みを受け付ける。読み評価部104aは、受け付けた読みのそれぞれに対して、当該読み(即ち、各形態素列候補が有する読み)が、禁止読み記憶部103に記憶されている禁止読みを含むか否かを判定する。
【0028】
本例では、読み評価部104aは、第1の条件、又は、第2の条件が成立する場合に、読みが禁止読みを含むと判定する。
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0029】
読み選択部104bは、読み評価部104aによる判定の結果に基づいて、形態素列候補生成部101により受け付けられたテキストを表す読みを決定する。具体的には、読み選択部104bは、読み候補生成部102により生成された読みのうちの、禁止読みを含むと読み評価部104aにより判定された読み以外の読みの中から、上記テキストを表す読みを決定する。そして、読み選択部104bは、決定された読みを出力する。
【0030】
(作動)
次に、上述した読み決定装置1の作動について図2〜図7を参照しながら説明する。
読み決定装置1は、図2にフローチャートにより示した読み決定プログラムを実行する。
【0031】
先ず、読み決定装置1は、テキスト(本例では、漢字仮名混じり文(漢字、片仮名、及び、平仮名が混用された文))を受け付ける(図2のステップS101)。例えば、読み決定装置1は、ユーザにより入力されたテキストを受け付ける。
【0032】
次いで、読み決定装置1は、受け付けたテキストに基づいてN個の形態素列候補を生成する(図2のステップS102)。ここで、Nは、正の整数である。なお、読み決定装置1は、比較的多数の形態素列候補を生成可能な場合、予め定められた上限数以下の形態素列候補を生成するように構成されていてもよい。
【0033】
本例では、読み決定装置1は、ノードとしての形態素により構成されるグラフ構造によって複数の形態素列候補を表した情報を生成する。なお、読み決定装置1は、グラフ構造以外の構造(例えば、複数の形態素列候補を単に含む構造)によって複数の形態素列候補を表した情報を生成してもよい。
【0034】
次いで、読み決定装置1は、ステップS102にて生成された複数の形態素列候補のそれぞれに対して、当該形態素列候補が有する読み(読み候補)C1〜CNを生成する(図2のステップS103)。
【0035】
本例では、禁止読み記憶部103は、図3に示したように、識別子(ID)と、禁止読みと、を対応付けて記憶している。また、本例では、禁止読み記憶部103は、受験生に対して不適切な読みを禁止読みとして記憶している。
【0036】
そして、読み決定装置1は、ステップS103にて生成された読み候補のそれぞれに対して、当該読み候補が、禁止読み記憶部103に記憶されている禁止読みを含むか否かを判定する(即ち、読み候補を評価する)(図2のステップS104)。なお、ステップS104の処理の詳細については後述する。
【0037】
次いで、読み決定装置1は、ステップS104における評価(判定)の結果に基づいて、受け付けられたテキストを表す読みを決定する(図2のステップS105)。具体的には、読み決定装置1は、読み候補のうちの、禁止読みを含むと判定された読み以外の読みの中から、上記テキストを表す読みを決定する。そして、読み決定装置1は、決定された読みを出力する(図2のステップS106)。
【0038】
なお、本例では、読み決定装置1は、複数の形態素列候補のそれぞれに対する、ステップS103〜ステップS104の処理を並列に(即ち、同時に)実行するように構成される。これによれば、処理時間を短縮することができる。
【0039】
なお、読み決定装置1は、複数の形態素列候補のそれぞれに対する、ステップS103〜ステップS104の処理を逐次(即ち、順に)実行するように構成されていてもよい。この場合、読み決定装置1は、複数の形態素列候補のうちの、尤もらしさの程度が高い形態素列候補から順に処理するとともに、ある形態素列候補の読みが禁止読みを含まないと判定された場合に以降の処理をスキップする(実行しない)ように構成されることが好適である。
【0040】
次に、ステップS104の処理の詳細について図4〜図7を参照しながら説明する。
読み決定装置1は、複数(本例では、N個)の読み候補C1〜CNのそれぞれに対して、図4にフローチャートにより示した読み評価プログラムを実行する。ここでは、n番目の読み候補Cnに対する処理について説明する。なお、nは、1〜Nの整数である。
【0041】
先ず、読み決定装置1は、フラグFnを初期値(本例では、「0」)に設定する(図4のステップS201)。フラグFnは、読み候補Cnが禁止読みを含むか否かを表す情報であり、「0」に設定されている場合には、読み候補Cnが禁止読みを含まない旨を表し、一方、「1」に設定されている場合には、読み候補Cnが禁止読みを含む旨を表す。
【0042】
次いで、読み決定装置1は、値mを1からMまで1ずつ増加させながら、ステップS203〜ステップS211の処理を繰り返し実行する。ここで、値Mは、禁止読み記憶部103に記憶されている禁止読みの総数(禁止読み数)である。
【0043】
読み決定装置1は、禁止読み記憶部103に記憶されている禁止読みPmを取得する。そして、読み決定装置1は、取得された禁止読みPmを有する形態素列の数である形態素数Lを取得する(図4のステップS203)。
【0044】
次いで、読み決定装置1は、値iを初期値(本例では、「1」)に設定する(図4のステップS204)。値iは、読み候補Cnを有する形態素列候補における、処理の対象となる形態素の先頭からの順序を表す。
【0045】
そして、読み決定装置1は、取得された形態素数Lが1である場合、ステップS206へ進み、第1の判定処理を行う。また、読み決定装置1は、取得された形態素数Lが2である場合、ステップS208へ進み、第2の判定処理を行う。読み決定装置1は、取得された形態素数Lが3以上である場合、ステップS209へ進み、第3の判定処理を行う。なお、第1の判定処理、第2の判定処理、及び、第3の判定処理の詳細については後述する。
【0046】
そして、読み決定装置1は、値iに1を加算する(図4のステップS210)。次いで、読み決定装置1は、値iに形態素数Lを加えた値から1を減じた値i+L−1が、禁止読み数Mよりも大きいか否かを判定する(図4のステップS211)。
【0047】
読み決定装置1は、値i+L−1が、禁止読み数M以下である場合、ステップS205へ戻り、ステップS205〜ステップS211の処理を繰り返し実行する。一方、値i+L−1が、禁止読み数Mよりも大きい場合、読み決定装置1は、ステップS212へ進む。
【0048】
次に、第1の判定処理の詳細について図5を参照しながら説明する。
読み決定装置1は、図4のステップS206に進んだとき、図5にフローチャートにより示した第1の判定処理プログラムを実行する。
【0049】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の少なくとも一部(即ち、全体、前方部分、又は、後方部分)と、禁止読みPm(1)の全体と、が一致しているか否かを判定する(図5のステップS301)。
【0050】
読みCn(i)の少なくとも一部と、禁止読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS302へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第1の判定処理を終了する。
【0051】
一方、読みCn(i)の少なくとも一部と、禁止読みPm(1)の全体と、が一致していない場合、読み決定装置1は、ステップS302の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第1の判定処理を終了する。
【0052】
次に、第2の判定処理の詳細について図6を参照しながら説明する。
読み決定装置1は、図4のステップS208に進んだとき、図6にフローチャートにより示した第2の判定処理プログラムを実行する。
【0053】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の全体、又は、後方部分と、禁止読みPmを有する形態素列における、先頭の形態素が有する読みPm(1)の全体と、が一致しているか否かを判定する(図6のステップS401)。
【0054】
読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS402へ進む。そして、読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi+1番目の形態素が有する読みCn(i+1)の全体、又は、前方部分と、禁止読みPmを有する形態素列における、先頭から2番目の形態素が有する読みPm(2)の全体と、が一致しているか否かを判定する。
【0055】
読みCn(i+1)の全体、又は、前方部分と、読みPm(2)の全体と、が一致している場合、読み決定装置1は、ステップS403へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第2の判定処理を終了する。
【0056】
一方、読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致していない場合、若しくは、読みCn(i+1)の全体、又は、前方部分と、読みPm(2)の全体と、が一致していない場合、読み決定装置1は、ステップS403の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第2の判定処理を終了する。
【0057】
次に、第3の判定処理の詳細について図7を参照しながら説明する。
読み決定装置1は、図4のステップS209に進んだとき、図7にフローチャートにより示した第3の判定処理プログラムを実行する。
【0058】
読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi番目の形態素が有する読みCn(i)の全体、又は、後方部分と、禁止読みPmを有する形態素列における、先頭の形態素が有する読みPm(1)の全体と、が一致しているか否かを判定する(図7のステップS501)。
【0059】
読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致している場合、読み決定装置1は、ステップS502へ進む。そして、読み決定装置1は、読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致しているか否かを判定する。
【0060】
読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致していることは、1〜L−2の整数jのそれぞれに対して、読みCn(i+j)の全体と読みPm(j+1)の全体とが一致していることを表す。
【0061】
読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致している場合、読み決定装置1は、ステップS503へ進む。そして、読み決定装置1は、読み候補Cnを有する形態素列候補における、先頭からi+L−1番目の形態素が有する読みCn(i+L−1)の全体、又は、前方部分と、禁止読みPmを有する形態素列における、先頭からL番目の形態素が有する読みPm(L)の全体と、が一致しているか否かを判定する。
【0062】
読みCn(i+L−1)の全体、又は、前方部分と、読みPm(L)の全体と、が一致している場合、読み決定装置1は、ステップS504へ進み、フラグFnを「1」に設定する。そして、読み決定装置1は、第3の判定処理を終了する。
【0063】
一方、読みCn(i)の全体、又は、後方部分と、読みPm(1)の全体と、が一致していない場合、読みCn(i+1)〜Cn(i+L−2)の全体と、読みPm(2)〜Pm(L−1)の全体と、がそれぞれ一致していない場合、若しくは、読みCn(i+L−1)の全体、又は、前方部分と、読みPm(L)の全体と、が一致していない場合、読み決定装置1は、ステップS504の処理を実行することなく(即ち、フラグFnを「0」に維持したまま)、第3の判定処理を終了する。
【0064】
以上、説明したように、本発明の第1実施形態に係る読み決定装置1によれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0065】
更に、第1実施形態に係る読み決定装置1は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0066】
加えて、第1実施形態に係る読み決定装置1は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0067】
<第2実施形態>
次に、本発明の第2実施形態に係る読み決定装置について説明する。第2実施形態に係る読み決定装置は、上記第1実施形態に係る読み決定装置に対して、読みに加えて、表記及び品詞にも基づいて、テキストを表す読みを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0068】
(機能)
第2実施形態に係る禁止読み記憶部103は、図8に示したように、識別子(ID)と、禁止読みと、表記と、品詞と、を対応付けて記憶している。本例では、禁止読み記憶部103は、受験生に対して不適切な読みを禁止読みとして記憶している。ここで、表記は、漢字仮名混じり文である。
【0069】
第2実施形態に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立する場合に、読みが禁止読みを含むと判定する。
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0070】
第3の条件は、禁止読みと対応付けられた表記と同一の表記を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
第4の条件は、禁止読みと対応付けられた品詞と同一の品詞を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0071】
(作動)
次に、第2実施形態に係る読み決定装置1の作動について図8〜図13を参照しながら説明する。いま、読み決定装置1が、「この山桜散る風景が、素晴らしい」というテキストを受け付けた場合を想定して説明を続ける。
【0072】
読み決定装置1は、テキストを受け付けると、図9に示したグラフ構造によって複数の形態素列候補を表した情報を生成する。このグラフ構造におけるすべての経路が、複数の形態素列候補を表している。
【0073】
図10は、生成された複数の形態素列候補のうちの1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。この形態素列候補が有する読み候補の全体、及び、一部は、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含まないと判定する。
【0074】
図11は、生成された複数の形態素列候補のうちの他の1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0075】
この形態素列候補が有する読み候補の一部である「さくらちる」は、禁止読み記憶部103にID「2」と対応付けて記憶されている禁止読み「さくらちる」と一致する。更に、この形態素列候補内の禁止読み「さくらちる」に対応する部分が有する表記「桜散る」は、禁止読み記憶部103にID「2」と対応付けて記憶されている表記「桜散る」と一致する。加えて、この形態素列候補内の禁止読み「さくらちる」に対応する部分が有する品詞「名詞」は、禁止読み記憶部103にID「2」と対応付けて記憶されている品詞「名詞」と一致する。
【0076】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0077】
図12は、生成された複数の形態素列候補のうちの他の1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0078】
この形態素列候補が有する読み候補の一部である「さくら/ち」は、禁止読み記憶部103にID「1」と対応付けて記憶されている禁止読み「さくら/ち」と一致する。ここで、「/」は、形態素間の境界を表す。
【0079】
更に、この形態素列候補内の禁止読み「さくら/ち」に対応する部分が有する表記「桜散」は、禁止読み記憶部103にID「1」と対応付けて記憶されている表記「桜散」と一致する。加えて、この形態素列候補内の禁止読み「さくら/ち」に対応する部分が有する品詞「名詞/動詞」は、禁止読み記憶部103にID「1」と対応付けて記憶されている品詞「名詞/動詞」と一致する。
【0080】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0081】
このようにして、読み決定装置1は、生成された複数の形態素列候補のすべてに対して、読み候補が禁止読みを含むか否かを判定する。
そして、読み決定装置1は、生成された複数の形態素列候補のうちの、禁止読みを含むと判定された読み候補以外の読み候補(即ち、禁止読みを含まないと判定された読み候補)を有する形態素列候補を取得する。
【0082】
そして、読み決定装置1は、非特許文献1に記載された方法を用いて、取得された形態素列候補の中から、最も適切な(尤もらしい)形態素列候補を1つだけ選択し、選択された形態素列候補が有する読み候補を、テキストを表す読みとして出力する。
これによれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【0083】
次に、読み決定装置1が、「これは夢落ちです」というテキストを受け付けた場合を想定して説明を続ける。読み決定装置1は、テキストを受け付けると、複数の形態素列候補を生成する。
【0084】
図13は、生成された複数の形態素列候補のうちの1つと、当該形態素列候補が有する読み(読み候補)、表記、及び、品詞と、を形態素毎に示す。
【0085】
この形態素列候補に含まれる任意の形態素が有する読みの全体は、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。同様に、この形態素列候補に含まれる任意の形態素列が有する読みの全体も、禁止読み記憶部103に記憶されている禁止読みのいずれとも一致しない。
【0086】
一方、この形態素列候補に含まれる形態素「夢落ち」の一部である「落ち」が有する読み「おち」は、禁止読み記憶部103にID「4」と対応付けて記憶されている禁止読み「おち」と一致する。更に、この形態素列候補内の禁止読み「おち」に対応する部分が有する表記「落ち」は、禁止読み記憶部103にID「4」と対応付けて記憶されている表記「落ち」と一致する。加えて、この形態素列候補内の禁止読み「おち」に対応する部分が有する品詞「名詞」は、禁止読み記憶部103にID「4」と対応付けて記憶されている品詞「名詞」と一致する。
【0087】
従って、この形態素列候補が有する読み候補に対して、読み決定装置1は、読みが禁止読みを含むと判定する。
【0088】
このようにして、読み決定装置1は、生成された複数の形態素列候補のすべてに対して、読み候補が禁止読みを含むか否かを判定し、その判定結果に基づいてテキストを表す読みを決定し、決定された読みを出力する。
これによれば、テキストを表す読みとして決定された読みが不適切な読み(禁止読み)を含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。
【0089】
以上、説明したように、本発明の第2実施形態に係る読み決定装置1によれば、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第2実施形態に係る読み決定装置1は、読みに加えて、表記及び品詞にも基づいて、テキストを表す読みを決定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0090】
なお、第2実施形態に係る読み決定装置1は、形態素列候補に含まれ且つ連続する複数の形態素(形態素列)が有する読みの少なくとも一部と、禁止読みと、が一致しているか否かを判定するために、禁止読みとしての形態素毎の読みと、形態素毎の品詞と、を記憶するように構成されている。
【0091】
ところで、第2実施形態の変形例に係る読み決定装置1は、予め定められた規則に従って、連続する複数の形態素を1つの形態素に統合し、統合された形態素が有する読みの少なくとも一部と、禁止読みと、が一致しているか否かを判定するように構成されていてもよい。
【0092】
この場合、読み決定装置1は、統合された形態素が有する読みとして、統合前の形態素列が有する読みを連結した読みを用いることが好適である。更に、読み決定装置1は、統合された形態素が有する品詞として、統合前の形態素列が有する品詞が同一である場合には、当該品詞を用いることが好適である。加えて、読み決定装置1は、統合された形態素が有する品詞として、統合前の形態素列が有する品詞が互いに異なる場合には、予め定められた規則に従って品詞を決定する(例えば、「名詞」と「動詞」の場合には、「動詞」とする)ことが好適である。
【0093】
<第3実施形態>
次に、本発明の第3実施形態に係る読み決定装置1について説明する。第3実施形態に係る読み決定装置1は、第1実施形態に係る読み決定装置1に対して、読み候補のうちの、禁止読みと一致する部分の数が最も少ない読み候補を、テキストを表す読みとして決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0094】
第3実施形態に係る読み決定装置1は、フラグFnに代えて、スコア値Snを用いる。
スコア値Snは、読み候補Cnのうちの、禁止読みと一致する部分の数を表す情報である。本例では、スコア値Snは、読み候補Cnのうちの、禁止読みと一致する部分の数が多くなるほど大きくなる値を有する。
【0095】
第3実施形態に係る読み決定装置1は、図4のステップS201の処理に代えて、スコア値Snを初期値(本例では、「0」)に設定する処理を行う。更に、読み決定装置1は、図5のステップS302、図6のステップS403、及び、図7のステップS504の処理に代えて、スコア値Snから予め設定された減点値(本例では、「1」)を減じた値により当該スコア値Snを更新する処理を行う。
【0096】
そして、読み決定装置1は、算出されたスコア値Snが最大である(即ち、最も0に近い、又は、0である)読み候補Cnを、テキストを表す読みとして決定する。
なお、読み決定装置1は、算出されたスコア値Snが最大である読み候補Cnが複数存在している場合、そのうちの一つをランダムに選択することが好適である。
【0097】
この第3実施形態に係る読み決定装置1によっても、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
【0098】
なお、読み決定装置1は、禁止読みと対応付けて減点値を記憶するように構成されていてもよい。これによれば、読み決定装置1は、禁止読み毎に異なる減点値を用いてスコア値Snを算出することができる。従って、禁止読み毎の不適切さの程度に基づいて、テキストを表す読みを決定することができる。
【0099】
また、第3実施形態の変形例に係る読み決定部104は、読み候補のそれぞれに対して、当該読み候補がテキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付けるように構成されていてもよい。この場合、読み決定装置1は、スコア値Snの初期値として、受け付けたスコア値を用いる。
【0100】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0101】
<第4実施形態>
次に、本発明の第4実施形態に係る読み決定装置について説明する。第4実施形態に係る読み決定装置は、上記第2実施形態に係る読み決定装置に対して、読み、表記及び品詞に加えて、アクセントの位置にも基づいて、テキストを表す読みを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0102】
(機能)
第4実施形態に係る禁止読み記憶部103は、図14に示したように、識別子(ID)と、アクセントの位置を含む禁止読みと、表記と、品詞と、を対応付けて記憶している。本例では、アクセントの位置は、禁止読みにおいて記号「#」が挿入された位置の直前の読みの位置である。また、本例では、禁止読み記憶部103は、結婚式において不適切な読みを禁止読みとして記憶している。
【0103】
第4実施形態に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立する場合に、読みが禁止読みを含むと判定する。
【0104】
第1の条件は、形態素列候補に含まれる形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
第2の条件は、形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、禁止読みと、が一致する、という条件である。
【0105】
第3の条件は、禁止読みと対応付けられた表記と同一の表記を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
第4の条件は、禁止読みと対応付けられた品詞と同一の品詞を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0106】
第5の条件は、禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、形態素列候補内の禁止読みに対応する部分が有する、という条件である。
【0107】
この第4実施形態に係る読み決定装置1によっても、第2実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第4実施形態に係る読み決定装置1は、読み、表記及び品詞に加えて、アクセントの位置にも基づいて、テキストを表す読みを決定するように構成されている。
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0108】
即ち、読み候補の少なくとも一部が禁止読みと一致するが、アクセントの位置が異なることによって不適切な読みとならない読み候補が排除されることを回避することができる。
【0109】
なお、第4実施形態の変形例に係る読み決定装置1は、アクセントの位置に加えて、アクセントの強さを表す情報、及び/又は、アクセントの長さを表す情報にも基づいて、テキストを表す読みを決定するように構成されていてもよい。
【0110】
また、第4実施形態の他の変形例に係る読み決定装置1は、平板型のアクセント及び尾高型のアクセントのように、条件によっては同じアクセントに聞こえる組み合わせを同一視したり、中高型のアクセントをすべて同一視したり、することにより、明らかに異なって聞こえるアクセントと、聞き間違える可能性のあるアクセントと、の違いを明確にすることも可能である。
【0111】
また、第4実施形態の他の変形例に係る読み決定装置1は、フラグFnの値を、読み候補の不適切さの程度に応じた値に設定するように構成される。
具体的には、この変形例に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立する場合に、フラグFnの値を「0」に設定する。
【0112】
また、この変形例に係る読み評価部104aは、第1の条件、又は、第2の条件が成立し、且つ、第3の条件が成立し、且つ、第4の条件が成立し、且つ、第5の条件が成立しない場合に、フラグFnの値を「1」に設定する。
【0113】
また、この変形例に係る読み評価部104aは、第1の条件、及び、第2の条件の両方が成立しない場合、第3の条件が成立しない場合、及び、第4の条件が成立しない場合、フラグFnの値を「2」に設定する。
【0114】
そして、読み選択部104bは、読み評価部104aにより設定されたフラグFnの値と、読み候補Cnを有する形態素列候補の適切さ(尤もらしさ)の程度を表す値と、を重み付け加算することにより評価値を算出し、算出された評価値に基づいてテキストを表す読みを決定する。形態素列候補の適切さの程度を表す値は、例えば、非特許文献1に記載された方法を用いて算出され得る。
これにより、読み候補の不適切さの程度を反映させながら、テキストを表す読みを決定することができる。
【0115】
<第5実施形態>
次に、本発明の第5実施形態に係る音声合成装置について説明する。第5実施形態に係る音声合成装置は、第1実施形態に係る読み決定装置に対して、決定された読みを有する音声を合成する点において相違している。従って、以下、かかる相違点を中心として説明する。
【0116】
図15に示したように、第5実施形態に係る音声合成装置1Aの機能は、第1実施形態に係る読み決定装置1の機能に加えて、音声合成部(音声合成手段)105を含む。
音声合成部105は、読み選択部104bにより決定された読みを有する音声を生成(合成)する(即ち、音声合成処理を行う)。音声合成部105は、生成された音声を出力装置を介して出力する。
【0117】
本例では、音声合成部105は、非特許文献2に記載された方法を用いて、読みに基づいて音声を生成する。
【0118】
以上、説明したように、本発明の第5実施形態に係る音声合成装置1Aによれば、第1実施形態に係る読み決定装置1と同様の作用及び効果を奏することができる。
更に、第5実施形態に係る音声合成装置1Aによれば、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0119】
なお、第5実施形態の変形例に係る読み決定部104は、フラグFnとともに、禁止読みが検出された位置を表す情報を出力するように構成されることが好適である。この場合、音声合成部105は、禁止読みが検出された位置において合成される音声の大きさを他の位置(禁止読みが検出されなかった位置)において合成される音声の大きさよりも小さくするように構成されることが好適である。これによれば、合成された音声が不適切な音声を含む場合であっても、合成された音声を聞いた時の不適切さが緩和される効果が得られる。
【0120】
<第6実施形態>
次に、本発明の第6実施形態に係る読み決定装置について図16を参照しながら説明する。
第6実施形態に係る読み決定装置900は、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定部(読み決定手段)901を備える。
【0121】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0122】
以上、上記実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成及び詳細に、本願発明の範囲内において当業者が理解し得る様々な変更をすることができる。
【0123】
なお、上記実施形態において読み決定装置1及び音声合成装置1Aの各機能は、CPUがプログラム(ソフトウェア)を実行することにより実現されていたが、回路等のハードウェアにより実現されていてもよい。
【0124】
また、上記実施形態においてプログラムは、記憶装置に記憶されていたが、コンピュータが読み取り可能な記録媒体に記憶されていてもよい。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
【0125】
また、上記実施形態の他の変形例として、上述した実施形態及び変形例の任意の組み合わせが採用されてもよい。
【0126】
<付記>
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
【0127】
(付記1)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える読み決定装置。
【0128】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを回避しながら、テキストを表す読みとして自然な読みを決定することができる。従って、例えば、決定された読みに基づいて音声合成処理を行った場合、不適切な読みに基づく音声が合成されることを回避しながら、自然な音声を合成することができる。
【0129】
(付記2)
付記1に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【0130】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0131】
(付記3)
付記1又は付記2に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【0132】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことを確実に回避することができる。
【0133】
(付記4)
付記1乃至付記3のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた表記と同一の表記を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0134】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0135】
(付記5)
付記1乃至付記4のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた品詞と同一の品詞を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0136】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0137】
(付記6)
付記1乃至付記5のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【0138】
これによれば、テキストを表す読みとして決定された読みが不適切な読みを含むことをより一層確実に回避しながら、テキストを表す読みとして、より一層自然な読みを決定することができる。
【0139】
(付記7)
付記1乃至付記6のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのそれぞれに対して、当該読みが前記テキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付け、当該読みが前記禁止読みを含む場合に、当該受け付けられたスコア値から、当該禁止読みに対応付けられた減点値を減じた値により当該スコア値を更新し、当該スコア値が最大となる読みを、前記テキストを表す読みとして決定するように構成された読み決定装置。
【0140】
(付記8)
付記1乃至付記7のいずれか一項に記載の読み決定装置であって、
前記テキストを受け付けるテキスト受付手段と、
前記受け付けられたテキストを表す前記形態素列候補を生成するとともに、当該形態素列候補のそれぞれが有する読みを生成する読み生成手段と、
を備え、
前記読み決定手段は、前記生成された読みを受け付けるように構成された読み決定装置。
【0141】
(付記9)
付記1乃至付記8のいずれか一項に記載の読み決定装置であって、
前記禁止読みを記憶する禁止読み記憶手段を備え、
前記読み決定手段は、前記記憶されている禁止読みに基づいて前記テキストを表す読みを決定するように構成された読み決定装置。
【0142】
(付記10)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する、読み決定方法。
【0143】
(付記11)
付記10に記載の読み決定方法であって、
前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定方法。
【0144】
(付記12)
付記10又は付記11に記載の読み決定方法であって、
前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定方法。
【0145】
(付記13)
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を実現させるための読み決定プログラム。
【0146】
(付記14)
付記13に記載の読み決定プログラムであって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定プログラム。
【0147】
(付記15)
付記13又は付記14に記載の読み決定プログラムであって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定プログラム。
【0148】
(付記16)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を備える音声合成装置。
【0149】
(付記17)
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
前記決定された読みを有する音声を生成する、音声合成方法。
【0150】
(付記18)
情報処理装置に、
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を実現させるための音声合成プログラム。
【産業上の利用可能性】
【0151】
本発明は、テキストが有する読みを決定する読み決定装置、及び、テキストに基づいて音声を合成する音声合成装置等に適用可能である。
【符号の説明】
【0152】
1 読み決定装置
1A 音声合成装置
101 形態素列候補生成部
102 読み候補生成部
103 禁止読み記憶部
104 読み決定部
104a 読み評価部
104b 読み選択部
105 音声合成部
900 読み決定装置
901 読み決定部
【特許請求の範囲】
【請求項1】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える読み決定装置。
【請求項2】
請求項1に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【請求項3】
請求項1又は請求項2に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【請求項4】
請求項1乃至請求項3のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた表記と同一の表記を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項5】
請求項1乃至請求項4のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた品詞と同一の品詞を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項6】
請求項1乃至請求項5のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項7】
請求項1乃至請求項6のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのそれぞれに対して、当該読みが前記テキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付け、当該読みが前記禁止読みを含む場合に、当該受け付けられたスコア値から、当該禁止読みに対応付けられた減点値を減じた値により当該スコア値を更新し、当該スコア値が最大となる読みを、前記テキストを表す読みとして決定するように構成された読み決定装置。
【請求項8】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する、読み決定方法。
【請求項9】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を備える音声合成装置。
【請求項10】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
前記決定された読みを有する音声を生成する、音声合成方法。
【請求項1】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段を備える読み決定装置。
【請求項2】
請求項1に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれる形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【請求項3】
請求項1又は請求項2に記載の読み決定装置であって、
前記読み決定手段は、前記形態素列候補に含まれ且つ連続する複数の形態素が有する読みの少なくとも一部と、前記禁止読みと、が一致している場合に、当該形態素列候補が有する読みが、当該禁止読みを含むと判定するように構成された読み決定装置。
【請求項4】
請求項1乃至請求項3のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた表記と同一の表記を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項5】
請求項1乃至請求項4のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられた品詞と同一の品詞を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項6】
請求項1乃至請求項5のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのうちの、前記禁止読みを含み、且つ、当該禁止読みと対応付けられたアクセントの位置と同一のアクセントの位置を、前記形態素列候補内の当該禁止読みに対応する部分が有する読み以外の読みの中から、前記テキストを表す読みを決定するように構成された読み決定装置。
【請求項7】
請求項1乃至請求項6のいずれか一項に記載の読み決定装置であって、
前記読み決定手段は、前記受け付けられた読みのそれぞれに対して、当該読みが前記テキストを表す尤もらしさの程度が高くなるほど大きくなるスコア値を受け付け、当該読みが前記禁止読みを含む場合に、当該受け付けられたスコア値から、当該禁止読みに対応付けられた減点値を減じた値により当該スコア値を更新し、当該スコア値が最大となる読みを、前記テキストを表す読みとして決定するように構成された読み決定装置。
【請求項8】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する、読み決定方法。
【請求項9】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定する読み決定手段と、
前記決定された読みを有する音声を生成する音声合成手段と、
を備える音声合成装置。
【請求項10】
テキストを表す形態素列の候補である形態素列候補のそれぞれが有する読みを受け付けるとともに、当該受け付けられた読みのうちの、予め定められた不適切な読みである禁止読みを含む読み以外の読みの中から、当該テキストを表す読みを決定し、
前記決定された読みを有する音声を生成する、音声合成方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2011−247928(P2011−247928A)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願番号】特願2010−118019(P2010−118019)
【出願日】平成22年5月24日(2010.5.24)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願日】平成22年5月24日(2010.5.24)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】
[ Back to top ]