説明

情報処理装置、情報処理方法及びプログラム

【課題】一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることを目的とする。
【解決手段】電子辞書コンテンツの読み上げを行う情報処理装置であって、見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、見出し語と、発音記号と、音声合成用発音記号と、を辞書に登録する登録手段と、一時抑制手段で一時的に使用不可とされた単語を辞書で使用可能とする抑制解除手段と、を有することによって課題を解決する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
電子辞書において、電子辞書コンテンツ中の見出し語や見出し語を含む例文を読み上げる際に、電子辞書コンテンツ記載の発音記号通りに音声合成する技術として特許文献1に記載の技術が存在する。特許文献1の技術では、見出し語及び見出し語の説明情報が表示されると、見出し語の説明情報の中から発音記号や品詞情報を抽出する。ユーザによって読み上げる例文が指定されると、例文中に前記抽出した見出し語の発音記号や品詞情報が挿入されて音声合成手段に渡される。音声合成手段は、挿入された見出し語の発音記号や品詞情報を用いて指定された例文中の見出し語を電子辞書コンテンツの発音記号通りの読みで音声合成する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4677869号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら特許文献1では、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができない問題があった。
本発明はこのような問題点に鑑みなされたもので、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることを目的とする。
【課題を解決するための手段】
【0005】
そこで、本発明は、電子辞書コンテンツの読み上げを行う情報処理装置であって、入力された見出し語に基づいて、電子辞書コンテンツを検索する検索手段と、前記検索手段での検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示手段と、前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定手段と、前記発音記号特定手段で特定された発音記号を音声合成用発音記号に変換する変換手段と、前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録手段と、前記読み上げ箇所を音声合成する音声合成手段と、前記一時抑制手段で一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除手段と、を有する。
【発明の効果】
【0006】
本発明によれば、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができる。
【図面の簡単な説明】
【0007】
【図1】実施形態1の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
【図2】情報処理装置のハードウェア構成の一例を示す図である。
【図3】電子辞書コンテンツ112の見出し語の一例を示す図である。
【図4】基本的な情報処理の流れを示すフローチャートである。
【図5】実施形態2の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
【図6】ユーザ辞書に登録できる単語数の上限を考慮した場合の情報処理の流れを示すフローチャートである。
【図7】ステップS701における差異コスト算出の処理の流れを示すフローチャートである。
【図8】実施形態3の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
【図9】見出し語と同一表記の単語とを全てユーザ辞書に登録する場合の処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0008】
以下、本発明の実施形態について図面に基づいて説明する。
【0009】
<実施形態1>
図1は、実施形態1の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
見出し語指定部101は、見出し語を指定する。
見出し語検索部102は、見出し語指定部101が指定した見出し語を電子辞書コンテンツ112を対象に検索し、見出し語に該当する説明情報を検索結果として得る。
表示部103は、見出し語検索部102の検索結果を表示する。
読み上げ箇所選択部104は、前記説明情報の中から読み上げ箇所を選択する。
品詞抽出部105は、前記読み上げ箇所に含まれる見出し語に対応する品詞を前記説明情報から抽出する。
発音記号抽出部106は、前記読み上げ箇所に含まれる見出し語に対応する発音記号を前記説明情報から抽出する。
発音記号変換部107は、前記抽出した発音記号を音声合成用の読みに変換する。
【0010】
同一表記単語一時抑制部108は、見出し語と同一の表記を持つ単語がユーザ辞書109に登録されている場合、ユーザ辞書109から全ての同一表記単語を一時的に削除する。同一表記単語一時抑制部108は、ユーザ辞書から削除した単語は再度登録できるよう保持しておく。
ユーザ辞書109は、動的に単語を登録・削除できる音声合成用の辞書である。音声合成のための言語解析を行う際、合成用言語辞書113よりも優先してユーザ辞書に登録されている単語が選択される。
ユーザ辞書検索部110は、ユーザ辞書109を対象に単語を検索し、単語の表記、品詞、読み等、音声合成に必要な情報を検索結果として得る。
ユーザ辞書削除部111は、登録されている単語をユーザ辞書109から削除する。
電子辞書コンテンツ112は、電子辞書に搭載されている英和辞典、和英辞典、中日辞典、和独辞典等の電子化されたコンテンツである。
合成用言語辞書113は、事前に用意する静的な辞書で、単語の表記、品詞、読み等、音声合成に必要な情報を保持する。
【0011】
合成用言語辞書検索部114は、合成用言語辞書113を対象に単語を検索し、単語の表記、品詞、読み等、音声合成に必要な情報を検索結果として得る。
未知語読み付け部115は、ユーザ辞書109にも合成用言語辞書113に登録されていない単語に対して用いられ、表記を入力として読みを推定する。
見出し語登録部116は、見出し語指定部101が指定した見出し語、品詞抽出部105が抽出した品詞、発音記号変換部107が変換した読みをセットとして、ユーザ辞書登録部117を介してユーザ辞書109に登録する。
ユーザ辞書登録部117は、単語をユーザ辞書109に登録する。
音声合成部118は、合成用言語辞書113、ユーザ辞書109、未知語読み付け部115を用いて読み上げ箇所選択部104が選択した読み上げ箇所に対して読みを付け、前記読みにしたがって合成音声を生成し出力する。
同一表記単語抑制解除部119は、同一表記単語一時抑制部108が一時的に削除した同一表記の単語をユーザ辞書109に再度登録する。
【0012】
図2は、情報処理装置のハードウェア構成の一例を示す図である。
CPU202は、システムバス205を介して接続する各デバイスを総括的に制御する。CPU202は、読み出し専用メモリ(ROM)203若しくはフラッシュメモリ(FM)211に記憶された処理ステップやプログラムを読み出して実行する。ランダムアクセスメモリ(RAM)204は、高速にアクセス可能なCPU202の主メモリ、ワークエリア等の一時記憶領域として用いられる。
ここで、FM211は、オペレーティングシステム、アプリケーション等における、コンピュータによって実行可能な工程をプログラムとして格納し、CPU202によって実行されるデバイスドライバ等を格納する。
ROM203は、基本I/O、スタートアップ、或いはキーボード208からのキーストローク受け付けのような基本的なシステム機能のための、コンピュータによって実行可能な不変の処理ステップを格納する。
また、キーボードコントローラ(KBC)206は、キーボード(KB)208やマウス、タッチパネル、レーザポインタ等のようなポインティングデバイス207からの指示入力を制御する。
ディスプレイコントローラ(DSPC)209は、ディスプレイ(DSP)210の表示を制御する。
なお、電子辞書コンテンツ112、合成用言語辞書113、ユーザ辞書109は、FM211等に構成される。
CPU202が、プログラムに基づいて処理を実行することによって、情報所装置のソフトウェア構成、及び後述するフローチャートの各ステップの処理等が実現される。
【0013】
図3は、電子辞書コンテンツ112の見出し語の一例を示す図である。
501は、見出し語であり、この例ではtodayという単語である。
502は、見出し語の説明情報である。説明情報には、発音記号503や品詞504、505、及び、例文等が含まれる。
506は、ユーザが指定した読み上げ箇所を示している。この例では、読み上げ箇所が反転表示されている例を表している。
【0014】
図1及び図2に示した構成による本実施形態が読み上げ及び見出し語のユーザ辞書への登録、削除を行う基本的な処理内容を、図4のフローチャートを参照して説明する。
ステップS301では、見出し語指定部101が、ユーザが入力する見出し語を受理して、ステップS302に移る。
ステップS302では、見出し語検索部102が電子辞書コンテンツ112を対象に見出し語指定部101が保持する見出し語を検索する。表示部103は、見出し語検索部102の検索結果である見出し語及び見出し語の説明情報をディスプレイ210に表示してステップS303に移る。
ステップS303では、読み上げ箇所選択部104がユーザが入力する読み上げ箇所を受理してステップS304に移る。読み上げ箇所は見出し語の説明情報の一部であるとする。
ステップS304では、ユーザが音声合成ボタンを押下した場合はステップS305に移り、押下しない場合はステップS304に移る。
【0015】
ステップS305からステップS309までで、ユーザ辞書109に見出し語を登録する。
ステップS305では、読み上げ箇所選択部104が保持する読み上げ箇所中の見出し語について、品詞抽出部105が前記見出し語の品詞を特定する(品詞特定)。より具体的には、品詞抽出部105見出し語の説明情報の中から品詞に関する部分を抽出し品詞を特定する。1つの見出し語について複数の品詞がある場合は、見出し語の説明情報における読み上げ箇所の位置を基準に品詞を特定することができる。品詞を特定したらステップS306に移る。
ステップS306では、読み上げ箇所選択部104が保持する読み上げ箇所の中の見出し語について、発音記号抽出部106が前記見出し語の発音記号を特定する(発音記号特定)。より具体的には、発音記号抽出部106は、見出し語の説明情報の中から発音記号に関する部分を抽出し発音記号を特定する。1つの見出し語について複数の発音記号がある場合は、発音記号抽出部106は、ステップS305で特定された品詞に基づいて対応する発音記号を特定する。発音記号を特定したらステップS307に移る。
【0016】
ステップS307では、発音記号変換部107が発音記号を音声合成用発音記号に変換する。発音記号抽出部106が抽出した発音記号は電子辞書コンテンツで定められた発音記号及び発音記号体系に基づいているため、これを音声合成用の発音記号に変換する必要がある。このため発音記号の変換テーブルを事前に用意しておくものとする。発音記号を変換したらステップS308に移る。
ステップS308では、同一表記単語一時抑制部108が見出し語と同一表記の単語をユーザ辞書109で一時的に使用不可とする。ここでは一時的な使用不可を実現するため、同一表記単語一時抑制部108は、ユーザ辞書から単語を削除する。もし表記が同じで発音記号が異なる単語が既にユーザ辞書に登録されている場合、単に見出し語をユーザ辞書に登録するだけでは、読み上げ箇所を言語解析した結果、所望の読み(つまり、見出し語の読み)が選択されない可能性がある。ここでは確実に見出し語の読みが選択されるように見出し語と同一表記の単語をユーザ辞書から一時的に削除する。より具体的には、ユーザ辞書検索部110がユーザ辞書109を対象に見出し語を検索する。ユーザ辞書削除部111は、検索にヒットした単語をユーザ辞書から削除する。ユーザ辞書削除部111は、検索にヒットした単語が複数ある場合は全て削除する。削除した単語はステップS310で音声合成した後のステップS312で再度ユーザ辞書に登録するので、同一表記単語一時抑制部108が保持しておく。同一表記の単語をユーザ辞書で一時的に使用不可にして、ステップS309に移る。
【0017】
ステップS309では、見出し語登録部116がユーザ辞書109に見出し語を登録する。より具体的には、見出し語検索部102が保持する見出し語の表記、品詞抽出部が保持する品詞、発音記号変換部107が保持する発音記号をユーザ辞書登録部117がユーザ辞書109に登録する。登録したらステップS310に移る。
ステップS310では、読み上げ箇所選択部104が保持する読み上げ箇所を音声合成部118が音声合成する。合成音声を出力したらステップS311に移る。
ステップS311では、ステップS308において同一表記単語を一時抑制した場合はステップS312に移り、一時抑制しなかった場合は処理を終了する。
ステップS312では、同一表記単語抑制解除部119が、ステップS308において一時抑制した同一表記単語の抑制を解除するため、再度、ユーザ辞書109に登録する。より具体的には、同一表記単語一時抑制部108が保持する一時削除した単語をユーザ辞書登録部117がユーザ辞書109に登録する。一時削除した単語が複数ある場合は、同一表記単語抑制解除部119は、全て登録する。登録後、処理を終了する。
【0018】
本実施形態における音声読み上げにユーザ辞書を利用する効果をより具体的な例を用いて説明する。単語blog(発音 b l a: g)が電子辞書コンテンツ112に登録されており、一方、合成用言語辞書113には登録されていないものとする。また、未知語読み付け部115による読み付け処理を行うと単語blogには b l a: dz I という読みが付与されるものとする。
ユーザは、単語blogを電子辞書で検索、表示、音声合成した後、別の単語、例えばdeleteを検索、表示、音声合成するものとする。単語deleteで音声合成する際の読み上げ箇所に単語blogが含まれているものとする。
ユーザが単語blogを電子辞書で検索、表示、音声合成(ステップS301〜S310)すると、その過程でblogの見出し語の説明情報に記載されている発音記号や品詞と共に単語blogがユーザ辞書109に登録される。よって、音声合成時には、ユーザ辞書に登録されたblogが選択され、電子辞書コンテンツ通りの発音(b l a: g)で音声合成が行われる。例えば、読み上げ箇所を I read his blog every day. とすると、単語blogの部分が正しく b l a: gと発音される。
一時削除した単語の有無に応じて、同一表記単語の再登録を行い(ステップS312、S313)、処理を終了するものとする。その結果、単語blogがユーザ辞書に登録されたままとなる。
【0019】
次に、ユーザが単語deleteを電子辞書で検索、表示、音声合成を行う。ユーザが指定する読み上げ箇所を I delete my blog. とする。見出し語はdeleteなので、単語deleteがユーザ辞書109に登録される。音声合成を行うと、単語deleteだけでなく、単語blogも電子辞書コンテンツ通りの発音で正しく音声合成される。これは、前回ユーザが単語blogを音声合成した際に、単語blogがユーザ辞書に登録されたからである。このように一度音声合成した見出し語が自動的にユーザ辞書に登録、保持されるため、別の見出し語の例文中に出現した場合にも電子辞書コンテンツの発音記号通りに音声合成することが可能になる。
なお、本実施形態では、同一表記単語一時抑制部108が同一表記の単語をユーザ辞書で一時的に使用不可とするためユーザ辞書から削除する場合について説明したが、これに限定されるものではない。例えば、ユーザ辞書の機能として、登録されている単語それぞれについて使用可能、使用不可の状態を制御できる場合もよいものとする。この場合、同一表記単語一時抑制部108は、ユーザ辞書の単語の状態を設定するユーザ辞書状態設定部(図示なし)を介して、ユーザ辞書に登録されている同一表記単語を使用不可の状態に設定する。使用不可に設定された単語は音声合成の言語解析では使用されないものとし、使用可能に設定された単語は音声合成の言語解析に使用されるものとする。同様に、同一表記単語抑制解除部119は、同一表記単語一時抑制部108が一時的に使用不可とした同一表記の単語をユーザ辞書で使用可能な状態に設定する。なお、使用可能、使用不可のように2値の状態だけに限らず、優先度を設定するように構成してもよいものとする。ユーザ辞書での使用を抑制したい場合は優先度を十分下げ、逆に抑制を解除したい場合は優先度を所定の値に戻すことで実現してもよいものとする。
【0020】
<実施形態2>
一般に、ユーザ辞書に登録できる単語の数には上限がある。即ち、上限まで単語を登録した後も本実施形態の前提である見出し語を電子辞書コンテンツの発音通りに読み上げるためには、新規に単語を登録するためには登録済みの単語を削除する必要がある。そのためにはどの単語を削除するのかを決定する必要がある。簡単な方法としては、登録日時の古い順や、使用頻度の少ない順等が有効である。
以下、別の有効な方法として、電子辞書コンテンツの発音記号と音声合成の発音記号の差異に着目した削除単語決定方法について説明する。
図5は、実施形態2の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
図5において、図1と同じモジュールには図1と同じ番号を振り説明を省略する。
差異コスト算出部601は、発音記号変換部107が変換した音声合成用の読みと合成用言語辞書113に登録されている読み又は未知語読み付け部115が推定する読みとの差異を算出する。
削除単語決定部602は、ユーザ辞書に空きが不足する場合に、差異コスト算出部601が算出した差異コストにしたがって削除する単語を決定する。
【0021】
図6は、ユーザ辞書に登録できる単語数の上限を考慮した場合の処理の流れを示すフローチャートである。図6において、ステップS301〜S307、S309、S310は図4と処理が同じであるため説明を省略する。
ステップS308において、同一表記単語一時抑制部108が同一表記の単語をユーザ辞書から一時的に削除して、ステップS701に移る。
ステップS701では、差異コスト算出部601が見出し語の差異コストを算出する。差異コストは、ステップS703及びステップS906において、ユーザ辞書に登録する語数が上限に達した場合に削除する単語を決定するために用いる。差異コストは、電子辞書コンテンツにおける見出し語の読みと音声合成による見出し語の読みとの差異を数値化したものである。ここでは、電子辞書コンテンツの見出し語の発音記号と音声合成とが中間的に出力する発音記号との差で定義する。音声合成が中間的に出力する発音記号には2つの可能性がある。見出し語が合成用言語辞書113に登録されている場合とそうでない場合とである。合成用言語辞書に登録されている場合は合成用言語辞書の発音記号を用いる。一方、合成用言語辞書に登録されていない場合は、未知語読み付け部115が見出し語の表記から発音記号を推定したものを用いる。
【0022】
以下、図7を用いて差異コストの算出処理の流れを説明する。
図7は、ステップS701における差異コスト算出の処理の流れを示すフローチャートである。
ステップS401では、合成用言語辞書検索部114が合成用言語辞書113を対象に見出し語を検索し、ステップS402に移る。
ステップS402では、合成用言語辞書検索部114は、検索にヒットした場合、つまり合成用言語辞書113に見出し語が登録されていた場合、ステップS404に移る。合成用言語辞書検索部114は、登録されていない場合、ステップS403に移る。
ステップS403では、未知語読み付け部115が、見出し語の表記を入力として発音記号を推定する。発音記号を推定し、ステップS404に移る。
ステップS404では、差異コスト算出部601が、電子辞書コンテンツの見出し語の発音記号(発音記号変換部107が保持する音声合成用の発音記号)とステップS401からS403で求めた発音記号との差異コストを算出する。差異コストを算出したら終了する。
【0023】
ここで差異コストの算出方法について一例を説明する。電子辞書コンテンツの見出し語の発音記号とステップS401からS403までで求めた発音記号とに基づき、次のように定義することができる。
差異コスト=(挿入誤り数+脱落誤り数+置換誤り数)/ 辞書コンテンツの見出し語の発音記号数
より具体的な例を用いて差異コストの算出例を説明する。
電子辞書コンテンツの見出し語の発音記号 b l a: g
音声合成が中間的に出力する発音記号 b l a: dz I
2つの発音記号の間でDPマッチングを行い、各発音記号の対応関係を決定すると以下のようになる。
b l a: g
b l a: dz I
b, l, a: は一致、gとdzは置換誤り、Iは挿入誤りとなる。よって、差異コストは、
差異コスト=(1+0+1)/4 = 0.5
となる。
図6の説明に戻って、ステップS701で差異コストを算出したらステップS309に移る。
【0024】
ステップS309では、見出し語登録部116が見出し語の表記、品詞、発音記号、及び、差異コストをユーザ辞書109に登録する。ユーザ辞書は、単語ごとに差異コストを保持できるものとする。登録したらステップS310に移る。
ステップS311では、ステップS308において同一表記単語を一時削除した場合はステップS312に移り、一時削除しなかった場合はステップS702に移る。
ステップS312では、同一表記単語抑制解除部119が、ステップS308において一時削除した同一表記単語を再度、ユーザ辞書109に登録し、ステップS702に移る。
ステップS702では、ユーザ辞書109に新たに単語を登録する空きがない場合はステップS703に移り、空きがある場合は終了する。
ステップS703では、削除単語決定部602がユーザ辞書109から削除する単語を決定する。削除する単語は、ユーザ辞書109に登録されている単語の差異コストが最小の単語とする。
【0025】
ここで、差異コストが小さいということは、音声合成した場合に電子辞書コンテンツの単語の読みと合成音声の読みの差異が小さいことを意味する。つまり、ユーザ辞書登録しておく価値が小さいことになる。逆に、差異コストが大きいということは、音声合成した場合にその単語がユーザ辞書に登録されていないと音声合成の読みの差異が大きいことを意味する。よって、差異が小さい単語から削除することにより、電子辞書コンテンツの単語の読みとの差異が大きい単語を可能な限りユーザ辞書に残すことになる。これにより、ユーザ辞書に残される差異コストが大きい単語は電子辞書コンテンツの読み通りに音声合成で発音できるので、限られたユーザ辞書登録語数の中で可能な限り電子辞書コンテンツの読みに近い音声合成を実現することが期待できる。
削除する単語が決まったら、ユーザ辞書削除部111がその単語をユーザ辞書109から削除して、終了する。
【0026】
なお、本実施形態では、ステップS309でユーザ辞書109の空き状況を確認することなくユーザ辞書109に見出し語を登録できるようにするため、ステップS702及びS703で少なくとも1つの空きを確保する処理を行っている。なお、ステップS309の前でユーザ辞書109の空き状況を確認し、空きがない場合は差異コストが最小の単語をユーザ辞書から削除するようにしてもよい。
これまでは、見出し語指定部101で指定された見出し語だけをユーザ辞書に登録する場合について説明したが、これに限定されることはなく、見出し語と同一表記の単語も併せて登録してもよいものとする。
【0027】
<実施形態3>
ここで、同一表記で読みが異なる単語が存在する場合を考える。先に述べた通り、ユーザ辞書109に登録された単語は合成用言語辞書113に登録された単語より優先して選択される。どちらかの読みの単語だけがユーザ辞書に登録されていると常にその読みが採用されてしまうため、その単語が別の見出し語の例文中に現れる際に読み誤りの可能性が高くなる。そこで、ユーザ辞書に同一表記単語を全て登録することにする。これにより、読み上げ箇所を言語解析する際にユーザ辞書に登録されている同一表記単語の品詞に基づいて前後の接続可能性が高い単語が選択され、正しい読みで音声合成される可能性が高くなる。一方、削除する場合は同一表記単語をユーザ辞書から全て削除することにより、読み上げ箇所を言語解析する際に合成用言語辞書に登録されている単語の品詞に基づいて前後の接続可能性が高い単語が選択される。これにより、正しい読みで音声合成される可能性が高くなる。
以下、図8及び図9を参照して、見出し語と同一表記の単語も併せて登録する場合について説明する。
【0028】
図8は、実施形態3の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
図8において、図5と同じモジュールには同じ番号を振り説明を省略する。
見出し語内検索部801は、見出し語検索部102が検索して得た説明情報を対象として見出し語と同一表記の単語を検索する。
見出し語外検索部802は、電子辞書コンテンツ112を対象として、見出し語と同一表記の単語を検索する。
【0029】
図9は、見出し語と同一表記の単語とを全てユーザ辞書に登録する場合の処理の流れを示すフローチャートである。
図9において、ステップS301〜310、S312、S70〜S703は、図6と同じ処理を行うステップには同じ番号を付与し説明を省略する。
ステップS311では、ステップS308において同一表記単語を一時削除した場合はステップS312に移り、一時削除しなかった場合はステップS901に移る。
ステップS901では、見出し語内検索部801が見出し語の説明情報を対象に見出し語と表記が同じで品詞や発音が異なる単語を検索する。見出し語内検索部801は、検索結果を保持してステップS902に移る。
ステップS902では、見出し語外検索部802が電子辞書コンテンツ112を対象に見出し語と表記が同じで品詞や発音が異なる単語を検索する。表記が同じ単語は同一の見出し語の説明情報に含まれることが多いが、辞書によって、或いは、単語によっては、別見出しとして記載される場合がある。ステップS902はそのための処理である。見出し語外検索部802は、検索結果を保持してステップS903に移る。
【0030】
ステップS903では、ステップS901及びステップS902の結果、同一表記で品詞や発音記号が異なる単語が存在する場合は、ステップS904に移る。存在しない場合は、ステップS702に移る。
ステップS904では、検索にヒットした単語それぞれについて、差異コスト算出部601が差異コストを算出する。例えば、差異コスト算出部601は、3単語がヒットした場合、まず3単語それぞれの差異コストを求める。更に、差異コスト算出部601は、3単語の差異コストの平均値を求め、この値を3単語共通の差異コストとする。これは、ユーザ辞書から差異コストが小さい単語を削除する際に、3単語同時に削除するための工夫である。先に述べた通り、ユーザ辞書109に登録された単語は合成用言語辞書113に登録された単語より優先して選択される。そのため、ユーザ辞書に同一表記単語が部分的に残っていると常にその単語が採用されてしまうため、読み誤りの可能性が高くなる。ユーザ辞書から削除する場合は同一表記単語を全て削除することにより、読み上げ箇所を言語解析する際に、単語に関しては合成用言語辞書に登録されている単語の品詞に基づいて前後の接続可能性が高い単語が選択される。これにより、正しい読みで音声合成される可能性が高くなる。差異コスト算出部601は、差異コストを算出したらステップS905に移る。
【0031】
ステップS905では、ユーザ辞書109に新たに単語を登録する空きが十分にない場合は、ステップS906に移り、十分な空きがある場合は、ステップS909に移る。
ここで、ユーザ辞書登録候補である同一表記単語の個数をNcとすると、十分な空きとは、Nc+1単語分である。+1の意味は、先に述べたようにステップS309においてユーザ辞書109に常に1単語分の空きを確保しておくためである。
ステップS906では、削除単語決定部602が削除する単語を決定するため、ユーザ辞書登録候補である同一表記単語の差異コストと、ユーザ辞書に登録されている単語の差異コストと、を比較する。ユーザ辞書の空きをNvとすると、ユーザ辞書から削除する単語の個数Ndは次のように表すことができる。
Nd=Nc+1−Nv
比較に際しては、ユーザ辞書に登録されている単語の差異コストの小さい順に並べてNd番目の値と比較すればよい。処理を高速化するため、予め差異コストの値でソートしておいてもよい。比較後、ステップS907に移る。
【0032】
ステップS907では、比較の結果、ユーザ辞書登録候補である同一表記単語の差異コストの方がNd番目の値よりも小さい場合は処理を終了する。つまり、ユーザ辞書登録候補である同一表記単語の差異コストが小さいので登録しない。小さくない場合は、ステップS908に移る。
ステップS908では、削除単語決定部602が削除する単語を決定する。ステップS906で求めたNdに基づき、差異コストが小さい順に少なくともNd個の単語をユーザ辞書から削除する単語として決定する。ここで「少なくとも」と記載したのは、Nd番目の単語と同一表記単語も削除単語とするからである。ステップS904に記載した通り、Nd番目の単語と同一表記単語の差異コストは同一である。ユーザ辞書削除部111が削除単語をユーザ辞書109から削除して、ステップS909に移る。
ステップS909では、ユーザ辞書登録部117がユーザ辞書登録候補である同一表記単語をユーザ辞書109に登録して処理を終了する。
【0033】
以上説明したように、見出し語と同一表記の単語を併せてユーザ辞書に登録し、また、削除する際は同一表記の単語を全て削除する。これにより、一度音声合成した見出し語及び同一表記単語が別の見出し語の例文中に現れた際にも、電子辞書コンテンツ112の発音記号通りに読まれる可能性が見出し語だけをユーザ辞書に登録する場合に比べて高くなる。
【0034】
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
【0035】
以上、上述した各実施形態によれば、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができる。
なお、上述した実施形態では動的に単語を追加、削除、また、単語の状態を設定するための辞書として、ユーザ辞書を用いる場合について説明した。一般的にユーザ辞書はユーザが所望の単語を思い通りの読みで音声合成するために利用するものである。上述した実施形態ではこのユーザ辞書を電子辞書システムが利用する場合について説明した。但し、ユーザ辞書に限られるものではなく、動的に単語を追加、削除、また、単語の状態を設定することができ、合成用言語辞書よりも優先的に登録単語が選択される辞書であればよいものとする。
また、上述した実施形態では、見出し語の詳細説明中の読み上げ箇所をユーザが選択する場合について説明したが、これに限定されるものではない。例えば、見出し語の詳細説明が表示された時点で、詳細説明全てが読み上げ箇所と自動的に決定されてもよいものとする。また、表示するページが切り替わるタイミングで、ページ全体が読み上げ箇所と自動的に決定される場合等任意の方法でもよいものとする。
また、上述した実施形態では、KBC206を介して見出し語や読み上げ箇所をユーザが指定する場合について説明したが、これに限定されるものではない。視線入力、ジェスチャー入力等、任意の入力手段により実現する場合もよいものとする。
【0036】
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、電子辞書コンテンツの読み上げを行う情報処理装置は、電子辞書コンテンツを画面に表示し操作することが可能な携帯端末装置やコンピュータによっても実現される。
【符号の説明】
【0037】
202 CPU、203 ROM、204 RAM、211 FM

【特許請求の範囲】
【請求項1】
電子辞書コンテンツの読み上げを行う情報処理装置であって、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索手段と、
前記検索手段での検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示手段と、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定手段と、
前記発音記号特定手段で特定された発音記号を音声合成用発音記号に変換する変換手段と、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録手段と、
前記読み上げ箇所を音声合成する音声合成手段と、
前記一時抑制手段で一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除手段と、
を有する情報処理装置。
【請求項2】
前記一時抑制手段は、前記見出し語と同一表記の単語を辞書から一時的に削除することで一時的に使用不可とする請求項1記載の情報処理装置。
【請求項3】
前記抑制解除手段は、前記一時抑制手段で一時的に削除した前記同一表記の単語を再度、前記辞書に登録することで前記単語を前記辞書で使用可能とする請求項2記載の情報処理装置。
【請求項4】
前記電子辞書コンテンツにおける見出し語の読みと前記音声合成手段での音声合成による見出し語の読みとの差異を示す差異コストを算出する算出手段と、
前記辞書に新たに単語を登録する空きがない場合、前記算出手段で算出された差異コストが最小の単語を前記辞書から削除する削除手段と、
を更に有する請求項1乃至3何れか1項記載の情報処理装置。
【請求項5】
前記削除手段は、前記算出手段で算出された差異コストが最小の単語と同一表記単語も前記辞書から削除する請求項4記載の情報処理装置。
【請求項6】
前記登録手段は、更に、前記見出し語と共に、前記見出し語と同一表記の単語を前記辞書に登録する請求項1乃至5何れか1項記載の情報処理装置。
【請求項7】
電子辞書コンテンツの読み上げを行う情報処理装置が実行する情報処理方法であって、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索ステップと、
前記検索ステップでの検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示ステップと、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定ステップと、
前記発音記号特定ステップで特定された発音記号を音声合成用発音記号に変換する変換ステップと、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制ステップと、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録ステップと、
前記読み上げ箇所を音声合成する音声合成ステップと、
前記一時抑制ステップで一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除ステップと、
を含む情報処理方法。
【請求項8】
電子辞書コンテンツの読み上げを行うコンピュータに、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索ステップと、
前記検索ステップでの検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示ステップと、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定ステップと、
前記発音記号特定ステップで特定された発音記号を音声合成用発音記号に変換する変換ステップと、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制ステップと、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録ステップと、
前記読み上げ箇所を音声合成する音声合成ステップと、
前記一時抑制ステップで一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除ステップと、
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−68667(P2013−68667A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2011−205175(P2011−205175)
【出願日】平成23年9月20日(2011.9.20)
【出願人】(000001007)キヤノン株式会社 (59,756)