説明

音声読上装置

【課題】文章読み上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができる音声読上装置を提供する。
【解決手段】制御部105は、テキストデータTDの文字数をカウントし、予め設定された文字数で段落を区切り、各段落の先頭位置をインデックスとして記憶部106に記憶するとともに、各インデックスに規則性を持った音データ(ドレミ音等の順序を想起させるような音データ)MDを割り当てて記憶部106に記憶し、ユーザによる入力操作によりテキストデータTDの各段落の任意のインデックスが指定されたときに、該当するインデックスに対応した音データMDを再生するようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストデータの音声読み上げを行う音声読上装置に関する。
【背景技術】
【0002】
電子メール等のテキストデータを読み上げる音声読上装置が案出されている。例えば、特許文献1には、電話機内に保存してある電子メールやショートメールの文字情報の読み上げ指令に従い、保存してある文字情報を音声コードデータに変換し、変換した音声コードデータを音声として発声する携帯電話機が開示されている。また、特許文献2には、音声読み上げ用のプログラムをダウンロードし、このプログラムを用いてテキスト文を読み上げる携帯端末が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−350692号公報
【特許文献2】特開2003−051867号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来の音声読み上げ装置は、単にテキストデータをその文頭から読み上げるのみであるため、以下に示す課題がある。
(1)テキストデータの読み上げ時に、知りたい情報に直ぐにアクセスすることができない。
(2)同じ情報を繰り返し聞きたい場合には始めから聞き返す必要があり、煩わしい。
(3)今読み上げている箇所が全体のどのあたりであるか把握し難い(あとどれくらいで文章が終わりそうか想像し難い)。
【0005】
本発明は、係る事情に鑑みてなされたものであり、テキストデータの読み上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができる音声読上装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の音声読上装置は、文章の区切りを示すインデックスが挿入されたテキストデータを読み上げる音声読上装置であって、入力操作を検出する入力操作部と、早送り時に、前記入力操作部の検出した入力操作に基づいて、前記単数又は複数のインデックスに割り当てられた音を再生する音再生部と、を備える。
【0007】
上記構成によれば、テキストデータの早送り再生時に、文章の区切りごとに挿入されたインデックスに割り当てられた音を再生するので、ユーザはインデックスに割り当てられた音を聞くことにより、知りたい情報に直ぐにアクセスすることができるようになる。また、同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなくなり、煩わしさが解消される。
【0008】
上記構成において、テキストデータの読み上げ時に、前記入力操作部の検出した入力操作に基づいて、テキストデータを読み上げる文字読上部を備え、前記音再生部は、テキストデータの読み上げ時に、前記文字読上部のテキストデータの読み上げに重畳させて、前記単数又は複数のインデックスのうち、前記文字読上部の読み上げるテキストデータの読み上げ位置に応じたインデックスに割り当てられた音を再生する。
【0009】
上記構成によれば、テキストデータの読み上げとともに、インデックスに割り当てられた音が再生されるので、今読み上げている箇所が全体のどのあたりであるのかを容易に把握できるようになる。
【0010】
上記構成において、前記音再生部は、早送り時に、前記入力操作部の入力操作の検出のたびに前記単数又は複数のインデックスのうち次のインデックスに割り当てられた音を再生する。
【0011】
上記構成によれば、入力操作の検出のたびに次のインデックスに割り当てられた音を再生するので、飛び越し再生が可能となる。
【0012】
上記構成において、前記文字読上部は、前記入力操作部の入力操作の検出のたびにテキストデータの読み上げを開始する。
【0013】
上記構成によれば、入力操作の検出のたびに通常の読み上げ再生が可能となる。
【0014】
上記構成において、テキストデータに複数のインデックスを挿入する制御部を備え、前記制御部は、前記入力操作部の検出した入力操作に基づいて、分割数を決定し、テキストデータの文字数又は音節数を前記分割数で分割した区切り位置にインデックスを挿入する。
【0015】
上記構成によれば、テキストデータの任意の位置にインデックスを挿入することができ、インデックスに割り当てられた音を聞くことにより、知りたい情報に直ぐにアクセスすることができるようになる。また、同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなくなり、煩わしさが解消される。
【0016】
上記構成において、前記インデックスに割り当てられた音は、ドレミ音である。
【0017】
上記構成によれば、区切られた文章を容易に判別することができる。
【発明の効果】
【0018】
本発明によれば、テキストデータの読み上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができる。
【図面の簡単な説明】
【0019】
【図1】本発明の音声読上装置の概要を説明するための図
【図2】本発明の実施の形態1に係る音声読上装置の概略構成を示すブロック図
【図3】図1の音声読上装置におけるテキストデータの分割処理及びインデックスに対する音データの割り当て処理を示すフローチャート
【図4】図1の音声読上装置において、段落数を「4」とした場合のテキストの分割状態の一例を示す図
【図5】図1の音声読上装置において、段落数を「4」とした場合の位置情報p(n)の記憶状態を示す図
【図6】図1の音声読上装置において、段落数を「4」とした場合の各段落に対応する音データq(n)の記憶状態を示す図
【図7】図1の音声読上装置において、入力操作によるインデックス選択と音声再生処理を示すフローチャート
【図8】本発明の実施の形態2に係る音声読上装置におけるテキストデータの分割処理及びインデックスに対する音データの割り当て処理を示すフローチャート
【発明を実施するための形態】
【0020】
以下、本発明を実施するための好適な実施の形態について、図面を参照して詳細に説明する。
【0021】
実施の形態の説明に先立ち本発明の概要を説明する。図1は、本発明の概要を説明するための図である。同図に示すように、本発明は、電子メールなどのテキストデータを音声読み上げする際に、規則性を持った音(例えば、“ド、レ、ミ、ファ、ソ、ラ、シ、ド”)を、各段落の文頭に割り当てる。同図では文章を3行ごとに区切って音符を割り当てている。すなわち、第1段落には“ド”、第2段落には“レ”、第3段落には“ミ”、第4段落には“ファ”、第5段落には“ソ”、第6段落には“ラ”、第7段落には“シ”を割り当てている。文章を所定の塊ごとに区切り、それぞれに音符を割り当てて、各音符の音を発声させることで、今、文章のどの部分を読み上げているのかを容易に知ることができる。
【0022】
(実施の形態1)
図2は、本発明の実施の形態1に係る音声読上装置の概略構成を示すブロック図である。同図において、本実施の形態に係る音声読上装置100は、入力操作部101と、音声出力部102と、文字読上部103と、音再生部104と、制御部105と、記憶部106とを備える。制御部105は、“ド、レ、ミ、ファ、ソ、ラ、シ、ド”のインデックスに割り当てる音データMDの入力を行い、また音声読み上げを行うテキストデータTDの入力を行って、テキストデータの分割処理、テキストデータに挿入したインデックスに対する音データの割り当て処理を行い、また入力操作によるインデックス選択処理を行う。本実施の形態では、テキストデータの分割処理においては、文字数で段落を区切るようにしている。なお、前記音データMD及びテキストデータTDの各々は図示しない記憶部に記憶される。制御部105は、ASIC(Application Specific Integrated Circuit)で組んでも良いし、汎用のマイクロコンピュータで組んでも良い。
【0023】
入力操作部101は、キーやタッチパネル等の入力操作を可能とする入力装置で構成され、テキストデータに対する段落数の設定及び決定、音声読上時の段落番号の入力、音声読上時すなわち再生時の操作(早送り操作を含む)等の操作に使用される。音声出力部102は、音声出力用のスピーカであり、文字読上部103や音再生部104からの電気信号を物理振動に変えて、音楽や音声などの音を生み出す。文字読上部103は、テキストデータTDの読み上げ時に、入力操作部101の検出した入力操作に基づいて、テキストデータTDの読み上げを実施し、電気信号として出力する。特に、文字読上部103は、入力操作部101の入力操作のたびにテキストデータTDの読み上げを開始する。音再生部104は、テキストデータTDの読み上げ時に、文字読上部103のテキストデータの読み上げに重畳させて、文字読上部103の読み上げるテキストデータTDの読み上げ位置に応じたインデックスに割り当てられた音を再生し、電気信号として出力する。特に、音再生部104は、早送り時に、入力操作部101の入力操作の検出のたびに複数のインデックスのうち次のインデックスに割り当てられた音データMDを再生する。記憶部106は、テキストデータTDに挿入されたインデックス等を記憶する。
【0024】
次に、本実施の形態に係る音声読上装置100の動作について説明する。
図3は、本実施の形態に係る音声読上装置100におけるテキストデータTDの分割処理及びインデックスに対する音データMDの割り当て処理を示すフローチャートである。ここで、変数及び定数を以下のように決定する。
[変数]
k:段落数
l:文章全体の文字数
m:1段落当たりの文字数
n:段落番号(n=1〜k)
p(n):文章の先頭(第1段落の先頭)から第n段落目の先頭までの文字数
q(n):予め用意された音データのうち、n番目の音データ
[定数]
K:予めユーザが設定した段落数
OFFSET:p(n)と音声nを格納する記憶領域のアドレスのオフセット
【0025】
制御部105は、ユーザが入力操作部101を使用して指定した段落数の設定を行う(k=K、ステップS1)。制御部105は、ユーザが指定した段落数を設定した後、テキストデータTDの読み込みを行い(ステップS2)、そのテキストデータTD内の全ての文字数lをカウントする(ステップS3)。テキストデータTD内の全ての文字数をカウントした後、ユーザが指定した段落数でテキストデータTDを分割する(m=l/k、ステップS4)。図4に段落数を「4」とした場合のテキストデータTDの分割状態の一例を示す。
【0026】
次いで、制御部105は、記憶部106の所定のアドレス領域に第1段落の位置情報p(n=1)を記憶する(p(n)=m×n+1、ステップS5)。この位置情報p(n=1)がインデックスに相当する。制御部105は、記憶部106に第1段落の位置情報p(n=1)を記憶した後、位置情報p(n=1)を格納したアドレスにオフセットを加えたアドレス領域に音データq(n=1)を格納する(ステップS6)。制御部105は、ステップS5及びステップS6の処理を段落ごとに行うことから、記憶部106の第1段落の位置情報p(n=1)及び音データq(n=1)を格納した後、nを1つインクリメントして(n=2、ステップS7)、設定した段落数までステップS5及びステップS6の処理を行う。すなわち、nの値がkを超えるまで(ステップS8の処理でYESと判断するまで)ステップS5及びステップS6の処理を行う。例えば、段落数を「4」とした場合、nが「5」になるまでステップS5及びステップS6の処理を行う。
【0027】
図5は、段落数を「4」とした場合の位置情報p(n)の記憶状態を示す図である。同図において、記憶部106の0x0001のアドレス領域に第1段落の位置情報:p(1)、0x0002のアドレス領域に第2段落の位置情報:p(2)、0x0003のアドレス領域に第3段落の位置情報:p(3)、0x0004のアドレス領域に第4段落の位置情報:p(4)がそれぞれ格納されている。
【0028】
また、図6は、段落数を「4」とした場合の各段落に対応する音データq(n)の記憶状態を示す図である。同図において、記憶部106の0x0001+OFFSETのアドレス領域に第1段落の音データ:q(1)、0x0002+OFFSETのアドレス領域に第2段落の音データ:q(2)、0x0003+OFFSETのアドレス領域に第3段落の音データ:q(3)、0x0004+OFFSETのアドレス領域に第4段落の音データ:q(4)がそれぞれ格納されている。
【0029】
このようにして制御部105は、テキストデータTDの分割処理及びインデックスに対する音データMDの割り当て処理を行う。
【0030】
次に、入力操作によるインデックス選択と音声再生処理について説明する。
図7は、当該処理を示すフローチャートである。同図において、制御部105は、まず段落番号nを入力する(ステップS20)。段落番号nはユーザが入力操作部101を使用して指定する。制御部105は、ユーザによって指定された段落番号nを入力した後、音再生部104に当該段落番号nに対応する音データq(n)を与えて再生させる(ステップS21)。すなわち、該当する音データq(n)を記憶部106から読み出して音再生部104に与える。音再生部104は、与えられた音データq(n)の音を発声する。
【0031】
制御部105は、ユーザによる段落番号nの決定があるまでステップS20とステップS21の処理を繰り返す度に音データq(n)を音再生部104に与える。例えば、音データq(1)を“ド”、音データq(2)を“レ”、音データq(3)を“ミ”、音データq(4)を“ファ”とすると、ユーザが例えば段落番号2を指定した場合、その段落番号に対応する音データq(2)の“レ”の音データMDを音再生部104に与える。この場合、ユーザが早送り操作した場合、ユーザが所望の段落番号を決定するまで、“ド”→“レ”→“ミ”→“ファ”の各音データMDが繰り返し音再生部104に与えられる。
【0032】
制御部105は、ユーザが段落番号を決定するまでの間、決定を受け付けたどうか判定し(ステップS22)、ユーザが段落番号を決定すると、決定された段落の位置p(n)からテキストデータTDを文字読上部103に与えて、音声読上げを開始する(ステップS23)。すなわち、決定された段落の位置p(n)からのテキストデータTDを入力し、それを文字読上部103に与えて音声読み上げを行わせる。音声読み上げを開始した後、nを1だけインクリメントする(n=n+1、ステップS24)。そして、nがk(段落数)を超えるかどうか判定し(ステップS25)、kを超えなければ、超えるまでの間、ステップS23及びステップS24の処理を繰り返す。
【0033】
その後、nがkを超えると本処理を終了する。例えば、第3段落のテキストデータTDからの音声読み上げが開始された場合、第4段落のテキストデータTDの音声読み上げが終了した後、本処理を終了する。
【0034】
このように本実施の形態に係る音声読上装置100によれば、テキストデータTDの全体の文字数をカウントした後、予め設定された文字数で段落を区切り、各段落の先頭位置をインデックスとして記憶するとともに、各インデックスに規則性を持った音データ(ドレミ音等の順序を想起させるような音データ)MDを割り当てるようにし、ユーザによる入力操作によりテキストデータTDの各段落の任意のインデックスが指定されたときに、指定されたインデックスに対応した音データMDを再生するようにしたので、テキストデータTDの読み上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができる。
【0035】
また、入力操作の検出のたびに次のインデックスに割り当てられた音を再生するので、飛び越し再生が可能となる。また、インデックスにドレミ音を割り当てることで、区切られたテキストデータTDの文章を容易に判別することができる。
【0036】
なお、本実施の形態では、テキストデータTDに複数のインデックスを挿入したが、当然ながら、挿入するインデックスは1つの場合もある。
【0037】
(実施の形態2)
前述した実施の形態1に係る音声読上装置100は、テキストデータTDを予め設定された文字数で段落を区切るようにしたが、本発明の実施の形態2に係る音声読上装置は、改行コード(例えばキャリッジリターン(CR)のコード)で段落を区切るようにしたものである。音声読上装置の構成は実施の形態1に係る音声読上装置100と同様であるので、図2を援用することとし、また符号200を付けることとする。
【0038】
図8は、本発明の実施の形態2に係る音声読上装置200におけるテキストデータTDの分割処理及びインデックスに対する音データMDの割り当て処理を示すフローチャートである。ここで、変数及び定数を以下のように決定する。
[変数]
i:文章の先頭(段落1の先頭)からの文字数
k:文章全体の段落数
l:文字全体の文字数
n:段落番号(n=1〜k)
moji:読み込んだ文字の文字コード
p(n):文章の先頭(段落1の先頭)からn段落目の改行コードまでの文字数
q(n):予め用意された音データのうち、n番目の音データ
[定数]
OFFSET:p(n)と音声nを格納する記憶領域のアドレスのオフセット
【0039】
制御部105は、まず図示せぬ記憶部に記憶されているテキストデータTDを読み込み(ステップS30)、テキストデータTD内の全ての文字数lをカウントする(ステップS31)。全ての文字数をカウントした後、i=0に設定する(ステップS32)。次いで、制御部105は、読み込んだテキストデータTDの1文字を読み込む(i=i+1、ステップS33)。そして、今読み込んだ文字が最終文字(i=l?)であるかどうか判定し(ステップS34)、最終文字であれば本処理を終了する。これに対して今読み込んだ文字が最終文字でなければ、今読み込んだ文字の文字コードmojiを参照する(ステップS35)。
【0040】
そして、参照した文字コードmojiが改行コードであるかどうか判定し(ステップS36)、改行コードでなければステップS33に戻り、次の1文字の読み込みを行う。これに対して改行コードであれば改行コードp(1)の位置情報p(1)を記憶する(ステップS37)。すなわち、前述した図5と同様に記憶部106の0x0001のアドレス領域に格納する。この位置情報p(1)がインデックスに相当する。
【0041】
次いで、制御部105は、位置情報p(1)を記憶した後、位置情報p(1)を格納したアドレスにオフセットを加えたアドレス領域に音データq(1)を格納する(ステップS38)。すなわち、前述した図6と同様に記憶部106の0x0001+OFFSETのアドレス領域に格納する。制御部105は、位置情報p(1)及び音データq(1)を格納した後、nを1つインクリメントして(n=n+1、ステップS39)、ステップS33に戻り、次の1文字の読み込みを行う。そして、最終文字になるまでステップS33〜ステップS39の処理を繰り返し、最終文字に達したときにステップS34の判定がYESとなって本処理を終了する。この結果、位置情報p(1)、p(2)、p(3)、…が、記憶部106の0x0001、0x0002、0x0003、…の各アドレス領域に格納されるとともに、音データq(1)、q(2)、q(3)、…が、記憶部106の0x0001+OFFSET、0x0002+OFFSET、0x0003+OFFSET、…の各アドレス領域に格納される。
【0042】
入力操作によるインデックス選択と音声再生処理は、前述した図7に示すフローチャートと同様になる。
【0043】
このように本実施の形態に係る音声読上装置200によれば、テキストデータTD内の全ての文字数をカウントした後、改行コードで段落を区切り、各段落の先頭位置をインデックスとして記憶するとともに、各インデックスに規則性を持った音ファイル(ドレミ音等の順序を想起させるような音ファイル)MDを割り当てるようにし、ユーザによる入力操作によりテキストデータTDの各段落の任意のインデックスが指定されたときに、該当するインデックスに対応した音データMDを再生するようにしたので、テキストデータTDの読みみ上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができる。
【0044】
また、入力操作の検出のたびに次のインデックスに割り当てられた音を再生するので、飛び越し再生が可能となる。また、インデックスにドレミ音を割り当てることで、区切られたテキストデータTDの文章を容易に判別することができる。
なお、上記実施の形態1、2における文字数の代わりに単語数を用いて同様の処理を行うこともできる。
【産業上の利用可能性】
【0045】
本発明は、テキストデータの読み上げ時に、知りたい情報に直ぐにアクセスすることができ、また同じ情報を繰り返し聞きたい場合には始めから聞き返す必要がなく、さらに今読み上げている箇所が全体のどのあたりであるか容易に把握することができるといった効果を有し、携帯電話やPDA(Personal Digital Assistant)等の携帯端末、パーソナルコンピュータ、電子辞書等のテキストデータを扱うことができる電子機器や、視覚障害者用の音声読上装置への適用が可能である。
【符号の説明】
【0046】
100、200 音声読上装置
101 入力操作部
102 音声出力部
103 文字読上部
104 音再生部
105 制御部
106 記憶部
TD テキストデータ
MD 音データ

【特許請求の範囲】
【請求項1】
文章の区切りを示すインデックスが挿入されたテキストデータを読み上げる音声読上装置であって、
入力操作を検出する入力操作部と、
早送り時に、前記入力操作部の検出した入力操作に基づいて、前記単数又は複数のインデックスに割り当てられた音を再生する音再生部と、
を備える音声読上装置。
【請求項2】
テキストデータの読み上げ時に、前記入力操作部の検出した入力操作に基づいて、テキストデータを読み上げる文字読上部を備え、
前記音再生部は、テキストデータの読み上げ時に、前記文字読上部のテキストデータの読み上げに重畳させて、前記単数又は複数のインデックスのうち、前記文字読上部の読み上げるテキストデータの読み上げ位置に応じたインデックスに割り当てられた音を再生する請求項1に記載の音声読上装置。
【請求項3】
前記音再生部は、早送り時に、前記入力操作部の入力操作の検出のたびに前記単数又は複数のインデックスのうち次のインデックスに割り当てられた音を再生する請求項1又は請求項2に記載の音声読上装置。
【請求項4】
前記文字読上部は、前記入力操作部の入力操作の検出のたびにテキストデータの読み上げを開始する請求項2に記載の音声読上装置。
【請求項5】
テキストデータに複数のインデックスを挿入する制御部を備え、
前記制御部は、前記入力操作部の検出した入力操作に基づいて、分割数を決定し、テキストデータの文字数又は音節数を前記分割数で分割した区切り位置にインデックスを挿入する請求項1乃至請求項4のいずれか1項に記載の音声読上装置。
【請求項6】
前記インデックスに割り当てられた音は、ドレミ音である請求項1乃至請求項5のいずれか1項に記載の音声読上装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−242727(P2011−242727A)
【公開日】平成23年12月1日(2011.12.1)
【国際特許分類】
【出願番号】特願2010−117293(P2010−117293)
【出願日】平成22年5月21日(2010.5.21)
【出願人】(000005821)パナソニック株式会社 (73,050)