説明

音声システム

【課題】通信、特にアナログ通信においては通信の秘話性を高めるため、音声波形を様々な方法で変形させていた。しかしながら、変形は入力音声の波形のブロックを単に置換するレベルのものであったため、一部音声が聞き取れると、これを手がかりに元の入力音声の復元ができてしまう場合があった。
【解決手段】以上課題解決のため、本発明では入力音声の素片を暗号鍵により別の音声素片に置換することで伝送を行う。これにより、音声の一部を聞きとって復元することは不可能となり、通信の秘匿性が向上する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信、特にアナログ通信において秘話性を向上させる技術に関する。
【背景技術】
【0002】
通信の秘匿化は現代において必須の技術である。一方、通信方式のうちアナログの音声通信は古くから通信路が確立されており、これを利用することによって簡便に通信を行うことができる。しかしながら、アナログ通信は入力音声波形そのものを通信路に流すため、盗聴などに対し脆弱性を有する点が問題となる。このため、アナログ通信の音声波形を操作することによって、通信の秘匿性を向上させる試みが存在する。非特許文献1および2では、上記試みが従来技術として紹介されている。図8から図10は従来技術によりアナログ通信の秘匿性を高めた通信方式である。非特許文献1において、図8では、一定時間内においてサンプリングを行い、サンプルの順序を時間軸上で前後させている。図9においては、音声の波形を一定時間で区切り、ブロックとしており、これを並べ替え送信することで秘匿性を得ている。また、非特許文献2においては、図10のように、周波数スペクトルにおいて所定のルールでスペクトルの反転を行っている。
【非特許文献1】IEEE TRANSACTIONS ON COMMUNICATIONS, VOL. COM−29, NO. I, JANUARY 1981
【非特許文献2】D.W. Davies (Ed.): Advances in Cryptology − EUROCRYPT '91, LNCS 547, pp. 422−430, 1991.
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、これらの方法では、暗号化したい音声そのものに対して並べ替える等の操作を行うので、部分的に元の音声が聞こえてしまう場合がある。そうするとそれを手がかりに並べ変えを行えば、比較的容易に復元ができてしまう可能性がある。このように、暗号化したい音声そのものに対して操作を行う方法では解読にあたって探索空間が限られてしまうため、通信の秘匿化が確保できない。したがって、暗号化したい音声以外の音声で通信を行い、十分な通信の秘匿化の確保を行うことが課題として生ずる。
【課題を解決するための手段】
【0004】
以上の課題を解決するために、第一に本発明は以下のような音声システムを提供する。まず、システムに入力された言語入力に応じて、音声素片のインデックス列を取得する。次に、そのインデックス列を暗号化鍵によって、別のインデックス列に置換する。置換されたインデックス列により音声合成を行い秘話化音声を生成し、その音声を伝送路により送信する。受信側においては、受信した秘話化音声に応じて音声素片のインデックス列を取得する。次に、復号化鍵により、インデックス列を送信前のインデックス列に復元する。復元したインデックス列により音声合成を行い、音声などとして出力する。
【0005】
具体的には、音声素片とインデックスとを対応づけた対応表を保持する対応表保持部と、言語入力を受付ける言語入力受付部と、言語入力受付部から入力された言語を構成する音声素片のインデックスである生インデックスを対応表から生成する生インデックス生成部と、生インデックスを暗号化したインデックスである暗号化インデックスを取得する暗号化インデックス取得部と、取得した暗号化インデックスに対応する音声素片を対応表から取得し、音声合成を行う秘話化音声合成部と、合成された秘話化音声を出力する出力部と、を有する出力装置と、秘話化音声を取得する取得部と、音声素片とインデックスとを対応づけた対応表を保持する対応表保持部と、取得した秘話化音声に応じた音声素片のインデックスである暗号化インデックスを対応表を利用して生成する暗号化インデックス生成部と、
暗号化インデックスを復号化して生インデックスを取得する生インデックス復号化部と、復号化された生インデックスにより音声素片を取得し、対応する言語を復元する言語復元部と、を有する復元装置と、からなる音声システムである。
【0006】
第二は、上記第一の音声システムを基本として、システムへの言語入力が音声である音声システムを提供する。
【0007】
具体的には、言語入力受付部は、音声言語の入力を受付ける音声言語入力受付手段を有する請求項1に記載の音声システムである。
【0008】
第三は、上記第一または第二の音声システムを基本として、システムへの言語入力がテキストデータである音声システムを提供する。
【0009】
具体的には、言語入力受付部は、テキスト言語の入力を受付けるテキスト言語入力受付手段を有する請求項1又は2に記載の音声システムである。
【発明の効果】
【0010】
以上のような構成をとる第一の本発明によって、システムへの言語入力に対して、音声素片のインデックス列を取得し、これを暗号化鍵により置換を行うことが可能となる。そうすると、置換されたインデックス列により音声合成することにより、入力された言語入力以外の音声素片による秘話化音声を伝送路に流すことが可能となる。受信側においては、受信した秘話化音声に応じて音声素片のインデックスを取得し、これを復号化鍵で復元し、元の音声素片のインデックス列を取得可能である。このインデックス列により音声合成を行うと、元の音声が復元出来るといった具合である。このように、伝送媒体に流す音声がシステムへ入力された音声以外の音素列とすることにより、通信の秘匿性が向上することとなる。
【0011】
また、第二の本発明によって、システムへの言語入力が音声であることにより、伝送路を介して秘話化音声を送信し、受信側へほぼリアルタイムで音声を送信することが可能である。これにより、電話のような、双方向リアルタイムのコミュニケーションを通信の秘匿性を確保しつつ、行うことが可能である。
【0012】
また、第三の本発明によって、システムへの言語入力がテキストデータであることにより、テキストを音声に変換した上で、通信が可能である。受信側で音声からテキストデータへ変換する処理を行えば、ファクシミリのようなオフラインのコミュニケーションが、秘匿性を確保しつつ行うことが可能である。
【発明を実施するための最良の形態】
【0013】
以下に、図を用いて本発明の実施の形態を説明する。なお、本発明はこれら実施の形態に何ら限定されるものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施しうる。
【0014】
≪実施例≫
<概要>
図1は、本実施例の音声システムの動作の一例を説明するための概念図である。この図にあるように、受信機と送信機があり、送信機に対する「あめになる」という言語入力を秘話化音声「おやせまめ」とし、受信機に送信している。受信機側では秘話化音声「おやせまめ」を復元し、「あめになる」という出力を得ている。
【0015】
具体的に説明すると、送信機側で「あめになる」という入力を得た後、入力のパターンに応じて、音声素片データベースのインデックスを取得する。実際の音声素片データベースは大量のパターンを含むが、簡単のため本事例においては、図2(A)のようなインデックス・テーブルから付与されているとする。すると、「A1 G4 E2 E1 I3」というインデックス列が取得できる(図2(B))。このインデックスを暗号化鍵によって発生させた暗号に基づき、別のインデックス列に置換する。「A5 H1 C4 G1 G4」というインデックス列が取得できたとする。そうすると、素片データベースのインデックスにより「おやせまめ」という秘話化文字列が得られる(図2(C))。当該文字列は音声素片データベースに基づき、音声合成により音声化し、アナログ通信路などを介して受信機に送信される。
【0016】
受信機側では、秘話化音声「おやせまめ」のパターンに応じ、音声素片データベースよりインデックス列を取得する。本事例においては「A5 H1 C4 G1 G4」のインデックス列が取得される。このインデックス列を復号化鍵により復元すると、送信機において置換前の「A1 G4 E2 E1 I3」とのインデックス列が取得される。このインデックス列に応じて音声素片データベースを参照し、「あめになる」という文字列に対応する音声が得られる。
【0017】
このように、本実施例の音声システムは、入力の文字列に対して音声素片データベースのインデックス列を取得し、暗号化鍵により、別の音声素片に対応するインデックス列に置換する処理が可能である。このため、秘話化音声そのものを素片ごとに入れ替えたとしても、元の文字列を得ることは不可能である。したがって高い秘匿性を保ちながら通信が可能である。また、音声合成を用いて送信機側から秘話化音声を受信機側に音声にて送信するため、アナログ通信路のような簡便な通信方法に適する。
【0018】
<機能的構成1>
図3は、本実施例の音声システムにおける機能ブロックの一例を表す図である。この図にあるように、本実施例の「音声システム」は、「出力装置」(0301)と、「復元装置」(0302)と、を有する。出力装置(0301)は言語入力受付部(0303)と、生インデックス生成部(0304)と、対応表保持部(0305)と、暗号化インデックス取得部(0306)と、秘話化音声合成部(0307)と、出力部(0308)とを有する。復元装置(0302)は、取得部(0309)と、暗号化インデックス生成部(0310)と、対応表保持部(0311)と、生インデックス復号化部(0312)と、言語復元部(0313)とを有する。
【0019】
言語入力受付部(0303)は、出力装置(0301)において、言語入力を受付ける機能を有する。
言語とは、音声やテキスト等の音声合成として出力が可能なデータである。入力はマイクロフォンでのリアルタイムの入力や、音声データでの入力、テキストデータでの入力などが考えられる。受け付けた言語入力は、生インデックス生成部(0304)へ出力される。
【0020】
生インデックス生成部(0304)は、言語入力受付部から入力された言語を構成する音声素片のインデックスである生インデックスを対応表から生成する機能を有する。具体的には、言語入力に応じて対応表保持部(0305)に蓄積されている音声素片のインデックス情報を取得する。例えば、言語入力が音声データである場合においては、DPマッチング等のパターン認識の手段を使用して、入力音声波形に対して最も適合性の高い音声素片を探し出し、その素片のインデックス情報を対応表保持部(0305)より取得するといった具合である。ここで得られたインデックス情報はインデックス列として、暗号化インデックス取得部(0306)へ出力される。
【0021】
対応表保持部(0305)は、音声素片とインデックスとを対応づけた対応表を保持する機能を有する。具体的には、音声素片データベースに蓄積されている音声素片と、音声素片のインデックスとを関連付けて保持しているテーブルである。例えば素片データが50音からなるものであった場合には、図5(A)のような対応表等が考えられる。音声素片については、単に50音から構成されているものの他、母音−母音、母音−子音、子音−母音、子音−子音、のように2音のつながりで構成されているものや、1音素が複数の素片から構成されているもの、また単語レベルで音声素片を構成しているもの等、種々のものが考えられる。
【0022】
暗号化インデックス取得部(0306)は、生インデックスを暗号化したインデックスである暗号化インデックスを取得する機能を有する。生インデックス生成部(0304)より入力された図2(B)のようなインデックス列を、暗号化鍵で他のインデックス列(図2(C))に置換を実行する。暗号化鍵は、生インデックスを入力データとして、対応表保持部内のインデックスのいずれかに置換するような暗号化などを行う。暗号化方式は、公開鍵暗号方式や秘密鍵(共通鍵)暗号方式などの種々のものが採用可能である。置換された後の暗号化インデックス列は、秘話化音声合成部(0307)に出力される。
【0023】
秘話化音声合成部(0307)は、取得した暗号化インデックスに対応する音声素片を対応表から取得し、音声合成を行う機能を有する。暗号化インデックス取得部(0306)で置換された後の暗号化インデックス列を入力し、入力にかかる暗号化インデックスに応じて、対応表を参照し、これに基づいて音声素片データベースより音声素片を取得し、音声合成を行う。合成された音声は出力部(0308)に出力される。
【0024】
出力部(0308)は、合成された秘話化音声を出力する機能を有する。出力とは、入力の音声を、伝送媒体を介して復元装置(0302)の取得部(0309)に対して出力することである。伝送方法についてはアナログ通信、デジタル通信、無線、有線等様々な態様が考えられるが、音声波形を伝搬することができるものであればどのような方式でも採用可能である。
【0025】
取得部(0309)は、復元装置(0302)において、秘話化音声を取得する機能を有する。出力装置(0301)の出力部(0308)から出力された音声波形データを取得し、暗号化インデックス生成部(0310)に対して出力を行う。
【0026】
暗号化インデックス生成部(0310)は、取得した秘話化音声に応じた音声素片のインデックスである暗号化インデックスを、対応表を利用して生成する機能を有する。具体的には、取得部(0309)からの音声波形データをDPマッチング等のパターン認識により、最も適合性の高い音声素片を選択し、対応するインデックス情報を対応表保持部(0311)から取得する機能を有する。インデックス情報は暗号化インデックス列として、生インデックス復号化部(0312)に出力される。
【0027】
対応表保持部(0311)は、復元装置(0302)において、音声素片とインデックスとを対応づけた対応表を保持する機能を有する。暗号化インデックス生成部(0309)での音声認識の際、または言語復元部(0313)において音声合成を行う場合に参照を行う。
【0028】
対応表保持部(0311)における対応表は出力装置(0301)の対応表保持部(0305)の対応表と同一であるかサブセットである必要がある。音声システム全体で単一の対応表保持部を有して、これを共有する態様であってもよい。
【0029】
生インデックス復号化部(0312)は、暗号化インデックスを復号化して生インデックスを取得する機能を有する。出力装置(0301)の暗号化インデックス取得部(0306)で使用した暗号化方式を使用して、置換されたインデックス列を元の生インデックスに戻す機能を有する。取得した生インデックスは、言語復元部(0313)に対して出力する。
【0030】
言語復元部(0313)は復号化された生インデックスにより音声素片を取得し、
対応する言語を復元する機能を有する。生インデックス復号化部(0312)で取得した生インデックスから、対応表に基づいて、音声素片を取得し音声合成を行う。この時出力は音声でもよいし、音声素片に対応するテキストデータでもよい。
【0031】
<機能的構成2>
図4は、本実施例の音声システムにおける機能ブロックの別の一例を表す図である。この図にあるように、本実施例の「音声システム」は、「出力装置」(0401)と、「復元装置」(0402)と、を有する。出力装置(0401)は言語入力受付部(0403)と、生インデックス生成部(0404)と、対応表保持部(0405)と、暗号化インデックス取得部(0406)と、秘話化音声合成部(0407)と、出力部(0408)とを有する。復元装置(0402)は、取得部(0409)と、暗号化インデックス生成部(0410)と、対応表保持部(0411)と、生インデックス復号化部(0412)と、言語復元部(0413)とを有する。なお上記構成要件については、上記で記載済みであるので、説明は省略する。本構成で特徴的な点は、「出力装置」(0401)おける言語入力受付部(0403)が、「音声言語入力受付手段」(0414)を有する点である。
【0032】
音声言語入力受付手段(0414)は、音声言語の入力を受付ける機能を有する。音声言語とは、音声で生成可能な言語であれば、自然言語に限られず、歌声などであっても構わない。どのような音声言語を使用可能であるかは、音声素片データベースに基づく対応表保持部(0405)の対応表に依存することになる。
【0033】
<機能的構成3>
図5は、本実施例の音声システムにおける機能ブロックのさらに別の一例を表す図である。この図にあるように、本実施例の「音声システム」は、「出力装置」(0501)と、「復元装置」(0502)と、を有する。出力装置(0501)は言語入力受付部(0503)と、生インデックス生成部(0504)と、対応表保持部(0505)と、暗号化インデックス取得部(0506)と、秘話化音声合成部(0507)と、出力部(0508)とを有する。復元装置(0502)は、取得部(0509)と、暗号化インデックス生成部(0510)と、対応表保持部(0511)と、生インデックス復号化部(0512)と、言語復元部(0513)とを有する。なお上記構成要件については、上記で記載済みであるので、説明は省略する。本構成で特徴的な点は、言語入力受付部が、「テキスト言語入力受付手段」(0515)を有する点である。
【0034】
テキスト言語入力受付手段(0515)はテキスト言語の入力を受付ける機能を有する。テキスト言語とは、テキストデータであり、音声合成可能なものであればどのようなものでもよい。どのようなテキスト言語を使用可能であるかは、音声言語入力受付手段(0414)と同様、音声素片データベースに基づく対応表保持部(0505)の対応表に依存することになる。
【0035】
<処理の流れ>
図6は、本実施例の音声システムにおける処理の流れの一例を表すフローチャートである。まず、出力装置側で、言語入力を受付ける(ステップS0601)。次に言語入力受付ステップにおいて入力された言語を構成する音声素片のインデックスである生インデックスを、音声素片とインデックスとを対応づけた対応表から生成する(ステップS0602)。次に、生インデックスを暗号化したインデックスである暗号化インデックスを取得する(ステップS0603)。次に、取得した暗号化インデックスに対応する音声素片を前記対応表から取得し、音声合成を行う(ステップS0604)。そして、合成された秘話化音声を出力する(ステップS0605)。復元装置側では、秘話化音声を取得する(ステップS0606)。次に、取得した秘話化音声に応じた音声素片のインデックスである暗号化インデックスを
音声素片とインデックスとを対応づけた対応表を利用して生成する(ステップS0607)。次に、暗号化インデックスを復号化して生インデックスを取得する(ステップS0608)。次に、暗号化インデックスを復号化して生インデックスを取得する生インデックス復号化ステップと、復号化された生インデックスにより音声素片を取得し、対応する言語を復元する(ステップS0609)。
【0036】
<ハードウエア的構成>
図7は、上記機能的な各構成要件をハードウエアとして実現した際の、音声システムにおける構成の一例を表す概略図である。この図を利用して音声通信のそれぞれのハードウエア構成部の働きについて説明する。この図にあるように、本実施例の音声システムは、送信機(0701)と受信機(0702)とからなる。送信機(0701)においては、各種演算処理を行う「CPU(中央演算装置)」(0703)と、「揮発性メモリ」(0704)と、「不揮発性メモリ」(0705)と、D/Aコンバータ(0706)と、マイクロフォン(0707)と、ネットワークI/F(0708)とを有している。そしてそれらが「システムバス」(0709)などのデータ通信経路によって相互に接続され、情報の送受信や処理を行う。
【0037】
送信機(0702)においては、各種演算処理を行う「CPU(中央演算装置)」(0710)と、「揮発性メモリ」(0711)と、「不揮発性メモリ」(0712)と、D/Aコンバータ(0713)と、スピーカ(0714)と、ネットワークI/F(0715)とを有している。そしてそれらが「システムバス」(0716)などのデータ通信経路によって相互に接続され、情報の送受信や処理を行う。
【0038】
また、「揮発性メモリ」(0704、0711)は、各種処理を行うプログラムを「CPU」(0703、0710)に実行させるために「不揮発性メモリ」(0705、0712)から読み出すと同時にそのプログラムの作業領域でもあるワーク領域を提供する。
【0039】
ここで、マイクロフォン(0707)に音声入力があった場合に、D/Aコンバータ(0706)を介してCPU(0702)にデータが送られる。CPU(0702)においては、揮発性メモリ(0704)に保持されている、A:生インデックス生成プログラムが実行され、B:対応表と不揮発性メモリ(0705)内に蓄積された素片DB(0717)を参照しつつ、生インデックスが作成される。次にC:暗号化プログラムがCPU(0703)で実行され、生インデックスが別の素片の暗号化インデックスに置換される。これを用いて、D:音声合成エンジンをCPU(0703)で素片DB(0717)を参照しつつ、実行することにより秘話化音声が生成される。音声はネットワークI/F(0708)を介して受信機(0702)に送信される。
【0040】
受信機側では、ネットワークI/F(0715)において秘話化音声を受信する。そうすると音声はCPU(0710)に送られ、実行中のE:暗号化インデックス作成プログラムにより暗号化インデックスが生成される。この時当該プログラムは不揮発性メモリ(0712)に蓄積された素片DB(0718)と揮発性メモリ(0711)に保持されているG:対応表とを参照する。次に、暗号化インデックスはF:復号化プログラムにより生インデックスに戻される。この生インデックスを、G:対応表と素片DB(0718)とを参照しつつ、H:音声合成エンジンで音声化する。音声はD/Aコンバータ(0713)を介してスピーカ(0714)により出力される。
【0041】
<効果の簡単な説明>
以上のように本実施例の音声システムによって、出力装置において入力の言語に対して音声素片のインデックス列を得て、このインデックス列を暗号鍵により別のインデックス列に置換することが可能である。これを伝送路により送信する。復元装置においてこれを受信し復号化鍵により元のインデックス列を取得し、入力言語を復元可能となる。これにより、通信の秘匿性が向上する。
【図面の簡単な説明】
【0042】
【図1】実施例の音声システムによる処理の概要を説明するための図
【図2】実施例の音声システムによる処理の概要を説明するための図
【図3】実施例の音声システムの機能ブロックの一例を表す図
【図4】実施例の音声システムの別の機能ブロックの一例を表す図
【図5】実施例の音声システムのさらに別の機能ブロックの一例を表す図
【図6】実施例の音声システムにおける処理の流れの一例を表すフローチャート
【図7】実施例の音声システムにおけるハードウエア構成の一例を表す概略図
【図8】従来技術における暗号化方式を説明するための概略図
【図9】従来技術における暗号化方式を説明するための概略図
【図10】従来技術における暗号化方式を説明するための概略図
【符号の説明】
【0043】
0301 出力装置
0302 復元装置
0304 生インデックス生成部
0306 暗号化インデックス取得部
0310 暗号化インデックス生成部
0312 生インデックス復号化部

【特許請求の範囲】
【請求項1】
音声素片とインデックスとを対応づけた対応表を保持する対応表保持部と、
言語入力を受付ける言語入力受付部と、
言語入力受付部から入力された言語を構成する音声素片のインデックスである
生インデックスを対応表から生成する生インデックス生成部と、
生インデックスを暗号化したインデックスである
暗号化インデックスを取得する暗号化インデックス取得部と、
取得した暗号化インデックスに対応する音声素片を対応表から取得し、
音声合成を行う秘話化音声合成部と、
合成された秘話化音声を出力する出力部と、
を有する出力装置と、
秘話化音声を取得する取得部と、
音声素片とインデックスとを対応づけた対応表を保持する対応表保持部と、
取得した秘話化音声に応じた音声素片のインデックスである暗号化インデックスを
対応表を利用して生成する暗号化インデックス生成部と、
暗号化インデックスを復号化して生インデックスを取得する
生インデックス復号化部と、
復号化された生インデックスにより音声素片を取得し、
対応する言語を復元する言語復元部と、
を有する復元装置と、
からなる音声システム。
【請求項2】
言語入力受付部は、音声言語の入力を受付ける音声言語入力受付手段を有する請求項1に記載の音声システム。
【請求項3】
言語入力受付部は、テキスト言語の入力を受付けるテキスト言語入力受付手段を有する請求項1又は2に記載の音声システム。
【請求項4】
言語入力を受付ける言語入力受付ステップと、
言語入力受付ステップにおいて入力された言語を構成する音声素片のインデックスである生インデックスを、音声素片とインデックスとを対応づけた対応表から生成する生インデックス生成ステップと、
生インデックスを暗号化したインデックスである暗号化インデックスを取得する暗号化インデックス取得ステップと、
取得した暗号化インデックスに対応する音声素片を前記対応表から取得し、音声合成を行う秘話化音声合成ステップと、
合成された秘話化音声を出力する出力ステップと、
秘話化音声を取得する取得ステップと、
取得した秘話化音声に応じた音声素片のインデックスである暗号化インデックスを、
音声素片とインデックスとを対応づけた対応表を利用して生成する暗号化インデックス生成ステップと、
暗号化インデックスを復号化して生インデックスを取得する生インデックス復号化ステップと、
復号化された生インデックスにより音声素片を取得し、対応する言語を復元する言語復元ステップと、
からなる音声システムの動作方法。
【請求項5】
言語入力受付ステップは、音声言語の入力を受付ける音声言語入力受付サブステップを有する請求項5に記載の音声システムの動作方法。
【請求項6】
言語入力受付ステップは、テキスト言語の入力を受付けるテキスト言語入力受付サブステップを有する請求項5又は6に記載の音声システムの動作方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2013−98869(P2013−98869A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−241599(P2011−241599)
【出願日】平成23年11月2日(2011.11.2)
【出願人】(598163064)学校法人千葉工業大学 (101)
【Fターム(参考)】