音声認識機能付きロギングシステムおよび同システムにおける端末装置ならびにプログラム

【課題】認識率の向上をはかり、暗号化の有無に影響されることなく、単語検索を行う際の利便性の向上をはかる。
【解決手段】本発明の音声認識機能付きロギングシステムは、端末装置（ＩＰ電話機１１、１２）のそれぞれが持つ、特定話者を対象に音声認識を行う特定話者音声認識エンジン（特定話者音声認識部１３、１４）を用いて作成された認識テキスト、もしくは前記特定話者音声認識エンジンの学習データを所定のタイミングでそれぞれ相手先端末装置へ送信し、当該相手先端末装置において送受信される音声データの音声認識を行い、その結果を保存する（情報保存領域１５、１６）。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、ＩＰ（Internet Protocol）接続環境を用いて交換される音声情報を保存し、活用する用途に用いて好適な、音声認識機能付きロギングシステムおよび同システムにおける端末装置ならびにプログラムに関する
【背景技術】
【０００２】
通信コスト低減を目的にＶｏＩＰ（Voice over Internet Protocol）電話が普及し、コンピュータと電話を融合するＣＴＩ（Computer Telephony Information）システムへの応用が注目されるようになった。
【０００３】
例えば、コールセンターにおいて、電話機のログを取得するのに、複数の電話機の音声をロギングサーバでまとめてログを取得する音声ロギングシステムがある。これら音声ロギングシステムには、電話機の音声を透過的に保存するものと、ロギングサーバで対象の電話機に音声を中継し、その中継の過程で保存するものがある。また、通話録音装置で録音された音声を認識し利用するシステムとして、認識された音声を機器の操作のために用いるボイスコマンド等がある（例えば、非特許文献１、２参照）。
【非特許文献１】http://advanced-media.co.jp/prooducts/1502.html＜インターネット＞２００４年１１月１１日閲覧、「ＡｍｉＶｏｉｃｅｓｅｒｉｅｓ製品情報」
【非特許文献２】http://www.logit.co.jp/products/nicelog/voip.html＜インターネット＞２００４年１１月１１日閲覧、ログイット株式会社Ｐｒｏｄｕｃｔｓ［製品紹介］「ＶｏＩＰ録音を可能にした最新のＩＰレコーディング」
【発明の開示】
【発明が解決しようとする課題】
【０００４】
ところで、上記したＩＰ電話でやり取りされている音声データに、暗号化処理等で第三者による盗聴を防ぐ仕組みは無い。一方でプライバシー保護の観点から暗号化による仕組みが組み込まれる可能性は高い。また、米国では、訴訟などの証拠保全対策としてＩＰ電話音声の保存を法的に義務付ける動きがある。
しかしながら、暗号化を考慮する際、音声を単一サーバで透過的に保存する場合にはサーバで保存されている音声は暗号化済みのデータであるため、利用が容易ではない。また、音声を中継することによるロギングシステムでは、暗号化データを復号化して保存できる可能性は有しているが、プライバシー保護を考慮する場合、復号化したデータを再度暗号化して中継する必要があり、中継処理に要する処理によって円滑なコミュニケーションを阻害する恐れがある。また、サーバに負荷が集中することから、ロギングミス等を引き起こす危険がある。
【０００５】
一方、音声認識について、電話によるコミュニケーションでは対象が一意に決まらないため、不特定多数を対象とする音声認識エンジンを必要とする。不特定話者音声認識エンジンは、発話の個人差を吸収可能な特定話者音声認識エンジンに比べて認識率が低い。
また、電話は、機器の状態、発話者の状態によりやりとりされる音声の品質は変動する。感度が悪いマイクや、マイクと発声器官の距離および発声量などにより、認識結果に悪影響を与える。更に、音声と認識テキストを参照する場合、音声と認識テキストの相関がないため、単語検索を行った場合に単語の発生個所から音声を途中再生することが難しいといった不都合を有していた。
【０００６】
本発明は上記事情に基づいてなされたものであり、暗号化の有無、音声入力および認識環境等の条件に影響されることなく、単語検索を行う際の利便性の向上をはかった、音声認識機能付きロギングシステムおよび同システムにおける端末装置ならびにプログラムを提供することを目的とする。
【課題を解決するための手段】
【０００７】
上記した課題を解決するために本発明の音声認識機能付きロギングシステムは、ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムであって、前記端末装置のそれぞれが持つ、特定話者を対象に音声認識を行う特定話者音声認識エンジンを用いて作成された認識テキスト、もしくは前記特定話者音声認識エンジンの学習データを所定のタイミングでそれぞれ相手先端末装置へ送信し、当該相手先端末装置において送受信される音声データの音声認識を行い、その結果を保存する手段、を具備することを特徴とする。
【０００８】
また、本発明は、ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおける前記端末装置であって、相手先端末装置から送信される音声データを受信して保存する手段と、相手先端末装置へ送信する音声データを保存し、当該音声データから自身を対象に音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する手段と、前記認識テキストを任意のタイミングで通話相手先へ送信する手段と、を具備することを特徴とする。
【０００９】
また、本発明において、相手先端末装置との通話が終了したことを検知したときに前記認識テキストを送信することを特徴とする。
【００１０】
また、本発明において、通話セッションとは別に、前記認識テキストを送信するセッションを確立し、当該セッション毎、前記保存した認識テキストを送信することを特徴とする。
【００１１】
また、本発明は、ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおける前記端末装置であって、相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する手段と、相手先端末装置から送信される音声データを受信して保存する手段と、相手先端末装置から任意のタイミングで送信される前記相手先端末装置の音声認識エンジンの学習データを受信し、当該学習データを用いて前記保存した受信音声データから認識テキストを生成する手段と、を具備することを特徴とする。
【００１２】
また、本発明は、ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおいて前記端末装置に用いられるプログラムであって、相手先から送信される音声データを受信して保存する処理と、相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する処理と、前記認識テキストを任意のタイミングで通話相手先へ送信する処理と、をコンピュータに実行させることを特徴とする。
【００１３】
また、本発明は、ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおいて前記端末装置に用いられるプログラムであって、相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する処理と、相手先端末装置から送信される音声データを受信して保存する処理と、相手先端末装置から任意のタイミングで送信される前記相手先端末装置の音声認識エンジンの学習データを受信し、当該学習データを用いて前記保存した受信音声データから認識テキストを生成する処理と、をコンピュータに実行させることを特徴とする。
【発明の効果】
【００１４】
本発明によれば、それぞれの端末装置において特定話者を対象に音声認識を行う特定話者音声認識エンジンを用いた音声認識テキストの利用が可能になるため、認識率の向上、および処理速度の向上がはかれる。また、端末装置において送受信データおよび作成された認識テキストの保存が行なわれるため、やりとりされる音声データの暗号化に影響されず、特定の機器に負荷が集中することにより発生するロギングミスがなくなる。
また、本発明によれば、通話終了を検知して、あるいは通話セッションとは別に設定されるセッション毎に認識テキストを送信し、相手先へ自身による特定話者認識結果を送信することで、リアルタイム性は損なわれるものの認識率の高い結果を得ることができる。さらに、本発明によれば、音声と認識テキストの相関を保存することで、検索の際、単語検索によりヒットした部分を、ヒットした単語のある文節から聴くことのできる部分再生を実現することができる。このことにより検索の際の利便性を提供することができる。
【発明を実施するための最良の形態】
【００１５】
以下、本発明実施形態につき、図１〜図７を参照しながら説明する。図１は、本発明実施形態に係わる音声認識機能付きロギングシステムのシステム構成図である。ここでは、ＩＰ電話機１１、１２を用いてユーザ同士で通話する例が示されている。
本発明の端末装置として機能する、ＩＰ電話機１１（１２）は、それぞれ特定話者音声認識エンジンを搭載した特定話者音声認識部１３（１４）を備えており、ここで音声認識された結果は、送信データと関連付けて情報保存領域１５、１６に保存される。なお、いずれも受信音声データについては一時的に保存するのみであり、追って他方のＩＰ電話機１２（１１）から送信される認識テキストと関連付けて保存される。
【００１６】
図２は、図１に示す音声認識機能付きロギングシステムの内部構成を機能展開して示したブロック図である。
図２中、図１に示すブロックと同一番号が付されたブロックは、図１に示すそれと同じ名称、機能を持つこととする。ここでは、ＩＰ電話機１１（１２）は、音声送信部１１１（１２２）と、音声受信部１１２（１２１）のみを持つ構成とする。
音声送信部１１１（１２２）により送信される音声データは、情報保存領域１５の送信音声保存部１５１（１６１）へ一時保存される他に、特定話者音声認識部１３（１４）へ供給され、ここで、特定話者認識エンジンによる自身の発話による音声認識が行われる。ここでは学習データが豊富なため、音声認識率が高く、早く結果が得られる。特定話者音声認識部１３（１４）は、認識に必要な量が貯まるまでデジタル音声データを保持し、認識処理が可能になった時点で認識処理を行う。認識処理後のデジタル音声データおよび認識テキストは、通話全体のデジタル音声データの認識処理が終了後も継続して情報保存領域１５の送信音声認識テキスト保存部１５２（１６２）へ保存される。
【００１７】
一方、パケット化されたＩＰ電話機１１（１２）からのデジタル音声データはＩＰ電話機１２（１１）の音声受信部１２１（１１２）で受信され、受信音声保存部１６３（１５３）に一時保存される。このとき暗号化されていた場合は復号化処理が行なわれる。また、ＩＰ電話機１２（１１）では上記同様、自身で発話したデジタル音声データの音声認識（特定話者音声認識部１４（１３））の実行を同時に行い、結果を送信音声認識テキスト保存部１６２（１５２）へ保存している。
認識テキスト同期部１８（１７）では、送信音声認識テキスト保存部１６２（１５２）に保存された認識テキストを、先に音声データを送信したＩＰ電話機１１（１２）が持つ情報保存領域１５の受信音声認識テキスト保存部１５４へ送信するタイミングを監視している。ここでは、通話終了の検出を待ち、通話終了後に音声認識処置が完了した時点で送信するものとする。認識テキスト同期部１８（１７）は、ＶｏＩＰ（Voice over IP）通信の場合、あらかじめホスト名がわかっているため、上記した通話終了のタイミングを検知したことを契機に、ＩＰ電話機１１（１２）同士でやりとりされた通話内容に関し容易に同期を取ることが可能である。
【００１８】
なお、ここでは、認識テキストを相手先のＩＰ電話機１１（１２）に送信するタイミングを、通話終了を検知した場合としたが、ＶｏＩＰの通話セッションとは別に、認識テキストを送信する、例えば、ＦＴＰ（File Transfer Protocol）コネクションを確立し、当該セッション毎に送信しても良い。その他、無音区間を検出して認識テキストを送信する等、種々変更が考えられる。
また、ここでは特定話者音声認識部１３（１４）に搭載される特定話者認識エンジンは1個のみとしたが、これを複数備え、話者がスイッチにより切替え使用する工夫も考えられる。ここで、「特定話者」とは、所定期間学習の過程を経て個人の特徴が記憶された話者のことをいう。
【００１９】
図３は、本発明実施形態において用いられる音声認識処理の概念図である。ここでは、データ一時保存領域５１（図２における情報保存領域１５、１６における送信音声保存部１５１、１６１、受信音声保存部１５３、１６３に相当）に保存されているデジタル音声データから、文節区切り処理部５２によって文節区切り済み音声データ５３を生成する。
次に、文節区切り済み音声データ５３を音声認識部５４（図２における特定話者音声認識部１３、１４に相当）で音声認識処理を行い、認識テキスト５５を生成する。そして、認識テキスト５５および文節区切り済み音声データ５３は、データ/認識テキスト保存領域５６（図２における送信音声認識テキスト保存部１５２、１６２、受信音声認識テキスト保存部１５４、１６４に相当）に対にして保存する。この操作は、データ一時保存領域５１のデジタル音声データがなくなるまで行う。
【００２０】
図４、図５は、図３に示す文節区切り処理の処理手順を示すフローチャートである。
図４では、文節区切り処理に、ＩＰ電話における標準的なメディアストリーム伝送プロトコルであるＲＴＰ(Real-time Transport Protocol)の無音制御を利用する。ＲＴＰは、耐障害性に富み、リアルタイムにデータの到着を考慮していないＩＰ網において、ストリーム伝送の制御を行うプロトコルである。具体的には、音声パケットを送出するたびに＋１されるシーケンス番号で、伝送路上でのパケットロスを検知し、送出したデータの累計で表現されるタイムスタンプで再生タイミングを制御する。
無音制御とは、マイクなどの音声入力デバイスから一定期間音声入力が無い場合、帯域を節約するためにデータを送出しない制御である。無音制御が生じた場合、シーケンス番号は無音制御発生前のパケット＋１になり、タイムスタンプは、無音区間にもデータを送出した場合と同じだけ加算される。従って、パケットロスが生じていない状態でタイムスタンプが大きく増加している場合になる。
【００２１】
図４に示すフローチャートを参照しながら説明する。まず、ステップＳ６１で、データ一時保存領域５１に認識処理に充分なデジタル音声データが保存されているか判別する。ここで、充分な量が保存されていない場合、ステップＳ６２において保存されているデータが通話終了に達しているか否かを判別する。通話終了に達していればステップＳ６６において認識処理を行い、達していない場合はステップＳ６３である一定時間待機後、ステップＳ６１に制御を移す。
ステップＳ６１において、保存されているデータが認識に充分な量が保存されていると判別された場合、ステップＳ６４において、ＲＴＰタイムスタンプがある閾値以上は離れている部分、つまり、無音制御が生じた部分が存在するか否かを判別する。無音制御が生じていない場合、ステップＳ６２において保存されているデータが通話終了に達しているものであるか否かを判別する。ここで、通話終了に達している場合はステップＳ６６の認識処理に制御を移し、達していない場合は保存されているデータには続きがある可能性が高いため、ステップＳ６３で一定時間待機した後ステップＳ６１に制御を移す。
【００２２】
ステップＳ６４で無音制御を検知した場合、ステップＳ６５において、保存データの最初から無音区間までのデータを1つの文節に区切られた音声データとみなし取得する。ここで取得したデータは保存している部分から取り除く。文節に区切られた音声データは、ステップＳ６６において認識エンジン（音声認識処理部５４）により認識処理され、認識結果を保存する領域に保存する。
認識処理後は、ステップＳ６７において保存されているデータが残っているか否かを判別し、残っている場合はステップＳ６３で一定時間待機後ステップＳ６１に制御を移し、残っていない場合は全ての通話を認識処理したものとみなし終了する。
【００２３】
次に、図５に示すフローチャートを参照しながら説明する。図５は、デジタル音声データの音声レベルを調べ、ある一定時間低い音声レベルの連続する部分を文節とみなす手法である。
まず、ステップＳ７１で、データ一時保存領域５１に認識処理に充分なデジタル音声データが保存されているか否かを判別する。ここで充分な量が保存されていない場合、ステップＳ７２において保存されているデータが通話終了に達しているものであるか否かを判別する。通話終了に達していればステップＳ７７において認識処理を行い、達していない場合はステップＳ７３である一定時間待機後、ステップＳ７１に制御を移す。
ステップＳ７１において、保存されているデータが認識に充分な量が保存されていると判別された場合、ステップＳ７４でノイズ除去フィルタによりノイズを除去し、ホワイトノイズを平滑化する。
【００２４】
次に、ステップＳ７５で一定時間音声レベルが低い区間が存在するか否かを判別する。音声レベルが低い区間が存在しない場合は、ステップＳ７２でデータが通話終了に達しているか否かを判別し、達している場合はステップＳ７７に制御を移し、達していない場合はステップＳ７３において一定時間待機後ステップＳ７１に制御を移す。
ここで、音声レベルが低い区間が存在する場合は、ステップＳ７６において、保存データの最初から低い音声レベル区間までのデータを1つの文節に区切られた音声データとみなし取得する。ここで取得したデータは保存している部分から取り除く。文節に区切られた音声データは、ステップＳ７７において認識エンジン（特定話者音声認識部１３、１４）により認識処理され、認識結果を保存する領域に保存する。認識処理後は、ステップＳ７８において保存されているデータが残っているか否かを判別し、残っている場合はステップＳ７３で一定時間待機後ステップＳ７１に制御を移し、残っていない場合は全ての通話を認識処理したものとみなし終了する。
【００２５】
図６は、検索処理を概念的に示す動作概念図である。ここでは、あいまい検索辞書を用いて音声認識の誤認識結果として考えられるものを検索語として用いる手法について説明する。
まず、ブラウザソフトウェアで作成された検索ＧＵＩ(グラフィカルユーザインタフェース)８１の単語入力欄に単語を入力し、検索ボタンを押下する。このことにより、入力された単語は検索システム８２に渡される（Ｓ８１）。
検索システム８２は、あいまい検索辞書８３から、入力単語の誤認識結果として考えられる、誤認識可能性単語リストを検索システム８２に渡す（Ｓ８２）。続いて検索システム８２はリスト内の単語全てについて、データ/認識テキスト保存領域８４内に保存されている音声認識テキストにマッチングするものがあるか否かを検索する（Ｓ８３）。検索結果は、結果表示インタフェース８５に、予め誤認識可能性単語リストに付けられたランクに従ってランク分けを行い表示する（Ｓ８４）。
【００２６】
図７は、あいまい辞書の作成処理を概念的に示した動作概念図である。ここでは、音声認識が入力音声波形の特徴からパターンマッチングを行っていることに着目し、誤認識の結果はある程度の数に絞られることを利用している。
まず、音声・単語入力部９１において、単語入力欄に単語を、マイクなどの音声入力デバイスで単語に対応した音声を入力する。次に、入力された単語は、あいまい辞書作成部９２で保持される。次に、音声は、音声認識処理部９３において実際に音声認識処理を行い、認識結果をあいまい辞書作成処理部９２に渡し、最初に入力された単語と関連付ける。その際、入力欄により入力された単語と音声認識の結果テキストが等しい場合、結果テキストは破棄する。また、検索結果テキストが既に入力単語と関連付けられている場合は、結果テキストの出現数を増加させ、図６における検索処理の結果表示時のランク分けに利用する。
【００２７】
次に、音声認識処理を終えた音声は、音声調整処理部９４において、音声レベルの調整、ノイズ付与、テンポ調整等のエフェクト処理を実行し、再度音声認識処理部９３において音声認識処理を行う。以上の操作を行うことであいまい検索辞書の語認識結果リストを増加させる。
【００２８】
以上説明のように本発明によれば、それぞれの端末装置において特定話者を対象に音声認識を行う特定話者音声認識エンジンを用いた音声認識が可能になるため、認識率の向上、および処理速度の向上がはかれる。また、端末装置において送受信データおよび作成された認識テキストの保存が行なわれるため、やりとりされる音声データの暗号化に影響されず、特定の機器に負荷が集中することにより発生するロギングミスがなくなる。
また、本発明によれば、通話終了を検知して、あるいは通話セッションとは別に設定されるセッション毎に認識テキストを送信することで、相手先へ自身による特定話者認識結果を送信することで、リアルタイム性は損なわれるものの認識率の高い結果を得ることができる。
【００２９】
また、本発明は、音声を文節に区切ってから音声認識処理を行うものであり、このことにより認識率の向上がはかれる。さらに、音声と認識テキストの相関を保存することで、検索の際、単語検索によりヒットした部分を、ヒットした単語のある文節から聴くことのできる部分再生を実現することができる。また、あいまい検索辞書を用いた検索を行うことで、音声認識結果が正確なものでなくとも検索処理における検索漏れの発生率を低下させる効果も得られる。更に、あいまい検索辞書作成時に実際の音声認識エンジンを用いて作成したものを利用することで、実際の誤認識パターンに即したものを作成し、用いることでより検索漏れの少ない検索処理を実現することができる。
【図面の簡単な説明】
【００３０】
【図１】本発明実施形態に係る音声認識機能付きロギングシステムのシステム構成を示す図である。
【図２】本発明実施形態に係る音声認識機能付きロギングシステムの内部構成を機能展開して示したブロック図である。
【図３】本発明実施形態に係る音声の文節区切り処理、音声認識処理の動作概念図である。
【図４】図３に示す文節区切り処理の処理手順の一例を示すフローチャートである。
【図５】図３に示す文節区切り処理の処理手順の他の例を示すフローチャートである。
【図６】あいまい検索を用いた検索システムの動作を概念的に示す動作概念図である。
【図７】あいまい検索に用いる辞書を作成する際の動作を概念的に示す動作概念図である。
【符号の説明】
【００３１】
１１、１２…ＩＰ電話機、１３、１４…特定話者音声認識部、１５、１６…情報保存領域、１７、１８…認識テキスト同期部、

【特許請求の範囲】
【請求項１】
ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムであって、
前記端末装置のそれぞれが持つ、特定話者を対象に音声認識を行う特定話者音声認識エンジンを用いて作成された認識テキスト、もしくは前記特定話者音声認識エンジンの学習データを所定のタイミングでそれぞれ相手先端末装置へ送信し、当該相手先端末装置において送受信される音声データの音声認識を行い、その結果を保存する手段、
を具備することを特徴とする音声認識機能付きロギングシステム。
【請求項２】
ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおける前記端末装置であって、
相手先端末装置から送信される音声データを受信して保存する手段と、
相手先端末装置へ送信する音声データを保存し、当該音声データから自身を対象に音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する手段と、
前記認識テキストを任意のタイミングで通話相手先端末装置へ送信する手段と、
を具備することを特徴とする端末装置。
【請求項３】
相手先端末装置との通話が終了したことを検知したときに前記認識テキストを送信することを特徴とする請求項２に記載の端末装置。
【請求項４】
通話セッションとは別に、前記認識テキストを送信するセッションを確立し、当該セッション毎、前記保存した認識テキストを送信することを特徴とする請求項２に記載の端末装置。
【請求項５】
ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおける前記端末装置であって、
相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する手段と、
相手先端末装置から送信される音声データを受信して保存する手段と、
相手先端末装置から任意のタイミングで送信される前記相手先端末装置の音声認識エンジンの学習データを受信し、当該学習データを用いて前記保存した受信音声データから認識テキストを生成する手段と、
を具備することを特徴とする端末装置。
【請求項６】
ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおいて前記端末装置に用いられるプログラムであって、
相手先端末装置から送信される音声データを受信して保存する処理と、
相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する処理と、
前記認識テキストを任意のタイミングで通話相手先端末装置へ送信する処理と、
をコンピュータに実行させるプログラム。
【請求項７】
ネットワークに接続された端末装置間の通話音声をロギングする音声認識機能付きロギングシステムにおいて前記端末装置に用いられるプログラムであって、
相手先端末装置へ送信する音声データを保存し、当該音声データから、当該音声データに対して音声認識を行う音声認識エンジンを用いて認識テキストを生成し、前記音声データと関連付けて保存する処理と、
相手先端末装置から送信される音声データを受信して保存する処理と、
相手先端末装置から任意のタイミングで送信される前記相手先端末装置の音声認識エンジンの学習データを受信し、当該学習データを用いて前記保存した受信音声データから認識テキストを生成する処理と、
をコンピュータに実行させるプログラム。

【図１】