説明

音声教材提供システム

【課題】 本発明では、利用者へ対話型の教材を容易に提供する。
【解決手段】 通信回線を介して教材情報を利用者に音声にて提供する音声教材提供システム(100)において、利用者によって入力された教材情報に関するパラメータを取得し(101)、この取得した教材パラメータを解析し(102)、この解析された前記教材パラメータに基づいて、教材情報をVXML文書で生成し(103)、この生成された教材情報を音声ブラウザで音声化して教材を利用者に提供する(105)ことにより、上記課題の解決を図る。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネットにおける音声を伴う教育サービスに関する。特に教育教材の簡便なコンテンツ作成に関する。
【背景技術】
【0002】
近年では、通信環境のブロードバンド化の浸透により、インターネットを利用した学習教材が提供され普及している。聴覚を用いた教材は、聞き取りの反復操作や聞き流しを行うことで、記憶の活性化につながり、外国語の学習、資格や認定試験の受験対策用に有益な教材である。聴覚を必要とする教材の提供手段は、以下が主流である。
【0003】
(1)予め教材内容を音声で録音し、利用者へはメディア媒体(CD/DVD)と、更新(差分)内容をインターネット経由によるダウンロード形態とで配布。
(2)予め教材内容を音声で録音し、利用者へはインターネット経由によるストリーミング技術で配布。
【0004】
(3)TV電話システムやIP電話システムを用いて、オンラインで人(講師)による実対話教材の放送。
さて、近年、VoiceXML(Voice extensible markup language。以下、VXML。)が注目されている。VXMLは、XMLベースの音声処理用構造化言語として、W3Cが中心でVoiceXMLを標準化している。VXMLでは、簡単に音声処理が行え、音声認識装置及び音声合成装置を用いて電話による音声入出力システムを構築できる。
【0005】
日本では、日本テレコム社およびNTTコミュニケーション社において、音声ポータルサービスが提供されている。音声ポータルサービスでは、利用者が必要とする情報をキーワードとして、あらかじめ登録し、関連するニュースや株価などのクリッピングサービスを実現している。米国では、音声ポータルのほかに航空券の予約サービスなどにも適用され始めている。
【0006】
VXML関連の特許文献としては、ニューズライン・ネットワーク社の特許文献1、IBM社の特許文献2(HTML言語のVXML変換技術)が開示されている。
【特許文献1】特開2003−5778号公報
【特許文献2】特開2002−342212号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
教材の利用者(ユーザ)から提起される課題を以下に示す。
<会話型教材の課題>
(I)教材媒体の容量の都合上、会話の立場が固定している。
【0008】
(II)学習のための任意の文章の繰り返し、速度変更の操作が煩わしい。
(III)書籍と比較すると、音声を用いた会話教材の発行種別が少なく、ユーザ側では教材の選択肢が限られる。
【0009】
これより、現行の提供教材としてはリスニングが主体となり、利用者の発話を必要とする会話、発音矯正、単語音読による暗記などの学習には不向きであり、利用者の学習意欲の妨げになる場合があった。
【0010】
<TVシステム型教材の課題>
(IV)上述(I)〜(III)の解決手段として、最近は利用者側のPCへカメラなどを追設したTVシステム装置を付帯した教育システムが登場し、利用されつつある。設置には、提供者側と利用者側の双方に経済負担を有する。さらに、「人」が相手であるため、繰り返し学習にも限度があり、また相手(講師)の資質や予約の必要などの依存要素が高い。
【0011】
<現行のインターネットを利用した教材の課題>
(V)上述(I)〜(IV)はPC上で動作する教材であるが、PCに不慣れな利用者や一般に情報弱者とよばれる障害者や高齢者へのデジタルデバイドは、インターネットの増加とともに、ますます拡大したと言われている。
【0012】
本発明の目的は、上記課題を解決するために、利用者へ対話型の教材を容易に提供することである。
【課題を解決するための手段】
【0013】
上記課題は、特許請求の範囲の請求項1に記載の発明によれば、通信回線を介して教材情報を利用者に音声にて提供する音声教材提供システムにおいて、前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、を備えることを特徴とする音声教材提供システムを提供することによって達成できる。
【0014】
このように構成することによって、簡易に各利用者に適した音声付教材を提供することができる。
上記課題は、特許請求の範囲の請求項2に記載の発明によれば、前記音声教材提供システムは、さらに、前記教材情報を作成するための基礎となる教材情報である基礎教材情報が格納された基礎教材情報格納手段を備えることを特徴とする請求項1に記載の音声教材提供システムを提供することによって達成できる。
【0015】
このように構成することによって、利用者の入力したパラメータに基づいて基礎教材情報をカスタマイズすることができる。
上記課題は、特許請求の範囲の請求項3に記載の発明によれば、前記教材情報生成手段は、前記教材パラメータに基づいて、ボイスXML文書を動的に生成することを特徴とする請求項1に記載の音声教材提供システムを提供することによって達成できる。
【0016】
このように構成することによって、VXML文書を動的に生成することができるので、各利用者に適した教材を提供する際に、柔軟に対応することができる。
上記課題は、特許請求の範囲の請求項4に記載の発明によれば、通信回線を介して教材情報を利用者に音声にて提供するために、コンピュータを実行させるための音声教材提供プログラムにおいて、前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手順と、前記教材パラメータ取得手順により取得した前記教材パラメータを解析する教材パラメータ解析手順と、前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手順と、前記教材情報生成手順により生成された前記教材情報を音声化して送信する音声化送信手順と、をコンピュータに実行させるための音声教材提供プログラムを提供することによって達成できる。
【0017】
このように構成することによって、簡易に各利用者に適した音声付教材を提供することができる。
上記課題は、特許請求の範囲の請求項5に記載の発明によれば、通信回線を介して教材情報を利用者に音声にて提供する音声教材提供サーバ装置において、前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、を備えることを特徴とする音声教材提供サーバ装置を提供することによって達成できる。
【0018】
このように構成することによって、簡易に各利用者に適した音声付教材を提供することができる。
【発明の効果】
【0019】
本発明を用いることにより、各利用者に適した音声付教材を提供する手段を簡素することができる。
【発明を実施するための最良の形態】
【0020】
VoiceXMLを用いた動的な音声教材を生成するシステムを提供する。ソフトウェアの構造としては、教材基本シナリオ制御部、教材パラメータ解析部、教材動的作成エンジンを、従来のVXMLシステムへ組み込む形態である。
【0021】
本発明では、書籍によりまたは任意の入力によりテキスト化された音声教材用の基本シナリオを用意し、次に教材を利用する前に利用者が指定する教材作成パラメータより、利用者に適した音声教材をVXMLで動的に作成し、利用者へ提供することである。
【0022】
具体的には、利用者から指定されたパラメータにより、基本シナリオ(テキスト化された文の集合体)へ、VXMLタグの発話、繰り返し構文、速度韻律、録音実施などのタグを挿入する。作成された内容は、指定パラメータ情報のみを残した形で別バッファへ保存され、次回の教材利用のために使用する。
【0023】
これより、音声を有する教材の提供を簡素化し、情報弱者でも容易に利用できる機器として、電話を利用することで、聞き取り、発話、および数字キーから情報入力を基にサービスの提供を行うことができることで、デジタルデバイトを緩和されることが期待できる。
【0024】
では、以下に本発明の実施の形態について説明する。
図1は、本発明にかかる音声教材提供システムの概要を示す。本発明にかかる音声教材提供システム100は、通信回線を介して教材情報を利用者に音声にて提供するものである。音声教材提供システム100は、教材パラメータ取得手段101、教材パラメータ解析手段102、教材情報生成手段103、基礎教材情報格納手段104、音声化送信手段105から構成される。
【0025】
教材パラメータ取得手段101では、利用者によって入力された教材情報に関するパラメータを取得する。教材パラメータ解析手段102では、その取得した教材パラメータを解析する。教材情報生成手段103では、その解析された教材パラメータに基づいて、教材情報を生成する。音声化送信手段105では、その生成された教材情報を音声化して利用者に送信する。基礎教材情報格納手段104には、教材情報のオリジナルデータが格納されている。
【0026】
図2は、本実施形態における音声教材提供システムの概要を示す。インターネット14に接続される音声教材提供システム1は、利用者情報管理制御部2、教材配信制御部4、教材運用制御部7から構成される。
【0027】
利用者情報管理制御部2は、音声教材提供システム1の利用者の情報を管理するためのサーバである。利用者情報管理制御部2は、例えば、利用者が過去にどのような要求をしたか等の履歴情報やユーザの言語のレベルがどのくらいなのか等の利用者に関する様々なプロファイル情報3やログイン情報を管理している。
【0028】
教材配信制御部4は、教材をインターネット14経由で利用者の端末に配信するためのサーバである。教材配信制御部4には、教材作成プログラム5と教材に関するデータベース6を用いることで、後述するように、利用者毎の要求に応じた教材を作成する。なお、本実施形態では、教材作成プログラム5とデータベース6は、教材配信制御部4に格納されているが、これに限定されず、利用者情報管理制御部2または教材運用制御部7に格納されていてもよいし、その他のサーバに格納されていてもよい。
【0029】
教材運用制御部7は、教材を管理運用するためのサーバである。
利用者は、PC(パーソナルコンピュータ)10を用いてインターネット14経由で、音声教材提供システム1にアクセスすることができる。また、利用者は、電話11または携帯電話12を用いて、電子交換機またはIP電話制御装置13を介してインターネット14に接続されることにより、音声教材提供システム1にアクセスすることができる。
【0030】
図3は、本実施形態における音声教材提供システム1の機能ブロック図である。同図は、図2の教材配信制御部4に対応する部分を以下に説明する。VXMLインターフェイスサーバ20は、音声教材提供システム1と利用者とのインターフェイスとなる部分である。VXMLインターフェイスサーバ20は、音声ブラウザ21と利用者用プラットフォーム24を備えている。なお、図3は、図2の音声教材提供システム1を機能的側面に基づいて描写したものであり、物理的な構成を示すものではない。
【0031】
音声ブラウザ21は、音声認識手段22、音声合成手段23を有する。音声認識手段22は、入力された音声を認識して、それをテキスト化するものである。音声合成手段23は、テキストの内容を音声合成技術を用いて音声で読み上げるものである。尚、これらは既存技術である。
【0032】
利用者用プラットフォーム24は、電話回線の制御を行うものである。例えば、電話によるユーザからの問い合わせの場合には、受話器が上がっているかどうか(すなわち電話回線のリンクが確立しているか)等の電話回線の状態を把握したり、プッシュ音を解析して押されたボタンが何であるか等を認識したりすることができる。
【0033】
利用者は、電話回線のON/OFF、音声、またはキーボード等のキー操作により、所定の情報(教材入力情報)を入力する。そうすると、その入力された情報がインターネットを経由してVXMLインターフェイスサーバ20に伝送される。
【0034】
DBサーバ29は、教材基本シナリオ情報30と利用者プロファイル情報31とが格納されている。教材基本シナリオ情報30は、教材の基本シナリオ、すなわち、後述するように各利用者に合わせてカスタマイズされる前の初期状態の教材のシナリオ情報である。利用者プロファイル情報31は、上述したように、音声教材提供システム1の利用に関し、利用者が過去にどのような要求をしたか、ユーザの言語のレベルがどのくらいなのか等の利用者の履歴情報である。
【0035】
VXML文書サーバ25は、VXMLコンテンツ(動的教材内容)28を作成するものである。VXML文書サーバ25は、VXMLインターフェイスサーバ20によりテキスト化された利用者からの教材入力情報と、教材提供者が指定する制御情報とを基にVXMLコンテンツ28を作成する。VXMLコンテンツ28の作成にあたり、VXML文書サーバ25はDBサーバ29に格納されている教材の基本シナリオ情報30と利用者のプロファイル情報31とを参照する。VXMLインターフェイスサーバ20とVXML文書サーバ25は、相互間でテキストにて情報の入出力を行う。
【0036】
図4は、本実施形態における教材基本シナリオ30のデータ構成の概要を示す。教材基本シナリオ30は、シナリオ制御情報40と、シナリオ内文情報42と臨場感制御情報45とから構成される。1シナリオ制御情報40では、複数のシナリオ内文情報42を持つ。
【0037】
本実施形態においてシナリオとは、例えば、教材の題材としての状況のことをいう。例えば、英会話の音声教材提供システムの場合には、「喫茶店での会話」、「駅での会話」等のように各状況ごとの学習プログラムを示している。このようなシナリオは、複数の文(会話)から構成されている(図6のシナリオ内文情報ビュー41参照)が、この個々の文をシナリオ内文情報42という。そして、この複数の文の集合(文群)を制御する情報がシナリオ制御情報40である。
【0038】
シナリオ内文情報42は、各文のデータ(本文データ43と語彙データ44)の制御情報である。本文データ43は、本文の内容(会話の内容)である。語彙データは、本文に使う語彙のことであり、言い回しのバリエーションのデータである。本文データ43と語彙データ44については後述する。
【0039】
臨場感制御情報45は、会話の臨場感を演出(例えば、周囲の雑音など)する音声ファイル情報46の制御情報である。これらについては、図5で詳述する。シナリオ内文情報42及び臨場感制御情報45は、読み書き可能な実データであり、シナリオ内文情報ビュー41は、これらのデータをビューで形成したものである。
【0040】
図5は、本実施形態における各データのスキーマ構成を示す。シナリオ制御情報40は、少なくとも「シナリオID」、「シナリオ内文情報ビューID」、「シナリオ内文情報ID」、「臨場感制御ID」、「シナリオ名称」、「場面名称」、「ロール数」、「構成文数」、「全長」、「丁寧度」のカラムから構成される。
【0041】
「シナリオID」には、複数シナリオを管理するIDが格納される。「シナリオ内文情報ビューID」には、シナリオ内文情報ビューを識別するIDが格納される。「シナリオ内文情報ID」には、1シナリオを形成する文のリンク情報(文の格納先)が格納される。「臨場感制御ID」には、会話の臨場感を演出する音声ファイル情報のIDが格納される。
【0042】
「シナリオ名称」には、どのような状況のシナリオかを把握するためシナリオの名称が格納される。「場面名称」には、シナリオ内の所定の会話場面の概要を記述したものが格納される。「ロール数」には、会話の演手数または登場人物が格納される。「構成文数」には、1シナリオを形成する文の数が格納される。「全長」には、当該シナリオを行うのにかかる時間である。
【0043】
「丁寧度」は、シナリオ内文を通しての丁寧度である。同じ意味合いのことを表現するにも、状況が変わればその丁寧さは変わってくる。例えば、飲食店で注文する場合にも、軽食店とレストランとではその表現が変わってくる。そのようなあらたまった表現にするか砕けた表現にするか設定することができる。
【0044】
シナリオ内文情報42は、各々の文に関する制御情報から成る。シナリオ内文情報42は、少なくとも「シナリオ内文ID」、「本文ID」、「語彙置換え情報」、「文言語種別」、「文ロール情報」のカラムから構成される。
【0045】
「シナリオ内文ID」には、1シナリオを形成する文のリンク情報が格納される。「本文ID」には、会話本文のファイルIDが格納される。「語彙置換え情報」には、文内の語彙の置換え情報が格納される。「文言語種別」には、文の言語情報が格納される。「文ロール情報」には、演じ手の種別が格納される。
【0046】
シナリオ内文情報ビュー41は、少なくとも「シナリオ内文ビューID」、「シナリオ内文ID」、「文ロール情報」、「臨場感制御ID」、「本文」のカラムから構成される。
【0047】
臨場感制御情報45は、少なくとも「臨場感制御ID」、「臨場感ファイルID」、「臨場感ファイル名」のカラムから構成される。
これらの情報群は、図5に示すようなリレーショナルで表される。
【0048】
図6は、教材基本シナリオにおける各データのスキーマ内容例を示す。この例のシナリオ制御情報40は、「シナリオID:SINA5」、「シナリオ内文ビューID:VIEW20」、「臨場感制御ID:10」、「シナリオ内文ID:SID10」、「シナリオ内文ID:SID11」、「シナリオ内文ID:SID12」、「シナリオ内文ID:SID20」、「シナリオ内文ID:SID40」、・・・「シナリオ名称:電話で次回打合せ日打診」、「場面名称:電話受付経由」、「ロール数:A,B,C」、「構成文数:12秒」、「全長:42秒」、「丁寧度:やや親密」となっている。
【0049】
シナリオ内文情報ビュー41は、「シナリオ内文ビューID:VIEW20」、「シナリオ内文ID:EID30,SID10,SID11,SID12,SID20,SID40,・・・」が格納されており、さらに、これらのシナリオ内文IDに対応する「文ロール情報」及び「本文」が順に格納されている。
【0050】
「文ロール情報:臨場感音、本文:電話ノイズ」41aに関連付いているのは、臨場感制御情報45aである。「文ロール情報:A、本文:Inderstory Resarch,May I help you?」41bに関連付いているのは、シナリオ内文情報42aである。「文ロール情報:B、本文:This is Kato,calling from Japan.」41cに関連付いているのは、シナリオ内文情報42bである。「文ロール情報:B、本文:May I speak to Mr.Brown.extension is 6790−320」41dに関連付いているのは、シナリオ内文情報42cである。「文ロール情報:A、本文:One morment please Sir.」41eに関連付いているのは、シナリオ内文情報42dである。「文ロール情報:臨場感音、本文:保留音2」41fに関連付いているのは、臨場感制御情報45bである。
【0051】
なお、シナリオ内文情報42aの語彙置換え情報は「あり MayI help you ← XXXX」となっているが、これは、語彙置換え情報を「あり」にすることで、ある語彙「XXXX」から語彙「MayI help you」に設定したことを示している。シナリオ内文情報42cの語彙置換え情報についても同様である。
【0052】
図7は、本実施形態におけるデータ入出力とシーケンス概要を示す。まず、利用者(電話使用者)は、音声教材提供システム1の提供するサイトにアクセスするために指定の電話番号をダイヤルする(ステップ1、以下ステップをSと称する)。着信後、音声ブラウザは、VXMLにて以降のメニューを音声にてナビゲートを行う(S2)。
【0053】
利用者は、S2でのナビゲートに従い利用者を特定するためのID(認識情報)などの入力を電話により行う(S3)。入力された情報は、入力解析部26によって利用者プロファイル31及び過去の教材作成情報50と照合され、サービス提供を行うかが判別される(S4)。
【0054】
S4での入力情報の解析結果に問題がなければ、音声ナビゲートに従い、利用者は教材利用情報を入力する(S5)。この教材利用情報の入力情報について図8を用いて説明する。
【0055】
図8は、本実施形態における利用者用教材作成パラメータを示す。利用者には、この利用者用教材作成パラメータに関する所定の教材が予め提供されている。「教材基本番号」は、学習対象となる教材識別子である。例えば、「01:喫茶店での会話」、「02:空港での会話」等のようにシナリオと教材識別子は管理されているので、そのシナリオに対応する識別番号(教材基本番号)を入力する。なお、シナリオ名称を直接音声で入力するようにしてもよい。
【0056】
「会話ロール」は、会話のロール(演じ手)を指定する。なお、この指定がない場合には、当該教材を聞き流す設定になる。「状況選択」は、実際の会話では、周りの騒々しさのなかで行われるため、その環境(たとえばホテルのロビーや会議場所など)を指定する。指定内容により騒音(例:ホテルのロビーの音など)をBGMとして挿入する。
【0057】
「反復」は、当該シナリオを予め反復する回数を入力する。なお、反復は、シナリオ内任意の箇所で任意の回数を設定することもできる。「自己発話結果の録音」は、自分の発話結果を録音し、会話実演後に第三者的に自分でその録音内容を確認するための設定である。
【0058】
「自己発話内容の評価」は、自分の発話結果が「通じるか」の評価を応答してもらう設定である。この設定を有効にした場合は、さらに発話結果を「即時応答」か、または「待時応答」かの2種類のうちいずれかを選択することができる。「即時応答」は、利用者が発話する度に通じるかどうかの評価を応答してもらう設定である。「待時応答」は、シナリオを全て終えて最後に通じるかどうかの評価を応答してもらう設定である。なお、この「通じるか」の評価は、音声ブラウザが認識できるか否かを示すものである。
【0059】
「相手発話内容の韻律情報(速度,音量)」は、自分に対する相手側(他の演じ手)発話内容の速度と音量の指示する。「相手発話内容の性別」は、男性音声、または女性音声かを指示する。それでは、図7の続きを説明する。
【0060】
S5で利用者により入力された情報(図8で示した利用者用教材作成パラメータ)を動的教材生成部27にて、教材基本シナリオ30と照合を行い、入力内容の妥当性(例えば、未入力チェック、ニューメリックチェック、データ型チェック等)を判別する(S6)。
【0061】
S6で入力情報に問題がなければ、動的教材生成部27は、利用者の教材利用情報(図8参照)と教材提供者が指定する制御情報(図9参照)とを基に、教材基本シナリオ30から動的教材51をVXML文書で生成する(S7)。ここで、図9を用いて教材提供者が指定する制御情報について説明する。
【0062】
図9は、本実施形態における教材提供者用教材作成パラメータを示す。「教材言語種別」は、教材の使用言語(例えば、日本語、英語、中国語、韓国語、アラビア語 等)を指定(翻訳エンジンと連動)することができる。将来の音声合成、認識装置の多言語化に対応させることができる。
【0063】
「発話ソース」は、発話のソース(音声合成装置による音声か録音ファイルによる音声か)を指定する。音声合成装置の成熟度により任意に選択することができる。「有人指定」は、Q&A対応などをオンラインで行うことができるように有人センター呼び出しの指定する。それでは、図7の続きを説明する。
【0064】
S7で生成された教材は、教材実施の全時間情報を含めた内容で、音声ブラウザに転送され、利用者へ送出される。生成された教材は、利用者毎に次回再実行ができる情報形態(生成したVXML文書を格納するのではなく、再度同一のVXML文書を生成するのに必要な情報、例えば利用者用教材作成パラメータを格納しておく。)で教材作成情報DB50へ格納される。これにより、音源の動的作成に伴うサーバ側記憶媒体容量を省小化することができる。また、音声ブラウザでは、VXML文体に従い、音声合成(発話)、音声認識(可聴)を行い(S8)、教材の利用をナビゲートすることにより、利用者に教材を提供する。
【0065】
図10は、本実施形態における入力情報解析部の処理ブロックを示す。同図の処理ブロックは、図7のS6に相当するものである。入力情報解析部60では、利用者が入力する教材利用情報と教材提供者が指定するパラメータにより、教材作成範囲の妥当性を判別する(利用者情報解析処理61及び教材提供者情報解析処理62)。
【0066】
図11は、本実施形態における動的教材生成部の処理ブロックを示す。同図の処理ブロックは、図7のS7に相当するものである。動的教材生成部での処理は、大別すると、文体要素抽出部70、文体整形部75、作成情報管理部82の3ブロックからなる。
【0067】
文体要素抽出部70では、指定された教材基本シナリオの読出し(基本情報シナリオ読出し処理71)、使用語彙の置き換え(使用語彙置換処理72)、他言語への一括翻訳(多言語化対応)(一括翻訳処理73)を行い、教材の部品を抽出する。また、利用者からの教材入力情報に状況選択の指定時は、該当する効果音(教材の背景音)を抽出する(臨場感音抽出74)。
【0068】
文体整形部75では、まずVXML文構造に影響を与えない整形を行う。会話ロールの指定では、音声認識手段22、音声合成手段23が実行すべき文情報を設定する(会話ロール設定処理76)。音声合成手段用に速度、音量、抑揚、性別などの韻律制御タグを設定する(相手側韻律設定処理77)。利用者からの教材入力情報に、自己発話内容の録音実行が指定されている場合は、録音ファイルの作成を行う制御タグを音声認識箇所に設定する(自己側録音情報設定78)。
【0069】
次に、文体整形部75では、VXML文構造に影響がある整形を行う。利用者からの教材入力情報である発話評価の応答(即時・待時)内容により、音声認識手段の反応結果を通知実行する制御タグを該当部に挿入する(発話評価の応答化処理79)。また、反復範囲の指定がある場合は、該当の文、または文群に反復制御タグを挿入する(反復化処理80)。文体の整形後、文毎でもつ文長時間を加算し、総時間を設定する(文長計測81)。
【0070】
作成情報管理部82では、文体整形を行った内容を利用者毎の教材用領域へ転送を行う(作成情報転送処理83)。また、利用者が教材の再利用を行えるように利用者用教材作成パラメータと教材提供者用教材作成パラメータを管理するために、それらを専用領域へ格納する(作成履歴管理処理84)。
【0071】
図12は、本実施形態における文体要素抽出部70で実行される処理フローを示す。まず、入力情報解析部60により解析処理された利用者用教材作成パラメータ(図8参照)を読み込む(S11)。この読み込んだ利用者用教材作成パラメータのうち教材基本番号より、これに対応するシナリオ内文情報ビューを教材基本シナリオDBから読み込む(S12)。このビューを作業用エリアへ複製する(S13)。これにより、以下で当該ビューにリンクしている臨場感制御情報45及びシナリオ内文情報42を取得することができる。
【0072】
次に、利用者用教材作成パラメータから「状況選択」に関する情報を抽出する(S14)。基本シナリオのビュー情報内に、S14で抽出された「状況選択」の互換情報(利用者により選択された情報)が含まれているかを判別する(S15)。図6のシナリオ内文情報ビュー41の臨場感音41a,41fが、利用者により選択された臨場感音に置き換わる。
【0073】
互換情報がある場合(S16で「有り」へ進む)には、S13で複製したビューの臨場感音を互換情報に置き換え(S17)、S18へ進む。互換情報がない場合(S16で「無し」へ進む)には、S18へ進む。
【0074】
次に、利用者用教材作成パラメータの「使用語彙選択内容」(図8には不図示)を抽出する(S18)。基本シナリオのビュー情報内に、S14で抽出された「使用語彙選択内容」の互換情報が含まれているかを判別する(S19)。互換情報がある場合(S20で「有り」へ進む)には、S13で複製したビューの語彙を互換情報に置き換え(21)、図13へ進む。互換情報がない場合(S20で「無し」へ進む)には、図13へ進む。
【0075】
図13は、本実施形態における文体整形部75で実行される処理フローを示す。まず、利用者用教材作成パラメータで指定された会話ロールを抽出する(S31)。抽出された内容が会話ロールの指定がある旨の場合(S32で「有り」へ進む)には、非対応文(指定外の演じ手の文)をスピーチ設定(音声で読み上げる設定)にする(S33)。抽出された内容が会話ロールの指定がない旨の場合には、全文(全演じ手の文)をスピーチ設定にする(S34)。
【0076】
次に、利用者用教材作成パラメータの会話ロール性別情報を抽出する(S35)。抽出された内容に性別情報が有る場合(S36で「有り」へ進む)には、相手発話文に性別を設定するために、VXML文書の該当する箇所に性別制御タグを挿入する(S37)。抽出された内容に性別情報がない場合(S36で「無し」へ進む)には、次の処理へ進む。
【0077】
次に、利用者用教材作成パラメータの相手発話内容の韻律情報を抽出する(S38)。抽出された内容に韻律情報が有る場合(S39で「有り」へ進む)には、相手発話文の韻律情報を設定するために、VXML文書の該当する箇所に韻律制御タグを挿入する(S40)。抽出された内容に韻律情報がない場合(S39で「無し」へ進む)には、次の処理へ進む。
【0078】
次に、利用者用教材作成パラメータの自己発話内容の録音情報を抽出する(S41)。抽出された内容に録音情報が有る場合(S42で「有り」へ進む)には、当該利用者の発話する自発話文に録音設定をするために、VXML文書の該当する箇所に制御タグを挿入する(S43)。抽出された内容に録音情報がない場合(S39で「無し」へ進む)には、次の処理へ進む。
【0079】
次に、利用者用教材作成パラメータの自己発話内容の評価情報の種別(即時、待時)を抽出する(S44)。抽出された評価情報の種別が「即時」の場合(S45で「即時」へ進む)は、VXML文書において「通じません文」(音声認識手段の反応結果を通知実行する制御タグ、以下同じ)を自己文直下に挿入する(S46)。抽出された評価情報の種別が「待時」の場合(S45で「待時」へ進む)は、VXML文書において「通じません文」を最終位置に挿入する(S47)。抽出された評価情報の種別の指定がない場合(S45で「指定なし」へ進む)は、次の処理へ進む。
【0080】
次に、利用者用教材作成パラメータの反復指定情報を抽出する(S48)。抽出された内容に反復指定情報が有る場合(S49で「有り」へ進む)には、その反復指定情報で指定された文箇所を指定された回数分複製するために、VXML文書の該当する箇所に反復制御タグを挿入する(S50)。抽出された内容に録音情報がない場合(S49で「無し」へ進む)には、次の処理へ進む。
【0081】
図14は、本実施形態における作成情報管理部82で実行される処理フローを示す。まず、上記で作成されたVXML文書の内容を音声ブラウザ20で音声化して利用者へ送出する(S61)。利用者用教材作成パラメータに当該利用者用教材作成パラメータを格納しておく指定情報(図8では不図示)が含まれている場合には、当該利用者用教材作成パラメータを実施時刻と共に利用者プロファイル及び教材作成情報に格納する。
【0082】
図15は、本実施形態における音声教材提供システム1を構築する各サーバのハードウェア環境の構成ブロック図である。同図において音声教材提供システム1の各サーバ装置150(サーバ2,4,7等)は、中央処理装置(CPU)152、リードオンリメモリ(ROM)153、ランダムアクセスメモリ(RAM)156、通信インターフェイス(以下、インターフェイスをI/Fという)154、記憶装置157、出力I/F151、入力I/F155、可搬型記憶媒体の読み取り装置158、およびこれらの全てが接続されたバス159、出力I/F151に接続している出力装置160、入力I/F155に接続している入力装置161によって構成されている。
【0083】
記憶装置157としてはハードディスク、磁気ディスクなど様々な形式の記憶装置を使用することができ、このような記憶装置157、またはROM153には、本実施形態で用いたフローのプログラムが格納されている。また、記憶装置157には、本実施形態で用いたデータベースが格納されている。
【0084】
上記のプログラムは、プログラム提供者側からネットワーク162、および通信I/F154を介して、例えば記憶装置157に格納されることも、また市販され、流通している可搬型記憶媒体に格納され、読み取り装置158にセットされて、CPU152によって実行されることも可能である。可搬型記憶媒体としてはCD−ROM、フレキシブルディスク、光ディスク、光磁気ディスク、ICカードなど様々な形式の記憶媒体を使用することができ、このような記憶媒体に格納されたプログラムが読み取り装置158によって読み取られる。
【0085】
また、入力装置161には、キーボード、マウス、または電子カメラ、マイク、スキャナ、センサ、タブレットなどを用いることが可能である。また、出力装置160には、ディスプレイ、プリンタ、スピーカなどを用いることが可能である。また、ネットワーク162は、インターネット、LAN、WAN、専用線、有線、無線等の通信網であってよい。
【0086】
以上より、利用者に適した音声付教材を提供する手段を簡素することができる。また、音源の動的作成に伴うサーバ側記憶媒体容量を省小化することができる。また、VXML化に伴い、電話によるwebハンズフリーが可能となり、情報弱者(デジタルデバイド)への保護を図ることができる。また、VXML化による副次効果として、既存教材には無かった長文のラジオのような聞き流しなど、従来にない学習サービス形態を創出することができる。
【0087】
(付記1)通信回線を介して教材情報を利用者に音声にて提供する音声教材提供システムにおいて、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、
前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、
前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、
を備えることを特徴とする音声教材提供システム。
【0088】
(付記2)前記音声教材提供システムは、さらに、
前記教材情報を作成するための基礎となる教材情報である基礎教材情報が格納された基礎教材情報格納手段を備えることを特徴とする付記1に記載の音声教材提供システム。
【0089】
(付記3)前記教材情報生成手段は、前記基礎教材情報のうち、前記教材パラメータに対応する情報があれば、該情報を該教材パラメータに置換することを特徴とする付記2に記載の音声教材提供システム。
【0090】
(付記4)前記教材情報生成手段は、前記教材パラメータに基づいて、ボイスXML文書を動的に生成することを特徴とする付記1に記載の音声教材提供システム。
(付記5)前記教材情報生成手段は、前記教材パラメータに基づいて、所定の制御タグを前記ボイスXML文書に挿入することを特徴とする付記4に記載の音声教材提供システム。
【0091】
(付記6)前記教材情報は、複数の演じ手による複数の会話文から構成されており、
前記教材パラメータを構成する情報は、前記演じ手のうちのいずれかの演じ手を指定する情報、前記演じ手による会話がされている場所周辺の環境音、前記会話文を反復させるか否かを示す情報、前記利用者の発話結果を録音するか否かの情報、前記利用者の発話結果が認識できるか否かの情報、前記指定された演じ手以外の前記演じ手の発話の速度と音量と性別を指定する情報のうち少なくともいずれか1つを含むことを特徴とする付記1に記載の音声教材提供システム。
【0092】
(付記7)前記教材パラメータ取得手段は、音声ブラウザの音声認識手段であり、前記音声化手段は、音声ブラウザの音声合成手段であることを特徴とする付記1に記載の音声教材提供システム。
【0093】
(付記8)通信回線を介して教材情報を利用者に音声にて提供するために、コンピュータを実行させるための音声教材提供プログラムにおいて、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手順と、
前記教材パラメータ取得手順により取得した前記教材パラメータを解析する教材パラメータ解析手順と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手順と、
前記教材情報生成手順により生成された前記教材情報を音声化して送信する音声化送信手順と、
をコンピュータに実行させるための音声教材提供プログラム。
【0094】
(付記9)教材情報生成手順は、前記教材情報を作成するための基礎となる教材情報である基礎教材情報と前記教材パラメータとから該教材情報特徴とする付記8に記載の音声教材提供プログラム。
【0095】
(付記10)前記教材情報生成手順は、前記基礎教材情報のうち、前記教材パラメータに対応する情報があれば、該情報を該教材パラメータに置換することを特徴とする付記9に記載の音声教材提供プログラム。
【0096】
(付記11)前記教材情報生成手順は、前記教材パラメータに基づいて、ボイスXML文書を動的に生成することを特徴とする付記8に記載の音声教材提供プログラム。
(付記12)前記教材情報生成手順は、前記教材パラメータに基づいて、所定の制御タグを前記ボイスXML文書に挿入することを特徴とする付記11に記載の音声教材提供プログラム。
【0097】
(付記13)前記教材情報は、複数の演じ手による複数の会話文から構成されており、
前記教材パラメータを構成する情報は、前記演じ手のうちのいずれかの演じ手を指定する情報、前記演じ手による会話がされている場所周辺の環境音、前記会話文を反復させるか否かを示す情報、前記利用者の発話結果を録音するか否かの情報、前記利用者の発話結果が認識できるか否かの情報、前記指定された演じ手以外の前記演じ手の発話の速度と音量と性別を指定する情報のうち少なくともいずれか1つを含むことを特徴とする付記8に記載の音声教材提供プログラム。
【0098】
(付記14)通信回線を介して教材情報を利用者に音声にて提供する音声教材提供サーバ装置において、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、
前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、
前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、
を備えることを特徴とする音声教材提供サーバ装置。
【0099】
(付記15)前記音声教材提供サーバ装置は、さらに、
前記教材情報を作成するための基礎となる教材情報である基礎教材情報が格納された基礎教材情報格納手段を備えることを特徴とする付記14に記載の音声教材提供サーバ装置。
【0100】
(付記16)前記教材情報生成手段は、前記基礎教材情報のうち、前記教材パラメータに対応する情報があれば、該情報を該教材パラメータに置換することを特徴とする付記15に記載の音声教材提供サーバ装置。
【0101】
(付記17)前記教材情報生成手段は、前記教材パラメータに基づいて、ボイスXML文書を動的に生成することを特徴とする付記14に記載の音声教材提供サーバ装置。
(付記18)前記教材情報生成手段は、前記教材パラメータに基づいて、所定の制御タグを前記ボイスXML文書に挿入することを特徴とする付記17に記載の音声教材提供サーバ装置。
【0102】
(付記19)前記教材情報は、複数の演じ手による複数の会話文から構成されており、
前記教材パラメータを構成する情報は、前記演じ手のうちのいずれかの演じ手を指定する情報、前記演じ手による会話がされている場所周辺の環境音、前記会話文を反復させるか否かを示す情報、前記利用者の発話結果を録音するか否かの情報、前記利用者の発話結果が認識できるか否かの情報、前記指定された演じ手以外の前記演じ手の発話の速度と音量と性別を指定する情報のうち少なくともいずれか1つを含むことを特徴とする付記14に記載の音声教材提供サーバ装置。
【0103】
(付記20)前記教材パラメータ取得手段は、音声ブラウザの音声認識手段であり、前記音声化手段は、音声ブラウザの音声合成手段であることを特徴とする付記14に記載の音声教材提供サーバ装置。
【図面の簡単な説明】
【0104】
【図1】本発明にかかる音声教材提供システムの概要を示す図である。
【図2】本実施形態における音声教材提供システムの概要を示す図である。
【図3】本実施形態における音声教材提供システム1の機能ブロック図である。
【図4】本実施形態における教材基本シナリオ30のデータ構成の概要を示す図である。
【図5】本実施形態における各データのスキーマ構成を示す図である。
【図6】本実施形態における教材基本シナリオにおける各データのスキーマ内容例を示す図である。
【図7】本実施形態におけるデータ入出力とシーケンス概要を示す図である。
【図8】本実施形態における利用者用教材作成パラメータを示す図である。
【図9】本実施形態における教材提供者用教材作成パラメータを示す図である。
【図10】本実施形態における入力情報解析部の処理ブロックを示す図である。
【図11】本実施形態における動的教材生成部の処理ブロックを示す図である。
【図12】本実施形態における文体要素抽出部70で実行される処理フローを示す図である。
【図13】本実施形態における文体整形部75で実行される処理フローを示す図である。
【図14】本実施形態における作成情報管理部82で実行される処理フローを示す図である。
【図15】本実施形態における音声教材提供システム1を構築する各サーバのハードウェア環境の構成ブロック図である。
【符号の説明】
【0105】
100 音声教材提供システム
101 教材パラメータ取得手段
102 教材パラメータ解析手段
103 教材情報生成手段
104 基礎教材情報格納手段
105 音声化送信手段
1 音声教材提供システム
2 利用者情報管理制御部
3 利用者プロファイル情報
4 教材配信制御部
5 教材作成プログラム
6 データベース
7 教材運用制御部
10 PC
11 電話
12 携帯電話
13 電子交換機またはIP電話制御装置
14 インターネット
20 VXMLインターフェイスサーバ
21 音声ブラウザ
22 音声認識手段
23 音声合成手段
24 利用者用プラットフォーム
25 VXML文書サーバ
29 DBサーバ
30 教材基本シナリオ情報
31 利用者プロファイル情報

【特許請求の範囲】
【請求項1】
通信回線を介して教材情報を利用者に音声にて提供する音声教材提供システムにおいて、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、
前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、
前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、
を備えることを特徴とする音声教材提供システム。
【請求項2】
前記音声教材提供システムは、さらに、
前記教材情報を作成するための基礎となる教材情報である基礎教材情報が格納された基礎教材情報格納手段を備えることを特徴とする請求項1に記載の音声教材提供システム。
【請求項3】
前記教材情報生成手段は、前記教材パラメータに基づいて、ボイスXML文書を動的に生成することを特徴とする請求項1に記載の音声教材提供システム。
【請求項4】
通信回線を介して教材情報を利用者に音声にて提供するために、コンピュータを実行させるための音声教材提供プログラムにおいて、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手順と、
前記教材パラメータ取得手順により取得した前記教材パラメータを解析する教材パラメータ解析手順と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手順と、
前記教材情報生成手順により生成された前記教材情報を音声化して送信する音声化送信手順と、
をコンピュータに実行させるための音声教材提供プログラム。
【請求項5】
通信回線を介して教材情報を利用者に音声にて提供する音声教材提供サーバ装置において、
前記利用者によって入力された前記教材情報に関するパラメータを取得する教材パラメータ取得手段と、
前記教材パラメータ取得手段により取得した前記教材パラメータを解析する教材パラメータ解析手段と、
前記解析された前記教材パラメータに基づいて、前記教材情報を生成する教材情報生成手段と、
前記教材情報生成手段により生成された前記教材情報を音声化して送信する音声化送信手段と、
を備えることを特徴とする音声教材提供サーバ装置。

【図1】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2006−163108(P2006−163108A)
【公開日】平成18年6月22日(2006.6.22)
【国際特許分類】
【出願番号】特願2004−356449(P2004−356449)
【出願日】平成16年12月9日(2004.12.9)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】