説明

音声データ再生装置、音声データ再生プログラム及び発話練習装置

【課題】電話応対の練習を効率よく一人で行うのは困難である。
【解決手段】装置に蓄積される音声データを相手側(応答パート)と自分側(練習パート)に分類して管理する。そして、応答パートと練習パートのいずれから開始するかを示すフラグを備え、このフラグで開始順を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声を発したり音を発したりする動作を個人練習するための装置及びプログラムに関する。
より詳細には、電話応対等の練習を個人で行うための装置及びプログラムに関する。
【背景技術】
【0002】
財団法人日本電信電話ユーザ協会(http://www.jtua.or.jp/)が主催する「電話応対(CTI)コンクール」という競技がある。お客様対応担当者の電話応対の技能を研鑽する目的で催されている。
このコンクールは、お客様がどう答えるかが予め課題として決まっているが、そのような応対になるためにどのような受け答えをすればよいのかを、出場選手自身が考え、自分の言葉で応対しなければならない。
一例として、図29に平成18年度のコンクールにおける課題を示す。応対者が出場選手自身に相当する。この内容を自分で考え、また自然な応対になるように話さなければならない。
【0003】
なお、電話応対練習ではないが、英会話の練習システムに関する先行技術文献として、特許文献1を示す。
【特許文献1】特開2005−31207号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
さて、電話応対コンクールのために練習することを考える。
もし、人手に頼るとなると、練習者自身以外に、応対者と、練習者の出来の良し悪しを採点する採点者の、合計二名が最低限必要になる。時間計測も必要であるので、時間計測を採点者が兼ねない場合は三名の人手が必要になる。
つまり、コンクール出場を目指す者は、最低二名の協力者を集める必要があった。
当然、人手に頼るのは時間的制約等が大きく、練習者の都合だけではなかなか練習ができない。
【0005】
本発明はかかる点に鑑みてなされたものであり、練習者一人だけで電話応対等の練習を実現する、音声データ再生装置及び音声データ再生プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するための本発明は、複数の音声データ群と、再生音声データを管理するリファレンスパターン管理テーブルと、再生音声データが自分側から開始するか相手側から開始するかを示すフラグとよりなるデータを読み込んで、音声データを再生すると共に、複数の音声データ群をリファレンスパターン管理テーブルの記述に基づいて表示する音声データ装置にかかわるものである。
【0007】
特許文献1等にあるような、予めお手本が作成済みのシステムとは異なり、電話応対コンクールの場合はお手本が存在しない。つまり、お手本は練習者自身が作成する必要がある。そこで、お手本を簡単に作成し、そのお手本から容易に応対者の部分だけを抜粋して練習ができるようにするために、お手本の音声データを練習者側と応答者側とで明確に区分する仕組みを採用した。
【発明の効果】
【0008】
本発明により、装置に蓄積される音声データを相手側(応答パート)と自分側(練習パート)に分けてリファレンスパターンと入力パターンの2系統に分類して管理し、入力パターンをリファレンスパターンに近づけるように反復練習を行うことにより、一人での電話応対練習を効率よく実現可能な、音声データ装置、プログラム及び発話練習装置を提供できる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の実施の形態を、図1〜図28を参照して説明する。
【0010】
[外観]
図1は、本発明の実施の形態にかかる、電話応対練習支援プログラム(以下「練習支援ソフト」と略)を起動した時の状態を示す図である。なお、図1は各部分の名称を表示する関係上、後述するリファレンスパターン表示エリア151、入力パターン表示エリア152及び詳細表示エリア153が白地になっているが、実際は図2、図3、図4、図5に示すように中間色で表示される。例えば灰色地である。
練習支援ソフト101はマイクロソフト社のWindows(登録商標)が稼動するパソコンにて実行できるアプリケーションプログラムである。練習支援ソフト101はその性格上、パソコンにオーディオインターフェースが装備されていることを要する。後述するように、使用者等が電話応対の練習等で発声した音声を録音したり、録音済み音声データファイルを再生して、上達の度合い等を確認する等の作業において、パソコンは音声の録音及び再生機能を要するからである。
【0011】
練習支援ソフト101はタスクファイルを読み込み、表示画面102上にその内容を展開して表示する。
そして、表示した内容に対し、「リファレンス再生」ボタン103及び「入力再生」ボタン104を押すことにより、音声の再生を実行する。
タスクファイルは、複数の音声データファイルと、その再生順番を示すテーブルデータ等よりなる。タスクファイルの詳細は後述する。
【0012】
表示画面102中には大きく三つの領域がある。
一つは、リファレンスパターン表示エリア151である。
リファレンスパターン表示エリア151は、電話応対のお手本の音声データが表示される領域である。
もう一つは、入力パターン表示エリア152である。
入力パターン表示エリア152は、電話応対の練習を行った時の音声データが表示される領域である。
最後に、詳細表示エリア153がある。
詳細表示エリア153は、リファレンスパターン表示エリア151及び入力パターン表示エリア152の、現在の再生位置にかかる音声データを、時間軸を拡大して表示すると共に、後述する類似度スコア表示を行う領域である。また、後述するテキスト表示モードが有効になっている時は、会話の内容を示す文章(テキスト)が表示される。
【0013】
「タスク新規作成」ボタン105は、タスクファイルを新規に作成するためのボタンである。
「タスク読み込み」ボタン106は、既存のタスクファイルを読み込むためのボタンである。
「タスク書き出し」ボタン107は、作成した音声データ等からタスクファイルを作成するためのボタンである。
タスクファイル名表示欄108は、読み込んだタスクファイルの名前が表示される領域である。
【0014】
「録音」ボタン109は、電話応対のお手本である、リファレンスパターンを録音するためのボタンである。
リファレンスパターンを録音すると、リファレンスパターン表示エリア151にその内容が表示される。
「連続」チェックボックス110は、リファレンスパターンの録音を連続して行うか否かを選択するチェックボックスである。
「リファレンス再生」ボタン103は、録音したリファレンスパターンを再生するためのボタンである。
【0015】
図2は、空のパートを幾つか作成した状態の図である。
図1の「パート追加」ボタン111を押すと、リファレンスパターン表示エリア151と入力パターン表示エリア152に次々と四角が表示される。この四角がパートである。
淡色にて表示されるパートは練習パート202である。練習パート202は、実際の表示画面では例えば白地にて表示される。これは、電話応対をするオペレータ、つまり練習支援ソフト101の使用者自身の発話部分である。
濃色にて表示されるパートは応答パート203である。応答パート203は、実際の表示画面では例えば群青地にて表示される。これは、電話応対をする相手の発話部分である。つまり、電話口の向こう側にいる顧客である。
【0016】
再び図1に戻る。
「パート追加」ボタン111は、カーソルで選択されているパートの直後に新たにパートを追加するためのボタンである。
「パート挿入」ボタン112は、カーソルで選択されているパートの直前に新たにパートを挿入するためのボタンである。
「パート削除」ボタン113は、カーソルで選択されているパートを削除するためのボタンである。
「MP3作成」ボタン114は、作成したリファレンスパターンからMP3(MPEG Audio Layer-3:映像データ圧縮方式のMPEG−1で利用される音声圧縮方式の一つ。)ファイルを生成するためのボタンである。これは携帯型音楽再生機器等に当該ファイルを取り込んで練習するためのものである。
【0017】
「練習開始」ボタン115は、電話応対の練習を行うためのボタンである。入力パターン表示エリア152内の表示に対応して、応答パートの再生と、練習パートの録音を交互に実行する。
「入力再生」ボタン104は、録音した練習パターンを再生する。
「応答速度」変更欄116は、練習において入力パターン内の応答パートの再生速度を変更するための数値変更欄である。
【0018】
「評価」ボタン117は、詳細表示エリア153においてリファレンスパターン詳細表示エリア154中のパートと入力パターン詳細表示エリア156中のパートとの比較を行い、その結果を表示するためのボタンである。
「比較再生」ボタン118は、リファレンスパターン詳細表示エリア154中のパートと入力パターン詳細表示エリア156中のパートの時間軸が対応する部分を同時に再生するためのボタンである。この時間軸の対応関係は、時間対応付けエリア155に表示されている結果から求められる。
「自動評価」チェックボックス119は、パートの選択操作が行われ、詳細表示エリア153においてリファレンスパターン詳細表示エリア154中のパートと入力パターン詳細表示エリア156中のパートが書き変えられた時点で自動的に「評価」ボタン117を押した場合と同じ動作を実行するためのチェックボックスである。
「テキスト表示」チェックボックス120は、詳細表示エリア153に現在のパートのテキストを表示するためのチェックボックスである。このチェックボックスをチェック(マウスでクリックして「レ」表示をさせる)すると、詳細表示エリア153全体がテキスト表示画面に切り替わる。
【0019】
「メトロノーム」チェックボックス121は、練習支援ソフト101の付加機能である、メトロノーム音を発生するためのチェックボックスである。このチェックボックスをチェックすると、練習における練習パートの録音のときに、その横にあるテンポ設定欄125にて設定したテンポのクリック音を発生する。なお、クリック音はリファレンスパターンの録音及び入力パターンの練習においては録音されない。
【0020】
タイマチェックボックス122は、練習中にリファレンスパターン中の練習パートの再生時間から逆算して、残り何分何秒かを表示する機能を選択するチェックボックスである。
電話応対の会話は早過ぎても遅すぎても良くない。つまり、お手本の会話のタイミングを忠実に再現できることが望ましい。そこで、このようなタイマ機能を設け、練習をする使用者が会話のタイミングを体に覚え込ませるのである。
「制限時間」設定欄123は、練習の際の全体の経過時間を規定する目安となる時間を設定する。つまり、総経過時間を設定する。この制限時間を設定すると、総経過時間が設定値の90%を越えた時点で、タイマ表示欄124のバックが黄色に変化する。そして、総経過時間が設定値を越えた時点で、タイマ表示欄124のバックが赤色に変化する。
タイマ表示欄124は、二つの経過時間を示す。
スラッシュ(「/」)を境に左側の表示欄は、現在再生中或は録音中のパート内の経過時間を表示する。
スラッシュ(「/」)を境に右側の表示欄は、動作モードによって表示内容が異なる。
リファレンスパターン及び入力パターンの再生時においては、各パターンの先頭から現在再生中の位置までの累積経過時間を表示する。
リファレンスパターンにおける1パートのみの録音時においては、録音中のパートの経過時間に、当該パートを除く全パートの再生時間の総和を表示する。
リファレンスパターンにおける連続モードの録音時においては、録音中のパートの経過時間に、当該パートより前方のパートの再生時間の総和を表示する。
練習実行時においては、録音或は再生中のパートの経過時間に、当該パートより前方のパートの再生時間の総和を表示する。
現在再生或は録音中のパートの経過時間は、タスク制御部908が、録音の際にはA/D変換部910の、再生の際にはD/A変換部911の、それら内部にある図示しないリングバッファを見て、音声データをバイト単位で計数することで、正確な経過時間を得ている。
【0021】
「終了」ボタン130は、練習支援ソフト101を終了させるためのボタンである。
時間軸変更ボタン126、127及び128は夫々、リファレンスパターン表示エリア151、入力パターン表示エリア152及び詳細表示エリア153の波形表示の時間軸の幅を変更する。
【0022】
ここで、練習支援ソフト101の概略を説明する。
練習支援ソフト101は、練習者が単独で電話応対を練習するために、予め自分でお手本を録音する。
そして、そのお手本の自分側を練習する。
お手本は、電話応対者側と電話応答者側の音声データの集合体よりなる。会話は交互に行われるため、電話応対者側の発話の後に電話応答者側の発話が続き、その後は電話応対者側、電話応答者側…と、音声データが配置される。
この、お手本における抽象的な概念を「リファレンスパターン」と呼ぶ。
そこで、音声データを、電話応対者側と電話応答者側と交互に配置するテーブルを用意する。
これが、リファレンスパターン管理テーブルである。リファレンスパターン管理テーブルは、リファレンスパターンの概念の中心である。
【0023】
お手本を基に練習をする際には、電話応答者側、つまり相手の音声データはお手本から持ち込み、電話応対者側、つまり自分はお手本を聞いて応対の練習をする。練習の結果は録音して、後から聞き直し、改善点を自己判断する。
お手本を基に練習をするために、リファレンスパターンとは別の抽象的な概念として、「入力パターン」を導入する。
リファレンスパターン管理テーブルの内容を複写し、練習パートの部分を空にする。この対応関係を、リファレンスパターン管理テーブルと同様に記述するテーブルを用意する。これが入力パターン管理テーブルである。
練習は、入力パターン管理テーブルの記述に基づき、複写された応答パートを再生し、空になった練習パートに録音を行う。
【0024】
これより、図1から図5迄を用いて、練習支援ソフト101の基本的な使い方の概要を説明する。
先ず、練習支援ソフト101を起動すると、利用履歴にタスクファイルが存在していれば、それを読み込んで図3のように表示する。利用履歴がないか、あっても当該タスクファイルが存在していなければ、初期状態として図1のように表示する。
図1の状態から、「パート挿入」ボタン112或は「パート追加」ボタン111を押すと、図2のように練習パートと応答パートが次々と追加される。
図2の状態から「録音」ボタン109を押して録音を行うと、リファレンスパターンの録音が行われ、リファレンスパターン表示エリア151が図3のような状態になる。なお、リファレンスパターンの録音が完遂すると、入力パターン表示エリア152中の応答パートにはリファレンスパターン中の応答パートと同じ内容が表示される。
なお、図3ではカーソルが1番目のパート(練習パート)を指し示しているので、リファレンスパターン中の第1番目のパートの音声データが、リファレンスパターン詳細表示エリア154に表示されている。
図3の状態から「練習」ボタンを押して練習を開始すると、入力パターン表示エリア152中の練習パートについては録音が、入力パターン表示エリア152中の応答パートについては再生が行われ、その結果、図4のような状態になる。
なお、図4ではカーソルが1番目のパート(練習パート)を指し示しているので、リファレンスパターン中の第1番目のパートの音声データが、リファレンスパターン詳細表示エリア154に表示されている。また、入力パターン中の第1番目のパートの音声データが、入力パターン詳細表示エリア156に表示されている。
図4の状態から「評価」ボタン117を押すと、評価が実行され、図5のような表示状態になる。
図5ではカーソルが1番目のパート(練習パート)を指し示しているので、リファレンスパターン中の第1番目のパートの音声データと、入力パターン中の第1番目のパートの音声データを比較している。
その結果、時間対応付け表示エリア155には、双方の音声データの時間軸の対応付けが細かい線にて表示される。
また、双方の音声データの類似度が計算され、その結果が類似度スコア表示エリア157に表示される。
【0025】
図6はリファレンスパターン表示エリア151と入力パターン表示エリア152を一部拡大した図である。
リファレンスパターン表示エリア151と入力パターン表示エリア152は、灰色の背景色にパートが表示される。
練習パートは淡色の下地に濃色の波形が表示される。例えばクリーム色の下地に群青色の波形である。
応答パートは練習パートとは反対に、濃色の下地に淡色の波形が表示される。例えば群青色の下地にクリーム色の波形である。
各々のパートに表示されている波形は、対応する音声データファイルの中身を可視化したものである。表示波形の縦軸は各時刻における振幅値に対応し、横軸は、相対的な時間に対応する。
各パートの左下には注目される色として、例えば赤色にて番号が表示されている。これがパート番号である。
入力パターン表示エリア152中の練習パートにおいて「no data」と表示されている(「no data」表示602)のは、対応する音声データファイルがないことを示す。「no data」表示パートは、練習支援ソフトのデフォルト値である、一定の幅で表示される。
リファレンスパターン表示エリア151と入力パターン表示エリア152の1番目のパートは、灰色地に表示される他のパートと異なり、その周囲が淡色(例えば黄色)に表示されている。これがカーソル表示である。
カーソルは、後述する録音/練習/再生を開始する際の基準位置や評価の対象となるパートの位置を示す。
カーソルとは別に、現在録音中或は再生中のパートは、注目される色で色分けして表示される。例えば、録音の場合は赤色に、再生の場合は緑色に、夫々色分けして表示する。
カーソルの変更は、録音/練習/再生等を行っていない状態において、リファレンスパターン表示エリア151或は入力パターン表示エリア152の中に表示されているパートをマウスで左クリックすることにより、行う。つまり、カーソルの位置はユーザの発意によってのみ変更される。
【0026】
[データ構造と表示内容と内部の機能との関係]
図7は、電話応対練習支援装置の内部データの構造を示す。
図8は、電話応対練習支援装置の内部データと、リファレンスパターン表示エリア151及び入力パターン表示エリア152の表示内容との対応関係を示す。
図9は、電話応対練習支援装置の機能ブロック図を示す。
【0027】
先ず、図7と図9とを併用して説明する。
練習支援ソフト101はパソコンに読み込まれ実行されることで、電話応対練習支援装置901を構成する。
周知のハードディスク装置やフラッシュメモリ等よりなる不揮発性ストレージ902に格納されているタスクファイル903は、図7に示されている各々のデータのうち、音声データ702とリファレンスパターン管理テーブル701とテキストデータ704が格納されている。タスクファイル903は圧縮アーカイブファイルであり、複数のファイルを圧縮して一つのファイルを形成するものである。一例としては、LHA(http://ja.wikipedia.org/wiki/LHA)等がある。
音声データ702は、音声データファイル904の集合体である。リファレンスパターン表示エリア151及び入力パターン表示エリア152の各パートに対応する音声データファイルであり、一例としてはwavファイルである。なお、タスクファイル903にはリファレンスパターン管理テーブル701に対応する音声データファイルのみ格納される。
【0028】
リファレンスパターン管理テーブル701は、リファレンスパターン表示エリア151に表示される各パートの音声データファイル904のファイル名が列挙されている。なお、タスクファイル903に格納される際には、第1パートのファイル名が記載される行、つまり先頭行に記載されているファイル名の後に、半角スペースを一つ挟んで、表示順フラグ705の「0」或は「1」が記載された後、プレーンテキストファイルの形式にて書き出される。
表示順フラグ705は、リファレンスパターン及び入力パターンが練習パートから始まるのか応答パートから始まるのかを示すフラグである。「0」で練習パートから、「1」で応答パートから始まることを示す。
【0029】
リファレンスパターン管理テーブル701をタスクファイル903に格納する際には、第1パートのファイル名が記載される行、つまり先頭行に記載されているファイル名の後に、半角スペースを一つ挟んで、表示順フラグ705の「0」或は「1」の記載を伴って、各パートの音声データファイル904のファイル名をテキストファイルに列挙出力する。このテキストファイルの中身の一例を次に示す。一行目だけ、ファイル名の後にスペース一つ挟んで、「0」が記されていることから、最初のパートは練習パートであることがわかる。
【0030】
ref061101153035005.wav 0
ref061101153036006.wav
ref061101153037007.wav
ref061101153038008.wav
【0031】
入力パターン管理テーブル703は、入力パターン表示エリア152に表示される各パートの音声データファイル904のファイル名が列挙されている。なお、タスクファイル903には格納されない。電話応対練習支援装置901がタスクファイル903を読み込むと、電話応対練習支援装置901はリファレンスパターン管理テーブル701を図示しないリファレンスパターン管理テーブルテキストファイルからRAM905に読み込んだ後、リファレンスパターン管理テーブル701から入力パターン管理テーブル703を生成する。つまり、入力パターン管理テーブル703はタスクファイル903読み込みの度毎に新規に生成される。
テキストデータ704はプレーンテキストである。これは各パートの台詞が記述されている。
【0032】
図7に示されている各々のデータのうち、音声データ702は個別の音声データファイル904として、不揮発性ストレージ902に格納されている。それ以外の、リファレンスパターン管理テーブル701、入力パターン管理テーブル703、テキストデータ704、表示順フラグ705は、RAM905に格納されている。また、RAM905には後述する動作制御にかかわるカウンタ変数等が格納される。
GUI(Graphical User Interface:ユーザに対する情報の表示にグラフィックを多用し、大半の基礎的な操作をマウスなどのポインティングデバイスにて行うことができるユーザインターフェース。)は、その機能として操作部906と表示部907に大別できる。操作部906と表示部907は表示画面102を構成する。
操作部906がユーザの操作を受けると、その制御信号がタスク制御部908に伝達される。
タスク制御部908は電話応対練習支援装置901の中核をなす機能を提供する。ユーザの操作を操作部906から受けて、その必要に応じて以下のような動作をする。
一つは、後述する録音/練習/再生の各動作のためにRAM905内のデータを読み込んで、音声信号処理部912を稼動させることである。
もう一つは、不揮発性ストレージ902内の音声データファイル904のサイズを取得して、後述するタイマ部909とA/D変換部910及びD/A変換部911から録音や再生の正確な経過時間等を計算することである。
更には、各種動作に応じて表示部907の表示制御を行わせることである。
【0033】
音声信号処理部912は、A/D変換部910及びD/A変換部911と不揮発性ストレージ902との間で、ディジタルオーディオ信号の授受と信号処理を行う。つまり、録音と再生、そして必要に応じて後述する話速変換処理を行う。
録音であれば、A/D変換部910から得られるディジタルオーディオ信号を、不揮発性ストレージ902内のタスク制御部908によって指定された音声データファイル904に記録する。
再生であれば、不揮発性ストレージ902内のタスク制御部908によって指定された音声データファイル904からディジタルオーディオ信号を生成し、D/A変換部911に供給する。
【0034】
タイマ部909はミリ秒単位の細かなタイマ機能を提供する。
A/D変換部910はマイクロホン913から入力されるアナログ音声信号をディジタル信号に変換し、音声信号処理部912に供給する。
D/A変換部911は音声信号処理部912から出力されるディジタル信号をアナログ音声信号に変換し、スピーカ914に出力する。
A/D変換部910及びD/A変換部911には内部にリングバッファを内蔵し、このリングバッファにディジタル音声データが読み書きされる。タスク制御部908はリングバッファの読み出し開始位置を取得して、タイマ部909から得られる正確な時間情報と共に、正確な再生時間或は録音時間を計算する。
表示部907はタスク制御部908の指示を受け、各種表示を行う。主に、
リファレンスパターン表示エリア151及び入力パターン表示エリア152中の各パートの表示、
タイマの表示、
テキストの表示、
ボタンの操作可能/不可の表示切替等を行う。
【0035】
音声データファイル904のファイル名は、必ずユニークなファイル名になるように工夫されている。具体的には、「年月日」+「時刻」+「999迄のカウント値」にて構成される。
リファレンスパターンにおいて新規に音声データファイル904のファイル名を生成するには、リファレンスパターン用の音声データファイル904であることを示す”ref”という文字列に、ファイル名生成の際の日時、そして練習支援ソフト101の内部のファイル名生成用カウンタのカウント値をインクリメントさせた値を付加する。
入力パターンにおいて新規に音声データファイル904のファイル名を生成するには、入力パターン用の音声データファイル904であることを示す”obj”という文字列に、ファイル名生成の際の日時、そして練習支援ソフト101の内部のファイル名生成用カウンタのカウント値をインクリメントさせた値を付加する。
今、2006年11月1日15時30分35秒であったとする。そして、練習支援ソフト101の内部のファイル名生成用カウンタのカウント値が「003」であったとする。この時点で、リファレンスパターン用の音声データファイル904を生成すると、ref061101153035004.wavというファイル名が生成される。
同様に、今、2006年11月1日15時30分35秒であったとする。そして、練習支援ソフト101の内部のファイル名生成用カウンタのカウント値が「003」であったとする。この時点で、入力パターン用の音声データファイル904を生成すると、obj061101153035004.wavというファイル名が生成される。
つまり、1秒間でカウンタ値を1000回繰り返さない限りは、人間の操作で同一の音声データファイル904を生成することはほぼ不可能である。
【0036】
図8は、リファレンスパターンには全パートに音声データファイル904が対応付けされているが、入力パターンには応答パートのみ音声データファイル904が対応付けされていることを示す。タスクファイル903を読み込んだ直後、或は新規にリファレンスパターンの録音を完遂した直後が、この状態である。
リファレンスパターン表示エリア151の応答パートに対応する音声データファイル904は、入力パターン表示エリア152の同じ番号の応答パートに対応する音声データファイル904と同じ内容になる。このため、リファレンスパターンの応答パートの音声データファイル904から、入力パターンの応答パートの音声データファイル904を生成すべく、複写する処理を行う。具体的には、以下のようなMS−DOS(登録商標)コマンドに相当する処理を行う。
>copy ref061101153035004.wav obj061101153035004.wav
つまり、”ref”より始まるファイル名を”obj”に始まるファイル名に変換して、内容をそっくりそのままコピーする。
なお、この処理の詳細な動作は後述する。
【0037】
[初期動作]
図10は練習支援ソフト101を起動した直後の処理の流れを示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
練習支援ソフト101を起動すると(S1001)、タスク制御部908は、Windows(登録商標)のレジストリ等に格納されているデータファイルの履歴情報から、タスクファイル903の履歴が存在するか否か、見る(S1002)。
もし、タスクファイル903の履歴が履歴情報にあった場合には、そのファイル名は実在するか否か、確認する(S1003)。
タスクファイル903の履歴がないか、あってもファイルが実在しない場合は、デフォルト設定を行う(S1004)。
履歴にあるタスクファイル903が実在していれば、タスク制御部908は、当該タスクファイル903を読み込み、音声データファイル904については不揮発性ストレージ902内の所定のディレクトリに展開し、それ以外のデータはRAM905に読み込む。この時、タスクファイル903内に含まれている図示しないリファレンス管理テーブルテキストファイルはRAM905に取り込まれ、リファレンスパターン管理テーブル701に変換される。そして、この動作に伴い、リファレンスパターン管理テーブル701のレコード数からパートの総数を得て、これを変数Nに設定する(S1005)。この時点で、ステップS1004或はS1005によって、リファレンスパターン管理テーブル701が生成されたこととなる。
次に、タスク制御部908は、リファレンスパターン管理テーブル701から入力パターン管理テーブル703を生成する処理を行う(S1006)。
リファレンスパターン管理テーブル701と入力パターン管理テーブル703が揃ったら、タスク制御部908は表示部907を制御して、各テーブル毎にパートを各々の表示エリアに表示する処理を行い(S1008)、一連の処理を終了する(S1009)。
ステップS1009の直後の画面表示状態が、図1及び図3である。
タスクファイル903の読み込みを行わない場合(S1004)は、図1の画面表示状態になる。つまり、読み込もうとするタスクファイル903が存在しないので、空白の練習パートを一つだけ設けて表示する。
タスクファイル903の読み込みが行われた場合(S1005)は、図3の画面表示状態になる。
つまり、読み込もうとするタスクファイル903が存在するので、リファレンスパターン表示エリア151には所定のパート数が表示され、入力パターン表示エリア152には応答パートだけがリファレンスパターン表示エリア151の表示内容と同じになる。
【0038】
図11はデフォルト設定の詳細な動作を示すフローチャートである。図10のステップS1004に相当する。主にタスク制御部908が主体となって行う処理である。
処理を開始すると(S1101)、タスク制御部908は規定値としてRAM905内の表示順フラグ705を「0」に設定する(S1102)。
次に、タスク制御部908はリファレンスパターン管理テーブル701の第1番目のパートの為の、ユニークなファイル名を新規に生成する(S1103)。そして、生成したファイル名をリファレンスパターン管理テーブル701の第1番目のパートに格納して(S1104)、処理を終了する(S1105)。
【0039】
図12は入力パターン管理テーブル703を生成する処理のフローチャートである。図10のステップS1006に相当する。主にタスク制御部908が主体となって行う処理である。
処理を開始すると(S1201)、タスク制御部908は最初にカウンタを構成する変数iに1を設定する(S1202)。なお、これ以降のフローチャートにおいて、変数が幾つか現れるが、これら変数は全てRAM905内にタスク制御部908によって設けられる変数である。特に、カウンタを構成する変数は各々のフローチャートの説明においてのみ有効なローカル変数である。
これ以降はループ処理である。
先ず、カウンタ変数iが示す番号のパートは応答パートか否か、判定する(S1203)。
例えば、表示順フラグ705が「0」(練習パートから開始)の場合は、奇数パートが練習パートであり、偶数パートが応答パートである。
逆に、表示順フラグ705が「1」(応答パートから開始)の場合は、奇数パートが応答パートであり、偶数パートが練習パートである。
すなわち、カウンタ変数iが偶数か奇数か、表示順フラグ705が0か1かで、その判定結果が変わる。
判定の結果、i番目のパートが練習パートであれば、タスク制御部908は入力パターン管理テーブル703用にユニークなファイル名を生成する(S1204)。
判定の結果、i番目のパートが応答パートであれば、タスク制御部908は、リファレンスパターン管理テーブル701のi番目の音声データファイル904から、入力パターン管理テーブル703のi番目の音声データファイル904を生成すべく、コピーする処理を行う(S1205)。先に示したcopyコマンドと等しい処理である。
ステップS1204或はS1205のいずれの場合においても、この時点で、入力パターン管理テーブル703用の音声データファイル904のファイル名が得られている。そこで、タスク制御部908は次に、入力パターン管理テーブル703のi番目のレコードに、当該音声データファイル904のファイル名を格納する(S1206)。
そして、カウンタ変数iを1加算(インクリメント)する(S1207)。
次に、インクリメントされた変数iの番号のパートが、リファレンスパターン管理テーブル701内にあるか否か見て(S1208)、あればループ処理を繰り返し(S1203)、なければ終了する(S1209)。
【0040】
図13は表示画面102を用いた状態遷移図である。
録音/練習/再生を行っていない状態(停止状態画面1301)において、リファレンスパターン表示エリア151の第1パートをマウスで右クリックすると、メニューウィンドウ2503が表示される。このウィンドウにて「練習パートから開始」するのか、「応答パートから開始」するのかをマウスにて指定すると、その指定内容によって表示順フラグ705が書き換えられると共に、リファレンスパターン表示エリア151と入力パターン表示エリア152の再表示処理が行われる。
録音/練習/再生を行っていない状態において、リファレンスパターン表示エリア151或は入力パターン表示エリア152に表示されている任意のパートをマウスで左クリックすると、当該パートにカーソル表示が移動する。
【0041】
図14はリファレンスパターン表示エリア151における表示処理である。
図15は入力パターン表示エリア152における表示処理である。
両者共、実質的な処理内容は全く同じであるので、ここでは図14のリファレンスパターン表示エリア151の表示処理について説明する。主にタスク制御部908が主体となって行う処理である。
処理を開始すると(S1401)、タスク制御部908はカウンタ変数iを指定した値に設定する(S1402)。指定した値とは、そのときのシチュエーションに応じて変わる。図12の場合では1になる。後述する録音/練習/再生処理の場合では、録音/練習/再生を完了した直後のパートの番号が代入される。
次に、タスク制御部908はリファレンスパターン管理テーブル701のi番目のパートに記述されている音声データファイル904は不揮発性ストレージ902内に実在するか否かを調べる(S1403)。もしあれば、表示部907を制御して、その音声データファイル904を読み込み、波形表示する(S1404)。なければ、空表示、すなわち「no data」表示を行う(S1405)。なお、このステップS1404及びS1405では、変数iと表示順フラグ705とを確認して、練習パートであれば白地に群青表示を、応答パートであれば群青地に白表示を行う。
次に、タスク制御部908は、表示部907による表示処理の結果、当該パートの表示が表示エリアをはみ出たか否かを確認する(S1406)。はみ出ていなければ、変数iをインクリメントし(S1407)、パート最大数Nと比較して、Nを超えていないか否か確認する(S1408)。Nを超えていなければ、再び表示処理を繰り返す(S1403)。Nを超えたか、或はステップS1406で表示エリアをはみ出てしまった場合は、処理を終了する(S1409)。
【0042】
図16はパート挿入ボタンを押したときの処理を示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
パート挿入ボタンが押されると(S1601)、タスク制御部908は、リファレンスパターン管理テーブル701の、現在カーソルが示しているパート以降の内容を一つ後方にずらす(S1602)。図16のステップS1602においては、現在のカーソル位置を示す変数をkとしている。そして、リファレンスパターン管理テーブル701のj番目の内容をRef(j)と表現している。この処理の詳細は、
Ref(N+1)を新規に作成し、
Ref(N+1)にRef(N)を代入し、
Ref(N)にRef(N−1)を代入し、
Ref(N−1)にRef(N−2)を代入し、…そして、
Ref(k+1)にRef(k)を代入する、という処理の流れになる。
次に、入力パターン管理テーブル703の、現在カーソルが示しているパート以降の内容を一つ後方にずらす(S1603)。図16のステップS1603においては、現在のカーソル位置を示す変数をkとしている。そして、入力パターン管理テーブル703のj番目の内容をObj(j)と表現している。この処理の詳細は、
Obj(N+1)を新規に作成し、
Obj(N+1)にObj(N)を代入し、
Obj(N)にObj(N−1)を代入し、
Obj(N−1)にObj(N−2)を代入し、…そして、
Obj(k+1)にObj(k)を代入する、という処理の流れになる。
つまり、ステップS1602及びS1603は、挿入したい位置を空ける処理である。
空ける処理の後は、実際にデータを挿入する処理である。タスク制御部908は、リファレンスパターン用にユニークなファイル名を生成して、リファレンスパターン管理テーブル701のk番目に書き込む(S1604)。同様に、入力パターン用にユニークなファイル名を生成して、入力パターン管理テーブル703のk番目に書き込む(S1605)。
そして、パートの数を保持している変数Nをインクリメントする(S1606)。
最後に、入力パターンのデータ更新処理を行って(S1607)、終了する(S1608)。
【0043】
図17はパート削除ボタンを押したときの処理を示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
パート削除ボタンが押されると(S1701)、タスク制御部908は、リファレンスパターン管理テーブル701の、現在カーソルが示しているパートの内容である音声データファイル904を削除する(S1702)。このとき、当該削除対象の音声データファイル904が実在していなければ、処理をスキップする。同様に、入力パターン管理テーブル703の、現在カーソルが示しているパートの内容である音声データファイル904を削除する(S1703)。このとき、当該削除対象の音声データファイル904が実在していなければ、処理をスキップする。
次に、リファレンスパターン管理テーブル701の、現在カーソルが示しているパート以降の内容を一つ前方にずらす(S1704)。図17のステップS1704においては、現在のカーソル位置を示す変数をkとしている。そして、リファレンスパターン管理テーブル701のj番目の内容をRef(j)と表現している。この処理の詳細は、
Ref(k+1)にRef(k)を代入し、
Ref(k+2)にRef(k+1)を代入し、…そして、
Ref(N−1)にRef(N)を代入する、という処理の流れになる。
同様に、入力パターン管理テーブル703の、現在カーソルが示しているパート以降の内容を一つ前方にずらす(S1705)。図17のステップS1705においては、現在のカーソル位置を示す変数をkとしている。そして、入力パターン管理テーブル703のj番目の内容をObj(j)と表現している。この処理の詳細は、
Obj(k+1)にObj(k)を代入し、
Obj(k+2)にObj(k+1)を代入し、…そして、
Obj(N−1)にObj(N)を代入する、という処理の流れになる。
そして、パートの数を保持している変数Nをデクリメントする(S1706)。
最後に、入力パターンのデータ更新処理を行って(S1707)、終了する(S1708)。
【0044】
図18は、入力パターンのデータ更新処理を示すフローチャートである。図16のステップS1607及び図17のステップS1707に相当する。主にタスク制御部908が主体となって行う処理である。
処理を開始すると(S1801)、タスク制御部908は、カウンタ変数iに現在のカーソル位置kを代入する(S1802)。
次に、タスク制御部908はカウンタ値iとパート数Nとを比較して(S1803)、iがパート数N以下であれば、i番目のパートが応答パートなのか練習パートなのかを確認する(S1804)。
応答パートであれば、入力パターン管理テーブル703のi番目が参照している音声データファイル904に、リファレンスパターン管理テーブル701のi番目が参照している音声データファイル904の内容を上書きコピーする(S1805)。この処理により、入力パターン管理テーブル703のi番目が参照している音声データファイル904のファイル名はそのままで、中身はリファレンスパターン管理テーブル701のi番目が参照している音声データファイル904と同じになる。
練習パートであれば、入力パターン管理テーブル703のi番目が参照している音声データファイル904を削除する(S1806)。なお、音声データファイル904が実在しない場合は、処理をスキップする。
ステップS1805及びS1806のいずれの場合でも、処理を完遂した後は、カウンタiをインクリメント(S1807)して、再びステップS1803にてパート数Nと比較される。
ステップS1803にて、カウンタiがパート数Nを超えたら、終了となる(S1808)。
【0045】
以上、図16、図17及び図18を通じて、リファレンスパターン管理テーブルと入力パターン管理テーブルとのパート数は必ず同じ数になることがわかる。
【0046】
[録音]
図19及び図20は、リファレンスパターンの録音を行う際の処理を示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
図1の「録音」ボタン109を押すと(S1901)、タスク制御部908は、最初にカウンタ変数jにカーソル位置を示す指定数kを代入する(S1902)。
これ以降はループ処理である。
先ず、jとパート数Nを比較する(S1903)。jがN以下であれば、次に「テキスト表示」チェックボックス120にチェックが入っているか否か(テキスト表示モードであるか否か)を確認する(S1904)。テキスト表示モードであれば、テキストデータ704のj番目のパートのテキストを表示する(S1905)。
次に、リファレンスパターン表示エリア151中のj番目のパートを赤く表示して(S1906)、録音を開始する(S1907)。
録音中は、タスク制御部908は操作部906を通じて、キーボードのエスケープキー(ESCキー)が押されたか否か(S1908)、マウスの右クリックが行われたか否か(S1909)をチェックし続ける(S1909のNからS1908へ)。
ESCキーが押されたら(S1908のY)、録音を終了すると共に当該パートの赤色表示を止めて(S1910)、j番目以降のパートの再表示処理を行う(S1911)。すなわち、図14に示したパート表示処理を、iにjを代入して行うものである。そして、終了する(S1912)。
マウスの右クリックが行われたら(S1909のY)、j番目のパートの録音を終了すると共に、当該パートの赤色表示を止める(S2013)。そして、j番目以降のパートの再表示処理を行う(S2014)。すなわち、図14に示したパート表示処理を、iにjを代入して行うものである。
次に、「連続」チェックボックス110にチェックが入っているか(連続録音モードであるか否か)を確認する(S2015)。連続モードでなければここで処理は終了する(S2016)が、連続モードであれば、次のパートの録音を行うので、jをインクリメントして(S2017)、処理を繰り返す(S1903)。カウンタjがパート数Nを超えたら、終了となる(S1918)。
【0047】
[練習]
図21は表示画面102を用いた状態遷移図である。
通常の表示状態(停止状態画面2101)において、「練習開始」ボタン115を押すと、発話練習開始ウィンドウ2102が表示される。
発話練習開始ウィンドウ2102の「開始」ボタンを押すと、入力パターン表示エリア152の表示内容にしたがって、練習パートへの録音(練習)と、応答パートの再生が繰り返される(練習状態画面2103)。
【0048】
図22及び図23は入力パターンにおける練習を行う際の処理を示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
図1の「練習開始」ボタン115を押すと(S2201)、タスク制御部908は最初にカウンタ変数jにカーソル位置を示す指定数kを代入する(S2202)。
これ以降はループ処理である。
先ず、jとパート数Nを比較する(S2203)。jがN以下であれば、次に「テキスト表示」チェックボックス120にチェックが入っているか否か(テキスト表示モードであるか否か)を確認する(S2204)。テキスト表示モードであれば、テキストデータ704のj番目のパートのテキストを表示する(S2205)。
次に、j番目のパートは応答パートであるか否かを確認する(S2206)。
応答パートであれば、j番目のパートを緑色に表示して(S2207)、j番目のパートの再生を開始する(S2208)。
再生中は、キーボードのエスケープキー(ESCキー)が押されたか否か(S2209)、当該パートの再生が終了したか否か(S2310)をチェックしつつ、ループする(S2310のNからS2209へ)。
ESCキーが押されたら(S2209のY)、当該パートの再生を中断すると共に当該パートの緑色表示を止めて(S2211)、終了する(S2212)。
当該パートの再生が終了したら(S2310のY)、カウンタjをインクリメントして(S2313)、ループ処理を継続する(S2203)。
応答パートの次には練習パートが位置している(S2206のN)。練習パートであれば、当該j番目のパートを赤く表示して(S2314)、録音を開始する(S2315)。ここで「録音」というのは、練習パートにかかる音声データファイル904に対する録音である。
録音中は、キーボードのエスケープキー(ESCキー)が押されたか否か(S2316)、マウスの右クリックが行われたか否か(S2317)をチェックしつつ、ループする(S2317のNからS2316へ)。
ESCキーが押されたら(S2316のY)、録音を終了すると共に当該パートの赤色表示を止めて(S2318)、j番目以降のパートの再表示処理を行う(S2319)。すなわち、図14に示したパート表示処理を、iにjを代入して行うものである。そして、終了する(S2320)。
マウスの右クリックが行われたら(S2317のY)、j番目のパートの録音を終了すると共に、当該パートの赤色表示を止める(S2321)。そして、j番目以降のパートの再表示処理を行う(S2322)。すなわち、図14に示したパート表示処理を、iにjを代入して行うものである。そして、カウンタjをインクリメントして(S2313)、ループ処理を継続する(S2203)。
カウンタjがパート数Nを超えたら終了となる(S2223)。
【0049】
[応答速度変更]
練習の際に、「応答速度」変更欄116の数値を変更することにより、応答パートの再生速度を変更することができる。いわゆる話速変換と呼ばれる機能である。数値による速度変更情報は操作部906からタスク制御部908に伝達される。タスク制御部908は音声信号処理部に制御命令を発する。音声信号処理部912では目的の(これから再生しようとする応答パートの)音声データファイル904の再サンプリング処理を施すことにより、再生時のピッチを変更せずに再生速度を変更する。
【0050】
[再生]
図24は、リファレンスパターン及び入力パターンの再生処理を示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
「リファレンス再生」ボタン103或は「入力再生」ボタン104を押すと(S2401)、最初にカウンタ変数jにカーソル位置を示す指定数kを代入する(S2402)。
これ以降はループ処理である。
先ず、jとパート数Nを比較する(S2403)。jがN以下であれば、次に「テキスト表示」チェックボックス120にチェックが入っているか否か(テキスト表示モードであるか否か)を確認する(S2404)。テキスト表示モードであれば、テキストデータ704のj番目のパートのテキストを表示する(S2405)。
次に、j番目のパートを緑色に表示して(S2406)、j番目のパートの再生を開始する(S2407)。
再生中は、キーボードのエスケープキー(ESCキー)が押されたか否か(S2408)、当該パートの再生が終了したか否か(S2409)をチェックしつつ、ループする(S2409のNからS2408へ)。
ESCキーが押されたら(S2408のY)、当該パートの再生を中断すると共に当該パートの緑色表示を止めて(S2410)、終了する(S2411)。
当該パートの再生が終了したら(S2409のY)、カウンタjをインクリメントして(S2412)、ループ処理を継続する(S2413)。
【0051】
[差し替え]
練習を行った結果、入力パターン上のある特定のパートに録音した音声がリファレンスパターン上のものよりも出来が良かった場合は、当該パートを選択して(マウスの左クリック)カーソル位置を更新した後、「差し替え」ボタン131を押す(マウスの左クリック)。すると、当該リファレンスパターン上のパートが指し示す音声データファイル904は、対応する入力パターン上のパートが指し示す音声データファイル904によって上書きコピーされる。
リファレンスパターン上にて選択したパートの音声データがref061101153035005.wavで、対応する入力パターン上のパートの音声データファイル904がobj061101154035000.wavである場合、以下のMS−DOSコマンドを実行したことと動作は等しい。
>copy obj061101154035000.wav ref061101153035005.wav
つまり、リファレンスパターン管理テーブル701内の当該パートのレコードに格納されているファイル名はそのままで、中身は入力パターン管理テーブル703内の当該パートのレコードに格納されているファイル名の音声データファイル904の中身に挿げ替えられる。
【0052】
[カット/コピー/ペースト]
電話応対では、応答する相手の会話内容が「ええ」「はい」等の相槌である場合が多い。このような相槌に相当する箇所は、同一の音声データを流用したい。そこで、指定したパートの内容に対し、切り取り(カット:指定した箇所の内容を削除して内部バッファ領域に転送する)/コピー(指定した箇所の内容を削除せずに内部バッファ領域に複写する)/貼り付け(ペースト:内部バッファ領域に保持されている内容を指定した箇所に複写する)を実現できると、便利である。
図25(a)及び(b)は、カット/コピー/ペーストのメニューウィンドウを表示した状態を示す図である。
図25(a)において、指定したパートを右クリックすることで、メニューウィンドウ2502が現れる。
メニューウィンドウ2502には、上から順に「コピー」、「切り取り」、「貼り付け」と列挙され、更に「ファイル読み込み」、「ファイル書き出し」という項目が続く。
図25(a)では、内部バッファ領域に音声データファイル904の内容が保持されていないので、「貼り付け」の項目の文字が薄い表示になっており、マウスの左クリックによる指定ができなくなっている。これ以外の項目の文字は濃い表示になっており、マウスの左クリックによる指定ができる。
図25(a)の状態で、「コピー」を選択すると、内部バッファ領域に音声データファイル904の内容が複写され、それと共にメニューウィンドウ2501の表示がなくなる。
図25(a)の状態で、「切り取り」を選択すると、内部バッファ領域に音声データファイル904の内容が複写され、音声データファイル904は削除され、「no data」表示になる。そして、メニューウィンドウ2501の表示がなくなる。
内部バッファ領域に音声データファイル904の内容が保持されている状態で、「貼り付け」を選択すると、指定したパートの音声データファイル904の中身が、内部バッファ領域に保持されている音声データの内容によって上書きされる。なお、このときに「貼り付け」対象のパートが「no data」表示である場合は、音声データファイル904の実体がないので、当該パートのファイル名にて新たに音声データファイル904が作成され、そこに内部バッファ領域に保持されている音声データの内容が転送(貼り付け)される。
なお、「ファイル読み込み」「ファイル書き出し」の項目は、指定したパートの音声データファイルを単独で読み込んだり書き出したりするために用いる機能である。
【0053】
図25(b)は、リファレンスパターン表示エリア151の第1パートにおいてマウスの右クリックを行った状態を示す。
図25(a)と異なる点は、メニューウィンドウ2502と異なり、メニューウィンドウ2503には図13で示した表示順指定項目が追加されている点である。このメニューウィンドウ2502は、リファレンスパターン表示エリア151の第1パートにおいてのみ表示されるものである。
【0054】
[評価]
「評価」ボタン117を押すと、カーソルにて指定されている練習パートについて、公知のDPマッチング処理アルゴリズムを用いて、時間軸対応関係表示及び類似度表示を行う。
練習支援ソフト101が録音/練習/再生を行っていない状態では、カーソル位置のパートについて、カーソル位置のパートが練習パートである場合は、音声信号処理部912がタスク制御部908の指示を受けて、比較対象となる音声データファイル904を読み込み、評価処理を行う。評価結果は表示部907によって時間対応付け表示エリア155及び類似度スコア表示エリア157に表示される。
「自動評価」チェックボックス119にチェックを付すと、練習支援ソフト101が再生を行っている状態で、カーソル位置のパートについて、カーソル位置のパートが練習パートである場合は、評価処理を逐次行う。
評価のグラフィカル表示が図5である。
【0055】
[MP3出力]
近年、フラッシュメモリ或は超小型ハードディスク装置を記憶媒体として用いている、MP3プレーヤが市場に広く流通している。携帯電話においてもMP3プレーヤ機能を備える機種が広く流通している。(以下、これらを「MP3プレーヤ」と包括して略す。)このような機器に、本実施形態の練習支援ソフト101におけるリファレンスパターンの音声内容をMP3形式で出力し、MP3プレーヤにて再生すれば、外出中でも個人練習ができる。
【0056】
図26は、「MP3作成」ボタン114を押すと現れる、MP3作成メニューウィンドウを示す。
MP3作成メニューウィンドウ2601には、MP3の出力形態を指定するためのラジオボタン等が設けられている。
MP3出力形式ラジオボタン2602は、MP3の出力形式を指定するラジオボタンである。「全てのパートをモノラル形式で作成」「練習パート/応答パート別にステレオ形式で作成」「練習パートを無音にしたモノラル形式で作成」のいずれか一つが選択できる。
合図音指定ラジオボタン2603は、MP3出力形式ラジオボタン2602にて「練習パートを無音にしたモノラル形式で作成」を選択した際に、更にその出力オプションとして、合図音を入れるか否か、入れるならどのような形式で入れるかを指定するラジオボタンである。「合図音を入れない」「一定間隔の合図音を入れる」「一定分割の合図音を入れる」のいずれか一つが選択できる。
合図音間隔指定欄2604は、合図音指定ラジオボタン2603にて「一定間隔の合図音を入れる」を選択した際に、合図音の間隔を秒数で指定する指定欄である。
合図音数指定欄2605は、合図音指定ラジオボタン2603にて「一定分割の合図音を入れる」を選択した際に、分割数を指定する指定欄である。
「作成」ボタン2606は、MP3作成を実行するためのボタンである。
【0057】
図27及び図28は、MP3出力処理の流れを示すフローチャートである。主にタスク制御部908が主体となって行う処理である。
図26の「作成」ボタン2606を押すと(S2701)、最初にカウンタ変数iに初期値1を設定する(S2702)。
次に、MP3出力形式ラジオボタンの判定処理を行う。「全てのパートをモノラル形式で作成」が選択されているか(S2703)、「練習パート/応答パート別にステレオ形式で作成」が選択されているか(S2704)を見る。ステップS2703及びS2704のいずれの条件にも当てはまらない場合は、「練習パートを無音にしたモノラル形式で作成」を選択したこととなる(S2704のN)。
【0058】
「全てのパートをモノラル形式で作成」が選択されている場合(S2703のY)、カウンタiとパート数Nとを比較して(S2705)、パート数N以内なら(S2705のY)、音声信号処理部912を制御して、リファレンスパターンのi番目のパートをモノラル出力し、MP3形式に変換する(S2706)。その後、カウンタiをインクリメントし(S2707)、処理を繰り返す(S2705)。カウンタiがパート数Nを超えたら(S2705のN)、処理を終了する(S2708)。
【0059】
「練習パート/応答パート別にステレオ形式で作成」が選択されている場合(S2704のY)、カウンタiとパート数Nとを比較する(S2709)。パート数N以内なら(S2709のY)、次にi番目のパートは応答パートか否か確認する(S2710)。応答パートなら、音声信号処理部912を制御して、当該パートを右チャンネルにて出力し、MP3変換する(S2711)。練習パートなら、当該パートを左チャンネルにて出力し、MP3変換する(S2712)。
その後、カウンタiをインクリメントし(S2713)、処理を繰り返す(S2709)。カウンタiがパート数Nを超えたら(S2709のN)、処理を終了する(S2714)。
【0060】
「練習パートを無音にしたモノラル形式で作成」を選択されている場合(S2704のN)、カウンタiとパート数Nとを比較する(S2815)。パート数N以内なら(S2815のY)、次にi番目のパートは応答パートか否か確認する(S2816)。応答パートなら、音声信号処理部912を制御して、当該パートをモノラルにて出力し、MP3変換する(S2817)。その後、カウンタiをインクリメントし(S2818)、処理を繰り返す(S2815)。カウンタiがパート数Nを超えたら(S2815のN)、処理を終了する(S2819)。
ステップS2816において当該パートが練習パートなら(S2816のN)、次に合図音指定ラジオボタン2603の判定処理を行う。「合図音を入れない」が選択されているか(S2820)、「一定間隔の合図音を入れる」が選択されているか(S2821)を見る。ステップS2820及びS2821のいずれの条件にも当てはまらない場合は、「一定分割の合図音を入れる」を選択したこととなる(S2821のN)。
【0061】
「合図音を入れない」が選択されている場合(S2820)、i番目のパートの音声データファイルの再生時間を得る。そして、音声信号処理部912を制御して、その時間に相当する無音データを出力し、MP3変換する(S2822)。
【0062】
「一定間隔の合図音を入れる」が選択されている場合(S2821)、i番目のパートの音声データファイルの再生時間を得る。そして、音声信号処理部912を制御して、その時間だけ指定間隔の合図音を出力し、MP3変換する(S2823)。
【0063】
「一定分割の合図音を入れる」を選択されている場合(S2821のN)、i番目のパートの音声データファイルの再生時間を得て、指定された分割数から、合図音を出す時間間隔を算出する(S2824)。そして、音声信号処理部912を制御して、当該音声データファイルの再生時間だけ、算出した間隔の合図音を出力し、MP3変換する(S2825)。
【0064】
MP3出力を行った後は(S2817、S2822、S2823、S2825)、カウンタiをインクリメントして(S2818)、カウンタiがパート数を越えるまで処理を繰り返し(S2815)、パート数Nを越えたら終了する(S2819)。
【0065】
本実施形態には、以下のような応用例が考えられる。
(1)上述の実施形態では、音声データを各パート毎に単一の音声データファイルとして管理していたが、単一の音声データファイルにすることもできる。また、音声データを格納するリレーショナルデータベースを用いることもできる。
【0066】
(2)上述の実施形態はあくまで相手が一人の場合だった。本発明の技術思想を発展させて、相手が複数の場合においても、本実施形態に多少の改変を施すだけで、複数相手の会話練習ソフトを実現することができる。
具体的には、各パート毎に応答パートか練習パートかを示すフラグを持たせる。
この応用形態では、例えば舞台等の演劇やドラマ等の出演者が、自宅等で台詞を覚える練習をする際に極めて好適である。リファレンスパターンに監督等が台本を読み上げて作成したタスクファイルを、複数の出演者に渡す。出演者は本ソフトを手持ちのパソコンで稼動させ、自分のパート、すなわち練習パートを指定して、台詞の練習ができるのである。
【0067】
(3)本発明の技術思想を応用して、記録するデータを音声データに留まらず、MIDIデータを記録再生できるようにすれば、楽器練習にも応用できる。テキストデータの代わりに、楽譜や、ギター或はベースの運指を示すタブラチュア譜を表示すれば、なお便利である。楽器練習においては、評価機能がリズムのずれを明確に表示することとなるので、これもまた練習に大変効果的である。
【0068】
(4)反復練習を行うために、練習の対象範囲を指定して、繰り返し練習を行うように機能を追加することもできる。
【0069】
(5)相槌に相当する応答パートは専用の音声データファイルをランダムに再生する機能を追加することもできる。
予め、″res″から始まる、相槌に相当する音声データファイルを複数用意する。
そして、リファレンスパターンの応答パートについて、マウスの右クリックにて「相槌」の指定を行う機能を追加する。「相槌」の指定がなされた当該応答パートは、″ref″から始まる音声データファイル名が、用意してある″res″から始まる音声データファイル名にランダムに変換される。
この機能により、リファレンスパターンの作成作業の手間が軽減される。
【0070】
本実施形態においては、電話応対練習支援プログラム及びこれを実行することによって実現される電話応対練習支援装置を開示した。
装置に蓄積される音声データを相手側(応答パート)と自分側(練習パート)に分類して管理することにより、一人での電話応対練習を効率よく実現できる。
【0071】
お手本(リファレンスパターン)及び練習(入力パターン)の内容を、音声データの波形を表示することにより、現在データとして格納されている内容がどのようになっているかが視覚的に明確にわかる。
また、音声データの波形に応じて表示幅が変わると共に、音声データがない場合は「no data」表記と共に規定の幅で表示することで、今どの音声データが存在しているか否かが一目で判別できる。
【0072】
データに表示順フラグを内包させることにより、応答パート、練習パートのいずれから開始する場合にも対応できる。
また、表示順フラグを変更する機能を持つことにより、データ入力の途中から、応答パート、練習パートのいずれから開始する場合にも変更できる。
【0073】
リファレンスパターンの録音はマウスのボタンを押しながら連続録音ができるので、リファレンスパターンの録音作業が非常に効率よくできる。
録音や練習の際には、マウスのボタンを押すことで音声データの録音が完了したパートから、録音であればリファレンスパターン表示エリア、練習であれば入力パターン表示エリアの再表示を行うことで、どこまで録音或は練習をしたのか、その進捗状況が一目で判ると共に、録音した音声データの時間幅が視覚的にわかる。
【0074】
リファレンスパターンの録音を終了すると、入力パターンの応答パートにも同一内容の音声データファイルを複写して、入力パターン表示テーブルに表示される。このように構成することで、練習のために用意するデータが自動的に作成されるので、リファレンスパターンの録音完了後、すぐに練習に取り掛かることができる。
練習の際には応答パートを再生し、再生を終了したら即座に練習パートの録音を開始する。こうすることにより、一人での電話応対練習を効率よく実現できる。
【0075】
練習の結果、出来の良かった入力パターン中の練習パートをリファレンスパターンへ差し替える処理を行う機能を設けることにより、自己練習でありながら効率良くスキルアップを図ることができる。
【0076】
リファレンスパターンの音声データを一つの音声データとして出力する機能を設けることにより、ノートパソコンが持ち込めないような環境下においても、MP3プレーヤ等携帯型音楽再生機器にて聴取しながら練習をすることもできる。
更に、音声データを出力する際に、練習パートを含めるか含めないかを選択できるように構成することにより、練習の習熟度に応じて適切な音声データを出力でき、練習が効率よくできる。
【0077】
以上、本発明の実施形態例について説明したが、本発明は上記実施形態例に限定されるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、他の変形例、応用例を含むことは言うまでもない。
【図面の簡単な説明】
【0078】
【図1】本発明の一実施の形態による電話応対練習支援プログラムを起動した時の画面表示を示す図である。
【図2】空のパートを幾つか作成した状態の画面表示を示す図である。
【図3】リファレンスパターンの録音を完了した状態の画面表示を示す図である。
【図4】入力パターンの練習を行った状態の画面表示を示す図である。
【図5】評価を実行した状態を示す図である。
【図6】リファレンスパターン表示エリアと入力パターン表示エリアを一部拡大した図である。
【図7】電話応対練習支援装置の内部データの構造を示す模式図である。
【図8】電話応対練習支援装置の内部データと、リファレンスパターン表示エリア及び入力パターン表示エリアの表示内容との対応関係を示す模式図である。
【図9】電話応対練習支援装置の機能ブロック図である。
【図10】練習支援ソフトを起動した直後の処理の流れを示すフローチャートである。
【図11】デフォルト設定の詳細な動作を示すフローチャートである。
【図12】入力パターン管理テーブルを生成する処理を示すフローチャートである。
【図13】表示画面を用いた状態遷移図である。
【図14】リファレンスパターン表示エリアにおける表示処理を示すフローチャートである。
【図15】入力パターン表示エリアにおける表示処理を示すフローチャートである。
【図16】パート挿入ボタンを押したときの処理を示すフローチャートである。
【図17】パート削除ボタンを押したときの処理を示すフローチャートである。
【図18】入力パターンのデータ更新処理を示すフローチャートである。
【図19】リファレンスパターンの録音を行う際の処理を示すフローチャートである。
【図20】リファレンスパターンの録音を行う際の処理を示すフローチャートである。
【図21】表示画面を用いた状態遷移図である。
【図22】入力パターンにおける練習を行う際の処理を示すフローチャートである。
【図23】入力パターンにおける練習を行う際の処理を示すフローチャートである。
【図24】リファレンスパターン及び入力パターンの再生処理を示すフローチャートである。
【図25】カット/コピー/ペーストのメニューウィンドウを表示した状態を示す図である。
【図26】MP3作成メニューウィンドウを示す図である。
【図27】MP3出力処理の流れを示すフローチャートである。
【図28】MP3出力処理の流れを示すフローチャートである。
【図29】財団法人日本電信電話ユーザ協会が主催する電話応対コンクールの、平成18年度の課題である。
【符号の説明】
【0079】
101…練習支援ソフト、102…表示画面、103…「リファレンス再生」ボタン、104…「入力再生」ボタン、105…「タスク新規作成」ボタン、106…「タスク読み込み」ボタン、107…「タスク書き出し」ボタン、108…タスクファイル名表示欄、109…「録音」ボタン、110…「連続」チェックボックス、111…「パート追加」ボタン、112…「パート挿入」ボタン、113…「パート削除」ボタン、114…「MP3作成」ボタン、115…「練習開始」ボタン、116…「応答速度」変更欄、117…「評価」ボタン、118…「比較再生」ボタン、119…「自動評価」チェックボックス、120…「テキスト表示」チェックボックス、121…「メトロノーム」チェックボックス、122…タイマチェックボックス、123…「制限時間」設定欄、124…タイマ表示欄、125…テンポ設定欄、126…時間軸変更ボタン、127…時間軸変更ボタン、128…時間軸変更ボタン、130…「終了」ボタン、131…「差し替え」ボタン、151…リファレンスパターン表示エリア、152…入力パターン表示エリア、153…詳細表示エリア、202…練習パート、203…応答パート、701…リファレンスパターン管理テーブル、702…音声データ、703…入力パターン管理テーブル、704…テキストデータ、705…表示順フラグ、901…電話応対練習支援装置、902…不揮発性ストレージ、903…タスクファイル、904…音声データファイル、905…RAM、906…操作部、907…表示部、908…タスク制御部、909…タイマ部、910…A/D変換部、911…D/A変換部、912…音声信号処理部、913…マイクロホン、914…スピーカ、2502…メニューウィンドウ、2503…メニューウィンドウ、2601…MP3作成メニューウィンドウ、2602…MP3出力形式ラジオボタン、2603…合図音指定ラジオボタン、2604…合図音間隔指定欄、2605…合図音数指定欄、2606…「作成」ボタン

【特許請求の範囲】
【請求項1】
複数の音声データ群と、
前記複数の音声データ群の再生手順を示す、リファレンスパターン管理テーブルと、
再生開始が自分或は相手であるかを示すフラグと
よりなる再生音声データ群と、
前記再生音声データ群の前記リファレンスパターン管理テーブルを読み込み、前記リファレンスパターン管理テーブルの記述と前記フラグに基づいて、前記複数の音声データ群を再生手順の時系列に表示するリファレンスパターン表示エリアを表示する表示部と、
前記再生音声データ群の前記リファレンスパターン管理テーブルに基づいて前記複数の音声データ群を再生する再生部と
を備えることを特徴とする音声データ再生装置。
【請求項2】
前記表示部は更に、
複数の音声データの再生時間を相対的に示す長さの幅を備える、複数の模範練習パートと、
複数の音声データの再生時間を相対的に示す長さの幅を備え、前記模範練習パートとは形状、模様或は色彩の少なくとも一つ以上が異なる表示形態にて区別表示される、複数の応答パートと、
前記複数の模範練習パート及び応答パートが時系列に従って列挙表示される、リファレンスパターン表示エリアと
を表示するものであることを特徴とする請求項1記載の音声データ再生装置。
【請求項3】
前記再生音声データ群は更に、
前記複数の音声データ群の再生手順を前記リファレンスパターン管理テーブルと共に示す、入力パターン管理テーブルを備え、
前記表示部には更に、
前記再生音声データ群の前記リファレンスパターン管理テーブル及び前記入力パターン管理テーブル及び前記フラグを読み込み、前記リファレンスパターン管理テーブル及び前記入力パターン管理テーブル及び前記フラグの記述に基づいて前記複数の音声データ群を再生手順の時系列に表示する入力パターン表示エリアが表示されることを特徴とする、請求項1記載の音声データ再生装置。
【請求項4】
コンピュータを、
複数の音声データ群と、
前記複数の音声データ群の再生手順を示す、リファレンスパターン管理テーブルと、
再生開始が自分或は相手であるかを示すフラグと
よりなる再生音声データ群と、
前記再生音声データ群の前記リファレンスパターン管理テーブルを読み込み、前記リファレンスパターン管理テーブルの記述と前記フラグに基づいて、前記複数の音声データ群を再生手順の時系列に表示するリファレンスパターン表示エリアを表示する表示部と、
前記再生音声データ群の前記リファレンスパターン管理テーブルに基づいて前記複数の音声データ群を再生する再生部
として機能させるための音声データ再生プログラム。
【請求項5】
前記表示部は更に、
複数の音声データの再生時間を相対的に示す長さの幅を備える、複数の模範練習パートと、
複数の音声データの再生時間を相対的に示す長さの幅を備え、前記模範練習パートとは形状、模様或は色彩の少なくとも一つ以上が異なる表示形態にて区別表示される、複数の応答パートと、
前記複数の模範練習パート及び応答パートが時系列に従って列挙表示される、リファレンスパターン表示エリアと
を表示するものであることを特徴とする請求項4記載の音声データ再生プログラム。
【請求項6】
前記再生音声データ群は更に、
前記複数の音声データ群の再生手順を前記リファレンスパターン管理テーブルと共に示す、入力パターン管理テーブルを備え、
前記表示部には更に、
前記再生音声データ群の前記リファレンスパターン管理テーブル及び前記入力パターン管理テーブル及び前記フラグを読み込み、前記リファレンスパターン管理テーブル及び前記入力パターン管理テーブル及び前記フラグの記述に基づいて前記複数の音声データ群を再生手順の時系列に表示する入力パターン表示エリアが表示されることを特徴とする、請求項4記載の音声データ再生プログラム。
【請求項7】
自己側に属する練習パートと相手側に属する応答パートに分類される複数の音声データ群を交互に再生する手順を示すリファレンスパターン管理テーブルと、
前記自己側に属する練習パートに対応して録音される録音パートと前記相手側に属する応答パートに分類される複数の音声データ群を交互に再生する手順を示す入力パターン管理テーブルと、
前記入力パターン管理テーブルの記述に従い、前記相手側に属する応答パートを再生する再生部と、
前記入力パターン管理テーブルの記述に従い、録音して作成した音声データを前記録音パートに加える録音部と
を備えることを特徴とする練習装置。
【請求項8】
更に、前記練習パートに属する音声データと、対応する前記録音パートに属する音声データとの音声波形の類似度を計算する類似度計算部を有することを特徴とする請求項7記載の練習装置。
【請求項9】
前記制御部は、前記入力パターン管理テーブルの記述に従い、
前記再生部が前記応答パートに属する音声データの再生を終了したことに呼応して、前記録音部に前記録音パートに属する音声データの録音を指示すると共に、
前記録音パートの録音中に所定の制御信号に呼応して、前記再生部に前記応答パートに属する音声データの再生を指示することを特徴とする、請求項7記載の練習装置。
【請求項10】
更に、前記制御部が前記リファレンスパターン管理テーブル或は前記入力パターン管理テーブルの記述に従い、前記再生部を制御して、前記音声データ群の再生を実行している間に、現在再生中の音声データの再生時間及び前記リファレンスパターン管理テーブル或は前記入力パターン管理テーブルの先頭からの総再生時間を表示する時間表示部を有することを特徴とする、請求項7記載の練習装置。
【請求項11】
更に、前記制御部が前記リファレンスパターン管理テーブルの記述に従い、前記録音部を制御して、前記練習パート及び前記応答パートの録音を実行している間に、現在録音中のパートの再生時間及び前記リファレンスパターン管理テーブルの先頭からの総録音時間を表示する時間表示部を有することを特徴とする、請求項7記載の練習装置。
【請求項12】
更に、前記制御部が前記入力パターン管理テーブルの記述に従い、前記録音部及び前記再生部を制御して、前記録音パートの録音と前記応答パートの再生を実行している間に、現在録音中のパート或は現在再生中のパートの再生時間及び前記入力パターン管理テーブルの先頭からの総経過時間を表示する時間表示部を有することを特徴とする、請求項7記載の練習装置。
【請求項13】
更に、前記リファレンスパターン管理テーブルの記述に従い、前記練習パート及び前記応答パートに属する音声データを連結して単一の音声データファイルを作成する音声データ作成部を有することを特徴とする、請求項7記載の練習装置。
【請求項14】
前記音声データ作成部は、
全パートの音声をモノラルにて連結する第1の音声データファイル作成モードと、
前記練習パートと前記応答パートをステレオの左右に振り分けて連結する第2の音声データファイル作成モードと、
前記練習パートの音声を無音に代えて前記応答パートと連結する第3の音声データファイル作成モードと
を有することを特徴とする、請求項13記載の練習装置。
【請求項15】
前記再生部は、前記応答パートに属する音声データの再生速度を可変できることを特徴とする、請求項7記載の練習装置。
【請求項16】
前記制御部は、前記録音パートの一を指定して、対応する前記練習パートに音声データを上書きする機能を有することを特徴とする、請求項7記載の練習装置。
【請求項17】
前記制御部は、前記リファレンスパターン管理テーブル及び前記入力パターン管理テーブル上の任意のパートを指定して、別の任意のパートへ音声データを複写する機能を有することを特徴とする、請求項7記載の練習装置。
【請求項18】
更に、前記入力パターン管理テーブルに基づいて練習を実施する際、前記録音パートの録音と平行して、入力する音声のテキストを表示するテキスト表示部を有することを特徴とする、請求項7記載の練習装置。
【請求項19】
前記制御部は、前記リファレンスパターン管理テーブルの先頭が前記練習パートか前記応答パートかを指定する機能を有することを特徴とする、請求項7記載の練習装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate


【公開番号】特開2008−134455(P2008−134455A)
【公開日】平成20年6月12日(2008.6.12)
【国際特許分類】
【出願番号】特願2006−320648(P2006−320648)
【出願日】平成18年11月28日(2006.11.28)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】