コンテンツ再生装置
【課題】コンテンツ再生中に選択された場面を繰返して再生できるようにするとともに、選択された場面の次の場面へ円滑に移行できるようにする。
【解決手段】コンテンツ再生装置は、キー231が押下されると、発音練習モードへ移行し、キーが押下された時に表示されている字幕の再生が終了するまで映像と字幕および音声の再生を行う。RAM104には、キーが押下された時に再生されていた字幕の再生開始時刻を示す時刻管理情報が記憶される。次にユーザがキー223を押下すると、RAM104に記憶されている、時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生を行う。そして、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する。コンテンツ再生装置は、キー230が押下されると通常再生モードへ移行し、RAM104に記憶されている時刻管理情報が示す再生開始時刻の場面から映像、音声及び字幕の再生を行う。
【解決手段】コンテンツ再生装置は、キー231が押下されると、発音練習モードへ移行し、キーが押下された時に表示されている字幕の再生が終了するまで映像と字幕および音声の再生を行う。RAM104には、キーが押下された時に再生されていた字幕の再生開始時刻を示す時刻管理情報が記憶される。次にユーザがキー223を押下すると、RAM104に記憶されている、時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生を行う。そして、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する。コンテンツ再生装置は、キー230が押下されると通常再生モードへ移行し、RAM104に記憶されている時刻管理情報が示す再生開始時刻の場面から映像、音声及び字幕の再生を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、記録媒体に記録されたコンテンツを利用して語学学習を行う技術に関する。
【背景技術】
【0002】
外国映画のセリフは外国語の日常会話を多く含んでいるため、外国映画を記録したビデオテープやDVD(Digital Versatile Disc)は、単に映画を楽しむためだけでなく語学学習の教材としても利用されている。特にDVDは、ビデオテープと比較して巻きもどしや早送り、繰返し再生等を容易に行うことができ、また、これらの動作を繰返し行ってもビデオテープのように記録媒体が劣化しない。このため、繰返し再生が頻繁に行われる語学学習用として注目されており、近年、DVDを利用して語学学習を行う技術も考案されている(例えば、特許文献1参照)。
【0003】
特許文献1には、映画のセリフのリストを表示し、選択されたセリフが発音される場面を再生するシステムが開示されている。このシステムにおいては、学習したいセリフが選択されると、そのセリフが再生される場面が頭出しされ、学習したいセリフの音声が再生される。このシステムにおいて、再生される映像に映画を使用すれば、日常会話等が自然な速さで発音されるので、この発音を聞いてシャドウイングやリスニングを行えば、効果的な語学学習を行うことができる。
【特許文献1】特開2001−22265号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、映画の字幕を利用して語学の学習を行う場合、映画を再生して楽しみつつ、覚えたいと思ったセリフを見つけた時には、そのセリフを繰返して再生し、シャドウイングやリスニングを繰返すというような学習方法も考えられる。しかしながら、特許文献1に開示されたシステムにおいては、練習したいセリフを見つけた場合、DVDの再生を停止して字幕のリストを表示させた後、リスト中から所望のセリフを検索し、リスト中のセリフを選択するという繁雑な操作を行わなければならず、すぐに発音の練習をすることができないという問題がある。また、練習を終了して、練習したセリフの場面から再び映画を楽しむ場合には、DVDを最初の場面から再生し、練習したセリフの場面まで早送りさせるという面倒な操作を行わなければならず、場面のつながりがなくなって映画を楽しむことができなくなってしまう。
【0005】
本発明は、上述した背景の下になされたものであり、その目的は、コンテンツの再生中に選択された場面を繰返して再生できるようにするとともに、選択された場面の次の場面へ円滑に移行できるようにすることにある。
【課題を解決するための手段】
【0006】
上述した課題を解決するために本発明は、映像と音声とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、前記読み出し手段により読み出されたコンテンツに含まれている映像および音声とを再生する再生手段と、第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、前記コンテンツ中の音声を解析し、前記コンテンツの再生中において人間の声が含まれる音声が再生される時間区間を特定する解析手段と、前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、前記解析手段により特定された時間区間であって、特定された時点を含む時間区間の開始時刻と終了時刻とを特定すると共に、前記第1モードから前記第2モードへ移行させる第1移行手段と、前記第1移行手段で特定された開始時刻から終了時刻までの間のコンテンツが再生されるように前記再生手段を制御する再生制御手段と、前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段とを有するコンテンツ再生装置を提供する。
【0007】
また、本発明は、映像と音声と複数の字幕とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、前記読み出し手段により読み出されたコンテンツに含まれている映像、音声および字幕とを再生する再生手段と、第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、前記読み出し手段により読み出されたコンテンツに含まれている複数の字幕画像の各再生開始時刻を解析する解析手段と、前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、この特定された時点で再生されている字幕画像の再生開始時刻を特定すると共に、第1モードから第2モードへ移行させる第1移行手段と、前記第1移行手段で特定された再生開始時刻からコンテンツが再生されるように、前記再生手段を制御し、前記再生開始時間から再生される字幕画像の再生が終了すると、コンテンツの再生が停止されるように前記再生手段を制御する再生制御手段と、前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された再生開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段とを有するコンテンツ再生装置を提供する。
【発明の効果】
【0008】
本発明によれば、コンテンツの再生中に選択された場面を繰返して再生できるようになり、また、選択された場面の次の場面へ円滑に移行することができる。
【発明を実施するための最良の形態】
【0009】
[第1実施形態]
[実施形態の構成]
以下、図面を参照して本発明の実施形態について説明する。図1は、本発明の実施形態に係るコンテンツ再生装置のハードウェア構成を示したブロック図である。図1に示したように、コンテンツ再生装置の各部は、バス101に接続されており、このバス101を介して各部間で信号やデータの授受を行う。
【0010】
光学ドライブ部109は、MPEG−2フォーマットに従ってDVDに記録されている映画コンテンツを読み出すものである。光学ドライブ部109はCPU102の制御の下、デジタルデータである映像データや音響データ、字幕データ等を含むパケットをDVDから読み出し、読み出したパケットを信号処理部107へ出力する。
信号処理部107は、光学ドライブ部109から出力されたパケットをデコードするものである。信号処理部107は、パケットに含まれている音響データをデコードし、音響データが表す音のアナログ信号(音響信号)を生成して音響再生部108と音声処理部110へ出力する。また、信号処理部107は、パケットに含まれている映像データと字幕データとをデコードし、これらのデータが示す画像の映像信号を生成して表示部106へ出力する。
【0011】
音響再生部108は、アンプおよびスピーカを備えており(いずれも図示略)、信号処理部107から出力された音響信号を増幅し、音響信号が表す音をスピーカから出力する。
表示部106は、例えば、液晶ディスプレイ等の表示デバイスを備えており、信号処理部107から出力された映像信号に従って、映像や字幕を表示する。また、表示部106はCPU102の制御の下、各種メッセージやコンテンツ再生装置を操作するためのメニュー画面等を表示する。
【0012】
入力部105は、図2に例示したように、ユーザの音声を電気信号に変換するマイクロホン201と、コンテンツ再生装置を操作するための各種キーとを備えている。マイクロホン201は、入力される音声に対応した電気信号(以下、音声信号と称する)を音声処理部110へ出力する。
キー210〜キー212は、DVDに記録されている映像・音声の再生、早送り、巻き戻しを行う際に使用されるキーである。キー210(プレイキー)が押下されると、CPU102により各部が制御され、DVDに記録されている映像や音声の再生が行われる。また、キー211(早送りキー)が押下されると映像や音声の早送り再生が行われ、キー212(巻き戻しキー)が押下されると映像や音声の巻き戻し再生が行われる。
キー230およびキー231は、DVDの再生のモードを切替える際に使用されるキーである。キー231(練習モードキー)は、DVDの再生モードを発音の練習を行う発音練習モード(第2モード)に移行させる際に使用され、キー230(通常再生モードキー)は、DVDの通常再生を行う通常再生モード(第1モード)に移行させる際に使用される。
キー221〜キー224は、ユーザが発音の練習を行う際に使用されるキーである。キー221(前文キー)およびキー222(次文キー)は、映像や字幕および音声の早送りや巻き戻しを行う際に使用される。また、キー223(再生キー)は、選択された場面の再生をする際に使用され、キー224(採点キー)は、コンテンツの音声と、ユーザの音声とを比較して、ユーザの音声を採点する際に使用される。
【0013】
音声処理部110は、マイクロホン201から出力された音声信号が表す音声と、信号処理部107から出力された音響信号が表す音声とを比較するものであり、比較結果をCPU102へ出力する。
ROM(Read Only Memory)103は、コンテンツ再生装置に各種機能を実現させる制御プログラムを記憶している。CPU102は、ROM103から制御プログラムを読出し、RAM(Random Access Memory)104を作業エリアとして制御プログラムを実行する。CPU102が制御プログラムを実行すると、DVDを再生する機能や、ユーザの音声とDVDに記録されている音声とを比較して比較結果を表示する機能等の各種機能がコンテンツ再生装置において実現する。
【0014】
[実施形態の動作]
次にコンテンツ再生装置の動作について説明する。
ユーザが字幕入りの映画コンテンツが記録されたDVDを光学ドライブ部109に挿入すると、DVDの再生モードが通常再生モードとなり、ユーザがキー210(プレイキー)を押下すると(図3:ステップSA1;YES)、DVDに記録されているコンテンツ(映像や字幕および音声)の再生が行われる(ステップSA2)。具体的には、CPU102によって光学ドライブ部109が制御され、映像データや音声データ、字幕データを含むパケットがDVDから読み出されて信号処理部107へ出力される。信号処理部107は、読み出されたパケットに含まれている音響データをデコードし、音響データが表す音に対応した音響信号を音響再生部108へ出力する。また、信号処理部107は、読み出されたパケットに含まれている映像データと字幕データとをデコードし、デコードされた画像を示す映像信号を表示部106へ出力する。映像信号が表示部106へ出力されると共に、音響信号が音響再生部108へ出力されると、音響データが表す音がスピーカから出力され、映像データが表す画像と字幕データが表す字幕とが表示部106に表示される。また、信号処理部107は、再生中の字幕画像と該字幕の再生開始時刻を示す時刻管理情報とをパケットから抽出し、この抽出した字幕と時刻管理情報とをRAM104に記憶する。
【0015】
再生モードが通常再生モードであるときにユーザがキー211(早送りキー)を押下すると(ステップSA3;YES)、CPU102によって光学ドライブ部109と信号処理部とが制御され、映像と字幕および音声の早送り再生が行われる(ステップSA4)。また、ユーザがキー212(巻き戻しキー)を押下すると(ステップSA5;YES)、映像と字幕および音声の巻き戻し再生が行われる(ステップSA6)。
【0016】
ユーザは、再生されている画像を視聴し、学習したいと思うセリフの字幕が表示された場合、キー231(練習モードキー)を押下する。CPU102は、キー231が押下されると、再生モードを通常再生モードから発音練習モードへ移行させる(図4:ステップSB1)。再生モードが発音練習モードに移行すると、CPU102により光学ドライブ部109と信号処理部107とが制御され、キー231が押下された時に表示されていた字幕の再生が終了するまで映像と字幕および音声の再生が行われる。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSB2)。ここでRAM104には、キー231が押下された時に再生されていた字幕の再生開始時刻を示す時刻管理情報が記憶される。
【0017】
再生モードが発音練習モードであるときにユーザがキー223(再生キー)を押下すると(図5:ステップSC7;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSC8)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC9)。この後、CPU102は、キー231が押下された時に表示されている字幕の再生が終了すると、光学ドライブ部109と信号処理部107とを制御して、映像と字幕および音声の再生を一時停止する(ステップSC10)。
【0018】
また、再生モードが発音練習モードであるときにユーザがキー224(採点キー)を押下すると(ステップSC11;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSC12)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC13)。ここで、音響信号は音声処理部110へも出力される。音声処理部110は、音響信号が入力されると、入力された音響信号をデジタル化し、発音の手本となる基準データとして一時記憶する。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSC14)。
【0019】
CPU102は、映像と字幕および音声の再生を一時停止させた後、表示部106を制御し、ユーザに発音を促すメッセージを表示する(ステップSC15)。このメッセージに促されてユーザが発音すると、ユーザの発した音声に対応した音声信号がマイクロホン201から音声処理部110へ出力される。音声処理部110は、マイクロホン201から出力された音声信号をデジタル化し、ユーザの発音を示すユーザデータとして一時記憶する。次に音声処理部110は、一時記憶されている基準データとユーザデータとを比較する。例えば、音声処理部110は、基準データが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換して手本となる音声のスペクトル包絡を得る。また、音声処理部110は、ユーザデータが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してユーザの音声のスペクトル包絡を得る。
【0020】
次に音声処理部110は、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡とを比較する。そして、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異が、予め決められたしきい値を超えた場合は、ユーザの発音が悪いものと判断し、予め決められたしきい値を超えていない場合には、ユーザの発音が良いものであると判断する。そして、判断結果を示す判断データをCPU102へ出力する。なお、基準データが表す音声とユーザデータが表す音声との差異は、例えば、特徴的なフォルマントの周波数とスペクトル密度とをスペクトル密度−周波数図に表したときの2点間の距離によって求めてもよいし、特定の周波数においてスペクトル密度を比較することによって求めてもよい。
【0021】
CPU102は、判断結果を示す判断データが入力されると(ステップSC16;YES)、入力された判断データに応じて基準データとユーザデータの比較結果を表示する(ステップSC17)。例えば、入力された判断データがユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「bad」というメッセージを表示し、ユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「good」というメッセージを表示する。ユーザは、学習したいと思うセリフを繰り返し練習する場合、再度キー224を押下する。キー224が押下されると、上述したステップSC12〜ステップSC17の処理が再度実行される。
【0022】
また、CPU102は、再生モードが発音練習モードであるときにキー221(前文キー)が押下されると(ステップSC1;YES)、RAM104に記憶されている時刻管理情報を読み出す(ステップSC2)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より前に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSC3)。この後、CPU102は、RAM104に記憶されている時刻管理情報を読み出し、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC9)。CPU102は、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSC10)。
【0023】
また、CPU102は、再生モードが発音練習モードであるときにキー222(次文キー)が押下されると(ステップSC4;YES)、RAM104に記憶されている時刻管理情報を読み出す(ステップSC5)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より後に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSC6)。この後、CPU102は、上述したステップSC9およびステップSC10の処理を行う。
【0024】
一方、再生モードが発音練習モードである時に、ユーザが発音の練習を終了するためにキー230(通常再生モードキー)を押下すると、CPU102は、再生モードを発音練習モードから通常再生モードへ移行させる(図6:ステップSD1)。そしてCPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSD2)、この時刻管理情報が示す再生開始時刻の場面から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSD3)。
【0025】
以上説明したように本実施形態によれば、発音練習モードに移行すると、再生中に選択された場面を繰返して再生することが可能となる。また、発音練習モードから通常再生モードに移行すると、発音練習を行っている場面から次の場面へスムーズに移行するので、映画を楽しみつつ、語学の練習を行うことができる。また、本実施形態によれば、映画コンテンツに含まれている音声を手本として、ユーザの発音をチェックすることができる。また、本実施形態では、一般に市販される映画コンテンツをそのまま語学学習の教材として使用することができるため、コンテンツを楽しみつつ、語学の学習を行うことができる。また、本実施形態では、DVDに記録されている音声を発音の基準とし、記録されている音声とユーザの音声とを比較するので、どのような言語であってもユーザの発音の良否を判断することができる。
【0026】
[第2実施形態]
次に本発明の第2実施形態について説明する。本発明の第2実施形態に係る再生装置は、信号処理部107の構成と、キー221,キー222,キー230,キー231が押下された時の動作が第1実施形態に係る再生装置と異なっている。
【0027】
本実施形態において、入力部105のキー221(前文キー)とキー222(次文キー)は、DVDに記録されている映像および音声の早送り、巻き戻しをDVDに記録されているコンテンツ中の音声単位で行う際に使用される。
【0028】
本実施形態に係る信号処理部107は、音響データをデコードして得られる音が人間の音声を含む音であるか、または人間の音声を含まない音であるか判別する。また、信号処理部107は、映像データや音響データを格納するバッファを備えている。DVDに記録されているデータは、先読みされて一端このバッファに格納された後、デコードされる。
【0029】
ROM103には、第1実施形態とは異なる制御プログラムが記憶されている。CPU102が制御プログラムを実行すると、DVDを再生する機能や、早送りや巻き戻しを行う機能、映画コンテンツ中の音声単位で映像および音声の早送りや巻き戻しを行う機能が実現する。
【0030】
[第2実施形態の動作]
次に、本実施形態の動作について説明する。なお、キー210〜キー212が押下された時の動作は第1実施形態と同じであるため、その説明を省略する。
【0031】
ユーザが映画コンテンツが記録されたDVDを光学ドライブ部109に挿入すると、DVDの再生モードが通常再生モードとなり、ユーザがキー210(プレイキー)を押下すると(図3:ステップSA1;YES)、DVDに記録されている映像および音声の再生が行われる(ステップSA2)。
【0032】
ここで、信号処理部107は、先読みされてバッファに記憶されている音響データをデコードし、音響データが表す音に対応した音響信号を生成する。信号処理部107は、音響信号をあらかじめ決められた時間(フレーム)毎に分割する。信号処理部107は、フレームに分解された音響信号が示す波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してフレームごとのスペクトル包絡を得る。信号処理部107は、こうして得られたスペクトル包絡から第1フォルマントおよび第2、第3フォルマントのフォルマント周波数を抽出する。そして、このフォルマント周波数を使用して、音響信号が表す音が人間の声であるか、無音または人間の声以外の音(例えば、BGM等のみの音の区間)であるか否かを判断し、人間の声を含まない音から人間の声を含む音への切り替わりと、人間の声を含む音から人間の声を含まない音への切り替わりを検知する。そして、映画コンテンツの再生時間軸上において、音響信号が表す音が人間の声を含む再生区間を検知し、音響信号が表す音が人間の声を含む再生区間の時間を、図10に示したようにRAM104の音声再生区間テーブルTB1に記憶する。
【0033】
例えば、図11に示したように、「00:05:30−00:05:50」の時間区間と、「00:06:05−00:06:45」の時間区間とで、人間の声が再生されることを検知すると、図10に示したように、音声再生区間テーブルTB1に「00:05:30−00:05:50」の時間区間と、「00:06:05−00:06:45」の時間区間とが格納される。ここで、音声再生区間テーブルTB1に格納されていない「00:05:51−00:06:04」の時間区間は、人間の声を含まない音の時間区間である。
【0034】
ユーザは、再生されているコンテンツを視聴し、学習したいと思うセリフが再生されている最中にキー231(練習モードキー)を押下する。CPU102は、キー231が押下されると、再生モードを通常再生モードから発音練習モードへ移行させる(図7:ステップSE1)。再生モードが発音練習モードに移行すると、CPU102は、DVDに記録されているコンテンツの再生時間軸上において、キー231が押下された時刻を特定する。そして、CPU102は、特定した時刻を含む時間区間を音声再生区間テーブルTB1から読み出してRAM104に設けられる時間区間格納領域に記憶するとともに、読み出した時間区間の終わりの時刻を抽出する。例えば、特定した時刻が「00:05:45」である場合、図10に示した音声再生区間テーブルTB1から「00:05:30−00:05:50」が読み出され、この時間区間がRAM104の時間区間格納領域に記憶される。また、時間区間の終わりの時刻として「00:05:50」が読み出される。
【0035】
次にCPU102は、光学ドライブ部109と信号処理部107とを制御し、時間区間格納領域に記憶された時間区間の終わりの時刻になるまで映像および音声の再生を行う。CPU102は、DVDの再生時刻が時間区間の終わりの時刻と一致すると、光学ドライブ部109と信号処理部107とを制御し、映像および音声の再生を一時停止する(ステップSE2)。
【0036】
再生モードが発音練習モードであるときにユーザがキー223(再生キー)を押下すると(図8:ステップSF5;YES)、CPU102は、時間区間格納領域に記憶された時間区間を参照し、この時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、時間区間格納領域に記憶された時間区間の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。例えば、時間区間格納領域に記憶された時間区間が「00:05:30−00:05:50」である場合、「00:05:30」から「00:05:50」の間の場面が再生される。
【0037】
また、再生モードが発音練習モードであるときにユーザがキー224(採点キー)を押下すると、CPU102は、時間区間格納領域に記憶されている時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する(ステップSF8)。そして、CPU102は、時間区間格納領域に記憶されている時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF9)。この後、CPU102は、第1実施形態のステップSC15〜ステップSC17の処理と同じ処理(ステップSF10〜ステップSF12)を行う。
【0038】
また、再生モードが発音練習モードであるときにユーザがキー221(前文キー)を押下すると(ステップSF1;YES)、CPU102は、時間区間格納領域に記憶されている時間区間より前の時間区間を音声再生区間テーブルTB1から読み出し、読み出した時間区間を時間区間格納領域に記憶する(ステップSF2)。例えば、時間区間格納領域に「00:06:05−00:06:45」が記憶されている場合、図10に示した音声再生区間テーブルTB1から「00:05:30−00:05:50」が読み出される。CPU102は時間区間の情報を読み出して記憶すると、この記憶した時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、この時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。
【0039】
また、再生モードが発音練習モードであるときにユーザがキー222(次文キー)を押下すると(ステップSF3;YES)、CPU102は、時間区間格納領域に記憶されている時間区間より後の時間区間を音声再生区間テーブルTB1から読み出し、読み出した時間区間を時間区間格納領域に記憶する(ステップSF4)。例えば、時間区間格納領域に「00:05:30−00:05:50」が記憶されている場合、図10に示した音声再生区間テーブルTB1から「00:06:05−00:06:45」が読み出される。CPU102は、時間区間の情報を読み出して記憶すると、この記憶した時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、読み出した時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。
【0040】
一方、再生モードが発音練習モードである時に、ユーザが発音の練習を終了するためにキー230(通常再生モードキー)を押下すると、CPU102は、再生モードを発音練習モードから通常再生モードへ移行させる(図9:ステップSG1)。そしてCPU102は、RAM104の時間区間格納領域に記憶されている時間区間を読み出し、この読み出した時間区間の始めの時刻から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSG2)。例えば、時間区間として「00:06:05−00:06:45」が読み出された場合、「00:06:05」の時点から映像および音声が再生される。
【0041】
以上説明したように、本実施形態においても、発音練習モードに移行すると、再生中に選択された場面を繰返して再生することが可能となる。また、発音練習モードから通常再生モードに移行すると、発音練習を行っている場面から次の場面へスムーズに移行するので、映画を楽しみつつ、語学の練習を行うことができる。
【0042】
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、以下に示すように、他の様々な形態で実施可能である。
【0043】
上述した実施形態においては、ユーザの発音が良い発音であるか否かを判断する際に用いるしきい値を、ユーザの操作によって変更できるようにしてもよい。また、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異に応じて、画面に表示するメッセージを異ならせるようにしてもよい。
【0044】
上述した実施形態においては、コンテンツ再生装置に外国語の辞書を記憶させ、画面に表示される字幕を文字認識し、表示部106に表示されている単語の意味を表示部106に表示させるようにしてもよい。
【0045】
上述した第2実施形態においては、人間の声が再生されていない時には、キー231(練習モードキー)の入力を受け付けないようにしてもよい。
【図面の簡単な説明】
【0046】
【図1】本発明の実施形態に係るコンテンツ再生装置のハードウェア構成を示したブロック図である。
【図2】同コンテンツ再生装置の入力部105が備えるマイクロホンとキーの配置を例示した図である。
【図3】CPU102が行う処理の流れを示したフローチャートである。
【図4】CPU102が行う処理の流れを示したフローチャートである。
【図5】CPU102が行う処理の流れを示したフローチャートである。
【図6】CPU102が行う処理の流れを示したフローチャートである。
【図7】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図8】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図9】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図10】音声再生区間テーブルTB1に格納された再生時刻を例示した図である。
【図11】第2実施形態の動作を説明するための図である。
【符号の説明】
【0047】
102・・・CPU、103・・・ROM、104・・・RAM、105・・・入力部、106・・・表示部、107・・・信号処理部、108・・・音響再生部、109・・・光学ドライブ部、110・・・音声処理部、201・・・マイクロホン。
【技術分野】
【0001】
本発明は、記録媒体に記録されたコンテンツを利用して語学学習を行う技術に関する。
【背景技術】
【0002】
外国映画のセリフは外国語の日常会話を多く含んでいるため、外国映画を記録したビデオテープやDVD(Digital Versatile Disc)は、単に映画を楽しむためだけでなく語学学習の教材としても利用されている。特にDVDは、ビデオテープと比較して巻きもどしや早送り、繰返し再生等を容易に行うことができ、また、これらの動作を繰返し行ってもビデオテープのように記録媒体が劣化しない。このため、繰返し再生が頻繁に行われる語学学習用として注目されており、近年、DVDを利用して語学学習を行う技術も考案されている(例えば、特許文献1参照)。
【0003】
特許文献1には、映画のセリフのリストを表示し、選択されたセリフが発音される場面を再生するシステムが開示されている。このシステムにおいては、学習したいセリフが選択されると、そのセリフが再生される場面が頭出しされ、学習したいセリフの音声が再生される。このシステムにおいて、再生される映像に映画を使用すれば、日常会話等が自然な速さで発音されるので、この発音を聞いてシャドウイングやリスニングを行えば、効果的な語学学習を行うことができる。
【特許文献1】特開2001−22265号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、映画の字幕を利用して語学の学習を行う場合、映画を再生して楽しみつつ、覚えたいと思ったセリフを見つけた時には、そのセリフを繰返して再生し、シャドウイングやリスニングを繰返すというような学習方法も考えられる。しかしながら、特許文献1に開示されたシステムにおいては、練習したいセリフを見つけた場合、DVDの再生を停止して字幕のリストを表示させた後、リスト中から所望のセリフを検索し、リスト中のセリフを選択するという繁雑な操作を行わなければならず、すぐに発音の練習をすることができないという問題がある。また、練習を終了して、練習したセリフの場面から再び映画を楽しむ場合には、DVDを最初の場面から再生し、練習したセリフの場面まで早送りさせるという面倒な操作を行わなければならず、場面のつながりがなくなって映画を楽しむことができなくなってしまう。
【0005】
本発明は、上述した背景の下になされたものであり、その目的は、コンテンツの再生中に選択された場面を繰返して再生できるようにするとともに、選択された場面の次の場面へ円滑に移行できるようにすることにある。
【課題を解決するための手段】
【0006】
上述した課題を解決するために本発明は、映像と音声とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、前記読み出し手段により読み出されたコンテンツに含まれている映像および音声とを再生する再生手段と、第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、前記コンテンツ中の音声を解析し、前記コンテンツの再生中において人間の声が含まれる音声が再生される時間区間を特定する解析手段と、前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、前記解析手段により特定された時間区間であって、特定された時点を含む時間区間の開始時刻と終了時刻とを特定すると共に、前記第1モードから前記第2モードへ移行させる第1移行手段と、前記第1移行手段で特定された開始時刻から終了時刻までの間のコンテンツが再生されるように前記再生手段を制御する再生制御手段と、前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段とを有するコンテンツ再生装置を提供する。
【0007】
また、本発明は、映像と音声と複数の字幕とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、前記読み出し手段により読み出されたコンテンツに含まれている映像、音声および字幕とを再生する再生手段と、第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、前記読み出し手段により読み出されたコンテンツに含まれている複数の字幕画像の各再生開始時刻を解析する解析手段と、前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、この特定された時点で再生されている字幕画像の再生開始時刻を特定すると共に、第1モードから第2モードへ移行させる第1移行手段と、前記第1移行手段で特定された再生開始時刻からコンテンツが再生されるように、前記再生手段を制御し、前記再生開始時間から再生される字幕画像の再生が終了すると、コンテンツの再生が停止されるように前記再生手段を制御する再生制御手段と、前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された再生開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段とを有するコンテンツ再生装置を提供する。
【発明の効果】
【0008】
本発明によれば、コンテンツの再生中に選択された場面を繰返して再生できるようになり、また、選択された場面の次の場面へ円滑に移行することができる。
【発明を実施するための最良の形態】
【0009】
[第1実施形態]
[実施形態の構成]
以下、図面を参照して本発明の実施形態について説明する。図1は、本発明の実施形態に係るコンテンツ再生装置のハードウェア構成を示したブロック図である。図1に示したように、コンテンツ再生装置の各部は、バス101に接続されており、このバス101を介して各部間で信号やデータの授受を行う。
【0010】
光学ドライブ部109は、MPEG−2フォーマットに従ってDVDに記録されている映画コンテンツを読み出すものである。光学ドライブ部109はCPU102の制御の下、デジタルデータである映像データや音響データ、字幕データ等を含むパケットをDVDから読み出し、読み出したパケットを信号処理部107へ出力する。
信号処理部107は、光学ドライブ部109から出力されたパケットをデコードするものである。信号処理部107は、パケットに含まれている音響データをデコードし、音響データが表す音のアナログ信号(音響信号)を生成して音響再生部108と音声処理部110へ出力する。また、信号処理部107は、パケットに含まれている映像データと字幕データとをデコードし、これらのデータが示す画像の映像信号を生成して表示部106へ出力する。
【0011】
音響再生部108は、アンプおよびスピーカを備えており(いずれも図示略)、信号処理部107から出力された音響信号を増幅し、音響信号が表す音をスピーカから出力する。
表示部106は、例えば、液晶ディスプレイ等の表示デバイスを備えており、信号処理部107から出力された映像信号に従って、映像や字幕を表示する。また、表示部106はCPU102の制御の下、各種メッセージやコンテンツ再生装置を操作するためのメニュー画面等を表示する。
【0012】
入力部105は、図2に例示したように、ユーザの音声を電気信号に変換するマイクロホン201と、コンテンツ再生装置を操作するための各種キーとを備えている。マイクロホン201は、入力される音声に対応した電気信号(以下、音声信号と称する)を音声処理部110へ出力する。
キー210〜キー212は、DVDに記録されている映像・音声の再生、早送り、巻き戻しを行う際に使用されるキーである。キー210(プレイキー)が押下されると、CPU102により各部が制御され、DVDに記録されている映像や音声の再生が行われる。また、キー211(早送りキー)が押下されると映像や音声の早送り再生が行われ、キー212(巻き戻しキー)が押下されると映像や音声の巻き戻し再生が行われる。
キー230およびキー231は、DVDの再生のモードを切替える際に使用されるキーである。キー231(練習モードキー)は、DVDの再生モードを発音の練習を行う発音練習モード(第2モード)に移行させる際に使用され、キー230(通常再生モードキー)は、DVDの通常再生を行う通常再生モード(第1モード)に移行させる際に使用される。
キー221〜キー224は、ユーザが発音の練習を行う際に使用されるキーである。キー221(前文キー)およびキー222(次文キー)は、映像や字幕および音声の早送りや巻き戻しを行う際に使用される。また、キー223(再生キー)は、選択された場面の再生をする際に使用され、キー224(採点キー)は、コンテンツの音声と、ユーザの音声とを比較して、ユーザの音声を採点する際に使用される。
【0013】
音声処理部110は、マイクロホン201から出力された音声信号が表す音声と、信号処理部107から出力された音響信号が表す音声とを比較するものであり、比較結果をCPU102へ出力する。
ROM(Read Only Memory)103は、コンテンツ再生装置に各種機能を実現させる制御プログラムを記憶している。CPU102は、ROM103から制御プログラムを読出し、RAM(Random Access Memory)104を作業エリアとして制御プログラムを実行する。CPU102が制御プログラムを実行すると、DVDを再生する機能や、ユーザの音声とDVDに記録されている音声とを比較して比較結果を表示する機能等の各種機能がコンテンツ再生装置において実現する。
【0014】
[実施形態の動作]
次にコンテンツ再生装置の動作について説明する。
ユーザが字幕入りの映画コンテンツが記録されたDVDを光学ドライブ部109に挿入すると、DVDの再生モードが通常再生モードとなり、ユーザがキー210(プレイキー)を押下すると(図3:ステップSA1;YES)、DVDに記録されているコンテンツ(映像や字幕および音声)の再生が行われる(ステップSA2)。具体的には、CPU102によって光学ドライブ部109が制御され、映像データや音声データ、字幕データを含むパケットがDVDから読み出されて信号処理部107へ出力される。信号処理部107は、読み出されたパケットに含まれている音響データをデコードし、音響データが表す音に対応した音響信号を音響再生部108へ出力する。また、信号処理部107は、読み出されたパケットに含まれている映像データと字幕データとをデコードし、デコードされた画像を示す映像信号を表示部106へ出力する。映像信号が表示部106へ出力されると共に、音響信号が音響再生部108へ出力されると、音響データが表す音がスピーカから出力され、映像データが表す画像と字幕データが表す字幕とが表示部106に表示される。また、信号処理部107は、再生中の字幕画像と該字幕の再生開始時刻を示す時刻管理情報とをパケットから抽出し、この抽出した字幕と時刻管理情報とをRAM104に記憶する。
【0015】
再生モードが通常再生モードであるときにユーザがキー211(早送りキー)を押下すると(ステップSA3;YES)、CPU102によって光学ドライブ部109と信号処理部とが制御され、映像と字幕および音声の早送り再生が行われる(ステップSA4)。また、ユーザがキー212(巻き戻しキー)を押下すると(ステップSA5;YES)、映像と字幕および音声の巻き戻し再生が行われる(ステップSA6)。
【0016】
ユーザは、再生されている画像を視聴し、学習したいと思うセリフの字幕が表示された場合、キー231(練習モードキー)を押下する。CPU102は、キー231が押下されると、再生モードを通常再生モードから発音練習モードへ移行させる(図4:ステップSB1)。再生モードが発音練習モードに移行すると、CPU102により光学ドライブ部109と信号処理部107とが制御され、キー231が押下された時に表示されていた字幕の再生が終了するまで映像と字幕および音声の再生が行われる。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSB2)。ここでRAM104には、キー231が押下された時に再生されていた字幕の再生開始時刻を示す時刻管理情報が記憶される。
【0017】
再生モードが発音練習モードであるときにユーザがキー223(再生キー)を押下すると(図5:ステップSC7;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSC8)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC9)。この後、CPU102は、キー231が押下された時に表示されている字幕の再生が終了すると、光学ドライブ部109と信号処理部107とを制御して、映像と字幕および音声の再生を一時停止する(ステップSC10)。
【0018】
また、再生モードが発音練習モードであるときにユーザがキー224(採点キー)を押下すると(ステップSC11;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSC12)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC13)。ここで、音響信号は音声処理部110へも出力される。音声処理部110は、音響信号が入力されると、入力された音響信号をデジタル化し、発音の手本となる基準データとして一時記憶する。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSC14)。
【0019】
CPU102は、映像と字幕および音声の再生を一時停止させた後、表示部106を制御し、ユーザに発音を促すメッセージを表示する(ステップSC15)。このメッセージに促されてユーザが発音すると、ユーザの発した音声に対応した音声信号がマイクロホン201から音声処理部110へ出力される。音声処理部110は、マイクロホン201から出力された音声信号をデジタル化し、ユーザの発音を示すユーザデータとして一時記憶する。次に音声処理部110は、一時記憶されている基準データとユーザデータとを比較する。例えば、音声処理部110は、基準データが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換して手本となる音声のスペクトル包絡を得る。また、音声処理部110は、ユーザデータが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してユーザの音声のスペクトル包絡を得る。
【0020】
次に音声処理部110は、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡とを比較する。そして、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異が、予め決められたしきい値を超えた場合は、ユーザの発音が悪いものと判断し、予め決められたしきい値を超えていない場合には、ユーザの発音が良いものであると判断する。そして、判断結果を示す判断データをCPU102へ出力する。なお、基準データが表す音声とユーザデータが表す音声との差異は、例えば、特徴的なフォルマントの周波数とスペクトル密度とをスペクトル密度−周波数図に表したときの2点間の距離によって求めてもよいし、特定の周波数においてスペクトル密度を比較することによって求めてもよい。
【0021】
CPU102は、判断結果を示す判断データが入力されると(ステップSC16;YES)、入力された判断データに応じて基準データとユーザデータの比較結果を表示する(ステップSC17)。例えば、入力された判断データがユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「bad」というメッセージを表示し、ユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「good」というメッセージを表示する。ユーザは、学習したいと思うセリフを繰り返し練習する場合、再度キー224を押下する。キー224が押下されると、上述したステップSC12〜ステップSC17の処理が再度実行される。
【0022】
また、CPU102は、再生モードが発音練習モードであるときにキー221(前文キー)が押下されると(ステップSC1;YES)、RAM104に記憶されている時刻管理情報を読み出す(ステップSC2)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より前に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSC3)。この後、CPU102は、RAM104に記憶されている時刻管理情報を読み出し、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSC9)。CPU102は、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSC10)。
【0023】
また、CPU102は、再生モードが発音練習モードであるときにキー222(次文キー)が押下されると(ステップSC4;YES)、RAM104に記憶されている時刻管理情報を読み出す(ステップSC5)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より後に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSC6)。この後、CPU102は、上述したステップSC9およびステップSC10の処理を行う。
【0024】
一方、再生モードが発音練習モードである時に、ユーザが発音の練習を終了するためにキー230(通常再生モードキー)を押下すると、CPU102は、再生モードを発音練習モードから通常再生モードへ移行させる(図6:ステップSD1)。そしてCPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSD2)、この時刻管理情報が示す再生開始時刻の場面から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSD3)。
【0025】
以上説明したように本実施形態によれば、発音練習モードに移行すると、再生中に選択された場面を繰返して再生することが可能となる。また、発音練習モードから通常再生モードに移行すると、発音練習を行っている場面から次の場面へスムーズに移行するので、映画を楽しみつつ、語学の練習を行うことができる。また、本実施形態によれば、映画コンテンツに含まれている音声を手本として、ユーザの発音をチェックすることができる。また、本実施形態では、一般に市販される映画コンテンツをそのまま語学学習の教材として使用することができるため、コンテンツを楽しみつつ、語学の学習を行うことができる。また、本実施形態では、DVDに記録されている音声を発音の基準とし、記録されている音声とユーザの音声とを比較するので、どのような言語であってもユーザの発音の良否を判断することができる。
【0026】
[第2実施形態]
次に本発明の第2実施形態について説明する。本発明の第2実施形態に係る再生装置は、信号処理部107の構成と、キー221,キー222,キー230,キー231が押下された時の動作が第1実施形態に係る再生装置と異なっている。
【0027】
本実施形態において、入力部105のキー221(前文キー)とキー222(次文キー)は、DVDに記録されている映像および音声の早送り、巻き戻しをDVDに記録されているコンテンツ中の音声単位で行う際に使用される。
【0028】
本実施形態に係る信号処理部107は、音響データをデコードして得られる音が人間の音声を含む音であるか、または人間の音声を含まない音であるか判別する。また、信号処理部107は、映像データや音響データを格納するバッファを備えている。DVDに記録されているデータは、先読みされて一端このバッファに格納された後、デコードされる。
【0029】
ROM103には、第1実施形態とは異なる制御プログラムが記憶されている。CPU102が制御プログラムを実行すると、DVDを再生する機能や、早送りや巻き戻しを行う機能、映画コンテンツ中の音声単位で映像および音声の早送りや巻き戻しを行う機能が実現する。
【0030】
[第2実施形態の動作]
次に、本実施形態の動作について説明する。なお、キー210〜キー212が押下された時の動作は第1実施形態と同じであるため、その説明を省略する。
【0031】
ユーザが映画コンテンツが記録されたDVDを光学ドライブ部109に挿入すると、DVDの再生モードが通常再生モードとなり、ユーザがキー210(プレイキー)を押下すると(図3:ステップSA1;YES)、DVDに記録されている映像および音声の再生が行われる(ステップSA2)。
【0032】
ここで、信号処理部107は、先読みされてバッファに記憶されている音響データをデコードし、音響データが表す音に対応した音響信号を生成する。信号処理部107は、音響信号をあらかじめ決められた時間(フレーム)毎に分割する。信号処理部107は、フレームに分解された音響信号が示す波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してフレームごとのスペクトル包絡を得る。信号処理部107は、こうして得られたスペクトル包絡から第1フォルマントおよび第2、第3フォルマントのフォルマント周波数を抽出する。そして、このフォルマント周波数を使用して、音響信号が表す音が人間の声であるか、無音または人間の声以外の音(例えば、BGM等のみの音の区間)であるか否かを判断し、人間の声を含まない音から人間の声を含む音への切り替わりと、人間の声を含む音から人間の声を含まない音への切り替わりを検知する。そして、映画コンテンツの再生時間軸上において、音響信号が表す音が人間の声を含む再生区間を検知し、音響信号が表す音が人間の声を含む再生区間の時間を、図10に示したようにRAM104の音声再生区間テーブルTB1に記憶する。
【0033】
例えば、図11に示したように、「00:05:30−00:05:50」の時間区間と、「00:06:05−00:06:45」の時間区間とで、人間の声が再生されることを検知すると、図10に示したように、音声再生区間テーブルTB1に「00:05:30−00:05:50」の時間区間と、「00:06:05−00:06:45」の時間区間とが格納される。ここで、音声再生区間テーブルTB1に格納されていない「00:05:51−00:06:04」の時間区間は、人間の声を含まない音の時間区間である。
【0034】
ユーザは、再生されているコンテンツを視聴し、学習したいと思うセリフが再生されている最中にキー231(練習モードキー)を押下する。CPU102は、キー231が押下されると、再生モードを通常再生モードから発音練習モードへ移行させる(図7:ステップSE1)。再生モードが発音練習モードに移行すると、CPU102は、DVDに記録されているコンテンツの再生時間軸上において、キー231が押下された時刻を特定する。そして、CPU102は、特定した時刻を含む時間区間を音声再生区間テーブルTB1から読み出してRAM104に設けられる時間区間格納領域に記憶するとともに、読み出した時間区間の終わりの時刻を抽出する。例えば、特定した時刻が「00:05:45」である場合、図10に示した音声再生区間テーブルTB1から「00:05:30−00:05:50」が読み出され、この時間区間がRAM104の時間区間格納領域に記憶される。また、時間区間の終わりの時刻として「00:05:50」が読み出される。
【0035】
次にCPU102は、光学ドライブ部109と信号処理部107とを制御し、時間区間格納領域に記憶された時間区間の終わりの時刻になるまで映像および音声の再生を行う。CPU102は、DVDの再生時刻が時間区間の終わりの時刻と一致すると、光学ドライブ部109と信号処理部107とを制御し、映像および音声の再生を一時停止する(ステップSE2)。
【0036】
再生モードが発音練習モードであるときにユーザがキー223(再生キー)を押下すると(図8:ステップSF5;YES)、CPU102は、時間区間格納領域に記憶された時間区間を参照し、この時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、時間区間格納領域に記憶された時間区間の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。例えば、時間区間格納領域に記憶された時間区間が「00:05:30−00:05:50」である場合、「00:05:30」から「00:05:50」の間の場面が再生される。
【0037】
また、再生モードが発音練習モードであるときにユーザがキー224(採点キー)を押下すると、CPU102は、時間区間格納領域に記憶されている時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する(ステップSF8)。そして、CPU102は、時間区間格納領域に記憶されている時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF9)。この後、CPU102は、第1実施形態のステップSC15〜ステップSC17の処理と同じ処理(ステップSF10〜ステップSF12)を行う。
【0038】
また、再生モードが発音練習モードであるときにユーザがキー221(前文キー)を押下すると(ステップSF1;YES)、CPU102は、時間区間格納領域に記憶されている時間区間より前の時間区間を音声再生区間テーブルTB1から読み出し、読み出した時間区間を時間区間格納領域に記憶する(ステップSF2)。例えば、時間区間格納領域に「00:06:05−00:06:45」が記憶されている場合、図10に示した音声再生区間テーブルTB1から「00:05:30−00:05:50」が読み出される。CPU102は時間区間の情報を読み出して記憶すると、この記憶した時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、この時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。
【0039】
また、再生モードが発音練習モードであるときにユーザがキー222(次文キー)を押下すると(ステップSF3;YES)、CPU102は、時間区間格納領域に記憶されている時間区間より後の時間区間を音声再生区間テーブルTB1から読み出し、読み出した時間区間を時間区間格納領域に記憶する(ステップSF4)。例えば、時間区間格納領域に「00:05:30−00:05:50」が記憶されている場合、図10に示した音声再生区間テーブルTB1から「00:06:05−00:06:45」が読み出される。CPU102は、時間区間の情報を読み出して記憶すると、この記憶した時間区間の場面が再生されるように、光学ドライブ部109および信号処理部107を制御する。そして、CPU102は、読み出した時間区間の場面の再生が終了すると、映像および音声の再生を一時停止する(ステップSF6)。
【0040】
一方、再生モードが発音練習モードである時に、ユーザが発音の練習を終了するためにキー230(通常再生モードキー)を押下すると、CPU102は、再生モードを発音練習モードから通常再生モードへ移行させる(図9:ステップSG1)。そしてCPU102は、RAM104の時間区間格納領域に記憶されている時間区間を読み出し、この読み出した時間区間の始めの時刻から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSG2)。例えば、時間区間として「00:06:05−00:06:45」が読み出された場合、「00:06:05」の時点から映像および音声が再生される。
【0041】
以上説明したように、本実施形態においても、発音練習モードに移行すると、再生中に選択された場面を繰返して再生することが可能となる。また、発音練習モードから通常再生モードに移行すると、発音練習を行っている場面から次の場面へスムーズに移行するので、映画を楽しみつつ、語学の練習を行うことができる。
【0042】
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、以下に示すように、他の様々な形態で実施可能である。
【0043】
上述した実施形態においては、ユーザの発音が良い発音であるか否かを判断する際に用いるしきい値を、ユーザの操作によって変更できるようにしてもよい。また、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異に応じて、画面に表示するメッセージを異ならせるようにしてもよい。
【0044】
上述した実施形態においては、コンテンツ再生装置に外国語の辞書を記憶させ、画面に表示される字幕を文字認識し、表示部106に表示されている単語の意味を表示部106に表示させるようにしてもよい。
【0045】
上述した第2実施形態においては、人間の声が再生されていない時には、キー231(練習モードキー)の入力を受け付けないようにしてもよい。
【図面の簡単な説明】
【0046】
【図1】本発明の実施形態に係るコンテンツ再生装置のハードウェア構成を示したブロック図である。
【図2】同コンテンツ再生装置の入力部105が備えるマイクロホンとキーの配置を例示した図である。
【図3】CPU102が行う処理の流れを示したフローチャートである。
【図4】CPU102が行う処理の流れを示したフローチャートである。
【図5】CPU102が行う処理の流れを示したフローチャートである。
【図6】CPU102が行う処理の流れを示したフローチャートである。
【図7】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図8】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図9】第2実施形態に係わるCPU102が行う処理の流れを示したフローチャートである。
【図10】音声再生区間テーブルTB1に格納された再生時刻を例示した図である。
【図11】第2実施形態の動作を説明するための図である。
【符号の説明】
【0047】
102・・・CPU、103・・・ROM、104・・・RAM、105・・・入力部、106・・・表示部、107・・・信号処理部、108・・・音響再生部、109・・・光学ドライブ部、110・・・音声処理部、201・・・マイクロホン。
【特許請求の範囲】
【請求項1】
映像と音声とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、
前記読み出し手段により読み出されたコンテンツに含まれている映像および音声とを再生する再生手段と、
第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、
前記コンテンツ中の音声を解析し、前記コンテンツの再生中において人間の声が含まれる音声が再生される時間区間を特定する解析手段と、
前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、前記解析手段により特定された時間区間であって、特定された時点を含む時間区間の開始時刻と終了時刻とを特定すると共に、前記第1モードから前記第2モードへ移行させる第1移行手段と、
前記第1移行手段で特定された開始時刻から終了時刻までの間のコンテンツが再生されるように前記再生手段を制御する再生制御手段と、
前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段と
を有するコンテンツ再生装置。
【請求項2】
映像と音声と複数の字幕とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、
前記読み出し手段により読み出されたコンテンツに含まれている映像、音声および字幕とを再生する再生手段と、
第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、
前記読み出し手段により読み出されたコンテンツに含まれている複数の字幕画像の各再生開始時刻を解析する解析手段と、
前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、この特定された時点で再生されている字幕画像の再生開始時刻を特定すると共に、第1モードから第2モードへ移行させる第1移行手段と、
前記第1移行手段で特定された再生開始時刻からコンテンツが再生されるように、前記再生手段を制御し、前記再生開始時間から再生される字幕画像の再生が終了すると、コンテンツの再生が停止されるように前記再生手段を制御する再生制御手段と、
前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された再生開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段と
を有するコンテンツ再生装置。
【請求項1】
映像と音声とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、
前記読み出し手段により読み出されたコンテンツに含まれている映像および音声とを再生する再生手段と、
第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、
前記コンテンツ中の音声を解析し、前記コンテンツの再生中において人間の声が含まれる音声が再生される時間区間を特定する解析手段と、
前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、前記解析手段により特定された時間区間であって、特定された時点を含む時間区間の開始時刻と終了時刻とを特定すると共に、前記第1モードから前記第2モードへ移行させる第1移行手段と、
前記第1移行手段で特定された開始時刻から終了時刻までの間のコンテンツが再生されるように前記再生手段を制御する再生制御手段と、
前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段と
を有するコンテンツ再生装置。
【請求項2】
映像と音声と複数の字幕とを含むコンテンツが記録された記録媒体から該コンテンツを読み出す読み出し手段と、
前記読み出し手段により読み出されたコンテンツに含まれている映像、音声および字幕とを再生する再生手段と、
第1モードから第2モードへの移行を指示する第1移行指示と、前記第2モードから前記第1モードへの移行を指示する第2移行指示とが入力される指示入力手段と、
前記読み出し手段により読み出されたコンテンツに含まれている複数の字幕画像の各再生開始時刻を解析する解析手段と、
前記コンテンツの再生時間軸上において前記指示入力手段に前記第1移行指示が入力された時点を特定し、この特定された時点で再生されている字幕画像の再生開始時刻を特定すると共に、第1モードから第2モードへ移行させる第1移行手段と、
前記第1移行手段で特定された再生開始時刻からコンテンツが再生されるように、前記再生手段を制御し、前記再生開始時間から再生される字幕画像の再生が終了すると、コンテンツの再生が停止されるように前記再生手段を制御する再生制御手段と、
前記第2モードである時に、前記指示入力手段に前記第2移行指示が入力された場合、前記第2モードから前記第1モードへ移行させると共に、前記第1移行手段で特定された再生開始時刻から前記コンテンツが再生されるように前記再生手段を制御する第2移行手段と
を有するコンテンツ再生装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2007−149163(P2007−149163A)
【公開日】平成19年6月14日(2007.6.14)
【国際特許分類】
【出願番号】特願2005−338674(P2005−338674)
【出願日】平成17年11月24日(2005.11.24)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
【公開日】平成19年6月14日(2007.6.14)
【国際特許分類】
【出願日】平成17年11月24日(2005.11.24)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
[ Back to top ]