表示制御装置
【課題】歌唱者、観客などの人の挙動に応じた演出を、楽曲の進行に伴って表示される歌唱者に対応する画像に対してリアルタイムに施すこと。
【解決手段】本発明の実施形態におけるカラオケ装置1は、カラオケの歌唱中に歌唱者を撮影し、歌唱者の画像を表示画面300に表示させる。カラオケ装置1は、さらに、歌唱者の歌唱の巧拙を評価値として算出し、評価値に応じて歌唱者の画像の大きさを決定し、表示画面300に表示される歌唱者の画像の大きさを変化させるように表示制御を行う。また、カラオケ装置1は、デュエット曲など2人の歌唱者による歌唱においては、双方の評価値の比に応じて、2人の歌唱者の画像の大きさを変化させるように表示制御を行う。
【解決手段】本発明の実施形態におけるカラオケ装置1は、カラオケの歌唱中に歌唱者を撮影し、歌唱者の画像を表示画面300に表示させる。カラオケ装置1は、さらに、歌唱者の歌唱の巧拙を評価値として算出し、評価値に応じて歌唱者の画像の大きさを決定し、表示画面300に表示される歌唱者の画像の大きさを変化させるように表示制御を行う。また、カラオケ装置1は、デュエット曲など2人の歌唱者による歌唱においては、双方の評価値の比に応じて、2人の歌唱者の画像の大きさを変化させるように表示制御を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱中に表示される内容を制御する技術に関する。
【背景技術】
【0002】
近年、カラオケ装置は、歌唱者を撮影するカメラを有しているものがある。このカメラによって撮影された歌唱者の画像は、歌唱中に表示される背景、歌詞テロップなどの画像に合成されて表示画面に表示される。このような技術は、例えば、特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−2732号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された技術によれば、歌唱者およびその観客は、表示画面に表示される歌唱者の画像を見ることができ、歌唱者の画像が表示されない場合に比べて観客も楽しむことができる。しかしながら、表示画面における表示内容は、歌唱者の画像が追加して表示されただけで、画面全体としては単調なものである。そのため、歌唱者および観客は、その場の雰囲気がどのような状況であっても同じような態様での表示が続くことで、その表示内容に飽きてしまうものであった。
本発明は、上述した事情に鑑みてなされたものであり、歌唱者、観客などの人の挙動に応じた演出を、楽曲の進行に伴って表示される歌唱者に対応する画像に対してリアルタイムに施すことを目的とする。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、楽曲データを再生して、当該楽曲データが示す音を放音手段から放音させる再生手段と、前記楽曲データの再生中に前記放音手段の放音範囲に位置する人の挙動を検出する検出手段と、前記挙動の検出対象となる人に対応付けられた対応画像を示す画像データを取得する画像取得手段と、前記楽曲データの再生中において表示画面に表示させる前記対応画像の表示態様を、前記検出された結果に基づいて決定する決定手段と、前記取得された画像データを用いて、前記対応画像を前記決定された表示態様で前記表示画面に表示させる表示制御手段とを具備することを特徴とする表示制御装置を提供する。
【0006】
また、別の好ましい態様において、前記放音範囲の少なくとも一部を撮影して、撮影画像を示す画像データを出力する撮影手段をさらに具備し、前記画像取得手段は、前記撮影手段から出力される画像データを、前記対応画像を示す画像データとして取得することを特徴とする。
【0007】
また、別の好ましい態様において、前記放音範囲の人の位置を特定する位置特定手段をさらに具備し、前記撮影手段は、前記特定された位置に応じて撮影範囲を決定することを特徴とする。
【0008】
また、別の好ましい態様において、前記検出手段は、前記放音範囲に位置する複数の人の各々の挙動を検出し、前記画像取得手段は、前記複数の人の各々に対応して、前記対応画像を示す画像データを取得し、前記決定手段は、前記各人について前記検出された結果の相対的な関係に基づいて、前記各人に対応する前記対応画像の表示態様を決定することを特徴とする。
【0009】
また、別の好ましい態様において、前記検出手段は、前記放音範囲に位置する人によって入力される歌唱音声を、前記挙動として検出し、前記決定手段は、前記歌唱音声を解析して評価値を算出し、算出した評価値に基づいて前記表示態様を決定することを特徴とする。
【発明の効果】
【0010】
本発明によれば、歌唱者、観客などの人の挙動に応じた演出を、楽曲の進行に伴って表示される歌唱者に対応する画像に対してリアルタイムに施すことができる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態におけるカラオケ装置の構成を説明するブロック図である。
【図2】本発明の実施形態におけるカラオケ装置が設置された部屋を説明する図である。
【図3】本発明の実施形態における表示制御機能の構成を説明する機能ブロック図である。
【図4】本発明の実施形態における歌唱練習モードにおける表示画面の表示態様を説明する図である。
【図5】本発明の実施形態におけるデュエットバトルモードにおける表示画面の表示態様を説明する図である。
【図6】本発明の実施形態における客席対抗モードにおける表示画面の表示態様を説明する図である。
【図7】本発明の変形例1における表示制御機能の構成を説明する機能ブロック図である。
【図8】本発明の変形例3における表示制御機能の構成を説明する機能ブロック図である。
【発明を実施するための形態】
【0012】
<実施形態>
[ハードウエア構成]
図1は、本発明の実施形態におけるカラオケ装置1の構成を説明するブロック図である。カラオケ装置1は、歌唱者または観客(以下、総称して参加者という)によって指示された表示モードに応じて、参加者の各々に対応付けられる画像(以下、対応画像という)を、背景画像および歌詞テロップなどに合成して表示画面300に表示させる。対応画像は、この例においては、撮影された歌唱者の画像、または、歌唱者などを擬似したキャラクタ(以下、アバターという)の画像であり、歌唱者によっていずれにするかが指示される。なお、後述するように、対応画像に対応付けられた参加者は、対応画像を変化させるために挙動が検出される対象となる人であり、対応画像が表す歌唱者とは一致しない場合がある。
【0013】
また、カラオケ装置1は、参加者によって指示された表示モードに応じた態様で、楽曲データの再生中に表示画面300に表示される対応画像の大きさを変化させる。なお、表示モードとしては、歌唱練習モード、デュエットバトルモード、および客席対抗モードが存在する。詳細の内容については後述する。まず、カラオケ装置1のハードウエア構成について説明する。
【0014】
カラオケ装置1は、制御部10、操作部20、表示部30、通信部40、記憶部50、音響処理部60、画像処理部70を有する。これらの各構成は、バスを介して接続されている。また、カラオケ装置1は、音響処理部60に接続されたスピーカ61および3つのマイクロフォン621、622、623、および画像処理部70に接続された3台のカメラ721、722、723を有する。
【0015】
制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部10は、ROMまたは記憶部50に記憶された制御プログラムを実行することにより、バスを介してカラオケ装置1の各部を制御する。この例においては、制御部10は、制御プログラムを実行することにより、表示制御機能を実現する。この表示制御機能においては、楽曲データを再生して表示画面300への表示内容を制御し、また、スピーカ61からの放音内容を制御する。また、表示内容の制御としては、参加者によって指示された表示モードに応じた態様で、表示画面300に表示される対応画像の大きさの制御が含まれる(図4、図5、図6参照)。
【0016】
操作部20は、操作パネルなどに設けられた操作ボタン、リモコンに設けられた操作ボタン、キーボード、マウスなどの操作デバイスであって、参加者の操作を受け付けて、その内容を示す操作信号を制御部10に出力する。操作部20への操作によって、参加者の指示が入力される。
表示部30は、液晶ディスプレイなどの表示デバイスであり、制御部10の制御に応じた内容を表示画面300に表示する。この表示の内容は、上述の表示制御機能によって表示される内容、例えば、カラオケの楽曲の進行に応じて表示される背景画像、歌詞テロップ、対応画像が含まれ、さらに、メニュー画面、歌唱音声の評価結果なども含まれる。
【0017】
通信部40は、制御部10の制御に応じて、インターネットなどの通信回線と接続して、サーバ装置などの通信装置と情報のやり取りを行う。また、この例においては、他のカラオケ装置1と接続し、情報のやりとりを行う。制御部10は、通信部40を介して取得した情報を用いて、記憶部50に記憶される情報を更新するようにしてもよい。また、通信部40は、ネットワークを介した通信に限らず、有線または無線により外部装置と接続可能に構成されたインターフェイスを有していてもよい。
【0018】
記憶部50は、ハードディスク、不揮発性メモリなどの記憶手段であり、楽曲データおよびアバター画像データをそれぞれ記憶する記憶領域を有する。
アバター画像データは、表示画面300に表示される画像のうち、アバターに関連する画像を示すデータである。
楽曲データは、カラオケの歌唱対象となる楽曲に関連するデータが含まれ、例えば、ガイドメロディデータ(以下、GMデータという)、伴奏データ、歌詞データ、背景データ、アバター制御データなどが含まれている。なお、デュエット曲においては、GMデータ、歌詞データは、歌唱パート(この例においては第1パート、第2パートなど)毎に対応するように設けられている。
【0019】
GMデータは、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容が指定されたデータであり、例えば、MIDI(Musical Instrument Digital Interface)形式により記述されている。伴奏データは、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。
歌詞データは、楽曲の歌詞の内容を示すデータ、および表示画面300に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。背景データは、表示画面300に表示される背景画像を示すデータである。この背景画像は、楽曲の進行に応じて変化するものであってもよいし、変化しないものであってもよい。
アバター制御データは、表示画面300に表示させるアバターの動作を、楽曲の進行に応じて規定するデータである。楽曲データの再生中においてアバター画像を表示させる場合には、アバター画像データをアバター制御データに応じて選択することにより、アバター画像の内容が決まるようになっている。
【0020】
なお、背景画像が各楽曲に対応して決められている必要がない、すなわち、どの楽曲でも同じ背景画像を用いる場合には、背景データは楽曲データ毎に設けられていなくてもよい。また、どの楽曲でもアバターの動作が同じものとする場合にも、アバター制御データが楽曲データ毎に設けられていなくてもよい。
また、楽曲データには、歌唱音声を評価するときに用いられる評価基準となる情報が含まれていてもよい。例えば、様々な歌唱技法を含む複数の評価項目(音高、ビブラート、抑揚、こぶし、フォール、リズムなど)の各々について、楽曲全体のうち評価を行う区間を規定する情報、評価項目の評価値を算出するための基準値などを有していればよい。
【0021】
楽曲データは、参加者による操作部20の操作によって指示された楽曲に対応するものが、制御部10(後述する再生部110(図3参照))によって読み出されて再生され、楽曲データに含まれる各データが、カラオケの伴奏音、ガイドメロディ音のスピーカ61からの出力、歌詞テロップ、背景画像およびアバター画像の表示画面300への表示に用いられる。なお、楽曲データには、楽曲のサビ部分の位置、メロディの出だし部分の位置など、楽曲の各構成部分の位置を規定する情報も含まれていてもよい。
【0022】
マイクロフォン621、622、623は、参加者の音声などが入力され、入力された音声などを示すオーディオ信号を音響処理部60に出力する。スピーカ61は、音響処理部60から出力されるオーディオ信号を放音する。
音響処理部60は、DSP(Digital Signal Processor)などの信号処理回路、MIDI形式の信号からオーディオ信号を生成する音源などを有する。音響処理部60は、マイクロフォン621、622、623から入力されるオーディオ信号をA/D変換(アナログデジタル変換)して、オーディオデータとして制御部10に出力する。このとき、オーディオデータは、A/D変換前のオーディオ信号を出力したマイクロフォンを識別する情報を対応付けて出力される。
音響処理部60は、制御部10から楽曲データに基づくMIDI形式の信号が入力され、その信号に基づいてオーディオデータを生成する。音響処理部60は、このように生成したオーディオデータ、制御部10から出力されたオーディオデータなどに、エフェクト処理、D/A変換(デジタルアナログ変換)、増幅処理などの信号処理を施してからスピーカ61に出力する。また、音響処理部60は、マイクロフォン621、622、623のうち制御部10によって決められたマイクロフォン(この例においては、マイクロフォン621、622)から入力されたオーディオ信号についても、上記信号処理などを施してスピーカ61に出力する。
【0023】
カメラ721、722、723は、予め決められた範囲を撮影し、撮影画像を示す撮影信号を画像処理部70に出力する。
画像処理部70は、カメラ721、722、723からの撮影信号をそれぞれ撮影画像データとして出力する。このとき、画像処理部70は、各カメラを識別する情報を各撮影画像データに対応付けて出力する。
以上が、カラオケ装置1のハードウエア構成についての説明である。
【0024】
[カラオケ装置1の設置態様]
図2は、本発明の実施形態におけるカラオケ装置1が設置された部屋1000を説明する図である。この例においては、カラオケ装置1は、部屋1000a、1000bに設置されている。それぞれのカラオケ装置1は通信部40を介して接続されている。部屋1000aに設置されたカラオケ装置1と、部屋1000bに設置されたカラオケ装置1とは、参加者によって指示された表示モードが客席対抗モードである場合に、連携して動作する。この場合には、各部屋のカラオケ装置1は、撮影画像データ、オーディオデータ、および表示制御機能において用いられる各種情報が通信部40を介して相互にやり取りするようになっている。以下、部屋1000aと1000bとを区別しない場合には、単に部屋1000という。
【0025】
部屋1000には、机1100および客席1200が設置されている。カラオケ装置1の表示画面300は、歌唱者および客席1200に座った観客から見える場所に位置している。表示画面300を有する筐体CNには、制御部10などバスに接続された各構成が設けられている。スピーカ61は、この例においては複数存在し、ステレオによる放音を行う。スピーカ61の放音範囲は、部屋1000の内部全体である。また、歌唱者Aが歌唱すべき範囲として歌唱範囲DAが決められ、歌唱者Bが歌唱すべき範囲として歌唱範囲DBが決められている。
【0026】
マイクロフォン621は、予め決められた歌唱範囲DA近傍に設置されている。以下の説明においては、マイクロフォン621を用いる歌唱者を歌唱者Aといい、マイクロフォン621から入力される音声を歌唱音声Aという。デュエット曲においては、第1パートを歌唱する歌唱者がこのマイクロフォン621を用いる。
マイクロフォン622は、予め決められた歌唱範囲DB近傍に設置されている。以下の説明においては、マイクロフォン622を用いる歌唱者を歌唱者Bといい、マイクロフォン622から入力される音声を歌唱音声Bという。デュエット曲においては、第2パートを歌唱する歌唱者がこのマイクロフォン622を用いる。
マイクロフォン623は、机1100に設置されている。マイクロフォン623から入力される音は、客席1200に位置する観客の音声を含んでいる。以下の説明においては、マイクロフォン623から入力された観客の音声を観客音声という。
なお、マイクロフォン621,622、623は、筐体CNとは異なる位置に設置されているが、狭い指向性を有する収音方向のマイクアレイなどを筐体CNに設置し、歌唱範囲DA、DB、客席1200方向からの音が入力されるようにしてもよい。
【0027】
カメラ721は、歌唱範囲DAを含む範囲(カメラ721から伸びる破線に対応)を撮影するように設置されている。歌唱中には、カメラ721は、歌唱者Aを撮影することになる。以下、この撮影画像を歌唱者A画像という。
カメラ722は、歌唱範囲DBを含む範囲(カメラ722から伸びる破線に対応)を撮影するように設置されている。歌唱中には、カメラ722は、歌唱者Bを撮影することになる。以下、この撮影画像を歌唱者B画像という。
カメラ723は、客席1200の少なくとも一部の範囲(カメラ723から伸びる破線に対応)を撮影するように設置されている。客席1200に観客がいる場合には、カメラ723は、観客を撮影することになる。以下、この撮影画像を観客画像という。
なお、カメラ721、722、723は、図2に示す例においては、筐体CNに取り付けられているが、部屋1000のいずれかの場所に設置されていてもよい。以上が、カラオケ装置1の部屋1000への設置態様についての説明である。
【0028】
[機能構成]
次に、カラオケ装置1の制御部10が制御プログラムを実行することによって実現される表示制御機能について説明する。なお、以下に説明する表示制御機能を実現するための各構成の一部または全部については、ハードウエアによって実現してもよい。
【0029】
図3は、本発明の実施形態における表示制御機能の構成を説明する機能ブロック図である。制御部10は、制御プログラムを実行すると、再生部110、取得部120、検出部130、決定部140、および表示制御部150を構成する。これらの構成により、制御部10は表示制御装置として機能する。
【0030】
再生部110は、予め歌唱者による操作部20の操作などにより指示された楽曲の楽曲データを読み出して再生する。再生部110は、楽曲データを再生することにより、楽曲データにおけるGMデータおよび伴奏データによって決められた音をスピーカ61から放音させるためのオーディオ信号を音響処理部60に出力する。
再生部110は、楽曲データにおける背景データ、歌詞データに応じた背景画像、歌詞テロップを表示画面300に表示させるための画像データを、表示制御部150に出力する。なお、再生部110は、楽曲データにおけるアバター制御データに従って、アバター画像を対応画像として表示画面300に表示させるための画像データについても表示制御部150に出力する。アバター画像を示す画像データについては、歌唱者によってアバター画像が対応画像として指示された場合にのみ出力されるようにしてもよい。
再生部110は、楽曲データにおけるGMデータが示す情報(各構成音の音高および期間)を決定部140に出力する。決定部140に出力されたGMデータに基づく情報は、後述するように歌唱音声の評価に用いられる。なお、上述した評価基準となる情報が楽曲データに含まれている場合には、再生部110は、この情報についても決定部140に出力する。
【0031】
なお、参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合については、再生部110は、上記処理となる一方、客席対抗モードである場合には部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは相互に再生タイミングを規定する情報をやり取りして、互いに同期して楽曲データを再生する。
【0032】
取得部120は、画像処理部70から出力される撮影画像データを取得し、カメラを識別する情報との対応関係を維持したまま、表示制御部150に出力する。なお、この撮影画像データについては、歌唱者によって撮影画像が対応画像として指示された場合にのみ出力されるようにしてもよい。以下の例においては、歌唱者によって撮影画像が対応画像として指示された場合を前提として説明するが、アバター画像が対応画像として指示された場合には、対応画像をアバター画像として置き換えればよい。
【0033】
参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合については、取得部120の処理は上記のとおりである。一方、客席対抗モードである場合には部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは相互に撮影画像データをやり取りし、一方の部屋1000のカラオケ装置1における取得部120は、他の部屋1000のカラオケ装置1における取得部120において取得される撮影画像データについても取得する。以下、部屋1000aの歌唱者Aおよび観客と、部屋1000bの歌唱者Aおよび観客とを区別する場合には、それぞれ、部屋1000aの歌唱者Aおよび観客については、歌唱者Aaおよび観客aといい、部屋1000bの歌唱者Aおよび観客については、歌唱者Abおよび観客bという。
このようにして撮影画像データをやり取りすることにより、各部屋1000のカラオケ装置1の取得部120は、ともに、歌唱者Aaおよび観客aの画像を示す撮影画像データおよび、歌唱者Abおよび観客bの画像を示す撮影画像データを取得する。
【0034】
検出部130は、歌唱音声Aを示すオーディオデータ、歌唱音声Bを示すオーディオデータ、および観客音声を示すオーディオデータを音響処理部60から取得することにより、歌唱者A、歌唱者Bおよび観客の音声を各人の挙動として検出する。なお、検出部130は、これらのオーディオデータのうち、参加者によって指示された表示モードに応じて、決定部140において用いられるオーディオデータのみ取得するようにしてもよい。
検出部130は、取得したオーディオデータを、各人の挙動の検出結果として決定部140に出力する。
【0035】
決定部140は、参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合には、検出部130から出力されたオーディオデータ(検出結果)と再生部110から出力されたGMデータとに基づいて、音高の一致の程度に応じた評価値を予め決められた期間毎(例えば、構成音毎)に算出する。そして、決定部140は、この算出結果に応じて、表示制御部150によって表示画面300に表示させる対応画像の大きさを決定する。
このとき、決定部140は、参加者によって指示された表示モードに応じて、検出結果に応じて大きさを変化させる対応画像と、挙動の検出対象の人との対応付けを行っておく。この例においては、歌唱練習モードであれば、決定部140は、対応画像Aに歌唱者Aを対応付けるように決められている。また、デュエットバトルモードであれば、決定部140は、さらに、対応画像Bに歌唱者Bを対応付けるように決められている。ここで、対応画像Aとは、カメラ721による撮影画像(歌唱者A画像)であり、後述する歌唱者A表示領域CAに表示される画像である。また、対応画像Bとは、カメラ722による撮影画像(歌唱者B画像)であり、後述する歌唱者B表示領域CBに表示される画像である。このように、歌唱練習モードおよびデュエットバトルモードにおいては、対応画像に対応付けられている人は、その対応画像を得るための撮影対象の人と同じである。
【0036】
また、各表示モードに応じて対応画像の大きさの決定方法が異なる。歌唱練習モードである場合には、決定部140は、対応画像Aの大きさを、対応画像Aに対応付けられた歌唱者Aによって入力された歌唱音声Aを示すオーディオデータとGMデータとに基づいて算出した評価値に応じて決定する。この例においては、決定部140は、算出した評価値が高いほど対応画像Aの大きさが大きくなるように決定する。なお、対応画像Aの大きさは、算出した評価値の、直前の期間において算出された評価値に対する相対的な値に応じて決定されてもよいし、直前の対応画像Aの大きさに対する変化量として決定されてもよい。
【0037】
一方、デュエットバトルモードである場合には、決定部140は、対応画像Aの大きさおよび対応画像Bの大きさを、対応画像Aに対応付けられた歌唱者Aによって入力された歌唱音声Aに基づいて算出した評価値Aと、対応画像Bに対応付けられた歌唱者Bによって入力された歌唱音声Bに基づいて算出した評価値Bとの相対的な関係(例えば比率)に応じて決定する。評価値Aは、歌唱音声Aを示すオーディオデータとGMデータ(第1パート)とに基づいて算出し、評価値Bは、歌唱音声Bを示すオーディオデータとGMデータ(第2パート)とに基づいて算出する。
【0038】
この例においては、決定部140は、それぞれの評価値が異なっているほど、それぞれの対応画像の大きさの比率が異なるように、それぞれの大きさを決定する。例えば、評価値Aの評価値Bに対する比が大きいほど、対応画像Aを大きく、対応画像Bを小さくするように決定する。なお、対応画像の大きさは、算出された評価値Aの評価値Bに対する比の、直前の期間において算出された比に対する相対的な値に応じて決定されてもよいし、直前の対応画像の大きさに対する変化量として決定されてもよい。
【0039】
ここで、決定部140は、評価値の算出において、音高の一致の程度については公知の様々な方法を用いることができるが、例えば、以下のようにして行う。まず、決定部140は、検出部130からのオーディオデータを解析して、歌唱音声の音高(以下、歌唱音高という)を特定する。例えば、各フレームについてオーディオデータが示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによってフレーム毎の歌唱音高(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。なお、歌唱音高は、歌唱音声データにFFT(Fast Fourier Transform)を施して得られるスペクトルから特定してもよい。
【0040】
そして、決定部140は、歌唱音高とGMデータが示す構成音の音高(以下、指定音高という)の周波数から一定範囲(この例においては、±50cent)に含まれている期間の割合に応じて評価値を算出する。すなわち、各構成音について歌唱音高と指定音高とが近いほど評価値が高くなる。なお、上述したように楽曲データに評価基準となる情報が含まれている場合には、決定部140は、音高以外(例えば、ビブラートなど)の評価を評価値算出に用いてもよく、この場合においても公知の方法を用いて評価値を算出すればよい。なお、このような歌唱音声と基準値との比較により評価値を算出する場合に限られず、決定部140は、歌唱音声の音量レベルであったり、周波数分布から得られるパラメータなどを評価値として算出してもよい。すなわち、オーディオデータから得られるパラメータを評価値として用いればよい。
【0041】
続いて、客席対抗モードである場合についての決定部140の処理を説明する。この場合の決定部140は、対応画像Aaに観客aを対応付け、対応画像Abに観客bを対応付けるように決められている。ここで、対応画像Aaとは、部屋1000aのカラオケ装置1におけるカメラ721による撮影画像(歌唱者Aa画像)であり、後述する歌唱者Aa表示領域CAaに表示される画像である。また、対応画像Abとは、部屋1000bのカラオケ装置1におけるカメラ721による撮影画像(歌唱者Ab画像)であり、後述する歌唱者Ab表示領域CAbに表示される画像である。このように、客席対抗モードにおいては、対応画像に対応付けられている人は、その対応画像を得るための撮影対象の人とは異なっている。
決定部140は、対応画像に対応付けられた観客によって入力された観客音声の音量レベルを評価値として算出する。部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは、この算出結果を相互にやり取りする。
【0042】
決定部140は、観客a音声の音量レベルaと観客b音声の音量レベルbとの相対的な関係(例えば比率)に応じて、対応画像Aaの大きさと対応画像Abの大きさとを決定する。この例においては、決定部140は、それぞれの音量レベルが異なっているほど、それぞれの対応画像の大きさの比率が異なるように、それぞれの大きさを決定する。例えば、音量レベルaの音量レベルbに対する比が大きいほど、対応画像Aaを大きく、対応画像Abを小さくするように決定する。
【0043】
そして、決定部140は、上述のように表示モードに応じた方法で決定した対応画像の大きさ示す決定情報を表示制御部150に出力する。
【0044】
表示制御部150は、再生部110から出力される画像データ、取得部120から出力される撮影画像データ、および決定部140から出力される決定情報を用いて、表示画面300の表示内容を制御する。この表示内容は、参加者によって指示された表示モードによっても異なる。続いて、各表示モードにおける表示画面の300の表示内容について図4、図5、図6を用いて説明する。
【0045】
[歌唱練習モードの表示例]
図4は、本発明の実施形態における歌唱練習モードにおける表示画面300の表示態様を説明する図である。歌唱練習モードにおいては、表示画面300の表示領域は、ステージSTなどの背景画像が表示される背景表示領域BA、歌詞テロップが表示される歌詞表示領域LA、対応画像A(この例においては歌唱者A画像)が表示される歌唱者A表示領域CA、およびカメラ723の撮影画像である観客画像が表示される観客表示領域CCにより構成される。歌詞表示領域LAおよび歌唱者A表示領域CAは、背景表示領域BAに重畳した位置関係であり、歌詞表示領域LA、歌唱者A表示領域CAおよび観客表示領域CCに表示される画像は、背景表示領域BAにおける背景画像より優先して表示される。また、歌唱者A表示領域CAに表示される歌唱者A画像は、観客表示領域CCに表示される観客画像よりも優先して表示される。
【0046】
歌唱者Aが歌唱を開始する前においては、歌唱者A表示領域CA(歌唱者A画像)は、図4(a)に示す大きさで表示される。その後、楽曲の進行に伴い歌唱者Aの歌唱が開始されると、歌唱音声Aの評価値に応じて、歌唱者A表示領域CAの大きさが変更される。歌唱者A画像は、歌唱者A表示領域CAの大きさに合わせて縮小または拡大される。この例においては、歌唱音声Aの評価値が高くなるほど、図4(b)に示すように歌唱者A表示領域CAが大きくなる。一方、歌唱音声Aの評価値が低くなるほど、図4(c)に示すように歌唱者A表示領域CAが小さくなる。
【0047】
このように表示されることにより、参加者は、歌唱者Aの歌唱の巧拙に応じて、表示画面300に表示される歌唱者A画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aは、自分の画像が大きく表示されるように巧く歌唱しようとすることにより、歌唱中の雰囲気を盛り上げることができる。
【0048】
[デュエットバトルモードの表示例]
図5は、本発明の実施形態におけるデュエットバトルモードにおける表示画面300の表示態様を説明する図である。デュエットバトルモードにおいては、表示画面300の表示領域には、歌唱練習モードの場合の表示態様に追加して、対応画像B(この例においては歌唱者B画像)が表示される歌唱者B表示領域CBが構成される。歌唱者B表示領域CBに表示される歌唱者B画像は、背景表示領域BAにおける背景画像、および観客表示領域CCに表示される観客画像よりも優先して表示される。なお、歌唱者A表示領域CAと歌唱者B表示領域CBとが重なる場合には、大きい方の画像が優先して表示される。
【0049】
歌唱者Aおよび歌唱者Bが歌唱を開始する前においては、歌唱者A表示領域CAおよび歌唱者B表示領域CBは、図5(a)に示すように同じ大きさで表示される。その後、楽曲の進行に伴い歌唱者Aおよび歌唱者Bの歌唱が開始されると、歌唱音声Aの評価値および歌唱音声Bの評価値に応じて、歌唱者A表示領域CAと歌唱者B表示領域CBとの大きさが変更される。歌唱者A画像は、歌唱者A表示領域CAの大きさに合わせて縮小または拡大される。また、歌唱者B画像は、歌唱者B表示領域CBの大きさに合わせて縮小または拡大される。この例においては、歌唱音声Aの評価値が歌唱音声Bの評価値に比べて高くなるほど、図5(b)に示すように歌唱者A表示領域CAが大きくなり歌唱者B表示領域CBが小さくなる。すなわち、歌唱者Bが巧く歌っても、歌唱者Aがより巧く歌えば、歌唱者B画像は小さくなる。一方、歌唱音声Aの評価値が歌唱音声Bの評価値に比べて低くなるほど、図5(c)に示すように歌唱者A表示領域CAが小さくなり歌唱者B表示領域CBが大きくなる。
【0050】
このように表示されることにより、参加者は、歌唱者Aおよび歌唱者Bの歌唱の巧拙に応じて、表示画面300に表示される歌唱者A画像および歌唱者B画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aおよび歌唱者Bは、自分の画像が大きく表示されるように相手より巧く歌唱しようとすることにより、歌唱中の雰囲気を盛り上げることができる。
【0051】
[客席対抗モードの表示例]
図6は、本発明の実施形態における客席対抗モードにおける表示画面300の表示態様を説明する図である。客席対抗モードにおいては、表示画面300の表示領域は、ステージSTa、STbなどの背景画像が表示される背景表示領域BA、歌詞テロップが表示される歌詞表示領域LA、対応画像Aa(この例においては歌唱者Aa画像)が表示される歌唱者Aa表示領域CAa、部屋1000aのカラオケ装置1におけるカメラ723の撮影画像である観客a画像が表示される観客a表示領域CCa、対応画像Ab(この例においては歌唱者Ab画像)が表示される歌唱者Ab表示領域CAb、および部屋1000bのカラオケ装置1におけるカメラ723の撮影画像である観客b画像が表示される観客b表示領域CCbにより構成される。重畳した場合に優先して表示させる画像については、上記の説明と同様である。
部屋1000aにおけるカラオケ装置1の表示画面300に表示される内容と、部屋1000bにおけるカラオケ装置1の表示画面300に表示される内容とは、同じものが表示されるものとするが、異なる態様で表示されてもよい。
【0052】
歌唱者Aaおよび歌唱者Abが歌唱を開始する前においては、歌唱者Aa表示領域CAaおよび歌唱者Ab表示領域CAbは、図6(a)に示すように同じ大きさで表示される。その後、楽曲の進行に伴い歌唱者Aaおよび歌唱者Abの歌唱が開始されると、観客a音声の音量レベルaおよび観客b音声の音量レベルbに応じて、歌唱者Aa表示領域CAaと歌唱者Ab表示領域CAbとの大きさが変更される。歌唱者Aa画像は、歌唱者Aa表示領域CAaの大きさに合わせて縮小または拡大される。また、歌唱者Ab画像は、歌唱者Ab表示領域CAbの大きさに合わせて縮小または拡大される。
【0053】
この例においては、観客a音声の音量レベルaが観客b音声の音量レベルbに比べて高くなるほど、図6(b)に示すように、歌唱者Aa表示領域CAaが大きくなり、歌唱者Ab表示領域CAbが小さくなる。一方、観客a音声の音量レベルaが観客b音声の音量レベルbに比べて低くなるほど、図6(c)に示すように、歌唱者Aa表示領域CAaが小さくなり、歌唱者Ab表示領域CAbが大きくなる。すなわち、歌唱者Aaおよび歌唱者Abの歌唱の巧さではなく、観客aおよび観客bの盛り上がりの程度によって、歌唱者Aa画像と歌唱者Ab画像との大きさが変わる。なお、観客a画像および観客b画像の大きさについても、歌唱者Aa画像および歌唱者Ab画像の大きさに連動して変化するようにしてもよい。
【0054】
このように表示されることにより、参加者は、観客aおよび観客bの盛り上がりの程度に応じて、表示画面300に表示される歌唱者Aa画像および歌唱者Ab画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aaおよび歌唱者Abは、自分の画像が大きく表示されるように相手より巧く歌唱して観客を盛り上げようとすることにより、歌唱中の雰囲気を盛り上げることができる。また、観客aおよび観客bについても、積極的に歌唱者が巧く歌唱できるように応援しようとすることで、歌唱中の雰囲気を盛り上げることができる。
【0055】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した実施形態において、検出部130は、歌唱音声、観客音声を示すオーディオデータを音響処理部60から取得することにより、参加者の音声を各人の挙動として検出していたが、参加者の動きを各人の挙動として検出するようにしてもよい。このような構成を実現するカラオケ装置1Aについて、図7を用いて説明する。
【0056】
図7は、本発明の変形例1における表示制御機能の構成を説明する機能ブロック図である。変形例1における制御部10Aは、制御プログラムを実行すると、再生部110、取得部120、検出部130A、決定部140A、および表示制御部150を構成する。また、カラオケ装置1Aの音響処理部60Aは、実施形態における構成と異なり、検出部130Aにオーディオデータを出力しない。一方、画像処理部70Aは、取得部120に出力する撮影画像データを、検出部130Aに対しても出力する。
【0057】
検出部130Aは、歌唱者A、歌唱者Bおよび観客の画像を示す撮影画像データを画像処理部70Aから取得することにより、歌唱者A、歌唱者Bおよび観客の動きを各人の挙動として検出する。検出部130Aは、このようにして取得した撮影画像データを、各人の挙動の検出結果として決定部140Aに出力する。
決定部140Aは、検出部130Aから出力された撮影画像データが示す画像を解析し、歌唱者などの人の動きの程度を評価値として算出する。これは、画像の内容の変化の程度を数値化することにより評価値として算出するものであってもよいし、画像の明るさなどを評価値として算出するものであってもよい。決定部140Aは、評価値を用いて対応画像の大きさを変化させる処理については、実施形態と同様に行えばよい。他の構成については、実施形態における構成と同様であるため説明を省略する。
【0058】
なお、カメラ721、722、723が、深度センサが取り付けられた構成とし、撮影範囲における深度を示す深度データを出力する構成とすれば、検出部130Aは、深度データを取得して決定部140Aに出力し、決定部140Aは、モーションキャプチャなどにおいて用いられる技術により、深度データに基づいて歌唱者などの人の動きの程度を評価値として算出してもよい。
【0059】
[変形例2]
上述した実施形態において、表示画面300に表示される歌唱者A画像、歌唱者B画像は、その大きさが変化することにより表示態様が変化するようになっていたが、他の方法により表示態様が変化するようになっていてもよい。例えば、画像の明度、彩度、色相などを変化させたり、画像の解像度を変化させたり、画像の形状を変化させたり、表示位置を振動させたりして、表示態様を変化させてもよい。
また、表示画面300が、裸眼またはメガネ等を用いて立体視の表示が可能な構成である場合には、画像の立体化の程度であったり、奥行き方向の位置を変化させることにより表示態様を変化させてもよい。この場合には、カメラ721、722、723の各々についても、複数地点から同時に撮影するなど、立体視可能な撮影方法に対応するようにしてもよい。
【0060】
[変形例3]
上述した実施形態において、カメラ721、722、723は予め決められた範囲を撮影範囲としていたが、撮影範囲が変更可能に構成され、歌唱者などが移動しても撮影範囲に歌唱者などが含まれるようにしてもよい。このような構成を実現するカラオケ装置1Bについて、図8を用いて説明する。
【0061】
図8は、本発明の変形例3における表示制御機能の構成を説明する機能ブロック図である。変形例3における制御部10Bは、制御プログラムを実行すると、実施形態における表示制御機能の各構成に加えて、位置特定部160を構成する。また、カラオケ装置1Bは、駆動部71および位置検出部80を有する。
駆動部71は、位置特定部160からの制御により、カメラ721、722、723の向きを変更するなどして、撮影範囲を変更させる。
【0062】
位置検出部80は、マイクロフォン621、622、623の位置を検出し、検出した位置を示す情報を位置特定部160に出力する。この位置の検出方法は、公知の方法を用いればよい。以下、いくつかの態様を例示する。
第1の態様として、位置検出部80は、部屋1000に設置され赤外線信号を出力するビーコン、およびマイクロフォン621、622、623に設けられビーコンからの赤外線信号を検出する構成を有するものとすればよい。この場合には、位置検出部80は、マイクロフォン621、622、623が検出した赤外線信号から、それぞれの位置を検出すればよい。
第2の態様として、位置検出部80は、マイクロフォン621、622、623に設けられ自身を識別する無線信号を出力する構成、およびカラオケ装置1Bの筐体CNに設けられ無線信号が出力される方向を認識する構成を有するものとすればよい。この場合には、位置検出部80は、認識した無線信号の出力方向をマイクロフォン621、622、623の位置として検出すればよい。
第3の態様として、位置検出部80は、マイクロフォン621、622、623に設けられ自身を識別する絵柄、およびこれを撮影するカメラ(カメラ721、722、723を用いてもよい)などを有するものとすればよい。この場合には、位置検出部80は、絵柄が撮影されたカメラの方向を、マイクロフォン621、622、623の位置として検出すればよい。
【0063】
位置特定部160は、位置検出部80からの情報を用いて、マイクロフォン621、622、623の位置を、歌唱者A、歌唱者B、観客の位置として特定する。そして、位置特定部160は、駆動部71を制御して、カメラ721、722、723の撮影範囲に、特定した歌唱者A、歌唱者B、観客のそれぞれの位置が含まれるように、撮影方向を変更させる。これにより、歌唱者などが移動しても、カメラ721、722、723の撮影範囲に含まれるようにすることができる。
【0064】
なお、上述した位置検出部80のようにマイクロフォン621、622、623の位置を検出することにより歌唱者などの位置を特定するのではなく、直接的に歌唱者などの位置を特定する構成を用いてもよい。この構成についても、公知の方法を用いればよい。例えば、位置特定部160は、マイクアレイを用いて歌唱者などから発生される歌唱音声の方向を認識することにより、歌唱者などの位置を特定してもよい。また、位置特定部160は、駆動部71を制御して撮影範囲が部屋1000の内部においてスキャンさせ、得られた撮影画像を解析することにより、歌唱者などの位置を特定してもよい。また、深度センサを用いたモーションキャプチャ技術、温度センサを用いた技術などにより歌唱者などの位置を特定してもよい。また、参加者が操作部20を操作して歌唱者の位置を入力することにより特定するようにしてもよい。
【0065】
[変形例4]
上述した実施形態において、デュエット曲の第1パートに対応する歌唱音声Aはマイクロフォン621から入力され、第2パートについての歌唱音声Bはマイクロフォン622から入力されるものとして予め決められていたが、この対応関係は予め決められていなくてもよい。この場合には、マイクロフォン621、622から入力された歌唱音声が、それぞれ第1パートの歌唱音声Aであるか第2パートの歌唱音声Bであるかを判定する判定部を設ければよい。この判定部は、それぞれのマイクロフォンに対応するオーディオデータを解析して得られる音高と、GMデータの各パートの構成音の音高とを比較し、いずれのパートと一致している程度が高いかに応じて判定すればよい。表示制御機能の各構成については、この判定結果にしたがって歌唱者A、歌唱者Bがいずれのマイクロフォンを用いているかが決められたものとして各処理を行えばよい。
【0066】
また、歌唱者練習モードの場合のように、歌唱者が1人である場合には、それぞれのマイクロフォンに対応するオーディオデータを解析して、音量レベルが一定値以上となるマイクロフォンを歌唱者が用いているものとして各処理を行えばよい。
これらの構成によれば、歌唱者が使用すべきマイクロフォンが予め決められていなくても、実施形態と同様な効果が得られる。
【0067】
[変形例5]
上述した実施形態において、歌唱者A、歌唱者Bおよび観客を撮影するカメラは、それぞれ個別のカメラ721、722、723を用いていたが、部屋1000の内部全体を撮影範囲とするカメラを用いてもよい。この場合には、画像処理部70は、撮影画像を解析し、歌唱者A、歌唱者Bおよび観客に対応する部分を抽出して、抽出した歌唱者A画像、歌唱者B画像、観客画像のそれぞれを示す撮影画像データを出力するようにすればよい。
このように観客を抽出する場合であって、客席1200に観客が複数存在する場合には、観客ごとに撮影画像データが出力されるようにして、表示画面300には複数の観客画像が表示されるようにしてもよい。
【0068】
[変形例6]
上述した実施形態におけて、デュエットバトルモードでは、歌唱者A画像と歌唱者B画像とは、その大きさが歌唱音声Aおよび歌唱音声Bについての評価値の相対的な値に応じて変化していたが、歌唱練習モードにおける場合と同様に、相対的でなくそれぞれ独立して画像の大きさが変化するようにしてもよい。この場合には、歌唱者A画像と歌唱者B画像との双方が大きくなる場合もある。客席対抗モードにおいても同様である。
【0069】
[変形例7]
上述した実施形態においては、表示画面300は、1台のカラオケ装置1について1つ設けられていたが、複数の表示画面が設けられていてもよい。この場合には、実施形態における表示画面300の表示領域の各構成要素が複数の表示画面に割り当てられていてもよい。例えば、歌唱者A画像と歌唱者B画像とが別の表示画面に表示されるようにしてもよいし、大きさが変化する画像と変化しない画像とが別の表示画面に表示されるようにしてもよい。また、表示領域の各構成要素のいくつかが複数の表示画面に表示されていてもよい。
【0070】
[変形例8]
上述した実施形態において、歌唱練習モードでは、歌唱音声Aの評価値に応じて歌唱者A画像の大きさが変化していたが、客席対抗モードのように観客音声の音量レベルに応じて歌唱者A画像の大きさが変化するようにしてもよい。この場合には、決定部140において対応画像Aに対応付けられる人は、歌唱者Aではなく観客となる。
また、デュエットバトルモードでは、対応画像Aに歌唱者Aが対応付けられ、対応画像Bに観客が対応付けられるようにしてもよい。客席対抗モードでは、対応画像Aaに歌唱者Aaが対応付けられ、対応画像Abに観客bが対応付けられるようにしてもよい。
なお、一つの対応画像に複数の人が対応付けられてもよい。例えば、歌唱練習モードにおいて、対応画像Aに歌唱者Aと観客とが対応付けられた場合には、決定部140は、歌唱音声Aに基づいて算出される評価値と観客音声の音量レベルにより算出される評価値とに基づいて、対応画像Aの大きさを決定すればよい。
【0071】
[変形例9]
上述した実施形態において、客席対抗モードでは、複数の部屋1000に設置されたカラオケ装置1を連動させ、楽曲データが同期して再生されるようにしていたが、必ずしも同期していなくてもよい。また、一方の部屋1000のカラオケ装置1をマスタ装置とし他方のカラオケ装置1をスレーブ装置として、マスタ装置はスレーブ装置を制御して、双方のカラオケ装置1全体を一つのカラオケ装置として取り扱ってもよい。この場合、例えば、カラオケ装置全体としてのスピーカ61の放音範囲は、部屋1000aの内部および部屋1000bの内部の双方の範囲になる。
【0072】
[変形例10]
上述した実施形態において、楽曲データに楽曲の各構成部分の位置を規定する情報が含まれている場合には、楽曲の構成部分に応じて、評価値の算出方法を変化させてもよい。例えば、サビの部分では評価値が高く算出されるように変化させればよい。また、デュエットバトルモードにおいては、デュエット曲の全期間にわたって第1パートと第2パートとの双方に構成音が存在するとは限らないため、例えば、第1パートのみの構成部分においては、第2パートに対応する歌唱音声Bに基づいて算出される評価値は一定値として固定しておけばよい。この一定値は、予め決められた値であってもよいし、既に算出された各期間の評価値に基づく値、例えば平均値などとしてもよい。
【0073】
[変形例11]
上述した実施形態において、音響処理部60は、マイクロフォン621に入力された歌唱音声Aを示すオーディオデータを出力するときに、他のマイクロフォン622、623に入力された歌唱音声Bおよび観客音声を用いて、マイクロフォン621に混入した歌唱音声Bおよび観客音声の成分をキャンセルする処理を行ってもよい。また、音響処理部60は、歌唱音声Aのスピーカ61からの成分をキャンセルする、すなわちエコーキャンセル処理を行ってもよい。
上記処理は、歌唱音声Bを示すオーディオデータ、観客音声を示すオーディオデータについても同様に適用してもよい。
【0074】
[変形例12]
上述した実施形態においては、歌唱者が最大2人の場合について説明したが、3人以上に対応していてもよい。
【0075】
[変形例13]
上述した実施形態における制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、カラオケ装置1は、制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0076】
1,1A,1B…カラオケ装置、10,10A,10B…制御部、20…操作部、30…表示部、300…表示画面、40…通信部、50…記憶部、60,60A…音響処理部、61…スピーカ、621,622,623…マイクロフォン、70,70A…画像処理部、71…駆動部、721,722,723…カメラ、80…位置検出部、110…再生部、120…取得部、130,130A…検出部、140,140A…決定部、150…表示制御部、160…位置特定部、1000a,1000b…部屋、1100…机、1200…客席
【技術分野】
【0001】
本発明は、歌唱中に表示される内容を制御する技術に関する。
【背景技術】
【0002】
近年、カラオケ装置は、歌唱者を撮影するカメラを有しているものがある。このカメラによって撮影された歌唱者の画像は、歌唱中に表示される背景、歌詞テロップなどの画像に合成されて表示画面に表示される。このような技術は、例えば、特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−2732号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された技術によれば、歌唱者およびその観客は、表示画面に表示される歌唱者の画像を見ることができ、歌唱者の画像が表示されない場合に比べて観客も楽しむことができる。しかしながら、表示画面における表示内容は、歌唱者の画像が追加して表示されただけで、画面全体としては単調なものである。そのため、歌唱者および観客は、その場の雰囲気がどのような状況であっても同じような態様での表示が続くことで、その表示内容に飽きてしまうものであった。
本発明は、上述した事情に鑑みてなされたものであり、歌唱者、観客などの人の挙動に応じた演出を、楽曲の進行に伴って表示される歌唱者に対応する画像に対してリアルタイムに施すことを目的とする。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、楽曲データを再生して、当該楽曲データが示す音を放音手段から放音させる再生手段と、前記楽曲データの再生中に前記放音手段の放音範囲に位置する人の挙動を検出する検出手段と、前記挙動の検出対象となる人に対応付けられた対応画像を示す画像データを取得する画像取得手段と、前記楽曲データの再生中において表示画面に表示させる前記対応画像の表示態様を、前記検出された結果に基づいて決定する決定手段と、前記取得された画像データを用いて、前記対応画像を前記決定された表示態様で前記表示画面に表示させる表示制御手段とを具備することを特徴とする表示制御装置を提供する。
【0006】
また、別の好ましい態様において、前記放音範囲の少なくとも一部を撮影して、撮影画像を示す画像データを出力する撮影手段をさらに具備し、前記画像取得手段は、前記撮影手段から出力される画像データを、前記対応画像を示す画像データとして取得することを特徴とする。
【0007】
また、別の好ましい態様において、前記放音範囲の人の位置を特定する位置特定手段をさらに具備し、前記撮影手段は、前記特定された位置に応じて撮影範囲を決定することを特徴とする。
【0008】
また、別の好ましい態様において、前記検出手段は、前記放音範囲に位置する複数の人の各々の挙動を検出し、前記画像取得手段は、前記複数の人の各々に対応して、前記対応画像を示す画像データを取得し、前記決定手段は、前記各人について前記検出された結果の相対的な関係に基づいて、前記各人に対応する前記対応画像の表示態様を決定することを特徴とする。
【0009】
また、別の好ましい態様において、前記検出手段は、前記放音範囲に位置する人によって入力される歌唱音声を、前記挙動として検出し、前記決定手段は、前記歌唱音声を解析して評価値を算出し、算出した評価値に基づいて前記表示態様を決定することを特徴とする。
【発明の効果】
【0010】
本発明によれば、歌唱者、観客などの人の挙動に応じた演出を、楽曲の進行に伴って表示される歌唱者に対応する画像に対してリアルタイムに施すことができる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態におけるカラオケ装置の構成を説明するブロック図である。
【図2】本発明の実施形態におけるカラオケ装置が設置された部屋を説明する図である。
【図3】本発明の実施形態における表示制御機能の構成を説明する機能ブロック図である。
【図4】本発明の実施形態における歌唱練習モードにおける表示画面の表示態様を説明する図である。
【図5】本発明の実施形態におけるデュエットバトルモードにおける表示画面の表示態様を説明する図である。
【図6】本発明の実施形態における客席対抗モードにおける表示画面の表示態様を説明する図である。
【図7】本発明の変形例1における表示制御機能の構成を説明する機能ブロック図である。
【図8】本発明の変形例3における表示制御機能の構成を説明する機能ブロック図である。
【発明を実施するための形態】
【0012】
<実施形態>
[ハードウエア構成]
図1は、本発明の実施形態におけるカラオケ装置1の構成を説明するブロック図である。カラオケ装置1は、歌唱者または観客(以下、総称して参加者という)によって指示された表示モードに応じて、参加者の各々に対応付けられる画像(以下、対応画像という)を、背景画像および歌詞テロップなどに合成して表示画面300に表示させる。対応画像は、この例においては、撮影された歌唱者の画像、または、歌唱者などを擬似したキャラクタ(以下、アバターという)の画像であり、歌唱者によっていずれにするかが指示される。なお、後述するように、対応画像に対応付けられた参加者は、対応画像を変化させるために挙動が検出される対象となる人であり、対応画像が表す歌唱者とは一致しない場合がある。
【0013】
また、カラオケ装置1は、参加者によって指示された表示モードに応じた態様で、楽曲データの再生中に表示画面300に表示される対応画像の大きさを変化させる。なお、表示モードとしては、歌唱練習モード、デュエットバトルモード、および客席対抗モードが存在する。詳細の内容については後述する。まず、カラオケ装置1のハードウエア構成について説明する。
【0014】
カラオケ装置1は、制御部10、操作部20、表示部30、通信部40、記憶部50、音響処理部60、画像処理部70を有する。これらの各構成は、バスを介して接続されている。また、カラオケ装置1は、音響処理部60に接続されたスピーカ61および3つのマイクロフォン621、622、623、および画像処理部70に接続された3台のカメラ721、722、723を有する。
【0015】
制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部10は、ROMまたは記憶部50に記憶された制御プログラムを実行することにより、バスを介してカラオケ装置1の各部を制御する。この例においては、制御部10は、制御プログラムを実行することにより、表示制御機能を実現する。この表示制御機能においては、楽曲データを再生して表示画面300への表示内容を制御し、また、スピーカ61からの放音内容を制御する。また、表示内容の制御としては、参加者によって指示された表示モードに応じた態様で、表示画面300に表示される対応画像の大きさの制御が含まれる(図4、図5、図6参照)。
【0016】
操作部20は、操作パネルなどに設けられた操作ボタン、リモコンに設けられた操作ボタン、キーボード、マウスなどの操作デバイスであって、参加者の操作を受け付けて、その内容を示す操作信号を制御部10に出力する。操作部20への操作によって、参加者の指示が入力される。
表示部30は、液晶ディスプレイなどの表示デバイスであり、制御部10の制御に応じた内容を表示画面300に表示する。この表示の内容は、上述の表示制御機能によって表示される内容、例えば、カラオケの楽曲の進行に応じて表示される背景画像、歌詞テロップ、対応画像が含まれ、さらに、メニュー画面、歌唱音声の評価結果なども含まれる。
【0017】
通信部40は、制御部10の制御に応じて、インターネットなどの通信回線と接続して、サーバ装置などの通信装置と情報のやり取りを行う。また、この例においては、他のカラオケ装置1と接続し、情報のやりとりを行う。制御部10は、通信部40を介して取得した情報を用いて、記憶部50に記憶される情報を更新するようにしてもよい。また、通信部40は、ネットワークを介した通信に限らず、有線または無線により外部装置と接続可能に構成されたインターフェイスを有していてもよい。
【0018】
記憶部50は、ハードディスク、不揮発性メモリなどの記憶手段であり、楽曲データおよびアバター画像データをそれぞれ記憶する記憶領域を有する。
アバター画像データは、表示画面300に表示される画像のうち、アバターに関連する画像を示すデータである。
楽曲データは、カラオケの歌唱対象となる楽曲に関連するデータが含まれ、例えば、ガイドメロディデータ(以下、GMデータという)、伴奏データ、歌詞データ、背景データ、アバター制御データなどが含まれている。なお、デュエット曲においては、GMデータ、歌詞データは、歌唱パート(この例においては第1パート、第2パートなど)毎に対応するように設けられている。
【0019】
GMデータは、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容が指定されたデータであり、例えば、MIDI(Musical Instrument Digital Interface)形式により記述されている。伴奏データは、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。
歌詞データは、楽曲の歌詞の内容を示すデータ、および表示画面300に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。背景データは、表示画面300に表示される背景画像を示すデータである。この背景画像は、楽曲の進行に応じて変化するものであってもよいし、変化しないものであってもよい。
アバター制御データは、表示画面300に表示させるアバターの動作を、楽曲の進行に応じて規定するデータである。楽曲データの再生中においてアバター画像を表示させる場合には、アバター画像データをアバター制御データに応じて選択することにより、アバター画像の内容が決まるようになっている。
【0020】
なお、背景画像が各楽曲に対応して決められている必要がない、すなわち、どの楽曲でも同じ背景画像を用いる場合には、背景データは楽曲データ毎に設けられていなくてもよい。また、どの楽曲でもアバターの動作が同じものとする場合にも、アバター制御データが楽曲データ毎に設けられていなくてもよい。
また、楽曲データには、歌唱音声を評価するときに用いられる評価基準となる情報が含まれていてもよい。例えば、様々な歌唱技法を含む複数の評価項目(音高、ビブラート、抑揚、こぶし、フォール、リズムなど)の各々について、楽曲全体のうち評価を行う区間を規定する情報、評価項目の評価値を算出するための基準値などを有していればよい。
【0021】
楽曲データは、参加者による操作部20の操作によって指示された楽曲に対応するものが、制御部10(後述する再生部110(図3参照))によって読み出されて再生され、楽曲データに含まれる各データが、カラオケの伴奏音、ガイドメロディ音のスピーカ61からの出力、歌詞テロップ、背景画像およびアバター画像の表示画面300への表示に用いられる。なお、楽曲データには、楽曲のサビ部分の位置、メロディの出だし部分の位置など、楽曲の各構成部分の位置を規定する情報も含まれていてもよい。
【0022】
マイクロフォン621、622、623は、参加者の音声などが入力され、入力された音声などを示すオーディオ信号を音響処理部60に出力する。スピーカ61は、音響処理部60から出力されるオーディオ信号を放音する。
音響処理部60は、DSP(Digital Signal Processor)などの信号処理回路、MIDI形式の信号からオーディオ信号を生成する音源などを有する。音響処理部60は、マイクロフォン621、622、623から入力されるオーディオ信号をA/D変換(アナログデジタル変換)して、オーディオデータとして制御部10に出力する。このとき、オーディオデータは、A/D変換前のオーディオ信号を出力したマイクロフォンを識別する情報を対応付けて出力される。
音響処理部60は、制御部10から楽曲データに基づくMIDI形式の信号が入力され、その信号に基づいてオーディオデータを生成する。音響処理部60は、このように生成したオーディオデータ、制御部10から出力されたオーディオデータなどに、エフェクト処理、D/A変換(デジタルアナログ変換)、増幅処理などの信号処理を施してからスピーカ61に出力する。また、音響処理部60は、マイクロフォン621、622、623のうち制御部10によって決められたマイクロフォン(この例においては、マイクロフォン621、622)から入力されたオーディオ信号についても、上記信号処理などを施してスピーカ61に出力する。
【0023】
カメラ721、722、723は、予め決められた範囲を撮影し、撮影画像を示す撮影信号を画像処理部70に出力する。
画像処理部70は、カメラ721、722、723からの撮影信号をそれぞれ撮影画像データとして出力する。このとき、画像処理部70は、各カメラを識別する情報を各撮影画像データに対応付けて出力する。
以上が、カラオケ装置1のハードウエア構成についての説明である。
【0024】
[カラオケ装置1の設置態様]
図2は、本発明の実施形態におけるカラオケ装置1が設置された部屋1000を説明する図である。この例においては、カラオケ装置1は、部屋1000a、1000bに設置されている。それぞれのカラオケ装置1は通信部40を介して接続されている。部屋1000aに設置されたカラオケ装置1と、部屋1000bに設置されたカラオケ装置1とは、参加者によって指示された表示モードが客席対抗モードである場合に、連携して動作する。この場合には、各部屋のカラオケ装置1は、撮影画像データ、オーディオデータ、および表示制御機能において用いられる各種情報が通信部40を介して相互にやり取りするようになっている。以下、部屋1000aと1000bとを区別しない場合には、単に部屋1000という。
【0025】
部屋1000には、机1100および客席1200が設置されている。カラオケ装置1の表示画面300は、歌唱者および客席1200に座った観客から見える場所に位置している。表示画面300を有する筐体CNには、制御部10などバスに接続された各構成が設けられている。スピーカ61は、この例においては複数存在し、ステレオによる放音を行う。スピーカ61の放音範囲は、部屋1000の内部全体である。また、歌唱者Aが歌唱すべき範囲として歌唱範囲DAが決められ、歌唱者Bが歌唱すべき範囲として歌唱範囲DBが決められている。
【0026】
マイクロフォン621は、予め決められた歌唱範囲DA近傍に設置されている。以下の説明においては、マイクロフォン621を用いる歌唱者を歌唱者Aといい、マイクロフォン621から入力される音声を歌唱音声Aという。デュエット曲においては、第1パートを歌唱する歌唱者がこのマイクロフォン621を用いる。
マイクロフォン622は、予め決められた歌唱範囲DB近傍に設置されている。以下の説明においては、マイクロフォン622を用いる歌唱者を歌唱者Bといい、マイクロフォン622から入力される音声を歌唱音声Bという。デュエット曲においては、第2パートを歌唱する歌唱者がこのマイクロフォン622を用いる。
マイクロフォン623は、机1100に設置されている。マイクロフォン623から入力される音は、客席1200に位置する観客の音声を含んでいる。以下の説明においては、マイクロフォン623から入力された観客の音声を観客音声という。
なお、マイクロフォン621,622、623は、筐体CNとは異なる位置に設置されているが、狭い指向性を有する収音方向のマイクアレイなどを筐体CNに設置し、歌唱範囲DA、DB、客席1200方向からの音が入力されるようにしてもよい。
【0027】
カメラ721は、歌唱範囲DAを含む範囲(カメラ721から伸びる破線に対応)を撮影するように設置されている。歌唱中には、カメラ721は、歌唱者Aを撮影することになる。以下、この撮影画像を歌唱者A画像という。
カメラ722は、歌唱範囲DBを含む範囲(カメラ722から伸びる破線に対応)を撮影するように設置されている。歌唱中には、カメラ722は、歌唱者Bを撮影することになる。以下、この撮影画像を歌唱者B画像という。
カメラ723は、客席1200の少なくとも一部の範囲(カメラ723から伸びる破線に対応)を撮影するように設置されている。客席1200に観客がいる場合には、カメラ723は、観客を撮影することになる。以下、この撮影画像を観客画像という。
なお、カメラ721、722、723は、図2に示す例においては、筐体CNに取り付けられているが、部屋1000のいずれかの場所に設置されていてもよい。以上が、カラオケ装置1の部屋1000への設置態様についての説明である。
【0028】
[機能構成]
次に、カラオケ装置1の制御部10が制御プログラムを実行することによって実現される表示制御機能について説明する。なお、以下に説明する表示制御機能を実現するための各構成の一部または全部については、ハードウエアによって実現してもよい。
【0029】
図3は、本発明の実施形態における表示制御機能の構成を説明する機能ブロック図である。制御部10は、制御プログラムを実行すると、再生部110、取得部120、検出部130、決定部140、および表示制御部150を構成する。これらの構成により、制御部10は表示制御装置として機能する。
【0030】
再生部110は、予め歌唱者による操作部20の操作などにより指示された楽曲の楽曲データを読み出して再生する。再生部110は、楽曲データを再生することにより、楽曲データにおけるGMデータおよび伴奏データによって決められた音をスピーカ61から放音させるためのオーディオ信号を音響処理部60に出力する。
再生部110は、楽曲データにおける背景データ、歌詞データに応じた背景画像、歌詞テロップを表示画面300に表示させるための画像データを、表示制御部150に出力する。なお、再生部110は、楽曲データにおけるアバター制御データに従って、アバター画像を対応画像として表示画面300に表示させるための画像データについても表示制御部150に出力する。アバター画像を示す画像データについては、歌唱者によってアバター画像が対応画像として指示された場合にのみ出力されるようにしてもよい。
再生部110は、楽曲データにおけるGMデータが示す情報(各構成音の音高および期間)を決定部140に出力する。決定部140に出力されたGMデータに基づく情報は、後述するように歌唱音声の評価に用いられる。なお、上述した評価基準となる情報が楽曲データに含まれている場合には、再生部110は、この情報についても決定部140に出力する。
【0031】
なお、参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合については、再生部110は、上記処理となる一方、客席対抗モードである場合には部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは相互に再生タイミングを規定する情報をやり取りして、互いに同期して楽曲データを再生する。
【0032】
取得部120は、画像処理部70から出力される撮影画像データを取得し、カメラを識別する情報との対応関係を維持したまま、表示制御部150に出力する。なお、この撮影画像データについては、歌唱者によって撮影画像が対応画像として指示された場合にのみ出力されるようにしてもよい。以下の例においては、歌唱者によって撮影画像が対応画像として指示された場合を前提として説明するが、アバター画像が対応画像として指示された場合には、対応画像をアバター画像として置き換えればよい。
【0033】
参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合については、取得部120の処理は上記のとおりである。一方、客席対抗モードである場合には部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは相互に撮影画像データをやり取りし、一方の部屋1000のカラオケ装置1における取得部120は、他の部屋1000のカラオケ装置1における取得部120において取得される撮影画像データについても取得する。以下、部屋1000aの歌唱者Aおよび観客と、部屋1000bの歌唱者Aおよび観客とを区別する場合には、それぞれ、部屋1000aの歌唱者Aおよび観客については、歌唱者Aaおよび観客aといい、部屋1000bの歌唱者Aおよび観客については、歌唱者Abおよび観客bという。
このようにして撮影画像データをやり取りすることにより、各部屋1000のカラオケ装置1の取得部120は、ともに、歌唱者Aaおよび観客aの画像を示す撮影画像データおよび、歌唱者Abおよび観客bの画像を示す撮影画像データを取得する。
【0034】
検出部130は、歌唱音声Aを示すオーディオデータ、歌唱音声Bを示すオーディオデータ、および観客音声を示すオーディオデータを音響処理部60から取得することにより、歌唱者A、歌唱者Bおよび観客の音声を各人の挙動として検出する。なお、検出部130は、これらのオーディオデータのうち、参加者によって指示された表示モードに応じて、決定部140において用いられるオーディオデータのみ取得するようにしてもよい。
検出部130は、取得したオーディオデータを、各人の挙動の検出結果として決定部140に出力する。
【0035】
決定部140は、参加者によって指示された表示モードが歌唱練習モードおよびデュエットバトルモードである場合には、検出部130から出力されたオーディオデータ(検出結果)と再生部110から出力されたGMデータとに基づいて、音高の一致の程度に応じた評価値を予め決められた期間毎(例えば、構成音毎)に算出する。そして、決定部140は、この算出結果に応じて、表示制御部150によって表示画面300に表示させる対応画像の大きさを決定する。
このとき、決定部140は、参加者によって指示された表示モードに応じて、検出結果に応じて大きさを変化させる対応画像と、挙動の検出対象の人との対応付けを行っておく。この例においては、歌唱練習モードであれば、決定部140は、対応画像Aに歌唱者Aを対応付けるように決められている。また、デュエットバトルモードであれば、決定部140は、さらに、対応画像Bに歌唱者Bを対応付けるように決められている。ここで、対応画像Aとは、カメラ721による撮影画像(歌唱者A画像)であり、後述する歌唱者A表示領域CAに表示される画像である。また、対応画像Bとは、カメラ722による撮影画像(歌唱者B画像)であり、後述する歌唱者B表示領域CBに表示される画像である。このように、歌唱練習モードおよびデュエットバトルモードにおいては、対応画像に対応付けられている人は、その対応画像を得るための撮影対象の人と同じである。
【0036】
また、各表示モードに応じて対応画像の大きさの決定方法が異なる。歌唱練習モードである場合には、決定部140は、対応画像Aの大きさを、対応画像Aに対応付けられた歌唱者Aによって入力された歌唱音声Aを示すオーディオデータとGMデータとに基づいて算出した評価値に応じて決定する。この例においては、決定部140は、算出した評価値が高いほど対応画像Aの大きさが大きくなるように決定する。なお、対応画像Aの大きさは、算出した評価値の、直前の期間において算出された評価値に対する相対的な値に応じて決定されてもよいし、直前の対応画像Aの大きさに対する変化量として決定されてもよい。
【0037】
一方、デュエットバトルモードである場合には、決定部140は、対応画像Aの大きさおよび対応画像Bの大きさを、対応画像Aに対応付けられた歌唱者Aによって入力された歌唱音声Aに基づいて算出した評価値Aと、対応画像Bに対応付けられた歌唱者Bによって入力された歌唱音声Bに基づいて算出した評価値Bとの相対的な関係(例えば比率)に応じて決定する。評価値Aは、歌唱音声Aを示すオーディオデータとGMデータ(第1パート)とに基づいて算出し、評価値Bは、歌唱音声Bを示すオーディオデータとGMデータ(第2パート)とに基づいて算出する。
【0038】
この例においては、決定部140は、それぞれの評価値が異なっているほど、それぞれの対応画像の大きさの比率が異なるように、それぞれの大きさを決定する。例えば、評価値Aの評価値Bに対する比が大きいほど、対応画像Aを大きく、対応画像Bを小さくするように決定する。なお、対応画像の大きさは、算出された評価値Aの評価値Bに対する比の、直前の期間において算出された比に対する相対的な値に応じて決定されてもよいし、直前の対応画像の大きさに対する変化量として決定されてもよい。
【0039】
ここで、決定部140は、評価値の算出において、音高の一致の程度については公知の様々な方法を用いることができるが、例えば、以下のようにして行う。まず、決定部140は、検出部130からのオーディオデータを解析して、歌唱音声の音高(以下、歌唱音高という)を特定する。例えば、各フレームについてオーディオデータが示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによってフレーム毎の歌唱音高(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。なお、歌唱音高は、歌唱音声データにFFT(Fast Fourier Transform)を施して得られるスペクトルから特定してもよい。
【0040】
そして、決定部140は、歌唱音高とGMデータが示す構成音の音高(以下、指定音高という)の周波数から一定範囲(この例においては、±50cent)に含まれている期間の割合に応じて評価値を算出する。すなわち、各構成音について歌唱音高と指定音高とが近いほど評価値が高くなる。なお、上述したように楽曲データに評価基準となる情報が含まれている場合には、決定部140は、音高以外(例えば、ビブラートなど)の評価を評価値算出に用いてもよく、この場合においても公知の方法を用いて評価値を算出すればよい。なお、このような歌唱音声と基準値との比較により評価値を算出する場合に限られず、決定部140は、歌唱音声の音量レベルであったり、周波数分布から得られるパラメータなどを評価値として算出してもよい。すなわち、オーディオデータから得られるパラメータを評価値として用いればよい。
【0041】
続いて、客席対抗モードである場合についての決定部140の処理を説明する。この場合の決定部140は、対応画像Aaに観客aを対応付け、対応画像Abに観客bを対応付けるように決められている。ここで、対応画像Aaとは、部屋1000aのカラオケ装置1におけるカメラ721による撮影画像(歌唱者Aa画像)であり、後述する歌唱者Aa表示領域CAaに表示される画像である。また、対応画像Abとは、部屋1000bのカラオケ装置1におけるカメラ721による撮影画像(歌唱者Ab画像)であり、後述する歌唱者Ab表示領域CAbに表示される画像である。このように、客席対抗モードにおいては、対応画像に対応付けられている人は、その対応画像を得るための撮影対象の人とは異なっている。
決定部140は、対応画像に対応付けられた観客によって入力された観客音声の音量レベルを評価値として算出する。部屋1000aのカラオケ装置1と部屋1000bのカラオケ装置1とは、この算出結果を相互にやり取りする。
【0042】
決定部140は、観客a音声の音量レベルaと観客b音声の音量レベルbとの相対的な関係(例えば比率)に応じて、対応画像Aaの大きさと対応画像Abの大きさとを決定する。この例においては、決定部140は、それぞれの音量レベルが異なっているほど、それぞれの対応画像の大きさの比率が異なるように、それぞれの大きさを決定する。例えば、音量レベルaの音量レベルbに対する比が大きいほど、対応画像Aaを大きく、対応画像Abを小さくするように決定する。
【0043】
そして、決定部140は、上述のように表示モードに応じた方法で決定した対応画像の大きさ示す決定情報を表示制御部150に出力する。
【0044】
表示制御部150は、再生部110から出力される画像データ、取得部120から出力される撮影画像データ、および決定部140から出力される決定情報を用いて、表示画面300の表示内容を制御する。この表示内容は、参加者によって指示された表示モードによっても異なる。続いて、各表示モードにおける表示画面の300の表示内容について図4、図5、図6を用いて説明する。
【0045】
[歌唱練習モードの表示例]
図4は、本発明の実施形態における歌唱練習モードにおける表示画面300の表示態様を説明する図である。歌唱練習モードにおいては、表示画面300の表示領域は、ステージSTなどの背景画像が表示される背景表示領域BA、歌詞テロップが表示される歌詞表示領域LA、対応画像A(この例においては歌唱者A画像)が表示される歌唱者A表示領域CA、およびカメラ723の撮影画像である観客画像が表示される観客表示領域CCにより構成される。歌詞表示領域LAおよび歌唱者A表示領域CAは、背景表示領域BAに重畳した位置関係であり、歌詞表示領域LA、歌唱者A表示領域CAおよび観客表示領域CCに表示される画像は、背景表示領域BAにおける背景画像より優先して表示される。また、歌唱者A表示領域CAに表示される歌唱者A画像は、観客表示領域CCに表示される観客画像よりも優先して表示される。
【0046】
歌唱者Aが歌唱を開始する前においては、歌唱者A表示領域CA(歌唱者A画像)は、図4(a)に示す大きさで表示される。その後、楽曲の進行に伴い歌唱者Aの歌唱が開始されると、歌唱音声Aの評価値に応じて、歌唱者A表示領域CAの大きさが変更される。歌唱者A画像は、歌唱者A表示領域CAの大きさに合わせて縮小または拡大される。この例においては、歌唱音声Aの評価値が高くなるほど、図4(b)に示すように歌唱者A表示領域CAが大きくなる。一方、歌唱音声Aの評価値が低くなるほど、図4(c)に示すように歌唱者A表示領域CAが小さくなる。
【0047】
このように表示されることにより、参加者は、歌唱者Aの歌唱の巧拙に応じて、表示画面300に表示される歌唱者A画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aは、自分の画像が大きく表示されるように巧く歌唱しようとすることにより、歌唱中の雰囲気を盛り上げることができる。
【0048】
[デュエットバトルモードの表示例]
図5は、本発明の実施形態におけるデュエットバトルモードにおける表示画面300の表示態様を説明する図である。デュエットバトルモードにおいては、表示画面300の表示領域には、歌唱練習モードの場合の表示態様に追加して、対応画像B(この例においては歌唱者B画像)が表示される歌唱者B表示領域CBが構成される。歌唱者B表示領域CBに表示される歌唱者B画像は、背景表示領域BAにおける背景画像、および観客表示領域CCに表示される観客画像よりも優先して表示される。なお、歌唱者A表示領域CAと歌唱者B表示領域CBとが重なる場合には、大きい方の画像が優先して表示される。
【0049】
歌唱者Aおよび歌唱者Bが歌唱を開始する前においては、歌唱者A表示領域CAおよび歌唱者B表示領域CBは、図5(a)に示すように同じ大きさで表示される。その後、楽曲の進行に伴い歌唱者Aおよび歌唱者Bの歌唱が開始されると、歌唱音声Aの評価値および歌唱音声Bの評価値に応じて、歌唱者A表示領域CAと歌唱者B表示領域CBとの大きさが変更される。歌唱者A画像は、歌唱者A表示領域CAの大きさに合わせて縮小または拡大される。また、歌唱者B画像は、歌唱者B表示領域CBの大きさに合わせて縮小または拡大される。この例においては、歌唱音声Aの評価値が歌唱音声Bの評価値に比べて高くなるほど、図5(b)に示すように歌唱者A表示領域CAが大きくなり歌唱者B表示領域CBが小さくなる。すなわち、歌唱者Bが巧く歌っても、歌唱者Aがより巧く歌えば、歌唱者B画像は小さくなる。一方、歌唱音声Aの評価値が歌唱音声Bの評価値に比べて低くなるほど、図5(c)に示すように歌唱者A表示領域CAが小さくなり歌唱者B表示領域CBが大きくなる。
【0050】
このように表示されることにより、参加者は、歌唱者Aおよび歌唱者Bの歌唱の巧拙に応じて、表示画面300に表示される歌唱者A画像および歌唱者B画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aおよび歌唱者Bは、自分の画像が大きく表示されるように相手より巧く歌唱しようとすることにより、歌唱中の雰囲気を盛り上げることができる。
【0051】
[客席対抗モードの表示例]
図6は、本発明の実施形態における客席対抗モードにおける表示画面300の表示態様を説明する図である。客席対抗モードにおいては、表示画面300の表示領域は、ステージSTa、STbなどの背景画像が表示される背景表示領域BA、歌詞テロップが表示される歌詞表示領域LA、対応画像Aa(この例においては歌唱者Aa画像)が表示される歌唱者Aa表示領域CAa、部屋1000aのカラオケ装置1におけるカメラ723の撮影画像である観客a画像が表示される観客a表示領域CCa、対応画像Ab(この例においては歌唱者Ab画像)が表示される歌唱者Ab表示領域CAb、および部屋1000bのカラオケ装置1におけるカメラ723の撮影画像である観客b画像が表示される観客b表示領域CCbにより構成される。重畳した場合に優先して表示させる画像については、上記の説明と同様である。
部屋1000aにおけるカラオケ装置1の表示画面300に表示される内容と、部屋1000bにおけるカラオケ装置1の表示画面300に表示される内容とは、同じものが表示されるものとするが、異なる態様で表示されてもよい。
【0052】
歌唱者Aaおよび歌唱者Abが歌唱を開始する前においては、歌唱者Aa表示領域CAaおよび歌唱者Ab表示領域CAbは、図6(a)に示すように同じ大きさで表示される。その後、楽曲の進行に伴い歌唱者Aaおよび歌唱者Abの歌唱が開始されると、観客a音声の音量レベルaおよび観客b音声の音量レベルbに応じて、歌唱者Aa表示領域CAaと歌唱者Ab表示領域CAbとの大きさが変更される。歌唱者Aa画像は、歌唱者Aa表示領域CAaの大きさに合わせて縮小または拡大される。また、歌唱者Ab画像は、歌唱者Ab表示領域CAbの大きさに合わせて縮小または拡大される。
【0053】
この例においては、観客a音声の音量レベルaが観客b音声の音量レベルbに比べて高くなるほど、図6(b)に示すように、歌唱者Aa表示領域CAaが大きくなり、歌唱者Ab表示領域CAbが小さくなる。一方、観客a音声の音量レベルaが観客b音声の音量レベルbに比べて低くなるほど、図6(c)に示すように、歌唱者Aa表示領域CAaが小さくなり、歌唱者Ab表示領域CAbが大きくなる。すなわち、歌唱者Aaおよび歌唱者Abの歌唱の巧さではなく、観客aおよび観客bの盛り上がりの程度によって、歌唱者Aa画像と歌唱者Ab画像との大きさが変わる。なお、観客a画像および観客b画像の大きさについても、歌唱者Aa画像および歌唱者Ab画像の大きさに連動して変化するようにしてもよい。
【0054】
このように表示されることにより、参加者は、観客aおよび観客bの盛り上がりの程度に応じて、表示画面300に表示される歌唱者Aa画像および歌唱者Ab画像の大きさがリアルタイムに変化するのを見ることができる。したがって、例えば、歌唱者Aaおよび歌唱者Abは、自分の画像が大きく表示されるように相手より巧く歌唱して観客を盛り上げようとすることにより、歌唱中の雰囲気を盛り上げることができる。また、観客aおよび観客bについても、積極的に歌唱者が巧く歌唱できるように応援しようとすることで、歌唱中の雰囲気を盛り上げることができる。
【0055】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した実施形態において、検出部130は、歌唱音声、観客音声を示すオーディオデータを音響処理部60から取得することにより、参加者の音声を各人の挙動として検出していたが、参加者の動きを各人の挙動として検出するようにしてもよい。このような構成を実現するカラオケ装置1Aについて、図7を用いて説明する。
【0056】
図7は、本発明の変形例1における表示制御機能の構成を説明する機能ブロック図である。変形例1における制御部10Aは、制御プログラムを実行すると、再生部110、取得部120、検出部130A、決定部140A、および表示制御部150を構成する。また、カラオケ装置1Aの音響処理部60Aは、実施形態における構成と異なり、検出部130Aにオーディオデータを出力しない。一方、画像処理部70Aは、取得部120に出力する撮影画像データを、検出部130Aに対しても出力する。
【0057】
検出部130Aは、歌唱者A、歌唱者Bおよび観客の画像を示す撮影画像データを画像処理部70Aから取得することにより、歌唱者A、歌唱者Bおよび観客の動きを各人の挙動として検出する。検出部130Aは、このようにして取得した撮影画像データを、各人の挙動の検出結果として決定部140Aに出力する。
決定部140Aは、検出部130Aから出力された撮影画像データが示す画像を解析し、歌唱者などの人の動きの程度を評価値として算出する。これは、画像の内容の変化の程度を数値化することにより評価値として算出するものであってもよいし、画像の明るさなどを評価値として算出するものであってもよい。決定部140Aは、評価値を用いて対応画像の大きさを変化させる処理については、実施形態と同様に行えばよい。他の構成については、実施形態における構成と同様であるため説明を省略する。
【0058】
なお、カメラ721、722、723が、深度センサが取り付けられた構成とし、撮影範囲における深度を示す深度データを出力する構成とすれば、検出部130Aは、深度データを取得して決定部140Aに出力し、決定部140Aは、モーションキャプチャなどにおいて用いられる技術により、深度データに基づいて歌唱者などの人の動きの程度を評価値として算出してもよい。
【0059】
[変形例2]
上述した実施形態において、表示画面300に表示される歌唱者A画像、歌唱者B画像は、その大きさが変化することにより表示態様が変化するようになっていたが、他の方法により表示態様が変化するようになっていてもよい。例えば、画像の明度、彩度、色相などを変化させたり、画像の解像度を変化させたり、画像の形状を変化させたり、表示位置を振動させたりして、表示態様を変化させてもよい。
また、表示画面300が、裸眼またはメガネ等を用いて立体視の表示が可能な構成である場合には、画像の立体化の程度であったり、奥行き方向の位置を変化させることにより表示態様を変化させてもよい。この場合には、カメラ721、722、723の各々についても、複数地点から同時に撮影するなど、立体視可能な撮影方法に対応するようにしてもよい。
【0060】
[変形例3]
上述した実施形態において、カメラ721、722、723は予め決められた範囲を撮影範囲としていたが、撮影範囲が変更可能に構成され、歌唱者などが移動しても撮影範囲に歌唱者などが含まれるようにしてもよい。このような構成を実現するカラオケ装置1Bについて、図8を用いて説明する。
【0061】
図8は、本発明の変形例3における表示制御機能の構成を説明する機能ブロック図である。変形例3における制御部10Bは、制御プログラムを実行すると、実施形態における表示制御機能の各構成に加えて、位置特定部160を構成する。また、カラオケ装置1Bは、駆動部71および位置検出部80を有する。
駆動部71は、位置特定部160からの制御により、カメラ721、722、723の向きを変更するなどして、撮影範囲を変更させる。
【0062】
位置検出部80は、マイクロフォン621、622、623の位置を検出し、検出した位置を示す情報を位置特定部160に出力する。この位置の検出方法は、公知の方法を用いればよい。以下、いくつかの態様を例示する。
第1の態様として、位置検出部80は、部屋1000に設置され赤外線信号を出力するビーコン、およびマイクロフォン621、622、623に設けられビーコンからの赤外線信号を検出する構成を有するものとすればよい。この場合には、位置検出部80は、マイクロフォン621、622、623が検出した赤外線信号から、それぞれの位置を検出すればよい。
第2の態様として、位置検出部80は、マイクロフォン621、622、623に設けられ自身を識別する無線信号を出力する構成、およびカラオケ装置1Bの筐体CNに設けられ無線信号が出力される方向を認識する構成を有するものとすればよい。この場合には、位置検出部80は、認識した無線信号の出力方向をマイクロフォン621、622、623の位置として検出すればよい。
第3の態様として、位置検出部80は、マイクロフォン621、622、623に設けられ自身を識別する絵柄、およびこれを撮影するカメラ(カメラ721、722、723を用いてもよい)などを有するものとすればよい。この場合には、位置検出部80は、絵柄が撮影されたカメラの方向を、マイクロフォン621、622、623の位置として検出すればよい。
【0063】
位置特定部160は、位置検出部80からの情報を用いて、マイクロフォン621、622、623の位置を、歌唱者A、歌唱者B、観客の位置として特定する。そして、位置特定部160は、駆動部71を制御して、カメラ721、722、723の撮影範囲に、特定した歌唱者A、歌唱者B、観客のそれぞれの位置が含まれるように、撮影方向を変更させる。これにより、歌唱者などが移動しても、カメラ721、722、723の撮影範囲に含まれるようにすることができる。
【0064】
なお、上述した位置検出部80のようにマイクロフォン621、622、623の位置を検出することにより歌唱者などの位置を特定するのではなく、直接的に歌唱者などの位置を特定する構成を用いてもよい。この構成についても、公知の方法を用いればよい。例えば、位置特定部160は、マイクアレイを用いて歌唱者などから発生される歌唱音声の方向を認識することにより、歌唱者などの位置を特定してもよい。また、位置特定部160は、駆動部71を制御して撮影範囲が部屋1000の内部においてスキャンさせ、得られた撮影画像を解析することにより、歌唱者などの位置を特定してもよい。また、深度センサを用いたモーションキャプチャ技術、温度センサを用いた技術などにより歌唱者などの位置を特定してもよい。また、参加者が操作部20を操作して歌唱者の位置を入力することにより特定するようにしてもよい。
【0065】
[変形例4]
上述した実施形態において、デュエット曲の第1パートに対応する歌唱音声Aはマイクロフォン621から入力され、第2パートについての歌唱音声Bはマイクロフォン622から入力されるものとして予め決められていたが、この対応関係は予め決められていなくてもよい。この場合には、マイクロフォン621、622から入力された歌唱音声が、それぞれ第1パートの歌唱音声Aであるか第2パートの歌唱音声Bであるかを判定する判定部を設ければよい。この判定部は、それぞれのマイクロフォンに対応するオーディオデータを解析して得られる音高と、GMデータの各パートの構成音の音高とを比較し、いずれのパートと一致している程度が高いかに応じて判定すればよい。表示制御機能の各構成については、この判定結果にしたがって歌唱者A、歌唱者Bがいずれのマイクロフォンを用いているかが決められたものとして各処理を行えばよい。
【0066】
また、歌唱者練習モードの場合のように、歌唱者が1人である場合には、それぞれのマイクロフォンに対応するオーディオデータを解析して、音量レベルが一定値以上となるマイクロフォンを歌唱者が用いているものとして各処理を行えばよい。
これらの構成によれば、歌唱者が使用すべきマイクロフォンが予め決められていなくても、実施形態と同様な効果が得られる。
【0067】
[変形例5]
上述した実施形態において、歌唱者A、歌唱者Bおよび観客を撮影するカメラは、それぞれ個別のカメラ721、722、723を用いていたが、部屋1000の内部全体を撮影範囲とするカメラを用いてもよい。この場合には、画像処理部70は、撮影画像を解析し、歌唱者A、歌唱者Bおよび観客に対応する部分を抽出して、抽出した歌唱者A画像、歌唱者B画像、観客画像のそれぞれを示す撮影画像データを出力するようにすればよい。
このように観客を抽出する場合であって、客席1200に観客が複数存在する場合には、観客ごとに撮影画像データが出力されるようにして、表示画面300には複数の観客画像が表示されるようにしてもよい。
【0068】
[変形例6]
上述した実施形態におけて、デュエットバトルモードでは、歌唱者A画像と歌唱者B画像とは、その大きさが歌唱音声Aおよび歌唱音声Bについての評価値の相対的な値に応じて変化していたが、歌唱練習モードにおける場合と同様に、相対的でなくそれぞれ独立して画像の大きさが変化するようにしてもよい。この場合には、歌唱者A画像と歌唱者B画像との双方が大きくなる場合もある。客席対抗モードにおいても同様である。
【0069】
[変形例7]
上述した実施形態においては、表示画面300は、1台のカラオケ装置1について1つ設けられていたが、複数の表示画面が設けられていてもよい。この場合には、実施形態における表示画面300の表示領域の各構成要素が複数の表示画面に割り当てられていてもよい。例えば、歌唱者A画像と歌唱者B画像とが別の表示画面に表示されるようにしてもよいし、大きさが変化する画像と変化しない画像とが別の表示画面に表示されるようにしてもよい。また、表示領域の各構成要素のいくつかが複数の表示画面に表示されていてもよい。
【0070】
[変形例8]
上述した実施形態において、歌唱練習モードでは、歌唱音声Aの評価値に応じて歌唱者A画像の大きさが変化していたが、客席対抗モードのように観客音声の音量レベルに応じて歌唱者A画像の大きさが変化するようにしてもよい。この場合には、決定部140において対応画像Aに対応付けられる人は、歌唱者Aではなく観客となる。
また、デュエットバトルモードでは、対応画像Aに歌唱者Aが対応付けられ、対応画像Bに観客が対応付けられるようにしてもよい。客席対抗モードでは、対応画像Aaに歌唱者Aaが対応付けられ、対応画像Abに観客bが対応付けられるようにしてもよい。
なお、一つの対応画像に複数の人が対応付けられてもよい。例えば、歌唱練習モードにおいて、対応画像Aに歌唱者Aと観客とが対応付けられた場合には、決定部140は、歌唱音声Aに基づいて算出される評価値と観客音声の音量レベルにより算出される評価値とに基づいて、対応画像Aの大きさを決定すればよい。
【0071】
[変形例9]
上述した実施形態において、客席対抗モードでは、複数の部屋1000に設置されたカラオケ装置1を連動させ、楽曲データが同期して再生されるようにしていたが、必ずしも同期していなくてもよい。また、一方の部屋1000のカラオケ装置1をマスタ装置とし他方のカラオケ装置1をスレーブ装置として、マスタ装置はスレーブ装置を制御して、双方のカラオケ装置1全体を一つのカラオケ装置として取り扱ってもよい。この場合、例えば、カラオケ装置全体としてのスピーカ61の放音範囲は、部屋1000aの内部および部屋1000bの内部の双方の範囲になる。
【0072】
[変形例10]
上述した実施形態において、楽曲データに楽曲の各構成部分の位置を規定する情報が含まれている場合には、楽曲の構成部分に応じて、評価値の算出方法を変化させてもよい。例えば、サビの部分では評価値が高く算出されるように変化させればよい。また、デュエットバトルモードにおいては、デュエット曲の全期間にわたって第1パートと第2パートとの双方に構成音が存在するとは限らないため、例えば、第1パートのみの構成部分においては、第2パートに対応する歌唱音声Bに基づいて算出される評価値は一定値として固定しておけばよい。この一定値は、予め決められた値であってもよいし、既に算出された各期間の評価値に基づく値、例えば平均値などとしてもよい。
【0073】
[変形例11]
上述した実施形態において、音響処理部60は、マイクロフォン621に入力された歌唱音声Aを示すオーディオデータを出力するときに、他のマイクロフォン622、623に入力された歌唱音声Bおよび観客音声を用いて、マイクロフォン621に混入した歌唱音声Bおよび観客音声の成分をキャンセルする処理を行ってもよい。また、音響処理部60は、歌唱音声Aのスピーカ61からの成分をキャンセルする、すなわちエコーキャンセル処理を行ってもよい。
上記処理は、歌唱音声Bを示すオーディオデータ、観客音声を示すオーディオデータについても同様に適用してもよい。
【0074】
[変形例12]
上述した実施形態においては、歌唱者が最大2人の場合について説明したが、3人以上に対応していてもよい。
【0075】
[変形例13]
上述した実施形態における制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、カラオケ装置1は、制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0076】
1,1A,1B…カラオケ装置、10,10A,10B…制御部、20…操作部、30…表示部、300…表示画面、40…通信部、50…記憶部、60,60A…音響処理部、61…スピーカ、621,622,623…マイクロフォン、70,70A…画像処理部、71…駆動部、721,722,723…カメラ、80…位置検出部、110…再生部、120…取得部、130,130A…検出部、140,140A…決定部、150…表示制御部、160…位置特定部、1000a,1000b…部屋、1100…机、1200…客席
【特許請求の範囲】
【請求項1】
楽曲データを再生して、当該楽曲データが示す音を放音手段から放音させる再生手段と、
前記楽曲データの再生中に前記放音手段の放音範囲に位置する人の挙動を検出する検出手段と、
前記挙動の検出対象となる人に対応付けられた対応画像を示す画像データを取得する画像取得手段と、
前記楽曲データの再生中において表示画面に表示させる前記対応画像の表示態様を、前記検出された結果に基づいて決定する決定手段と、
前記取得された画像データを用いて、前記対応画像を前記決定された表示態様で前記表示画面に表示させる表示制御手段と
を具備することを特徴とする表示制御装置。
【請求項2】
前記放音範囲の少なくとも一部を撮影して、撮影画像を示す画像データを出力する撮影手段をさらに具備し、
前記画像取得手段は、前記撮影手段から出力される画像データを、前記対応画像を示す画像データとして取得する
ことを特徴とする請求項1に記載の表示制御装置。
【請求項3】
前記放音範囲の人の位置を特定する位置特定手段をさらに具備し、
前記撮影手段は、前記特定された位置に応じて撮影範囲を決定する
ことを特徴とする請求項2に記載の表示制御装置。
【請求項4】
前記検出手段は、前記放音範囲に位置する複数の人の各々の挙動を検出し、
前記画像取得手段は、前記複数の人の各々に対応して、前記対応画像を示す画像データを取得し、
前記決定手段は、前記各人について前記検出された結果の相対的な関係に基づいて、前記各人に対応する前記対応画像の表示態様を決定する
ことを特徴とする請求項1乃至請求項3のいずれかに記載の表示制御装置。
【請求項5】
前記検出手段は、前記放音範囲に位置する人によって入力される歌唱音声を、前記挙動として検出し、
前記決定手段は、前記歌唱音声を解析して評価値を算出し、算出した評価値に基づいて前記表示態様を決定する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の表示制御装置。
【請求項1】
楽曲データを再生して、当該楽曲データが示す音を放音手段から放音させる再生手段と、
前記楽曲データの再生中に前記放音手段の放音範囲に位置する人の挙動を検出する検出手段と、
前記挙動の検出対象となる人に対応付けられた対応画像を示す画像データを取得する画像取得手段と、
前記楽曲データの再生中において表示画面に表示させる前記対応画像の表示態様を、前記検出された結果に基づいて決定する決定手段と、
前記取得された画像データを用いて、前記対応画像を前記決定された表示態様で前記表示画面に表示させる表示制御手段と
を具備することを特徴とする表示制御装置。
【請求項2】
前記放音範囲の少なくとも一部を撮影して、撮影画像を示す画像データを出力する撮影手段をさらに具備し、
前記画像取得手段は、前記撮影手段から出力される画像データを、前記対応画像を示す画像データとして取得する
ことを特徴とする請求項1に記載の表示制御装置。
【請求項3】
前記放音範囲の人の位置を特定する位置特定手段をさらに具備し、
前記撮影手段は、前記特定された位置に応じて撮影範囲を決定する
ことを特徴とする請求項2に記載の表示制御装置。
【請求項4】
前記検出手段は、前記放音範囲に位置する複数の人の各々の挙動を検出し、
前記画像取得手段は、前記複数の人の各々に対応して、前記対応画像を示す画像データを取得し、
前記決定手段は、前記各人について前記検出された結果の相対的な関係に基づいて、前記各人に対応する前記対応画像の表示態様を決定する
ことを特徴とする請求項1乃至請求項3のいずれかに記載の表示制御装置。
【請求項5】
前記検出手段は、前記放音範囲に位置する人によって入力される歌唱音声を、前記挙動として検出し、
前記決定手段は、前記歌唱音声を解析して評価値を算出し、算出した評価値に基づいて前記表示態様を決定する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の表示制御装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【公開番号】特開2012−198305(P2012−198305A)
【公開日】平成24年10月18日(2012.10.18)
【国際特許分類】
【出願番号】特願2011−61019(P2011−61019)
【出願日】平成23年3月18日(2011.3.18)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
【公開日】平成24年10月18日(2012.10.18)
【国際特許分類】
【出願日】平成23年3月18日(2011.3.18)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
[ Back to top ]