説明

カラオケシステム

【課題】カラオケに合わせて歌唱者に対して画像処理を行うことによってカラオケの新たな娯楽性を提供することができるカラオケシステムを提供すること。
【解決手段】カラオケシステム100は、カラオケ中に、すなわち、歌唱者がカラオケの楽曲に合わせて歌唱するカラオケ中に、当該歌唱者を撮像するとともに、撮像された歌唱者の顔部分にキャラクタ画像を重畳するカラオケ画像を生成するようになっている。特に、本実施形態のカラオケシステム100は、撮像された歌唱者の顔領域を認識しつつ、当該歌唱者の表情及びその顔の向きを判別し、判別された顔の表情または顔の向きに基づいて、予め設定されたキャラクタ画像を変化させ、当該歌唱者の顔部分に重畳した合成画像を生成するようになっている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カラオケ用の楽音を再生するカラオケシステムに関し、特に、カラオケ中の歌唱者を撮像した画像に対して実行される画像処理の技術分野に属する。
【背景技術】
【0002】
近年、伴奏のみからなる楽曲データ(いわゆる、カラオケ用楽曲データ)を再生し、当該再生された楽曲データに併せてユーザが歌うカラオケは、娯楽や趣味として認知されている。また、一の店舗を複数の部屋に分け、各部屋毎に専用の装置、すなわち、カラオケシステムを設置してカラオケを提供するカラオケボックスなど、飲食店のサービスの一つとして提供されるのみならず、カラオケそのものを提供する店舗も多く出現し、数人のグループにてカラオケに興じることも広く行われている。
【0003】
また、最近では、カラオケの新たな楽しみ方として、カラオケの歌唱中に歌唱者(すなわち、ユーザ)を撮像し、かつ、その歌声及びカラオケの楽曲を集音して得た動画像を生成するカラオケシステムも実用化されている。
【0004】
例えば、このような歌唱者の歌唱状態の動画像を生成するカラオケシステムとしては、歌詞を加工しつつ、撮像された歌唱者の画像に重畳してその歌声及びカラオケの楽曲を集音して得た動画像を生成するようになっている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−72289号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載のカラオケシステムにあっては、撮像された歌唱者に対しては画像処理を行っておらず、撮像された歌唱者の歌唱状況を集音して得た音データとともに記録するだけである。
【0007】
本発明は、上記課題を解決するためになされたものであり、その目的は、カラオケに合わせて歌唱者に対して画像処理を行うことによってカラオケの新たな娯楽性を提供することができるカラオケシステムを提供することにある。
【課題を解決するための手段】
【0008】
(1)上記課題を解決するため、本発明のカラオケシステムは、複数の楽曲データから一の楽曲データを選択して当該選択された楽曲データを再生して楽音を出力させるとともに、当該楽音の出力に伴って前記選択された楽曲の歌詞を表示手段に表示するカラオケシステムあって、前記楽曲データを再生する再生手段と、前記再生された楽曲の楽音を出力するとともに集音手段によって集音された歌唱者の声を拡声する出力手段と、前記楽曲の再生に合わせて歌唱する歌唱者を撮像し、フレーム毎に撮像した画像を撮像画像として出力する撮像手段と、前記フレーム毎に、前記出力された撮像画像の中から当該歌唱者の顔部分の画像領域である顔領域を認識する認識手段と、前記認識された顔領域に、予め設定され画像であって人間の顔または擬人化されたものの顔を題材として創作された創作画像を重畳する画像処理を行う画像処理手段と、前記画像処理された画像を前記表示手段に表示させる表示制御手段と、を備え、前記画像処理手段が、前記集音手段によって集音された歌唱者の声に関する声情報、または、前記再生された楽曲データから前記歌唱者が歌う歌のパートに関する歌パート情報の少なくとも何れか一方の情報を順次カラオケ情報として取得するカラオケ情報取得手段と、前記取得されたカラオケ情報に基づいて前記重畳する創作画像を変化させる画像変換処理手段と、を含む構成を有している。
【0009】
この構成により、本発明のカラオケシステムは、撮像された歌唱者の顔に創作画像を重畳するとともに、例えば、楽曲で想定されている前記歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報または当該歌パートにおける歌詞を歌うタイミングを示す歌パートタイミング情報と、マイクロホンなどの集音手段によって集音された歌唱者の声量情報、または、当該集音された歌唱者の声の高さを示す歌唱者声高情報と、楽曲で想定されている歌パートのメロディに対する歌唱者の音程の一致度(採点結果)などのカラオケ情報に基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができる。したがって、本発明のカラオケシステムは、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0010】
(2)また、本発明のカラオケシステムは、前記声情報には、前記集音手段よって集音された歌唱者の声量値を示す声量情報、または、当該集音された歌唱者の声の高さを示す歌唱者声高情報の少なくとも何れか一方の情報が含まれるとともに、前記歌パート情報には、前記歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報、当該歌パートにおける歌詞を歌うタイミングを示す歌パートタイミング情報、または、当該歌パートにおける音量を示す歌パート音量情報の少なくとも何れか一方の情報が含まれる構成を有している。
【0011】
この構成により、本発明のカラオケシステムは、本発明のカラオケシステムは、撮像された歌唱者の顔に創作画像を重畳するとともに、楽曲で想定されている前記歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報または当該歌パートにおける歌詞を歌うタイミングを示す歌パートタイミング情報と、マイクロホンなどの集音手段によって集音された歌唱者の声量情報、または、当該集音された歌唱者の声の高さを示す歌唱者声高情報と、楽曲で想定されている歌パートのメロディに対する歌唱者の音程の一致度(採点結果)のカラオケ情報に基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができる。
【0012】
(3)また、本発明のカラオケシステムは、前記画像変換処理手段が、前記取得したカラオケ情報に含まれる値が予め定められた値以上の場合に、前記重畳する創作画像を変化させる構成を有している。
【0013】
この構成により、本発明のカラオケシステムは、歌唱者が大きな声を出している、または、高い音を出していることを想定することなど、歌唱者の表情を推定することができるので、歌唱者の実際の顔にマッチした創作画像を歌唱者の顔部分に重畳することができる。
【0014】
(4)また、本発明のカラオケシステムは、前記カラオケ情報に前記声情報と歌パート情報の双方が含まれる場合に、前記画像変換処理手段が、前記声情報と歌パート情報の同一の性質を有する情報の一致度に基づいて前記重畳する創作画像を変化させる構成を有している。
【0015】
この構成により、本発明のカラオケシステムは、例えば、同一の性質として、楽曲で想定されている歌パートのメロディに対する歌唱者の音程の一致度(採点結果)に基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができるので、一致度が低ければ歌唱者が悲しみ、一致度が高ければ歌唱者が喜ぶといった歌唱者の表情を推定することができる。したがって、本発明のカラオケシステムは、歌唱者の実際の顔にマッチした創作画像を歌唱者の顔部分に重畳することができる。
【0016】
(5)また、本発明のカラオケシステムは、一の顔を題材として創作された顔のパターンが異なる複数の創作画像から構成される創作画像群が複数記憶される記憶手段を更に備え、前記画像変換処理手段が、前記取得手段によって取得されたカラオケ情報に基づいて、一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる構成を有している。
【0017】
この構成により、本発明のカラオケシステムは、カラオケ情報に基づいて、撮像された歌唱者の顔領域に重畳された創作画像を簡易に変化させることができるので、システムの処理負担を軽減させることができるとともに、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0018】
(6)また、本発明のカラオケシステムは、前記楽曲データから曲調を示す曲調情報、曲構成部分を示す構成情報または楽曲の基準音の高さを示す基準音高情報の少なくとも何れか一の情報から構成される制御情報を取得する制御情報取得手段を更に備え、前記画像処理手段が、前記記憶手段に記憶された創作画像群の中から、前記取得されたカラオケ情報及び前記制御情報に基づいて一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる構成を有している。
【0019】
この構成により、本発明のカラオケシステムは、カラオケ情報に加えて、曲調情報または基準音高情報に基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができる。したがって、本発明のカラオケシステムは、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0020】
(7)上記課題を解決するため、本発明のカラオケシステムは、複数の楽曲データから一の楽曲データを選択して当該選択された楽曲データを再生して楽音を出力させるとともに、当該楽音の出力に伴って前記選択された楽曲の歌詞を表示手段に表示するカラオケシステムあって、前記楽曲データを再生する再生手段と、前記再生された楽曲の楽音を出力するとともに集音手段によって集音された歌唱者の声を拡声する出力手段と、前記楽曲の再生に合わせて歌唱する歌唱者を撮像し、フレーム毎に撮像した画像を撮像画像として出力する撮像手段と、前記フレーム毎に、前記出力された撮像画像の中から当該歌唱者の顔部分の画像領域である顔領域を認識する認識手段と、前記認識された顔領域に、予め設定され画像であって人間の顔または擬人化されたものの顔を題材として創作された創作画像を重畳する画像処理を行う画像処理手段と、前記画像処理された画像を前記表示手段に表示させる表示制御手段と、を備え、前記画像処理手段が、前記認識された顔領域の画像に基づいて前記歌唱者の表情または当該歌唱者の顔の向きを判別する判別手段と、前記判別された顔の表情または顔の向きに基づいて前記重畳する創作画像を変化させる画像変換処理手段と、を含む構成うぃ有している。
【0021】
この構成により、本発明のカラオケシステムは、撮像された歌唱者の顔に創作画像を重畳するとともに、歌唱者の表情及び向きに基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができる。したがって、本発明のカラオケシステムは、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0022】
(8)また、本発明のカラオケシステムは、一の顔を題材として創作された顔のパターンが異なる複数の創作画像から構成される創作画像群が複数記憶される記憶手段を更に備え、前記画像変換理手段が、前記記憶された創作画像群の中から、前記判別された顔の表情または顔の向きと、に基づいて、一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる構成を有している。
【0023】
この構成により、本発明のカラオケシステムは、カラオケ情報に基づいて、撮像された歌唱者の顔領域に重畳された創作画像を簡易に変化させることができるので、システムの処理負担を軽減させることができるとともに、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0024】
(9)また、本発明のカラオケシステムは、前記楽曲データから曲調を示す曲調情報、曲構成部分を示す構成情報または楽曲の基準音の高さを示す基準音高情報の少なくとも何れか一の情報から構成される制御情報を取得する制御情報取得手段を更に備え、前記画像処理手段が、前記記憶手段に記憶された創作画像群の中から、前記判別された顔の表情または顔の向きと前記取得された制御情報に基づいて一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる構成を有している。
【0025】
この構成により、本発明のカラオケシステムは、カラオケ情報に加えて、曲調情報または基準音高情報に基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができる。したがって、本発明のカラオケシステムは、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0026】
(10)また、本発明のカラオケシステムは、前記認識手段が、前記撮像画像に、前記歌唱者とは異なる非歌唱者が存在する場合に、前記フレーム毎に、前記出力された撮像画像の中から前記非歌唱者の顔領域を認識し、前記画像変換処理手段が、前記認識された非歌唱者の顔領域に、前記歌唱者とは異なる種類の創作画像を重畳させる構成を有している。
【0027】
この構成により、本発明のカラオケシステムは、被歌唱者についても顔をキャラクタ画像にすることによって、さらにユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0028】
(11)また、本発明のカラオケシステムは、前記再生手段が、前記創作画像が既に重畳された歌唱者の画像を、第1歌唱者画像として、当該第1歌唱者画像を生成したときの楽曲データ及び第1歌唱者の声データとともに再生し、前記出力手段、前記撮像手段、認識手段及び画像処理手段が当該再生された第1歌唱者画像に基づいて、第2歌唱者に対して動作するとともに、前記表示制御手段が、前記第1歌唱者画像に第2歌唱者の画像を合成した合成画像を前記表示手段に表示させる構成を有している。
【0029】
この構成により、本発明のカラオケシステムは、プライバシーの保護と自己の表現の公開との両立を実現することができるとともに、当歌唱者の顔の部分がキャラクタとなっている歌唱者画像の利用を通じて該歌唱者画像の生成するためのカラオケシステムの利用の促進を図ることができる。
【0030】
(12)また、本発明のカラオケシステムは、前記表示手段に表示された前記画像を画像データとしてネットワークに接続され、通信端末装置にて閲覧可能にサーバ装置にアップロードする通信手段を更に有する構成を備えている。
【0031】
この構成により、本発明のカラオケシステムは、歌唱者が自己のカラオケ画像を公開することができるので、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【発明の効果】
【0032】
本発明のカラオケシステムは、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【図面の簡単な説明】
【0033】
【図1】本発明に係るネットワークシステムの構成を示すブロック図である。
【図2】本発明に係るカラオケシステムの第1実施形態における構成を示すブロック図である。
【図3】第1実施形態のシステム用データベースに記録されているキャラクタ画像の例である。
【図4】第1実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【図5】本発明に係るカラオケシステムの第2実施形態における構成を示すブロック図である。
【図6】第2実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【図7】第3実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【発明を実施するための形態】
【0034】
次に、本発明に好適な実施の形態について、図面に基づいて説明する。
【0035】
以下に説明する実施の形態は、歌唱者を撮像しつつ、カラオケ用の楽曲データ(以下、単に「カラオケデータ」という。)を再生するカラオケシステムに対して本願のカラオケシステムを適用した場合の実施形態である。
【0036】
<第1実施形態>
はじめに、図1〜図4の各図を用いて本願に係る第1実施形態におけるネットワークシステム10とカラオケシステム100について説明する。
【0037】
[ネットワークシステムとカラオケシステムの概要]
まず、図1を用いて本実施形態のネットワークシステム10及びカラオケシステム100の概要について説明する。なお、図1は、本実施形態におけるネットワークシステム10の構成を示す構成図である。
【0038】
本実施形態のネットワークシステム10は、カラオケシステム100と、複数のカラオケデータを記録し、カラオケシステム100にカラオケデータを提供するカラオケデータ用データベース200と、カラオケを実行する際に歌唱者を撮像して生成されたカラオケ画像のデータ(以下、「カラオケ画像データ」という。)を記憶し、当該記憶したカラオケ画像データの管理を行う管理サーバ装置300と、複数の端末装置400と、から構成される。また、カラオケシステム100、カラオケ用データベース、管理サーバ装置300及び各端末装置400は、インターネット上において提供されるWorld Wide Web システムなどのネットワークNによって相互に接続される。
【0039】
本実施形態のカラオケシステム100は、カラオケボックスなどの店舗内に設置され、歌唱者の操作に基づいて、カラオケデータ用データベース200から特定のカラオケデータを取得し、歌唱者がカラオケの楽曲に合わせて歌唱可能にその再生を実行するようになっている。また、カラオケシステム100は、カラオケ中に、すなわち、歌唱者がカラオケの楽曲に合わせて歌唱する歌唱中に、当該歌唱者を撮像するとともに、撮像された歌唱者の顔部分に所定のキャラクタの画像(以下、「キャラクタ画像」または「創作画像」という。)を重畳するカラオケ画像を生成するようになっている。特に、本実施形態のカラオケシステム100は、撮像された歌唱者の顔の領域(以下、「顔領域」という。)を認識しつつ、当該歌唱者の表情及びその顔の向きを判別し、判別された顔の表情または顔の向きに基づいて、予め設定されたキャラクタ画像を変化させ、当該歌唱者の顔部分に重畳した合成画像を生成するようになっている。そして、カラオケシステム100は、生成したカラオケ画像をデータ(以下、「カラオケ画像データ」という。)として管理サーバ装置300にコンピュータまたは携帯用電話機などの端末装置400によって閲覧可能にアップロードするようになっている。
【0040】
カラオケデータ用データベース200は、カラオケデータの種別毎に、カラオケデータを選曲番号データに対応付けて格納するためのデータベースである。例えば、このカラオケデータ用データベース200には、選曲番号毎に、カラオケ用の楽曲データと、カラオケデータの再生中に表示させる歌詞データと、が対応付けて記憶されている。また、カラオケ用の楽曲データには、複数の楽器の演奏音を再生制御するためのMIDI(Musical Instrument Digital Interface)データ、背景を表示部114に表示する際に用いる曲調を示す曲調情報、Aメロ、Bメロ、サビなど楽曲の構成を示す楽曲構成情報、歌パートの基準音(キー)の音高を示す音高情報などのデータが含まれる。
【0041】
管理サーバ装置300は、アップロードされたカラオケ画像データを記録する図示しないデータベースを有し、当該記憶されたカラオケ画像データを管理するようになっている。特に、管理サーバ装置300は、ユーザIDと、固有のURL(Uniform Resource Locator)と呼ばれるアドレス(以下、「URL」という。)と、に基づいて、データベース100に記憶され、また、信端末装置400によって指定されて読み出されるようになっている。特に、カラオケ画像データは、HTML(Hyper Text Markup Language)またはXML(eXtensible Markup Language)などのマークアップ言語によって構成されているWWWシステム用のリソースデータ(以下、「Webページデータ」ともいう。)における構成要素データとして構築され、各端末装置400に搭載されたブラウザ機能によって閲覧可能になっている。
【0042】
各端末装置400は、携帯用電話機などの携帯用通信端末装置またはパーソナルコンピュータであり、URLに基づいてWebページデータを閲覧可能に表示するブラウザを搭載している。そして、各端末装置400は、ユーザIDに専用のWebページにアクセスし、かつ、URLアドレスに基づいてカラオケ画像データを特定すると、当該カラオケ画像データを閲覧することができるようになっている。
【0043】
この構成により、本実施形態のカラオケシステム100は、生成した歌唱者の顔部分にキャラクタ画像を重畳した合成画像を他の端末装置400において閲覧可能にアップロードすることができるので、歌を歌う、または、他人の歌を聴くカラオケの本来の楽しみ方に加えて、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができるようになっている。
【0044】
また、本実施形態のカラオケシステム100においては、歌唱者本人を限定せずに、自己が歌唱しているカラオケ画像を公開することができるので、顔を公開することへの抵抗を感じている歌唱者であっても、プライベートを保護しつつ、新たな娯楽性を提供することができるとともに、このような動画サービスの利用を促進させることができる。
【0045】
[カラオケシステムの構成]
次に、図2または図3を用いてを用いて本実施形態のカラオケシステム100の具体的な構成及びその動作について説明する。なお、図2は、本実施形態におけるカラオケシステム100の構成を示す構成図であり、図3は、システム用データベースに記録されているキャラクタ画像の例である。
【0046】
本実施形態のカラオケシステム100は、図2に示すように、ネットワークを介して複数のカラオケ用のデータが記録されるカラオケデータ用データベース200からカラオケデータを取得するための通信を行う通信制御部102と、カラオケデータを再生するカラオケ再生部104と、各部を制御するシステム制御部106と、を備えている。
【0047】
また、このカラオケシステム100は、カラオケデータの再生その他の操作を行う操作部108と、マイクロホンMから入力された音声信号に対して所定の処理を行う音声入力処理部110と、再生されたカラオケデータに対応してカラオケ用の楽音をスピーカSPに拡声させる拡声処理部112と、カラオケデータの再生中に背景画像、カラオケ画像及び歌詞を表示するための表示部114と、表示部114を制御する表示制御部116と、を備えている。
【0048】
さらに、カラオケシステム100は、主に歌唱者を撮像する撮像カメラ装置118と、アバターやキャラクタの顔部分の画像、すなわち、キャラクタ画像がデータとしてキャラクタ毎に記憶されるとともに、撮像された歌唱者の画像が記憶されるデータベース(以下、「システム用データベース」という。)120と、撮像カメラ装置118から出力されたフレーム毎の画像から歌唱者の顔部分の画像領域(すなわち、顔領域)を認識し、アバターやキャラクタの顔部分の画像を歌唱者の顔部分に重畳表示させる画像処理部130と、を備えている。
【0049】
なお、例えば、本実施形態の通信制御部102は、本発明の通信手段を、カラオケ再生部104は、本発明の再生手段を、スピーカは、本発明の出力手段を構成する。また、例えば、本実施形態の表示制御部116は、本発明の表示制御手段を、撮像カメラ装置118は、本発明の撮像手段を、システム用データベース120は、本発明の記憶手段を、画像処理部130は。本発明の認識手段及び画像処理手段を構成する。
【0050】
通信制御部102は、システム制御部106の制御の下、ネットワークを介してカラオケデータ用データベース200に接続して通信回線を構築し、カラオケデータの授受のための通信を行うようになっている。特に、通信制御部102は、操作部108によって入力されたカラオケデータを指定する選曲番号のデータ(以下、「選曲番号データ」という。)に基づいて、カラオケデータ用データベース200から、選曲番号データの選曲番号に対応付けられて記録されているカラオケデータを取得し、カラオケ再生部104に出力するようになっている。
【0051】
また、通信制御部102は、システム制御部106の制御の下、ネットワークを介して管理サーバ装置300に接続して通信回線を構築し、生成されたカラオケ画像データをアップロードするための通信を行うようになっている。
【0052】
カラオケ再生部104は、MIDI音源を有し、システム制御部106の制御の下、操作部108を介して入力された選曲番号から出力された選曲番号データに基づいて、通信制御部102を介してカラオケデータ用データベース200からカラオケデータを取得するようになっている。そして、カラオケ再生部104は、取得したカラオケデータに基づいてMIDI音源を制御する再生処理を行うようになっている。また、カラオケ再生部104は、カラオケデータの再生開始時には、取得したカラオケデータに基づいてシステム用データベース120に記憶された背景画像データを選択して出力開始を指示する。さらに、カラオケ再生部104は、再生処理によって生成された楽音データを拡声処理部112170に出力するとともに、歌詞データを表示部114に所定のタイミングにて出力するようになっている。
【0053】
システム制御部106は、主に中央演算処理装置(CPU)とROM及びRAMによって構成され、各部とバスBによって接続されている。また、このシステム制御部106は、操作部108を介して入力された選曲番号に基づいてカラオケデータの取得制御及び再生制御を行うとともに、撮像カメラ装置118と連動して歌唱者の撮像を行いつつ、当該歌唱者の顔部分にキャラクタ画像を重畳表示するカラオケ画像データを生成するカラオケ画像生成処理の制御を実行するようになっている。また、システム制御部106は、カラオケ画像データの生成時に、生成されたカラオケ画像データとカラオケ再生部104において再生された楽曲データ及びマイクロホンMから入力された歌唱者の声データをミキシングさせつつ、システム用データベース120に記憶する記憶制御を行う。そして、システム制御部106は、カラオケ画像データを生成して記憶すると、通信制御部102、操作部108及び表示部114と連動して管理サーバ装置300にアップロードするアップロード処理を実行するようになっている。なお、カラオケ画像生成処理及びアップロード処理の動作の詳細については、後述する。
【0054】
操作部108は、カラオケシステム100の筐体前面等に設けられたコントロールパネルまたはリモートコントロールユニットによって構成され、各種確認ボタン及び数字キー等の多数のキーを有している。特に、本実施形態の操作部108は、カラオケデータの選曲、図示しないマイクロホンMの音量操作などカラオケを実行するための各種の操作の他に、カラオケ画像生成処理を実行する際の開始指示、キャラクタ画像の選択指示及びカラオケ画像データにおけるアップロード指示に用いられるようになっている。
【0055】
拡声処理部112は、システム制御部106の制御の下、カラオケ再生部104から出力された音データをアナログ形式のオーディオ信号に変換する処理及び変換されたオーディオ信号を所定のレベルに増幅してスピーカSPに出力する処理を行うようになっている。
【0056】
なお、スピーカSPは、カラオケシステム100が設けられた設置場所によって適したシステムによって構成されている。
【0057】
表示部114は、例えば、有機EL(Electro−Luminescence)素子、液晶表示素子またはCRT(Cathode Ray Tube)によって構成され、表示部114の制御にしたがって所定の映像信号を表示するようになっている。具体的には、この表示部114は、背景画像を表示しつつ、音データの出力、すなわち、再生される楽曲に併せて歌詞データを表示するようになっている。また、表示部114は、背景画像に代えて、キャラクタ画像が重畳された歌唱者の画像、すなわち、カラオケ画像を表示するようになっている。
【0058】
表示制御部116は、システム制御部106の制御の下、通常再生時の背景(すなわち、カラオケ画像生成処理を実行しないときに表示部114に表示される背景)若しくはカラオケ画像を表示するための画像データ及び歌詞データに基づいて、表示部114に表示させるための表示データを生成して表示部114に出力するようになっている。特に、この表示制御部116は、背景画像またはカラオケ画像と歌詞データを重畳的に表示部114に表示させるとともに、音データの出力、すなわち、再生される楽曲に併せて歌詞データを表示部114に表示させるための表示制御を行うようになっている。
【0059】
システム用データベース120には、曲調毎に対応付けられた背景画像が記憶されているとともに、キャラクタ毎に正面、左右側面、背面など複数のパターン画像が記憶されている。すなわち、システム用データベース120には、一のキャラクタを題材として創作された顔のパターンが異なる複数のキャラクタ画像から構成されるキャラクタ画像群がキャラクタ毎に記憶されている。なお、このキャラクタには、動物またはアニメーションなどをモチーフとして擬人化されたものの他に、アバターと言われる仮想現実世界において自分の分身として用いるキャラクタが含まれる。
【0060】
例えば、アバターとしては、システム用データベースには、図2(a)、(b)、(c)及び(d)に示すように、一のキャラクタを題材として創作された顔のパターンが異なる複数のキャラクタ画像から構成されるキャラクタ画像群がキャラクタ毎に記憶されている。なお、各図2において右から、正面図、右斜め側面図、右側面図、左斜め側面図である。また、この他にも、背面図及び左側面図などが記憶されている。
【0061】
撮像カメラ装置118は、光電変換する撮像素子(以下、「CCD」という)と、当該CCDを格納する筐体及び撮像レンズなどのカメラ機構と、を備え、カラオケ中にCCDに形成された対象物の影像をフレーム毎に所定の画像データに変換し、画像処理部130に出力するようになっている。また、撮像カメラ装置118は、システム制御部106によって撮像開始などの各種の動作が制御される。
【0062】
画像処理部130は、カラオケ画像生成処理を実行する際に、カラオケ画像を生成するための各種の処理を行うようになっている。具体的には、画像処理部130は、撮像カメラ装置118から出力されたフレーム毎の画像(以下、「フレーム画像」という。)に対して、当該フレーム画像内における歌唱者の顔部分の顔領域を認識しつつ、歌唱者の表情及びその顔の向きを判別し、判別された顔の表情または顔の向きに基づいて重畳するキャラクタ画像を変化させるようになっている。具体的には、画像処理部130は、顔領域を認識する認識処理部131と、認識された顔領域から歌唱者の表情及び向きを判別する表情/向き判別部132と、判別された歌唱者の表情及び向きに基づいて、予め設定されたキャラクタからシステム用データベース120に記憶された一のキャラクタ画像を選択し、顔領域に重畳する画像変換処理部133と、から構成されている。
【0063】
なお、例えば、本実施形態の認識処理部131は、本発明の認識手段を構成し、表情/向き判別部132は、本発明の判別手段を構成する。また、例えば、本実施形態の画像変換処理部133は、本発明の画像変換処理手段を構成する。
【0064】
認識処理部131は、例えば、フレーム画像からY・Cr・Cb表色系(Y(輝度)、Cr(赤さ)、Cb(青さ))を用いて肌色領域を検出し、当該検出した部分を顔領域として認識する顔画像認識処理、フレーム画像の各領域と予め定められたテンプレートの画像とを比較し、そのマッチング度合いが高い領域を顔領域として認識する顔画像認識処理、または、その双方の認識処理を用いてフレーム毎に顔領域を認識するようになっている。また、認識処理部131は、一度認識した顔領域については、次のフレームでも現フレームの近傍に存在することを想定して顔領域を追従するための演算処理を実行し、顔領域の認識能力を高めている。
【0065】
表情/向き判別部132は、肌色領域及び髪領域の割合を算出しつつ、目、鼻、口などの顔の各部位に対して主成分分析を行って特徴量を抽出するLFA(Local Feature Analysis)法、または、画像を複数のフィルタリング処理を実行し、それぞれの画像を細分化して局所的に特徴量を算出するパターン分布特徴を用いて顔特徴を抽出するGabor
Wavelet変換法などの各方法に基づく表情/向き判別処理を行って、顔の向き及びその表情を判別するようになっている。
【0066】
例えば、表情/向き判別部132は、表情としては、笑顔の他に、苦しそうに大きな声を叫んでいる表情を示す絶叫顔、目を閉じて眉をひそめて歌によって酔っている表情を示す陶酔顔など各種のカラオケ中の特徴的な表情を判別するようになっている。また、表情/向き判別部132は、右側面、右斜め、正面、左斜め、左側面及び後ろ向きの各顔の向きを判別するようになっている。なお、本実施形態においては、表情/向き判別部132は、顔の表情のみ、または、顔の向きのみ判別してもよいし、その双方を判別するようにしてもよい。
【0067】
画像変換処理は、フレーム画像毎に、表情/向き判別部132によって特定された、顔の表情、顔の向きまたはそれらの双方に基づいて、システム用データベース120を検索し、予め設定されたキャラクタにおける該当する顔の表情及び向きのキャラクタ画像を特定するようになっている。具体的には、画像変換処理部133は、表情/向き判別部132によって右斜めを向いていると判別された場合には、システム用データベース120に予め歌唱者によって設定されたキャラクタにおいて右斜めの画像として登録されているキャラクタ画像(すなわち、設定されたキャラクタにおいて右斜め方向である属性情報を有するキャラクタ画像)を検出するようになっている。そして、画像変換処理部133は、検出したキャラクタ画像を、認識処理部131において認識された顔領域上に、大きさを調整しつつ、重畳させるための画像変換処理を行うようになっている。
【0068】
[カラオケ画像生成処理を含むアップロード処理]
次に、図3を用いて本実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明する。なお、図3は、本実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【0069】
まず、操作部108によってカラオケデータの選曲前にカラオケ画像生成処理を実行する旨の指示が入力されると(ステップS101)、システム制御部106は、システム用データベース120に記憶された複数のキャラクタを表示部114に表示させ、表示部114及び操作部108と連動して歌唱者または歌唱者以外の他のユーザに一のキャラクタを選択させるための処理を実行する(ステップS102)。
【0070】
次いで、システム制御部106は、操作部108からの選曲データの入力を待ってカラオケ再生部104にカラオケデータの再生、及び、撮像カメラ装置118に歌唱者の撮像を開始させるとともに、画像処理部130に、当該歌唱者におけるカラオケ画像生成処理の実行を開始させる(ステップS103)。なお、画像処理部130は、カラオケ画像生成処理の実行が開始されると、フレーム毎に以下の処理を実行するとともに、システム制御部106は、各フレーム毎のフレーム画像を、再生された楽曲データ及び歌唱者の声データとともにミキシングしつつ順次システム用データベース120に記録する。
【0071】
まず、認識処理部131は、入力されたフレーム画像から上述した顔画像認識処理を実行し、当該フレーム画像における顔領域を判別する(ステップS104)。
【0072】
次いで、表情/向き判別部132は、認識された顔領域の画像に基づいて表情/向き判別処理を実行し、歌唱者の表情及び向きを判別する(ステップS105)。
【0073】
次いで、画像変換処理部133は、判別された表情及び向きと一致するキャラクタ画像をシステム用データベース120から読み出し、認識された顔領域上に、大きさを調整しつつ、重畳させるための画像変換処理を行う(ステップS106)。画像変換処理が実行されると、表示制御部116は、キャラクタ画像が重畳されたフレーム画像を表示部114に表示し、システム用データベース120に記録する。
【0074】
次いで、システム制御部106は、カラオケの再生が終了したか否かを判断し(ステップS107)、カラオケの再生が終了していないと判断した場合には、ステップS104の処理に移行して画像処理部130に次のフレーム画像について所定の処理を実行させ、カラオケの再生が終了していとと判断した場合には、ステップS108の処理に移行する。
【0075】
次いで、システム制御部106は、表示部114に、生成されたカラオケ画像をアップロードするか否かを選択させるための表示を行ってその入力を待機する(ステップS108)。
【0076】
次いで、システム制御部106は、操作部108からの入力に基づいて、生成されたカラオケ画像データを管理サーバ装置300にアップロードするか否かを判断し(ステップS109)、生成されたカラオケ画像データを管理サーバ装置300にアップロードしないと判断した場合には、本動作を終了させる。
【0077】
一方、システム制御部106は、生成されたカラオケ画像データを管理サーバ装置300にアップロードすると判断した場合には、通信制御部102を介して当該カラオケ画像データを管理サーバ装置300にアップロードするとともに、アップロード先のURLアドレスを取得して表示部114に表示させて(ステップS110)、本動作を終了させる。
【0078】
なお、このとき、システム制御部106は、操作部108及び表示部114と連動してアップロードする際に、楽曲名称、ユーザID及びデータ名称などの各情報の入力を促すとともに、楽曲IDなどの属性情報をカラオケ再生部104などから読み出して各入力された各情報及び属性情報とともに、カラオケ画像データをアップロードする。また、システム制御部106は、取得したURLアドレスを携帯用電話機などの他の通信端末装置に送信する処理を行ってもよいし、当該URLを2次元バーコードとして表示部114に表示してもよい。
【0079】
[作用効果]
以上本実施形態のカラオケシステム100は、撮像された歌唱者の顔にキャラクタ画像を重畳するとともに、歌唱者の表情及び向きに基づいて撮像された歌唱者の顔に重畳する創作画像を変化させることができるので、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0080】
また、本実施形態のカラオケシステム100は、カラオケ情報に基づいて、撮像された歌唱者の顔領域に重畳された創作画像を簡易に変化させることができる。
【0081】
また、本実施形態のカラオケシステム100は、プライバシーの保護と自己の表現の公開との両立を実現することができるとともに、当歌唱者の顔の部分がキャラクタとなっている歌唱者画像の利用を通じて該歌唱者画像の生成するためのカラオケシステム100の利用の促進を図ることができる。
【0082】
[変形例]
本実施形態においては、歌唱者の表情または向きに加えて、カラオケ再生部104によって、カラオケデータに含まれる曲調情報、基準音高情報及び楽曲構成情報を取得し、画像変換処理部133は、当該取得された曲調情報または基準音高情報に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させてよい。例えば、バラードを歌唱している場合には、キャラクタ画像の表情をしかめて雰囲気を暗くするキャラクタ画像を用い、ノリの激しい曲を歌唱している場合には、左右に向くときにその向きの変化を大きくするようにキャラクタ画像を重畳する。したがって、この場合には、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を更に楽しむ新たな娯楽性を提供することができる。なお、例えば、この場合においては、カラオケ再生部104は、本発明の制御情報取得手段を構成する。
【0083】
また、本実施形態においては、歌唱者の顔のみにキャラクタ画像を重畳しているが、撮像画像に、歌唱者とは異なる非歌唱者が存在する場合に、フレーム毎に、出力された撮像画像の中から非歌唱者の顔領域を認識し、画像変換処理部133は、認識された非歌唱者の顔領域に、予め設定された、もしくは、ランダムに選択された、歌唱者とは異なる種類のキャラクタ画像、または、歌唱者同一の種類のキャラクタ画像を重畳させてもよい。この場合には、被歌唱者についても顔をキャラクタ画像にすることによって、さらにユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0084】
本実施形態においては、各フレーム画像の顔領域の大きさに基づいてキャラクタ画像の大小を調整しつつ、当該フレーム画像に重畳するようになっているが、カラオケ画像生成処理前に、表示部114に表示された画像を閲覧しつつ、当該基準となるキャラクタ画像の大きさを定め、当該定めたキャラクタ画像の大きさに基づいて、フレーム画像にキャラクタ画像を重畳してもよい。
【0085】
本実施形態においては、画像変換処理部133は、予めシステム用データベース120に記憶されたキャラクタ画像を歌唱者が撮像されたフレーム画像の顔領域上に重畳することによって歌唱者の画像にキャラクタ画像を合成しているが、データベースに記憶された単一の3Dのキャラクタ画像に対して演算処理を実行して、表情/向き判別部132によって判別された表情及び向きに該当する画像を生成し、生成された画像をフレーム画像の顔領域上に重畳するようにしてもよい。
【0086】
また、本実施形態の画像変換処理部133は、撮像された歌唱者の顔領域にキャラクタ画像を重畳するようになっているが、背景に対して星または雪などの装飾的な画像を重畳するようにしてもよい。この場合には、画像変換処理部133は、特に、歌唱者の画像の予め定められた所定の領域に、装飾画像を表示する。また、上述の曲調情報、基準音高情報または楽曲構成情報に基づいて、装飾画像を間奏またはサビ終わりなどの所定のタイミングに表示してもよい。
【0087】
また、本実施形態の画像処理部130においては、フレーム画像における歌唱者の顔領域にキャラクタ画像を重畳するようになっているが、当該フレーム画像における歌唱者全身の領域(以下、「全身領域」という。)にアバターなどのキャラクタ全体の画像(以下、「キャラクタ全体画像」という。)を重畳するようにしてもよい。
【0088】
この場合には、認識処理部131は、操作部108と表示部114と連動してカラオケをスタートさせる前に予め撮像された歌唱者の画像から歌唱者全身領域のピクセル特徴量を登録させる。そして、認識処理部131は、フレーム画像毎に、当該各フレーム画像を構成する各ピクセル特徴量から歌唱者全身領域のピクセル特徴量を算出して、同一の特徴量を有するピクセル群を歌唱者全身領域として認識するようになっている。
【0089】
なお、認識処理部131は、一の画像フレームにおける歌唱者全身領域を認識する際に、前フレーム画像によって特定された歌唱者全身領域の各ピクセルの情報に基づいて演算の効率化を図ることも可能である。すなわち、一のフレーム画像について歌唱者全身領域の画像に属する各ピクセルは、次のフレーム画像においては前フレーム画像の歌唱者全身領域の各ピクセル位置に隣接するピクセル位置に存在することが想定できるので、前フレーム画像の各ピクセル位置に隣接する各ピクセルについてピクセル特徴を重点的に算出することによって、フレーム画像全体を一から算出して比較するよりは演算効率を図ることができる。
【0090】
また、この場合に、表情/向き判別部132は、顔だけでなく全身の向きを検出し、画像変換処理部は、当該歌唱者の全身の動きを判別し、当該判別した全身の動きにマッチするキャラクタ画像を、カラオケデータ用データベースから読み出す。例えば、表情/向き判別部132は、正面、右向き、左向き、背面の他に、ジャンプまたは踊っている手足の動きを検出し、歌唱者の向きと動きを判別するようになっている。そして、画像変換処理部132は、当該判別された向きと動きに基づいてシステム用データベース120から一のキャラクタ画像を選択して該当する歌唱者全身領域に重畳する。なお、キャラクタ画像の選択に対しては顔領域の場合と一緒である。
【0091】
<第2実施形態>
次に、図5及び図6を用いて本願に係る本実施形態における第2実施形態のカラオケシステム100について説明する。
【0092】
本実施形態は、第1実施形態において、歌唱者の顔の表情及び顔の向きに基づいてキャラクタ画像を変化させる点に代えて、マイクロホンMによって集音された歌唱者の声に関する声情報、または、再生された楽曲データから歌唱者が歌う歌のパートに関する歌パート情報に基づいて、キャラクタ画像を変化させる点に特徴がある。その他の構成は、第1実施形態と同様であり、同一の部材については同一の符号を付してその説明を省略する。
【0093】
[画像処理部]
本実施形態の画像処理部130は、カラオケ画像生成処理を実行する際に、声情報としてマイクロホンMによって集音された歌唱者の声量情報、及び、当該集音された歌唱者の声の高さを示す歌唱者声高情報、並びに、歌パート情報として、楽曲で想定されている前記歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報に基づいて、撮像カメラ装置118と連動して歌唱者の撮像を行いつつ、当該歌唱者の顔部分にキャラクタ画像を重畳表示するカラオケ画像生成するための各種の処理を行うようになっている。
【0094】
特に、画像処理部130は、撮像カメラ装置118から出力されたフレーム毎のフレーム画像に対して、当該フレーム画像内における歌唱者の顔部分の顔領域を認識しつつ、再生されたカラオケデータから、歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報、マイクロホンMよって集音された歌唱者の声量値を示す声量情報、または、マイクロホンMによって集音された歌唱者の声の高さを示す歌唱者声高情報に基づいて、システム用データベース120に記憶された予め設定されたキャラクタにおける表情が異なるキャラクタ画像を特定し、特定したキャラクタ画像をフレーム画像に重畳するようになっている。
【0095】
具体的には、画像処理部130は、顔領域を認識する認識処理部131と、歌パート音高情報、声量情報、歌唱者声高情報におけるレベルを判定するレベル判定部142と、判定されたレベルに基づいて予め設定されたキャラクタからシステム用データベース120に記憶された一のキャラクタ画像を選択し、顔領域に重畳する画像変換処理部133と、から構成されている。
【0096】
なお、例えば、本実施形態の認識処理部131は、本発明の認識手段を構成し、レベル判定部142は、本発明のカラオケ情報取得手段を構成する。また、例えば、本実施形態の画像変換処理部133は、本発明の画像変換処理手段を構成する。
【0097】
レベル判定部142は、
(1)再生中のカラオケデータを受信し、当該再生に伴ってカラオケデータに含まれる歌パート音高情報が予め定められた音以上であるか否か、
(2)カラオケデータに沿って歌唱する歌唱者の声量をマイクロホンM及び音声入力処理部110を介して声量情報として受信し、受信した歌唱者の声量値が予め定められた値以上であるか否か、または、
(3)カラオケデータに沿って歌唱する歌唱者の声高をマイクロホンM及び音声入力処理部110を介して声量情報として受信し、受信した歌唱者の声の高さを示す歌唱者声高情報が予め定められた音以上であるか否かを段階的に判定するようになっている。
【0098】
例えば、レベル判定部142は、MIDIデータのノートナンバーに基づいてカラオケデータにおける歌パートの音高情報が所定の高音以上であるか否か、その高音から3音以上高いか否か、及び、その高音から5音以上高いか否かを判定するようになっている。そして、レベル判定部142は、カラオケデータにおける歌パートの音高情報が所定の高音以上であってその音より3音低い音である判定した場合には、レベル1と、所定の高音から3音以上高く、かつ、5音より低いと判定した場合には、レベル2と、所定の高音から5音以上高いと判定した場合には、レベル3と判定するようになっている。
【0099】
また、レベル判定部142は、マイクロホンMから出力された電気信号の振幅に基づいて、集音された歌唱者の声量値が第1のレベル以上であるか否か、第1のレベルより値が大きい第2のレベル以上である否か、及び、第2のレベルより値が大きい第3のレベル以上であるか否かを判定するようになっている。そして、レベル判定部142は、歌唱者の声量値が第1のレベル以上であって第2のレベルより小さい場合には、レベル1と、歌唱者の声量値が第2のレベル以上であって第3のレベルより小さい場合には、レベル2と、歌唱者の声量値が第3のレベル以上である場合には、レベル3と判定するようになっている。
【0100】
さらに、レベル判定部142は、マイクロホンMから出力された電気信号の周波数特性に基づいて、マイクロホンMによって集音された歌唱者の声高情報が所定の高音以上であるか否か、その高音から3音以上高いか否か、及び、その高音から5音以上高いか否かを判定するようになっている。そして、レベル判定部142は、カラオケデータにおける歌パートの音高情報が所定の高音以上であってその音より3音低い音である判定した場合には、レベル1と、所定の高音から3音以上高く、かつ、5音より低いと判定した場合には、レベル2と、所定の高音から5音以上高いと判定した場合には、レベル3と判定するようになっている。
【0101】
なお、本実施形態においては、レベル判定部142は、歌パート音高情報、歌唱者の声量情報、歌唱者声高情報は、その何れかに基づいて、上記のレベルを判定すればよく、全てにおいて判定する必要はない。また、歌唱者または被歌唱者によって、または、予めシステム制御部106によって、何れの情報に基づいてレベル判定を行うか設定するようになっている。
【0102】
[システム用データベース]
システム用データベース120には、各キャラクタ毎に、歌唱することが辛い表情のレベルが異なる複数種類のキャラクタ画像を有している。例えば、上記のように、レベル1の場合には、キャラクタの顔が「ピンク」色に染まっている画像、レベル2の場合には、キャラクタの顔が「赤」色に染まり、頭から煙りが出ている画像、及び、レベル3の場合には、キャラクタの顔が「青」色となり、疲れ切っている表情を有する画像が、キャラクタ毎に記憶されている。
【0103】
[カラオケ画像生成処理を含むアップロード処理]
次に、図6を用いて本実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明する。なお、図6は、本実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【0104】
まず、操作部108によってカラオケデータの選曲前にカラオケ画像生成処理を実行する旨の指示が入力されると(ステップS201)、システム制御部106は、システム用データベース120に記憶された複数のキャラクタを表示部114に表示させ、表示部114及び操作部108と連動して歌唱者または歌唱者以外の他のユーザに一のキャラクタを選択させるための処理を実行する(ステップS202)。
【0105】
次いで、システム制御部106は、操作部108からの選曲データの入力を待ってカラオケ再生部104にカラオケデータの再生、及び、撮像カメラ装置118に歌唱者の撮像を開始させるとともに、画像処理部130に、当該歌唱者におけるカラオケ画像生成処理の実行を開始させる(ステップS203)。なお、画像処理部130は、カラオケ画像生成処理の実行が開始されると、フレーム毎に以下の処理を実行するとともに、システム制御部106は、各フレーム毎のフレーム画像を、再生された楽曲データ及び歌唱者の声データとともにミキシングしつつ順次システム用データベース120に記録する。
【0106】
まず、認識処理部131は、入力されたフレーム画像から上述した顔画像認識処理を実行し、当該フレーム画像における顔領域を判別する(ステップS204)。
【0107】
次いで、レベル判定部142は、歌パート音高情報、声量情報または歌唱者声高情報に基づいて、レベルを判定する(ステップS205)。
【0108】
次いで、画像変換処理部133は、判定されたレベルと同一のキャラクタ画像をシステム用データベース120から読み出し、認識された顔領域上に、大きさを調整しつつ、重畳させるための画像変換処理を行う(ステップS206)。画像変換処理が実行されると、表示制御部116は、キャラクタ画像が重畳されたフレーム画像を表示部114に表示するとともに、システム用データベース120に記録する。
【0109】
次いで、システム制御部106は、カラオケの再生が終了したか否かを判断し(ステップS207)、カラオケの再生が終了していないと判断した場合には、ステップS204の処理に移行して画像処理部130に次のフレーム画像について所定の処理を実行させ、カラオケの再生が終了していとと判断した場合には、ステップS208の処理に移行する。
【0110】
次いで、システム制御部106は、表示部114に、生成されたカラオケ画像をアップロードするか否かを選択させるための表示を行ってその入力を待機する(ステップS208)。
【0111】
次いで、システム制御部106は、操作部108からの入力に基づいて、生成されたカラオケ画像データを管理サーバ装置300にアップロードするか否かを判断し(ステップS209)、生成されたカラオケ画像データを管理サーバ装置300にアップロードしないと判断した場合には、本動作を終了させる。
【0112】
一方、システム制御部106は、生成されたカラオケ画像データを管理サーバ装置300にアップロードすると判断した場合には、通信制御部102を介して当該カラオケ画像データを管理サーバ装置300にアップロードするとともに、アップロード先のURLアドレスを取得して表示部114に表示させて(ステップS210)、本動作を終了させる。
【0113】
なお、このとき、システム制御部106は、操作部108及び表示部114と連動してアップロードする際に、楽曲名称、ユーザID及びデータ名称などの各情報の入力を促すとともに、楽曲IDなどの属性情報をカラオケ再生部104などから読み出して各入力された各情報及び属性情報とともに、カラオケ画像データをアップロードする。また、システム制御部106は、取得したURLアドレスアドレスを携帯用電話機などの他の通信端末装置に送信する処理を行ってもよいし、当該URLを2次元バーコードとして表示部114に表示してもよい。
【0114】
[作用効果]
以上本実施形態のカラオケシステム100は、撮像された歌唱者の顔にキャラクタ画像を重畳するとともに、歌パート音高情報、声量情報または歌唱者声高情に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させることができるので、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0115】
また、本実施形態のカラオケシステム100は、プライバシーの保護と自己の表現の公開との両立を実現することができるとともに、当歌唱者の顔の部分がキャラクタとなっている歌唱者画像の利用を通じて該歌唱者画像の生成するためのカラオケシステム100の利用の促進を図ることができる。
【0116】
[変形例]
本実施形態のレベル判定部142は、歌パート情報として歌パート音高情報を用いているが、歌唱者が歌う歌パートにおける歌詞を歌うタイミングを示す歌パートタイミング情報、または、当該歌パートにおける音量を示す歌パート音量情報を用いてもよい。なお、歌パートタイミング情報の場合には、上述のようにしきい値によって葉画像を切り替えるのではなく、そのタイミングで適切な画像に切り替える。
【0117】
本実施形態のレベル判定部142は、歌パート音高情報、声量情報または歌唱者声高情に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させているが、カラオケ中に歌唱者声高情報と歌パート音高情報の一致度を示す一致度情報、すなわち、歌唱者の歌唱力の採点を実行し、予め定められた点数でレベルを設定し、画像変換処理が当該レベルに基づいてキャラクタ画像を重畳するようにしてもよい。この場合に、例えば、歌パート音高情報と歌唱者声高情報は、同一の性質を有する情報である。また、上述の歌パート音量情報と声量情報は、同一の性質を有する情報である。
【0118】
本実施形態においては、カラオケ情報に加えて、カラオケ再生部104によって、カラオケデータに含まれる曲調情報、基準音高情報及び楽曲構成情報を取得し、画像変換処理部133は、当該取得された曲調情報または基準音高情報に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させてよい。例えば、バラードを歌唱している場合には、キャラクタ画像の表情をしかめて雰囲気を暗くするキャラクタ画像を用い、ノリの激しい曲を歌唱している場合には、左右に向くときにその向きの変化を大きくするようにキャラクタ画像を重畳する。したがって、この場合には、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を更に楽しむ新たな娯楽性を提供することができる。なお、例えば、この場合においては、カラオケ再生部104は、本発明の制御情報取得手段を構成する。
【0119】
また、本実施形態においては、歌唱者の顔のみにキャラクタ画像を重畳しているが、撮像画像に、歌唱者とは異なる非歌唱者が存在する場合に、第1実施形態の認識処理部を用いて、フレーム毎に、出力された撮像画像の中から非歌唱者の顔領域を認識し、画像変換処理部133は、認識された非歌唱者の顔領域に、予め設定された、もしくは、ランダムに選択された、歌唱者とは異なる種類のキャラクタ画像、または、歌唱者同一の種類のキャラクタ画像を重畳させてもよい。この場合には、被歌唱者についても顔をキャラクタ画像にすることによって、さらにユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0120】
本実施形態においては、各フレーム画像の顔領域の大きさに基づいてキャラクタ画像の大小を調整しつつ、当該フレーム画像に重畳するようになっているが、カラオケ画像生成処理前に、表示部114に表示された画像を閲覧しつつ、当該基準となるキャラクタ画像の大きさを定め、当該定めたキャラクタ画像の大きさに基づいて、フレーム画像にキャラクタ画像を重畳してもよい。
【0121】
本実施形態においては、画像変換処理部133は、予めシステム用データベース120に記憶されたキャラクタ画像を歌唱者が撮像されたフレーム画像の顔領域上に重畳することによって歌唱者の画像にキャラクタ画像を合成しているが、データベースに記憶された単一の3Dのキャラクタ画像に対して演算処理を実行して、表情/向き判別部132によって判別された表情及び向きに該当する画像を生成し、生成された画像をフレーム画像の顔領域上に重畳するようにしてもよい。
【0122】
また、本実施形態の画像変換処理部133は、撮像された歌唱者の顔領域にキャラクタ画像を重畳するようになっているが、背景に対して星または雪などの装飾的な画像を重畳するようにしてもよい。この場合には、画像変換処理部133は、特に、歌唱者の画像の予め定められた所定の領域に、装飾画像を表示する。また、上述の曲調情報、基準音高情報または楽曲構成情報に基づいて、装飾画像を間奏またはサビ終わりなどの所定のタイミングに表示してもよい。
【0123】
また、本実施形態では、キャラクタ画像に加えて当該変化したキャラクタ画像に伴って歌唱者の歌唱状況を示す文言を各フレーム画像に重畳するようにしてもよい。例えば、上述のように、マイクロホンMによって集音された歌唱者の声高または声量が一定レベル以上であると検出された場合に、画像変換処理部132は、「声を高くしすぎ」、「声を大きくしすぎ」などの予め設定された状況を示す文字をキャラクタ画像とともにクレーム画像に重畳する。なお、状況示す文字に代えて、または、当該状況を示す文字に加えて、「喉を痛めますよ」または「音程を下げてはいかがでしょうか」などのアドバイスを示す文字をフレーム画像に重畳するようにしてもよい。また、当該文字またはアドバイスに関しては、上述した被歌唱者のキャラクタ画像から吹き出しているように画像処理を行うようにしてもよい。
【0124】
<第3実施形態>
次に、図7を用いて本願に係る本実施形態における第3実施形態のカラオケシステム100について説明する。
【0125】
本実施形態は、第1実施形態において、既にアップロードされた第1の歌唱者におけるカラオケ画像データ(以下、「第1カラオケ画像データ」という。)を再生しつつ、第1の歌唱者に合わせて第2の歌唱者がカラオケを実行し、第2の歌唱者におけるカラオケ画像データ(以下、「第2カラオケ画像データ」という。)を第1カラオケ画像データと合成した合成カラオケ画像データを生成する点に特徴がある。その他の構成は、第1実施形態と同様であり、同一の部材については同一の符号を付してその説明を省略する。
【0126】
[カラオケ再生部]
カラオケ再生部104は、システム制御部106の制御の下、カラオケ画像データから当該カラオケ画像データに録音されているオーディオデータを取得し、取得したオーディオデータを拡声処理部112に出力するようになっている。また、カラオケ再生部104は、カラオケ画像データを表示制御部116に出力するようになっている。
【0127】
[カラオケ画像生成処理を含むアップロード処理]
次に、図7を用いて本実施形態におけるカラオケ画像生成処理を含むアップロード処理の動作について説明する。なお、図7は、本実施形態におけるカカラオケ画像生成処理を含むアップロード処理の動作について説明するフローチャートである。
【0128】
まず、操作部108によってカラオケ画像データを選択する前にカラオケ画像生成処理を実行する旨の指示が入力されると(ステップS301)、システム制御部106は、システム用データベース120に記憶された複数のキャラクタを表示部114に表示させ、表示部114及び操作部108と連動して歌唱者または歌唱者以外の他のユーザに一のキャラクタを選択させるための処理を実行する(ステップS302)。
【0129】
次いで、システム制御部106は、操作部108及び通信制御部102と連動して、管理サーバ装置300にアップロードされている複数の第1カラオケ画像データの中から一の第1カラオケ画像データが選択されると(ステップS303)、カラオケ再生部104に選択された第1カラオケ画像データの再生及び当該第1カラオケ画像データに含まれるオーディオデータの再生と、撮像カメラ装置118に歌唱者の撮像と、を開始させるとともに、画像処理部130に、当該歌唱者におけるカラオケ画像生成処理の実行を開始させる(ステップS304)。なお、画像処理部130は、カラオケ画像生成処理の実行が開始されると、フレーム毎に以下の処理を実行するとともに、システム制御部106は、フレーム毎のフレーム画像を、再生されたオーディオデータ及び歌唱者の声データとともにミキシングしつつ順次システム用データベース120に記録する。
【0130】
まず、認識処理部131は、入力されたフレーム画像から上述した顔画像認識処理を実行し、当該フレーム画像における顔領域を判別する(ステップS305)。
【0131】
次いで、表情/向き判別部132は、認識された顔領域の画像に基づいて表情/向き判別処理を実行し、歌唱者の表情及び向きを判別する(ステップS306)。
【0132】
次いで、画像変換処理部133は、判定されたレベルと同一のキャラクタ画像をシステム用データベース120から読み出し、認識された顔領域上に、大きさを調整しつつ、重畳させるための画像変換処理を行う(ステップS307)。画像変換処理が実行されると、表示制御部116は、キャラクタ画像が重畳されたフレーム画像(すなわち、キャラクタ画像が重畳された第2カラオケ画像データ)を表示部114に表示するとともに、システム用データベース120に記録する。
【0133】
次いで、システム制御部106は、カラオケの再生が終了したか否かを判断し(ステップS308)、カラオケの再生が終了していないと判断した場合には、ステップS305の処理に移行して画像処理部130に次のフレーム画像(第2カラオケ画像データ)について所定の処理を実行させ、カラオケの再生が終了していとと判断した場合には、ステップS309の処理に移行する。
【0134】
次いで、システム制御部106は、表示部114に、生成されたカラオケ画像、すなわち、第1カラオケ画像データと第2カラオケ画像データが合成されている画像をアップロードするか否かを選択させるための表示を行ってその入力を待機する(ステップS309)。
【0135】
次いで、システム制御部106は、操作部108からの入力に基づいて、生成されたカラオケ画像データを管理サーバ装置300にアップロードするか否かを判断し(ステップS310)、生成されたカラオケ画像データを管理サーバ装置300にアップロードしないと判断した場合には、本動作を終了させる。
【0136】
一方、システム制御部106は、生成されたカラオケ画像データを管理サーバ装置300にアップロードすると判断した場合には、通信制御部102を介して当該カラオケ画像データを管理サーバ装置300にアップロードするとともに、アップロード先のURLアドレスを取得して表示部114に表示させて(ステップS311)、本動作を終了させる。
【0137】
なお、このとき、システム制御部106は、操作部108及び表示部114と連動してアップロードする際に、楽曲名称、ユーザID及びデータ名称などの各情報の入力を促すとともに、楽曲IDなどの属性情報をカラオケ再生部104などから読み出して各入力された各情報及び属性情報とともに、カラオケ画像データをアップロードする。また、システム制御部106は、取得したURLアドレスアドレスを携帯用電話機などの他の通信端末装置に送信する処理を行ってもよいし、当該URLを2次元バーコードとして表示部114に表示してもよい。
【0138】
[作用効果]
以上本実施形態のカラオケシステム100は、第1実施形態に加えて、プライバシーの保護と自己の表現の公開との両立を実現することができるとともに、当歌唱者の顔の部分がキャラクタとなっている歌唱者画像の利用を通じて該歌唱者画像の生成するためのカラオケシステム100の利用の促進を図ることができる。
【0139】
[変形例]
本実施形態のレベル判定部142は、撮像された歌唱者の顔にキャラクタ画像を重畳するとともに、歌パート音高情報、声量情報または歌唱者声高情に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させているが、カラオケ中に歌唱者声高情報と歌パート音高情報の一致度を示す一致度情報、すなわち、歌唱者の歌唱力の採点を実行し、予め定められた点数でレベルを設定し、画像変換処理が当該レベルに基づいてキャラクタ画像を重畳するようにしてもよい。
【0140】
本実施形態においては、歌唱者の表情または向きに加えて、カラオケ再生部104によって、カラオケデータに含まれる曲調情報、基準音高情報及び楽曲構成情報を取得し、画像変換処理部133は、当該取得された曲調情報または基準音高情報に基づいて撮像された歌唱者の顔に重畳するキャラクタ画像を変化させてよい。例えば、バラードを歌唱している場合には、キャラクタ画像の表情をしかめて雰囲気を暗くするキャラクタ画像を用い、ノリの激しい曲を歌唱している場合には、左右に向くときにその向きの変化を大きくするようにキャラクタ画像を重畳する。したがって、この場合には、歌を歌う、または、他人の歌を聴く娯楽の他に、歌唱者のユニークな画像を更に楽しむ新たな娯楽性を提供することができる。なお、例えば、この場合においては、カラオケ再生部104は、本発明の制御情報取得手段を構成する。
【0141】
また、本実施形態においては、歌唱者の顔のみにキャラクタ画像を重畳しているが、撮像画像に、歌唱者とは異なる非歌唱者が存在する場合に、フレーム毎に、出力された撮像画像の中から非歌唱者の顔領域を認識し、画像変換処理部133は、認識された非歌唱者の顔領域に、予め設定された、もしくは、ランダムに選択された、歌唱者とは異なる種類のキャラクタ画像、または、歌唱者同一の種類のキャラクタ画像を重畳させてもよい。この場合には、被歌唱者についても顔をキャラクタ画像にすることによって、さらにユニークな画像を楽しむ新たな娯楽性を提供することができる。
【0142】
本実施形態においては、各フレーム画像の顔領域の大きさに基づいてキャラクタ画像の大小を調整しつつ、当該フレーム画像に重畳するようになっているが、カラオケ画像生成処理前に、表示部114に表示された画像を閲覧しつつ、当該基準となるキャラクタ画像の大きさを定め、当該定めたキャラクタ画像の大きさに基づいて、フレーム画像にキャラクタ画像を重畳してもよい。
【0143】
本実施形態においては、画像変換処理部133は、予めシステム用データベース120に記憶されたキャラクタ画像を歌唱者が撮像されたフレーム画像の顔領域上に重畳することによって歌唱者の画像にキャラクタ画像を合成しているが、データベースに記憶された単一の3Dのキャラクタ画像に対して演算処理を実行して、表情/向き判別部132によって判別された表情及び向きに該当する画像を生成し、生成された画像をフレーム画像の顔領域上に重畳するようにしてもよい。
【0144】
また、本実施形態の画像変換処理部133は、撮像された歌唱者の顔領域にキャラクタ画像を重畳するようになっているが、背景に対して星または雪などの装飾的な画像を重畳するようにしてもよい。この場合には、画像変換処理部133は、特に、歌唱者の画像の予め定められた所定の領域に、装飾画像を表示する。また、上述の曲調情報、基準音高情報または楽曲構成情報に基づいて、装飾画像を間奏またはサビ終わりなどの所定のタイミングに表示してもよい。
【0145】
また、本実施形態においては、第1カラオケ画像データが選択される前に、第2カラオケ画像データに用いるキャラクタ画像を歌唱者などのユーザに選択させて設定しているが、第1カラオケ画像データが選択された後に、第2カラオケ画像データに用いるおける各フレーム画像に重像するキャラクタ画像を自動的にまたはユーザの指示によって選択させるようにしてもよい。この場合に、第1カラオケ画像データに用いられたキャラクタ画像と関連するキャラクタ画像を自動的にまたはユーザによって選択的に表示及び設定されて用いられるようにしてもよい。
【0146】
具体的には、システム用データベース120にキャラクタ毎に、他の記憶されたキャラクタとの関連性を示す属性情報とともに記憶させ、カラオケ画像が生成される毎に、すなわち、第1カラオケ画像データが生成される毎に、属性情報についてもカラオケ画像データの一部に保持させる。そして、上述のように、第1カラオケ画像データが選択された際に、この属性情報を読み出して当該属性情報と一致する属性情報を有するキャラクタをランダムに設定し、または、一致する属性情報を有する複数のキャラクタを提示してユーザに一のキャラクタを選択させるようにしてもよい。なお、例えば、この属性情報には、兄弟または姉妹などのキャラクタの同一ファミリーである場合、キャラクタを提供している会社が同一である場合、歌手、漫才師または芸術家などの同一のグループに属している場合に、同一の属性情報となる。
【符号の説明】
【0147】
10 … ネットワークシステム
100 … カラオケシステム
100 … データベース
102 … 通信制御部
104 … カラオケ再生部
106 … システム制御部
108 … 操作部
110 … 音声入力処理部
112 … 拡声処理部
114 … 表示部
116 … 表示制御部
118 … 撮像カメラ装置
120 … システム用データベース
130 … 画像処理部
131 … 認識処理部
132 … 表情/向き判別部
133 … 画像変換処理部
200 … カラオケデータ用データベース
142 … レベル判定部
300 … 管理サーバ装置
400 … 端末装置

【特許請求の範囲】
【請求項1】
複数の楽曲データから一の楽曲データを選択して当該選択された楽曲データを再生して楽音を出力させるとともに、当該楽音の出力に伴って前記選択された楽曲の歌詞を表示手段に表示するカラオケシステムあって、
前記楽曲データを再生する再生手段と、
前記再生された楽曲の楽音を出力するとともに集音手段によって集音された歌唱者の声を拡声する出力手段と、
前記楽曲の再生に合わせて歌唱する歌唱者を撮像し、フレーム毎に撮像した画像を撮像画像として出力する撮像手段と、
前記フレーム毎に、前記出力された撮像画像の中から当該歌唱者の顔部分の画像領域である顔領域を認識する認識手段と、
前記認識された顔領域に、予め設定され画像であって人間の顔または擬人化されたものの顔を題材として創作された創作画像を重畳する画像処理を行う画像処理手段と、
前記画像処理された画像を前記表示手段に表示させる表示制御手段と、
を備え、
前記画像処理手段が、
前記集音手段によって集音された歌唱者の声に関する声情報、または、前記再生された楽曲データから前記歌唱者が歌う歌のパートに関する歌パート情報の少なくとも何れか一方の情報を順次カラオケ情報として取得するカラオケ情報取得手段と、
前記取得されたカラオケ情報に基づいて前記重畳する創作画像を変化させる画像変換処理手段と、
を含むことを特徴とするカラオケシステム。
【請求項2】
請求項1に記載のカラオケシステムにおいて、
前記声情報には、前記集音手段よって集音された歌唱者の声量値を示す声量情報、または、当該集音された歌唱者の声の高さを示す歌唱者声高情報の少なくとも何れか一方の情報が含まれるとともに、
前記歌パート情報には、前記歌唱者が歌う歌のパートにおける音の高さを示す歌パート音高情報、当該歌パートにおける歌詞を歌うタイミングを示す歌パートタイミング情報、または、当該歌パートにおける音量を示す歌パート音量情報の少なくとも何れか一方の情報が含まれる、カラオケシステム。
【請求項3】
請求項1または2に記載のカラオケシステムにおいて、
前記画像変換処理手段が、前記取得したカラオケ情報に含まれる値が予め定められた値以上の場合に、前記重畳する創作画像を変化させる、カラオケシステム。
【請求項4】
請求項1または2に記載のカラオケシステムであって、
前記カラオケ情報に前記声情報と歌パート情報の双方が含まれる場合に、
前記画像変換処理手段が、前記声情報と歌パート情報の同一の性質を有する情報の一致度に基づいて前記重畳する創作画像を変化させる、カラオケシステム。
【請求項5】
請求項1〜4の何れか一項に記載のカラオケシステムであって、
一の顔を題材として創作された顔のパターンが異なる複数の創作画像から構成される創作画像群が複数記憶される記憶手段を更に備え、
前記画像変換処理手段が、前記取得手段によって取得されたカラオケ情報に基づいて、一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる、カラオケシステム。
【請求項6】
請求項5に記載のカラオケシステムであって、
前記楽曲データから曲調を示す曲調情報、曲構成部分を示す構成情報または楽曲の基準音の高さを示す基準音高情報の少なくとも何れか一の情報から構成される制御情報を取得する制御情報取得手段を更に備え、
前記画像処理手段が、前記記憶手段に記憶された創作画像群の中から、前記取得されたカラオケ情報及び前記制御情報に基づいて一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる、カラオケシステム。
【請求項7】
複数の楽曲データから一の楽曲データを選択して当該選択された楽曲データを再生して楽音を出力させるとともに、当該楽音の出力に伴って前記選択された楽曲の歌詞を表示手段に表示するカラオケシステムあって、
前記楽曲データを再生する再生手段と、
前記再生された楽曲の楽音を出力するとともに集音手段によって集音された歌唱者の声を拡声する出力手段と、
前記楽曲の再生に合わせて歌唱する歌唱者を撮像し、フレーム毎に撮像した画像を撮像画像として出力する撮像手段と、
前記フレーム毎に、前記出力された撮像画像の中から当該歌唱者の顔部分の画像領域である顔領域を認識する認識手段と、
前記認識された顔領域に、予め設定され画像であって人間の顔または擬人化されたものの顔を題材として創作された創作画像を重畳する画像処理を行う画像処理手段と、
前記画像処理された画像を前記表示手段に表示させる表示制御手段と、
を備え、
前記画像処理手段が、
前記認識された顔領域の画像に基づいて前記歌唱者の表情または当該歌唱者の顔の向きを判別する判別手段と、
前記判別された顔の表情または顔の向きに基づいて前記重畳する創作画像を変化させる画像変換処理手段と、
を含むことを特徴とするカラオケシステム。
【請求項8】
請求項7に記載のカラオケシステムであって、
一の顔を題材として創作された顔のパターンが異なる複数の創作画像から構成される創作画像群が複数記憶される記憶手段を更に備え、
前記画像変換理手段が、前記記憶された創作画像群の中から、前記判別された顔の表情または顔の向きと、に基づいて、一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる、カラオケシステム。
【請求項9】
請求項8に記載のカラオケシステムであって、
前記楽曲データから曲調を示す曲調情報、曲構成部分を示す構成情報または楽曲の基準音の高さを示す基準音高情報の少なくとも何れか一の情報から構成される制御情報を取得する制御情報取得手段を更に備え、
前記画像処理手段が、前記記憶手段に記憶された創作画像群の中から、前記判別された顔の表情または顔の向きと前記取得された制御情報に基づいて一の創作画像を選択し、前記選択された創作画像を前記撮像画像に重畳することによって、前記重畳する創作画像を変化させる、カラオケシステム。
【請求項10】
請求項1〜9の何れか一項に記載のカラオケシステムであって、
前記認識手段が、前記撮像画像に、前記歌唱者とは異なる非歌唱者が存在する場合に、前記フレーム毎に、前記出力された撮像画像の中から前記非歌唱者の顔領域を認識し、
前記画像変換処理手段が、前記認識された非歌唱者の顔領域に、前記歌唱者とは異なる種類の創作画像または同一の創作画像を重畳させることを特徴とするカラオケシステム。
【請求項11】
請求項1〜10の何れか一項に記載のカラオケシステムであって、
前記再生手段が、前記創作画像が既に重畳された歌唱者の画像を、第1歌唱者画像として、当該第1歌唱者画像を生成したときの楽曲データ及び第1歌唱者の声データとともに再生し、
前記出力手段、前記撮像手段、認識手段及び画像処理手段が当該再生された第1歌唱者画像に基づいて、第2歌唱者に対して動作するとともに、
前記表示制御手段が、前記第1歌唱者画像に第2歌唱者の画像を合成した合成画像を前記表示手段に表示させる、カラオケシステム。
【請求項12】
請求項1〜11の何れか一項に記載のカラオケシステムであって、
前記表示手段に表示された前記画像を画像データとしてネットワークに接続され、通信端末装置にて閲覧可能にサーバ装置にアップロードする通信手段を更に有する、カラオケシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate