説明

ネットワーク基盤のロボットシステムで動作含みのマルチメディアコンテンツを再生するための処理方法

【課題】本発明はネットワーク基盤のロボット用動作含みのマルチメディアコンテンツを再生するための処理方法に関するものである。
【解決手段】ロボット端末機などとこの端末機を制御するサービスサーバーを含むネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法において、サービスサーバーが、マルチメディアコンテンツファイルに端末機用動作制御データを挿入し、動作含みのマルチメディアコンテンツデータパケットなどを形成して貯蔵する段階;ユーザーが、特定端末機で特定コンテンツを再生しろと命令をすれば、この命令が前記サービスサーバーへ伝送される段階;前記命令により、前記サービスサーバーが前記コンテンツに対応するデータパケットを読み出し、順に前記端末機へ伝送する段階;前記端末機が、前記データパケットを順に貯蔵し、順に読み出して再生する段階を含むことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はネットワーク基盤のロボットシステムで、動作制御情報が含まれたマルチメディアコンテンツを再生するための処理方法に関するものである。
【背景技術】
【0002】
未来にはさまざまなホームロボットが各家庭ごと補給され、ホームロボットを用いてさまざまな機能を行うことになるが、その代表的な利用分野の一つが口演童話の聞かせ、英語教育などの音声及び映像コンテンツ(以下、マルチメディアコンテンツ)の再生による教育分野である。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、このような従来のホームロボットシステムにおいて、ユーザーがホームロボットまたはPCを通じてサービスサーバーに接続しホームページで特定の口演童話や英語学習コンテンツを有料または無料で購買すれば、このサービスサーバーに貯蔵されたこのコンテンツのための文章/音声ファイルと映像ファイルの全体がホームロボットでダウンされてホームロボットに貯蔵されている途中、ユーザーが所望の時期に、ホームロボットで文章をTTSエンジンを用いて音声ファイルへ変換して発声したり、伝達された音声ファイルで発声しながら映像ファイルを再生し、口演童話や英語学習コンテンツを再生してくれるので、このようなダウンされた大容量の音声及び映像を再生するためにはホームロボットには殆どPC級の大容量の処理装置と貯蔵装置(メモリ、HDDなど)が必要であってホームロボットの単価が上昇することになる。
【0004】
また、このような口演童話及び英語学習用音声と映像再生の時にホームロボットは音声及び映像再生のみをするだけ、この音声及び映像に関連された動作(例えば、”おはよう?”または”HELLO”という文章が出ると、ホームロボットがあいさつする動作をしたり、文章を発声する時、文章に合うように口を開閉する動作など)をしなくて、口演童話や英語学習用コンテンツを用いる幼児及び子供に興味を誘発させることができない。
【0005】
結局、現在のホームロボットシステムでは、音声及び映像コンテンツを用いるためにはホームロボットに大容量の中央処理装置と貯蔵装置が必要であり、音声及び映像に対応する動作なしに興味を誘発させることができない。
【0006】
本発明は前記の従来技術の問題点を勘案して、安値のホームロボットの提供が可能になり、ホームロボットでは音声/映像再生と同期された動作が行われるようになる。
【課題を解決するための手段】
【0007】
以上のような本発明の課題を達成するための本発明の実施例では、ネットワークに連結されたロボット端末機などと、このロボット端末機などを制御するサービスサーバーを含むネットワーク基盤(Network Based Robot System)のロボット制御システムを用いて動作含みのマルチメディアコンテンツ(Multimedia Contents Having Motion Information)を再生するための処理方法において、前記サービスサーバーが、パケット再生時間間隙で分割されたマルチメディアコンテンツファイルに、同期されるロボット端末機用動作制御データを挿入し、動作含みのマルチメディアコンテンツデータパケットなどを形成し貯蔵する段階;ユーザーが、特定ロボット端末機で特定動作含みのマルチメディアコンテンツを再生しろと命令すれば、この命令が前記サービスサーバーへ伝送される段階;前記伝送された命令により、前記サービスサーバーが前記特定動作含みのマルチメディアコンテンツに対応する動作含みのマルチメディアコンテンツデータパケットなどを読み出し、パケット段位で順に前記特定ロボット端末機のバッファへ伝送する段階;前記特定ロボット端末機が、前記受信される動作含みのマルチメディアコンテンツデータパケットなどをバッファに順に貯蔵し、前記パケット再生時間間隙で順に読み出して再生する段階を含むことを特徴とする。
【発明の効果】
【0008】
以上のような本発明を用いれば、安値のホームロボットの提供が可能になり、ホームロボットでは音声/映像再生と同期された動作が行われるようになる。
【発明を実施するための最良の形態】
【0009】
まず、安値のホームロボットを達成するための本発明のシステムの全体的な構成及び動作を図1を参考にして説明する。
【0010】
そして、本発明によるホームロボットは再生と駆動のための基本的な構成だけを有しているから、コンピューターシステムで端末機のような役目をするので、以下ではロボット端末機と称する。
【0011】
各家庭のロボット端末機(1−1、1−2...1−N)には唇や関節、輪を駆動するためのモーター/リレー(2−1、2−2...2−N)と、モーター及びリレー(2−1、2−2...2−N)を駆動するための駆動回路(3−1、3−2...3−N)と、マイクなどのセンサーなど(4−1、4−2...4−N)と、センサーなど(4−1、4−2...4−N)からのセンシング信号をサーバー(7)へ伝送してサーバー(7)からのデータをロボット端末機(1−1、1−2...1−N)から受信するための送受信装置(5−1、5−2...5−N)と、サーバー(7)から伝達される音声ファイルを発声するためのD/A変換機(6−1、6−2...6−N)とスピーカー(10−1、10−2...10N)、ロボット端末機(1−1、1−2...1−N)に映像再生用モニター(図示せず)を有する時伝達される映像ファイルをモニターに表示するための映像表示制御装置(図示せず)を含んでいる。
【0012】
このような各々のロボット端末機(1−1、1−2...1−N)の送受信装置(5−1、5−2...5−N)は無線で各々にIP住所が割り当てられたホームゲートウェー(8−1、8−2...8−N)に連結し、ホームゲートウェー(8−1、8−2...8−N)はサーバー(7)に接続される。
【0013】
サーバー(7)はホームゲートウェー(8−1、8−2...8−N)を通じて、各ロボット端末機(1−1、1−2...1−N)の各種センサー(4−1、4−2...4−N)からのセンシング信号を受信し要する処理と分析をして、ロボット端末機(1−1、1−2...1−N)へ音声及び映像ファイルを伝送し、この音声/映像ファイルと同期される動作制御データ(下で説明する各々のパケット再生時間間隙の間、唇及び各関節の動きを制御するモーターまたはリレーの駆動制御データ)を送信する。
【0014】
そのため、送受信装置(5−1、5−2...5−N)を通じて動作制御データを受信したロボット端末機(1−1、1−2...1−N)は、この動作制御データを唇、関節または輪用モーター/リレー駆動回路(3−1、3−2...3−N)へ送り、このモーター/リレー駆動回路(3−1、3−2...3−N)でモーター/リレー(2−1、2−2...2−N)を駆動してロボット端末機(1−1、1−2...1−N)が適切な動作をするようにする。
【0015】
また、サーバー(7)はTTSエンジン(9)により文字を音声ファイルに変換したり録音をして音声ファイルを形成し、形成された音声ファイルをロボット端末機(1−1、1−2...1−N)へ伝送すれば、この音声ファイルを受信したロボット端末機(1−1、1−2...1−N)がD/A変換機(6−1、6−2...6−N)によって音声ファイルをアナログ音声信号に変換してスピーカー(10−1、10−2...10−N)により発声をするようになる。
【0016】
なお、動作または発声関連の映像がある場合には、受信された映像ファイルを映像表示制御装置へ送信してロボット端末機(1−1、1−2...1−N)のモニターに関連映像を表示する。
【0017】
以上のように、ロボット端末機(1−1、1−2...1−N)にはサーバー(7)とのデータ送受信のための送受信装置(5−1、5−2...5−N)と、マイクなどのセンサーなど(4−1、4−2...4−N)と、モーター/リレー(2−1、2−2...2−N)と、モーター/リレー駆動回路(3−1、3−2...3−N)と、D/A変換機(6−1、6−2...6−N)と、スピーカー(10−1、10−2...10−N)及び/または映像表示制御装置とモニターのみを設け、ロボット端末機(1−1、1−2...1−N)の動作のための動作制御データの形成、音声ファイル及び/または映像ファイルの形成のための大容量のデータ処理はサービスサーバー(7)で行われるようにしたら、ロボット端末機(1−1、1−2...1−N)には大容量の中央処理装置やメモリが要しなくなり安値のホームロボットを提供することが可能になる。
【0018】
さて、本発明のために用いられるホームゲートウェー(8)に対してより詳しく察して見るようにする。
【0019】
ホームゲートウェー(8)はさまざまな形態で連結されることができる。例えば、Ethernet(登録商標) LAN方式やその他電力線通信、ホームPNAなどの有線方式が可能である。
【0020】
本発明のロボット端末機(1)は図1に示したとおり、基本的に無線でホームゲートウェー(8)との通信が可能でなければなりません。若し、ホームネットワークが設けられなくてホームゲートウェー(8)がない家庭では、ホームゲートウェー(8)の代りに、高速インターネット回線に連結されるAP(Access Point)を通じて無線ラン装置(図示せず)を経てロボット端末機(1)と無線通信をする。この場合、ロボット端末機(1)はサービスサーバー(7)に直接連結が可能なインターネットプロトコルと無線ラン(IEEE 802.11x)を内臓しなければならない。
【0021】
無線ラン(IEEE 802.11x)の以外に、ホームネットワーク用で開発された無線通信装置には、HomeRF、Bluetooth、UWB(Ultra Wide Bandwidth)、無線1394、ZigBee、Wireless USBなどがある。
【0022】
さて、本発明のロボット端末機(1)がサービスサーバー(7)に接続する方法に対して説明する。
【0023】
本発明のロボット端末機(1)は自体的に有する機能が非常に限定されているので、サービスサーバー(7)の助けが絶対的に必要である。
【0024】
従って、ロボット端末機(1)に電源が投入されば、先ずネットワークに接続してサービスサーバー(7)との通信が行われなければならない。
【0025】
ロボット端末機(1)に電源が投入される時、ロボット端末機(1)がサービスサーバー(7)に接続される過程を図2を参考にして説明する。この時、家内のAP(Access Point)を通じてインターネットでサービスサーバー(7)に接続される場合に対して説明する。
【0026】
1.ロボット端末機(1)がDHCP(Dynamic Host Configuration Protocol)を通じてローカルIP住所を得てAPと通信を始める。
【0027】
2.ロボット端末機(1)がDNS(Domain Name Service)を用いてサービスサーバー(7)のドメインのIP住所を分かる。
【0028】
3.ロボット端末機(1)がセッションサーバーに接続してロボット端末機(1)が適法であることを認証(Authentication)受ける。
【0029】
4.保安のために暗号化方式を用いて要するデータを取り交わす。
【0030】
次に、音声及び/または映像と同期された動作を行うために、本発明で行われるサービスサーバー(7)とロボット端末機(1)との間のデータの送受信方法に対して説明する。
【0031】
一般的なロボットと異なり、ネットワークに連結されたロボット端末機(1)をサービスサーバー(7)で遠隔制御するためには、二つの側面が考慮されなければならない。
【0032】
一つ目、ネットワークを通じてデータを伝送する時発生する時間の遅延と到着時間の不均一性であり、二つ目は、ロボット端末機(1)が移動したり、人間との相互作用の時、実時間的に反応して要する動作をするように処理する問題である。
【0033】
例えば、ロボット端末機(1)が発声をしながら該当する動作をするためには、サービスサーバー(7)のTTSエンジン(9)によって音声ファイルに変換された音声情報と、動作制御データファイルである動作情報(例えば、唇及び関節の動きのための動作制御データ)を別々に伝送すれば、音声情報と動作情報の到着時間が時間的に不一致することになるので、発声をしながら動作をするようにできない。
【0034】
これを防止するために、大きなバッファメモリをロボット端末機(1)の内部に設け、音声情報と動作情報の全体を受信及び貯蔵してから、発声をしながら動作をするようにする方法も考えることができるのに、この方法は音声情報と動作情報の全体を受信した後再生する方法を用いるので、実時間的に反応することができない短所がある。
【0035】
従って、本発明では、ロボット端末機(1)とサービスサーバー(7)との間のデータを同期データ(Synchronous Data)と非同期データ(Asynchronous Data)に区分し、各データの特性に相応しい図3のような複合伝送方式を用いる。
【0036】
ここで、同期データはロボット端末機(1)の動作及び発声と映像表示を連続的に絶えることがないようにするためのデータであり、動作(唇の動きや顔の表情、身の動作など)データと、この動作データと一致する発声及び/または映像表示をするための音声データ及び/または映像データなど(これらを総称してマルチメディアデータという)をいう。
【0037】
また、同期データは周りの環境または人間との相互作用でなく、予め作られてサービスサーバー(7)に貯蔵されている資料を意味する。
【0038】
非同期データは予め貯蔵されたマルチメディアデータでなく、実時間的に伝送されるセンサー(4)の出力などと、サービスサーバー(7)から早急に伝送される実時間制御データであるシステムコマンド(System Command)を指称する。
【0039】
システムコマンドは伝送され次第に実行されなければならない。システムコマンドの種類を大きく分類すれば、次のとおりである。
【0040】
1.ネットワークに関連する命令: MAC住所、無線動作モード、AP 関連データなど。
【0041】
2.認証及び保安関連データ。
【0042】
3.マルチメディアの再生に関連する命令: 再生速度、画面のサイズ、MONO/STEREOなど。
【0043】
4.バッファ制御命令: バッファ内容消し、満たし、現在残っているサイズ、バッファサイズの調節など。
【0044】
5.センサーテーブルの設定:感知しようとするセンサーの種類及び伝送周期を設定。
【0045】
図4には図3の通信方式のための伝送データパケットの形態が示されている。
【0046】
ここで、ヘッダー領域(領域(V)ないし領域(XL))には、この動作含みのマルチメディアデータパケットデータのプロトコルバージョン番号(Protocol Version Number)を示すバージョン番号領域(V)と、パケットに含まれたデータのタイプなど(オーディオデータ、ビデオデータ、動作データ、システムコマンド、ACKなど)を示すデータタイプ領域(DT)と、このパケットが伝送される順序を示すシークエンス領域(SEQ)と、このパケットが伝送される時間を示すタイムスタンプ領域(TS)と、現在通信中であるセッションの区別及び保安のためのセッションID領域(SID)と、下で説明するダウンパケット伝送の時、動作制御データの長さ領域(ML)またはアップパケット伝送の時にロボット端末機(1)にある距離センサーなどの各種センサー値の長さ領域(SL)、音声データの長さ領域(AL)、映像データの長さ領域(VL)と、システムコマンドなどのその他データの長さを示す補助データの長さ領域(XL)がある。
【0047】
また、動作制御データ領域(MD)またはセンサーデータ領域(SD)にはロボット端末機(1)の所望の動作を行うための各モーター/リレーなどの動作制御データまたはロボット端末機(1)のセンサーなどから測定されたセンサー値などが入り、音声データ領域(AD)には動作をしながら発声する場合または動作なしに発声のみをする場合のように発声のための音声データまたはロボット端末機(1)のマイクで入力された音声に対する音声データが入って、映像データ領域(VD)には動作及び/または発声とともにモニターに示されなければならない映像データまたはロボット端末機(1)のカメラで検出された映像データが入り、補助データ領域(XD)にはシステムコマンドなどのその他データが入る。
【0048】
最終に、前記動作データ(MD)/センサーデータ(SD)と音声データ(AD)、映像データ(VD)、補助データ(XD)の有効性を示すチェックサム(Check-Sum:CS)が入る。
【0049】
一方、動作制御データ領域(MD)は図5で示されたとおり、各駆動装置(モーター/リレーなど)を示すIDと、この駆動装置を制御する命令データ(Control Data:CD)と各駆動装置などを区分する区分子(ST)の繰り返しからなる。
【0050】
もう図3に戻って、サービスサーバー(7)から伝送されるデータはダウンストリームパケット(down stream packet)形態で、TCP/IPまたはUDP/IP protocolでロボット端末機(1)へ伝達され、ロボット端末機(1)の処理装置(図示せず)では各々のパケットが伝達される時ごと、パケットのヘッダーでデータタイプ(DT)を読取り、このパケットに同期データ(オーディオ/ビデオ/動作データ)が含まれていれば、この同期データは順にバッファ(down)(バッファの一つのサイズは与えられたパケット再生時間(Ts)内に再生が終わるようにサイズが決まっている)に貯蔵し、このパケットに非同期データ(システムコマンド)が含まれていれば、この非同期データであるシステムコマンドはバッファ(down)に貯蔵されなく、すぐに伝達してロボット端末機(1)がシステムコマンドに対応する作動を行うことになる。
【0051】
このようにパケット単位でバッファ(down)に貯蔵された同期データは、ロボット端末機(1)の処理装置によりバッファ(down)でパケット再生時間間隙(Ts)ごと一つずつ読み出され、ヘッダーに含まれたデータサイズ領域(ML、AL、VL)を検査して動作、音声、映像データが共に含まれたのであれば、動作データ領域(MD)、音声データ領域(AD)、映像データ領域(VD)で該当するデータを読み出し、動作データ(MD)はモーター/リレー駆動回路(3)へ伝達されモーター/リレー(2)を駆動して動作を実現するようにし、音声データ(AD)はデコーダーとD/A変換機(6)を経てアナログ音声信号に変換されてスピーカー(10)で発声をし、映像データ(VD)はデコーダーと映像表示制御装置を経てモニターに示されるようになる。
【0052】
結局、各々のパケット再生時間間隙(Ts)ごと再生を要する発声/映像表示/動作制御データがバッファ(down)で一つずつ読み出し再生されるので、音声と映像、動作が同期された動作含みのマルチメディアの再生が可能になる。
【0053】
さて、ロボット端末機(1)をTs=40ms(秒当たり25回)周期で動作させ、音声データ(AD)は16 bit、16,000Hz(秒当たり32,000bytes)のADPCM(Adaptive Differential Pulse Coded Modulation)データにし、映像データ(VD)はなく、50個のバッファを有する場合を想定してより詳しく説明する。
【0054】
ロボット端末機(1)のバッファ(down)は40msx50=2.0秒の同期データの貯蔵が可能であるので、予期することができない2秒以内の通信障害を克服して切られることがない動作及び発声を保障する。
【0055】
この時、必要な音声データ用メモリのサイズは圧縮率1/4のADPCM アルゴリズムを用いれば、バッファの一つに32,000bytes/4/25=8,000/25=320bytesの音声データが貯蔵されるので、320bytesx50=16Kbytesである。この音声データ(AD)のサイズは通信の状態、音声データの質などにより加減されなければならない。
【0056】
次に、システムコマンド(SC)による動作を例えば説明する。
【0057】
ロボット端末機(1)がモノの口演童話の音声を再生している途中、ステレオで口演童話の音声を再生するという時を想定して見ると、次の二つの方法が可能である。
【0058】
1.サービスサーバー(7)では、バッファに残っているサイズを伝送しろというシステムコマンド(SC)をロボット端末機(1)へ送ってバッファの残るサイズを受信し、この受信された値が0になれば、ステレオで再生機能を変更しろというシステムコマンド(SC)をロボット端末機(1)へ送ってロボット端末機(1)がオーディオ再生モードをステレオに変更した後、新しいステレオオーディオデータが含まれた同期データを伝送し始める。
【0059】
2.サービスサーバー(7)でバッファ内容消しというシステムコマンド(SC)をロボット端末機(1)へ送信しロボット端末機(1)がバッファ内容を削除すれば、オーディオ再生モードをステレオに変更しろというシステムコマンド(SC)をロボット端末機(1)へ送ってロボット端末機(1)がオーディオ再生モードをステレオに変更した後、新しいステレオオーディオデータが含まれた同期データを伝送し始める。
【0060】
次に、ロボット端末機(1−1、1−2...1−N)でサービスサーバー(7)へのアップストリームパケット(up stream packet)に対して説明すれば、マイク(Mic)で入力されるアナログ音声データ(命令音声データなど)はA/D変換機(図示せず)によりデジタルデータ形態で変換してインコーダーにより圧縮され、各種センサー(S1...Sk)(移動の時、障害物認知センサーなど)での出力とともに、バッファ(up)(前記のダウンストリーム(down stream)の時のバッファに比べては非常に小さいサイズである)に貯蔵した後、図4のフォーマットでパケットストリーム形態でサービスサーバー(7)へ伝送される。
【0061】
さて、ロボット端末機(1)でサービスサーバー(7)へ伝送されるアップストリームパケット(up stream packet)のセンサー値に対して詳しく説明する。
【0062】
ネットワークによって制御される通常のロボット遠隔制御システムでは、命令を送り届けた後、それに反応するセンサーの値を確認するようになる。
【0063】
しかし、この方法ではネットワーク時間の遅延により、受信されたセンサー値が現在のセンサー値と差があるようになり、例えばロボットが移動中に予想する事が出来ない障害物がある場合にはこのようなネットワーク時間の遅延に受信されたセンサー値による緊急な措置(例えば、サービスサーバーで緊急停止命令をロボットへ下す)を取ってもロボットが障害物に衝突してしまった後になる可能性がある。
【0064】
また、ロボットが円を描いて移動する場合、センサー値の到着時間が一定しなく、正確な軌道追従が行われなくなる。
【0065】
本発明では、このような従来技術での問題点を改善しようと、サービスサーバー(7)の要請と関係なく特定したセンサー値は周期的に伝送するようになる。
【0066】
言い換えようとすると、サービスサーバー(7)の指示なしにも要すると判断される特定のセンサー値、例えば、移動の時には距離/超音波/人体感知センサー値を決まった周期で連続的に伝送することになる。
【0067】
この方式は通信帯域幅を続けて占有する短所があるが、予想する事が出来ない障害物に手早い対処が可能である。
【0068】
一方、TCP通信方式の代りにUDP通信方式を用いれば、受信の要否に関係なく続けて送信をするので、若干のパケットが損失される可能性があるが、伝送周期が短いから、このような若干の損失があっても大きな問題が発生しない。
【0069】
結局、センサー値を非常に短く、予め決まった周期で伝送するので、次の周期のセンサー値または損失された値を予測することが非常に容易になる。
【0070】
実用的にセンサーの伝送周期は20msから100msの以下が適切であり、この伝送周期は通信状態、ロボット端末機(1)の動作速度と精密度により可変されなければならない。
【0071】
なお、ロボット端末機(1)内に装着された各種センサーのすべての変化値を前記のように早い周期で伝送すれば非常に非効率的であるから、温度、湿度など環境センサーはその変化が遅いから伝送周期を遅くして、距離センサー、音源関連のセンサーは特性上非常に早い伝送周期とする。
【0072】
本発明ではサービスサーバー(7)で要するセンサー値の種類と、センサー値の伝送周期をシステムコマンド(SC)を用いてロボット端末機(1)に設定し、ロボット端末機(1)にセンサーテーブル(sensor table)の形態でサービスサーバー(7)が要するセンサーなどの種類と伝送周期が貯蔵されるようになる。
【0073】
ロボット端末機(1)はこのセンサーテーブルを通じてサービスサーバー(7)へセンサー値を伝送しなければならないセンサーなどと該当の伝送周期を把握して該当センサーで該当伝送周期にセンサー値を読み取ってサービスサーバー(7)へ伝送するようになる。設定されたセンサーテーブルは次の設定がある前まで持続的に有効である。
【0074】
次に、以上のようにパケット単位で動作含みのマルチメディアファイルをサーバー(7)でロボット端末機(1)へ送受信するために、サーバ−(7)またはロボット端末機(1)で動作含みのマルチメディアファイルパケットをどのように形成するかを”おはよう?”という発声/映像とともに関連動作をする実施例である図6、7を参考にして察して見る。
【0075】
まず、ビデオカメラなどの映像撮影手段による実際映像またはコンピューターグラフィック映像に音声をダビングして形成される口演童話や学習映像、音楽(童謡)ビデオのような既存の一般的なマルチメディアコンテンツファイル(相互同期される音声ファイルと映像ファイルからなる)を入手し(S1)、パケット単位で伝送し動作データを結合させるために、パケット再生時間間隙(Ts=40ms)単位で音声ファイル(AD)と映像ファイル(VD)を切断し、全体音楽ファイル(AD)がAD1、AD2...ADnで分離され、全体映像ファイル(VD)がVD1、VD2...VDnで分離される(S2)。
【0076】
さて、例えば“おはよう?”というあいさつ語に対応する音声及び映像(2秒位)が各々AD1...AD50とVD1...VD50に対応し、このような“おはよう?”というロボット端末機(1)での発声と映像表示をしながら、ロボット端末機(1)があいさつ動作(口を開閉する動作とともに、頭を下げて腕を中に集めてあいさつ動作を始めて頭をあげるあいさつ動作)をするようにするためには、サーバー(7)では50個のパケット再生時間(Ts=40ms)各々に対して口と頭、腕を駆動するモーターまたはリレーがどのように制御されなければならないかに対する、各々の動作制御データ(MD1...MD50)を形成して各々のAD1...AD50とVD1...VD50に付加させる(S3)。
【0077】
各々の対((AD1、VD1、MD1)...(AD50/VD50/MD50))に対してヘッダー部分とチェックサム領域を形成して付加させ(S4)、図6のような50個のパケットを形成する(S5)。
【0078】
以上のような方式で動作データの挿入を要する音声及び映像部分ごと動作データを結合させパケットストリーム伝送のための動作含みのマルチメディアコンテンツデータパケットなどを形成すれば、全体の動作含みのマルチメディアコンテンツデータが形成され、これをサーバー(7)の貯蔵装置(図示せず)に貯蔵する。
【0079】
このような方式をさまざまなマルチメディアコンテンツに対して繰り返せば、サーバー(7)の貯蔵装置にはさまざまな動作含みのマルチメディアコンテンツデータが貯蔵される。
【0080】
この時、ロボット端末機(1)が一種類でなくさまざまな種類が存在すれば、各々のさまざまな種類別のモデル名により動作制御データが形成され、マルチメディアコンテンツに同期するように挿入され、完成されたモデル別の動作含みのマルチメディアコンテンツデータがサーバー(7)に貯蔵されなければならない。
【0081】
次に、ユーザーがPC(図示せず)を通じてサーバー(7)に接続し、自分のロボット端末機(1)で聞きたい動作含みの口演童話などの動作含みのマルチメディアコンテンツを購買し、購入した動作含みの口演童話を聞く過程を図8を参考にして説明する。
【0082】
ユーザーがPCを通じてサーバー(7)のホームページに初め接続して加入手続の時にIDを受けて(S10)、加入段階または追って接続段階で自分が所有しているロボット端末機など(1)のモデル名とシリアル番号など(総称して、ロボット端末機の認識情報)を識別名称(例えば、“ロボット1”、“ロボット2”...)とともに入力をすれば(S11)、サーバー(7)には図9のようにIDとパースワードとともに認識情報及び識別名称がユーザーのDBに貯蔵される。
【0083】
さて、このホームページで提供する動作含みの口演童話中で特定動作含みの口演童話を購買するために、サーバー(7)のホームページに接続してIDとパースワードを入力して認証手続を終えた後(S12)、このホームページで提示する動作含みの口演童話リストと自分が所有しているロボット名称リストを見ながら、特定ロボット名称(例えば、“ロボット1”)と自分のロボット端末機(1)で聞きたい特定動作含みの口演童話(例えば、“兎と亀”)を選択すれば(S13)、有償購買の時には購買手続(決済など)をもっと行い、この口演童話の商品コードが貯蔵され、“ロボット1”が“兎と亀”という動作含みの口演童話を行うための選択及び購買手続が完了される。同一である“ロボット1”に対して追加的購買を所望したり、その他“ロボット2”に対しても購買を所望する時には以上のような過程を繰り返せばよい。以上のようにすれば、図9のようなユーザーのDBが完成される。
【0084】
さて、ユーザーがこの動作含みの口演童話を聞きたく、ロボット端末機(1)(ロボット1)またはロボット端末機(1)用リモコンにある動作含みの口演童話の再生ボタンを押したり、音声により命令(“口演童話の再生”)をすれば(S14)、この命令(ボタン情報または命令音声ファイル)とともにこのロボット端末機(1)の認識情報(モデル名とシリアル番号に対する情報)がサーバー(7)へ伝達され、サーバー(7)では音声命令の場合には音声認識をして命令が口演童話を再生すると認識して口演童話のボタンを押す場合にはそのまま認識し(S15)、ユーザーのDBから伝達された認識情報(モデル名とシリアル番号)に対応する動作含みの口演童話リストをロボット端末機(1)へ送信する(S16)。
【0085】
ロボット端末機(1)はモニターがある場合にはモニターに購買した口演童話リストを示してユーザーが選択するようにし、モニターがない場合には購買した口演童話の題目を例えば、“兎と亀は1番、白雪姫と七一寸法師は2番を選択下さい。”と発声をする(S17)。
【0086】
さて、リストがロボット端末機(1)のモニターに示された場合にはユーザーがタッチスクリーン機能を用いたり、ロボット端末機(1)の番号ボタンまたはリモコンの番号ボタンを押し、音声発声の場合にはユーザーがロボット端末機(1)の番号ボタンまたはリモコンの番号ボタンを押したり、音声により番号を選択すれば(S18)、この選択した番号情報がサーバー(7)へ伝達され、サーバー(7)では選択番号を認識して選択した口演童話用動作含みのマルチメディアデータパケットストリームが図3のようにロボット端末機(1)へ伝達されバッファ(down)に貯蔵する(S19)。
【0087】
この時、サービスサーバー(7)は一つまたは幾つの動作含みのマルチメディアデータパケットをバッファ(down)へ伝送する時ごとバッファ(down)の状態を検査してバッファがあふれないように送信パケットの数を調節する。
【0088】
さて、ロボット端末機(1)の処理装置(図示せず)によりこのバッファ(down)に貯蔵された動作含みのマルチメディアデータパケットがパケット再生時間間隙(Ts)で一つずつ読み出され、ヘッダーに含まれたデータサイズ領域(ML、AL、VL)を検査して動作、音声、映像データが全部含まれたのであれば動作制御データ領域(MD)、音声データ領域(AD)、映像データ領域(VD)で該当するデータを読み出し、動作データ(MD)はモーター/リレー駆動回路(3)へ伝達されてモーター/リレー(2)を駆動し動作を実現するようにし、音声データ(AD)はデコーダーとD/A変換機(6)を経てアナログ音声信号に変換されてスピーカー(10)で発声をし、映像データ(VD)はデコーダー及び映像表示制御装置を経てモニターに示すようにされ(S20)、口演童話を読んでくれながらモニターでは関連映像を示さながら関連動作を行うようになって、より興味津津な動作を含む口演童話の提供が可能になる。
【0089】
以上では、本発明の好ましい実施例を説明したが、本発明はこの実施例に限定されることでなく、本発明の精神を脱しない範囲内ではさまざまな変形が可能であることを留意しなければならない。
【0090】
例えば、以上では、事前に加工され存在する口演童話などのマルチメディアコンテンツを対象に動作含みのマルチメディアファイルを形成してサービスサーバー(7)に貯蔵し、ユーザーが特定動作含みのマルチメディアファイルを選択すれば、指定された時間にロボット端末機(1)へ伝送して再生する方法に対して説明したが、本発明は事前に加工され存在しなく、実時間に提供されるラジオ放送とかTV放送または電話通話(総称して、マルチメディアコンテンツの提供媒体と称する)のように音声及び/または映像が実時間にロボット端末機(1)で再現されなければならない場合にも適用が可能である。
【0091】
この場合には例えば、前記の選択段階(S13)でユーザーが特定ラジオチャンネルの音声を聞くのを選択し、実時間的にラジオ受信機で入力されるアナログ音声信号をサンプリングとA/D変換過程を経てデジタル音声信号に変換してサービスサーバー(7)へ入力し、このデジタル音声信号を前記のパケット再生時間間隙(Ts=40ms)の間集めてここにロボット端末機(1)用動作制御データ(簡単には、口を開閉する位の動作制御データ)を付加し、動作含みのマルチメディアパケットデータなどを毎40ms間隙ごと形成して更新する過程を繰り返す。
【0092】
さて、ユーザーが特定ロボット端末機(1)で動作含みのラジオ放送の聞き取りがほしければ、実時間的に形成される動作含みのラジオ音声パケットがロボット端末機(1)のバッファ(down)へ伝送・貯蔵し、ロボット端末機がパケット再生時間間隙(Ts)ごとバッファ(down)で導出して再生するようにする。
【0093】
この時、実時間に提供されるマルチメディアコンテンツの場合には、実際放送または通話とタイミングが殆ど一致するようにロボット端末機(1)で再生しなければならないので、事前に加工され存在するマルチメディアコンテンツのように50個位の領域を有するバッファ(down)を置くことは好ましくない。
【0094】
なぜなら、実時間の放送または通話の場合にはバッファ(down)のサイズが50個位(2秒位の動作含みのマルチメディアコンテンツの再生時間に当る)であると、最大2秒前の放送または通話をロボット端末機(1)で再生することになり、実時間の放送または通話の意味が色焼けされるからである。
【0095】
特に、電話通話の場合には双方の通話であるので、最大2秒の時間遅延は通話を不便にする。
【0096】
従って10個以下のバッファ領域を置けば、このような時間遅延の問題は減るが、このようなバッファ領域の個数はネットワークインフラのQoS(Quality of Service)により最終的に決定されるようになる。
【0097】
一方、以上では動作含みのマルチメディアの選択及び購買がPCを通じて行われることで記載したが、このような選択と購買がPDA、携帯電話などのネットワーク接続が可能な情報端末機を通じて行われることも可能である。
【0098】
また、ロボット端末機の自分を用いても可能であるが、この時にはホームページに接続する手数を減らすことができる。
【0099】
また、図4のようなフォーマットの動作含みのマルチメディアコンテンツパケットデータは必要によりバージョン番号(V)、タイムスタンプ(TS)が除いた形態で簡略化してサーバーに貯蔵されることもある。
【0100】
この時には各パケットを区別する区別子が各パケットの間に存在しなければならない。
【0101】
一方、以上ではマルチメディアコンテンツファイルをパケット伝送時間間隙で分割して各々に動作制御データを挿入して動作含みのマルチメディアコンテンツパケットデータなどを形成しサーバー(7)に貯蔵している途中、ユーザーが購買または選択して再生を要請する時に、関連動作含みのマルチメディアコンテンツパケットデータなどをロボット端末機(1)へ伝送する方式を用いるが、各パケットごとの動作制御データを生成する過程がサーバー(7)で実時間的に実行可能な場合(例えば、生成しなければならない動作制御データが唇の動作データ位で簡単であり、サーバー(7)が動作制御データの生成に所要される時間が少ない場合)には、原本マルチメディアファイルのみをサーバー(7)に貯蔵し、再生するためにロボット端末機(1)へ伝送する時に実時間の放送のようにサーバー(7)で動作制御データを形成して原本マルチメディアファイルに挿入しロボット端末機(1)へ送信する方式を用いれば、動作含みのマルチメディアコンテンツパケットデータなどをサーバー(7)に事前に貯蔵する必要がなくなってサーバー(7)の貯蔵装置の容量を非常に減らすことができる。
【0102】
しかし、このように動作制御データなどを実時間的に生成するのが困難な場合には、事前に原本マルチメディアファイルとこれに対応する動作データをサーバー(7)に別途に貯蔵している途中、再生のためにロボット端末機(1)へ送信の時に集めて伝送するようにすれば、動作制御データなどを実時間的に生成する場合に比べては若干もっと貯蔵空間を要するが、サーバー(7)の貯蔵装置の容量を大きく減らすことができる。
【図面の簡単な説明】
【0103】
【図1】本発明の全体的な構成図。
【図2】本発明でロボット端末機に電源投入の時、サービスサーバーに接続する過程を示す。
【図3】本発明のための複合通信方式を示す。
【図4】図3の本発明で用いられるパケットデータの形態を示す。
【図5】動作制御データの形態を示す。
【図6】本発明の動作含みのマルチメディアコンテンツデータパケットなどを示す。
【図7】本発明で動作含みのマルチメディアコンテンツパケットデータなどを形成する過程を示す。
【図8】本発明を適用して動作含みの口演童話を選択して再生する過程を示す。
【図9】サーバーに貯蔵されたユーザーDBの構造を示す。

【特許請求の範囲】
【請求項1】
ネットワークに連結されたロボット端末機などと、このロボット端末機などを制御するサービスサーバーを含むネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法において、
前記サービスサーバーが、パケット再生時間間隙で分割されたマルチメディアコンテンツファイルに、同期されるロボット端末機用動作制御データを挿入し、動作含みのマルチメディアコンテンツデータパケットなどを形成し貯蔵する段階;
ユーザーが、特定ロボット端末機で特定動作含みのマルチメディアコンテンツを再生しろと命令をすれば、この命令が前記サービスサーバーへ伝送される段階;
前記伝送された命令により、前記サービスサーバーが前記特定動作含みのマルチメディアコンテンツに対応する動作含みのマルチメディアコンテンツデータパケットなどを読み出し、パケット形態で順に前記特定ロボット端末機のバッファへ伝送する段階;
前記特定ロボット端末機が、前記受信される動作含みのマルチメディアコンテンツデータパケットなどをバッファに順に貯蔵し、前記パケット再生時間間隙で順に読み出して再生する段階を含むことを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項2】
ネットワークに連結されたロボット端末機などと、このロボット端末機などを制御するサービスサーバーを含むネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法において、
ユーザーが、特定ロボット端末機で特定動作含みのマルチメディアコンテンツを再生しろと命令をすれば、この命令が前記サービスサーバーへ伝送される段階;
前記伝送された命令により、前記サービスサーバーが、パケット再生時間間隙で分割された、前記特定動作含みのマルチメディアコンテンツ用マルチメディアコンテンツファイルに、同期されるロボット端末機用動作制御データを挿入し、動作含みのマルチメディアコンテンツデータパケットなどを形成し、パケット形態で順に前記特定ロボット端末機のバッファへ伝送する段階;
前記特定ロボット端末機が、前記受信される動作含みのマルチメディアコンテンツデータパケットなどをバッファに順に貯蔵し、前記パケット再生時間間隙で順に読み出して再生する段階を含むことを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項3】
第1項または第2項において、
前記ユーザーが前記サービスサーバーに接続し、自分が所有しているロボット端末機などの認識情報と自分が選択した動作含みのマルチメディアコンテンツ情報を前記サービスサーバーに貯蔵させる段階をもっと含むことを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアのコンテンツを再生するための処理方法。
【請求項4】
第3項において、
前記ユーザーのサービスサーバーへの接続はPCを通じて行われることを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項5】
第1項または第2項において、
前記マルチメディアコンテンツは口演童話であることを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項6】
第1項または第2項において、
前記マルチメディアコンテンツは学習用コンテンツであることを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項7】
第1項または第2項において、
前記動作含みのマルチメディアコンテンツデータパケットなどの伝送は、前記サービスサーバーがロボット端末機のバッファの状態を検査し、空いている個数位のパケットを連続して伝送することを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項8】
第1項または第2項において、
前記バッファのサイズはネットワークの遅延によって動作含みのマルチメディアンテンツデータパケットなどの到着が遅延されても十分に切られることがない再生ができるほどであることを特徴とするネットワーク基盤のロボット制御システムを用いて動作含みのマルチメディアコンテンツを再生するための処理方法。
【請求項9】
ネットワークに連結されたロボット端末機などと、このロボット端末機などを制御するサービスサーバーを含むネットワーク基盤のロボット制御システムを用いてマルチメディアコンテンツの提供媒体用動作含みのマルチメディアコンテンツを実時間に再生するための処理方法において、
ユーザーが選択したマルチメディアの提供媒体で実時間に提供するマルチメディアコンテンツをパケット再生時間間隙で集めてマルチメディアコンテンツデータパケットを形成し、前記形成されたマルチメディアコンテンツデータパケットに、同期されるロボット端末機用動作制御データを挿入して動作含みのマルチメディアコンテンツデータパケットなどをサービスサーバーが形成する段階;
前記サービスサーバーが前記動作含みのマルチメディアコンテンツデータパケットなどをパケット形態で順に前記ロボット端末機のバッファへ伝送する段階;
前記特定ロボット端末機が、前記受信される動作含みのマルチメディアコンテンツデータパケットなどをバッファに順に貯蔵し、前記パケット再生時間間隙で順に読み出して再生する段階を含むことを特徴とするネットワーク基盤のロボット制御システムを用いてマルチメディアコンテンツの提供媒体用動作含みのマルチメディアコンテンツを実時間に再生するための処理方法。
【請求項10】
第9項において、
前記マルチメディアの提供媒体は、ラジオ放送であることを特徴とするネットワーク基盤のロボット制御システムを用いてマルチメディアコンテンツの提供媒体用動作含みのマルチメディアコンテンツを実時間に再生するための処理方法。
【請求項11】
第9項において、
前記マルチメディアの提供媒体は、電話であることを特徴とするネットワーク基盤のロボット制御システムを用いてマルチメディアコンテンツの提供媒体用動作含みのマルチメディアコンテンツを実時間に再生するための処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2006−246438(P2006−246438A)
【公開日】平成18年9月14日(2006.9.14)
【国際特許分類】
【出願番号】特願2006−2898(P2006−2898)
【出願日】平成18年1月10日(2006.1.10)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Bluetooth
2.ZIGBEE
【出願人】(505108258)アイオー.テック カンパニー リミテッド (6)
【Fターム(参考)】