説明

制御情報生成装置および形状制御装置

【課題】音節の発音内容を規定した発音情報に基づいて、口を模した部分を持つ装置における口の形状を変化させる制御を行いながらも、口の形状の変化を自然なものにすること。
【解決手段】本発明の実施形態に係る形状制御システムにおいては、発音装置および口を模した部分を有する形状変化装置を、形状制御装置を用いて制御する。形状制御装置は、発音情報に基づいて発音装置を制御するとともに、発音情報から制御情報を生成して、この制御情報を用いて形状変化装置を制御する。形状制御装置は、発音情報から制御情報を生成するときに、口の形状が変わるときにおける変化前から変化後までの遷移時間を示す遷移情報を、予め決められたアルゴリズムに従って決定する。そして、形状制御装置は、口の形状が変化させるときには、遷移時間で徐々にその形状が変化するように形状変化装置を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、口を模した部分を持つ装置における口の形状を音声の発音にあわせて制御する技術に関する。
【背景技術】
【0002】
話をすることができる人型のロボットやCG(Computer Graphics)において、声の発音と口の動きとを連動させること(リップシンク)により、本当に話をしているかのように見せる技術がある。リップシンクをCGに適用した一例として、特許文献1には、音節の母音の種類に対応した口の形状を持つ画像を示す画像データを予め記憶しておき、音節の発音に対応して画像を表示させる技術が記載されている。また、リップシンクをロボットに適用した例として、非特許文献1に開示された技術がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平11−66345号公報
【非特許文献】
【0004】
【非特許文献1】中岡慎一郎,金広文男,三浦郁奈子,森澤光晴,藤原清司,金子健二,梶田秀司,比留川博久:サイバネティックヒューマンHRP−4Cの開発 −顔動作作成システム−,第27回日本ロボット学会学術講演会予稿集,2009.
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述の先行技術文献によれば、音節の母音に対応して口の形状を変化させることができるが、現実には口の形状は様々に変化し、発音される音節の母音が変化して口の形状が変化する。そして、この変化は、見た目の自然さに与える影響は大きい。しかしながら、上述の先行技術文献によっては、現実には細かい制御を行うことはできなかった。
特許文献1に記載された技術においては、発音される音節に対応する画像を発音と同時に切り替えて表示する。そのため、発音と同時に表示される画像が突然切り替わることになり、視聴者からは不自然な動きに見えてしまう。
非特許文献1に記載された技術においては、自然な動きで口の形状を変化させるように、音節に応じた変化の態様を予め設定しておくことができる。しかしながら、この設定者は、発音される音節と口の形状の変化との時間的関係を予め調整しておく必要があり、煩雑なものとなっていた。
【0006】
本発明は、上述の事情に鑑みてなされたものであり、音節の発音内容を規定した発音情報に基づいて、口を模した部分を持つ装置における口の形状を変化させる制御を行いながらも、口の形状の変化を自然なものにすることを目的とする。
【課題を解決するための手段】
【0007】
上述の課題を解決するため、本発明は、複数の音節および前記各音節の発音タイミングを規定した発音情報に基づいて発音する発音装置の発音内容に対応して口を模した部分の形状が変化するように制御される装置の当該口の形状を制御するために用いられる制御情報を生成する制御情報生成装置であって、前記発音情報を取得する発音情報取得手段と、前記口の形状を示す形状情報、前記口の形状を当該形状情報が示す形状にするタイミングを示すタイミング情報、および当該形状が変わるときにおける変化前から変化後までの遷移時間を示す遷移情報を有する制御情報を、前記発音情報取得手段によって取得された発音情報に基づいて生成する生成手段であって、前記発音情報が示す音節の母音に応じて前記形状情報を決定し、当該音節の発音タイミングに応じて前記タイミング情報を決定するとともに、予め決められたアルゴリズムに従って前記遷移情報を決定することによって、前記制御情報を生成する生成手段とを具備することを特徴とする制御情報生成装置を提供する。
【0008】
また、別の好ましい態様において、前記遷移情報は、前記口の形状の変化を開始するタイミングを示す情報を有し、前記遷移情報が示す遷移時間は、当該情報が示すタイミングから当該変化した後の形状にするタイミングまでを示すことを特徴とする。
【0009】
また、別の好ましい態様において、前記生成手段は、前記発音情報が示す音節の子音が特定の子音であるときには、当該子音に応じた前記口の形状を示す形状情報、および当該形状情報に係るタイミング情報をさらに有する制御情報を生成し、当該タイミング情報を当該音節の母音に応じた形状情報が示す形状にするタイミングより予め決められた時間だけ前のタイミングとして決定することを特徴とする。
【0010】
また、別の好ましい態様において、前記生成手段は、一の前記形状情報が示す形状と、次の前記形状情報が示す形状とが同一であり、それぞれの形状情報に係るタイミング情報が示すタイミング間の時間が予め決められた時間より長い場合には、当該形状とは異なる前記口の形状を示す形状情報、および当該形状情報に係るタイミング情報をさらに有し、当該タイミング情報を当該タイミング間のいずれかのタイミングとして決定することを特徴とする。
【0011】
また、本発明は、口を模した部分を有する装置における当該口の形状を制御する形状制御装置であって、発音させる複数の音節および発音タイミングを規定した発音情報に基づいて、発音装置に対して発音内容の制御を行う発音制御手段と、前記発音制御手段によって前記発音情報に基づいて発音制御が行われているときに、当該発音情報に基づいて前記口の形状を示す形状情報を出力する出力手段であって、当該発音情報が示す音節の母音に応じて前記形状情報を決定し、当該音節の発音タイミングより予め決められた遷移時間前に当該形状情報を出力する出力手段と、前記出力手段から形状情報が出力されると、前記遷移時間をかけて前記口の形状を当該形状情報が示す形状に変化させるように、前記装置を制御する形状制御手段とを具備することを特徴とする形状制御装置を提供する。
【発明の効果】
【0012】
本発明によれば、音節の発音内容を規定した発音情報に基づいて、口を模した部分を持つ装置における口の形状を変化させる制御を行いながらも、口の形状の変化を自然なものにすることができる。
【図面の簡単な説明】
【0013】
【図1】第1実施形態に係る形状制御システム1の構成を示すブロック図である。
【図2】第1実施形態に係る発音情報の一例を説明する図である。
【図3】第1実施形態に係る形状対応情報を説明する図である。
【図4】第1実施形態に係る形状情報を説明する図である。
【図5】第1実施形態に係る形状制御機能の構成を示すブロック図である。
【図6】図2に示す発音情報に基づいて生成される制御情報を説明する図である。
【図7】第1実施形態に係る発音情報および制御情報を用いた場合の発音装置および形状変化装置の動作を説明する図である。
【図8】第1実施形態に係る発音情報の他の例を説明する図である。
【図9】図8に示す発音情報に基づいて生成される制御情報の他の例を説明する図である。
【図10】図8に示す発音情報および図9に示す制御情報の例を用いた場合の発音装置および形状変化装置の動作を説明する図である。
【図11】第2実施形態に係る形状制御機能の構成を示すブロック図である。
【図12】図2に示す発音情報に基づいて出力部から出力される内容の一例を説明する図である。
【図13】図2に示す発音情報および図12に示す出力内容を用いた場合の発音装置および形状変化装置の動作を説明する図である。
【図14】変形例1に係る制御情報の一例を説明する図である。
【図15】図2に示す発音情報および図14に示す制御情報を用いた場合の発音装置および形状変化装置の動作を説明する図である。
【図16】変形例2に係る発音情報の一例を説明する図である。
【図17】図16に示す発音情報に基づいて生成される目蓋制御情報を説明する図である。
【図18】図16に示す発音情報および図17に示す目蓋制御情報を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。
【図19】変形例2に係る形状情報を説明する図である。
【発明を実施するための形態】
【0014】
<第1実施形態>
[全体構成]
図1は、本発明の第1実施形態に係る形状制御システム1の構成を示すブロック図である。形状制御システム1は、言葉を発音する発音装置20、口を模した部分の形状が変化する形状変化装置30、および発音装置20の発音内容と形状変化装置30における形状の変化内容とを制御する形状制御装置10を有する。形状制御装置10は、発音装置20からの発音内容に対応して、形状変化装置30における口の形状が変化するように制御する。
【0015】
発音装置20は、形状制御装置10からの制御に従って音声波形信号を生成する音源やDSP(Digital Signal Processor)、および生成した音声波形信号を放音するスピーカを有する。形状変化装置30は、この例においては、人型のロボットであり、その顔の部分に口を模した部分(以下、単に「口」という)を有する。形状変化装置30は、形状制御装置10からの制御により、この口の形状を変化させる。次に、形状制御装置10の各構成について説明する。
【0016】
[形状制御装置10の構成]
形状制御装置10は、制御部11、記憶部12、操作部13、表示部14およびインターフェイス15を有する。これらの各要素は、バスを介して互いに接続されている。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを有する。CPUは、ROMに記憶されている制御プログラムをRAMにロードして実行することにより、形状制御装置10の各部について、バスを介して制御し、各種機能を実現する。また、制御部11は、記憶部12、ROMなどに記憶された形状制御プログラムを実行することにより、発音装置20と形状変化装置30とを制御するための形状制御機能を実現する。RAMは、CPUが各データの加工などを行う際のワークエリアとしても機能する。
【0017】
記憶部12は、例えば、不揮発性メモリ、ハードディスクなどの記憶手段であって、発音情報、形状対応情報、形状制御機能において生成される制御情報を記憶する。上述した制御プログラムをROMの代わりに記憶していてもよい。なお、記憶部12は、外付けの不揮発性メモリなどの記憶手段を、接続インターフェイスなどを介して接続したものであってもよい。記憶部12に記憶された発音情報、形状対応情報について説明する。
【0018】
図2は、第1実施形態に係る発音情報の一例を説明する図である。発音情報は、発音装置20において発音させる内容を規定する情報である。発音情報は、図2に示すように、発音させる言葉を音節ごとに分けて、各音節の発音の「タイミング」、発音の「時間」(sec.)、「音高」(MIDI(Musical Instrument Digital Interface)データなどにおけるノートナンバに対応)が規定されている。発音のタイミングは、発音開始指示からの経過時間(sec.)で示したものである。なお、図2に示す発音情報においては、音節に対応する「文字」、その文字の音素(「子音」、「母音」)についても記載されているが、これらは各音節の内容がわかりやすいように記載したものである。したがって、発音情報は、音節に対応するこれらの情報全てを有する必要はなく、音節を特定できる情報を有していればよい。
【0019】
図3は、第1実施形態に係る形状対応情報を説明する図である。形状対応情報は、音素と形状変化装置30の口の形状を示す形状情報とを対応付けた情報である。形状情報に対応付けられた音素としては、各母音(「a」「i」「u」「e」「o」)、子音の一部(「m」「p」「b」、など、以下、まとめて「唇音」という)および文字「ん」に対応する「(n)」である。なお、「(n)」は「な行」に対応する子音「n」とは異なるものであることを明確にするため、図3においては、便宜上、母音として扱っている。形状情報は、この例においては、6種類(A、I、U、E、O、N)が設定されている。形状情報「A」、「I」、「U」、「E」、「O」は、母音「a」「i」「u」「e」「o」に対応する。また、形状情報Nは、唇音および「(n)」に対応している。
【0020】
図4は、第1実施形態に係る形状情報を説明する図である。図4に示すように、形状情報「A」、「I」、「U」、「E」、「O」、「N」は、それぞれ「あ」、「い」、「う」、「え」、「お」、「ん」に対応した口の形状を示す情報である。
【0021】
図1に戻って説明を続ける。操作部13は、キーボード、マウス、表示部14の表示画面の表面部分に設けられたタッチセンサなどの操作手段である。操作部13は、利用者の操作によりその操作内容を示す操作データを制御部11に出力する。操作内容としては、例えば、発音を開始する指示、制御情報を生成する指示などである。
表示部14は、制御部11の制御により画像を表示する表示画面を有する液晶ディスプレイなどの表示手段である。
【0022】
インターフェイス15は、例えば、外部装置と有線接続する接続端子、無線接続する無線接続手段、基地局やネットワークなどを介して接続する通信手段などであって、接続した外部装置と各種データの送受信を行う。インターフェイス15は、この例においては、発音装置20および形状変化装置30が接続される。これにより、形状制御装置10は、発音装置20および形状変化装置30と接続して、それぞれを制御する。
以上が、形状制御装置10の各部の構成についての説明である。
【0023】
[形状制御機能の構成]
次に、制御部11が形状制御プログラムを実行することによって実現される形状制御機能について図5を用いて説明する。なお、以下に説明する形状制御機能を実現する各構成については、その一部または全部をハードウエアにより実現してもよい。
【0024】
図5は、第1実施形態に係る形状制御機能の構成を示すブロック図である。制御部11は、形状制御プログラムを実行することにより、発音情報取得部111、発音制御部112、生成部113および形状制御部114を構成して、形状制御機能を実現する。
発音情報取得部111は、利用者の操作などによる指示に応じて、記憶部12から発音情報を取得する。発音情報取得部111は、この指示が制御情報の生成指示を含む場合には、取得した発音情報を生成部113に出力し、この指示が発音を開始する指示を含む場合には、発音制御部112に出力する。
【0025】
発音制御部112は、発音情報取得部111から取得した発音情報に応じた発音内容で発音させるように、インターフェイス15を介して発音装置20を制御する。発音情報に応じた発音内容で発音させるとは、発音情報が示す音節を音声合成技術により音声波形信号に変換させ、その音節に対応したタイミング、時間、音高で、その音声波形信号を放音させることをいう。この音声合成技術は、公知の様々な技術を用いることができるが、この例においては、特許第3879402号公報に記載された技術を用いる。この技術においては、発音のタイミングは、母音の発音のタイミングを示すものである。そのため、発音制御部112は、子音を音素として有する音節においては、予め決められた時間(この例においては、0.01秒とする)だけ前に子音に対応した音声波形信号が放音されるように発音装置20を制御する。
【0026】
また、発音制御部112は、発音情報におけるどの部分について発音させているかを示す同期情報を形状制御部114に対して出力する。これにより、発音制御部112における制御と形状制御部114における制御が同期して行えるようにする。なお、発音制御部112または形状制御部114は、それぞれにおける制御遅延を考慮して、同期情報を補正してもよい。
【0027】
生成部113は、発音情報取得部111から取得した発音情報、および記憶部12に記憶されている形状対応情報に基づいて、制御情報を生成して記憶部12に記憶する。この制御情報は、形状情報、その形状情報が示す口の形状にするタイミング、および口の形状が変わるときにおける変化前から変化後までの遷移時間を規定した情報である。これらの各情報は、生成部113が発音情報および形状対応情報に基づいて決定する。なお、このタイミングは、発音情報と同様に発音開始指示からの経過時間を示すものである。
【0028】
生成部113は、制御情報を生成するときには、まず、初期状態として形状情報Nとタイミング「0.00」とを対応付ける。そして、生成部113は、発音情報を参照して音節ごとに対応する形状情報を決定し、その音節に対応するタイミングを、形状を変化させるタイミングとする。このとき、生成部113は、音節が子音を有する場合には、形状を変化させるタイミングを0.01秒早いタイミングに修正する。このタイミングの修正は、上述したように、発音制御部112における制御において、子音がある場合には、予め決められた時間だけ前に子音に対応する音声波形信号を放音することになるために行われる。
【0029】
また、生成部113は、発音情報に規定されたタイミング、時間から、音節が発音されない期間が存在する場合には、その期間は口を閉じている状態にするために、その期間の開始タイミングと、形状情報Nとを対応付けて、制御情報に追加する。
【0030】
生成部113は、さらに、初期値以外の各形状情報に対応して、予め決められたアルゴリズムに従って、遷移時間を決定する。この例においては、生成部113は、音節が発音されない期間として口を閉じている状態にしたり、口を閉じている状態から空けた状態にしたりする場合には遷移時間を0.01秒、それ以外の口の形状を変化させる場合には遷移時間を0.02秒として決定するものである。
なお、このアルゴリズムは、様々なものとすることができる。例えば、生成部113は、口の形状が変化する場合には、全て同じ遷移時間として決定するようにしてもよいし、予め決められた範囲内でランダムに遷移時間を決定してもよい。全て同一の遷移時間である場合には、形状制御部114あるいは形状変化装置30に予め設定しておき、制御情報に遷移時間を示す情報が含まれていなくてもよい。また、生成部113は、発音情報における時間や音節の種類などに応じて変化するようにして遷移時間を決定してもよいし、利用者の操作によって指定された時間を遷移時間として決定してもよい。
【0031】
図6は、図2に示す発音情報に基づいて生成される制御情報を説明する図である。図6に示す制御情報は、図2に示す発音情報、および図3に示す形状対応情報に基づいて生成されたものである。図2に示す発音情報が示す音節のうち、文字「さ」および「た」については子音があり、「い」については子音がない。そのため、例えば、「さ」に対応する形状情報「A」については、タイミングが「0.2」ではなく0.01秒早いタイミングの「0.19」として決定されている。また、遷移時間は、上述のアルゴリズムに従って決定され、直前の形状情報が「N」のタイミング「0.19」の形状情報「A」、およびタイミング「2.00」の形状情報「N」についてが「0.01」、それ以外が「0.02」として決定されている。
【0032】
図5に戻って説明を続ける。形状制御部114は、記憶部12に記憶された制御情報に基づいて口の形状を変化させるように、インターフェイス15を介して形状変化装置30を制御する。この制御情報は、発音制御部112が制御に用いる発音情報に基づいて生成部113が生成した制御情報である。
このとき、形状制御部114は、発音制御部112から出力される同期情報により、発音制御部112が発音情報に基づいて行う発音装置20の制御に同期して、形状変化装置30の制御を行う。この同期とは、発音制御部112における発音情報に基づく制御と、形状制御部114における制御情報に基づく制御とが、同じ時間軸に沿って処理されることをいう。すなわち、発音情報が示すタイミングと制御情報が示すタイミングが同じ値である処理については、同じタイミングで行われる。
【0033】
また、形状制御部114は、口の形状を変化させるときには、変化前の口の形状から変化後の形状までに遷移する時間が、制御情報に示される変化後の形状情報に対応した遷移時間となるように、形状変化装置30を制御する。例えば、図6に示す制御情報において、タイミング「0.8」の形状情報「I」については、遷移時間「0.02」である。従って、形状情報「A」の口の形状から形状情報「I」の口の形状に変化するまでの遷移時間は、「0.02秒」であることを示し、形状の変化が開始されるタイミングは、「0.8秒」より「0.02秒」前の「0.78秒」となる。すなわち、制御情報に示される「遷移時間」により、対応する口の形状へ変化する遷移時間だけでなく、制御情報に示される「タイミング」と組み合わせて、変化を開始するタイミングについても示すことになる。
【0034】
また、形状制御部114は、変化前の口の形状から変化後の口の形状に至る遷移期間においては、徐々に口の形状が変化するように制御する。ここで、形状制御部114は、口の形状を徐々に変化させる場合には、遷移期間中の各タイミングにおける口の形状を、変化前後の口の形状から補間して決定する。なお、形状変化装置30がこのような補間機能を備えている場合には、生成部113は、形状変化装置30において形状を変化させるための制御に用いられる制御情報を生成し、形状制御部114は、徐々に変化させる処理を行わなくてもよい。
以上が、形状制御機能についての説明である。続いて、形状制御機能により制御される発音装置20および形状変化装置30の動作例について、図7を用いて説明する。
【0035】
[動作例]
図7は、第1実施形態に係る発音情報および制御情報を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。この例においては、発音情報は図2に示す内容、この発音情報により生成された制御情報は図6に示す内容であるものとして、説明する。
図7の上部に示されている音高と時刻との関係を示す図は、発音情報により規定されている内容を示すものである。その下に示されている「音素タイミング」については、発音装置20から発音される内容を音素で表したものである。上述したように、子音を有する音節については、発音情報が示すタイミングで母音を示す音声波形信号が放音される。そして、子音を示す音声波形信号は、そのタイミングから予め決められた時間(0.01秒)前に放音されるようになっている。
【0036】
音素タイミングの下に示されている「口の形状」については、形状変化装置30の口の形状を形状情報により示している。例えば、「N」と表されている期間は、形状情報Nに対応して口を閉じた形状に制御されている期間である。また、ハッチングされている部分は、口の形状が変化する遷移期間を示す。ここで、図7において、遷移XYは、形状情報Xが示す口の形状から形状情報Yが示す口の形状へ遷移する期間を示している。例えば、遷移NAは、形状情報Nが示す口の形状から形状情報Aが示す口の形状へ遷移する期間を示している。
また、「口の形状」の下に示されている形状情報については、制御情報が示す形状情報とタイミングとの関係を示している。
【0037】
このように、本発明の実施形態に係る形状制御システム1においては、発音装置20および口を模した部分を有する形状変化装置30を、形状制御装置10を用いて制御する。形状制御装置10は、発音情報に基づいて発音装置20を制御するとともに、発音情報から制御情報を生成して、この制御情報を用いて形状変化装置30を制御する。形状制御装置10は、発音情報から制御情報を生成するときに、口の形状が変わるときにおける変化前から変化後までの遷移時間を示す遷移情報を、予め決められたアルゴリズムに従って決定する。そして、形状制御装置10は、口の形状が変化させるときには、遷移時間で徐々にその形状が変化するように形状変化装置30を制御する。
これにより、発音内容に応じて口の形状を自然に見えるように変化させることができる。また、形状制御装置10は、このように形状を変化させるための制御に用いられる制御情報を生成することもできる。
【0038】
[動作例2]
続いて、発音情報の内容が図2に示すものと異なる場合において、形状制御機能により制御される発音装置20および形状変化装置30の動作例について説明する。
【0039】
図8は、第1実施形態に係る発音情報の他の例を説明する図である。図9は、図8に示す発音情報に基づいて生成される制御情報を説明する図である。図8に示す発音情報は、図2に示す発音情報と大きく異なる点は、唇音をもつ音節が存在すること、発音時間が長い音節が存在することである。生成部113は、このような図8に示す発音情報に基づいて、図9に示す制御情報を生成する。
【0040】
生成部113は、このような発音情報に基づいて制御情報を生成する場合には、上述した処理に加えて、以下に説明する処理を行う。生成部113は、発音時間が予め決められた時間Ta(この例においては、「0.8秒」)を超える音節があり、かつ、この音節と次の音節とに対応する形状情報が同一である場合に、次の音節に対応する形状情報に対応するタイミングよりも予め決められた時間Ts(この例においては、「0.3秒」)前のタイミングから、その形状情報が示す口の形状を、開き方が小さくなるようにした形状にするように制御情報を生成する。この例においては、開き方を小さくした口の形状を示す形状情報は、元の形状情報に「(s)」を付して表す。例えば、形状情報が「A」である場合には、開き方を小さくした口の形状を示す形状情報は、「A(s)」として表す。
なお、開き方を小さくした口の形状を示す形状情報「A(s)」、「I(s)」、「U(s)」、「E(s)」、「O(s)」は、生成部113で生成されるのではなく、記憶部12に記憶されていてもよい。この場合、生成部113は、記憶部12から対応する形状情報を取得すればよい。また、この形状情報「A(s)」、「I(s)」、「U(s)」、「E(s)」、「O(s)」は、開き方を小さくした口の形状ではなくてもよく、形状情報「A」、「I」、「U」、「E」、「O」が示す口の形状と異なるものであればよい。
【0041】
また、生成部113は、この場合においても開き方を小さくした口の形状を示す形状情報に対応して、予め決められたアルゴリズムに従って遷移時間(この例においては、「0.01秒」)を決定する。
なお、文字「た」の発音時間は、時間Ta以上となるが、これに対応する形状情報「A」と、次に続く形状情報「N」とは異なるため、口の形状を小さく開くようにする処理は行わない。
【0042】
また、生成部113は、発音情報が示す音節に唇音を持つものがある場合には、上述のようにその音節の母音に対応する形状情報ではなく、唇音に対応する形状情報「N」として決定して制御情報を生成する。すなわち、形状情報「N」に対応するタイミングは、その音節の子音に対応する音声波形信号が放音されるタイミングとして決定される。
そして、生成部113は、その音節に対応するタイミング、すなわち母音に対応する音声波形信号が放音されるタイミングを、その母音に対応する口の形状とするタイミングとして制御情報を生成する。この唇音に対する形状情報「N」から母音に対する形状情報に変化する遷移時間は、この例においては、「0.01秒」とする。なお、生成部113は、母音に対応する口の形状とするタイミングを、母音に対応する音声波形信号が放音されるタイミングより前のタイミングとして決定してもよい。この場合には、生成部113は、対応する遷移時間についても短くなるように決定する。
【0043】
図10は、図8に示す発音情報および図9に示す制御情報の例を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。図10の詳細な説明については、図7における場合と同様であるため省略する。なお、文字「ま」に対応する形状情報「N」は、すぐに形状情報「A」に遷移を開始するため、図10の記載においては、遷移ANの後はすぐに遷移NAになっている。
【0044】
このようにして、形状制御装置10は、同じ口の形状が続くように形状変化装置30を制御する場合に、開き方が小さくなるように口の形状を変化させることで、発音内容に応じた口の形状の変化をより自然に見えるようにすることができる。また、発音させる音節が唇音を持つ場合には、一旦口を閉じるように変化させることで、口の形状の変化をさらに自然に見えるようにすることができる。
【0045】
<第2実施形態>
第1実施形態において、形状制御装置10は、生成部113により予め生成した制御情報を用いて、形状変化装置30の口の形状を制御していた。第2実施形態においては、形状制御装置10は、発音情報に基づいて発音装置20の発音内容を制御しながら、リアルタイムに形状変化装置30の口の形状を制御するものである。
第2実施形態における形状制御機能の構成について説明する。
【0046】
[形状制御機能の構成]
図11は、第2実施形態に係る形状制御機能の構成を示すブロック図である。制御部11は、形状制御プログラムを実行することにより、発音情報取得部111A、発音制御部112A、形状制御部114Aおよび出力部115を構成して、形状制御機能を実現する。
【0047】
発音情報取得部111Aは、利用者の操作などによる指示に応じて、記憶部12から発音情報を取得する。発音情報取得部111Aは、取得した発音情報を出力部115および発音制御部112Aに出力する。
発音制御部112Aは、第1実施形態における発音制御部112と同様の処理を行うが、発音情報におけるどの部分について発音させているかを示す同期情報については、出力部115に対して出力する。これにより、発音制御部112Aにおける制御と出力部115からの出力が同期して行えるようにする。
形状制御部114Aは、出力部115から出力される形状情報および遷移時間を示す情報を取得すると、形状変化装置30の口の形状を形状情報が示す口の形状にするように変化を開始させ、徐々に口の形状を変化させ、遷移時間が経過するとその形状情報が示す口の形状になるように、形状変化装置30を制御する。
【0048】
出力部115は、発音情報取得部111Aから取得した発音情報、記憶部12に記憶されている形状対応情報、および発音制御部112Aから出力される同期情報に基づいて、形状情報および遷移時間を示す情報を形状制御部114Aに出力する。
出力部115は、発音制御部112Aによる発音制御が開始されると、まず初期値として、形状情報「N」を出力する。そして、出力部115は、発音装置20から音節が発音されるタイミングより遷移時間だけ前のタイミングに、その音節に対応する形状情報およびその遷移時間を示す情報を、形状制御部114Aに対して出力する。
なお、出力部115は、予め決められたアルゴリズムに従って、遷移時間を決定する。このアルゴリズムは、第1実施形態において説明したように様々な態様があり得る。遷移時間が形状情報により変化せず、予め決められた時間とする場合には、遷移時間を形状制御部114Aに予め設定しておけば、出力部115は、遷移時間を示す情報を出力しなくてもよい。
【0049】
図12は、図2に示す発音情報に基づいて出力部から出力される内容の一例を説明する図である。図12に示す出力内容は、図2に示す発音情報、および図3に示す形状対応情報に基づいて、出力部115によって出力される内容を示したものである。例えば、出力部115は、タイミング「0.18」において、形状情報「A」、遷移時間「0.01」を出力する。
以上が、第2実施形態における形状制御機能についての説明である。続いて、第2実施形態における形状制御機能により制御される発音装置20および形状変化装置30の動作例について、図13を用いて説明する。
【0050】
[動作例]
図13は、図2に示す発音情報および図12に示す出力内容を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。図13の詳細な説明については、図7における場合と同様であるため省略する。なお、図13の下部に示す形状情報については、矢印が示すタイミングにおいて出力部115から出力される形状情報を示している。
このように、第2実施形態における形状制御システム1において、形状制御装置10は、出力部115が形状情報を遷移開始タイミングにあわせて出力することにより、制御情報を生成することなく、発音情報に基づく発音装置20および形状変化装置30を同期して制御することができる。
【0051】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した第1実施形態においては、生成部113が生成する制御情報には、遷移時間を示す情報が含まれていたが、別の態様で遷移時間を特定するようにしてもよい。遷移時間を特定する態様のうち、形状情報を用いて遷移時間を特定する場合の一例を、図14を用いて説明する。
【0052】
図14は、変形例1に係る制御情報の一例を説明する図である。図14が示す変形例1に係る制御情報は、上述した図6が示す第1実施形態に係る制御情報と、制御内容は同じである。変形例1に係る生成部113は、変化後の形状を示す形状情報の前の遷移を開始するタイミングに対応して、変化前の形状を示す形状情報を有する制御情報を生成する。すなわち、制御情報は、形状情報が必ず2つセットとして規定される。これにより、2つ目の形状情報に対応するタイミングが、口の形状変化の遷移が開始されるタイミングとなる。そして、遷移開始のタイミングから次の形状情報に対応するタイミング(遷移終了タイミング)までが遷移時間となる。このように制御情報は、遷移時間を示す情報を含んでいれば、どのような態様で含んでいてもよい。
【0053】
図15は、図2に示す発音情報および図14に示す制御情報を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。図15の詳細な説明については、図7における場合と同様であるため省略する。図15に示すように、遷移期間の開始タイミングおよび終了タイミングは、変化前の形状を示す形状情報と、変化後の形状を示す形状情報とに挟むようにして制御情報に規定される。
【0054】
[変形例2]
上述した実施形態において、形状制御装置10は、形状変化装置30における口の形状以外の形状についても制御してもよい。例えば、形状変化装置30が目を模した部分(以下、単に「目」という)を有し、目の開閉が可能に構成されていれば、形状制御装置10は、この開閉を制御するようにしてもよい。この場合の形状制御装置10の構成について説明する。
【0055】
変形例2において、記憶部12は、目の形状を示す形状情報を記憶している。この例において、形状情報「OPEN」「CLOSE」は、それぞれ開状態、閉状態の目の形状を示すものとする。
変形例2において、生成部113は、発音情報に基づいて、目蓋制御情報を生成して記憶部12に記憶する。この目蓋制御情報は、形状情報、その形状情報が示す目の形状にするタイミング、および目の形状が変わるときにおける変化前から変化後までの遷移時間を規定した情報である。これらの各情報は、生成部113が発音情報および形状対応情報に基づいて決定する。なお、このタイミングは、発音情報と同様に発音開始指示からの経過時間を示すものである。
【0056】
生成部113は、目蓋制御情報を生成するときには、この例においては、発音情報が示す各音節の発音時間に基づいて、形状情報を「OPEN」または「CLOSE」のいずれかに決定する。生成部113は、予め決められたアルゴリズムに従って、形状情報を決定する。この例においては、生成部113は、特定の範囲の時間から、音節ごとにランダムに時間Tbを決定し、その音節の発音時間が時間Tbを超える場合に、その音節に対応する形状情報を「CLOSE」として決定する。そして、生成部113は、形状情報が「CLOSE」となる条件を満たさない音節に対応する形状情報を「OPEN」として決定する。
【0057】
なお、生成部113は、このような形状情報の決定に限定されることなく、様々な態様で形状情報の決定を行うことができる。例えば、生成部113は、音節を構成する音素(子音、母音)の種類、組み合わせ、音高、前後の音節のつながり(フレーズの流れ)に基づいて、形状情報を決定してもよい。また、生成部113は、音節の発音時間が一定の時間Tcを超えた場合には、形状情報を一定の確率で「CLOSE」となるように決定してもよい。
生成部113における形状情報の決定にランダム性を持たせることで、同じフレーズが続いた場合でも、常に同じ部分で目を閉じてしまうといったことを回避することができる。
生成部113は、遷移時間については、第1実施形態における制御情報における遷移時間と同様に、予め決められたアルゴリズムに従って決定する。
【0058】
変形例2において、形状制御部114は、記憶部12に記憶された目蓋制御情報に基づいて、目の開閉を変化させるように、インターフェイス15を介して形状変化装置30を制御する。この目蓋制御情報は、発音制御部112が制御に用いる発音情報に基づいて生成部113が生成した目蓋制御情報である。形状制御部114における目蓋制御情報に基づく制御は、第1実施形態における制御情報に基づく制御と制御対象が異なるだけである。そのため、形状制御部114における目蓋制御情報に基づく制御の内容については、詳細の説明を省略する。
次に、発音情報を例示して、変形例2における発音装置20および形状変化装置30の動作について説明する。
【0059】
図16は、変形例2に係る発音情報の一例を説明する図である。図17は、図16に示す発音情報に基づいて生成される目蓋制御情報を説明する図である。図18は、図16に示す発音情報および図17に示す目蓋制御情報を用いた場合の発音装置20および形状変化装置30の動作を説明する図である。図18に示す「目の形状」については、形状変化装置30の目の形状を形状情報により示している。
【0060】
図19は、変形例2に係る形状情報を説明する図である。図19に示す例においては、形状情報「I」と「OPEN」との組み合わせ、形状情報「I」と「CLOSE」との組み合わせを例として、目の形状および口の形状を示している。
このように、形状制御装置10は、発音情報に基づいて様々な部分の形状を制御する制御情報を生成して、形状変化装置30の口の形状だけでなく、目の形状、その他の部分の形状についても制御するようにしてもよい。
【0061】
[変形例3]
上述した実施形態においては、形状変化装置30は人型ロボットであったが、表示画面を有し、表示画面にCGで人の顔などを表示させたものであってもよい。すなわち、形状変化装置30は、口を模した部分を有する装置であればよい。なお、口とは、人の口に限らず、動物の口であってもよいし、口を有さない植物、構造物などに擬似的に設けた口であってもよい。
また、CGなど表示画面に表示させる場合には、形状変化装置30が表示するのではなく、表示部14が表示するようにしてもよい。
【0062】
[変形例4]
上述した第1実施形態においては、形状制御装置10は、制御情報を生成する生成部113と形状制御部114とを有していたが、それぞれ別の装置で処理が行われるようにしてもよい。すなわち、形状制御装置10は、生成プログラムをCPUにより実行することにより発音情報取得部111および生成部113を有する制御情報生成機能を実現する制御情報生成装置と、制御プログラムをCPUにより実行することにより形状制御部114を有する制御機能を実現する装置とにより構成されるようにしてもよい。この形状制御部114は、生成部113が生成した制御情報に基づいて、形状変化装置30を制御すればよい。
【0063】
[変形例5]
上述した第1実施形態において、生成部113は子音を持つ音節に対応する形状情報について、その形状情報が示す形状に変化させる遷移開始タイミングを、その子音の音素タイミングとし、遷移終了タイミングをその母音の音素タイミングとするように制御情報を生成してもよい。第2実施形態においては、出力部115が上記遷移開始タイミング、終了タイミングとなるように、形状情報および遷移時間を示す情報を出力するようにしてもよい。
【0064】
[変形例6]
上述した実施形態においては、形状制御装置10は、発音情報が示す音節に唇音を持つものがある場合には、母音に対応する口の形状とする前に、形状情報「N」により示される口を閉じる形状となるように、形状変化装置30を制御していた。これと同様に、唇音でなくても、音節を発音するときに人の口の形状が変化するような場合、例えば、「わ」、「さ」など特定の子音をもつ音節である場合に、記憶部12は、これに対応する口の形状を示す形状情報を記憶しておいてもよい。そして、生成部113、出力部115は、唇音に対応して形状情報「N」を用いたように、この形状情報を用いて処理を行えばよい。
【0065】
[変形例7]
上述した実施形態においては、形状制御装置10は、母音「a」「i」「u」「e」「o」に対応する形状情報を用いていたが、これ以外の特殊な母音に対応する口の形状を示す形状情報を用いてもよい。
【0066】
[変形例8]
上述した実施形態における形状制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、形状制御装置10は、形状制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0067】
1…形状制御システム、10…形状制御装置、11…制御部、12…記憶部、13…操作部、14…表示部、15…インターフェイス、111,111A…発音情報取得部、112,112A…発音制御部、113…生成部、114,114A…形状制御部、115…出力部、20…発音装置、30…形状変化装置

【特許請求の範囲】
【請求項1】
複数の音節および前記各音節の発音タイミングを規定した発音情報に基づいて発音する発音装置の発音内容に対応して口を模した部分の形状が変化するように制御される装置の当該口の形状を制御するために用いられる制御情報を生成する制御情報生成装置であって、
前記発音情報を取得する発音情報取得手段と、
前記口の形状を示す形状情報、前記口の形状を当該形状情報が示す形状にするタイミングを示すタイミング情報、および当該形状が変わるときにおける変化前から変化後までの遷移時間を示す遷移情報を有する制御情報を、前記発音情報取得手段によって取得された発音情報に基づいて生成する生成手段であって、前記発音情報が示す音節の母音に応じて前記形状情報を決定し、当該音節の発音タイミングに応じて前記タイミング情報を決定するとともに、予め決められたアルゴリズムに従って前記遷移情報を決定することによって、前記制御情報を生成する生成手段と
を具備することを特徴とする制御情報生成装置。
【請求項2】
前記遷移情報は、前記口の形状の変化を開始するタイミングを示す情報を有し、
前記遷移情報が示す遷移時間は、当該情報が示すタイミングから当該変化した後の形状にするタイミングまでを示す
ことを特徴とする請求項1に記載の制御情報生成装置。
【請求項3】
前記生成手段は、前記発音情報が示す音節の子音が特定の子音であるときには、当該子音に応じた前記口の形状を示す形状情報、および当該形状情報に係るタイミング情報をさらに有する制御情報を生成し、当該タイミング情報を当該音節の母音に応じた形状情報が示す形状にするタイミングより予め決められた時間だけ前のタイミングとして決定する
ことを特徴とする請求項1または請求項2に記載の制御情報生成装置。
【請求項4】
前記生成手段は、一の前記形状情報が示す形状と、次の前記形状情報が示す形状とが同一であり、それぞれの形状情報に係るタイミング情報が示すタイミング間の時間が予め決められた時間より長い場合には、当該形状とは異なる前記口の形状を示す形状情報、および当該形状情報に係るタイミング情報をさらに有し、当該タイミング情報を当該タイミング間のいずれかのタイミングとして決定する
ことを特徴とする請求項1乃至請求項3のいずれかに記載の制御情報生成装置。
【請求項5】
口を模した部分を有する装置における当該口の形状を制御する形状制御装置であって、
発音させる複数の音節および発音タイミングを規定した発音情報に基づいて、発音装置に対して発音内容の制御を行う発音制御手段と、
前記発音制御手段によって前記発音情報に基づいて発音制御が行われているときに、当該発音情報に基づいて前記口の形状を示す形状情報を出力する出力手段であって、当該発音情報が示す音節の母音に応じて前記形状情報を決定し、当該音節の発音タイミングより予め決められた遷移時間前に当該形状情報を出力する出力手段と、
前記出力手段から形状情報が出力されると、前記遷移時間をかけて前記口の形状を当該形状情報が示す形状に変化させるように、前記装置を制御する形状制御手段と
を具備することを特徴とする形状制御装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2011−164763(P2011−164763A)
【公開日】平成23年8月25日(2011.8.25)
【国際特許分類】
【出願番号】特願2010−24346(P2010−24346)
【出願日】平成22年2月5日(2010.2.5)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】