説明

半導体集積回路装置及び電子機器

【課題】音声合成処理の終了から音声認識処理の開始までの間に適切な時間間隔を設ける処理に対するホスト装置の負荷を低減する。
【解決手段】半導体集積回路が、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、半導体集積回路装置及び電子機器に関するものであり、特に音声処理を行うことが可能な半導体集積回路装置及び電子機器に関する。
【背景技術】
【0002】
従来、音声合成処理若しくは音声認識処理を行う様々な半導体集積回路装置及び電子機器が存在する。これらの装置の中には、所謂対話ボットのような、該装置が発する問いに対して利用者が返答を行い、該装置が返答に応じて更なる問いを行うなどの対話形式の処理が可能な装置も存在する。
【0003】
対話形式の処理が可能な装置は、音声合成処理及び音声認識処理の両方の処理が可能な装置であるが、該装置による音声の出力と利用者の返答とが同時にならないことを前提とするならば、音声合成処理と音声認識処理とを並列に行うことは必ずしも必要ない。このため、音声合成処理と音声認識処理とが排他的に行われるような構造を有する場合若しくは音声合成処理と音声認識処理とが排他的に実行されるように制御が行われる場合がある。
【0004】
いずれの場合においても、音声合成処理を行うタイミング及び音声認識処理を行うタイミングの制御のための制御信号が必要である。このような制御信号の例として、特許文献1には、ホストCPUからのコマンドの受信、外部から入力される音声合成処理開始制御信号及び音声認識処理開始制御信号などの外部信号、及び、半導体集積回路内部の複数のタイマーなどを用いてタイミング制御を行うことが記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−129412号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、音声合成処理及び音声認識処理のタイミング制御に外部から入力される音声合成処理開始制御信号及び音声認識処理開始制御信号を用いていることにより、これらの信号を生成する外部の処理装置の動作により処理タイミングが規定されてしまい、該処理装置の動作によっては、音声合成部及び音声認識部の制御に不具合が発生する可能性がある。
【課題を解決するための手段】
【0007】
本発明は、上述した問題若しくは課題の少なくともひとつを解決するためになされたものであり、以下の適用例若しくは実施形態として実現することが可能である。
【0008】
[適用例1]
本適用例にかかる半導体集積回路装置は、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする。
【0009】
この構成によれば、外部コマンドから入力された制御コマンドが第1の記憶部に記憶され、該制御コマンドが第1の制御部により解釈され、該第1の制御部により音声認識部に対する動作開始の指示がなされた後に、該音声認識部における音声認識の処理が開始されることで、音声認識部により音声認識処理の開始のタイミングを調整することができる。
【0010】
音声認識部における音声認識処理は、常時行う必要がある場合と常時行う必要がない場合とがある。たとえば、問い合わせと該問い合わせに対する返答などの場合においては、該問い合わせの音声が発せられている間は音声認識の処理がなされていなくても差し障りがない場合が多い。このような場合は、第1の制御部により音声認識部が処理を行う期間の長さの制御が行われることが好ましい。また、音声認識の処理の開始までの時間間隔は、対話の内容により変更したほうが好ましいこともあると考えられる。
【0011】
しかしながら、第1の制御部がこのような制御を行うことは、第1の制御部にとって煩わしいことになる場合がある。このような場合、ひとつの例として、音声認識部の側で処理を開始するまでの時間の調整が行えると第1の制御部における処理が容易なものとなる。音声認識部が第1の制御部からの動作開始の指示の後の所定の時間の経過後に音声認識の処理を開始するようにすることで、第1の制御部は音声認識部に対する処理開始の指示を行うだけで音声認識処理を開始するまでの時間間隔の制御を行う必要をなくすことができる。第1の制御部は、半導体集積回路装置内の制御の多くを行う部分であるから、音声認識部に処理の開始を所定の時間遅らせる制御を付加するデメリットと第1の制御部から音声認識部の処理開始のタイミングを調整する制御を除くメリットを考慮すると、半導体集積回路装置としてみた場合は、第1の制御部から音声認識部の処理開始のタイミングを調整する制御を除くメリットの方が大きいと判断することができる。
【0012】
[適用例2]
上記適用例にかかる半導体集積回路装置において、前記所定の時間は、前記音声認識の処理における処理内容に応じて設定されることが好ましい。
【0013】
この構成によれば、音声認識部における音声認識の処理を開始させるための所定の時間を音声認識の処理における処理内容に応じて設定することで、音声認識処理を行う期間の制御を適切に行うことができる。
【0014】
たとえば、所定の時間の設定は音声認識部にタイマー機能を持たせ、処理の開始を該タイマー機能に設定した値のカウント分の時間遅らせることで実現することができる。音声認識の処理内容に応じてとは、対話の種類に応じてと言い換えることでよい。したがって、所定の時間の変更は、対話の種類に応じて該タイマー機能に設定する値を予め用意しておき、これらの値のいずれかを用いることでよい。尚、タイマー機能は、ハードウエアで構成してもソフトウエアで構成してもどちらでもよい。
【0015】
また、タイマー機能は複数有してもよい。複数のタイマー機能のそれぞれに処理内容に応じた所定の時間に対応するカウント値を設定しておき、対話内容に応じて用いるタイマー機能を切り替えることにより処理内容に応じて行う所定の時間の設定が容易となる。
【0016】
[適用例3]
上記適用例にかかる半導体集積回路装置において、更に、音声合成部を含み、前記音声合成部は前記解釈の結果に基づいて前記第1の制御部により制御され、前記音声合成部における音声合成の処理の終了を示す信号が出力された後、前記所定の時間の経過後に前記音声認識の処理が開始されることが好ましい。
【0017】
この構成によれば、更に音声合成部を含み、音声合成部の処理の終了を示す信号が出力された後、所定の時間の経過後に音声認識の処理が開始されるようにすることで、第1の制御部が行う制御を簡単化することができる。
【0018】
たとえば、外部から入力されたコマンドが音声合成処理の終了後に音声認識処理を行うことを指示するコマンドであった場合、第1の制御部は音声認識部の処理開始のトリガーとなる信号を第1の制御部からの出力信号から音声合成処理の終了を示す信号に切り替えておく。その後に音声合成部に音声合成処理の開始を指示し、音声認識処理の終了の割込み待ちとするだけで、音声合成部の処理と音声終了部の処理とを連続して実行することができ、音声合成処理の開始の指示の後に音声合成処理の終了を認識し、その後に音声認識処理の開始を指示し音声認識処理の終了を待つのと比較すると、第1の制御部における処理を簡便なものとすることができる。
【0019】
[適用例4]
本適用例にかかる電子機器は、半導体集積回路装置を内蔵する電子機器であって、前記半導体集積回路装置が、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする。
【0020】
この構成によれば、半導体集積回路装置を含む電子機器であって、該半導体集積回路装置が音声認識部と第1の記憶部と第1の制御部とを含み、第1の記憶部に記憶されたコマンドの実行を行う第1の制御部からの指示の後、音声認識部が所定の時間経過後に処理を開始することで、音声認識部により音声認識処理の開始のタイミングを調整することができる電子機器を構成することができる。
【0021】
[適用例5]
上記適用例にかかる電子機器において、前記半導体集積回路装置は、更に、音声合成部を含み、前記音声合成部は、前記解釈の結果に基づいて前記第1の制御部により制御され、前記音声合成部における音声合成の処理の終了を示す信号が出力された後、前記所定の時間の経過後に前記音声認識の処理が開始されることが好ましい。
【0022】
この構成によれば、電子機器が更に音声合成部を含み、該音声合成部における音声合成の処理の終了を示す信号が出力された後、所定の時間の経過後に音声認識の処理が開始されることで、第1の制御部により実行されるコマンドが音声合成処理の後に音声認識処理を行うことを示すコマンドである場合の第1の制御部による制御を簡便なものとする電子機器を構成することができる。
【図面の簡単な説明】
【0023】
【図1】半導体集積回路装置の概略ブロック図。
【図2】ホスト装置におけるフローチャート図。
【図3】ホスト装置におけるフローチャート図。
【図4】音声認識部におけるフローチャート図。
【図5】電子機器の概略ブロック図。
【図6】ホスト装置における従来のフローチャート図。
【発明を実施するための形態】
【0024】
以下、図を用いて本発明の実施形態について説明する。尚、以降の実施形態の説明に用いる図は、説明に必要な部分を表した便宜上のブロック図である。実際の装置には、図に示されていない様々な機能を有するブロックが存在する。
【0025】
(第1実施形態)
本実施形態は、本発明を適用した半導体集積回路装置100の動作の例を示すものである。図1に、本実施形態における半導体集積回路装置100を示す。半導体集積回路装置100は、記憶部110、制御部120、音声認識部130及び音声合成部140を有する。記憶部110には、音声合成部140で使用される音声合成用データ、音声認識部130で使用される音声認識用のデータベース、及び、音声認識部130で認識された結果などが格納される。
【0026】
半導体集積回路装置100は、接続信号23を介して図示しないホスト装置と接続される。接続信号23の仕様は接続されるホスト装置との取り決めによるものでよい。たとえば、ホスト装置から見た半導体集積回路装置100の位置付けがペリフェラル装置のひとつという位置付けでもよい。また、ホスト装置のプロセッサーにおけるコプロセッサーとして構成されることでもよい。また。半導体集積回路装置100からホスト装置に対する割込み要求を示す信号も接続信号23に含まれるものとする。
【0027】
制御部120は、半導体集積回路装置100内部の制御と接続信号23を介してホスト装置との通信を行う機能を有している。半導体集積回路装置100は、ホスト装置から送られる制御コマンドにより制御される。制御部120はホスト装置と行った通信情報を解析することでホスト装置からの指示内容を判断し、半導体集積回路装置100内部の制御を行う。
【0028】
制御信号20は、制御部120が記憶部110を制御するための信号であり、記憶部110に対するアドレス情報、コマンド情報(以降、第1コマンド情報と呼ぶ)及びデータ情報などが含まれる。尚、第1コマンド情報には、書込み指示や読み出し指示などの記憶部110の動作を指示する情報が含まれる。
【0029】
制御信号21は、制御部120が音声認識部130を制御するための信号であり、コマンド情報(以降、第2コマンド情報と呼ぶ)や割込み情報などが含まれる。尚、第2コマンド情報には、処理の開始指示、処理の停止指示、処理の終了指示及び処理に必要なパラメーター・データ等が含まれる。また、制御信号21に含まれる割込み情報は音声認識部130からの情報であり、音声認識処理の終了及びエラー検出などによる割込み要求が含まれる。
【0030】
制御信号22は、制御部120が音声合成部140を制御するための信号であり、コマンド情報(以降、第3コマンド情報と呼ぶ)や割込み情報などが含まれる。尚、第3コマンド情報には、処理の開始指示、処理の停止指示、処理の終了指示及び処理に必要なパラメーター・データ等が含まれる。また、制御信号22に含まれる割込み情報は音声合成部140からの情報であり、音声合成処理の終了及びエラー検出などによる割込み要求が含まれる。
【0031】
音声認識部130は、音声認識処理を行う部分である。上述したように、音声認識部130と制御部120とは制御信号21により接続されている。マイク101は、音声認識部130で音声認識を行うための音声を入力するためのものである。マイク101は、図示しない適切なインターフェイスを介して音声認識部130と接続されている。音声認識部130は、第1タイマー131を有する。第1タイマー131は、音声認識部130に対する音声認識処理の開始が指示された後に音声認識処理が開始されるまでの所定の時間を計測するためのタイマーである。音声認識部130は、処理の開始が指示されると第1タイマー131によるカウントを行い、カウントアップとなってから音声認識処理を開始する。また、音声認識部130と音声合成部140との間に接続されている制御信号30は、音声合成部140から出力される、音声合成処理の終了を示す信号である。音声認識部130における音声認識処理の開始は、制御部120からの制御信号21若しくは制御信号30により指示される。いずれかの信号を用いるかは、事前に制御部120により制御信号21を介して設定される。
【0032】
制御信号10は、音声認識部130が記憶部110のアクセスに用いる信号である。記憶部110における記憶領域を指定するためのアドレス情報、コマンド情報(以降、第4コマンド情報と呼ぶ)及びデータ情報が含まれる。第4コマンド情報には、書込み指示や読み出し指示などの記憶部110の動作を指示する情報が含まれる。上述したように、音声認識用のデータベースは記憶部110に記憶されている。音声認識部130は、制御信号10を介して記憶部110にアクセスし、音声認識の処理に必要なデータを入手する。また、記憶部110は、マイク101からの音声データの一次記憶用のメモリーとしても利用されるなど、音声認識処理におけるワークメモリーとしても用いられ、このための制御においても制御信号10が用いられる。
【0033】
音声合成部140は、制御部120からの指示により音声合成処理を行う部分である。上述したように、音声合成部140と制御部120とは制御信号22により接続されている。音声合成部140で合成された音声は、スピーカー102から出力される。スピーカー102は、図示しない適切なインターフェイスを介して音声合成部140と接続されている。音声合成部140は、音声合成処理が停止若しくは終了した場合は、制御信号22を介して停止若しくは終了したことを制御部120に通知すると共に、制御信号30を介して音声認識部130にも通知する。
【0034】
制御信号11は、音声合成部140が記憶部110のアクセスに用いる信号である。記憶部110における記憶領域を指定するためのアドレス情報、コマンド情報(以降、第5コマンド情報と呼ぶ)及びデータ情報が含まれる。第5コマンド情報には、書込み指示や読み出し指示などの記憶部110の動作を指示する情報が含まれる。音声合成部140は、制御信号11を介して音声合成用データを取得することができる。尚、制御部120が音声合成処理の開始の指示と共に音声合成用データを与えるようにすることもできる。音声合成部140の音声合成用データの入手手段の決定は、制御部120により行われる。
【0035】
便宜上、音声合成処理を用いて利用者に対して質問などの音声を発した後で、利用者の返答を音声認識する処理を行うことを想定する。このような処理の場合、音声認識処理は音声合成処理の終了後に即座に開始する必要はない。利用者が返答内容を考えるのに要する時間を含めて、利用者からの返答があるまでには所定の時間(以降、開始遅延時間と呼ぶ)を必要とすると考えられるからである。また、開始遅延時間の間に音声認識処理を行わないことで、消費電力の低減が可能となる。
【0036】
ここで、上記開始遅延時間の設定をするために、従来行っていた処理(以降、従来処理と呼ぶ)のホスト装置におけるフローチャート901を図6に示す。従来処理の場合は、音声合成処理の開始及び音声認識処理の開始をホスト装置から指示すると共に、音声合成処理の終了後における音声認識処理の開始までの遅延時間をホスト装置において管理していた。また、本説明における従来処理において、ホスト装置は、音声合成処理の終了、音声認識処理の終了及びタイマーカウントアップなどを割込みにより認識するものとする。尚、半導体集積回路装置100を従来処理に適応させる場合は、第1タイマー131のカウント値をゼロとすることで可能である。従って、以降の従来処理の説明において第1タイマー131の値がゼロになっているとして、図1に示したブロック図を流用する。
【0037】
フローチャート901について説明する。電源投入後、パワーオンリセット及びホスト装置における初期設定が行われる(S901)。次にホスト装置により半導体集積回路装置100の初期設定が行われ(S902)、開始遅延タイマーにカウント値が設定される(S903)。ここで、開始遅延タイマーとは、ホスト装置におけるタイマーのひとつであり、専用のタイマーとして設定してあってもよく汎用のタイマーを用いることでもかまわない。尚、処理S901は、接続信号23を介してホスト装置から送信される制御コマンドにより指示される。ホスト装置は、音声合成処理が終了した後開始遅延タイマーのカウントを起動させ、開始遅延タイマーがカウントアップした後で音声認識処理の開始を指示することになる。
【0038】
その後、音声合成処理の開始を指示(S904)し、音声合成処理の終了割込みを認識可能とするために割込み許可の設定がなされる(S905)。ホスト装置は音声合成処理の終了割込みの監視を行い(S906)、終了割込みが発生すると一旦割込み禁止の設定(S907)をした後開始遅延タイマーのカウントを開始し(S908)、再び割込み許可の設定(S909)を行う。
【0039】
ホスト装置は、開始遅延タイマーのカウントアップを割り込みにより監視(S910)し、当該割り込みを検出すると割込み禁止に設定(S911)した後で音声認識処理の開始を指示(S912)する。その後、割込みを許可(S913)し音声認識処理の終了を監視(S914)する。音声認識処理の終了の割込みを検出すると割込みを禁止(S915)した後に音声認識結果を取得(S916)する。これにより音声合成処理と当該音声合成処理に続いた音声認識処理とが終了する。尚、説明の便宜上、フローチャート901では、エラー発生に伴い行わなければならない処理等の動作の説明に直接関係しないと思われる処理に関するフローは省略している。これは、以下のフローチャートにおいても同様とする。
【0040】
本発明にかかる半導体集積回路装置100は音声認識部130が第1タイマー131を有することで、従来処理で用いていたホスト装置における開始遅延タイマーを不要とする。
【実施例1】
【0041】
本実施例は、ホスト装置からの指示を受け、制御部120が音声合成部140及び音声認識部130のそれぞれに対する処理の開始を個別に指示する例である。この形の実行のモードを第1実行モードと呼ぶことにする。本実施例における処理のフローチャート501を図2に示す。
【0042】
フローチャート501について説明する。半導体集積回路装置100及びホスト装置の電源が投入されると、まずパワーオンリセットが行われ続いて半導体集積回路装置100及びホスト装置のそれぞれにおいて初期設定が行われる(S101)。この段階においては、ホスト装置における割込みの受付は許可されていない。続いて、ホスト装置により半導体集積回路装置100に対する動作設定が行われる(S102)。
【0043】
次に、第1タイマー131に開始遅延時間の計測のためのカウント値が設定(S103)され、音声認識部130が第1実行モードで動作するように設定(S104)がなされる。具体的には、処理S104により音声認識部130における第1タイマー131のカウント開始が制御部120からの指示(制御信号21)で行われるように設定がされる。第1タイマー131に設定されるカウント値は固定値でもよいが、固定値とする必要はなく処理に適した任意のカウント値を設定することでよい。
【0044】
次に、半導体集積回路装置100に対して音声合成処理の開始を指示(S105)し、ホスト装置に対する割込みが許可される(S106)。続いて、ホスト装置は半導体集積回路装置100からの割込みを監視し、音声合成処理が終了したかどうかを確認する(S107)。処理S105が実行されると、音声合成処理の開始の指示が制御信号22を介して制御部120から音声合成部140に対してなされる。音声合成部140による処理が終了すると制御部120に対して終了割込みが発生し、制御部120はホスト装置に対する割込みを要求する。ホスト装置において音声合成処理の終了が確認されると一旦割込みを禁止(S108)にした後で、半導体集積回路装置100に対して音声認識処理の開始の指示(S109)がなされ、ホスト装置に対する割込みが許可(S110)される。続いて半導体集積回路装置100からの割込みを監視し音声認識処理が終了したかどうかを確認する(S111)。処理S109が実行されると、音声認識処理の開始の指示が制御信号21を介して制御部120から音声認識部130に対してなされる。音声認識処理が終了すると制御部120に対して終了割込みが発生し、制御部120は接続信号23を介して音声認識処理の終了の割込み要求をホスト装置に伝達する。ホスト装置において終了が確認されるとホスト装置に対する割込みを禁止(S112)し、音声認識結果を取得(S113)する。これにより音声合成処理と当該音声合成処理に続いた音声認識処理とが終了する。
【0045】
フローチャート501とフローチャート901を比較して明らかなように、フローチャート501の処理項目の方が少ない。また、フローチャート501及びフローチャート901は便宜上説明ができる程度の簡易なものとして記載したものであるが、実際にホスト装置が処理する処理には装置全体の割込み処理、エラー処理及びユーザーインターフェイスのための処理など多岐にわたり、その処理フローは相当に複雑なものになる。このような処理を行う場合には、制御に微妙な影響を与えそうな期間計測などの処理を複数並行して処理することは、割込み禁止期間における処理などが多くなった場合には当該期間計測が正確さを欠く場合が想定できる。従って、開始遅延時間の計測の負荷をホスト装置から減らすことの効果は、フローチャート501とフローチャート901との差以上のホスト装置における負担軽減効果及びホスト装置における時間的な制御の正確さの向上の効果を有すると考えることができる。
【実施例2】
【0046】
本実施例は、制御部120が音声合成部140に対して処理の開始の指示を行った後、音声認識部130の処理の開始が音声合成部140の終了により起動される例である。制御部120は、音声合成部140に対して処理の開始の指示を行った後は音声認識部130からの終了の通知を待つことでよい。本実施例における実行モードを第2実行モードと呼ぶことにする。また、ホスト装置においても、音声合成の処理の指示を行なった後は音声認識の終了まで処理の終了の通知がないことになる。従って、第2実行モードで動作が行われる場合は、ホスト装置からの指示は、音声合成処理と音声認識処理を連続して行うことを指示するものである。本実施例における処理のフローチャート502を図3に示す。
【0047】
フローチャート502について説明する。半導体集積回路装置100及びホスト装置の電源が投入されると、まずパワーオンリセットが行われ続いて半導体集積回路装置100及びホスト装置のそれぞれにおいて初期設定が行われる(S201)。この段階においては、ホスト装置に対する割込みは許可されていない。続いて、ホスト装置により半導体集積回路装置100に対する動作設定が行われる(S202)。
【0048】
次に、第1タイマー131に開始遅延時間の計測のためのカウント値が設定(S203)され、音声認識部130が第2実行モードで動作するような設定(S204)がなされる。具体的には、処理S204により音声認識部130における第1タイマー131のカウント開始が音声合成部140からの指示(制御信号30)で行われるように設定がされる。
【0049】
次に、ホスト装置から半導体集積回路装置100に音声合成認識処理の開始の指示(S205)がなされる。ここでいう音声合成認識処理は、音声合成処理の後に連続して音声認識処理を行う処理のことである。続いて、ホスト装置に対する割込みが許可(S206)され、音声合成認識処理の終了を監視(S207)し、終了が確認されるとホスト装置に対する割込みを禁止(S208)し、ホスト装置は音声認識結果を取得(S209)する。これにより音声合成認識処理が終了する。
【0050】
本実施例におけるホスト装置の処理の従来処理に対する負荷の低減は、第1実施例におけるホスト装置の処理の従来処理に対する負荷の低減よりも大きなものとなる。
【0051】
(第2実施形態)
本実施形態は、第1実施形態における音声認識部130の処理の例について示すものである。音声認識部130の処理を示すフローチャート503を図4に示す。
【0052】
フローチャート503について説明する。まず、電源投入に伴うパワーオンリセット、及び初期設定が行われる(S301)。当該初期設定は、制御部120が音声認識部130に対して行う初期設定である。ホスト装置が行う動作設定(S102及びS202)は、ホスト装置から送られるコマンドが制御部120で解釈され、制御部120が発する第2コマンドの実行として行われる。第2コマンドは、制御信号21を介して音声認識部130に伝達される。また、処理S301が実行された直後において、音声認識部130からの割込み要求信号はマスクされ、音声認識処理の開始が第2コマンドにより行われるように(第1実行モード)設定されている。従って、フローチャート501における処理S104は、必ず必要な処理とはいえず、第2実行モードから第1実行モードに変更する場合に行う処理として行うことでよいことになる。第1実行モードから第2実行モードへの変更及び第2実行モードから第1実行モードへの変更は、第2コマンドにより行われる。
【0053】
パワーオンリセット・初期設定(S301)が終了すると、音声認識部130は第2コマンドの受信の判定(S302)を行う。第2コマンドの受信がない場合においては、コマンドの受信の判定(S302)と第2実行モードであるかどうかの判定(S307)が繰り返される。また、第2実行モードである場合には、第2コマンドの受信の判定(S302)及び制御信号30を介しての音声合成処理の終了の判定(S308)が繰り返される。第2実行モードにおいては、制御信号30により伝達される音声合成処理の終了の通知が第1タイマー131のカウント開始のトリガーとなる。音声合成処理の終了が伝達されると第1タイマー131によるカウントが開始される(S309)。第1タイマー131のカウント終了後の処理については後述する。
【0054】
第2コマンドの受信があった場合は、受信した第2コマンドの解析を行う(S303)。当該第2コマンドが音声認識処理の開始の指示を行うものでない場合には処理S306に進み(S304)、必要な処理が音声認識部130において実行(S306)され、第2コマンドの受信の判定(S302)の処理に戻る。第2コマンドが音声認識処理の開始の指示を行うものであった場合には処理S305に進み(S304)、第1実行モードであるかどうかを判定し(S305)、第1実行モードの場合は第1タイマー131によるカウントが開始(S309)される。第1実行モードでない場合は第2コマンドの受信の判定(S302)の処理に戻る。本来は、第1実行モードでない場合に音声認識処理の開始の第2コマンドが発せられることはない。この場合には、実際にはエラー処理が存在するが、上述したように、本実施形態の説明においては便宜上省略している。
【0055】
第1タイマー131によるカウントが終了する(S310)と音声認識処理が実行される(S311)。その後、音声認識結果が保存され(S312)、制御部120に対しての処理終了を通知し(S313)、第2コマンドの受信の判定(S302)に戻ることとなる。制御部120は、音声認識部130からの処理終了の通知を受けてホスト装置に音声合成認識処理の終了を通知する割込み要求を行う。尚、フローチャート503においては、コマンド受信の判定(S302)と第2実行モードにおける音声合成処理の終了の判定(S307及びS308)が逐次的に行われるようになっているが、第2コマンドの受信と制御信号30の変化とを音声認識部130内部における割込み処理とすることによって、時間的に並列して検出することが可能となる。
【0056】
従来処理では音声認識部130で開始遅延時間の計測は行っておらず、このための処理が音声認識部130に追加されたことになるが、上述したように、ホスト装置側の負荷の低減に対する効果を考慮すると、ホスト装置と半導体集積回路装置100とを含む処理装置全体の処理における内部効率が改善されることになる。
【0057】
(第3実施形態)
本実施形態は、半導体集積回路装置100を有する電子機器1000について示すものである。図5に電子機器1000の概略ブロック図を示す。電子機器1000は、半導体集積回路装置100、CPU200、記憶部300、周辺回路400及び記憶装置500を有する。マイク101及びスピーカー102は、第1実施形態と同様に接続されている。周辺回路400は様々な周辺装置を接続するためのインターフェイスを有する。また、周辺回路400は無線LANの機能を有し、周辺回路400には無線LAN用のアンテナ401、モニター402、マウス403、キーボード404及び記憶装置500が接続されている。記憶装置500は、たとえばハードディスク装置のようなものである。CPU200、記憶部300及び周辺回路400は内部バス50に接続されている。また、周辺回路400は接続信号23が接続可能なインターフェイスを有し、半導体集積回路装置100は周辺回路400に接続されている。
【0058】
第1実施形態及び第2実施形態の説明において図示しないホスト装置を用いたが、本実施形態においては、周辺回路400をホスト装置と見做してもよく、CPU200、記憶部300、周辺回路400及び記憶装置500をまとめてホスト装置と見做してもよい。半導体集積回路装置100は、接続信号23を介してホスト装置から制御され、第1実施形態及び第2実施形態で説明した動作を行うことができる。これにより、電子機器1000において、利用者の要求する音声合成処理及び音声認識処理を行うことが可能となる。
【0059】
以上、本発明にかかる適用例及び実施形態の説明を行ったが、本発明の実施は上述したものに限られるものではない。たとえば、電子機器1000内部の接続において、接続信号23の仕様をCPU200の有する接続信号の仕様に合わせることで、半導体集積回路装置100をCPU200に直接接続することが可能である。また、半導体集積回路装置100内部の構成要素が内部バスを用いた接続形態をとるように構成してもよい。また、音声認識部130及び音声合成部140の各々は、記憶部110に個別にアクセスして必要なデータの入手並びに保存を行えるようにしているが、制御部120を介してそれぞれの部分に必要なデータの入手並びに保存を行えるようにしてもよい。本発明は、本発明の趣旨を逸脱しない範囲において広く適応することが可能である。
【符号の説明】
【0060】
10…制御信号、11…制御信号、20…制御信号、21…制御信号、22…制御信号、23…接続信号、30…制御信号、50…内部バス、100…半導体集積回路装置、101…マイク、102…スピーカー、110…記憶部、120…制御部、130…音声認識部、131…第1タイマー、140…音声合成部、200…CPU、300…記憶部、400…周辺回路、401…無線LAN用のアンテナ、402…モニター、403…マウス、404…キーボード、500…記憶装置、501…フローチャート、502…フローチャート、503…フローチャート、901…フローチャート、1000…電子機器。

【特許請求の範囲】
【請求項1】
音声認識部と、
外部から入力された制御コマンドを記憶する第1の記憶部と、
前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、
前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする半導体集積回路装置。
【請求項2】
前記所定の時間は、前記音声認識の処理における処理内容に応じて設定されることを特徴とする請求項1に記載の半導体集積回路装置。
【請求項3】
更に、音声合成部を含み、
前記音声合成部は前記解釈の結果に基づいて前記第1の制御部により制御され、
前記音声合成部における音声合成の処理の終了を示す信号が出力された後、前記所定の時間の経過後に前記音声認識の処理が開始されること特徴とする請求項1又は2に記載の半導体集積回路装置。
【請求項4】
半導体集積回路装置を内蔵する電子機器であって、
前記半導体集積回路装置が、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、
前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする電子機器。
【請求項5】
前記半導体集積回路装置は、更に、音声合成部を含み、
前記音声合成部は、前記解釈の結果に基づいて前記第1の制御部により制御され、
前記音声合成部における音声合成の処理の終了を示す信号が出力された後、前記所定の時間の経過後に前記音声認識の処理が開始されること特徴とする請求項4に記載の電子機器。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2013−92713(P2013−92713A)
【公開日】平成25年5月16日(2013.5.16)
【国際特許分類】
【出願番号】特願2011−235732(P2011−235732)
【出願日】平成23年10月27日(2011.10.27)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】