説明

情報処理装置及び情報処理方法

【課題】 ユーザが特定のオブジェクトに音声を登録し、その音声を発声することでオブジェクトを呼び出すことができる音声操作において、前記オブジェクトが表現しにくい概念(操作マクロ、検索クエリ等)であった場合を考える。登録したオブジェクトを発声で呼び出した際には、呼び出したオブジェクトがユーザが求める内容であるかどうかを効果的に確認する手段がない。
【解決手段】 オブジェクトへの音声登録時に、識別情報データベースから識別情報を選択する。そして、オブジェクト、登録音声、選択された識別情報からなる登録情報を登録データベースに格納する。音声呼び出し時は、呼び出された登録情報に含まれる識別情報をユーザに提示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器のユーザインタフェースに音声認識を用いた情報処理装置に関する。
【背景技術】
【0002】
近年、機器の高機能化に従い、その操作方法も複雑化している。これに伴い、機器操作に不慣れなユーザでも直感的に操作できるUI(User Interface)が強く求められるようになった。
【0003】
直感的に操作できるUIの一つとして、音声認識を用いた音声操作がある。これは、ユーザが機器のマイクに向かって音声コマンドを発声し、そのコマンドに応じた処理を機器が行うものである。このような音声操作は、カーナビゲーションシステムやCTI(Computer Telephony Integration)システムで実用化されている。
【0004】
実用化されているほとんどの音声操作では、発声可能な語彙は機器に始めから組み込まれたコマンドである。しかし、特定の機能やオブジェクト(アプリケーション、UI階層、URL等)にユーザが自由に音声を登録し、登録した音声と同じ内容の音声を発声することで、これらの機能やオブジェクトを呼び出す技術も存在する(例えば、特許文献1)。以下この技術を「音声ブックマーク」と呼ぶ。また、音声ブックマークを付けることができる機能やオブジェクトを「音声ブックマーク対象」と呼ぶ。更に、特定の機能やオブジェクトに音声を付与する行為を「音声登録」と呼び、発声によってその機能やオブジェクトを呼び出す行為を「音声呼び出し」と呼ぶ。
【0005】
音声ブックマークは、組込みの音声コマンドを覚えられないユーザにとっては、自分の覚えやすい発声を音声登録できるという利点がある。また、声に特徴があり、組込みの音声認識では認識性能が出ないユーザの場合は、自分の発声で音声登録を行うことで認識性能の向上が見込まれる。
【特許文献1】特開平11−184670号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
次のようなコマンドシーケンスがあったとする。
1.変数Aに10を設定
2.変数Bに20を設定
3.変数Cに30を設定
このコマンドシーケンスをユーザが繰り返し用いる場合、これらはマクロとして保存しておくことでユーザの利便性が向上する。しかし、マクロの呼び出しはGUIや物理ボタンを使ったものがほとんどであり、ユーザが付与した自由な発声でマクロの呼び出しを行うことはできなかった。そこで本発明では、一連のコマンドシーケンスを音声で呼び出すことでユーザの利便性を向上させることを目的とする。請求項1がこの目的を達成するための技術に相当する。
【0007】
また更にその利便性を向上することを目的とする。請求項2がこの目的を達成するための技術に相当する。
【0008】
ここでは、仮に音声ブックマーク機能をコマンドシーケンスに応用した場合を想定する。例えば、一連のコマンドシーケンスに「私のマクロ1」という音声登録を行い、「私のマクロ1」と発声(音声呼び出し)することで、上記のマクロを実行することができたとする。しかし、実際に音声呼び出しされたコマンドシーケンスが、ユーザの意図したものであるかが分かりにくいという問題がある。
【0009】
例えば、
1.変数Aに10を設定
2.変数Bに40を設定
3.変数Cに30を設定
という前出のコマンドシーケンスとは微妙に異なるものに対し、「私のマクロ2」と音声登録を行っていたとする(前出のものとは変数Bに設定する内容が異なる)。一般的に、音声認識(音声呼び出し)は誤認識が生じるものであり、「私のマクロ1」とユーザが音声呼び出しした場合でも、機器は「私のマクロ2」と解釈する可能性がある。この場合、「私のマクロ2」に相当する一連のコマンドシーケンスが実行される。しかし、ユーザは「私のマクロ1」ではなく、「私のマクロ2」が実行されたことに気が付かないことが予想される。
【0010】
上記問題を解決するために、音声呼び出し時に音声ブックマーク対象毎に定められたアイコンのような識別情報を提示することが望ましい。前出の例では、機器が「私のマクロ1」と認識した場合には、「私のマクロ1」を表すアイコンを提示する。ユーザが「私のマクロ1」と発声した場合に「私のマクロ1」以外のアイコンが提示された場合は、即座に誤認識が発生したことに気がつくはずである。
【0011】
更に、音声ブックマーク対象へのアイコン登録方法について考慮してみる。既存の技術を用いると、次の2つの方法が考えられる。
1.音声ブックマーク対象側にアイコン情報を埋め込んでおく。
2.音声登録時に、ユーザにアイコンを編集(あるいはシステムが持つアイコンリストから選択)させる。
【0012】
1の方法は、Webブラウザのブックマーク機能で用いられているものである。Web上のhtmlドキュメントでは、
<link rel=“shortcut icon” href=“shortcut.ico”/>
のように、ブックマークで表示するアイコンを記述することができる。ユーザがこのタグを含むコンテンツを表示してブックマーク登録を行うと、Webブラウザは”shortcut.ico”というアイコンをブックマークに割り当てる。
【0013】
この手法を音声ブックマークに当てはめると、音声ブックマーク対象側にアイコン情報を埋め込んでおき、呼び出し時には、このアイコンを提示することで、他のブックマーク対象との識別性を高めることが可能である。しかし、全ての音声ブックマーク対象毎に、異なるアイコンを前もって割り当てておくことは現実的ではない。例えば、上記のようなマクロを音声ブックマーク対象とする場合は、考えられる全ての設定値の組み合わせ毎に異なるアイコンを割り当てておく必要がある。
【0014】
2の方法は、音声ブックマークの音声登録時に、アイコンの編集画面をGUI等で表示し、識別しやすいアイコンを編集(あるいは選択)してもらう方法である。ユーザが適切なアイコンを選択する場合、その音声ブックマーク対象の識別性は高くなる。しかし、音声ブックマークの登録時に編集(あるいは選択)作業が発生してしまい、ユーザの負担は大きくなる。
【0015】
このように、既存の方法では、ユーザの負担が少なく、かつ、識別性が高いアイコンのような識別情報を音声ブックマークのブックマーク対象に割り当てることができない。そこで、本発明では、ユーザの負担が少なく、かつ、識別性が高い識別情報を音声ブックマークのブックマーク対象に割り当てることを目的とする。
【課題を解決するための手段】
【0016】
上記目的を達成するために、本発明に係る情報処理装置は、登録対象のコマンドシーケンスを取得する登録対象取得手段と、登録用の音声を取得する第1音声取得手段と、前記登録用の音声及び前記登録対象のコマンドシーケンスを関連付けてメモリに記憶する記憶手段と、呼び出し用の音声を取得する第2音声取得手段と、前記第2音声取得手段で取得された前記呼び出し用の音声をもとに前記メモリを検索し、検索結果である登録用の音声に関連付けて記憶された登録対象のコマンドシーケンスを取得する検索手段とを備えることを特徴とする。
【0017】
また上記目的を達成するために、本発明に係る情報処理装置は、登録対象のデータを取得する登録対象取得手段と、登録用の音声を取得する第1音声取得手段と、前記第1音声取得手段で登録用の音声を取り込んだ場合に、複数の識別情報が格納された識別情報データベースから識別情報を選択する選択手段と、前記選択された識別情報、前記登録用の音声及び前記登録対象のデータを関連付けてメモリに記憶する記憶手段と、呼び出し用の音声を取得する第2音声取得手段と、前記第2音声取得手段で取得した前記呼び出し用の音声をもとに前記メモリを検索し、検索結果である登録用の音声と関連付けて記憶された識別情報及び登録対象のデータを取得する検索手段と、前記検索手段により取得された識別情報をユーザに提示する第1提示手段とを備えることを特徴とする。
【発明の効果】
【0018】
請求項1にかかる本発明によれば、一連のコマンドシーケンスを音声ブックマーク対象とすることで、音声を登録したコマンドシーケンスを音声で呼び出すことができるようになる。また、請求項2にかかる本発明によれば、音声ブックマークの音声登録を行った際に、識別性が高い識別情報を音声ブックマーク対象毎に割り当てることができる。
【発明を実施するための最良の形態】
【0019】
以下、添付図面を参照して本発明に係る実施の形態を詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定する趣旨のものではない。
【実施例1】
【0020】
図1は、実施例1に係る情報処理装置の機能構成図である。図2は、実施例1に係る情報処理装置の音声ブックマーク登録処理のフローチャートである。図3は、実施例1に係る情報処理装置の音声ブックマーク呼び出し処理のフローチャートである。
【0021】
実施例1に係る情報処理装置は、音声ブックマーク対象に音声登録を行う。そして、音声呼び出しにより音声ブックマーク対象を呼び出すことが可能である。ここでは前半の処理を音声登録フェーズ、後半の処理を音声呼び出しフェーズとして説明する。
【0022】
<音声登録フェーズ>
ユーザからの指示に従い、本情報処理装置(100)は音声登録フェーズに入り、図2のフローチャートで示した処理を実行する。
【0023】
まず、登録用音声の取り込みを行う(S201)。ここでは、登録用音声取り込み部(101)が装置外部のマイクロフォン(10)にアクセスし、ユーザの発声を取り込む。
【0024】
次に、音声ブックマーク対象の取り込みを行う(S202)。音声ブックマーク対象とは、音声ブックマークの登録対象となるソフトウェアで表現可能なオブジェクトである。具体的には、本情報処理装置を組み込んだシステムによって異なる。例えば、ユーザがキーボードやマウス(11)を用いて指示したGUI項目(ボタン、メニュー階層等)を、音声ブックマーク対象とすることが考えられる。あるいは、現在GUI画面に表示されている設定群、URL、検索クエリ、実行中のアプリケーション名等の情報を音声ブックマーク対象としてもよい。この音声ブックマーク対象の取り込みは、音声ブックマーク対象取り込み部(102)で行われる。
【0025】
次に、音声ブックマークデータベースの参照を行う(S203)。これは、音声ブックマーク検索部(105)が音声ブックマークデータベース(106)を参照する処理である。音声ブックマークデータベースとは、既に登録された音声ブックマーク情報が格納されたデータベースである。一つの音声ブックマーク情報は、少なくとも、音声ブックマーク対象、登録用音声、登録された識別情報を含む。なお、登録用音声は、ユーザが登録用に発声した音声そのままの形で格納してもよいし、何らかの符号化を行ったものを格納してもよい。
【0026】
音声ブックマークデータベースの参照結果に応じ、今回の音声ブックマークで用いる識別情報の決定を行う(S204)。ここでいう識別情報とはブックマークを識別するためのデータであり、画像、音、テキスト、振動パタン、ライト用の点滅パタン等が考えられる。どのような識別情報を選択するかは、音声ブックマークデータベースの参照結果に応じて決定する。例えば、システムが保持している識別情報データベース(15)の中で、現在の音声ブックマークデータベースで使われていない識別情報から、ランダムで選択してもよい。あるいは、登録した順番から一意に決定される識別情報を選択してもよい。例えば、N番目に登録した音声ブックマークには、N番の識別情報を割り当てる。これらの処理は、識別情報選択部(103)で行われる。
【0027】
識別情報の決定が終了すると、音声ブックマークデータベースに、今回登録する音声ブックマーク情報(音声ブックマーク対象、登録用音声、識別情報)を関連付けて登録する(S205)。この処理は音声ブックマーク格納部(104)で行われる。登録が終了すると、音声ブックマークの音声登録フェーズを終了する。
【0028】
<音声呼び出しフェーズ>
ユーザからの指示に従って、本情報処理装置は音声呼び出しフェーズに入り、図3のフローチャートで示した処理を実行する。
【0029】
まず、呼び出し用音声の取り込みを行う(S301)。ここでは、呼び出し用音声取り込み部(107)が装置外部のマイクロフォン(12)にアクセスし、ユーザの発声を取り込む。ちなみに、マイクロフォン10とマイクロフォン12は同じ物を利用してもよい。
【0030】
次に、音声ブックマークデータベースに登録されたブックマーク数を取得し、変数Nに格納する(S302)。そして、音声ブックマークデータベースに登録された全登録用音声(N個)に対し、呼び出し用音声との類似度を算出する(S303〜S306)。音声間の類似度算出には、既存の音声認識技術を用いるため、説明は省略する。
【0031】
類似度算出が完了すると、最も類似度の高い登録用音声持つ音声ブックマーク番号を変数Mに格納する(S307)。そして、M番目の音声ブックマークの音声ブックマーク対象と識別情報を取り出す(S308)。これら一連の処理は、類似度算出部(108)で行う。
【0032】
次に、取り出した識別情報をユーザに提示する(S309)。これは、識別情報提示部(110)が装置外部のディスプレイやスピーカ(13)を介して行う。例えば、取り出した識別情報が画像あるいはテキスト情報である場合、ディスプレイから出力する。また、音データである場合は、スピーカから出力する。
【0033】
最後に、取り出した音声ブックマーク対象を音声ブックマーク情報送信部(109)が装置外部のブックマーク処理部(14)へ送信し(S310)、そこで音声ブックマークを実行する。ブックマーク処理部は、ブックマーク(音声ブックマークとは限らない)の対象に合わせた処理を行う部分である。例えば、ブックマーク対象が特定のURLであった場合、そのURLをブラウザで表示する。また、特定の設定群である場合は、その設定を機器に反映する。また、特定のアプリケーション情報である場合、そのアプリケーションを起動する。
【0034】
以上により、音声ブックマークの音声登録を行った際に、特別な操作をすること無く、識別情報を音声ブックマーク対象に割り当てることが可能となる。また、音声ブックマーク呼び出し時は、その識別情報を提示することになる。これにより、ユーザが求める音声ブックマークが選択されたかどうかが判断しやすくなる。
【実施例2】
【0035】
実施例2では、本発明を複写機に適用した例をあげて説明する。
【0036】
実施例2に係る複写機は、例えば図4の401のような操作パネルを装備している。この操作パネルには、テンキーのほか、タッチスクリーン(402)や、ユーザの音声を取り込むためのマイクロフォン(403)を装備するものとする。
【0037】
ユーザはこれらのデバイスを用い、複写のための設定を行うことが可能である。例えば、図4では、次の設定がされていることを表している。
コピー倍率:144%
コピー枚数:12枚
用紙サイズ:A4
フィニッシャ設定:自動
実施例2に係る複写機では、これらの設定群を音声ブックマーク対象とすることが可能である。
【0038】
<音声登録フェーズ>
図5は、音声登録フェーズのGUI例を示した図である。例えば、音声ブックマーク登録ボタン(404)を押下することで、音声登録フェーズを起動し、音声ブックマーク登録画面1(501)を表示する。ここでは、“Speak”と“Cancel”のGUIボタンを表示する。
【0039】
“Speak”ボタンを押下すると、音声ブックマーク登録画面2(502)を表示する。音声ブックマーク登録画面2では、音声入力インジケータ(504)を表示し、ユーザが発声する一定時間分の登録用音声をマイクロフォン(403)から取り込む。そして、音声ブックマーク対象として、現在設定されている複写設定(144%、12枚、A4、自動)を取り込む。そして音声ブックマークデータベースにアクセスし、未だ割り当たっていない識別情報番号をランダムに取得する。
【0040】
図7は、音声ブックマークデータベースの例である。括弧内はjpgファイルの画像アイコンの内容を表している。今回の音声登録フェーズに入る前は、No1とNo2の音声ブックマークが登録されていたとする。すると、42番と19番の識別情報は既に用いられているため、残りの識別情報(1番から256番までとする)からランダムな番号の識別情報を割り当てる。今回の音声登録フェーズでは27番の識別情報が割り当たったとする。
【0041】
音声ブックマーク登録画面3(503)では、取り出された27番の識別情報と、502の画面で取得した登録用音声、取り込まれた複写設定(144%、12枚、A4、自動)を用い、音声ブックマークデータベースに登録する。例えば図7のNo3のような音声ブックマークを登録する。その際、登録用音声はSpeech03.wavのように、ファイルに格納するのが望ましい。なお、音声ブックマーク登録後、今回登録した27番の識別情報(505)を画面あるいはスピーカから出力してもよい。
【0042】
<音声呼び出しフェーズ>
図6は、音声呼び出しフェーズのGUI例を示した図である。音声呼び出し前は複写設定がされていない初期画面(601)であるとする。ここで、音声ブックマーク呼び出しボタン(405)を押下することで、音声呼び出しフェーズを起動し、音声ブックマーク呼び出し画面(602)を表示する。すると、一定時間分の呼び出し用音声の取り込みを行う。その際に音声入力インジケータ(604)を表示してもよい。
【0043】
呼び出し用音声の取り込みが終了すると、音声ブックマークデータベースにアクセスし、呼び出し用音声に最も類似した登録用音声を持つ音声ブックマーク情報を選択する。例えば、最も類似した登録用音声が図7のSpeech03.wavであったとする。すると、音声ブックマークデータベース中のNo3が呼び出されたと見なし、複写設定(144%、12枚、A4、自動)と27番の識別情報を取り出す。
【0044】
そして、音声ブックマーク内容反映済み画面(603)のように複写設定(144%、12枚、A4、自動)を反映し、それとともに、27番の識別情報(605)を出力する。識別情報出力は一定時間経過後に終了してもよいし、ユーザが何らかの操作を行った際に終了してもよい。
【0045】
図8は、ユーザが意図しない音声ブックマークが呼び出された図である。
【0046】
音声呼び出し時に、ユーザはNo3の音声ブックマークを呼び出したつもりでも、背景雑音やユーザの言いよどみ等により、呼び出し用音声に最も類似した登録用音声がSpeech01.wavとなることがある。その場合、図7の音声ブックマークデータベースからNo1の音声ブックマークが選択されることになる。No1とNo3に登録された複写設定は、CopyRatioだけが異なる設定であり、一見しただけでは違いが分かりにくい。しかし、音声ブックマーク反映済み画面(801)のように複写設定反映時に42番の識別情報(802)を出力することで、違いが分かりやすくなる。
【0047】
以上により本複写機は、音声ブックマーク登録時に定めた識別情報を、呼び出し時に出力する。これにより、音声ブックマーク呼び出し時にユーザが求める複写設定と異なる複写設定が選択された際は、瞬時に間違いに気が付くようになる。
【実施例3】
【0048】
実施例2では、本発明を複写機に適用した例をあげて説明したが、これに限られるものではない。
【0049】
例えば、テレビ視聴アプリケーションに適用し、特定チャンネル番号、特定番組情報、特定のEPG検索クエリを音声ブックマーク対象とすることが可能である。
【0050】
また、検索アプリケーションに適用し、特定の検索クエリ、特定の検索結果を音声ブックマーク対象とすることが可能である。
【0051】
また、フォーム入力が必要なアプリケーションに適用し、特定の入力値のセットを音声ブックマーク対象とすることが可能である。
【実施例4】
【0052】
上記実施例では、音声登録時の識別情報選択方法として、現在音声ブックマークデータベースに登録されていない識別情報から、ランダムに選択していた。あるいは、登録した順番から一意に決定される識別情報を選択していた。しかし、識別情報選択はこれらの方法に限定されるものではない。
【0053】
既に音声ブックマークに割り当てられた識別情報を、別の音声ブックマークに割り当てても良い。例えば、割り当て回数が少ない識別情報を新たに割り当てた場合には、その識別情報の識別性はそれほど低下しない。また、同じ日(同じ週)に登録した音声ブックマークには、同じ識別情報を割り当てることも考えられる。これにより、識別情報を見る(聞く)だけで、登録日(週)が判断できるという利点が生じる。
【実施例5】
【0054】
また音声登録時の識別情報選択を、登録用音声の情報(発声時間、基本周波数、音声結果認識結果、話者クラス等)を加味して行ってもよい。
【0055】
図9は、登録用音声の情報(発声時間、基本周波数)から、識別情報を選択するためのテーブルの例である。登録用音声を解析して、このテーブルと照合することで、登録用音声に対応した識別情報を割り当てることが可能となる。
【0056】
例えば、登録用音声が次のような音声であったとする。
基本周波数:150Hz
発声時間:700ms
この場合、17〜20番の識別情報が選択対象となる。この中で、現在未使用の識別情報番号を選択し、割り当てるようにしてもよい。
【0057】
例えば、図9の一つのボックスに含まれる識別情報を同系統(画像なら青系で統一、音なら動物の鳴き声で統一等)のものにしておく。すると、特定の話者が音声登録した場合には常に同系統の識別情報が付与されることになる。音声呼び出し時に見慣れぬ系統の識別情報が出力された場合は、自分が登録したものとは異なることがすぐにわかるようになる。
【実施例6】
【0058】
また音声登録時の識別情報選択を、音声ブックマーク対象の情報(オブジェクト種別、URLのドメイン種別、GUI階層、設定値の内容等)を加味して行ってもよい。
【0059】
図10は、登録用音声の情報(発声時間)と音声ブックマーク対象の情報(コピー枚数)から、識別情報を選択するためのテーブルの例である。このテーブルを用いることで、登録用音声とブックマーク対象から識別情報を割り当てることが可能となる。
【0060】
例えば、登録用音声と音声ブックマーク対象の情報が次のような値を持っていたとする。
コピー枚数:12枚
発声時間:400ms
この場合、9〜12番の識別情報が選択対象となる。この中で、現在未使用の識別情報番号を選択し、割り当てるようにしてもよい。
【実施例7】
【0061】
上記実施例では、基本的に識別情報として画像と音を示した。しかし、これらの識別情報に限定するわけではない。例えば、テキスト情報を割り当ててもよい。フォースフィードバックが可能なデバイスでは、振動パタンを識別情報としてもよい。ライトを持つデバイスでは、ライトの色や点滅パタンを識別情報としてもよい。音声合成装置を持つシステムにおいては、音声合成の内容を識別情報としてもよい。
【実施例8】
【0062】
本発明の情報処理装置は、一連のコマンドシーケンスを音声ブックマーク対象としてもよい。例えば、図11はPC上で動作するテキストエディタの概観である(1101)。本情報処理装置はこのテキストエディタに組み込まれているものとする。
【0063】
このテキストエディタには、マクロ登録ボタン(1102)が付いている。ユーザがマクロ登録ボタンをクリックすると、コマンドシーケンスの記述を促すダイアログが開く。ユーザはそこで一連のコマンドシーケンスを記述し、PCに接続したマイクロフォンを介して音声登録を行う。すると、本情報処理装置は、ユーザが記述したコマンドシーケンス、選択した識別情報、登録音声、の対を音声ブックマークデータベースに登録する。図13はこの音声ブックマークデータベースの例である。
【0064】
ユーザがマクロ呼び出しボタン(1103)をクリックすると、音声呼び出しを促すダイアログが開く。ユーザはここで発声することで、過去に登録したコマンドシーケンスを呼び出し、実行することができる。例えば、図13のSpeech02.wavに相当する音声を発声した場合は、No2に相当する音声ブックマークが選択される。すると、カーソルが左端に移動し、カーソル位置に“>”を挿入するというコマンドシーケンスを実行する(1105)。一連のコマンドシーケンスを実行している間、No2の音声ブックマークに登録された識別情報(1106)を、カーソル上に表示してもよい。
【0065】
このように本発明を用いると、ユーザは一連のコマンドシーケンスを音声ブックマーク対象とすることが可能となり、ユーザの利便性が向上する。
【実施例9】
【0066】
また、図12は音声ブックマークデータベースを表示するGUIの例を示している。ユーザはテキストエディタのマクロ表示ボタン(1202)をクリックすることで、音声ブックマークデータベースに格納された音声ブックマーク情報を確認することができる。その際に、登録されたコマンドシーケンスだけでなく、対として登録された識別情報を表示するようにしてもよい。
【0067】
これにより、登録された音声ブックマーク情報を識別情報と共に確認することができるようになり、音声ブックマーク情報の識別性が向上する。
【実施例10】
【0068】
なお、本発明の目的は次のようにしても達成される。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。このようにしても目的が達成されることは言うまでもない。
【0069】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0070】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0071】
また、本発明に係る実施の形態は、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合に限られない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0072】
さらに、本発明に係る実施形態の機能は次のようにしても実現される。即ち、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる。そして、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。この処理により前述した実施形態の機能が実現されることは言うまでもない。
【図面の簡単な説明】
【0073】
【図1】実施例1の情報処理装置の機能構成図である。
【図2】実施例1の情報処理装置の音声ブックマーク登録処理のフローチャートである。
【図3】実施例1の音声ブックマーク呼び出し処理のフローチャートである。
【図4】実施例2の複写機の操作パネル例である。
【図5】実施例2の複写機の音声登録フェーズのGUI例である。
【図6】実施例2の複写機の音声呼び出しフェーズのGUI例である。
【図7】実施例2の複写機の音声ブックマークデータベースの例である。
【図8】実施例2の複写機の音声呼び出しフェーズのGUI例である。
【図9】実施例5の識別情報選択テーブルの例である。
【図10】実施例6の識別情報選択テーブルの例である。
【図11】実施例8のテキストエディタのテキスト編集時の例である。
【図12】実施例9のテキストエディタの音声ブックマーク表示時の例である。
【図13】実施例8のテキストエディタの音声ブックマークデータベースの例である。
【符号の説明】
【0074】
10 マイクロフォン
11 キーボード・マウス
12 マイクロフォン
13 ディスプレイ・スピーカ
14 ブックマーク処理部
15 識別情報データベース
100 情報処理装置
101 登録用音声取り込み部
102 音声ブックマーク対象取り込み部
103 識別情報選択部
104 音声ブックマーク格納部
105 音声ブックマーク検索部
106 音声ブックマークデータベース
107 呼び出し用音声取り込み部
108 類似度算出部
109 音声ブックマーク情報送信部
110 識別情報提示部

【特許請求の範囲】
【請求項1】
登録対象のコマンドシーケンスを取得する登録対象取得手段と、
登録用の音声を取得する第1音声取得手段と、
前記登録用の音声及び前記登録対象のコマンドシーケンスを関連付けてメモリに記憶する記憶手段と、
呼び出し用の音声を取得する第2音声取得手段と、
前記第2音声取得手段で取得された前記呼び出し用の音声をもとに前記メモリを検索し、検索結果である登録用の音声に関連付けて記憶された登録対象のコマンドシーケンスを取得する検索手段とを備えることを特徴とする情報処理装置。
【請求項2】
登録対象のデータを取得する登録対象取得手段と、
登録用の音声を取得する第1音声取得手段と、
前記第1音声取得手段で登録用の音声を取り込んだ場合に、複数の識別情報が格納された識別情報データベースから識別情報を選択する選択手段と、
前記選択された識別情報、前記登録用の音声及び前記登録対象のデータを関連付けてメモリに記憶する記憶手段と、
呼び出し用の音声を取得する第2音声取得手段と、
前記第2音声取得手段で取得した前記呼び出し用の音声をもとに前記メモリを検索し、検索結果である登録用の音声と関連付けて記憶された識別情報及び登録対象のデータを取得する検索手段と、
前記検索手段により取得された識別情報をユーザに提示する第1提示手段とを備えることを特徴とする情報処理装置。
【請求項3】
前記選択手段は、前記識別情報データベースに格納された識別情報のうち、前記記憶手段によってメモリに記憶されていない識別情報からランダムに選択することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記選択手段は、前記識別情報データベースに格納された識別情報のうち、過去に登録した回数から一意に決まる識別情報を選択することを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記選択手段で識別情報が選択された際に、前記識別情報をユーザに提示する第2の提示手段を更に備えることを特徴とする請求項2乃至4のいずれかに記載の情報処理装置。
【請求項6】
前記登録用の音声の音声情報を解析する第1解析手段を更に備え、
前記選択手段は、前記第1解析手段で解析された音声情報を加味して識別情報を選択することを特徴とする請求項2乃至5のいずれかに記載の情報処理装置。
【請求項7】
前記登録対象の登録情報を解析する第2解析手段を更に備え、
前記選択手段は前記第2解析手段で解析された登録情報を加味して識別情報を選択することを特徴とする請求項2乃至6のいずれかに記載の情報処理装置。
【請求項8】
前記登録対象のデータとは、コマンドシーケンス、テレビ視聴アプリケーションにおけるチャンネル番号、番組情報、検索アプリケーションにおける検索クエリ、検索結果、フォーム入力アプリケーションにおける入力値のセットの少なくともいずれかであることを特徴とする請求項2乃至7のいずれかに記載の情報処理装置。
【請求項9】
前記識別情報とは、画像、音、テキスト、振動デバイス用の振動パタン、ライト用の点滅パタンの少なくともいずれかであることを特徴とする請求項2乃至8のいずれかに記載の情報処理装置。
【請求項10】
前記音声情報とは、発声時間、基本周波数、発声内容又は話者クラスの少なくともいずれかであることを特徴とする請求項6に記載の情報処理装置。
【請求項11】
前記登録情報とは、オブジェクト種別、URLのドメイン種別、GUI階層、設定値の内容の少なくともいずれかであることを特徴とする請求項7記載の情報処理装置。
【請求項12】
登録対象のデータを取得する登録対象取得工程と、
登録用の音声を取得する第1音声取得手段と、
前記登録用の音声及び前記登録対象のコマンドシーケンスを関連付けメモリに記憶する記憶工程と、
呼び出し用の音声を取得する第2の音声取得工程と、
前記第2の音声取得手段で取得された前記呼び出し用の発声をもとに前記メモリを検索し、検索結果である登録用の音声に関連付けて記憶された登録対象のコマンドシーケンスを取得する検索工程とを備えることを特徴とする情報処理方法。
【請求項13】
登録対象のデータを取得する登録対象取得工程と、
登録用の音声を取得する第1音声取得工程と、
前記第1音声取得工程で登録用の音声を取り込んだ場合に、複数の識別情報が格納された識別情報データベースから識別情報を選択する選択工程と、
前記選択された識別情報、前記登録用の音声及び前記登録対象のデータを関連付けてメモリに記憶する記憶工程と、
呼び出し用の音声を取得する第2音声取得工程と、
前記第2音声取得工程で取得された前記呼び出し用の発声をもとに前記メモリを検索し、検索結果である登録用の音声と関連付けて記憶された識別情報及び登録対象のデータを取得する検索工程と、
前記検索工程により取得された識別情報をユーザに提示する第1の提示工程とを備えることを特徴とする情報処理方法。
【請求項14】
請求項12又は13に記載の音声認識方法をコンピュータに実行させるための制御プログラム。
【請求項15】
請求項14に記載の制御プログラムを格納したコンピュータ読取可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate