説明

音声認識手段を持つ複合機

【課題】 音声認識での操作手順の入力が全体的に正確かつ簡単になる音声認識手段を持つ複合機の提供。
【解決手段】 入力部と表示部を持つ操作部と、画像をスキャンするスキャナと、画像を出力するプリンタと、操作部の操作手順を音声認識する音声認識手段と、コントローラと、からなる複合機において、音声認識手段は音声認識の適合程度が大きいほど大きい値を示す識別スコアをコントローラに出力し、コントローラは、識別スコアが第1の値以下である場合は音声認識が正しく認識していないと判断し再度音声入力を要求し、識別スコアが第2の値以上の場合は音声認識が正しく認識したと判断し、その認識した指示でその後の操作部処理を行い、識別スコアがその中間の値の場合は識別した内容が正しいかどうかユーザに確認させる、ことを特徴とする音声認識手段を持つ複合機。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音声認識手段を持つ複合機において、音声入力により操作部の入力操作の指示を行うことができる複合機に関するものである。
【背景技術】
【0002】
従来の音声認識装置は、最初の音声入力によって十分な確信度が得られなかった場合に、その結果に関連して次の入力を求め、その認識結果によって最初の音声認識候補を絞り込むものであった(例えば、特許文献1参照)。
【特許文献1】特開2000−148181号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
音声認識により入力された指示にそのまま従い、操作部の入力フローを進めていくと、もし音声認識が間違っていた場合、誤認識されることとなり希望しない設定となってしまう。また、音声認識が不明確である場合に、いちいちユーザに再確認していると、たとえ認識が正確であっても、ユーザの処理が煩雑になってしまう問題点があった。
【課題を解決するための手段】
【0004】
入力部と表示部を持つ操作部と、画像をスキャンするスキャナと、画像を出力するプリンタと、操作部の操作手順を音声認識する音声認識手段と、コントローラと、からなる複合機において、音声認識手段は音声認識の適合程度が大きいほど大きい値を示す識別スコアをコントローラに出力し、コントローラは、識別スコアが第1の値以下である場合は音声認識が正しく認識していないと判断し再度音声入力を要求し、識別スコアが第2の値以上の場合は音声認識が正しく認識したと判断し、その認識した指示でその後の操作部処理を行い、識別スコアがその中間の値の場合は識別した内容が正しいかどうかユーザに確認させる。
【発明の効果】
【0005】
ユーザの任意で、認識スコアにより音声認識の判断を設定できる。そのため、第1の閾値より認識スコアが低い場合は再度音声入力を要求できる。
【0006】
また第2の閾値より認識スコアが高い場合は操作手順がすぐ決定し、ユーザの操作が簡便になる。
【0007】
その中間の場合は、認識した候補をユーザに提示することで認識が正しいかどうかの確認ができる。
【0008】
このように音声認識での操作手順の入力が全体的に正確かつ簡単になる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の発明を実施するための最良の形態について図面を用いて説明する。
【実施例1】
【0010】
図1は本発明の構成を表すブロック図である。
【0011】
複合機10は、コントローラ100、操作部200、音声認識手段300、音声入力手段310、プリンタ400、スキャナ500からなる。
【0012】
コントローラ100は全体の制御を行う制御手段である。
【0013】
操作部200は入力部210と表示部220を持つ。
【0014】
入力部210はキー入力で操作入力をするところである。
【0015】
表示部220は入力された操作設定を表示するところである。
【0016】
音声認識手段300は音声入力部310から入力された音声を認識してどのような操作入力が入力されたかを認識するところである。
【0017】
図2は本発明の動作フローを示すフローチャートである。
【0018】
S100からスタートする。
【0019】
S110でまず音声の入力があるかチェックする。
【0020】
ない場合はS110に戻り、入力があるまで待つ。
【0021】
音声の入力があった場合は、S120に進み音声認識を行い、音声認識スコアの出力を行う。
【0022】
次にS130で音声認識スコアと予め決められているOKとなる閾値とを比較する。音声認識スコアの方が大きい場合は、音声認識が正確にされたと判断されるのでS180に進む。
【0023】
音声認識スコアの方が小さい場合は、音声認識が正確だったと判断できないので、S140に進む。
【0024】
S140では音声認識スコアと予め決められているNGとなる閾値とを比較する。音声認識スコアの方が小さい場合は、音声認識が不正確だったと判断されるのでS190に進む。
【0025】
S190では音声識別できなかった旨を表示しS110に戻り、再度音声入力を待つ。
【0026】
S140で音声認識スコアが大きい場合は、音声認識があいまいだったと判断されるのでS150に進み、とりあえず認識した操作内容を表示する。
【0027】
次にS160に進み、表示を見たユーザが音声認識された内容でよいか操作部から入力する。操作部からの入力があるまでS160に戻る。
【0028】
入力があればS170に進む。
【0029】
S170でユーザからの入力で音声認識が認識した内容で悪い場合は、S110に戻り最初から音声入力をやり直す。
【0030】
S170で音声認識された内容でよい場合はS180に進む。
【0031】
S180では音声認識した内容を操作内容として決定し操作部にその操作内容を指示する。
【0032】
次にS199に進み処理を終了する。
【実施例2】
【0033】
操作部入力部210から音声認識の精度を判定する第1の閾値と第2の閾値を入力できるようにする。
【0034】
入力したらコントローラ100に記憶し、判定のフローチャートの時に予め定められた値を使わずに、入力されて記憶した値を使用して判定する。
【図面の簡単な説明】
【0035】
【図1】本発明の構成を示すブロック図である。
【図2】本発明の動作フローを示すフローチャートである。
【符号の説明】
【0036】
10 複合機
100 コントローラ
200 操作部
210 入力部
220 表示部
300 音声認識手段
310 音声入力部
400 プリンタ
500 スキャナ

【特許請求の範囲】
【請求項1】
入力部と表示部を持つ操作部と、
画像をスキャンするスキャナと、
画像を出力するプリンタと、
操作部の操作手順を音声認識する音声認識手段と、
コントローラと、からなる複合機において、
音声認識手段は音声認識の適合程度が大きいほど大きい値を示す識別スコアをコントローラに出力し、
コントローラは、識別スコアが第1の値以下である場合は音声認識が正しく認識していないと判断し再度音声入力を要求し、
識別スコアが第2の値以上の場合は音声認識が正しく認識したと判断し、その認識した指示でその後の操作部処理を行い、
識別スコアがその中間の値の場合は識別した内容が正しいかどうかユーザに確認させる、
ことを特徴とする、音声認識手段を持つ複合機。
【請求項2】
請求項1記載の音声認識手段を持つ複合機において、第1の値、第2の値は操作部の入力部からユーザが値を設定できることを特徴とする、音声認識手段を持つ複合機。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2006−205497(P2006−205497A)
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願番号】特願2005−19320(P2005−19320)
【出願日】平成17年1月27日(2005.1.27)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】