説明

画像形成装置、プログラムおよび記録媒体

【課題】視覚を使用しないで操作可能な画像形成装置を使用し、特に音声認識による操作方法を利用した時に、利用者が混乱なく操作内容を確実に確認できる画像形成装置を提供する。
【解決手段】利用者からの各種操作の入力に対して画像形成装置の選択項目を制御する操作制御部2と、木構造メニュー上の項目位置を管理するメニュー管理部3と、利用者が入力した音声を認識する音声認識部4と、メニュー上の項目名および音声認識結果の復唱を出力する音声出力部5とを備える。メニュー管理部3は、音声認識部4で認識された結果がメニューの項目が表す機能と一致したとき、その項目の位置に移動し、音声出力部5は、利用者が入力した音声と同じ発声内容及び前記メニュー上で移動した項目名とを音声出力して、視覚を使用せずに機器を操作できるようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、視覚を使用しないで操作可能な画像形成装置、その画像形成装置の機能を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【背景技術】
【0002】
複写装置、ファクシミリ装置、プリンタ装置、スキャナ装置やそれらのOA機器が提供する機能を1台に統合した複合機(MFP:Multi−Functional Peripherals)の操作に対して、音声を使用した操作及び操作のガイダンスが行われる「非視覚モード」と、タッチパネルと液晶表示によって操作が行われる「視覚モード」とを有する画像形成装置については、特開2003−140880号公報(特許文献1)、特開2003−131773号公報(特許文献2)に記載されている。この装置における、「非視覚モード」は、機器の操作項目を機能グループ別に分類して、木構造メニューを作成し、このメニュー上の項目を音声情報を手がかりにして選択させる。この方法により、視覚に障害がある人がMFPを操作できるようにしている。
【0003】
上述した特開2003−140880号公報(特許文献1)、特開2003−131773号公報(特許文献2)では、視覚を利用しない操作方法として、次の3つの操作方法があり、それらのいずれかを使用して装置の操作項目の選択を行うようになっている。
【0004】
(1)木構造メニューで構成された装置を操作するための項目を、上下左右に1ステップずつ移動しながら、所望の項目にたどりつく方法。
【0005】
(2)上記の各項目に番号を付しておき、その番号をテンキーで入力して直接該当する項目に移動する方法。
【0006】
(3)装置を操作するための項目を音声で入力し、音声認識により直接該当する項目に移動する方法。
【0007】
また、上記のいずれの操作方法を用いても項目が選択されると、装置側から利用者への確認用に選択された項目を音声で出力するようになっている。上記(3)の音声認識を用いる方法の場合、利用者が発声した音声を認識し、装置の機能項目を選択させ、選択した項目を装置から音声で復唱、出力させる。この復唱によって、使用者は項目が正しく選択されたかどうかを確認できる。
【0008】
さらに、上記(3)の方法では、同じ機能をもつ項目に対して複数の発話内容を割り当てることによって、さらに操作性を向上できる。例えば、原稿画像を用紙の両面に複写する「両面コピー」の機能を選択する場合、「両面コピー」と「コピー両面」のどちらの発声も音声認識が受付けることによって、利用者の発話制限を軽減できる。
【0009】
ところで、このような複数の発話を受付ける場合、従来のように機能に割り当てられた項目名を復唱用として音声出力してしまうと、次のような不都合が生じる場合がある。例えば、利用者が「コピー両面」と発声したのに、機器側からは、項目名である「両面コピー」と復唱されてしまうと、利用者は、正しい項目を選択できたのかどうかがわからずに、混乱するかもしれない。
【0010】
他方で、特開平11−143489号公報(特許文献3)に開示されているように、利用者が発話した通りに復唱させることも考えられるが、上述の(1)〜(3)のように音声認識以外にも複数の操作方法が提供されている場合、同じ項目を選択しているにもかかわらず、音声認識を使用したときだけ出力される内容が他の方法と変わってしまうと、一貫性がなくなり、やはり、混乱のもととなる。
【特許文献1】特開2003−140880号公報
【特許文献2】特開2003−131773号公報
【特許文献3】特開平11−143489号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
本発明では、上記の問題を解決するため、視覚を使用しないで操作可能な画像形成装置を使用し、特に音声認識による操作方法を利用した時に、利用者が混乱なく操作内容を確実に確認できる画像形成装置を提供する。
【課題を解決するための手段】
【0012】
請求項1の発明は、機器の操作項目を機能グループ別に分類して、木構造メニューを作成し、このメニュー上の項目を音声情報を用いて選択させることによって、前記機器を操作する画像形成装置において、利用者からの各種操作の入力に対して画像形成装置の選択項目を制御する操作制御部と、メニュー上の項目位置を管理するメニュー管理部と、利用者が入力した音声を認識する音声認識部と、メニュー上の項目名および音声認識結果の復唱を出力する音声出力部とを備え、前記メニュー管理部は、前記音声認識部で認識された結果がメニューの項目が表す機能と一致したとき、その項目の位置に移動し、前記音声出力部は、利用者が入力した音声と同じ発声内容及び前記メニュー上で移動した項目名とを音声出力して、視覚を使用せずに機器を操作できるようにしたことを特徴としたものである。
【0013】
請求項2の発明は、請求項1の発明において、前記音声出力部において、利用者が入力した音声と同じ発声内容と前記メニュー上で移動した項目名とで異なる種類の音声を利用することを特徴としたものである。
【0014】
請求項3の発明は、請求項2の発明において、前記音声出力部における種類とは性別であることを特徴としたものである。
【0015】
請求項4の発明は、請求項2の発明において、前記音声出力部における種類とは感情であることを特徴としたものである。
【0016】
請求項5の発明は、コンピュータを請求項1乃至4のいずれか1の発明における画像形成装置として機能させるためのプログラムである。
【0017】
請求項6の発明は、請求項5の発明における画像形成プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0018】
音声認識使用時に発声した音声の復唱と、音声認識で設定させる項目名のどちらも出力させるようにしたので、視覚を使用しない利用者が所望する機能の項目を確実に選択できる。さらに、上記で出力する音声の種類を音声認識の復唱と項目名とで区別したので、確認を素早く行うことができ、利用者の利便性が増す。
【発明を実施するための最良の形態】
【0019】
以下に説明する本発明の実施の形態では、従来の画像形成装置に視覚を使用しない操作機能を組み込んだものとして説明する。
【0020】
図1は、本発明の画像形成装置に関わる機能構成を示すブロック図で、同図において、画像形成装置は、画像形成部1、操作制御部2、メニュー管理部3、音声認識部4、音声出力部5を少なくとも含んで構成されている。画像形成部1は、従来の画像形成を行うための機能を有し、操作パネル(画面やキーなど)も含まれる。
【0021】
操作制御部2は、使用者からの各種入力操作やその操作に対する制御を行う。画像形成部において視覚を使用しない操作モードであると判定されているときは、使用者が押下したキー押下情報を受け取り、キーの内容に応じた処理をメニュー管理部3、音声認識部4、音声出力部5に依頼する。また、画像形成部1の機能を設定する場合には、設定項目情報を画像形成部1に送信する。画像形成部1では設定項目情報を受信すると設定結果を操作パネルに表示する。
【0022】
メニュー管理部3は、画像形成装置の機能項目を木構造メニューとして管理し、キー押下情報または音声入力により指定された項目への移動や項目に対する値設定を行う。
【0023】
音声認識部4は、前記(3)で説明した音声認識による方法において、使用者から発声された音声(音声入力)を認識し、認識結果を操作制御部2に引き渡す。操作制御部2では、認識結果として受け取った項目情報をメニュー管理部3に送信し、メニュー管理部3は、受け取った項目上に現在位置を移動させる。この処理により、利用者は、階層メニューの所望する項目へ直接移動できる。
【0024】
音声出力部5は、操作制御部2の指示で、キー押下情報による各種の操作を表す音声ガイダンス、報知音、BGM(Background Music)などを出力(音声出力)する。
【0025】
図2は、以上の機能構成において、音声認識による方法で操作を行う場合の処理の流れを示す図で、音声認識部4では、音声認識が行われると、表1を参照して認識結果に対応する認識番号を操作制御部2に送信する。例えば、「コピー両面」が正しく認識されると番号18を操作制御部に送信する(ステップS1)。
【0026】
【表1】

【0027】
操作制御部2では、認識番号を受け取ると、表2を参照し、認識番号に対応する項目番号を調べ、メニュー管理部3に送信する。認識番号18を受け取った場合は、項目番号612をメニュー管理部3に送信する(ステップS2)。
【0028】
【表2】

【0029】
メニュー管理部3では、項目番号を受け取り、該当する項目に現在位置を移動する。項目番号612を受け取った場合は、項目「両面コピー」に移動する(ステップS3)。メニュー上の項目移動が行われたら、操作制御部2では、表3と表4とを参照し、ステップS1で調べた認識番号に対応する音声ファイル番号およびステップS2で調べた項目番号に対応する音声ファイル番号をそれぞれ調べ、音声出力部に送信する。認識番号18に対する項目番号は612であり、音声ファイル番号は、それぞれ418、1581である。
【0030】
【表3】

【0031】
【表4】

【0032】
音声出力部5では、受け取った音声ファイル番号に対応するファイルを再生する(ステップS5)。
【0033】
以上の処理により、音声認識に対する復唱が行われるので、利用者は正しく認識が行われたかどうかを確認できる。さらに、項目名の出力が行われるので、正しい項目に移動したかどうかも合わせて確認できる。
【0034】
ここで、音声認識の復唱に使用する音声と項目名を出力する音声を異なる種類のデータで保存しておくことによって、どちらの確認にもちいる音声であるかがより明確になり、利便性が増す。
【0035】
例えば、表3と表4に用いる音声を男声、女声で区別することによって実現できる。
【0036】
同一の話者であっても感情のこもった音声を別に用意することにより区別することができる。例えば、表4では通常の発声による音声を使用し、表3では、通常よりも元気な声で録音した音声を使用すればよい。他にも通常の発声と異なる音声であれば、どのような種類でもよく、悲しそうな声や反対に感情の起伏のない声を採用しても、本発明を実施可能である。
【0037】
上述した実施形態を構成する各機能をそれぞれプログラム化し、あらかじめCD−ROM等の記録媒体に書き込んでおき、このCD−ROMをCD−ROMドライブのような媒体駆動装置を搭載したコンピュータに装着して、これらのプログラムをコンピュータのメモリあるいは記憶装置に格納し、それを実行することによっても、本発明の目的が達成されることは言うまでもない。
【0038】
この場合、記録媒体から読出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
【0039】
なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
【0040】
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0041】
また、上述した実施形態の機能を実現するプログラムが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって、上述した実施形態の機能が実現される場合も含まれる。
【0042】
さらに、上述したプログラムをサーバコンピュータの磁気ディスク等の記憶装置に格納しておき、通信網で接続された利用者のコンピュータからダウンロード等の形式で頒布する場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
【図面の簡単な説明】
【0043】
【図1】本発明の画像形成装置に関わる機能構成を示すブロック図である。
【図2】音声認識による方法で操作を行う場合の処理の流れを示す図である。
【符号の説明】
【0044】
1…画像形成部、2…操作制御部、3…メニュー管理部、4…音声認識部、5…音声出力部。

【特許請求の範囲】
【請求項1】
機器の操作項目を機能グループ別に分類して、木構造メニューを作成し、このメニュー上の項目を音声情報を用いて選択させることによって、前記機器を操作する画像形成装置において、利用者からの各種操作の入力に対して画像形成装置の選択項目を制御する操作制御部と、メニュー上の項目位置を管理するメニュー管理部と、利用者が入力した音声を認識する音声認識部と、メニュー上の項目名および音声認識結果の復唱を出力する音声出力部とを備え、前記メニュー管理部は、前記音声認識部で認識された結果がメニューの項目が表す機能と一致したとき、その項目の位置に移動し、前記音声出力部は、利用者が入力した音声と同じ発声内容及び前記メニュー上で移動した項目名とを音声出力して、視覚を使用せずに機器を操作できるようにしたことを特徴とする画像形成装置。
【請求項2】
前記音声出力部において、利用者が入力した音声と同じ発声内容と前記メニュー上で移動した項目名とで異なる種類の音声を利用することを特徴とする請求項1に記載の画像形成装置。
【請求項3】
前記音声出力部における種類とは性別であることを特徴とする請求項2に記載の画像形成装置。
【請求項4】
前記音声出力部における種類とは感情であることを特徴とする請求項2に記載の画像形成装置。
【請求項5】
コンピュータを請求項1乃至4のいずれか1に記載の画像形成装置として機能させるためのプログラム。
【請求項6】
請求項5に記載の画像形成プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2006−235040(P2006−235040A)
【公開日】平成18年9月7日(2006.9.7)
【国際特許分類】
【出願番号】特願2005−46948(P2005−46948)
【出願日】平成17年2月23日(2005.2.23)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】