説明

単音の組み合せによる音声機器操作

【課題】 何らかの障害で機器の操作が困難なユーザー、且つ、発話困難なユーザーには、既存の音声認識手段では機器の設定をすることができず、使用することが困難であるという問題があった。
【解決手段】 音声認識、合成機能を備えた画像形成装置において、複数の障害を同時に有している障害者、たとえば、肢体不自由と発話困難の障害を持つユーザーは、通常の音声認識では機器を操作できない。本アイデアは、このような発話困難なユーザーにも、音声認識を利用して機器を使用可能にするものである。
本発明の該画像形成装置は、単音の組み合せパターンを複数記憶できる機能、該パターンに機器設定を割り当てる機能、の2つの機能を有する。これにより、なんらかの障害で操作パネルを接触して使用できない、かつ発話困難なユーザーが、該ユーザーが発生できる単音の組み合せによって、機器の機能を使用することが可能となる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識手段を備える画像形成装置及びその制御方法に係り、より詳しくは、単音の組み合せパターンを複数記憶できる機能と、パターンに機器設定を割り当てる機能を備える、複写機、プリンタ、ファックス等の画像形成装置、カメラ等の画像入出力装置、PCや小型携帯端末(Personal Digital Assistant: PDA)等の画像表示装置、及びその制御方法に適用されるものである。
【背景技術】
【0002】
近年、画像形成装置のデジタル化、多機能化に伴い、音声認識/合成機能が付加された装置が一般的なってきている。これによって、音声によって機器の設定ができるようになったが、調音障害者は発話が難しいため、音声認識機能を用いた設定ができなかった。
【0003】
音声認識による機器の操作手段に関する特許は、以下のものがある。
特開2002−82604(小池和代)は、調音障害者の発話練習プログラムで、口と手の形状を表示し合成音声を出力する方法に関する発明である。この方法は、調音障害者の発話を認識することができるが、認識した音声に基づいた機器の設定は行わない。
【0004】
特開2000−20087(ブラザー工業株式会社)は、携帯電話の音声機能を用いて、単音節を認識して音節を導きだし単語の候補を絞り込む方法に関する発明である。この方法は、単音を認識することができるが、機器の設定は行わない。
【0005】
特公平2−46957(インターナショナル ビジネス マシーンズ CORP)は、単音節の信号を解析し、あらかじめ登録されている時系列の特徴パラメータと照合することによって、単音節の音声を認識する方法に関する発明である。この方法は、単音認識の精度を上げることができるが、単音による機器設定は行わない。
また前述の発明は、認識の精度を上げるには大容量の音声辞書が必要になるうえ、口腔に障害がある人は使うことができなかった。
【特許文献1】特開2002−82604号公報
【特許文献2】特開2000−20087号公報
【特許文献3】特公平2−46957号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
以上より、何らかの障害で機器の操作が困難なユーザー、且つ、発話困難なユーザーには、既存の音声認識手段では機器の設定をすることができず、使用することが困難であるという問題があった。これに対して本提案は、単音を認識し、該単音に基づいた機器の設定を行う方法を提案する。本提案により、ユーザは単音のみで機器を設定することができるようになり、四肢障害者及び調音障害者でも健常者と同様に画像形成装置を扱うことが可能となる。
【課題を解決するための手段】
【0007】
本発明は、音声認識機能を備えた画像形成装置において、入力された単音に基づいて機器を設定する方法に関する発明である。
【0008】
本発明の請求項1記載の発明は、画像形成装置が備える音声認識装置を用いて単音を認識し、該単音に基づいて機器を設定する際に実施する方法であり、音声を入出力する音声入出力装置と、原稿を読み取り画像情報に変換する画像読取装置と、該画像情報を保存する保存装置と、ネットワークを用いて該画像情報を入出力する通信装置と、該画像情報を印刷用紙に出力する画像形成装置、を備える画像形成装置であり、該単音の特徴である、基本周波数、n次のホルマント周波数(0<n)、反復回数、連続発音時間、ピッチの変化、パワースペクトルの一つ以上に基づいて単音を認識する機能と、該単音の組み合せパターンを複数記憶する機能と、パターンに機器設定を割り当てる機能、を備える、単音による画像形成装置の制御機能である。
【0009】
つまり、(1)入力された単音を解析して単音節を抽出するステップ、(2)短音「あ」、長音「あー」、反復「あ、あ、…」、音色「あ、い、う、え、お」、高低「あぁ、ぁあ」等を認識するステップ、(3)あらかじめ登録されたパターンと機器設定の対応に基づいて、認識されたパターンを用いて機器を設定するステップ、から成る。
【発明の効果】
【0010】
旧来、四肢障害者は機器の入力装置(パネル等)を用いた設定ができず、また同時に、調音障害者は音声認識機能を用いた設定ができなかった。そのため、四肢障害と調音障害を併発しているユーザは、機器を設定することができず、使用することが困難であった。本提案によりユーザは、単音のみで機器を設定することができるようになり、四肢障害者及び調音障害者でも健常者と同様に画像形成装置を扱うことが可能となる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の特徴について適宜図面を参照しながら解説する。
【0012】
1.システムのハードウェア全景
本発明の実施例にかかわる画像入出力システムのハードウェア構成を、図1を参照しながら説明する。
【0013】
リーダー部(画像入力装置)200は、原稿画像を光学的に読み取り、画像データに変換する。リーダー部200は、原稿を読取るための機能を持つスキャナユニット210と、原稿用紙を搬送するための機能を持つ原稿給紙ユニット250(以下フィーダと呼ぶ)とで構成される。
【0014】
プリンタ部(画像出力装置)300は、記録紙を搬送し、その上に画像データを可視画像として印字して装置外に排紙する。プリンタ部300は、複数種類の記録紙カセットを持つ給紙ユニット310と、画像データを記録紙に転写、定着させる機能を持つマーキングユニット320と、印字された記録紙をソート、ステイプルして機外へ出力する機能を持つ排紙ユニット330とで構成される。
【0015】
制御装置110は、リーダー部200、プリンタ部300、FAXモデム510、HDD(ハードディスクドライブ)520と電気的に接続され、さらにネットワーク400を介して、ホストコンピュータ401,402と画像入出力システム101、及び、FAXモデム510、電話回線500を介してFAX501,502と接続されている。
【0016】
制御装置110は、リーダー部200を制御して、原稿の画像データを読込み、プリンタ部300を制御して画像データを記録用紙に出力してコピー機能を提供する。また、リーダー部200から読取った画像データを、コードデータに変換し、ネットワーク400を介してホストコンピュータへ送信するスキャナ機能、ホストコンピュータからネットワーク400を介して受信したコードデータを画像データに変換し、プリンタ部300に出力するプリンタ機能、入力された画像データをFAXモデム510と電話回線500を介して送受信するFAX機能、送受信した画像データをHDD520に蓄積するボックス機能を提供する。
【0017】
続いて図2を用いて操作部150について説明する。
【0018】
操作部150は、制御装置110に接続され、液晶タッチパネルで構成され、画像入出力システムを操作するためのユーザI/Fを提供する。
【0019】
600はLCDタッチパネルであり、主なモード設定、状況表示はここで行われる。601は0〜9までの数値を入力するためのテンキーである。602はIDキーであり、装置が部門管理されている場合に部門番号と暗礁モードを入力する際に使用されるものである。
【0020】
603は設定されたモードをリセットするためのリセットキー、604は各モードについての説明画面を表示するためのガイドキー、605はユーザーモード画面に入るためのユーザーモードキー、606は割り込みコピーを行うための割り込みキーになっている。
【0021】
607はコピー動作をスタートさせるためのスタートキー、608は実行中のコピージョブを中止させるためのストップキーである。
【0022】
609はソフト電源SWであり、押下することによりLCD600のバックライトが消え装置は低電力状態に落ちる。610は節電キーであり、これを押下することで節電状態に入り、再度押下することで節電状態から復帰する。
【0023】
611、612、613、614はコピー、送信、ボックス、拡張に移行させるためのファンクションキーである。図2はコピーの標準画面が表示された状態であり、他のファンクションキー612、613、614を押下することでそれぞれの機能の標準画面が表示される。
【0024】
615はLCDタッチパネルのコントラストを調整するための調整キーである。
【0025】
616はカウンタ確認キーであり、このキーを押下することでそれまでに仕様したコピー枚数の集計を表示するカウント画面がLCD上に表示される。
【0026】
617はジョブの実行中、画像メモリへの画像蓄積中を示すLED、618がジャム、ドアオープン等装置がエラー状態にあることを示すエラーLED、619は装置のメインスイッチがONになっていることを示す電源LEDになっている。
【0027】
620はマイク、621はスピーカである。
【0028】
622は、非接触型ICチップ読取装置である。
【0029】
図3はリーダー部200及びプリンタ部300の断面図である。リーダー部の原稿給送ユニット250は原稿を先頭順に1枚ずつプラテンガラス211上へ給送し、原稿の読み取り動作終了後、プラテンガラス211上の原稿を排出トレイ219に排出するものである。原稿がプラテンガラス211上に搬送されると、ランプ212を点灯し、そして光学ユニット213の移動を開始させて、原稿を露光走査する。この時の原稿からの反射光は、ミラー214、215、216、及びレンズ217によってCCDイメージセンサ(以下CCDと呼ぶ)218へ導かれる。このように、走査された原稿の画像はCCD218によって読み取られる。CCD218から出力される画像データは、所定の処理が施された後、制御装置110へ転送される。
【0030】
プリンタ部300のレーザドライバ321はレーザ発光部322を駆動するものであり、制御装置110から出力された画像データに応じたレーザ光をレーザ発光部322に発光させる。このレーザ光は感光ドラム323に照射され、感光ドラム323にはレーザ光に応じた潜像が形成される。この感光ドラム323の潜像の部分には現像器324によって現像剤が付着される。
【0031】
そして、レーザ光の照射開始と同期したタイミングで、カセット311、カセット312、カセット313、カセット314、手差し給紙段315のいずれかから記録紙を給紙し、転写部325へ搬送路331によって導かれ、感光ドラム323に付着された現像剤を記録紙に転写する。現像剤の乗った記録紙は搬送ベルト326によって、定着部327に搬送され、定着部327の熱と圧力により現像剤は記像紙に定着される。その後、定着部327を通過した記録紙は搬送路325、搬送路324を通り、排紙ビン328に排出される。あるいは、印字面を反転して排紙ビン328に排出する場合には、搬送路336、搬送路338まで導かれ、そこから記録紙を逆方向に搬送し、搬送路337、搬送路324を通る。
【0032】
また、両面記録が設定されている場合は、定着部327を通過したあと、搬送路336からフラッパ329によって、搬送路333に記録紙は導かれ、その後記録紙を逆方向に搬送し、フラッパ329によって、搬送路338、再給紙搬送路332へ導かれる。再給紙搬送路332へ導かれた記録紙は上述したタイミングで搬送路331を通り、転写部325へ給紙される。
【0033】
図4はフィニッシャ部の断面図である。フィニッシャ部350は、印刷装置300に備え付けられた排紙ビン328を取り除いた箇所に取り付ける。記録紙は搬送路334から排出されることによってフィニッシャ部350に送られる。この時、印刷した用紙の印刷面は上を向いており、排紙時に印刷面を下にするために、フィニッシャ部350により記録紙の向きを反転させる。この反転処理はフラッパ351を下げて搬送ローラ352により記録紙を一時的に上方に送り、記録紙が上まで行き着いたところで搬送ローラ352を逆転させて記録紙を排紙口へ送り出す。
【0034】
フィニッシャ部350は、4つの排紙ビン361を有している。この排紙ビンは排紙口駆動装置353により排紙部360を上下に移動させることができ、この上下動により任意の排紙ビン361に記録紙を出力することが可能となっている。
【0035】
排出された記録紙にステイプル処理を施す場合、記録紙を搬送路363に一時的に保持し、原稿がそろった時点で反転ローラ362を搬送方向から逆転することによって、記録紙の端をステイプル装置353にセットしてステイプルし、再度逆転することでステイプルした記録紙を排紙ビン361に排出する。またステイプル装置353は、ステイプル上のICにデータを書き込む機能を有する。
【0036】
以下、制御装置の詳細について述べる。
【0037】
2.1 制御装置の説明
制御装置110の機能を、図5に示すブロック図をもとに説明する。
【0038】
メインコントローラ111は、主にCPU112と、バスコントローラ113と、各種I/Fコントローラ回路から構成される。
【0039】
CPU112とバスコントローラ113は制御装置110全体の動作を制御するものであり、CPU112はROM114からROM I/F115を経由して読込んだプログラムに基いて動作する。また、ホストコンピュータから受信したPDL(ページ記述言語)コードデータを解釈し、ラスターイメージデータに伸張する動作も、このプログラムに記述されており、ソフトウェアによって処理される。バスコントローラ113は各I/Fから入出力されるデータ転送を制御するものであり、バス競合時の調停やDMAデータ転送の制御を行う。
【0040】
DRAM116はDRAM I/F117によってメインコントローラ111と接続されており、CPU112が動作するためのワークエリアや、画像データを蓄積するためのエリアとして使用される。
【0041】
Network Contorller121はI/F123によってメインコントローラ111と接続され、コネクタ122によって外部ネットワークと接続される。ネットワークとしては一般的にFAXモデム510を介した電話回線500があげられる。
【0042】
汎用高速バス125には、拡張ボードを接続するための拡張コネクタ124とI/O制御部126とが接続される。汎用高速バスとしては、一般的にPCIバスがあげられる。
【0043】
I/O制御部126には、リーダー部200、プリンタ部300の各CPUと制御コマンドを送受信するための調歩同期シリアル通信コントローラ127が2チャンネル装備されており、I/Oバス128によって外部I/F回路140,145に接続されている。
【0044】
パネルI/F132は、LCDコントローラ131に接続され、操作部150上の液晶画面600に表示を行うためのI/Fと、ハードキーやタッチパネルキーの入力を行うためのキー入力I/F130とから構成される。
【0045】
操作部150は液晶表示部と液晶表示部上に張り付けられたタッチパネル入力装置と、複数個のハードキーを有する。タッチパネルまたはハードキーにより入力された信号は前述したパネルI/F132を介してCPU112に伝えられ、液晶表示部はパネルI/F132から送られてきた画像データを表示するものである。液晶表示部には、本画像表示装置の操作における機能表示や画像データ等を表示する。
【0046】
リアルタイムクロックモジュール133は、機器内で管理する日付と時刻を更新/保存するためのもので、バックアップ電池134によってバックアップされている。
【0047】
E-IDEインタフェース161は、外部記憶装置を接続するためのものである。このI/Fを介してハードディスクやCD-ROM ドライブを接続し、プログラムや画像データを書き込んだり読み込んだりすることができる。
【0048】
コネクタ142と147は、それぞれリーダー部200とプリンタ部300とに接続され、同調歩同期シリアルI/F(143,148)とビデオI/F(144,149)とから構成される。
【0049】
スキャナI/F140は、コネクタ142を介してリーダー部200と接続され、また、スキャナバス141によってメインコントローラ111と接続されており、リーダー部200から受け取った画像を、その後の過程における処理の内容によって、最適な2値化を行ったり、主走査・副走査の変倍処理を行ったりする機能を有し、さらに、リーダー部200から送られたビデオ制御信号をもとに生成した制御信号を、スキャナバス141に出力する機能も有する。
【0050】
スキャナバス141からDRAM116へのデータ転送は、バスコントローラ113によって制御される。
【0051】
プリンタI/F145は、コネクタ147を介してプリンタ部300と接続され、また、プリンタバス146によってメインコントローラ111と接続されており、メインコントローラ111から出力された画像データにスムージング処理をして、プリンタ部300へ出力する機能を有し、さらに、プリンタ部300から送られたビデオ制御信号をもとに生成した制御信号を、プリンタバス146に出力する機能も有する。
【0052】
DRAM116上に伸張されたラスターイメージデータのプリンタ部への転送は、バスコントローラ113によって制御され、プリンタバス146、ビデオI/F149を経由して、プリンタ部300へDMA転送される。
【0053】
2.2 メインコントローラの説明
図6にメインコントローラのブロック図を示す。
【0054】
プロセッサコア401は、64ビットのプロセッサバス(SCバス)を介して、システム・バス・ブリッジ(SBB)402に接続される。SBB402は4×4の64ビットクロスバスイッチであり、プロセッサコア401の他に、キャッシュメモリを備えたSDRAMやROMを制御するメモリコントローラ403と専用のローカルバス(MCバス)で接続されており、さらに、グラフィックバスであるGバス404、IOバスであるBバス405と接続され、全部で4つのバスに接続される。SBB402は、これら4モジュール間を、可能な限り、同時平行接続を確保することができるように設計されている。
【0055】
また、データの圧縮伸張ユニット(codec)418とも, codec I/F を介して接続されている。
【0056】
Gバス404はGバスアービタ(GBA)406により協調制御されており、スキャナやプリンタと接続するためのスキャナ/プリンタコントローラ(SPC)408に接続される。また、Bバス405は、Bバスアービタ(BBA)407により協調制御されており、SPC408のほか、電力管理ユニット(PMU)409,インタラプトコントローラ(IC)410,UARTを用いたシリアルインタフェースコントローラ(SIC)411,USBコントローラ412,IEEE1284を用いたパラレルインタフェースコントローラ(PIC)413, LANコントローラ(LANC)414,LCDパネル,キー,汎用入出力コントローラ(PC)415,PCIバスインタフェース(PCIC)416にも接続されている。
【0057】
PC415には、表示パネルやキーボードを備えた操作パネル417が接続される。
【0058】
2.2.1 インタラプトコントローラの説明
インタラプトコントローラ410は、Bバス405に接続され、メインコントローラチップ内の各機能ブロック及び、チップ外部からのインタラプトを集積し、CPUコア401がサポートする、6レベルの外部インタラプト及び、ノンマスカブルインタラプト(NMI)に再分配する。各機能ブロックとは、電力管理ユニット409,シリアルインタフェースコントローラ411,USBコントローラ412,パラレルインタフェースコントローラ413,LANコントローラ414,汎用IOコントローラ415,PCIインタフェースコントローラ416,スキャナ/プリンタコントローラ408などである。
【0059】
2.2.2 メモリコントローラの説明
メモリコントローラ403は、メモリコントローラ専用のローカルバスであるMCバスに接続され、シンクロナスDRAM(SDRAM)やフラッシュROMやROMを制御する。
【0060】
2.3 システムバスブリッジの説明
図7はシステムバスのブロック図を示す。
【0061】
SBB402は、Bバス(入出力バス),Gバス(グラフィックバス),SCバス(プロセッサローカルバス)及びMCバス間の相互接続をクロスバスイッチを用いて提供する、マルチチャネル双方向バスブリッジである。クロスバススイッチにより、2系統の接続を同時に確立することが出来、並列性の高い高速データ転送を実現出来る。
【0062】
SBB402は、Bバス405と接続するためのBバスインタフェース2009と、Gバス404と接続するためのGバスインタフェース2006と、プロセッサコア401と接続するためのCPUインタフェーススレーブポート2002と、メモリコントローラ403と接続するためのメモリインタフェースマスターポート2001と, 圧縮伸張ユニット418と接続するためのCODECバスインタフェース2014を備えるほか、アドレスバスを接続するアドレススイッチ2003,データバスを接続するデータスイッチ2004を含む。また、プロセッサコアのキャッシュメモリを無効化するキャッシュ無効化ユニット2005を備えている。
【0063】
2.3.1 PCIバスインタフェースの説明
PCIバスインタフェース416は、メインコントローラ内部汎用IOバスであるBバスと、チップ外部IOバスであるPCIバスの間をインタフェースするブロックである。
【0064】
2.3.2 Gバスアービタ、Bバスアービタの説明
Gバスのアービトレーションは、中央アービトレーション方式であり、各バスマスタに対して専用のリクエスト信号とグラント信号を持つ。このアービタは制御方法をプログラミングすることが出来る。また、バスマスタへの優先権の与え方として、すべてのバスマスタを同じ優先権として、公平にバス権を与える公平アービトレーションモードと、いずれかひとつのバスマスタの優先権を上げ、優先的にバスを使用させる優先アービトレーションモード、のどちらかを指定できる。
【0065】
Bバスアービタ407は、IO汎用バスであるBバス405のバス使用要求を受け付け、調停の後、使用許可を選択された一つのマスタに対して与え、同時に2つ以上のマスタがバスアクセスを行う事を禁止する。アービトレーション方式は、3段階のプライオリティを持ち、それぞれのプライオリティに複数のマスタをプログラマブルに割り当てられる構成になっている。
【0066】
2.4 スキャナコントローラ/プリンタコントローラ
図8はスキャナコントローラ、プリンタコントローラのブロック図である。
【0067】
スキャナ/プリンタコントローラ408は、VideoI/Fによってスキャナおよびプリンタと接続され、内部バスGバスおよびBバスにインタフェースするブロックである。大別して以下の3つのブロックから構成される。
【0068】
2.4.1 スキャナコントローラ
スキャナとビデオI/Fで接続され、動作制御およびデータ転送制御を行なう。Gバス/BバスI/Fユニット(GBI)4301Aとは、IFバスで接続され、データ転送およびレジスタのリード/ライトが行なわれる。
【0069】
2.4.2 プリンタコントローラ
プリンタとビデオI/Fで接続され、動作制御およびデータ転送制御を行なう。GBI 4301Bとは、IFバスで接続され、データ転送およびレジスタのリード/ライトが行なわれる。
【0070】
CPバスは、スキャナとプリンタの画像データおよび水平垂直同期のための同期信号を直結するためのバスである。
【0071】
2.4.3 Gバス/Bバス I/Fユニット(GBI)
スキャナコントローラ4302およびプリンタコントローラ4303をGバスまたはBバスに接続するためのユニットである。スキャナコントローラ4302とプリンタコントローラ4303にそれぞれ独立して接続され、GバスとBバスの両方に接続されている。
【0072】
2.5 電力管理ユニットの説明
メインコントローラ111は、CPUを内蔵した大規模なASICである。このため、内部のロジックが全部同時に動作してしまうと、大量の熱を発生し、チップ自体が破壊されてしまう恐れがある。これを防ぐために、メインコントローラは、ブロック毎の電力の管理、すなわちパワーマネジメントを行ない、更にチップ全体の消費電力量の監視を行なう。
【0073】
パワーマネージメントは、それぞれのブロックが各自個別に行なう。各ブロックの消費電力量の情報は、パワーマネージメントレベルとして、電力管理ユニット(PMU)409に集められる。PMU409では、各ブロックの消費電力量を合計し、その値が限界消費電力を超えないように、メインコントローラの各ブロックの消費電力量を一括して監視する。
【0074】
3.画像表示装置のソフトウェア構成
次に、本発明の実施例に関わる画像入出力システムのソフトウェア全体構成をについて説明する。本発明の実施例に関わる画像入出力装置100は、コピー、送信、ボックス、拡張の機能を提供する。
【0075】
コピー機能611は、ユーザがコピーのスタートを指示することによって、原稿画像を光学的に読み取り画像データに変換するリーダ部200から、印刷記録用紙に画像データを転写するプリンタ部300までの一連の流れをユーザに提供する。コピーは、倍率変換、用紙選択、濃度設定、ソート、両面印刷、応用機能設定、システム管理等の機能で構成される。
【0076】
送受信機能612は、ユーザが送受信のスタートを指示することによってリーダ部200等を用いて取り込まれた画像データを、画像入出力システム100とPC401の間をLAN400経由で、または、画像入出力システム100とFAX501の間を電話回線500経由で送受信する機能をユーザに提供する。
【0077】
ボックス機能613は、ユーザがボックスのスタートを指示することによってリーダ部200等を用いて取り込まれた画像データのHDD520への保存、及び、HDD520に保存された内容の印刷、消去、パネルI/F132への表示等の機能をユーザに提供する。ボックス機能の詳細については、(特開平11-275296)等で詳説している。
【0078】
拡張機能614は、画像表示装置100の、デバイス管理、プリント、コピー、送受信等のジョブ管理、ボックス管理、システム情報管理等の機能を、LAN400を介しPC401から操作する手段をユーザに提供する。
【0079】
4.実施例
以上で説明した画像形成装置のハードウェア・ソフトウェア構成を用いて、実施例を解説する。
【0080】
図9は単音機器操作概要のフローチャート図である。
【0081】
本発明の概要について説明する。本発明は、マイク620から入力された単音を認識しF001、単音音声パターンに適合しているか調べF002、もし単音音声パターンに適合していなければ終了し、もし単音音声パターンに適合していればF004対応した機器設定を行いF003、該機器設定に基づいた画像形成装置の処理(印刷・送信・保存等)を行うF005。また、機器設定の手順と確認に、スピーカ621やLCDタッチパネル600を用いる。
【0082】
音声認識技術(単音を含む音声の認識方法や個人性の抽出方法等)は、すでに多くの文献や論文等が存在するため、本発明では詳細を割愛し簡単に説明する。まず、入力音声をサンプリングし、ある一定単位時間の離散信号を抽出する。次に、抽出した離散信号に窓関数をかけて始端と終端の波形をそろえ、高速フーリエ変換(FFT)し、周波数とパワースペクトルを計算する。もし抽出した離散信号のパワースペクトルが一定値以下ならば、音声の入力は無くノイズである可能性が高いため、データを捨て再度音声認識を行う。もし抽出した離散信号のパワースペクトルが一定値以上ならば、周波数解析を継続する。この時、発音障害者は単音(あ、い、う、え、お等)自体が明瞭に発話できない可能性があるため、認識する単音の周波数誤差を大きくとるほうが良いが、周波数誤差を大きくとることによって認識精度が落ちる。よって、障害者の使いやすさと発話認識精度のトレードオフをとる必要がある。次に解析した周波数が、単音(あ、い、う、え、お等)であるならば、その継続時間を計算する。これにより、単音のパワースペクトル、周波数、発音継続時間等を抽出することができ、さらに、パワースペクトルと発音継続時間から時間によるパワースペクトルの変化が、周波数と発音継続時間から時間による周波数の変化が、導き出される。つまり、パワースペクトル、周波数、発音継続時間、パワースペクトルの時間変化、周波数の時間変化等の情報を抽出することができる。
【0083】
図10は単音認識による機器操作を用いた実行例前段階のフローチャート図である。
【0084】
前述の音声認識手法等を用い、機器設定で単音入力がONになっていた場合F051、画像形成装置が備える音声認識機能によってユーザの単音を認識する。画像形成装置は「あー、又は、あいうえお、と発音してください」とタッチパネル上の文字と音声で出力しF052、ユーザからの応答を待つF053。もしユーザが一音のみ発話すればF054「一音モード」F055、もしユーザが「あいうえお」と発話すればF056「あいうえおモード」F057として認識する。このとき、認識率の向上のために、ユーザ音声の周波数分析を行い、認識音声の周波数等を補正することが望ましいF058。補正の詳細(個人性認識等)は本発明の論点から外れるので割愛する。認識した単音に基づいた画像形成装置の設定方法について、一音モード、あいうえおモードによる操作の実施例を以下に示す。
【0085】
図11は単音認識による機器操作を用いた実行例のフローチャート図である。
【0086】
(実施例1)一音モード
視覚や口蓋に障害を持つユーザは、UIパネルが見えず複雑な音を出すことができない。よって、一音「あ」「あ、あ」「あ、あ、…」「あー」で機器を操作する方法を提供する。以下に具体例を示す。
【0087】
原稿を「両面、ステイプル、3部」複写する際の実施例を示す。まず、画像形成装置は、標準の設定「片面、1部」を読み上げF101、「コピーするなら「あー」、設定を変更するなら「あ、あ」、終了するなら「あ」と発音してください」と出力するF103。ユーザの入力を待ちF104、「あ、あ」が入力されたら次に進むF109。次に、画像形成装置は、「コピー枚数を変更する場合は「あー」、両面をコピーする場合は「あ、あー」、ステイプルする場合は「あ、あ、あー」、その他の機能を使う場合は「あ、あ、あ、あー」、始めに戻る場合は「あ、あ、あ、あ、あー」と発音してください。」と出力するF103。ユーザの入力を待ちF104、「あー、あ、あー、あ、あ、あー」が入力されたら次へ進むF106。「あ、あー」から両面コピー、「あ、あ、あー」からステイプルへの設定変更を行いF107、変更結果「両面、ステイプル、1部」を音声出力するF108。次に、「あー」から、「コピー枚数を発音して下さい。「あー」が一回10枚、「あ」が一回1枚です。」と出力するF103。ユーザの入力を待ちF104、「あ、あ、あ」が入力されたら3枚と認識しF106、3枚印刷へ設定変更を行いF107、設定変更結果「両面、ステイプル、3部」を音声出力するF108。次に、「コピーするなら「あー」、設定を変更するなら「あ、あ」、終了するなら「あ」と発音してください」と出力するF103。ユーザの入力を待ちF104「あー」と入力されたらF105、画像形成装置で印刷を開始するF110。
【0088】
(実施例2)複音モード(あいうえおモード)
前述の一音モードでは複雑な操作を行う際に多くを発話する必要があるため、一般的なユーザには操作しやすいとはいえない。よって、複雑な操作を簡単に提供するために、複音「あいうえお」で機器を操作する方法を提供する。
【0089】
原稿を「両面、ステイプル、3部」複写する際の実施例を示す。まず、画像形成装置は、標準の設定「片面、1部」を読み上げF101、「コピーするなら「あー」、設定を変更するなら「あ、あ」、終了するなら「あ」と発音してください」と出力するF103。ユーザの入力を待ちF104、「あ、あ」が入力されたら次に進むF109。次に、画像形成装置は、「コピー枚数を変更する場合は「あ」、両面をコピーする場合は「い」、ステイプルする場合は「う」、その他の機能を使う場合は「え」、始めに戻る場合は「お」と発音してください。」と出力するF103。ユーザの入力を待ちF104、「あ、い、う」が入力されたら次へ進むF106。「い」から両面コピー、「う」からステイプルへの設定変更を行いF107、変更結果「両面、ステイプル、1枚」を音声出力するF108。「あ」から、「コピー枚数を発音して下さい。「あー」が一回10枚、「あ」が一回1枚です。」と出力するF103。ユーザの入力を待ちF104、「あ、あ、あ」が入力されたら3枚と認識しF106、3枚印刷へ設定変更を行いF107、設定変更結果「両面、ステイプル、3部」を音声出力するF108。次に「コピーするなら「あー」、設定を変更するなら「あ、あ」、終了するなら「あ」と発音してください」と出力するF103。ユーザの入力を待ちF104、「あー」と入力されたらF105、画像形成装置で印刷を開始するF110。
【0090】
前述の方法を応用することで、ABCDEやあかさたな等を認識し機器を操作することや、画像形成装置が持つ画像保管機能や画像送信機能等を操作することも可能だが、単音の認識による操作は同様であるため割愛する。またもちろん、リセットは同じ発音に統一する、UI表示と音声を同時出力する、など、バリアフリーやユーザインタフェースの観点からの使いやすさの向上策が考えられるが、今回の実施例は一つの例であるため記載していない。
【図面の簡単な説明】
【0091】
【図1】本実施例に係わる画像入出力システムの全体構成の説明図。
【図2】操作部150となるユーザI/F。
【図3】リーダー部およびプリンタ部の断面図。
【図4】フィニッシャ部の断面図。
【図5】制御装置のブロック図。
【図6】メインコントローラのブロック図。
【図7】システムバスブリッジのブロック図。
【図8】スキャナコントローラ、プリンタコントローラのブロック図。
【図9】単音機器操作概要のフローチャート図。
【図10】単音認識による機器操作を用いた実行例前段階のフローチャート図。
【図11】単音認識による機器操作を用いた実行例のフローチャート図。
【符号の説明】
【0092】
331 搬送路
335 搬送路
336 搬送路
338 搬送路
333 搬送路
332 再給紙搬送路
325 定着部
323 感光ドラム

【特許請求の範囲】
【請求項1】
音声を入出力する音声入出力装置と、
原稿を読み取り画像情報に変換する画像読取装置と、
該画像情報を保存する保存装置と、
ネットワークを用いて該画像情報を入出力する通信装置と、
該画像情報を印刷用紙に出力する画像形成装置、
を備えた画像形成装置において、
単音を認識する機能と、
該単音の組み合せパターンを複数記憶する機能と、
パターンに機器設定を割り当てる機能、
を有することを特徴とする、画像形成装置。
【請求項2】
基本周波数、n次のホルマント周波数(0<n)、ピッチ(周期)、パワースペクトル、反復回数、連続発音時間(摩擦音、破裂音、バス音等)、該ホルマントの時間変化、の一つ以上に基づいて該単音を認識することを特徴とする、請求項1記載の画像形成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2006−163096(P2006−163096A)
【公開日】平成18年6月22日(2006.6.22)
【国際特許分類】
【出願番号】特願2004−356318(P2004−356318)
【出願日】平成16年12月9日(2004.12.9)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】