説明

認識装置およびその制御方法

【課題】 機器(筐体)の裏面(背面)においてもユーザの意図に沿った軌跡入力の操作ができるようにする。
【解決手段】 ユーザにより入力される軌跡を検知する正面入力部および背面入力部を備えた認識装置であって、前記正面入力部または背面入力部から入力された軌跡を取得する取得手段と、前記取得された軌跡が、前記2つの入力部の何れから入力された軌跡であるかを特定する特定手段と、前記取得された軌跡を認識する認識手段とを備え、前記認識手段は、前記取得された軌跡が背面入力部から入力された場合には、該取得された軌跡の反転処理を伴う正規化処理を行った後に、前記正面入力部から入力された軌跡の認識と同じ認識アルゴリズムを用いて、軌跡の認識を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの指やスタイラスなどを用いて描画された軌跡を認識する技術に関する。
【背景技術】
【0002】
近年、携帯電話やゲーム機などにおいて、ユーザインタフェース(UI)としてタッチ操作を採用するものが増えてきている。タッチ操作の1つとして、文字及びジェスチャの軌跡を入力する「手書き軌跡入力操作」が存在する。この操作においては装置が軌跡を認識するため、タッチしている指などが移動する方向が重要な意味を持つことは言うまでもない。
また、1つの機器に複数のタッチ操作ができる画面が存在するものなども知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−26064号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
もし、機器(筐体)の表面に相当する画面に対して、その裏面(背面)にタッチパネルが存在するような場合を考える。この場合に、ユーザが画面を見ながら、裏面に文字などの軌跡を記入しようとすると、ユーザが意識する左右(もしくは上下)と実際の裏面の画面の左右の位置は反転関係(いわゆる鏡像)になってしまう。従って、このような機器を操作する場合においては、ユーザの意図に沿った裏面(背面)への手書き軌跡の入力ができなかった。
本発明は上記課題を解決するためになされたものであって、機器(筐体)の裏面(背面)においてもユーザの意図に沿った軌跡入力の操作ができるようにすることを主な目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するため、本発明の手書き認識装置によれば、ユーザにより入力される軌跡を検知する正面入力部および背面入力部を備えた認識装置であって、前記正面入力部または背面入力部から入力された軌跡を取得する取得手段と、前記取得された軌跡が、前記2つの入力部の何れから入力された軌跡であるかを特定する特定手段と、前記取得された軌跡を認識する認識手段とを備え、前記認識手段は、前記取得された軌跡が背面入力部から入力された場合には、該取得された軌跡の反転処理を伴う正規化処理を行った後に、前記正面入力部から入力された軌跡の認識と同じ認識アルゴリズムを用いて、軌跡の認識を実行することを特徴とする。
【発明の効果】
【0006】
本発明によれば、機器の裏面(背面)においてもユーザの意図に沿った軌跡入力の操作ができる。
【図面の簡単な説明】
【0007】
【図1】手書き認識装置の機能構成図
【図2】手書き認識工程を示すフローチャート
【図3】一般的な手書き軌跡認識を示す図
【図4】手書き認識装置を組み込んだ携帯端末の外観図
【図5】背面入力の例
【図6】背面入力による手書き軌跡の例
【図7】手書き認識装置の機能構成図
【図8】手書き軌跡パタンの例
【図9】背面入力により発生する歪みを説明する図
【図10】手書き軌跡の補正テーブル
【図11】携帯端末の外観図
【図12】手書き認識装置の機能構成図
【図13】背面入力による手書き軌跡認識処理のフローチャート
【図14】手書き認識装置の機能構成図
【発明を実施するための形態】
【0008】
<実施形態1>
図4は、本実施形態で適用可能な機器(手書き認識装置)の外観図である。ここに示す機器のサイズは、例えば、ユーザの手のひら、またはそれより少し大きいサイズのものを想定して構わない。
【0009】
機器(筐体)の表面(正面)401には、GUI402を表示するとともに、そのGUI402に対するタッチ操作が可能なタッチパネル403を備えている。
【0010】
さらに機器(筐体)の裏面(背面)404には、タッチ操作ができるタッチパッド405を備えている。ユーザは、このタッチパッド405をタッチ操作することで、表面401に表示されたGUI402に対する操作をすることが可能である。すなわち、機器に表示されているGUI402は、表面401のタッチパネル403からも操作が可能であり、裏面404のタッチパッド405からも操作が可能である。
【0011】
なお、裏面(背面)のタッチパッド405を備えるメリットを考える。例えば、ユーザは、タッチパッド405を操作しながら、GUI402の全てを見ることができるであろう。また、タッチパネル403がタッチ操作で汚れる可能性が少なくなるであろう。
【0012】
また、以下では、タッチパネル403からタッチ操作することを正面入力部による正面入力と呼び、タッチパッド405からタッチ操作することを背面入力部による背面入力と呼ぶこととする。
【0013】
図5および図6は、ユーザが上記機器に背面入力を実行する場合の様子を示す図である。ここでは、機器(筐体)の正面501は、図4の正面401に相当する。またタッチパネル502は、図4のタッチパネル403に相当する。ユーザの手503は、機器を保持している。文字軌跡504は、図4のタッチパッド405にユーザが手書き記入した軌跡を視覚的に示したものであるが、タッチパネル502上に表示されているわけではない。
【0014】
例えばユーザは、機器(筐体)の正面401上のタッチパネル402にはタッチせず、タッチパネル402を見ながら、タッチパッド405のほうに手書きで文字を入力する。
【0015】
この場合、ユーザは、タッチパッド405に自分がどんな文字を書いているのかを実際に見ることができないであろう。すなわち、ユーザは、文字軌跡504を正面501から見た場合を頭の中で想像しながら、指を動かすことになる。
【0016】
以上で説明したような背面入力を行うと、タッチパッド405上には、図6のような文字を書いたことになる。これは、ユーザが意図している文字とは左右が反転したもの(鏡像)になっている。
【0017】
本実施形態では、このような鏡像を、ユーザが意図している正しい軌跡あるいは文字として認識する。
【0018】
図1は、本実施形態で適用可能な機器(手書き認識装置100)の機能構成図である。本装置100には、軌跡検知部101が接続されている。これは、例えば上述した機器正面の正面入力部であるタッチパネル403や、機器背面の背面入力部であるタッチパッド405に相当する。軌跡検知部101において発生した、ユーザの手書き等で得られる軌跡の情報は、軌跡入力部102を介して本装置100によって入力される。なお、ここでは上記軌跡検知部101を、装置100の外部機器として接続されているものとして説明するが、装置100に内蔵された処理部として存在していても構わない。
【0019】
次に、ここで入力された軌跡の情報は、正面/背面入力検出部103に出力される。この検出部103では、入力した軌跡が機器の正面(タッチパネル403)から入力されたものか、機器の背面(タッチパッド405)から入力されたものかを特定する。
【0020】
もし、機器の正面から入力された軌跡であれば、その軌跡の情報は正面入力軌跡認識部104に出力される。一方、もし機器の背面から入力された軌跡であれば、その軌跡は、背面入力軌跡認識部105に出力される。
【0021】
正面入力軌跡認識部104、および背面入力軌跡認識部105では、入力された軌跡の情報を所定の認識アルゴリズムを用いて認識処理し、その軌跡の認識結果を出力する。この認識結果は、ユーザによる手書き入力の結果として、認識結果出力部106を介して装置100の外部機器へ出力されたり、装置100内における各種処理に利用される。なお、ここでの認識結果の具体例としては、文字認識などの結果である文字データや記号データが相当する。
【0022】
図2は、装置100の動作フローを示した図である。本実施形態では、ユーザが機器の正面401のGUI402などを操作することによって、軌跡を認識するソフトウェアアプリケーションを起動するものとする。そして、機器の正面にあるタッチパネル403または機器の背面にあるタッチパッド405に、ユーザの指やスタイラスなどによる軌跡の入力が開始された時点で、この動作フローが開始されるものとする。
【0023】
図中の動作フローが開始された場合、ステップS201において、軌跡入力部102は、入力されている軌跡が正面から入力された軌跡か、背面から入力された軌跡かを検出する。ここでは、軌跡入力部102が上記検出を容易にするため、軌跡検知部101から入力された各軌跡の情報には、正面入力による軌跡なのか背面入力による軌跡なのかを識別できるフラグが付与されるものとする。
【0024】
ステップS202では、入力された軌跡の情報を取得する。例えば、この時点までにシステムのイベントキューに溜まっている軌跡の情報を取得する。
【0025】
ステップS203では、取得された軌跡から、その軌跡がユーザが入力した軌跡の終端であるかどうかを判定する。例えば、取得した最新の軌跡が、500ms以上の追加または更新が無い場合などには、ユーザによる軌跡の入力が既に終了していると判定する。本実施形態では、ユーザによる軌跡の入力中に、軌跡の認識処理を順次行うものとし、軌跡の入力が終了した場合には速やかに認識結果の候補を出力するものである。よって、ステップS203において、もし「取得した軌跡が、まだ終端ではない(ユーザにより、まだ軌跡を入力中である)」と判定した場合には、速やかにステップS204以降の軌跡の認識工程に進む。
【0026】
ステップS204では、ステップS201で正面入力と判定したかどうかを調べる(S204)。もし、ステップS201の検出結果が正面入力であった場合、ステップ205へ進む。一方、もし、ステップS201の検出結果が背面入力であった場合、ステップ206へ進む。
【0027】
ステップS205では、ステップS202で取得した軌跡に対して、正面入力による軌跡としての認識を行う。具体的には、後述する正面入力軌跡パタン702を用いたパターンマッチングにより、軌跡の認識を実行する。
【0028】
ステップS206では、ステップS202で取得した軌跡に対して、背面入力による軌跡としての認識を行う。具体的には、後述する正規化処理によって軌跡の左右を反転する反転処理を行い、その後に正面入力軌跡パタン702を用いたパターンマッチングにより、軌跡の認識を実行する。
【0029】
もし、ステップ203の判定において、取得した軌跡が軌跡の終端であると判定した場合には、これ以上の認識処理を行う必要が無いため、ステップS207に進む。
【0030】
ステップS207では、以前までのステップS205またはステップS206における認識処理の結果を出力する。なお、その認識結果は1つに決定する必要は無く、正解の可能性が高い(認識結果のスコアが高い)1〜N番目までのN個の候補を認識結果として出力する。ここでは詳述しないが、後段の処理において、ユーザまたは装置が必要に応じて、N個の候補のうちの1つを選択すれば良い。
【0031】
図3は、軌跡認識部104、105において軌跡の認識を行うための、基本的な機能を示した概念図である。主には、特徴抽出機能301、パタンマッチング機能302、出力機能303、軌跡パタン304からなる。まず、特徴抽出部301は、軌跡検知部101から入力された軌跡の情報を用いて、特徴の抽出を行う。この特徴としては、例えば、軌跡の各座標や、一定時刻前の軌跡からの変動量などが利用される。ステップS302では、上記抽出された特徴量を、予め登録されている多数の軌跡パタン304とパタンマッチングを行う。なお、パタンマッチングについては公知の種々のパタンマッチングを適用してかまわない。例えば、動的計画法(Dynamic Programming)により、時間方向のゆれを加味した類似度の算出を行っても良いし、Hidden Marcov Modelで軌跡パタンを表現することで、確率的な計算を用いて類似度を算出しても良い。ステップS303では、上記パタンマッチングの結果、類似度が近い上位N個を認識結果の候補として出力する。
【0032】
図7は、上述した図1の装置100の内部を、更に詳細に示した図である。ここでは、特に、正面入力軌跡認識部104と背面入力軌跡認識部105の更なる詳細を示している。なお、基本的な構成は図1と同じであるので、本図で新たに登場する処理部以外については、説明を省略する。
【0033】
正面入力軌跡認識部104は、軌跡認識部A701を備える。軌跡認識部A701は、正面入力軌跡パタン702を用いて、ユーザに入力された軌跡の認識を行う。なお、この正面入力軌跡パタン702は、ユーザが正面入力を行った際に手書きで描く可能性が高い軌跡の全てのパタンを格納したデータベースである。
【0034】
図8は、軌跡パタンの一例を示す図である。図中801は、上述した「ユーザが正面入力を行った際に手書きで描く可能性が高い軌跡」のパタンの一例である。一方、図中802は、「ユーザが背面入力を行った際に手書きで描く可能性が高い軌跡」のパタンの一例である。すなわち、上記正面入力軌跡パタン702は、図中801に該当するパタンを格納したデータベースである。
【0035】
背面入力軌跡認識部105は、軌跡正規化部703と軌跡認識部B704とを備える。軌跡正規化部703は、背面入力された軌跡の情報を左右に反転させることで、正面入力による軌跡と同様のデータに正規化する。軌跡認識部B704は、軌跡認識部A701と同様に、正面入力軌跡パタン702を用いて、上記正規化された軌跡の認識を行う。
【0036】
以上によれば、ユーザにより正面入力された軌跡であっても、背面入力された軌跡であっても、高精度の軌跡の認識ができる。
【0037】
<実施形態2>
上記実施形態1では、背面入力された軌跡は、入力された軌跡の正規化(左右反転)を行った後に認識を行っていた。しかしながら、上記正規化の処理として、左右反転以外の正規化も合わせて行うことが有効な場合も有り得る。以下ではその一例を説明する。
【0038】
まず、ユーザが背面入力をする場合を考える。例えば、ユーザは、機器を人差し指以外の指で保持しているかもしれない。その場合には、人差し指で手書き軌跡を入力することになるであろう。ここで、人差し指によって入力された軌跡は、特徴的な形状を持ち、人差し指の可動範囲に軌跡の全てが閉じ込められた形状となるであろう。
【0039】
図9の901は、背面入力時において、片方の人差し指がタッチパッド405に接触できる範囲、言い換えればタッチパッド上での人差し指の可動範囲を示す。ユーザが機器を保持しながら人差し指で軌跡を描いた場合には、本来ユーザが描こうとした軌跡は、この楕円形の可動範囲の内部に歪められてしまう。そして、もしこの歪んだ軌跡を認識しようとすれば、正しい認識を行うことは困難である。従って、本実施形態では、第1実施形態での正規化である左右反転に加えて、上述した歪みも解消する。具体的には、図中902で示すように、軌跡の各点について、図示の楕円形の可動範囲から矩形に変形するような空間変換(マッピング処理)を行う。これにより、空間の歪みが正規化される。
【0040】
図13は、この背面入力軌跡認識部105で行われる背面入力軌跡認識処理S206のサブフローである。まず、ステップS1301において、第1の正規化処理として、背面入力された軌跡の左右反転を行う。次に、ステップS1302において、第2の正規化処理として、左右反転された軌跡を図9の902で示したように空間変換する。次に、ステップS1303では、上記2種類の正規化処理が施された軌跡を、正面入力軌跡パタン702とのパタンマッチングにより認識処理する。
【0041】
なお、2種類の正規化処理を行う方法としては、例えば図10に示すような空間変換テーブルを用いて、第1正規化(左右反転)と第2正規化(歪み除去の空間変換)の両方を行う空間変換を実行しても良い。たとえば、このテーブルを用いると、入力された軌跡上の座標(100,104)は、座標(209,52)にマッピングされる。このマッピングにより、第1正規化(左右反転)と第2正規化(歪み除去の空間変換)の両方が一度に実行されることとなる。
【0042】
なお、本実施形態では、人差し指の可動範囲を一例に挙げて、第2の正規化を説明したが、本発明はこれに限らない。例えば指の種類は、他の指であっても構わない。また、スタイラスなどによって背面入力する場合の可動範囲などを考慮したものであっても構わない。
【0043】
以上によれば、背面入力された軌跡を、より高精度に認識できる。
【0044】
<実施形態3>
上述した各実施形態では、機器の正面はタッチパネル403、機器の背面はタッチパッド405といったように、ユーザまたは装置が、正面と背面の種類を明確に区別できる機器について説明した。以下では、これらを明確に区別できない場合の実施形態について説明する。
【0045】
図11は、正面と背面をユーザに区別させないような機器の一例である。図中、機器のA面1101とB面1102のそれぞれにはタッチパネル1103とタッチパネル1104が備えられている。ユーザは、この端末のA面とB面の何れが正面であるかを意識せずに、操作するものである。すなわち、A面とB面の何れも、機器の正面にも背面にもなり得る。
【0046】
図12は、本実施形態で適用可能な機器(手書き認識装置100)の機能構成図である。なお、図1および図7と同じ構成要素に対しては同じ番号を付与し、説明を省略する。本実施形態において特徴的な部分は、正面/背面入力検出部103の動作である。
【0047】
ここで注意するべき点としては、タッチパネル1200は正面のタッチパネルかもしれないし、背面のタッチパネルかもしれない点である。もしタッチパネル1200が正面のタッチパネルである時には、それはタッチパネル1202と同一物に相当する。一方で、もしタッチパネル1200が背面のタッチパネルである時には、それはタッチパネル1202の反対面に存在するタッチパネルということになる。
【0048】
本実施形態では、正面/背面入力検出部103が、A面あるいはB面のどちらのタッチパネルがユーザの正面に向いているのかを検出することができる。すなわち、正面/背面入力検出部103は、軌跡検知部101を含むタッチパネル1200が正面のタッチパネルか、背面のタッチパネルかを判断することができる。この検出方法としては種々の方法を適用可能である。例えば、機器のA面にカメラを備え、軌跡の入力時にはA面のカメラで撮影を行う。もしこのカメラで撮影された画像を顔検出した結果、顔が含まれていると判定した場合は、A面がユーザ正面であると判定できる。逆に、顔が含まれていないと判定した場合には、B面がユーザ正面であると判定すれば良い。
【0049】
他の方法としては、例えば、機器内に加速度センサ(重力センサ)を装備し、A面とB面のうち、上方を向いている面をユーザ正面と判定しても良い。
【0050】
以上により、ユーザにとって正面のタッチパネルに軌跡が入力された場合は、正面入力であると判定し、ユーザにとって背面のタッチパネルに軌跡が入力された場合は、背面入力と判定する。
【0051】
なお、本実施形態では、背面入力軌跡認識部105に正面パネル出力部1201を備えている。そして、軌跡正規化部703で正規化された軌跡を、正面パネル出力部1201を介して、ユーザの正面と判断されたタッチパネル(タッチパネルディスプレイ)1202に出力させることができる。これは、ユーザに、背面入力された軌跡がどのようなものかを明示することができ、ユーザの意図に沿った軌跡の入力がし易くなるという利点がある。
【0052】
<実施形態4>
上記各実施形態では、背面入力した軌跡を正規化することで、正面入力軌跡パタン702とのパターンマッチングを行っていた。しかしながら、図10のようなテーブルを利用した空間変換であっても、入力された軌跡の全ての座標について行う場合には、その負荷が大きい。これに対し、あえて背面入力された軌跡を正規化せずに、背面入力された軌跡を高速に認識できるようにすることも可能である。以下、その一例を説明する。
【0053】
図14は、本実施形態の機能ブロック図である。背面入力軌跡パタン1601は、上述した図8における背面入力軌跡パタン802と同様のデータベースである。このデータベースには、全て背面入力で入力される可能性のある軌跡が格納されている。すなわち、背面入力軌跡パタン1601は、正面入力で入力される可能性のある軌跡を左右反転している軌跡の集まりに相当する。図14においては、正面/背面入力検出部103が背面入力であると判定した場合、軌跡認識部B704は、軌跡正規化部703の機能を必要とせずに、速やかに背面入力の軌跡パタン1601とのパタンマッチングを行う。図14における他の動作は基本的に上記図12と同様であるので詳細な説明は省略する。
【0054】
以上によれば、背面入力による軌跡の認識を高速に行うことができる。
【0055】
<変形例>
なお、上記各実施形態では、正面と背面は角度が180度異なる方向を向いている状態を想定して説明したが、本発明はこれに限らない。すなわち、本発明は、ユーザが平面であると感じるような少なくとも2つの面を有する機器に適用でき、その2つの面は、ユーザが感覚的に正面と背面であると感じる関係であれば良い。例えば、機器のA面とB面が90度ぐらいの角度を形成するような配置関係であっても、A面を正面として見ているユーザにとって、B面をA面と同時に見ることができなければ、B面は背面に相当する。そのような関係の2面についても、上述した各実施形態の正面と背面の概念を適用することが可能である。
【0056】
なお、上述した各実施形態は、以下の処理を実行することによっても実現される。即ち、上記実施形態の各工程や機能を実現するソフトウェア(コンピュータプログラム)を、ネットワークや記憶媒体を介してシステムに供給し、そのシステムのコンピュータ(またはCPU等)が上記プログラムを読み込んで実行する処理である。上記コンピュータプログラムや、それを記憶したコンピュータ可読記憶媒体も本発明の範疇に含まれる。例えば、図1に示した機器の各処理部と同等の機能を、CPUやROM、RAMなどから構成されるコンピュータが実行する場合には、そのコンピュータは認識装置に相当し、その一連の認識動作を制御することは認識装置の制御方法に相当する。

【特許請求の範囲】
【請求項1】
ユーザにより入力される軌跡を検知する正面入力部および背面入力部を備えた認識装置であって、
前記正面入力部または背面入力部から入力された軌跡を取得する取得手段と、
前記取得された軌跡が、前記2つの入力部の何れから入力された軌跡であるかを特定する特定手段と、
前記取得された軌跡を認識する認識手段とを備え、
前記認識手段は、前記取得された軌跡が背面入力部から入力された場合には、該取得された軌跡の反転処理を伴う正規化処理を行った後に、前記正面入力部から入力された軌跡の認識と同じ認識アルゴリズムを用いて、軌跡の認識を実行することを特徴とする認識装置。
【請求項2】
コンピュータに読み込み込ませ実行させることで、前記コンピュータを請求項1に記載の認識装置として機能させるコンピュータプログラム。
【請求項3】
請求項2に記載のコンピュータプログラムを記憶したことを特徴とするコンピュータ可読記憶媒体。
【請求項4】
ユーザにより入力される軌跡を検知する正面入力部および背面入力部を備えた認識装置の制御方法であって、
取得手段により、前記正面入力部または背面入力部から入力された軌跡を取得する取得工程と、
特定手段により、前記取得された軌跡が、前記2つの入力部の何れから入力された軌跡であるかを特定する特定工程と、
認識手段により、前記取得された軌跡を認識する認識工程とを備え、
前記認識工程では、前記取得された軌跡が背面入力部から入力された場合には、該取得された軌跡の反転処理を伴う正規化処理を行った後に、前記正面入力部から入力された軌跡の認識と同じ認識アルゴリズムを用いて、軌跡の認識を実行することを特徴とする制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2013−77180(P2013−77180A)
【公開日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2011−216778(P2011−216778)
【出願日】平成23年9月30日(2011.9.30)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】