説明

情報処理装置、および情報処理方法

【課題】ユーザの操作性の向上を図りつつ、オブジェクトを認識することが可能な、情報処理装置、および情報処理方法を提供する。
【解決手段】撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識する検出対象認識部と、認識された検出対象からオブジェクトを検出するオブジェクト検出部とを備える、情報処理装置が提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、および情報処理方法に関する。
【背景技術】
【0002】
近年、OCR(Optical Character Recognition。光学文字認識)や画像解析によって、文字や特定の物体などのオブジェクトを認識することが可能な装置の普及が進んでいる。
【0003】
また、文字の認識に係る技術も開発されている。ユーザの手と指との位置および姿勢に基づいて、文字を認識する技術としては、例えば、特許文献1に記載の技術が挙げられる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−108923号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば特許文献1に記載の文字の認識に係る技術(以下、「従来の技術」と示す場合がある。)では、ユーザの手、指の姿勢として指示姿勢と選択姿勢の2動作姿勢を設定する。また、従来の技術では、撮像された画像からユーザの手と指とを検出してユーザの手、指の姿勢、および位置を認識することによって、文字を認識する領域を特定する。そして、従来の技術では、特定された領域において文字認識処理を行う。よって、従来の技術を用いることによって、撮像された画像から指定された特定の文字を認識できる可能性はある。
【0006】
しかしながら、従来の技術を用いる装置を用いるユーザは、当該装置に文字を認識させる領域を設定するために、指示姿勢に係る操作と選択姿勢に係る操作という、異なる複数の操作を行わなければならない。そのため、従来の技術を用いる装置を用いるユーザは、煩雑な操作を行わなければならず、直感的な操作を行えない恐れがある。
【0007】
本開示では、ユーザの操作性の向上を図りつつ、オブジェクトを認識することが可能な、新規かつ改良された情報処理装置、および情報処理方法を提案する。
【課題を解決するための手段】
【0008】
本開示によれば、撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識する検出対象認識部と、認識された検出対象からオブジェクトを検出するオブジェクト検出部と、を備える、情報処理装置が提供される。
【0009】
また、本開示によれば、撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識するステップと、認識された検出対象からオブジェクトを検出するステップと、を有する、情報処理方法が提供される。
【発明の効果】
【0010】
本開示によれば、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【図面の簡単な説明】
【0011】
【図1】本実施形態に係る情報処理装置が処理する撮像画像の一例を説明するための説明図である。
【図2】本実施形態に係る情報処理装置が処理する撮像画像の一例を説明するための説明図である。
【図3】本実施形態に係る情報処理方法に係る処理の一例を示す流れ図である。
【図4】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第1の例を示す流れ図である。
【図5】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図6】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図7】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図8】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図9】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図10】本実施形態に係る情報処理装置における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。
【図11】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第2の例を示す流れ図である。
【図12】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第3の例を示す流れ図である。
【図13】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第4の例を示す流れ図である。
【図14】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第5の例を示す流れ図である。
【図15】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第6の例を示す流れ図である。
【図16】本実施形態に係る情報処理装置における、指示体を認識する場合における検出対象の認識に係る処理の第7の例を示す流れ図である。
【図17】本実施形態に係る情報処理装置における、指示体を認識しない場合における検出対象の認識に係る処理の一例を説明するための説明図である。
【図18】本実施形態に係る情報処理装置における、指示体を認識しない場合における検出対象の認識に係る処理の一例を説明するための説明図である。
【図19】本実施形態に係る情報処理装置の構成の一例を示すブロック図である。
【図20】本実施形態に係る情報処理装置のハードウェア構成の一例を示す説明図である。
【発明を実施するための形態】
【0012】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0013】
また、以下では、下記に示す順序で説明を行う。
1.本実施形態に係る情報処理方法
2.本実施形態に係る情報処理装置
3.本実施形態に係るプログラム
【0014】
(本実施形態に係る情報処理方法)
本実施形態に係る情報処理装置(以下、「情報処理装置100」と示す場合がある。)の構成について説明する前に、本実施形態に係る情報処理方法について説明する。また、以下では、本実施形態に係る情報処理装置が、本実施形態に係る情報処理方法に係る処理を行うものとして説明する。
【0015】
[本実施形態に係る情報処理方法の概要]
上述したように、例えば従来の技術が用いられる装置のように、撮像された画像(以下、「撮像画像」と示す。)からユーザの手、指の姿勢を複数認識して文字(オブジェクトの一例)を認識する領域を特定する場合には、当該装置を用いるユーザは、直感的な操作を行えない恐れがある。
【0016】
そこで、情報処理装置100は、撮像画像(動画像、または、複数の静止画像。以下、同様とする。)に基づいて、例えばユーザの指や指示装置などの指示体の動きの状態、または、撮像対象の動きの状態を判定して、検出対象(ターゲット)を認識する(検出対象認識処理)。ここで、本実施形態に係る検出対象とは、後述するオブジェクト検出処理を行う処理の対象である。
【0017】
より具体的には、情報処理装置100は、指示体の動きの状態を判定して検出対象を認識する場合には、例えば、撮像画像における指示体の位置の軌跡に基づいて、指示体の動きの状態を判定する。また、情報処理装置100は、撮像対象の動きの状態を判定して検出対象を認識する場合には、例えば、撮像画像の中心位置などの所定の位置に対応する画像の変化に基づいて、撮像対象の動きの状態を判定する。なお、指示体の位置の軌跡に基づく指示体の動きの状態の判定に係る処理の具体例、および、撮像画像の所定の位置に対応する画像の変化に基づく撮像対象の動きの状態の判定に係る処理の具体例については、後述する。
【0018】
そして、情報処理装置100は、例えばOCR技術や画像解析技術を用いることによって、認識された検出対象から特定のオブジェクトを検出する(オブジェクト検出処理)。ここで、本実施形態に係るオブジェクトとしては、例えば、文字や、特定の物体(例えば、人間や、車などの物など)が挙げられる。情報処理装置100は、オブジェクト検出処理において、例えば、予め設定されたオブジェクトや、ユーザ操作などによって新たに設定されたオブジェクトを、特定のオブジェクトとして検出する。以下では、情報処理装置100が検出する特定のオブジェクトを、単に「オブジェクト」と示す場合がある。
【0019】
図1、図2は、本実施形態に係る情報処理装置100が処理する撮像画像の一例を説明するための説明図である。図1に示すAと図2に示すAとは、撮像を行う撮像装置の一例を示している。また、図1に示すBは、指示体の一例である指示装置を示している。また、図1に示すCと図2に示すBとは、撮像対象の一例である文字が記載された紙媒体を示している。なお、本実施形態に係る撮像対象は、図1に示すCや図2に示すBに示すような紙媒体に限られない。例えば、本実施形態に係る撮像対象は、看板や雑誌などであってもよく、また、オブジェクトが含まれるものであれば、屋内、屋外を問わず任意のものとすることが可能である。
【0020】
本実施形態に係る撮像画像としては、例えば、図1のAに示すように撮像位置が固定された撮像装置により撮像された画像や、図2のAに示すように撮像位置が固定されていない撮像装置により撮像された画像が挙げられる。図1のAに示すような撮像装置により撮像された撮像画像に基づき検出対象を認識する場合には、情報処理装置100は、指示体の動きの状態を判定して、検出対象を認識する。また、図2のAに示すような撮像装置により撮像された撮像画像に基づき検出対象を認識する場合には、情報処理装置100は、撮像対象の動きの状態を判定して、検出対象を認識する。
【0021】
ここで、情報処理装置100は、例えば、ネットワークを介して(あるいは、直接的に)接続された撮像装置から有線/無線で受信した、撮像画像を示す画像信号を処理することによって、撮像画像に基づく処理を行う。本実施形態に係るネットワークとしては、例えば、LAN(Local Area Network)やWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0022】
なお、本実施形態に係る情報処理装置100が処理する画像信号は、上記に限られない。例えば、本実施形態に係る画像信号としては、情報処理装置100がテレビ塔などから送信された放送波を(直接的、またはセットトップボックスなどを介して間接的に)受信してデコードした結果得られる画像信号が挙げられる。また、情報処理装置100は、例えば、記憶部(後述する)や、情報処理装置100から着脱可能な外部記録媒体に記憶された画像データをデコードすることにより得られた画像信号を処理してもよい。さらに、情報処理装置100が動画像を撮像することが可能な撮像部(後述する)を備えている場合、すなわち、情報処理装置100が撮像装置として機能する場合には、情報処理装置100は、例えば、撮像部(後述する)により撮像された撮像画像に対応する画像信号を処理することも可能である。
【0023】
上記のように、本実施形態に係る情報処理装置100は、(I)検出対象認識処理と、(II)オブジェクト検出処理とを行うことによって、撮像画像に基づいてオブジェクトを検出する。ここで、情報処理装置100は、撮像画像に基づいて指示体の動きの状態または撮像対象の動きの状態を判定することによって、検出対象を認識する。つまり、情報処理装置100のユーザ(以下、単に「ユーザ」と示す場合がある。)は、従来の技術が用いられる場合のように、指示姿勢に係る操作と選択姿勢に係る操作という異なる複数の操作を行う必要はない。また、情報処理装置100は、例えばOCR技術や画像解析技術を用いることによって、認識された検出対象から特定のオブジェクトを検出する。よって、ユーザは、従来の技術が用いられる装置を用いる場合よりも、より直感的な操作で情報処理装置100にオブジェクトを検出させることが可能となる。
【0024】
したがって、情報処理装置100は、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【0025】
なお、本実施形態に係る情報処理方法に係る処理は、(I)の処理(検出対象認識処理)、(II)の処理(オブジェクト検出処理)に限られない。例えば、情報処理装置100は、検出されたオブジェクトに基づいて、当該オブジェクトに対応する処理を行うことも可能である(実行処理)。
【0026】
ここで、本実施形態に係る情報処理装置100における(III)実行処理としては、例えば、オブジェクトに対応するサービスに係る処理を実行することや、オブジェクトに対応するアプリケーションを起動して実行することなどが挙げられる。より具体的には、情報処理装置100は、例えばオブジェクトとして文字が検出された場合には、例えば、“検出された文字を翻訳した結果を提示する”、“検出された文字が示す地名に対応する地図を提示する”などの処理を行う。また、情報処理装置100は、例えばオブジェクトとして人物が検出された場合には、例えば、“記憶部(後述する)などの記憶媒体から検出された人物が含まれる画像を検索する”などの処理を行う。また、情報処理装置100は、検出されたオブジェクトに基づく複数の処理結果を、マッシュアップしてもよい。なお、本実施形態に係る情報処理装置100における実行処理が、上記の例に限られないことは、言うまでもない。
【0027】
[本実施形態に係る情報処理方法に係る処理の具体例]
次に、本実施形態に係る情報処理方法に係る処理について、より具体的に説明する。以下では、本実施形態に係る情報処理装置100が、本実施形態に係る情報処理方法に係る処理を行うものとして説明する。また、以下では、情報処理装置100が、文字(または文字列。以下、同様とする。)をオブジェクトとして検出する場合を例に挙げて説明する。また、以下では、情報処理装置100が、複数のフレームの画像(以下、「フレーム画像」と示す。)からなる動画像である撮像画像を処理する場合を例に挙げて説明する。
【0028】
また、以下では、簡単化のために、撮像画像において文字などのオブジェクトには傾きがない場合を例に挙げて説明する。なお、本実施形態に係る情報処理装置100は、仮に、撮像画像においてオブジェクトには傾きが存在したとしても、撮像画像に対して補正を行うことによって、傾きがない場合と同様の処理を行うことが可能である。
【0029】
図3は、本実施形態に係る情報処理方法に係る処理の一例を示す流れ図である。ここで、図3に示すステップS100〜S106の処理は、上記(I)の処理(検出対象認識処理)に相当する。また、図3に示すステップS108〜S114、およびS118〜S122の処理は、上記(II)の処理(オブジェクト検出処理)に相当し、図3に示すステップS116の処理は、上記(III)の処理(実行処理)に相当する。
【0030】
情報処理装置100は、指示体を認識するか否かを判定する(S100)。ここで、情報処理装置100は、例えば、指示体を認識するか否かが設定された設定情報に基づいて、ステップS100の処理を行う。上記設定情報は、例えば記憶部(図示せず)などに記憶される。また、設定情報における設定は、例えば、予め設定されていてもよいし、ユーザ操作などに基づいて設定されてもよい。
【0031】
なお、本実施形態に係る情報処理装置100におけるステップS100の処理は、上記に限られない。例えば、情報処理装置100は、処理対象の撮像画像に基づいて、ステップS100の判定を行ってもよい。例えば、情報処理装置100は、連続する複数のフレーム画像に対して動き検出処理を行う。そして、情報処理装置100は、撮像対象が動いていることが検出されない場合に指示体を認識すると判定し、また、撮像対象が動いていることが検出された場合に、指示体を認識しないと判定する。ここで、情報処理装置100は、例えば勾配法などを用いて動きベクトルを検出することによって、撮像対象の動きを検出するが、情報処理装置100における動き検出処理は、上記に限られない。
【0032】
〔1〕指示体を認識する場合の処理の一例
ステップS100において指示体を認識すると判定された場合には、情報処理装置100は、例えば撮像画像の中から指示体の先端部分を認識し(S102)、認識された先端部分の動きに基づいて、検出対象を認識する(S104)。
【0033】
ここで、情報処理装置100は、例えば、撮像画像からエッジを検出して指示体の輪郭を検出することによって、指示体の先端部分を認識する。なお、情報処理装置100における指示体の先端部分の認識方法は、上記に限られない。例えば、情報処理装置100は、指示装置(指示体の一例)の先端部分に付された特定のマークなどを撮像画像から検出することによって、指示体の先端部分を認識することも可能である。また、図3では、情報処理装置100が、ステップS102において指示体の先端部分を認識する例を示しているが、情報処理装置100におけるステップS102における処理が、指示体の先端部分を認識することに限られないことは、言うまでもない。
【0034】
以下、情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理について、より具体的に説明する。
【0035】
〔1−1〕検出対象の認識に係る処理の第1の例
図4は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第1の例を示す流れ図である。
【0036】
情報処理装置100は、撮像画像における指示体の位置(処理時点に対応する一のフレーム画像における、指示体の位置(現在位置))を記憶する(S200)。ここで、本実施形態に係る撮像画像における指示体の位置は、例えば、撮像画像の左下隅など特定の位置を原点とした座標で表される。
【0037】
ステップS200において指示体の現在位置が記憶されると、情報処理装置100は、指示体が移動したか否かを判定する(S202)。ここで、情報処理装置100は、例えば、ステップS200において記憶した位置と、時間的に連続する次のフレーム画像、または、一定の時間が経過した後のフレーム画像における指示体の位置とを比較することによって、ステップS202の処理を行う。
【0038】
ステップS202において指示体が移動したと判定された場合には、情報処理装置100は、指示体の位置の軌跡が閉領域を示すか否かを判定する(S204)。ここで、情報処理装置100は、例えばステップS200において適宜記憶される指示体の位置の情報(位置データ)を時系列に用いることによって、指示体の位置の軌跡を特定する。
【0039】
ステップS204において指示体の位置の軌跡が閉領域を示すと判定されない場合には、情報処理装置100は、ステップS200からの処理を繰り返す。
【0040】
また、ステップS204において指示体の位置の軌跡が閉領域を示すと判定された場合には、情報処理装置100は、閉領域の判定に基づく第1方法により検出対象を認識し(S206)、検出対象の認識に係る処理を終了する。
【0041】
図5は、本実施形態に係る情報処理装置100における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。ここで、図5は、閉領域の判定に基づく第1方法に係る処理の一例を示している。また、図5に示すIは、指示体の一例を示しており、図5に示すTは、指示体の位置の軌跡を示している。以下では、指示体の位置の軌跡を「軌跡T」と示す場合がある。
【0042】
図5のAに示すように、軌跡Tが閉領域を示さない場合には、情報処理装置100は、ステップS204において指示体の位置の軌跡が閉領域を示すと判定せず、ステップS200からの処理を繰り返す。一方、図5のBに示すように、軌跡Tが閉領域を示す場合には、情報処理装置100は、閉領域を検出対象として認識する。よって、例えば図5のBに示す例では、(II)の処理(オブジェクト検出処理)によって、文字“method”が検出されることとなる。
【0043】
再度図4を参照して、情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第1の例について説明する。ステップS202において指示体が移動したと判定されない場合には、情報処理装置100は、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S208)。ここで、情報処理装置100は、例えば、ステップS202において指示体が移動したと判定されない場合にカウントアップされるカウンタの値に基づいて、ステップS208の判定を行う。また、上記カウンタの値は、例えば図4の処理が開始されるときに初期化される。なお、本実施形態に係る情報処理装置100におけるステップS208の処理が、上記に限られないことは、言うまでもない。
【0044】
ステップS208において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS200からの処理を繰り返す。
【0045】
また、ステップS208において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、指示体の位置の軌跡が矩形の2辺を示すか否かを判定する(S210)。
【0046】
ステップS210において指示体の位置の軌跡が矩形の2辺を示すと判定された場合には、情報処理装置100は、矩形の2辺の判定に基づく第2方法により検出対象を認識し(S212)、検出対象の認識に係る処理を終了する。
【0047】
図6は、本実施形態に係る情報処理装置100における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。ここで、図6は、矩形の2辺の判定に基づく第2方法に係る処理の一例を示している。また、図6に示すIは、指示体の一例を示しており、図6に示すTは、指示体の位置の軌跡を示している。
【0048】
例えば図6のA〜Cに示すように、ユーザが、時刻t0で指示体を停止させ、時刻t1まで線分を引いた後に、時刻t2まで直角(略直角)に線分を引くと、図6のDに示すように、指示装置の停止から次の停止までの軌跡は、途中の1点で直角(略直角)に折れ曲がった2つの線分を示す。上記のように、指示体の軌跡が途中の1点で直角(略直角)に折れ曲がった2つの線分を示す場合には、情報処理装置100は、ステップS210において指示体の位置の軌跡が矩形の2辺を示すと判定する。ここで、情報処理装置100は、例えば、2つの線分がなす角度θが“90−α<θ<90+α”(αは、設定されている閾値。)を満たす場合に、指示体の軌跡が途中の1点で直角(略直角)に折れ曲がった2つの線分を示すと判定する。なお、ステップS210における処理が、上記に限られないことは、言うまでもない。
【0049】
また、指示体の位置の軌跡が矩形の2辺を示すと判定された場合には、情報処理装置100は、最初の停止位置、途中で折れ曲がった位置、および次の停止位置の3点により規定される矩形の領域を、検出対象と認識する。つまり、情報処理装置100は、矩形の2辺に基づき閉領域を設定して、検出対象を認識する。よって、例えば図6のDに示す例では、(II)の処理(オブジェクト検出処理)によって、文字“method”が検出されることとなる。
【0050】
一方、指示体の停止から次の停止までの軌跡が、途中の1点で直角(略直角)に折れ曲がった2つの線分となっていない場合には、情報処理装置100は、ステップS210において指示体の位置の軌跡が矩形の2辺を示すと判定しない。
【0051】
再度図4を参照して、情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第1の例について説明する。ステップS210において指示体の位置の軌跡が矩形の2辺を示すと判定されない場合には、情報処理装置100は、指示体の位置の軌跡が線分を示すか否かを判定する(S214)。
【0052】
ステップS214において指示体の位置の軌跡が線分を示すと判定された場合には、情報処理装置100は、線分の判定に基づく第3方法により検出対象を認識し(S216)、検出対象の認識に係る処理を終了する。
【0053】
図7は、本実施形態に係る情報処理装置100における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。ここで、図7は、線分の判定に基づく第3方法に係る処理の一例を示している。また、図7に示すIは、指示体の一例を示しており、図7に示すTは、指示体の位置の軌跡を示している。
【0054】
図7のA、Bに示すように軌跡が描かれた結果、指示体の停止から次の停止までの軌跡が線分である場合には、情報処理装置100は、例えば、軌跡から垂直方向に所定の距離分離れて存在する線分や、軌跡が示す線分そのものを、検出対象と認識する。例えば軌跡から垂直方向に所定の距離分離れて存在する線分が検出対象として認識される場合には、情報処理装置100は、(II)の処理(オブジェクト検出処理)によって、例えば図7のBに示すようにアンダーラインが引かれた文字列“the method”を検出する。また、例えば軌跡が示す線分そのものを検出対象と認識する場合には、指示体によってなぞられたオブジェクトが検出されることとなる。
【0055】
なお、情報処理装置100における、軌跡が線分である場合の検出対象の認識に係る処理は、上記に限られない。図8は、本実施形態に係る情報処理装置100における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図であり、線分の判定に基づく第3方法に係る処理の他の例を示している。ここで、図8に示すIは、指示体の一例を示している。
【0056】
例えば図8のAに示す撮像画像において指示体の軌跡が線分である場合、情報処理装置100は、線分を含む所定の大きさの領域ARを検出対象と認識する。つまり、情報処理装置100は、線分に基づき閉領域を設定して、検出対象を認識する。上記の場合には、情報処理装置100は、(II)の処理(オブジェクト検出処理)によって、認識された領域ARから指示体の軌跡に対応する文字を、オブジェクトとして検出する。
【0057】
より具体的には、情報処理装置100は、例えば、検出対象である領域ARから指示体の軌跡に対応する文字行を検出する。例えば図8のBに示す例では、領域ARから4行の文字行が検出される。そして、情報処理装置100は、検出された文字行から指示体の軌跡に対応する文字を検出する。例えば図7に示す軌跡Tと同様の軌跡が図8に示す例において描かれていた場合には、情報処理装置100は、“the method”を検出する。
【0058】
ここで、情報処理装置100は、例えば、(II)の処理(オブジェクト検出処理)を行う際に、領域ARに対してOCR処理を行って、文字を検出するが、本実施形態に係る情報処理装置100の処理は、上記に限られない。例えば、情報処理装置100は、予め撮像画像全体に対してOCR処理を行い、当該OCR処理の結果を用いて(II)の処理(オブジェクト検出処理)を行ってもよい。
【0059】
再度図4を参照して、情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第1の例について説明する。ステップS214において指示体の位置の軌跡が線分を示すと判定されない場合には、情報処理装置100は、第4方法により検出対象を認識し(S218)、検出対象の認識に係る処理を終了する。
【0060】
図9、図10は、本実施形態に係る情報処理装置100における指示体の位置の軌跡に基づく検出対象の認識に係る処理の一例を示す説明図である。ここで、図9、図10は、第4方法に係る処理の一例を示している。また、図9に示すI、および図10に示すIは、指示体の一例を示している。
【0061】
情報処理装置100は、例えば、指示体の位置から垂直方向に所定の距離分離れて存在する文字や、指示体の位置に存在する文字を、検出対象と認識する。例えば指示体の位置から垂直方向に所定の距離分離れて存在する文字が検出対象として認識される場合には、情報処理装置100は、例えば、(II)の処理(オブジェクト検出処理)において、指示体の位置から垂直方向に所定の距離分離れて存在する文字行を認識する。そして、情報処理装置100は、例えば、認識された文字行においてスペースで区切られた部分を一単語と捉え、指示体から垂直方向に所定の距離分離れて存在する単語を、オブジェクトとして検出する。例えば、図9の例では、“method”が検出される。
【0062】
また、例えば指示体の位置に存在する文字が検出対象として認識される場合には、情報処理装置100は、例えば、(II)の処理(オブジェクト検出処理)において、予め撮像画像全体に対してOCR処理を行った結果と、指示体の位置とに基づいて、当該指示体の位置に対応する単語をオブジェクトとして検出する。
【0063】
また、情報処理装置100は、例えば、文字認識用の辞書として熟語データベースを用いることによって、上記のように検出された一単語とその前後の単語との組合せから、熟語を認識することも可能である。例えば図10の例において単語として“care”が検出されたときには、情報処理装置100は、熟語データベースを用いることによって、例えば、“take care”や“take care of”を検出する。
【0064】
情報処理装置100は、指示体を認識して処理を行う場合には、例えば図4に示す処理を行うことによって、検出対象を認識する。
【0065】
なお、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理は、図4に示す第1の例に係る処理に限られない。例えば、図4では、情報処理装置100が複数の判断処理の結果に基づき第1方法〜第4方法のいずれかによって検出対象を認識する例を示したが、情報処理装置100は、検出対象の認識に用いる方法や、判断処理の組合せなどが変更された処理を行うこともできる。より具体的には、情報処理装置100は、例えば、第1方法〜第4方法のうちの1つ以上の任意の組合せ(15通り)によって、検出対象を認識することが可能である。以下、情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の他の例について、説明する。
【0066】
〔1−2〕検出対象の認識に係る処理の第2の例
図11は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第2の例を示す流れ図である。
【0067】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S300)。
【0068】
ステップS300において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S302)。
【0069】
ステップS302において指示体が移動したと判定された場合には、情報処理装置100は、図4のステップS204と同様に、指示体の位置の軌跡が閉領域を示すか否かを判定する(S304)。ステップS304において指示体の位置の軌跡が閉領域を示すと判定されない場合には、情報処理装置100は、ステップS300からの処理を繰り返す。
【0070】
また、ステップS304において指示体の位置の軌跡が閉領域を示すと判定された場合には、情報処理装置100は、図4のステップS206と同様に、閉領域の判定に基づく第1方法により検出対象を認識する(S306)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0071】
ステップS302において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS208と同様に、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S308)。ステップS308において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS300からの処理を繰り返す。
【0072】
また、ステップS308において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、図4のステップS218と同様に、第4方法により検出対象を認識する(S310)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0073】
〔1−3〕検出対象の認識に係る処理の第3の例
図12は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第3の例を示す流れ図である。
【0074】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S400)。
【0075】
ステップS400において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S402)。ステップS402において指示体が移動したと判定された場合には、情報処理装置100は、ステップS400からの処理を繰り返す。
【0076】
ステップS402において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS208と同様に、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S404)。ステップS404において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS400からの処理を繰り返す。
【0077】
また、ステップS404において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、図4のステップS210と同様に、指示体の位置の軌跡が矩形の2辺を示すか否かを判定する(S406)。
【0078】
ステップS406において指示体の位置の軌跡が矩形の2辺を示すと判定された場合には、情報処理装置100は、図4のステップS212と同様に、矩形の2辺の判定に基づく第2方法により検出対象を認識する(S408)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0079】
また、ステップS406において指示体の位置の軌跡が矩形の2辺を示すと判定されない場合には、情報処理装置100は、図4のステップS214と同様に、指示体の位置の軌跡が線分を示すか否かを判定する(S410)。
【0080】
ステップS410において指示体の位置の軌跡が線分を示すと判定されない場合には、情報処理装置100は、ステップS400からの処理を繰り返す。
【0081】
また、ステップS410において指示体の位置の軌跡が線分を示すと判定された場合には、情報処理装置100は、図4のステップS216と同様に、線分の判定に基づく第3方法により検出対象を認識する(S412)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0082】
〔1−4〕検出対象の認識に係る処理の第4の例
図13は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第4の例を示す流れ図である。
【0083】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S500)。
【0084】
ステップS500において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S502)。ステップS502において指示体が移動したと判定された場合には、情報処理装置100は、ステップS500からの処理を繰り返す。
【0085】
ステップS502において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS204と同様に、指示体の位置の軌跡が閉領域を示すか否かを判定する(S504)。ステップS504において指示体の位置の軌跡が閉領域を示すと判定されない場合には、情報処理装置100は、ステップS500からの処理を繰り返す。
【0086】
また、ステップS504において指示体の位置の軌跡が閉領域を示すと判定された場合には、情報処理装置100は、図4のステップS206と同様に、閉領域の判定に基づく第1方法により検出対象を認識する(S506)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0087】
〔1−5〕検出対象の認識に係る処理の第5の例
図14は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第5の例を示す流れ図である。
【0088】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S600)。
【0089】
ステップS600において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S602)。ステップS602において指示体が移動したと判定された場合には、情報処理装置100は、ステップS600からの処理を繰り返す。
【0090】
ステップS602において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS208と同様に、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S604)。ステップS604において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS600からの処理を繰り返す。
【0091】
また、ステップS604において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、図4のステップS218と同様に、第4方法により検出対象を認識する(S606)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0092】
〔1−6〕検出対象の認識に係る処理の第6の例
図15は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第6の例を示す流れ図である。
【0093】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S700)。
【0094】
ステップS700において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S702)。ステップS702において指示体が移動したと判定された場合には、情報処理装置100は、ステップS700からの処理を繰り返す。
【0095】
ステップS702において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS208と同様に、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S704)。ステップS704において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS700からの処理を繰り返す。
【0096】
また、ステップS704において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、図4のステップS210と同様に、指示体の位置の軌跡が矩形の2辺を示すか否かを判定する(S706)。
【0097】
ステップS706において指示体の位置の軌跡が矩形の2辺を示すと判定されない場合には、情報処理装置100は、ステップS700からの処理を繰り返す。
【0098】
また、ステップS706において指示体の位置の軌跡が矩形の2辺を示すと判定された場合には、情報処理装置100は、図4のステップS212と同様に、矩形の2辺の判定に基づく第2方法により検出対象を認識する(S708)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0099】
〔1−7〕検出対象の認識に係る処理の第7の例
図16は、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理の第7の例を示す流れ図である。
【0100】
情報処理装置100は、図4のステップS200と同様に、撮像画像における指示体の位置を記憶する(S800)。
【0101】
ステップS800において指示体の現在位置が記憶されると、情報処理装置100は、図4のステップS202と同様に、指示体が移動したか否かを判定する(S802)。ステップS802において指示体が移動したと判定された場合には、情報処理装置100は、ステップS800からの処理を繰り返す。
【0102】
ステップS802において指示体が移動したと判定されない場合には、情報処理装置100は、図4のステップS208と同様に、移動していない(停止した)のは移動が開始されてから一度目か否かを判定する(S804)。ステップS804において移動していないのは移動が開始されてから一度目であると判定されない場合には、情報処理装置100は、ステップS800からの処理を繰り返す。
【0103】
また、ステップS804において移動していないのは移動が開始されてから一度目であると判定された場合には、情報処理装置100は、図4のステップS214と同様に、指示体の位置の軌跡が線分を示すか否かを判定する(S806)。
【0104】
ステップS806において指示体の位置の軌跡が線分を示すと判定されない場合には、情報処理装置100は、ステップS800からの処理を繰り返す。
【0105】
また、ステップS806において指示体の位置の軌跡が線分を示すと判定された場合には、情報処理装置100は、図4のステップS216と同様に、線分の判定に基づく第3方法により検出対象を認識する(S808)。そして、情報処理装置100は、検出対象の認識に係る処理を終了する。
【0106】
情報処理装置100は、指示体を認識して処理を行う場合、例えば、上記第1の例に係る処理〜第7の例に係る処理を行うことによって、検出対象を認識する。
【0107】
なお、本実施形態に係る情報処理装置100における、指示体を認識する場合における検出対象の認識に係る処理は、上記第1の例に係る処理〜第7の例に係る処理に限られない。例えば、情報処理装置100は、上述したように、第1方法〜第4方法のうちの1つ以上の任意の組合せ(15通り)によって、検出対象を認識することが可能である。
【0108】
また、情報処理装置100は、例えば、軌跡の移動方向や、指示体の種類などをさらに検出してもよい。ここで、検出された軌跡の移動方向を示す情報(データ)としては、例えば、時計回り/反時計回りで描かれた閉領域であることを示す情報や、線分が描かれた方向を示す情報などが挙げられる。また、検出された指示体の種類を示す情報(データ)としては、例えば、指(指示体の一例)の種類を示す情報や、指示装置(指示体の一例)の種類を示す情報などが挙げられる。
【0109】
情報処理装置100は、例えば、軌跡の移動方向を示す情報や指示体の種類を示す情報を、(III)の処理(実行処理)において用いることによって、オブジェクトに対応するサービスに係る処理や、オブジェクトに対応して起動するアプリケーションを切り替える。軌跡の移動方向を示す情報などを用いた(III)の処理(実行処理)の具体例については、後述する。
【0110】
情報処理装置100は、指示体を認識して処理を行う場合には、例えば上記のような処理を行うことによって、検出対象を認識する。再度図3を参照して、本実施形態に係る情報処理方法に係る処理の一例について説明する。
【0111】
〔2〕指示体を認識しない場合の処理の一例
ステップS100において指示体を認識すると判定されない場合には、情報処理装置100は、撮像対象の動きに基づいて検出対象を認識する(S106)。
【0112】
図17、図18は、本実施形態に係る情報処理装置100における、指示体を認識しない場合における検出対象の認識に係る処理の一例を説明するための説明図である。ここで、図17は、ユーザが、図2のAに示すように撮像位置が固定されていない撮像装置を用いて撮像を行う例を示している。ここで、撮像位置が固定されていない撮像装置としては、例えば、ペン型カメラや、レーザーポインタと一体化されたカメラ、ユーザの身体に装着されたカメラなどが挙げられる。
【0113】
図17に示すようにユーザが撮像装置を移動させて撮像を行う場合、当該撮像装置により撮像された撮像画像は、撮像対象が動く画像を示すこととなる。そこで、情報処理装置100は、例えば図18のPに示すように、撮像画像の中心位置などの所定の位置に対応する画像の変化に基づいて、撮像対象の動きの状態を判定する。
【0114】
より具体的には、情報処理装置100は、例えば、ユーザが撮像装置を移動させることによって描かれる、撮像画像における上記所定の位置の軌跡に基づいて、撮像対象の動きの状態を判定し、対象領域を認識する。
【0115】
ここで、情報処理装置100は、例えば、撮像画像における撮像対象のオプティカルフローを用いることによって、撮像画像における所定の位置の軌跡を求める。なお、本実施形態に係る情報処理装置100における、所定の位置の軌跡を求める方法は、上記に限られない。例えば、撮像装置が、加速度センサやジャイロセンサなどのような撮像装置の動きを検出することが可能なセンサを備えている場合には、情報処理装置100は、撮像装置から受信したセンサの検出値を示すセンサ情報に基づいて、所定の位置の軌跡を求めることも可能である。
【0116】
また、情報処理装置100は、例えば、上述した〔1〕の処理(指示体を認識する場合の処理)と同様の処理を行うことによって、軌跡に基づいて検出対象を認識する。
【0117】
情報処理装置100は、指示体を認識せずに処理を行う場合には、例えば上記のような処理を行うことによって、検出対象を認識する。
【0118】
再度図3を参照して、本実施形態に係る情報処理方法に係る処理の一例について説明する。ステップS104の処理またはステップS106の処理によって検出対象が認識されると、情報処理装置100は、検出対象の縦(垂直方向)と横(水平方向)とが両方判断できるように認識されたか否かを判定する(S108)。
【0119】
ここで、情報処理装置100は、例えば、上述した第1方法〜第4方法のいずれの方法で検出対象を認識したかに基づいて、ステップS108の判定を行う。より具体的には、情報処理装置100は、例えば、第1方法(軌跡が閉領域を示す場合における方法)、または第2方法(軌跡が矩形の2辺を示す場合における方法)により検出対象を認識した場合には、両方判断できるように認識されたと判定する。また、情報処理装置100は、例えば、第3方法(軌跡が線分を示す場合における方法)、または第4方法(その他の場合における方法)により検出対象を認識した場合には、両方判断できるように認識されなかったと判定する。なお、本実施形態に係る情報処理装置100におけるステップS108の処理が、上記に限られないことは、言うまでもない。
【0120】
ステップS108において検出対象の縦と横とが両方判断できるように認識されたと判定された場合には、情報処理装置100は、文字を検出するための検出対象文字領域を決定する(S110)。ここで、情報処理装置100は、例えば、軌跡が描く閉領域や、軌跡が描く矩形の2辺で規定される矩形に対応する領域を、検出対象文字領域として決定する。
【0121】
ステップS110において検出対象文字領域が決定されると、情報処理装置100は、例えばOCR処理などを行うことによって、検出対象文字領域内の文字を認識し(S112)、文字コードを取得する(S114)。そして、情報処理装置100は、後述するステップS116の処理を行う。
【0122】
また、ステップS108において検出対象の縦と横とが両方判断できるように認識されたと判定されない場合には、情報処理装置100は、例えばOCR処理などを行うことによって、撮像対象全体または指示位置周辺領域(例えば図8の領域AR)の文字を認識する(S118)。
【0123】
ステップS118において文字が認識されると、情報処理装置100は、指示位置に対応する文字行の文字コードを取得する(S120)。ここで、上記指示位置に対応する文字行としては、例えば、指示体の位置から垂直方向に所定の距離分離れて存在する文字行や、指示体の位置に存在する文字行が挙げられる。
【0124】
ステップS120の処理が行われると、情報処理装置100は、空白などを利用して、指示位置に対応する文字コードを取得する(S122)。
【0125】
ステップS114の処理またはステップS122の処理が行われると、情報処理装置100は、取得された文字コードが示す文字(検出されたオブジェクトの一例)をサービス、アプリケーションに使用する(S116)。
【0126】
例えば、情報処理装置100は、記憶部(後述する)などに記憶されたユーザの母国語を示す情報と、取得された文字コードとに基づいて、当該文字コードが示す文字がユーザの母国語であるか否かを判定する。そして、情報処理装置100は、取得された文字コードが示す文字がユーザの母国語でない場合には、当該文字を母国語に翻訳する。
【0127】
また、情報処理装置100は、例えば、記憶部(後述する)などに記憶されたデータベースと、取得された文字コードとに基づいて、取得された文字コードが示す文字が示す内容を判定する。例えば取得された文字コードが示す文字が地名を示す場合には、情報処理装置100は、例えば、当該地名に対応する地図や経路、天気予報などを検索し、表示画面に表示させるなどによりユーザに提示する。また、例えば取得された文字コードが示す文字が店名を示す場合には、情報処理装置100は、例えば、当該店の口コミなどの店に関する情報をユーザに提示する。
【0128】
情報処理装置100は、取得された文字コードが示す文字に基づいて、例えば上記のように、取得された文字コードが示す文字に対応するサービスに係る処理を行い、また、取得された文字コードが示す文字に対応するアプリケーションを起動し実行する。
【0129】
なお、本実施形態に係る情報処理装置100におけるステップS116の処理は、上記に限られない。例えば、情報処理装置100は、軌跡の移動方向を示す情報や指示体の種類を示す情報を用いることによって、取得された文字コードが示す文字に対応するサービスに係る処理や、取得された文字コードが示す文字に対応して起動するアプリケーションを切り替えることも可能である。
【0130】
例えば軌跡の移動方向を示す情報を用いる場合には、情報処理装置100は、例えば下記のような切り替えを実現することができる。
・取得された文字コードが示す文字が地名を示し、かつ当該文字コードが時計回り軌跡により描かれた閉領域によって取得されたものである場合には、情報処理装置100は、当該地名に対応する地図と経路とをユーザに提示する。
・取得された文字コードが示す文字が地名を示し、かつ当該文字コードが反時計回り軌跡により描かれた閉領域によって取得されたものである場合には、情報処理装置100は、例えば、当該地名に対応する場所における天気予報をユーザに提示する。
【0131】
また、情報処理装置100は、文字コードの取得に用いた検出対象の認識方法(例えば、上記第1方法〜第4方法など)に基づいて、取得された文字コードが示す文字に対応するサービスに係る処理や、取得された文字コードが示す文字に対応して起動するアプリケーションを切り替えてもよい。
【0132】
情報処理装置100は、例えば図3に示す処理を行うことによって、本実施形態に係る情報処理方法を実現する。よって、情報処理装置100は、例えば図3に示す処理を行うことによって、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。なお、本実施形態に係る情報処理方法に係る処理が、図3に示す例に限られないことは、言うまでもない。
【0133】
(本実施形態に係る情報処理装置)
次に、上述した本実施形態に係る情報処理方法に係る処理を行うことが可能な、本実施形態に係る情報処理装置100の構成の一例について、説明する。
【0134】
図19は、本実施形態に係る情報処理装置100の構成の一例を示すブロック図である。情報処理装置100は、例えば、通信部102と、制御部104とを備える。
【0135】
また、情報処理装置100は、例えば、ROM(Read Only Memory;図示せず)や、RAM(Random Access Memory;図示せず)、記憶部(図示せず)、ユーザが操作可能な操作部(図示せず)、様々な画面を表示画面に表示する表示部(図示せず)、撮像部(図示せず)などを備えていてもよい。情報処理装置100は、例えば、データの伝送路としてのバス(bus)により上記各構成要素間を接続する。
【0136】
ここで、ROM(図示せず)は、制御部104が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部104により実行されるプログラムなどを一時的に記憶する。
【0137】
記憶部(図示せず)は、情報処理装置100が備える記憶手段であり、例えば、画像データや、上記設定情報などの本実施形態に係る情報処理方法に係る処理に用いられる各種情報、アプリケーションなど様々なデータを記憶する。ここで、記憶部(図示せず)としては、例えば、ハードディスク(Hard Disk)などの磁気記録媒体や、EEPROM(Electrically Erasable and Programmable Read Only Memory)、フラッシュメモリ(flash memory)などの不揮発性メモリ(nonvolatile memory)などが挙げられる。また、記憶部(図示せず)は、情報処理装置100から着脱可能であってもよい。
【0138】
操作部(図示せず)としては、例えば、ボタンや、方向キー、ジョグダイヤルなどの回転型セレクター、あるいは、これらの組み合わせなどが挙げられる。また、情報処理装置100は、例えば、情報処理装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)と接続することもできる。
【0139】
表示部(図示せず)としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display。または、OLEDディスプレイ(Organic Light Emitting Diode display)ともよばれる。)などが挙げられる。なお、表示部(図示せず)は、例えばタッチスクリーンなどのように、表示とユーザ操作とが可能なデバイスであってもよい。また、情報処理装置100は、表示部(図示せず)の有無に関わらず、情報処理装置100の外部装置としての表示デバイス(例えば、外部ディスプレイなど)と接続することもできる。
【0140】
撮像部(図示せず)は、静止画像または動画像を撮像する役目を果たす。撮像部(図示せず)を備える場合には、情報処理装置100は、例えば、撮像部(図示せず)における撮像により生成された画像信号を処理することが可能である。
【0141】
ここで、本実施形態に係る撮像部(図示せず)としては、例えば、レンズ/撮像素子と信号処理回路とから構成される撮像デバイスが挙げられる。レンズ/撮像素子は、例えば、光学系のレンズと、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を複数用いたイメージセンサとで構成される。また、信号処理回路は、例えば、AGC(Automatic Gain Control)回路やADC(Analog to Digital Converter)を備え、撮像素子により生成されたアナログ信号をデジタル信号(画像データ)に変換し、各種信号処理を行う。信号処理回路が行う信号処理としては、例えば、White Balance補正処理、色調補正処理、ガンマ補正処理、YCbCr変換処理、エッジ強調処理などが挙げられる。
【0142】
[情報処理装置100のハードウェア構成例]
図20は、本実施形態に係る情報処理装置100のハードウェア構成の一例を示す説明図である。情報処理装置100は、例えば、MPU150と、ROM152と、RAM154と、記録媒体156と、入出力インタフェース158と、操作入力デバイス160と、表示デバイス162と、通信インタフェース164とを備える。また、情報処理装置100は、例えば、データの伝送路としてのバス166で各構成要素間を接続する。
【0143】
MPU150は、例えば、MPU(Micro Processing Unit)や、各種処理回路などで構成され情報処理装置100全体を制御する制御部104として機能する。また、MPU150は、情報処理装置100において、例えば、後述する検出対象認識部110、オブジェクト検出部112、および処理部114の役目を果たす。
【0144】
ROM152は、MPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。RAM154は、例えば、MPU150により実行されるプログラムなどを一時的に記憶する。
【0145】
記録媒体156は、記憶部(図示せず)として機能し、例えば、画像データや、本実施形態に係る情報処理方法に係る処理に用いられる各種情報、アプリケーションなど様々なデータを記憶する。ここで、記録媒体156としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリが挙げられる。また、記録媒体156は、情報処理装置100から着脱可能であってもよい。
【0146】
入出力インタフェース158は、例えば、操作入力デバイス160や、表示デバイス162を接続する。操作入力デバイス160は、操作部(図示せず)として機能し、また、表示デバイス162は、表示部(図示せず)として機能する。ここで、入出力インタフェース158としては、例えば、USB(Universal Serial Bus)端子や、DVI(Digital Visual Interface)端子、HDMI(High-Definition Multimedia Interface)端子、各種処理回路などが挙げられる。また、操作入力デバイス160は、例えば、情報処理装置100上に備えられ、情報処理装置100の内部で入出力インタフェース158と接続される。操作入力デバイス160としては、例えば、ボタン、方向キー、ジョグダイヤルなどの回転型セレクター、あるいは、これらの組み合わせなどが挙げられる。また、表示デバイス162は、例えば、情報処理装置100上に備えられ、情報処理装置100の内部で入出力インタフェース158と接続される。表示デバイス162としては、例えば、液晶ディスプレイや有機ELディスプレイなどが挙げられる。
【0147】
なお、入出力インタフェース158が、情報処理装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)や、表示デバイス、撮像デバイス(例えば、図1のAや図2のAに示す撮像装置など)などの、外部デバイスと接続することもできることは、言うまでもない。また、表示デバイス162は、例えばタッチスクリーンなど、表示とユーザ操作とが可能なデバイスであってもよい。
【0148】
通信インタフェース164は、情報処理装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、例えば、図1のAや図2のAに示す撮像装置や、サーバなどの外部装置と無線/有線で通信を行うための通信部102として機能する。ここで、通信インタフェース164としては、例えば、通信アンテナおよびRF(Radio Frequency)回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、IEEE802.11bポートおよび送受信回路(無線通信)、あるいはLAN(Local Area Network)端子および送受信回路(有線通信)などが挙げられる。また、本実施形態に係るネットワークとしては、例えば、LANやWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0149】
情報処理装置100は、例えば図20に示す構成によって、本実施形態に係る情報処理方法に係る処理を行う。なお、本実施形態に係る情報処理装置100のハードウェア構成は、図20に示す構成に限られない。
【0150】
例えば、情報処理装置100は、DSP(Digital Signal Processor)と、増幅器(アンプ)やスピーカなどから構成される音声出力デバイスとをさらに備えていてもよい。上記DSPと音声出力デバイスとをさらに備える場合には、情報処理装置100は、例えば検出されたオブジェクトに対応する情報(例えば、サービスに係る処理の実行やアプリケーションの実行により得られる情報)の内容を、聴覚的にユーザに提示することが可能となる。
【0151】
また、情報処理装置100は、例えば、レンズ/撮像素子と信号処理回路とから構成される撮像デバイスをさらに備えていてもよい。撮像デバイスを備える場合には、情報処理装置100は、撮像装置として機能し、当該撮像デバイスにより撮像された撮像画像を処理することが可能となる。
【0152】
また、情報処理装置100は、スタンドアロンで処理を行う構成である場合には、通信デバイス164を備えていなくてもよい。さらに、情報処理装置100は、操作デバイス160や表示デバイス162を備えない構成をとることも可能である。
【0153】
再度図19を参照して、情報処理装置100の構成の一例について説明する。通信部102は、情報処理装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、図1のAや図2のAに示す撮像装置や、サーバなどの外部装置と無線/有線で通信を行う。また、通信部102は、例えば制御部104により通信が制御される。ここで、通信部102としては、例えば、通信アンテナおよびRF回路や、LAN端子および送受信回路などが挙げられるが、通信部102の構成は、上記に限られない。例えば、通信部102は、USB端子および送受信回路など通信を行うことが可能な任意の規格に対応する構成や、ネットワークを介して外部装置と通信可能な任意の構成をとることができる。
【0154】
通信部102を備えることによって、情報処理装置100は、例えば、“サーバなどの外部装置に記憶されている文字認識用の辞書を参照する”、“OCR処理や、(I)の処理(検出対象認識処理)〜(III)の処理(実行処理)の一部の処理または全部の処理を、外部装置に行わせる”、“(III)の処理(実行処理)において用いるデータを外部装置から取得する”などを実現することができる。
【0155】
制御部104は、例えばMPUなどで構成され、情報処理装置100全体を制御する役目を果たす。また、制御部104は、例えば、検出対象認識部110と、オブジェクト検出部112と、処理部114とを備え、本実施形態に係る情報処理方法に係る処理を主導的に行う役目を果たす。
【0156】
検出対象認識部110は、(I)の処理(検出対象認識処理)を主導的に行う役目を果たし、撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識する。より具体的には、検出対象認識部110は、例えば、図3のステップS102〜S106を参照して示したように、撮像画像における指示体の位置の軌跡や、撮像画像における所定の位置に対応する画像の変化に基づいて、検出対象を認識する。
【0157】
オブジェクト検出部112は、(II)の処理(オブジェクト検出処理)を主導的に行う役目を果たし、認識された検出対象からオブジェクトを検出する。オブジェクト検出部112は、例えば、OCR処理や、エッジ検出やパターンマッチング、顔検出などの様々な画像処理を行うことによって、認識された検出対象から検出対象のオブジェクトを検出する。
【0158】
処理部114は、(III)の処理(実行処理)を主導的に行う役目を果たし、検出されたオブジェクトに基づいて、オブジェクトに対応する処理を行う。より具体的には、処理部114は、例えば、検出されたオブジェクトに対応するサービスに係る処理を実行し、また、検出されたオブジェクトに対応するアプリケーションを起動し実行する。
【0159】
また、処理部114は、例えば(I)の処理(検出対象認識処理)において取得される、軌跡の移動方向を示す情報や、指示体の種類を示す情報、検出対象の認識方法(例えば、上記第1方法〜第4方法など)を示す情報などをさらに用いて、実行する処理を切り替えることも可能である。つまり、処理部114は、検出されたオブジェクトおよび当該オブジェクトの検出の経過に対応する処理を行うことができる。
【0160】
制御部104は、例えば、検出対象認識部110、オブジェクト検出部112、および処理部114を備えることによって、本実施形態に係る情報処理方法に係る処理を主導的に行う。
【0161】
なお、本実施形態に係る情報処理方法に係る処理を実現するための構成は、図19に示す制御部104の構成に限られない。例えば、本実施形態に係る制御部104は、処理部114を備えない構成をとってもよい。処理部114を備えない構成をとる場合であっても、本実施形態に係る情報処理装置100は、本実施形態に係る情報処理方法に係る、(I)の処理(検出対象認識処理)および(II)の処理(オブジェクト検出処理)を行うことが可能である。よって、処理部114を備えない構成をとる場合であっても、本実施形態に係る情報処理装置100は、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【0162】
情報処理装置100は、例えば図19に示す構成によって、本実施形態に係る情報処理方法に係る処理(例えば、(I)の処理(検出対象認識処理)および(II)の処理(オブジェクト検出処理))を行う。したがって、情報処理装置100は、例えば図19に示す構成によって、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【0163】
また、情報処理装置100は、例えば図19に示す構成によって、さらに(III)の処理(実行処理)を行う。したがって、情報処理装置100は、検出されたオブジェクトに対応する処理や、検出されたオブジェクトおよび当該オブジェクトの検出の経過に対応する処理を行うことが可能であるので、ユーザの利便性をより向上させることができる。
【0164】
以上のように、本実施形態に係る情報処理装置100は、本実施形態に係る情報処理方法に係る処理として、例えば、(I)の処理(検出対象認識処理)および(II)の処理(オブジェクト検出処理)を行い、撮像画像に基づいてオブジェクトを検出する。ここで、情報処理装置100は、撮像画像に基づき指示体の動きの状態または撮像対象の動きの状態を判定することによって、検出対象を認識する。つまり、情報処理装置100のユーザは、従来の技術が用いられる場合のように、指示姿勢に係る操作と選択姿勢に係る操作という異なる複数の操作を行う必要はない。また、情報処理装置100のユーザは、例えば、差す、囲む、なぞるといった直感的で簡単な操作を行えば、情報処理装置100に当該操作に対応するオブジェクトを検出させることができるので、操作に慣れが必要ない。よって、ユーザは、従来の技術が用いられる装置を用いる場合よりも、より直感的な操作で情報処理装置100にオブジェクトを検出させることが可能となる。
【0165】
したがって、情報処理装置100は、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【0166】
また、情報処理装置100は、本実施形態に係る情報処理方法に係る処理として、さらに(III)の処理(実行処理)を行い、検出されたオブジェクトに対応する処理を行う。ここで、情報処理装置100は、検出されたオブジェクトに応じて、オブジェクトに対応するサービスに係る処理や、オブジェクトに対応して起動するアプリケーションを切り替える。また、情報処理装置100は、さらに、軌跡の移動方向を示す情報や、指示体の種類を示す情報、検出対象の認識方法(例えば、上記第1方法〜第4方法など)を示す情報などを用いることによって、サービスに係る処理や、起動するアプリケーションを切り替えることも可能である。つまり、情報処理装置100のユーザは、例えばユーザの検出対象のオブジェクトの指定の仕方や、指定に用いる指示体の種類を変えることによって、所望の処理を情報処理装置100に行わせることができる。
【0167】
したがって、情報処理装置100は、ユーザの利便性や操作性をより向上させることができる。
【0168】
また、情報処理装置100は、撮像画像に基づき処理を行うので、オブジェクトを検出する対象のメディアは、非電子メディアであってもよいし、電子メディアであってもよい。さらに、オブジェクトを検出する対象のメディアが電子メディアである場合であっても、情報処理装置100は、撮像画像に基づき処理を行うので、タッチパネル等の検出用のセンサを設ける必要はない。
【0169】
以上、本実施形態として情報処理装置100を挙げて説明したが、本実施形態は、かかる形態に限られない。本実施形態は、例えば、携帯電話やスマートフォンなどの通信装置や、映像/音楽再生装置(または映像/音楽記録再生装置)、ゲーム機、PC(Personal Computer)などのコンピュータ、デジタルカメラなどの撮像装置など、様々な機器に適用することができる。
【0170】
(本実施形態に係るプログラム)
コンピュータを、本実施形態に係る情報処理装置として機能させるためのプログラム(例えば、“(I)の処理(検出対象認識処理)および(II)の処理(オブジェクト検出処理)”や、“(I)の処理、(II)の処理、および(III)の処理(実行処理)”など、本実施形態に係る情報処理方法に係る処理を実行することが可能なプログラム)によって、ユーザの操作性の向上を図りつつ、オブジェクトを認識することができる。
【0171】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0172】
例えば、本実施形態に係る情報処理装置は、図19に示す検出対象認識部110、オブジェクト検出部112、および処理部114を個別に備える(例えば、それぞれを個別の処理回路で実現する)ことができる。
【0173】
また、上記では、例えば、コンピュータを、本実施形態に係る情報処理装置として機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本実施形態は、さらに、上記プログラムをそれぞれ記憶させた記録媒体も併せて提供することができる。
【0174】
上述した構成は、本実施形態の一例を示すものであり、当然に、本開示の技術的範囲に属するものである。
【0175】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識する検出対象認識部と、
認識された検出対象からオブジェクトを検出するオブジェクト検出部と、
を備える、情報処理装置。
(2)
前記検出対象認識部は、前記撮像画像における前記指示体の位置の軌跡に基づいて前記指示体の動きの状態を判定し、検出対象を認識する、(1)に記載の情報処理装置。
(3)
前記検出対象認識部は、前記指示体の位置の軌跡が、閉領域を示しているか、矩形の2辺を示しているか、線分を示しているかの判定結果に基づいて、検出対象を認識する、(2)に記載の情報処理装置。
(4)
前記検出対象認識部は、前記指示体の位置の軌跡が矩形の2辺を示していると判定した場合、または前記軌跡が線分を示していると判定した場合には、前記矩形の2辺または前記線分に基づき閉領域を設定して検出対象を認識する、(3)に記載の情報処理装置。
(5)
前記検出対象認識部は、前記撮像画像における所定の位置に対応する画像の変化に基づいて前記撮像対象の動きの状態を判定し、検出対象を認識する、(1)に記載の情報処理装置。
(6)
前記オブジェクト検出部は、認識された検出対象において光学文字認識を行うことによって、前記オブジェクトとして文字を検出する、(1)〜(5)のいずれか1つに記載の情報処理装置。
(7)
前記オブジェクト検出部は、
前記検出対象から前記指示体の動きまたは前記撮像対象の動きに対応する文字行を検出し、
検出された前記文字行から前記指示体の動きまたは前記撮像対象の動きに対応する文字を検出する、(6)に記載の情報処理装置。
(8)
検出されたオブジェクトに基づいて、前記オブジェクトに対応する処理を行う処理部をさらに備える、(1)〜(7)のいずれか1つに記載の情報処理装置。
(9)
撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識するステップと、
認識された検出対象からオブジェクトを検出するステップと、
を有する、情報処理方法。
【符号の説明】
【0176】
100 情報処理装置
102 通信部
104 制御部
110 検出対象認識部
112 オブジェクト検出部
114 処理部




【特許請求の範囲】
【請求項1】
撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識する検出対象認識部と、
認識された検出対象からオブジェクトを検出するオブジェクト検出部と、
を備える、情報処理装置。
【請求項2】
前記検出対象認識部は、前記撮像画像における前記指示体の位置の軌跡に基づいて前記指示体の動きの状態を判定し、検出対象を認識する、請求項1に記載の情報処理装置。
【請求項3】
前記検出対象認識部は、前記指示体の位置の軌跡が、閉領域を示しているか、矩形の2辺を示しているか、線分を示しているかの判定結果に基づいて、検出対象を認識する、請求項2に記載の情報処理装置。
【請求項4】
前記検出対象認識部は、前記指示体の位置の軌跡が矩形の2辺を示していると判定した場合、または前記軌跡が線分を示していると判定した場合には、前記矩形の2辺または前記線分に基づき閉領域を設定して検出対象を認識する、請求項3に記載の情報処理装置。
【請求項5】
前記検出対象認識部は、前記撮像画像における所定の位置に対応する画像の変化に基づいて前記撮像対象の動きの状態を判定し、検出対象を認識する、請求項1に記載の情報処理装置。
【請求項6】
前記オブジェクト検出部は、認識された検出対象において光学文字認識を行うことによって、前記オブジェクトとして文字を検出する、請求項1に記載の情報処理装置。
【請求項7】
前記オブジェクト検出部は、
前記検出対象から前記指示体の動きまたは前記撮像対象の動きに対応する文字行を検出し、
検出された前記文字行から前記指示体の動きまたは前記撮像対象の動きに対応する文字を検出する、請求項6に記載の情報処理装置。
【請求項8】
検出されたオブジェクトに基づいて、前記オブジェクトに対応する処理を行う処理部をさらに備える、請求項1に記載の情報処理装置。
【請求項9】
撮像画像に基づき検出される、指示体の動きの状態または撮像対象の動きの状態に基づいて、検出対象を認識するステップと、
認識された検出対象からオブジェクトを検出するステップと、
を有する、情報処理方法。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2013−37462(P2013−37462A)
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願番号】特願2011−171637(P2011−171637)
【出願日】平成23年8月5日(2011.8.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】