視覚障害者用空間認識装置、方法およびプログラム

【課題】本発明は、視覚系に比較して格段に分解能が低い感覚系（触覚系、聴覚系など）を介してユーザに三次元空間を高精度に認識させることが可能な新規な視覚障害者用空間認識装置を提供することを目的とする。
【解決手段】ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、全画素についての距離値を算出する。算出された複数の距離値について統計的な代表値（たとえば平均値）を導出し、当該代表値が小さくなるほど大きな出力レベルでバイブレータを駆動する。ステレオ撮像装置を動かすことに応答して、バイブレータの出力レベルが経時的に変化する。ユーザは、触覚により感受される振動レベルの経時的変化から障害物の奥行き感を認知する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、視覚障害者用空間認識装置に関し、より詳細には、ステレオ視法を利用した視覚障害者用空間認識装置に関する。
【背景技術】
【０００２】
従来、視覚障害者の支援を目的とし、ステレオ視法を利用した空間認識システムについて種々検討がなされている。特開２００２−６５７２１号公報（特許文献１）は、ユーザの前頭部に装着したステレオカメラによって撮影された画像から、ユーザの前方空間内にある物体の三次元位置を計算し、その結果に基づいてユーザが手で触れる触覚表示装置やステレオヘッドフォンを駆動することを特徴とした視覚障害者用環境認識支援装置を開示する。また、特開２００３−７９６８５号公報（特許文献２）は、ステレオカメラによって撮影された画像から得られる障害物の三次元情報を二次元情報に変換し、当該二次元情報に基づいてユーザの額に当てられたアクチュエータアレイの突起部を駆動することによって、ユーザに空間情報を体感的に伝達することを特徴とした視覚障害者歩行用補助具を開示する。
【０００３】
しかしながら、人間の聴覚系の情報伝達速度は、視覚系のそれに比較して格段に遅く、触覚系のそれは、聴覚系のそれよりもさらに格段に遅いことが知られており、上述したシステムがステレオ視法を利用して取得した正確な三次元情報に基づいて、どんなに解像度の高い情報をユーザに提供したとしても、ユーザ側の感覚系の分解能が不十分であるため、結局のところ、ユーザに空間の奥行き感を正確に認識させることができないという問題があった。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００２−６５７２１号公報
【特許文献２】特開２００３−７９６８５号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
本発明は、上記従来技術における課題に鑑みてなされたものであり、本発明は、視覚系に比較して格段に分解能が低い感覚系（聴覚系、触覚系など）を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置を提供することを目的とする。
【課題を解決するための手段】
【０００６】
本発明者は、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置につき鋭意検討した結果、空間がもつ膨大な三次元情報の中からユーザが真に必要とする情報のみを抽出し、これを触覚や聴覚などの感覚器の分解能に適合した一次元情報へと縮約する着想を得た。本発明者は、この着想に基づいて、ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する全画素についてステレオ視法を利用して算出された複数の距離値について統計的な代表値を導出し、当該代表値に基づいて出力装置を駆動するシステム構成に想到し、本発明に至ったのである。
【０００７】
すなわち、本発明によれば、主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、前記情報処理装置は、前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、前記出力信号に基づいて駆動する出力装置とを含む視覚障害者用空間認識装置が提供される。
【発明の効果】
【０００８】
上述したように、本発明によれば、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置が提供される。
【図面の簡単な説明】
【０００９】
【図１】本実施形態の視覚障害者用空間認識装置を示す図。
【図２】本実施形態における注目領域設定部の機能を説明するための概念図。
【図３】注目領域の３つのモードを示す図。
【図４】注目領域の３つのモードの活用方法を説明するための概念図。
【図５】本実施形態の視覚障害者用空間認識装置のステレオ撮像装置を示す図。
【図６】本実施形態の視覚障害者用空間認識装置の使用態様を示す図。
【図７】本実施形態の視覚障害者用空間認識装置の「スリットモード」における使用態様を示す図。
【図８】本実施形態における「スリットモード」の効用を説明するための概念図。
【図９】本実施形態における「スリットモード」の効用を説明するための概念図。
【図１０】本実施形態における「スリットモード」の効用を説明するための概念図。
【図１１】本実施形態における「スリットモード」の効用を説明するための概念図。
【図１２】本実施形態における「スリットモード」の効用を説明するための概念図。
【図１３】本実施形態における「スリットモード」の効用を説明するための概念図。
【図１４】本実施形態における「スリットモード」の効用を説明するための概念図。
【発明を実施するための形態】
【００１０】
以下、本発明を図面に示した実施の形態をもって説明するが、本発明は、図面に示した実施の形態に限定されるものではない。なお、以下に参照する各図においては、共通する要素について同じ符号を用い、適宜、その説明を省略するものとする。
【００１１】
図１は、本発明の実施形態である視覚障害者用空間認識装置１００を示す。視覚障害者用空間認識装置１００（以下、単に、空間認識装置１００という）は、ステレオ撮像装置１０と、情報処理装置２０と、出力装置３０と、設定切替手段４０とを含んで構成されている。ステレオ撮像装置１０は、視覚障害者であるユーザ（以下、単にユーザという）の進行方向上にある対象物Ｓを撮像するための手段であり、平行等位に設置される主カメラ１２および副カメラ１４を備えている。なお、主カメラ１２および副カメラ１４は、デジタル動画あるいはデジタル連続静止画を高解像度で撮像可能な３ＣＣＤカメラとして構成することが好ましい。主カメラ１２および副カメラ１４によって撮像された各画像は、情報処理装置２０に転送される。情報処理装置２０は、主カメラ１２および副カメラ１４が撮像した２つの画像に基づいて対象物Ｓとステレオ撮像装置１０（すなわち、ユーザ）との離間距離をステレオ視法を利用して算出し、当該離間距離に対応する出力信号を生成して出力装置３０に送信する。
【００１２】
本実施形態における情報処理装置２０は、汎用コンピュータとして構成することができ、適切なオペレーティング・システムの管理下で、プログラミング言語により記述されたアプリケーション・プログラムを実行することによって、以下の各機能手段を実現する。すなわち、情報処理装置２０は、ステレオ撮像装置１０から転送される画像を受領するための画像入力用インターフェース２１と、注目領域設定部２２と、ステレオマッチング部２３と、距離値算出部２４と、代表値導出部２５と、出力信号生成部２６と、設定切替部２７とを含んで構成されている。以下、上記各機能手段が果たす機能について、図１〜図４を参照して説明する。
【００１３】
図２は、本実施形態における注目領域設定部２２の機能を説明するための概念図である。本実施形態においては、まず、ステレオ撮像装置１０の主カメラ１２および副カメラ１４によって撮像された対象物Ｓの２つの画像が画像入力用インターフェース２１を介して注目領域設定部２２に入力される。図２（ａ）は、注目領域設定部２２に入力された２つの画像を示す。なお、図２においては、紙面の左側に主カメラ１２の撮像画像（以下、主画像として参照する）を示し、紙面の右側に副カメラ１４の撮像画像（以下、副画像として参照する）を示している。先に述べたように、主カメラ１２と副カメラ１４は、平行等位に設置されているため、図２（ａ）に示されるように、主画像と副画像のエピポーラ線は一致している。
【００１４】
続いて、注目領域設定部２２は、図２（ｂ）に示すように、ステレオ撮像装置１０から受領した主画像の一部の画素領域を注目領域Ｒ（破線で囲んで示す）として設定する。なお、注目領域Ｒは、その重心が主カメラの光軸（図中「+」で示す）と一致するように定義することが好ましい。本実施形態においては、形状および大きさの異なった複数の注目領域Ｒを定義し、設定によって注目領域Ｒの態様を適宜切替えることができるように構成することが好ましい。なお、この点については後に詳説する。
【００１５】
注目領域設定部２２によって設定された主画像の注目領域Ｒを構成する全ての画素情報と副画像の全画素情報は、ステレオマッチング部２３に送られる。図２（ｃ）は、ステレオマッチング部２３に送られた画素情報を概念的に示す。なお、ここで、画素情報とは、各画素の輝度値および座標を含む情報である。ステレオマッチング部２３は、注目領域Ｒを構成する全画素について、画素毎に副画像との間でステレオマッチング処理を実行し、注目領域Ｒに含まれる各画素に対応する副画像内の画素を特定する。ステレオマッチング処理は、動的計画法を用いた方法など既知の手法によって行なうことができる。ステレオマッチング部２３は、マッチング結果として、注目領域Ｒ内の各画素の座標とこれに対応する副画像内の画素の座標を対応付けた情報（以下、画素対情報として参照する）を距離値算出部２４に送る。距離値算出部２４は、画素対情報に含まれる注目領域Ｒの画素の座標および副画像の画素の座標に基づいて距離値を算出する。本実施形態において、距離値は、注目領域Ｒの各画素に写り込んだ対象物Ｓ上の位置から主カメラ１２および副カメラ１４の各レンズの中心を結ぶ線に下ろした垂線の長さまたはその近似値として定義することができる。距離値算出部２４は、注目領域Ｒの画素の座標および副画像の画素の座標に基づいて求めた両画素間の距離から偏差を減じたものを視差ｐとし、主カメラ１２および副カメラ１４の各レンズの中心間距離とカメラの焦点距離との積を視差ｐで除算することによって距離値を算出することができ、あるいは、視差ｐに適当な固定係数を乗じることによって近似値としての距離値を導出することもできる。当該距離値は、注目領域Ｒを構成する全画素について算出され、注目領域Ｒを構成する画素数と同数の距離値が計測結果として代表値導出部２５に送られる。
【００１６】
代表値導出部２５は、注目領域Ｒに含まれる膨大な空間情報を縮約するための機能部である。すなわち、代表値導出部２５は、距離値算出部２４から受領した複数の距離値について統計的な代表値を導出する。このとき、画素単位の計測誤差は自動的に吸収されることになる。本実施形態においては、代表値として、平均値、中央値、最頻値または最小値のいずれかを設定することができるように構成されている。導出された代表値は出力信号生成部２６に送られる。
【００１７】
出力信号生成部２６は、上記代表値を触覚や聴覚などの感覚器の分解能に適合した一次元情報（出力レベル）へと変換する。出力信号生成部２６には、上記代表値を出力レベルに変換するための関数が予め用意されており、代表値をパラメータとして当該関数を参照して出力レベルを決定する。本実施形態において、出力レベルは、周波数または振幅、あるいはその両方（以下、周波数等という）によって定義することができる。出力レベルを周波数等によって定義する場合には、代表値と周波数等が負の相関関係を有する関数を用意することによって、代表値が小さくなるほど高い周波数（あるいは大きな振幅）が決定される。出力信号生成部２６は、決定された周波数等に基づいて周期信号を生成する。また、上記関数に代えて、代表値と周波数等が負の相関関係を有するように対応付けられた出力信号生成用テーブルを用意し、当該テーブルを参照することによって出力レベルを決定するように構成してもよい。
【００１８】
最後に、出力装置３０が情報処理装置２０から送信された出力信号によって駆動される。本実施形態においては、出力レベルを周波数等によって定義し、出力装置３０をバイブレータ（振動器）やスピーカなどの振動子として構成することができる。たとえば、振動子としてバイブレータ（振動器）を採用した場合には、出力レベルが大きくなるほど（すなわち、代表値が小さくなるほど）高い周波数（あるいは、大きい振幅）でバイブレータが振動するため、ユーザは、触覚を介して対象物Ｓの距離感を直感的に認識することができる。また、振動子としてスピーカを採用した場合には、出力レベルが大きくなるほど（すなわち、代表値が小さくなるほど）高い周波数（あるいは、大きい振幅）の音波が発生するため、ユーザは、聴覚を介して対象物Ｓの距離感を直感的に認識することができる。その他、出力装置３０を加圧子として構成し、出力レベルを圧力によって定義することによって、対象物Ｓの距離感をユーザの圧覚を介して伝えるように構成することもできる。
【００１９】
なお、上述した代表値を出力レベルに変換するための関数（あるいは出力信号生成用テーブル）を定義する場合、出力装置３０に固有の出力レンジを代表値の範囲に割り当てることが必要になる。代表値の範囲を広くとった場合、近景から遠景までの距離感を網羅的にユーザに伝えることが可能になるが、その分、情報の解像度は低くなる。したがって、本実施形態においては、代表値の範囲について複数のモード（たとえば、「遠景モード」、「近景モード」など）を定義し、各モードを切替え可能に構成することが好ましい。たとえば、「遠景モード」においては、代表値の範囲を「１〜４ｍ」とすることによって、ユーザは、周囲の状況について、従来の白杖を使用する場合よりも広い範囲の情報を取得することが可能になる。一方、「近景モード」においては、代表値の範囲を、「０〜２ｍ」とすることによって、ユーザは、近接した環境について、高い解像度の情報を取得することが可能になる。なお、これら各モードの切替えは、ユーザが操作する設定切替手段４０からの入力に応答して設定切替部２７が出力信号生成部２６を制御することによって実行される。
【００２０】
以上、障害物の距離感をユーザに直感的に伝える実施形態について説明してきたが、本発明はこれに限定されるものではなく、たとえば、出力装置３０を音声出力装置として構成し、代表値を音の階調に対応付けて定義することよって、対象物Ｓの距離感をユーザに概念的に伝えたり、代表値に対応する距離値を予め用意された言語音声で伝えたりすることによって、対象物Ｓまでの距離をユーザに定量的に伝えることもできる。以上、本実施形態である空間認識装置１００の各構成要素について説明してきたが、続いて、本実施形態の空間認識装置１００における注目領域Ｒの設定モードについて、以下説明する。
【００２１】
本実施形態の空間認識装置１００においては、上述したように注目領域Ｒについて複数の設定モードを予め定義しておき、各モードを切り替え可能に構成することが好ましい。本実施形態においては、設定モードとして、たとえば、「広域モード」、「局所モード」および「スリットモード」という３つのモードを定義することができる。これら３つのモードは、空間認識装置１００の異なった活用方法をユーザに提供することができる。以下、図３および図４を参照しながら、上記３つのモードについて説明する。
【００２２】
図３（ａ）〜（ｃ）は、３つのモードにおける注目領域Ｒを破線で囲んで示す。図３（ａ）に示す「広域モード」においては、主画像の全域（あるいはそれに近い範囲）が注目領域Ｒとして定義され、代表値として「最小値」が定義される。また、図３（ｂ）に示す「局所モード」においては、ごく狭い領域が注目領域Ｒとして定義され、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。さらに、図３（ｃ）に示す「スリットモード」においては、アスペクト比が大きい長方形領域（すなわち、スリット状領域）が注目領域Ｒとして定義され、「局所モード」と同じく、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。なお、本実施形態においては、図３（ｃ）に示すように「スリットモード」における注目領域Ｒをその長手方向がエピポーラ線に対して平行になるように構成する他、エピポーラ線に対して垂直になるように構成したり、エピポーラ線に対して任意の角度に傾けて構成したりすることもできる。各モードの切替えは、ユーザが操作する設定切替手段４０からの入力に応答して設定切替部２７が注目領域設定部２２および代表値導出部２５を制御することによって実行される。なお、以下の説明においては、「局所モード」および「スリットモード」の代表値を「平均値」とするものとして説明する。
【００２３】
図４（ａ）〜（ｃ）は、３つのモードの活用方法を説明するための概念図である。図４（ａ）に示す「広域モード」は、障害物の存在を広く検出したい場合に利用することができる。図４（ａ）に示す例においては、注目領域Ｒには、（０．５ｍ先にある）障害物５２および（４ｍ先にある）障害物５４ならびにその他の背景が写り込んでいる。「広域モード」においては、代表値として「最小値」が設定されるため、ユーザの視野範囲内において一番近くに存在する細長い棒状の障害物５２までの離間距離に近似する距離値（０．５ｍ）が代表値として導出され、当該距離値（０．５ｍ）に基づいて出力レベルが決定される。その結果、ユーザは、自身の視野範囲内において一番近い障害物５２の存在をその距離感とともに認知することができる。但し、「広域モード」においては、その障害物がロープのようなものであっても、壁のようなものあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。また、その障害物が視野範囲内のどこにあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。したがって、「広域モード」においては、ユーザは、どのような形状の障害物がどの方向にどのような態様で存在するのかについて認知することができない。
【００２４】
一方、図４（ｂ）に示す「局所モード」は、対象物までに距離感を正確に把握したい場合に利用することができる。図４（ｂ）に示す例においては、注目領域Ｒ内の画素の大部分に（４ｍ先にある）障害物５４が写り込んでいる。「局所モード」においては、代表値として「平均値」が設定されるため、ユーザから障害物５４までの離間距離に近似する距離値（４ｍ）が代表値として導出され、当該距離値（４ｍ）に基づいて出力レベルが決定される。その結果、ユーザは、主カメラ１２の光軸上にある障害物５４の存在をその距離感とともに認知することができる。なお、代表値に対応する距離値を示す言語音声（出力信号）を生成するように出力信号生成部２６を構成した場合、「局所モード」においては、障害物５４までの距離を「４ｍです」と言うような言語音声でユーザに伝えることができる。
【００２５】
従来、ユーザは、白杖が対象物に触れる度にその感触を「点」として捉え、捉えた複数の「点」を時系列的に統合することによって、対象物の全体像を認知していたということができる。そういった意味では、本実施形態の「局所モード」は、従来の白杖と同様の利用形態が期待できるものと言えるであろう。但し、本実施形態の「局所モード」には、従来の白杖にない利点がある。すなわち、白杖の場合は、杖が届く距離範囲内にある対象物しか認知することができないのに対し、本実施形態の「局所モード」によれば、理論的にはその適用距離範囲に限定がない。したがって、ユーザは、本実施形態の空間認識装置１００を「伸縮自在の白杖」といった感覚で利用することができるであろう。
【００２６】
一方、図４（ｃ）に示す「スリットモード」においては、代表値として「平均値」が設定されるため、注目領域Ｒ内の全画素から算出される距離値の「平均値」が出力レベルに変換される。ここで、図４（ｃ）に示す例においては、注目領域Ｒ内の画素に障害物５２の一部および障害物５４の一部ならびにその他の背景が写り込んでいるため、注目領域Ｒ内の全画素から算出される距離値の「平均値」から変換された出力レベルは、障害物５２の距離感と障害物５４の距離感とその他の背景の距離感とを平準化したものになり、情報としての有意性がないようにも見える。しかしながら、本実施形態の「スリットモード」によれば、ユーザに対して障害物のより具体的なイメージ（奥行き感）を提供することができるのである。この点について、図５〜図１４を参照して、以下説明する。
【００２７】
図５は、本実施形態の空間認識装置１００のステレオ撮像装置１０を示す。なお、図５（ａ）は、ステレオ撮像装置１０の前面を示し、図５（ｂ）は、ステレオ撮像装置１０の背面を示す。図５に示す例においては、ステレオ撮像装置１０は、ユーザが片手で持って使用することを想定して細長い円柱状の筐体１１を利用して実装されている。図５（ａ）に示すように、筐体１１前面の両端近傍には、超小型３ＣＣＤカメラとして構成される主カメラ１２および副カメラ１４が適切な間隔をもって平行等位に設置されている。また、筐体１１前面の中央部には凹凸などの特殊な表面加工１５が施されており、ユーザが表面加工１５を触覚により認知することによってステレオ撮像装置１０の前面（すなわち、カメラの撮像方向）を認識することができるように構成されている。
【００２８】
一方、ステレオ撮像装置１０の背面には、図５（ｂ）に示すように、出力装置３０としてのバイブレータ３０が一体的に固設されており、ユーザがステレオ撮像装置１０を握った状態において、手の平でバイブレータ３０の振動を感じ取ることができるように構成されている。
【００２９】
さらに、図５に示す例においては、設定切替手段４０としてのスイッチ４０がステレオ撮像装置１０に一体的に形成されている。ユーザは、必要に応じて、図５（ｃ）に示すように、スイッチ４０を親指で操作することによって、上述した「広域モード」、「局所モード」、「スリットモード」、「遠景モード」、「近景モード」などの各種設定の切替えを行なうことができるように構成されている。本実施形態は、スイッチ４０の具体的な構成について特に限定するものではないが、多段式押しスイッチやユニバーサルスイッチなどを用いて、視覚障害者が現在の選択モードを触覚で確認することができるように構成することが好ましいであろう。
【００３０】
図６（ａ）は、図５に示したステレオ撮像装置１０を採用した空間認識装置１００の使用態様を示す図である。図６（ａ）に示す例においては、ユーザは、ステレオ撮像装置１０を右手に持ち、情報処理装置２０を腰ベルトに装着した状態で歩いている。ステレオ撮像装置１０と情報処理装置２０とは信号線１６で接続され、双方向通信が可能に構成されている。なお、両者の双方向通信は、無線通信によって実現してもよい。さらに、ステレオ撮像装置１０および情報処理装置２０を一つの筐体内に実装して一体化してもよい。
【００３１】
なお、本発明は、上述した実施形態に限定されるものではなく、出力装置３０をステレオ撮像装置１０と別体とすることもでき、たとえば、図６（ｂ）に示すように、ユーザの腕などにバイブレータ３０を装着することもできる。また、図６（ｂ）に示すように、出力装置３０をスピーカ装置（たとえば、ヘッドフォン等）として構成することもでき、あるいは、バイブレータとスピーカ装置を併用することもできる。さらに、図６（ｂ）に示すように、設定切替手段４０として、情報処理装置２０の筐体に点字を付した設定ボタンを備える操作パネルを形成することもできる。
【００３２】
次に、本実施形態における「スリットモード」の効用について説明する。ユーザの前に広がる生活空間には、様々な対象物が存在しうるが、その中でもユーザが特に必要とするのは、たとえば、「柱」、「壁」、「塀」、「出入口」、「通路」などに関する情報である。仮に、これらの対象物の距離感や奥行き感をユーザに高精度に認知させることができたならば、それはユーザにとって大きな助けとなるであろう。本発明者は、この点につき、これらの対象物が水平方向または鉛直方向の少なくとも一方に空間的な境界を有することに着目して、上述した「スリットモード」に想到したのである。すなわち、「スリットモード」は、対象物の水平方向あるいは鉛直方向にのびる空間的な境界の存在を選択的に検出することが可能なモードであり、ユーザはこの「スリットモード」を利用することによって、対象物についてより具体的な空間イメージを取得することができるのである。以下、この点について、図７〜図１４を参照しながら、具体的な例に基づいて説明する。
【００３３】
図７は、「スリットモード」における（図５に示した）ステレオ撮像装置１０の使用態様を示す図である。なお、図７においては、説明の便宜上、空間認識装置１００のうちステレオ撮像装置１０のみを示している。ユーザは、まず、図７（ａ）に示すように、ステレオ撮像装置１０を持った右手を進行方向に向かって突き出した状態で前に進む。この時、空間認識装置１００を「広域モード」に設定しておくことによって、ユーザは、バイブレータ３０の振動を介して進行方向に何らかの障害物が存在することを認知することができる。
【００３４】
たとえば、図８に示すように、ユーザの進行方向上に幅の狭い通路が現われたとする。図８（ａ）においては、「広域モード」に設定された主カメラの視野を実線太枠で示し、注目領域Ｒを破線枠で示している。「広域モード」においては、図８（ａ）に示すように、注目領域Ｒ内に「壁」、「通路」、および「通路の先の遠景」が写り込んでいる。「広域モード」においては、各画素について算出された距離値の「最小値」が代表値として導出されるので、ユーザに一番近接した障害物である「壁」に対応した距離値が代表値として導出され、これがバイブレータ３０の振動に変換される。ユーザは、当該振動により前方に何らかの障害物が存在することを認知して立ち止まる。
【００３５】
しかし、この時点では、その障害物の態様についてユーザはその詳細を知ることができない。そこで、ユーザは、設定切替手段４０を操作して、空間認識装置１００を「スリットモード」に切替える。図８（ｂ）においては、「スリットモード」に設定された主カメラの視野を実線太枠で示し、注目領域Ｒを破線枠で示している。ここで、注目すべきは、「スリットモード」の注目領域Ｒの長手方向がステレオ撮像装置１０の長手方向に対応している点である。このように注目領域Ｒの長手方向をステレオ撮像装置１０の長手方向に対応させることによって、ユーザは、「スリットモード」における「スリット」の向きを直感的に認識することができる。
【００３６】
空間認識装置１００を「スリットモード」に切替えたユーザは、図７（ｂ）に示すように、ステレオ撮像装置１０の長手方向を水平方向と平行にした状態で上下に動かす。図９（ａ）は、その間に撮像される複数の主画像の注目領域Ｒを丸囲み数字１〜７で時系列的に示す。なお、図９（ａ）においては、主カメラの視野については省略し、注目領域Ｒのみを破線枠で示している（以下、図１０〜図１４についても同様）。一方、図９（ｂ）は、バイブレータ３０の出力レベル（％）の時系列的な変化を示す。なお、図９に示す例においては、空間認識装置１００は、上述した「遠景モード」に設定されているものとして参照されたい（図１０および図１１についても同様）。
【００３７】
「スリットモード」においては、各注目領域Ｒを構成する各画素について算出された距離値の平均値が算出され、当該平均値に対応する出力レベルでバイブレータ３０が振動することになるが、丸囲み数字１〜７で示す注目領域Ｒに写り込んだ内容は、図９（ａ）に示すように互いに大きな差異がないため、各注目領域Ｒから導出される平均値はほぼ等しくなる。その結果、図９（ｂ）に示すように、バイブレータ３０の出力レベルは、時系列的にほとんど変化しない。ただし、この場合の「スリットモード」における平均値は、「通路の先の遠景」が写り込んでいる分、図８（ａ）に示した「広域モード」において取得された最小値よりも若干大きくなるはずなので、ユーザが感じる振動レベルは「広域モード」時のそれよりも少し弱くなる。この感覚の経時的変化によって、ユーザは、前方に壁一面が広がっているのではなく、何らかの奥行きを持った障害物が存在することを認識する。
【００３８】
次に、ユーザは、空間認識装置１００を「スリットモード」に保持したまま、図７（ｃ）に示すように、手を９０°回転させてステレオ撮像装置１０の長手方向を鉛直方向に平行にしてステレオ撮像装置１０を左右に動かす。図１０（ａ）は、その間に撮像される複数の主画像の注目領域Ｒを丸囲み数字１〜５で時系列的に示す。図１０（ａ）に示されるように、各注目領域Ｒに写り込んだ内容は、時系列的に大きく変化している。これに伴って、図１０（ｂ）に示すようにバイブレータ３０の出力レベルは、時系列的に大きく変化する。ユーザは、バイブレータ３０の振動レベルの経時的変化から、前方に２つの壁が存在し、さらに、その２つの壁の間に少なくとも４ｍ以上の奥行きが延びていることを推定する。すなわち、ユーザは、前方に狭い通路が存在することを認識することができる。
【００３９】
ユーザは、空間認識装置１００を「スリットモード」に保持したまま、図７（ｄ）に示すように、同様にステレオ撮像装置１０を左右に動かしながら、通路の中を進んでいく。図１１（ａ）は、その間に撮像される複数の主画像の注目領域Ｒを丸囲み数字１〜８で時系列的に示す。図１１（ａ）に示されるように、各注目領域Ｒに写り込んだ内容の変化に応じて、バイブレータ３０の出力レベルは、図１１（ｂ）に示すように時系列的に変化する。ユーザは、バイブレータ３０の振動レベルの経時的変化から通路の幅を認識することができ、安全に前進することができる。
【００４０】
さらに、図１２〜図１４を参照して、「スリットモード」のさらなる効用について説明する。なお、図１２〜図１４に示す例においては、空間認識装置１００は、上述した「近景モード」に設定されているものとして参照されたい。
【００４１】
たとえば、ユーザの進行方向上に図１２に示すような障害物が現われたとする。この場合、ユーザが、図１２（ａ）に示すように、ステレオ撮像装置１０を左右に動かした場合であっても、図１２（ｂ）に示すように、ステレオ撮像装置１０を上下に動かした場合であっても、バイブレータ３０の出力レベル（すなわち、ユーザが感じる振動レベル）は、経時的に変化しない。このことに基づいて、ユーザは、前方に壁一面がはだかっていることを認識することができる。
【００４２】
次に、ユーザの進行方向上に図１３に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置１０を左右に動かした場合には、図１３（ａ）に示すように、バイブレータ３０の出力レベル（ユーザが感じる振動レベル）は、経時的に変化しないが、ステレオ撮像装置１０を上下に動かした場合には、バイブレータ３０の出力レベル（ユーザが感じる振動レベル）は、図１３（ｂ）に示す態様で経時的に変化する。ユーザは、ステレオ撮像装置１０を左右に動かした場合に感じる感覚の経時的変化と上下に動かした場合に感じる感覚の経時的変化の違いに基づいて、前方に急傾斜の坂がはだかっていることを認識することができる。
【００４３】
次に、ユーザの進行方向上に図１４に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置１０を左右に動かした場合には、図１４（ａ）に示すように、バイブレータ３０の出力レベル（ユーザが感じる振動レベル）は、経時的に変化しないが、ステレオ撮像装置１０を上下に動かした場合には、バイブレータ３０の出力レベル（ユーザが感じる振動レベル）は、図１４（ｂ）に示す態様で経時的に変化する。ここで、注目すべきは、図１４（ｂ）に示した出力レベルの経時的変化と図１３（ｂ）に示した急傾斜の坂のときの出力レベルの経時的変化の態様の違いである。ユーザは、この２つの経時的変化の態様の違いを感覚的に検知することによって、前方にはだかっている障害物が急傾斜の坂ではなく、階段であることを認識することができるであろう。
【００４４】
以上、説明したように、本実施形態の「スリットモード」によれば、ユーザは、ステレオ撮像装置１０を上下、左右に動かすことに伴って触覚により感受される振動レベルの経時的変化に基づいて、水平方向あるいは鉛直方向に延びる空間的な境界の存在をその距離感とともに認知することができ、その結果、空間をより正確に認識することができるのである。
【００４５】
以上、本発明について実施形態をもって説明してきたが、本発明は上述した実施形態に限定されるものではない。上述した実施形態においては、注目領域の形状および大きさについて予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、本発明においては、別の実施形態として、ダイヤル式などの設定切替手段を採用し、注目領域の高さおよび幅を調整自在に構成することもできる。さらに、上述した実施形態においては、出力装置の出力レンジを割り当てる代表値の範囲について予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、同じく、ダイヤル式などの設定切替手段を採用して任意の代表値の範囲を設定自在に構成することもできる。その他、当業者が推考しうる実施態様の範囲内において、本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
【符号の説明】
【００４６】
１０…ステレオ撮像装置
１１…筐体
１２…主カメラ
１４…副カメラ
１５…表面加工
１６…信号線
２０…情報処理装置
２１…画像入力用インターフェース
２２…注目領域設定部
２３…ステレオマッチング部
２４…距離値算出部
２５…代表値導出部
２６…出力信号生成部
２７…設定切替部
３０…出力装置（バイブレータ）
４０…設定切替手段（スイッチ）
５２，５４…障害物
１００…視覚障害者用空間認識装置

【特許請求の範囲】
【請求項１】
主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、
前記情報処理装置は、
前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、
算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、
前記出力信号に基づいて駆動する出力装置と
を含む視覚障害者用空間認識装置。
【請求項２】
前記注目領域は、スリット状領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項１に記載の視覚障害者用空間認識装置。
【請求項３】
前記注目領域は、狭小領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項１に記載の視覚障害者用空間認識装置。
【請求項４】
前記注目領域は、前記主画像の全域として定義され、前記代表値は、最小値である、請求項１に記載の視覚障害者用空間認識装置。
【請求項５】
前記注目領域をスリット状領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択するスリットモード、前記注目領域を狭小領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択する局所モード、および、前記注目領域を前記主画像の全域として定義し前記代表値を最小値とする広域モードからなる３つの設定を切替えるための設定切替部をさらに備える、請求項１に記載の視覚障害者用空間認識装置。
【請求項６】
前記注目領域は、その重心が前記主カメラの光軸に一致するように定義される、請求項１〜５のいずれか１項に記載の視覚障害者用空間認識装置。
【請求項７】
前記出力装置は、振動子である、請求項１〜６のいずれか１項に記載の視覚障害者用空間認識装置。
【請求項８】
前記振動子は、振動器またはスピーカ装置である、請求項７に記載の視覚障害者用空間認識装置。
【請求項９】
前記ステレオ撮像装置と前記出力装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項１〜８のいずれか１項に記載の視覚障害者用空間認識装置。
【請求項１０】
前記ステレオ撮像装置と前記出力装置と前記情報処理装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項１〜８のいずれか１項に記載の視覚障害者用空間認識装置。
【請求項１１】
ユーザに空間を認識させるためにコンピュータに出力装置の駆動を実行させるコンピュータ実行可能な方法であって、前記方法は、前記コンピュータに対し、
主カメラおよび副カメラを含むステレオ撮像装置の前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する機能手段と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出する機能手段と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する機能手段と、算出された複数の前記距離値について統計的な代表値を導出する機能手段と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する機能手段と、
前記出力信号に基づいて前記出力装置を駆動する機能手段と、
を実現する方法。
【請求項１２】
請求項１１に記載の各機能手段を実現させるためのコンピュータ実行可能なプログラム。

【図１】