視覚障害者用空間認識装置、方法およびプログラム
【課題】本発明は、視覚系に比較して格段に分解能が低い感覚系(触覚系、聴覚系など)を介してユーザに三次元空間を高精度に認識させることが可能な新規な視覚障害者用空間認識装置を提供することを目的とする。
【解決手段】ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、全画素についての距離値を算出する。算出された複数の距離値について統計的な代表値(たとえば平均値)を導出し、当該代表値が小さくなるほど大きな出力レベルでバイブレータを駆動する。ステレオ撮像装置を動かすことに応答して、バイブレータの出力レベルが経時的に変化する。ユーザは、触覚により感受される振動レベルの経時的変化から障害物の奥行き感を認知する。
【解決手段】ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、全画素についての距離値を算出する。算出された複数の距離値について統計的な代表値(たとえば平均値)を導出し、当該代表値が小さくなるほど大きな出力レベルでバイブレータを駆動する。ステレオ撮像装置を動かすことに応答して、バイブレータの出力レベルが経時的に変化する。ユーザは、触覚により感受される振動レベルの経時的変化から障害物の奥行き感を認知する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、視覚障害者用空間認識装置に関し、より詳細には、ステレオ視法を利用した視覚障害者用空間認識装置に関する。
【背景技術】
【0002】
従来、視覚障害者の支援を目的とし、ステレオ視法を利用した空間認識システムについて種々検討がなされている。特開2002−65721号公報(特許文献1)は、ユーザの前頭部に装着したステレオカメラによって撮影された画像から、ユーザの前方空間内にある物体の三次元位置を計算し、その結果に基づいてユーザが手で触れる触覚表示装置やステレオヘッドフォンを駆動することを特徴とした視覚障害者用環境認識支援装置を開示する。また、特開2003−79685号公報(特許文献2)は、ステレオカメラによって撮影された画像から得られる障害物の三次元情報を二次元情報に変換し、当該二次元情報に基づいてユーザの額に当てられたアクチュエータアレイの突起部を駆動することによって、ユーザに空間情報を体感的に伝達することを特徴とした視覚障害者歩行用補助具を開示する。
【0003】
しかしながら、人間の聴覚系の情報伝達速度は、視覚系のそれに比較して格段に遅く、触覚系のそれは、聴覚系のそれよりもさらに格段に遅いことが知られており、上述したシステムがステレオ視法を利用して取得した正確な三次元情報に基づいて、どんなに解像度の高い情報をユーザに提供したとしても、ユーザ側の感覚系の分解能が不十分であるため、結局のところ、ユーザに空間の奥行き感を正確に認識させることができないという問題があった。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−65721号公報
【特許文献2】特開2003−79685号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記従来技術における課題に鑑みてなされたものであり、本発明は、視覚系に比較して格段に分解能が低い感覚系(聴覚系、触覚系など)を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明者は、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置につき鋭意検討した結果、空間がもつ膨大な三次元情報の中からユーザが真に必要とする情報のみを抽出し、これを触覚や聴覚などの感覚器の分解能に適合した一次元情報へと縮約する着想を得た。本発明者は、この着想に基づいて、ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する全画素についてステレオ視法を利用して算出された複数の距離値について統計的な代表値を導出し、当該代表値に基づいて出力装置を駆動するシステム構成に想到し、本発明に至ったのである。
【0007】
すなわち、本発明によれば、主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、前記情報処理装置は、前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、前記出力信号に基づいて駆動する出力装置とを含む視覚障害者用空間認識装置が提供される。
【発明の効果】
【0008】
上述したように、本発明によれば、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置が提供される。
【図面の簡単な説明】
【0009】
【図1】本実施形態の視覚障害者用空間認識装置を示す図。
【図2】本実施形態における注目領域設定部の機能を説明するための概念図。
【図3】注目領域の3つのモードを示す図。
【図4】注目領域の3つのモードの活用方法を説明するための概念図。
【図5】本実施形態の視覚障害者用空間認識装置のステレオ撮像装置を示す図。
【図6】本実施形態の視覚障害者用空間認識装置の使用態様を示す図。
【図7】本実施形態の視覚障害者用空間認識装置の「スリットモード」における使用態様を示す図。
【図8】本実施形態における「スリットモード」の効用を説明するための概念図。
【図9】本実施形態における「スリットモード」の効用を説明するための概念図。
【図10】本実施形態における「スリットモード」の効用を説明するための概念図。
【図11】本実施形態における「スリットモード」の効用を説明するための概念図。
【図12】本実施形態における「スリットモード」の効用を説明するための概念図。
【図13】本実施形態における「スリットモード」の効用を説明するための概念図。
【図14】本実施形態における「スリットモード」の効用を説明するための概念図。
【発明を実施するための形態】
【0010】
以下、本発明を図面に示した実施の形態をもって説明するが、本発明は、図面に示した実施の形態に限定されるものではない。なお、以下に参照する各図においては、共通する要素について同じ符号を用い、適宜、その説明を省略するものとする。
【0011】
図1は、本発明の実施形態である視覚障害者用空間認識装置100を示す。視覚障害者用空間認識装置100(以下、単に、空間認識装置100という)は、ステレオ撮像装置10と、情報処理装置20と、出力装置30と、設定切替手段40とを含んで構成されている。ステレオ撮像装置10は、視覚障害者であるユーザ(以下、単にユーザという)の進行方向上にある対象物Sを撮像するための手段であり、平行等位に設置される主カメラ12および副カメラ14を備えている。なお、主カメラ12および副カメラ14は、デジタル動画あるいはデジタル連続静止画を高解像度で撮像可能な3CCDカメラとして構成することが好ましい。主カメラ12および副カメラ14によって撮像された各画像は、情報処理装置20に転送される。情報処理装置20は、主カメラ12および副カメラ14が撮像した2つの画像に基づいて対象物Sとステレオ撮像装置10(すなわち、ユーザ)との離間距離をステレオ視法を利用して算出し、当該離間距離に対応する出力信号を生成して出力装置30に送信する。
【0012】
本実施形態における情報処理装置20は、汎用コンピュータとして構成することができ、適切なオペレーティング・システムの管理下で、プログラミング言語により記述されたアプリケーション・プログラムを実行することによって、以下の各機能手段を実現する。すなわち、情報処理装置20は、ステレオ撮像装置10から転送される画像を受領するための画像入力用インターフェース21と、注目領域設定部22と、ステレオマッチング部23と、距離値算出部24と、代表値導出部25と、出力信号生成部26と、設定切替部27とを含んで構成されている。以下、上記各機能手段が果たす機能について、図1〜図4を参照して説明する。
【0013】
図2は、本実施形態における注目領域設定部22の機能を説明するための概念図である。本実施形態においては、まず、ステレオ撮像装置10の主カメラ12および副カメラ14によって撮像された対象物Sの2つの画像が画像入力用インターフェース21を介して注目領域設定部22に入力される。図2(a)は、注目領域設定部22に入力された2つの画像を示す。なお、図2においては、紙面の左側に主カメラ12の撮像画像(以下、主画像として参照する)を示し、紙面の右側に副カメラ14の撮像画像(以下、副画像として参照する)を示している。先に述べたように、主カメラ12と副カメラ14は、平行等位に設置されているため、図2(a)に示されるように、主画像と副画像のエピポーラ線は一致している。
【0014】
続いて、注目領域設定部22は、図2(b)に示すように、ステレオ撮像装置10から受領した主画像の一部の画素領域を注目領域R(破線で囲んで示す)として設定する。なお、注目領域Rは、その重心が主カメラの光軸(図中「+」で示す)と一致するように定義することが好ましい。本実施形態においては、形状および大きさの異なった複数の注目領域Rを定義し、設定によって注目領域Rの態様を適宜切替えることができるように構成することが好ましい。なお、この点については後に詳説する。
【0015】
注目領域設定部22によって設定された主画像の注目領域Rを構成する全ての画素情報と副画像の全画素情報は、ステレオマッチング部23に送られる。図2(c)は、ステレオマッチング部23に送られた画素情報を概念的に示す。なお、ここで、画素情報とは、各画素の輝度値および座標を含む情報である。ステレオマッチング部23は、注目領域Rを構成する全画素について、画素毎に副画像との間でステレオマッチング処理を実行し、注目領域Rに含まれる各画素に対応する副画像内の画素を特定する。ステレオマッチング処理は、動的計画法を用いた方法など既知の手法によって行なうことができる。ステレオマッチング部23は、マッチング結果として、注目領域R内の各画素の座標とこれに対応する副画像内の画素の座標を対応付けた情報(以下、画素対情報として参照する)を距離値算出部24に送る。距離値算出部24は、画素対情報に含まれる注目領域Rの画素の座標および副画像の画素の座標に基づいて距離値を算出する。本実施形態において、距離値は、注目領域Rの各画素に写り込んだ対象物S上の位置から主カメラ12および副カメラ14の各レンズの中心を結ぶ線に下ろした垂線の長さまたはその近似値として定義することができる。距離値算出部24は、注目領域Rの画素の座標および副画像の画素の座標に基づいて求めた両画素間の距離から偏差を減じたものを視差pとし、主カメラ12および副カメラ14の各レンズの中心間距離とカメラの焦点距離との積を視差pで除算することによって距離値を算出することができ、あるいは、視差pに適当な固定係数を乗じることによって近似値としての距離値を導出することもできる。当該距離値は、注目領域Rを構成する全画素について算出され、注目領域Rを構成する画素数と同数の距離値が計測結果として代表値導出部25に送られる。
【0016】
代表値導出部25は、注目領域Rに含まれる膨大な空間情報を縮約するための機能部である。すなわち、代表値導出部25は、距離値算出部24から受領した複数の距離値について統計的な代表値を導出する。このとき、画素単位の計測誤差は自動的に吸収されることになる。本実施形態においては、代表値として、平均値、中央値、最頻値または最小値のいずれかを設定することができるように構成されている。導出された代表値は出力信号生成部26に送られる。
【0017】
出力信号生成部26は、上記代表値を触覚や聴覚などの感覚器の分解能に適合した一次元情報(出力レベル)へと変換する。出力信号生成部26には、上記代表値を出力レベルに変換するための関数が予め用意されており、代表値をパラメータとして当該関数を参照して出力レベルを決定する。本実施形態において、出力レベルは、周波数または振幅、あるいはその両方(以下、周波数等という)によって定義することができる。出力レベルを周波数等によって定義する場合には、代表値と周波数等が負の相関関係を有する関数を用意することによって、代表値が小さくなるほど高い周波数(あるいは大きな振幅)が決定される。出力信号生成部26は、決定された周波数等に基づいて周期信号を生成する。また、上記関数に代えて、代表値と周波数等が負の相関関係を有するように対応付けられた出力信号生成用テーブルを用意し、当該テーブルを参照することによって出力レベルを決定するように構成してもよい。
【0018】
最後に、出力装置30が情報処理装置20から送信された出力信号によって駆動される。本実施形態においては、出力レベルを周波数等によって定義し、出力装置30をバイブレータ(振動器)やスピーカなどの振動子として構成することができる。たとえば、振動子としてバイブレータ(振動器)を採用した場合には、出力レベルが大きくなるほど(すなわち、代表値が小さくなるほど)高い周波数(あるいは、大きい振幅)でバイブレータが振動するため、ユーザは、触覚を介して対象物Sの距離感を直感的に認識することができる。また、振動子としてスピーカを採用した場合には、出力レベルが大きくなるほど(すなわち、代表値が小さくなるほど)高い周波数(あるいは、大きい振幅)の音波が発生するため、ユーザは、聴覚を介して対象物Sの距離感を直感的に認識することができる。その他、出力装置30を加圧子として構成し、出力レベルを圧力によって定義することによって、対象物Sの距離感をユーザの圧覚を介して伝えるように構成することもできる。
【0019】
なお、上述した代表値を出力レベルに変換するための関数(あるいは出力信号生成用テーブル)を定義する場合、出力装置30に固有の出力レンジを代表値の範囲に割り当てることが必要になる。代表値の範囲を広くとった場合、近景から遠景までの距離感を網羅的にユーザに伝えることが可能になるが、その分、情報の解像度は低くなる。したがって、本実施形態においては、代表値の範囲について複数のモード(たとえば、「遠景モード」、「近景モード」など)を定義し、各モードを切替え可能に構成することが好ましい。たとえば、「遠景モード」においては、代表値の範囲を「1〜4m」とすることによって、ユーザは、周囲の状況について、従来の白杖を使用する場合よりも広い範囲の情報を取得することが可能になる。一方、「近景モード」においては、代表値の範囲を、「0〜2m」とすることによって、ユーザは、近接した環境について、高い解像度の情報を取得することが可能になる。なお、これら各モードの切替えは、ユーザが操作する設定切替手段40からの入力に応答して設定切替部27が出力信号生成部26を制御することによって実行される。
【0020】
以上、障害物の距離感をユーザに直感的に伝える実施形態について説明してきたが、本発明はこれに限定されるものではなく、たとえば、出力装置30を音声出力装置として構成し、代表値を音の階調に対応付けて定義することよって、対象物Sの距離感をユーザに概念的に伝えたり、代表値に対応する距離値を予め用意された言語音声で伝えたりすることによって、対象物Sまでの距離をユーザに定量的に伝えることもできる。以上、本実施形態である空間認識装置100の各構成要素について説明してきたが、続いて、本実施形態の空間認識装置100における注目領域Rの設定モードについて、以下説明する。
【0021】
本実施形態の空間認識装置100においては、上述したように注目領域Rについて複数の設定モードを予め定義しておき、各モードを切り替え可能に構成することが好ましい。本実施形態においては、設定モードとして、たとえば、「広域モード」、「局所モード」および「スリットモード」という3つのモードを定義することができる。これら3つのモードは、空間認識装置100の異なった活用方法をユーザに提供することができる。以下、図3および図4を参照しながら、上記3つのモードについて説明する。
【0022】
図3(a)〜(c)は、3つのモードにおける注目領域Rを破線で囲んで示す。図3(a)に示す「広域モード」においては、主画像の全域(あるいはそれに近い範囲)が注目領域Rとして定義され、代表値として「最小値」が定義される。また、図3(b)に示す「局所モード」においては、ごく狭い領域が注目領域Rとして定義され、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。さらに、図3(c)に示す「スリットモード」においては、アスペクト比が大きい長方形領域(すなわち、スリット状領域)が注目領域Rとして定義され、「局所モード」と同じく、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。なお、本実施形態においては、図3(c)に示すように「スリットモード」における注目領域Rをその長手方向がエピポーラ線に対して平行になるように構成する他、エピポーラ線に対して垂直になるように構成したり、エピポーラ線に対して任意の角度に傾けて構成したりすることもできる。各モードの切替えは、ユーザが操作する設定切替手段40からの入力に応答して設定切替部27が注目領域設定部22および代表値導出部25を制御することによって実行される。なお、以下の説明においては、「局所モード」および「スリットモード」の代表値を「平均値」とするものとして説明する。
【0023】
図4(a)〜(c)は、3つのモードの活用方法を説明するための概念図である。図4(a)に示す「広域モード」は、障害物の存在を広く検出したい場合に利用することができる。図4(a)に示す例においては、注目領域Rには、(0.5m先にある)障害物52および(4m先にある)障害物54ならびにその他の背景が写り込んでいる。「広域モード」においては、代表値として「最小値」が設定されるため、ユーザの視野範囲内において一番近くに存在する細長い棒状の障害物52までの離間距離に近似する距離値(0.5m)が代表値として導出され、当該距離値(0.5m)に基づいて出力レベルが決定される。その結果、ユーザは、自身の視野範囲内において一番近い障害物52の存在をその距離感とともに認知することができる。但し、「広域モード」においては、その障害物がロープのようなものであっても、壁のようなものあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。また、その障害物が視野範囲内のどこにあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。したがって、「広域モード」においては、ユーザは、どのような形状の障害物がどの方向にどのような態様で存在するのかについて認知することができない。
【0024】
一方、図4(b)に示す「局所モード」は、対象物までに距離感を正確に把握したい場合に利用することができる。図4(b)に示す例においては、注目領域R内の画素の大部分に(4m先にある)障害物54が写り込んでいる。「局所モード」においては、代表値として「平均値」が設定されるため、ユーザから障害物54までの離間距離に近似する距離値(4m)が代表値として導出され、当該距離値(4m)に基づいて出力レベルが決定される。その結果、ユーザは、主カメラ12の光軸上にある障害物54の存在をその距離感とともに認知することができる。なお、代表値に対応する距離値を示す言語音声(出力信号)を生成するように出力信号生成部26を構成した場合、「局所モード」においては、障害物54までの距離を「4mです」と言うような言語音声でユーザに伝えることができる。
【0025】
従来、ユーザは、白杖が対象物に触れる度にその感触を「点」として捉え、捉えた複数の「点」を時系列的に統合することによって、対象物の全体像を認知していたということができる。そういった意味では、本実施形態の「局所モード」は、従来の白杖と同様の利用形態が期待できるものと言えるであろう。但し、本実施形態の「局所モード」には、従来の白杖にない利点がある。すなわち、白杖の場合は、杖が届く距離範囲内にある対象物しか認知することができないのに対し、本実施形態の「局所モード」によれば、理論的にはその適用距離範囲に限定がない。したがって、ユーザは、本実施形態の空間認識装置100を「伸縮自在の白杖」といった感覚で利用することができるであろう。
【0026】
一方、図4(c)に示す「スリットモード」においては、代表値として「平均値」が設定されるため、注目領域R内の全画素から算出される距離値の「平均値」が出力レベルに変換される。ここで、図4(c)に示す例においては、注目領域R内の画素に障害物52の一部および障害物54の一部ならびにその他の背景が写り込んでいるため、注目領域R内の全画素から算出される距離値の「平均値」から変換された出力レベルは、障害物52の距離感と障害物54の距離感とその他の背景の距離感とを平準化したものになり、情報としての有意性がないようにも見える。しかしながら、本実施形態の「スリットモード」によれば、ユーザに対して障害物のより具体的なイメージ(奥行き感)を提供することができるのである。この点について、図5〜図14を参照して、以下説明する。
【0027】
図5は、本実施形態の空間認識装置100のステレオ撮像装置10を示す。なお、図5(a)は、ステレオ撮像装置10の前面を示し、図5(b)は、ステレオ撮像装置10の背面を示す。図5に示す例においては、ステレオ撮像装置10は、ユーザが片手で持って使用することを想定して細長い円柱状の筐体11を利用して実装されている。図5(a)に示すように、筐体11前面の両端近傍には、超小型3CCDカメラとして構成される主カメラ12および副カメラ14が適切な間隔をもって平行等位に設置されている。また、筐体11前面の中央部には凹凸などの特殊な表面加工15が施されており、ユーザが表面加工15を触覚により認知することによってステレオ撮像装置10の前面(すなわち、カメラの撮像方向)を認識することができるように構成されている。
【0028】
一方、ステレオ撮像装置10の背面には、図5(b)に示すように、出力装置30としてのバイブレータ30が一体的に固設されており、ユーザがステレオ撮像装置10を握った状態において、手の平でバイブレータ30の振動を感じ取ることができるように構成されている。
【0029】
さらに、図5に示す例においては、設定切替手段40としてのスイッチ40がステレオ撮像装置10に一体的に形成されている。ユーザは、必要に応じて、図5(c)に示すように、スイッチ40を親指で操作することによって、上述した「広域モード」、「局所モード」、「スリットモード」、「遠景モード」、「近景モード」などの各種設定の切替えを行なうことができるように構成されている。本実施形態は、スイッチ40の具体的な構成について特に限定するものではないが、多段式押しスイッチやユニバーサルスイッチなどを用いて、視覚障害者が現在の選択モードを触覚で確認することができるように構成することが好ましいであろう。
【0030】
図6(a)は、図5に示したステレオ撮像装置10を採用した空間認識装置100の使用態様を示す図である。図6(a)に示す例においては、ユーザは、ステレオ撮像装置10を右手に持ち、情報処理装置20を腰ベルトに装着した状態で歩いている。ステレオ撮像装置10と情報処理装置20とは信号線16で接続され、双方向通信が可能に構成されている。なお、両者の双方向通信は、無線通信によって実現してもよい。さらに、ステレオ撮像装置10および情報処理装置20を一つの筐体内に実装して一体化してもよい。
【0031】
なお、本発明は、上述した実施形態に限定されるものではなく、出力装置30をステレオ撮像装置10と別体とすることもでき、たとえば、図6(b)に示すように、ユーザの腕などにバイブレータ30を装着することもできる。また、図6(b)に示すように、出力装置30をスピーカ装置(たとえば、ヘッドフォン等)として構成することもでき、あるいは、バイブレータとスピーカ装置を併用することもできる。さらに、図6(b)に示すように、設定切替手段40として、情報処理装置20の筐体に点字を付した設定ボタンを備える操作パネルを形成することもできる。
【0032】
次に、本実施形態における「スリットモード」の効用について説明する。ユーザの前に広がる生活空間には、様々な対象物が存在しうるが、その中でもユーザが特に必要とするのは、たとえば、「柱」、「壁」、「塀」、「出入口」、「通路」などに関する情報である。仮に、これらの対象物の距離感や奥行き感をユーザに高精度に認知させることができたならば、それはユーザにとって大きな助けとなるであろう。本発明者は、この点につき、これらの対象物が水平方向または鉛直方向の少なくとも一方に空間的な境界を有することに着目して、上述した「スリットモード」に想到したのである。すなわち、「スリットモード」は、対象物の水平方向あるいは鉛直方向にのびる空間的な境界の存在を選択的に検出することが可能なモードであり、ユーザはこの「スリットモード」を利用することによって、対象物についてより具体的な空間イメージを取得することができるのである。以下、この点について、図7〜図14を参照しながら、具体的な例に基づいて説明する。
【0033】
図7は、「スリットモード」における(図5に示した)ステレオ撮像装置10の使用態様を示す図である。なお、図7においては、説明の便宜上、空間認識装置100のうちステレオ撮像装置10のみを示している。ユーザは、まず、図7(a)に示すように、ステレオ撮像装置10を持った右手を進行方向に向かって突き出した状態で前に進む。この時、空間認識装置100を「広域モード」に設定しておくことによって、ユーザは、バイブレータ30の振動を介して進行方向に何らかの障害物が存在することを認知することができる。
【0034】
たとえば、図8に示すように、ユーザの進行方向上に幅の狭い通路が現われたとする。図8(a)においては、「広域モード」に設定された主カメラの視野を実線太枠で示し、注目領域Rを破線枠で示している。「広域モード」においては、図8(a)に示すように、注目領域R内に「壁」、「通路」、および「通路の先の遠景」が写り込んでいる。「広域モード」においては、各画素について算出された距離値の「最小値」が代表値として導出されるので、ユーザに一番近接した障害物である「壁」に対応した距離値が代表値として導出され、これがバイブレータ30の振動に変換される。ユーザは、当該振動により前方に何らかの障害物が存在することを認知して立ち止まる。
【0035】
しかし、この時点では、その障害物の態様についてユーザはその詳細を知ることができない。そこで、ユーザは、設定切替手段40を操作して、空間認識装置100を「スリットモード」に切替える。図8(b)においては、「スリットモード」に設定された主カメラの視野を実線太枠で示し、注目領域Rを破線枠で示している。ここで、注目すべきは、「スリットモード」の注目領域Rの長手方向がステレオ撮像装置10の長手方向に対応している点である。このように注目領域Rの長手方向をステレオ撮像装置10の長手方向に対応させることによって、ユーザは、「スリットモード」における「スリット」の向きを直感的に認識することができる。
【0036】
空間認識装置100を「スリットモード」に切替えたユーザは、図7(b)に示すように、ステレオ撮像装置10の長手方向を水平方向と平行にした状態で上下に動かす。図9(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜7で時系列的に示す。なお、図9(a)においては、主カメラの視野については省略し、注目領域Rのみを破線枠で示している(以下、図10〜図14についても同様)。一方、図9(b)は、バイブレータ30の出力レベル(%)の時系列的な変化を示す。なお、図9に示す例においては、空間認識装置100は、上述した「遠景モード」に設定されているものとして参照されたい(図10および図11についても同様)。
【0037】
「スリットモード」においては、各注目領域Rを構成する各画素について算出された距離値の平均値が算出され、当該平均値に対応する出力レベルでバイブレータ30が振動することになるが、丸囲み数字1〜7で示す注目領域Rに写り込んだ内容は、図9(a)に示すように互いに大きな差異がないため、各注目領域Rから導出される平均値はほぼ等しくなる。その結果、図9(b)に示すように、バイブレータ30の出力レベルは、時系列的にほとんど変化しない。ただし、この場合の「スリットモード」における平均値は、「通路の先の遠景」が写り込んでいる分、図8(a)に示した「広域モード」において取得された最小値よりも若干大きくなるはずなので、ユーザが感じる振動レベルは「広域モード」時のそれよりも少し弱くなる。この感覚の経時的変化によって、ユーザは、前方に壁一面が広がっているのではなく、何らかの奥行きを持った障害物が存在することを認識する。
【0038】
次に、ユーザは、空間認識装置100を「スリットモード」に保持したまま、図7(c)に示すように、手を90°回転させてステレオ撮像装置10の長手方向を鉛直方向に平行にしてステレオ撮像装置10を左右に動かす。図10(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜5で時系列的に示す。図10(a)に示されるように、各注目領域Rに写り込んだ内容は、時系列的に大きく変化している。これに伴って、図10(b)に示すようにバイブレータ30の出力レベルは、時系列的に大きく変化する。ユーザは、バイブレータ30の振動レベルの経時的変化から、前方に2つの壁が存在し、さらに、その2つの壁の間に少なくとも4m以上の奥行きが延びていることを推定する。すなわち、ユーザは、前方に狭い通路が存在することを認識することができる。
【0039】
ユーザは、空間認識装置100を「スリットモード」に保持したまま、図7(d)に示すように、同様にステレオ撮像装置10を左右に動かしながら、通路の中を進んでいく。図11(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜8で時系列的に示す。図11(a)に示されるように、各注目領域Rに写り込んだ内容の変化に応じて、バイブレータ30の出力レベルは、図11(b)に示すように時系列的に変化する。ユーザは、バイブレータ30の振動レベルの経時的変化から通路の幅を認識することができ、安全に前進することができる。
【0040】
さらに、図12〜図14を参照して、「スリットモード」のさらなる効用について説明する。なお、図12〜図14に示す例においては、空間認識装置100は、上述した「近景モード」に設定されているものとして参照されたい。
【0041】
たとえば、ユーザの進行方向上に図12に示すような障害物が現われたとする。この場合、ユーザが、図12(a)に示すように、ステレオ撮像装置10を左右に動かした場合であっても、図12(b)に示すように、ステレオ撮像装置10を上下に動かした場合であっても、バイブレータ30の出力レベル(すなわち、ユーザが感じる振動レベル)は、経時的に変化しない。このことに基づいて、ユーザは、前方に壁一面がはだかっていることを認識することができる。
【0042】
次に、ユーザの進行方向上に図13に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置10を左右に動かした場合には、図13(a)に示すように、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、経時的に変化しないが、ステレオ撮像装置10を上下に動かした場合には、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、図13(b)に示す態様で経時的に変化する。ユーザは、ステレオ撮像装置10を左右に動かした場合に感じる感覚の経時的変化と上下に動かした場合に感じる感覚の経時的変化の違いに基づいて、前方に急傾斜の坂がはだかっていることを認識することができる。
【0043】
次に、ユーザの進行方向上に図14に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置10を左右に動かした場合には、図14(a)に示すように、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、経時的に変化しないが、ステレオ撮像装置10を上下に動かした場合には、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、図14(b)に示す態様で経時的に変化する。ここで、注目すべきは、図14(b)に示した出力レベルの経時的変化と図13(b)に示した急傾斜の坂のときの出力レベルの経時的変化の態様の違いである。ユーザは、この2つの経時的変化の態様の違いを感覚的に検知することによって、前方にはだかっている障害物が急傾斜の坂ではなく、階段であることを認識することができるであろう。
【0044】
以上、説明したように、本実施形態の「スリットモード」によれば、ユーザは、ステレオ撮像装置10を上下、左右に動かすことに伴って触覚により感受される振動レベルの経時的変化に基づいて、水平方向あるいは鉛直方向に延びる空間的な境界の存在をその距離感とともに認知することができ、その結果、空間をより正確に認識することができるのである。
【0045】
以上、本発明について実施形態をもって説明してきたが、本発明は上述した実施形態に限定されるものではない。上述した実施形態においては、注目領域の形状および大きさについて予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、本発明においては、別の実施形態として、ダイヤル式などの設定切替手段を採用し、注目領域の高さおよび幅を調整自在に構成することもできる。さらに、上述した実施形態においては、出力装置の出力レンジを割り当てる代表値の範囲について予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、同じく、ダイヤル式などの設定切替手段を採用して任意の代表値の範囲を設定自在に構成することもできる。その他、当業者が推考しうる実施態様の範囲内において、本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
【符号の説明】
【0046】
10…ステレオ撮像装置
11…筐体
12…主カメラ
14…副カメラ
15…表面加工
16…信号線
20…情報処理装置
21…画像入力用インターフェース
22…注目領域設定部
23…ステレオマッチング部
24…距離値算出部
25…代表値導出部
26…出力信号生成部
27…設定切替部
30…出力装置(バイブレータ)
40…設定切替手段(スイッチ)
52,54…障害物
100…視覚障害者用空間認識装置
【技術分野】
【0001】
本発明は、視覚障害者用空間認識装置に関し、より詳細には、ステレオ視法を利用した視覚障害者用空間認識装置に関する。
【背景技術】
【0002】
従来、視覚障害者の支援を目的とし、ステレオ視法を利用した空間認識システムについて種々検討がなされている。特開2002−65721号公報(特許文献1)は、ユーザの前頭部に装着したステレオカメラによって撮影された画像から、ユーザの前方空間内にある物体の三次元位置を計算し、その結果に基づいてユーザが手で触れる触覚表示装置やステレオヘッドフォンを駆動することを特徴とした視覚障害者用環境認識支援装置を開示する。また、特開2003−79685号公報(特許文献2)は、ステレオカメラによって撮影された画像から得られる障害物の三次元情報を二次元情報に変換し、当該二次元情報に基づいてユーザの額に当てられたアクチュエータアレイの突起部を駆動することによって、ユーザに空間情報を体感的に伝達することを特徴とした視覚障害者歩行用補助具を開示する。
【0003】
しかしながら、人間の聴覚系の情報伝達速度は、視覚系のそれに比較して格段に遅く、触覚系のそれは、聴覚系のそれよりもさらに格段に遅いことが知られており、上述したシステムがステレオ視法を利用して取得した正確な三次元情報に基づいて、どんなに解像度の高い情報をユーザに提供したとしても、ユーザ側の感覚系の分解能が不十分であるため、結局のところ、ユーザに空間の奥行き感を正確に認識させることができないという問題があった。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−65721号公報
【特許文献2】特開2003−79685号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記従来技術における課題に鑑みてなされたものであり、本発明は、視覚系に比較して格段に分解能が低い感覚系(聴覚系、触覚系など)を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明者は、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置につき鋭意検討した結果、空間がもつ膨大な三次元情報の中からユーザが真に必要とする情報のみを抽出し、これを触覚や聴覚などの感覚器の分解能に適合した一次元情報へと縮約する着想を得た。本発明者は、この着想に基づいて、ステレオ撮像装置の主カメラが撮像した主画像の一部の画素領域を注目領域として定義し、当該注目領域を構成する全画素についてステレオ視法を利用して算出された複数の距離値について統計的な代表値を導出し、当該代表値に基づいて出力装置を駆動するシステム構成に想到し、本発明に至ったのである。
【0007】
すなわち、本発明によれば、主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、前記情報処理装置は、前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、前記出力信号に基づいて駆動する出力装置とを含む視覚障害者用空間認識装置が提供される。
【発明の効果】
【0008】
上述したように、本発明によれば、視覚系に比較して格段に分解能が低い感覚系を介してユーザに三次元空間を正確に認識させることが可能な新規な視覚障害者用空間認識装置が提供される。
【図面の簡単な説明】
【0009】
【図1】本実施形態の視覚障害者用空間認識装置を示す図。
【図2】本実施形態における注目領域設定部の機能を説明するための概念図。
【図3】注目領域の3つのモードを示す図。
【図4】注目領域の3つのモードの活用方法を説明するための概念図。
【図5】本実施形態の視覚障害者用空間認識装置のステレオ撮像装置を示す図。
【図6】本実施形態の視覚障害者用空間認識装置の使用態様を示す図。
【図7】本実施形態の視覚障害者用空間認識装置の「スリットモード」における使用態様を示す図。
【図8】本実施形態における「スリットモード」の効用を説明するための概念図。
【図9】本実施形態における「スリットモード」の効用を説明するための概念図。
【図10】本実施形態における「スリットモード」の効用を説明するための概念図。
【図11】本実施形態における「スリットモード」の効用を説明するための概念図。
【図12】本実施形態における「スリットモード」の効用を説明するための概念図。
【図13】本実施形態における「スリットモード」の効用を説明するための概念図。
【図14】本実施形態における「スリットモード」の効用を説明するための概念図。
【発明を実施するための形態】
【0010】
以下、本発明を図面に示した実施の形態をもって説明するが、本発明は、図面に示した実施の形態に限定されるものではない。なお、以下に参照する各図においては、共通する要素について同じ符号を用い、適宜、その説明を省略するものとする。
【0011】
図1は、本発明の実施形態である視覚障害者用空間認識装置100を示す。視覚障害者用空間認識装置100(以下、単に、空間認識装置100という)は、ステレオ撮像装置10と、情報処理装置20と、出力装置30と、設定切替手段40とを含んで構成されている。ステレオ撮像装置10は、視覚障害者であるユーザ(以下、単にユーザという)の進行方向上にある対象物Sを撮像するための手段であり、平行等位に設置される主カメラ12および副カメラ14を備えている。なお、主カメラ12および副カメラ14は、デジタル動画あるいはデジタル連続静止画を高解像度で撮像可能な3CCDカメラとして構成することが好ましい。主カメラ12および副カメラ14によって撮像された各画像は、情報処理装置20に転送される。情報処理装置20は、主カメラ12および副カメラ14が撮像した2つの画像に基づいて対象物Sとステレオ撮像装置10(すなわち、ユーザ)との離間距離をステレオ視法を利用して算出し、当該離間距離に対応する出力信号を生成して出力装置30に送信する。
【0012】
本実施形態における情報処理装置20は、汎用コンピュータとして構成することができ、適切なオペレーティング・システムの管理下で、プログラミング言語により記述されたアプリケーション・プログラムを実行することによって、以下の各機能手段を実現する。すなわち、情報処理装置20は、ステレオ撮像装置10から転送される画像を受領するための画像入力用インターフェース21と、注目領域設定部22と、ステレオマッチング部23と、距離値算出部24と、代表値導出部25と、出力信号生成部26と、設定切替部27とを含んで構成されている。以下、上記各機能手段が果たす機能について、図1〜図4を参照して説明する。
【0013】
図2は、本実施形態における注目領域設定部22の機能を説明するための概念図である。本実施形態においては、まず、ステレオ撮像装置10の主カメラ12および副カメラ14によって撮像された対象物Sの2つの画像が画像入力用インターフェース21を介して注目領域設定部22に入力される。図2(a)は、注目領域設定部22に入力された2つの画像を示す。なお、図2においては、紙面の左側に主カメラ12の撮像画像(以下、主画像として参照する)を示し、紙面の右側に副カメラ14の撮像画像(以下、副画像として参照する)を示している。先に述べたように、主カメラ12と副カメラ14は、平行等位に設置されているため、図2(a)に示されるように、主画像と副画像のエピポーラ線は一致している。
【0014】
続いて、注目領域設定部22は、図2(b)に示すように、ステレオ撮像装置10から受領した主画像の一部の画素領域を注目領域R(破線で囲んで示す)として設定する。なお、注目領域Rは、その重心が主カメラの光軸(図中「+」で示す)と一致するように定義することが好ましい。本実施形態においては、形状および大きさの異なった複数の注目領域Rを定義し、設定によって注目領域Rの態様を適宜切替えることができるように構成することが好ましい。なお、この点については後に詳説する。
【0015】
注目領域設定部22によって設定された主画像の注目領域Rを構成する全ての画素情報と副画像の全画素情報は、ステレオマッチング部23に送られる。図2(c)は、ステレオマッチング部23に送られた画素情報を概念的に示す。なお、ここで、画素情報とは、各画素の輝度値および座標を含む情報である。ステレオマッチング部23は、注目領域Rを構成する全画素について、画素毎に副画像との間でステレオマッチング処理を実行し、注目領域Rに含まれる各画素に対応する副画像内の画素を特定する。ステレオマッチング処理は、動的計画法を用いた方法など既知の手法によって行なうことができる。ステレオマッチング部23は、マッチング結果として、注目領域R内の各画素の座標とこれに対応する副画像内の画素の座標を対応付けた情報(以下、画素対情報として参照する)を距離値算出部24に送る。距離値算出部24は、画素対情報に含まれる注目領域Rの画素の座標および副画像の画素の座標に基づいて距離値を算出する。本実施形態において、距離値は、注目領域Rの各画素に写り込んだ対象物S上の位置から主カメラ12および副カメラ14の各レンズの中心を結ぶ線に下ろした垂線の長さまたはその近似値として定義することができる。距離値算出部24は、注目領域Rの画素の座標および副画像の画素の座標に基づいて求めた両画素間の距離から偏差を減じたものを視差pとし、主カメラ12および副カメラ14の各レンズの中心間距離とカメラの焦点距離との積を視差pで除算することによって距離値を算出することができ、あるいは、視差pに適当な固定係数を乗じることによって近似値としての距離値を導出することもできる。当該距離値は、注目領域Rを構成する全画素について算出され、注目領域Rを構成する画素数と同数の距離値が計測結果として代表値導出部25に送られる。
【0016】
代表値導出部25は、注目領域Rに含まれる膨大な空間情報を縮約するための機能部である。すなわち、代表値導出部25は、距離値算出部24から受領した複数の距離値について統計的な代表値を導出する。このとき、画素単位の計測誤差は自動的に吸収されることになる。本実施形態においては、代表値として、平均値、中央値、最頻値または最小値のいずれかを設定することができるように構成されている。導出された代表値は出力信号生成部26に送られる。
【0017】
出力信号生成部26は、上記代表値を触覚や聴覚などの感覚器の分解能に適合した一次元情報(出力レベル)へと変換する。出力信号生成部26には、上記代表値を出力レベルに変換するための関数が予め用意されており、代表値をパラメータとして当該関数を参照して出力レベルを決定する。本実施形態において、出力レベルは、周波数または振幅、あるいはその両方(以下、周波数等という)によって定義することができる。出力レベルを周波数等によって定義する場合には、代表値と周波数等が負の相関関係を有する関数を用意することによって、代表値が小さくなるほど高い周波数(あるいは大きな振幅)が決定される。出力信号生成部26は、決定された周波数等に基づいて周期信号を生成する。また、上記関数に代えて、代表値と周波数等が負の相関関係を有するように対応付けられた出力信号生成用テーブルを用意し、当該テーブルを参照することによって出力レベルを決定するように構成してもよい。
【0018】
最後に、出力装置30が情報処理装置20から送信された出力信号によって駆動される。本実施形態においては、出力レベルを周波数等によって定義し、出力装置30をバイブレータ(振動器)やスピーカなどの振動子として構成することができる。たとえば、振動子としてバイブレータ(振動器)を採用した場合には、出力レベルが大きくなるほど(すなわち、代表値が小さくなるほど)高い周波数(あるいは、大きい振幅)でバイブレータが振動するため、ユーザは、触覚を介して対象物Sの距離感を直感的に認識することができる。また、振動子としてスピーカを採用した場合には、出力レベルが大きくなるほど(すなわち、代表値が小さくなるほど)高い周波数(あるいは、大きい振幅)の音波が発生するため、ユーザは、聴覚を介して対象物Sの距離感を直感的に認識することができる。その他、出力装置30を加圧子として構成し、出力レベルを圧力によって定義することによって、対象物Sの距離感をユーザの圧覚を介して伝えるように構成することもできる。
【0019】
なお、上述した代表値を出力レベルに変換するための関数(あるいは出力信号生成用テーブル)を定義する場合、出力装置30に固有の出力レンジを代表値の範囲に割り当てることが必要になる。代表値の範囲を広くとった場合、近景から遠景までの距離感を網羅的にユーザに伝えることが可能になるが、その分、情報の解像度は低くなる。したがって、本実施形態においては、代表値の範囲について複数のモード(たとえば、「遠景モード」、「近景モード」など)を定義し、各モードを切替え可能に構成することが好ましい。たとえば、「遠景モード」においては、代表値の範囲を「1〜4m」とすることによって、ユーザは、周囲の状況について、従来の白杖を使用する場合よりも広い範囲の情報を取得することが可能になる。一方、「近景モード」においては、代表値の範囲を、「0〜2m」とすることによって、ユーザは、近接した環境について、高い解像度の情報を取得することが可能になる。なお、これら各モードの切替えは、ユーザが操作する設定切替手段40からの入力に応答して設定切替部27が出力信号生成部26を制御することによって実行される。
【0020】
以上、障害物の距離感をユーザに直感的に伝える実施形態について説明してきたが、本発明はこれに限定されるものではなく、たとえば、出力装置30を音声出力装置として構成し、代表値を音の階調に対応付けて定義することよって、対象物Sの距離感をユーザに概念的に伝えたり、代表値に対応する距離値を予め用意された言語音声で伝えたりすることによって、対象物Sまでの距離をユーザに定量的に伝えることもできる。以上、本実施形態である空間認識装置100の各構成要素について説明してきたが、続いて、本実施形態の空間認識装置100における注目領域Rの設定モードについて、以下説明する。
【0021】
本実施形態の空間認識装置100においては、上述したように注目領域Rについて複数の設定モードを予め定義しておき、各モードを切り替え可能に構成することが好ましい。本実施形態においては、設定モードとして、たとえば、「広域モード」、「局所モード」および「スリットモード」という3つのモードを定義することができる。これら3つのモードは、空間認識装置100の異なった活用方法をユーザに提供することができる。以下、図3および図4を参照しながら、上記3つのモードについて説明する。
【0022】
図3(a)〜(c)は、3つのモードにおける注目領域Rを破線で囲んで示す。図3(a)に示す「広域モード」においては、主画像の全域(あるいはそれに近い範囲)が注目領域Rとして定義され、代表値として「最小値」が定義される。また、図3(b)に示す「局所モード」においては、ごく狭い領域が注目領域Rとして定義され、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。さらに、図3(c)に示す「スリットモード」においては、アスペクト比が大きい長方形領域(すなわち、スリット状領域)が注目領域Rとして定義され、「局所モード」と同じく、代表値として「平均値」、「中央値」、または「最頻値」のいずれかを採用することができる。なお、本実施形態においては、図3(c)に示すように「スリットモード」における注目領域Rをその長手方向がエピポーラ線に対して平行になるように構成する他、エピポーラ線に対して垂直になるように構成したり、エピポーラ線に対して任意の角度に傾けて構成したりすることもできる。各モードの切替えは、ユーザが操作する設定切替手段40からの入力に応答して設定切替部27が注目領域設定部22および代表値導出部25を制御することによって実行される。なお、以下の説明においては、「局所モード」および「スリットモード」の代表値を「平均値」とするものとして説明する。
【0023】
図4(a)〜(c)は、3つのモードの活用方法を説明するための概念図である。図4(a)に示す「広域モード」は、障害物の存在を広く検出したい場合に利用することができる。図4(a)に示す例においては、注目領域Rには、(0.5m先にある)障害物52および(4m先にある)障害物54ならびにその他の背景が写り込んでいる。「広域モード」においては、代表値として「最小値」が設定されるため、ユーザの視野範囲内において一番近くに存在する細長い棒状の障害物52までの離間距離に近似する距離値(0.5m)が代表値として導出され、当該距離値(0.5m)に基づいて出力レベルが決定される。その結果、ユーザは、自身の視野範囲内において一番近い障害物52の存在をその距離感とともに認知することができる。但し、「広域モード」においては、その障害物がロープのようなものであっても、壁のようなものあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。また、その障害物が視野範囲内のどこにあっても、それらがユーザから見て同じ距離にあれば、出力レベルは等しくなる。したがって、「広域モード」においては、ユーザは、どのような形状の障害物がどの方向にどのような態様で存在するのかについて認知することができない。
【0024】
一方、図4(b)に示す「局所モード」は、対象物までに距離感を正確に把握したい場合に利用することができる。図4(b)に示す例においては、注目領域R内の画素の大部分に(4m先にある)障害物54が写り込んでいる。「局所モード」においては、代表値として「平均値」が設定されるため、ユーザから障害物54までの離間距離に近似する距離値(4m)が代表値として導出され、当該距離値(4m)に基づいて出力レベルが決定される。その結果、ユーザは、主カメラ12の光軸上にある障害物54の存在をその距離感とともに認知することができる。なお、代表値に対応する距離値を示す言語音声(出力信号)を生成するように出力信号生成部26を構成した場合、「局所モード」においては、障害物54までの距離を「4mです」と言うような言語音声でユーザに伝えることができる。
【0025】
従来、ユーザは、白杖が対象物に触れる度にその感触を「点」として捉え、捉えた複数の「点」を時系列的に統合することによって、対象物の全体像を認知していたということができる。そういった意味では、本実施形態の「局所モード」は、従来の白杖と同様の利用形態が期待できるものと言えるであろう。但し、本実施形態の「局所モード」には、従来の白杖にない利点がある。すなわち、白杖の場合は、杖が届く距離範囲内にある対象物しか認知することができないのに対し、本実施形態の「局所モード」によれば、理論的にはその適用距離範囲に限定がない。したがって、ユーザは、本実施形態の空間認識装置100を「伸縮自在の白杖」といった感覚で利用することができるであろう。
【0026】
一方、図4(c)に示す「スリットモード」においては、代表値として「平均値」が設定されるため、注目領域R内の全画素から算出される距離値の「平均値」が出力レベルに変換される。ここで、図4(c)に示す例においては、注目領域R内の画素に障害物52の一部および障害物54の一部ならびにその他の背景が写り込んでいるため、注目領域R内の全画素から算出される距離値の「平均値」から変換された出力レベルは、障害物52の距離感と障害物54の距離感とその他の背景の距離感とを平準化したものになり、情報としての有意性がないようにも見える。しかしながら、本実施形態の「スリットモード」によれば、ユーザに対して障害物のより具体的なイメージ(奥行き感)を提供することができるのである。この点について、図5〜図14を参照して、以下説明する。
【0027】
図5は、本実施形態の空間認識装置100のステレオ撮像装置10を示す。なお、図5(a)は、ステレオ撮像装置10の前面を示し、図5(b)は、ステレオ撮像装置10の背面を示す。図5に示す例においては、ステレオ撮像装置10は、ユーザが片手で持って使用することを想定して細長い円柱状の筐体11を利用して実装されている。図5(a)に示すように、筐体11前面の両端近傍には、超小型3CCDカメラとして構成される主カメラ12および副カメラ14が適切な間隔をもって平行等位に設置されている。また、筐体11前面の中央部には凹凸などの特殊な表面加工15が施されており、ユーザが表面加工15を触覚により認知することによってステレオ撮像装置10の前面(すなわち、カメラの撮像方向)を認識することができるように構成されている。
【0028】
一方、ステレオ撮像装置10の背面には、図5(b)に示すように、出力装置30としてのバイブレータ30が一体的に固設されており、ユーザがステレオ撮像装置10を握った状態において、手の平でバイブレータ30の振動を感じ取ることができるように構成されている。
【0029】
さらに、図5に示す例においては、設定切替手段40としてのスイッチ40がステレオ撮像装置10に一体的に形成されている。ユーザは、必要に応じて、図5(c)に示すように、スイッチ40を親指で操作することによって、上述した「広域モード」、「局所モード」、「スリットモード」、「遠景モード」、「近景モード」などの各種設定の切替えを行なうことができるように構成されている。本実施形態は、スイッチ40の具体的な構成について特に限定するものではないが、多段式押しスイッチやユニバーサルスイッチなどを用いて、視覚障害者が現在の選択モードを触覚で確認することができるように構成することが好ましいであろう。
【0030】
図6(a)は、図5に示したステレオ撮像装置10を採用した空間認識装置100の使用態様を示す図である。図6(a)に示す例においては、ユーザは、ステレオ撮像装置10を右手に持ち、情報処理装置20を腰ベルトに装着した状態で歩いている。ステレオ撮像装置10と情報処理装置20とは信号線16で接続され、双方向通信が可能に構成されている。なお、両者の双方向通信は、無線通信によって実現してもよい。さらに、ステレオ撮像装置10および情報処理装置20を一つの筐体内に実装して一体化してもよい。
【0031】
なお、本発明は、上述した実施形態に限定されるものではなく、出力装置30をステレオ撮像装置10と別体とすることもでき、たとえば、図6(b)に示すように、ユーザの腕などにバイブレータ30を装着することもできる。また、図6(b)に示すように、出力装置30をスピーカ装置(たとえば、ヘッドフォン等)として構成することもでき、あるいは、バイブレータとスピーカ装置を併用することもできる。さらに、図6(b)に示すように、設定切替手段40として、情報処理装置20の筐体に点字を付した設定ボタンを備える操作パネルを形成することもできる。
【0032】
次に、本実施形態における「スリットモード」の効用について説明する。ユーザの前に広がる生活空間には、様々な対象物が存在しうるが、その中でもユーザが特に必要とするのは、たとえば、「柱」、「壁」、「塀」、「出入口」、「通路」などに関する情報である。仮に、これらの対象物の距離感や奥行き感をユーザに高精度に認知させることができたならば、それはユーザにとって大きな助けとなるであろう。本発明者は、この点につき、これらの対象物が水平方向または鉛直方向の少なくとも一方に空間的な境界を有することに着目して、上述した「スリットモード」に想到したのである。すなわち、「スリットモード」は、対象物の水平方向あるいは鉛直方向にのびる空間的な境界の存在を選択的に検出することが可能なモードであり、ユーザはこの「スリットモード」を利用することによって、対象物についてより具体的な空間イメージを取得することができるのである。以下、この点について、図7〜図14を参照しながら、具体的な例に基づいて説明する。
【0033】
図7は、「スリットモード」における(図5に示した)ステレオ撮像装置10の使用態様を示す図である。なお、図7においては、説明の便宜上、空間認識装置100のうちステレオ撮像装置10のみを示している。ユーザは、まず、図7(a)に示すように、ステレオ撮像装置10を持った右手を進行方向に向かって突き出した状態で前に進む。この時、空間認識装置100を「広域モード」に設定しておくことによって、ユーザは、バイブレータ30の振動を介して進行方向に何らかの障害物が存在することを認知することができる。
【0034】
たとえば、図8に示すように、ユーザの進行方向上に幅の狭い通路が現われたとする。図8(a)においては、「広域モード」に設定された主カメラの視野を実線太枠で示し、注目領域Rを破線枠で示している。「広域モード」においては、図8(a)に示すように、注目領域R内に「壁」、「通路」、および「通路の先の遠景」が写り込んでいる。「広域モード」においては、各画素について算出された距離値の「最小値」が代表値として導出されるので、ユーザに一番近接した障害物である「壁」に対応した距離値が代表値として導出され、これがバイブレータ30の振動に変換される。ユーザは、当該振動により前方に何らかの障害物が存在することを認知して立ち止まる。
【0035】
しかし、この時点では、その障害物の態様についてユーザはその詳細を知ることができない。そこで、ユーザは、設定切替手段40を操作して、空間認識装置100を「スリットモード」に切替える。図8(b)においては、「スリットモード」に設定された主カメラの視野を実線太枠で示し、注目領域Rを破線枠で示している。ここで、注目すべきは、「スリットモード」の注目領域Rの長手方向がステレオ撮像装置10の長手方向に対応している点である。このように注目領域Rの長手方向をステレオ撮像装置10の長手方向に対応させることによって、ユーザは、「スリットモード」における「スリット」の向きを直感的に認識することができる。
【0036】
空間認識装置100を「スリットモード」に切替えたユーザは、図7(b)に示すように、ステレオ撮像装置10の長手方向を水平方向と平行にした状態で上下に動かす。図9(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜7で時系列的に示す。なお、図9(a)においては、主カメラの視野については省略し、注目領域Rのみを破線枠で示している(以下、図10〜図14についても同様)。一方、図9(b)は、バイブレータ30の出力レベル(%)の時系列的な変化を示す。なお、図9に示す例においては、空間認識装置100は、上述した「遠景モード」に設定されているものとして参照されたい(図10および図11についても同様)。
【0037】
「スリットモード」においては、各注目領域Rを構成する各画素について算出された距離値の平均値が算出され、当該平均値に対応する出力レベルでバイブレータ30が振動することになるが、丸囲み数字1〜7で示す注目領域Rに写り込んだ内容は、図9(a)に示すように互いに大きな差異がないため、各注目領域Rから導出される平均値はほぼ等しくなる。その結果、図9(b)に示すように、バイブレータ30の出力レベルは、時系列的にほとんど変化しない。ただし、この場合の「スリットモード」における平均値は、「通路の先の遠景」が写り込んでいる分、図8(a)に示した「広域モード」において取得された最小値よりも若干大きくなるはずなので、ユーザが感じる振動レベルは「広域モード」時のそれよりも少し弱くなる。この感覚の経時的変化によって、ユーザは、前方に壁一面が広がっているのではなく、何らかの奥行きを持った障害物が存在することを認識する。
【0038】
次に、ユーザは、空間認識装置100を「スリットモード」に保持したまま、図7(c)に示すように、手を90°回転させてステレオ撮像装置10の長手方向を鉛直方向に平行にしてステレオ撮像装置10を左右に動かす。図10(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜5で時系列的に示す。図10(a)に示されるように、各注目領域Rに写り込んだ内容は、時系列的に大きく変化している。これに伴って、図10(b)に示すようにバイブレータ30の出力レベルは、時系列的に大きく変化する。ユーザは、バイブレータ30の振動レベルの経時的変化から、前方に2つの壁が存在し、さらに、その2つの壁の間に少なくとも4m以上の奥行きが延びていることを推定する。すなわち、ユーザは、前方に狭い通路が存在することを認識することができる。
【0039】
ユーザは、空間認識装置100を「スリットモード」に保持したまま、図7(d)に示すように、同様にステレオ撮像装置10を左右に動かしながら、通路の中を進んでいく。図11(a)は、その間に撮像される複数の主画像の注目領域Rを丸囲み数字1〜8で時系列的に示す。図11(a)に示されるように、各注目領域Rに写り込んだ内容の変化に応じて、バイブレータ30の出力レベルは、図11(b)に示すように時系列的に変化する。ユーザは、バイブレータ30の振動レベルの経時的変化から通路の幅を認識することができ、安全に前進することができる。
【0040】
さらに、図12〜図14を参照して、「スリットモード」のさらなる効用について説明する。なお、図12〜図14に示す例においては、空間認識装置100は、上述した「近景モード」に設定されているものとして参照されたい。
【0041】
たとえば、ユーザの進行方向上に図12に示すような障害物が現われたとする。この場合、ユーザが、図12(a)に示すように、ステレオ撮像装置10を左右に動かした場合であっても、図12(b)に示すように、ステレオ撮像装置10を上下に動かした場合であっても、バイブレータ30の出力レベル(すなわち、ユーザが感じる振動レベル)は、経時的に変化しない。このことに基づいて、ユーザは、前方に壁一面がはだかっていることを認識することができる。
【0042】
次に、ユーザの進行方向上に図13に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置10を左右に動かした場合には、図13(a)に示すように、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、経時的に変化しないが、ステレオ撮像装置10を上下に動かした場合には、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、図13(b)に示す態様で経時的に変化する。ユーザは、ステレオ撮像装置10を左右に動かした場合に感じる感覚の経時的変化と上下に動かした場合に感じる感覚の経時的変化の違いに基づいて、前方に急傾斜の坂がはだかっていることを認識することができる。
【0043】
次に、ユーザの進行方向上に図14に示すような障害物が現われたとする。この場合、ユーザがステレオ撮像装置10を左右に動かした場合には、図14(a)に示すように、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、経時的に変化しないが、ステレオ撮像装置10を上下に動かした場合には、バイブレータ30の出力レベル(ユーザが感じる振動レベル)は、図14(b)に示す態様で経時的に変化する。ここで、注目すべきは、図14(b)に示した出力レベルの経時的変化と図13(b)に示した急傾斜の坂のときの出力レベルの経時的変化の態様の違いである。ユーザは、この2つの経時的変化の態様の違いを感覚的に検知することによって、前方にはだかっている障害物が急傾斜の坂ではなく、階段であることを認識することができるであろう。
【0044】
以上、説明したように、本実施形態の「スリットモード」によれば、ユーザは、ステレオ撮像装置10を上下、左右に動かすことに伴って触覚により感受される振動レベルの経時的変化に基づいて、水平方向あるいは鉛直方向に延びる空間的な境界の存在をその距離感とともに認知することができ、その結果、空間をより正確に認識することができるのである。
【0045】
以上、本発明について実施形態をもって説明してきたが、本発明は上述した実施形態に限定されるものではない。上述した実施形態においては、注目領域の形状および大きさについて予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、本発明においては、別の実施形態として、ダイヤル式などの設定切替手段を採用し、注目領域の高さおよび幅を調整自在に構成することもできる。さらに、上述した実施形態においては、出力装置の出力レンジを割り当てる代表値の範囲について予め複数の設定モードを定義しておき、これを適宜切替える構成について説明したが、同じく、ダイヤル式などの設定切替手段を採用して任意の代表値の範囲を設定自在に構成することもできる。その他、当業者が推考しうる実施態様の範囲内において、本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
【符号の説明】
【0046】
10…ステレオ撮像装置
11…筐体
12…主カメラ
14…副カメラ
15…表面加工
16…信号線
20…情報処理装置
21…画像入力用インターフェース
22…注目領域設定部
23…ステレオマッチング部
24…距離値算出部
25…代表値導出部
26…出力信号生成部
27…設定切替部
30…出力装置(バイブレータ)
40…設定切替手段(スイッチ)
52,54…障害物
100…視覚障害者用空間認識装置
【特許請求の範囲】
【請求項1】
主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、
前記情報処理装置は、
前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、
算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、
前記出力信号に基づいて駆動する出力装置と
を含む視覚障害者用空間認識装置。
【請求項2】
前記注目領域は、スリット状領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項1に記載の視覚障害者用空間認識装置。
【請求項3】
前記注目領域は、狭小領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項1に記載の視覚障害者用空間認識装置。
【請求項4】
前記注目領域は、前記主画像の全域として定義され、前記代表値は、最小値である、請求項1に記載の視覚障害者用空間認識装置。
【請求項5】
前記注目領域をスリット状領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択するスリットモード、前記注目領域を狭小領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択する局所モード、および、前記注目領域を前記主画像の全域として定義し前記代表値を最小値とする広域モードからなる3つの設定を切替えるための設定切替部をさらに備える、請求項1に記載の視覚障害者用空間認識装置。
【請求項6】
前記注目領域は、その重心が前記主カメラの光軸に一致するように定義される、請求項1〜5のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項7】
前記出力装置は、振動子である、請求項1〜6のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項8】
前記振動子は、振動器またはスピーカ装置である、請求項7に記載の視覚障害者用空間認識装置。
【請求項9】
前記ステレオ撮像装置と前記出力装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項1〜8のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項10】
前記ステレオ撮像装置と前記出力装置と前記情報処理装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項1〜8のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項11】
ユーザに空間を認識させるためにコンピュータに出力装置の駆動を実行させるコンピュータ実行可能な方法であって、前記方法は、前記コンピュータに対し、
主カメラおよび副カメラを含むステレオ撮像装置の前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する機能手段と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出する機能手段と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する機能手段と、算出された複数の前記距離値について統計的な代表値を導出する機能手段と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する機能手段と、
前記出力信号に基づいて前記出力装置を駆動する機能手段と、
を実現する方法。
【請求項12】
請求項11に記載の各機能手段を実現させるためのコンピュータ実行可能なプログラム。
【請求項1】
主カメラおよび副カメラを含むステレオ撮像装置と情報処理装置と出力装置とを含む視覚障害者用空間認識装置であって、
前記情報処理装置は、
前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する注目領域設定部と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出するステレオマッチング部と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する距離値算出部と、
算出された複数の前記距離値について統計的な代表値を導出する代表値導出部と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する出力信号生成部と、
前記出力信号に基づいて駆動する出力装置と
を含む視覚障害者用空間認識装置。
【請求項2】
前記注目領域は、スリット状領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項1に記載の視覚障害者用空間認識装置。
【請求項3】
前記注目領域は、狭小領域として定義され、前記代表値は、平均値、中央値および最頻値からなる群より選択される、請求項1に記載の視覚障害者用空間認識装置。
【請求項4】
前記注目領域は、前記主画像の全域として定義され、前記代表値は、最小値である、請求項1に記載の視覚障害者用空間認識装置。
【請求項5】
前記注目領域をスリット状領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択するスリットモード、前記注目領域を狭小領域として定義し前記代表値を平均値、中央値および最頻値からなる群より選択する局所モード、および、前記注目領域を前記主画像の全域として定義し前記代表値を最小値とする広域モードからなる3つの設定を切替えるための設定切替部をさらに備える、請求項1に記載の視覚障害者用空間認識装置。
【請求項6】
前記注目領域は、その重心が前記主カメラの光軸に一致するように定義される、請求項1〜5のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項7】
前記出力装置は、振動子である、請求項1〜6のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項8】
前記振動子は、振動器またはスピーカ装置である、請求項7に記載の視覚障害者用空間認識装置。
【請求項9】
前記ステレオ撮像装置と前記出力装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項1〜8のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項10】
前記ステレオ撮像装置と前記出力装置と前記情報処理装置とが片手で携帯自在な一つの筐体に一体的に実装されることを特徴とする、請求項1〜8のいずれか1項に記載の視覚障害者用空間認識装置。
【請求項11】
ユーザに空間を認識させるためにコンピュータに出力装置の駆動を実行させるコンピュータ実行可能な方法であって、前記方法は、前記コンピュータに対し、
主カメラおよび副カメラを含むステレオ撮像装置の前記主カメラが撮像した主画像の一部の画素領域を注目領域として定義する機能手段と、
前記注目領域を構成する各画素について副カメラが撮像した副画像との間でステレオマッチングを実行し、前記注目領域の前記各画素に対応する前記副画像内の画素を検出する機能手段と、
前記注目領域の前記各画素と検出された前記対応する前記副画像内の画素の座標から算出される視差に基づいて前記注目領域の前記各画素の距離値を算出する機能手段と、算出された複数の前記距離値について統計的な代表値を導出する機能手段と、
前記代表値が小さくなるほど大きな出力レベルの出力信号を生成する機能手段と、
前記出力信号に基づいて前記出力装置を駆動する機能手段と、
を実現する方法。
【請求項12】
請求項11に記載の各機能手段を実現させるためのコンピュータ実行可能なプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2011−250928(P2011−250928A)
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願番号】特願2010−125662(P2010−125662)
【出願日】平成22年6月1日(2010.6.1)
【出願人】(599011687)学校法人 中央大学 (110)
【Fターム(参考)】
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願日】平成22年6月1日(2010.6.1)
【出願人】(599011687)学校法人 中央大学 (110)
【Fターム(参考)】
[ Back to top ]