情報埋込装置、情報復元装置、情報埋込方法、情報復元方法、情報埋込プログラム及び情報復元プログラム

【課題】
ドットフレームを配置することなく、情報埋め込みを可能とする。
【解決手段】
オブジェクトを表す原画像を取得し、該原画像から、オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成するものであって、情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置するフレームマーカ配置部と、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、情報埋込画像に配置する方向検出マーカ配置部とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、オブジェクトを表す画像に対して情報を埋め込む情報埋込装置、情報復元装置、情報埋込方法、情報復元方法、情報埋込プログラム及び情報復元プログラムに関するものであって、特に、オブジェクト全体の形態を一定に保持しつつ、そのオブジェクトのエッジ部分に情報を埋め込む情報埋込画像を生成する情報埋込装置及び方法並びにプログラムと、その情報埋込画像から情報を復元する情報復元装置及び方法並びにプログラムに関するものである。
【背景技術】
【０００２】
従来、携帯端末にＵＲＬなどの情報を入力するために、二次元画像コードが広く一般に利用されている。例えば、ＱＲコードはその代表例である。従来の二次元画像コードでは、画像自体に意味を持たないことが多く、コードを商品に貼りつけることでデザイン性を損ねることがあった。
【０００３】
また、ロゴなどの単純なグレースケール画像から二次元画像コードを生成する手法をＢｅ−ｃｏｄｅ（Ｂｉｎａｒｙ−ｅｍｂｌｅｍｃｏｄｅ）と称し、原画像のロゴのエッジ部分の画素の値を変更することで、ロゴの見た目を保ったまま情報を埋め込むことができる技術が提案されている。
【０００４】
例えば、この技術に関連するものとして、元画像の形を壊さずに情報の埋め込みを行い、また、元画像情報を必要とせずに埋め込みデータを検出する二値化画像への情報埋め込み方法及び読み出し方法に関する技術が、特許文献１に提案されている。
【先行技術文献】
【特許文献】
【０００５】
【特許文献１】特開２０１１−４１０５５号公報
【発明の概要】
【発明が解決しようとする課題】
【０００６】
上述した情報埋め込み方法及び読み出し方法は、例えば、ロゴやオブジェクトを囲むドットフレームを配置する必要性があり、画像全体として、当該フレームをはずすことができずに、デザインの自由度を制限するという問題があった。
【０００７】
そこで、本発明は、上記事情に鑑み、ドットフレームを配置することなく、情報埋め込み、または情報復元を可能とする情報埋込装置、情報復元装置、情報埋込方法、情報復元方法、情報埋込プログラム及び情報復元プログラムを提供することを目的とする。
【課題を解決するための手段】
【０００８】
本発明の情報埋込装置は、オブジェクトを表す原画像を取得し、該原画像から、オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成する情報埋込装置において、情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置するフレームマーカ配置部と、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、情報埋込画像に配置する方向検出マーカ配置部とを備えたものである。
【０００９】
「フレームマーカ」は、原画像の座標系に変換するためのものである。また、フレームマーカの外側には白色であって、１画素以上のマージンを設けてもよい。
【００１０】
「方向検出マーカ」は、原画像の正しい向きに画像復元するためのものである。また、「方向検出マーカ」は、フレームマーカのうちの左隅のものを基準として配置されたものであってもよい。
【００１１】
また、本発明の情報埋込装置は、フレームマーカと方向検出マーカの間には、少なくとも１画素分の白色のスペースを設けてもよい。
【００１２】
また、本発明の情報埋込装置は、オブジェクトのエッジ部分に情報を埋め込むに際し、原画像を水平および垂直方向に１画素ずつ重なるように所定の画素ブロックに分割し、可変得点を用いるものであってもよい。
【００１３】
また、本発明の情報埋込装置は、原画像をグレースケール化することで、情報埋込画像を生成するものであってもよい。
【００１４】
また、本発明の情報埋込装置は、埋め込まれた情報は、リード・ソロモン符号を用いたものであってもよい。
【００１５】
本発明の情報復元装置は、情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得するものであって、取得された観測画像から、フレームマーカおよび方向検出マーカを検出するマーカ検出部と、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元する画像処理部とを備えるものである。
【００１６】
本発明の情報復元装置は、埋め込まれた情報であるリード・ソロモン符号から誤り訂正符号を求めるものであってもよい。
【００１７】
本発明の情報埋込方法において、オブジェクトを表す原画像を取得し、該原画像から、前記オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成するに際し、原画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置し、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置する。
【００１８】
本発明の情報復元方法において、情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得するに際し、取得された観測画像から、フレームマーカおよび方向検出マーカを検出し、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元する。
【００１９】
本発明の情報埋込プログラムにおいて、オブジェクトを表す原画像を取得し、該原画像から、オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成するものであって、コンピュータに、原画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置する機能と、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置する機能とを実現させるものである。
【００２０】
本発明の情報復元プログラムにおいて、情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得する情報復元プログラムにおいて、コンピュータに、取得された観測画像から、フレームマーカおよび方向検出マーカを検出する機能と、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、前記埋め込まれた情報を復元する機能とを実現するものである。
【発明の効果】
【００２１】
本発明の情報埋込装置及び方法並びにプログラムによれば、原画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置し、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置することにより、ロゴやオブジェクトを囲むドットフレームを配置することなく、情報を埋め込んだ画像を生成することができる。
【００２２】
また、本発明の情報埋込装置及び方法並びにプログラムによれば、オブジェクトのエッジ部分に情報を埋め込むに際し、原画像を水平および垂直方向に１画素ずつ重なるように所定の画素ブロックに分割し、可変得点を用いることにより、多くの情報を埋め込むことを可能とする。
【００２３】
また、本発明の情報埋込装置及び方法並びにプログラムによれば、原画像をグレースケール化することで、情報埋込画像を生成することにより、原画像がアンチエイリアシングされていても、デザイン性を損なわないことを可能とする。
【００２４】
また、本発明の情報復元装置及び方法並びにプログラムによれば、取得された観測画像から、フレームマーカおよび方向検出マーカを検出し、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元することができる。
【００２５】
また、本発明の情報復元装置及び方法並びにプログラムによれば、埋め込まれた情報であるリード・ソロモン符号から誤り訂正符号を求める際には、訂正能力を超えた誤りが起こった場合にも、読み取りに失敗することを判定できる。
【図面の簡単な説明】
【００２６】
【図１】本発明の実施形態における情報埋込装置及び情報復元装置を示す図
【図２】本発明の実施形態における情報埋込装置の処理フローを示したフローチャート
【図３】本発明の実施形態における情報復元装置の処理フローを示したフローチャート
【図４】Ｂｅ−ｃｏｄｅの構造を説明するための図
【図５】可変得点が０．５以上となるブロックを説明するための図
【図６】埋め込み情報量を増やすブロック分割を説明するための図
【図７】二値化処理のためのグレースケール化を説明するための図
【図８】グレースケール画像を用いたＢｅ−ｃｏｄｅ生成を説明するための図
【図９】フレーム付加によるＢｅ−ｃｏｄｅ生成を説明するための図
【図１０】フレームマーカの探索を示した図
【図１１】画像分割による適応的二値化を説明するための図
【図１２】実験環境と観測画像例を示した図
【図１３】ロゴ画像毎の埋め込み情報量の違いを説明するための図
【図１４】グレースケールのための係数ｃと読み取り角度及び読み取り精度を説明するための図
【発明を実施するための形態】
【００２７】
本発明の実施の形態となる情報埋込装置及び情報復元装置について、図面を参照しつつ説明する。
【００２８】
図１は、本発明の情報埋込装置１０及び情報復元装置５０の概略を示す図である。情報埋込装置１０は、オブジェクト（例えば、ロゴ画像）を表す原画像を取得し、該原画像から、オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成するものであって、情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置するフレームマーカ配置部（不図示）と、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置する方向検出マーカ配置部（不図示）とを備える。また、コンピュータである情報埋込装置１０はプリンタ５と接続されている。
【００２９】
方向検出マーカ部は、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成されるものであるが、情報埋込画像の左上隅にある、所定の画素領域から構成されるフレームマーカを基準とした例により説明するが、情報埋込画像の左下隅、右下隅、右上隅のいずれかにある所定の画素領域から構成されるフレームマーカを基準としてもよい。
【００３０】
情報埋込装置１０は、コンピュータであり、各種入力に基づきＣＰＵがＲＯＭに記録されたプログラムを実行することで各種機能部として動作する。
【００３１】
プリンタ５は、コンピュータである情報埋込装置１０により送信された情報埋込画像を印刷し、情報埋込画像を表す印刷物１５を出力するものである。
【００３２】
情報復元装置５０は、情報埋込装置１０により生成された情報埋込画像を撮影することで観測画像を取得するものであって、取得された観測画像から、フレームマーカおよび方向検出マーカを検出するマーカ検出部（不図示）と、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元する画像処理部（不図示）とを備えるものである。
【００３３】
情報復元装置５０は、コンピュータであり、各種入力に基づきＣＰＵがＲＯＭに記録されたプログラムを実行することで各種機能部として動作する。また、情報復元装置５０は、例えば、カメラ機能付携帯電話、カメラ機能付ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）であってもよい。
【００３４】
ここで、本発明の実施形態における二次元画像コードを生成する手法について、図２および図３のフローチャートの手順に沿って、詳細に説明する。なお、ロゴ画像などの単純なグレースケール画像から二次元画像コードを生成する手法をＢｅ−ｃｏｄｅ（Ｂｉｎａｒｙ−ｅｍｂｌｅｍｃｏｄｅ）と称して説明する。
情報埋込装置１０は、オブジェクトを表す原画像を取得し、該原画像から、前記オブジェクト全体の形態を一定に保持しつつ、オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成するに際し、原画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置し、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置する。
【００３５】
情報埋込装置１０は、図４に示すように、エンブレムエリア(Ｅｍｂｌｅｍａｒｅａ)には、ロゴ画像に情報埋め込みを行ったものを配置する（ＳＴＥＰ１）。ロゴ画像への情報埋め込みの具体的な手法は、後述する。また、観測画像からの情報埋め込みを行うときには、ロゴ画像のデザイン性を確保することと、観測環境に依らずに頑健に読み取れることの２つを満足する必要がある。
【００３６】
（可変得点を用いた情報埋め込み）
ここで、ロゴ画像への情報埋め込みの具体的な手法について説明する。
ロゴ画像への情報埋め込みは画素値を変化させることで行うが、原画像のデザイン性確保のためには、人間が見て目立たないように画素値を変化させなければならない。これを実現するために、画像上の各微小領域のなめらかさや連結性を考慮して情報埋め込みを行うＷｕらの手法（ＭｉｎＷｕ、ＢｅｄｅＬｉｕ、”ＤａｔａＨｉｄｉｎｇｉｎＢｉｎａｒｙＩｍａｇｅｆｏｒＡｕｔｈｅｎｔｉｃａｔｉｏｎａｎｄＡｎｎｏｔａｔｉｏｎ”、ＩＥＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＭＵＬＴＩＭＥＤＩＡ、ｖｏｌ．６、Ｎｏ．４、ｐｐ．５２８−５３８，２００４．８）を利用する。Ｗｕらの手法では、二値画像を３×３のブロックに分け、なめらかさと連結数に基づいて可変得点(ｆｉｐｐａｂｉｌｉｔｙｓｃｏｒｅ)を計算する。なめらかさは、画素(i、j) に対して水平Ｎｈ（ｉ、ｊ）、垂直Ｎｖ（ｉ，ｊ）および対角Ｎｄ１（ｉ，ｊ）、Ｎｄ２（ｉ，ｊ）に対して計算される（数式１参照）。
【００３７】
【数１】

【００３８】
ただし、ｐｉ，ｊは画素（i，ｊ）の値であり、Ｉ（）は括弧内が真のとき１、偽のときに０となる関数である。連結数は、ブロック内の白黒の連結領域の数によって調べる。連結領域であるかどうかは、白黒ともに４連結で調べる。
【００３９】
可変得点の計算は以下の手順で行う。
（１）ブロック内の画素の値がすべて白、もしくは、すべて黒ならば、可変得点は０とし、終了する。
（２）Ｎｈ＝０またはＮｖ＝０であれば、可変得点は０とし、終了する。それ以外のときにはｓ＝０．５とする。
（３）Ｎｄ１＝０またはＮｄ２＝０とき、ｓ＝ｓ−０．１２５とする。Ｎｄ１≠０かつＮｄ２≠０のとき、ｎｐ＝ｍａｘ（０，３ −ｍｉｎｐ∈｛ｈ，ｖ，ｄ１、ｄ２｝Ｎｐ）を求め、s=s−０．１２５ｎｐとする。
（４）中心画素の値を反転するとき、Ｎｈが変化しなければｓ＝ｓ＋０．１２５とし、変化すればｓ＝ｓ−０．１２５とする。同様に、Ｎｖが変化しなければｓ＝ｓ＋０．１２５とし、変化すればｓ＝ｓ−０．１２５とする。
（５）中心画素の値を反転するとき、連結数が変化すれば、ｓ＝ｓ−０．１２５とする。
（６） s を可変得点とし、終了する。
図５は可変得点が０．５以上となるブロックの例である。可変得点が０．５以上のブロックでは中央の画素の値を変更しても、やはり可変得点が０．５以上であることが保証される。
【００４０】
ロゴ画像から可変得点が０．５以上のブロックを検出し、０を埋め込むときには中央画素に黒を、1を埋め込むときには中央画素に白を埋め込む。情報を読み取るときにも、画像上で可変得点が０．５以上のブロックを見つけ、中央画素が０か１かを見れば、情報を読み取ることができる。この手法では、情報読み込みのときに原画像を参照する必要がない。
【００４１】
Ｗｕらの手法はブロック内で黒となる個数が偶数のときに０、奇数のときに１としていたが、偶奇の判定のためには、ブロック内のすべての値が正しく識別されている必要がある。カメラによる観測によって白黒の判定が起こる可能性があることを考えると、中央画素の白黒の値のみによって情報を表現する方が、誤りが少ないことが期待できる。
【００４２】
Ｗｕらの手法は図６（ａ）に示すように画像を３×３のブロックに分けて情報埋め込みを行った。情報埋め込みのためには中心画素の値を変化させるだけでよいので、このブロック分割の方法は効率が悪かった。我々は、より多くの情報を埋め込むために、図６（ｂ）に示すように、隣接するブロックで水平および垂直に1画素重なるようなブロック分割を提案する。これにより、従来手法では画像中の１／９の画素が白黒を変化させる対象となっていたが、この手法では、画像中の１／４の画素がこの対象となる。これにより、同じ画像により多くの情報を埋め込めるようになる。
【００４３】
ここで、可変得点が大きいブロックは、なめらかさが小さく複雑なパターンを持つブロックであることに注意されたい。このようなブロックは、ロゴのエッジ部分に多く存在する。結果として、情報埋め込みはロゴのエッジ部分に多くなされることになる。
逆に言えば、埋め込める情報量はロゴがどれほど複雑なエッジを持つかによって変わることになる。単純なロゴに対しては埋め込める情報量が少なくなるが、ロゴ画像内に文字を含めることで埋め込める情報量を増やすこともできる。ロゴ画像の複雑さによる埋め込み情報量の違いはでてくる。
【００４４】
（埋め込み情報量の向上）
可変得点を用いた情報埋め込みでは、ロゴ画像にどれほどエッジが含まれるかによって、埋め込める情報量が異なる。例えば、１１１×８０の大きさのロゴ画像に対して、埋め込み容量がどれほどとなるかを調べる。また、隣接するブロックを重なりなく設定する場合と、水平垂直に重ねて設定する場合でどれほど異なるかについても調べた。図１２にこの結果を示す。ロゴ画像の形状により、埋め込める情報量が異なることがわかる。図１３（ａ）や図１３（ｃ）のように多くのエッジで構成されるロゴ画像や、図１３（ｂ）のような傾いたエッジで構成されるロゴ画像では、エッジ部分で可変得点が大きくなるために、埋め込める情報量が多くなる。一方、図１３（ｄ）や図１３（ｅ）、図１３（ｆ）のように、あまりエッジが多くないようなロゴ画像では埋め込める情報量が少なくなる。また、ブロック分割を水平垂直に重ねて設定することで、
９１％から１７２％の埋め込み情報量の増加が行えた。ＩＰｖ４のアドレスを表現するのに必要な情報量は３２ビットであるので、ある程度単純なロゴ画像から生成されるＢｅ−ｃｏｄｅであっても、ＩＰｖ４のアドレスを表現するのに十分な情報量を埋め込むことができるといえる。
【００４５】
（グレースケール画像への情報埋め込み）
次に、グレースケール画像への情報埋め込みについて説明する。
【００４６】
前述の可変得点を用いた情報埋め込みと情報読み取りの手法は、二値画像を対象としていた。一般的に明暗の２色で構成されているように見えるロゴ画像でも、ロゴの縁の部分ではアンチエイリアシングが施されていることが多い。アンチエイリアシングは、エッジ付近の画素にグレースケールの値を割り当てることで実現される。アンチエイリアシングが施された画像を二値化すると、ジャギーが目立ち、デザイン性が損なわれることがある。この問題は、コード化の対象となる画像を二値化処理の妨げとならないようにグレースケール化することで解決できる。アンチエイリアシングを含むグレースケール画像中の注目画素の値をｖ、二値化の閾値をｇｔｈとする。ｇｔｈはグレースケールの原画像に対して大津の閾値判定法を用いることで決定する。ｖがｇｔｈに近ければ、照明変化などにより二値化の結果が変わることがある。そこで、照明変化の影響を受けやすい範囲を黒側の基準値ｂｔｈ=ｇｔｈ―ｄｂと白側の基準値ｗｔｈ＝ｇｔｈ＋ｄｗで定義し、すべての画素がこの範囲内の値を取らないように以下の処理を行う（図７参照）。ただし、ｄｂ、ｄｗは照明変動の大きさを反映した閾値である。
【００４７】
（１）ｂｔｈ＜ｖ＜ｇｔｈであるとき、ｖ＝ｂｔｈとする
（２）ｇｔｈ≦ ｖ＜ｗｔｈであるとき、ｖ＝ｗｔｈとする
（３）ｖ≦ｂｔｈ、ｖ≧ｗｔｈであるとき、変更しない
ｇｔｈは画像ごとに異なるので、ｄｂとｄｗを固定値とすると、白側や黒側のいずれかのレンジが極端に狭くなることがある。ｄｂとｄｗをそれぞれ０からｇｔｈおよびｇｔｈから２５５の幅を考慮して相対的に決定することで、この問題を避けることができる。幅の割合を決定するための係数をｃ（０≦ｃ≦１）とすると、ｄｂとｄｗは以下の数式２及び３で求めるものとする。
【００４８】
【数２】

【００４９】
【数３】

【００５０】
さらに、情報埋め込みの白黒の反転の際にも、以下のように画素値を変更することで、原画像からの変化を少なくすることができる。
（１）ｖ≦ｂｔｈを白に変更するときには、ｖ＝ｗｔｈとする
（２）ｖ≧ｗｔｈを黒に変更するときには、ｖ＝ｂｔｈとする
図８には、二値化画像をコード化したものとグレースケール画像をコード化したものを示す。グレースケール画像をコード化したものでは、エイリアシングが軽減されていることがわかる。
【００５１】
（リード・ソロモン符号を用いた誤り訂正と読み取り成否）
次に、リード・ソロモン符号を用いた誤り訂正と読み取り成否の判定について述べる。観測画像から原画像の復元を行うときには、画素の反転が起こることがある。そこで、Ｂｅ−ｃｏｄｅに埋め込む情報には、ＱＲコードにも採用されている誤り訂正符号の一種であるリード・ソロモン符号を採用する。リード・ソロモン符号を用いることで、少数の誤りに対しては訂正できるようになる。訂正能力を超えた誤りが起こった場合にも、読み取りに失敗したことが判定でき、読み取れるまで画像取得を続けることを促すことができる。
リード・ソロモン符号を用いた情報埋め込みでは、入力されたデータ符号を８ビット１シンボルとして区切り、有限体に基づいて生成される多項式によって、誤り訂正符号を求める。誤り訂正符号をデータ符号に付加したものを通信符号とし、画像に情報を埋め込む。情報の読み取りでは、通信符号に誤りを含んだ受信符号が取得される。受信符号に対し、まず誤りの検索を行い、受信符号に誤りが含まれているか、また、その誤りが訂正可能であるかを判断する。誤りが含まれており、さらにその誤りを訂正可能である場合には、誤り位置多項式によって誤り位置を算出し、訂正する。これにより、誤りのない元の通信符号を復号することができる。誤りが含まれているが、その誤りが訂正不可能である場合には、読み取りに失敗したと通知し、利用者に再度読み取りを促すこととする。
【００５２】
次にフレームマーカ及び方向検出マーカの配置について説明する（ＳＴＥＰ２）。
【００５３】
フレームマーカ(ｆｒａｍｅｍａｒｋｅｒ)は、観測画像から元のロゴ画像の座標系に変換するためのマーカである。それぞれのマーカはｍ×ｍ画素で黒色の矩形領域であり、エンブレムエリアの外側の四隅に配置される。フレームマーカの内側には、１×１画素で黒色の方向検出マーカ（ｄｉｒｅｃｔｉｏｎｍａｒｋｅｒ）を左上の隅にのみ配置し、画像が回転しても正しい向きで画像復元できるようにしている。フレームマーカと方向検出マーカの間には、１画素分の白色のスペースを取る。フレームマーカを用いて原画像の座標系に変換する方法については、後述する。また、Ｂｅ−ｃｏｄｅの周囲に文字や絵があってもフレームマーカが検出できるように、フレームマーカの外側には白色で１画素以上のマージン（ｍａｒｇｉｎ）を設ける。
【００５４】
（原画像復元のためのフレーム付加）
では、フレームマーカを用いて原画像の座標系に変換する方法について、説明する。
【００５５】
カメラで観測する画像で情報読み込みを実現するためには、まず観測画像を原画像の座標系に変換する必要がある。本発明では、図４に示したように、画像の周囲に小さなマー
カを付加することで原画像の座標系への復元を行う。原画像には、上述した可変得点によって情報埋め込みが行われる。このとき、原画像の向きを表現するために、画像の左上に方向検出マーカを付加する。方向検出マーカとその外側の白色のスペースによって、画像の四辺は２画素分ずつ外に膨らむ。このときの画像のサイズをｗ×ｈ画素とする。
さらに、この画像の四隅にｍ×ｍ画素の黒色矩形領域から構成されるフレームマーカを付加する。図９に例を示す。図９（ａ）の原画像から構成されるＢｅ−ｃｏｄｅは、図９（ｂ）に示すようになる。
【００５６】
原画像復元のためには、まず、観測した画像からＢｅ−ｃｏｄｅのフレームマーカを検出する。ここで、観測画像は白黒の二値で表現されているものとして議論を進める。観測画像の二値化については、後述する。観測画像中の黒色領域をラベリングし、連結領域に分割する。このとき、図１０に示すように、それぞれの分割領域に外接する長方形のうち、面積が最小となるものを求める。この長方形は、ｒｏｔａｔｉｎｇｃａｌｉｐｅｒｓ法によって求めることができる。フレームマーカは黒色で塗りつぶされた矩形領域であるので、外接する。
【００５７】
長方形の内部は図１０（ａ）に示すように黒色領域の割合が高くなる。その他の一般領域では、図１０（ｂ）に示すように黒色でない領域が多く含まれることになる。黒色である割合に閾値を設定して、フレームマーカを検出する。フレームマーカの一辺の大きさｍを大きくするほど閾値を高く設定できることになるので、一般領域との判別が容易となる。
【００５８】
原画像上の四隅のフレームマーカの外側の点(０，０)，(ｗ＋２ｍ，０)，（ｗ＋２ｍ，ｈ＋２ｍ），（０，ｈ＋２ｍ）を（ｘｉ，ｙｉ）（ｉ＝０，１，２，３）と表すことにする。Ｂｅ―ｃｏｄｅは平面上に貼られているので、観測画像から原画像への変換は３×３の平面射影変換Ｐで記述することができる。観測画像上で四隅のフレームマーカの外側の点（ｘ’ｉ，ｙ’ｉ）（ｉ＝０，１，２，３）を求めることができれば、原画像上の４点（ｘｉ、ｙｉ）（ｉ＝０，１，２，３）との関係はＰを用いて以下の数式４から６ように記述される。
【００５９】
【数４】

【００６０】
【数５】

【００６１】
【数６】

【００６２】
数式５及び６によって、８つの未知数に対して８つの方程式を立てることができ、Ｐの各要素の値を求めることができる。ｗ，ｈは、観測画像上でフレームマーカの大きさとエンブレムエリアの大きさの比から推定することができる。これによって、ｗ，ｈをあらかじめ規定することなくＢｅ−ｃｏｄｅを読み取ることが可能になる。推定手順は以下の通りである。まず、仮の射影変換行列Ｐ’を求めるために、任意の定数ｗ’，ｈ’を用いて（ｘｉ，ｙｉ）（ｉ＝０，１，２，３）を定義する。Ｐ’は数式４及び５から求められる。Ｐ’を用いることで、観測画像からＢｅ−ｃｏｄｅが長方形に映るような画像を得ることができる。このときに、縦横比は正しくは得られないが、フレームマーカの大きさとエンブレムエリアの大きさの比を求めるためには問題とならない。
【００６３】
Ｐ’を用いて復元されたフレームマーカの大きさがｍ’ｘ×ｍ’ｙとなるすると、ｗとｈの推定値〜ｗ（チルダｗ），〜ｈ（チルダｈ）は以下の数式７，８で求められる。
【００６４】
【数７】

【００６５】
【数８】

【００６６】

このときに、ｍが小さければ〜ｗ（チルダｗ），〜ｈ（チルダｈ）が１画素単位で正しく求まることは期待できない。そこで、原画像の大きさｗ，ｈがそれぞれN の定数倍であるという制約を設け、推定のときには〜ｗと〜ｈに最も近いＮの定数倍とすることで推定誤りを避ける。今回の実装ではＮ＝１０とした。このとき、〜ｗ（チルダｗ），〜ｈ（チルダｈ）を四捨五入することで原画像の大きさｗ、ｈの推定値を得ることができる。ｗ，ｈが推定できれば、観測画像と原画像の間の平面射影変換行列を改めて求め、原画像を復元する。
【００６７】
（観測画像の適応的二値化）
次に、観測画像の適応的二値化について説明する。フレームマーカの検出および原画像の復元のためには、観測画像を二値化する必要がある。照明環境により、観測画像の濃淡はマーカ内でも変化する可能性があるので、位置に対して適応的に閾値を設定することが必要となる。ＱＲコードでは、コード内のマーカで区切られたブロックごとに二値化の閾値を設定している。これによって、局所的に陰影が生じる場合にも、正しく二値化を行うことができる。ただし、この処理は各ブロック内に白黒の領域が両方含まれることを前提に行われている。Ｂｅ―ｃｏｄｅでは、ＱＲコードのように小さなブロックごとで適応的に閾値を決定しようとすると、あるブロックでは白の画素あるいは黒の画素のみしか含まれないことが起こり、正しい閾値を得ることができない。そこで、図１１に示すように観測画像を中心から上下左右で４分割し、それぞれの領域で適応的に二値化の閾値を決めることとする。Ｂｅ−ｃｏｄｅが中央に配置されていれば、フレームマーカがそれぞれの分割領域で観測されることになるので、それぞれの領域が白黒両方の領域を含むことが保証できる。閾値の決定には、大津の閾値判定法（大津展之“判別および最少２乗基準に基づく自動しきい値選定法、”電子通信学会論文誌、vol．63、no．4、pp．349-356、1980）を用いた。この判定法では、明るさのヒストグラムが双峰性を持つと仮定して、２つの山の境界となる値を二値化の閾値とする。
【００６８】
次に、情報復元装置５０の処理手順について、図３のフローチャートを用いて説明する。情報復元装置５０は、情報埋込装置１０により生成された情報埋込画像を撮影することで観測画像を取得するものであって、取得された観測画像から、フレームマーカおよび方向検出マーカを検出するマーカ検出部（不図示）と、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元する画像処理部（不図示）とを備える。
【００６９】
情報復元装置５０は、情報埋め込み画像を撮影し、（ＳＴＥＰ３）。上述した観測画像と原画像の間の平面射影行列を改めて求め、原画像を復元する（ＳＴＥＰ４）。情報復元装置５０は、上述したように、リード・ソロモン符号を用いた誤り訂正により、情報の読み取りを行う（ＳＴＥＰ５）。具体的には、情報埋込装置１０により生成された情報埋込画像を撮影することで観測画像を取得するに際し、取得された観測画像から、フレームマーカおよび方向検出マーカを検出し、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元する。例えば、ソニーエリクソン社製携帯端末Ｘｐｅｒｉａ（ＳＯ―０１Ｂ）を用いた実験例をもって説明する。実験では、図１３（ａ）および図１３（ｂ）、図１３（ｃ）に示す原画像から生成されるＢｅ−ｃｏｄｅを対象とし、一般的な室内環境で行った。二値化処理を考慮したグレースケール化のための係数ｃを１／３、１／２、１としたものを対象とした。原画像とc を変えたＢｅ−ｃｏｄｅを各１００回撮影し、情報読み取りの精度を調べた。図１２（ａ）は撮影の様子であり、図１２（ｂ）は実際の観測画像の例である。
【００７０】
まず、c と読み取り角度、読み取り成功率の関係を調べた。図１３（ａ）、図１３（ｂ）、図１３（ｃ）に示した原画像から生成されるＢｅ−ｃｏｄｅを机上に置き、１００回ずつ自由に撮影を行ってもらった。各画像で平面射影変換行列が求まれば、Ｂｅ−ｃｏｄｅが貼り付けられた平面と観測画像平面とのなす角度を得ることができる。平面射影変換が正しく得られない観測画像については、観測画像上でフレームマーカの位置を手動で指定することで正しい平面射影変換を与えた。これらの角度の５度ごとの頻度を求め、角度ごとの読み取り成功率を示したのが図１４である。観測角度の頻度を見ると、いずれのＢｅ−ｃｏｄｅにおいても１０度以上１５度未満、または、１５度以上２０度未満で最頻値を取ることがわかる。一方で、３０度以上で撮影された観測画像はなかった。これは、Ｂｅ−ｃｏｄｅを撮影する際に、正面ではなくこの角度から撮影されることが多いことを示している。このことから、射影ひずみを考慮できる平面射影変換を用いて原画像を復元することが有用であることがわかる。
【００７１】
次に、それぞれの角度ごとの読み取り成功率について検討する。ｃ＝１／２のときにはサルで２枚、ｃ＝１のときには手紙で１枚のみで読み取りに失敗した。このことから、ｃを１／２以上に設定しておけば、すべての観測画像に対して高い精度で読み取ることができるといえる。ｃ＝１／３のときには、観測角度が大きくなるほど読み取り精度が落ちる傾向がある。また、観測角度が小さいときにもｃ＝１／２とするときに比べて読み取り精度は低いこともわかる。読み取り結果を詳細に検証すると、ｃを小さくしたときに読み取りができなかった観測画像では、うまく焦点が合っていないことが確かめられた。これは、エッジ付近にグレースケールの値を加えることで、エッジの高周波成分が失われ、カメラのオートフォーカス機能がうまく働かなかったためと考えられる。焦点が合っていないと、観測画像に焦点ぼけが生じ、正しい二値化画像を得ることができない。観測角度が大きくなるにつれて読み取り精度が悪くなる原因も、焦点ぼけにあると考えられる。画像コードを接写して撮影すると焦点距離が短くなり、被写界深度が浅くなるために、結果として焦点ぼけが大きくなる。観測画像上を詳しく見ると、焦点が合っていない領域があることが確かめられた。これによって、マーカ内部の一部の画素で白黒の反転が起こっていた。カメラを離した上でズームして撮影することができれば、この問題は一部解決することができると考えられる。
【００７２】
以上の結果から、観測角度が３０度未満であるときには、ｃを１／２以上に設定することで、高い読み取り精度を保証できるといえる。今回実験した環境では、３０度以上の角度で観測されることはなかった。ｃを小さくするときには、観測角度が大きくなるほどに読み取り精度は下がる。
【００７３】
一方で、Ｂｅ−ｃｏｄｅにはリード・ソロモン符号が導入されているので、少数の誤りは訂正されており、また、訂正能力を超える誤りは検出することができる。訂正能力を超えた誤りが起こった場合には、ユーザに再撮影を促すようにシステムを設計している。
【００７４】
次にグレースケール化によるデザイン性向上の検証について説明する。Ｂｅ−ｃｏｄｅのデザイン性の確保のために原画像のグレースケールの値を利用しており、グレースケール化のための係数ｃは小さい方がよい。ここでは、ｃの値を小さくすることによるデザイン性の向上について、検証する。例えば、上述したｃ＝１／３としたときとｃ＝１／２としたときとで読み取り精度に差があることを述べた。読み取りのことを考慮すると、精度が低下しにくいｃ＝１／２に留めておくべきである。このことから、被験者実験ではc を１／２以上とするときの見た目の変化を調べた。図１３（ａ）、図１３（ｂ）、図１３（ｃ）に示すサル、手紙、結晶の原画像に対して、ｃ＝０．５，０．６，０．７，０．８としてＢｅ−ｃｏｄｅを生成した。これらとｃ＝０として生成されたＢｅ―ｃｏｄｅとの比較を行い、ＰＳＮＲを求めたものを表１に示す。ｃ＝０とするときには、原画像とＢｅ―ｃｏｄｅとの画素値の差は高々１となり、原画像のグレースケールの値はほぼ保存されることになる。
【００７５】
【表１】

【００７６】
ＰＳＮＲの値が大きいほど、比較される２つの画像が近いといえる。表１から、ｃの値を小さくするほど原画像に近いＢｅ−ｃｏｄｅが得られることがわかる。また、同じｃの値を設定したときにも、ロゴ画像によってＰＳＮＲの値に差があることもわかる。サルの画像から生成されるＢｅ−ｃｏｄｅでは、ｃを大きくすると他の画像よりもＰＳＮＲが小さくなった。
【００７７】
次に、ｃの設定が見た目の変化に与える影響について、被験者実験によって調べた。実験のためには、シェッフェの一対比較法の浦の変法を採用した。この方法では、すべての被験者がすべてのサンプル対について評価を行う。サンプルは１つずつ提示され、その順序効果についても考慮がなされる。ｃの値が異なる２つのＢｅ−ｃｏｄｅについて、ｃ＝０で作成されたＢｅ−ｃｏｄｅに近いのはどちらかを答えてもらった。被験者は大学生１０名(男子７名、女子３名) とした。評価項目は以下の通りである。ただし、先に提示する方をＡ、後に提示する方をＢとする。
評価値:
＋２：ＡがＢより非常に近い
＋１：ＡがＢよりやや近い
０：ＡとＢは同等である
―１：ＢがＡよりやや近い
―２：ＢがＡより非常に近い
サル、手紙、結晶のいずれにおいても、主効果は０．０１の有意水準で有意であった。その他の効果について、有意差は得られなかった。
【００７８】
表２に比較実験の結果を示す。表２の結果からは、すべてのロゴ画像について、ｃの値が小さなＢｅ−ｃｏｄｅはｃの値が大きなＢｅ−ｃｏｄｅよりも、ｃ＝０のＢｅ−ｃｏｄｅに有意に近いか、もしくは、有意には変わらないことがわかる。このことから、c の値を小さくすることで見た目は向上するか、あるいは、変わらないと結論づけられる。読み取りのことを考慮すると、精度が低下しにくいｃ＝０．５に留めておくべきである。
【００７９】
【表２】

【００８０】
以上により、ロゴ画像などの単純な画像に対して、デザイン性を確保したまま情報埋め込みを実現するＢｅ−ｃｏｄｅを提案した。可変得点が０．５以上のブロックに対し、中心画素の明暗を変化させることによって、情報埋め込みを行う。カメラでの観測による情報読み取りを可能にするために、フレームを付加し、平面射影変換を求めることで原画像を復元できるようにした。また、デザイン性をさらに確保するために、グレースケール画像に対する情報埋め込みの手法を提案した。実験では、埋め込める情報量および携帯端末による読み取り精度と確保されるデザイン性の関係について検証した。今後の課題として、焦点を合わせやすいパターンの開発を目指す。実験では、射影によって観測距離に幅ができることによる読み取りの失敗と、パターンに高周波がなくなることによりオートフォーカスがうまく働かないことによる読み取りの失敗が見られた。前者は、Ｂｅ−ｃｏｄｅの中心部に焦点が合わせた場合に、Ｂｅ−ｃｏｄｅ周辺部で焦点が合わなくなることが問題となる。周辺部では焦点が合っていなくても読み取れるようにするためには、周辺部の画素の大きさを調整することで実現できると考えている。後者は、画像全体で高周波成分が失われることが問題であり、オートフォーカスのためにＢｅ−ｃｏｄｅの一部に高周波成分を残しておくことで解決できると考えている。
【００８１】
情報埋込装置１０によれば、原画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置し、フレームマーカのうちいずれか一つを基準として、オブジェクト側に所定の画素領域から構成される方向検出マーカを、原画像に配置することにより、ロゴやオブジェクトを囲むドットフレームを配置することなく、情報を埋め込んだ画像を生成することができる。
【００８２】
また、情報埋込装置１０によれば、オブジェクトのエッジ部分に情報を埋め込むに際し、原画像を水平および垂直方向に１画素ずつ重なるように所定の画素ブロックに分割し、可変得点を用いることにより、多くの情報を埋め込むことを可能とする。
また、情報埋込装置１０によれば、原画像をグレースケール化することで、情報埋込画像を生成することにより、原画像がアンチェインリアシングされていても、デザイン性を損なわないことを可能とする。
【００８３】
また、情報復元装置５０によれば、取得された観測画像から、フレームマーカおよび方向検出マーカを検出し、検出されたマーカから観測画像から原画像の座標系に変換および、観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、埋め込まれた情報を復元することができる。
【００８４】
また、情報復元装置５０によれば、埋め込まれた情報であるリード・ソロモン符号から誤り訂正符号を求める際には、訂正能力を超えた誤りが起こった場合にも、読み取りに失敗することを判定できる。

【符号の説明】
【００８５】
５プリンタ
１５印刷物
１０情報埋込装置
５０情報復元装置

【特許請求の範囲】
【請求項１】
オブジェクトを表す原画像を取得し、該原画像から、前記オブジェクト全体の形態を一定に保持しつつ、前記オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成する情報埋込装置において、
前記情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置するフレームマーカ配置部と、
前記フレームマーカのうちいずれか一つを基準として、前記オブジェクト側に所定の画素領域から構成される方向検出マーカを、前記情報埋込画像に配置する方向検出マーカ配置部とを備えたことを特徴とする情報埋込装置。
【請求項２】
前記フレームマーカは、前記原画像の座標系に変換するためのものであることを特徴とする請求項１記載の情報埋込装置。
【請求項３】
前記方向検出マーカは、前記オブジェクトを表す原画像の正しい向きに画像復元するためのものであることを特徴とする請求項１または２記載の情報埋込装置。
【請求項４】
前記方向検出マーカは、前記フレームマーカのうちの左隅のものを基準として配置されたものであることを特徴とする請求項１から３いずれか１項記載の情報埋込装置。
【請求項５】
前記フレームマーカの外側には白色であって、１画素以上のマージンを設けることを特徴とする請求項１から４いずれか１項記載の情報埋込装置。
【請求項６】
前記フレームマーカと前記方向検出マーカの間には、少なくとも１画素分の白色のスペースを設けることを特徴とする１から５いずれか１項記載の情報埋込装置。
【請求項７】
前記オブジェクトのエッジ部分に情報を埋め込むに際し、前記原画像を水平および垂直方向に１画素ずつ重なるように所定の画素ブロックに分割し、可変得点を用いることを特徴とする請求項１から６いずれか１項記載の情報埋込装置。
【請求項８】
前記原画像をグレースケール化することで、情報埋込画像を生成するものであることを特徴とする請求項１から７いずれか１項記載の情報埋込装置。
【請求項９】
前記埋め込まれた情報は、リード・ソロモン符号を用いたことを特徴とする請求項１から８いずれか１項記載の情報埋込装置。
【請求項１０】
前記情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得する情報復元装置において、
前記取得された観測画像から、前記フレームマーカおよび方向検出マーカを検出するマーカ検出部と、
前記検出されたマーカから前記観測画像から前記原画像の座標系に変換および、前記観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、前記埋め込まれた情報を復元する画像処理部とを備えたことを特徴とする請求項１から９いずれか１項記載の情報復元装置。
【請求項１１】
前記情報復元装置は、前記埋め込まれた情報であるリード・ソロモン符号から誤り訂正符号を求めることを特徴とする請求項１０記載の情報復元装置。
【請求項１２】
オブジェクトを表す原画像を取得し、該原画像から、前記オブジェクト全体の形態を一定に保持しつつ、前記オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成する情報埋込方法において、
前記情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置し、
前記フレームマーカのうちいずれか一つを基準として、前記オブジェクト側に所定の画素領域から構成される方向検出マーカを、前記情報埋込画像に配置することを特徴とする情報埋込装置。
【請求項１３】
前記情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得する情報復元方法において、
前記取得された観測画像から、前記フレームマーカおよび方向検出マーカを検出し、
前記検出されたマーカから前記観測画像から前記原画像の座標系に変換および、前記観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、前記埋め込まれた情報を復元することを特徴とする請求項１から９いずれか１項記載の情報復元方法。
【請求項１４】
オブジェクトを表す原画像を取得し、該原画像から、前記オブジェクト全体の形態を一定に保持しつつ、前記オブジェクトのエッジ部分に情報を埋め込んだ情報埋込画像を生成する情報埋込プログラムにおいて、
コンピュータに、前記情報埋込画像の四隅それぞれに、所定の画素領域から構成されるフレームマーカを配置する機能と、
前記フレームマーカのうちいずれか一つを基準として、前記オブジェクト側に所定の画素領域から構成される方向検出マーカを、前記情報埋込画像に配置する機能とを実現させることを特徴とする情報埋込プログラム。
【請求項１５】
前記情報埋込装置により生成された情報埋込画像を撮影することで観測画像を取得する情報復元プログラムにおいて、
コンピュータに、前記取得された観測画像から、前記フレームマーカおよび方向検出マーカを検出する機能と、
前記検出されたマーカから前記観測画像から前記原画像の座標系に変換および、前記観測画像を原画像の向きに変換し、該変換された観測画像を二値化し、該二値化された観測画像を平面射影変換することにより、原画像を復元し、前記埋め込まれた情報を復元する機能とを実現することを特徴とする請求項１から９いずれか１項記載の情報復元プログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【公開番号】特開２０１３−４２４６５（Ｐ２０１３−４２４６５Ａ）
【公開日】平成２５年２月２８日（２０１３．２．２８）
【国際特許分類】

【出願番号】特願２０１１−１７９８５４（Ｐ２０１１−１７９８５４）
【出願日】平成２３年８月１９日（２０１１．８．１９）
【新規性喪失の例外の表示】特許法第３０条第１項適用申請有り　一般社団法人　画像電子学会，２０１１年６月２４日発行　国立大学法人山梨大学　２０１１年２月２２日発行　国立大学法人山梨大学　２０１１年２月２２日発行
【公序良俗違反の表示】
（特許庁注：以下のものは登録商標）
１．ＱＲコード
【出願人】（３０４０２３９９４）国立大学法人山梨大学 (223)
【出願人】（５０４２２６６７４）株式会社クレスコ (1)
【Ｆターム（参考）】

[ Back to top ]

情報埋込装置、情報復元装置、情報埋込方法、情報復元方法、情報埋込プログラム及び情報復元プログラム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

情報埋込装置、情報復元装置、情報埋込方法、情報復元方法、情報埋込プログラム及び情報復元プログラム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク