表示物の生成方法、デジタルメディア提供システム、それらのためのコンピュータプログラムおよび表示物体
【課題】対象ドキュメントのコンテンツへの視覚的な影響が少なくユーザには認識が容易な、ドキュメントの部分領域にリンクされたデジタルメディアに容易にアクセスできる技術を提供する。
【解決手段】ドキュメントの部分領域に重なるようにデジタルメディアがリンクされていることを示す埋め込み型メディアマーカ(EMM: Embedded Media Marker)を配置する。EMMの領域内にはドキュメントの部分を識別するのに十分な特徴点が含まれるように調整されて配置され、これらの特徴点に関する情報がリンクされたデジタルメディアと関連付けられてデータベース上に保存される。ユーザは、このEMMの写真を撮影し、その写真の特徴点を解析することで、リンクされたデジタルメディアを取得することができる。
【解決手段】ドキュメントの部分領域に重なるようにデジタルメディアがリンクされていることを示す埋め込み型メディアマーカ(EMM: Embedded Media Marker)を配置する。EMMの領域内にはドキュメントの部分を識別するのに十分な特徴点が含まれるように調整されて配置され、これらの特徴点に関する情報がリンクされたデジタルメディアと関連付けられてデータベース上に保存される。ユーザは、このEMMの写真を撮影し、その写真の特徴点を解析することで、リンクされたデジタルメディアを取得することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルメディアの埋め込みマーカを設けた表示物の生成方法、この表示物を用いてデジタルメディアを提供するシステム、それらに用いられるソフトウェア、そして表示物に関する。
【背景技術】
【0002】
紙媒体は情報を閲覧する媒体としては最も広く利用されている媒体ではあるが、ビデオ、音楽といった動的なメディアを再生することはできない。一方、携帯電話による音楽やビデオの再生が盛んになってきてはいるが、紙の持つ、高い解像度、大きな表示面積、情報配置の柔軟性、屋外での視認性や静的なコンテンツに対する強健さには敵わない。現在、画像認識技術を用いることで紙ドキュメントに対応する動的メディアへリンクをすることが可能となっている。携帯電話に内蔵されているカメラでドキュメントの部分的な画像を撮影する。ドキュメントの部分画像はその画像中にある特徴を用いて識別され、そのドキュメント中にリンクされたデジタルメディアが検索され、携帯電話上で再生される。
【0003】
こうした紙ドキュメント上のメディアリンクを作成するタイプの方法で一般的なのは、ドキュメント上にコード化したマーカを印刷するものである。そうしたマーカの例としては、2次元バーコード、ドットの印刷パターンが良く知られている(非特許文献1)。しかしながら、こうしたマーカは視覚的にも、ドキュメントのコンテンツの配置の点でも邪魔になる。データグリフ(非特許文献2)は、紙上に、見えにくい、機械が認識可能なパターンを印刷することでこうした問題を解消しようとしている。しかし、このタイプのマーカは高解像度のプリンターとドキュメント識別用のカメラとが必要となる。電子的なマーカ、例えばRFIDを使用することも可能であるが(非特許文献3)、生成コストが増加してしまう。
【0004】
他のシステムではドキュメントコンテンツ自体の特徴を使って、関連するドキュメントの部分画像を識別し、それをメディアリンクを作成するのに用いている。例えば、HOTPAPER(非特許文献4)、Mobile Retriever(非特許文献5)は、単語の空間配置のようなドキュメント中のテキストに基づいた特徴を用いている。Bookmarkr(非特許文献6)やMapSnapper(非特許文献7)は、画素レベルの特徴(例えばSIFTアルゴリズム)を、写真や図といった一般的なドキュメントコンテントを識別するのに用いている。こうしたシステムでは、視覚的に邪魔になるマークは識別に必要にはならない。
【0005】
しかしながら、既存のマーカを用いた方法とコンテンツに基づく方法とはともにリンクされたメディアの種類がわからない。バーコードとデータグリフは眼に見えるが、そこに関連付けられたメディアの存在や種類を直接示してはいない。コンテンツの特徴を使用する場合には、ドキュメントへのメディアのリンクについて、ユーザが一見して分かる形では、紙上に何も示さない。この結果、例えば先のHotPaperでは、ホットスポットを探すためには、携帯電話による撮影画像上に赤いドットが表示されたり、振動が発生するなどのフィードバックがあるまで、紙の上を携帯電話のカメラを移動させる必要がある。
【0006】
しかし、可視、不可視のバーコード、データグリフ、アノトパターンといった既存技術はユーザが入手可能なマルチメディアに関して、意味ある情報をユーザに提供しない。
【0007】
従って、目障りでなく、レイアウトへの制約が少なく、プリンターやカメラの解像度への依存度が低い、埋込マーカが必要とされている。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】ブレント ヘフト(B. Hecht)外3名、「ウィキアイ−場所情報で参照されたウィキペディアコンテントを探索するためのマジックレンズの利用(Wikeye - Using Magic Lenses to Explore Georeferenced Wikipedia Content)」、第3回携帯インタラクションデバイスの普及に関する国際ワークショップ予稿集(Proceedings of the 3rd International Workshop on Pervasive Mobile Interaction Devices (PERMID))、2007年、p.6−10
【非特許文献2】デイビッド ヘフト(David Hecht)、「ハードコピーデジタルドキュメントのための埋込みデータグリフ技術(Embedded Data Glyph Technology for Hardcopy Digital Documents)」、SPIE−カラーハードコピーとグラフィックス技術III(SPIE -Color Hard Copy and Graphics Arts III)、1994年2月、第2171巻、p.341−352
【非特許文献3】デレク レイリー(Derek Reilly)外4名、「マークアップマップ、紙の地図と電子情報源との組み合わせ(Marked-up maps: combining paper maps and electronic information resources)」、パーソナルおよびユビキタスコンピューティング(Personal and Ubiquitous Computing)、2006年、第10巻第4号、p.215−226
【非特許文献4】ベルナ エロール(Berna Erol)外2名、「ホットペーパー:携帯電話を用いた紙のマルチメディアインタラクション(HOTPAPER: multimedia interaction with paper using mobile phones)」、マルチメディア予稿集、2008年、p.399−408
【非特許文献5】フー リュウ(Xu Liu)外1名、「モバイルリトリバー:物体源からのデジタルドキュメントへのアクセス(Mobile Retriever: access to digital documents from their physical source)」、ドキュメント分析と認識の国際誌(Int. J. Doc. Anal. Recognit.)、2008年、第11巻第1号、p.19−27
【非特許文献6】ネイルス ヘンゼ(Neils Henze)外1名, 「撮影しあなたのフォトブックを共有する(Snap and share your photobooks)」、マルチメディア予稿集(Proceedings of Multimedia)、2008年、p.409−418
【非特許文献7】ジョナサン ハレ(Jonathan Hare)外3名、「マップスナッパー:携帯電話からの画像適合のための効率的アルゴリズム(MapSnapper: Engineering an Efficient Algorithm for Matching Images of Maps from Mobile Phones)」、SPIE予稿集、2008年、第6820巻、pp 68200L-68200L-11
【非特許文献8】チョン リュウ(Qiong Liu)外4名、「高速不変変換を用いた高精度かつ言語非依存のドキュメント検索(High Accuracy and Language Independent Document Retrieval With A Fast Invariant Transform)」、ICME予稿集(Proceedings of ICME)、2009年、p.386−389
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、上述したような、媒体上のマーカを用いてリンクされたメディアにアクセスする既存のシステムあるいは方法が有していた課題の少なくとも一部を解決することを目的とする。
【課題を解決するための手段】
【0010】
本発明の一形態である、表示物の生成方法は、付加的なデジタルメディアを提供するために用いる表示物の生成方法であって、表示媒体の表示面の上に表示されるコンテント情報を取得し、前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、前記表示条件に基づいて前記マーカを出力し、少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、ことを特徴とする。
さらに別の態様では、表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする。
さらに別の態様では、表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする。
さらに別の態様では マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする。
さらに別の態様では、表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする。
さらに別の態様では、表示媒体の表面上に前記コンテント情報と前記表示条件とに基づいて前記マーカを合成して出力することを特徴とする。
さらに別の態様では、マーカを、前記表示条件に応じて、透光性を有する基材上に印刷出力し、前記表示媒体の表面上に前記コンテント情報を出力し、前記表示媒体と前記基材とを重ね合わせて表示物を構成することを特徴とする。
本発明の別の形態である、デジタルメディアを提供するシステムは、上記の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するシステムであって、前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、を備えることを特徴とする。
本発明の別の形態である、表示物を生成するためのコンピュータプログラムは、付加的なデジタルメディアを提供するために用いる表示物を生成するためのコンピュータプログラムであって、コンピュータを、前記表示媒体の表示面の上に表示されるコンテント情報を取得し、前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、前記表示条件に基づいて前記マーカを出力し、少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶するように動作させるためのコンピュータプログラムである。
さらに別の態様では、表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする。
さらに別の態様では、表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする。
さらに別の態様では、マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする。
さらに別の態様では、表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする。
さらに本発明の別の形態である、上記の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するためのコンピュータプログラムは、コンピュータを、前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、として動作させるためコンピュータプログラムである。
さらに本発明の別の形態である、表示物体は、表示面と、前記表示面の上に表示されたコンテント情報と、前記表示面の上の所定の位置にデジタルメディアが関連付けられていることを表示し、前記所定の位置の近傍の前記表示面の一部の領域の境界を表示するとともに、前記境界の内側に位置する前記コンテント情報が前記境界の内側に表示されるマーカと、を備え、前記デジタルメディアの取得に必要となる情報と画像特徴とを関連付けた関連付け情報の組を記憶する記憶手段を用いて、前記領域を特定するのに十分な量の前記コンテント情報の画像特徴が、前記マーカの前記境界の内側に含まれることを特徴とする。
さらに別の態様では、所定の位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所を前記境界の内側に含むように前記マーカが配置されていることを特徴とする。
さらに別の態様では、境界内には前記デジタルメディアに関連するアイコン画像を含むことを特徴とする。
さらに別の態様では、アイコン画像は、前記境界の内側で前記画像特徴の量が少ない箇所に配置されることを特徴とする。
【発明の効果】
【0011】
本発明によれば、従来のコード画像と比べて、ドキュメントコンテントのレイアウト上の障害となりにくく、従来の画像特徴を用いる手法と比べると、ユーザがページ内の特定部分に埋め込まれたデジタルメディアに容易で高速にアクセスできるデジタルメディアの埋込みマーカを提供することができる。
【図面の簡単な説明】
【0012】
【図1A】本発明に関わる埋め込み型メディアマーカを印刷用広告に付加した例を示すものである。
【図1B】本発明に関わる埋め込み型メディアマーカを地図に付加した例を示すものである。
【図2】本発明に関わるEMMの例のより詳細な構造を説明するものである。
【図3】本発明に関わるアルゴリズムで、円の内部にある特徴点の数を概算する方法の例を示すものである。
【図4】広告上にこのドキュメントの画像特徴点を重ね合わせて表示したものである。
【図5A】特徴点の分布マップの例を示したものである。
【図5B】累積的特徴点分布マップの例を示したものである。
【図6】本発明の一例に係わる、矩形内にある特徴点の数を計算する方法を説明するためのものである。
【図7】本発明の実施形態に係わる、3次元空間中の3段階構造とされたEMMのモデルを説明するためのものである。
【図8】2次元フィルタの対角線方向での形状の例を示すものである。
【図9A】白黒のマルチメディアアイコンの典型例を示すものである。
【図9B】グラフィック効果を施されたEMMを示すものである。
【図10】ドキュメントページにEMMがアルファブレンディングされた例を示すものである。
【図11】不定形状のEMMの例を示すものである。
【図12】不定形状のEMMの配置手法の例を説明するためのものである。
【図13】他のEMMのデザイン例を示すものである。
【図14】他のEMMのデザイン例を示すものである。
【図15】他のEMMのデザイン例を示すものである。
【図16】他のEMMのデザイン例を示すものである。
【図17】他のEMMのデザイン例を示すものである。
【図18】本発明の一形態である、データベースとEMMを有する物体から、デジタルメディアを提供するための方法の例を示すものである。
【図19】本発明の一形態である、EMMを備える物体を生成する方法の一例を示すものである。
【図20】本発明の一形態であるシステムの機能ブロック図を示すものである。
【図21】本発明の一形態である、携帯端末プラットフォームの一例を示すものである。
【発明を実施するための形態】
【0013】
以下の詳細な記述において、図中にも示される参照番号は、同様の機能を有する要素に類似した数値を当てている。これらの図面はあくまでも例示のためであって、本発明を限定し、特定の実施態様だけが本発明の原理と一致することを示すものではない。実施形態は本発明の原理に基づいて当業者が実施可能な程度で十分に記述され、本発明の技術思想の範疇であれば、他の形態を適用したり、各要素を変更あるいは交換したりすることができることは理解されよう。すなわち、以降に示す詳細な説明は、限定的に理解されるべきではない。さらに、記述されている多様な本発明の実施形態は、一般用途のコンピュータ上でソフトウェアを動作させても、専用ハードウェアの形でも、あるいはソフトウェアとハードウェアとの組み合わせでも、実現することもできる。
【0014】
本発明の一実施形態である、媒体上に設けられる埋め込み型メディアマーカ(以降Embedded Media Markers (EMM)と呼ぶことがある)は、紙ドキュメント上に重なるように印刷されるマーカであり、ドキュメントの一部の特定領域に関連付けられている。本発明の一実施形態では、例えばカメラを内蔵した携帯電話を使って、EMMが設けられたドキュメントの部分の写真を撮影し、EMMが設けられたドキュメントの場所に関連付けられたデジタルメディアが携帯電話のディスプレイ上に表示される。バーコードと比較してみると、このEMMの実施形態の方は透明に近い一方で、視認が可能である。つまり、EMMは使用者がドキュメントのコンテントを閲覧するのを妨げない。EMMに関連付けられたデジタルメディアの検索は、撮影されたEMMが設けられたドキュメントの部分の局所画像特徴に基づいて行われる。いくつかの実施形態では、オリジナルのドキュメントの表示をなるべく妨げずにEMMの配置されたドキュメントの部分から十分な識別用の特徴を取得できるように、半自動的にドキュメント中のある場所にEMMを配置する手法を示す。
【0015】
以下の実施形態では、EMMを有する物体の生成システムや方法の説明の他、これらのマーカを用いる多様な目的を示す。本発明のいくつかの実施形態では、EMMはユーザに対してデジタルメディアやデータ(デジタルメディアオブジェクト)が存在することを示すのに用いられ、EMMが設けられた対象物(例えば、紙)と関連付けられた、どこか他の場所に、それらが保存される。加えて、EMMを用いることで、ユーザは簡単に関連付けられたデジタルメディアオブジェクトを検索し閲覧することが可能となる。本発明の一実施形態では、そうしたメディアやデータは、EMMを使用するオブジェクトによって図示されたコンテントに関するさらなる説明を提供するようになるだろう。言い換えれば、埋め込まれたEMMは、EMMが設けられたオブジェクトに関連付けられたローカルあるいは外部のメディアオブジェクトへのメディアリンクのようなものである。
【0016】
本発明の一以上の実施形態では、紙には意味を備えた標識である、埋込みメディアマーカ(EMM)が付加され、前述のメディアリンクの存在とメディアの形式が表示される。本発明の一実施形態では、EMMを見たとき、カメラ付き携帯電話でEMMが設けられたドキュメントの部分を撮影することで、そのドキュメントに関連付けられたデジタルメディアを見ることができることが、ユーザに示される(あるいは理解される)。これは、ウェブページにおいて下線、フォント変更、画像タグといった表示手法で、ユーザがクリックしたときに追加情報が得られるリンクが存在していることを表すのと類似した手法である。本発明のいくつかの実施形態では、バーコードとは異なって、EMMはほとんど視覚的に邪魔にならないので、ドキュメント中の内容を閲覧する障害にもなりにくい。本発明のいくつかの実施形態では、データ埋め込みグリフコードやアノトパターンと異なって、EMMは通常の解像度のプリンターで印刷することができ、通常の解像度の携帯電話のカメラで撮影した画像でも、利用することができる。さらに、本発明の一実施形態では、EMMはEMMが設けられた場所に関連付けられたデジタルメディアの形式(例えば、音楽、ビデオ、画像)を示すようにデザインされている。
【0017】
本発明の一実施形態では、ドキュメント中に半自動的にEMMを配置する手法とアルゴリズムを提供する。この手法とアルゴリズムは、ドキュメントの一部分を識別するために、ドキュメントの本来のコンテントを主として用いる(すなわち、バーコードのような識別用マークを用いない)。また、本発明の手法とアルゴリズムは、オーサリングツールの要素として用いることができ、マルチメディア情報を付加するために、メディアエディタを用いて紙の一ページ上の所望のアンカーポイントを選択すると、本発明のアルゴリズムによって、編集者が選択したアンカーポイントに応じて自動的にEMMが配置される。EMMは、ドキュメントのその部分の位置が識別できるように、そのドキュメントの部分に関する十分な量の特徴をマーク範囲内に含むように配置される。EMMは続いてそのドキュメントコンテンツ上に重ね合わされ、高機能化された紙として出力される。EMMは透明な印刷媒体、例えば透明シートやステッカーの上に印刷し、ドキュメントコンテントの対応する箇所上に重ねて配置して使用することも可能である。そして、ユーザは、紙上のEMMが設けられたドキュメント部分を撮影することで、画面、スピーカ、あるいは他の出力機器といった動的デバイス上で追加マルチメディア情報を取得することができる。
【0018】
図1Aは、あるパンフレットに付加された、EMMの例示的な形態を示す。ここで示すEMMの形態は、このパンフレット中の人の手の位置に、対応付けられたビデオが存在することを示すものである。大きなEMM境界101(この例では円)の中のドキュメントの部分が、EMMが設けられたドキュメントの部分として扱われる。EMMが設けられたドキュメント部分内には、小さい境界102(この例では円)で示され、その内部にはこのEMMに関連付けられているメディアのタイプを示すグラフィック103(この例ではビデオ)を有するメディアタイプマークが設けられる。小さい円102に接続された矢印は、そのメディアが関連付けられたドキュメント中の正確な場所を指し示すもので、アンカーもしくはEMM埋込みドキュメント箇所と呼ぶことができる。なお、図中にはEMMの構成要素を説明するための吹き出し線と説明が表示されているが、これらはEMMの構成要素ではない。
【0019】
図1Bは、EMM110の一実施形態を示すもので、地図111上に設けたものである。地図111は地形に関する高品質な情報を大きな表示領域で提供する。これは屋外で読みやすく、折りたたみもでき、他の人々と共有もしやすい。しかし、場所特有の動的な情報、例えばレストランのビデオクリップ、公園の天気予報、ホテルの現在の割引情報、といったものを提供できない。
【0020】
EMMを用いると、こうした動的なマルチメディアを紙の地図を通じて簡単に提供できる。図1Bに示すように、東京の地図上に、和食料理店がEMM110によって加えられており、その場所の歴史やハイライトに関するビデオクリップを指し示していて、それは携帯デバイス112を用いて見ることができる。携帯デバイスはEMMの内部にあるドキュメントの特徴あるいは特徴点を用いて、どのビデオクリップが実行されるのかを特定する。同様に、EMMを用いてカスタマーレビューやそのレストランのメニューを示してもよいし、その場で店の予約をするために用いてもよい。なお、ここでEMMはもともとの地図のレイアウトは変更せず、視覚的にもほとんど邪魔にならない。これがEMMがバーコードを利用した既存の手法と異なる点である。加えて、関心領域(POI:Point of Interest)の真上にEMMを配置することができる点は、地図上の関心領域のコンテキストを維持するのに特に有効である。
【0021】
図2は本発明に係わるEMM200の一例の詳細を示すものであり、特徴境界201、メディアタイプアイコン境界202、メディアアイコン203、アンカーポイント204、そして矢印205が含まれる。EMM200の機能的なデザインと、ドキュメント上に半自動的にEMMを配置する手法とアルゴリズムとについて以下に記述する。すなわち、ここではユーザがドキュメント上でアンカーポイント204を選択して、その場所にマルチメディア情報を関連付けるためのオーサリングツールを説明する。本発明の他の目的に関する、ユーザが選択したアンカーポイントにとって最適なEMMの場所と配置とを、そのEMMが設定されたドキュメントの部分が十分正確な識別を可能とする数の特徴が含むように、自動的に見出すアルゴリズムについても記述する。そして本発明に係わるEMMは例えば印刷物として元のドキュメント上に重ね合わされて(例えばアルファブレンドされて)、進化した紙となる。既存の紙ドキュメントにEMMを追加するために、EMM200は透明な媒体、例えば透光性シートやステッカー上に作成し、それを既存のドキュメントの対応箇所上に重ね合わせることができる。ユーザは、例えばカメラ付き携帯電話で、このEMMが設定されたドキュメント部分の写真を撮影し、これを解析して、そのドキュメントにリンクされたメディアを検索し、そのメディアを再生することができるようになる。
【0022】
[EMMの望ましい特徴]
本発明のいくつかの実施形態では、EMMは、紙上に印刷されたコンテントの特定の一部分にデジタルメディアが関連付けられていることを示す、紙上のマークを意味する。使用感を向上させるために、本発明のいくつかの実施形態に係わるEMMは、次の特徴を有する。
1.EMMは人が見ることができる。EMMはドキュメントに関連付けられたマルチメディア情報の存在を知らしめるために可視のマークであるべきである。
2.EMMの意味を人が把握できる。EMMは、EMMに関連付けられたデジタルメディア、例えば、オーディオ、ビデオ、テキスト、画像、アノテーションといった、メディアの種類を示している。
3.EMMは紙の上で余分な領域を占めず、EMMの配置によるドキュメントのレイアウトへの影響が少ない。
4.EMMはオリジナルの紙上のコンテントの変化を実質的に最小限とする。EMMのデザインと配置とは元のドキュメントのコンテントとブレンドされる。
5.EMMはドキュメントの部分を大きく劣化させない。認識手法がドキュメントのコンテントの特徴に基づくため、ドキュメントのコンテントはうまく保存されることになる。
6.EMMは、マルチメディアを再生するために必要となる画像をユーザにガイドする。
7.EMMは、マルチメディアを再生するために必要となる十分な量の特徴を含んだ領域を示す。
8.EMMはデータベース内でインデックス化すべきドキュメント部分の大きさを制限でき、計算の複雑さとデータ容量を低減し、検索速度を向上させる。
【0023】
[例示的なEMMの作成]
a. 特徴境界マーク
バーコードを用いないため、ユーザは関連するドキュメント部分を識別するために画像特徴を用いる必要がある。こうした特徴は記事上の画像から得られたいくつかの特徴か、異なる種類の特徴の組み合わせであってもよい。こうした特徴としては、記事上の画像の局所空間配置から抽出された一般的な画像局所特徴を利用することができる。一般的な画像特徴の中でも、SIFTやPCA-SIFT、SURFあるいはFITといった、スケール不変画像局所特徴(scale invariant image local feature)が好ましく利用できる。あるいは、エロールらが開発したHOTPAPERで用いられているテキスト部分の単語の配置に基づく画像特徴や、中居らが開発したLLAHで用いられている特徴点の局所配置に基づく手法を用いることもできる。これらの特徴はドキュメント画像の一部であるため、バーコードのような明確な輪郭がない。もし特徴の数を認識精度を高めるために増やす必要が生じた場合、この技術では、これらのグループとして扱われる特徴に対して明確な境界を持たないことになる。明確な境界を持たない場合には、システムがそのドキュメント部分を識別するのに十分な量の特徴を含んでいないドキュメント領域をユーザが撮影してしまう可能性が高くなる。この問題を解消するために、ユーザに対して撮影用の境界を付加してガイドすることが望まれる。いくつかの実施形態では、この境界はそのドキュメント部分を識別するに必要最小限となる領域が撮影範囲に含まれるように設定される。この撮影範囲のガイドを使用することで、いくつかの実施形態では特徴データベースにおいてインデックス化される特徴の数を、大幅に減少させることも可能となる。こうした特徴の数を制限することは、認識精度と認識速度とを高める上でもとても有効である。
【0024】
本発明のいくつかの実施形態では、様々な方向から撮影した場合であっても十分な数の特徴が取得できるように、図2に示すような特徴境界円201を用いて、人工的に特徴境界を表示している。(なお、カメラの光軸は紙のほぼ法線方向にあると仮定した。)特徴境界円は、ドキュメントの一部分を識別するために用いられる特徴をその中に含んだページの一領域あるいは一部分を規定する。ドキュメントの領域識別という観点では、円が大きいほど、そのドキュメント部分の識別に用いることができる特徴の数を増やすことができる。一方、円が大きい程、各ページ内に配置できるEMMの数が少なくなってしまうし、特徴数を減らすことで得られるメリットも損なわれてしまう。さらに、カメラ付き携帯等で大きな円を撮影しようとすると視野角と解像度の制約のためにユーザがうまく利用できない場合も発生する。
【0025】
いくつかの実施形態では、円の大きさ(すなわち図2の半径R)の考慮以外に、円の配置(すなわち図2の中心点(X,Y))もまたドキュメント部分の識別には重要となる。もし、特徴の分布が密な箇所に円が配置された場合、円の半径Rは非常に小さくできるし識別精度も高い。一方、空白の部分に大きな円を配置しても識別精度は低下してしまう。こうした考え方に基づいて、好適な円の中心(X,Y)と半径Rを決定する本発明の方法が提供される。
【0026】
b. メディアタイプ(種別)マーク
いくつかの実施形態においては、カメラ付き携帯端末での写真撮影用のガイドの役割に加えて、リンクされているメディアの種類(例えば、オーディオ、ビデオ、ウェブページなど)の情報は、利用者にとってこの進化した紙ドキュメントを利用する上で役に立つ。図2に例示するEMMはこのEMMにビデオへのリンクが関連付けられていることを示すためのビデオアイコン203を含んでいる。メディアタイプに関するアイコン情報は、ここではメディアタイプアイコン境界と呼ばれるもう一つの円202で囲まれている。この円202はアイコン情報を強調する上で有効である。一方、これを特徴境界マーク201と視覚的には一致させてもよい。
【0027】
いくつかの実施形態では、メディアアイコン203は、ユーザの注意を引く程度の大きさに生成される。一方で、このマーク203によってドキュメントの部分を識別するのに必要となる十分な数の特徴が隠されて減少してしまわないようにするべきでもある。本発明の一つに関連するアルゴリズムでは、アイコンマークの最適な中心位置(x,y)の検出方法を提供する。
【0028】
c. アンカーポイントと矢印
いくつかの実施形態では、図2の小さい方の円202は紙の特定の箇所へリンクするための明らかな点があるわけではないので、紙上のアイコンマークを取り囲む円を用いることは難しくはない。しかし、場合によってはあまり安易にこの円を配置するとユーザに正確な情報が伝わりにくくなる場合もある。例えば、図面の中にいくつかの機械部品が密集して配置されていて、多くの部品は3次元モデルで表示されているような場合、それらの部品とアイコンマークを囲む円とを対応付けることはユーザにとって難しいだろう。こうした問題を解消するために、本発明のいくつかの実施形態では、ドキュメント作成プログラムを用いて、ドキュメント中の特定の場所をアンカーポイント(m,n)としてユーザに選択させ、アイコンマークを取り囲む円からそのアンカーポイントを指し示す矢印を追加する。このようにすることでこの矢印とアイコンマークを囲む円とで、特定の箇所(m,n)に対する指し示しを表現できる。
【0029】
d. 画像処理
いくつかの実施形態では、オリジナルドキュメントへの影響を低減するため、メディアタイプアイコンを表現するときは、着色された領域ではなく、スケルトン表現(骨格部分のみの表示)が選択される。人間の眼はアルファブレンドされた画像の分離能力が一般に高いため、原画像にアルファブレンドされたメディアタイプアイコンはオリジナルドキュメントへの意味合いについての影響を低減させるうえで有効である。いくつかの実施形態では、色チャンネルと領域に応じてアルファブレンド係数を変化させることで、EMMが付与される領域内でのテキストや写真の色を変更することもできる。あるいは、紙ドキュメント中の図形オブジェクトは2次元空間で表現されることが多いから、いくつかの実施形態では、EMM自体を3次元状に表示させるようにしてもよく、これによってEMMと、オリジナルドキュメント中の図形オブジェクトとの区別がいっそうしやすくなる。
【0030】
いくつかの実施形態では、図2に示すようにEMMの外観が類似した、大きな円201が小さな円202を取り囲む、ものとすることができる。小さい円202は単純なアイコン203とそれに付加された矢印205とで表される(図2参照)。いくつかの実施形態では、EMMについて視覚上の統一性を持たせることで、ユーザがページ中でEMMを発見しやすくすることができる。EMMの機能は、ウェブページ内で着色や下線を用いる、慣用されているハイパーリンクと類似している。ハイパーリンクと異なるのは、EMMの実施形態が、物理的な表示媒体上に表示され、そしてEMMが付されたドキュメントの箇所に関連付けられた、利用可能なメディアを示すアイコンを用いる点である。
【0031】
いくつかの実施形態では、画像およびテキストのオクルージョンを、EMMを含むページを印刷するために用いられるデータの輝度のみを調整することで緩和させることもできる。一実施形態では、EMMを配置するときに、ある限られた範囲で重なり合う画像の輝度を変化させる。ここで輝度情報を用いたのは、カラーおよび白黒の装置あるいはプリンターにおいて高い正確性をもって再現されるからである。一実施形態では、大きな境界円と小さな円とは、これらと重なり合う画像の輝度情報に対して付加される一方で、影付き処理の部分では輝度が減少するようにする。
【0032】
いくつかの実施形態では、画像とテキストとの干渉は、単純に、EMMに明るい色を用いる、線の太さ、ドットの大きさを選択する、あるいはコンテンツの空白や間隙等の間にドットを配置し、EMMがドキュメントのコンテンツの邪魔しない一方で、ユーザがEMMを認識しやすくする、といった処理をして軽減することもできる。
【0033】
いくつかの実施形態では、小さい方の内部の円202がメディアアイコン203とアンカーポイント矢印205とを含む。メディアアイコン203はリンクされているオーディオやビデオなどのメディアの種類を画像として表現する単純なアイコンである。このアイコン203は小さな円202の内部に輝度は増加させずに描画され、先に述べたような影付き処理が施される。アンカーポイント矢印205は、隣接する円の中心からの指し示しを表す小さな矢印として描画される。矢印205はページ内でユーザが指定した領域を指し示す。矢印の外観は関連付けられた円とマッチするように表示される。
【0034】
[EMMの配置手順とアルゴリズムの実施形態]
1.EMMの配置ルールと手順
いくつかの実施形態では、EMMのオーサリング処理は、オリジナルのドキュメントをEMMオーサリングエディタに読み込んで処理することを含めることができる。読み込まれた後に、各ページの全体の局所画像特徴が所定の特徴抽出方法に従って抽出され、一時メモリに記憶される。なお、そのドキュメントに対応する、予め抽出された局所画像特徴を外部データベース等から受信して用いてもよい。次に、先に説明したような手順で、アンカーを施す処理と、アンカーにリンクされるデジタルメディアの情報をユーザから受信したのち、一時メモリ中のアンカーポイントの周囲の局所画像特徴を用いてEMMの大きさ(特徴境界、メディアタイプ境界)と位置とを決定する処理を行う。EMMの内部に存在する局所画像特徴の決定と、ユーザによる編集処理とが完了したあと、ユーザからのドキュメントの保存や印刷指示が受信され、EMMの内部に含まれる局所画像特徴と、EMMにリンクされるメディアのURLやファイル自体とが関係付けられてデータベースに保存される。本処理に用いる特徴データベースは、EMMの固有識別番号、EMM内部に存在する各特徴点毎の特徴を表すベクトル情報を含む局所画像特徴のセット、埋め込まれたデジタルメディアのローカルメモリ上あるいはインターネットアドレス、といった情報が含まれる。
【0035】
あるいは、オーサリング処理ではページ全体の画像特徴を特徴データベースに保存するようにしてもよい。一時メモリ中に保存された局所画像特徴を用いてEMMの大きさと配置箇所とを決定する上で、リンクを形成する箇所に基づいてページ全体の画像特徴を保持するデータベースからEMMの範囲内の画像特徴を用いて比較するようにしてもよい。局所画像特徴を保存する場合には、EMM内に含まれる局所画像特徴をコピーし、関連付けられるデジタルメディアのアドレスとともに、他の参照テーブルデータベースに保存するようにすることもできる。
【0036】
いくつかの実施形態では、各ページから抽出された特徴は単純に一時メモリに保存することもできる。オーサリングツールによりEMMの位置が決定された後、EMMがページに追加され、EMMと重なり合った箇所を含む近傍領域の画像データが切り取られ、切り取られた画像から画像特徴を再計算し、この特徴をデータベースに保存するようにしてもよい。このようにすることで、EMM自体の画像特徴がオリジナルのドキュメントの特徴と組み合わされることになるので、より少量の特徴を各EMMに対応して保存すればよくなり、この結果データベースもより多くのEMMを取り扱えることになる。加えて、EMMと重なりあった画像について、特徴を再計算するようにすることで、EMMを含まない画像特徴を用いる場合よりも、ユーザが撮影した画像との整合性を向上させることができる。
【0037】
いくつかの実施形態では、EMMの構造について、主にマルチメディアが複合された表示物体に関するユーザの要求という観点で主に説明してきた。いくつかの実施形態では本発明のシステムがユーザにより好適なサービスを提供できるように、装置側の要求という観点でも考慮がなされる。より具体的には、本実施形態のドキュメントの部分認識処理への悪影響なしにシステムを改善することができるようにEMMを配置する。この目的を達成するために、EMMの配置用のパラメータの調整のアルゴリズムに工夫が施される。
【0038】
いくつかの実施形態では、EMMの調整のために3つの基本的なパラメータ、特徴境界円中心(X,Y)、特徴境界円半径R、そしてメディアタイプ円中心(x,y)がある。識別用のシステムにおいては、各EMMを識別するために十分といえる量の閾値以上にその画像部分でカバーされる量の特徴点が含まれていてもEMMの識別精度は大きくは変わらないので、特徴境界円の最適化は、ドキュメント上での表面積が最小で、画像部分の識別精度が十分に良いということを目標になされる。EMMが占める表面積を小さくすることで、本実施形態のシステムでは次のような利点が生じる。
1) EMMを配置したことによるドキュメントのオリジナルコンテントの見にくさが軽減される。
2) 表面積が小さいことでより多くのEMMを各ページ内に配置することができる。
3) パッチ識別用の円の内部にある特徴点(例えば上述したSIFT/SURF/FITの特徴点)をインデックス化するため、面積が小さくなればインデックス用のサーバに保存する特徴点の量も少なくすることができる。特徴点の量が少ないことは識別速度を向上させる上でも有効である。
4) マークされた小さい領域を用いることで利用者が撮影する際のガイドが提供され、計算量も少なくなるので利用者がマルチメディアデータを取得するための待ち時間も短縮される。
5) 撮影領域が小さくなることで、撮影性能に制約のあるカメラ付き携帯端末を用いた場合でも、撮影が行い易くなる。すなわち、撮影する円の大きさが大きいと、携帯端末のカメラとドキュメントとの間の距離も遠ざけて撮影する必要が生じるが、小さい円を近くで撮影した方が、撮影作業自体も容易であるとともに、撮影画像の画質(例えばダイナミックレンジや解像度)も高くなるので、検索性能も結果的に向上する。
【0039】
いくつかの実施形態では、特徴境界円の大きさを小さくするために、本発明の実施形態に係わるアルゴリズムによって、特徴点の密度が高い領域に境界円が配置されるとともに、最低限含まれる必要がある量の特徴点を円内に含む小さい半径の円を求める処理を行う。
【0040】
いくつかの実施形態においては、前述したドキュメント部分識別アルゴリズムで、特徴境界円はユーザが視認可能な最小となるサイズよりは通常は十分大きい。いくつかの実施形態に係わるアルゴリズムでは、特徴境界円の内部のメディアタイプアイコンを取り囲む円は、ユーザがEMMと一体であることがわかるように設定される。メディアタイプアイコンによって生ずるコンテンツの見づらさを低減するために、本実施形態のアルゴリズムでは、この円を特徴点の数が最小密度である箇所に移動させるように試みる。すなわち、アイコン用円のサイズの決定とともに、オリジナルドキュメントの中でその円が含む特徴点の数が最小となるように最適化をする。このようにすることで、ドキュメント部分の識別の上で以下の利点が生じる。
【0041】
1)メディアタイプアイコンとそれを取り囲む円は重要な特徴になるべく影響を与えさせない。こうすることでユーザはオリジナルコンテントとアイコンとが区別でき、オリジナルドキュメントの理解の障害にならないようにする。
2) メディアタイプの表示が半透過の骨組みと影とによって主に構成される場合、その吹き出し(call out)表示とオリジナルドキュメントのコンテントとの組み合わせを、オリジナルのドキュメント中でも特徴点が粗い領域中に配置することで、より高い分別性を与えられる。この特徴点密度のバランス処理は、装置にとってはより一様に分布した特徴点を検出するのに有効であり、さらに、撮影時の携帯端末側の姿勢を予測するために用いる空間変換マトリクスをより安定的に獲得する場合に有効となる。さらに、このマトリクスがより安定的に得られるようになることで、整合用の輪郭を減らし、部分識別精度をより向上させるのにも有効となる。
【0042】
いくつかの実施形態では、これらの最適化方法以外に、EMMの見栄えを良くしたり、より多様な条件化でも外観を一致させたりするためのいくつかの追加ルールが用いられる。そうしたルールは、以下のものを含む。
1)アンカーポイントは、特徴境界円の内部にあるべきである。こうすることでEMMの機能をより直感的に理解でき、配置場所の探索範囲も限定される。さらに、複数のEMMが同じページの同じ場所に配置されて結合してしまうのを避けることができる(グローバル位置最適化)。
2) メディアタイプアイコンとそれを取り囲む円はドキュメントの作成者が選択したアンカーポイントを覆ってはいけない。このようにすることで、矢印が常に円から外に向かって突き出し、EMMを様々な箇所に配置しても外観を一致させることができる。
3) 矢印をなるべく短くするために、吹き出し表示に用いるアイコンがアンカーポイントにより近くなるようにアルゴリズムを構成する。
4) 全EMMに施す影付き表示は無限遠に配置された同じ光源を用いる。
5) 影付き処理を施す際にEMMのモデルが3次元空間中の3段階構造を有すると仮定する。
6) いくつかの実施形態では、影付き処理の際の光源は無限遠の左上から照射されるものとする。
【0043】
2. 円内の点の量を見積もる高速アルゴリズム
いくつかの実施形態では、特徴境界円の最適な位置とサイズとを得るため、あるいはアイコン吹き出し表示円の最適位置を得るため、システムは円内の特徴点の数を計数しなければならない。もし、EMMを配置することで画像局所特徴を急激に変化させてしまう場合、システムは新たなEMMのパラメータ(すなわち、場所とサイズ)の検証後に、EMMが配置された部分内の全ての特徴を再計算する必要がある。こうした処理は最適なパラメータの組み合わせを妥当な時間内に得る上では実用上望ましくない。本発明のいくつかの実施形態におけるEMMは、エッジと影とを主たる構成要素としており、ドキュメントの一部分にEMMが追加されても特徴点の数が大きく損なわれることはない。EMMのエッジの近くにあるオリジナルコンテントとエッジとの間では新しい特徴が形成され得るが、EMMの透明部分では元の特徴に大きな影響を与えない。このため、EMMは局所領域での特徴点の数を増加させる可能性の方が高いといえる。この点を考慮すると、ページ内の特徴点分布について、EMM特徴境界円上やEMMメディアタイプアイコン境界上にある実際の特徴の量を見積もるのに、EMMが無い状態での特徴量の分布に基づいて行ったとしてしても安全に利用することができるといえる。
【0044】
いくつかの実施形態では、EMMのパラメータの各セットを検証する時に特徴の再計算を省略したとしても、多くの異なる円のパラメータとともに円内の特徴点の数の計数をシステムで行うことは必要となる。すなわち、システムでは円の中心として各画素の位置を試験する必要があるかもしれない。さらに、最適解に到達する前に異なる半径も試みるであろう。このため、円内の特徴点の数を見積もるアルゴリズムは現実的な使用目的では高速である必要がある。
【0045】
一以上の実施形態では、100DPIでスキャンされた1ページ内の一般的な特徴点の数nは数千に及ぶ。力ずくで検索する手法を用いたとすると、円の中の特徴点の数から予測される計算複雑性はQ(n)で表される。これは現実的な利用上は時間がかかりすぎる。
【0046】
いくつかの実施形態では、この計算複雑性を解消するために、円内の特徴点の数を見積もるために設計した高速アルゴリズムを用いる。このアルゴリズムは特徴点分散ヒストグラムの統合画像に基づいている。このアルゴリズムを用いるために、半径Rの円の中にある特徴点の数を、先の円の内部にあって一辺が√2・Rの正方形中にある特徴点の数を用いて概算する。円300と正方形301との関係を図3に示す。Ncは円300内の特徴点の数で、Nsは正方形301内の特徴点の数であり、Ns≦Ncとなる。この見積方法はドキュメントの部分を識別するために、正方形の内部の特徴点の数が部分の識別の最低限に達している場合には、円の中の特徴点の数も十分であることを保証できる。
【0047】
いくつかの実施形態に関連する図4は、広告ページ400の上に特徴点401を重ねて表示している。図5Aは、図4中の画像に対応する、特徴点分布マップであり、白いマップ中の各黒点がそれぞれ特徴点である。図5Bは累積特徴点分布マップであり、原点とある点とを頂点とする矩形内に存在する特徴点の数と一致する。累積特徴点分布マップ中で、各点における値は、その左上側の領域にある特徴点の数に一致する。画像中の画素の数をNとすると、この累積特徴点分布マップを得る計算複雑性はO(N)となる。このアルゴリズムではこのマップを一度計算しておけばよく、各画像についてシステムがこのマップを予め計算し保持しておくことができるので、ドキュメント作成者がこの手法を使って最適なEMMの配置を得るときに、このマップの計算複雑性は最適化をする場合でもそれほど影響しない。
【0048】
いくつかの実施形態では、累積特徴点分布マップとともに、一定時間内で正方形内にある特徴点の数をシステムで計算することもできる。図6において正方形ABCDは画像境界等の一つと並行な辺を有し、累積分布マップ上の各点A,B,C,Dでの点の数をそれぞれNA、NB,NC,NDとする。 ここでは図3の円の場合のように、システムは円内にある正方形内の特徴点の数を利用する。図5の累積特徴点分布は正方形内にある特徴点の数を計算するのに利用することができる。システムは円内の特徴点の量の概算量である、正方形ABCD内の特徴点の量NSQを次の式に基づいて決定する事ができる。
【0049】
この数式を使った実施形態のシステムは、1回の足し算と2回の引き算とで正方形内の特徴点の数を概算することができる。これは、力ずくアプローチで各特徴点を確認するために、2回の掛け算、2回の足し算、1回の引き算を計算するときと比べてずっと効率的である。例えば、ユーザがページ内の最適な円の中心を探す場合に、3000個の特徴点があるとして、この高速アルゴリズを用いる計算は約3800倍高速である。
【0050】
3. 最適な特徴境界円の決定
いくつかの実施形態では、円内の特徴点の数を概算する高速アルゴリズムに加えて、各画素の位置を円の中心とする配置のテストをシステムが行うことができる。さらに、システムは最良の特徴境界円の最適な半径もまた知る必要がある。最適な半径を得るために、本発明のいくつかの実施形態では次のバイナリサーチアプローチを最適化手法として用いている。
1) 円が、その中にアンカーポイントとその半径で最大の特徴点とを含むような円の中心位置を得る。
2)このとき、この半径の特徴点の最大数が、特徴点の下限数(KEYNUMLOWLIMIT)よりも大きいかどうかを判断する。
もし、下限より大きい場合は、現在の半径(currentradius)を大半径(radiushigh)とする。
それ以外の場合は、現在の半径を小半径(radiuslow)とする。
3)現在の半径を大半径と小半径の平均とする。
1)〜3)を大半径と小半径の差が所定の最小マージン(SMALLMARGEN)に達するまで繰り返す。
125〜250の円の半径が使用される場合、バイナリサーチアプローチは約18倍速くなる。
【0051】
4. メディアタイプアイコンを取り囲む円の最適化
いくつかの実施形態では、メディアタイプアイコンのサイズは固定されているので、この円の場所の最適化はこの円の中に最小の特徴点が含まれるように円の位置を決定することとなる。この最適化の方法と合わせて、先に述べた2および3のルールを適用すればEMMの見栄えをより良くすることができる。言い換えると、メディアアイコン取り囲み円の中心とアンカーポイントの距離は、取り囲み円の半径よりは大きくなくてはならない。取り囲み円は、短い矢印を配置するためにアンカーポイントの近くに配置すべきである。矢印の長さを短くする方法はいくつかある。1つの方法(1番目の方法)はアンカーポイントとメディアアイコン取り囲み円の中心との距離が最大となるように設定することである。他の方法(2番目の方法)は、特徴境界中心位置(X,Y)からメディアアイコン取り囲み円の中心位置(x,y)へのベクトルと、特徴境界中心位置(X,Y)からアンカーポイント(m,n)へのベクトルを計算し、この2つのベクトルのなす角が90°より小さくなるようにする。ここでは2番目のアプローチを利用した。
【0052】
[EMMのグラフィック効果の生成]
いくつかの実施形態では、紙ドキュメント上の図形オブジェクトは通常2次元であるので、EMMに3次元的な効果を施すと、オリジナルドキュメント中にある他のグラフィカルオブジェクトとEMMとをより明確に区別できるようになる。一実施形態のシステムでは、3次元空間における影を示す3段階構造のEMMモデルを用いる。3段階構造EMMモデル700については図7に示す。影に付いては光源が左上にあると仮定している。この効果を施すために、ゾーベルフィルタを2Dフィルタに続いて使用することもできる。ゾーベルフィルタは計数[1 0; 0 -1]を有する。2Dフィルタは、図8中に示される形状800の特性を対角線方向に持ち、他のフィルター位置では係数が0である。
【0053】
いくつかの実施形態では、EMMエッジに対するフィルタリング結果を組み合わせることによって、白黒(単色濃淡)のマルチメディアアイコンに応じた適当なEMMグラフィック効果を生成することができる。図9は、典型的な白黒のマルチメディアアイコン900とグラフィック効果で装飾されたEMM901を示す。矢印は最適なEMMパラメータのセットが決まった後に動的に3段階EMMモデルに追加しているので、矢印のグラフィック効果はEMMの他の部分のグラフィック効果と適当にブレンドされるようにしてある。
【0054】
図10には、いくつかの実施形態である、EMMをドキュメントのページ1000にアルファブレンディングした効果を示す。
【0055】
いくつかの実施形態として、ユーザがEMMの形状を不定形としたい場合が実用上想定される。不定形EMMを用いる理由は、例えば次のようなものである。
・ もしユーザがEMMの矩形状を正しい方向で常に撮影することができるなら、特徴量の計算速度が速くなる矩形状EMMの方を使用したい(回転の計算が不要になるため)。
・ 特定の目的(例えば祝日のお祝い、ブランドの知名度向上)でEMMを不定形にデザインしたい。
・ 適当にEMM形状を変形させることで、EMMが付加されたドキュメント部分を識別するのに役立つ場合がある。
・ EMMの形状に何らかの情報を持たせることもできる。
・ EMMの形状を変更することで、オリジナルドキュメントとの干渉をさらに低減することができる場合がある。
図11には不定形状のEMMのいくつかの例1101〜1104を示してある。
【0056】
図12で示すような、不定形のEMM1200を配置する一つの簡単な手法は、円形状のEMMにおいて最適化された円1201中にEMMの不定形の部分を整合させる方法である。図12(A)にこの手法を示す。この手法は単純である。しかし、不定形状のEMM全体が撮影されたときに、この手法では撮影された画像内に十分な数の特徴点が含まれることは保証できない。一方、図12(B)で示す手法では、どのような方向からEMMが撮影されたとしても共通に含まれる領域内に十分な特徴点が含まれるように設定することで、不定形状のEMM全体が撮影されたときに、撮影画像中に十分な数の特徴点が含まれることを保証するための手法の一例である。
1. 2つの直交する軸上に、この不定形状1200を投影し、2つの投影像1202および1203を作る。
2.投影像1202および1203それぞれについて、一方を一辺として含む、不定形状を囲むアスペクト比が固定された(例えば4:3の)複数の矩形境界1204−1、1204−2を生成する。
3.1、2の工程を、投影される直交軸を回転させて繰り返し、矩形を生成する。このとき作成する矩形の数および回転角は所定の数および回転角であってもよいし、EMMの周囲に適合するような矩形をエンジニアリング手法により決めてもよい。
4.これらの各投影像を一辺として作られる固定アスペクト比の矩形を重ね合わせたときに、全ての矩形で重複する領域を参照用円1205として見出す。すなわち、この領域はどの方向から撮影しても必ず含まれる領域となる。
5.参照用円の中心(すなわち最適位置)と不定形状のEMMの現在の設置位置との間で2次元ベクトルを得る。
6.十分な特徴点が含まれるように参照用円1205の最適化された半径を決定する。
7.参照用円の最適位置および円の大きさが得られた後で、外接円1201の半径と参照用円1205の半径との比に基づいて、2次元ベクトルと不定形状1200の表示倍率を調整し、不定形状1200が配置される。
【0057】
いくつかの実施形態において、ドキュメント検索システムのパフォーマンスを、スキャンされたドキュメントのデータベースおよびEMMによる検索成功率から評価したところ、99%以上であった。
【0058】
[EMMのデザイン例]
利用可能な様々なデジタルメディアを示すための、例示的なEMMのデザイン例を図13〜17に示す。EMMの装飾デザインはこれまで述べた理由等から、次のような特徴を有する。
1.EMMは典型的には紙やプラスチック等の表面上に印刷される。印刷は、オフセット印刷、フレキソ印刷、染料転写、インクジェット印刷、レーザプリンティング、パッド印刷、レリーフ印刷、グラビア印刷、スクリーン印刷、電子写真印刷、あるいは、他の表面にマークを形成する方法であってもよい。
EMMは、ビデオディスプレイ上に表示されてもよい(例えば、電子ブック、LCDモニターや電子ペーパー等)。
2.EMMは、例えばメディアタイプアイコンの境界である小さい円を取り囲む大きな円のような、特徴境界を有する。小さい円は、単純なアイコンであるのが望ましい、メディアタイプアイコンと、円に付加された矢印を備えている(図13〜17)。EMMの外観を統一させ、ユーザがページ内でEMMをすばやく見つけることができるようにデザインされている。これはウェブページ状でハイパーリンクを色や下線で示すのと似ている。
3.特徴境界(大きな円)内でメディアタイプアイコン(小さい円)の配置は変化する(図13〜17)。
4.矢印の位置と方向は変化する(図13〜17)。
5.メディアタイプアイコン境界(小さい円)と特徴境界(大きな円)の大きさとの関係は変化する。
6.EMMは印刷ページ上のコンテンツ上に重ねられる。下地となるコンテンツのオクルージョンは、EMMと下地となる画像とを含んだページを印刷するために用いる画像情報の輝度チャネルを調整するだけで緩和できる。EMMは下地画像の輝度を変化させる。輝度情報は、カラーおよび白黒の双方の印刷技術で忠実に再現できるため、輝度情報を調整するのである。この視覚効果は、印刷ページ上のコンテントと重なる、明るく、半透明なマークをもたらす。
7.EMMのエッジは影を落とすことで決定される(図13〜17)。 影を落とす輝度効果は、マーク本体に、大まかに輝度の逆数の効果を適用して得られるものである。この視覚効果は、暗く、半透明の影を、EMMの境界と内部のアイコンの境界とに与えることができる。
【0059】
[デジタルメディアを提供する方法]
図18は、データベースと本発明の実施形態の一つとを用いてデジタルメディアを提供するための方法に関するフローチャートの一例である。いくつかの実施形態では、部分領域の画像を受信すると(1800)、画像から複数の特徴が抽出され(1801)、EMMに対応するデジタルメディアが識別される(1802)。必要な場合には、デジタルメディアが続いて検索され、提供される(1803)。画像から抽出される特徴は、どのような指標が検索されるかをシステムに伝える特徴点を含んでもよい。
【0060】
[物体の生成方法]
図19は、視覚化されたコンテントとそのコンテント上の埋め込み型メディアマーカとを含む物体を生成するためのフローチャートの一例を示す。第1に、視覚化されたコンテント中でメディアを埋め込む場所の選択を受信する(1900)。選択に基づいて、EMMの場所とサイズが決定される(1901)。続いて、EMMは決定された位置と大きさとに基づいて物体上に配置される(1902)。
【0061】
[例示的なシステム構造]
図20は実施形態に係わるシステムの機能ブロック図の一例を示す。カメラ2001を内蔵する携帯端末2000を用いて、EMMを含むドキュメント2002をカメラの撮影領域に収めることで、フィードバックが提供される。EMMを識別すると、EMMが参照しているコンテントのタイプを決定するために、データベース2003を参照する。データベースは携帯端末に情報を返し、携帯端末はたとえばそのコンテントを実行する。
【0062】
[例示的な携帯プラットフォーム]
図21は、携帯端末のプラットフォームおよび遠隔サーバーシステムの一例を示したものである。システム2100は携帯端末プラットフォーム2101とネットワークリソース2103とを含む。
【0063】
携帯端末プラットフォーム2101は、携帯端末プラットフォーム2101内の各部品間の情報を通信するためのデータバス2104や他の通信機構を備え、プロセッサ(CPU)2105はバス2104と結合し、情報処理およびその他の計算や制御処理を行う。携帯端末プラットフォーム2101は、様々な情報やプロセッサ2105で実行される命令などを記憶し、バス2104に接続されたRAMや他の動的記憶装置のような揮発性メモリ(記憶領域)2106を含む。プロセッサ2105による命令の実行の間に一時記憶や他の中間情報を保存するための揮発性メモリ(記憶領域)2106もまた使用してよい。携帯端末プラットフォーム2101は、バス2104に接続され、BIOSやシステムの多様なコンフィギュレーションパラメータといった、静的な情報やプロセッサ2105用の命令を記憶するROMや他の静的記憶装置を含んでいてもよい。磁気ディスク、光学ディスク、あるいは固体フラッシュメモリデバイスといった固定記憶装置(不揮発性記憶領域)2108を備え、情報や命令を保存するためにバス2104と接続されてもよい。
【0064】
携帯端末プラットフォーム2101は、CRT、プラズマディスプレイあるいは液晶ディスプレイ等のディスプレイ2109とバス2104を介して接続され、携帯端末の利用者に対して情報を表示する。ディスプレイ2109は、EMMに関連付けられたデジタルメディアを見るために用いても良い。(キーボードなどの)入力装置2110は、英数字等の入力キーを含み、プロセッサ2105との情報通信や命令選択を行うために、バス2104に接続される。他のユーザ入力装置はマウス、トラックボール、あるいはカーソル方向指示キーのような、カーソル制御用のデバイス2111であり、方向情報やコマンド選択をプロセッサ2105に通信したり、ディスプレイ2109上でのカーソルの移動を制御したりする。この入力装置は典型的には2次元の自由度を持ち、第1軸(X)と第2軸(Y)とによって、平面上の場所を特定するのに用いられる、
【0065】
カメラ2112は、バス2104を介して携帯端末プラットフォーム2101に接続され、本発明のEMMを備える物体の写真を撮影するために用いられる。
【0066】
本発明は、ここに記述された技術を実現するためのコンピュータシステム2100の使い方に関連する。実施形態として、携帯端末プラットフォーム2101のような機械上に、本発明に関するシステムを搭載する。本発明の一形態としては、ここで記載された技術を、揮発性メモリ2106中の1以上の命令による1以上の処理をプロセッサ2105に処理させることで実現させる。こうした命令は不揮発性記憶領域2108のような他のコンピュータ読取可能な媒体から、揮発性メモリ2106に読み出してもよい。揮発性メモリ2106中に保持された一連の命令をプロセッサ2105に実行させることで、ここに述べた処理ステップを実現させる。他の形態としては、ハードウェアの電子回路を、発明を実現するソフトウェアと、一部置き換え、あるいは、組み合わせてもよい。なお、本発明は特定のスペックを有するハードウェアやソフトウェアの組み合わせに限定されるものではない。
【0067】
ここで、コンピュータ可読媒体とは、プロセッサ2105が実行するための命令を提供するのに用いられるあらゆる媒体を指す。コンピュータ可読媒体は機械読取可能媒体の一例であり、ここで述べた、いかなる方法もしくは技術をも実現するための命令を保持することができるものである。このような媒体は多様な形態をとり、不揮発性媒体、揮発性媒体、そして通信媒体といったものに限られない。不揮発性媒体としては、例えば、記憶装置(固定記憶装置2108)のような、光、磁気ディスクが含まれる。揮発性媒体としては、例えば揮発性記憶装置2106のような動的メモリを含む。通信媒体は、データバス2104のような配線を含む同軸ケーブル、銅線、光ファイバーなどであってよい。通信媒体は、電磁波や赤外光データ通信のような、音波や光を利用したものも含む。
【0068】
コンピュータ可読媒体の一般的な形態は、例えば、フロッピー(登録商標)ディスク、ハードディスク、磁気テープあるいは他の磁気媒体、CD-ROMあるいは他の光記憶媒体、パンチカード、紙テープなどの穴の配置を用いる媒体、RAM、ROM、EPROM、フラッシュEPROM、フラッシュドライブ、メモリーカードなどのメモリチップやカートリッジ、通信波、あるいはコンピュータが読むことができる他の媒体、といった通常のコンピュータ可読媒体を含む。
【0069】
さまざまな形態のコンピュータ可読媒体が、プロセッサ2105で処理される1以上の処理を実行させるために用いることができる。例えば、その命令が最初はリモートコンピュータから磁気ディスクに保持されてもよい。あるいは、リモートコンピュータがその命令を動的記憶装置にロードして、これを、モデムを用いた電話回線を通じて送信してもよい。コンピュータシステムに接続されたモデムは、電話回線を通じてデータを受け取るともに、データを赤外線信号に変換して赤外線として伝送するようにしてもよい。赤外線検出装置は、赤外線信号に重畳されたデータを受信し、適当な回路がそのデータをデータバス2104に伝送する。バス2104は揮発性記憶領域2106にデータを伝送し、プロセッサ2105がその命令を参照して実行できる状態におく。揮発性メモリ2106から受け取った命令はプロセッサ2105により処理される前あるいは後に固定記憶装置2108に保存されるようにしてもよい。命令は、周知のネットワークデータ通信プロトコルのいずれかで、インターネットを介してコンピュータ(携帯端末)プラットフォーム2101にダウンロードするようにしてもよい。
【0070】
携帯端末プラットフォーム2101は、データバス2104に結合したネットワークインターフェースカード2113のような通信インターフェースも有する。通信インターフェース2113はローカルエリアネットワーク2115に接続されたネットワークリンク2114に接続し、双方向のデータ通信が可能とされる。例えば、通信インターフェース2113はISDNカードやモデムと一体化され、対応する電話回線でのデータ通信を行わせるようにしてもよい。他の例としては、LANや802.11a、802.11b、802.11g として公知の無線LANリンクに適合したデータ通信接続を行うローカルエリアネットワークインターフェースカード(LAN NIC)としたり、Bluetooth(登録商標)を用いて実現してもよい。いずれの場合でも、通信インターフェース2113は、様々なタイプの情報を表すデジタルデータ列を伝送する、電気、電磁、あるいは光信号を送受信する。
【0071】
ネットワークリンク2114は、1以上の他のネットワークとのデータ通信を通常可能とする。例えば、ネットワークリンク2114は、ローカルエリアネットワーク2115を介して、ホストコンピュータ2116やネットワークストレージ/サーバ2122への接続を提供する。加えて、あるいは代替として、ネットワークリンク2114は、インターネットのような、広域あるいはグローバルネットワーク2118にゲートウェイ/ファイアウォール2117を通じて接続する。そして携帯端末プラットフォーム2101はインターネット2118上のどこかにある、例えばリモートネットワークストレージ/サーバ2119といった、ネットワークリソースにもアクセスすることが可能となる。一方、携帯端末プラットフォーム2101は、ローカルエリアネットワーク2115および/またはインターネット2118上のいかなる位置にいるクライアントからもアクセスできるようにしてもよい。ネットワーククライアント2120および2121は、プラットフォーム2101と同様のコンピュータプラットフォームに基づいて構築されても良い。
【0072】
ローカルエリアネットワーク2115およびインターネット2118は、共に電気、電磁、あるいは光信号を、データ信号列を伝播するのに用いる。なお、デジタルデータを携帯端末プラットフォーム2101に入出させる、多様なネットワークを通じた信号、ネットワークリンク2114上や、通信インターフェース2113を介した信号は情報伝送の伝送波の例示的な形態である。
【0073】
携帯端末プラットフォーム2101は、メッセージの送信、プログラムコードを含むデータの受信を、インターネット2118およびLAN2115を含む多様なネットワーク、ネットワークリンク2114および通信インターフェース2113を介して行うことができる。インターネットの例では、コンピュータプラットフォーム2101はネットワークサーバとして機能し、クライアント2120および/または2121で実行されるアプリケーションプログラム用の、リクエストコードやデータを、インターネット2118、ゲートウェイ/ファイアウォール2117、ローカルエリアネットワーク2115および通信インターフェース2113を介して伝送する。同様に、他のネットワークリソースからコードを受信してもよい。
【0074】
受信したコードはプロセッサ2105によって受信時に実行されるか、固定記憶装置2108あるいは揮発記憶装置2106に保存する、あるいは他の不揮発性記憶領域に記憶して、後で実行してもよい。
【0075】
最後に、ここに記載した方法や技法は、特定の装置固有に成り立つものでなく、いかなる適当な構成要素の組み合わせによっても実現できることを理解されたい。また、この開示の示唆に従って、多様な一般用途の装置を用いてもよい。またここで開示した手法を実現する専用の装置を作成することも有効である。この発明は特定の例示に基づいて記述されているが、それらは全て限定的にするためではなく、例示するためのものである。当業者であれば、ハードウェア、ソフトウェアおよびファームウェアの多くの異なる組み合わせが本発明を実施するのに適当であることは理解されうることであろう。例えば、ソフトウェアの記述は、アセンブラ、C/C++、pearl、shell、PHP、Java(登録商標)といった多様なプログラムあるいはスクリプト言語を用いて実現できる。
【0076】
さらに、当業者であればここに開示された本発明の明細書および実施例に基づいて、本発明の他の改良もまた明らかであろう。実施形態に記述された多様な観点や構成は、このコンピュータにより実現される画像検索システムを単独もしくは組み合わせることにより利用することができる。明細書と実施例は例示的なものと解釈され、真の発明の示す範囲および思想はクレームにより示されるものである。
【符号の説明】
【0077】
100、400 広告ページ(ドキュメント)
101 埋め込み型メディアマーカ(EMM)の境界円
102 EMMのメディアタイプマーク境界円
103、900 メディアタイプマーク(アイコン)
110、200、901 埋め込み型メディアマーカ
401 特徴点
【技術分野】
【0001】
本発明は、デジタルメディアの埋め込みマーカを設けた表示物の生成方法、この表示物を用いてデジタルメディアを提供するシステム、それらに用いられるソフトウェア、そして表示物に関する。
【背景技術】
【0002】
紙媒体は情報を閲覧する媒体としては最も広く利用されている媒体ではあるが、ビデオ、音楽といった動的なメディアを再生することはできない。一方、携帯電話による音楽やビデオの再生が盛んになってきてはいるが、紙の持つ、高い解像度、大きな表示面積、情報配置の柔軟性、屋外での視認性や静的なコンテンツに対する強健さには敵わない。現在、画像認識技術を用いることで紙ドキュメントに対応する動的メディアへリンクをすることが可能となっている。携帯電話に内蔵されているカメラでドキュメントの部分的な画像を撮影する。ドキュメントの部分画像はその画像中にある特徴を用いて識別され、そのドキュメント中にリンクされたデジタルメディアが検索され、携帯電話上で再生される。
【0003】
こうした紙ドキュメント上のメディアリンクを作成するタイプの方法で一般的なのは、ドキュメント上にコード化したマーカを印刷するものである。そうしたマーカの例としては、2次元バーコード、ドットの印刷パターンが良く知られている(非特許文献1)。しかしながら、こうしたマーカは視覚的にも、ドキュメントのコンテンツの配置の点でも邪魔になる。データグリフ(非特許文献2)は、紙上に、見えにくい、機械が認識可能なパターンを印刷することでこうした問題を解消しようとしている。しかし、このタイプのマーカは高解像度のプリンターとドキュメント識別用のカメラとが必要となる。電子的なマーカ、例えばRFIDを使用することも可能であるが(非特許文献3)、生成コストが増加してしまう。
【0004】
他のシステムではドキュメントコンテンツ自体の特徴を使って、関連するドキュメントの部分画像を識別し、それをメディアリンクを作成するのに用いている。例えば、HOTPAPER(非特許文献4)、Mobile Retriever(非特許文献5)は、単語の空間配置のようなドキュメント中のテキストに基づいた特徴を用いている。Bookmarkr(非特許文献6)やMapSnapper(非特許文献7)は、画素レベルの特徴(例えばSIFTアルゴリズム)を、写真や図といった一般的なドキュメントコンテントを識別するのに用いている。こうしたシステムでは、視覚的に邪魔になるマークは識別に必要にはならない。
【0005】
しかしながら、既存のマーカを用いた方法とコンテンツに基づく方法とはともにリンクされたメディアの種類がわからない。バーコードとデータグリフは眼に見えるが、そこに関連付けられたメディアの存在や種類を直接示してはいない。コンテンツの特徴を使用する場合には、ドキュメントへのメディアのリンクについて、ユーザが一見して分かる形では、紙上に何も示さない。この結果、例えば先のHotPaperでは、ホットスポットを探すためには、携帯電話による撮影画像上に赤いドットが表示されたり、振動が発生するなどのフィードバックがあるまで、紙の上を携帯電話のカメラを移動させる必要がある。
【0006】
しかし、可視、不可視のバーコード、データグリフ、アノトパターンといった既存技術はユーザが入手可能なマルチメディアに関して、意味ある情報をユーザに提供しない。
【0007】
従って、目障りでなく、レイアウトへの制約が少なく、プリンターやカメラの解像度への依存度が低い、埋込マーカが必要とされている。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】ブレント ヘフト(B. Hecht)外3名、「ウィキアイ−場所情報で参照されたウィキペディアコンテントを探索するためのマジックレンズの利用(Wikeye - Using Magic Lenses to Explore Georeferenced Wikipedia Content)」、第3回携帯インタラクションデバイスの普及に関する国際ワークショップ予稿集(Proceedings of the 3rd International Workshop on Pervasive Mobile Interaction Devices (PERMID))、2007年、p.6−10
【非特許文献2】デイビッド ヘフト(David Hecht)、「ハードコピーデジタルドキュメントのための埋込みデータグリフ技術(Embedded Data Glyph Technology for Hardcopy Digital Documents)」、SPIE−カラーハードコピーとグラフィックス技術III(SPIE -Color Hard Copy and Graphics Arts III)、1994年2月、第2171巻、p.341−352
【非特許文献3】デレク レイリー(Derek Reilly)外4名、「マークアップマップ、紙の地図と電子情報源との組み合わせ(Marked-up maps: combining paper maps and electronic information resources)」、パーソナルおよびユビキタスコンピューティング(Personal and Ubiquitous Computing)、2006年、第10巻第4号、p.215−226
【非特許文献4】ベルナ エロール(Berna Erol)外2名、「ホットペーパー:携帯電話を用いた紙のマルチメディアインタラクション(HOTPAPER: multimedia interaction with paper using mobile phones)」、マルチメディア予稿集、2008年、p.399−408
【非特許文献5】フー リュウ(Xu Liu)外1名、「モバイルリトリバー:物体源からのデジタルドキュメントへのアクセス(Mobile Retriever: access to digital documents from their physical source)」、ドキュメント分析と認識の国際誌(Int. J. Doc. Anal. Recognit.)、2008年、第11巻第1号、p.19−27
【非特許文献6】ネイルス ヘンゼ(Neils Henze)外1名, 「撮影しあなたのフォトブックを共有する(Snap and share your photobooks)」、マルチメディア予稿集(Proceedings of Multimedia)、2008年、p.409−418
【非特許文献7】ジョナサン ハレ(Jonathan Hare)外3名、「マップスナッパー:携帯電話からの画像適合のための効率的アルゴリズム(MapSnapper: Engineering an Efficient Algorithm for Matching Images of Maps from Mobile Phones)」、SPIE予稿集、2008年、第6820巻、pp 68200L-68200L-11
【非特許文献8】チョン リュウ(Qiong Liu)外4名、「高速不変変換を用いた高精度かつ言語非依存のドキュメント検索(High Accuracy and Language Independent Document Retrieval With A Fast Invariant Transform)」、ICME予稿集(Proceedings of ICME)、2009年、p.386−389
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、上述したような、媒体上のマーカを用いてリンクされたメディアにアクセスする既存のシステムあるいは方法が有していた課題の少なくとも一部を解決することを目的とする。
【課題を解決するための手段】
【0010】
本発明の一形態である、表示物の生成方法は、付加的なデジタルメディアを提供するために用いる表示物の生成方法であって、表示媒体の表示面の上に表示されるコンテント情報を取得し、前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、前記表示条件に基づいて前記マーカを出力し、少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、ことを特徴とする。
さらに別の態様では、表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする。
さらに別の態様では、表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする。
さらに別の態様では マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする。
さらに別の態様では、表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする。
さらに別の態様では、表示媒体の表面上に前記コンテント情報と前記表示条件とに基づいて前記マーカを合成して出力することを特徴とする。
さらに別の態様では、マーカを、前記表示条件に応じて、透光性を有する基材上に印刷出力し、前記表示媒体の表面上に前記コンテント情報を出力し、前記表示媒体と前記基材とを重ね合わせて表示物を構成することを特徴とする。
本発明の別の形態である、デジタルメディアを提供するシステムは、上記の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するシステムであって、前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、を備えることを特徴とする。
本発明の別の形態である、表示物を生成するためのコンピュータプログラムは、付加的なデジタルメディアを提供するために用いる表示物を生成するためのコンピュータプログラムであって、コンピュータを、前記表示媒体の表示面の上に表示されるコンテント情報を取得し、前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、前記表示条件に基づいて前記マーカを出力し、少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶するように動作させるためのコンピュータプログラムである。
さらに別の態様では、表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする。
さらに別の態様では、表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする。
さらに別の態様では、マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする。
さらに別の態様では、表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする。
さらに本発明の別の形態である、上記の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するためのコンピュータプログラムは、コンピュータを、前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、として動作させるためコンピュータプログラムである。
さらに本発明の別の形態である、表示物体は、表示面と、前記表示面の上に表示されたコンテント情報と、前記表示面の上の所定の位置にデジタルメディアが関連付けられていることを表示し、前記所定の位置の近傍の前記表示面の一部の領域の境界を表示するとともに、前記境界の内側に位置する前記コンテント情報が前記境界の内側に表示されるマーカと、を備え、前記デジタルメディアの取得に必要となる情報と画像特徴とを関連付けた関連付け情報の組を記憶する記憶手段を用いて、前記領域を特定するのに十分な量の前記コンテント情報の画像特徴が、前記マーカの前記境界の内側に含まれることを特徴とする。
さらに別の態様では、所定の位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所を前記境界の内側に含むように前記マーカが配置されていることを特徴とする。
さらに別の態様では、境界内には前記デジタルメディアに関連するアイコン画像を含むことを特徴とする。
さらに別の態様では、アイコン画像は、前記境界の内側で前記画像特徴の量が少ない箇所に配置されることを特徴とする。
【発明の効果】
【0011】
本発明によれば、従来のコード画像と比べて、ドキュメントコンテントのレイアウト上の障害となりにくく、従来の画像特徴を用いる手法と比べると、ユーザがページ内の特定部分に埋め込まれたデジタルメディアに容易で高速にアクセスできるデジタルメディアの埋込みマーカを提供することができる。
【図面の簡単な説明】
【0012】
【図1A】本発明に関わる埋め込み型メディアマーカを印刷用広告に付加した例を示すものである。
【図1B】本発明に関わる埋め込み型メディアマーカを地図に付加した例を示すものである。
【図2】本発明に関わるEMMの例のより詳細な構造を説明するものである。
【図3】本発明に関わるアルゴリズムで、円の内部にある特徴点の数を概算する方法の例を示すものである。
【図4】広告上にこのドキュメントの画像特徴点を重ね合わせて表示したものである。
【図5A】特徴点の分布マップの例を示したものである。
【図5B】累積的特徴点分布マップの例を示したものである。
【図6】本発明の一例に係わる、矩形内にある特徴点の数を計算する方法を説明するためのものである。
【図7】本発明の実施形態に係わる、3次元空間中の3段階構造とされたEMMのモデルを説明するためのものである。
【図8】2次元フィルタの対角線方向での形状の例を示すものである。
【図9A】白黒のマルチメディアアイコンの典型例を示すものである。
【図9B】グラフィック効果を施されたEMMを示すものである。
【図10】ドキュメントページにEMMがアルファブレンディングされた例を示すものである。
【図11】不定形状のEMMの例を示すものである。
【図12】不定形状のEMMの配置手法の例を説明するためのものである。
【図13】他のEMMのデザイン例を示すものである。
【図14】他のEMMのデザイン例を示すものである。
【図15】他のEMMのデザイン例を示すものである。
【図16】他のEMMのデザイン例を示すものである。
【図17】他のEMMのデザイン例を示すものである。
【図18】本発明の一形態である、データベースとEMMを有する物体から、デジタルメディアを提供するための方法の例を示すものである。
【図19】本発明の一形態である、EMMを備える物体を生成する方法の一例を示すものである。
【図20】本発明の一形態であるシステムの機能ブロック図を示すものである。
【図21】本発明の一形態である、携帯端末プラットフォームの一例を示すものである。
【発明を実施するための形態】
【0013】
以下の詳細な記述において、図中にも示される参照番号は、同様の機能を有する要素に類似した数値を当てている。これらの図面はあくまでも例示のためであって、本発明を限定し、特定の実施態様だけが本発明の原理と一致することを示すものではない。実施形態は本発明の原理に基づいて当業者が実施可能な程度で十分に記述され、本発明の技術思想の範疇であれば、他の形態を適用したり、各要素を変更あるいは交換したりすることができることは理解されよう。すなわち、以降に示す詳細な説明は、限定的に理解されるべきではない。さらに、記述されている多様な本発明の実施形態は、一般用途のコンピュータ上でソフトウェアを動作させても、専用ハードウェアの形でも、あるいはソフトウェアとハードウェアとの組み合わせでも、実現することもできる。
【0014】
本発明の一実施形態である、媒体上に設けられる埋め込み型メディアマーカ(以降Embedded Media Markers (EMM)と呼ぶことがある)は、紙ドキュメント上に重なるように印刷されるマーカであり、ドキュメントの一部の特定領域に関連付けられている。本発明の一実施形態では、例えばカメラを内蔵した携帯電話を使って、EMMが設けられたドキュメントの部分の写真を撮影し、EMMが設けられたドキュメントの場所に関連付けられたデジタルメディアが携帯電話のディスプレイ上に表示される。バーコードと比較してみると、このEMMの実施形態の方は透明に近い一方で、視認が可能である。つまり、EMMは使用者がドキュメントのコンテントを閲覧するのを妨げない。EMMに関連付けられたデジタルメディアの検索は、撮影されたEMMが設けられたドキュメントの部分の局所画像特徴に基づいて行われる。いくつかの実施形態では、オリジナルのドキュメントの表示をなるべく妨げずにEMMの配置されたドキュメントの部分から十分な識別用の特徴を取得できるように、半自動的にドキュメント中のある場所にEMMを配置する手法を示す。
【0015】
以下の実施形態では、EMMを有する物体の生成システムや方法の説明の他、これらのマーカを用いる多様な目的を示す。本発明のいくつかの実施形態では、EMMはユーザに対してデジタルメディアやデータ(デジタルメディアオブジェクト)が存在することを示すのに用いられ、EMMが設けられた対象物(例えば、紙)と関連付けられた、どこか他の場所に、それらが保存される。加えて、EMMを用いることで、ユーザは簡単に関連付けられたデジタルメディアオブジェクトを検索し閲覧することが可能となる。本発明の一実施形態では、そうしたメディアやデータは、EMMを使用するオブジェクトによって図示されたコンテントに関するさらなる説明を提供するようになるだろう。言い換えれば、埋め込まれたEMMは、EMMが設けられたオブジェクトに関連付けられたローカルあるいは外部のメディアオブジェクトへのメディアリンクのようなものである。
【0016】
本発明の一以上の実施形態では、紙には意味を備えた標識である、埋込みメディアマーカ(EMM)が付加され、前述のメディアリンクの存在とメディアの形式が表示される。本発明の一実施形態では、EMMを見たとき、カメラ付き携帯電話でEMMが設けられたドキュメントの部分を撮影することで、そのドキュメントに関連付けられたデジタルメディアを見ることができることが、ユーザに示される(あるいは理解される)。これは、ウェブページにおいて下線、フォント変更、画像タグといった表示手法で、ユーザがクリックしたときに追加情報が得られるリンクが存在していることを表すのと類似した手法である。本発明のいくつかの実施形態では、バーコードとは異なって、EMMはほとんど視覚的に邪魔にならないので、ドキュメント中の内容を閲覧する障害にもなりにくい。本発明のいくつかの実施形態では、データ埋め込みグリフコードやアノトパターンと異なって、EMMは通常の解像度のプリンターで印刷することができ、通常の解像度の携帯電話のカメラで撮影した画像でも、利用することができる。さらに、本発明の一実施形態では、EMMはEMMが設けられた場所に関連付けられたデジタルメディアの形式(例えば、音楽、ビデオ、画像)を示すようにデザインされている。
【0017】
本発明の一実施形態では、ドキュメント中に半自動的にEMMを配置する手法とアルゴリズムを提供する。この手法とアルゴリズムは、ドキュメントの一部分を識別するために、ドキュメントの本来のコンテントを主として用いる(すなわち、バーコードのような識別用マークを用いない)。また、本発明の手法とアルゴリズムは、オーサリングツールの要素として用いることができ、マルチメディア情報を付加するために、メディアエディタを用いて紙の一ページ上の所望のアンカーポイントを選択すると、本発明のアルゴリズムによって、編集者が選択したアンカーポイントに応じて自動的にEMMが配置される。EMMは、ドキュメントのその部分の位置が識別できるように、そのドキュメントの部分に関する十分な量の特徴をマーク範囲内に含むように配置される。EMMは続いてそのドキュメントコンテンツ上に重ね合わされ、高機能化された紙として出力される。EMMは透明な印刷媒体、例えば透明シートやステッカーの上に印刷し、ドキュメントコンテントの対応する箇所上に重ねて配置して使用することも可能である。そして、ユーザは、紙上のEMMが設けられたドキュメント部分を撮影することで、画面、スピーカ、あるいは他の出力機器といった動的デバイス上で追加マルチメディア情報を取得することができる。
【0018】
図1Aは、あるパンフレットに付加された、EMMの例示的な形態を示す。ここで示すEMMの形態は、このパンフレット中の人の手の位置に、対応付けられたビデオが存在することを示すものである。大きなEMM境界101(この例では円)の中のドキュメントの部分が、EMMが設けられたドキュメントの部分として扱われる。EMMが設けられたドキュメント部分内には、小さい境界102(この例では円)で示され、その内部にはこのEMMに関連付けられているメディアのタイプを示すグラフィック103(この例ではビデオ)を有するメディアタイプマークが設けられる。小さい円102に接続された矢印は、そのメディアが関連付けられたドキュメント中の正確な場所を指し示すもので、アンカーもしくはEMM埋込みドキュメント箇所と呼ぶことができる。なお、図中にはEMMの構成要素を説明するための吹き出し線と説明が表示されているが、これらはEMMの構成要素ではない。
【0019】
図1Bは、EMM110の一実施形態を示すもので、地図111上に設けたものである。地図111は地形に関する高品質な情報を大きな表示領域で提供する。これは屋外で読みやすく、折りたたみもでき、他の人々と共有もしやすい。しかし、場所特有の動的な情報、例えばレストランのビデオクリップ、公園の天気予報、ホテルの現在の割引情報、といったものを提供できない。
【0020】
EMMを用いると、こうした動的なマルチメディアを紙の地図を通じて簡単に提供できる。図1Bに示すように、東京の地図上に、和食料理店がEMM110によって加えられており、その場所の歴史やハイライトに関するビデオクリップを指し示していて、それは携帯デバイス112を用いて見ることができる。携帯デバイスはEMMの内部にあるドキュメントの特徴あるいは特徴点を用いて、どのビデオクリップが実行されるのかを特定する。同様に、EMMを用いてカスタマーレビューやそのレストランのメニューを示してもよいし、その場で店の予約をするために用いてもよい。なお、ここでEMMはもともとの地図のレイアウトは変更せず、視覚的にもほとんど邪魔にならない。これがEMMがバーコードを利用した既存の手法と異なる点である。加えて、関心領域(POI:Point of Interest)の真上にEMMを配置することができる点は、地図上の関心領域のコンテキストを維持するのに特に有効である。
【0021】
図2は本発明に係わるEMM200の一例の詳細を示すものであり、特徴境界201、メディアタイプアイコン境界202、メディアアイコン203、アンカーポイント204、そして矢印205が含まれる。EMM200の機能的なデザインと、ドキュメント上に半自動的にEMMを配置する手法とアルゴリズムとについて以下に記述する。すなわち、ここではユーザがドキュメント上でアンカーポイント204を選択して、その場所にマルチメディア情報を関連付けるためのオーサリングツールを説明する。本発明の他の目的に関する、ユーザが選択したアンカーポイントにとって最適なEMMの場所と配置とを、そのEMMが設定されたドキュメントの部分が十分正確な識別を可能とする数の特徴が含むように、自動的に見出すアルゴリズムについても記述する。そして本発明に係わるEMMは例えば印刷物として元のドキュメント上に重ね合わされて(例えばアルファブレンドされて)、進化した紙となる。既存の紙ドキュメントにEMMを追加するために、EMM200は透明な媒体、例えば透光性シートやステッカー上に作成し、それを既存のドキュメントの対応箇所上に重ね合わせることができる。ユーザは、例えばカメラ付き携帯電話で、このEMMが設定されたドキュメント部分の写真を撮影し、これを解析して、そのドキュメントにリンクされたメディアを検索し、そのメディアを再生することができるようになる。
【0022】
[EMMの望ましい特徴]
本発明のいくつかの実施形態では、EMMは、紙上に印刷されたコンテントの特定の一部分にデジタルメディアが関連付けられていることを示す、紙上のマークを意味する。使用感を向上させるために、本発明のいくつかの実施形態に係わるEMMは、次の特徴を有する。
1.EMMは人が見ることができる。EMMはドキュメントに関連付けられたマルチメディア情報の存在を知らしめるために可視のマークであるべきである。
2.EMMの意味を人が把握できる。EMMは、EMMに関連付けられたデジタルメディア、例えば、オーディオ、ビデオ、テキスト、画像、アノテーションといった、メディアの種類を示している。
3.EMMは紙の上で余分な領域を占めず、EMMの配置によるドキュメントのレイアウトへの影響が少ない。
4.EMMはオリジナルの紙上のコンテントの変化を実質的に最小限とする。EMMのデザインと配置とは元のドキュメントのコンテントとブレンドされる。
5.EMMはドキュメントの部分を大きく劣化させない。認識手法がドキュメントのコンテントの特徴に基づくため、ドキュメントのコンテントはうまく保存されることになる。
6.EMMは、マルチメディアを再生するために必要となる画像をユーザにガイドする。
7.EMMは、マルチメディアを再生するために必要となる十分な量の特徴を含んだ領域を示す。
8.EMMはデータベース内でインデックス化すべきドキュメント部分の大きさを制限でき、計算の複雑さとデータ容量を低減し、検索速度を向上させる。
【0023】
[例示的なEMMの作成]
a. 特徴境界マーク
バーコードを用いないため、ユーザは関連するドキュメント部分を識別するために画像特徴を用いる必要がある。こうした特徴は記事上の画像から得られたいくつかの特徴か、異なる種類の特徴の組み合わせであってもよい。こうした特徴としては、記事上の画像の局所空間配置から抽出された一般的な画像局所特徴を利用することができる。一般的な画像特徴の中でも、SIFTやPCA-SIFT、SURFあるいはFITといった、スケール不変画像局所特徴(scale invariant image local feature)が好ましく利用できる。あるいは、エロールらが開発したHOTPAPERで用いられているテキスト部分の単語の配置に基づく画像特徴や、中居らが開発したLLAHで用いられている特徴点の局所配置に基づく手法を用いることもできる。これらの特徴はドキュメント画像の一部であるため、バーコードのような明確な輪郭がない。もし特徴の数を認識精度を高めるために増やす必要が生じた場合、この技術では、これらのグループとして扱われる特徴に対して明確な境界を持たないことになる。明確な境界を持たない場合には、システムがそのドキュメント部分を識別するのに十分な量の特徴を含んでいないドキュメント領域をユーザが撮影してしまう可能性が高くなる。この問題を解消するために、ユーザに対して撮影用の境界を付加してガイドすることが望まれる。いくつかの実施形態では、この境界はそのドキュメント部分を識別するに必要最小限となる領域が撮影範囲に含まれるように設定される。この撮影範囲のガイドを使用することで、いくつかの実施形態では特徴データベースにおいてインデックス化される特徴の数を、大幅に減少させることも可能となる。こうした特徴の数を制限することは、認識精度と認識速度とを高める上でもとても有効である。
【0024】
本発明のいくつかの実施形態では、様々な方向から撮影した場合であっても十分な数の特徴が取得できるように、図2に示すような特徴境界円201を用いて、人工的に特徴境界を表示している。(なお、カメラの光軸は紙のほぼ法線方向にあると仮定した。)特徴境界円は、ドキュメントの一部分を識別するために用いられる特徴をその中に含んだページの一領域あるいは一部分を規定する。ドキュメントの領域識別という観点では、円が大きいほど、そのドキュメント部分の識別に用いることができる特徴の数を増やすことができる。一方、円が大きい程、各ページ内に配置できるEMMの数が少なくなってしまうし、特徴数を減らすことで得られるメリットも損なわれてしまう。さらに、カメラ付き携帯等で大きな円を撮影しようとすると視野角と解像度の制約のためにユーザがうまく利用できない場合も発生する。
【0025】
いくつかの実施形態では、円の大きさ(すなわち図2の半径R)の考慮以外に、円の配置(すなわち図2の中心点(X,Y))もまたドキュメント部分の識別には重要となる。もし、特徴の分布が密な箇所に円が配置された場合、円の半径Rは非常に小さくできるし識別精度も高い。一方、空白の部分に大きな円を配置しても識別精度は低下してしまう。こうした考え方に基づいて、好適な円の中心(X,Y)と半径Rを決定する本発明の方法が提供される。
【0026】
b. メディアタイプ(種別)マーク
いくつかの実施形態においては、カメラ付き携帯端末での写真撮影用のガイドの役割に加えて、リンクされているメディアの種類(例えば、オーディオ、ビデオ、ウェブページなど)の情報は、利用者にとってこの進化した紙ドキュメントを利用する上で役に立つ。図2に例示するEMMはこのEMMにビデオへのリンクが関連付けられていることを示すためのビデオアイコン203を含んでいる。メディアタイプに関するアイコン情報は、ここではメディアタイプアイコン境界と呼ばれるもう一つの円202で囲まれている。この円202はアイコン情報を強調する上で有効である。一方、これを特徴境界マーク201と視覚的には一致させてもよい。
【0027】
いくつかの実施形態では、メディアアイコン203は、ユーザの注意を引く程度の大きさに生成される。一方で、このマーク203によってドキュメントの部分を識別するのに必要となる十分な数の特徴が隠されて減少してしまわないようにするべきでもある。本発明の一つに関連するアルゴリズムでは、アイコンマークの最適な中心位置(x,y)の検出方法を提供する。
【0028】
c. アンカーポイントと矢印
いくつかの実施形態では、図2の小さい方の円202は紙の特定の箇所へリンクするための明らかな点があるわけではないので、紙上のアイコンマークを取り囲む円を用いることは難しくはない。しかし、場合によってはあまり安易にこの円を配置するとユーザに正確な情報が伝わりにくくなる場合もある。例えば、図面の中にいくつかの機械部品が密集して配置されていて、多くの部品は3次元モデルで表示されているような場合、それらの部品とアイコンマークを囲む円とを対応付けることはユーザにとって難しいだろう。こうした問題を解消するために、本発明のいくつかの実施形態では、ドキュメント作成プログラムを用いて、ドキュメント中の特定の場所をアンカーポイント(m,n)としてユーザに選択させ、アイコンマークを取り囲む円からそのアンカーポイントを指し示す矢印を追加する。このようにすることでこの矢印とアイコンマークを囲む円とで、特定の箇所(m,n)に対する指し示しを表現できる。
【0029】
d. 画像処理
いくつかの実施形態では、オリジナルドキュメントへの影響を低減するため、メディアタイプアイコンを表現するときは、着色された領域ではなく、スケルトン表現(骨格部分のみの表示)が選択される。人間の眼はアルファブレンドされた画像の分離能力が一般に高いため、原画像にアルファブレンドされたメディアタイプアイコンはオリジナルドキュメントへの意味合いについての影響を低減させるうえで有効である。いくつかの実施形態では、色チャンネルと領域に応じてアルファブレンド係数を変化させることで、EMMが付与される領域内でのテキストや写真の色を変更することもできる。あるいは、紙ドキュメント中の図形オブジェクトは2次元空間で表現されることが多いから、いくつかの実施形態では、EMM自体を3次元状に表示させるようにしてもよく、これによってEMMと、オリジナルドキュメント中の図形オブジェクトとの区別がいっそうしやすくなる。
【0030】
いくつかの実施形態では、図2に示すようにEMMの外観が類似した、大きな円201が小さな円202を取り囲む、ものとすることができる。小さい円202は単純なアイコン203とそれに付加された矢印205とで表される(図2参照)。いくつかの実施形態では、EMMについて視覚上の統一性を持たせることで、ユーザがページ中でEMMを発見しやすくすることができる。EMMの機能は、ウェブページ内で着色や下線を用いる、慣用されているハイパーリンクと類似している。ハイパーリンクと異なるのは、EMMの実施形態が、物理的な表示媒体上に表示され、そしてEMMが付されたドキュメントの箇所に関連付けられた、利用可能なメディアを示すアイコンを用いる点である。
【0031】
いくつかの実施形態では、画像およびテキストのオクルージョンを、EMMを含むページを印刷するために用いられるデータの輝度のみを調整することで緩和させることもできる。一実施形態では、EMMを配置するときに、ある限られた範囲で重なり合う画像の輝度を変化させる。ここで輝度情報を用いたのは、カラーおよび白黒の装置あるいはプリンターにおいて高い正確性をもって再現されるからである。一実施形態では、大きな境界円と小さな円とは、これらと重なり合う画像の輝度情報に対して付加される一方で、影付き処理の部分では輝度が減少するようにする。
【0032】
いくつかの実施形態では、画像とテキストとの干渉は、単純に、EMMに明るい色を用いる、線の太さ、ドットの大きさを選択する、あるいはコンテンツの空白や間隙等の間にドットを配置し、EMMがドキュメントのコンテンツの邪魔しない一方で、ユーザがEMMを認識しやすくする、といった処理をして軽減することもできる。
【0033】
いくつかの実施形態では、小さい方の内部の円202がメディアアイコン203とアンカーポイント矢印205とを含む。メディアアイコン203はリンクされているオーディオやビデオなどのメディアの種類を画像として表現する単純なアイコンである。このアイコン203は小さな円202の内部に輝度は増加させずに描画され、先に述べたような影付き処理が施される。アンカーポイント矢印205は、隣接する円の中心からの指し示しを表す小さな矢印として描画される。矢印205はページ内でユーザが指定した領域を指し示す。矢印の外観は関連付けられた円とマッチするように表示される。
【0034】
[EMMの配置手順とアルゴリズムの実施形態]
1.EMMの配置ルールと手順
いくつかの実施形態では、EMMのオーサリング処理は、オリジナルのドキュメントをEMMオーサリングエディタに読み込んで処理することを含めることができる。読み込まれた後に、各ページの全体の局所画像特徴が所定の特徴抽出方法に従って抽出され、一時メモリに記憶される。なお、そのドキュメントに対応する、予め抽出された局所画像特徴を外部データベース等から受信して用いてもよい。次に、先に説明したような手順で、アンカーを施す処理と、アンカーにリンクされるデジタルメディアの情報をユーザから受信したのち、一時メモリ中のアンカーポイントの周囲の局所画像特徴を用いてEMMの大きさ(特徴境界、メディアタイプ境界)と位置とを決定する処理を行う。EMMの内部に存在する局所画像特徴の決定と、ユーザによる編集処理とが完了したあと、ユーザからのドキュメントの保存や印刷指示が受信され、EMMの内部に含まれる局所画像特徴と、EMMにリンクされるメディアのURLやファイル自体とが関係付けられてデータベースに保存される。本処理に用いる特徴データベースは、EMMの固有識別番号、EMM内部に存在する各特徴点毎の特徴を表すベクトル情報を含む局所画像特徴のセット、埋め込まれたデジタルメディアのローカルメモリ上あるいはインターネットアドレス、といった情報が含まれる。
【0035】
あるいは、オーサリング処理ではページ全体の画像特徴を特徴データベースに保存するようにしてもよい。一時メモリ中に保存された局所画像特徴を用いてEMMの大きさと配置箇所とを決定する上で、リンクを形成する箇所に基づいてページ全体の画像特徴を保持するデータベースからEMMの範囲内の画像特徴を用いて比較するようにしてもよい。局所画像特徴を保存する場合には、EMM内に含まれる局所画像特徴をコピーし、関連付けられるデジタルメディアのアドレスとともに、他の参照テーブルデータベースに保存するようにすることもできる。
【0036】
いくつかの実施形態では、各ページから抽出された特徴は単純に一時メモリに保存することもできる。オーサリングツールによりEMMの位置が決定された後、EMMがページに追加され、EMMと重なり合った箇所を含む近傍領域の画像データが切り取られ、切り取られた画像から画像特徴を再計算し、この特徴をデータベースに保存するようにしてもよい。このようにすることで、EMM自体の画像特徴がオリジナルのドキュメントの特徴と組み合わされることになるので、より少量の特徴を各EMMに対応して保存すればよくなり、この結果データベースもより多くのEMMを取り扱えることになる。加えて、EMMと重なりあった画像について、特徴を再計算するようにすることで、EMMを含まない画像特徴を用いる場合よりも、ユーザが撮影した画像との整合性を向上させることができる。
【0037】
いくつかの実施形態では、EMMの構造について、主にマルチメディアが複合された表示物体に関するユーザの要求という観点で主に説明してきた。いくつかの実施形態では本発明のシステムがユーザにより好適なサービスを提供できるように、装置側の要求という観点でも考慮がなされる。より具体的には、本実施形態のドキュメントの部分認識処理への悪影響なしにシステムを改善することができるようにEMMを配置する。この目的を達成するために、EMMの配置用のパラメータの調整のアルゴリズムに工夫が施される。
【0038】
いくつかの実施形態では、EMMの調整のために3つの基本的なパラメータ、特徴境界円中心(X,Y)、特徴境界円半径R、そしてメディアタイプ円中心(x,y)がある。識別用のシステムにおいては、各EMMを識別するために十分といえる量の閾値以上にその画像部分でカバーされる量の特徴点が含まれていてもEMMの識別精度は大きくは変わらないので、特徴境界円の最適化は、ドキュメント上での表面積が最小で、画像部分の識別精度が十分に良いということを目標になされる。EMMが占める表面積を小さくすることで、本実施形態のシステムでは次のような利点が生じる。
1) EMMを配置したことによるドキュメントのオリジナルコンテントの見にくさが軽減される。
2) 表面積が小さいことでより多くのEMMを各ページ内に配置することができる。
3) パッチ識別用の円の内部にある特徴点(例えば上述したSIFT/SURF/FITの特徴点)をインデックス化するため、面積が小さくなればインデックス用のサーバに保存する特徴点の量も少なくすることができる。特徴点の量が少ないことは識別速度を向上させる上でも有効である。
4) マークされた小さい領域を用いることで利用者が撮影する際のガイドが提供され、計算量も少なくなるので利用者がマルチメディアデータを取得するための待ち時間も短縮される。
5) 撮影領域が小さくなることで、撮影性能に制約のあるカメラ付き携帯端末を用いた場合でも、撮影が行い易くなる。すなわち、撮影する円の大きさが大きいと、携帯端末のカメラとドキュメントとの間の距離も遠ざけて撮影する必要が生じるが、小さい円を近くで撮影した方が、撮影作業自体も容易であるとともに、撮影画像の画質(例えばダイナミックレンジや解像度)も高くなるので、検索性能も結果的に向上する。
【0039】
いくつかの実施形態では、特徴境界円の大きさを小さくするために、本発明の実施形態に係わるアルゴリズムによって、特徴点の密度が高い領域に境界円が配置されるとともに、最低限含まれる必要がある量の特徴点を円内に含む小さい半径の円を求める処理を行う。
【0040】
いくつかの実施形態においては、前述したドキュメント部分識別アルゴリズムで、特徴境界円はユーザが視認可能な最小となるサイズよりは通常は十分大きい。いくつかの実施形態に係わるアルゴリズムでは、特徴境界円の内部のメディアタイプアイコンを取り囲む円は、ユーザがEMMと一体であることがわかるように設定される。メディアタイプアイコンによって生ずるコンテンツの見づらさを低減するために、本実施形態のアルゴリズムでは、この円を特徴点の数が最小密度である箇所に移動させるように試みる。すなわち、アイコン用円のサイズの決定とともに、オリジナルドキュメントの中でその円が含む特徴点の数が最小となるように最適化をする。このようにすることで、ドキュメント部分の識別の上で以下の利点が生じる。
【0041】
1)メディアタイプアイコンとそれを取り囲む円は重要な特徴になるべく影響を与えさせない。こうすることでユーザはオリジナルコンテントとアイコンとが区別でき、オリジナルドキュメントの理解の障害にならないようにする。
2) メディアタイプの表示が半透過の骨組みと影とによって主に構成される場合、その吹き出し(call out)表示とオリジナルドキュメントのコンテントとの組み合わせを、オリジナルのドキュメント中でも特徴点が粗い領域中に配置することで、より高い分別性を与えられる。この特徴点密度のバランス処理は、装置にとってはより一様に分布した特徴点を検出するのに有効であり、さらに、撮影時の携帯端末側の姿勢を予測するために用いる空間変換マトリクスをより安定的に獲得する場合に有効となる。さらに、このマトリクスがより安定的に得られるようになることで、整合用の輪郭を減らし、部分識別精度をより向上させるのにも有効となる。
【0042】
いくつかの実施形態では、これらの最適化方法以外に、EMMの見栄えを良くしたり、より多様な条件化でも外観を一致させたりするためのいくつかの追加ルールが用いられる。そうしたルールは、以下のものを含む。
1)アンカーポイントは、特徴境界円の内部にあるべきである。こうすることでEMMの機能をより直感的に理解でき、配置場所の探索範囲も限定される。さらに、複数のEMMが同じページの同じ場所に配置されて結合してしまうのを避けることができる(グローバル位置最適化)。
2) メディアタイプアイコンとそれを取り囲む円はドキュメントの作成者が選択したアンカーポイントを覆ってはいけない。このようにすることで、矢印が常に円から外に向かって突き出し、EMMを様々な箇所に配置しても外観を一致させることができる。
3) 矢印をなるべく短くするために、吹き出し表示に用いるアイコンがアンカーポイントにより近くなるようにアルゴリズムを構成する。
4) 全EMMに施す影付き表示は無限遠に配置された同じ光源を用いる。
5) 影付き処理を施す際にEMMのモデルが3次元空間中の3段階構造を有すると仮定する。
6) いくつかの実施形態では、影付き処理の際の光源は無限遠の左上から照射されるものとする。
【0043】
2. 円内の点の量を見積もる高速アルゴリズム
いくつかの実施形態では、特徴境界円の最適な位置とサイズとを得るため、あるいはアイコン吹き出し表示円の最適位置を得るため、システムは円内の特徴点の数を計数しなければならない。もし、EMMを配置することで画像局所特徴を急激に変化させてしまう場合、システムは新たなEMMのパラメータ(すなわち、場所とサイズ)の検証後に、EMMが配置された部分内の全ての特徴を再計算する必要がある。こうした処理は最適なパラメータの組み合わせを妥当な時間内に得る上では実用上望ましくない。本発明のいくつかの実施形態におけるEMMは、エッジと影とを主たる構成要素としており、ドキュメントの一部分にEMMが追加されても特徴点の数が大きく損なわれることはない。EMMのエッジの近くにあるオリジナルコンテントとエッジとの間では新しい特徴が形成され得るが、EMMの透明部分では元の特徴に大きな影響を与えない。このため、EMMは局所領域での特徴点の数を増加させる可能性の方が高いといえる。この点を考慮すると、ページ内の特徴点分布について、EMM特徴境界円上やEMMメディアタイプアイコン境界上にある実際の特徴の量を見積もるのに、EMMが無い状態での特徴量の分布に基づいて行ったとしてしても安全に利用することができるといえる。
【0044】
いくつかの実施形態では、EMMのパラメータの各セットを検証する時に特徴の再計算を省略したとしても、多くの異なる円のパラメータとともに円内の特徴点の数の計数をシステムで行うことは必要となる。すなわち、システムでは円の中心として各画素の位置を試験する必要があるかもしれない。さらに、最適解に到達する前に異なる半径も試みるであろう。このため、円内の特徴点の数を見積もるアルゴリズムは現実的な使用目的では高速である必要がある。
【0045】
一以上の実施形態では、100DPIでスキャンされた1ページ内の一般的な特徴点の数nは数千に及ぶ。力ずくで検索する手法を用いたとすると、円の中の特徴点の数から予測される計算複雑性はQ(n)で表される。これは現実的な利用上は時間がかかりすぎる。
【0046】
いくつかの実施形態では、この計算複雑性を解消するために、円内の特徴点の数を見積もるために設計した高速アルゴリズムを用いる。このアルゴリズムは特徴点分散ヒストグラムの統合画像に基づいている。このアルゴリズムを用いるために、半径Rの円の中にある特徴点の数を、先の円の内部にあって一辺が√2・Rの正方形中にある特徴点の数を用いて概算する。円300と正方形301との関係を図3に示す。Ncは円300内の特徴点の数で、Nsは正方形301内の特徴点の数であり、Ns≦Ncとなる。この見積方法はドキュメントの部分を識別するために、正方形の内部の特徴点の数が部分の識別の最低限に達している場合には、円の中の特徴点の数も十分であることを保証できる。
【0047】
いくつかの実施形態に関連する図4は、広告ページ400の上に特徴点401を重ねて表示している。図5Aは、図4中の画像に対応する、特徴点分布マップであり、白いマップ中の各黒点がそれぞれ特徴点である。図5Bは累積特徴点分布マップであり、原点とある点とを頂点とする矩形内に存在する特徴点の数と一致する。累積特徴点分布マップ中で、各点における値は、その左上側の領域にある特徴点の数に一致する。画像中の画素の数をNとすると、この累積特徴点分布マップを得る計算複雑性はO(N)となる。このアルゴリズムではこのマップを一度計算しておけばよく、各画像についてシステムがこのマップを予め計算し保持しておくことができるので、ドキュメント作成者がこの手法を使って最適なEMMの配置を得るときに、このマップの計算複雑性は最適化をする場合でもそれほど影響しない。
【0048】
いくつかの実施形態では、累積特徴点分布マップとともに、一定時間内で正方形内にある特徴点の数をシステムで計算することもできる。図6において正方形ABCDは画像境界等の一つと並行な辺を有し、累積分布マップ上の各点A,B,C,Dでの点の数をそれぞれNA、NB,NC,NDとする。 ここでは図3の円の場合のように、システムは円内にある正方形内の特徴点の数を利用する。図5の累積特徴点分布は正方形内にある特徴点の数を計算するのに利用することができる。システムは円内の特徴点の量の概算量である、正方形ABCD内の特徴点の量NSQを次の式に基づいて決定する事ができる。
【0049】
この数式を使った実施形態のシステムは、1回の足し算と2回の引き算とで正方形内の特徴点の数を概算することができる。これは、力ずくアプローチで各特徴点を確認するために、2回の掛け算、2回の足し算、1回の引き算を計算するときと比べてずっと効率的である。例えば、ユーザがページ内の最適な円の中心を探す場合に、3000個の特徴点があるとして、この高速アルゴリズを用いる計算は約3800倍高速である。
【0050】
3. 最適な特徴境界円の決定
いくつかの実施形態では、円内の特徴点の数を概算する高速アルゴリズムに加えて、各画素の位置を円の中心とする配置のテストをシステムが行うことができる。さらに、システムは最良の特徴境界円の最適な半径もまた知る必要がある。最適な半径を得るために、本発明のいくつかの実施形態では次のバイナリサーチアプローチを最適化手法として用いている。
1) 円が、その中にアンカーポイントとその半径で最大の特徴点とを含むような円の中心位置を得る。
2)このとき、この半径の特徴点の最大数が、特徴点の下限数(KEYNUMLOWLIMIT)よりも大きいかどうかを判断する。
もし、下限より大きい場合は、現在の半径(currentradius)を大半径(radiushigh)とする。
それ以外の場合は、現在の半径を小半径(radiuslow)とする。
3)現在の半径を大半径と小半径の平均とする。
1)〜3)を大半径と小半径の差が所定の最小マージン(SMALLMARGEN)に達するまで繰り返す。
125〜250の円の半径が使用される場合、バイナリサーチアプローチは約18倍速くなる。
【0051】
4. メディアタイプアイコンを取り囲む円の最適化
いくつかの実施形態では、メディアタイプアイコンのサイズは固定されているので、この円の場所の最適化はこの円の中に最小の特徴点が含まれるように円の位置を決定することとなる。この最適化の方法と合わせて、先に述べた2および3のルールを適用すればEMMの見栄えをより良くすることができる。言い換えると、メディアアイコン取り囲み円の中心とアンカーポイントの距離は、取り囲み円の半径よりは大きくなくてはならない。取り囲み円は、短い矢印を配置するためにアンカーポイントの近くに配置すべきである。矢印の長さを短くする方法はいくつかある。1つの方法(1番目の方法)はアンカーポイントとメディアアイコン取り囲み円の中心との距離が最大となるように設定することである。他の方法(2番目の方法)は、特徴境界中心位置(X,Y)からメディアアイコン取り囲み円の中心位置(x,y)へのベクトルと、特徴境界中心位置(X,Y)からアンカーポイント(m,n)へのベクトルを計算し、この2つのベクトルのなす角が90°より小さくなるようにする。ここでは2番目のアプローチを利用した。
【0052】
[EMMのグラフィック効果の生成]
いくつかの実施形態では、紙ドキュメント上の図形オブジェクトは通常2次元であるので、EMMに3次元的な効果を施すと、オリジナルドキュメント中にある他のグラフィカルオブジェクトとEMMとをより明確に区別できるようになる。一実施形態のシステムでは、3次元空間における影を示す3段階構造のEMMモデルを用いる。3段階構造EMMモデル700については図7に示す。影に付いては光源が左上にあると仮定している。この効果を施すために、ゾーベルフィルタを2Dフィルタに続いて使用することもできる。ゾーベルフィルタは計数[1 0; 0 -1]を有する。2Dフィルタは、図8中に示される形状800の特性を対角線方向に持ち、他のフィルター位置では係数が0である。
【0053】
いくつかの実施形態では、EMMエッジに対するフィルタリング結果を組み合わせることによって、白黒(単色濃淡)のマルチメディアアイコンに応じた適当なEMMグラフィック効果を生成することができる。図9は、典型的な白黒のマルチメディアアイコン900とグラフィック効果で装飾されたEMM901を示す。矢印は最適なEMMパラメータのセットが決まった後に動的に3段階EMMモデルに追加しているので、矢印のグラフィック効果はEMMの他の部分のグラフィック効果と適当にブレンドされるようにしてある。
【0054】
図10には、いくつかの実施形態である、EMMをドキュメントのページ1000にアルファブレンディングした効果を示す。
【0055】
いくつかの実施形態として、ユーザがEMMの形状を不定形としたい場合が実用上想定される。不定形EMMを用いる理由は、例えば次のようなものである。
・ もしユーザがEMMの矩形状を正しい方向で常に撮影することができるなら、特徴量の計算速度が速くなる矩形状EMMの方を使用したい(回転の計算が不要になるため)。
・ 特定の目的(例えば祝日のお祝い、ブランドの知名度向上)でEMMを不定形にデザインしたい。
・ 適当にEMM形状を変形させることで、EMMが付加されたドキュメント部分を識別するのに役立つ場合がある。
・ EMMの形状に何らかの情報を持たせることもできる。
・ EMMの形状を変更することで、オリジナルドキュメントとの干渉をさらに低減することができる場合がある。
図11には不定形状のEMMのいくつかの例1101〜1104を示してある。
【0056】
図12で示すような、不定形のEMM1200を配置する一つの簡単な手法は、円形状のEMMにおいて最適化された円1201中にEMMの不定形の部分を整合させる方法である。図12(A)にこの手法を示す。この手法は単純である。しかし、不定形状のEMM全体が撮影されたときに、この手法では撮影された画像内に十分な数の特徴点が含まれることは保証できない。一方、図12(B)で示す手法では、どのような方向からEMMが撮影されたとしても共通に含まれる領域内に十分な特徴点が含まれるように設定することで、不定形状のEMM全体が撮影されたときに、撮影画像中に十分な数の特徴点が含まれることを保証するための手法の一例である。
1. 2つの直交する軸上に、この不定形状1200を投影し、2つの投影像1202および1203を作る。
2.投影像1202および1203それぞれについて、一方を一辺として含む、不定形状を囲むアスペクト比が固定された(例えば4:3の)複数の矩形境界1204−1、1204−2を生成する。
3.1、2の工程を、投影される直交軸を回転させて繰り返し、矩形を生成する。このとき作成する矩形の数および回転角は所定の数および回転角であってもよいし、EMMの周囲に適合するような矩形をエンジニアリング手法により決めてもよい。
4.これらの各投影像を一辺として作られる固定アスペクト比の矩形を重ね合わせたときに、全ての矩形で重複する領域を参照用円1205として見出す。すなわち、この領域はどの方向から撮影しても必ず含まれる領域となる。
5.参照用円の中心(すなわち最適位置)と不定形状のEMMの現在の設置位置との間で2次元ベクトルを得る。
6.十分な特徴点が含まれるように参照用円1205の最適化された半径を決定する。
7.参照用円の最適位置および円の大きさが得られた後で、外接円1201の半径と参照用円1205の半径との比に基づいて、2次元ベクトルと不定形状1200の表示倍率を調整し、不定形状1200が配置される。
【0057】
いくつかの実施形態において、ドキュメント検索システムのパフォーマンスを、スキャンされたドキュメントのデータベースおよびEMMによる検索成功率から評価したところ、99%以上であった。
【0058】
[EMMのデザイン例]
利用可能な様々なデジタルメディアを示すための、例示的なEMMのデザイン例を図13〜17に示す。EMMの装飾デザインはこれまで述べた理由等から、次のような特徴を有する。
1.EMMは典型的には紙やプラスチック等の表面上に印刷される。印刷は、オフセット印刷、フレキソ印刷、染料転写、インクジェット印刷、レーザプリンティング、パッド印刷、レリーフ印刷、グラビア印刷、スクリーン印刷、電子写真印刷、あるいは、他の表面にマークを形成する方法であってもよい。
EMMは、ビデオディスプレイ上に表示されてもよい(例えば、電子ブック、LCDモニターや電子ペーパー等)。
2.EMMは、例えばメディアタイプアイコンの境界である小さい円を取り囲む大きな円のような、特徴境界を有する。小さい円は、単純なアイコンであるのが望ましい、メディアタイプアイコンと、円に付加された矢印を備えている(図13〜17)。EMMの外観を統一させ、ユーザがページ内でEMMをすばやく見つけることができるようにデザインされている。これはウェブページ状でハイパーリンクを色や下線で示すのと似ている。
3.特徴境界(大きな円)内でメディアタイプアイコン(小さい円)の配置は変化する(図13〜17)。
4.矢印の位置と方向は変化する(図13〜17)。
5.メディアタイプアイコン境界(小さい円)と特徴境界(大きな円)の大きさとの関係は変化する。
6.EMMは印刷ページ上のコンテンツ上に重ねられる。下地となるコンテンツのオクルージョンは、EMMと下地となる画像とを含んだページを印刷するために用いる画像情報の輝度チャネルを調整するだけで緩和できる。EMMは下地画像の輝度を変化させる。輝度情報は、カラーおよび白黒の双方の印刷技術で忠実に再現できるため、輝度情報を調整するのである。この視覚効果は、印刷ページ上のコンテントと重なる、明るく、半透明なマークをもたらす。
7.EMMのエッジは影を落とすことで決定される(図13〜17)。 影を落とす輝度効果は、マーク本体に、大まかに輝度の逆数の効果を適用して得られるものである。この視覚効果は、暗く、半透明の影を、EMMの境界と内部のアイコンの境界とに与えることができる。
【0059】
[デジタルメディアを提供する方法]
図18は、データベースと本発明の実施形態の一つとを用いてデジタルメディアを提供するための方法に関するフローチャートの一例である。いくつかの実施形態では、部分領域の画像を受信すると(1800)、画像から複数の特徴が抽出され(1801)、EMMに対応するデジタルメディアが識別される(1802)。必要な場合には、デジタルメディアが続いて検索され、提供される(1803)。画像から抽出される特徴は、どのような指標が検索されるかをシステムに伝える特徴点を含んでもよい。
【0060】
[物体の生成方法]
図19は、視覚化されたコンテントとそのコンテント上の埋め込み型メディアマーカとを含む物体を生成するためのフローチャートの一例を示す。第1に、視覚化されたコンテント中でメディアを埋め込む場所の選択を受信する(1900)。選択に基づいて、EMMの場所とサイズが決定される(1901)。続いて、EMMは決定された位置と大きさとに基づいて物体上に配置される(1902)。
【0061】
[例示的なシステム構造]
図20は実施形態に係わるシステムの機能ブロック図の一例を示す。カメラ2001を内蔵する携帯端末2000を用いて、EMMを含むドキュメント2002をカメラの撮影領域に収めることで、フィードバックが提供される。EMMを識別すると、EMMが参照しているコンテントのタイプを決定するために、データベース2003を参照する。データベースは携帯端末に情報を返し、携帯端末はたとえばそのコンテントを実行する。
【0062】
[例示的な携帯プラットフォーム]
図21は、携帯端末のプラットフォームおよび遠隔サーバーシステムの一例を示したものである。システム2100は携帯端末プラットフォーム2101とネットワークリソース2103とを含む。
【0063】
携帯端末プラットフォーム2101は、携帯端末プラットフォーム2101内の各部品間の情報を通信するためのデータバス2104や他の通信機構を備え、プロセッサ(CPU)2105はバス2104と結合し、情報処理およびその他の計算や制御処理を行う。携帯端末プラットフォーム2101は、様々な情報やプロセッサ2105で実行される命令などを記憶し、バス2104に接続されたRAMや他の動的記憶装置のような揮発性メモリ(記憶領域)2106を含む。プロセッサ2105による命令の実行の間に一時記憶や他の中間情報を保存するための揮発性メモリ(記憶領域)2106もまた使用してよい。携帯端末プラットフォーム2101は、バス2104に接続され、BIOSやシステムの多様なコンフィギュレーションパラメータといった、静的な情報やプロセッサ2105用の命令を記憶するROMや他の静的記憶装置を含んでいてもよい。磁気ディスク、光学ディスク、あるいは固体フラッシュメモリデバイスといった固定記憶装置(不揮発性記憶領域)2108を備え、情報や命令を保存するためにバス2104と接続されてもよい。
【0064】
携帯端末プラットフォーム2101は、CRT、プラズマディスプレイあるいは液晶ディスプレイ等のディスプレイ2109とバス2104を介して接続され、携帯端末の利用者に対して情報を表示する。ディスプレイ2109は、EMMに関連付けられたデジタルメディアを見るために用いても良い。(キーボードなどの)入力装置2110は、英数字等の入力キーを含み、プロセッサ2105との情報通信や命令選択を行うために、バス2104に接続される。他のユーザ入力装置はマウス、トラックボール、あるいはカーソル方向指示キーのような、カーソル制御用のデバイス2111であり、方向情報やコマンド選択をプロセッサ2105に通信したり、ディスプレイ2109上でのカーソルの移動を制御したりする。この入力装置は典型的には2次元の自由度を持ち、第1軸(X)と第2軸(Y)とによって、平面上の場所を特定するのに用いられる、
【0065】
カメラ2112は、バス2104を介して携帯端末プラットフォーム2101に接続され、本発明のEMMを備える物体の写真を撮影するために用いられる。
【0066】
本発明は、ここに記述された技術を実現するためのコンピュータシステム2100の使い方に関連する。実施形態として、携帯端末プラットフォーム2101のような機械上に、本発明に関するシステムを搭載する。本発明の一形態としては、ここで記載された技術を、揮発性メモリ2106中の1以上の命令による1以上の処理をプロセッサ2105に処理させることで実現させる。こうした命令は不揮発性記憶領域2108のような他のコンピュータ読取可能な媒体から、揮発性メモリ2106に読み出してもよい。揮発性メモリ2106中に保持された一連の命令をプロセッサ2105に実行させることで、ここに述べた処理ステップを実現させる。他の形態としては、ハードウェアの電子回路を、発明を実現するソフトウェアと、一部置き換え、あるいは、組み合わせてもよい。なお、本発明は特定のスペックを有するハードウェアやソフトウェアの組み合わせに限定されるものではない。
【0067】
ここで、コンピュータ可読媒体とは、プロセッサ2105が実行するための命令を提供するのに用いられるあらゆる媒体を指す。コンピュータ可読媒体は機械読取可能媒体の一例であり、ここで述べた、いかなる方法もしくは技術をも実現するための命令を保持することができるものである。このような媒体は多様な形態をとり、不揮発性媒体、揮発性媒体、そして通信媒体といったものに限られない。不揮発性媒体としては、例えば、記憶装置(固定記憶装置2108)のような、光、磁気ディスクが含まれる。揮発性媒体としては、例えば揮発性記憶装置2106のような動的メモリを含む。通信媒体は、データバス2104のような配線を含む同軸ケーブル、銅線、光ファイバーなどであってよい。通信媒体は、電磁波や赤外光データ通信のような、音波や光を利用したものも含む。
【0068】
コンピュータ可読媒体の一般的な形態は、例えば、フロッピー(登録商標)ディスク、ハードディスク、磁気テープあるいは他の磁気媒体、CD-ROMあるいは他の光記憶媒体、パンチカード、紙テープなどの穴の配置を用いる媒体、RAM、ROM、EPROM、フラッシュEPROM、フラッシュドライブ、メモリーカードなどのメモリチップやカートリッジ、通信波、あるいはコンピュータが読むことができる他の媒体、といった通常のコンピュータ可読媒体を含む。
【0069】
さまざまな形態のコンピュータ可読媒体が、プロセッサ2105で処理される1以上の処理を実行させるために用いることができる。例えば、その命令が最初はリモートコンピュータから磁気ディスクに保持されてもよい。あるいは、リモートコンピュータがその命令を動的記憶装置にロードして、これを、モデムを用いた電話回線を通じて送信してもよい。コンピュータシステムに接続されたモデムは、電話回線を通じてデータを受け取るともに、データを赤外線信号に変換して赤外線として伝送するようにしてもよい。赤外線検出装置は、赤外線信号に重畳されたデータを受信し、適当な回路がそのデータをデータバス2104に伝送する。バス2104は揮発性記憶領域2106にデータを伝送し、プロセッサ2105がその命令を参照して実行できる状態におく。揮発性メモリ2106から受け取った命令はプロセッサ2105により処理される前あるいは後に固定記憶装置2108に保存されるようにしてもよい。命令は、周知のネットワークデータ通信プロトコルのいずれかで、インターネットを介してコンピュータ(携帯端末)プラットフォーム2101にダウンロードするようにしてもよい。
【0070】
携帯端末プラットフォーム2101は、データバス2104に結合したネットワークインターフェースカード2113のような通信インターフェースも有する。通信インターフェース2113はローカルエリアネットワーク2115に接続されたネットワークリンク2114に接続し、双方向のデータ通信が可能とされる。例えば、通信インターフェース2113はISDNカードやモデムと一体化され、対応する電話回線でのデータ通信を行わせるようにしてもよい。他の例としては、LANや802.11a、802.11b、802.11g として公知の無線LANリンクに適合したデータ通信接続を行うローカルエリアネットワークインターフェースカード(LAN NIC)としたり、Bluetooth(登録商標)を用いて実現してもよい。いずれの場合でも、通信インターフェース2113は、様々なタイプの情報を表すデジタルデータ列を伝送する、電気、電磁、あるいは光信号を送受信する。
【0071】
ネットワークリンク2114は、1以上の他のネットワークとのデータ通信を通常可能とする。例えば、ネットワークリンク2114は、ローカルエリアネットワーク2115を介して、ホストコンピュータ2116やネットワークストレージ/サーバ2122への接続を提供する。加えて、あるいは代替として、ネットワークリンク2114は、インターネットのような、広域あるいはグローバルネットワーク2118にゲートウェイ/ファイアウォール2117を通じて接続する。そして携帯端末プラットフォーム2101はインターネット2118上のどこかにある、例えばリモートネットワークストレージ/サーバ2119といった、ネットワークリソースにもアクセスすることが可能となる。一方、携帯端末プラットフォーム2101は、ローカルエリアネットワーク2115および/またはインターネット2118上のいかなる位置にいるクライアントからもアクセスできるようにしてもよい。ネットワーククライアント2120および2121は、プラットフォーム2101と同様のコンピュータプラットフォームに基づいて構築されても良い。
【0072】
ローカルエリアネットワーク2115およびインターネット2118は、共に電気、電磁、あるいは光信号を、データ信号列を伝播するのに用いる。なお、デジタルデータを携帯端末プラットフォーム2101に入出させる、多様なネットワークを通じた信号、ネットワークリンク2114上や、通信インターフェース2113を介した信号は情報伝送の伝送波の例示的な形態である。
【0073】
携帯端末プラットフォーム2101は、メッセージの送信、プログラムコードを含むデータの受信を、インターネット2118およびLAN2115を含む多様なネットワーク、ネットワークリンク2114および通信インターフェース2113を介して行うことができる。インターネットの例では、コンピュータプラットフォーム2101はネットワークサーバとして機能し、クライアント2120および/または2121で実行されるアプリケーションプログラム用の、リクエストコードやデータを、インターネット2118、ゲートウェイ/ファイアウォール2117、ローカルエリアネットワーク2115および通信インターフェース2113を介して伝送する。同様に、他のネットワークリソースからコードを受信してもよい。
【0074】
受信したコードはプロセッサ2105によって受信時に実行されるか、固定記憶装置2108あるいは揮発記憶装置2106に保存する、あるいは他の不揮発性記憶領域に記憶して、後で実行してもよい。
【0075】
最後に、ここに記載した方法や技法は、特定の装置固有に成り立つものでなく、いかなる適当な構成要素の組み合わせによっても実現できることを理解されたい。また、この開示の示唆に従って、多様な一般用途の装置を用いてもよい。またここで開示した手法を実現する専用の装置を作成することも有効である。この発明は特定の例示に基づいて記述されているが、それらは全て限定的にするためではなく、例示するためのものである。当業者であれば、ハードウェア、ソフトウェアおよびファームウェアの多くの異なる組み合わせが本発明を実施するのに適当であることは理解されうることであろう。例えば、ソフトウェアの記述は、アセンブラ、C/C++、pearl、shell、PHP、Java(登録商標)といった多様なプログラムあるいはスクリプト言語を用いて実現できる。
【0076】
さらに、当業者であればここに開示された本発明の明細書および実施例に基づいて、本発明の他の改良もまた明らかであろう。実施形態に記述された多様な観点や構成は、このコンピュータにより実現される画像検索システムを単独もしくは組み合わせることにより利用することができる。明細書と実施例は例示的なものと解釈され、真の発明の示す範囲および思想はクレームにより示されるものである。
【符号の説明】
【0077】
100、400 広告ページ(ドキュメント)
101 埋め込み型メディアマーカ(EMM)の境界円
102 EMMのメディアタイプマーク境界円
103、900 メディアタイプマーク(アイコン)
110、200、901 埋め込み型メディアマーカ
401 特徴点
【特許請求の範囲】
【請求項1】
付加的なデジタルメディアを提供するために用いる表示物の生成方法であって、
表示媒体の表示面の上に表示されるコンテント情報を取得し、
前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、
所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、
前記表示条件に基づいて前記マーカを出力し、
少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、
ことを特徴とする表示物の生成方法。
【請求項2】
前記表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする請求項1記載の表示物の生成方法。
【請求項3】
前記表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする請求項1または2記載の表示物の生成方法。
【請求項4】
前記マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする請求項1記載の表示物の生成方法。
【請求項5】
前記表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする請求項4記載の表示物の生成方法。
【請求項6】
前記表示媒体の表面上に前記コンテント情報と前記表示条件とに基づいて前記マーカを合成して出力することを特徴とする請求項1〜5のいずれか1項に記載の表示物の生成方法。
【請求項7】
前記マーカを、前記表示条件に応じて、透光性を有する基材上に印刷出力し、前記表示媒体の表面上に前記コンテント情報を出力し、前記表示媒体と前記基材とを重ね合わせて表示物を構成することを特徴とする請求項1〜5のいずれか1項に記載の表示物の生成方法。
【請求項8】
請求項1〜7のいずれか1項に記載の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するシステムであって、
前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、
前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、
前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、
前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、
前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、
を備えることを特徴とするデジタルメディア提供システム。
【請求項9】
付加的なデジタルメディアを提供するために用いる表示物を生成するためのコンピュータプログラムであって、
コンピュータを、
表示媒体の表示面の上に表示されるコンテント情報を取得し、
前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、
所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、
前記表示条件に基づいて前記マーカを出力し、
少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、
ように動作させるための、表示物を生成するためのコンピュータプログラム。
【請求項10】
前記表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする請求項9記載の表示物を生成するためのコンピュータプログラム。
【請求項11】
前記表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする請求項9または10記載の表示物を生成するためのコンピュータプログラム。
【請求項12】
前記マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする請求項9記載の表示物を生成するためのコンピュータプログラム。
【請求項13】
前記表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする請求項12記載の表示物を生成するためのコンピュータプログラム。
【請求項14】
請求項1〜7のいずれか1項に記載の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するためのコンピュータプログラムであって、
コンピュータを、
前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、
前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、
前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、
前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、
前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、
として動作させるためのデジタルメディア提供用コンピュータプログラム。
【請求項15】
表示面と、
前記表示面の上に表示されたコンテント情報と、
前記表示面の上の所定の位置にデジタルメディアが関連付けられていることを表示し、前記所定の位置の近傍の前記表示面の一部の領域の境界を表示するとともに、前記境界の内側に位置する前記コンテント情報が前記境界の内側に表示されるマーカと、
を備え、
前記デジタルメディアの取得に必要となる情報と画像特徴とを関連付けた関連付け情報の組を記憶する記憶手段を用いて、前記領域を特定するのに十分な量の前記コンテント情報の画像特徴が、前記マーカの前記境界の内側に含まれる、
ことを特徴とする表示物体。
【請求項16】
前記所定の位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所を前記境界の内側に含むように前記マーカが配置されていることを特徴とする請求項15記載の表示物体。
【請求項17】
前記境界内には前記デジタルメディアに関連するアイコン画像を含むことを特徴とする請求項15記載の表示物体。
【請求項18】
前記アイコン画像は、前記境界の内側で前記画像特徴の量が少ない箇所に配置されることを特徴とする請求項17記載の表示物体。
【請求項1】
付加的なデジタルメディアを提供するために用いる表示物の生成方法であって、
表示媒体の表示面の上に表示されるコンテント情報を取得し、
前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、
所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、
前記表示条件に基づいて前記マーカを出力し、
少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、
ことを特徴とする表示物の生成方法。
【請求項2】
前記表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする請求項1記載の表示物の生成方法。
【請求項3】
前記表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする請求項1または2記載の表示物の生成方法。
【請求項4】
前記マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする請求項1記載の表示物の生成方法。
【請求項5】
前記表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする請求項4記載の表示物の生成方法。
【請求項6】
前記表示媒体の表面上に前記コンテント情報と前記表示条件とに基づいて前記マーカを合成して出力することを特徴とする請求項1〜5のいずれか1項に記載の表示物の生成方法。
【請求項7】
前記マーカを、前記表示条件に応じて、透光性を有する基材上に印刷出力し、前記表示媒体の表面上に前記コンテント情報を出力し、前記表示媒体と前記基材とを重ね合わせて表示物を構成することを特徴とする請求項1〜5のいずれか1項に記載の表示物の生成方法。
【請求項8】
請求項1〜7のいずれか1項に記載の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するシステムであって、
前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、
前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、
前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、
前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、
前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、
を備えることを特徴とするデジタルメディア提供システム。
【請求項9】
付加的なデジタルメディアを提供するために用いる表示物を生成するためのコンピュータプログラムであって、
コンピュータを、
表示媒体の表示面の上に表示されるコンテント情報を取得し、
前記表示面における前記デジタルメディアの埋込み場所を指定する位置情報を受信し、
所定形状の境界を有するマーカを前記表示面の上に配置したときに、前記位置情報に基づいて配置される前記マーカの前記境界の内側に含まれる前記コンテント情報の画像特徴が、前記埋込み場所を特定するのに十分な量含まれるように前記マーカの表示条件を調整し、
前記表示条件に基づいて前記マーカを出力し、
少なくとも前記デジタルメディアの取得に必要となる情報と前記境界の内側に含まれる前記コンテント情報の画像情報とを関連付けた関連付け情報を記憶手段に記憶する、
ように動作させるための、表示物を生成するためのコンピュータプログラム。
【請求項10】
前記表示条件が、前記マーカのサイズあるいは前記マーカの配置位置の少なくとも一方であることを特徴とする請求項9記載の表示物を生成するためのコンピュータプログラム。
【請求項11】
前記表示条件が、前記位置情報で指定される位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所が前記境界の内側に含まれるように調整することで得られる条件であることを特徴とする請求項9または10記載の表示物を生成するためのコンピュータプログラム。
【請求項12】
前記マーカは、前記境界の内側に含まれ、前記デジタルメディアに関連するアイコン画像を更に備えることを特徴とする請求項9記載の表示物を生成するためのコンピュータプログラム。
【請求項13】
前記表示条件が、前記境界の内側で前記画像特徴の量が少ない箇所に前記アイコン画像を配置するように調整することで得られる条件であることを特徴とする請求項12記載の表示物を生成するためのコンピュータプログラム。
【請求項14】
請求項1〜7のいずれか1項に記載の生成方法により得られた表示物を用いて、前記デジタルメディアを提供するためのコンピュータプログラムであって、
コンピュータを、
前記表示物の上に表示された前記境界の全体を含む画像を取得する取得手段と、
前記画像のうち前記境界の内側に存在する画像特徴を抽出する画像特徴抽出手段と、
前記画像特徴抽出手段により抽出された画像特徴に対応する、前記記憶手段に記憶された関連付け情報に含まれる画像特徴を検索し、検索された画像特徴に関連付けられた前記デジタルメディアの取得に必要となる情報を提供する画像特徴検索手段と、
前記画像特徴検索手段により提供された前記デジタルメディアの取得に必要となる情報を用いて対応するデジタルメディアを取得する取得手段と、
前記取得手段により取得されたデジタルメディアをユーザに提供する提供手段と、
として動作させるためのデジタルメディア提供用コンピュータプログラム。
【請求項15】
表示面と、
前記表示面の上に表示されたコンテント情報と、
前記表示面の上の所定の位置にデジタルメディアが関連付けられていることを表示し、前記所定の位置の近傍の前記表示面の一部の領域の境界を表示するとともに、前記境界の内側に位置する前記コンテント情報が前記境界の内側に表示されるマーカと、
を備え、
前記デジタルメディアの取得に必要となる情報と画像特徴とを関連付けた関連付け情報の組を記憶する記憶手段を用いて、前記領域を特定するのに十分な量の前記コンテント情報の画像特徴が、前記マーカの前記境界の内側に含まれる、
ことを特徴とする表示物体。
【請求項16】
前記所定の位置の近傍で、前記コンテント情報の画像特徴の量が多い箇所を前記境界の内側に含むように前記マーカが配置されていることを特徴とする請求項15記載の表示物体。
【請求項17】
前記境界内には前記デジタルメディアに関連するアイコン画像を含むことを特徴とする請求項15記載の表示物体。
【請求項18】
前記アイコン画像は、前記境界の内側で前記画像特徴の量が少ない箇所に配置されることを特徴とする請求項17記載の表示物体。
【図1A】
【図1B】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図10】
【図11】
【図12】
【図18】
【図19】
【図20】
【図21】
【図13】
【図14】
【図15】
【図16】
【図17】
【図1B】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図10】
【図11】
【図12】
【図18】
【図19】
【図20】
【図21】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2011−135556(P2011−135556A)
【公開日】平成23年7月7日(2011.7.7)
【国際特許分類】
【出願番号】特願2010−145801(P2010−145801)
【出願日】平成22年6月28日(2010.6.28)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
【公開日】平成23年7月7日(2011.7.7)
【国際特許分類】
【出願日】平成22年6月28日(2010.6.28)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
[ Back to top ]