説明

映像コンテンツへの位置情報付与システムおよび方法

【課題】携帯電話番号を用いて、通常の撮影機器で撮影した画像(映像コンテンツ)に簡易に位置情報を付与する。
【解決手段】予め、顔写真、名前および携帯電話番号を少なくとも登録された家庭個別DB(データベース)43と、映像撮影時間情報が付加された映像コンテンツを受信する映像入力部44と、前記映像コンテンツから抽出された顔情報を基に、該映像コンテンツ中の人物の名前を認識する顔認識部47と、前記映像入力部で受信した映像撮影時間情報と、前記顔認識された人物の携帯電話番号とに基づいて、撮影場所の地名および施設名候補の少なくとも一つを取得し、前記映像コンテンツのタグ情報とするタグ付与部50と、前記撮影場所の地名または施設名候補のタグ情報を、前記映像コンテンツと共に保存するVoDコンテンツ保存部54とを具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は映像コンテンツへの位置情報付与システムおよび方法に関し、特に、ユーザが、デジカメ、ビデオカメラ等の撮影機器で撮影した静止画像または動画像に自動的に地名や施設名などの位置情報を付けて保管することのできる映像コンテンツへの位置情報付与システムおよび方法に関する。
【背景技術】
【0002】
従来は、デジカメ、ビデオカメラ等の撮影者が撮影した映像を見ながら、手入力で、撮影時の記憶やメモに従って位置情報または場所情報を映像コンテンツに入力していた。また、下記の特許文献1に開示されているように、撮影機器にGPS装置を付加して撮影映像と共に位置情報を映像コンテンツに記録することが行われていた。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−330377号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、前記した手入力で位置情報または場所情報を映像コンテンツに入力する方法は、正確に位置情報または場所情報を入力することはできるが、手間がかかり、効率が悪いという課題があった。また、前記撮影機器にGPS装置を付加して位置情報を取得する方法は、GPS装置を付加する分の撮影機器のコスト増になるという課題があった。
【0005】
本発明は、前記課題に鑑みてなされたものであり、その目的は、通常の撮影機器で撮影した画像に、携帯電話番号を用いて簡易に位置情報を付与することのできる映像コンテンツへの位置情報付与システムおよび方法を提供することにある。
【課題を解決するための手段】
【0006】
前記の目的を達成するために、本発明は、予め、顔写真、名前および携帯電話番号を少なくとも登録された家庭個別DB(データベース)と、映像撮影時間情報が付加された映像コンテンツを受信する映像入力部と、前記映像入力部で受信した映像コンテンツの映像撮影時間情報を抽出する時間情報抽出部と、前記映像コンテンツから抽出された顔情報と前記家庭個別DBに登録されている顔写真情報とを比較して、該映像コンテンツ中の人物の名前を認識する顔認識部と、前記時間情報抽出部で抽出した映像撮影時間情報と、前記顔認識部で認識された人物の携帯電話番号とに基づいて、撮影場所の地名および施設名候補の少なくとも一つを取得し、前記映像コンテンツのタグ情報とするタグ付与部と、前記タグ付与部で付与された撮影場所の地名または施設名候補のタグ情報を、前記映像コンテンツと共に保存するVoDコンテンツ保存部とを具備した点に特徴がある。
【0007】
また、前記タグ付与部は、前記映像撮影時間情報と携帯電話番号とにより携帯電話位置情報DBにアクセスして該映像撮影時間情報に対応する位置情報を得、該位置情報を基に地図情報DBにアクセスして該位置情報に対応する地名および施設名候補の少なくとも一つを得る点に他の特徴がある。
【0008】
また、予め、家庭個別DB(データベース)に顔写真、名前および携帯電話番号を少なくとも登録する工程と、映像撮影時間情報が付加された映像コンテンツを受信する工程と、前記映像コンテンツから顔情報を抽出する工程と、該抽出された顔情報と前記家庭個別DBに登録されている顔写真情報とを比較する工程と、該比較により、前記映像コンテンツ中の人物の名前を認識する工程と、前記映像入力部で受信した映像撮影時間情報と、前記顔認識部で認識された人物の携帯電話番号とに基づいて、撮影場所の地名および施設名候補の少なくとも一つを取得する工程と、該取得した地名および施設名候補の少なくとも一つを前記映像コンテンツのタグ情報とする工程と、前記タグ付与部で付与された撮影場所の地名または施設名候補のタグ情報を、前記映像コンテンツと共に保存する工程とからなる映像コンテンツへの位置情報付与方法に他の特徴がある。
【発明の効果】
【0009】
本発明は、撮影カメラにGPS機能を装着することなく、1人1台を持つまでに普及している携帯電話を巧みに利用して撮影画像の場所情報を自動的に付与できるという効果、およびこのためユーザは撮影画像に簡易かつ安価に位置情報を付与できるという効果がある。
【図面の簡単な説明】
【0010】
【図1】本発明が実施されるネットワーク環境の一例を示すブロック図である。
【図2】本発明の一実施形態のサーバの構成を示すブロック図である。
【図3】家庭個別DB登録部に登録される家庭個別データの一例を示す図である。
【図4】家庭個別DB登録部への登録動作を説明するフローチャートである。
【図5】サーバの動作を説明するフローチャートである。
【図6】図5の続きの動作を示すフローチャートである。
【図7】サーバのタグ付与部の動作の概略の説明図である。
【発明を実施するための形態】
【0011】
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明が実施されるネットワーク環境の一例の説明図である。
【0012】
PC等の端末装置2からは、顔映像、名前、携帯電話番号などの家庭情報がインターネット網3を介してサーバ4へアップロードされる。また、撮像装置1はビデオカメラ、デジカメなどからなり、該撮像装置1で撮影されたユーザ個人等の映像データ(静止画像、動画像)は、PC等の端末装置2を経由して、または直接にWiFi、WiMax等によりインターネット網3に送られる。インターネット網3に送られた家庭情報、及び映像データ又は映像コンテンツ(以下、映像コンテンツと呼ぶ)はサーバの情報・映像入力部からサーバ4に入力される。該サーバ4の構成は後で詳細に説明するが、映像コンテンツの顔情報から名前や携帯電話番号などを認識する機能、サーバ4に接続されている携帯電話位置情報DB(データベース)5にアクセスして映像コンテンツの時間情報を基に位置情報(GPS情報)を取得する機能、該取得した位置情報を基に地図情報DB6にアクセスし地図情報を取得する機能、映像コンテンツにタグ情報(位置情報、地名、施設名情報など)を付与する機能、映像ファイル作成機能、該映像ファイルを保管する機能、IDおよびパスワードを生成して該映像コンテンツに関連させる機能、VoD受信要求のアクセスに対応する機能、フィードバック情報に対応する機能などを有している。なお、前記携帯電話位置情報DB5および地図情報DB6は、インターネット網3に接続されることもできる。
【0013】
サーバ4はVoD視聴装置8からインターネット網3又はVoDインフラ網7を介してアクセスされると、前記IDおよびパスワードを照合した上で要求された画像コンテンツを映像出力部からVoDインフラ網7を介してVoD視聴装置8へ送出する。VoD視聴装置8はテレビやDVR等からなり、ユーザは該VoD視聴装置8の映像面上に映出された画像コンテンツの映像分類情報を用いて、見たい映像コンテンツやチャプター(映像シーン)を選択的に映出することにより、効率的にかつ自宅に居ながら楽しむことができる。また、サーバ4で自動的に付けられた前記タグ情報に満足しない場合には、ユーザは好みのタグ情報をサーバ4にフィードバックして、タグ情報を修正することができる。つまり、サーバ4は、該フィードバック情報により前記タグ情報を修正すると共に、タグ情報付与の精度が向上するように学習することができる。
【0014】
次に、前記サーバ4の構成の詳細を、図2のブロック図を参照して詳細に説明する。図2において、図1と同じ符号は同一または同等物を示す。なお、本発明では、ユーザは携帯電話を所持していることを前提とするものであり、ユーザが携帯電話を持ちながら所望の場所に移動すると、その行路は時間と共に、例えば携帯電話会社の携帯電話位置情報DB5に記録されるものとする。
【0015】
サーバ4は、前記端末装置2からの家庭情報(例えば、顔映像、名前、携帯電話番号)などが入力する情報入力部41、情報入力部41に入力した家庭情報などを受け付ける情報受付部42、該家庭情報などを登録する家庭個別DB登録部43を有している。前記家庭情報は、図3に具体例が示されているように、名前、顔画像および携帯電話番号がリンクされて構成される。
【0016】
また、サーバ4は、インターネット網経由で送られてきた映像コンテンツ(動画・静止画)が入力する映像入力部44、該映像コンテンツから時間情報を抽出する時間情報抽出部45を有している。該時間情報は、デジカメ、ビデオカメラ等の撮影機器が本来的に有する時計機能により映像コンテンツに付加される情報である。また、サーバ4は例えばDVフォーマットの映像をMPEG2や非圧縮映像に変換する映像規格変換部46を有する。また、サーバ4は、顔認識部47および特徴量抽出部48を有する。該顔認識部47は、映像コンテンツから顔データを抜き出し、家庭個別DB登録部43に予め登録されている家庭情報の顔映像と比較し、映像コンテンツに登場している人の名前と、その人と対応する携帯電話番号(その人が持っている携帯電話機の電話番号)とを取得する。
【0017】
映像特徴量DB49には地名や施設名がそれらの映像特徴と対で格納されており、特徴量抽出部48は映像コンテンツの中から映像全体あるいは顔以外の背景などから特徴量を抽出し、前記映像特徴量DB49と比較して、地名や施設名などを取得する。例えば、銀座、渋谷、東京タワー、ディズニーランド、都庁などの地名や施設名を取得する。なお、該特徴量抽出部48および映像特徴量DB49は、ユーザが携帯電話機を所持していない場合、あるいは所持を忘れた場合に有用となるものであり、本発明には必須のものではない。
【0018】
サーバ4は、また、タグ付与部50を有している。該タグ付与部50は、前記時間情報抽出部45から時間情報を受け取り、顔認識部47からは映っている人の名前と携帯電話番号を受け取り、特徴量抽出部48からは地名や施設名などのデータを受け取る。そして、前記携帯電話番号と時間情報を基に、位置情報取得部51を介して携帯電話位置情報DB5をアクセスし、位置情報を得る。例えば、「座標:35.632546,139.881328」という位置情報を得る。この位置情報だけでは、具体的な場所が分からないからこの位置情報を基に地名・施設名取得部52を介して地図情報DB6をアクセスし、具体的な地名・施設名などの候補情報、例えば、「浦安、ディズニーランド、幕張」などの候補情報を得る。タグ付与部50は、以上の情報またはデータから、映像コンテンツにタグ情報を付与する。このタグ情報は、例えば映像コンテンツのシーン毎に付けられるのが好ましい。
【0019】
サーバ4は、さらに、映像規格変換部46よりの映像コンテンツとタグ情報が付与されている映像ファイルを作成する映像ファイル(TS;Transport stream)作成部53、該映像ファイルを格納するVoDコンテンツ保存部54および図1の映像出力部に相当するVoD送出部55を有する。さらに、図1のフィードバック情報入力部に相当するVoD受信部56を有し、該VoD受信部56は、ユーザからのVoD視聴要求とフィードバック情報とを識別し、VoD視聴要求であればVoDコンテンツ保存部54にVoD視聴要求を送り、一方フィードバック情報であれば該フィードバック情報をフィードバック処理部57に送る。タグ付与部50は、フィードバック処理部57から修正情報を受けると、映像ファイル作成部53およびVoDコンテンツ保存部54に送付済みの該当する映像コンテンツに付与されているタグ情報を修正すると共に、修正内容に応じて、家庭個別DB登録部43および映像特徴量DB49のデータを修正する。
【0020】
次に、前記サーバ4の動作を、図4、図5のフローチャートを参照して説明する。まず、サーバ4の家庭個別DB登録部43に、家庭情報を予め登録する動作を図4のフローチャートを参照して説明する。ステップS1では、例えば図3のような家庭情報(個人や家族の顔画像、名前、携帯電話番号など)が入力される。ステップS2では、ユーザが入力内容が正しいことが確認されたか否かの判断がなされ、正しいことが確認された後、登録操作がなされると、ステップS3に進んで、前記入力された家庭情報が前記家庭個別DB登録部43に登録される。
【0021】
次に、サーバ4の動作を、図5のフローチャートを参照して説明する。ステップS11では、端末装置2から、撮影者の名前や携帯電話番号が入力された後、映像コンテンツ(静止画、動画)が入力されると、映像入力部44は撮影者の名前や携帯電話番号および映像コンテンツを受信する。ステップS12では、時間情報抽出部45で、映像コンテンツから時間情報を抽出する。抽出された時間情報は前記タグ付与部50に送られる。ステップS13では、映像規格変換部46で映像フォーマットが変換される。例えばDVフォーマットの映像がMPEG2や非圧縮映像に変換される。ステップS14では、顔認識部47にて、静止画や動画のシーン内の顔画像が抽出され、ステップS15では家庭個別DB登録部43を参照して顔認識ができた画像であるか否かの判断がなされる。この判断が肯定の場合にはステップS17に進んで撮影日時情報と撮影者と顔認識対象者(複数でもよい)の携帯電話番号とを、タグ情報として付与する。一方、顔認識ができなかった画像であれば、ステップS18に進んで、撮影日時情報と、撮影者の携帯電話番号とをタグ情報として付与する。
【0022】
その後ステップS19に進み、タグ付与部50は、携帯会社の位置情報DB5にアクセスし、前記撮影日時情報と携帯電話番号とを基に、その時刻の位置情報を取得する。次いで、ステップS20に進み、地図情報DB6にアクセスし、該位置情報を基に、該位置情報の地名や施設名及び近くの地名や施設名を付与候補として取得する。次に、ステップS21では、映像ファイル作成部53が、映像規格変換部46からの映像コンテンツに、タグ情報(撮影日時、顔認識された人の名前、地名や施設名等)を付与して映像ファイルを作成する。ステップS22では、作成された映像ファイルがVoDコンテンツ保存部54に一時的に保存される。
【0023】
次に図6に進み、ステップS23では、該映像ファイルがVoDコンテンツ保存部54から読み出され、VoD送出部55からVoD視聴装置8に送出される。そこで、映像コンテンツに付与されているタグ情報はユーザによって閲覧及びチェックされ、修正すべきタグ情報があれば(ステップS24が肯定)、ステップS25に進んで映像コンテンツのタグ情報の修正がなされる。また、ステップS26では、家庭個別DB登録部43のデータや、映像特徴DBのデータが更新(修正)される。そして、映像コンテンツに付与されるタグ情報が確定され、ステップS27にてVoDコンテンツ保存部54に保存される。一方、タグ情報の修正のフィードバック情報がなければ、タグ情報はそのまま確定されて保存される。
【0024】
図7に、本実施形態の動作の一具体例を示す。今、時間情報9時40分〜10時40分までの映像コンテンツ60が映像入力としてサーバ4に送られてきたとすると、顔認識(個人認識)部47は映像コンテンツ60から顔抽出をする。図7の例では、10時〜10時20分の間に写っている人の顔を抽出する。そして、家庭個別DB登録部43に予め登録されている家庭情報の顔映像と比較し、映像コンテンツに登場している人の名前と、その人と対応する携帯電話番号(その人が持っている携帯電話機の電話番号)とを取得する。いま、図3のデータが家庭個別DB登録部43に登録されているとすると、名前「はるか」と携帯電話番号「090−1111−1111」が取得される。また、前記時間情報(撮影日時情報)は、時間情報抽出部45で抽出されタグ付与部45に送られる。
【0025】
タグ付与部50では、映像コンテンツ60に対して撮影者の携帯電話番号「090−3333−3333」を付与すると共に、前記10時〜10時20分の映像に対しては「はるか」と携帯電話番号「090−1111−1111」とをタグ情報として付与する。また、撮影者と「はるか」の携帯電話番号を基に前記携帯電話位置情報DB5および地図情報DB6を前記のようにアクセスし、地名、施設名などの情報、例えば「浦安、ディズニーランド、幕張」を取得する。そして、前記映像コンテンツ60に、タグ情報、すなわち前記撮影者の携帯電話番号「090−3333−3333」、「はるか」、「090−1111−1111」および「浦安、ディズニーランド、幕張」を付与する。このタグ情報が付された映像コンテンツ60は、映像ファイル化され、一時的にVoDコンテンツ保持部54に保持された後、ユーザのVoD視聴装置8(図1参照)へ送られる。ユーザは受信した映像コンテンツを閲覧して、前記撮影者の携帯電話番号「090−3333−3333」、「はるか」、「090−1111−1111」に間違いがあれば修正し、地名、施設名候補「浦安、ディズニーランド、幕張」の中から所望のものを選択する。これらの修正情報および選択情報はサーバ4にフィードバック情報として返送される。そうすると、サーバ4のタグ付与部50は、映像コンテンツのタグ情報を指示された通りに修正または決定すると共に、家庭個別DB登録部43や映像特徴量DB49のデータを更新修正する。
【0026】
なお、携帯電話会社が有する前記携帯電話位置情報DB5は個人情報に係わるものであるので、本発明のサービス提供者は、該携帯電話位置情報DB5の提供について予め同意を得たことを確認したユーザ(携帯電話契約者)にのみ本発明のサービスを提供することができることに留意する必要がある。
【0027】
以上の実施形態では、本発明の典型例を説明したが、本発明の精神から逸脱しない範囲での変形は、本発明に含まれることは明らかである。
【符号の説明】
【0028】
1・・・撮像装置、2・・・端末装置、3・・・インターネット網、4・・・サーバ、5・・・携帯電話位置情報DB、6・・・地図情報DB、7・・・VoDインフラ網、8・・・VoD視聴装置、43・・・家庭個別DB登録部、44・・・映像入力部、45・・・時間情報抽出部、46・・・映像規格変換部、47・・・顔認識(個人認識)部、50・・・タグ付与部、51・・・位置情報取得部、52・・・地名・施設名取得部、53・・・映像ファイル(TS)作成部、54・・・VoDコンテンツ保存部、55・・・VoD送出部、56・・・VoD受信部、57・・・フィードバック処理部。

【特許請求の範囲】
【請求項1】
予め、顔写真、名前および携帯電話番号を少なくとも登録された家庭個別DB(データベース)と、
映像撮影時間情報が付加された映像コンテンツを受信する映像入力部と、
前記映像入力部で受信した映像コンテンツの映像撮影時間情報を抽出する時間情報抽出部と、
前記映像コンテンツから抽出された顔情報と前記家庭個別DBに登録されている顔写真情報とを比較して、該映像コンテンツ中の人物の名前を認識する顔認識部と、
前記時間情報抽出部で抽出した映像撮影時間情報と、前記顔認識部で認識された人物の携帯電話番号とに基づいて、撮影場所の地名および施設名候補の少なくとも一つを取得し、前記映像コンテンツのタグ情報とするタグ付与部と、
前記タグ付与部で付与された撮影場所の地名または施設名候補のタグ情報を、前記映像コンテンツと共に保存するVoDコンテンツ保存部とを具備する映像コンテンツへの位置情報付与システム。
【請求項2】
前記タグ付与部は、前記映像撮影時間情報と携帯電話番号とにより携帯電話位置情報DBにアクセスして、該映像撮影時間情報に対応する位置情報を得ることを特徴とする請求項1に記載の映像コンテンツへの位置情報付与システム。
【請求項3】
前記タグ付与部は、前記映像コンテンツから顔情報が認識できない場合に、撮影者の携帯電話番号を使用することを特徴とする請求項2に記載の映像コンテンツへの位置情報付与システム。
【請求項4】
前記タグ付与部は、前記位置情報を基に地図情報DBにアクセスして、該位置情報に対応する地名および施設名候補の少なくとも一つを得ることを特徴とする請求項2または3に記載の映像コンテンツへの位置情報付与システム。
【請求項5】
前記タグ付与部は、さらに、前記撮影時間情報、前記携帯電話番号及び前記人物の名前の少なくとも一つを前記映像コンテンツのタグ情報とすることを特徴とする請求項1に記載の映像コンテンツへの位置情報付与システム。
【請求項6】
フィードバック情報を処理するフィードバック処理部をさらに有し、
該フィードバック処理部から選択のフィードバック情報を受けると、前記タグ付与部は、前記撮影場所を該選択情報で通知された地名又は施設名に決定することを特徴とする請求項1に記載の映像コンテンツへの位置情報付与システム。
【請求項7】
予め、家庭個別DB(データベース)に顔写真、名前および携帯電話番号を少なくとも登録する工程と、
映像撮影時間情報が付加された映像コンテンツを受信する工程と、
前記映像コンテンツから顔情報を抽出する工程と、
該抽出された顔情報と前記家庭個別DBに登録されている顔写真情報とを比較する工程と、
該比較により、前記映像コンテンツ中の人物の名前を認識する工程と、
前記映像入力部で受信した映像撮影時間情報と、前記顔認識部で認識された人物の携帯電話番号とに基づいて、撮影場所の地名および施設名候補の少なくとも一つを取得する工程と、該取得した地名および施設名候補の少なくとも一つを前記映像コンテンツのタグ情報とする工程と、
前記タグ付与部で付与された撮影場所の地名または施設名候補のタグ情報を、前記映像コンテンツと共に保存する工程とからなる映像コンテンツへの位置情報付与方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−206600(P2010−206600A)
【公開日】平成22年9月16日(2010.9.16)
【国際特許分類】
【出願番号】特願2009−50619(P2009−50619)
【出願日】平成21年3月4日(2009.3.4)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】