説明

音声記録のジオタギング

【課題】音声記録のジオタギング。
【解決手段】オーディオ録音にジオタグする方法であって、オーディオ録音が行なわれた場所を決定するステップ(220)と、前記場所の表示を含む画像または該画像を含むファイルへの参照を得るステップ(230)と、前記オーディオ録音(4)と、前記画像(8)または該画像を含む別のファイルへの参照と、を含む単一のファイル(1)を作成するステップ(215、240)と、を含んでおり、前記場所の表示が、前記場所を含む地図(8a)、前記場所を含む航空または衛星写真、ならびに前記場所を特定すべく前記画像に重ねられたテキスト(8b)のうちの少なくとも1つを含む、方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ録音について、オーディオ録音が行なわれた1つ以上の場所についての情報を注記として付加することに関する。本発明は、特に、オーディオおよび画像データを単一のファイルにまとめて保存することを可能にするファイルフォーマットに関する。
【背景技術】
【0002】
さまざまなデジタルオーディオフォーマットが存在する。最も一般的かつ広く採用されているフォーマットの1つは、MPEG−1またはMPEG−2 Audio Layer 3規格にもとづく。これは、一般に、このフォーマットに関するファイル名拡張子によって「MP3」と称される。他のオーディオファイルフォーマットとして、Advanced Audio Coding(AAC)、Windows Media Audio(WMA)などの独自規格、およびFree Lossless Audio Codec(FLAC)などの自由に利用できるコーデックなど、他の国際規格が挙げられる。
【0003】
オーディオコンテンツを説明するために、オーディオファイルにメタデータを与えることが知られている。オーディオファイルは、音楽用として使用されることが多く、オーディオファイルフォーマットに関連付けられるメタデータの多くは、この用途によって影響される。例えば、アーティスト名、トラック番号、トラックタイトル、およびアルバムタイトルなどといった情報のためのメタデータ要素(フィールド、または「タグ」)を提供することが典型的である。
【0004】
「ID3v2」が、MP3フォーマットおよびいくつかの他のオーディオファイルフォーマットにおいて一般的に使用されているメタデータコンテナのための非公式な規格である。MP3そのものと同様に、ID3v2も広く採用されている。他の種類のオーディオファイルは、別のメタデータフォーマットを使用することができる。例えば、Advanced Systems Format(ASF)を、WMAファイルおよび関連のメタデータのためのコンテナとして使用することができる。
【0005】
しかしながら、ID3v2などの従来からのメタデータの仕様は、音楽の録音に関して有用なメタデータの記述以外のメタデータの記述をほとんどサポートしていない。特に、音声の録音が行なわれた場所を記述することが、ほとんどまたはまったく規定されていない。
【発明の概要】
【0006】
本発明の一態様によれば、オーディオ録音にジオタグを付加する方法であって、
オーディオ録音が行なわれた場所を割り出すステップと、
前記場所の表示を含む画像または該画像を含むファイルへの参照を得るステップと、
前記オーディオ録音と、前記画像または該画像を含む別のファイルへの参照と、を含む単一のファイルを作成するステップと
を含んでおり、
前記場所の表示が、前記場所を含む地図、前記場所を含む航空または衛星写真、ならびに前記場所を特定すべく前記画像に重ねられた文章のうちの少なくとも1つを含む方法が提供される。
【0007】
前記画像を含むファイルへの参照は、画像のURLなど、画像を取り出すことができるアドレスであってよい。
【0008】
前記画像を得るステップは、画像を生成するステップを含むことができる。あるいは、画像を本発明の方法の外部で生成し、本発明の方法を実施する装置が、その画像(または、画像への参照)を得てもよい。すなわち、画像を生成する装置と、前記単一のファイルを作成する装置とが、同じ装置であっても、異なる装置であってもよい。
【0009】
この方法がオーディオの録音と同時に実行される場合には、前記場所を割り出すステップが、場所を確立するためにGPS受信機などの測位システムを使用するステップを含むことができる。あるいは、この方法が事後に(オーディオの録音の後で)実行される場合には、前記場所を割り出すステップが、前もって確立された場所を読み出すステップを含むことができる。例えば、場所を、オーディオを含んでいるファイルのメタデータに提供することができ、あるいは他の方法でオーディオに関連付けることができる。
【0010】
前記場所を含む航空写真は、好ましくは垂直航空写真であり、すなわち前記場所へとほぼ垂直下方を向いたカメラによって取得された平面図の写真画像である。同じことが、前記場所の衛星写真にも当てはまる。これらの上空からの写真による表現はどちらも、地図と同様、画像を参照することによって(地表の)二次元における地点を一意に特定することができるという特徴を有する。また、地図または航空/衛星写真を参照することによって、録音場所の領域をナビゲートすることも可能である。
【0011】
地図を、(写真による表現とは対照的に)地理的特徴の象徴的な図式表現として定めることができる。地図および写真による表現を、(例えば、航空写真に道路などの記号を重ねることによって)組み合わせることも可能である。すなわち、単一の画像が写真および地図の両方を含むことが可能である。
【0012】
好ましくは、地図または写真が、地図または写真上で前記場所の位置を特定するマークを含んでいる。当該領域の俯瞰図におけるマーク(または、記号)は、典型的には、録音場所の表示としてユーザにとってすぐに理解可能である。また、ユーザがその場所への道のりを見つけようと試みる場合の助けとしてもきわめて有用である。
【0013】
好ましくは、画像がファイルに埋め込まれる。これは、画像ファイルとオーディオ録音とが離れてしまう問題および画像ファイルへのリンクが古くなるという問題の可能性を回避する。
【0014】
好ましい実施形態によれば、オーディオ録音に録音場所によるジオタグを付加する方法であって、
前記場所の表示を含む画像を生成するステップと、
前記オーディオ録音と前記画像とを含む単一のファイルを作成するステップと
を含んでおり、
前記場所の表示が、前記場所の地図および/または前記場所を特定すべく前記画像に重ねられた文章を含む方法が提供される。
【0015】
オーディオが録音された場所を保存することは、音楽トラックについては自明には有用でないかもしれないが、多数の用途において有用である。例えば、音声メモまたは口述記録に取得場所を注記することが、多くの用途において望ましいと考えられる。他の種類の場所特有のオーディオとして、科学、保護、または娯楽の目的のための野生生物(例えば、鳥の鳴き声)の音の録音を挙げることができる。
【0016】
場所を記述するというこの必要性に対応するために、専用または独自のメタデータの形態を開発することが可能であると考えられる。しかしながら、そのようなメタデータは、すでに広く採用されている基準および標準から逸脱し、既存の装置およびソフトウェアとの互換性を欠くことになると考えられる。特定の場所メタデータを理解するようにはプログラムされていないと考えられるこれらの既存のツールが、場所メタデータを単純に無視することが期待できるにとどまる。これは、例えばメタデータが「コメント」用に確保されたテキストフィールドに埋め込まれた場合に生じうる。しかしながら、これは、既存のツールを使用して場所メタデータにアクセスすることが困難かつ直観的でないため、依然として問題を呈すると考えられる。
【0017】
本発明は、場所メタデータをピクチャに埋め込むことによってこれらの問題を回避する。本発明者らは、オーディオファイルフォーマットが音楽を保存するために従来使用されているため、アルバムアートワークを含むように意図された1つ以上の画像のオーディオファイルへの埋め込みをサポートすることが比較的一般的であることに気が付いた。あるいは、1つ以上のそのような画像へのリンクをオーディオファイルに埋め込むことができる。いずれの場合も、これらのメタデータ要素を、オーディオファイルのジオタグ付けという課題への技術的解決策を提供するために利用することができる(ジオタグは、デジタルメディアアイテムに地理的位置を特定するメタデータを追加することを意味する)。
【0018】
この技術的解決策は、オーディオファイルを取り扱う装置およびソフトウェアにより、埋め込まれた画像メタデータおよびリンクされた画像が処理される従来からの方法に良好に適合する。例えば、装置が、音楽トラックを再生しているときに表示画面上にアルバムアートワークの画像を表示することが典型的である。同様に、コンピュータのオペレーティングシステムなどのソフトウェアが、ファイルシステムにおいてファイルを表わすためのアイコンとして画像を使用することができる。どちらの場合も、本発明は、録音の場所がユーザへと視覚的に(音楽トラックのアートワークの代わりに)表示されるという効果を有する。このようにして、本発明は、既存の標準、ハードウェア、およびソフトウェアとの後方互換性を有する方法で、便利かつ直観的な場所の表現を提供する。さらに、必要となる追加の努力もわずかである。多くの場合、通常であれば空または未使用のままであるメタデータフィールドが利用される。これは、多くの種類のオーディオ録音において、アルバムアートは入手できず、あるいは重要でないからである。
【0019】
重ねられる文章は、文字による形態での位置座標、逆ジオコーディングによる所番地、あるいは両方を含むことができる(逆ジオコーディングは、場所の座標を人間にとって理解可能な所番地または地名に変換するプロセスである)。文章を、無地の背景または写真に重ねることができ、あるいは画像が場所の地図を含む場合には、その地図に重ねることができる。このように、この文脈において、文章を「重ねる」とは、画像内に文字を、画像が観察されるときに視認可能であるように描画することを意味する。
【0020】
画像は、一様または無地の背景に文章が重ねられる第1の部分と、別の地図部分とを含むモザイクであってよい。これは、文章を重ねることによって地図の視覚的特徴が遮られることを回避する。また、文章と背景との間の良好なコントラストを保証することによって、文章の読み易さの向上も可能である。
【0021】
好ましくは、前記単一のファイルは、デジタルオーディオファイルフォーマットによりフォーマットされている。
【0022】
適切なオーディオファイルフォーマットの1つのグループは、画像をメタデータの一部として埋め込むことを可能にしているフォーマットである。そのようなファイルフォーマットとして、これらに限られるわけではないが、MP3、AAC、WMA(少なくともASFファイルに含まれるとき)、Audio Interchange File Format(AIFF)、MPEG−4 Audio(M4A)、およびMPEG−4 Audio Book File(M4B)が挙げられる。他のグループは、そのような画像へのリンク(参照)の埋め込みを可能にしているファイルフォーマットを含む。
【0023】
いくつかのファイルフォーマットは、画像の直接的な埋め込みおよび画像へのリンクの埋め込みの両方をサポートすることができる。例えば、OggコンテナフォーマットにおいてVorbisコーデックとともに使用されるように意図されたVorbisCommentメタデータフォーマットにMETADATA_BLOCK_PICTUREという名称のフィールドを加えることが提案されている。この提案によるフィールドは、ユーザの好みに従って画像のリンクまたは埋め込みを可能にする。
【0024】
画像を、オーディオファイルフォーマットのうちのメタデータ用に確保された部分に埋め込むことができる。
【0025】
特に、画像を、メタデータのうちのフロントカバーまたはバックカバーなどのアルバムアートワーク用に確保された部分に埋め込むことができる。適切なメタデータの種類として、とりわけID3v2タグおよびVorbisコメントを挙げることができる。
【0026】
ファイルが、MP3ファイルであってよく、画像が、ID3v2仕様による「添付ピクチャ」(APIC)フレームに埋め込まれる。
【0027】
ID3v2仕様は、APICフレームを、オーディオファイルに直接関係したピクチャを収容するものと定義している。したがって、取得の場所の記述を含む画像を埋め込むことは、この非公式な規格に矛盾しない。仕様によれば、APICは、Joint Photographic Experts Group(JPEG)またはPortable Network Graphics(PNG)ファイルとして埋め込まれなければならない。この方法で埋め込まれたJPEGアルバムアートは、例えばMP3再生機のソフトウェアおよびハードウェアにおいて広くサポートされている。
【0028】
他の実施形態においては、前記単一のファイルが、画像への参照を含むことができる。この場合、参照は、画像を得ることができる(電子)アドレスへのリンクを含むことができる。このリンクは、例えばローカルファイルアドレスまたはインターネット経由で画像を得ることを可能にするURLであってよい。
【0029】
画像へのリンクだけを埋め込むことは、前記単一のファイルの総サイズが重要な関心事である場合に有益である。実際の画像データを埋め込むことは、ファイルサイズを増加させる傾向にある。
【0030】
オーディオ録音の録音場所を、ファイルの1つ以上の文字または数字メタデータタグにも記載することができる。
【0031】
場所を、機械読み取り可能な形態および人間が読み取り可能な視覚的形態で提示することが好ましい。さらに場所を文字または数字のフィールドにも記載することで、これが達成される。例えば、記載は、所番地、地名、あるいは緯度および経度または地図上の格子の参照などの地理的座標を含むことができる。
【0032】
ファイルが、MP3ファイルであってよく、場所を、ID3v2仕様によるUnique File Identifierフレームに記載することができる。
【0033】
ID3v2仕様において公表されている「Unique File Identifier」(UFID)フレームは、2つの部分、すなわちUniform Resource Locator(URL)を含む文字列である「Owner Identifier」および最大64バイトのバイナリデータであってよい実際の「Identifier」を提供する。Owner Identifierが、データベースを管理する組織を特定する。Identifierが地理的場所の座標を含む場合、Owner Identifierがラベルとして機能でき、オーディオファイルを処理する装置またはソフトウェアプログラムがIdentifierを正しく解釈する(あるいは、正しく解釈するための方法を発見する)ことを可能にする。
【0034】
画像を、JPEGファイルとして提供することができ、オーディオ録音の録音場所が、好ましくはJPEGファイルの1つ以上のEXIFメタデータタグに記載される。
【0035】
Exchangeable Image File Format(EXIF)は、メタデータをJPEG画像に埋め込む方法を定義し、場所情報のための標準タグを提供する。これは、JPEGがオーディオファイルに埋め込まれるため、場所情報を標準化された機械読み取り可能な形態(画像においてユーザにとっても視認可能である)でオーディオファイルにもたらすことを可能にする。慣例的に、EXIFメタデータは、写真を撮影したカメラの場所を記載することが予定されている。しかしながら、この例では、EXIFメタデータが、オーディオ録音の録音場所である地図または写真に示された現場における場所を記載するために使用される。この場合に、これは、通常は(航空または衛星写真の場合の)写真の撮影場所とは異なる。
【0036】
録音の場所が、録音の進行中に変化してもよく、前記場所の表示が、複数の不連続な場所、場所範囲、または軌跡のうちの少なくとも1つを記載することができる。
【0037】
例えば、場所の表示が、オーディオを録音した装置が訪れた複数の特定の地点を示すことができる。それらの地点を、地図上のマークすることができ、および/または画像上に重ねられる文字にて列挙することができる。上述の地点は、オーディオ録音の開始時および終了時の装置の場所に対応する少なくとも始点および終点を好ましくは含む。変化する録音場所の表示を、代表地点の座標ならびにその地点を中心とする変動の範囲によって記載することも可能である。代表地点は、訪れた場所の範囲の平均位置または中心位置であってよく、あるいは始点または終点であってよい。同様に、画像が、録音装置が録音を行ないつつ辿った軌跡の表示を含んでもよい。これを、辿った経路を描く地図上の線(直線または曲線)によって表示することができる。
【0038】
本発明の別の態様によれば、オーディオ録音に録音場所によるジオタグを付加する方法であって、
オーディオ録音を含むデジタルオーディオファイルを作成するステップと、
前記場所を前記デジタルオーディオファイルの1つ以上のメタデータタグに記載するステップと
を含んでおり、
前記オーディオファイルが、MP3ファイルであり、前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載される方法が提供される。
【0039】
使用可能な種々のメタデータ要素のうちで、場所情報を保存するためにUnique File Identifierを使用することは、すでに上述したようにきわめて有利である。
【0040】
さらに、コンピュータ上で実行されたときに先行のいずれかの請求項のすべてのステップを実行するように適合されたコンピュータプログラムコード手段を含んでいるコンピュータプログラムが提供され、そのようなコンピュータプログラムは、コンピュータ読み取り可能な媒体上に具現化される。
【0041】
本発明のさらなる態様によれば、オーディオ録音と、画像または画像を含む別途のファイルへの参照と、を含むデジタルオーディオファイルであって、前記画像が、前記オーディオ録音が行なわれた場所を含む地図、該場所を含む航空または衛星写真、および該場所を特定すべく前記画像に重ねられた文章のうちの少なくとも1つを含んでいるデジタルオーディオファイルが提供される。
【0042】
好ましい実施形態によれば、オーディオ録音と画像とを含むデジタルオーディオファイルであって、前記画像が、前記オーディオ録音が行なわれた場所を示す地図および/またはこの場所を特定する図式的な文章を含んでいるデジタルオーディオファイルが提供される。
【0043】
文章が、例えば単に画像のメタデータにおける文字表現を使用する場合と異なり、画像上に図式的(および視覚的)に表わされる。
【0044】
本発明の別の態様によれば、オーディオ録音と少なくとも1つのメタデータタグとを含むデジタルオーディオファイルであって、前記タグが、前記オーディオ録音が行なわれた場所を記載しており、前記オーディオファイルが、MP3ファイルであり、前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載されているデジタルオーディオファイルが提供される。
【0045】
好ましくは、これらのオーディオファイルは、揮発性または不揮発性メモリ回路、CDまたはDVDなどの光ディスク、あるいはハードディスクまたはテープなどの磁気記憶媒体など(ただし、これらに限られるわけではない)のコンピュータ読み取り可能な媒体上に具現化される。
【0046】
本発明のさらに別の態様によれば、オーディオ録音にジオタグを付加するための装置であって、
オーディオ録音を保存するためのメモリと、
前記オーディオ録音が行なわれた場所を割り出し、
該場所を示す画像または該画像を含むファイルへの参照を得、
前記オーディオ録音と、前記画像または該画像を含む別途のファイルへの参照と、を含む単一のファイルを前記メモリに作成する
ように適合されたプロセッサと
を備えており、
前記画像が、前記場所を含む地図、前記場所を含む航空または衛星写真、ならびに前記場所を特定すべく前記画像に重ねられた文章のうちの少なくとも1つによって前記場所を示している装置が提供される。
【0047】
本発明のさらに別の態様は、オーディオ録音にジオタグを付加するための装置であって、
オーディオ録音を保存するためのメモリと、
前記オーディオ録音が行なわれた場所を割り出し、
前記オーディオ録音と、前記場所を記載する1つ以上のメタデータタグと、を含むデジタルオーディオファイルを前記メモリに作成する
ように適合されたプロセッサと
を備えており、
前記オーディオファイルが、MP3ファイルであり、前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載される装置を提供する。
【0048】
次に、本発明を、添付の図面を参照してあくまでも例として説明する。
【図面の簡単な説明】
【0049】
【図1】場所を示す画像が埋め込まれている本発明の実施形態によるオーディオファイルの構造の一例を示している。
【図2】本発明の実施形態に従って動作するように構成された一群のハードウェア装置のブロック図を示している。
【図3】第2の実施形態に従って動作するように適合されたスマートフォンのブロック図である。
【図4】一実施形態による方法のフロー図である。
【図5】本発明の実施形態によるファイルを再生しているときのメディア再生機のユーザインターフェイスを示している。
【図6】比較例によるオーディオ録音を再生しているときの同じメディア再生機のユーザインターフェイスを示している。
【発明を実施するための形態】
【0050】
本発明者らは、録音場所を特定または示す情報を視覚的な形態でデジタルオーディオファイルに埋め込むことが可能であること、すなわち視覚的なメタデータを使用してオーディオファイルにジオタグを付加することが可能であることを認識した。これにより、場所情報をユーザへと容易に提示できるほか、デジタルオーディオを楽しむために使用されている多数の既存のハードウェア装置およびソフトウェアプログラムとの後方互換性も提供することができる。
【0051】
図1が、場所の視覚的な表示をオーディオファイルに埋め込むときに使用することができる、本発明の好ましい実施形態によるファイル構造を示している。デジタルオーディオファイル1が、広く採用されているMP3フォーマットで提供されている。ファイル1は、MP3規格に従ってエンコードされた不可逆圧縮によるオーディオ4を含んでいる。ID3v2タグ2が、オーディオファイル1の先頭に含まれている。これらのタグは、JPEG画像ファイル6を収容する少なくとも1つの添付ピクチャ(APIC)フレーム5を含んでいる。JPEGファイル6の中に、圧縮された画像データ8およびEXIFタグ7が存在する。さらに、ID3v2メタデータは、1つ以上のUFIDタグおよび任意の他のタグ(「UFID」の下方に並んだ空白の箇条書きの点によって示されているとおり)を含む。
【0052】
図1の例において、ID3v2メタデータが、ファイルの先頭に位置することに留意されたい。これは、(例えば、ストリーミングの用途において)好ましいものの、必須ではない。代案として、ID3v2メタデータをファイルの終わりに付け加えることが可能である。
【0053】
画像8の内容が、2つの方法でMP3オーディオデータの録音の場所を視覚的に示す。第1に、録音場所が地図上にマークされる。点、星印、または十字、あるいは地図上の場所を指す矢印など、任意の好都合なマーキングの形態を使用することができる。第2に、画像内に説明文が提供される。説明文は、上書きによる文章として描画することができ、好ましくは画像の別の部分(例えば、地図の画像の上方または下方の無地の背景の領域)に備えられる。これは、地図および説明文の両方が容易に判読可能であり、互いに干渉することがないことを保証するうえで役に立つ。説明文を、録音場所の地理的座標(緯度および経度)、録音場所の郵便の宛て先または地名、あるいは両方で構成することができる。
【0054】
オーディオファイル1がソフトウェアまたはハードウェアによって処理されるとき、ID3v2メタデータから画像8をデコードし、表示することができる。例えば、従来からのメディア再生機が、オーディオ録音を再生しながら画像を表示(音楽トラックについてアルバムアートを表示するのと同じ方法で)することができる。画像8を、コンピュータのオペレーティングシステムのファイル管理ソフトウェアによって、オーディオファイル1のファイルアイコンとして表示してもよい。これは、グラフィカルユーザインターフェイス(GUI)にて、ユーザへの録音場所の便利かつ容易に理解できる提示を可能にする。
【0055】
加えて、場所が、メタデータの他の場所に機械読み取り可能な形態でエンコードされる。この例では、場所が、JPEGファイル6のEXIF部分7の地理的場所タグへと書き込まれる。座標は、ID3v2タグのUnique File Identifierフレーム(UFID)の識別子としても使用される。UFIDのOwner Identifier部分が、識別子の座標情報を解釈することができるデータベースへのリンクを含んでいる。位置情報を機械読み取り可能な形態でも提供することによって、位置にもとづくさらなる自動処理が可能にされる。
【0056】
図2が、本発明の実施形態による装置の構成のブロック図である。デジタルディクタフォンなどのオーディオ録音装置10が、現場においてユーザによって携行される。別途の(外部の)GPS受信装置20も、ユーザによって携行される。ユーザが音声メモを口述するとき、オーディオ録音装置が、エンコードされたオーディオコンテンツを含むMP3ファイルを生成し、録音の時刻を注記として付け加える。この注記を、オーディオファイルの作成日時によって与えてもよいし、日時をオーディオファイルのメタデータに埋め込んでもよいし、あるいは両方でもよい。
【0057】
一方で、オーディオ録音装置10に接続されていないGPS受信機20が、ユーザの訪れた場所についてのログを保持する。GPS装置20がGPS衛星から信号を定期的に受信し、受信した信号を処理して測位(position fix)を得ることによって、これを行う。各々の測位に、受信機20がその位置にあったときの時刻が注記として付加される。結果が、不連続な位置および関連のタイムスタンプからなるログである。
【0058】
後に、ユーザがオーディオ録音装置10およびGPS受信機20の両方をパーソナルコンピュータ30へと接続する。オーディオファイルが、オーディオ録音装置10によってコンピュータのメモリ32へとアップロードされ、GPS追跡ログが、GPS受信機20によってメモリ32へとアップロードされる。コンピュータのプロセッサ34が、オーディオ録音のタイムスタンプをGPS追跡ログのタイムスタンプと比較することによって、オーディオファイルの録音の場所を割り出すようにプログラムされている。測位の空間的および/または時間的な間隔が大きい場合には、GPS測位の間の補間を使用することができる。これに類似した方法が、デジタル写真のジオタグ付けの当技術分野において公知であることに、留意されたい。当業者であれば、これらの方法を本発明によるオーディオファイルのジオタグ付けに適合させうることを、理解できるであろう。
【0059】
ひとたびオーディオファイルの録音場所が確立されると、コンピュータ30が、その場所を示す地図を生成するように制御される。適切な画像を、内部に(コンピュータのメモリ32に)保存された地図データベースのデータを使用して合成でき、あるいはコンピュータ30が、遠隔/外部のプロバイダからの地図画像を要求してもよい。具体的な地理的場所の座標にもとづいて地図画像を生成または取得する方法は、当業者にとってよく知られている。さらに、コンピュータ30は、場所の説明を、画像の別の部分に重ねられる文章として描画する。例えば、キャプションバーを地図の上方または下方に付け加えることができる。描画される文章による場所の説明として、位置座標、逆ジオコーディングによる住所または地名、あるいは両方を含むことができる。
【0060】
上述した第1の実施形態においては、GPS受信機20は、完全に機能するリアルタイムGPS受信機である。すなわち、リアルタイムでGPS信号を受信および処理し、測位(例えば、緯度および経度の座標)を生成するように適合されている。GPS信号を受信し、受信したGPS信号をサンプリングしてGPS信号サンプルを生成し、これらのサンプルを後の処理のためにローカルに保存するGPS受信機を提供することも、当技術分野において公知である。「保存および事後処理(store and process late)」または「キャプチャおよび処理(capture and process)」の受信機として知られるこの形式の受信機は、リアルタイムGPS受信機と比べ、電池がより長持ちし、コストがより低く、より複雑でないという利点を有することができる。これは、キャプチャおよび処理の受信機は、個々の衛星信号を検出し、これらの衛星までの疑似距離を計算し、これらの疑似距離を三辺測量の計算を使用して処理して測位を生成するために必要な、演算に関して負荷が多大である処理を、実行する必要がないためである。
【0061】
図2に示した本発明の実施形態は、GPS受信機20がキャプチャおよび処理のGPS受信機である場合にも等しく適用可能である。この場合、コンピュータ30のプロセッサ34が、保存されたGPS信号サンプルがGPS受信機からアップロードされた後で、このGPS信号サンプルの最終的な処理を実行する。すなわち、GPS信号サンプルおよび関連のタイムスタンプの組に代えて、GPS追跡ログが存在する。出来事の場所を割り出すための方法であって、キャプチャおよび処理のGPS受信機における使用に適した方法が、米国特許第7,659,848号に記載されていることに留意されたい。今や当業者であれば、この方法を、オーディオ録音がなされた場所を割り出すために、本発明の実施形態において使用できることを、理解できるであろう。
【0062】
図3が、本発明の別の実施形態の実行に適したスマートフォン100のブロック図を示している。この実施形態と図2の実施形態との間の主たる相違は、スマートフォン100においてはすべての構成要素が装置に一体化されている点である。次に、この実施形態を、図3ならびにこの実施形態による方法を示している図4のフロー図を参照して説明する。
【0063】
オーディオ録音ユニット110が、マイクロプロセッサ134の制御のもとでオーディオ信号の録音を実行する(ステップ210)。録音されたオーディオは、メモリ132内のファイルに保存される(ステップ215)。また、オーディオ録音装置110の作動により、スマートフォン100の現在位置を割り出す(ステップ220)ために、GPS受信機120の動作も生じる。GPS受信機120によって割り出された位置にもとづき、マイクロプロセッサ134が、遠隔の地図データベースサーバ(図示されていない)への要求を行なうように無線通信インターフェイス140を制御する。これらに限られるわけではないが、無線LAN接続、GPRSまたは3Gモバイルインターネット接続などの携帯電話データ接続、など、任意の適切な無線通信リンクを使用することができる。
【0064】
地図画像が、地図データベースサーバから取得される(ステップ230)。スマートフォン100のプロセッサ134が、場所の座標を画像上の図式的な文字として描画することによって、視覚的な注記を付加する。随意により、プロセッサ134は、逆ジオコーディングサービスに連絡するように無線通信インターフェイス140を制御することができる。これは、場所の座標を地名または住所に変換することを可能にする。この文字による情報を、画像上に図式的に描画することも可能である。ひとたびスマートフォン100によって注記入りの地図が生成および取得(ステップ230)されたならば、これがオーディオファイル1に付加され、メモリ132に保存される。オーディオファイル1への地図の埋め込み(ステップ240)は、図1に関して上述したとおりである。
【0065】
本発明の他の実施形態において、各々のオーディオファイルについて2つ以上の場所を保存することが可能であることに、留意されたい。これは、例えばオーディオ録音を行なったユーザが、録音を行ないながら移動していた場合に適切である可能性がある。この場合、オーディオファイルが、単にただ1つの唯一の場所に関連付けられるだけではない。むしろ、ユーザの移動の軌跡が取得の場所を描写する。これを、さまざまな方法で画像8に表わすことができる。録音の進行中にGPS受信機20または120によって測定されたいくつかの不連続な位置を、地図上にマークすることができ、および/または、図式的な説明文に列挙することができる。あるいは、地図上に描かれる線を、ユーザが辿った実際の経路を表わすために使用することができる。他の技術的解決策は、録音の開始時および終了時の装置の推定位置だけを示すことであってよい。これに代え、あるいはこれに加えて、複数の位置を、座標の数値範囲へと変換することもできる。同様に、この範囲を示すために、文字による注記を選択することができる(例えば、すべてが同じ都市に位置する一式の位置または場所の範囲を、その都市の名称によって注記できる)。
【0066】
複数の場所に関係したオーディオ録音の1つの現実的な例は、ガイド付き旅行である。解説のオーディオ録音を、解説の各々の部分に関係する場所に関連付けることが望ましいと考えられる。例えば、バス旅行においては、通常は観光ガイドがバスが通過する種々の場所を紹介する。旅行全体を、訪れた各々の場所についての位置情報とともに録音することが有利であると考えられる。後に、タイムスタンプを比較することによって、位置を録音の該当部分に照らし合わせることができる。
【0067】
図5および6が、本発明の実施形態の有用性を示している。図5が、一実施形態にしたがってフォーマットされたオーディオファイル1を再生しているときのマルチメディア再生機300のグラフィカルユーザインターフェイス(GUI)を示している。このGIUを、例えば上述のスマートフォン100の表示装置150またはパーソナルコンピュータの視覚表示ユニット(VDU)に表示することができる。メディア再生ソフトウェアが、ファイル1に埋め込まれた画像を読み取り、画面上に表示する。これは、従来からの音楽トラックについてアルバムカバーを表示する方法と同じ方法で行なわれる。実際、メディア再生機300は、表示される画像がアルバムアートの一部でないことに気付く必要すらない。画像は、オーディオ録音が行なわれた場所を示す地図8aを含む。実際の場所が、地図8aの下辺に位置する字幕バー8bにおいて重ね書きの文字にて画像上に表示されている。さらに、この具体的な場所が、場所をマークする星形の記号8cによって地図上に示されている。画像8にオーディオ録音を提供することによって、メディア再生機の変更を必要とすることなく、メディア再生機300は、オーディオ録音が行なわれた場所をユーザに示すことができる。これは、例えばオーディオ録音が場所特有の観測に関係する場合にきわめて有用である。そのような種類の観測の1つは、ストリートファーニチャなどといった(不動の)物体または装置の検査の際に録音される音声メモであってよい。その場合、(例えば、修理または再検査のために)同じ場所へと確実かつ容易に移動できることがきわめて望まれる。これが、図5の実施形態によって達成される。
【0068】
対照的に、図6は、オーディオファイルに画像が提供されていない(あるいは、オーディオファイルに画像がリンクされていない)比較例を示している。ここでは、メディア再生機300が、追加の情報をユーザに伝えることがない汎用のアイコンを表示している。
【0069】
本発明を、図面および以上の説明において詳しく図示および説明したが、そのような図示および説明は、例示または典型であって、本発明を限定するものではないと理解されるべきであり、本発明は開示された実施形態に限られない。
【0070】
特に、本発明は、典型的な実施形態において使用される特定の標準的なフォーマットの使用に限定されない。これは、デジタルオーディオファイルのフォーマット(不可逆または可逆のどちらの圧縮が使用されてもよく、あるいはどちらの圧縮も使用されなくてもよい)、メタデータのフォーマット、およびオーディオファイルに埋め込まれる画像のフォーマットを含む。相互運用性の促進のために、公式または非公式に標準化され、あるいは一般的に使用されているフォーマットを採用することが好ましい。当業者であれば、さまざまな種類のメタデータがさまざまな種類のオーディオファイルにおける使用に適し、および/またはさまざまな種類のオーディオファイルにおける使用を意図されていることを、理解できるであろう。他の装置およびソフトウェアプログラムとの可能な限り幅広い相互運用性を保証するために、そのような意図された組み合わせを使用することが好ましいであろう。
【0071】
それでもなお、一般に、画像を任意の所望の方法でオーディオ録音と同じファイルに埋め込むことができる。
【0072】
図2の実施形態においては、GPS受信機20が、オーディオ録音装置10とは別の装置として示されている。当然ながら、別の同様の実施形態においては、GPS受信機20およびオーディオ録音装置10を、1つの製品に一体化させることができる。
【0073】
本発明の実施形態を、物理的に別々の電子装置および/または演算装置を使用して、分散形式で実現することができる。例えば、オーディオ録音装置およびGPS受信機が、録音が行なわれた場所を記述する場所メタデータが埋め込まれたデジタルオーディオファイルを作成するために協働することができる。このメタデータを、適切な文字または数字フィールド(すでに上述したID3v2タグ「UFID」など)を使用してオーディオファイルに挿入することができる。次いで、デジタルオーディオファイルを、サーバコンピュータであってよいコンピュータなどの別の装置へともたらすことができる。サーバコンピュータを、UFIDタグを分析し、場所の座標を読み取り、その場所を図式的に示す適切な画像を生成するように構成することができる。この画像を、サーバによってオーディオファイルに埋め込むことができる。あるいは、サーバが、画像へのリンクを埋め込んでもよい。別の代案として、オーディオファイルおよび画像を、別々のファイルとしてクライアント装置(図3のスマートフォン100と同様の)へと返してもよい。次いで、スマートフォンが、好みに応じて画像をオーディオファイルに埋め込むか、あるいは画像へのリンクをオーディオファイルに埋め込むことができる。これらの例においては、本発明の実施形態による方法が、協働するさまざまな装置によって実行される。
【0074】
当業者であれば、請求される発明を実行するにあたり、開示した実施形態の他の変種を、図面、明細書、および添付の特許請求の範囲の検討から理解および達成することができる。特許請求の範囲において、用語「・・・を含む(comprising)」は、他の構成要素または工程の存在を排除するものではなく、不定冠詞「a」または「an」は、複数であることを排除するものではない。ただ1つのプロセッサまたは他のユニットが、特許請求の範囲に記載されるいくつかの項目の機能を実行することができる。たとえ特定の手段が互いに別々の従属請求項に記載されていても、それらの手段の組み合わせを有利に使用することができないという意味ではない。コンピュータプログラムを、他のハードウェアと一緒に供給され、あるいは他のハードウェアの一部として供給される光学記憶媒体または半導体媒体などの適切な媒体上に保存/分配することができるが、インターネットあるいは他の有線または無線の電気通信システムなどを介して他の形態で流通させてもよい。特許請求の範囲におけるいかなる参照符号も、範囲を限定するものとして解釈してはならない。

【特許請求の範囲】
【請求項1】
オーディオ録音にジオタグする方法であって、
オーディオ録音が行なわれた場所を決定するステップ(220)と、
前記場所の表示を含む画像または該画像を含むファイルへの参照を得るステップ(230)と、
前記オーディオ録音(4)と、前記画像(8)または該画像を含む別のファイルへの参照と、を含む単一のファイル(1)を作成するステップ(215、240)と、
を含んでおり、
前記場所の表示が、前記場所を含む地図(8a)、前記場所を含む航空または衛星写真、ならびに前記場所を特定すべく前記画像に重ねられたテキスト(8b)のうちの少なくとも1つを含む、方法。
【請求項2】
前記場所の表示が、前記場所を含む地図(8a)あるいは航空または衛星写真を含んでおり、
該地図または写真が、該地図または写真上で前記場所の位置を特定するマーク(8c)を含んでいる、請求項1に記載の方法。
【請求項3】
前記画像(8)が、前記単一のファイル(1)のうちのメタデータ用に確保された部分(2)に含まれる、請求項1または2に記載の方法。
【請求項4】
前記ファイル(1)が、MP3ファイルであり、
前記画像(8)が、ID3v2仕様による添付ピクチャフレームに埋め込まれる、請求項3に記載の方法。
【請求項5】
前記オーディオ録音が行なわれた場所が、前記単一のファイルの1つ以上のテキストまたは数字メタデータタグにも記載される、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記単一のファイルが、MP3ファイルであり、
前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載される、請求項5に記載の方法。
【請求項7】
前記画像(8)が、JPEGファイル(6)として提供され、
前記オーディオ録音が行なわれた場所が、該JPEGファイル(6)の1つ以上のEXIFメタデータタグ(7)にも記載される、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
録音の場所が、録音の進行中に変化しており、
前記場所の表示が、複数の不連続な場所、場所範囲、または軌跡のうちの少なくとも1つを記載する、請求項1〜7のいずれか一項に記載の方法。
【請求項9】
オーディオ録音に、録音場所をジオタグする方法であって、
オーディオ録音を含むデジタルオーディオファイルを作成するステップと、
前記デジタルオーディオファイルの1つ以上のメタデータタグに前記場所を記載するステップと、
を含んでおり、
前記オーディオファイルが、MP3ファイルであり、
前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載される、方法。
【請求項10】
コンピュータ上で実行されたときに請求項1〜9のいずれか一項に記載のすべてのステップを実行するように構成されたコンピュータプログラムコード手段を含んでいる、コンピュータプログラム。
【請求項11】
コンピュータ読み取り可能な媒体上に具現化された、請求項10に記載のコンピュータプログラム。
【請求項12】
オーディオ録音(4)と、
画像(8)または画像を含む別途のファイルへの参照と、を含んでおり、
前記画像が、前記オーディオ録音が行なわれた場所を含む地図(8a)、該場所を含む航空または衛星写真、および、該場所を特定すべく前記画像に重ねられたテキスト(8b)のうちの少なくとも1つを含んでいるデジタルオーディオファイル(1)。
【請求項13】
オーディオ録音(4)と、
少なくとも1つのメタデータタグ(2)と、を含んでおり、
前記タグは、前記オーディオ録音が行なわれた場所を記載しており、
前記オーディオファイルが、MP3ファイルであり、
前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載されている、デジタルオーディオファイル(1)。
【請求項14】
オーディオ録音にジオタグするための装置であって、
オーディオ録音を保存するためのメモリ(32、132)と、
プロセッサ(34、134)と、を備えており、
前記プロセッサ(34、134)は、
前記オーディオ録音が行なわれた場所を決定し、
該場所を示す画像(8)または該画像を含むファイルへの参照を得、
前記オーディオ録音(4)と、前記画像(8)または該画像を含む別途のファイルへの参照と、を含む単一のファイル(1)を前記メモリ(32、132)に作成する
ように構成され、
前記画像が、前記場所を含む地図(8a)、前記場所を含む航空または衛星写真、ならびに前記場所を特定すべく前記画像に重ねられた文章(8b)のうちの少なくとも1つによって前記場所を示している、装置。
【請求項15】
オーディオ録音にジオタグするための装置であって、
オーディオ録音を保存するためのメモリ(32、132)と、
プロセッサ(34、134)と、を備えており、
前記プロセッサ(34、134)は、
前記オーディオ録音が行なわれた場所を決定し、
前記オーディオ録音(4)と、前記場所を記載する1つ以上のメタデータタグ(2)と、を含むデジタルオーディオファイル(1)を前記メモリに作成する
ように構成され、
前記オーディオファイルが、MP3ファイルであり、
前記場所が、ID3v2仕様によるUnique File Identifierフレームに記載される、装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2013−15838(P2013−15838A)
【公開日】平成25年1月24日(2013.1.24)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−147015(P2012−147015)
【出願日】平成24年6月29日(2012.6.29)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Windows Media
【出願人】(510112671)ユー‐ブロックス、アクチエンゲゼルシャフト (15)
【氏名又は名称原語表記】U−BLOX A.G.
【Fターム(参考)】