説明

音声制御装置、音声制御方法、およびプログラム

【課題】音声出力される複数の情報からの迅速な情報抽出を支援するための音声制御装置、音声制御方法、およびプログラムを提供する。
【解決手段】周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、を備える音声制御装置。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音声制御装置、音声制御方法、およびプログラムに関する。
【背景技術】
【0002】
近日、撮像装置およびディスプレイを備えた携帯端末の普及に伴い、AR(Augmented Reality:拡張現実)技術を用いたアプリケーションが注目を集めている。例えば、AR技術を用いたアプリケーションとして、携帯機器の位置に基づき、現実空間の撮像画像に写真/テキスト/音声などのタグ情報を付加するARアプリケーションが挙げられる。
【0003】
ユーザは、このようなARアプリケーションにより、現実空間に付加されたタグ情報を閲覧および操作することが可能となる。しかし、現実空間に付加されるタグ情報の数が多くなると、画面の視認性が低下するので、ユーザが所望の情報を見つけることが困難になってしまう。この点について、携帯端末と対象位置との関係に応じてユーザに音声案内を行うための音響制御装置が特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2010−49158号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、携帯端末の周囲に対応付けられているタグ情報を音声で順次に出力する場合、タグ情報の数が多くなると、ユーザが興味のあるタグ情報が出力されるまでの時間が長期化するので、ユーザは所望のタグ情報を抽出し難い。
【0006】
そこで、本開示では、音声出力される複数の情報からの迅速な情報抽出を支援することが可能な、新規かつ改良された音声制御装置、音声制御方法、およびプログラムを提案する。
【課題を解決するための手段】
【0007】
本開示によれば、周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、を備える音声制御装置が提供される。
【0008】
また、本開示によれば、周囲の位置と対応付けられている情報を取得するステップと、複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、を含む音声制御方法が提供される。
【0009】
また、本開示によれば、コンピュータを、周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、として機能させるためのプログラムが提供される。
【発明の効果】
【0010】
以上説明したように本開示によれば、音声出力される複数の情報からの迅速な情報抽出を支援することが可能である。
【図面の簡単な説明】
【0011】
【図1】本開示の実施形態による音声制御システムの構成を示した説明図である。
【図2】タグ情報が付加された現実空間の撮像画像を示した説明図である。
【図3】第1の実施形態による携帯端末の利用形態の具体例を示した説明図である。
【図4】本開示の第1の実施形態による携帯端末の構成を示した機能ブロック図である。
【図5】領域設定部により設定される対象領域の具体例を示した説明図である。
【図6】携帯端末の周囲のタグ情報の密集度が高い場合の対象領域の具体例を示した説明図である。
【図7】携帯端末の周囲のタグ情報の密集度が低い場合の対象領域の具体例を示した説明図である。
【図8】タグ情報の再構成を示した説明図である。
【図9】音声制御部による音声制御の具体例を示した説明図である。
【図10】タグ情報のリストの具体例を示した説明図である。
【図11】本開示の第1の実施形態による携帯端末の動作を示したフローチャートである。
【図12】本開示の第2の実施形態による携帯端末および音声出力装置を示した説明図である。
【図13】第2の実施形態による携帯端末の構成を示した機能ブロック図である。
【図14】第2の実施形態による表示制御例を示した説明図である。
【図15】携帯端末のハードウェア構成を示した説明図である。
【発明を実施するための形態】
【0012】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0013】
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。
【0014】
また、以下に示す項目順序に従って本開示を説明する。
1.音声制御システムの基本構成
2.第1の実施形態
2−1.第1の実施形態の概要
2−2.第1の実施形態による携帯端末の構成
2−3.第1の実施形態による携帯端末の動作
3.第2の実施形態
4.携帯端末のハードウェア構成
5.むすび
【0015】
<<1.音声制御システムの基本構成>>
本開示による技術は、一例として「2.第1の実施形態」〜「3.第2の実施形態」において詳細に説明するように、多様な形態で実施され得る。また、各実施形態による音声制御装置(携帯端末20)は、
A.周囲の位置と対応付けられている情報を取得する情報取得部(通信部228、情報解析部236)と、
B.前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部(240)と、
を備える。
【0016】
以下では、まず、このような各実施形態において共通する音声制御システムの基本構成について図1を参照して説明する。
【0017】
図1は、本開示の実施形態による音声制御システムの構成を示した説明図である。図1に示したように、本開示の実施形態による音声制御システムは、ARサーバ10と、携帯端末20と、を備える。
【0018】
このARサーバ10および携帯端末20は、通信網12を介して接続されており、通信網12を介して各種情報を通信することが可能である。なお、通信網12は、通信網12に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網12は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網12は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
【0019】
ARサーバ10は、位置情報とタグ情報とを対応付けて記憶しており、通信網12を介して位置情報とタグ情報を携帯端末20に送信する。例えば、ARサーバ10は、携帯端末20から携帯端末20の現在位置を示す位置情報を受信すると、携帯端末20の周囲の位置を示す位置情報およびタグ情報を携帯端末20に送信する。さらに、ARサーバ10は、携帯端末20から携帯端末20の特定の部位が向けられている方向を示す方向情報も受信した場合、携帯端末20の現在位置から、方向情報の示す方向側の位置を示す位置情報およびタグ情報を携帯端末20に送信してもよい。
【0020】
なお、タグ情報としては、例えば写真や動画のような画像情報、テキスト情報、または音声情報などが想定される。また、タグ情報は、対応付けられている位置情報の示す位置に関する宣伝情報であってもよいし、対応付けられている位置情報の示す位置に関してアップロードされた一般ユーザからの提供情報であってもよい。
【0021】
携帯端末20は、現在位置の周囲に関する位置情報およびタグ情報を取得し、タグ情報をユーザに提供する。例えば、携帯端末20は、現在位置を示す位置情報をARサーバ10に送信し、ARサーバ10から現在位置の周囲に関するタグ情報および位置情報を取得し、タグ情報を現実空間の撮像画像に付加してタッチパネル22に表示することができる。
【0022】
また、携帯端末20は、音声を出力する音声出力部の一例であるスピーカ24、および音声を収音する音声入力部の一例であるマイクロフォン26を備える。本明細書においては、携帯端末20においてスピーカ24が配されている側の端部を上端部US(Upper Side)と称し、マイクロフォン26が配されている側の端部を下端部LS(Lower Side)と称する。
【0023】
なお、図1においては携帯端末20の一例としてスマートフォンを示しているが、携帯端末20はスマートフォンに限定されない。例えば、携帯端末20は、PDA(Personal Digital Assistants)、携帯電話、携帯用音楽再生装置、携帯用映像処理装置、または携帯用ゲーム機器であってもよい。
【0024】
(本実施形態の背景)
スマートフォンのような携帯端末の普及に伴い、上述したように、現実空間の撮像画像に写真/テキスト/音声などのタグ情報を付加するアプリケーションが注目を集めている。このアプリケーションによれば、例えば、図2に示したようなタグ情報が付加された現実空間の撮像画像が表示されるので、ユーザは、現実空間からは得られないタグ情報を閲覧および操作することが可能となる。
【0025】
しかし、現実空間に付加されるタグ情報の数が多くなると、画面の視認性が低下するので、ユーザが所望の情報を見つけることが困難になってしまう。また、タグ情報を音声により出力することも考えられるが、携帯端末の周囲に対応付けられているタグ情報を音声で順次に出力する場合、タグ情報の数が多くなると、ユーザが興味のあるタグ情報が出力されるまでの時間が長期化するので、ユーザは所望のタグ情報を抽出し難い。
【0026】
そこで、上記事情を一着眼点にして本実施形態を創作するに至った。本実施形態によれば、音声出力される複数のタグ情報からの迅速な情報抽出を支援することが可能である。以下、このような効果を有する本開示の第1の実施形態および第2の実施形態について詳細に説明する。
【0027】
<<2.第1の実施形態>>
<2−1.第1の実施形態の概要>
ユーザは、様々な雑音が存在する状況においても、自分が興味のあるワードや会話は自然と聞き分けることができることが知られている(カクテルパーティ効果)。本開示の第1の実施形態による携帯端末20−1は、このカクテルパーティ効果を利用することにより、タグ情報を音声出力によりユーザに提供する場合に、ユーザが興味のあるタグ情報の迅速に抽出することを可能とする。以下、図3を参照して、第1の実施形態による携帯端末20−1の利用形態の具体例を説明する。
【0028】
図3は、第1の実施形態による携帯端末20−1の利用形態の具体例を示した説明図である。図3に示したように、ユーザが携帯端末20−1のスピーカ24を耳にかざすと、携帯端末20−1は、周囲の位置と対応付けられているタグ情報を同時に音声出力する。具体的には、携帯端末20−1は、携帯端末20−1の特定の部位として下端部LSが向けられている方向を基準とする対象領域を設定し、対象領域内の位置P1〜P3と対応付けられているタグ情報TA〜TCを同時に出力する。すなわち、携帯端末20−1は、タグ情報TA「KKKのアルバム最高!」、タグ情報TB「FFF Cafeのケーキ美味しい!」、タグ情報TC「BBBで女優A発見!」を同時に音声出力する。
【0029】
これにより、ユーザは、例えば女優Aに興味がある場合、カクテルパーティ効果に基づいて女優Aに関するタグ情報を迅速に聞きとると共に、女優Aが携帯端末20−1の下端部LSが向けられている方向で発見されたことを知ることができる。なお、携帯端末20−1は、タグ情報が対応付けられている位置と現在位置との距離が遠いほどタグ情報を小さな音量で出力してもよい。この場合、ユーザは、所望のタグ情報が対応付けられている位置と現在位置との距離感も把握することが可能となる。
【0030】
<2−2.第1の実施形態による携帯端末の構成>
以上、本開示の第1の実施形態の概要を説明した。続いて、本開示の第1の実施形態による携帯端末20−1の構成について詳細に説明する。
【0031】
図4は、本開示の第1の実施形態による携帯端末20−1の構成を示した機能ブロック図である。図4に示したように、本開示の第1の実施形態による携帯端末20−1は、タッチパネル22と、スピーカ24と、GPS220と、加速度センサ224と、通信部228と、領域設定部232と、情報解析部236と、音声制御部240と、表示制御部244と、を備える。
【0032】
(GPS)
GPS(Global Positioning System)220は、人工衛星から送信される航法メッセージを受信し、航法メッセージの受信結果に基づいて携帯端末20−1の現在位置を取得する。なお、GPS220は、携帯端末20−1の現在位置を取得するための構成の一例に過ぎず、他の構成により携帯端末20−1の現在位置を取得することも可能である。例えば、携帯端末20−1は、周囲の無線通信装置から送信されるWi−Fi電波の受信強度に基づいて現在位置を推定してもよいし、ユーザ入力に基づいて現在位置を取得してもよい。
【0033】
(加速度センサ)
加速度センサ224は、携帯端末20−1の加速度を測定する。加速度センサ224による測定結果に基づき、携帯端末20−1の向き、例えば携帯端末20−1の下端部LSの向いている方向を推定することが可能となる。
【0034】
(通信部)
通信部228は、ARサーバ10とのインタフェースであり、ARサーバ10と各種情報を送受信する。例えば、通信部228は、GPS220によって取得された携帯端末20−1の位置情報をARサーバ10に送信し、携帯端末20−1の周囲と対応付けられているタグ情報を位置情報と共にARサーバ10から受信する。また、通信部228は、携帯端末20−1の位置情報に加え、加速度センサ224による測定結果もARサーバ10に送信してもよい。この場合、ARサーバ10から、携帯端末20−1の下端部LSが向いている方向の位置と対応付けられているタグ情報を受信することが可能となる。このように、通信部228、または後述する情報解析部236は、音声出力するためのタグ情報を取得する情報取得部として機能する。
【0035】
なお、本実施形態においては携帯端末20−1がARサーバ10からタグ情報を取得する例を説明するが、本実施形態はかかる例に限定されない。例えば、携帯端末20−1は、位置情報とタグ情報が対応付けられているデータベースを有し、当該データベースから携帯端末20−1の周囲と対応付けられているタグ情報を取得してもよい。
【0036】
(領域設定部)
領域設定部232は、GPS220から供給される携帯端末20−1の位置情報、および加速度センサ224から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。領域設定部232により設定された対象領域内の位置情報と対応付けられているタグ情報が音声出力の対象となる。ここで、図5を参照し、領域設定部232により設定される対象領域について具体的に説明する。
【0037】
図5は、領域設定部232により設定される対象領域の具体例を示した説明図である。領域設定部232は、一例として、携帯端末20−1の下端部LSが向けられている方向を基準とする、半径rおよび角度θで表わされる扇状領域を対象領域として設定してもよい。
【0038】
ここで、同時に音声出力されるタグ情報が多すぎると、カクテルパーティ効果が弱まり、ユーザが興味のあるタグ情報を聞き分けることが難しくなると考えられる。一方、同時に音声出力されるタグ情報が少なすぎると、ユーザが興味のあるタグ情報が音声出力される可能性も低くなるので、情報抽出の効率が悪くなる。
【0039】
そこで、領域設定部232は、対象領域の広さを周囲のタグ情報の密集度合いに応じて変更してもよい。例えば、領域設定部232は、対象領域内の位置情報と対応付けられているタグ情報の数が下限値以上、上限値未満、または所定数となるように対象領域を設定してもよい。以下、この点について図6および図7を参照してより具体的に説明する。
【0040】
図6は、携帯端末20−1の周囲のタグ情報の密集度が高い場合の対象領域の具体例を示した説明図である。図7は、携帯端末20−1の周囲のタグ情報の密集度が低い場合の対象領域の具体例を示した説明図である。領域設定部232は、図6に示したように、周囲のタグ情報の密集度が高い場合には半径rや角度θを小さくすることにより対象領域を狭くしてもよい。一方、領域設定部232は、図7に示したように、周囲のタグ情報の密集度が低い場合には半径rや角度θを大きくすることにより対象領域を広くしてもよい。
【0041】
かかる構成により、ユーザによるタグ情報の聞き分けの容易性、および情報抽出の効率性を確保することが可能となる。
【0042】
(情報解析部)
情報解析部236は、通信部228により受信された周囲のタグ情報から、領域設定部232により設定された対象領域内の位置情報と対応付けられているタグ情報を抽出する。また、情報解析部236は、抽出したタグ情報が対応付けられている位置と、携帯端末20−1との距離および角度を解析し、解析結果を音声制御部240に供給する。
【0043】
(音声制御部)
音声制御部240は、情報解析部236により抽出されたタグ情報のスピーカ24からの音声出力を制御する。具体的には、音声制御部240は、情報解析部236により抽出されたタグ情報が同時にスピーカ24から出力されるように音声制御を行う(第1の制御形態)。かかる構成により、ユーザは、同時に出力される複数のタグ情報からカクテルパーティ効果に基づいて効率的に興味のあるタグ情報を聞き分けることが可能となる。また、音声制御部240は、タグ情報の音声出力に際して以下の制御例A〜制御例Eを行ってもよい。
【0044】
−制御例A
音声制御部240は、タグ情報が対応付けられている位置と携帯端末20−1との距離に応じてタグ情報の音量を制御する。例えば、音声制御部240は、タグ情報が対応付けられている位置と携帯端末20−1との距離が遠いほど当該タグ情報の音量を小さくしてもよい。かかる構成により、ユーザは、タグ情報が対応付けられている位置と現在位置との距離感を把握することが可能となる。
【0045】
−制御例B
音声制御部240は、複数のタグ情報の各々が異なる音特性で出力されるように音声制御を行う。例えば、音声制御部240は、複数のタグ情報の各々が異なる基本周波数または音質で出力されるように音声制御を行ってもよい。かかる構成により、より確実にカクテルパーティ効果を達成することが可能となる。
【0046】
−制御例C
音声制御部240は、タグ情報が音声情報でない場合、タグ情報から音声情報を生成する。例えば、音声制御部240は、タグ情報がテキスト情報である場合、テキスト情報に対応する音声情報を生成してもよい。また、音声制御部240は、タグ情報が写真タグである場合、写真タグに付加されているコメントに対応する音声情報を生成してもよい。かかる構成により、より多数のタグ情報を音声出力の対象とすることができる。
【0047】
−制御例D
音声制御部240は、各タグ情報からキーワードを抽出し、各タグ情報のキーワードの出力タイミングが分散するように音声制御を行う。例えば、タグ情報TA「KKKのアルバム最高!」のキーワードが「KKK」であり、タグ情報TB「FFF Cafeのケーキ美味しい!」のキーワードが「FFF Cafe」であり、タグ情報TC「BBBで女優A発見!」のキーワードが「女優A」であるとする。この場合、これらタグ情報をそのまま出力すると、タグ情報TAのキーワード「KKK」とタグ情報TBのキーワードが「FFF Cafe」が同時に出力される。そこで、音声制御部240は、図8に示したように、タグ情報TAのキーワード「KKK」とタグ情報TBのキーワードが「FFF Cafe」の出力タイミングがずれるよう、タグ情報TBの内容を再構成してもよい。かかる構成により、各タグ情報のキーワードの聞き分けをより容易にすることが可能である。
【0048】
−制御例E
音声制御部240は、ユーザの嗜好に基づき、ユーザが興味を持っていると考えられるワードの出力タイミングが早くなるようにタグ情報の内容を再構成してもよい。例えば、ユーザが「女優A」に興味を持っている場合、音声制御部240は、タグ情報TCの内容を、「女優A、BBBで発見」のように、「女優A」の出力タイミングが早くなるように再構成してもよい。かかる構成により、ユーザは、早期に自分の興味のあるタグ情報を抽出することが可能となる。
【0049】
また、音声制御部240は、タップ操作のような所定のユーザ操作に基づいて、情報解析部236により抽出されたタグ情報の各々が順次に出力されるように制御を行う第2の形態に音声制御を切り替える。このとき、ユーザは、所望のタグ情報が音声出力されているときに第1のユーザ操作を行うことによりタグ情報を選択することが可能である。また、音声制御部240は、フリック操作のような第2のユーザ操作に応じて音声出力対象のタグ情報を切り替えてもよい。以下、このような一連の動作について図9を参照してより具体的に説明する。
【0050】
図9は、音声制御部240による音声制御の具体例を示した説明図である。図9に示したように、複数のタグ情報が同時に出力されている状態においてユーザによりタップ操作が行われると、音声制御部240は、複数のタグ情報を順次に出力する形態に音声制御を切り替える。ここで、音声制御部240は、携帯端末20−1の近くに対応付けられているタグ情報から順次に出力されるように音声制御を行ってもよい。なお、図中の文字の大きさは音量の大きさに対応している。
【0051】
その後、所望のタグ情報が音声出力されているときに携帯端末20−1を振るシェイク操作を行うことにより、所望のタグ情報を選択することができる。例えば、タグ情報TBの出力時にユーザがシェイク操作を行った場合、表示制御部244が、タグ情報TBが対応付けられている位置をタッチパネル22に表示させる。
【0052】
このように、ユーザは、まずカクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を絞り、その後、興味のあるタグ情報を当該母集団から特定し、興味のあるタグ情報の詳細情報を得ることが可能となる。
【0053】
(表示制御部)
表示制御部244は、各種表示画面を生成し、生成した表示画面をタッチパネル22に表示させる。特に、本実施形態による表示制御部244は、複数のタグ情報を順次に出力される第2の形態においてシェイク操作のようなユーザ操作が行われると、シェイク操作が行われた際に音声出力されたタグ情報と対応付けられている位置を示す表示を制御する(図9)。
【0054】
なお、上記では、タグ情報の母集団からユーザが興味のあるタグ情報を特定するための方法として複数のタグ情報を順次に出力する第2の形態を説明したが、ユーザが興味のあるタグ情報を当該母集団から特定するための方法はかかる例に限定されない。例えば、表示制御部244は、複数のタグ情報が同時に出力される第1の形態において所定のユーザ操作が行われた場合、ユーザ操作が行われた時点での複数のタグ情報を固定し、図10に示したように、固定した複数のタグ情報のリストをタッチパネル22に表示させてもよい。かかる構成により、ユーザは、タグ情報のリストから所望のタグ情報を特定することが可能となる。
【0055】
<2−3.第1の実施形態による携帯端末の動作>
以上、本開示の第1の実施形態による携帯端末20−1の構成を説明した。続いて、図11を参照し、本開示の第1の実施形態による携帯端末20−1の動作を説明する。
【0056】
図11は、本開示の第1の実施形態による携帯端末20−1の動作を示したフローチャートである。図11に示したように、まず、携帯端末20−1のGPS220が携帯端末20−1の現在位置を測定し、加速度センサ224が携帯端末20−1の下端部LSの向きを測定する(S304)。そして、通信部228が、携帯端末20−1の位置情報をARサーバ10に送信することにより、ARサーバ10から携帯端末20−1の周囲と対応付けられているタグ情報を取得する(S308)。
【0057】
一方、領域設定部232は、GPS220から供給される携帯端末20−1の位置情報、および加速度センサ224から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。その後、情報解析部236が、携帯端末20−1の周囲と対応付けられているタグ情報から、対象領域内のタグ情報を抽出する(S316)。そして、音声制御部240は、対象領域内のタグ情報がスピーカ24から同時に出力されるように音声制御を行う(S320)。
【0058】
その後、タッチパネル22に対してユーザによりタップ操作が行われると(S324)、音声制御部240は、対象領域内のタグ情報が順次に出力されるように音声制御の形態を切り替える(S328)。そして、ユーザによりシェイク操作が行われると(S332)、表示制御部244が、シェイク操作の際に音声出力されたタグ情報と対応付けられている位置を示す表示画面をタッチパネル22に表示させる(S336)。
【0059】
以上説明したように、本開示の第1の実施形態によれば、複数のタグ情報を同時に出力することにより、ユーザは、カクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を迅速に絞り込むことが可能となる。
【0060】
<<3.第2の実施形態>>
続いて、本開示の第2の実施形態を説明する。本開示の第2の実施形態は、音声出力をスピーカ24でなく装着型の音声出力装置から行う点で第1の実施形態と異なる。以下、このような本開示の第2の実施形態について詳細に説明する。
【0061】
図12は、本開示の第2の実施形態による携帯端末20−2および音声出力装置30を示した説明図である。図12に示したように、第2の実施形態による携帯端末20−2は、音声出力装置30に音声信号を送信し、音声出力装置30が、携帯端末20−2から受信した音声信号をステレオ音声で出力する。
【0062】
なお、図12においては携帯端末20−2と音声出力装置30が近接無線通信により接続される例を示しているが、携帯端末20−2と音声出力装置30は有線により接続されてもよい。また、図12においては装着型の音声出力装置30の一例としてヘッドホンを示しているが、音声出力装置30は、ヘッドホンに限定されず、例えばイヤホンであってもよい。
【0063】
(第2の実施形態による携帯端末の構成)
続いて、図13を参照し、第2の実施形態による携帯端末20−2の構成を説明する。図13は、第2の実施形態による携帯端末20−2の構成を示した機能ブロック図である。図13に示したように、第2の実施形態による携帯端末20−2は、タッチパネル22と、GPS220と、加速度センサ224と、通信部228と、領域設定部234と、情報解析部236と、音声制御部240と、表示制御部246と、音源設定部248と、音声処理部252と、を備える。タッチパネル22、GPS220、加速度センサ224、通信部228、および音声制御部240などの構成について第1の実施形態と共通部分が多いので、ここでの詳細な説明を省略する。
【0064】
領域設定部234は、GPS220から供給される携帯端末20−1の位置情報、および加速度センサ224から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。ここで、第1の実施形態と異なり、ユーザはスピーカ24を耳にかざす必要が無いので、領域設定部234は、携帯端末20−2の下端部LSでなく、例えば上端部USが向けられている方向を基準にして対象領域を設定する。
【0065】
音源設定部248は、情報解析部236により抽出された複数のタグ情報の各々について仮想的な音源位置(以下、仮想音源位置)を設定する。例えば、音源設定部248は、複数のタグ情報の各々に対応付けられている位置を仮想音源位置に設定してもよい。また、音源設定部248は、タグ情報に対応付けられている位置と異なる位置を複数のタグ情報の各々の仮想音源位置に設定してもよい。このように、複数のタグ情報の各々に異なる仮想音源位置を設定することにより、カクテルパーティ効果が一層高まることが期待される。
【0066】
音声処理部252は、複数のタグ情報の各々について、音源設定部248により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う。この処理はユーザの向きに応じて行われるので、ユーザの向きを検出するためのセンサをユーザが装着してもよいし、携帯端末20−2の上端部USの向きをユーザの向きとして扱ってもよい。
【0067】
近接通信部256は、音声処理部252により処理された音声信号を音声出力装置30に送信する。そして、音声出力装置30は、近接通信部256から受信した音声信号をステレオ音声で出力する。
【0068】
表示制御部246は、音声出力装置30から複数のタグ情報が同時に出力されている間、各タグ情報をタッチパネル22に表示させる。ここで、表示制御部246は、各タグ情報が、図14に示したように、現在位置を基準とする音源設定部248により設定された仮想音源位置に表示されるように表示制御を行ってもよい。かかる構成により、ユーザは、聴覚により知覚されるタグ情報の位置を、視覚を通じても知覚することが可能となる。
【0069】
<<4.携帯端末のハードウェア構成>>
以上、本開示の実施形態について詳細に説明した。上述した本開示の実施形態による携帯端末20による情報処理は、ソフトウェアと携帯端末20のハードウェアが協働することにより実現される。以下、このような携帯端末20のハードウェア構成について図15を参照して説明する。
【0070】
図15は、携帯端末20のハードウェア構成を示した説明図である。図15に示したように、携帯端末20は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、入力装置208と、出力装置210と、ストレージ装置211と、ドライブ212と、撮像装置213と、通信装置215とを備える。
【0071】
CPU201は、演算処理装置および制御装置として機能し、各種プログラムに従って携帯端末20内の動作全般を制御する。また、CPU201は、マイクロプロセッサであってもよい。ROM202は、CPU201が使用するプログラムや演算パラメータ等を記憶する。RAM203は、CPU201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバスにより相互に接続されている。
【0072】
入力装置208は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU201に出力する入力制御回路などから構成されている。携帯端末20のユーザは、該入力装置208を操作することにより、携帯端末20に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0073】
出力装置210は、例えば、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置を含む。さらに、出力装置210は、スピーカおよびヘッドホンなどの音声出力装置を含む。例えば、表示装置は、撮像された画像や生成された画像などを表示する。一方、音声出力装置は、音声データ等を音声に変換して出力する。
【0074】
ストレージ装置211は、本実施形態にかかる携帯端末20の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置211は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。このストレージ装置211は、CPU201が実行するプログラムや各種データを格納する。
【0075】
ドライブ212は、記憶媒体用リーダライタであり、携帯端末20に内蔵、あるいは外付けされる。ドライブ212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体23に記録されている情報を読み出して、RAM203に出力する。また、ドライブ212は、リムーバブル記憶媒体23に情報を書き込むこともできる。
【0076】
撮像装置213は、光を集光する撮影レンズおよびズームレンズなどの撮像光学系、およびCCD(Charge Coupled Device)またはCMOS(Complementary Metal Oxide Semiconductor)などの信号変換素子を備える。撮像光学系は、被写体から発せられる光を集光して信号変換部に被写体像を形成し、信号変換素子は、形成された被写体像を電気的な画像信号に変換する。
【0077】
通信装置215は、例えば、通信網12に接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置215は、無線LAN(Local Area Network)対応通信装置であっても、LTE(Long Term Evolution)対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
【0078】
<<5.むすび>>
以上説明したように、本開示の実施形態によれば、複数のタグ情報を同時に出力することにより、ユーザは、カクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を迅速に絞り込むことが可能となる。その後、ユーザは、視覚または聴覚を通じて興味のあるタグ情報を当該母集団から特定し、興味のあるタグ情報の詳細情報を得ることが可能となる。
【0079】
また、本開示によれば、タグ情報が一般ユーザにより現在位置と対応付けて提供される情報である場合、ユーザは、タグ情報が出力される音量に基づいて、一般ユーザとの距離感を把握することができる。また、本開示のタグ情報を、相手の位置情報と対応付けられたメールやチャットなどに適用すれば、相手の方向や距離を把握することが可能となる。
【0080】
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0081】
例えば、本明細書の携帯端末20の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、携帯端末20の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
【0082】
また、携帯端末20に内蔵されるCPU201、ROM202およびRAM203などのハードウェアを、上述した携帯端末20の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。
【0083】
また、以下のような構成も本開示の技術的範囲に属する。
(1)
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
を備える、音声制御装置。
(2)
前記音声制御部は、前記複数の情報が異なる音特性で出力されるように音声制御を行う、前記(1)に記載の音声制御装置。
(3)
前記音声制御部は、前記複数の情報が同時に出力されるように音声制御を行う第1の形態と、前記複数の情報の各々が順次に出力されるように制御を行う第2の形態とで音声制御を切り替える、前記(1)または(2)に記載の音声制御装置。
(4)
前記第2の形態において第1のユーザ操作が行われると、前記第1のユーザ操作が行われた際に音声出力された情報と対応付けられている位置を示す表示を制御する表示制御部と、
をさらに備える、前記(3)に記載の音声制御装置。
(5)
前記音声制御部は、前記第2の形態において、第2のユーザ操作に応じて音声出力の対象情報を切り替える、前記(3)または(4)に記載の音声制御装置。
(6)
前記音声制御部は、前記複数の情報のうちで、前記音声制御装置に近い位置と対応付けられている情報ほど大きな音量で出力されるように音声制御を行う、前記(2)に記載の音声制御装置。
(7)
前記音声制御部は、前記複数の情報の各々の音声出力を異なる周波数または音質で制御する、前記(2)または(6)に記載の音声制御装置。
(8)
前記情報取得部は、前記音声制御装置の特定の部位が向けられている方向を基準とする領域内の位置と対応付けられている情報を取得する、前記(1)〜(7)のいずれか一項に記載の音声制御装置。
(9)
前記領域内の位置と対応付けられている情報の数が下限値以上、上限値未満、または所定数となるように前記領域を設定する領域設定部をさらに備える、前記(8)に記載の音声制御装置。
(10)
前記音声制御部は、前記複数の情報に含まれるキーワードの出力タイミングが分散するように音声制御を行う、前記(1)〜(9)のいずれか一項に記載の音声制御装置。
(11)
前記音声制御部は、ステレオ音声を出力する装着型の音声出力装置からの音声出力を制御し、
前記音声制御装置は、
前記複数の情報の各々について仮想音源位置を設定する音源設定部と、
前記複数の情報の各々について、前記音源設定部により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う音声処理部と、
をさらに備える、前記(1)〜(10)のいずれか一項に記載の音声制御装置。
(12)
前記音源設定部は、前記複数の情報の各々に対応付けられている位置を前記複数の情報の各々の仮想音源位置に設定する、前記(11)に記載の音声制御装置。
(13)
前記音源設定部は、前記複数の情報の各々の仮想音源位置を異なる位置に設定する、前記(11)に記載の音声制御装置。
(14)
表示画面において、前記複数の情報の各表示が、前記音源設定部により設定された仮想音源位置に応じた位置に配置されるように表示を制御する表示制御部をさらに備える、前記(11)〜(13)のいずれか一項に記載の音声制御装置。
(15)
周囲の位置と対応付けられている情報を取得するステップと、
複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、
を含む、音声制御方法。
(16)
コンピュータを、
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
として機能させるための、プログラム。
【符号の説明】
【0084】
10 ARサーバ
20 携帯端末
22 タッチパネル
24 スピーカ
26 マイクロフォン
30 音声出力装置
220 GPS
224 加速度センサ
228 通信部
232、234 領域設定部
236 情報解析部
240 音声制御部
244、246 表示制御部
248 音源設定部
252 音声処理部
256 近接通信部

【特許請求の範囲】
【請求項1】
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
を備える、音声制御装置。
【請求項2】
前記音声制御部は、前記複数の情報が異なる音特性で出力されるように音声制御を行う、請求項1に記載の音声制御装置。
【請求項3】
前記音声制御部は、前記複数の情報が同時に出力されるように音声制御を行う第1の形態と、前記複数の情報の各々が順次に出力されるように制御を行う第2の形態とで音声制御を切り替える、請求項1に記載の音声制御装置。
【請求項4】
前記第2の形態において第1のユーザ操作が行われると、前記第1のユーザ操作が行われた際に音声出力された情報と対応付けられている位置を示す表示を制御する表示制御部と、
をさらに備える、請求項3に記載の音声制御装置。
【請求項5】
前記音声制御部は、前記第2の形態において、第2のユーザ操作に応じて音声出力の対象情報を切り替える、請求項3に記載の音声制御装置。
【請求項6】
前記音声制御部は、前記複数の情報のうちで、前記音声制御装置に近い位置と対応付けられている情報ほど大きな音量で出力されるように音声制御を行う、請求項2に記載の音声制御装置。
【請求項7】
前記音声制御部は、前記複数の情報の各々の音声出力を異なる周波数または音質で制御する、請求項2に記載の音声制御装置。
【請求項8】
前記情報取得部は、前記音声制御装置の特定の部位が向けられている方向を基準とする領域内の位置と対応付けられている情報を取得する、請求項1に記載の音声制御装置。
【請求項9】
前記領域内の位置と対応付けられている情報の数が下限値以上、上限値未満、または所定数となるように前記領域を設定する領域設定部をさらに備える、請求項8に記載の音声制御装置。
【請求項10】
前記音声制御部は、前記複数の情報に含まれるキーワードの出力タイミングが分散するように音声制御を行う、請求項1に記載の音声制御装置。
【請求項11】
前記音声制御部は、ステレオ音声を出力する装着型の音声出力装置からの音声出力を制御し、
前記音声制御装置は、
前記複数の情報の各々について仮想音源位置を設定する音源設定部と、
前記複数の情報の各々について、前記音源設定部により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う音声処理部と、
をさらに備える、請求項1に記載の音声制御装置。
【請求項12】
前記音源設定部は、前記複数の情報の各々に対応付けられている位置を前記複数の情報の各々の仮想音源位置に設定する、請求項11に記載の音声制御装置。
【請求項13】
前記音源設定部は、前記複数の情報の各々の仮想音源位置を異なる位置に設定する、請求項11に記載の音声制御装置。
【請求項14】
表示画面において、前記複数の情報の各表示が、前記音源設定部により設定された仮想音源位置に応じた位置に配置されるように表示を制御する表示制御部をさらに備える、請求項11に記載の音声制御装置。
【請求項15】
周囲の位置と対応付けられている情報を取得するステップと、
複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、
を含む、音声制御方法。
【請求項16】
コンピュータを、
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
として機能させるための、プログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2013−101248(P2013−101248A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2011−245357(P2011−245357)
【出願日】平成23年11月9日(2011.11.9)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】