音声制御装置、音声制御方法、およびプログラム

【課題】音声出力される複数の情報からの迅速な情報抽出を支援するための音声制御装置、音声制御方法、およびプログラムを提供する。
【解決手段】周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、を備える音声制御装置。

【発明の詳細な説明】
【技術分野】
【０００１】
本開示は、音声制御装置、音声制御方法、およびプログラムに関する。
【背景技術】
【０００２】
近日、撮像装置およびディスプレイを備えた携帯端末の普及に伴い、ＡＲ（ＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ：拡張現実）技術を用いたアプリケーションが注目を集めている。例えば、ＡＲ技術を用いたアプリケーションとして、携帯機器の位置に基づき、現実空間の撮像画像に写真／テキスト／音声などのタグ情報を付加するＡＲアプリケーションが挙げられる。
【０００３】
ユーザは、このようなＡＲアプリケーションにより、現実空間に付加されたタグ情報を閲覧および操作することが可能となる。しかし、現実空間に付加されるタグ情報の数が多くなると、画面の視認性が低下するので、ユーザが所望の情報を見つけることが困難になってしまう。この点について、携帯端末と対象位置との関係に応じてユーザに音声案内を行うための音響制御装置が特許文献１に開示されている。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２０１０−４９１５８号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
しかし、携帯端末の周囲に対応付けられているタグ情報を音声で順次に出力する場合、タグ情報の数が多くなると、ユーザが興味のあるタグ情報が出力されるまでの時間が長期化するので、ユーザは所望のタグ情報を抽出し難い。
【０００６】
そこで、本開示では、音声出力される複数の情報からの迅速な情報抽出を支援することが可能な、新規かつ改良された音声制御装置、音声制御方法、およびプログラムを提案する。
【課題を解決するための手段】
【０００７】
本開示によれば、周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、を備える音声制御装置が提供される。
【０００８】
また、本開示によれば、周囲の位置と対応付けられている情報を取得するステップと、複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、を含む音声制御方法が提供される。
【０００９】
また、本開示によれば、コンピュータを、周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、として機能させるためのプログラムが提供される。
【発明の効果】
【００１０】
以上説明したように本開示によれば、音声出力される複数の情報からの迅速な情報抽出を支援することが可能である。
【図面の簡単な説明】
【００１１】
【図１】本開示の実施形態による音声制御システムの構成を示した説明図である。
【図２】タグ情報が付加された現実空間の撮像画像を示した説明図である。
【図３】第１の実施形態による携帯端末の利用形態の具体例を示した説明図である。
【図４】本開示の第１の実施形態による携帯端末の構成を示した機能ブロック図である。
【図５】領域設定部により設定される対象領域の具体例を示した説明図である。
【図６】携帯端末の周囲のタグ情報の密集度が高い場合の対象領域の具体例を示した説明図である。
【図７】携帯端末の周囲のタグ情報の密集度が低い場合の対象領域の具体例を示した説明図である。
【図８】タグ情報の再構成を示した説明図である。
【図９】音声制御部による音声制御の具体例を示した説明図である。
【図１０】タグ情報のリストの具体例を示した説明図である。
【図１１】本開示の第１の実施形態による携帯端末の動作を示したフローチャートである。
【図１２】本開示の第２の実施形態による携帯端末および音声出力装置を示した説明図である。
【図１３】第２の実施形態による携帯端末の構成を示した機能ブロック図である。
【図１４】第２の実施形態による表示制御例を示した説明図である。
【図１５】携帯端末のハードウェア構成を示した説明図である。
【発明を実施するための形態】
【００１２】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【００１３】
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。
【００１４】
また、以下に示す項目順序に従って本開示を説明する。
１．音声制御システムの基本構成
２．第１の実施形態
２−１．第１の実施形態の概要
２−２．第１の実施形態による携帯端末の構成
２−３．第１の実施形態による携帯端末の動作
３．第２の実施形態
４．携帯端末のハードウェア構成
５．むすび
【００１５】
＜＜１．音声制御システムの基本構成＞＞
本開示による技術は、一例として「２．第１の実施形態」〜「３．第２の実施形態」において詳細に説明するように、多様な形態で実施され得る。また、各実施形態による音声制御装置（携帯端末２０）は、
Ａ．周囲の位置と対応付けられている情報を取得する情報取得部（通信部２２８、情報解析部２３６）と、
Ｂ．前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部（２４０）と、
を備える。
【００１６】
以下では、まず、このような各実施形態において共通する音声制御システムの基本構成について図１を参照して説明する。
【００１７】
図１は、本開示の実施形態による音声制御システムの構成を示した説明図である。図１に示したように、本開示の実施形態による音声制御システムは、ＡＲサーバ１０と、携帯端末２０と、を備える。
【００１８】
このＡＲサーバ１０および携帯端末２０は、通信網１２を介して接続されており、通信網１２を介して各種情報を通信することが可能である。なお、通信網１２は、通信網１２に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網１２は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などを含んでもよい。また、通信網１２は、ＩＰ−ＶＰＮ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ−ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）などの専用回線網を含んでもよい。
【００１９】
ＡＲサーバ１０は、位置情報とタグ情報とを対応付けて記憶しており、通信網１２を介して位置情報とタグ情報を携帯端末２０に送信する。例えば、ＡＲサーバ１０は、携帯端末２０から携帯端末２０の現在位置を示す位置情報を受信すると、携帯端末２０の周囲の位置を示す位置情報およびタグ情報を携帯端末２０に送信する。さらに、ＡＲサーバ１０は、携帯端末２０から携帯端末２０の特定の部位が向けられている方向を示す方向情報も受信した場合、携帯端末２０の現在位置から、方向情報の示す方向側の位置を示す位置情報およびタグ情報を携帯端末２０に送信してもよい。
【００２０】
なお、タグ情報としては、例えば写真や動画のような画像情報、テキスト情報、または音声情報などが想定される。また、タグ情報は、対応付けられている位置情報の示す位置に関する宣伝情報であってもよいし、対応付けられている位置情報の示す位置に関してアップロードされた一般ユーザからの提供情報であってもよい。
【００２１】
携帯端末２０は、現在位置の周囲に関する位置情報およびタグ情報を取得し、タグ情報をユーザに提供する。例えば、携帯端末２０は、現在位置を示す位置情報をＡＲサーバ１０に送信し、ＡＲサーバ１０から現在位置の周囲に関するタグ情報および位置情報を取得し、タグ情報を現実空間の撮像画像に付加してタッチパネル２２に表示することができる。
【００２２】
また、携帯端末２０は、音声を出力する音声出力部の一例であるスピーカ２４、および音声を収音する音声入力部の一例であるマイクロフォン２６を備える。本明細書においては、携帯端末２０においてスピーカ２４が配されている側の端部を上端部ＵＳ（ＵｐｐｅｒＳｉｄｅ）と称し、マイクロフォン２６が配されている側の端部を下端部ＬＳ（ＬｏｗｅｒＳｉｄｅ）と称する。
【００２３】
なお、図１においては携帯端末２０の一例としてスマートフォンを示しているが、携帯端末２０はスマートフォンに限定されない。例えば、携帯端末２０は、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔｓ）、携帯電話、携帯用音楽再生装置、携帯用映像処理装置、または携帯用ゲーム機器であってもよい。
【００２４】
（本実施形態の背景）
スマートフォンのような携帯端末の普及に伴い、上述したように、現実空間の撮像画像に写真／テキスト／音声などのタグ情報を付加するアプリケーションが注目を集めている。このアプリケーションによれば、例えば、図２に示したようなタグ情報が付加された現実空間の撮像画像が表示されるので、ユーザは、現実空間からは得られないタグ情報を閲覧および操作することが可能となる。
【００２５】
しかし、現実空間に付加されるタグ情報の数が多くなると、画面の視認性が低下するので、ユーザが所望の情報を見つけることが困難になってしまう。また、タグ情報を音声により出力することも考えられるが、携帯端末の周囲に対応付けられているタグ情報を音声で順次に出力する場合、タグ情報の数が多くなると、ユーザが興味のあるタグ情報が出力されるまでの時間が長期化するので、ユーザは所望のタグ情報を抽出し難い。
【００２６】
そこで、上記事情を一着眼点にして本実施形態を創作するに至った。本実施形態によれば、音声出力される複数のタグ情報からの迅速な情報抽出を支援することが可能である。以下、このような効果を有する本開示の第１の実施形態および第２の実施形態について詳細に説明する。
【００２７】
＜＜２．第１の実施形態＞＞
＜２−１．第１の実施形態の概要＞
ユーザは、様々な雑音が存在する状況においても、自分が興味のあるワードや会話は自然と聞き分けることができることが知られている（カクテルパーティ効果）。本開示の第１の実施形態による携帯端末２０−１は、このカクテルパーティ効果を利用することにより、タグ情報を音声出力によりユーザに提供する場合に、ユーザが興味のあるタグ情報の迅速に抽出することを可能とする。以下、図３を参照して、第１の実施形態による携帯端末２０−１の利用形態の具体例を説明する。
【００２８】
図３は、第１の実施形態による携帯端末２０−１の利用形態の具体例を示した説明図である。図３に示したように、ユーザが携帯端末２０−１のスピーカ２４を耳にかざすと、携帯端末２０−１は、周囲の位置と対応付けられているタグ情報を同時に音声出力する。具体的には、携帯端末２０−１は、携帯端末２０−１の特定の部位として下端部ＬＳが向けられている方向を基準とする対象領域を設定し、対象領域内の位置Ｐ１〜Ｐ３と対応付けられているタグ情報ＴＡ〜ＴＣを同時に出力する。すなわち、携帯端末２０−１は、タグ情報ＴＡ「ＫＫＫのアルバム最高！」、タグ情報ＴＢ「ＦＦＦＣａｆｅのケーキ美味しい！」、タグ情報ＴＣ「ＢＢＢで女優Ａ発見！」を同時に音声出力する。
【００２９】
これにより、ユーザは、例えば女優Ａに興味がある場合、カクテルパーティ効果に基づいて女優Ａに関するタグ情報を迅速に聞きとると共に、女優Ａが携帯端末２０−１の下端部ＬＳが向けられている方向で発見されたことを知ることができる。なお、携帯端末２０−１は、タグ情報が対応付けられている位置と現在位置との距離が遠いほどタグ情報を小さな音量で出力してもよい。この場合、ユーザは、所望のタグ情報が対応付けられている位置と現在位置との距離感も把握することが可能となる。
【００３０】
＜２−２．第１の実施形態による携帯端末の構成＞
以上、本開示の第１の実施形態の概要を説明した。続いて、本開示の第１の実施形態による携帯端末２０−１の構成について詳細に説明する。
【００３１】
図４は、本開示の第１の実施形態による携帯端末２０−１の構成を示した機能ブロック図である。図４に示したように、本開示の第１の実施形態による携帯端末２０−１は、タッチパネル２２と、スピーカ２４と、ＧＰＳ２２０と、加速度センサ２２４と、通信部２２８と、領域設定部２３２と、情報解析部２３６と、音声制御部２４０と、表示制御部２４４と、を備える。
【００３２】
（ＧＰＳ）
ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）２２０は、人工衛星から送信される航法メッセージを受信し、航法メッセージの受信結果に基づいて携帯端末２０−１の現在位置を取得する。なお、ＧＰＳ２２０は、携帯端末２０−１の現在位置を取得するための構成の一例に過ぎず、他の構成により携帯端末２０−１の現在位置を取得することも可能である。例えば、携帯端末２０−１は、周囲の無線通信装置から送信されるＷｉ−Ｆｉ電波の受信強度に基づいて現在位置を推定してもよいし、ユーザ入力に基づいて現在位置を取得してもよい。
【００３３】
（加速度センサ）
加速度センサ２２４は、携帯端末２０−１の加速度を測定する。加速度センサ２２４による測定結果に基づき、携帯端末２０−１の向き、例えば携帯端末２０−１の下端部ＬＳの向いている方向を推定することが可能となる。
【００３４】
（通信部）
通信部２２８は、ＡＲサーバ１０とのインタフェースであり、ＡＲサーバ１０と各種情報を送受信する。例えば、通信部２２８は、ＧＰＳ２２０によって取得された携帯端末２０−１の位置情報をＡＲサーバ１０に送信し、携帯端末２０−１の周囲と対応付けられているタグ情報を位置情報と共にＡＲサーバ１０から受信する。また、通信部２２８は、携帯端末２０−１の位置情報に加え、加速度センサ２２４による測定結果もＡＲサーバ１０に送信してもよい。この場合、ＡＲサーバ１０から、携帯端末２０−１の下端部ＬＳが向いている方向の位置と対応付けられているタグ情報を受信することが可能となる。このように、通信部２２８、または後述する情報解析部２３６は、音声出力するためのタグ情報を取得する情報取得部として機能する。
【００３５】
なお、本実施形態においては携帯端末２０−１がＡＲサーバ１０からタグ情報を取得する例を説明するが、本実施形態はかかる例に限定されない。例えば、携帯端末２０−１は、位置情報とタグ情報が対応付けられているデータベースを有し、当該データベースから携帯端末２０−１の周囲と対応付けられているタグ情報を取得してもよい。
【００３６】
（領域設定部）
領域設定部２３２は、ＧＰＳ２２０から供給される携帯端末２０−１の位置情報、および加速度センサ２２４から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。領域設定部２３２により設定された対象領域内の位置情報と対応付けられているタグ情報が音声出力の対象となる。ここで、図５を参照し、領域設定部２３２により設定される対象領域について具体的に説明する。
【００３７】
図５は、領域設定部２３２により設定される対象領域の具体例を示した説明図である。領域設定部２３２は、一例として、携帯端末２０−１の下端部ＬＳが向けられている方向を基準とする、半径ｒおよび角度θで表わされる扇状領域を対象領域として設定してもよい。
【００３８】
ここで、同時に音声出力されるタグ情報が多すぎると、カクテルパーティ効果が弱まり、ユーザが興味のあるタグ情報を聞き分けることが難しくなると考えられる。一方、同時に音声出力されるタグ情報が少なすぎると、ユーザが興味のあるタグ情報が音声出力される可能性も低くなるので、情報抽出の効率が悪くなる。
【００３９】
そこで、領域設定部２３２は、対象領域の広さを周囲のタグ情報の密集度合いに応じて変更してもよい。例えば、領域設定部２３２は、対象領域内の位置情報と対応付けられているタグ情報の数が下限値以上、上限値未満、または所定数となるように対象領域を設定してもよい。以下、この点について図６および図７を参照してより具体的に説明する。
【００４０】
図６は、携帯端末２０−１の周囲のタグ情報の密集度が高い場合の対象領域の具体例を示した説明図である。図７は、携帯端末２０−１の周囲のタグ情報の密集度が低い場合の対象領域の具体例を示した説明図である。領域設定部２３２は、図６に示したように、周囲のタグ情報の密集度が高い場合には半径ｒや角度θを小さくすることにより対象領域を狭くしてもよい。一方、領域設定部２３２は、図７に示したように、周囲のタグ情報の密集度が低い場合には半径ｒや角度θを大きくすることにより対象領域を広くしてもよい。
【００４１】
かかる構成により、ユーザによるタグ情報の聞き分けの容易性、および情報抽出の効率性を確保することが可能となる。
【００４２】
（情報解析部）
情報解析部２３６は、通信部２２８により受信された周囲のタグ情報から、領域設定部２３２により設定された対象領域内の位置情報と対応付けられているタグ情報を抽出する。また、情報解析部２３６は、抽出したタグ情報が対応付けられている位置と、携帯端末２０−１との距離および角度を解析し、解析結果を音声制御部２４０に供給する。
【００４３】
（音声制御部）
音声制御部２４０は、情報解析部２３６により抽出されたタグ情報のスピーカ２４からの音声出力を制御する。具体的には、音声制御部２４０は、情報解析部２３６により抽出されたタグ情報が同時にスピーカ２４から出力されるように音声制御を行う（第１の制御形態）。かかる構成により、ユーザは、同時に出力される複数のタグ情報からカクテルパーティ効果に基づいて効率的に興味のあるタグ情報を聞き分けることが可能となる。また、音声制御部２４０は、タグ情報の音声出力に際して以下の制御例Ａ〜制御例Ｅを行ってもよい。
【００４４】
−制御例Ａ
音声制御部２４０は、タグ情報が対応付けられている位置と携帯端末２０−１との距離に応じてタグ情報の音量を制御する。例えば、音声制御部２４０は、タグ情報が対応付けられている位置と携帯端末２０−１との距離が遠いほど当該タグ情報の音量を小さくしてもよい。かかる構成により、ユーザは、タグ情報が対応付けられている位置と現在位置との距離感を把握することが可能となる。
【００４５】
−制御例Ｂ
音声制御部２４０は、複数のタグ情報の各々が異なる音特性で出力されるように音声制御を行う。例えば、音声制御部２４０は、複数のタグ情報の各々が異なる基本周波数または音質で出力されるように音声制御を行ってもよい。かかる構成により、より確実にカクテルパーティ効果を達成することが可能となる。
【００４６】
−制御例Ｃ
音声制御部２４０は、タグ情報が音声情報でない場合、タグ情報から音声情報を生成する。例えば、音声制御部２４０は、タグ情報がテキスト情報である場合、テキスト情報に対応する音声情報を生成してもよい。また、音声制御部２４０は、タグ情報が写真タグである場合、写真タグに付加されているコメントに対応する音声情報を生成してもよい。かかる構成により、より多数のタグ情報を音声出力の対象とすることができる。
【００４７】
−制御例Ｄ
音声制御部２４０は、各タグ情報からキーワードを抽出し、各タグ情報のキーワードの出力タイミングが分散するように音声制御を行う。例えば、タグ情報ＴＡ「ＫＫＫのアルバム最高！」のキーワードが「ＫＫＫ」であり、タグ情報ＴＢ「ＦＦＦＣａｆｅのケーキ美味しい！」のキーワードが「ＦＦＦＣａｆｅ」であり、タグ情報ＴＣ「ＢＢＢで女優Ａ発見！」のキーワードが「女優Ａ」であるとする。この場合、これらタグ情報をそのまま出力すると、タグ情報ＴＡのキーワード「ＫＫＫ」とタグ情報ＴＢのキーワードが「ＦＦＦＣａｆｅ」が同時に出力される。そこで、音声制御部２４０は、図８に示したように、タグ情報ＴＡのキーワード「ＫＫＫ」とタグ情報ＴＢのキーワードが「ＦＦＦＣａｆｅ」の出力タイミングがずれるよう、タグ情報ＴＢの内容を再構成してもよい。かかる構成により、各タグ情報のキーワードの聞き分けをより容易にすることが可能である。
【００４８】
−制御例Ｅ
音声制御部２４０は、ユーザの嗜好に基づき、ユーザが興味を持っていると考えられるワードの出力タイミングが早くなるようにタグ情報の内容を再構成してもよい。例えば、ユーザが「女優Ａ」に興味を持っている場合、音声制御部２４０は、タグ情報ＴＣの内容を、「女優Ａ、ＢＢＢで発見」のように、「女優Ａ」の出力タイミングが早くなるように再構成してもよい。かかる構成により、ユーザは、早期に自分の興味のあるタグ情報を抽出することが可能となる。
【００４９】
また、音声制御部２４０は、タップ操作のような所定のユーザ操作に基づいて、情報解析部２３６により抽出されたタグ情報の各々が順次に出力されるように制御を行う第２の形態に音声制御を切り替える。このとき、ユーザは、所望のタグ情報が音声出力されているときに第１のユーザ操作を行うことによりタグ情報を選択することが可能である。また、音声制御部２４０は、フリック操作のような第２のユーザ操作に応じて音声出力対象のタグ情報を切り替えてもよい。以下、このような一連の動作について図９を参照してより具体的に説明する。
【００５０】
図９は、音声制御部２４０による音声制御の具体例を示した説明図である。図９に示したように、複数のタグ情報が同時に出力されている状態においてユーザによりタップ操作が行われると、音声制御部２４０は、複数のタグ情報を順次に出力する形態に音声制御を切り替える。ここで、音声制御部２４０は、携帯端末２０−１の近くに対応付けられているタグ情報から順次に出力されるように音声制御を行ってもよい。なお、図中の文字の大きさは音量の大きさに対応している。
【００５１】
その後、所望のタグ情報が音声出力されているときに携帯端末２０−１を振るシェイク操作を行うことにより、所望のタグ情報を選択することができる。例えば、タグ情報ＴＢの出力時にユーザがシェイク操作を行った場合、表示制御部２４４が、タグ情報ＴＢが対応付けられている位置をタッチパネル２２に表示させる。
【００５２】
このように、ユーザは、まずカクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を絞り、その後、興味のあるタグ情報を当該母集団から特定し、興味のあるタグ情報の詳細情報を得ることが可能となる。
【００５３】
（表示制御部）
表示制御部２４４は、各種表示画面を生成し、生成した表示画面をタッチパネル２２に表示させる。特に、本実施形態による表示制御部２４４は、複数のタグ情報を順次に出力される第２の形態においてシェイク操作のようなユーザ操作が行われると、シェイク操作が行われた際に音声出力されたタグ情報と対応付けられている位置を示す表示を制御する（図９）。
【００５４】
なお、上記では、タグ情報の母集団からユーザが興味のあるタグ情報を特定するための方法として複数のタグ情報を順次に出力する第２の形態を説明したが、ユーザが興味のあるタグ情報を当該母集団から特定するための方法はかかる例に限定されない。例えば、表示制御部２４４は、複数のタグ情報が同時に出力される第１の形態において所定のユーザ操作が行われた場合、ユーザ操作が行われた時点での複数のタグ情報を固定し、図１０に示したように、固定した複数のタグ情報のリストをタッチパネル２２に表示させてもよい。かかる構成により、ユーザは、タグ情報のリストから所望のタグ情報を特定することが可能となる。
【００５５】
＜２−３．第１の実施形態による携帯端末の動作＞
以上、本開示の第１の実施形態による携帯端末２０−１の構成を説明した。続いて、図１１を参照し、本開示の第１の実施形態による携帯端末２０−１の動作を説明する。
【００５６】
図１１は、本開示の第１の実施形態による携帯端末２０−１の動作を示したフローチャートである。図１１に示したように、まず、携帯端末２０−１のＧＰＳ２２０が携帯端末２０−１の現在位置を測定し、加速度センサ２２４が携帯端末２０−１の下端部ＬＳの向きを測定する（Ｓ３０４）。そして、通信部２２８が、携帯端末２０−１の位置情報をＡＲサーバ１０に送信することにより、ＡＲサーバ１０から携帯端末２０−１の周囲と対応付けられているタグ情報を取得する（Ｓ３０８）。
【００５７】
一方、領域設定部２３２は、ＧＰＳ２２０から供給される携帯端末２０−１の位置情報、および加速度センサ２２４から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。その後、情報解析部２３６が、携帯端末２０−１の周囲と対応付けられているタグ情報から、対象領域内のタグ情報を抽出する（Ｓ３１６）。そして、音声制御部２４０は、対象領域内のタグ情報がスピーカ２４から同時に出力されるように音声制御を行う（Ｓ３２０）。
【００５８】
その後、タッチパネル２２に対してユーザによりタップ操作が行われると（Ｓ３２４）、音声制御部２４０は、対象領域内のタグ情報が順次に出力されるように音声制御の形態を切り替える（Ｓ３２８）。そして、ユーザによりシェイク操作が行われると（Ｓ３３２）、表示制御部２４４が、シェイク操作の際に音声出力されたタグ情報と対応付けられている位置を示す表示画面をタッチパネル２２に表示させる（Ｓ３３６）。
【００５９】
以上説明したように、本開示の第１の実施形態によれば、複数のタグ情報を同時に出力することにより、ユーザは、カクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を迅速に絞り込むことが可能となる。
【００６０】
＜＜３．第２の実施形態＞＞
続いて、本開示の第２の実施形態を説明する。本開示の第２の実施形態は、音声出力をスピーカ２４でなく装着型の音声出力装置から行う点で第１の実施形態と異なる。以下、このような本開示の第２の実施形態について詳細に説明する。
【００６１】
図１２は、本開示の第２の実施形態による携帯端末２０−２および音声出力装置３０を示した説明図である。図１２に示したように、第２の実施形態による携帯端末２０−２は、音声出力装置３０に音声信号を送信し、音声出力装置３０が、携帯端末２０−２から受信した音声信号をステレオ音声で出力する。
【００６２】
なお、図１２においては携帯端末２０−２と音声出力装置３０が近接無線通信により接続される例を示しているが、携帯端末２０−２と音声出力装置３０は有線により接続されてもよい。また、図１２においては装着型の音声出力装置３０の一例としてヘッドホンを示しているが、音声出力装置３０は、ヘッドホンに限定されず、例えばイヤホンであってもよい。
【００６３】
（第２の実施形態による携帯端末の構成）
続いて、図１３を参照し、第２の実施形態による携帯端末２０−２の構成を説明する。図１３は、第２の実施形態による携帯端末２０−２の構成を示した機能ブロック図である。図１３に示したように、第２の実施形態による携帯端末２０−２は、タッチパネル２２と、ＧＰＳ２２０と、加速度センサ２２４と、通信部２２８と、領域設定部２３４と、情報解析部２３６と、音声制御部２４０と、表示制御部２４６と、音源設定部２４８と、音声処理部２５２と、を備える。タッチパネル２２、ＧＰＳ２２０、加速度センサ２２４、通信部２２８、および音声制御部２４０などの構成について第１の実施形態と共通部分が多いので、ここでの詳細な説明を省略する。
【００６４】
領域設定部２３４は、ＧＰＳ２２０から供給される携帯端末２０−１の位置情報、および加速度センサ２２４から得られる測定結果に基づいて、タグ情報の音声出力に関する対象領域を設定する。ここで、第１の実施形態と異なり、ユーザはスピーカ２４を耳にかざす必要が無いので、領域設定部２３４は、携帯端末２０−２の下端部ＬＳでなく、例えば上端部ＵＳが向けられている方向を基準にして対象領域を設定する。
【００６５】
音源設定部２４８は、情報解析部２３６により抽出された複数のタグ情報の各々について仮想的な音源位置（以下、仮想音源位置）を設定する。例えば、音源設定部２４８は、複数のタグ情報の各々に対応付けられている位置を仮想音源位置に設定してもよい。また、音源設定部２４８は、タグ情報に対応付けられている位置と異なる位置を複数のタグ情報の各々の仮想音源位置に設定してもよい。このように、複数のタグ情報の各々に異なる仮想音源位置を設定することにより、カクテルパーティ効果が一層高まることが期待される。
【００６６】
音声処理部２５２は、複数のタグ情報の各々について、音源設定部２４８により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う。この処理はユーザの向きに応じて行われるので、ユーザの向きを検出するためのセンサをユーザが装着してもよいし、携帯端末２０−２の上端部ＵＳの向きをユーザの向きとして扱ってもよい。
【００６７】
近接通信部２５６は、音声処理部２５２により処理された音声信号を音声出力装置３０に送信する。そして、音声出力装置３０は、近接通信部２５６から受信した音声信号をステレオ音声で出力する。
【００６８】
表示制御部２４６は、音声出力装置３０から複数のタグ情報が同時に出力されている間、各タグ情報をタッチパネル２２に表示させる。ここで、表示制御部２４６は、各タグ情報が、図１４に示したように、現在位置を基準とする音源設定部２４８により設定された仮想音源位置に表示されるように表示制御を行ってもよい。かかる構成により、ユーザは、聴覚により知覚されるタグ情報の位置を、視覚を通じても知覚することが可能となる。
【００６９】
＜＜４．携帯端末のハードウェア構成＞＞
以上、本開示の実施形態について詳細に説明した。上述した本開示の実施形態による携帯端末２０による情報処理は、ソフトウェアと携帯端末２０のハードウェアが協働することにより実現される。以下、このような携帯端末２０のハードウェア構成について図１５を参照して説明する。
【００７０】
図１５は、携帯端末２０のハードウェア構成を示した説明図である。図１５に示したように、携帯端末２０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２０２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２０３と、入力装置２０８と、出力装置２１０と、ストレージ装置２１１と、ドライブ２１２と、撮像装置２１３と、通信装置２１５とを備える。
【００７１】
ＣＰＵ２０１は、演算処理装置および制御装置として機能し、各種プログラムに従って携帯端末２０内の動作全般を制御する。また、ＣＰＵ２０１は、マイクロプロセッサであってもよい。ＲＯＭ２０２は、ＣＰＵ２０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ２０３は、ＣＰＵ２０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはＣＰＵバスなどから構成されるホストバスにより相互に接続されている。
【００７２】
入力装置２０８は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ２０１に出力する入力制御回路などから構成されている。携帯端末２０のユーザは、該入力装置２０８を操作することにより、携帯端末２０に対して各種のデータを入力したり処理動作を指示したりすることができる。
【００７３】
出力装置２１０は、例えば、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）装置およびランプなどの表示装置を含む。さらに、出力装置２１０は、スピーカおよびヘッドホンなどの音声出力装置を含む。例えば、表示装置は、撮像された画像や生成された画像などを表示する。一方、音声出力装置は、音声データ等を音声に変換して出力する。
【００７４】
ストレージ装置２１１は、本実施形態にかかる携帯端末２０の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置２１１は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。このストレージ装置２１１は、ＣＰＵ２０１が実行するプログラムや各種データを格納する。
【００７５】
ドライブ２１２は、記憶媒体用リーダライタであり、携帯端末２０に内蔵、あるいは外付けされる。ドライブ２１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体２３に記録されている情報を読み出して、ＲＡＭ２０３に出力する。また、ドライブ２１２は、リムーバブル記憶媒体２３に情報を書き込むこともできる。
【００７６】
撮像装置２１３は、光を集光する撮影レンズおよびズームレンズなどの撮像光学系、およびＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）またはＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）などの信号変換素子を備える。撮像光学系は、被写体から発せられる光を集光して信号変換部に被写体像を形成し、信号変換素子は、形成された被写体像を電気的な画像信号に変換する。
【００７７】
通信装置２１５は、例えば、通信網１２に接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置２１５は、無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）対応通信装置であっても、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
【００７８】
＜＜５．むすび＞＞
以上説明したように、本開示の実施形態によれば、複数のタグ情報を同時に出力することにより、ユーザは、カクテルパーティ効果に基づいて興味のあるタグ情報を含む母集団を迅速に絞り込むことが可能となる。その後、ユーザは、視覚または聴覚を通じて興味のあるタグ情報を当該母集団から特定し、興味のあるタグ情報の詳細情報を得ることが可能となる。
【００７９】
また、本開示によれば、タグ情報が一般ユーザにより現在位置と対応付けて提供される情報である場合、ユーザは、タグ情報が出力される音量に基づいて、一般ユーザとの距離感を把握することができる。また、本開示のタグ情報を、相手の位置情報と対応付けられたメールやチャットなどに適用すれば、相手の方向や距離を把握することが可能となる。
【００８０】
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【００８１】
例えば、本明細書の携帯端末２０の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、携帯端末２０の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
【００８２】
また、携帯端末２０に内蔵されるＣＰＵ２０１、ＲＯＭ２０２およびＲＡＭ２０３などのハードウェアを、上述した携帯端末２０の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。
【００８３】
また、以下のような構成も本開示の技術的範囲に属する。
（１）
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
を備える、音声制御装置。
（２）
前記音声制御部は、前記複数の情報が異なる音特性で出力されるように音声制御を行う、前記（１）に記載の音声制御装置。
（３）
前記音声制御部は、前記複数の情報が同時に出力されるように音声制御を行う第１の形態と、前記複数の情報の各々が順次に出力されるように制御を行う第２の形態とで音声制御を切り替える、前記（１）または（２）に記載の音声制御装置。
（４）
前記第２の形態において第１のユーザ操作が行われると、前記第１のユーザ操作が行われた際に音声出力された情報と対応付けられている位置を示す表示を制御する表示制御部と、
をさらに備える、前記（３）に記載の音声制御装置。
（５）
前記音声制御部は、前記第２の形態において、第２のユーザ操作に応じて音声出力の対象情報を切り替える、前記（３）または（４）に記載の音声制御装置。
（６）
前記音声制御部は、前記複数の情報のうちで、前記音声制御装置に近い位置と対応付けられている情報ほど大きな音量で出力されるように音声制御を行う、前記（２）に記載の音声制御装置。
（７）
前記音声制御部は、前記複数の情報の各々の音声出力を異なる周波数または音質で制御する、前記（２）または（６）に記載の音声制御装置。
（８）
前記情報取得部は、前記音声制御装置の特定の部位が向けられている方向を基準とする領域内の位置と対応付けられている情報を取得する、前記（１）〜（７）のいずれか一項に記載の音声制御装置。
（９）
前記領域内の位置と対応付けられている情報の数が下限値以上、上限値未満、または所定数となるように前記領域を設定する領域設定部をさらに備える、前記（８）に記載の音声制御装置。
（１０）
前記音声制御部は、前記複数の情報に含まれるキーワードの出力タイミングが分散するように音声制御を行う、前記（１）〜（９）のいずれか一項に記載の音声制御装置。
（１１）
前記音声制御部は、ステレオ音声を出力する装着型の音声出力装置からの音声出力を制御し、
前記音声制御装置は、
前記複数の情報の各々について仮想音源位置を設定する音源設定部と、
前記複数の情報の各々について、前記音源設定部により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う音声処理部と、
をさらに備える、前記（１）〜（１０）のいずれか一項に記載の音声制御装置。
（１２）
前記音源設定部は、前記複数の情報の各々に対応付けられている位置を前記複数の情報の各々の仮想音源位置に設定する、前記（１１）に記載の音声制御装置。
（１３）
前記音源設定部は、前記複数の情報の各々の仮想音源位置を異なる位置に設定する、前記（１１）に記載の音声制御装置。
（１４）
表示画面において、前記複数の情報の各表示が、前記音源設定部により設定された仮想音源位置に応じた位置に配置されるように表示を制御する表示制御部をさらに備える、前記（１１）〜（１３）のいずれか一項に記載の音声制御装置。
（１５）
周囲の位置と対応付けられている情報を取得するステップと、
複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、
を含む、音声制御方法。
（１６）
コンピュータを、
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
として機能させるための、プログラム。
【符号の説明】
【００８４】
１０ＡＲサーバ
２０携帯端末
２２タッチパネル
２４スピーカ
２６マイクロフォン
３０音声出力装置
２２０ＧＰＳ
２２４加速度センサ
２２８通信部
２３２、２３４領域設定部
２３６情報解析部
２４０音声制御部
２４４、２４６表示制御部
２４８音源設定部
２５２音声処理部
２５６近接通信部

【特許請求の範囲】
【請求項１】
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
を備える、音声制御装置。
【請求項２】
前記音声制御部は、前記複数の情報が異なる音特性で出力されるように音声制御を行う、請求項１に記載の音声制御装置。
【請求項３】
前記音声制御部は、前記複数の情報が同時に出力されるように音声制御を行う第１の形態と、前記複数の情報の各々が順次に出力されるように制御を行う第２の形態とで音声制御を切り替える、請求項１に記載の音声制御装置。
【請求項４】
前記第２の形態において第１のユーザ操作が行われると、前記第１のユーザ操作が行われた際に音声出力された情報と対応付けられている位置を示す表示を制御する表示制御部と、
をさらに備える、請求項３に記載の音声制御装置。
【請求項５】
前記音声制御部は、前記第２の形態において、第２のユーザ操作に応じて音声出力の対象情報を切り替える、請求項３に記載の音声制御装置。
【請求項６】
前記音声制御部は、前記複数の情報のうちで、前記音声制御装置に近い位置と対応付けられている情報ほど大きな音量で出力されるように音声制御を行う、請求項２に記載の音声制御装置。
【請求項７】
前記音声制御部は、前記複数の情報の各々の音声出力を異なる周波数または音質で制御する、請求項２に記載の音声制御装置。
【請求項８】
前記情報取得部は、前記音声制御装置の特定の部位が向けられている方向を基準とする領域内の位置と対応付けられている情報を取得する、請求項１に記載の音声制御装置。
【請求項９】
前記領域内の位置と対応付けられている情報の数が下限値以上、上限値未満、または所定数となるように前記領域を設定する領域設定部をさらに備える、請求項８に記載の音声制御装置。
【請求項１０】
前記音声制御部は、前記複数の情報に含まれるキーワードの出力タイミングが分散するように音声制御を行う、請求項１に記載の音声制御装置。
【請求項１１】
前記音声制御部は、ステレオ音声を出力する装着型の音声出力装置からの音声出力を制御し、
前記音声制御装置は、
前記複数の情報の各々について仮想音源位置を設定する音源設定部と、
前記複数の情報の各々について、前記音源設定部により設定された仮想音源位置が音源位置としてユーザに知覚されるように音声処理を行う音声処理部と、
をさらに備える、請求項１に記載の音声制御装置。
【請求項１２】
前記音源設定部は、前記複数の情報の各々に対応付けられている位置を前記複数の情報の各々の仮想音源位置に設定する、請求項１１に記載の音声制御装置。
【請求項１３】
前記音源設定部は、前記複数の情報の各々の仮想音源位置を異なる位置に設定する、請求項１１に記載の音声制御装置。
【請求項１４】
表示画面において、前記複数の情報の各表示が、前記音源設定部により設定された仮想音源位置に応じた位置に配置されるように表示を制御する表示制御部をさらに備える、請求項１１に記載の音声制御装置。
【請求項１５】
周囲の位置と対応付けられている情報を取得するステップと、
複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行うステップと、
を含む、音声制御方法。
【請求項１６】
コンピュータを、
周囲の位置と対応付けられている情報を取得する情報取得部と、
前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、
として機能させるための、プログラム。

【図１】