説明

情報処理装置および情報処理方法

【課題】音楽を鑑賞中に別の情報の報知音を聞くのは煩わしい。
【解決手段】ユーザ端末12aにおいて、再生部30は、ユーザが選択入力を行った音楽ファイルを、音楽ファイル記憶部28から読み出して再生する。通常の再生では出力部34が当該再生音を音響として出力する。報知情報受信部19がネットワーク16から報知の必要な電子メールや電話着信などの情報を受信したら、報知情報解析部20はその情報や報知音の設定を解析し、重要度を判定する。周波数帯域割り当て部24は、割り当て情報記憶部22に格納された周波数帯域の割り当てパターンから、重要度および報知音の周波数帯域に基づき、報知音および音楽のそれぞれに対し一のパターンを選択する。音声処理部32は音楽および報知音に割り当てられた周波数帯域の成分を抽出して合成し、出力部34が出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理技術に関し、特に音声信号を再生する機能を含む情報処理装置、およびそれに適用される情報処理方法に関する。
【背景技術】
【0002】
近年、音声信号の圧縮率の向上、メモリ容量の増大、ネットワーク環境の充実化などによって、音楽データを携帯し、様々な場所で鑑賞することが増えてきた。また、1セグメント部分受信サービスの普及に伴い、テレビ番組を移動端末で視聴することも一般化しつつある。このようにいかなる環境にあっても、音声は常に身近に存在する。その一方で、電子メールを受信した情報端末や、ユーザが選択した処理を終了した家電製品などは、それを知らせる報知音を発するのが一般的になっている。このように現代の一般的な生活では、ユーザの好むと好まざるとに関わらず、電子機器が発する音声、報知音など、音を聴く機会が非常に多くなっている。
【発明の開示】
【発明が解決しようとする課題】
【0003】
例えば携帯電話で音楽を鑑賞している際に電話や電子メールが着信した場合、一般的には着信を知らせる報知音を、音楽に重ねて出力する。しかし音楽が大きなボリュームで再生されている場合は、報知音を聞き逃してしまう場合がある。それを防ぐために、報知音を鳴らす間は音楽を一時停止することも考えられるが、他所より突然入った電話や電子メールのために音楽が中断されてしまうことは煩わしく感じられる場合も多い。このように、報知音は突然、ユーザの意図とは関係なく発生されることが多いため、音声を含むコンテンツ、すなわち音楽、テレビ番組、ラジオ番組などを鑑賞中に別の音が重なる、といった状況は好ましいものではなかった。
【0004】
本発明はこのような課題に鑑みてなされたものであり、その目的は、音声を含むコンテンツを再生中に、報知音を確実かつ適度に聞かせる技術を提供することにある。
【課題を解決するための手段】
【0005】
本発明のある態様は情報処理装置に関する。この情報処理装置は、コンテンツに含まれる音声信号を再生する再生部と、所定の情報をユーザに報知するための報知音を発生させる報知音発生部と、再生部が音声信号を再生中、報知音を発生させる必要性が生じた際、再生中の音声信号と、報知音のそれぞれに対して異なるパターンで周波数帯域を割り当てる周波数帯域割り当て部と、周波数帯域割り当て部が割り当てた周波数帯域のパターンで、再生部が再生した音声信号と、報知音発生部が発生させた報知音のそれぞれから、割り当てた周波数帯域成分を抽出して合成する音声処理部と、音声処理部が合成した音声信号を音響として出力する出力部と、を備えたことを特徴とする。
【0006】
ここで「パターン」とは、可聴周波数帯域内で割り当てる帯域と割り当てない帯域の幅および周波数帯のバリエーションをいう。割り当てる領域と割り当てない領域はそれぞれ、可聴周波数帯域内に複数あってもよい。
【0007】
本発明の別の態様は情報処理方法に関する。この情報処理方法は、コンテンツに含まれる音声信号をメモリより読み出し再生するステップと、音声信号を再生中、所定の情報をユーザに報知するための報知音を発生させる必要性が生じた際、再生中の音声信号と、報知音のそれぞれに対して異なるパターンで周波数帯域を割り当てるステップと、報知音を発生させるステップと、割り当てた周波数帯域のパターンで、再生した音声信号と、発生させた報知音のそれぞれから、割り当てた周波数帯域成分を抽出して合成するステップと、合成した音声信号を音響として出力するステップと、を含むことを特徴とする。
【0008】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0009】
本発明によれば、コンテンツの音声を邪魔することなく報知の本来の目的にかなった報知音を聴かせることができる。
【発明を実施するための最良の形態】
【0010】
図1は本実施の形態を適用できるシステムの構成例を示している。情報受信システム10は、複数のユーザ端末12a、12b、・・・、12nとメールサーバ14がネットワーク16を介して接続する態様を有する。ユーザ端末12a、12b、・・・、12nは例えば携帯電話、携帯オーディオ再生装置、携帯情報端末、複数の電子機器の音声信号を集中管理する装置などのいずれでもよく、音声を含む主たる情報を出力している間に、別の情報についてユーザに報知することのできる機能を含む。
【0011】
このような環境においてユーザ端末12aは、音楽鑑賞、テレビ番組視聴などのために、音声を出力する機能を有する。またユーザ端末12aは、ネットワーク16を介して他のユーザ端末12b、12nなどから送信された電子メールをサーバ14を介して受信する機能も有する。電子メールを受信した際、ユーザ端末12aは報知音を発生させてユーザに着信を知らせる。
【0012】
ユーザ端末12aは、電子メールの他、ネットワーク16を介して様々な情報を取得し、所定のタイミングで報知音を発生させてよい。例えば電話着信、ホームセキュリティシステムからの自宅の異常の報知、自宅の電化製品や電子機器からの通知、株の取引に係る情報の通知など、ユーザ端末12aを操作するユーザが加入するサービスや各電子機器の機能に応じてユーザ端末12aは報知音を発生させる。また、報知元はネットワーク16を介さず、ユーザ端末12a自身であってもよい。スケジュール管理の機能におけるアラートやタイマーがこれにあたる。以下の説明では、報知元の情報はネットワーク16を介して受信されるとする。
【0013】
本実施の形態では、このような環境においてユーザがユーザ端末12aを用いて音楽やテレビ番組などで音声を聴いている状況において、報知音を発生させる必要性が発生した際の処理について述べる。このとき、音楽に浸る気分を損ねたり、大事な会話を聞き逃したりすることなく、逆に音楽にかき消されたりすることなく確実に重要な報知を行うことを可能にする。具体的には、音楽および報知音にそれぞれ所定の周波数帯域割り当て、両方を混合して出力することにより、音楽と報知音の両方を聴くことができるようにする。なお以下の説明において音声データは音楽データとするが、それに限る趣旨ではなく、落語や会議などにおける人声、環境音、放送波に含まれる音声など、音声信号のデータであればよく、それらが混合していてもよい。
【0014】
図2はユーザ端末12aの詳細な構成を示している。ユーザ端末12aは、ネットワーク16を介して電子メールなど報知の必要な情報を受信する報知情報受信部19、報知情報を解析する報知情報解析部20、解析された報知情報に基づき音楽および報知音を所定の周波数帯域に割り当てる周波数帯域割り当て部24、および周波数帯域の割り当てパターンを決定するための情報を格納する割り当て情報記憶部22を含む。
【0015】
ユーザ端末12aはさらに、ユーザ端末12aで再生できる音楽ファイルを格納する音楽ファイル記憶部28、ユーザによる音楽の選択入力を受け付ける入力部29、ユーザが選択した音楽ファイルを再生する再生部30、本来の報知音を発生させる報知音発生部26、音楽および報知音の音声信号のうち、それぞれに割り当てられた周波数帯域の成分を抽出したうえで混合する音声処理部32、および混合された音声、あるいは再生された音楽を音響として出力する出力部34を含む。
【0016】
図2において、さまざまな処理を行う機能ブロックとして記載される各要素は、ハードウェア的には、CPU(Central Processing Unit)、メモリ、その他のLSIで構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
【0017】
入力部29、音楽ファイル記憶部28、再生部30は、一般的な音楽再生装置に設けられている入力装置、記憶装置および再生装置と同じ構成でよい。すなわち、MP3などの一般的な符号化形式によって符号化されている音楽ファイルを音楽ファイル記憶部28に記憶させておき、ユーザが入力部29から選択入力を行うことにより、そのうちの一つのファイルが再生部30に送られ、復号される。従って入力部29は、一般的な電子機器が有するキーボード、タッチパネル、ボタンなどの少なくともいずれかを備え、さらに再生する音楽を選択するための選択画面を表示する表示装置を含んでもよい。再生装置30は、音楽ファイルの符号化形式に則り、一般的な手法で復号して音声信号を生成する。
【0018】
なお報知音を発生させる必要がない状態では、再生部30が再生した音声信号は、後に述べる音声処理部32の周波数帯域抽出処理を受けずに出力部34から音響信号として出力される。したがって出力部34は、内蔵スピーカや外部に接続したスピーカ、イヤホンなど一般的な電子機器で用いられる音響出力装置で構成してよい。
【0019】
報知情報受信部19は、ネットワーク16を介して報知を必要とする情報を受信する。報知を必要とする情報は上述のとおり、ユーザ端末12aを利用して実現することのできる機能やユーザがネットワークを利用して享受するサービスによって様々である。受信する情報には、報知音がどのような音であるかの情報が付加されている。あるいは、ユーザ端末12aにおいて、情報の種類ごとに報知音の設定が保持されている。当該設定はユーザが行ったものでもよい。
【0020】
報知音発生部26は、報知情報受信部19が受信した情報に対しあらかじめ設定されている報知音を発生させる。なお受信した際に、再生部30において音楽が再生されていなければ、報知情報解析部20、周波数帯域割り当て部24、および音声処理部34の処理は行わなくてよく、報知音発生部26が発生させた音をそのまま出力部34から音響信号として出力してよい。したがって報知音発生部26は、一般的な電子機器で用いられる報知音発生装置で構成してよい。
【0021】
報知情報解析部20は、報知情報受信部19から報知を必要とする情報を受信すると、その情報を解析する。解析対象は、例えば当該情報を報知するために設定された報知音の周波数帯域や、音の特徴、あるいは、情報本体である電子メールのヘッダ、題名、メール本文などであり、解析内容はあらかじめ設定しておく。報知情報解析部20は、当該解析結果に基づき、割り当て情報記憶部22に格納しておいた重要度判定テーブルと照らし合わせ、受信した情報の重要度を判定する。
【0022】
周波数帯域割り当て部24は、報知情報解析部20が決定した、受信した情報の重要度に基づき、報知音および再生中の音楽のそれぞれに対し、割り当てる周波数帯域の幅を定めるフォーカス値を決定する。そして報知音および音楽に対し最終的に割り当てる周波数帯域のパターンを決定する。フォーカス値、および周波数帯域の割り当てパターンについては後に詳述する。音声処理部32は、周波数帯域割り当て部24が決定した割り当てパターンに基づき、報知音および音楽の周波数帯のうち、それぞれに割り当てた周波数帯域のみを抽出し合成する。出力部34は、合成された報知音および音楽を音響として出力する。
【0023】
次に、音楽および報知音という2つの音に対し周波数帯域を割り当てる態様について説明する。人間は、耳における音の感知と、脳における音の解析との2段階によって音を認識する。人間が異なる音源から同時に発せられた音を聞き分けるには、この2段階のいずれかまたは双方において別の音源であることを表す情報、すなわち分離情報を取得できればよい。例えば右耳と左耳とで異なる音を聴くことは、内耳レベルで分離情報を得たことになり、脳において別の音として解析され認識できる。最初から混合されている音の場合は、音脈や音色の違いなどを、これまでの生活で学習し記憶された分離情報と照らして解析することにより、脳レベルで分離することが可能である。
【0024】
複数の音を混合して1組のスピーカやイヤホンなどから聴く場合は、本来、内耳レベルでの分離情報が得られないため、上述のように音脈や音色の違いなどを頼りに脳で別の音であることを認識することになるが、そのようにして聞き分けることのできる音は限定的である。そこで、最終的に混合しても分離して認識できる音声信号を生成するために、複数の音源のそれぞれに周波数帯域を割り当て、内耳に働きかけを行う分離情報を音声信号に人工的に付加する。
【0025】
図3は、周波数帯域の割り当てについて説明するための図である。図の横軸は周波数であり周波数f0からf8までを可聴帯域とする。同図では音a、音bの2つの音声信号を混合して聴く場合について示している。本実施の形態では、可聴帯域を複数のブロックに分割し、各ブロックを複数の音声信号の少なくともいずれかに割り当てる。そして各音声信号から、割り当てられたブロックに属する周波数成分のみを抽出する。
【0026】
図3では、可聴帯域をf1、f2、・・・、f7の周波数で8つのブロックに分割している。そして例えば斜線にて示すように、音aに対し周波数f1〜f2、f3〜f4、f5〜f6、f7〜f8の4つのブロックを、音bに対し周波数f0〜f1、f2〜f3、f4〜f5、f6〜f7の4つのブロックを割り当てる。ここでブロックの境界となる周波数f1、f2、・・・、f7を、例えばBarkの24臨界帯域の境界周波数のいずれかとすることにより、周波数帯域分割の効果をより発揮することができる。
【0027】
臨界帯域とは、ある周波数帯域を有する音が、それ以上帯域幅を広げても他の音に対するマスキング量が増加しなくなる周波数帯域のことである。ここでマスキングとはある音に対する最小可聴値が他の音の存在によって上昇する現象、すなわち聴きづらくなる現象であり、マスキング量はその最小可聴値の上昇量である。すなわち、異なる臨界帯域にある音どうしは互いにマスキングされにくい。実験によって判明したBarkの24個の臨界帯域を利用して周波数帯域を分割することにより、例えば周波数f1〜f2のブロックに属する音aの周波数成分が、周波数f2〜f3のブロックに属する音bの周波数成分をマスキングするなどの影響を抑えることができる。他のブロックについても同様であり、結果として、音aと音bは互いに打ち消しあうことの少ない音声信号となる。
【0028】
なお、ブロックへの分割は臨界帯域によらなくてもよい。いずれの場合でも、重複する周波数帯域を少なくすることにより、内耳の周波数分解能を利用して分離情報を与えることができる。また図3に示した例では、各ブロックが同程度の帯域幅を有しているが、実際には周波数帯によって変化させてもよい。例えば臨界帯域2つ分を1つのブロックとする帯域と4つ分を1つのブロックとする帯域があってもよい。ブロックへの分割の仕方は、例えば低域の周波数を有する音はマスキングされにくい、などの一般的な音の特性を考慮して決定してもよい。
【0029】
また本実施の形態では、音楽を聴いている状態を継続しつつ報知音を確実に聴かせる、という特徴を有するため、元の報知音が狭い周波数帯にある音であれば、報知音に対し当該周波数帯を優先して割り当てることにより、報知音が元々存在しない周波数帯域を報知音に割り当ててしまう、という状況がないようにする。そのため報知情報解析部20は、報知音の元の周波数帯域に係る情報も周波数帯域割り当て部24に送信する。
【0030】
一方、音楽は、周波数帯域の割り当てに際し、特徴的な周波数帯域を考慮してもよい。ここで特徴的な周波数帯域とは、例えば、主旋律が占める周波数帯域など曲の表現上、重要となる周波数帯域である。割り当てるべき周波数帯域が報知音と重なると予想される場合は、報知音を優先させるほかに、その帯域をさらに細かく分割して均等に割り当ててもよい。また図3に示した例では、一連のブロックを交互に音a、音bに割り当てたが、連続した2つのブロックを音aに割り当てるなど、割り当て方はこれに限らない。
【0031】
図4は音声処理部32の詳細な構成を示している。音声処理部32は、第1周波数帯域抽出部40、第2周波数帯域抽出部42、および合成部44を含む。第1周波数帯域抽出部40および第2周波数帯域抽出部42はそれぞれ、報知音発生部26および再生部30から入力された報知音および音楽の音声信号から、それぞれに割り当てた周波数帯域の成分を抽出する。第1周波数帯域抽出部40および第2周波数帯域抽出部42には、周波数帯域割り当て部24から入力された、報知音および音楽のそれぞれに対して割り当てる周波数帯域のブロックの情報、すなわち割り当てパターンの情報を設定しておく。第1周波数帯域抽出部40および第2周波数帯域抽出部42で抽出された音声信号成分は、合成部44において合成され出力される。
【0032】
図5は、第1周波数帯域抽出部40の詳細な構成を示している。なお第2周波数帯域抽出部42も同様の構成としてよく、周波数帯域の割り当てパターンを替えることによりそのまま適用できる。第1周波数帯域抽出部40は、フィルタバンク50および振幅調整部52および合成部54を含む。フィルタバンク50は、入力された報知音の音声信号を、図3で示したような周波数帯域のブロック(図3の例では8個のブロック)に分離する。N個のブロックに分離する場合、フィルタバンク50はN個のバンドパスフィルタで構成する。各バンドパスフィルタには、抽出する各ブロックの周波数帯域の情報をあらかじめ設定しておく。
【0033】
振幅調整部52は、フィルタバンク50の各バンドパスフィルタが出力したブロックごとの音声信号を、あらかじめ設定された振幅にする。すなわち、割り当てられていない周波数帯域のブロックについては振幅を0とし、割り当てられている周波数帯域のブロックをそのままの振幅にする。合成部54は、振幅調整が施された各ブロックの音声信号を合成して出力する。このような構成により、報知音および音楽のそれぞれに割り当てられた周波数帯域成分のみを抽出した音声信号を取得することができる。周波数帯域割り当て部24は、割り当てパターンに応じて、N個のブロックに対しNビットの選択/非選択の情報を入力し、振幅調整部52のN個の振幅調整回路のそれぞれは、対応するビットの情報を参照し、非選択の振幅調性回路が振幅を0にする調整を行えばよい。
【0034】
次に周波数帯域割り当て部24が行う、周波数帯域の割り当て方について説明する。図3では複数の音声信号を分離して認識させる手法を説明するため、「音a」と「音b」とでほぼ均等に周波数帯域のブロックの割り当てを行った。一方、ブロックを割り当てる数に大小をつけることにより、同時に聴かせる音のそれぞれの聞こえ方をさらに調整することができる。図6はブロックの割り当てパターンの例を模式的に示している。
【0035】
同図は、可聴帯域を7個のブロックに分割した場合について示している。図3と同様、横軸に周波数をとり、説明の便宜上、低域側のブロックからブロック1、ブロック2、・・・、ブロック7とする。まず「パターン群A」と記載された上から3つの割り当てパターンに着目する。これらのパターンのうち、最上段のパターンは最も割り当てられるブロックの数が大きいため、最も聞こえやすい。下の段に行くほど割り当てる数が減少するため、音の聞こえやすさが減少していく。ここで、割り当てるブロック数で決定される聞こえやすさの度合いを「フォーカス値」と呼ぶ。同図では、各割り当てパターンの左側に、フォーカス値として与えられる数値が例示されている。
【0036】
ある音声信号の聞こえやすさの度合いを最高とする場合、すなわち他の音声信号と比較し最も聞き取り易くする場合、フォーカス値が1.0の割り当てパターンを当該音声信号に適用する。同図の「パターン群A」では、ブロック2、ブロック3、ブロック5、およびブロック6の4つのブロックが同じ音声信号に割り当てられる。
【0037】
ここで同じ音声信号の聞こえやすさの度合いを少し低下させる場合、割り当てパターンを例えばフォーカス値が0.5の割り当てパターンに変更する。同図の「パターン群A」では、ブロック1、ブロック2、ブロック3の3つのブロックが割り当てられる。同様に同じ音声信号の聞こえやすさの度合いを最低としたい場合、すなわち聞き取れる範囲で最も目立たなくする場合は、割り当てパターンを、フォーカス値が0.1の割り当てパターンに変更する。同図の「パターン群A」では、ブロック1の1つのブロックが割り当てられる。本実施の形態では、後に述べるように、報知情報受信部19が受信した、報知を必要とする情報の重要度によって、報知音および音楽のフォーカス値を相対的に変化させる。
【0038】
同図に示すとおり、強調の度合いが最高である、フォーカス値が1.0の音声信号に対しても、全てのブロックを割り当ててしまわないようにすることが望ましい。同図ではブロック1、ブロック4、およびブロック7が割り当てられていない。これは、例えばブロック1をフォーカス1.0の音声信号にも割り当ててしまうと、ブロック1のみを割り当てられたフォーカス値0.1の別の音声信号の周波数成分をマスキングしてしまう可能性があるためである。本実施の形態では、複数の音声信号を分離して聴かせつつ、フォーカス値が低くても聞き取りが可能となることが望ましい。そのため、フォーカス値が低い音声信号に割り当てられたブロックは、フォーカス値が高い音声信号には割り当てないようにする。
【0039】
以上の説明は「パターン群A」に着目して行ったが、「パターン群B」、「パターン群C」のように、同じフォーカス値でも様々な割り当てパターンが存在する。周波数帯域割り当て部24は、報知情報解析部20から、報知音の周波数帯域についての情報を取得すると、最低のフォーカス値であっても、報知音の周波数帯域とかけ離れた帯域を割り当てないように、好ましくは報知音の周波数帯域は報知音に割り当てられるように、あらかじめ割り当て情報記憶部22に用意しておいた割り当てパターン群から最適なものを決定する。
【0040】
音楽についても同様に、最低のフォーカス値でも、特徴的な周波数帯域が可能な限り抽出されるように、割り当て情報記憶部22に用意しておいた割り当てパターン群から最適なものを選択する。音楽の特徴的な周波数帯域は、音楽ファイルとともに音楽ファイル記憶部28に格納されたメタデータなどから取得する。このとき、特徴的な周波数帯域についての直接的な情報を取得してもよいし、ジャンルや楽器名、女声か男声か、などの一般的な書誌情報から、推奨されるパターン群を導出するルールをあらかじめ割り当て情報記憶部22に設定しておいてもよい。なおいずれのパターン群においても、フォーカス値0.1で割り当てられるブロックは、フォーカス値1.0では割り当てられないブロックである。この理由は既に述べたとおりである。
【0041】
ここで割り当て情報記憶部22に記憶させておく割り当てパターンは、フォーカス値0.1、0.5、1.0以外のフォーカス値を含んでよい。しかしながらブロックの個数は有限であるため、あらかじめ準備できる割り当てパターンは限られる。そのため割り当て情報記憶部22に記憶されていないフォーカス値の場合は、その前後のフォーカス値で、割り当て情報記憶部22に記憶されている直近のフォーカス値の割り当てパターンを補間することによって割り当てパターンを決定する。補間の方法としては、ブロックをさらに分割して割り当てる周波数帯域を調整したり、あるブロックに属する周波数成分の振幅を調整したりする。
【0042】
次に、報知情報解析部20が行う、受信した情報の重要度の判定について説明する。図7は、割り当て情報記憶部22に格納され、報知情報解析部20が参照する重要度判定テーブルの例を示している。なお同図に示す重要度判定の根拠は、理解を容易にするために概念的に記載しているが、実際には周波数の値や音色の種類、設定されたテキストデータなど、さらに具体的に設定してよい。重要度判定テーブル60は、重要度欄62、報知音欄64、および電子メール・報知内容欄66を含む。
【0043】
報知音欄64および電子メール・報知内容欄66に記載されている内容は、報知情報解析部20が報知音の設定および受信した電子メールや報知の内容を解析した結果、それぞれ得られる特徴を示しており、各特徴を、重要度欄62に示した「大」、「中」、「小」の三段階の重要度で区別している。例えば報知音の設定が、「スイープ音」や「サイレン音」であることが受信した情報から取得できたら、それは重要度を「大」と設定する。この場合は「報知音」を解析対象としているので、受信した情報の種類は問わなくてよい。一方、受信した情報が電子メールである場合、当該電子メールの題名に「緊急」の文字が含まれていたり、顧客など重要な相手からの電子メールである場合、重要度を「大」とする。
【0044】
ここで電子メールの題名は、形態素解析など一般的な文書解析技術で解析することにより、「緊急」など特定の単語を抽出することができる。電子メールの送信元は、ユーザがあらかじめ重要と考える送信元のアドレスを設定しておき、報知情報解析部20が受信した電子メールのヘッダに含まれる送信元アドレスと比較するなどして判断する。また、電子メール以外でも、報知システムからの報知であれば、あらかじめ設定されたアドレスやIDなどで「災害緊急連絡」の報知であることを判断する。電話の送信元も電子メールの送信元と同様である。
【0045】
同様に、報知音の設定が「ビープ音」である場合は重要度を「中」、「メロディ音」である場合は重要度を「小」とする。一方、電子メールの本文を形態素解析した結果、ユーザが設定した定型文が含まれていた場合や、ベイジアンフィルタを用いた解析によりスパムメールであると判定された場合に重要度を「小」とする。電子メール・報知内容で解析する場合、上述した例以外は重要度を「中」とする。なお図7で示したテーブルの内容はあくまで例示であり、受信する情報の種類やユーザの好みなどにより適宜設定を行う。
【0046】
また、報知音欄64および電子メール・報知内容欄66は、報知情報解析部20が受信した情報のうち、設定された報知音、あるいは情報そのものの内容のいずれかを解析して、いずれかの欄を参照し、あてはまる特徴を検索するものであるが、報知音と情報そのものの内容とを組み合わせた条件で重要度を判定するようにしてもよい。
【0047】
重要度判定テーブル60を参照して報知情報解析部20が重要度を判定すると、周波数帯域割り当て部24は、当該情報に基づき、音楽および報知音のフォーカス値を決定する。図8は割り当て情報記憶部22に格納され、周波数帯域割り当て部24が参照するフォーカス値テーブルの例を示している。フォーカス値テーブル70は、重要度欄72、音楽欄74、および報知音76を含む。周波数帯域割り当て部24は、受信した情報の重要度を重要度欄72より検索し、その状況における音楽および報知音のフォーカス値の最適値を、音楽欄74および報知音欄76からそれぞれ取得する。
【0048】
例えば情報の重要度が「大」であると判定されたら、音楽のフォーカス値を「0.1」とし、報知音のフォーカス値を「0.9」とする。すなわち、音楽を少ない周波数帯域で出力して控えめに聴かせるとともに、報知音をより大きな周波数帯域で出力して強調する。同様に重要度が「中」であれば音楽のフォーカス値、報知音のフォーカス値をいずれも「0.5」とする。これは、音楽の周波数帯域をある程度下げ、報知音も同程度の聞き取りやすさで出力する、ということになる。また重要度が「小」であれば、音楽のフォーカス値を「0.9」とし、報知音のフォーカス値を「0.1」とする。これは、音楽の周波数帯域をほとんど変化させずに、報知音を控えめに聞かせる状態である。
【0049】
本実施の形態では、音を単に振幅のみで調整するのではなく、周波数帯で調整し、報知音が有する周波数帯域は優先させるなどの規則のもと、調整を行うため、例えば重要度の小さい情報の場合、聴いている音楽はほぼそのままの状態で、それでも報知音が確実にユーザの耳に届くように聴かせることができる。そのため周波数帯域割り当て部24は、フォーカス値のみならず上述のように周波数帯域の割り当てパターンも、音に合わせて選択する。したがって、重要度が「中」の場合に音楽と報知音のフォーカス値がどちらも「0.5」であっても、互いを打ち消し合うことのない異なるパターン群から割り当てパターンを選択すれば、2つの音を独立して同程度の聞き取りやすさで聴くことができる。
【0050】
なお図8のフォーカス値テーブル70の各欄に記載された値は例示であり、実際の聞きやすさなどを試験したうえで決定してもよい。また同図では、音楽と報知音のフォーカス値は、各重要度において和を1としているが、それに限定する趣旨ではない。
【0051】
次にこれまで述べた構成による動作を説明する。図9はユーザ端末12aが音楽を再生中に、報知の必要な情報を処理する手順を示すフローチャートである。まずユーザが、入力部29に対し、音楽ファイル記憶部28に格納された音楽ファイルからの選択入力を行うと、再生部30は当該ファイルを読み出して再生し、出力部34がその音響を出力する(S10)。報知情報受信部19が、報知の必要な情報を取得しない間は(S12のN)、音楽の通常再生および出力を継続する(S10)。このとき、全周波数帯域が音楽に割り当てられている。
【0052】
報知情報受信部19が、報知の必要な情報を受信したら(S12のY)、報知情報解析部20は、当該情報に含まれる報知音の設定や、情報として受信した電子メールの内容、電話の送信元、情報の種類など所定の情報を取得し、重要度判定テーブル60を参照して当該情報の重要度を判定する(S14)。すると周波数帯域割り当て部24は、重要度に基づきフォーカス値テーブル70を参照し、再生中の音楽および報知音のフォーカス値を決定する(S16)。
【0053】
次に周波数帯域割り当て部24は、割り当て情報記憶部22に格納された、周波数帯域の割り当てパターン群から、音楽および報知音に適した割り当てパターン群を選択し、音声処理部32の2つの周波数帯域抽出部に、選択した割り当てパターン群およびフォーカス値で決定される割り当てパターンの情報をそれぞれ設定する(S18)。音楽の割り当てパターン群は、報知音の有無に関わらず、再生を開始した時点で決定してもよい。あるいは、報知音に適した割り当てパターン群を決定してから、当該パターン群と別のパターン群を音楽に割り当てることにより、報知音の聞こえやすさを優先させるようにしてもよい。
【0054】
一方、報知音発生部26は、受信した情報で設定されている報知音を発生させる(S20)。すると音声処理部32は、設定された割り当てパターンで、報知音および音楽の周波数帯域成分を抽出し、合成する(S22)。そして出力部34が合成された音を出力する(S24)。その後、ユーザが音楽を停止する指示入力を入力部29に対し行った場合は(S26のY)、音に係るそれまでの処理を停止する。この場合、ユーザが電子メールを開く、電話に出るなどの行為を携帯端末12aを用いて行うことが考えられるが同図ではそれらの処理は省略している。
【0055】
ユーザが音楽を停止する指示入力を行わなかった場合は(S26のN)、音楽の通常再生および出力処理が引き続き行われる。設定された報知音が鳴り続ける種類のものであった場合は、S24以後、いずれかの段階でユーザが報知音の停止を指示入力した後、S10の、音楽の通常再生、出力処理に切り替える。このときの通常再生は、報知音を同時に発生させる前の通常再生時と同様、全ての周波数帯域を音楽に割り当てた状態である。なお、S24で合成音を出力する直前まで、S10音楽の通常再生、出力の処理は継続しているものとする。
【0056】
以上述べた本実施の形態によれば、ユーザが端末を用いて音楽、テレビ、ラジオなどを楽しんでいる最中に、報知の必要な情報を受信したら、再生中の音楽および報知音に、それぞれに適した周波数帯域を割り当てて出力することにより同時に聴かせる。このとき割り当てる周波数帯域の少なくとも一部が重ならないようにすることで、音楽を聴きながら報知音を認識することが可能になる。結果として、音楽などを楽しんでいる気分を報知音で害されたり、テレビの音声などで重要な部分を聞き逃したりすることなく、報知があったことも同時に認識できる。また、報知音によって音楽を一時停止したりすることもないため、音楽の連続性も保たれる。
【0057】
周波数帯域の割り当てには、報知音が有する周波数帯域を設定から確認し、報知音には含まれない周波数帯域を報知音に割り当てないようにする。これにより、抽出した周波数帯域成分に報知音が含まれていなかったり、音楽にかき消されてしまったりすることが少なくなる。
【0058】
また報知音の元となる、受信した情報を解析し、その重要度を判定する。そしてその重要度に基づき、割り当てる周波数帯域のブロックの数を、音楽と報知音で相対的に調整する。これにより、緊急に対処しなければならない情報、重要であるが緊急でない情報、それほど重要でなく緊急でもない情報、などの場合分けを、報知音のみで判断することができる。このとき、報知音の周波数帯域のみならず、音楽の周波数帯域も調整することにより、ロックなどの激しい曲を聴いているときでも、バラードなど静かな曲を聴いているときでも、ほぼ同じ条件で報知音の重要性を認識することができ、報知音に音楽がかぶさり聞こえづらかったため重要と思わなかった、といった過誤の発生を防止することができる。
【0059】
以上、本発明を実施の形態をもとに説明した。上記実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【図面の簡単な説明】
【0060】
【図1】本実施の形態を適用できるシステムの構成例を示す図である。
【図2】本実施の形態におけるユーザ端末の詳細な構成を示す図である。
【図3】本実施の形態における周波数帯域の割り当てについて説明するための図である。
【図4】本実施の形態における音声処理部の詳細な構成を示す図である。
【図5】本実施の形態における第1周波数帯域抽出部の詳細な構成を示す図である。
【図6】本実施の形態においてブロックの割り当て方のパターンを模式的に示す図である。
【図7】本実施の形態において割り当て情報記憶部に格納される重要度判定テーブルの例を示す図である。
【図8】本実施の形態において割り当て情報記憶部に格納されるフォーカス値テーブルの例を示す図である。
【図9】本実施の形態にいてユーザ端末が音楽を再生中に報知の必要な情報を処理する手順を示すフローチャートである。
【符号の説明】
【0061】
1 情報受信システム、 12a ユーザ端末、 19 報知情報受信部、 20 報知情報解析部、 22 割り当て情報記憶部、 24 周波数帯域割り当て部、 26 報知音発生部、 28 音楽ファイル記憶部、 29 入力部、 30 再生部、 32 音声処理部、 34 出力部、 40 第1周波数帯域抽出部、 42 第2周波数帯域抽出部、 50 フィルタバンク、 52 振幅調整部。

【特許請求の範囲】
【請求項1】
コンテンツに含まれる音声信号を再生する再生部と、
所定の情報をユーザに報知するための報知音を発生させる報知音発生部と、
前記再生部が音声信号を再生中、前記報知音を発生させる必要性が生じた際、再生中の音声信号と、前記報知音のそれぞれに対して異なるパターンで周波数帯域を割り当てる周波数帯域割り当て部と、
前記周波数帯域割り当て部が割り当てた周波数帯域のパターンで、前記再生部が再生した音声信号と、前記報知音発生部が発生させた報知音のそれぞれから、割り当てた周波数帯域成分を抽出して合成する音声処理部と、
前記音声処理部が合成した音声信号を音響として出力する出力部と、
を備えたことを特徴とする情報処理装置。
【請求項2】
前記報知音発生部が発生させる報知音の周波数帯域を特定する報知情報解析部をさらに備え、
前記周波数帯域割り当て部は、前記報知情報解析部が特定した報知音の周波数帯域を、報知音に優先的に割り当てることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
ネットワークを介して接続されたサーバから、報知の必要な情報を受信する報知情報受信部をさらに備え、
前記報知音発生部は、前記報知情報受信部が報知の必要な情報を受信することにより、当該情報にて設定された報知音を発生させることを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記報知情報受信部が受信した情報を解析し、あらかじめ定められた、情報の重要度を決定づける条件と照合することにより、前記受信した情報の重要度を判定する報知情報解析部をさらに備え、
前記周波数帯域割り当て部は、前記報知情報解析部が判定した重要度に応じて、前記再生中の音声信号と、前記報知音に割り当てる周波数帯域の総帯域幅を調整することを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記周波数帯域割り当て部は、前記重要度が高いほど、前記報知音に割り当てる周波数帯域の総帯域幅を大きくし、前記再生中の音声信号に割り当てる周波数帯域の総帯域幅を小さくすることを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記重要度を決定づける条件は、前記受信した情報にて設定された報知音の音の種類によって重要度を決定づけることを特徴とする請求項4に記載の情報処理装置。
【請求項7】
前記重要度を決定づける条件は、前記受信した情報である電子メールまたは電話の送信元がユーザが設定した人物であるか否かによって重要度を決定づけることを特徴とする請求項4に記載の情報処理装置。
【請求項8】
前記重要度を決定づける条件は、あらかじめユーザが設定した、前記受信した情報である電子メールにユーザが設定した定型文が含まれるか否かによって重要度を決定づけることを特徴とする請求項4に記載の情報処理装置。
【請求項9】
コンテンツに含まれる音声信号をメモリより読み出し再生するステップと、
前記音声信号を再生中、所定の情報をユーザに報知するための報知音を発生させる必要性が生じた際、再生中の音声信号と、前記報知音のそれぞれに対して異なるパターンで周波数帯域を割り当てるステップと、
前記報知音を発生させるステップと、
割り当てた周波数帯域のパターンで、再生した音声信号と、発生させた報知音のそれぞれから、割り当てた周波数帯域成分を抽出して合成するステップと、
合成した音声信号を音響として出力するステップと、
を含むことを特徴とする情報処理方法。
【請求項10】
コンテンツに含まれる音声信号をメモリより読み出し再生する機能と、
前記音声信号を再生中、所定の情報をユーザに報知するための報知音を発生させる必要性が生じた際、再生中の音声信号と、前記報知音のそれぞれに対して異なるパターンで周波数帯域を割り当てる機能と、
前記報知音を発生させる機能と、
割り当てた周波数帯域のパターンで、再生した音声信号と、発生させた報知音のそれぞれから、割り当てた周波数帯域成分を抽出して合成する機能と、
合成した音声信号を音響として出力する機能と、
をコンピュータ実現させることを特徴とするコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2010−136117(P2010−136117A)
【公開日】平成22年6月17日(2010.6.17)
【国際特許分類】
【出願番号】特願2008−310317(P2008−310317)
【出願日】平成20年12月4日(2008.12.4)
【出願人】(395015319)株式会社ソニー・コンピュータエンタテインメント (871)
【Fターム(参考)】