説明

携帯端末装置、情報処理方法、及びプログラム

【課題】 音声信号から視聴者が求める盛り上がり部分を自動的に抽出して統合し、又はそのような盛り上がり部分を再生する。
【解決手段】 情報提供装置10において、重要度判断部11は、TV放送を受信すると、所定の時間区間毎に音声信号の周波数強度分布を調べ、その周波数強度分布について、重要パターンとして予め登録してある周波数強度分布とのマッチングを行い、例えば類似度が閾値以上である部分を重要部分と判断する。抽出部12は、重要度判断部11において重要と判断された部分及びその前後の映像/音声を抽出し、その部分をコピーして元の映像/音声信号とは別に記録部13に記録する。統合部14は、記録部13に記録された重要部分を時系列順、或いは任意の順序で統合する。発信部15は、統合部14によって統合された重要部分を視聴者、例えば携帯電話機等のユーザに対して発信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テレビジョン放送等における音声信号の盛り上がり部分を重要部分として抽出し、又は重要部分を再生する情報処理装置及び携帯端末装置に関する。
【背景技術】
【0002】
一般公共放送を利用した放送では、その情報形態として流し続けるのが一般的であり、視聴者はこの中から希望する番組を選択して視聴する。しかしながら、視聴者はその中でも特に見たい部分や興味ある領域を持っているのが普通である。例えばスポーツ番組では、ある競技が始まってから最終的に勝敗が決まるまでを視聴することも大事であるが、得点が入った瞬間やゴールを決めた瞬間は特に視聴者の関心が高く、その部分だけは見逃したくないと考えるのが一般的である。そのため放送局では、視聴者が希望する部分だけを切り出して編集した特別番組や総集編といったダイジェスト映像を作成して、競技終了後に別の番組としてさらに放送することも少なくない。
【0003】
従来、このようなダイジェスト映像の作成方法としては、人間が映像を見ながら手作業で映像編集してダイジェスト映像を作成する方法や、内容に基づくインデックスを手作業で振り、そのインデックスを利用して検索し、ダイジェスト映像を作成する方法が一般的であった。しかしながら、このような方法では、人間が映像全体を視聴する必要があるため、多大な時間と労力とが必要とされていた。
【0004】
さらに、近年ネットワーク技術の発展により、ADSLや光接続など、いわゆるブロードバンドが普及し始め、単にテレビジョン受像器を用いて放送を視聴するのみならず、ネットワーク経由でいわゆるストリーミング番組を視聴することも増えてきた。しかしながら、このようなネットワーク経由で流されるダイジェスト映像においても、従来は人間が手作業で作成しており、一般公共放送のための媒体をネットワーク経由向けに変換されただけのものも多く、多大な時間と労力とが必要とされていた。
【0005】
このような理由から、下記の特許文献1には、全周波数帯域のパワーレベルと、特定の周波数成分のパワーレベルの大小との組み合わせにより、スポーツ等のイベントの盛り上がり部分を自動的に検出し、インデックスとして付与する技術が提案されている。この技術では、観客が盛り上がった音を検出するため、多くのイベントに汎用的に適用でき、イベントの進行上重要な箇所を自動的に検出することができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−143451号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、この特許文献1に記載の技術では、盛り上がり部分にインデックスを付すのみであるため、このようなインデックスの付された映像/音声信号を例えば携帯端末装置のユーザに配信した場合、ユーザがダイジェスト映像を視聴するためには、インデックス位置への頭出しを行わなければならず、利便性に欠けていた。
【0008】
本発明は、このような従来の実情に鑑みて提案されたものであり、音声信号から視聴者が求める盛り上がり部分を自動的に抽出して統合し、又はそのような盛り上がり部分を再生する情報処理装置及び携帯端末装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した目的を達成するために、本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。
【0010】
ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。
【0011】
このような情報処理装置は、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合する。
【0012】
また、上述した目的を達成するために、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。
【0013】
このような携帯端末装置は、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生する。
【0014】
また、上述した課題を達成するために、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。
【0015】
このような携帯端末装置は、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生する。
【発明の効果】
【0016】
本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。
【0017】
ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。
【0018】
このような情報処理装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合するため、例えば統合された情報を視聴者に対して発信した場合、視聴者は容易に重要部分を視聴することができる。
【0019】
また、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。
【0020】
このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生することにより、ユーザは容易に重要部分を視聴することができる。
【0021】
また、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。
【0022】
このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生するため、ユーザは容易に重要部分を視聴することができる。
【図面の簡単な説明】
【0023】
【図1】TV放送の視聴形態の一例を示す図である。
【図2】放送局と電話局との間の接続形態の他の例を示す図である。
【図3】放送局と電話局との間の接続形態の他の例を示す図である。
【図4】放送局と電話局との間の接続形態の他の例を示す図である。
【図5】第1の実施の形態における情報提供装置の概念構成を示す図である。
【図6】同情報提供装置の重要度判断部の処理手順を説明するフローチャートである。
【図7】映像信号のフレーム毎に音声信号の周波数強度分布を求める場合の例を示す図である。
【図8】現在時刻の前後のフレームに対応する音声信号の周波数解析結果をも利用する場合の例を示す図である。
【図9】前後のフレームの周波数解析結果の利用例を示す図である。
【図10】同情報提供装置の抽出部における抽出区間を示す図である。
【図11】同情報提供装置の発信部からの発信形態の一例を示す図である。
【図12】同情報提供装置の発信部からの発信形態の一例を示す図である。
【図13】同情報提供装置の発信部からの発信形態の一例を示す図である。
【図14】第1の実施の形態における情報提供装置の詳細な構成例を示す図である。
【図15】同情報提供装置における盛り上がり区間処理部の内部構成を示す図である。
【図16】第2の実施の形態における携帯端末装置と情報提供装置との間のデータの送受信を説明するフローチャートである。
【図17】同情報提供装置で作成される重要情報一覧の一例を示す図である。
【図18】同重要情報一覧を受信した携帯端末装置における表示例を示す図である。
【図19】第2の実施の形態における携帯端末装置の詳細な構成例を示す図である。
【図20】第3の実施の形態における携帯端末装置の詳細な構成例を示す図である。
【図21】同情報処理装置における盛り上がり区間処理部の内部構成を示す図である。
【発明を実施するための形態】
【0024】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明に係る情報処理装置及び携帯端末装置を、映像/音声信号から重要部分を抽出して統合し、視聴者に提供する情報提供装置、及びそのような情報を再生し、又は映像/音声信号から重要部分を抽出・統合する携帯端末装置に適用したものである。なお、以下の実施の形態では、映像/音声信号として、テレビジョン(以下、TVという。)放送を例示して説明する。
【0025】
先ず、第1の実施の形態における情報提供装置の説明をする前に、TV放送の視聴形態例を図1に示す。TV放送は放送局1から電波で発信されており、電話会社2はそれをアンテナを介して受信する。そして電話会社2は、受信した情報であるTV番組を加工し、視聴者、例えば携帯電話機等の受信端末3のユーザに向けて発信する。ここで、図1では放送局1と電話会社2の間は通常のTV放送の形態をとっているが、これに限定されるものではなく、図2のように専用線で放送局1と電話会社2とを結ぶ形態であっても、図3のようにインターネット等のネットワークで結ぶ形態であっても、図4のように衛星通信を使って結ぶ形態であってもよい。また、最終的にユーザに対して情報を提供するのは、電話会社に限らず、電話会社以外の他の会社や個人であってもよく、放送局自身であっても構わない。以下、このように視聴者に対して情報を加工して提供する会社又は個人を情報提供者と定義し、そのような処理を行う装置を情報提供装置と定義する。
【0026】
情報提供者は、受信したTV番組を視聴者が望む形に加工する。例えばスポー番組の場合、視聴者は試合の全てを見たいとも思っているが、全てを見る時間的余裕がない場合や複数の試合を簡便に見たい場合も多く、得点が入った瞬間、或いは自分の応援しているチームや選手にとって有利又は不利な展開になった部分だけは必ず見たいと思うことも多い。このような得点が入ったシーンなどでは、そのスポーツが開催されている会場の聴衆も同様に関心が高く、それが会場内の音響にも具体的に現れる。すなわち、聴衆の反応として、音響的には「わぁー」という音声分布が現れる。しかも、試合継続中に開催場所が変化、移動することは極めて稀であるため、会場における音響特性は、ほぼ同じと考えられ、結果として聴衆の反応も同じような傾向を示す。つまり、得点の入ったシーンなどの盛り上がり部分では、周波数分布がほぼ同じような特性を示すことになる。
【0027】
そこで、本実施の形態ではこの特性を利用し、周波数分布が前述の特性を示す部分を盛り上がり部分と判断し、その盛り上がり部分を重要部分として抽出する。なお、TV放送では音声と映像とが同期しているため、対応する映像も重要度が高いとして同様に抽出する。この際、単にその部分だけを抽出するのではなく、その前後も調整可能な範囲内で抽出すれば、例えば試合中の得点に絡む前後のシーンを極めて正確に抽出できることになる。
【0028】
このように重要部分を抽出して視聴者に提供する情報提供装置の概念構成を図5に示す。図5に示すように、情報提供装置10は、音声信号の周波数分布から重要度が高い部分を判断する重要度判断部11と、その重要部分を抽出する抽出部12と、抽出した情報が記録される記録部13と、それらの重要部分を統合する統合部14と、統合した情報を視聴者に向けて発信する発信部15とにより構成される。
【0029】
ここで重要度判断部11は、TV放送を受信すると、先ず所定の時間区間毎に音声信号の周波数強度分布を調べる。そして、その周波数強度分布について、重要パターンとして予め登録してある周波数強度分布とのマッチングを行い、例えば類似度が閾値以上である部分を重要部分と判断する。
【0030】
すなわち、図6のフローチャートに示すように、先ずステップS1において、所定の時間区間毎に周波数強度分布を求め、ステップS2において、その周波数強度分布が予め登録されている重要パターンと一致するか否かを判別する。ステップS2において一致する場合(Yes)にはステップS3において重要部分と判断し、そうでない場合(No)にはステップS4に進む。ステップS4では、信号(番組)の最後か否かを判別し、最後である場合(Yes)には重要度の判断処理を終了し、そうでない場合(No)にはステップS1に戻って判断処理を続ける。
【0031】
ここで、周波数強度分布を求める時間区間は、例えば1秒乃至数秒毎としてもよく、或いは映像のフレーム毎としてもよい。フレーム毎に周波数強度分布を求める場合、図7に示すように、現在時刻「01:20:14」のフレームに対応する音声信号を選択領域として周波数解析を行い、周波数強度分布を求める。この際、そのフレームに対応する音声信号のみならず、図8のように前後のフレームに対応する音声信号の解析結果をも利用することで、マッチングの精度を向上させることができる。この場合、図9に示すように、現在時刻を中心として肩部を有する重み付け係数を各周波数成分毎に乗算し、これらを加算することで現在時刻「01:20:14」のフレームに対応する音声信号の周波数解析結果とすることができる。
【0032】
なお、マッチング時には閾値を調整可能とすることにより、厳密に一致していなければならない場合や、ある程度類似していればよい場合など、多様な判断が可能となる。曖昧な一致検索では、ファジーや他の技術を用いた曖昧検索が利用可能である。また、必ずしも登録されたパターンのみならず、学習機能を持たせ、登録されたパターンから学習したパターンをマッチングのテンプレートとしてもよい。
【0033】
抽出部12は、重要度判断部11において重要と判断された部分の映像/音声を抽出し、その部分をコピーして元の映像/音声信号とは別に記録部13に記録する。この際、単にその部分だけを抽出するのではなく、その前後も調整可能な範囲内で抽出することが好ましい。すなわち、例えば図10に示すように、時刻「01:20:14」のフレームに対応する区間が重要であると判断された場合、その前後のフレームに対応する区間についても抽出するようにする。この範囲は、例えば重要部分の前後3分間というように設定可能である。さらに、この範囲を変更可能としておくことで視聴対象となる番組に応じて変化させることもでき、利便性が高まる。
【0034】
また、抽出部12は、映像が流れているその時点では重要部分の抽出を行わず、その部分が重要であるという開始点及び終了点のマーカーのみを記録部13に記録するようにしてもよい。この場合にも、重要部分の前後を含めることが好ましい。マーカーは、元の映像/音声信号中に埋め込む或いは加えるようにしてもよいが、信号そのものを変化させたくない場合には、信号とは別にデータベースとして記録部13に記録することもできる。但し、例えば映像信号であれば信号が持つTBC(Time Base Corrector)等の位置情報を利用するなど、元の信号のどの部分に対応するかが容易に分かるようにしておく必要があるのは勿論である。
【0035】
統合部14は、記録部13に記録された重要部分を例えば時系列順に統合する。この際、各重要部分の間にその概要を説明するヘッダ情報を追加するようにしても構わない。また、時系列に従わず、任意の順番に入れ替えて統合するようにしてもよい。
【0036】
発信部15は、統合部14によって統合された重要部分を視聴者、例えば携帯電話機やPDA(Personal Digital Assistance)等の携帯端末装置、或いはTV受像器、PC(Personal Computer)等を含む受信端末3のユーザに対して発信する。発信の方法としては、発信側が任意の時間に発信するものであってもよく、視聴者側が任意の時間に送信要求を出し、これに応じて発信側から発信するものであってもよい。後者の場合には、視聴者が望む時間、場所で視聴することが可能である。また、送信形態は、図11に示すように、インターネット等の一般のネットワーク、或いは専用線を利用して発信するものであってもよく、図12に示すように、衛星通信を利用して発信するものであってもよい。また、放送局自身が重要部分の抽出を行う場合には、図13に示すように、従来のTV放送と同様に放送局から発信してもよい。
【0037】
上述した情報提供装置10の詳細な構成例を図14に示す。図14に示すように、情報提供装置10は、該情報提供装置10の各部を統括して制御するCPU(Central Processing Unit)100と、不揮発性のメモリであるROM(Read Only Memory)101と、揮発性のメモリであるRAM(Random Access Memory)102と、いわゆるTVチューナーであり、例えば放送局からのTV放送を受信する映像/音声データ通信部103と、上述したような盛り上がり区間を検出する盛り上がり区間処理部104と、インターネット等のネットワーク、専用線、或いは衛星通信等を介して通信する通信回路105とが制御ライン110及びデータライン120とを介して接続されている。
【0038】
このような情報提供装置10において、CPU100は、例えばROM101に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM102には、CPU100が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。
【0039】
映像/音声データ通信部103は、アンテナ106を介して受信した映像/音声信号をRAM102に記憶し、RAM102は、この信号を一定時間バッファリングした後、順次盛り上がり区間処理部104に出力する。なお、RAM102ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。
【0040】
盛り上がり区間処理部104は、例えば図15に示すように、データライン120を介して入力された時間軸上の信号を周波数軸上の信号にスペクトル変換するスペクトル変換部150と、予め登録された重要パターンが記憶される重要パターン記憶部151と、各時間区間毎にデータが盛り上がり区間であるか否かを判定する判定部152と、盛り上がり区間を抽出する抽出部153と、各盛り上がり区間を統合する統合部154と、盛り上がり区間処理部104を統括して制御するデータ制御部155とにより構成される。
【0041】
スペクトル変換部150は、入力された時間軸上の信号を前述した所定の時間区間毎にFFT(Fast Fourier Transform)等により周波数スペクトルに変換し、周波数強度分布を得る。そして判定部152は、重要パターン記憶部151から読み出した周波数強度分布と、スペクトル変換により得られた周波数強度分布とを比較して重要度を判定し、重要と判定された場合にはその旨をデータ制御部155に通知する。
【0042】
データ制御部155は、判定部152から通知を受け取ると抽出部153を起動させ、抽出部153は、その重要部分の前の信号をRAM102(図14)から読み出し、重要部分の信号及びその後の信号と合わせて統合部154に送る。そして統合部154は、抽出部153から送られた信号を順次記憶しておき、1つの信号として統合する。
【0043】
図14に戻って通信回路105は、任意の時間に、又は視聴者側からの送信要求に応じて、統合部154(図15)で統合された信号を視聴者に対して発信する。
【0044】
以上のように、第1の実施の形態によれば、情報提供装置10において所定の時間区間毎に音声信号の周波数強度分布を調べ、その周波数強度分布について予め登録された重要パターンとのマッチングを行うことで、TV放送から視聴者が求める重要部分(盛り上がり部分)を自動的に抽出して統合してすることができ、視聴者に対してその重要部分を容易に提供することができる。また、視聴者は、頭出し等を行うことなく、重要部分を容易に視聴することができる。
【0045】
次に、以下に説明する第2実施の形態では、第1の実施の形態のように統合された重要部分の全てを視聴者に対して発信するのではなく、情報提供装置10が重要部分の一覧情報を作成して視聴者の携帯端末装置20に送信し、視聴者がその重要部分の中から所望の情報のみをダウンロードする。
【0046】
すなわち、図16のフローチャートに示すように、先ずステップS10において携帯端末装置20のユーザが重要部分一覧、例えばAチーム対Bチームの得点シーンの一覧を要求すると、ステップS11において、情報提供装置10は図17に示すような一覧情報を携帯端末装置20に送信する。これにより、携帯端末装置20の表示部には、図18に示すような画面が表示される。
【0047】
次に携帯端末装置20のユーザが図18に示す一覧情報のうち、所望の得点シーンについてのチェックボックスをチェックし、さらに「選択部を受信する」とされたボタンを選択すると、ステップS12において携帯端末装置20は、情報提供装置10に対して選択部分の送信を要求する。
【0048】
続いてステップS13において情報提供装置10が選択部分の1つを送信すると、ステップS14において携帯端末装置20は、受信した選択部分の保存又は再生を行う。そしてステップS15において情報提供装置10が選択部分の最後を送信すると、ステップS16において携帯端末装置20は、情報提供装置10に終了通知を送信する。
【0049】
なお、ACK通知送信を行う携帯端末装置20の場合には、選択部分の1つを受信すると、正常に受信したことを示すアクノレッジを情報提供装置10に返信し、正常に受信できなかった場合には、受信に失敗したことを示すアクノレッジを情報提供装置10に返信する。
【0050】
このような処理を行う携帯端末装置20の詳細な構成例を図19に示す。図19に示すように、携帯端末装置20は、該携帯端末装置20の各部を統括して制御するCPU200と、不揮発性のメモリであるROM201と、揮発性のメモリであるRAM202と、表示部206に対する映像の表示を制御する表示制御部203と、RAM202に記憶された情報を表示部206で表示可能に再生する処理を行うデータ再生部204と、インターネット等のネットワークを介して通信する通信回路205とが制御ライン220及びデータライン230とを介して接続されている。さらに、制御ライン220には入力手段であるテンキー207が接続され、データライン230には音声を出力するスピーカ208と、音声を集音するマイクロホン209とが接続されている。
【0051】
このような携帯端末装置20において、CPU200は、例えばROM201に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM202には、CPU200が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。
【0052】
通信回路205は、アンテナ210を介して情報提供装置10と通信し、上述した重要情報一覧や、その一覧から選択した情報等を受信する。通信回路205は、受信した情報をRAM202に記憶する。なお、RAM202ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。
【0053】
データ再生部204は、RAM202に記憶された重要情報一覧や選択された重要情報等のデータを表示部206で表示可能に再生する処理を行う。
【0054】
以上のように、第2の実施の形態によれば、情報提供装置10において抽出された重要部分(盛り上がり部分)の一覧情報を作成して視聴者の携帯端末装置20に送信し、携帯端末装置20において視聴者がその重要部分の中から所望の情報のみを指定してダウンロードすることにより、視聴者の選択した部分のみを簡便に視聴することができる。
【0055】
続いて、以下に説明する第3の実施の形態では、第1、2の実施の形態のように情報提供装置10を介さず、携帯端末装置自身が受信したTV放送から重要部分を抽出して統合し、統合した重要部分を再生する。
【0056】
このような処理を行う携帯端末装置30の詳細な構成例を図20に示す。図20に示すように、携帯端末装置30は、該携帯端末装置30の各部を統括して制御するCPU300と、不揮発性のメモリであるROM301と、揮発性のメモリであるRAM302と、いわゆるTVチューナーであり、例えば放送局からのTV放送を受信する映像/音声データ通信部303と、上述したような盛り上がり区間を検出する盛り上がり区間処理部304と、表示部308に対する映像の表示を制御する表示制御部305と、RAM302に記憶された情報を表示部308で表示可能に再生する処理を行うデータ再生部306と、インターネット等のネットワークを介して通信する通信回路307とが制御ライン320及びデータライン330とを介して接続されている。さらに、制御ライン320には入力手段であるテンキー309が接続され、データライン330には音声を出力するスピーカ310と、音声を集音するマイクロホン311とが接続されている。
【0057】
このような携帯端末装置30において、CPU300は、例えばROM301に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM302には、CPU300が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。
【0058】
映像/音声データ通信部303は、アンテナ312を介して受信した映像/音声信号をRAM302に記憶し、RAM302は、この信号を一定時間バッファリングした後、順次盛り上がり区間処理部304に出力する。なお、RAM302ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。
【0059】
盛り上がり区間処理部304は、例えば図21に示すように、データライン330を介して入力された時間軸上の信号を周波数軸上の信号にスペクトル変換するスペクトル変換部350と、重要パターンが記憶される重要パターン記憶部351と、各時間区間毎にデータが盛り上がり区間であるか否かを判定する判定部352と、盛り上がり区間を抽出する抽出部353と、各盛り上がり区間を統合する統合部354と、盛り上がり区間処理部304を統括して制御するデータ制御部355とにより構成される。
【0060】
スペクトル変換部350は、入力された時間軸上の信号を前述した所定の時間区間毎にFFT等により周波数スペクトルに変換し、周波数強度分布を得る。そして判定部352は、重要パターン記憶部351から読み出した周波数強度分布と、スペクトル変換により得られた周波数強度分布とを比較して重要度を判定し、重要と判定された場合にはその旨をデータ制御部355に通知する。なお、重要パターン記憶部351に記憶される重要パターンは、デフォルトのパターンであってもよく、ユーザが任意に作成したパターンであってもよい。また、通信回路307のアンテナ313を介して、番組を放送する放送局からその番組の放送前にダウンロードされたものであってもよく、所定のサイトから購入したものであってもよい。
【0061】
データ制御部355は、判定部352から通知を受け取ると抽出部353を起動させ、抽出部353は、その重要部分の前の信号をRAM302(図20)から読み出し、重要部分の信号及びその後の信号と合わせて統合部354に送る。そして統合部354は、抽出部353から送られた信号を順次記憶しておき、1つの信号として統合する。
【0062】
図20に戻ってデータ再生部306は、例えばユーザからの再生要求に応じて、統合部354(図21)で統合された信号を読み出し、表示部308で表示可能に再生する処理を行う。
【0063】
以上のように、第3の実施の形態によれば、携帯端末装置30において所定の時間区間毎に音声信号の周波数強度分布を調べ、その周波数強度分布について重要パターンとのマッチングを行うことで、TV放送からユーザが求める重要部分(盛り上がり部分)を自動的に抽出して統合してすることができ、重要部分を容易に視聴することができる。
【0064】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0065】
例えば、上述した実施の形態では、TV放送の音声信号に基づいて重要部分か否かを判断し、重要部分の音声及び映像を抽出するものとして説明したが、これに限定されるものではなく、例えばラジオ放送の場合には重要部分の音声信号のみを抽出するようにしても、同様の効果が得られる。
【産業上の利用可能性】
【0066】
以上詳細に説明したように、本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。
【0067】
ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。
【0068】
このような情報処理装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合するため、例えば統合された情報を視聴者に対して発信した場合、視聴者は容易に重要部分を視聴することができる。
【0069】
また、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。
【0070】
このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生することにより、ユーザは容易に重要部分を視聴することができる。
【0071】
また、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。
【0072】
このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生するため、ユーザは容易に重要部分を視聴することができる。
【符号の説明】
【0073】
1 放送局、2 電話会社、3 受信端末、10 情報提供装置、11 重要度判断部、12 抽出部、13 記録部、14 統合部、15 発信部、20 携帯端末装置、103,303 映像/音声データ通信部、104,304 盛り上がり区間処理部、105,205,307 通信回路、203 表示制御部、204,306 データ再生部、206,308 表示部、207 テンキー、208,310 スピーカ

【特許請求の範囲】
【請求項1】
音声信号における重要部分を抽出する情報処理装置において、
所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、
上記重要度に基づいて上記重要部分を抽出する抽出手段と、
抽出された複数の重要部分の少なくとも一部を統合する統合手段と
を備える情報処理装置。
【請求項2】
上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備える請求項1記載の情報処理装置。
【請求項3】
上記重要度判断手段は、上記時間区間毎の上記音声信号の周波数強度分布に基づいて、上記重要度を判断する請求項1記載の情報処理装置。
【請求項4】
上記重要度判断手段は、上記時間区間毎に求められた上記周波数強度分布と、予め登録された重要部分の周波数強度分布とを比較することにより、上記重要度を判断する請求項3記載の情報処理装置。
【請求項5】
上記音声信号には映像信号が付随しており、
上記抽出手段は、上記重要部分と該重要部分に対応する時刻の上記映像信号とを抽出する請求項1記載の情報処理装置。
【請求項6】
上記抽出手段は、上記重要部分と該重要部分の前後の所定の時間内における信号とを抽出する請求項1記載の情報処理装置。
【請求項7】
上記統合手段は、複数の上記重要部分を時系列順又は任意の順序で統合する請求項1記載の情報処理装置。
【請求項8】
上記発信手段は、外部からの要求に応じて上記統合された情報を発信する請求項2記載の情報処理装置。
【請求項9】
上記発信手段は、任意の時間に上記統合された情報を外部に発信する請求項2記載の情報処理装置。
【請求項10】
上記重要部分が記憶される記憶手段をさらに備え、
上記抽出手段は、上記重要部分の複製を上記記憶手段に記憶する請求項1記載の情報処理装置。
【請求項11】
抽出された上記重要部分が記憶される記憶手段をさらに備え、
上記抽出手段は、上記重要部分の開始点及び終了点の情報を上記記憶手段に記憶し、
上記統合手段は、上記記憶手段に記憶された上記開始点及び終了点の情報に基づいて、上記重要部分を統合する請求項1記載の情報処理装置。
【請求項12】
所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、
上記重要部分を再生する再生手段と
を備える携帯端末装置。
【請求項13】
上記通信手段は、上記情報処理装置から上記重要部分の一覧情報を受信すると共に、該一覧情報のうち所望の部分を指定する指定情報を上記情報処理装置に送信し、
上記再生手段は、上記指定情報に応じて上記情報処理装置から送信された上記所望の部分を再生すること
を特徴とする請求項12記載の携帯端末装置。
【請求項14】
上記重要部分は、上記時間区間毎の上記音声信号の周波数強度分布と、予め登録された重要部分の周波数強度分布と比較して上記重要度を判断し、該重要度に基づいて抽出されたものである請求項12記載の情報処理装置。
【請求項15】
上記音声信号には映像信号が付随しており、
上記再生手段は、上記重要部分と該重要部分に対応する時刻の上記映像信号とを再生する請求項12記載の携帯端末装置。
【請求項16】
音声信号における重要部分を抽出して再生する携帯端末装置において、
所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、
上記重要度に基づいて上記重要部分を抽出する抽出手段と、
抽出された複数の重要部分の少なくとも一部を統合する統合手段と、
上記統合された情報を再生する再生手段と
を備える携帯端末装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2010−266880(P2010−266880A)
【公開日】平成22年11月25日(2010.11.25)
【国際特許分類】
【出願番号】特願2010−142781(P2010−142781)
【出願日】平成22年6月23日(2010.6.23)
【分割の表示】特願2003−105641(P2003−105641)の分割
【原出願日】平成15年4月9日(2003.4.9)
【出願人】(000002185)ソニー株式会社 (34,172)
【出願人】(501431073)ソニー・エリクソン・モバイルコミュニケーションズ株式会社 (810)
【Fターム(参考)】