説明

電話システムおよびその通話方法、電話端末、電話システム制御プログラム、および該プログラムを記録した記録媒体

【課題】 新規な音声通話機能を追加した電話システムを提供する。
【解決手段】 電話システムは、互いに通話を行う2つの電話端末1a・1bを備える。一方の電話端末1aは、複数の通話音を他方の電話端末に送信する。他方の電話端末1bは、一方の通信端末からの複数の通話音を受信して、複数の通話音を複数のスピーカー8a・8bからそれぞれ出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、互いに通話を行う2つの電話端末を備えた電話システムおよびその通話方法、電話端末、電話システム制御プログラム、および該プログラムを記録した記録媒体に関するものである。具体的には、テレビ電話機能を有する携帯電話端末を用いた携帯電話システムなどに関するものである。
【背景技術】
【0002】
近時、携帯電話の普及にともない、多種多様な機能が携帯電話端末に搭載されている。カメラによる画像撮影、画像の送信、動画のリアルタイム送信といった画像に関する機能や、音楽の録音再生、音楽データの通信配信などの音に関する機能を備え、それら用途に用いる為のCCD(Charge Coupled Devices)やCMOS(Complementary Metal Oxide Semiconductor)などを用いたカメラ、LCD(Liquid Crystal Display)や有機ELD(Electro Luminescence Display)などを用いた高輝度・高解像度表示装置、ステレオ音声を再生する為の複数のスピーカーなどを備えた携帯端末が市販され始めている。
【0003】
テレビ電話機能を備えた携帯電話端末として、受信者には送信者の顔が表示されないように代替画像を表示する機能を搭載したものが開示されている(例えば、特許文献1参照)。
【0004】
また、テレビ電話機能を用いた通話時に受信者に対して周囲の画像を送信せずに、現在の背景と異なる画像を自然に表示し、マイクからの入力音のうち周囲音を除去する機能を有するものが開示されている(例えば、特許文献2参照)。
【0005】
また、2つのスピーカーによって背面からの音を仮想的に実現する、ヴァーチャルサラウンドと呼ばれる3次元音響の技術が知られている。
【特許文献1】特開2004−40525号(平成16年2月5日公開)
【特許文献2】特開2003−333556号(平成15年11月21日公開)
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記のように多種多様な機能を備えた携帯電話端末が市販されているにも関わらず、音声の通話機能に関しては多機能化しているとは言い難い。確かに、TV電話機能の追加や、通話音の音質の向上などが図られているが、前者は固定電話システムにも存在し、後者は固定電話システムの通話音の音質までには至っていない。
【0007】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、音声の通話機能に関して、従来の電話システムには無い新規な機能を追加した電話システムなどを提供することにある。
【課題を解決するための手段】
【0008】
本発明の電話システムは、上記課題を解決するために、互いに通話を行う2つの電話端末を備えた電話システムであって、一方の電話端末は、複数の通話音を他方の電話端末に送信する送信手段を備えており、前記他方の電話端末は、前記一方の通信端末からの複数の通話音を受信する受信手段と、該複数の通話音をそれぞれ出力する複数の音出力手段とを備えることを特徴としている。
【0009】
上記の構成によれば、複数の通話音を一方の電話端末から他方の電話端末に送信して出力することができる。これにより、ステレオの通話音を出力したり、通話者など主音声と背景音とを別々に出力したりでき、音声の通話機能に新規な機能を追加することができる。
【0010】
本発明の電話システムは、上記の構成において、前記送信手段は、前記複数の通話音に基づいて複数の音声信号を生成し、生成した複数の音声信号を音声チャネルおよびその他のチャネルを介して前記他方の電話端末に送信するものであり、前記受信手段は、前記複数の音声信号を、前記音声チャネルおよび前記その他のチャネルを介して受信し、受信した複数の音声信号に基づいて複数の通話音を生成するものであることを特徴としている。
【0011】
ところで、従来の電話システムの場合、音声信号を送信する音声チャネルにおいて、複数の音声信号を送信することは困難である。これは、送信する音声信号としてモノラルの音声信号を想定しているためと考えられる。
【0012】
これに対し、上記の構成によれば、1本の通信回線を複数のチャネルに分割した各チャネルにおいて、従来の音声信号を従来の音声チャネルを用いて送信するとともに、追加の音声信号を別のチャネルを用いて送信することにより、従来の音声に追加の音声を加えた通話を実現できる。
【0013】
さらに、本発明の電話システムは、上記の構成において、前記複数の通話音は、左側の音および右側の音を含むことを特徴としている。
【0014】
上記の構成によれば、ステレオ音声を用いた通話を実現することができる。
【0015】
さらに、本発明の電話システムは、上記の構成において、前記送信手段は、前記左側の音の信号である左側音声信号と前記右側の音の信号である右側音声信号との和信号を生成するとともに、前記左側音声信号と前記右側音声信号との差信号を生成し、前記和信号を、前記音声チャネルを介して送信するとともに、前記差信号を、前記その他のチャネルを介して送信しており、前記受信手段は、前記音声チャネルを介して前記和信号を受信するとともに、前記その他のチャネルを介して前記差信号を受信することを特徴としている。
【0016】
上記の構成によれば、他方の電話端末がステレオ音声の出力に対応していないものであっても、右側音声信号と左側音声信号との和信号を従来の音声チャネルを介して受け取ることで、モノラルではあるが両方の音を出力することが出来る。
【0017】
また、本発明の電話システムは、上記の構成において、前記複数の通話音は、主音声および背景音を含み、前記主音声はモノラルであり、前記背景音は左側の背景音と右側の背景音とを含むステレオであることを特徴としている。
【0018】
上記の構成によれば、主音声である会話音声をモノラルで送信するとともに、背景音をステレオで送信することで、聞き取りやすさが重視される会話音声と、音質や臨場感が重視される背景音を独立して送信する通話を実現することができる。
【0019】
さらに、本発明の電話システムは、上記の構成において、前記送信手段は、前記主音声の信号である主音声信号と、前記左側の背景音の信号である左側音声信号と、前記右側の背景音の信号である右側音声信号とを含む和信号を生成するとともに、前記左側音声信号と前記右側音声信号との差信号を生成し、前記和信号を、前記音声チャネルを介して送信するとともに、前記差信号を、前記その他のチャネルを介して送信しており、前記受信手段は、前記音声チャネルを介して前記和信号を受信するとともに、前記その他のチャネルを介して前記差信号を受信することを特徴としている。
【0020】
上記の構成によれば、ステレオ出力に対応している通信端末では、モノラルである主音声とステレオである背景音が合成された信号を受信し臨場感のある通話を実現するとともに、ステレオ出力に対応していない通話端末であっても、主音声信号と右側音声信号と左側音声信号との和信号を従来の音声チャネルを介して受け取ることで、会話音声および背景音が合成された音声の信号を受信しモノラルで出力する通信を実現できるという効果を奏する。
【0021】
また、本発明の電話システムは、上記の構成において、前記送信手段は、前記主音声の信号である主音声信号を生成するとともに、音源データの選択に基づいて識別信号を生成し、前記主音声信号を、前記音声チャネルを介して送信するとともに、前記識別信号を、前記その他のチャネルを介して送信しており、前記他方の電話端末は、各種の背景音の音源データを記憶する記憶手段をさらに備えており、前記受信手段は、前記主音声信号を、前記音声チャネルを介して受信するとともに、前記識別信号を前記その他のチャネルを介して受信し、前記主音声信号に基づいて主音声を生成するとともに、前記識別信号に基づいて前記記憶手段から前記音源データを選択して前記背景音を生成することを特徴としている。
【0022】
上記の構成によれば、主音声を実際に送信するとともに背景音については識別信号のみを送信し、受信端末において識別信号に基づいた背景音データを合成することで、通信するデータ量を減らすことが出来る。なお、主音声は従来の音声チャネルで送信されるため、背景音の出力に対応していない電話端末であっても、主音声のみの通話を問題なく行うことが出来る。
【0023】
また、本発明の電話システムは、上記の構成において、前記背景音に対し、3次元音響を用いた音響エフェクトを施すことを特徴としている。
【0024】
上記の構成によれば、背景音に音響エフェクトを施し臨場感ある背景音とするとともに、会話音声である主音声に音声エフェクトを適用することを回避できるので、音声エフェクトにより会話音声を聞き取りにくくしてしまうことを回避できる。
【0025】
また、本発明の電話システムは、上記の構成において、前記一方の電話端末は、撮影を行う撮影手段をさらに備えており、前記送信手段は、さらに、前記撮影手段が撮影した撮影画像の信号である画像信号を、画像チャネルを介して送信しており、前記受信手段は、さらに、前記画像信号を、前記画像チャネルを介して受信し、受信した画像信号に基づいて画像を生成するものであり、前記他方の電話端末は、前記画像を表示する表示手段をさらに備えることを特徴としている。
【0026】
上記の構成によれば、1本の通信回線を用いて複数の通話音を同時に送信するとともに、送信元の画像を送信することが出来、上記の臨場感ある音声通話を行う電話システムを、テレビ電話に対して好適に適用することができる。
【0027】
さらに、本発明の電話システムは、上記の構成において、前記送信手段は、前記撮影画像に別の画像を合成した画像の信号である画像信号を、画像チャネルを介して送信することを特徴としている。
【0028】
上記の構成によれば、送信元の人物の画像に任意の背景画像を合成したデータを他方の電話端末に表示するテレビ電話システムを実現することができる。
【0029】
また、本発明の電話システムは、上記の構成において、前記送信手段は、さらに、画像データの選択に基づいて識別信号を生成し、該識別信号を前記音声チャネルおよび前記画像チャネルの他のチャネルを介して送信しており、前記他方の電話端末は、各種の画像データを記憶する記憶手段をさらに備えており、前記受信手段は、さらに、前記識別信号を前記他のチャネルを介して受信し、前記識別信号に基づいて前記記憶手段から前記画像データを選択し、選択した画像データの画像を前記画像信号の画像に合成しており、前記表示手段は、前記受信手段が合成した画像を表示することを特徴としている。
【0030】
上記の構成によれば、音声および人物画像を実際に送信するとともに背景画像については識別信号のみを送信し、受信端末において画像データベースから識別信号に基づいた背景画像データを選択し合成することで、通信するデータ量を減らすことが出来る。
【0031】
なお、上記電話システムにおいて一方または他方の電話端末として用いられる電話端末であれば、上述の効果を得ることができる。
【0032】
本発明の電話システムの通話方法は、互いに通話を行う2つの電話端末を備えた電話システムの通話方法であって、一方の電話端末は、複数の通話音を他方の電話端末に送信し、前記他方の電話端末は、受信した複数の通話音をそれぞれ外部に出力することを特徴としている。
【0033】
上記の方法によれば、複数の通話音を一方の電話端末から他方の電話端末に送信して出力することができる。これにより、ステレオの通話音を出力したり、通話者など主音声と背景音とを別々に出力したりでき、音声の通話機能に新規な機能を追加することができる。
【0034】
なお、上記電話システムにおける通話方法を、電話システム制御によりコンピュータ上で実行させることができる。さらに、上記表電話システム制御プログラムをコンピュータ読取り可能な記録媒体に記憶させることにより、任意のコンピュータ上で上記電話システム制御プログラムを実行させることができる。
【発明の効果】
【0035】
以上のように、本発明に係る電話システムは、複数の通話音を送受信する手段により、同時に複数の通話音を使用する通話を行い、複数の通話音を出力することが出来るので、ステレオ音声、会話音、背景音、画像データ、識別信号の送受信といった様々な情報のやりとりをそれぞれ独立した状態で同時に通信する電話システムを実現することができるという効果を奏する。
【発明を実施するための最良の形態】
【0036】
〔実施形態1〕
本発明の一実施形態について、図1ないし図4に基づいて説明すると以下の通りである。以下では、電話端末として好適な携帯電話機に本発明を適用した場合について説明するが、本発明はそれに留まるものではなく、電話通信機能を有するものであれば、PHS(Personal Handyphone System)(登録商標)、固定電話などの任意の電話端末に適用することができる。
【0037】
図1は、本実施形態における電話システムに利用される電話端末の概略構成を示したブロック図である。電話端末1は、主制御部(送信手段、受信手段)2、アンテナ(送信手段、受信手段)3、通信部(送信手段、受信手段)4、ディスプレイ(表示手段)5、マイク6、カメラ(撮影手段)7、左スピーカー(音出力手段)8a、右スピーカー(音出力手段)8b、音源データベース(記憶手段)20、画像データベース(記憶手段)21、A/D変換部30、D/A変換部31、音声コーデック部32、画像コーデック部33、多重化部(送信手段)34、多重化分離部(受信手段)35、音声合成部(送信手段、受信手段)36、音声分離部(受信手段)37、画像合成部(送信手段、受信手段)38、3次元音響処理部(送信手段、受信手段)39を備える構成である。
【0038】
主制御部2は、上記の各機能ブロックの統括的な制御を行うものである。主制御部2の機能は、例えばRAMやフラッシュメモリなどの記憶装置に記憶されたプログラムをCPU(Central Processing Unit)が実行することによって実現される。
【0039】
アンテナ3は、電波を外部に送り出すとともに外部から電波を受け取るためのものである。アンテナ3は、電話端末1の筐体内部にあってもよいし、筐体内部から引き出すロッドアンテナでもよい。通信部4はアンテナ3より受信した信号を主制御部2に送り、また、主制御部2より受け取ったデータを電波としてアンテナ3より送信する処理をするものである。
【0040】
ディスプレイ5は、LCDや有機ELDなどを用いた表示装置である。ディスプレイ5は、電話端末1の各種機能を使用する際にさまざまなインフォメーションを表示するために用いるものである。本実施形態では、主としてテレビ電話機能において通信相手の顔などの人物画像を表示することに用いるものである。
【0041】
カメラ6は、CCDやCMOSイメージセンサなど撮像素子を用いた撮影装置である。本実施形態では、主としてテレビ電話機能において通話元の顔画像を撮影することに用いるものである。
【0042】
マイク7は、ダイナミックマイクやコンデンサマイクなどを用いた音声入力装置である。なお、本願において、「音声」は、サウンドおよびボイスを含む広い概念を意味している。本実施形態では、マイク7は、主としてテレビ電話機能において通話元の音声を取得するものである。また、本実施形態では、モノラル音声を入力するマイクを用いているが、ステレオ音声を入力するものであってもよい。
【0043】
スピーカー8aおよび8bは、音声や着信音などの音を出力する音声出力装置である。本実施形態では、主としてテレビ電話機能において送信側の通話者の音声データを出力することに用いるものである。
【0044】
音源データベース20は、各種の音データを記憶したメモリ装置である。本実施形態では、音源データベース20は、主として背景音として用いる音データの記憶に用いるものである。音データの形式は、PCM(Pulse Code Modulation)によってデジタル化されたデータであってもよいし、MP3(MPEG-1 Audio Layer-3)のようなフォーマットで圧縮された音データであってもよい。
【0045】
画像データベース21は、各種の画像データを記憶したメモリ装置である。本実施形態では、画像データベース21は、主として通話元の顔画像といった人物画像の背景に合成することに用いる。画像データの形式は、JPEG(Joint Photographic Coding Experts Group)のような圧縮形式であってもよいし、無圧縮のものであってもよい。また、Motion JPEGのような動画形式でもよいし、ストリーミング送信に対応したデータフォーマットであってもよい。
【0046】
A/D変換部30は、入力されたアナログ音声信号をデジタル音声信号に変換して出力する機能ブロックである。D/A変換部31は、入力されたデジタル音声信号をアナログ音声信号に変換して出力する機能ブロックである。
【0047】
音声コーデック部32は、音声フォーマットに従って圧縮やエラー訂正信号の付加といった音声データの符号化と、符号化された音声データの復号化とを行うものである。
【0048】
画像コーデック部33は、画像フォーマットに従って動画データの作成や圧縮やエラー訂正信号の付加といった画像データの符号化と、符号化された画像データの復号化とを行うものである。
【0049】
多重化部34は、複数チャネルからなるデータにヘッダ情報を付加したり、多重化を実行したりするものである。多重化分離部35は、多重化されたデータをチャネルごとに多重化分離するものである。
【0050】
音声合成部36は、複数の音声信号を合成するものである。本実施形態では、音声合成部36は、モノラル音声信号と左右のステレオ音声信号と合成し出力したり、入力された2つの音声信号の和信号および差信号の出力したりするものである。音声分離部37は、複数の音声信号に処理を行い、別の複数の音声信号を出力するものである。本実施形態では、音声分離部37は、音声信号の和信号および差信号からのステレオ音声を復号するものである。
【0051】
画像合成部38は、複数の入力画像を合成し出力する処理を行うものである。本実施形態では、画像合成部38は、画像データベース21より選択された背景画像とカメラ6から取得された送信元の顔画像とを合成するものである。
【0052】
3次元音響処理部39は、3次元音響の技術を用いた音響エフェクトが付加されたステレオ音声を作成するものである。本実施形態では、3次元音響処理部39は、音源データベース20より選択された背景音に、2つのスピーカーによって背面からの音を仮想的に実現するヴァーチャルサラウンドのような音響エフェクトの付加に用いるものである。
【0053】
上記構成において、送信側の電話端末1aがテレビ電話通話機能を用いて画像データと音声データとを受信側の電話端末1bへ送信する際の動作を、図2、3に基づき説明すると、以下の通りである。
【0054】
図2は、本実施形態の電話システムにおいて、テレビ電話機能による通話を行う際に送信側の電話端末1aにおいて実行される、入力処理と、画像および音声の処理と、多重化および送信する処理との流れを示している。
【0055】
まず、送信する画像データの処理について説明を行う。始めに、カメラ6は、撮影した画像データを画像合成部38に送信する。そして、画像合成部38は、取得した送信元の画像データに対して、人物の画像部分と背景の画像部分との認識を行う。その後、画像合成部38は、背景の画像部分と認識された部分に画像データベース21から送信側の通話者が選択した画像を合成して、画像データGを作成する。このとき、送信側の通話者が選択したマスク、キャラクター、マスコット、メッセージなどの画像を合成しても良い。最後に、画像コーデック部33は、合成した画像データGを符号化する。なお、送信元は、回線状況や電話端末1の処理能力になど応じて、任意のタイミングで以上の画像データの処理機能をOFFにしても良い。
【0056】
次に、送信する音声データの処理について説明を行う。始めに、送信側の通話者は、音源データベース20から任意の背景音を選択する。送信する画像データの処理において画像データベース21から選択した画像に対応した音源データを自動的に選択してもよい。例をあげると、海の背景画像に対して波の背景音などである。そして、3次元音響処理部39は、3次元音響の技術を用いた音響エフェクトを付加してステレオ音声の背景音を作成する。ここで、左音をL、右音をRとする。なお、送信元の通話者は、回線状況や電話端末1aの処理能力になど応じて、任意のタイミングで以上の3次元音響の技術を用いた音響エフェクトを付加する機能をOFFにしても良い。
【0057】
その後、D/A変換部31は、作成されたステレオ音声の背景音LおよびRをデジタル信号からアナログ信号へ変換する。本実実施形態では、音源データベース20内の音源データはデジタルデータとしたが、アナログデータであってもよい。その場合、ステレオ音声の背景音をデジタル信号からアナログ信号に変換する必要はない。
【0058】
さらに、音声合成部36は、ステレオ音声の背景音LおよびRのそれぞれに対し、マイク7から取得した主音声Vを合成した後、それらの和信号L+R+2Vと差信号L−Rとを合成する。このとき、マイク7から取得した主音声Vには、周囲の雑音を除去する処理を行うことが好ましい。
【0059】
なお、送信元の通話者は、回線状況や電話端末1aの処理能力になど応じて、任意のタイミングで以上の背景音の合成を行う機能をOFFにしても良い。また、マイク7より取得される主音声Vはモノラル音声としたが、ステレオ音声であってもよい。ここで、和信号L+R+2Vと差信号L−Rを作成するのは、受信側の電話端末1bがステレオ音声の受信および再生に対応していない場合(例えば、モノラル出力の場合など)に、和信号L+R+2Vのみを使用して出力を行うためである。その後、A/D変換部30は、生成した和信号L+R+2Vおよび差信号L−Rをアナログ信号からデジタル信号に変換する。
【0060】
最後に、音声コーデック部32は、変換したデジタル信号の符号化を行う。そして、画像コーデック部33が符号化した画像データGと、音声コーデック部32が符号化した和信号の音声データL+R+2Vおよび差信号の音声データL−Rとの3つのデータを多重化部34に入力する。
【0061】
多重化部34は、入力されたデータを用いて多重化を行う。多重化には、例えば、ITU−Tの勧告で規定されている多重化プロトコルであるH.223を利用する。H.223では、各データを各チャネルに割り当てて多重化を行う。本実施形態では、画像データGは画像チャネルを利用し、和信号の音声データL+R+2Vは音声チャネルを利用し、差信号の音声データL−Rはデータチャネルを利用して通信を行う。多重化したデータは、通信部4およびアンテナ3を介して無線送信する。なお、多重化したデータのデータ構造については後述する。
【0062】
図3は、本実施形態の電話システムにおいて、テレビ電話機能による通話を行う際に受信側の電話端末1bにおいて実行される、受信および多重化分離する処理と、画像および音声の処理と、出力処理との流れを示している。
【0063】
まず、多重化分離部37は、アンテナ3および通信部4を介して受信した多重化データを、画像データG、和信号の音声データL+R+2V、および差信号の音声データL−Rとの3つのデータに分離する。ここで、画像データGは、送信側の通話者が撮影した画像に画像データベースから選択した背景画像を合成したものである。また、和信号の音声データL+R+2Vは、3次元音響の技術を用いた音響エフェクトを付加したステレオ音声の背景音L、Rにそれぞれ主音声Vを合成した2つの音L+V、R+Vの和である。また、差信号の音声データL−Rは、上記2つの音L+V、R+Vの差である。
【0064】
まず、受信した画像データの処理について説明する。画像コーデック部33は、多重化分離によって分離された画像データGの復号化を行う。その後、複合化した画像をディスプレイ5に表示する。なお、受信側の通話者は、回線状況や電話端末1bの処理能力になど応じて、任意のタイミングで以上の処理を行う画像データ処理機能をOFFにしても良い。
【0065】
次に、分離した音声データの処理について説明する。始めに、音声コーデック部32は、和信号L+R+2Vおよび差信号L−Rの音声データをそれぞれ復号化する。そして、D/A変換部31は、復号化した音声データをデジタル信号からアナログ信号へ変換する。その後、音声分離部37は、アナログ信号に変換された音声データL+R+2VおよびL−Rを用いて、和信号の音声データL+R+2Vをステレオの音声データL+V、R+Vに分離する。
【0066】
和信号L+Rおよび差信号L−Rの和を取ることにより左音声Lを、和信号L+Rおよび差信号L−Rの差を取ることにより右音声Rを得ることができる。さらに、A/D変換部30は、得られた左右の音声LおよびRをデジタル信号に変換する。最後に、主制御部2は、デジタル信号に変換された左右の音声データLおよびRを、左右のスピーカー8aおよび8bから出力する。出力された音声データの背景音は、3次元音響の技術を用いた音響エフェクトが付加されたステレオ音声となる。
【0067】
以上のように、本実施形態の電話システムは、主音声である会話音声Vをモノラルで送信するとともに、背景音LおよびRをステレオで送信することで、聞き取りやすさが重視される会話音声Vと、音質や臨場感が重視される背景音LおよびRを独立して送信する通話を実現することができる。
【0068】
また、本実施形態の電話システムは、ステレオ出力に対応している通信端末1では、モノラルである主音声Vとステレオである背景音LとRとが合成された信号L+R+2VおよびL−Rを受信し臨場感のある通話を実現するとともに、ステレオ出力に対応していない通話端末であっても、主音声信号と右側音声信号と左側音声信号との和信号L+R+2Vを従来の音声チャネルを介して受け取ることで、会話音声Vおよび背景音LとRとが合成された音声の信号L+R+2Vを受信しモノラルで出力する通信を実現できる。
【0069】
また、本実施形態の電話システムは、背景音LおよびRに音響エフェクトを施し臨場感ある背景音とするとともに、会話音声である主音声Vに音声エフェクトを適用することを回避できるので、音声エフェクトにより会話音声を聞き取りにくくしてしまうことを回避できる。
【0070】
また、本実施形態の電話システムは、1本の通信回線を用いて複数の通話音V、L、Rを同時に送信するとともに、送信元の画像Gを送信することが出来、上記の臨場感ある音声通話を行う電話システムを、テレビ電話に対して好適に適用することができる。
【0071】
また、本実施形態の電話システムは、送信元の人物の画像に任意の背景画像を合成したデータGを他方の電話端末1bに表示するテレビ電話システムを実現することができる。
【0072】
図4は、本実施形態における多重化されたデータのデータ構造である。本実施形態では、ITU−Tの勧告で規定されている多重化プロトコルであるH.223に基づいて、各論理チャネルのデータを多重化して送信を行う。各チャネルは、音声、ビデオ、データのチャネルから構成される。本実施形態における多重化されたデータのフォーマットとして音声チャネルでは和信号の音声データL+R+2V、ビデオチャネルでは画像データG、データチャネルでは差信号の音声データL−Rを送信する。
【0073】
音声チャネルのデータは20msに一度送信しなければならないため、固定長のデータとなる。これにより、データチャネルの音声データL−Rも同じサイズのデータを送信することが望ましい。一度に送信できる多重化したデータのサイズは決まっているため、全体のサイズTからヘッダのサイズhと音声チャネルのサイズaとデータチャネルのサイズaとを差し引いたT−(h+2a)がビデオチャネルのデータ分となる。この割合は、所定の多重化テーブルによって決定する。音声データのサイズaは、送信する音声データの音質、および、送信する画像データの画質によって各チャネルのサイズが占める割合が決定される。それぞれの画質が許す範囲で、各チャネルのサイズの割合を変更しても良い。
【0074】
図5は、多重化されたデータの別のデータ構造を示している。図示のように、音声チャネルで音声データVを、ビデオチャネルで画像データGを、データチャネルで音声データL+RおよびL−Rを送信しても良い。この場合、音声データL+RおよびL−Rに3次元音響の技術を用いた音響エフェクトを付加せずに送信し、受信先の電話端末1bに3次元音響処理部39を備えることで、受信先の電話端末1bによって3次元音響の技術を用いた音響エフェクトを付加しても良い。また、受信先は、回線状況や電話1bの処理能力になど応じて、任意のタイミングで以上の3次元音響の技術を用いた音響エフェクトを付加する機能をOFFにしても良い。
【0075】
本実施形態では、デジタル回線を用いた通信について説明したが、これに限定されるものではなく、アナログ回線を用いた通信であっても良い。その場合、A/D変換部30およびD/A変換部31を省いた構成の電話端末1であってもよい。
【0076】
〔実施の形態2〕
次に、本発明の別の実施形態について、図6〜図8を参照しつつ説明する。
【0077】
本実施形態の電話システムでは、図2および図3に示されるシステムに比べて、送信側の電話端末1aが行っていた背景音に3次元音響の技術を用いた音響エフェクトを付加する処理と、送信側の通話者が撮影した画像に背景画像を合成する処理とが、受信側の電話端末1bによって行われる構成となっている点が異なり、その他の構成は同様である。
【0078】
このため、本実施形態では、送信側の電話端末1aにおいて、D/A変換部31と音声合成部38を省略する一方で(図2・図6参照)、識別信号生成部(送信手段)60を追加する構成としている。また、受信側の電話端末1bにおいて、音源データベース20と音源選択部(受信手段)51と3次元音響処理部39と音声合成部36と画像データベース21と画像選択部(受信手段)50と画像合成部38と識別信号処理部(受信手段)61を追加する一方で、音声分離部37を省略する構成(図3・図7参照)としている。
【0079】
なお、上記実施形態で説明した構成と同様の機能を有する構成には同一の符号を付して、その説明を省略する。また、本実施形態を構成する場合、送信側の電話端末1aと受信側の電話端末1bは同じ構成であることが好ましいが、これに限定されるものではない。上記構成において、送信側の電話端末1aがテレビ電話通話機能を用いて画像データと音声データを受信側の電話端末1bへ送信する際の動作を、図6に基づき説明すると、以下の通りである。
【0080】
図6は、本実施形態の電話システムにおいて、テレビ電話機能による通話を行う際に送信側の電話端末1aにおいて実行される、入力処理と、画像および音声の処理と、多重化および送信する処理との流れを示している。
【0081】
まず、送信する画像データの処理について説明を行う。始めに、カメラ6は撮影した画像データを画像選択部51に送信する。そして、送信元の通話者は、画像データベース21より背景画像を選択する。選択した背景画像に関する情報は、識別信号Iの生成に用いられる。なお、識別信号Iの生成については後述する。その後、画像コーデック部33は、撮影した画像データGを符号化する。また、音源選択部50は、選択した背景画像を元に音源データベース20から適切な背景音を選択する。同様に、選択した背景音に関する情報も、音源・画像データ識別信号Iの生成に用いられる。
【0082】
次に、音源・画像データの識別信号の処理について説明を行う。上記送信する画像データの処理において、画像選択部51は、画像データベース21より背景画像を選択した。また、音源選択部50は、画像選択部51によって選択された背景画像を元に音源データベース20から適切な背景音を選択した。識別信号生成部60は、上記の選択されたデータを元に識別信号Iを生成する。なお、識別信号Iは、画像データベース21および音源データベース20内のデータ番号であってもよいし、それらのテーマやキーワードを検索キーに設定したものであってもよい。また、画像データベース21および音源データベース20の内容がまったく同一である場合は、各データを特定する具体的なID番号であってもよい。
【0083】
最後に、送信する音声データの処理について説明を行う。始めに、マイク7は、取得した主音声VをA/D変換部30に送信する。次に、A/D変換部30は、取得した主音声Vをアナログ信号からデジタル信号に変換する。そして、音声コーデック部32は、変換したデジタル信号の符号化を行う。
【0084】
上記送信する画像データの処理、識別信号の処理、送信する音声データの処理によって、送信側の通話者が撮影した画像データGと、識別信号Iと、主音声の音声データVとの3つのデータを多重化部34に入力する。多重化部34は、入力されたデータを用いて多重化を行う。本実施形態では、画像データGは画像チャネルを利用し、識別信号Iはデータチャネルを利用し、主音声の音声データVは音声チャネルを利用して通信を行う。多重化したデータは、通信部4およびアンテナ3を通して送信する。
【0085】
図7は、本実施の形態の電話端末1において、テレビ電話通話機能による通話を行う際に受信側の電話端末1bにおいて実行される、受信および多重化分離離する処理と、画像および音声の処理と、画像データと音声データの出力処理との流れである。
【0086】
まず、アンテナ3および通信部4を介して多重化したデータを、多重化分離部37は、送信側の通話者が撮影した画像データGと、識別信号Iと、主音声の音声データVとの3つのデータに多重化分離する。受信した上記3つのデータの処理方法は、以下のとおりである。
【0087】
まず、受信した画像データの処理について説明する。始めに、画像コーデック部33は、多重化分離によって分離された画像データGの復号化を行う。そして、画像合成部38は、取得した送信元の画像データに対して、人物の画像部分と背景の画像部分の認識を行う。その後、画像合成部38は、背景の画像部分と認識された部分に、識別信号Iを元に画像データベース21から選択した画像を合成する。最後に、合成した画像をディスプレイ5に表示する。
【0088】
次に、受信した音声データの処理について説明する。始めに、音声コーデック部32は、受信した主音声Vの音声データを復号化する。そして、D/A変換部31aは、復号化した音声データをデジタル信号からアナログ信号へ変換する。さらに、音源選択部51は、識別信号Iを元に音源データベース20から選択する。その後、3次元音響処理部39は、選択した背景音に3次元音響の技術を用いた音響エフェクトを付加して、ステレオ音声の背景音を作成する。
【0089】
ここで、左音をL、右音をRとする。D/A変換部31bは、作成されたステレオ音声の背景音LおよびRをデジタル信号からアナログ信号へ変換する。上記では、音源データベース内の音源データはデジタルデータとしたが、アナログデータであってもよい。その場合、ステレオ音声の背景音をデジタル信号からアナログ信号に変換する必要はない。また、D/A変換部31aと31bは同じであってもよいし、違ってもよい。最後に、音声合成部36は、左の背景音Lと主音声V、および、右の背景音Rと主音声Vを合成する。合成されたデータは、左のスピーカー8aおよび右のスピーカー8bより出力される。本実施形態において、スピーカーより出力される音声信号はアナログ信号としたが、実施形態1のようにデジタル信号による出力であってもよい。
【0090】
図8は、本実施形態における多重化されたデータの構成である。音声チャネルでは音声データV、ビデオチャネルでは画像データG、データチャネルでは識別信号Iが送信される。各チャネルの占める割合は多重化テーブルによって決定するが、音声データの送信周期が許す範囲において音質・画質を変更し、各チャネルの割合を変更しても良い。本実施形態では、デジタル回線を用いた通信について説明したが、これに限定されるものではなく、アナログ回線を用いた通信であっても良い。
【0091】
以上のように、本実施形態の電話システムは、実施形態1で述べた効果に加えてさらに、主音声Vを実際に送信するとともに背景音LおよびRについては識別信号Gのみを送信し、受信端末1bにおいて識別信号Gに基づいた背景音データを合成することで、通信するデータ量を減らすことが出来るという効果を奏する。なお、主音声Vは従来の音声チャネルで送信されるため、背景音LおよびRの出力に対応していない電話端末であっても、主音声Vのみの通話を問題なく行うことが出来る。
【0092】
また、本実施形態の電話システムは、音声Vおよび人物画像Gを実際に送信するとともに背景画像については識別信号Iのみを送信し、受信端末1bにおいて画像データベースから識別信号Gに基づいた背景画像データを選択し合成することで、通信するデータ量を減らすことが出来る。
【0093】
なお、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0094】
例えば、上記実施形態の電話端末1の各部や各処理ステップは、CPUなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することができる。したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読取り、当該プログラムを実行するだけで、本実施形態の電話端末1の各種機能および各種処理を実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。
【0095】
この記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであっても良い。
【0096】
また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されているものとする。
【0097】
また、上記プログラムメディアとしては、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等がある。
【0098】
また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。
【0099】
さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。
【産業上の利用可能性】
【0100】
以上のように、本発明に係る電話システムは、複数の通話音を送受信する手段により、同時に複数の通話音を使用する通話を行い、複数の通話音を出力することが出来るので、携帯電話システム、固定電話システム、IP電話システムなどの任意の電話システムに適用できる。
【図面の簡単な説明】
【0101】
【図1】本発明の一実施形態である電話システムに利用される電話端末の概略構成を示すブロック図である。
【図2】上記電話端末において、テレビ電話機能による通話を行う場合における送信に関する構成を示すブロック図である。
【図3】上記電話端末において、テレビ電話機能による通話を行う場合における受信に関する構成を示すブロック図である。
【図4】上記電話端末が送信するデータのデータ構造の、一例を示す図である。
【図5】上記電話端末が送信するデータのデータ構造の、別の例を示す図である。
【図6】本発明の別の実施形態である電話システムに利用される電話端末において、テレビ電話機能による通話を行う場合における送信に関する構成を示すブロック図である。
【図7】上記電話端末において、テレビ電話機能による通話を行う場合における受信に関する構成を示すブロック図である。
【図8】上記電話端末が送信するデータのデータ構造の一例を示す図である。
【符号の説明】
【0102】
1 電話端末
2 主制御部(送信手段、受信手段)
3 アンテナ(送信手段、受信手段)
4 通信部(送信手段、受信手段)
5 ディスプレイ(表示手段)
6 マイク
7 カメラ(撮影手段)
8a 左スピーカー(音出力手段)
8b 右スピーカー(音出力手段)
20 音源データベース(記憶手段)
21 背景画像データベース(記憶手段)
30 A/D変換部
31 D/A変換部
32 音声コーデック
33 画像コーデック
34 多重化部(送信手段)
35 多重化分離部(受信手段)
36 音声合成部(送信手段、受信手段)
37 音声分離部(受信手段)
38 画像合成部(送信手段、受信手段)
39 3次元音響処理部(送信手段、受信手段)
50 画像選択部(送信手段、受信手段)
51 音声選択部(送信手段、受信手段)
60 識別信生成部(送信手段)
61 識別信号処理部(受信手段)

【特許請求の範囲】
【請求項1】
互いに通話を行う2つの電話端末を備えた電話システムであって、
一方の電話端末は、複数の通話音を他方の電話端末に送信する送信手段を備えており、
前記他方の電話端末は、前記一方の通信端末からの複数の通話音を受信する受信手段と、上記複数の通話音をそれぞれ出力する複数の音出力手段とを備えることを特徴としている。
【請求項2】
前記送信手段は、前記複数の通話音に基づいて複数の音声信号を生成し、生成した複数の音声信号を音声チャネルおよびその他のチャネルを介して前記他方の電話端末に送信するものであり、
前記受信手段は、前記複数の音声信号を、前記音声チャネルおよび前記その他のチャネルを介して受信し、受信した複数の音声信号に基づいて複数の通話音を生成するものであることを特徴とする請求項1に記載の電話システム。
【請求項3】
前記複数の通話音は、左側の音および右側の音を含むことを特徴とする請求項2に記載の電話システム。
【請求項4】
前記送信手段は、前記左側の音の信号である左側音声信号と前記右側の音の信号である右側音声信号との和信号を生成するとともに、前記左側音声信号と前記右側音声信号との差信号を生成し、前記和信号を、前記音声チャネルを介して送信するとともに、前記差信号を、前記その他のチャネルを介して送信しており、
前記受信手段は、前記音声チャネルを介して前記和信号を受信するとともに、前記その他のチャネルを介して前記差信号を受信することを特徴とする請求項3に記載の電話システム。
【請求項5】
前記複数の通話音は、主音声および背景音を含み、前記主音声はモノラルであり、前記背景音は左側の背景音と右側の背景音とを含むステレオであることを特徴とする請求項2に記載の電話システム。
【請求項6】
前記送信手段は、前記主音声の信号である主音声信号と、前記左側の背景音の信号である左側音声信号と、前記右側の背景音の信号である右側音声信号とを含む和信号を生成するとともに、前記左側音声信号と前記右側音声信号との差信号を生成し、前記和信号を、前記音声チャネルを介して送信するとともに、前記差信号を、前記その他のチャネルを介して送信しており、
前記受信手段は、前記音声チャネルを介して前記和信号を受信するとともに、前記その他のチャネルを介して前記差信号を受信することを特徴とする、請求項5に記載の電話システム。
【請求項7】
前記送信手段は、前記主音声の信号である主音声信号を生成するとともに、音源データの選択に基づいて識別信号を生成し、前記主音声信号を、前記音声チャネルを介して送信するとともに、前記識別信号を、前記その他のチャネルを介して送信しており、
前記他方の電話端末は、各種の背景音の音源データを記憶する記憶手段をさらに備えており、
前記受信手段は、前記主音声信号を、前記音声チャネルを介して受信するとともに、前記識別信号を前記その他のチャネルを介して受信し、前記主音声信号に基づいて主音声を生成するとともに、前記識別信号に基づいて前記記憶手段から前記音源データを選択して前記背景音を生成することを特徴とする請求項5に記載の電話システム。
【請求項8】
前記背景音に対し、3次元音響を用いた音響エフェクトを施すことを特徴とする請求項5ないし7の何れか1項に記載の電話システム。
【請求項9】
前記一方の電話端末は、撮影を行う撮影手段をさらに備えており、
前記送信手段は、さらに、前記撮影手段が撮影した撮影画像の信号である画像信号を、画像チャネルを介して送信しており、
前記受信手段は、さらに、前記画像信号を、前記画像チャネルを介して受信し、受信した画像信号に基づいて画像を生成するものであり、
前記他方の電話端末は、前記画像を表示する表示手段をさらに備えることを特徴とする請求項1ないし8の何れか1項に記載の電話システム。
【請求項10】
前記送信手段は、前記撮影画像に別の画像を合成した画像の信号である画像信号を、画像チャネルを介して送信することを特徴とする請求項9に記載の電話システム。
【請求項11】
前記送信手段は、さらに、画像データの選択に基づいて識別信号を生成し、該識別信号を前記音声チャネルおよび前記画像チャネルの他のチャネルを介して送信しており、
前記他方の電話端末は、各種の画像データを記憶する記憶手段をさらに備えており、
前記受信手段は、さらに、前記識別信号を前記他のチャネルを介して受信し、前記識別信号に基づいて前記記憶手段から前記画像データを選択し、選択した画像データの画像を前記画像信号の画像に合成しており、
前記表示手段は、前記受信手段が合成した画像を表示することを特徴とする請求項9項に記載の電話システム。
【請求項12】
請求項1ないし11の何れか1項に記載の電話システムに利用される電話端末。
【請求項13】
互いに通話を行う2つの電話端末を備えた電話システムの通話方法であって、
一方の電話端末は、複数の通話音を他方の電話端末に送信し、
前記他方の電話端末は、受信した複数の通話音をそれぞれ外部に出力することを特徴としている電話システムの通話方法。
【請求項14】
請求項1ないし11の何れか1項に記載の電話システムを動作させるための電話システム制御プログラムであって、コンピュータを上記送信手段または上記受信手段として機能させるための電話システム制御プログラム。
【請求項15】
請求項14に記載の電話システム制御プログラムが記録されたコンピュータ読取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2006−217187(P2006−217187A)
【公開日】平成18年8月17日(2006.8.17)
【国際特許分類】
【出願番号】特願2005−27044(P2005−27044)
【出願日】平成17年2月2日(2005.2.2)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】