説明

画像送信装置及びその送信方法

【目的】音声データが無音でありデータ量が小さくなる場合に、画像データをIフレームとして符号化して送信するようにして、伝送エラーが発生してもその影響を解消する「画像送信装置及びその送信方法」を提供することである。
【構成】音声データと画像データとを多重化して送信する際、無音検出部27は、マイク33から取得した音声が無音であるか検出し、無音が検出された場合、画像コーデック24は、カメラ31から取得した画像をPフレームに代えてIフレームとして符号化して送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像送信装置及びその送信方法に係わり、特に、音声及び画像を取得して符号化し、音声符号化データと画像符号化データとを多重化して送信する画像送信装置及びその送信方法に関する。
【背景技術】
【0002】
近年、携帯電話や携帯情報端末ではカメラを搭載し、画像データ付き電子メールサービスやTV電話サービス等の種々の画像データ伝送サービスが使用できるようになっている。しかしこのようなシステムにおいて、画像データのような情報量が大きいデータを伝送しようとすると、伝送帯域が問題となりそのままの画像データでは伝送することはできない。
そこで、画像データを伝送する場合には、画像の符号化/復号処理が必要であり、携帯電話や携帯情報端末では現在MPEG−4と呼ばれる画像の符号化/復号方式が採用されている。
【0003】
MPEG−4は、画像データとして独立に意味をなす絶対値情報としてのフレーム(Iフレーム)と、1フレーム前の画像データとの差分情報であり画像データとして独立に意味をなさないフレーム(Pフレーム)で構成される。また、Iフレームは静止画として符号化した1画面の全画像情報を含む画像データであり、Pフレームは1フレーム前の動画像データとの差分情報であり、1画面の全画像情報ではない。そのため、IフレームはPフレームと比較して、データ量が大きいが高画質という特徴を持つ。
【0004】
図5はMPEG−4を使用した画像データの伝送システムの動作例を模式的に表したものである。同図において、例えば送信装置CP1においてV1、V2、V3、・・、VN、・・に示す画像データがカメラにより順次撮影されたとする。まず、送信装置CP1は上記画像データV1を静止画として符号化しIフレームを生成する。その後、送信装置CP1はこのIフレームとマイクから取得した音声データとを多重化して送信する。これに対し、受信装置CP2は、上記Iフレームを基に1画面データW1を復号して表示するとともに、上記音声データを再生する。
次に送信装置CP1は、上記画像データV2、V3、・・、VN、・・が得られるごとに、これらの画像データV2、V3、・・、VN、・・とその1フレーム前の画像データV1、V2、・・、VN−1(図示しない)、・・との差分を検出し、この差分情報をそれぞれ符号化してPフレームを生成する。その後、送信装置CP1はこのPフレームとマイクから取得した音声データとを多重化して送信する。これに対し、受信装置CP2は、上記Pフレームを受信するごとにそれぞれ、そのデータを1画面前に表示した画像データW1、W2・・、WN−1(図示しない)に加算して画像データを復号して表示するとともに、上記音声データを再生する。
これにより、例えば数Mbpsの情報量を持つ画像データは、数十Kbpsの情報量として伝送することを可能としている。
【0005】
しかし、図6に示すように、送信装置CP1より画像データ受信中に、送信装置CP1で撮影した画像データV2と画像データV1との差分情報であるPフレームを伝送する際に通信障害等により伝送エラーが発生したとする。そうすると、伝送エラーの影響により、受信装置CP2で表示される画像データW2′は正確な画像として表示されない。また、次フレームである画像データW3′は1画面前に表示した動画像データW2′と送信装置CP1により送信されるPフレームで構成されるため、正確な画像として表示することはできない。つまり、画像データ受信中に伝送エラーが発生した場合、その影響は現フレームだけでなく次フレーム以降にまで波及する。
【0006】
この伝送エラー発生による受信画像への影響は、送信装置CP1により再びIフレームが送信されることにより解消できる。しかし、送信装置CP1がIフレームを送信するタイミングは送信装置CP1に依存されるため、Iフレームの送信タイミングが長くなることがある。したがって、送信装置CP1によっては通信終了時まで伝送エラー発生による受信画像への影響が続くことがあった。
【0007】
Iフレーム送信制御の従来技術として、画像データ受信途中で画像データを記録開始する場合において、記録指示が入力された場合に受信側から送信側へIフレームの送信要求を行い、受信側からの送信要求に応じて、送信側から受信側にIフレームを伝送する伝送システムある(特許文献1参照)。この技術によれば、画像データ受信途中で記録を開始する場合でも、記録指示の入力直後から高画質のデータを記録できる。
【特許文献1】特開2001−251631号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、従来技術では、伝送エラーが発生してもIフレームの送信要求がされない限り、Iフレームを送信しないため、伝送エラーによる受信画像への影響を解消することができない。
従って、本発明の目的は、音声データが無音でありデータ量が小さくなる場合に、画像データをIフレームとして符号化して送信するようにして、伝送エラーが発生してもその影響を解消する画像送信装置及びその送信方法を提供することである。
【課題を解決するための手段】
【0009】
本発明の第1の態様は、音声及び画像を取得して符号化し、音声符号化データと画像符号化データとを多重化して送信する画像送信装置であり、無音を検出する無音検出部と、前記無音検出部により無音が検出された場合、前記画像を画像データとして独立に意味を成す絶対値情報として符号化するように指示する制御部と、前記指示に基づいて、前記画像を前記絶対値情報として符号化する画像符号化部と、前記画像符号化部により前記絶対値情報として符号化された画像符号化データを送信する送信部と、を備えている。
【0010】
上記画像送信装置の無音検出部は、前記音声符号化データのデータ量が所定値以下である場合、該音声符号化データを無音として検出する。
【0011】
本発明の第2の態様は、音声及び画像を取得して符号化し、音声符号化データと画像符号化データとを多重化して送信する画像送信装置の送信方法であり、無音を検出する第1ステップ、前記無音が検出された場合、前記画像を画像データとして独立に意味を成す絶対値情報として符号化するように指示する第2ステップ、前記指示に基づいて、前記画像を前記絶対値情報として符号化して送信する第3ステップ、を有している。
【0012】
前記第1ステップは、前記音声符号化データのデータ量が所定値以下である場合、該音声符号化データを無音として検出する。
【発明の効果】
【0013】
本発明によれば、音声符号化データのデータ量に基づいて無音を検出し、前記無音が検出された場合、前記画像を画像データとして独立に意味を成す絶対値情報として符号化するように指示し、前記指示に基づいて、前記画像を前記絶対値情報として符号化して送信するように構成したため、画像データ送信中に伝送エラーが発生しても、無音時に、受信画像への画質の影響を解消することができる。
【発明を実施するための最良の形態】
【0014】
(A)無線TV電話通信の仕組み
図1は、移動通信システムの送信装置CP1と受信装置CP2間で画像データ、音声データおよびコンピュータデータを多重化伝送することにより、無線TV電話通信を行う際の仕組みを示す図である。
送信装置CP1と受信装置CP2は物理レイヤにより相互に接続され、MUX−PDUと呼ばれるパケット単位でデータ伝送を行う。MUX−PDUは、図1に示すように先頭にフラグとヘッダを配置し、その後ろに画像データ、音声データおよびコンピュータデータを交互に配置したものである。ヘッダにはMUX−PDUの内容を表す情報が挿入される。物理レイヤの上位にはAL/MUXレイヤが配置され、このAL/MUXレイヤにおいて上記MUX−PDUが生成される。また、AL/MUXレイヤの上位には高位レイヤが配置され、ここでビデオチャネル、オーディオチャネルおよび制御・データチャネルの接続が行われる。高位レイヤは、後述する画像コーデック、音声コーデックおよびデータ通信部により実現される。
【0015】
図2は、MPEG−4ストリームのデータ構造を示す図である。MPEG−4ストリームは図1に示したビデオチャネルに挿入され伝送される。このMPEG−4ストリームでは、図2に示すように1画面の全ての画像要素を含むIフレームがまず送信され、以後フレームタイミングごとに前フレームとの差分情報からなるPフレームが順次送信される。但し、Pフレームに代えてIフレームを送信することもできる。
【0016】
(C)画像送受信装置の構成
図3は、本発明に係る画像送受信装置の構成を示すブロック図であり、図1の送信装置CP1及び受信装置CP2として使用できるものである。画像送受信装置は、携帯端末1と、車載機2とから構成される。携帯端末1は無線部3と、ベースバンド部4と、入出力部5と、電源部6とから構成され、車載機2はCPU41と、通信インターフェース42と、表示部43と、操作部44とから構成される。
【0017】
同図において、基地局から移動通信システム用の無線チャネルを介して到来した無線周波信号はアンテナ11で受信された後、アンテナ共用器(DUP)12を介して受信回路(RX)13に入力される。受信回路13は高周波増幅器、周波数変換器および復調器を備える。そして、上記無線信号を低雑音増幅器で低雑音増幅した後、周波数変換器において周波数シンセサイザ(SYN)14から発生された受信局部発信信号とミキシングして受信中間周波信号または受信ベースバンド信号に周波数変換し、その出力信号を復調器でディジタル復調する。復調方式としては、例えば、QPSK方式に対応した直交復調方式が用いられる。なお、上記周波数シンセサイザ14から発生される受信局部発信信号周波数は、ベースバンド部4に設けられた主制御部21から指示される
【0018】
上記復調器から出力された復調信号はベースバンド部4に入力される。ベースバンド部4は、主制御部21と、多重分離部22と、音声コーデック23と、画像コーデック24と、LCD制御部25と、通信インターフェース26とを備えている。
【0019】
上記復調信号は主制御部21において制御情報であるか画像データ等のマルチメディア情報であるかが識別され、マルチメディア情報であれば多重分離部22に入力されてここで音声データと画像データに分離される。そして、音声データは音声コーデック23に入力されてここで音声復号され、これにより再生された音声信号は入出力部5のスピーカ34から拡声出力される。一方、画像データは、画像コーデック24に入力されてここで画像復号処理され、これにより復号された画像信号は通信インターフェース26を介して接続された車載機2のCPU41に入力される。CPU41は、該画像信号を表示部43に入力して表示する。また、上記画像信号はLCD制御部25を介してLCD32に入力して表示することもできる。
【0020】
一方、TV電話通信が開始され、主制御部21より音声処理の指示がされると、音声コーデック23は、入出力部5のマイク33から出力されたユーザの送話音声信号を順次取得する。そして、音声コーデック23は、マイクから入力された送話音声信号を音声符号化し、この音声符号化データを多重分離部22に入力する。次に、画像コーデック24は、主制御部21より画像処理の指示がされると、入出力部5のカメラ31より順次画像を取得して符号化処理を行う。具体的には、カメラ31より入力される1フレーム目の画像に対してはIフレーム符号化処理を行い、2フレーム目以降の画像に対してはPフレーム符号化処理を行う。その後、画像コーデック24により符号化処理された画像は、多重分離部22に入力される。多重分離部22は、上記音声符号化データと画像符号化データとを所定のフォーマット基づいて多重化し、この多重化された送信データを主制御部21から無線部3の送信回路(TX)15に入力する。
以上の説明は音声が無音でない場合の送信処理である。音声が無音である場合、音声コーデック23は、ユーザの送話音声信号を符号化後、音声コーデック23が備える無音検出部27より無音検出を行う。無音検出部27より無音が検出された場合、音声コーデック23は、音声符号化データが無音であることを示す信号を生成して主制御部21に入力する。主制御部21はこの信号に基づいて、Iフレーム符号化要求信号を生成して画像コーデック24に入力する。画像コーデック24はIフレーム符号化要求信号に基づいて、カメラ31より取得した画像をPフレームに変えてIフレームとして符号化処理を行い、このIフレームを多重分離部22に入力する。そして、多重分離部22は、無音である音声符号化データとIフレームの画像データとを所定のフォーマット基づいて多重化し、この多重化された送信データを主制御部21から無線部3の送信回路(TX)15に入力する。
【0021】
送信回路15は変調器、周波数変換器および送信電力増幅器を備える。上記送信データは変調器でディジタル変調された後、周波数変換器により周波数シンセサイザ14から発生された送信局部発振信号とミキシングされて無線周波信号に周波数変換される。変調方式としてはQPSK方式が用いられる。そして、この生成された送信無線周波信号は、送信電力増幅器で所定の送信レベルに増幅された後、アンテナ共用器12を介してアンテナ11に入力され、このアンテナ11から基地局に向け送信される。
【0022】
電源部6は図示しないがリチウムイオン電池等のバッテリと、このバッテリを充電するための充電回路と、バッテリの出力電圧をもとに所定の電源電圧を生成する電圧生成回路を備えている。また、入力部5には主制御部21から出力された本端末の操作状態を表す情報、例えば、電話帳や受信強度やバッテリの残量などを表示するLCD32と、通話開始や終了を行うための操作部35と、LCD32や操作部35とを照明するための照明器36が備えられている。
【0023】
主制御部21は、図示しないがマイクロプロセッサと、ROMおよびRAMなどからなる内部メモリとを備えたもので、無線チャネルの接続制御や通信リンクの確立、通常の制御機能とを備えている。また、主制御部21は、車載機2が備える操作部44で行われるハンズフリーTV電話通信設定情報が通信インターフェース26を介して入力され、図示しない車速センサー等により、車両が停止中であることが検出された場合には、送信装置CP1より受信した画像データを表示するように制御し、車両が走行中であることを検出した場合には、送信装置CP1より受信した画像データを非表示するように制御する。
【0024】
(D)画像送信処理の動作
図4は、本発明に係る画像送信装置の動作を示すフローチャートである。なお、図示しないが、カメラ31により画像は順次撮影され、マイク33により音声は順次入力されている。
ユーザが操作部35によりTV電話通信開始を指示すると、主制御部21はこの指示に基づいて音声コーデック23に音声処理を要求する。これにより、音声コーデック23はマイク33から音声信号を取得して符号化し、音声符号化データを多重分離部22に入力する(ステップS1)。更に、主制御部21は、TV電話通信開始の指示に基づいて画像コーデック24に画像符号化処理を要求する。これにより、画像コーデック24はカメラ31より1フレーム目の画像を取得してIフレームとして符号化処理を行い、画像符号化データを多重分離部22に入力する(ステップS3)。そして、多重分離部22は、入力された音声符号化データ及び画像符号化データを所定のフォーマット基づいて多重化し、この多重化された送信データは無線部3により送信される(ステップS5)。以上の説明は1フレーム目の画像を送信する時の動作である。
次に、2フレーム目以降の画像を送信する時の動作を説明する。音声コーデック23はマイク33から音声信号を取得して符号化し、音声符号化データを多重分離部22に入力する(ステップS7)。その後、音声コーデック23が備える無音検出部27より無音検出を行う。具体的には、音声符号化データのデータ量が所定値以下であるか判定する(ステップS9)。ステップS9において、音声符号化データのデータ量が所定値以下でなければ、画像コーデック24は、カメラ31より画像を取得して1フレーム前の画像との差分データを生成し(ステップS11)、この差分データのデータ量が所定値以下であるか判定する(ステップS13)。ステップS13において、差分データのデータ量が所定値以下であれば、画像コーデック24は、上記画像をPフレームとして符号化処理を行い、画像符号化データを多重分離部22に入力する(ステップS15)。ステップS13において、差分データのデータ量が所定値以下でなければ、画像コーデック24は、上記画像をIフレームとして符号化処理を行い、画像符号化データを多重分離部22に入力する(ステップS17)。そして、多重分離部22は、入力された音声符号化データ及び画像符号化データを所定のフォーマット基づいて多重化し、この多重化された送信データは無線部3により送信される(ステップS19)。
一方、ステップS9において、音声符号化データのデータ量が所定値以下であれば、無音検出部27は、音声を無音と認識して、音声符号化データが無音であることを示す信号を生成して主制御部21に入力する(ステップS21)。主制御部21は、この信号に基づいて、Iフレーム符号化要求信号を生成して画像コーデック24に入力する。画像コーデック24は、Iフレーム符号化要求信号に基づいて、カメラ31より取得した画像をPフレームに変えてIフレームとして符号化処理を行い、このIフレームを多重分離部22に入力する(ステップS23)。その後、音声符号化データ及び画像符号化データは前述したステップS19の処理により、所定のフォーマット基づいて多重化されて無線部3により送信される。
次いで、主制御部21は、ユーザにより通信終了を指示されたかを判定する(ステップS25)。ステップS25において、ユーザにより通信終了を指示されれば、主制御部21は通信を終了し、ユーザにより通信終了を指示されなければ、ステップS7〜S23の処理を繰り返す。なお、図示しないが、ステップS5及びS23において送信された音声符号化データ及び画像符号化データは、受信装置CP2の無線部3で受信され、音声符号化データはスピーカ34により再生され、画像符号化データは車載機2の表示部43により表示される。
上記処理により、画像データ送信中に伝送エラーが発生しても、無音時にIフレームを送信するため、受信画像への画質の影響を解消することができる。
【0025】
本実施例では、画像データの符号化/復号方式にMPEG−4を用いているが、MPEG−4以外にH.264等のその他の方式を用いても実現できる。
【0026】
本実施例では、車両内で無線TV電話通信を行う場合を説明したが、車両内でネットワークを介してインターネット上のWWWサーバに接続し、このサーバから画像データを表示させるような場合にも本発明は適用できる。更に、車載機を接続しない携帯端末間での無線TV電話通信にも本発明は適用できる。
【0027】
その他、本発明は、画像送受信装置の構成や制御手順等についても、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【図面の簡単な説明】
【0028】
【図1】無線TV電話通信を行う際の仕組みを示す図である。
【図2】MPEG−4ストリームのデータ構造を示す図である。
【図3】本発明に係る画像送受信装置の構成を示すブロック図である。
【図4】本発明に係る画像送信装置の動作を示すフローチャートである。
【図5】MPEG−4を使用した画像データの伝送システムの動作例を模式的に表したものである。
【図6】MPEG−4を使用した画像データの伝送システムにおいて、伝送エラーが発生した場合の動作例を模式的に表した図である。
【符号の説明】
【0029】
CP1…送信装置
CP2…受信装置
1…携帯端末
2…車載機
21…主制御部
23…音声コーデック
24…画像コーデック
27…無音検出部



【特許請求の範囲】
【請求項1】
音声及び画像を取得して符号化し、音声符号化データと画像符号化データとを多重化して送信する画像送信装置において、
無音を検出する無音検出部と、
前記無音検出部により無音が検出された場合、前記画像を画像データとして独立に意味を成す絶対値情報として符号化するように指示する制御部と、
前記指示に基づいて、前記画像を前記絶対値情報として符号化する画像符号化部と、
前記画像符号化部により前記絶対値情報として符号化された画像符号化データを送信する送信部と、
を備えることを特徴とする画像送信装置。
【請求項2】
前記無音検出部は、前記音声符号化データのデータ量が所定値以下である場合、該音声符号化データを無音として検出する、
ことを特徴とする請求項1記載の画像送信装置。
【請求項3】
音声及び画像を取得して符号化し、音声符号化データと画像符号化データとを多重化して送信する画像送信装置の送信方法において、
無音を検出する第1ステップ、
前記無音が検出された場合、前記画像を画像データとして独立に意味を成す絶対値情報として符号化するように指示する第2ステップ、
前記指示に基づいて、前記画像を前記絶対値情報として符号化して送信する第3ステップ、
を有することを特徴とする画像送信装置の送信方法。
【請求項4】
前記第1ステップは、前記音声符号化データのデータ量が所定値以下である場合、該音声符号化データを無音として検出する、
ことを特徴とする請求項3記載の画像送信装置の送信方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2007−282164(P2007−282164A)
【公開日】平成19年10月25日(2007.10.25)
【国際特許分類】
【出願番号】特願2006−109531(P2006−109531)
【出願日】平成18年4月12日(2006.4.12)
【出願人】(000101732)アルパイン株式会社 (2,424)
【Fターム(参考)】