説明

会話種別判定装置、マルチメディア品質推定装置、会話種別判定方法およびマルチメディア品質推定方法

【課題】会話種別を判定し、会話種別および利用環境条件を考慮したマルチメディア品質を推定する。
【解決手段】マルチメディア品質推定装置2は、通信端末1間で送受信されるパケットを収集する通信パケット収集部21と、パケットから音声情報を抽出する音声情報収集部22と、パケットから映像情報を抽出する映像情報収集部23と、遅延品質を推定する遅延品質推定部24と、音声品質を推定する音声品質推定部25と、音声情報から通信端末1間の会話の特徴量を抽出し、会話種別を判定するタスク判断部26と、映像品質を推定する映像品質推定部27と、外部から通信端末1の利用環境条件を受け取る利用環境条件入力部28と、会話種別および利用環境条件を考慮してマルチメディア品質を推定するマルチメディア品質推定部29とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークを介して映像と音声を伝送する映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定する会話種別判定装置および会話種別判定方法、並びに、判定された会話種別を利用して映像・音声通信サービスにおけるマルチメディア品質を推定するマルチメディア品質推定装置およびマルチメディア品質推定方法に関するものである。
【背景技術】
【0002】
映像配信サービスにおいては、高品質な映像の授受を実現するために、提供されたマルチメディアの品質を適切かつ迅速に評価する手法の確立が望まれている。
従来、映像品質評価は、ユーザがその映像を実際に観たときに感じる品質を測定する、いわゆる主観品質評価が基本である。しかしながら、主観品質評価は専用の設備と膨大な時間および労力を要する。そこで、映像品質評価をより効率的に行うために、映像から物理的に測定される特徴の量から主観品質を推定する技術(以下、客観品質評価技術という)の開発が望まれている。
【0003】
従来の客観品質評価技術は、マルチメディア品質と、音声品質、映像品質および遅延品質との関係、並びに音声品質、映像品質および遅延品質のうちの2つに対する交互作用を考慮したモデルを作成してきた(例えば特許文献1参照)。ここで、マルチメディア品質とは、音声品質、映像品質および遅延品質を考慮した、通信サービスの総合的な品質のことを言う。
また、従来、双方向の映像・音声通信サービスといえばテレビ会議サービスであり、マルチメディア品質の推定方法としては、1対1の双方向で同程度のやり取りが行われ、同程度の通信端末が利用されていることを想定していた。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−244321号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、テレビ会議サービスの利用状態は利用目的によって異なる。例えば、結論を導く討議を行う会議もあれば、講演や講義のように一方的な映像および音声を送るだけの会議もある。討議を行うような会議では、テレビ会議サービスで結ばれた2つ以上の地点で映像の動きや会話の発生状況が似通っている状態と思われるが、講演のような場合には、送話者の側では映像の動きや発話が活発でも受話者の側ではほとんど動きや発話がない状態となる。
【0006】
マルチメディア品質推定モデルにおける構成要素である映像品質や音声品質および遅延品質を考えた場合、作業遂行性が強い会議の場合には音声品質の重みが映像品質に比べて強くなり、遅延品質の重みも強くなる。また、一方的な伝達を目的としたような講演・講義のような場合には、映像品質の重みが音声品質に比べて強くなると同時に遅延品質の重みも弱くなると考えられる。
【0007】
さらに、このようなコミュニケーションの状況の違いに加え、双方向の利用環境の違いも出てくる。すなわち、一方の地点では高解像度のディスプレイ付きの通信端末を使用し、他方の地点では低解像度のディスプレイ付きの通信端末を使用している場合には、映像品質や音声品質に対する重みが異なる。ディスプレイの解像度が低くなればなるほど、映像品質に対する重要度が低くなり、音声品質に対する重要度が強くなると考えられる。
【0008】
本発明は、上記に鑑みてなされたもので、その目的とするところは、双方向の映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定することができる会話種別判定装置および会話種別判定方法を提供することにある。
また、本発明の目的は、会話種別および利用環境条件を考慮したマルチメディア品質を推定することができるマルチメディア品質推定装置およびマルチメディア品質推定方法を提供することにある。
【課題を解決するための手段】
【0009】
本発明は、ネットワークを介して映像と音声を伝送する映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定する会話種別判定装置であって、通信端末間で送受信されている通信パケットを収集する通信パケット収集手段と、この通信パケット収集手段が収集した通信パケットから音声情報を抽出する音声情報収集手段と、この音声情報収集手段が抽出した音声情報から通信端末間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定手段とを備えることを特徴とするものである。
また、本発明の会話種別判定装置の1構成例において、前記会話種別判定手段は、前記音声情報収集手段が抽出した音声情報から前記会話の特徴量として、通信端末間の会話のやり取りの頻度を算出するやり取り頻度算出手段と、算出されたやり取りの頻度を所定の判別閾値により分類することにより前記会話種別を判定する分類手段とを有することを特徴とするものである。
また、本発明の会話種別判定装置の1構成例において、前記やり取り頻度算出手段は、音声パケットの発生状況から前記やり取りの頻度を算出することを特徴とするものである。
【0010】
また、本発明のマルチメディア品質推定装置は、会話種別判定装置と、前記通信パケット収集手段が収集した通信パケットから映像情報を抽出する映像情報収集手段と、この映像情報収集手段が抽出した映像情報から映像品質を推定する映像品質推定手段と、前記音声情報収集手段が抽出した音声情報から音声品質を推定する音声品質推定手段と、前記抽出された音声情報と映像情報とから遅延品質を推定する遅延品質推定手段と、前記会話種別判定装置が判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定手段が算出した映像品質推定値と、前記音声品質推定手段が算出した音声品質推定値と、前記遅延品質推定手段が算出した遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定手段とを備えることを特徴とするものである。
また、本発明のマルチメディア品質推定装置は、会話種別判定装置と、前記通信パケット収集手段が収集した品質情報パケットから映像品質推定値、音声品質推定値および遅延品質推定値を取り出す品質情報抽出手段と、前記会話種別判定装置が判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定値と、前記音声品質推定値と、前記遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定手段とを備えることを特徴とするものである。
【0011】
また、本発明のマルチメディア品質推定装置の1構成例において、前記マルチメディア品質推定手段は、会話種別と利用環境条件との交互作用を考慮して決定された係数を会話種別毎および利用環境条件毎に予め記憶する係数テーブルと、前記会話種別判定装置が判定した会話種別と外部から入力された利用環境条件とに対応する係数を前記係数テーブルから取得し、取得した係数と前記映像品質推定値と前記音声品質推定値と前記遅延品質推定値とを所定の品質推定式に代入してマルチメディア品質推定値を算出するマルチメディア品質算出手段とを有することを特徴とするものである。
【0012】
また、本発明は、ネットワークを介して映像と音声を伝送する映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定する会話種別判定方法であって、通信端末間で送受信されている通信パケットを収集する通信パケット収集ステップと、この通信パケット収集ステップで収集した通信パケットから音声情報を抽出する音声情報収集ステップと、この音声情報収集ステップで抽出した音声情報から通信端末間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定ステップとを備えることを特徴とするものである。
また、本発明の会話種別判定方法の1構成例において、前記会話種別判定ステップは、前記音声情報収集ステップで抽出した音声情報から前記会話の特徴量として、通信端末間の会話のやり取りの頻度を算出するやり取り頻度算出ステップと、算出したやり取りの頻度を所定の判別閾値により分類することにより前記会話種別を判定する分類ステップとからなることを特徴とするものである。
また、本発明の会話種別判定方法の1構成例において、前記やり取り頻度算出ステップは、音声パケットの発生状況から前記やり取りの頻度を算出することを特徴とするものである。
【0013】
また、本発明のマルチメディア品質推定方法は、会話種別判定方法の各ステップと、前記通信パケット収集ステップで収集した通信パケットから映像情報を抽出する映像情報収集ステップと、この映像情報収集ステップで抽出した映像情報から映像品質を推定する映像品質推定ステップと、前記音声情報収集ステップで抽出した音声情報から音声品質を推定する音声品質推定ステップと、前記抽出した音声情報と映像情報とから遅延品質を推定する遅延品質推定ステップと、前記会話種別判定ステップで判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定ステップで算出した映像品質推定値と、前記音声品質推定ステップで算出した音声品質推定値と、前記遅延品質推定ステップで算出した遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定ステップとを備えることを特徴とするものである。
また、本発明のマルチメディア品質推定方法は、会話種別判定方法の各ステップと、前記通信パケット収集ステップで収集した品質情報パケットから映像品質推定値、音声品質推定値および遅延品質推定値を取り出す品質情報抽出ステップと、前記会話種別判定ステップで判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定値と、前記音声品質推定値と、前記遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定ステップとを備えることを特徴とするものである。
【0014】
また、本発明のマルチメディア品質推定方法の1構成例において、前記マルチメディア品質推定ステップは、会話種別と利用環境条件との交互作用を考慮して決定された係数を会話種別毎および利用環境条件毎に予め記憶する係数テーブルを参照して、前記会話種別判定ステップで判定した会話種別と外部から入力された利用環境条件とに対応する係数を前記係数テーブルから取得し、取得した係数と前記映像品質推定値と前記音声品質推定値と前記遅延品質推定値とを所定の品質推定式に代入してマルチメディア品質推定値を算出するマルチメディア品質算出ステップを有することを特徴とするものである。
【発明の効果】
【0015】
本発明によれば、通信端末間で送受信されている通信パケットを収集する通信パケット収集手段と、通信パケット収集手段が収集した通信パケットから音声情報を抽出する音声情報収集手段と、音声情報収集手段が抽出した音声情報から通信端末間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定手段とを設けることにより、会話種別を判定することができ、テレビ会議サービスのような双方向の映像・音声通信サービスにおけるマルチメディア品質を推定する際に会話種別を考慮した推定を行うことができる。
【0016】
また、本発明では、映像情報から映像品質を推定する映像品質推定手段と、音声情報から音声品質を推定する音声品質推定手段と、音声情報と映像情報とから遅延品質を推定する遅延品質推定手段と、会話種別判定装置が判定した会話種別と利用環境条件と映像品質推定値と音声品質推定値と遅延品質推定値に基づいてマルチメディア品質を推定するマルチメディア品質推定手段とを設けることにより、会話種別および利用環境条件を考慮した高精度の主観品質推定を実現することができ、双方向通信サービスの利用状況に対応したマルチメディア品質を高精度に推定することができる。その結果、本発明によれば、会議や自由会話のような双方向の強い会話、講演や講義のような双方向性の弱い会話のいずれの場合でも、マルチメディア品質を高精度に推定することができる。また、本発明では、一方の地点では高解像度のディスプレイ付きの通信端末を使用し、他方の地点では低解像度のディスプレイ付きの通信端末を使用しているような場合でも、マルチメディア品質を高精度に推定することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の第1の実施の形態に係るマルチメディア品質推定装置を利用した映像・音声通信サービスシステムの一例を示すブロック図である。
【図2】本発明の第1の実施の形態に係るマルチメディア品質推定装置の動作を示すフローチャートである。
【図3】本発明の第1の実施の形態に係るマルチメディア品質推定装置におけるタスク判断部の構成を示すブロック図である。
【図4】本発明の第1の実施の形態に係るマルチメディア品質推定装置におけるタスク判断部の動作を示すフローチャートである。
【図5】本発明の第1の実施の形態に係るマルチメディア品質推定装置におけるマルチメディア品質推定部の構成を示すブロック図である。
【図6】本発明の第1の実施の形態に係るマルチメディア品質推定装置におけるマルチメディア品質推定部の動作を示すフローチャートである。
【図7】本発明の第1の実施の形態に係るマルチメディア品質推定装置における係数テーブルの例を示す図である。
【図8】本発明の第2の実施の形態においてマルチメディア品質推定装置を通信端末内に設ける例を示すブロック図である。
【発明を実施するための形態】
【0018】
[第1の実施の形態]
以下、本発明の実施の形態を図面に基づき詳細に説明する。図1は本発明の第1の実施の形態に係るマルチメディア品質推定装置を利用した映像・音声通信サービスシステムの一例を示すブロック図である。
映像・音声通信サービスシステムは、複数の通信端末1と、複数のマルチメディア品質推定装置2と、複数の通信端末1を相互に接続するネットワーク3と、映像・音声通信サービスシステムの品質管理を行う品質管理装置4とから構成されている。各マルチメディア品質推定装置2は、通信端末1とネットワーク3との間に設置されている。
【0019】
マルチメディア品質推定装置2は、通信端末1間で送受信されている通信パケットを収集する通信パケット収集部21と、通信パケットから音声情報を抽出する音声情報収集部22と、通信パケットから映像情報を抽出する映像情報収集部23と、音声情報と映像情報とから遅延品質を推定する遅延品質推定部24と、音声情報から音声品質を推定する音声品質推定部25と、音声情報から通信端末1間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定手段となるタスク判断部26と、映像情報から映像品質を推定する映像品質推定部27と、外部から通信端末1の能力を表す利用環境条件を受け取る利用環境条件入力部28と、マルチメディア品質を推定するマルチメディア品質推定部29とを有する。通信パケット収集部21と音声情報収集部22とタスク判断部26とは、会話種別判定装置を構成している。
【0020】
図2はマルチメディア品質推定装置2の動作を示すフローチャートである。通信パケット収集部21は、ネットワーク3を介して通信端末1間で送受信されている通信パケットを収集する(図2ステップS1)。
音声情報収集部22は、通信パケット収集部21が収集した通信パケットから音声情報(音声パケット)を抽出する(図2ステップS2)。
映像情報収集部23は、通信パケット収集部21が収集した通信パケットから映像情報(映像パケット)を抽出する(図2ステップS3)。
【0021】
なお、本実施の形態において、映像品質、音声品質、遅延品質およびマルチメディア品質における「品質」とは、ユーザ体感品質(Quality of Experience:QoE)のことを意味し、主観評価実験で得られる平均オピニオン評点(Mean Opinion Score:MOS)もしくはMOSを推定することにより得られる客観品質評価値のことを指す。
【0022】
遅延品質推定部24は、映像情報収集部23が抽出した映像情報と音声情報収集部22が抽出した音声情報とから映像と音声との相対的遅延時間を算出し、遅延品質を推定する(図2ステップS4)。
【0023】
音声品質推定部25は、音声情報収集部22が抽出した音声パケットもしくは音声パケットに含まれる音声信号に基づいて音声品質を推定する(図2ステップS5)。音声品質を推定する方法としては、例えば国際標準化機関ITU−T(International Telecommunication Union Telecommunication Standardization Sector)勧告P.862による音声品質客観評価尺度PESQ(Perceptual Evaluation of Speech Quality)アルゴリズムを利用することができる。
【0024】
タスク判断部26は、音声情報収集部22が抽出した音声情報から通信端末別の有音区間の発生状況を測定し、通信端末1間の会話のやり取りの発生頻度から、映像・音声通信サービスシステムを利用している話者の会話の形式を表す会話種別を判定する(図2ステップS6)。会話種別としては、会議、講義(講演)、自由会話、データ照合などがある。
【0025】
会話種別を判定するための会話の特徴量としては、例えば文献「伊藤,北脇,“会話音声の時間的特徴量に着目した遅延品質評価法”,日本音響学会誌,Vol.43,No.11,p.851−857,1987」で定義されている「やり取りの頻度」を用いる。このやり取りの頻度Rnとは、一方の通信端末1を利用している話者Aと他方の通信端末1を利用している話者Bとの間の音声のやり取りの回数を会話毎に求め、このやり取りの回数を単位時間(例えば1分間)当たりに換算した値として以下のように算出するものである。
【0026】
【数1】

【0027】
ここで、iは会話番号、Rnab(i)は会話(i)における話者A,B間のやり取りの回数、Tmは会話時間長、tmは単位時間(1分間)を示す。やり取りの回数とは、話者Aの発話が終わって話者Bの発話に切り替わったり、話者Bの発話が終わって話者Aの発話に切り替わったりする回数、すなわち話者が切り替わる回数のことである。
【0028】
そして、タスク判断部26は、算出したやり取りの頻度Rnを特開2005−148225号公報に開示された判別閾値により閾値処理することにより、会話種別を判定することができる。具体的には、やり取りの頻度Rnが所定値a(例えば0)未満であれば、会話種別を「講義」と判定し、やり取りの頻度Rnが所定値a以上所定値b(a<b)未満であれば、会話種別を「会議」と判定し、やり取りの頻度Rnが所定値b以上所定値c(b<c)未満であれば、会話種別を「自由会話」と判定し、やり取りの頻度Rnが所定値c以上であれば、会話種別を「データ照合」と判定する。
【0029】
図3はタスク判断部26の構成を示すブロック図、図4はタスク判断部26の動作を示すフローチャートである。タスク判断部26は、通信端末別の有音区間の発生状況を測定する有音区間検出部261と、通信端末1間の会話のやり取りの回数を算出するやり取り回数算出部262と、通信端末1間の会話のやり取りの頻度を算出するやり取り頻度算出部263と、やり取りの頻度から会話種別を判定する分類部264とを有する。
【0030】
まず、有音区間検出部261は、音声情報収集部22が抽出した音声情報から、通信端末別の有音区間の発生状況を測定する(図4ステップS261)。
やり取り回数算出部262は、有音区間の発生状況から、話者が切り替わる回数であるやり取り回数を算出する(ステップS262)。
【0031】
やり取り頻度算出部263は、算出されたやり取り回数を用いて、式(1)により単位時間あたりの会話のやり取りの頻度Rnを算出する(ステップS263)。
そして、分類部264は、算出されたやり取りの頻度Rnを、上記のように所定の判別閾値a,b,cにより分類することにより、会話種別を判定する(ステップS264)。会話種別の判定が完了した時点でタスク判断部26の処理が終了する(ステップS265においてYES)。
【0032】
やり取りの頻度Rnを測定する方法として、音声信号ではなく音声パケット情報を用いる方法もある。すなわち、音声符号化にITU−T勧告G.729,G.723.1のAnnexに記載されている無音圧縮技術が用いられている場合、有音パケットのみ送出され、無音区間ではパケットは送出されないことから、音声パケットの発生状況からやり取りの頻度Rnを推定することができる。
【0033】
また、会話種別は、音声情報と映像情報を組み合わせることにより推定することもできる。この場合、タスク判断部26は、映像情報より映像動き量の時間的発生状況の推移を測定し、さらに有音区間の時間的発生状況を測定する。双方向性が強い通信の場合には、映像動き量の時間的発生状況と有音区間の時間的発生状況の一致度合いが高いと想定される。このため、映像動き量の時間的発生状況と有音区間の時間的発生状況の一致度を用いて、会話のやり取りの頻度を推定することができる。
【0034】
映像品質推定部27は、映像情報収集部23が抽出した映像パケットもしくは映像パケットに含まれる映像信号に基づいて映像品質を推定する(図2ステップS7)。映像信号を基に映像品質を推定する方法としては、ITU−T勧告J.144,J.246,J.247,J.249に記載されている方法がある。これらの方法はメディア信号もしくはメディア信号から得られる統計情報を用いて映像品質を推定する方法である。
【0035】
次に、マルチメディア品質推定部29は、タスク判断部26が判定した会話種別と、利用環境条件入力部28から入力された利用環境条件と、映像品質推定部27から入力された映像品質推定値と、音声品質推定部25から入力された音声品質推定値と、遅延品質推定部24から入力された遅延品質推定値に基づいて、マルチメディア品質を推定する(図2ステップS8)。
【0036】
図5はマルチメディア品質推定部29の構成を示すブロック図、図6はマルチメディア品質推定部29の動作を示すフローチャートである。
マルチメディア品質推定部29は、係数テーブル291と、マルチメディア品質算出部292とを有する。
【0037】
図7はマルチメディア品質推定部29の係数テーブル291の例を示す図である。係数テーブル291は、会話種別と通信端末1の能力を表す利用環境条件と後述するマルチメディア品質推定式の係数α,β,γ,δ,ε,ψ,φ,μとを対応付けて予め記憶しているものである。
【0038】
マルチメディア品質算出部292は、例えば通信端末1の利用者から利用環境条件入力部28を介して利用環境条件が入力され(図6ステップS291)、タスク判断部26から会話種別を表す数値が入力されると(ステップS292)、入力された利用環境条件および会話種別に対応する係数α,β,γ,δ,ε,ψ,φ,μを係数テーブル291から取得する(ステップS293)。
【0039】
そして、マルチメディア品質算出部292は、映像品質推定部27から入力された映像品質推定値MOSvを受信し(ステップS294)、音声品質推定部25から入力された音声品質推定値MOSaを受信し(ステップS295)、遅延品質推定部24から入力された遅延品質推定値MOSdを受信して(ステップS296)、これらの品質推定値と係数α,β,γ,δ,ε,ψ,φ,μとを以下のマルチメディア品質推定式に代入して、マルチメディア品質推定値MOStを算出し(ステップS297)、算出したマルチメディア品質推定値MOStを出力する(ステップS298)。
【0040】
双方向通信サービスを対象としたマルチメディア品質の推定方法としては、特許文献1に開示された方法がある。特許文献1に開示された方法では、マルチメディア品質推定モデルへの入力は、映像品質推定値MOSv、音声品質推定値MOSa、遅延品質推定値MOSdである。マルチメディア品質推定モデルは、会話を想定したモデルになっている。映像品質推定値MOSv、音声品質推定値MOSaおよび遅延品質推定値MOSdとマルチメディア品質推定値MOStとの関係を表すマルチメディア品質推定式は、以下のようになる。
MOSt=α・MOSa+β・MOSv+γ・MOSd+δ・MOSa・MOSv
+ε・MOSa・MOSd+ψ・MOSv・MOSd
+φ・MOSa・MOSv・MOSd+μ ・・・(2)
【0041】
マルチメディア品質算出部292は、式(2)を用いてマルチメディア品質推定値MOStを算出する。
以上で、マルチメディア品質推定装置2の処理が終了する。
【0042】
ここで、係数テーブル291に予め設定しておく係数α,β,γ,δ,ε,ψ,φ,μの求め方について説明する。まず、映像品質、音声品質、遅延品質、利用環境条件および会話種別が異なる複数の実験条件を設定し、これらの実験条件の各々について実験室等で主観評価実験を実施する。各品質は、映像・音声通信サービスの通信環境が制御できる実験系を用いることで制御可能である。主観評価実験では、想定する会話種別を模擬する会話を被験者に実施してもらい、映像品質評価値MOSv、音声品質評価値MOSaおよび遅延品質評価値MOSdと、総合的な品質であるマルチメディア品質評価値MOStとを求める。そして、これらの評価値のデータと式(2)とを使って回帰分析により、最適な係数α,β,γ,δ,ε,ψ,φ,μを利用環境条件毎および会話種別毎に求めるようにすればよい。
【0043】
図4の例では、会話種別を4つに分類し、例えば会議、講義、自由会話、データ照合のそれぞれに1,2,3,4の番号を割り当てている。また、図4の例では、利用環境条件を、映像を受信する通信端末1のディスプレイ装置の解像度としている。ここでは、QVGA(Quarter Video Graphics Array),VGA(Video Graphics Array)・SD(Standard Definition)、HD(High Definition)の3段階を設けている。なお、利用環境条件は、ディスプレイ装置の画面の大きさを表すものであってもよい。
【0044】
マルチメディア品質推定モデルにおける構成要素である映像品質や音声品質および遅延品質を考えた場合、会話種別が作業遂行性の強い会議の場合には、音声品質に対する重みが映像品質に比べて強くなり、遅延品質の重みも強くなる。また、一方的な伝達を目的とした講演・講義の場合には、映像品質の重みが音声品質に比べて強くなると同時に遅延品質の重みも弱くなると考えられる。
【0045】
さらに、このような会話種別の違いに加えて、利用環境条件の違いも出てくる。すなわち、一方の地点では高解像度のディスプレイ付きの通信端末を使用し、他方の地点では低解像度のディスプレイ付きの通信端末を使用している場合には、映像品質や音声品質に対する重みが異なる。ディスプレイの解像度が低くなればなるほど、映像品質に対する重要度が低くなり、音声品質に対する重要度が強くなると考えられる。係数テーブル291は、このような特性を考慮して導かれるものである。
【0046】
[第2の実施の形態]
第1の実施の形態では、マルチメディア品質推定装置2を通信端末1の直前に設置したが、これに限るものではなく、マルチメディア品質推定装置2とは別の通信パケット収集手段があれば、マルチメディア品質推定装置2をネットワーク3上の任意の箇所に配置して、マルチメディア品質推定を行ってもよい。
また、マルチメディア品質推定装置2による品質推定結果を通信端末1に通知するだけでなく、ネットワーク3を介して品質推定結果を品質管理装置4に通知して、品質管理装置4が実施する品質管理に役立てるようにしてもよい。
また、マルチメディア品質推定装置2を、図8に示すように通信端末1内に組み込んで利用してもよい。
【0047】
[第3の実施の形態]
第1の実施の形態では、通信端末1間で送受信される通信パケットそのものから音声情報および映像情報を収集したが、音声情報や映像情報の品質推定結果が搭載されているような品質情報パケットを収集してもよい。
【0048】
例えば、RTP(Real-time Transport Protocol)パケットで送受信される双方向通信サービスの場合、IETF(Internet Engineering Task Force)で制定されたRFC3611のRTCP−XRを用いることができる。RTCP−XRパケットには、パケット品質から推定されるネットワーク品質情報、メディア品質情報が格納されており、この情報から映像品質情報や音声品質情報、遅延品質情報を取り出すことができる。
【0049】
本実施の形態の場合、遅延品質推定部24、音声品質推定部25および映像品質推定部27の代わりに、RTCP−XRパケットから映像品質情報、音声品質情報および遅延品質情報を取り出す品質情報抽出部をマルチメディア品質推定装置2に設けるようにすればよい。
【0050】
なお、第1〜第3の実施の形態のマルチメディア品質推定装置2は、CPU、記憶装置および外部とのインタフェースを備えたコンピュータと、これらのハードウェア資源を制御するプログラムによって実現することができる。このようなコンピュータにおいて、本発明の会話種別判定方法およびマルチメディア品質推定方法を実現させるためのプログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供される。CPUは、記録媒体から読み込んだプログラムを記憶装置に書き込み、プログラムに従って第1〜第3の実施の形態で説明した処理を実行する。
【産業上の利用可能性】
【0051】
本発明は、映像・音声通信サービスにおけるマルチメディア品質を推定する技術に適用することができる。
【符号の説明】
【0052】
1…通信端末、2…マルチメディア品質推定装置、3…ネットワーク、4…品質管理装置、21…通信パケット収集部、22…音声情報収集部、23…映像情報収集部、24…遅延品質推定部、25…音声品質推定部、26…タスク判断部、27…映像品質推定部、28…利用環境条件入力部、29…マルチメディア品質推定部、261…有音区間検出部、262…やり取り回数算出部、263…やり取り頻度算出部、264…分類部、291…係数テーブル、292…マルチメディア品質算出部。

【特許請求の範囲】
【請求項1】
ネットワークを介して映像と音声を伝送する映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定する会話種別判定装置であって、
通信端末間で送受信されている通信パケットを収集する通信パケット収集手段と、
この通信パケット収集手段が収集した通信パケットから音声情報を抽出する音声情報収集手段と、
この音声情報収集手段が抽出した音声情報から通信端末間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定手段とを備えることを特徴とする会話種別判定装置。
【請求項2】
請求項1記載の会話種別判定装置において、
前記会話種別判定手段は、
前記音声情報収集手段が抽出した音声情報から前記会話の特徴量として、通信端末間の会話のやり取りの頻度を算出するやり取り頻度算出手段と、
算出されたやり取りの頻度を所定の判別閾値により分類することにより前記会話種別を判定する分類手段とを有することを特徴とする会話種別判定装置。
【請求項3】
請求項2記載の会話種別判定装置において、
前記やり取り頻度算出手段は、音声パケットの発生状況から前記やり取りの頻度を算出することを特徴とする会話種別判定装置。
【請求項4】
請求項1乃至3のいずれか1項に記載の会話種別判定装置と、
前記通信パケット収集手段が収集した通信パケットから映像情報を抽出する映像情報収集手段と、
この映像情報収集手段が抽出した映像情報から映像品質を推定する映像品質推定手段と、
前記音声情報収集手段が抽出した音声情報から音声品質を推定する音声品質推定手段と、
前記抽出された音声情報と映像情報とから遅延品質を推定する遅延品質推定手段と、
前記会話種別判定装置が判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定手段が算出した映像品質推定値と、前記音声品質推定手段が算出した音声品質推定値と、前記遅延品質推定手段が算出した遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定手段とを備えることを特徴とするマルチメディア品質推定装置。
【請求項5】
請求項1乃至3のいずれか1項に記載の会話種別判定装置と、
前記通信パケット収集手段が収集した品質情報パケットから映像品質推定値、音声品質推定値および遅延品質推定値を取り出す品質情報抽出手段と、
前記会話種別判定装置が判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定値と、前記音声品質推定値と、前記遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定手段とを備えることを特徴とするマルチメディア品質推定装置。
【請求項6】
請求項4または5記載のマルチメディア品質推定装置において、
前記マルチメディア品質推定手段は、
会話種別と利用環境条件との交互作用を考慮して決定された係数を会話種別毎および利用環境条件毎に予め記憶する係数テーブルと、
前記会話種別判定装置が判定した会話種別と外部から入力された利用環境条件とに対応する係数を前記係数テーブルから取得し、取得した係数と前記映像品質推定値と前記音声品質推定値と前記遅延品質推定値とを所定の品質推定式に代入してマルチメディア品質推定値を算出するマルチメディア品質算出手段とを有することを特徴とするマルチメディア品質推定装置。
【請求項7】
ネットワークを介して映像と音声を伝送する映像・音声通信サービスにおいて通信端末間で行われる会話の形式を表す会話種別を判定する会話種別判定方法であって、
通信端末間で送受信されている通信パケットを収集する通信パケット収集ステップと、
この通信パケット収集ステップで収集した通信パケットから音声情報を抽出する音声情報収集ステップと、
この音声情報収集ステップで抽出した音声情報から通信端末間の会話の特徴量を抽出し、この特徴量から会話種別を判定する会話種別判定ステップとを備えることを特徴とする会話種別判定方法。
【請求項8】
請求項7記載の会話種別判定方法において、
前記会話種別判定ステップは、
前記音声情報収集ステップで抽出した音声情報から前記会話の特徴量として、通信端末間の会話のやり取りの頻度を算出するやり取り頻度算出ステップと、
算出したやり取りの頻度を所定の判別閾値により分類することにより前記会話種別を判定する分類ステップとからなることを特徴とする会話種別判定方法。
【請求項9】
請求項8記載の会話種別判定方法において、
前記やり取り頻度算出ステップは、音声パケットの発生状況から前記やり取りの頻度を算出することを特徴とする会話種別判定方法。
【請求項10】
請求項7乃至9のいずれか1項に記載の各ステップと、
前記通信パケット収集ステップで収集した通信パケットから映像情報を抽出する映像情報収集ステップと、
この映像情報収集ステップで抽出した映像情報から映像品質を推定する映像品質推定ステップと、
前記音声情報収集ステップで抽出した音声情報から音声品質を推定する音声品質推定ステップと、
前記抽出した音声情報と映像情報とから遅延品質を推定する遅延品質推定ステップと、
前記会話種別判定ステップで判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定ステップで算出した映像品質推定値と、前記音声品質推定ステップで算出した音声品質推定値と、前記遅延品質推定ステップで算出した遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定ステップとを備えることを特徴とするマルチメディア品質推定方法。
【請求項11】
請求項7乃至9のいずれか1項に記載の各ステップと、
前記通信パケット収集ステップで収集した品質情報パケットから映像品質推定値、音声品質推定値および遅延品質推定値を取り出す品質情報抽出ステップと、
前記会話種別判定ステップで判定した会話種別と、通信端末の能力を表す利用環境条件と、前記映像品質推定値と、前記音声品質推定値と、前記遅延品質推定値に基づいて、通信サービスの総合的な品質であるマルチメディア品質を推定するマルチメディア品質推定ステップとを備えることを特徴とするマルチメディア品質推定方法。
【請求項12】
請求項10または11記載のマルチメディア品質推定方法において、
前記マルチメディア品質推定ステップは、
会話種別と利用環境条件との交互作用を考慮して決定された係数を会話種別毎および利用環境条件毎に予め記憶する係数テーブルを参照して、前記会話種別判定ステップで判定した会話種別と外部から入力された利用環境条件とに対応する係数を前記係数テーブルから取得し、取得した係数と前記映像品質推定値と前記音声品質推定値と前記遅延品質推定値とを所定の品質推定式に代入してマルチメディア品質推定値を算出するマルチメディア品質算出ステップを有することを特徴とするマルチメディア品質推定方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−4779(P2012−4779A)
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2010−137003(P2010−137003)
【出願日】平成22年6月16日(2010.6.16)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】