説明

通話品質の主観評価のための評価サンプル数を決定する方法及びサーバ

【課題】 通話品質の主観評価について、実質的に信頼できるMOS値を求めるために必要な総評価サンプル数を決定することができる方法及びサーバを提供する。
【解決手段】 サーバが、1回目として、評価者識別子数と、評価者当たりの評価サンプル数との乗算による総評価サンプル数の第1の主観評価値を収集し、第1の主観評価値の平均値MOSを導出する。サーバが、2回目として、総評価サンプル数まで、第2の主観評価値を収集し、第2の主観評価値を収集する毎に、第1の主観評価値の平均値と、その時点までに収集した第2の主観評価値の平均値とに基づく平方平均二乗誤差値を導出し、収集した第2の主観評価値の総評価サンプル数の累積数毎に、平方平均二乗誤差値RMSEを蓄積する。そして、所定の平方平均二乗誤差値以下に相当する総評価サンプル数を決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通話品質の主観評価のための評価サンプル数を決定する方法及びサーバに関する。
【背景技術】
【0002】
IP(Internet Protocol)電話装置又は携帯電話機においては、音声品質の良し悪しについて、その評価方法が問題となる。通話品質の評価方法において、実際に利用者自身が聞いて評価する主観評価と、測定装置により測定された値によって評価する客観評価とがある。通話品質における主観評価の1つに、MOS(Mean Opinion Store)評価がある(例えば非特許文献1参照)。これは、「相手の話が聞き取りにくい」又は「相手の声が自然に聞こえる」といった利用者自身の主観による評価を点数化する。MOS値は、「非常に良い=5」(音質が良い)から「非常に悪い=1」(音質が悪い)までの5段階で表される。
【0003】
MOS評価においては、送話装置から受話装置まで、ネットワークシステム全体を測定する必要がある。送話装置が音声評価サンプルの音声信号を送信し、評価者が受話装置からの音声を実際に聞いて評価する。MOS値は人間の実際の評価であるために、その評価結果に個人差が表れ、年齢又は性別によっても評価値が異なる。
【0004】
【非特許文献1】ITU-T Recommendation P.800, "Methods for subjective determination of transmission quality," Aug.1996.
【発明の開示】
【発明が解決しようとする課題】
【0005】
主観評価によれば、年齢層又は性別の異なる複数の評価者が、同一ネットワークシステム内で評価した値が必要になる。これは、年齢層又は性別の異なる複数の評価者(異なる複数の評価サンプル)が多いほど、主観評価値の信頼度は向上することを意味する。一方で、このような方法は、費用と時間が増すという問題がある。
【0006】
これに対し、ITU−T勧告P.800によれば、信頼できるMOS値を求めるのに必要な総評価サンプル数は規定されていない。多くの場合、総評価サンプル数は経験的に設定していて、どれくらいの誤差が想定されるかは明らかにされていない。
【0007】
従って、本発明は、通話品質の主観評価について、実質的に信頼できるMOS値を求めるために必要な総評価サンプル数を決定する方法及びサーバを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明は、音声信号を送話する送話装置と、
送話装置にネットワークを介して接続されており、評価者に評価値を入力させる手段と、該評価値をサーバへ送信する手段とを有する受話装置と
複数の評価者識別子毎の主観評価値を収集し、音声通話の主観評価のための評価サンプル数を決定するサーバと
を有するシステムにおける音声通話の主観評価のための評価サンプル数決定方法に関する。
【0009】
本発明の方法によれば、
サーバが、1回目として、評価者識別子数と、評価者当たりの評価サンプル数との乗算による総評価サンプル数の第1の主観評価値を収集する第1のステップと、
第1の主観評価値の平均値(MOS)を導出する第2のステップと、
サーバが、2回目として、総評価サンプル数まで、第2の主観評価値(x)を収集する第3のステップと、
第2の主観評価値を収集する毎に、第1の主観評価値の平均値(MOS)と、その時点までに収集(n)した第2の主観評価値の平均値(1/nΣi=1nx)とに基づく平方平均二乗誤差値を導出する第4のステップと、
収集した第2の主観評価値の総評価サンプル数の累積数毎に、平方平均二乗誤差値を蓄積する第5のステップと、
所定の平方平均二乗誤差値以下に相当する総評価サンプル数を決定する第6のステップとを有することを特徴とする。
【0010】
また、本発明の方法における他の実施形態によれば、第6のステップにおける所定の平方平均二乗誤差値は、第3のステップの総評価サンプル数が、第1のステップの総評価サンプル数に達した際に導出された平方平均二乗誤差値であることも好ましい。
【0011】
更に、送話装置から送信される音声信号に対して、異なる雑音条件の付加及び/又は異なる符号化方式の適用による複数の評価条件を加え、第4のステップは、評価条件が同一の場合にのみ、平方平均二乗誤差値を導出することも好ましい。
【0012】
また、本発明は、音声信号を送話する送話装置と、
送話装置にネットワークを介して接続されており、評価者に評価値を入力させる手段と、該評価値をサーバへ送信する手段とを有する受話装置と
を有するシステムに含まれ、複数の評価者識別子毎の主観評価値を収集し、音声通話の主観評価のための評価サンプル数を決定するサーバに関する。
【0013】
本発明のサーバによれば、1回目として、評価者識別子数と、評価者当たりの評価サンプル数との乗算による総評価サンプル数の第1の主観評価値を収集する第1の主観評価値収集手段と、
第1の主観評価値の平均値(MOS)を導出する平均値導出手段と、
2回目として、総評価サンプル数まで、第2の主観評価値(x)を収集する第2主観評価値収集手段と、
第2の主観評価値を収集する毎に、第1の主観評価値の平均値(MOS)と、その時点までに収集(n)した第2の主観評価値の平均値(1/nΣi=1nx)とに基づく平方平均二乗誤差値を導出する平方平均二乗誤差値導出手段と、
収集した第2の主観評価値の総評価サンプル数の累積数毎に平方平均二乗誤差値を蓄積する平方平均二乗誤差値蓄積手段と、
所定の平方平均二乗誤差値以下に相当する総評価サンプル数を決定する総評価サンプル数決定手段とを有することを特徴とする。
【0014】
また、本発明のサーバにおける他の実施形態によれば、総評価サンプル数決定手段における所定の平方平均二乗誤差値は、第2の主観評価値収集手段の総評価サンプル数が、第1の主観評価値収集手段の総評価サンプル数に達した際に、平方平均二乗誤差導出手段によって導出された平方平均二乗誤差値であることも好ましい。
【0015】
更に、本発明のサーバにおける他の実施形態によれば、送話装置から送信される音声信号に対して、異なる雑音条件の付加及び/又は異なる符号化方式の適用による複数の評価条件を加え、平方平均二乗誤差導出手段は、評価条件が同一の場合にのみ、平方平均二乗誤差値を導出することも好ましい。
【発明の効果】
【0016】
本発明によれば、通話品質の主観評価について、実質的に信頼できるMOS値を求めるために必要な総評価サンプル数を決定することができる。1回目のMOS値に対して、2回目の主観評価値を収集する毎に、総評価サンプル数の累積数に対するRMSE値を近似曲線として蓄積する。蓄積されたこの近似曲線を用いて、所定のRMSE値を指定することにより、総評価サンプル数を決定することができる。
【0017】
また、所定のRMSE値は、1回目の第1の主観評価値の総評価サンプル数と同数の累積数に達した、第2の主観評価値に基づくRMSE値であってもよい。2回目のMOS評価は、別の評価者を集めて同じ規模のMOS評価を行うことが好ましい。これにより、異なる評価者による2回目のRMSE値をばらつきの最大とすることにより、そのRMSE値に達した程度の総評価サンプルを決定することができる。
【発明を実施するための最良の形態】
【0018】
以下では、図面を用いて、本発明を実施するための最良の形態について説明する。
【0019】
図1は、本発明におけるシステムの機能構成図である。
【0020】
図1のシステムは、サーバ1と、送話装置2と、受話装置3とが、ネットワーク4を介して接続されている。送話装置2は、受話装置3に対して1つの音声信号を送話する。受話装置3は、送話装置2から受信した音声信号を発声する受話部と、評価者(X,Y,Z)が主観的評価値を入力することができる入力部と、その評価値をサーバ1へ送信する評価値送信部とを有する。評価者は、受話装置3の受話部から発声された音声を聞き、入力部に評価値を入力する。評価者毎に識別子が付与されている。受話装置3の評価値送信部は、主観評価値を、評価者識別子と共に、サーバ1へ送信する。また、評価の信頼性を高めるために、1人の評価者に対して複数回(評価サンプル数)の評価値を収集する。この場合、
(1条件当たりの)総評価サンプル数=評価者識別子数×評価サンプル数
となる。
【0021】
ここで、複数の評価条件を設定することもできる。評価条件とは、送話装置から送信される音声信号に対して、異なる雑音条件の付加及び/又は異なる符号化方式の適用をいう。例えば、1つの音声信号に対して、3つの雑音条件を付加し且つ2つの符号化方式を適用した場合、6つの評価条件(3×2)を指定することができる。また、複数の音声信号を適用することもでき、異なる音声信号に対しても同じ評価条件を指定することができる。これにより、送話装置から受話装置へ送信した際に、指定条件毎に評価者の主観的評価値を得ることができる。この場合、
総評価サンプル数=1条件当たりの総評価サンプル数×評価条件数
となる。
【0022】
サーバ1は、第1の主観評価値収集部10と、第1の主観評価値蓄積部11と、平均値(MOS値)導出部12と、第2の主観評価値収集部13と、第2の主観評価値蓄積部14と、平方平均二乗誤差(RMSE:Root Mean Square Error)値導出部15と、RMSE導出部16と、総評価サンプル数決定部17と、RMSE値記憶部18とを有する。
【0023】
第1の主観評価値収集部10は、1回目として、総評価サンプル数の第1の主観評価値を収集する。第1の主観評価値蓄積部11は、評価者識別子と共に、受信した第1の主観評価値を蓄積する。十分に信頼できるMOS値を導出するために、蓄積される第1の主観評価値の総評価サンプル数は、十分に大きな数であることが望ましい。MOS値導出部12は、第1の主観評価値の平均値MOSを導出する。
【0024】
第2の主観評価値収集部13は、2回目として、1回目の総評価サンプル数まで、第2の主観評価値を収集し、累積する。第2の主観評価値蓄積部14は、評価者識別子と共に、受信した第2の主観評価値を蓄積する。
【0025】
RMSE導出部15は、第2の主観評価値を収集する毎に、過去のMOS評価と一致する条件について、第1の主観評価値の平均値MOSと、その時点までに収集した第2の主観評価値の平均値とに基づく平方平均二乗誤差値を導出する。即ち、2回目以降のMOS評価に必要な精度を、平方平均二乗誤差値として導出するものである。RMSEは、MOS評価の評価サンプル数減少に伴うMOS値のばらつきの増大を示す。このように第2の主観評価値を受信しながら累積しつつ、その時点でのMOS値のばらつきを検出することもできる。RMSE値は、以下の式によって導出される。
【0026】
【数1】

【0027】
MOS1,cは、1回目のMOS評価の評価条件cにおけるMOS値を意味する。xc,iは、2回目以降のMOS評価における評価条件の評価サンプルiを意味する。nは、2回目以降のMOS評価の評価サンプル数を意味する。mは、1回目と2回目で共通する評価条件cの総数を意味する。
【0028】
RMSE蓄積部16は、導出されたRMSE値を、第1の主観評価値の総評価サンプル数の累積数毎に記憶する。これにより、総評価サンプル数の関数として、RMSE(n)の近似曲線を導出することができる。
【0029】
総評価サンプル数決定部17は、RMSE蓄積部16bの近似曲線から、所定のRMSE値以下になる評価サンプル数を決定する。この所定のRMSE値は、1回目の第1の主観評価値の総評価サンプル数と同数の累積数に達した、第2の主観評価値に基づくRMSE値であってもよい。例えば、第1の主観評価値に基づく総評価サンプル数が320であれば、第2の主観評価値が320の総評価サンプル数に達した際のRMSE値を、この所定のRMSE値とすることができる。2回目のMOS評価は、別の評価者を集めて同じ規模のMOS評価を行うことが好ましい。
【0030】
図2は、本発明におけるフローチャートである。
【0031】
(S201)1回目として、総評価サンプル数の第1の主観評価値を収集する。
(S202)評価サンプル識別子と評価者識別子と共に、受信した第1の主観評価値を蓄積する。十分に信頼できるMOS値を導出するために、蓄積される第1の主観評価値の総評価サンプル数は、十分に大きな数であることが望ましい。
(S203)第1の主観評価値の平均値MOSを導出する。
(S204)2回目として、総評価サンプル数の累積数に達するまで、第2の主観評価値を収集する。
(S205)評価者識別子と共に、受信した第2の主観評価値を蓄積する。
(S206)第2の主観評価値を収集する毎に、過去のMOS評価と一致する条件について、第1の主観評価値の平均値MOSと、その時点までに収集した第2の主観評価値の平均値とに基づく平方平均二乗誤差値を導出する。
(S207)導出されたRMSE値を、第1の主観評価値の総評価サンプル数の累積数毎に記憶する。これにより、総評価サンプル数の関数として、RMSE(n)の近似曲線を導出することができる。
(S208)総評価サンプル数を決定したいときに、RMSE(n)の近似曲線を用いて、所定のRMSE値以下になる評価サンプル数を決定する。
【0032】
次に、具体的な例として、携帯電話機における背景雑音を含む音声に対するMOS評価について、詳細に説明する。
【0033】
例えば、評価者は、一般の20代〜50代の男女計80名とする。表1は、評価者の人数構成である。
【0034】
【表1】

【0035】
1人の評価者が評価する回数(評価サンプル数)を4とする。これにより、評価者識別子数80×評価サンプル数4=総評価サンプル数320となる。
【0036】
表2は、送話装置から送信される音声信号の雑音条件(評価条件)である。
【0037】
【表2】

【0038】
また、評価条件として、符号化方式A及びBを通過させる。これにより、雑音条件16×符号化方式2=32条件となる。
【0039】
評価サンプル数を決定するパラメータとして、評価者識別子数、評価者当たりの評価サンプル数(評価する回数×評価条件)の2種類がある。評価者については、全評価者80名から性別、年代別の人数構成割合を保ちつつ、40名、20名、10名をランダムに2パターンずつ選択した。表3は、評価者数を減少させた場合の人数構成を示す。
【0040】
【表3】

【0041】
また、評価者当たり評価サンプル数については、4、2、1に減少させる。以下では、これらの評価者数及び評価者当たり評価サンプル数の組合せにより実現される、160、80、40、20という評価サンプル数について検討する。
【0042】
図3は、評価サンプル数320のMOS値と、160(評価者数80×評価者当たり評価サンプル数2、40×4)のMOS値との比較からなるグラフである。図4は、評価サンプル数320のMOS値と、80(評価者数80×評価者当たり評価サンプル数1、40×2、20×4)のMOS値との比較からなるグラフである。図5は、評価サンプル数320のMOS値と、40(評価者数40×評価者当たり評価サンプル数1、20×2、10×4)のMOS値との比較からなるグラフである。図6は、評価サンプル数320のMOS値と、20(評価者数20×評価者当たり評価サンプル数1、10×2)のMOS値との比較からなるグラフである。図7は、評価サンプル数320のMOS値と、10(評価者数10×評価者当たり評価サンプル数1)のMOS値との比較からなるグラフである。尚、図3から7について、縦軸及び横軸は評価点数(1〜5)を示しており、各図には、MOS値のばらつきを示す指標として、RMSE値が併記されている。
【0043】
表4は、図3〜7の各場合のRMSE値である。これは、1回目の第1の主観評価値のMOS値に対して、2回目の第2の主観評価値を累積していく総評価サンプル数のMOS値のRMSE値を表す。このRMSE値は、RMSE値蓄積部16に蓄積される。
【0044】
【表4】

【0045】
表4によれば、総評価サンプル数が少ないほど、RMSE値は大きい。MOS評価で確保すべき精度の目安としては、異なる評価者で実施した2回目のMOS評価のRMSE値を想定する。即ち、1回目に総評価サンプル数320を収集し、次に、異なる評価者、評価サンプル又は評価条件による2回目の総評価サンプル数320を収集し、両者のばらつきであるRMSE値を、MOS評価で確保すべき精度の目安とすることができる。表4によれば、例えば、1回目に対する2回目のRMSEは0.098である。従って、RMSEが0,098以上となる総評価サンプル数を、MOS評価に適した総評価サンプル数として決定することができる。表4によれば、RMSE0.098以上となる総評価サンプル数は、40(RMSE0.101)であることが理解できる。
【0046】
尚、実験データから、総評価サンプル数が同じであれば、評価者数と、評価者当たり評価サンプル数(音声信号の評価サンプル数×評価条件)との組合せの違いによる差は、ほとんど見られなかった。例えば、評価者数40×評価者当たり評価サンプル数1の場合はRMSE0.109であり、20×2場合はRMSE0.098であった。
【0047】
前述した本発明における主観評価のための評価サンプル数を決定する方法及びサーバの種々の実施形態によれば、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略を、当業者は容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【図面の簡単な説明】
【0048】
【図1】本発明におけるシステムの機能構成図である。
【図2】本発明におけるフローチャートである。
【図3】評価サンプル数320のMOS値と、160のMOS値との比較からなるグラフである。
【図4】評価サンプル数320のMOS値と80のMOS値との比較からなるグラフである。
【図5】評価サンプル数320のMOS値と40のMOS値との比較からなるグラフである。
【図6】評価サンプル数320のMOS値と20のMOS値との比較からなるグラフである。
【図7】評価サンプル数320のMOS値と10のMOS値との比較からなるグラフである。
【符号の説明】
【0049】
1 サーバ
10 第1の主観評価値収集部
11 第1の主観評価値蓄積部
12 平均値(MOS値)導出部
13 第2の主観評価値収集部
14 第2の主観評価値蓄積部
15 平方平均二乗誤差値(RMSE値)導出部
16 平方平均二乗誤差値(RMSE値)蓄積部
17 総評価サンプル数決定部
18 平方平均二乗誤差値(RMSE値)記憶部
2 送話装置
3 受話装置
4 ネットワーク

【特許請求の範囲】
【請求項1】
音声信号を送話する送話装置と、
前記送話装置にネットワークを介して接続されており、前記評価者に評価値を入力させる手段と、該評価値を前記サーバへ送信する手段とを有する受話装置と
複数の評価者識別子毎の主観評価値を収集し、音声通話の主観評価のための評価サンプル数を決定するサーバと
を有するシステムにおける音声通話の主観評価のための評価サンプル数決定方法において、
前記サーバが、1回目として、評価者識別子数と、評価者当たりの評価サンプル数との乗算による総評価サンプル数の第1の主観評価値を収集する第1のステップと、
前記第1の主観評価値の平均値(MOS)を導出する第2のステップと、
前記サーバが、2回目として、前記総評価サンプル数まで、第2の主観評価値(x)を収集する第3のステップと、
前記第2の主観評価値を収集する毎に、前記第1の主観評価値の平均値(MOS)と、その時点までに収集(n)した前記第2の主観評価値の平均値(1/nΣi=1nx)とに基づく平方平均二乗誤差値を導出する第4のステップと、
収集した前記第2の主観評価値の総評価サンプル数の累積数毎に、前記平方平均二乗誤差値を蓄積する第5のステップと、
所定の平方平均二乗誤差値以下に相当する前記総評価サンプル数を決定する第6のステップと
を有することを特徴とする方法。
【請求項2】
前記第6のステップにおける前記所定の平方平均二乗誤差値は、前記第3のステップの前記総評価サンプル数が、前記第1のステップの総評価サンプル数に達した際に導出された平方平均二乗誤差値であることを特徴とする請求項1に記載の方法。
【請求項3】
前記送話装置から送信される音声信号に対して、異なる雑音条件の付加及び/又は異なる符号化方式の適用による複数の評価条件を加え、前記第4のステップは、前記評価条件が同一の場合にのみ、前記平方平均二乗誤差値を導出することを特徴とする請求項1又は2に記載の方法。
【請求項4】
音声信号を送話する送話装置と、
前記送話装置にネットワークを介して接続されており、前記評価者に評価値を入力させる手段と、該評価値を前記サーバへ送信する手段とを有する受話装置と
を有するシステムに含まれ、複数の評価者識別子毎の主観評価値を収集し、音声通話の主観評価のための評価サンプル数を決定するサーバにおいて、
1回目として、評価者識別子数と、評価者当たりの評価サンプル数との乗算による総評価サンプル数の第1の主観評価値を収集する第1の主観評価値収集手段と、
前記第1の主観評価値の平均値(MOS)を導出する平均値導出手段と、
2回目として、前記総評価サンプル数まで、第2の主観評価値(x)を収集する第2主観評価値収集手段と、
前記第2の主観評価値を収集する毎に、前記第1の主観評価値の平均値(MOS)と、その時点までに収集(n)した前記第2の主観評価値の平均値(1/nΣi=1nx)とに基づく平方平均二乗誤差値を導出する平方平均二乗誤差値導出手段と、
収集した前記第2の主観評価値の総評価サンプル数の累積数毎に前記平方平均二乗誤差値を蓄積する平方平均二乗誤差値蓄積手段と、
所定の平方平均二乗誤差値以下に相当する前記総評価サンプル数を決定する総評価サンプル数決定手段と
を有することを特徴とするサーバ。
【請求項5】
前記総評価サンプル数決定手段における前記所定の平方平均二乗誤差値は、前記第2の主観評価値収集手段の前記総評価サンプル数が、前記第1の主観評価値収集手段の総評価サンプル数に達した際に、前記平方平均二乗誤差導出手段によって導出された平方平均二乗誤差値であることを特徴とする請求項4に記載のサーバ。
【請求項6】
前記送話装置から送信される音声信号に対して、異なる雑音条件の付加及び/又は異なる符号化方式の適用による複数の評価条件を加え、前記平方平均二乗誤差導出手段は、前記評価条件が同一の場合にのみ、前記平方平均二乗誤差値を導出することを特徴とする請求項4又は5に記載のサーバ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate