サーバ装置及び話者確認システム
【課題】既存の端末装置からの変更点を少なくしつつ音声通信を行う者同士に適した音声特徴により話者確認を行う。
【解決手段】契約者情報DBは、各通話相手先のユーザの発話音声の特徴を示す特徴情報を、端末装置の契約者毎に記憶する。第1端末装置20と第2端末装置30との音声通信が開始されると(S1,S2)、サーバ装置10は、第1端末装置20から受信した、第1端末装置20の契約者及び通話相手先である第2端末装置30が指定された確認要求メッセージを取得し、第2端末装置30からの送話音声に応じた特徴情報を生成する(S3,S4)。サーバ装置10は、第1端末装置20の契約者及び第2端末装置30に対応して契約者情報DBに記憶された特徴情報と、生成した特徴情報とを照合し(S5,S6)、照合の結果を第1端末装置20に通知する。第1端末装置20は、サーバ装置10から通知された照合の結果の内容を報知する(S8)。
【解決手段】契約者情報DBは、各通話相手先のユーザの発話音声の特徴を示す特徴情報を、端末装置の契約者毎に記憶する。第1端末装置20と第2端末装置30との音声通信が開始されると(S1,S2)、サーバ装置10は、第1端末装置20から受信した、第1端末装置20の契約者及び通話相手先である第2端末装置30が指定された確認要求メッセージを取得し、第2端末装置30からの送話音声に応じた特徴情報を生成する(S3,S4)。サーバ装置10は、第1端末装置20の契約者及び第2端末装置30に対応して契約者情報DBに記憶された特徴情報と、生成した特徴情報とを照合し(S5,S6)、照合の結果を第1端末装置20に通知する。第1端末装置20は、サーバ装置10から通知された照合の結果の内容を報知する(S8)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、話者確認を行うための技術に関する。
【背景技術】
【0002】
振り込め詐欺のような、音声通信の相手となるユーザのなりすましによる被害を受けないために、通話相手先からの送話音声を用いて話者確認を行う技術が特許文献1,2に開示されている。特許文献1は、着信側携帯電話端末のユーザが本人確認したいユーザのユーザ指定信号を入力すると、リモート端末が発信側携帯電話端末からの受信音声信号と、音声データサンプル保存部から供給されたユーザ指定信号で指定されたユーザの音声データサンプルとを比較照合し、その比較照合結果を着信側携帯電話端末へ出力することを開示している。特許文献2は、着信側の端末装置でユーザにより通話相手が指定されると、指定された通話相手に対応する音声サンプルデータを音声データサンプル保存部から読み出し、音声サンプルデータが示す音声サンプルと、発信側の端末装置からの音声とを照合して、その照合結果を出力することを開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−268173号公報
【特許文献2】特開2005−184618号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、特許文献1に記載の発明では、リモート端末で発信側のユーザの音声データサンプルが管理されて音声の照合が行われ、着信側のユーザが誰であるかについては話者確認に係る処理において特に考慮されていない。特許文献2に記載の発明は、端末装置が音声サンプルデータを管理して話者確認のための一連の処理を行うもので、既存の端末装置に対し新たに実装すべき機能が多く、話者確認に係るサービスを受けるためにユーザがこのサービスに対応した端末装置を購入しなければならず不便である。
これに対し、本発明は、既存の端末装置からの変更点を少なくしつつ音声通信を行う者同士に適した音声特徴により話者確認を行うことを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決するため、本発明のサーバ装置は、第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、前記照合部が照合した結果を前記第1端末装置に通知する通知部とを備えることを特徴とする。
【0006】
本発明のサーバ装置において、前記確認要求取得部は、前記音声通信を行う第2端末装置が更に指定された前記確認要求を取得し、前記照合部は、前記確認要求で指定された契約者と当該第2端末装置とに対応して記憶された特徴情報を前記特徴情報記憶部から取得し、取得した特徴情報と前記生成部が生成した特徴情報とを照合するようにしてもよい。
【0007】
本発明のサーバ装置において、前記照合部は、前記音声通信の終了後、当該音声通信を行った第2端末装置に対応する前記特徴情報を含む前記確認要求が受信された場合、当該確認要求で指定された契約者に対応して前記特徴情報記憶部に記憶された特徴情報と、当該確認要求に含まれる特徴情報とを照合するようにしてもよい。
【0008】
本発明のサーバ装置において、前記特徴情報記憶部に記憶された特徴情報を、同一の契約者及び第2端末装置について前記生成部が生成した特徴情報で更新する更新部を備えるようにしてもよい。
【0009】
本発明の話者確認システムは、サーバ装置と第1端末装置とを備える話者確認システムであって、前記サーバ装置は、前記第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、前記照合部が照合した結果を前記第1端末装置に通知する通知部とを有し、前記第1端末装置は、前記第2端末装置との音声通信と、前記サーバ装置との通信を行う通信部と、前記通信部により音声通信が開始された後、自装置の契約者が指定された前記ユーザの確認要求を、前記通信部により前記サーバ装置に送信する送信制御部と、前記通信部により前記サーバ装置から受信した、前記通知部により通知された前記結果の内容を報知する報知部とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、既存の端末装置からの変更点を少なくしつつ音声通信を行う者同士に適した音声特徴により話者確認を行うことができる。
【図面の簡単な説明】
【0011】
【図1】話者確認システムの全体構成を示す図。
【図2】サーバ装置のハードウェア構成を示すブロック図。
【図3】契約者情報DBが記憶する契約者情報のデータ構造を示す図。
【図4】第1端末装置のハードウェア構成を示すブロック図。
【図5】サーバ装置の制御部の機能的構成を示す機能ブロック図。
【図6】第1端末装置の制御部の機能的構成を示す機能ブロック図。
【図7】話者確認システムにおける動作手順を示すシーケンスチャート。
【図8】サーバ装置の制御部の機能的構成を示す機能ブロック図。
【図9】話者確認システムにおける動作手順を示すシーケンスチャート。
【図10】第1端末装置の制御部の機能的構成を示す機能ブロック図。
【図11】話者確認システムにおける動作手順を示すシーケンスチャート。
【発明を実施するための形態】
【0012】
以下、図面を参照しつつ本発明の実施形態を説明する。
図1は、話者確認システム1の全体構成を示すブロック図である。図1に示すように、話者確認システム1は、サーバ装置10と、第1端末装置20と、第2端末装置30とを備える。話者確認システム1において、サーバ装置10と、第1端末装置20と、第2端末装置30とはネットワークNW経由で通信可能に接続されている。ネットワークNWは、ここでは、固定電話網、移動体通信網、ゲートウェイ及びインターネットを含む通信網である。
【0013】
サーバ装置10は、サーバ装置10を運営する通信事業者と加入契約を行った者に対し、通話相手先のユーザが真のユーザであるか否かを確認する話者確認サービスを提供する。第1端末装置20及び第2端末装置30は、それぞれが音声通信を行う機能を有し、ここでは携帯電話端末である。以下の説明では、第2端末装置30が発信側となり、第1端末装置20が着信側となって、第1端末装置20と第2端末装置30とで音声通信が行われる場合を主に説明する。この場合、第1端末装置20からみて第2端末装置30が通話相手先である。
なお、話者確認システム1には、実際には、音声通信を行う機能を有する端末装置が他にも含まれる。また、本実施形態では、上述したように第1端末装置20の通話相手先となる端末装置として第2端末装置30を想定するが、第1端末装置20の通話相手先となる端末装置(本発明の第2端末装置)は、上記通信事業者と加入契約を行った者が所有するもののほか、別の通信事業者と加入契約を行った者が所有する端末装置であってもよい。また、第2端末装置30は固定電話や公衆電話等の電話端末であってもよく、音声通信を行うことができればそれ以外に特別な構成を有していなくてよい。
【0014】
図2は、サーバ装置10のハードウェア構成を示すブロック図である。サーバ装置10は、制御部11と、ネットワーク通信部12と、記憶部13とを備える。制御部11は、CPU(Central Processing Unit)を含む演算装置やメモリを備え、プログラムを実行することによりサーバ装置10の各部を制御する。ネットワーク通信部12は、ネットワークNWに接続するためのインタフェースである。記憶部13は、例えばハードディスクを備え、制御部11により実行されるプログラムや契約者情報DB(Data Base)131を記憶する。
【0015】
図3は、契約者情報DB131のデータ構造を示す図である。
図3に示すように、契約者情報DB131は、「契約者情報」と、「相手先情報」と、「特徴情報」という各情報を対応付けた構造である。契約者情報は、上記通信事業者と加入契約を行った端末装置の契約者を識別する識別情報であり、ここでは、端末装置に割り当てられた電話番号である。端末装置の契約者は、個人の場合もあれば法人等の団体の場合もあり、契約者たる人物は必ずしも端末装置のユーザとは一致しない。相手先情報は、音声通信の通話相手先を識別する情報であり、通話相手先毎に異なる情報が割り当てられる。相手先情報は、ここでは数値とアルファベットとの組み合わせで表される。この相手先情報は、契約者情報DB131で契約者情報が対応付けられた端末装置にも記憶されている。通話相手先は、例えば、親族や友人等の振り込め詐欺の際になりすましが行われるようなユーザの通話相手先が想定される。「特徴情報」のフィールドには、各通話相手先のユーザの発話音声の特徴を示す情報が記述される。本実施形態の特徴情報は、ユーザの発話音声を示す音声信号を周波数スペクトル分析した結果を表す。このように、特徴情報は、相手先情報が示す通話相手先のユーザを識別できる音声特徴を示す。
【0016】
契約者情報DB131において、契約者情報「090−○○○○−□□□□」は、第1端末装置20に割り当てられた電話番号であり、第1端末装置20の契約者を識別する情報である。相手先情報「UID0001」は、第2端末装置30を識別する情報である。図3に示す契約者情報「090−△△△△−××××」は、話者確認システム1に含まれる第1端末装置20以外の端末装置の契約者を識別する情報である。相手先情報「UID0002」、「UID0003」及び「UID0004」は、第2端末装置30以外の通話相手先を識別する情報である。また、契約者情報DB131では、契約者情報「090−○○○○−□□□□」及び「090−△△△△−××××」の双方に、同一の通話相手先である、第2端末装置30を識別する相手先情報「UID0001」が対応付けられている。一方で、契約者情報「090−○○○○−□□□□」に対応付けられた特徴情報は「crtA1」であり、「090−△△△△−××××」に対応付けられた特徴情報は「crtA2」であり、互いに異なる。このように、同一ユーザの発話音声の特徴であっても、契約者情報DB131に記憶される特徴情報が示す特徴は、着信側の端末装置によって異なる。このように、契約者情報DB131では、端末装置の契約者毎に個別に特徴情報が管理されている。
以上のデータ構造の契約者情報DB131を記憶する記憶部13が、本発明の特徴情報記憶部に相当する。
【0017】
図4は、第1端末装置20のハードウェア構成を示すブロック図である。図4に示すように、第1端末装置20は、制御部21と、音声入出力部22と、無線通信部23と、操作部24と、表示部25と、記憶部26とを備える。
制御部21は、CPUを含む演算装置やメモリを備え、プログラムを実行することにより第1端末装置20の各部を制御する。音声入出力部22は、受話音声を収音するマイクや送話音声を放音するスピーカを備え、音声の入出力に関する機能を実現する。無線通信部23は、無線通信回路やアンテナを備え、ネットワークNWに接続するためのインタフェースである。無線通信部23は、図示せぬアンテナを介して無線基地局との間で無線通信を行い、音声通信やデータ通信を行う通信部として機能する。操作部24は、テンキー等の複数の操作子を備え、ユーザによる操作子の操作を受け付けて、その操作に応じた操作信号を制御部21に出力する。表示部25は、例えば液晶駆動回路や液晶ディスプレイを備え、画像の表示により情報に応じた内容を報知する。記憶部26は、例えばEEPROM(Electronically Erasable and Programmable Read Only Memory)を備え、通話相手先の名称及びその通話相手先に割り当てられた電話番号が記述された電話帳データ等を記憶する。
【0018】
図5は、サーバ装置10の制御部11の機能的構成を示す機能ブロック図である。制御部11は、プログラムを実行することにより、確認要求取得部111と、特徴情報生成部112と、照合部113と、通知部114とに相当する機能を実現する。
確認要求取得部111は、第1端末装置20によって送信された確認要求メッセージを、ネットワーク通信部12による第1端末装置20との通信により取得する。確認要求メッセージは、第1端末装置20がサーバ装置10に対して話者確認サービスの利用を要求する際に送信するメッセージであり、少なくとも第1端末装置20の契約者が指定されている。例えば、確認要求メッセージは、第1端末装置20の契約者を識別する契約者情報、第1端末装置20が行う音声通信の通話相手先を識別する相手先情報、及び第1端末装置20が第2端末装置30から受信した送話音声を示す音声信号を含む。確認要求メッセージに含まれる音声信号は、例えば、音声通信中に第1端末装置20が受信した音声信号の一部である。
【0019】
特徴情報生成部112は、第1端末装置20と第2端末装置30との音声通信が開始された後、第2端末装置30からの送話音声に応じて特徴情報を生成する。特徴情報生成部112は、例えば、確認要求取得部111が取得した確認要求メッセージに含まれる音声信号を解析して特徴情報を生成する。
【0020】
照合部113は、音声通信を行う第1端末装置20の契約者及びその通話相手先に対応して契約者情報DB131に記憶された特徴情報と、特徴情報生成部112が生成した特徴情報とを照合する。照合部113は、例えば、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けられた特徴情報を契約者情報DB131から取得し、取得した特徴情報と特徴情報生成部112で生成された特徴情報とを照合する。
【0021】
通知部114は、照合部113が照合した結果を、ネットワーク通信部12による第1端末装置20との通信により、第1端末装置20に通知する。通知部114は、照合部113の照合結果に応じて、例えば、通話相手先のユーザの真偽を示す話者確認の結果を通知する。
【0022】
図6は、第1端末装置20の制御部21の機能的構成を示す機能ブロック図である。制御部21は、プログラムを実行することにより、受付部211と、確認要求送信制御部212と、照合結果取得部213と、報知部214とに相当する機能を実現する。
受付部211は、ユーザが操作部24に対して行う操作に応じて、話者確認サービスの利用する旨の指示をユーザから受け付ける。
確認要求送信制御部212は、第1端末装置20の契約者と第1端末装置20の音声通信の通話相手先とが指定され、かつ、第2端末装置30からの送話音声を示す音声信号を含む確認要求メッセージを、無線通信部23によってサーバ装置10に送信させる。送話音声を示す音声信号は、例えば、受付部211により話者確認サービスの利用を指示する操作が受け付けられたことを契機に、確認要求送信制御部212の制御により送話音声が録音された結果(例えば、所定時間分の音声信号)を示す。
【0023】
照合結果取得部213は、無線通信部23による通信によりサーバ装置10から受信した、通知部114により通知された照合の結果(つまり、話者確認の結果)を取得する。
報知部214は、照合結果取得部213が取得した照合の結果の内容を報知する。報知部214は、例えば、通話相手先のユーザの真偽を第1端末装置20のユーザに知らしめるためのメッセージを表示部25に表示させる。
次に、話者確認システム1の動作を説明する。
【0024】
まず、サーバ装置10が話者確認サービスを提供するために、図3に示すデータ構造の契約者情報DB131が、サーバ装置10の記憶部13に予め記憶されている。契約者情報DB131に登録される契約者情報については、契約者による話者確認サービスの利用の申し込みによってサーバ装置10の管理者(通信事業者)により設定される。契約者情報DB131に登録される相手先情報は、話者確認サービスが提供される第1端末装置20のユーザにより登録される。本実施形態の相手先情報は、第1端末装置20の電話帳データにも予め登録されているものとする。契約者情報DB131に登録される特徴情報は、第1端末装置20が事前に行った音声通信により通話相手先から取得した音声信号をサーバ装置10に提供し、サーバ装置10によりこの音声信号に基づいて生成されたものである。サーバ装置10は、高速フーリエ変換等によって、第1端末装置20から提供された音声信号を解析して周数スペクトル分析を行い、この分析結果を示す特徴情報を、話者確認サービスの利用者たる端末装置の契約者毎に分類して、契約者情報DB131に記憶させる。
次に、話者確認システム1の話者確認サービスに係る動作を説明する。
【0025】
図7は、話者確認システム1の動作手順を示すシーケンスチャートである。
本実施形態で発信側の端末装置となる第2端末装置30のユーザは、第1端末装置20のユーザとの音声通信を行うべく、電話帳データから通話相手先を指定したり電話番号を直接入力したりして、音声通信を開始させるための操作を行う。この操作を受け付けると、第2端末装置30は、第1端末装置20の発呼をネットワークNWに指示する(ステップS1)。第1端末装置20はネットワークNW経由で第2端末装置30からの発呼を受け付ける。そして、第1端末装置20がユーザによる操作部24のオフフックキーの操作を受け付けると、第2端末装置30と第1端末装置20との間に通信路が確立され、音声通信が開始される(ステップS2)。
【0026】
次に、第1端末装置20のユーザが、例えば、第2端末装置30に関する情報が自装置の電話帳データに登録されていなかったり、第2端末装置30のユーザが真のユーザであるかを確認したいと考えた場合、操作部24に所定の操作を行って、話者確認サービスの利用を第1端末装置20に指示する。第1端末装置20の制御部21は、話者確認サービスの利用を指示する操作を受け付けると、確認要求メッセージを生成して、無線通信部23によりサーバ装置10に送信する(ステップS3)。
確認要求メッセージは、第1端末装置20の契約者情報と、第2端末装置30の相手先情報と、第2端末装置30からの送話音声の音声信号とを含む。第1端末装置20の契約者情報は自装置に割り当てられた電話番号であり、予め第1端末装置20に登録されている。相手先情報は、例えば、第1端末装置20のユーザにより電話帳データが参照されて指定された通話相手先を示す。ここでは、確認要求メッセージは、契約者情報「090−○○○○−□□□□」と、相手先情報「UID001」とを含んでいるものとする。また、第1端末装置20は、ユーザからの話者確認サービスの利用を指示する操作を契機に、第2端末装置30からの送話音声を所定時間だけ録音して音声信号を生成し、確認要求メッセージに含めておく。
【0027】
次に、サーバ装置10の制御部11は、ネットワーク通信部12による第1端末装置20との通信により確認要求メッセージを受信すると、確認要求メッセージに含まれる送話音声を示す音声信号に基づいて特徴情報を生成する(ステップS4)。ここでは、制御部11は、音声信号を解析して周波数スペクトル分析を行った結果を示す特徴情報を生成する。
次に、制御部11は、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けて契約者情報DB131に記憶された特徴情報を取得する(ステップS5)。制御部11は、契約者情報と相手先情報とに対応付けて契約者情報DB131に記述された特徴情報を読み出して、これを取得する。ここでは、制御部11は特徴情報「crtA1」を取得し、それ以外の特徴情報については契約者情報DB131から取得しない。
【0028】
次に、制御部11は、ステップS4の処理で生成した特徴情報と、ステップS5の処理で取得した特徴情報とを照合する(ステップS6)。ここでは、制御部11は、ステップS4の処理で生成した特徴情報と、ステップS5の処理で取得した特徴情報「crtA1」との類似度(尤度)を算出する。ここで、照合される特徴情報が類似する度合いが高いほど尤度が高い値を示すものとする。特徴情報の類似の度合いを示す尤度の算出方法については、サーバ装置10は公知の方法を採用してよい。
【0029】
次に、制御部11は、ステップS6の処理で得た照合の結果を、ネットワーク通信部12により第1端末装置20に通知する(ステップS7)。ここでは、制御部11は、ステップS6の処理で算出した尤度を通知する。
【0030】
第1端末装置20の制御部21は、無線通信部23により照合結果を受信すると、受信した照合結果の内容を、表示部25への表示により報知する(ステップS8)。ここでは、制御部21は、尤度が閾値以上であれば、第2端末装置30のユーザが真のユーザであると判定し、尤度が閾値未満であれば、第2端末装置30のユーザが真のユーザでないと判定する。例えば、制御部21は、真のユーザであると判定した場合は、「話者確認の結果、○○さんと確認できました。」というメッセージを表示させ、真のユーザでないと判定した場合は、「話者確認の結果、○○さんと確認できませんでした。」というメッセージを表示部25に表示させる。ここで、「○○」には、例えば電話帳データに登録された名称が表示される。この報知の内容を見た第1端末装置20のユーザは、真のユーザと確認できれば安心して会話を続けることができるし、真のユーザでないと報知された場合には、そこで音声通信を終了して、例えば真のユーザに電話を掛け直す等といった対応を採ることができる。
なお、第1端末装置20は、第2端末装置30のユーザが真のユーザであるかに代えて、サーバ装置10から通知された尤度を報知してもよいし、これら両方を報知してもよい。また、サーバ装置10が、ステップS7の処理で第2端末装置30のユーザが真のユーザであるか否かを判定し、この判定結果を照合結果として通知してもよい。第1端末装置20がバイブレーション機能を用いて報知してもよいし、光や音を用いて報知してもよく、照合結果を第1端末装置20のユーザに知らしめるための方法はどのようなものでもよい。
【0031】
以上が、話者確認サービスに係る話者確認システム1の動作の説明である。以上の動作説明では、契約者情報「090−○○○○−□□□□」のユーザが、相手先情報「UID001」の通話相手先についての話者確認を要求したので、特徴情報「crtA1」を用いた場合の照合結果が第1端末装置20に提供される。一方、契約者情報「090−△△△△−××××」のユーザが、相手先情報「UID001」の通話相手先についての話者確認を要求した場合、図3を見ても分かるように、特徴情報「crtA2」を用いた照合の結果が第1端末装置20に提供される。このように、サーバ装置10では、契約者毎に特徴情報が独立して用意されているので、本実施形態の話者確認システム1により以下の効果を奏する。
【0032】
一般に、ユーザが電話を掛ける際には、通話相手の人物によって声の調子が異なることがある。例えば、同一ユーザの発話音声であっても、気軽に話せる場合と緊張する場合とでは音声特徴が異なるはずである。要するに、同一ユーザの発話音声であっても、通話相手先によってその特徴は異なると考えられる。よって、発話音声の特徴を基に話者確認を行おうとした場合、通話相手(ここでは、第1端末装置20の契約者たるユーザに対応。)に関わらず同一の特徴情報を用いていては、その通話相手次第で、照合結果の精度が低下すると考えられる。これでは、通話相手先のユーザが真のユーザであるにも関わらず、照合の結果、なりすましによる偽者と判断されてしまう可能性がある。これに対し、本実施形態の話者確認システム1では、契約者と通話相手先との双方により定まる特徴情報が照合に用いることで、音声通信を行う者同士に適した音声特徴により話者確認が行われる。これにより、話者確認システム1によれば、音声通信の通話相手次第で、話者確認の結果の精度が低下する可能性を抑えることができる。
【0033】
また、本実施形態の話者確認システム1では、サーバ装置10が音声信号に基づいて特徴情報を生成する処理を行う。一方、第1端末装置20は確認要求メッセージをサーバ装置10に送信し、この確認要求メッセージに応じてサーバ装置10から通知された話者確認の結果を報知すればよく、第1端末装置20はそれ以外は一般的な電話端末と同様に動作すればよい。このように、話者確認システム1では、話者確認に係る処理のほとんどをサーバ装置10で担うことができるので、話者確認システム1の第1端末装置20については、既存の端末装置からの変更点を少なくすることができる。これにより、話者確認サービスの提供を受けたいユーザが、このサービスを受けるためにわざわざ端末装置を買い替える必要が生じるのを抑えることができる。
【0034】
[変形例]
本発明は、上述した実施形態と異なる形態で実施することが可能である。本発明は、例えば、以下のような形態で実施することも可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
[変形例1]
上述した実施形態では、サーバ装置10は契約者情報DB131に記憶された特徴情報を用いて照合を行っていたが、更に、この特徴情報を更新する構成を備えてもよい。
図8は、この変形例のサーバ装置10の制御部11の機能的構成を示す機能ブロック図である。
図8に示すように、制御部11は、プログラムを実行することにより、確認要求取得部111と、特徴情報生成部112と、照合部113と、通知部114と、更新部115とに相当する機能を実現する。確認要求取得部111、特徴情報生成部112、照合部113及び通知部114は、上述した第1実施形態と同等に機能する。更新部115は、契約者情報DB131に記憶された特徴情報を、同一の契約者及び通話相手先について特徴情報生成部112が生成した特徴情報で更新する。
次に、話者確認システム1の動作を説明する。
【0035】
図9は、話者確認システム1における動作手順を示すシーケンスチャートである。
ステップS1〜S8までの処理ステップは、上述した実施形態と同じであるから、ここではその説明を省略する。
サーバ装置10の制御部11は、第2端末装置30と第1端末装置20との音声通信が行われたことを契機に、これら両端末で定まる特徴情報を更新する(ステップS9)。第2端末装置30と第1端末装置20との音声通信が行われた場合に契約者情報DB131に記憶された特徴情報を更新するとき、制御部11は、第1端末装置20の契約者及び第2端末装置30に対応する特徴情報を更新する。例えば、制御部11は、ステップS4の処理で生成した特徴情報が「crtA3」であれば、図3に示す特徴情報「crtA1」を、特徴情報「crtA3」に書き換えるよう、契約者情報DB131を更新する。
以上の契約者情報DB131の更新は、音声通信が行われるたびに行われてもよいし、決められた期間毎に行われてもよいし、第1端末装置20から指示された場合に行われてもよく、更新の時期や頻度については任意である。
本変形例の話者確認システム1によれば、通話相手先のユーザの発話音声の特徴が時間とともに変化したような場合であっても、話者確認に係る照合にこの変化を反映させることができる。この結果、時間の経過とともに、話者確認の精度が低下してしまうことを予め抑えることができる。また、この更新に係る処理に関して、第1端末装置20のユーザに手間が掛けられることもない。
【0036】
[変形例2]
上述した実施形態では、話者確認システム1において音声通信が行われている期間に話者確認が行われていたが、音声通信の終了後に話者確認が行われてもよい。
図10は、この変形例のサーバ装置10の制御部11の機能的構成を示す機能ブロック図である。
図10に示すように、制御部21は、プログラムを実行することにより、受付部211と、確認要求送信制御部212と、照合結果取得部213と、報知部214とに相当する機能を実現する。受付部211、照合結果取得部213及び報知部214は、上述した第1実施形態と同等に機能する。確認要求送信制御部212は、音声通信の終了後において、第1端末装置20の契約者を示す契約者情報と第2端末装置30を示す相手先情報とを含み、かつ、第2端末装置30の送話音声を示す音声信号から生成された特徴情報を含む確認要求メッセージを生成し、無線通信部23によりサーバ装置10に送信する。確認要求送信制御部212は、予めサーバ装置10から受信し記憶部26に記憶しておいた特徴情報を取得して、確認要求メッセージに含める。
【0037】
図11は、話者確認システム1における動作手順を示すシーケンスチャートである。
ステップS1〜S8までの処理ステップは、上述した実施形態と同じであるから、ここではその説明を省略する。
サーバ装置10の制御部11は、第2端末装置30と第1端末装置20との音声通信中において、ステップS4の処理で生成した特徴情報をネットワーク通信部12により第1端末装置20に送信する(ステップS10)。この特徴情報の送信は、例えば、第2端末装置30によりその送信が要求された場合に行われる。そして、第2端末装置30と第1端末装置20との音声通信が終了する(ステップS11)。
【0038】
音声通信の終了後、第1端末装置20は、確認要求メッセージを無線通信部23によりサーバ装置10に送信する(ステップS12)。この確認要求メッセージには、第1端末装置20の契約者を示す契約者情報と、第2端末装置30を示す相手先情報と、ステップS10の処理で第1端末装置20が受信した特徴情報とが含まれる。
次に、サーバ装置10の制御部11は、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けて契約者情報DB131に記憶された特徴情報を取得する(ステップS13)。次に、制御部11は、ステップS12の処理で取得した確認要求メッセージに含まれる特徴情報と、ステップS13の処理で取得した特徴情報とを照合する(ステップS14)。ここでは、制御部11は、ステップS6の処理と同じ手法で照合処理を行う。次に、制御部11は、ステップS14の処理の照合結果をネットワーク通信部12により第1端末装置20に通知する(ステップS15)。第1端末装置20の制御部21は、無線通信部23により照合結果を受信すると、受信した照合の結果の内容を報知する(ステップS16)。ステップS15,S16の処理は、上述したステップS7,S8の処理と同様に行われればよい。
【0039】
本変形例の話者確認システム1によれば、第1端末装置20は音声通信の終了後においても話者確認サービスを利用することができる。よって、第1端末装置20のユーザが事後的に通話相手先のユーザの真偽を確認したくなった場合でも、この確認を行うことが可能である。
なお、本変形例では、話者確認システム1は音声通信中にも話者確認を行うことができるが、音声通信の終了後のみに話者確認を行う構成であってもよい。
【0040】
[変形例3]
上述した実施形態では、サーバ装置10は、着信側となる第1端末装置20からの確認要求に応じて発信側となる第2端末装置30の話者確認を行い、話者確認の結果を着信側となる第1端末装置20に通知していた。これに代えて、サーバ装置10は、第1端末装置20が発信側となった場合に、第1端末装置20からの要求に応じて着信側の第2端末装置30の話者確認を行い、話者確認の結果を発信側の第1端末装置20に通知してもよい。
【0041】
[変形例4]
上述した実施形態では、通話相手先を指定するための相手先情報が確認要求メッセージに含まれていたが、確認要求メッセージに相手先情報が含まれないようにしてもよい。この場合、サーバ装置10は、確認要求メッセージで指定された契約者に対応して契約者情報DB131に記憶されたすべての通話相手先の特徴情報を、照合の対象とするとよい。話者確認サービスで話者確認が行われる通話相手先は、例えば親族や友人等の限られた範囲に限定されることが多い。よって、契約者情報から確認要求メッセージを送信してきた端末装置の契約者をサーバ装置10が特定し、その契約者に対応するすべての通話相手先を照合対象としても、サーバ装置10において照合処理に係る負荷が過大になることはほとんどないと考えられる。また、第1端末装置20のユーザは話者確認サービスの利用時において、通話相手先を指定する操作を行わなくて済む。
【0042】
[変形例5]
本発明において、発話音声の特徴を示す特徴情報は、周波数スペクトルの分析結果以外のものでもよい。例えば、発話音声の特徴を示す特徴情報として、ユーザの声紋を特定するためのデータを採用してもよい。要するに、音声の特徴を照合してユーザの同一性を確認するための種々の照合方法を、本発明に適用することができる。この場合も、発話音声の特徴を示す特徴情報は、端末装置の契約者ごとに分類されて契約者情報DB131で管理される。更に、サーバ装置10が特徴情報を生成する基となる情報は、確認要求メッセージに含まれた音声信号でなくてもよい。要するに、サーバ装置10は、送話音声に応じた特徴情報を生成するのに用いる情報を取得できればよい。
また、契約者情報は、第1端末装置20の契約者を識別できればよく、電話番号以外にSIM(Subscriber Identity Module)カード等で特定される端末識別情報や、話者確認サービスの利用者に対し予め割り当てられたものであってもよい。また、相手先情報についても、通話相手先に割り当てられた電話番号等の別の情報であってもよい。
【0043】
[変形例6]
上述した各実施形態では、本発明の端末装置が携帯電話端末である場合を説明したが、本発明は、その他の端末装置に適用することも可能である。例えば、本発明の端末装置は、音声通信を行う機能を有していれば、例えば、スマートフォンや固定電話、モバイルコンピュータ、携帯ゲーム機、タブレット端末等であってもよい。
また、サーバ装置10が契約者情報DB131を記憶する構成に限らず、サーバ装置10からみた外部装置が契約者情報DB131を記憶していてもよい。この場合、サーバ装置10はこの外部装置にアクセスして契約者情報DB131を参照した処理を行う。
上述したサーバ装置10の制御部11が実現する各機能、及び第1端末装置20の制御部21が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の協働によって実現され得る。
【符号の説明】
【0044】
1…話者確認システム、10…サーバ装置、11…制御部、111…確認要求取得部、112…特徴情報生成部、113…照合部、114…通知部、115…更新部、12…ネットワーク通信部、13…記憶部、131…契約者情報DB、20…第1端末装置、21…制御部、211…受付部、212…確認要求送信制御部、213…照合結果取得部、214…報知部、22…音声入出力部、23…無線通信部、24…操作部、25…表示部、26…記憶部、30…第2端末装置
【技術分野】
【0001】
本発明は、話者確認を行うための技術に関する。
【背景技術】
【0002】
振り込め詐欺のような、音声通信の相手となるユーザのなりすましによる被害を受けないために、通話相手先からの送話音声を用いて話者確認を行う技術が特許文献1,2に開示されている。特許文献1は、着信側携帯電話端末のユーザが本人確認したいユーザのユーザ指定信号を入力すると、リモート端末が発信側携帯電話端末からの受信音声信号と、音声データサンプル保存部から供給されたユーザ指定信号で指定されたユーザの音声データサンプルとを比較照合し、その比較照合結果を着信側携帯電話端末へ出力することを開示している。特許文献2は、着信側の端末装置でユーザにより通話相手が指定されると、指定された通話相手に対応する音声サンプルデータを音声データサンプル保存部から読み出し、音声サンプルデータが示す音声サンプルと、発信側の端末装置からの音声とを照合して、その照合結果を出力することを開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−268173号公報
【特許文献2】特開2005−184618号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、特許文献1に記載の発明では、リモート端末で発信側のユーザの音声データサンプルが管理されて音声の照合が行われ、着信側のユーザが誰であるかについては話者確認に係る処理において特に考慮されていない。特許文献2に記載の発明は、端末装置が音声サンプルデータを管理して話者確認のための一連の処理を行うもので、既存の端末装置に対し新たに実装すべき機能が多く、話者確認に係るサービスを受けるためにユーザがこのサービスに対応した端末装置を購入しなければならず不便である。
これに対し、本発明は、既存の端末装置からの変更点を少なくしつつ音声通信を行う者同士に適した音声特徴により話者確認を行うことを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決するため、本発明のサーバ装置は、第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、前記照合部が照合した結果を前記第1端末装置に通知する通知部とを備えることを特徴とする。
【0006】
本発明のサーバ装置において、前記確認要求取得部は、前記音声通信を行う第2端末装置が更に指定された前記確認要求を取得し、前記照合部は、前記確認要求で指定された契約者と当該第2端末装置とに対応して記憶された特徴情報を前記特徴情報記憶部から取得し、取得した特徴情報と前記生成部が生成した特徴情報とを照合するようにしてもよい。
【0007】
本発明のサーバ装置において、前記照合部は、前記音声通信の終了後、当該音声通信を行った第2端末装置に対応する前記特徴情報を含む前記確認要求が受信された場合、当該確認要求で指定された契約者に対応して前記特徴情報記憶部に記憶された特徴情報と、当該確認要求に含まれる特徴情報とを照合するようにしてもよい。
【0008】
本発明のサーバ装置において、前記特徴情報記憶部に記憶された特徴情報を、同一の契約者及び第2端末装置について前記生成部が生成した特徴情報で更新する更新部を備えるようにしてもよい。
【0009】
本発明の話者確認システムは、サーバ装置と第1端末装置とを備える話者確認システムであって、前記サーバ装置は、前記第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、前記照合部が照合した結果を前記第1端末装置に通知する通知部とを有し、前記第1端末装置は、前記第2端末装置との音声通信と、前記サーバ装置との通信を行う通信部と、前記通信部により音声通信が開始された後、自装置の契約者が指定された前記ユーザの確認要求を、前記通信部により前記サーバ装置に送信する送信制御部と、前記通信部により前記サーバ装置から受信した、前記通知部により通知された前記結果の内容を報知する報知部とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、既存の端末装置からの変更点を少なくしつつ音声通信を行う者同士に適した音声特徴により話者確認を行うことができる。
【図面の簡単な説明】
【0011】
【図1】話者確認システムの全体構成を示す図。
【図2】サーバ装置のハードウェア構成を示すブロック図。
【図3】契約者情報DBが記憶する契約者情報のデータ構造を示す図。
【図4】第1端末装置のハードウェア構成を示すブロック図。
【図5】サーバ装置の制御部の機能的構成を示す機能ブロック図。
【図6】第1端末装置の制御部の機能的構成を示す機能ブロック図。
【図7】話者確認システムにおける動作手順を示すシーケンスチャート。
【図8】サーバ装置の制御部の機能的構成を示す機能ブロック図。
【図9】話者確認システムにおける動作手順を示すシーケンスチャート。
【図10】第1端末装置の制御部の機能的構成を示す機能ブロック図。
【図11】話者確認システムにおける動作手順を示すシーケンスチャート。
【発明を実施するための形態】
【0012】
以下、図面を参照しつつ本発明の実施形態を説明する。
図1は、話者確認システム1の全体構成を示すブロック図である。図1に示すように、話者確認システム1は、サーバ装置10と、第1端末装置20と、第2端末装置30とを備える。話者確認システム1において、サーバ装置10と、第1端末装置20と、第2端末装置30とはネットワークNW経由で通信可能に接続されている。ネットワークNWは、ここでは、固定電話網、移動体通信網、ゲートウェイ及びインターネットを含む通信網である。
【0013】
サーバ装置10は、サーバ装置10を運営する通信事業者と加入契約を行った者に対し、通話相手先のユーザが真のユーザであるか否かを確認する話者確認サービスを提供する。第1端末装置20及び第2端末装置30は、それぞれが音声通信を行う機能を有し、ここでは携帯電話端末である。以下の説明では、第2端末装置30が発信側となり、第1端末装置20が着信側となって、第1端末装置20と第2端末装置30とで音声通信が行われる場合を主に説明する。この場合、第1端末装置20からみて第2端末装置30が通話相手先である。
なお、話者確認システム1には、実際には、音声通信を行う機能を有する端末装置が他にも含まれる。また、本実施形態では、上述したように第1端末装置20の通話相手先となる端末装置として第2端末装置30を想定するが、第1端末装置20の通話相手先となる端末装置(本発明の第2端末装置)は、上記通信事業者と加入契約を行った者が所有するもののほか、別の通信事業者と加入契約を行った者が所有する端末装置であってもよい。また、第2端末装置30は固定電話や公衆電話等の電話端末であってもよく、音声通信を行うことができればそれ以外に特別な構成を有していなくてよい。
【0014】
図2は、サーバ装置10のハードウェア構成を示すブロック図である。サーバ装置10は、制御部11と、ネットワーク通信部12と、記憶部13とを備える。制御部11は、CPU(Central Processing Unit)を含む演算装置やメモリを備え、プログラムを実行することによりサーバ装置10の各部を制御する。ネットワーク通信部12は、ネットワークNWに接続するためのインタフェースである。記憶部13は、例えばハードディスクを備え、制御部11により実行されるプログラムや契約者情報DB(Data Base)131を記憶する。
【0015】
図3は、契約者情報DB131のデータ構造を示す図である。
図3に示すように、契約者情報DB131は、「契約者情報」と、「相手先情報」と、「特徴情報」という各情報を対応付けた構造である。契約者情報は、上記通信事業者と加入契約を行った端末装置の契約者を識別する識別情報であり、ここでは、端末装置に割り当てられた電話番号である。端末装置の契約者は、個人の場合もあれば法人等の団体の場合もあり、契約者たる人物は必ずしも端末装置のユーザとは一致しない。相手先情報は、音声通信の通話相手先を識別する情報であり、通話相手先毎に異なる情報が割り当てられる。相手先情報は、ここでは数値とアルファベットとの組み合わせで表される。この相手先情報は、契約者情報DB131で契約者情報が対応付けられた端末装置にも記憶されている。通話相手先は、例えば、親族や友人等の振り込め詐欺の際になりすましが行われるようなユーザの通話相手先が想定される。「特徴情報」のフィールドには、各通話相手先のユーザの発話音声の特徴を示す情報が記述される。本実施形態の特徴情報は、ユーザの発話音声を示す音声信号を周波数スペクトル分析した結果を表す。このように、特徴情報は、相手先情報が示す通話相手先のユーザを識別できる音声特徴を示す。
【0016】
契約者情報DB131において、契約者情報「090−○○○○−□□□□」は、第1端末装置20に割り当てられた電話番号であり、第1端末装置20の契約者を識別する情報である。相手先情報「UID0001」は、第2端末装置30を識別する情報である。図3に示す契約者情報「090−△△△△−××××」は、話者確認システム1に含まれる第1端末装置20以外の端末装置の契約者を識別する情報である。相手先情報「UID0002」、「UID0003」及び「UID0004」は、第2端末装置30以外の通話相手先を識別する情報である。また、契約者情報DB131では、契約者情報「090−○○○○−□□□□」及び「090−△△△△−××××」の双方に、同一の通話相手先である、第2端末装置30を識別する相手先情報「UID0001」が対応付けられている。一方で、契約者情報「090−○○○○−□□□□」に対応付けられた特徴情報は「crtA1」であり、「090−△△△△−××××」に対応付けられた特徴情報は「crtA2」であり、互いに異なる。このように、同一ユーザの発話音声の特徴であっても、契約者情報DB131に記憶される特徴情報が示す特徴は、着信側の端末装置によって異なる。このように、契約者情報DB131では、端末装置の契約者毎に個別に特徴情報が管理されている。
以上のデータ構造の契約者情報DB131を記憶する記憶部13が、本発明の特徴情報記憶部に相当する。
【0017】
図4は、第1端末装置20のハードウェア構成を示すブロック図である。図4に示すように、第1端末装置20は、制御部21と、音声入出力部22と、無線通信部23と、操作部24と、表示部25と、記憶部26とを備える。
制御部21は、CPUを含む演算装置やメモリを備え、プログラムを実行することにより第1端末装置20の各部を制御する。音声入出力部22は、受話音声を収音するマイクや送話音声を放音するスピーカを備え、音声の入出力に関する機能を実現する。無線通信部23は、無線通信回路やアンテナを備え、ネットワークNWに接続するためのインタフェースである。無線通信部23は、図示せぬアンテナを介して無線基地局との間で無線通信を行い、音声通信やデータ通信を行う通信部として機能する。操作部24は、テンキー等の複数の操作子を備え、ユーザによる操作子の操作を受け付けて、その操作に応じた操作信号を制御部21に出力する。表示部25は、例えば液晶駆動回路や液晶ディスプレイを備え、画像の表示により情報に応じた内容を報知する。記憶部26は、例えばEEPROM(Electronically Erasable and Programmable Read Only Memory)を備え、通話相手先の名称及びその通話相手先に割り当てられた電話番号が記述された電話帳データ等を記憶する。
【0018】
図5は、サーバ装置10の制御部11の機能的構成を示す機能ブロック図である。制御部11は、プログラムを実行することにより、確認要求取得部111と、特徴情報生成部112と、照合部113と、通知部114とに相当する機能を実現する。
確認要求取得部111は、第1端末装置20によって送信された確認要求メッセージを、ネットワーク通信部12による第1端末装置20との通信により取得する。確認要求メッセージは、第1端末装置20がサーバ装置10に対して話者確認サービスの利用を要求する際に送信するメッセージであり、少なくとも第1端末装置20の契約者が指定されている。例えば、確認要求メッセージは、第1端末装置20の契約者を識別する契約者情報、第1端末装置20が行う音声通信の通話相手先を識別する相手先情報、及び第1端末装置20が第2端末装置30から受信した送話音声を示す音声信号を含む。確認要求メッセージに含まれる音声信号は、例えば、音声通信中に第1端末装置20が受信した音声信号の一部である。
【0019】
特徴情報生成部112は、第1端末装置20と第2端末装置30との音声通信が開始された後、第2端末装置30からの送話音声に応じて特徴情報を生成する。特徴情報生成部112は、例えば、確認要求取得部111が取得した確認要求メッセージに含まれる音声信号を解析して特徴情報を生成する。
【0020】
照合部113は、音声通信を行う第1端末装置20の契約者及びその通話相手先に対応して契約者情報DB131に記憶された特徴情報と、特徴情報生成部112が生成した特徴情報とを照合する。照合部113は、例えば、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けられた特徴情報を契約者情報DB131から取得し、取得した特徴情報と特徴情報生成部112で生成された特徴情報とを照合する。
【0021】
通知部114は、照合部113が照合した結果を、ネットワーク通信部12による第1端末装置20との通信により、第1端末装置20に通知する。通知部114は、照合部113の照合結果に応じて、例えば、通話相手先のユーザの真偽を示す話者確認の結果を通知する。
【0022】
図6は、第1端末装置20の制御部21の機能的構成を示す機能ブロック図である。制御部21は、プログラムを実行することにより、受付部211と、確認要求送信制御部212と、照合結果取得部213と、報知部214とに相当する機能を実現する。
受付部211は、ユーザが操作部24に対して行う操作に応じて、話者確認サービスの利用する旨の指示をユーザから受け付ける。
確認要求送信制御部212は、第1端末装置20の契約者と第1端末装置20の音声通信の通話相手先とが指定され、かつ、第2端末装置30からの送話音声を示す音声信号を含む確認要求メッセージを、無線通信部23によってサーバ装置10に送信させる。送話音声を示す音声信号は、例えば、受付部211により話者確認サービスの利用を指示する操作が受け付けられたことを契機に、確認要求送信制御部212の制御により送話音声が録音された結果(例えば、所定時間分の音声信号)を示す。
【0023】
照合結果取得部213は、無線通信部23による通信によりサーバ装置10から受信した、通知部114により通知された照合の結果(つまり、話者確認の結果)を取得する。
報知部214は、照合結果取得部213が取得した照合の結果の内容を報知する。報知部214は、例えば、通話相手先のユーザの真偽を第1端末装置20のユーザに知らしめるためのメッセージを表示部25に表示させる。
次に、話者確認システム1の動作を説明する。
【0024】
まず、サーバ装置10が話者確認サービスを提供するために、図3に示すデータ構造の契約者情報DB131が、サーバ装置10の記憶部13に予め記憶されている。契約者情報DB131に登録される契約者情報については、契約者による話者確認サービスの利用の申し込みによってサーバ装置10の管理者(通信事業者)により設定される。契約者情報DB131に登録される相手先情報は、話者確認サービスが提供される第1端末装置20のユーザにより登録される。本実施形態の相手先情報は、第1端末装置20の電話帳データにも予め登録されているものとする。契約者情報DB131に登録される特徴情報は、第1端末装置20が事前に行った音声通信により通話相手先から取得した音声信号をサーバ装置10に提供し、サーバ装置10によりこの音声信号に基づいて生成されたものである。サーバ装置10は、高速フーリエ変換等によって、第1端末装置20から提供された音声信号を解析して周数スペクトル分析を行い、この分析結果を示す特徴情報を、話者確認サービスの利用者たる端末装置の契約者毎に分類して、契約者情報DB131に記憶させる。
次に、話者確認システム1の話者確認サービスに係る動作を説明する。
【0025】
図7は、話者確認システム1の動作手順を示すシーケンスチャートである。
本実施形態で発信側の端末装置となる第2端末装置30のユーザは、第1端末装置20のユーザとの音声通信を行うべく、電話帳データから通話相手先を指定したり電話番号を直接入力したりして、音声通信を開始させるための操作を行う。この操作を受け付けると、第2端末装置30は、第1端末装置20の発呼をネットワークNWに指示する(ステップS1)。第1端末装置20はネットワークNW経由で第2端末装置30からの発呼を受け付ける。そして、第1端末装置20がユーザによる操作部24のオフフックキーの操作を受け付けると、第2端末装置30と第1端末装置20との間に通信路が確立され、音声通信が開始される(ステップS2)。
【0026】
次に、第1端末装置20のユーザが、例えば、第2端末装置30に関する情報が自装置の電話帳データに登録されていなかったり、第2端末装置30のユーザが真のユーザであるかを確認したいと考えた場合、操作部24に所定の操作を行って、話者確認サービスの利用を第1端末装置20に指示する。第1端末装置20の制御部21は、話者確認サービスの利用を指示する操作を受け付けると、確認要求メッセージを生成して、無線通信部23によりサーバ装置10に送信する(ステップS3)。
確認要求メッセージは、第1端末装置20の契約者情報と、第2端末装置30の相手先情報と、第2端末装置30からの送話音声の音声信号とを含む。第1端末装置20の契約者情報は自装置に割り当てられた電話番号であり、予め第1端末装置20に登録されている。相手先情報は、例えば、第1端末装置20のユーザにより電話帳データが参照されて指定された通話相手先を示す。ここでは、確認要求メッセージは、契約者情報「090−○○○○−□□□□」と、相手先情報「UID001」とを含んでいるものとする。また、第1端末装置20は、ユーザからの話者確認サービスの利用を指示する操作を契機に、第2端末装置30からの送話音声を所定時間だけ録音して音声信号を生成し、確認要求メッセージに含めておく。
【0027】
次に、サーバ装置10の制御部11は、ネットワーク通信部12による第1端末装置20との通信により確認要求メッセージを受信すると、確認要求メッセージに含まれる送話音声を示す音声信号に基づいて特徴情報を生成する(ステップS4)。ここでは、制御部11は、音声信号を解析して周波数スペクトル分析を行った結果を示す特徴情報を生成する。
次に、制御部11は、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けて契約者情報DB131に記憶された特徴情報を取得する(ステップS5)。制御部11は、契約者情報と相手先情報とに対応付けて契約者情報DB131に記述された特徴情報を読み出して、これを取得する。ここでは、制御部11は特徴情報「crtA1」を取得し、それ以外の特徴情報については契約者情報DB131から取得しない。
【0028】
次に、制御部11は、ステップS4の処理で生成した特徴情報と、ステップS5の処理で取得した特徴情報とを照合する(ステップS6)。ここでは、制御部11は、ステップS4の処理で生成した特徴情報と、ステップS5の処理で取得した特徴情報「crtA1」との類似度(尤度)を算出する。ここで、照合される特徴情報が類似する度合いが高いほど尤度が高い値を示すものとする。特徴情報の類似の度合いを示す尤度の算出方法については、サーバ装置10は公知の方法を採用してよい。
【0029】
次に、制御部11は、ステップS6の処理で得た照合の結果を、ネットワーク通信部12により第1端末装置20に通知する(ステップS7)。ここでは、制御部11は、ステップS6の処理で算出した尤度を通知する。
【0030】
第1端末装置20の制御部21は、無線通信部23により照合結果を受信すると、受信した照合結果の内容を、表示部25への表示により報知する(ステップS8)。ここでは、制御部21は、尤度が閾値以上であれば、第2端末装置30のユーザが真のユーザであると判定し、尤度が閾値未満であれば、第2端末装置30のユーザが真のユーザでないと判定する。例えば、制御部21は、真のユーザであると判定した場合は、「話者確認の結果、○○さんと確認できました。」というメッセージを表示させ、真のユーザでないと判定した場合は、「話者確認の結果、○○さんと確認できませんでした。」というメッセージを表示部25に表示させる。ここで、「○○」には、例えば電話帳データに登録された名称が表示される。この報知の内容を見た第1端末装置20のユーザは、真のユーザと確認できれば安心して会話を続けることができるし、真のユーザでないと報知された場合には、そこで音声通信を終了して、例えば真のユーザに電話を掛け直す等といった対応を採ることができる。
なお、第1端末装置20は、第2端末装置30のユーザが真のユーザであるかに代えて、サーバ装置10から通知された尤度を報知してもよいし、これら両方を報知してもよい。また、サーバ装置10が、ステップS7の処理で第2端末装置30のユーザが真のユーザであるか否かを判定し、この判定結果を照合結果として通知してもよい。第1端末装置20がバイブレーション機能を用いて報知してもよいし、光や音を用いて報知してもよく、照合結果を第1端末装置20のユーザに知らしめるための方法はどのようなものでもよい。
【0031】
以上が、話者確認サービスに係る話者確認システム1の動作の説明である。以上の動作説明では、契約者情報「090−○○○○−□□□□」のユーザが、相手先情報「UID001」の通話相手先についての話者確認を要求したので、特徴情報「crtA1」を用いた場合の照合結果が第1端末装置20に提供される。一方、契約者情報「090−△△△△−××××」のユーザが、相手先情報「UID001」の通話相手先についての話者確認を要求した場合、図3を見ても分かるように、特徴情報「crtA2」を用いた照合の結果が第1端末装置20に提供される。このように、サーバ装置10では、契約者毎に特徴情報が独立して用意されているので、本実施形態の話者確認システム1により以下の効果を奏する。
【0032】
一般に、ユーザが電話を掛ける際には、通話相手の人物によって声の調子が異なることがある。例えば、同一ユーザの発話音声であっても、気軽に話せる場合と緊張する場合とでは音声特徴が異なるはずである。要するに、同一ユーザの発話音声であっても、通話相手先によってその特徴は異なると考えられる。よって、発話音声の特徴を基に話者確認を行おうとした場合、通話相手(ここでは、第1端末装置20の契約者たるユーザに対応。)に関わらず同一の特徴情報を用いていては、その通話相手次第で、照合結果の精度が低下すると考えられる。これでは、通話相手先のユーザが真のユーザであるにも関わらず、照合の結果、なりすましによる偽者と判断されてしまう可能性がある。これに対し、本実施形態の話者確認システム1では、契約者と通話相手先との双方により定まる特徴情報が照合に用いることで、音声通信を行う者同士に適した音声特徴により話者確認が行われる。これにより、話者確認システム1によれば、音声通信の通話相手次第で、話者確認の結果の精度が低下する可能性を抑えることができる。
【0033】
また、本実施形態の話者確認システム1では、サーバ装置10が音声信号に基づいて特徴情報を生成する処理を行う。一方、第1端末装置20は確認要求メッセージをサーバ装置10に送信し、この確認要求メッセージに応じてサーバ装置10から通知された話者確認の結果を報知すればよく、第1端末装置20はそれ以外は一般的な電話端末と同様に動作すればよい。このように、話者確認システム1では、話者確認に係る処理のほとんどをサーバ装置10で担うことができるので、話者確認システム1の第1端末装置20については、既存の端末装置からの変更点を少なくすることができる。これにより、話者確認サービスの提供を受けたいユーザが、このサービスを受けるためにわざわざ端末装置を買い替える必要が生じるのを抑えることができる。
【0034】
[変形例]
本発明は、上述した実施形態と異なる形態で実施することが可能である。本発明は、例えば、以下のような形態で実施することも可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
[変形例1]
上述した実施形態では、サーバ装置10は契約者情報DB131に記憶された特徴情報を用いて照合を行っていたが、更に、この特徴情報を更新する構成を備えてもよい。
図8は、この変形例のサーバ装置10の制御部11の機能的構成を示す機能ブロック図である。
図8に示すように、制御部11は、プログラムを実行することにより、確認要求取得部111と、特徴情報生成部112と、照合部113と、通知部114と、更新部115とに相当する機能を実現する。確認要求取得部111、特徴情報生成部112、照合部113及び通知部114は、上述した第1実施形態と同等に機能する。更新部115は、契約者情報DB131に記憶された特徴情報を、同一の契約者及び通話相手先について特徴情報生成部112が生成した特徴情報で更新する。
次に、話者確認システム1の動作を説明する。
【0035】
図9は、話者確認システム1における動作手順を示すシーケンスチャートである。
ステップS1〜S8までの処理ステップは、上述した実施形態と同じであるから、ここではその説明を省略する。
サーバ装置10の制御部11は、第2端末装置30と第1端末装置20との音声通信が行われたことを契機に、これら両端末で定まる特徴情報を更新する(ステップS9)。第2端末装置30と第1端末装置20との音声通信が行われた場合に契約者情報DB131に記憶された特徴情報を更新するとき、制御部11は、第1端末装置20の契約者及び第2端末装置30に対応する特徴情報を更新する。例えば、制御部11は、ステップS4の処理で生成した特徴情報が「crtA3」であれば、図3に示す特徴情報「crtA1」を、特徴情報「crtA3」に書き換えるよう、契約者情報DB131を更新する。
以上の契約者情報DB131の更新は、音声通信が行われるたびに行われてもよいし、決められた期間毎に行われてもよいし、第1端末装置20から指示された場合に行われてもよく、更新の時期や頻度については任意である。
本変形例の話者確認システム1によれば、通話相手先のユーザの発話音声の特徴が時間とともに変化したような場合であっても、話者確認に係る照合にこの変化を反映させることができる。この結果、時間の経過とともに、話者確認の精度が低下してしまうことを予め抑えることができる。また、この更新に係る処理に関して、第1端末装置20のユーザに手間が掛けられることもない。
【0036】
[変形例2]
上述した実施形態では、話者確認システム1において音声通信が行われている期間に話者確認が行われていたが、音声通信の終了後に話者確認が行われてもよい。
図10は、この変形例のサーバ装置10の制御部11の機能的構成を示す機能ブロック図である。
図10に示すように、制御部21は、プログラムを実行することにより、受付部211と、確認要求送信制御部212と、照合結果取得部213と、報知部214とに相当する機能を実現する。受付部211、照合結果取得部213及び報知部214は、上述した第1実施形態と同等に機能する。確認要求送信制御部212は、音声通信の終了後において、第1端末装置20の契約者を示す契約者情報と第2端末装置30を示す相手先情報とを含み、かつ、第2端末装置30の送話音声を示す音声信号から生成された特徴情報を含む確認要求メッセージを生成し、無線通信部23によりサーバ装置10に送信する。確認要求送信制御部212は、予めサーバ装置10から受信し記憶部26に記憶しておいた特徴情報を取得して、確認要求メッセージに含める。
【0037】
図11は、話者確認システム1における動作手順を示すシーケンスチャートである。
ステップS1〜S8までの処理ステップは、上述した実施形態と同じであるから、ここではその説明を省略する。
サーバ装置10の制御部11は、第2端末装置30と第1端末装置20との音声通信中において、ステップS4の処理で生成した特徴情報をネットワーク通信部12により第1端末装置20に送信する(ステップS10)。この特徴情報の送信は、例えば、第2端末装置30によりその送信が要求された場合に行われる。そして、第2端末装置30と第1端末装置20との音声通信が終了する(ステップS11)。
【0038】
音声通信の終了後、第1端末装置20は、確認要求メッセージを無線通信部23によりサーバ装置10に送信する(ステップS12)。この確認要求メッセージには、第1端末装置20の契約者を示す契約者情報と、第2端末装置30を示す相手先情報と、ステップS10の処理で第1端末装置20が受信した特徴情報とが含まれる。
次に、サーバ装置10の制御部11は、確認要求メッセージに含まれる契約者情報及び相手先情報に対応付けて契約者情報DB131に記憶された特徴情報を取得する(ステップS13)。次に、制御部11は、ステップS12の処理で取得した確認要求メッセージに含まれる特徴情報と、ステップS13の処理で取得した特徴情報とを照合する(ステップS14)。ここでは、制御部11は、ステップS6の処理と同じ手法で照合処理を行う。次に、制御部11は、ステップS14の処理の照合結果をネットワーク通信部12により第1端末装置20に通知する(ステップS15)。第1端末装置20の制御部21は、無線通信部23により照合結果を受信すると、受信した照合の結果の内容を報知する(ステップS16)。ステップS15,S16の処理は、上述したステップS7,S8の処理と同様に行われればよい。
【0039】
本変形例の話者確認システム1によれば、第1端末装置20は音声通信の終了後においても話者確認サービスを利用することができる。よって、第1端末装置20のユーザが事後的に通話相手先のユーザの真偽を確認したくなった場合でも、この確認を行うことが可能である。
なお、本変形例では、話者確認システム1は音声通信中にも話者確認を行うことができるが、音声通信の終了後のみに話者確認を行う構成であってもよい。
【0040】
[変形例3]
上述した実施形態では、サーバ装置10は、着信側となる第1端末装置20からの確認要求に応じて発信側となる第2端末装置30の話者確認を行い、話者確認の結果を着信側となる第1端末装置20に通知していた。これに代えて、サーバ装置10は、第1端末装置20が発信側となった場合に、第1端末装置20からの要求に応じて着信側の第2端末装置30の話者確認を行い、話者確認の結果を発信側の第1端末装置20に通知してもよい。
【0041】
[変形例4]
上述した実施形態では、通話相手先を指定するための相手先情報が確認要求メッセージに含まれていたが、確認要求メッセージに相手先情報が含まれないようにしてもよい。この場合、サーバ装置10は、確認要求メッセージで指定された契約者に対応して契約者情報DB131に記憶されたすべての通話相手先の特徴情報を、照合の対象とするとよい。話者確認サービスで話者確認が行われる通話相手先は、例えば親族や友人等の限られた範囲に限定されることが多い。よって、契約者情報から確認要求メッセージを送信してきた端末装置の契約者をサーバ装置10が特定し、その契約者に対応するすべての通話相手先を照合対象としても、サーバ装置10において照合処理に係る負荷が過大になることはほとんどないと考えられる。また、第1端末装置20のユーザは話者確認サービスの利用時において、通話相手先を指定する操作を行わなくて済む。
【0042】
[変形例5]
本発明において、発話音声の特徴を示す特徴情報は、周波数スペクトルの分析結果以外のものでもよい。例えば、発話音声の特徴を示す特徴情報として、ユーザの声紋を特定するためのデータを採用してもよい。要するに、音声の特徴を照合してユーザの同一性を確認するための種々の照合方法を、本発明に適用することができる。この場合も、発話音声の特徴を示す特徴情報は、端末装置の契約者ごとに分類されて契約者情報DB131で管理される。更に、サーバ装置10が特徴情報を生成する基となる情報は、確認要求メッセージに含まれた音声信号でなくてもよい。要するに、サーバ装置10は、送話音声に応じた特徴情報を生成するのに用いる情報を取得できればよい。
また、契約者情報は、第1端末装置20の契約者を識別できればよく、電話番号以外にSIM(Subscriber Identity Module)カード等で特定される端末識別情報や、話者確認サービスの利用者に対し予め割り当てられたものであってもよい。また、相手先情報についても、通話相手先に割り当てられた電話番号等の別の情報であってもよい。
【0043】
[変形例6]
上述した各実施形態では、本発明の端末装置が携帯電話端末である場合を説明したが、本発明は、その他の端末装置に適用することも可能である。例えば、本発明の端末装置は、音声通信を行う機能を有していれば、例えば、スマートフォンや固定電話、モバイルコンピュータ、携帯ゲーム機、タブレット端末等であってもよい。
また、サーバ装置10が契約者情報DB131を記憶する構成に限らず、サーバ装置10からみた外部装置が契約者情報DB131を記憶していてもよい。この場合、サーバ装置10はこの外部装置にアクセスして契約者情報DB131を参照した処理を行う。
上述したサーバ装置10の制御部11が実現する各機能、及び第1端末装置20の制御部21が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の協働によって実現され得る。
【符号の説明】
【0044】
1…話者確認システム、10…サーバ装置、11…制御部、111…確認要求取得部、112…特徴情報生成部、113…照合部、114…通知部、115…更新部、12…ネットワーク通信部、13…記憶部、131…契約者情報DB、20…第1端末装置、21…制御部、211…受付部、212…確認要求送信制御部、213…照合結果取得部、214…報知部、22…音声入出力部、23…無線通信部、24…操作部、25…表示部、26…記憶部、30…第2端末装置
【特許請求の範囲】
【請求項1】
第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、
前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、
前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、
前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、
前記照合部が照合した結果を前記第1端末装置に通知する通知部と
を備えることを特徴とするサーバ装置。
【請求項2】
前記確認要求取得部は、前記音声通信を行う第2端末装置が更に指定された前記確認要求を取得し、
前記照合部は、前記確認要求で指定された契約者と当該第2端末装置とに対応して記憶された特徴情報を前記特徴情報記憶部から取得し、取得した特徴情報と前記生成部が生成した特徴情報とを照合する
ことを特徴とする請求項1に記載のサーバ装置。
【請求項3】
前記照合部は、
前記音声通信の終了後、当該音声通信を行った第2端末装置に対応する前記特徴情報を含む前記確認要求が受信された場合、当該確認要求で指定された契約者に対応して前記特徴情報記憶部に記憶された特徴情報と、当該確認要求に含まれる特徴情報とを照合する
ことを特徴とする請求項1又は2に記載のサーバ装置。
【請求項4】
前記特徴情報記憶部に記憶された特徴情報を、同一の契約者及び第2端末装置について前記生成部が生成した特徴情報で更新する更新部
を備えることを特徴とする請求項1から3のいずれか1項に記載のサーバ装置。
【請求項5】
サーバ装置と第1端末装置とを備える話者確認システムであって、
前記サーバ装置は、
前記第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、
前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、
前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、
前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、
前記照合部が照合した結果を前記第1端末装置に通知する通知部と
を有し、
前記第1端末装置は、
前記第2端末装置との音声通信と、前記サーバ装置との通信を行う通信部と、
前記通信部により音声通信が開始された後、自装置の契約者が指定された前記ユーザの確認要求を、前記通信部により前記サーバ装置に送信する送信制御部と、
前記通信部により前記サーバ装置から受信した、前記通知部により通知された前記結果の内容を報知する報知部と
を有することを特徴とする話者確認システム。
【請求項1】
第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、
前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、
前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、
前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、
前記照合部が照合した結果を前記第1端末装置に通知する通知部と
を備えることを特徴とするサーバ装置。
【請求項2】
前記確認要求取得部は、前記音声通信を行う第2端末装置が更に指定された前記確認要求を取得し、
前記照合部は、前記確認要求で指定された契約者と当該第2端末装置とに対応して記憶された特徴情報を前記特徴情報記憶部から取得し、取得した特徴情報と前記生成部が生成した特徴情報とを照合する
ことを特徴とする請求項1に記載のサーバ装置。
【請求項3】
前記照合部は、
前記音声通信の終了後、当該音声通信を行った第2端末装置に対応する前記特徴情報を含む前記確認要求が受信された場合、当該確認要求で指定された契約者に対応して前記特徴情報記憶部に記憶された特徴情報と、当該確認要求に含まれる特徴情報とを照合する
ことを特徴とする請求項1又は2に記載のサーバ装置。
【請求項4】
前記特徴情報記憶部に記憶された特徴情報を、同一の契約者及び第2端末装置について前記生成部が生成した特徴情報で更新する更新部
を備えることを特徴とする請求項1から3のいずれか1項に記載のサーバ装置。
【請求項5】
サーバ装置と第1端末装置とを備える話者確認システムであって、
前記サーバ装置は、
前記第1端末装置の契約者毎に、当該第1端末装置の音声通信の相手となる第2端末装置のユーザの発話音声の特徴を示す特徴情報を記憶する特徴情報記憶部と、
前記音声通信の開始後、前記第1端末装置の契約者が指定された前記ユーザの確認要求を当該第1端末装置から取得する確認要求取得部と、
前記音声通信を行う第2端末装置からの送話音声に応じて、前記特徴情報を生成する生成部と、
前記確認要求取得部が取得した確認要求で指定された契約者と前記音声通信を行う第2端末装置とに対応して前記特徴情報記憶部に記憶された特徴情報と、前記生成部が生成した特徴情報とを照合する照合部と、
前記照合部が照合した結果を前記第1端末装置に通知する通知部と
を有し、
前記第1端末装置は、
前記第2端末装置との音声通信と、前記サーバ装置との通信を行う通信部と、
前記通信部により音声通信が開始された後、自装置の契約者が指定された前記ユーザの確認要求を、前記通信部により前記サーバ装置に送信する送信制御部と、
前記通信部により前記サーバ装置から受信した、前記通知部により通知された前記結果の内容を報知する報知部と
を有することを特徴とする話者確認システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2013−9101(P2013−9101A)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願番号】特願2011−139648(P2011−139648)
【出願日】平成23年6月23日(2011.6.23)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願日】平成23年6月23日(2011.6.23)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
[ Back to top ]