説明

通話録音方法及び通信端末

【目的】通信端末を用いてなされる通話の通話音声データを簡便に管理できる通話録音方法及び通信端末を提供することである。
【構成】複数の通信端末間で交信される通話音声を録音して通話音声記録データを作成する通話録音方法であり、該通信端末間に通話セッションが確立される度に、該通話音声を表す通話音声データを生成し、かつこれを識別する記録管理データを生成し、該記録管理データを音声にて表現する合成音声をデータ化して得られる合成音声記録管理データを生成し、これを該通話音声データと結合して該通話音声記録データとする。本発明による通信端末は、音声通話機能を備えると共に、かかる通話録音方法を実行する手段を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、遠隔相談サービスを提供するコサルステーション(登録商標)システムにおいて各拠点に配置される遠隔相談端末の如き、通信端末を用いた通話音声を録音する通話録音方法及びかかる通信端末に関する。
【背景技術】
【0002】
「通話録音装置及び通話録音方法」と題する特許文献1は、IPアドレスに対応付けられた通話音声データを記憶する技術を開示している。また、「通話録音システム」と題する特許文献2は、通話録音を行うに際して通話の概要を文字データ入力する技術を開示している。さらに、「コールセンタにおける通話音声データ管理方式及びオペレータ端末」と題する特許文献3は、通話音声データを各種管理データにより顧客と関連付けてデータベース化する技術を開示している。
【0003】
かかる技術は、通話内容を録音して通話音声データを保存すると共に、該通話音声データを通話概要の如き記録管理データにより管理するものである。
【特許文献1】特開2003−092632号公報
【特許文献2】特開2005−012339号公報
【特許文献3】特開2005−192024号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、かかる管理形態の何れもが通話概要の如き文字情報によって各通話音声データを管理するものであって簡便な管理を可能とするものではなかった。
【0005】
本発明の目的は、通信端末を用いてなされる通話の通話音声データを簡便に管理できる通話録音方法及び通信端末を提供することである。
【課題を解決するための手段】
【0006】
請求項1に係わる通話録音方法は、複数の通信端末間で交信される通話音声を録音して通話音声記録データを作成する通話録音方法であり、該通信端末間に通話セッションが確立される度に、該通話音声を表す通話音声データを生成し、かつこれを識別する記録管理データを生成する生成ステップと、該記録管理データを音声にて表現する合成音声をデータ化して得られる合成音声記録管理データを生成する音声合成ステップと、該合成記録管理データを、該通話音声データと結合して該通話音声記録データとする結合ステップとを含むことを特徴とする。
【0007】
請求項5に係わる通信端末は、音声通話機能を備える通信端末であり、通話先通信端末と通話セッションを確立するセッション確立手段と、該通話セッションが確立される度に、該通話音声を表す通話音声データを生成し、かつこれを識別する記録管理データを生成する生成手段と、該記録管理データを音声にて表現する合成音声をデータ化して得られる合成音声記録管理データを生成する音声合成手段と、該合成記録管理データを、該通話音声データと結合して該通話音声記録データとする結合手段とを含むことを特徴とする。
【発明の効果】
【0008】
本発明による通話録音方法及び通信端末によれば、録音された通話音声データに録音開始時刻の如き記録管理データを通話音声データに付加する構成が与えられる。これにより、通信端末を用いてなされる通話の通話音声データを簡便に管理することができる。
【発明を実施するための最良の形態】
【0009】
本発明の実施例について添付の図面を参照しつつ詳細に説明する。
<第1の実施例>
図1は、本発明の第1の実施例を示し、本発明による通信端末の構成を示している。 遠隔相談端末10は、通常のコンピュータ装置により実現される通信端末であり、通常の中央演算処理装置(CPU)12及び主記憶装置(MEM)13と、補助記憶装置14と、音声入出力インタフェース(I/F)15と、映像入出力インタフェース(I/F)16と、ネットワークインタフェース(I/F)17とを含み、これらがバス11により相互に接続されている。遠隔相談端末10は、本発明による通話録音方法を実行する。
【0010】
補助記憶装置14は、中央演算処理装置12により実行される各種ソフトウェアが予めから格納されていると共に、複数の通話音声記録ファイル81〜8N(Nは正数)が記憶される記憶装置である。通話音声記録ファイル81〜8Nの各々は、顧客が相談サービスを受ける通話セッション毎に作成される通話音声記録データのファイルであり、該通話音声記録データは、当該顧客や相談員と外部の端末(例えば、相談センタの専門相談員)との間でやり取りされた通話音声が録音されている。該通話音声記録データの形式は、例えば、PCM符号化されたデジタル音声信号であるWAV形式や、PCM符号化されたデジタル音声信号に対して更に適切な圧縮化を施したMP3形式(MPEG1オーディオレイヤIII)が考えられる。
【0011】
音声入出インタフェース(I/F)15は、マイクロフォン151及びスピーカ152が接続されて外部音声との入出力を行い、外部音声と内部のデジタル音声信号との相互変換を行う機能を備える。映像入出力インタフェース(I/F)16は、モニタディスプレイ161及びWebカメラ162が接続され、Webデータや各種データを表示再生すると共に、顧客や相談員の映像を取り込み、これをデジタル映像信号に変換する機能を備える。ネットワークインタフェース(I/F)17は、VPN(Virtual Private Network)等のネットワークを介して外部の端末やセンタシステムとの間でWebデータ、音声データ及びTV映像データを送受信する機能を備える。
【0012】
図2は、図1に示した主記憶装置に展開されるソフトウェア構成を示している。ソフトウェア構成70は、コンピュータ装置としての遠隔相談端末10の全体制御を司るオペレーティングシステム71と、映像・音声ドライバ部74と、ブラウザ部75と、遠隔相談アプリケーション部76と、TV会議アプリケーション部77とを含む。
【0013】
オペレーティングシステム71は、また、時刻収集部72及び端末サービス部73を含む。時刻収集部72は、中央演算処理装置(CPU)のクロック信号に同期して得られる内部時計の最新時刻を現在時刻として収集し、これを遠隔相談アプリケーション部76を含む各アプリケーションに供給する機能を備える。端末サービス部73は、相談員のログイン指令に応じて、外部端末またはセンタシステムとの間に通話セッションを確立する機能を備える。
【0014】
映像・音声ドライバ部74は、音声入出インタフェースを介して入出力されるデジタル音声信号、並びに映像入出力インタフェースを介して入出力されるデジタル音声を、遠隔相談アプリケーション部76及びTV会議アプリケーション部77との間で受け渡す機能を備える。
【0015】
ブラウザ部75は、ネットワークインタフェースを介して入出力される通信データからWebデータを抽出し、これを映像入出力インタフェースを介してモニタディスプレイに表示する機能を備える。
【0016】
遠隔相談アプリケーション部76は、遠隔相談端末10の主機能として外部の端末との間でリモートコンサルティングすなわち遠隔相談サービスを提供する機能を備える。かかるコンサルティング機能としては、例えば、相談内容に応じて外部端末やセンタシステムとの間でデータ通信を行うと共に、並行して両者の間で通話を実現する機能がある。遠隔相談アプリケーション部76は、また、遠隔相談サービスを利用者に提供する時間にわたって、その音声通話の内容をそのまま録音して音声通話データを生成する機能を備える。録音された内容は、オペレーティングシステム71による入出力制御の下に補助外部記憶装置14に通話音声記録ファイルとして記録される。
【0017】
遠隔相談アプリケーション部76は、さらに、音声合成部77を含む。音声合成部77は、通話セッションの開始時及び終了時に、自動的に、年月日及び時分秒を含む現在時刻及び相談員の識別情報、例えばログインアカウントや相談員の氏名を含む記録管理データを音声にて表現する合成音声をデータ化して得られる音声合成記録管理データ(以下、合成前の記録管理データと同様に記録管理データと称する)を生成する機能を備える。該記録管理データは、通話音声データと同一形式のデータである。
【0018】
TV会議アプリケーション部77は、遠隔相談アプリケーション部76と連携して、外部端末を含む複数の端末との間でTV会議を実現する機能を備える。
【0019】
図3は、図1に示した通話音声記録ファイルの構成を示している。複数の通話音声記録ファイル81〜8N(Nは正数)の各々は、外部の利用者端末との通話セッション毎に作成される。1つの通話音声記録ファイル81は、音声ヘッダ811と、通話音声データ812と、音声フッタ813とから構成される。音声ヘッダ811、通話音声データ812及び音声フッタ813の各々は、MP3等の同一形式の音声情報であり、これらが適切に連結処理されることで連続して再生可能なように繋げられている。音声ヘッダ311は、録音の開始時刻と、相談員の識別情報としてログインアカントが合成音声化された記録管理データである。相談員の識別情報はログインアカントに限られず、相談員の所属、氏名等の当該相談員を一意に識別可能な情報が用いられも良い。音声フッタ313は、録音の終了時刻の発音情報が合成音声化された記録管理データである。
【0020】
図4は、遠隔相談サービスの提供時に行う音声録音処理の処理手順を示している。ここでは、遠隔相談端末10が外部端末50にログインする場合を示している。該音声録音処理は、遠隔相談端末10の遠隔相談アプリケーション部76と、音声合成処理部77と、補助記憶装置14とが協働してなされる。
【0021】
先ず、操作者のログイン操作に応じて、遠隔相談端末10の遠隔相談アプリケーション部76は、該ログインを受け付ける(ステップS1)。これより、遠隔相談アプリケーション部76と外部端末50とが通話セッションを確立する(ステップS2)。
【0022】
次に、遠隔相談端末10の音声合成処理部77は、現在時刻及びログインアカウントを収集する(ステップS3)。次いで、該現在時刻及びログインアカウントから音声ヘッダを音声合成し(ステップS4)、補助記憶装置14に供給する。補助記憶装置14は、該音声ヘッダを通話音声記録ファイルに書き込む(ステップS5)。
【0023】
並行して、遠隔相談アプリケーション部76は、外部端末50との間の通話内容を録音して通話音声データを生成し(ステップS6)、これを補助記憶装置14に供給する。補助記憶装置14は、該通話音声データを通話音声記録ファイルに書き込む(ステップS7)。
【0024】
コンサルティングの終了に際した操作者のログアウト操作に応じて、遠隔相談アプリケーション部76は、外部端末50との通話セッションを終了する(ステップS8)。次いで、遠隔相談アプリケーション部76は、現在時刻を収集し(ステップS9)、該現在時刻を音声合成処理部77に供給する。音声合成処理部77は、該現在時刻に基づいて音声フッタを音声合成し(ステップS10)、これを補助記憶装置14に供給する。補助記憶装置14は、該音声フッタを通話音声記録ファイルに書き込む(ステップS11)。
【0025】
以上の処理手順により、音声ヘッダ、通話音声データ及び音声フッタを含む通話音声記録ファイルが作成される。該通話音声記録ファイルを再生することにより、録音開始時刻やログインアカントが発音され、引き続いて録音内容が発音されて最後に録音終了時刻が発音される。これにより、録音内容と共に当該録音内容の記録管理データを簡便に認識することができる。
<第2の実施例>
図5は、本発明の第2の実施例を示し、本発明による通信端末を遠隔相談端末とする遠隔相談システムの全体構成を示している。ここでは、複数の営業店C及びDと、複数の相談センタA及びBと、データセンタEとがVPN(Virtual Private Network)ネットワーク30を介して繋がれている。VPNネットワーク30は、伝送されるべき通信データに対して適切なカプセル化を施すことより外部からの盗聴及び改竄を防ぐことで、インターネットの如き公衆網のなかに仮想的な専用網を形成できるネットワークである。
【0026】
相談センタA及びBの各々は、複数の遠隔相談端末10a〜10dを含み、これらがVPN装置32または34を介してVPNネットワーク30に繋がれている。一方、営業店C及び営業店Dの各々は、複数の遠隔相談端末10e〜10hを含み、これらがVPN装置31または32を介してVPNネットワーク30に繋がれている。さらに、データセンタEは、AP共有サーバ41及びTV会議サーバ42を含み、これらがVPN装置35を介してVPNネットワーク3に繋がれている。複数の遠隔相談端末10a〜10hの各々は、第1の実施例における遠隔相談端末10(図1参照)と同一の構成を有する端末である。
【0027】
AP共有サーバ41は、遠隔相談端末10a〜10hの各々に対して、Webコンテンツ共有によるコンサルティングを提供するサーバアプリケーションを実行するサーバである。TV会議サーバ42は、遠隔相談端末10a〜10hのうちの2者間また3者以上の間でTV会議サービスを提供するサーバアプリケーションを実行するサーバである。
【0028】
本実施例における運用例として銀行業務について説明すると、複数の遠隔相談端末10a〜10dは各銀行営業店の相談ブースに設置され、接客を行う相談員が顧客と一緒に端末画面上の情報を閲覧しつつ、コンサルティングやセールスを行う。端末画面上には投資信託など資産運用商品の銀行内共通の情報がAP共有サーバ41により提供される。また、必要に応じて各銀行相談センタの端末を用いた専門相談員が営業店の相談員及び顧客との相談に加わることができる。相談センタの専門相談員は、営業店と同じ画面を共有しつつ、専門的なコンサルティングができる。さらには、TV会議サーバ42を用いることで、専門相談員、営業店の相談員及び顧客の3者はテレビ会議を行うことが可能であり、質の高いコンサルティングを実現することができる。
【0029】
なお、この場合、第1の実施例と同様に、相談員や専門相談員がログインすることによって、同一の通話セッションに参加した相談員や専門相談員それぞれの識別情報を含む記録管理データが音声合成され音声ヘッダとして先頭に付加される。これにより、通話セッションに参加した相談員が複数人いたとしても、すべての相談員を把握することが可能である。また、最初に相談員と顧客による通話セッションが開始され、途中で専門相談員が通話セッショシに参加したような場合には、途中参加した専門相談員の識別情報を含む記録管理データが音声合成され、最初に生成された音声ヘッダの後に、第2の音声ヘッダとして挿入される。これによって、途中参加した相談員についても、どの相談員がどの時点で参加したかを把握することが可能である。
【0030】
このとき、当該音声データを記録する相談端末は、1台であることが望ましいので、記録を行う端末は顧客の第1の相談窓口になると思われる相談員がログインしている端末で行う。専門相談員が通話セッションに参加した情報を相談員の端末が受信すると、相談員の端末は、専門相談員の識別情報の音声ヘッダを生成し、前述の挿入処理を行う。
【0031】
以上の第2の実施例では、本発明による通信端末を遠隔相談端末とする遠隔相談システムが示されたが、該通信端末をオペレータ端末とするコールセンタシステムとする形態も可能である。
【0032】
以上の複数の実施例において、自動的かつ確実に録音時間や相談員の識別を含む記録管理データが通話音声記録ファイルに挿入される。これより、該通話音声記録データを再生することで容易かつ正確に録音時間や相談員の識別情報を認識することができる。また、かかる記録管理データは、システムが自動的に付与するものであるから正確であると共に、人為的な操作が介在しないことで担当者による不正を防止することができる。
【0033】
尚、通話音声データに付加される記録管理データとして、録音開始及び終了時間や相談員の識別情報が例として示されたが、本発明にはかかる限定はなく、CPUが自動的に取得することができる情報であれば端末識別情報等の他の情報であっても良い。
【図面の簡単な説明】
【0034】
【図1】本発明の第1の実施例を示し、本発明による通信端末の構成を示すブロック図である。
【図2】図1に示した主記憶装置に展開されるソフトウェア構成を示すブロック図である。
【図3】図1に示した通話音声記録ファイルの構成を示すブロック図である。
【図4】遠隔相談サービスの提供時に行う音声録音処理の処理手順を示しているシーケンス図である。
【図5】本発明の第2の実施例を示し、本発明による通信端末を遠隔相談端末とする遠隔相談システムの全体構成を示すブロック図である。
【符号の説明】
【0035】
10、10a〜10h 遠隔相談端末
11 バス
12 中央演算処理装置
13 主記憶装置(MEM)
14 補助記憶装置
15 音声入出力インタフェース(I/F)
16 映像入出力インタフェース(I/F)
17 ネットワークインタフェース(I/F)
30 VPNネットワーク
31〜34 VPN装置
41 AP共用サーバ
42 TV会議サーバ
50 外部端末
70 ソフトウェア構成
71 オペレーティングシステム
72 時刻収集部
73 端末サービス部
74 映像・音声ドライバ部
75 ブラウザ部
76 遠隔相談アプリケーション部
77 音声合成部
78 TV会議アプリケーション部
81〜8N 通話音声記録ファイル
811 音声ヘッダ
812 通話音声データ
813 音声フッタ
151 マイクロフォン
152 スピーカ
161 モニタディスプレイ
162 Webカメラ

【特許請求の範囲】
【請求項1】
複数の通信端末間で交信される通話音声を録音して通話音声記録データを作成する通話録音方法であって、
前記通信端末間に通話セッションが確立される度に、前記通話音声を表す通話音声データを生成し、かつこれを識別する記録管理データを生成する生成ステップと、
前記記録管理データを音声にて表現する合成音声をデータ化して得られる合成音声記録管理データを生成する音声合成ステップと、
前記合成記録管理データを、前記通話音声データと結合して前記通話音声記録データとする結合ステップと、
を含むことを特徴とする通話録音方法。
【請求項2】
前記生成ステップは、前記通話セッションの開始時刻、終了時刻及びログインアカントのうちの少なくとも1つを含む記録管理データを生成するステップであることを特徴とする請求項1記載の通話録音方法。
【請求項3】
前記合成ステップは、前記記録管理データのデータ形式を、前記通話音声データのデータ形式と同一のデータ形式とするステップであることを特徴とする請求項1記載の通話録音方法。
【請求項4】
前記結合ステップは、前記合成記録管理データの一部または全部を、前記通話音声データの先頭または末尾に結合するステップであることを特徴とする請求項1記載の通話録音方法。
【請求項5】
音声通話機能を備える通信端末であって、
通話先通信端末と通話セッションを確立するセッション確立手段と、
前記通話セッションが確立される度に、前記通話音声を表す通話音声データを生成し、かつこれを識別する記録管理データを生成する生成手段と、
前記記録管理データを音声にて表現する合成音声をデータ化して得られる合成音声記録管理データを生成する音声合成手段と、
前記合成記録管理データを、前記通話音声データと結合して前記通話音声記録データとする結合手段と、
を含むことを特徴とする通信端末。
【請求項6】
前記生成手段は、前記通話セッションの開始時刻、終了時刻及びログインアカントのうちの少なくとも1つを含む記録管理データを生成することを特徴とする請求項5記載の通信端末。
【請求項7】
前記合成手段は、前記記録管理データのデータ形式を、前記通話音声データのデータ形式と同一のデータ形式とすることを特徴とする請求項5記載の通信端末。
【請求項8】
前記結合手段は、前記記録管理データの一部または全部を、前記通話音声データの先頭または末尾に結合することを特徴とする請求項5記載の通信端末。
【請求項9】
請求項5記載の通信端末を遠隔相談端末として含むことを特徴とする遠隔相談システム。
【請求項10】
請求項5記載の通信端末をオペレータ端末として含むことを特徴とするコールセンタシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−221677(P2007−221677A)
【公開日】平成19年8月30日(2007.8.30)
【国際特許分類】
【出願番号】特願2006−42559(P2006−42559)
【出願日】平成18年2月20日(2006.2.20)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】