説明

録音装置

【課題】簡易な制御で特定の会議参加者の発言を再生可能とする録音装置を提供する。
【解決手段】ミキシングされた音声情報を記録する際に、各会議参加者の音声情報が入力される部分に発言の有無を検出する入力有音検出手段を設けて、発言者を区別する情報と発言の開始/終了をインデックスとして併せて記録し、再生時には記録したインデックスに基づき、再生対象指定手段によって指定された会議参加者毎の発言を検索、選択して再生させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声録音装置に係り、会議参加者の発言の開始・中断を検知して、音声情報に加えて、インデックス情報を付加して記録し、再生時に、指定したインデックス情報を抽出して会議参加者の発言(音声情報)を再生する録音装置に関する。
【背景技術】
【0002】
従来の録音装置における再生制御方法は、以下の文献に記載されている。
特許文献1は、複数の発言者(相手先)からの音声情報がミキシングされた合成音声ファイルを、個別の音声情報ファイルに変換した後、再生する方法を開示している。
【0003】
特許文献2は、複数の発言者(相手先)からの音声情報がミキシングされた合成音声ファイルから、音声認識処理によって各話者の特徴を認識し、特定の話者を抽出して再生する方法を開示している。
【0004】
特許文献3は、会議参加者毎に独立した音声情報として個別音声情報ファイルに記録する方法を開示している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−256498号公報
【特許文献2】特開2007−298876号公報
【特許文献3】特開平9−097220号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1の方法では、パソコン等によってミキシングされた合成音声データファイルから必要な情報を抽出し、個々の音声情報ファイルに変換するため、目的の会議参加者の記録音声を再生するまでに手間が必要である。
また、特許文献2は、音声認識を行うため、再生装置に高度なCPUを搭載する必要があり、再生装置のコストが高騰してしまう。
【0007】
さらに、特許文献3では、会議参加者毎に独立した個別音声情報ファイルとして記録するため、大量の保存用のメモリを用意する必要がある。
本発明の目的は、簡易な制御で特定の会議参加者の発言を再生可能とする録音装置を提供することに有る。
【課題を解決するための手段】
【0008】
そこで本発明では、ミキシングされた音声情報を記録する際に、各会議参加者の音声情報が入力される部分に発言の有無を検出する入力有音検出手段を設けて、発言者を区別する情報と発言の開始/終了をインデックスとして併せて記録し、再生時には記録したインデックスに基づき、再生対象指定手段によって指定された会議参加者毎の発言を検索、選択して再生させる。
【0009】
上述した課題は、特定の音声入力部から入力する音声信号中の有音を検出する特定話者有音検出手段と、複数の音声入力部からの音声をミキシングして録音するミキシング音声録音手段と、ミキシング音声録音手段に録音された音声信号の再生を制御する音声再生制御手段とを有し、ミキシング音声録音手段は、特定話者有音検出手段が有音を検出する毎に録音区間の区切りを示す区切情報を記録し、音声再生制御手段は、区切情報が発言開始を示す位置から再生を開始し、区切情報が発言中断を示す位置を検出する毎に音声再生を一時停止する、または以降の区切情報を検出するまで音声再生をスキップする、または以前の区切情報のタイミングに戻って再度音声を再生する機能を有する録音装置により、達成できる。
【0010】
また、複数の音声入力部に対して音声信号中の有音を検出する複数の入力音声有音検出手段と、複数の音声入力部からの音声をミキシングして録音するミキシング音声録音手段と、ミキシング音声録音手段に録音された音声信号の再生を制御する音声再生制御手段と、再生する対象を指定する再生対象指定手段とを有し、ミキシング音声録音手段は、複数の入力音声有音検出手段が有音を検出する毎に録音区間の区切情報を記録し、音声再生制御手段は、再生対象指定手段によって指定された音声入力部に対応する区切情報に従って発言開始を示す位置から記録された音声情報を抽出して再生を開始し、区切情報が発言中断を示す位置を検出する毎に音声再生を一時停止する、または以降の区切情報を検出するまで音声再生をスキップする、または以前の区切情報のタイミングに戻って再度音声を再生する録音装置により、達成できる。
【発明の効果】
【0011】
本発明によれば、簡易な制御で特定の会議参加者の発言を再生可能とする録音装置を提供することができる。
【図面の簡単な説明】
【0012】
【図1】会議電話装置の構成を説明する機能ブロック図である。
【図2A】音声情報記録メモリの記録内容を説明する図である。
【図2B】区切情報を説明する図である。
【図3】発言中フラグを説明する図である。
【図4】録音制御部の動作を説明するフローチャートである。
【図5】再生対象管理メモリを説明する図である。
【図6】再生制御部の動作を説明するフローチャートである。
【図7】区切情報を説明する図である(その2)。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態について、実施例を用い図面を参照しながら詳細に説明する。なお、実質同一部位には同じ参照番号を振り、説明は繰り返さない。
【実施例1】
【0014】
図1を参照して、録音機能を備えた会議電話装置と電話網との接続構成を説明する。図1において、会議電話装置30は、電話網20を介して、3台の相手先端末10と接続されている。会議電話装置30は、回線インタフェース部301と、呼制御部302と、3式の通話回路31と、通話回路31と1対1で接続された有音検出部32と、音声ミキシング部314と、録音制御部325と、区切情報生成部326と、音声情報記録メモリ315と、再生制御部327と、スピーカ332と、操作部331と、再生用通話回路317と、再生対象指定操作検出部328とから構成されている。
【0015】
回線インタフェース部301は、会議電話装置30と電話網20とを接続する。呼制御部302は、着信、応答および終話を制御する。通話回路31は、回線インタフェース部301を介して各相手先端末10と音声ミキシング部314との間で音声信号を中継する。有音検出部32−1〜有音検出部32−3は、通話回路31−1〜通話回路31−3毎に相手先端末10−1〜10−3から入力された音声信号の有音/無音を検出する。
【0016】
音声ミキシング部314は、相手先端末10−1と相手先端末10−2から入力された音声信号をミキシング(合成)して相手先端末10−3(通話回路3)に出力する。音声ミキシング部314は、また相手先端末10−1と相手先端末10−3から入力された音声信号をミキシング(合成)して相手先端末10−2(通話回路2)に出力する。音声ミキシング部314は、また相手先端末10−2と相手先端末10−3から入力された音声信号をミキシング(合成)して相手先端末10−1(通話回路1)に出力する。
【0017】
音声情報記録メモリ315は、全ての相手先端末10から入力された音声信号をミキシング(合成)した合成音声と区切情報を記録する。録音制御部325は、音声情報記録メモリ315に対して音声ミキシング部314でミキシングされた会議音声情報の録音(保存)を制御する。再生制御部327は、音声情報記録メモリ315に保存された会議音声情報の再生を制御する。
【0018】
録音制御部325は、会議通話が開始されると音声ミキシング部314を有効とし、全ての相手先端末10(通話回路31)から入力された音声信号がミキシングされた会議音声信号を音声情報記録メモリ315に保存する。録音制御部325は、この時、各有音検出部32が有音を検知した際、区切情報生成部326から取得したメモリアドレス(発言開始位置情報)と、呼制御部302から有音を検出した通話回路に対応する相手先端末(会議参加者)の電話番号情報を取得する。録音制御部325は、メモリアドレスと、電話番号とを関連付けた区切情報(インデックス)として音声情報記録メモリ315に保存する。録音制御部325は、また各有音検出部が有音から無音に変化したことを検知した際にも、同様に発言の中断を示す区切情報を生成し、音声情報記録メモリ315に保存する。
【0019】
ここで有音から無音に変化したこととは、有音から無音への状態の変化を検出し、無音が一定時間経過(ここでは1秒)したことを云う。
【0020】
再生制御部327は、操作部331または再生対象指定操作検出部328から、会議音声情報の再生指示を検出すると、音声情報記録メモリ315から指定された会議参加者の区切情報を検索し、抽出した発言開始位置より再生を開始し、スピーカ332または再生用通話回路317を介して、保存された会議音声情報を出力する。また再生制御部327は、発言中断位置に至ったことを検出した場合、該当する会議音声情報の再生を中止する。
【0021】
再生対象指定操作検出部328は、保存された会議音声情報の読出しを行う相手先端末からのPB(DTMF)信号等を受信し、再生の対象となる話者選択、再生の繰返し、停止、終了等の指示を検出する。
【0022】
なお、通話回路31−1〜通話回路31−3によって3つの相手先と接続する例として示しているが、更に通話回路及び有音検知部を追加して、多数の相手先と接続させてもよい。
【0023】
図2を参照して、音声情報記録メモリの記録内容を説明する。図2Aにおいて、音声情報記録メモリ315は、ミキシングされた会議音声情報を蓄積するエリア3151と、区切情報350を蓄積するエリア3152とから構成する。
【0024】
図2Bにおいて、区切情報350は、発言者区分351、発言開始位置352、発言中断位置353で構成されている。ここで、発言者区分351は、発言者の電話番号を記録する。発言開始位置352および発言中断位置353は、ミキシングされた会議音声情報を蓄積するエリア3151の記録開始位置/記録中断位置を示すメモリ番地を記録する。
【0025】
なお、会議記録の先頭のレコードの発言者区分351は、録音開始を記録し、発言開始位置352は、会議音声情報を蓄積するエリア3151の先頭のメモリ番地を記録する。また、会議記録の末尾のレコードの発言者区分351は、録音終了を記録し、発言中断位置353は、会議音声情報を蓄積するエリア3151の末尾のメモリ番地を記録する。
また、同時に発言する場合があるので、区切情報350に記録された発言開始位置352と発言中断位置353とは、各レコードで重なってもよい。
【0026】
図3を参照して、録音制御部が、音声情報記録メモリに会議音声情報の区切情報を保存する際に、発言者(相手先端末)が発言中であるか否かを識別する発言中フラグを説明する。図3において、発言中フラグ360は、発言者区分361と、発言中識別フラグ362で構成される。発言者区分361は、発言者の電話番号を記録する。発言中識別フラグ362は、有音検出部32の検出結果に基づいて、有音検出中に「1」、非有音検出中に「0」を記録している。
【0027】
図4を参照して、録音制御部の処理を説明する。図4において、録音制御部325は、会議通話の開始を待つ(S101)。録音制御部325は、会議通話が開始されたことを認識すると(YES)、区切情報生成部326からメモリ位置情報を取得する(S102)。録音制御部325は、音声情報記録メモリ315に録音の先頭を示す区切情報を記録する(S103)。録音制御部325は、音声ミキシング部314を有効として、ミキシングされた会議音声情報の記録を開始する(S104)。
【0028】
録音制御部325は、カウンタiに1をセットする(S106)。録音制御部325は、有音検出部32−iで有音を検出しているか判定する(S107)。有音を検出しているとき(S107でYES)のとき録音制御部325は、通話回路31−iの発言中フラグがセットされているか判定する(S108)。発言中フラグがセットされていないとき(S108でNO)、録音制御部325は、メモリ位置と電話番号を取得する(S109)。録音制御部325は、発言開始の区切情報を記録する(S111)。録音制御部325は、通話回路31−iの発言中フラグをセットする(S112)。録音制御部325は、カウンタiをインクリメントする(S113)。録音制御部325は、カウンタiが4か判定する(S114)。NOのとき録音制御部325は、ステップ107に遷移する。発言中フラグがセットされているとき(S108でYES)、録音制御部325は、そのままステップ113に遷移する。
【0029】
無音を検知しているとき(107でNO)、録音制御部325は、通話回路31−iの発言中フラグがセットされているか判定する(S116)。YESのとき録音制御部325は、メモリ位置と電話番号を取得する(S117)。録音制御部325は、発言中断の区切情報を記録する(S118)。録音制御部325は、通話回路31−iの発言中フラグをリセットして(S119)、ステップ113に遷移する。ステップ116でNOのとき、録音制御部325は、そのままステップ113に遷移する。
【0030】
ステップ114でYESのとき、録音制御部325は、会議通話が終了したか判定する(S121)。YESのとき、録音制御部325は、ミキシング音声録音を停止する(S122)。録音制御部325は、メモリ位置を取得する(S123)。録音制御部325は、録音終了の区切位置を記録して(S124)、終了する。ステップ121でNOのとき、録音制御部325は、ステップ106に遷移する。
【0031】
図5を参照して、再生制御部が、音声情報記録メモリ315に保存された会議音声情報を再生し、前後の発言検索する際に用いる再生位置メモリの内容を説明する。図5において、再生位置メモリ370は、再生中発言者区分371、再生開始位置372、再生中断位置373から構成される。再生中発言者区分371、再生開始位置372、再生中断位置373は、いずれも区切情報350のレコードをコピーしたものである。ここでは、図2Bの区切情報350の2番目のレコードを記録している。したがって、再生中発言者区分371は、再生中の発言者の電話番号を記録する。再生開始位置372および再生中断位置373は、再生中の会議音声情報を蓄積するエリア3151の記録開始位置/記録中断位置を示すメモリ番地を記録する。
【0032】
図6を参照して、再生制御部の動作フローを説明する。図6において、再生制御部327は、再生対象の会議の指定を待つ(S201)。記録された会議音声情報の再生指示を認識すると(YES)、再生制御部327は、再生用通話回路317を接続する(S202)。再生制御部327は、再生位置メモリ370をリセットする(S203)。再生制御部327は、発言者nの再生指示を検出したか判定する(S204)。YESのとき、再生制御部327は、発言者nの次の区切情報を抽出する(S206)。再生制御部327は、該当する区切情報を再生位置メモリ370に保存する(S207)。再生制御部327は、該当する再生開始位置372から再生開始する(S208)。
【0033】
ステップ208に引き続いて、またはステップ204でNOのとき、再生制御部327は、巻き戻し再生支持を検出したか判定する(S209)。YESのとき、再生制御部327は、該当発言者の前の区切情報を抽出する(S211)。再生制御部327は、該当する区切情報を再生位置メモリ370に保存する(S212)。再生制御部327は、該当する再生開始位置372から再生開始する(S213)。
【0034】
ステップ213に引き続いて、またはステップ209でNOのとき、再生制御部327は、再生停止指示を検出したか判定する(S214)。YESのとき、再生制御部327は、音声情報の再生を停止する(S216)。
【0035】
ステップ216に引き続いて、またはステップ214でNOのとき、再生制御部327は、再生中断位置373に到達したか判定する(S217)。YESのとき、再生制御部327は、音声情報の再生を停止する(S218)。
【0036】
ステップ218に引き続いて、またはステップ217でNOのとき、再生制御部327は、再生終了指示を検出したか判定する(S219)。YESのとき、再生制御部327は、対象音声情報の再生を停止する(S221)。再生制御部327は、再生通話回路317を切断して(S222)、終了する。ステップ219でNOのとき、再生制御部327は、ステップ204に遷移する。
【0037】
上述した実施例に拠れば、簡易な制御で特定の会議参加者の発言を再生可能とする録音装置を提供することができる。なお、実施例として会議電話装置を説明したが、これに限らず単に録音装置であってもよい。
【実施例2】
【0038】
実施例1は、順次、特定の端末から入力された音声を再生する。これに対して、実施例2は、電話会議の主催者の通話回路を特定し、その音声で切り分けて、ミキシングした音声を再生する。
【0039】
図7において、区切情報350は、発言者区分351、発言開始位置352、発言中断位置353で構成されている。ここで、発言者区分351は、会議の主催者の電話番号を記録する。発言開始位置352および発言中断位置353は、ミキシングされた会議音声情報を蓄積するエリア3151の記録開始位置/記録中断位置を示すメモリ番地を記録する。
【0040】
なお、会議記録の先頭のレコードの発言者区分351は、録音開始を記録し、発言開始位置352は、会議音声情報を蓄積するエリア3151の先頭のメモリ番地を記録する。また、会議記録の末尾のレコードの発言者区分351は、録音終了を記録し、発言中断位置353は、会議音声情報を蓄積するエリア3151の末尾のメモリ番地を記録する。
【0041】
録音開始および録音終了を除く各レコードは、会議主催者(特定話者)の発言開始時点で、当該レコードの発言開始位置352と、あれば一つ前のレコードの発言中断位置353を記入する。すなわち、発言開始位置352は、単一の会議主催者の発言開始位置を記録するが、発言中断位置353は、すべての会議参加者の発言が中断された時点もしくは会議主催者の次の発言開始位置より−1したメモリ番地を記録してもよい。
【0042】
図4を再び参照して、実施例2の録音制御部の処理を説明する。図4において、実施例1との違いを説明する。すなわち、ステップ106、ステップ113、ステップ114、ステップ117、ステップ118は、実施例2ではジャンプして飛ばす。また、ステップ111では、録音制御部325は、発言開始の区切情報を記録するだけでなく、もしあれば、前のレコードの発言中断の区切情報を記録する。また、ステップ124では、録音終了の区切位置(発言中断位置)と、その前の区切の発言中断位置を記録して、終了する。
実施例2によれば、会議の全てを順を追って再生することができ、また会議主催者の発言を単位として再生のスキップや巻き戻しを行うことができる。
【符号の説明】
【0043】
10…相手先端末、20…電話網、30…会議電話装置、31…通話回路、32…有音検出部、301…回線インタフェース部、302…呼制御部、314…音声ミキシング部、315…音声情報記録メモリ、317…再生用通話回路、325…録音制御部、326…区切情報生成部、327…再生制御部、328…再生対象指定操作検出部、331…操作部、332…スピーカ。

【特許請求の範囲】
【請求項1】
複数の音声入力部からの音声を録音および再生する録音装置において、
特定の音声入力部から入力する音声信号中の有音を検出する特定話者有音検出手段と、前記複数の音声入力部からの音声をミキシングして録音するミキシング音声録音手段と、前記ミキシング音声録音手段に録音された音声信号の再生を制御する音声再生制御手段とを有し、
前記ミキシング音声録音手段は、前記特定話者有音検出手段が有音を検出する毎に録音区間の区切りを示す区切情報を記録し、
前記音声再生制御手段は、前記区切情報が発言開始を示す位置から再生を開始し、前記区切情報が発言終了を示す位置を検出する毎に音声再生を一時停止する、または以降の区切情報を検出するまで音声再生をスキップする、または以前の区切情報のタイミングに戻って再度音声を再生する機能を有することを特徴とする録音装置。
【請求項2】
複数の音声入力部からの音声を録音および再生する録音装置において、
複数の音声入力部に対して音声信号中の有音を検出する複数の入力音声有音検出手段と、前記複数の音声入力部からの音声をミキシングして録音するミキシング音声録音手段と、前記ミキシング音声録音手段に録音された音声信号の再生を制御する音声再生制御手段と、再生する対象を指定する再生対象指定手段とを有し、
前記ミキシング音声録音手段は、前記複数の入力音声有音検出手段が有音を検出する毎に録音区間の区切情報を記録し、前記音声再生制御手段は、前記再生対象指定手段によって指定された音声入力部に対応する区切情報に従って記録された音声情報を抽出して再生を開始し、前記区切情報が発言終了を示す位置を検出する毎に音声再生を一時停止する、または以降の区切情報を検出するまで音声再生をスキップする、または以前の区切情報のタイミングに戻って再度音声を再生することを特徴とする録音装置。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−19034(P2011−19034A)
【公開日】平成23年1月27日(2011.1.27)
【国際特許分類】
【出願番号】特願2009−161597(P2009−161597)
【出願日】平成21年7月8日(2009.7.8)
【出願人】(000134707)株式会社ナカヨ通信機 (522)
【Fターム(参考)】