説明

議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム

【課題】情報の精度が高く、かつ手間をかけずに効率良く議事録情報を生成する議事録情報生成システムを提供する。
【解決手段】音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成システムであって、ユーザから入力される音声を音声情報に変換する音声入力手段を備え、ユーザを識別する情報を含むユーザ情報を予め記憶し、ユーザが利用する音声入力手段とユーザ情報とを対応付けて記憶し、音声情報が入力された音声入力手段に対応するユーザ情報を検出し、検出したユーザ情報と、音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成システムに関する。
【背景技術】
【0002】
従来、コンピュータ端末によって形成されるネットワークを利用して、会議の映像や音声を遠隔地間で送受信して会議を行う電子会議システムが利用されている。
また、一方で、近年では、入力される音声情報をテキスト情報に変換する音声認識技術が発展しており(例えば、特許文献1参照)、様々な場面に応用されるようになってきた(例えば、特許文献2参照)。
そこで、このような電子会議システムと音声認識技術とを用いて、電子会議システムにおいて交わされる会議内容としての音声情報を、音声認識技術によってテキスト情報に変換し、保存することで、議事録情報を生成する電子会議システムが提案されている(例えば、特許文献3参照)。
【特許文献1】特開2004−361769号公報
【特許文献2】特開2007−206011号公報
【特許文献3】特開2005−341015号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、このような議事録情報生成システムでは、会議中にどのような発言があったかを記憶することはできるが、誰がどの発言を行ったかを記憶できるものではない。
また、複数の会議参加ユーザが同時に発言した場合、重なった音声情報が音声情報として入力されるために音声認識エラーとなり、その間の発言は議事録が生成されないこととなる。
【0004】
また、このような音声認識を精度良く行うために、個々のユーザが発するそれぞれの特徴を予め記憶する音声プロファイルと呼ばれる情報を予め作成しておき、音声情報が入力される場合には、このような音声プロファイル情報を指標として用い、音声情報のキャリブレーションを行ってテキスト情報に変換する音声認識処理が一般的に行われている。
しかしながら、そのような音声プロファイル情報を生成するためには、ユーザが定型文などをマイクに向かって発声しながら、入力された音声情報を解析して特徴を抽出する処理が必要である。会議の都度このような音声情報の特徴抽出処理を行うのは、ユーザにとって面倒であり、負担となっている。
【0005】
また、このような音声情報をテキスト情報に変換する音声認識処理は、複雑な計算処理を必要とするため、コンピュータへの処理負荷が高いことが一般的である。このため、リアルタイムでの音声認識処理では、音声認識の計算処理が会議の進行に追いつかずに、計算処理が中断されてしまったり、エラーとなったりする場合がある。
また、このような議事録情報には、会議の発言内容に加えて、会議時間や会議参加者などの会議情報が記録されることが望ましい。
【0006】
本発明は、このような状況に鑑みてなされたもので、情報の精度が高く、かつ手間をかけずに効率良く議事録情報を生成する議事録情報生成システムを提供する。
【課題を解決するための手段】
【0007】
上述の課題を解決するために、本発明は、音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成システムであって、ユーザから入力される音声を音声情報に変換する音声入力手段と、ユーザを識別する情報を含むユーザ情報を予め記憶するユーザ情報記憶手段と、ユーザが利用する音声入力手段と、ユーザ情報記憶手段に記憶されたユーザのユーザ情報とを対応付けて記憶する対応情報記憶手段と、対応情報記憶手段から、音声が入力された音声入力手段に対応するユーザ情報を検出する対応情報検出手段と、音声情報が入力された音声入力手段に対応するユーザ情報を対応情報検出手段によって検出し、検出したユーザ情報と、音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成する議事録情報生成手段と、を備えることを特徴とする議事録情報生成システムである。
【0008】
本発明は、上述のユーザ情報記憶手段は、可搬記憶媒体が有しており、可搬記憶媒体がユーザによって接続されると、可搬記憶媒体に記憶されたユーザ情報を読み出すユーザ情報読出手段と、ユーザ情報読出手段が読み出したユーザ情報と、音声入力手段とを対応付けた情報を、対応情報記憶手段に記憶させる対応情報制御手段と、をさらに備えることを特徴とする。
【0009】
本発明は、上述のユーザ情報記憶手段が記憶するユーザ情報は、ユーザ情報が示すユーザが発する音声の特徴を示す音声特徴情報を含み、音声認識手段は、音声情報が入力された音声入力手段に対応付けられた音声特徴情報に基づいて音声情報をテキスト情報に変換することを特徴とする。
【0010】
本発明は、上述の対応情報記憶手段は、複数の音声入力手段のうちいずれかの音声入力手段と、複数のユーザ情報のうちいずれかのユーザ情報とを一対一で対応付ける情報を記憶することを特徴とする。
【0011】
本発明は、上述の音声入力手段に入力される音声情報を記憶する音声情報記憶手段をさらに備え、上述の議事録情報生成手段は、音声情報記憶手段から読み出した音声情報に基づいて、議事録情報を生成することを特徴とする。
【0012】
本発明は、会議参加ユーザ、会議場所、及び会議時間を示す情報である会議情報の入力を受け付ける会議情報入力手段をさらに備え、議事録情報生成手段が生成する議事録情報に、会議情報を付加することを特徴とする。
【0013】
本発明は、音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成方法であって、ユーザ情報記憶手段が、ユーザを識別する情報を含むユーザ情報を予め記憶するステップと、音声入力手段が、ユーザから入力される音声を音声情報に変換するステップと、対応情報記憶手段が、ユーザが利用する音声入力手段と、ユーザ情報記憶手段に記憶されたユーザのユーザ情報とを対応付けて記憶するステップと、対応情報検出手段が、対応情報記憶手段から、音声が入力された音声入力手段に対応するユーザ情報を検出するステップと、議事録情報生成手段が、音声情報が入力された音声入力手段に対応するユーザ情報を対応情報検出手段によって検出し、検出されたユーザ情報と、音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成するステップと、を備えることを特徴とする議事録情報生成方法である。
【0014】
本発明は、ユーザから入力される音声を音声情報に変換する音声入力手段を備え、音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成装置としてのコンピュータに、ユーザ情報記憶手段が、ユーザを識別する情報を含むユーザ情報を予め記憶するステップと、対応情報記憶手段が、ユーザが利用する音声入力手段と、ユーザ情報記憶手段に記憶されたユーザのユーザ情報とを対応付けて記憶するステップと、対応情報検出手段が、対応情報記憶手段から、音声が入力された音声入力手段に対応するユーザ情報を検出するステップと、議事録情報生成手段が、音声情報が入力された音声入力手段に対応するユーザ情報を対応情報検出手段によって検出し、検出されたユーザ情報と、音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成するステップと、を実行させるための議事録情報生成プログラムである。
【発明の効果】
【0015】
以上説明したように、本発明によれば、ユーザの識別情報を含むユーザ情報を予め記憶し、音声入力手段にユーザ情報を対応付けておき、音声入力手段に入力される音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報と、その音声情報が入力された音声入力手段に対応するユーザ情報とを対応付けた議事録情報を生成するようにしたので、ユーザを識別する情報と音声認識手段により生成されたテキスト情報とが対応付けられた議事録情報を生成することが可能となり、また、ユーザは予め自身のユーザ情報をユーザ情報記憶手段に記憶させておくことで、会議の都度、自身の情報を入力する必要がないので、詳細な議事録情報を効率よく生成することができる。
【0016】
さらに、本発明によれば、ユーザ情報を可搬記憶媒体に記憶させることとしたので、ユーザは、予め自身のユーザ情報を記憶させた可般記憶媒体を携帯して持ち歩くことができ、その可搬記憶媒体の情報を議事録情報生成システムに読みこませることで、会議の都度ユーザ情報を入力する手間を省くことができる。
【0017】
さらに、本発明によれば、ユーザ情報として、ユーザの音声特徴情報を記憶するようにしたので、音声認識手段は、音声特徴情報に基づいて音声情報をテキスト情報に変換することができ、より精度の高い音声認識が可能となる。
【0018】
さらに、本発明によれば、複数の音声入力手段のうちいずれかの音声入力手段と、複数のユーザ情報のうちいずれかのユーザ情報とを一対一で対応付けるようにしたので、複数ユーザによる会議を行う場合にも、それぞれのユーザの発言を個別に取得することができ、同時に発言が行われた場合にも、それぞれの発言をテキスト情報に変換する精度を高くすることができる。
【0019】
さらに、本発明によれば、音声入力手段に入力される音声情報を記憶する音声情報記憶手段を設け、音声情報記憶手段に記憶された音声情報に基づいた議事録情報の生成を行うことができるようにしたので、負荷の高い音声認識処理をリアルタイムに行うことが困難である場合でも、音声情報を記憶しておき、事後的に議事録情報を生成することができる。
【0020】
さらに、本発明によれば、会議参加ユーザ、会議場所、及び会議時間を示す情報である会議情報の入力を受け付けて議事録情報に付加するようにしたので、議事録情報への情報追加や修正を行わなくても、議事録として必要な情報項目を含んだ議事録情報を生成することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の一実施形態について、図面を参照して説明する。
<第1の実施形態>
図1は、本実施形態による議事録情報生成システム10の構成を示すブロック図である。
本実施形態による議事録情報生成システム10は、ユーザの個人情報を記憶するIC(集積回路)カード100と、会議に出席するユーザごとに用意され設置される会議端末200と、会議端末200から受信する情報に基づいて議事録情報を生成する300とを備えている。
【0022】
なお、図1には、一枚のICカード100を図示して本実施形態を説明するが、ICカード100は、複数のユーザがそれぞれ自身のユーザ情報を記憶するICカード100を所持して良い。また、図1には、一台の会議端末200を図示して本実施形態を説明するが、会議端末200は、ICカード100と一対一になるように複数台を設置する。本実施形態では、電子会議室の席ごとに、会議端末200が設置されることを想定する。複数台の会議端末200を利用する場合には、複数の会議端末200が、一台の議事録生成サーバ300にネットワークを介して接続されるようにしても良い。
【0023】
ICカード100は、情報の記憶と演算が可能なICチップを備える可搬記憶媒体であり、ユーザ情報記憶部101を備えている。ユーザ情報記憶部101は、ユーザ番号、氏名、音声プロファイルなどの情報を記憶する。ユーザ番号とは、本システムにおいてユーザを一意に特定するための識別情報であり、数値や、数値と文字とを組み合わせた情報である。氏名とは、ユーザの氏名を示す情報である。この他に、組織内におけるユーザの所属部署名などをさらに記憶させることとしても良い。
【0024】
音声プロファイルとは、ユーザが発する音声の特徴を表す情報であり、その音声の周波数、速度、アクセント、イントネーションなどの特徴が数値化された情報である。ここで、ICカード100は、ICカードリーダ201と接触して情報の読み書きを行う接触型でも良いし、無線通信で情報の読み書きを行う非接触型でも良い。また、ICカード100は、上述のようなユーザ情報記憶部101を備えるものであれば、ICカード、SIM(Subscriber Identity Module)、SD(Secure Digital)メモリ、RFID(Radio Frequency IDentification)などの携帯媒体でも良い。このような携帯媒体は、対タンパ性のあるセキュアなICを搭載した携帯媒体であることが望ましい。
【0025】
会議端末200は、本システムを利用して開催される会議に出席するユーザに利用される情報端末である。会議端末200は、ICカードリーダ201と、マイク202とを備えている。ICカードリーダ201は、上述のICカード100に接続し、記憶された情報を読みだす。本実施形態の会議端末200には、ICカードリーダ201として、ICカード100の挿入口(スロット)が設けられていることとする。マイク202は、ユーザが発する音声を電気信号に変換し、音声情報を生成する。ここで、ユーザの数(ICカード100の数)と同数の会議端末200が用意され、複数のユーザはそれぞれ1台の会議端末200を利用することとする。会議端末200は、少なくともこのような機能を備えていれば、PCのような装置でも良いし、このようなICカードリーダ201とマイク202とのみを備えた簡単な機器でも良い。
【0026】
議事録生成サーバ300は、会議端末200とネットワークを介して情報通信を行い、会議端末200から受信する情報に基づいて、議事録情報を生成する。ここで、会議端末200と議事録生成サーバ300とを接続するネットワークは、情報通信が可能であれば良く、いわゆるインターネットでも良いし、LAN(Local Area Network)内のネットワークでも良いし、その他の情報通信ネットワークでも良い。会議端末200と議事録生成サーバ300とのインターフェイスは、USB等によるシリアル通信、赤外線等の無線通信のインターフェイスでも良い。議事録生成サーバ300は、対応情報記憶部301と、対応情報制御部302と、音声認識部303と、議事録情報生成部304と、議事録情報記憶部305とを備えている。
【0027】
対応情報記憶部301は、マイク202と、ICカードリーダ201とを対応付ける情報を記憶する。対応情報記憶部301は、会議端末200から、ICカード100のユーザ情報記憶部101に記憶されたユーザ情報と、その会議端末200が備えるマイク202の識別情報とを受信し、対応させて記憶する。
対応情報制御部302は、対応情報記憶部301から、音声が入力されたマイク202に対応するユーザ情報を検出する。
【0028】
音声認識部303は、入力される音声情報の周波数、速度、アクセント、イントネーションなどの音声特徴情報を解析した上で、予め記憶された単語辞書情報を参照して音声情報に対応するテキスト情報を生成する音声認識処理を行う。ここで、ユーザが発する音声情報には、個人によって傾向が異なり、ある程度の音声パターンがある。そこで、音声認識部303は、予めそのユーザの音声特徴情報を取得しておき、予め記憶された音声特徴情報と、入力される解析対象の音声情報を比較することで、より精度の高い音声認識処理を行うことができるものである。
【0029】
議事録情報生成部304は、音声が入力されたマイク202に対応するユーザ情報を、対応情報制御部302を介して検出し、ユーザ情報と、音声情報が音声認識部303によってテキスト変換されたテキスト情報とを対応づけた議事録情報を生成する。議事録情報記憶部305は、議事録情報生成部304に生成された議事録情報を記憶する。
【0030】
次に、本発明による議事録情報生成システムの動作例を説明する。
図2は、本実施形態による議事録情報生成システム10の動作例を示すフローチャートである。
各ユーザは、会議端末200が設置された会議室に集合し、予め自身のユーザ情報が記憶されたICカード100を、ICカードリーダ201のスロットに挿入する。議事録情報生成システム10は、音響モデル設定処理を開始する(ステップS10)。ここで、音響モデル設定処理とは、解析対象の音声、音素がそれぞれどのような周波数特性を持っているか等を予め定める処理である。一般的には、音響モデルは、混合正規分布を出力確率とした隠れマルコフモデルなどによって表される。
【0031】
図3は、音響モデル設定処理を詳細に示すフローチャートである。会議端末200のICカードリーダ201は、ICカード100のユーザ情報記憶部101に記憶されたユーザ情報から、音声プロファイルを読み出す(ステップS11)。また、ICカードリーダ201は、ICカード100のユーザ情報記憶部101に記憶されたユーザ情報から、氏名情報を読み出す(ステップS12)。そして、会議端末200は、ICカードリーダ201が読み出したユーザ情報を、議事録生成サーバ300に送信する(ステップS13)。議事録生成サーバ300は、受信する音声プロファイルと、氏名情報と、これらのユーザを送信してきた会議端末200が備えるマイク202の識別情報とを対応付けて、対応情報記憶部301に記憶させる。
【0032】
図2に戻り、議事録情報生成システム10は、音声入力設定確認処理を行う(ステップS20)。図4は、音声入力設定確認処理を詳細に示すフローチャートである。音声入力設定確認処理は、音声認識のために、議事録情報生成システム10が予め行うキャリブレーションの処理である。例えば、会議端末200は、ディスプレイを備えることとして、ユーザに、予め定められた文章を読み上げる音声入力を促すメッセージを表示する。
【0033】
そして、ユーザが、マイク202に予め定められた音声を入力する(ステップS21)。音声認識部303は、マイク202によって出力される音声情報の周波数や強弱等の音声特徴情報を解析し、マイク202に対応付けて対応情報記憶部301に記憶された対応情報に基づいて音声確認処理を行う(ステップS22)。また、入力された文章に対応する単語を、予め記憶された単語辞書情報から検出する確認処理を行う(ステップS23)。議事録情報生成システム10は、このようにして行うステップS22またはステップS23の処理で、予め定められた異常を検知した場合は、以降の処理を行わないこととしても良いし、音響モデルの補正処理や、予め定められた単語辞書情報の補正処理などを行ってから、処理を継続することとしても良い。
【0034】
そして、会議の主催者が、議事録情報生成システム10に会議を開始する命令を入力すると、議事録情報生成システム10は、音声情報の取得を開始する(ステップS30)。また、ここで、議事録情報生成部304は、議事録情報を生成して、議事録情報生成部304に記憶させる。ここで、議事録情報には、例えば、会議開始時刻や会議場所等の情報を記憶させる。
【0035】
マイク202に、音声が入力される(ステップS40)と、会議端末200は、マイク202が出力する音声情報を議事録生成サーバ300に送信する。議事録生成サーバ300は、会議端末200から送信される音声情報を受信すると、音声認識部303が、受信する音声情報の音声分析を行う(ステップS50)。
【0036】
そして、音声認識部303は、対応情報制御部302を介して、入力された音声情報に対応するユーザ情報のうち、音声プロファイルを対応情報記憶部301から読み出し、読み出した音声プロファイルに基づいた音声情報の補正処理を行う(ステップS60)。例えば、入力される音声情報の周波数特性から、ユーザの発声位置からマイク202までの距離を予測し、予測値に基づいて音声プロファイルの補正を行うようにしても良い。
【0037】
音声認識部303は、音声情報から認識したそれぞれの単語について、予め記憶された単語辞書情報から最適な単語を検出する(ステップS70)
そして、音声認識部303は、ステップS70で検出された単語を結合し、テキスト情報を生成して、ユーザの氏名を示すテキスト情報ともに、議事録情報記憶部305に記憶された議事録情報に情報を追加して記憶させる(ステップS80)。
【0038】
議事録情報生成システム10は、会議終了の命令が入力されるまで、ステップS40からステップS80までの処理を続ける。
議事録情報生成システム10は、会議の主催者等から会議終了の指示情報が入力されると(ステップS90:YES)、議事録情報記憶部305に記憶された議事録情報に、会議終了時間を記憶させ(ステップS100)、議事録生成処理を終了する。
【0039】
このように、本発明によれば、ユーザが、予め自身の氏名や音声プロファイルなどを記憶させたICカード100を用いることで、音声認識会議システムを利用して会議を行う際に、その都度、音声プロファイル情報や氏名などの情報入力を行わなくても、精度の高い音声認識による議事録情報を取得することができるものである。
【0040】
さらに、複数ユーザの人数分のマイク202を設置し、それぞれを利用するユーザのユーザ情報とマイク202とを対応付けておくことで、複数ユーザが参加する会議でも、複数ユーザの発する音声が混じることを防ぐことができ、精度の高い音声認識を行うことができる。
【0041】
このようにすれば、海外などの遠隔地から会議に参加するようなユーザでも、予め音声プロファイルを生成し、自身の氏名などの情報とともにユーザ情報としてICカード100に記憶させておき、会議参加時には、そのユーザ情報記憶部101に記憶された情報をシステムに読み込ませることで、自身のユーザ情報と音声プロファイルとを会議開始時に速やかに設定することが可能となる。
【0042】
また、会議室の各個人の席に、マイクなどの音声入力装置と、音声プロファイル等のユーザ情報を読み取り可能な装置とを設置しておけば、複数のユーザの音声を識別し、同時に話した内容も、各個人の席ごとに認識できるため、認識エラーを削減することができる。また、会議端末が設置された会議室で行われる会議で、各ユーザの識別や音声の認識の精度を高め、会議をしながら会議議事録を生成し、議事録生成の時間を削減することができる。このように、信頼性の高い議事録生成システムを提供することができる。
【0043】
また、上述のような音声認識処理は、隠れマルコフモデルなどによる複雑な計算処理が必要となることから、コンピュータへの処理負荷が高いことが一般的である。このため、リアルタイムでの音声認識処理は、処理が音声入力に追いつかない場合が考えられる。そこで、議事録生成サーバ300は、マイク202から入力される音声情報を、そのまま記憶しておき、休憩時間や、会議終了後などに、音声認識部303が音声認識処理を行って、議事録情報生成部304が議事録情報を生成するようにしても良い。
【0044】
また、近年では、ICカード等を利用して組織内での会議室の利用予約などを行う会議予約システムが一般に利用されている。このようなICカードによれば、会議室を予約する際にユーザから入力された会議場所、会議時間、会議参加ユーザなどの会議情報を参照することが可能である。そこで、議事録情報生成部304は、このようなICカードから会議情報を読み込んで議事録情報記憶部305に追加して議事録情報を記憶させるようにしても良い。また、ICカードリーダ201に挿入されたICカード100が記憶するユーザ情報を、実際に会議に出席したユーザであるとして会議出席者名簿を生成することも可能である。
【0045】
また、ユーザの音声を取得する音声入力手段は、その周りの雑音をも取得してしまう。そこで、各個人の席に設ける音声入力手段とは別に、外部の雑音を主に取得するための音声入力手段を1台または複数台設置して、ユーザの音声を取得する音声入力手段が取得する音声から、外部の雑音を取得するための音声入力手段が取得する音声を差し引き、フィルタリングすることで、ユーザの音声をより正確に集音するようにしても良い。
【0046】
なお、本実施形態では、複数のユーザがそれぞれ異なる会議端末200を利用することとしたが、一台の会議端末200を複数ユーザで利用した場合も、予め取得された音声プロファイルによるフィルタリングを行うことで、精度の高い音声認識が可能となる。
また、本実施形態では、対応情報記憶部、対応情報制御部、音声認識部などの機能部は、議事録生成サーバ300が備えることとしたが、このような機能部は、会議端末200が備えることとしても良い。本システムの管理者、実施者は、会議端末200として用意するコンピュータ端末、ネットワーク、議事録生成サーバ300としてのコンピュータ端末などの性能や特性、または本システムを利用する人数などによって、最適な端末構成を設計して良い。
【0047】
また、本実施形態では、議事録生成サーバ300の対応情報記憶部301には、ユーザ情報記憶部101に記憶されたユーザ情報を全て記憶することとしたが、例えば、識別情報としてのユーザ番号のみを記憶し、その他の情報はICカード100から都度読み出すようにしても良い。
また、本実施形態では、日本語による音声認識を前提として説明したが、英語、フランス語等による音声情報に対しても、同様の構成で同様の効果を得ることができる。
【0048】
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより議事録情報の生成を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【図面の簡単な説明】
【0049】
【図1】本発明の一実施形態による端末構成を示す図である。
【図2】本発明の一実施形態による音声認識処理を示すフローチャートである。
【図3】本発明の一実施形態による音響モデル設定処理を示すフローチャートである。
【図4】本発明の一実施形態による音声入力設定確認処理を示すフローチャートである。
【符号の説明】
【0050】
10 議事録情報生成システム
100 ICカード
101 ユーザ情報記憶部
200 会議端末
201 ICカードリーダ
202 マイク
300 議事録生成サーバ
301 対応情報記憶部
302 対応情報制御部
303 音声認識部
304 議事録情報生成部
305 議事録情報記憶部

【特許請求の範囲】
【請求項1】
音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成システムであって、
ユーザから入力される音声を音声情報に変換する音声入力手段と、
前記ユーザを識別する情報を含むユーザ情報を予め記憶するユーザ情報記憶手段と、
前記ユーザが利用する前記音声入力手段と、前記ユーザ情報記憶手段に記憶された前記ユーザのユーザ情報とを対応付けて記憶する対応情報記憶手段と、
前記対応情報記憶手段から、前記音声が入力された前記音声入力手段に対応する前記ユーザ情報を検出する対応情報検出手段と、
前記音声情報が入力された前記音声入力手段に対応するユーザ情報を前記対応情報検出手段によって検出し、検出した当該ユーザ情報と、当該音声情報が前記音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成する議事録情報生成手段と、
を備えることを特徴とする議事録情報生成システム。
【請求項2】
前記ユーザ情報記憶手段は、可搬記憶媒体が有しており、
前記可搬記憶媒体がユーザによって接続されると、当該可搬記憶媒体に記憶されたユーザ情報を読み出すユーザ情報読出手段と、
前記ユーザ情報読出手段が読み出したユーザ情報と、前記音声入力手段とを対応付けた情報を、前記対応情報記憶手段に記憶させる対応情報制御手段と、
をさらに備えることを特徴とする請求項1に記載の議事録情報生成システム。
【請求項3】
前記ユーザ情報記憶手段が記憶するユーザ情報は、当該ユーザ情報が示すユーザが発する音声の特徴を示す音声特徴情報を含み、
前記音声認識手段は、音声情報が入力された前記音声入力手段に対応付けられた前記音声特徴情報に基づいて前記音声情報をテキスト情報に変換する
ことを特徴とする請求項1または請求項2のいずれか1項に記載の議事録情報生成システム。
【請求項4】
前記対応情報記憶手段は、複数の前記音声入力手段のうちいずれかの音声入力手段と、複数の前記ユーザ情報のうちいずれかのユーザ情報とを一対一で対応付ける情報を記憶する
ことを特徴とする請求項1から請求項3のうちいずれか1項に記載の議事録情報生成システム。
【請求項5】
前記音声入力手段に入力される音声情報を記憶する音声情報記憶手段をさらに備え、
前記議事録情報生成手段は、前記音声情報記憶手段から読み出した音声情報に基づいて、前記議事録情報を生成する
ことを特徴とする請求項1から請求項4までのいずれか1項に記載の議事録情報生成システム。
【請求項6】
会議参加ユーザ、会議場所、及び会議時間を示す情報である会議情報の入力を受け付ける会議情報入力手段をさらに備え、
前記議事録情報生成手段が生成する議事録情報に、前記会議情報を付加する
ことを特徴とする請求項1から請求項5までのいずれか1項に記載の議事録情報生成システム。
【請求項7】
音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成方法であって、
ユーザ情報記憶手段が、前記ユーザを識別する情報を含むユーザ情報を予め記憶するステップと、
音声入力手段が、ユーザから入力される音声を音声情報に変換するステップと、
対応情報記憶手段が、前記ユーザが利用する前記音声入力手段と、前記ユーザ情報記憶手段に記憶された前記ユーザのユーザ情報とを対応付けて記憶するステップと、
対応情報検出手段が、前記対応情報記憶手段から、前記音声が入力された前記音声入力手段に対応する前記ユーザ情報を検出するステップと、
議事録情報生成手段が、前記音声情報が入力された前記音声入力手段に対応するユーザ情報を前記対応情報検出手段によって検出し、検出された当該ユーザ情報と、当該音声情報が前記音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成するステップと、
を備えることを特徴とする議事録情報生成方法。
【請求項8】
ユーザから入力される音声を音声情報に変換する音声入力手段を備え、音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成装置としてのコンピュータに、
ユーザ情報記憶手段が、前記ユーザを識別する情報を含むユーザ情報を予め記憶するステップと、
対応情報記憶手段が、前記ユーザが利用する前記音声入力手段と、前記ユーザ情報記憶手段に記憶された前記ユーザのユーザ情報とを対応付けて記憶するステップと、
対応情報検出手段が、前記対応情報記憶手段から、前記音声が入力された前記音声入力手段に対応する前記ユーザ情報を検出するステップと、
議事録情報生成手段が、前記音声情報が入力された前記音声入力手段に対応するユーザ情報を前記対応情報検出手段によって検出し、検出された当該ユーザ情報と、当該音声情報が前記音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成するステップと、
を実行させるための議事録情報生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2009−86207(P2009−86207A)
【公開日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願番号】特願2007−254717(P2007−254717)
【出願日】平成19年9月28日(2007.9.28)
【出願人】(000003193)凸版印刷株式会社 (10,630)
【Fターム(参考)】