説明

議事録作成方法、その装置及びそのプログラム

【課題】複数の言語で行われる会議の議事録を作成することが出来る議事録作成装置を提供する。
【解決手段】入力した音声をその言語のテキストデータとする音声認識手段と、前記テキストデータを所定の言語に翻訳する翻訳手段と、翻訳された前記テキストデータを基に、議事録を作成する議事録作成する手段と、を備える議事録作成装置であって、入力される言語の種類と議題、レジュメ又は参考資料とを基に、それぞれ、それらに適した音響モデル及び言語モデルとを選択するモデル選択手段と、入力される言語の種類と議事録で用いられる言語の種類とを基に、翻訳辞書を選択する翻訳辞書選択手段と、を更に備え、前記音声認識手段は、前記モデル選択手段により選択された前記音響モデル及び前記言語モデルを利用し、前記翻訳手段は、前記翻訳辞書選択手段により選択された前記翻訳辞書を利用する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、議事録を電子的に作成する議事録作成方法、その装置及びそのプログラムに関する。
【背景技術】
【0002】
音声認識と翻訳機能を統合した議事録作成装置は従来存在しない。そこで例えば従来の音声認識を使用し多言語で結果を返すシステムの一例が、特許文献1に記載されている。図12を参照すると、この発明装置は認識対象の複数の言語の発音辞書102および対応する音響モデル103と、認識対象の複数の言語の発音辞書102で定義される単語を用いて作成された1つの多言語化された認識用文法104と、言語に独立な1つの音声分析部101および探索部105を備え、音声分析部101において入力音声から抽出された特徴パラメータに対して、探索部105において認識対象の複数の言語の音響モデルを用いて認識用文法で表現される単語列との間の照合を行い、照合スコアの最も高い単語列を認識結果として出力する多言語音声認識方法、装置、およびプログラムである。この発明を議事録作成に応用したとする。その場合、この発明において、ユーザが意識して翻訳用辞書を用意、更新する作業が必要である。
【特許文献1】特開2004−101727号公報(図1)
【発明の開示】
【発明が解決しようとする課題】
【0003】
多言語間で行われる会議において議事録を作成する場合、会議の参加者が執筆者として会議中に筆記し翻訳のための労力が必要となる。そこで例えば過去の発明において、音声認識による議事録作成が提案されており、この発明を利用して音声認識結果に翻訳機能を適応することで、議事録翻訳に応用することができる。ところが、この施策では発話者の言語で認識されてしまうため、議事録が複数の言語で出力されてしまう問題があった。また、翻訳機能を使用する際、変換元・変換先の翻訳辞書を予め複数用意し、明示的に変換元・変換先言語を指定して翻訳する必要があった。
【0004】
そこで、本発明は、複数の言語で行われる会議の議事録を作成することが出来る議事録作成方法、その装置及びそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明によれば、入力した音声をその言語のテキストデータとする音声認識ステップと、前記テキストデータを所定の言語に翻訳する翻訳ステップと、翻訳された前記テキストデータを基に、議事録を作成する議事録作成するステップと、を備える議事録作成方法であって、入力される言語の種類と議題、レジュメ又は参考資料とを基に、それぞれ、それらに適した音響モデル及び言語モデルとを選択するモデル選択ステップと、入力される言語の種類と議事録で用いられる言語の種類とを基に、翻訳辞書を選択する翻訳辞書選択ステップと、を更に備え、前記音声認識ステップは、前記モデル選択ステップにより選択された前記音響モデル及び前記言語モデルを利用し、前記翻訳ステップは、前記翻訳辞書選択ステップにより選択された前記翻訳辞書を利用することを特徴とする議事録作成方法が提供される。
【0006】
上記の議事録作成方法であって、前記モデル選択ステップは、会議への各参加者毎に、前記音響モデル及び前記言語モデルを選択するようにしてもよい。
【0007】
上記の議事録作成方法において、各参加者毎の利用言語は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている各参加者毎の利用言語を基に、各参加者毎の音響モデルを選択するようにしてもよい。
【0008】
上記の議事録作成方法において、前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の利用言語を基に、言語モデルを選択するようにしてもよい。
【0009】
上記の議事録作成方法において、各参加者毎の参加場所は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている各参加者毎の参加場所を基に、各参加者毎の音響モデルを選択するようにしてもよい。
【0010】
上記の議事録作成方法において、前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の参加場所を基に、言語モデルを選択するようにしてもよい。
【0011】
上記の議事録作成方法において、前記翻訳辞書選択ステップは、会議への各参加者毎に、前記翻訳辞書を選択するようにしてもよい。
【0012】
上記の議事録作成方法において、各参加者毎の利用言語及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択ステップは、前記会議開催予定データに記述されている各参加者毎の利用言語及び議事録で利用する言語を基に、翻訳辞書を選択するようにしてもよい。
【0013】
上記の議事録作成方法において、各参加者毎の参加場所及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択ステップは、前記会議開催予定データに記述されている各参加者毎の参加場所及び議事録で利用する言語を基に、翻訳辞書を選択するようにしてもよい。
【発明の効果】
【0014】
本発明の効果は、会議主催者や会議参加者が明示的に指定をしなくても、確認するのに最適な言語に翻訳して、会議議事録が自動的に作成できることにある。
【0015】
その理由は、会議開催データと会議参加者のユーザ情報の言語情報から、個々の会議参加者に最も適した翻訳Webサービス接続先を自動的に決定し、翻訳された議事録を取得することができるためである。
【発明を実施するための最良の形態】
【0016】
以下、図面を参照して本発明を実施するための最良の形態について詳細に説明する。
【0017】
本発明を音声認識ソフトウェアとWebサービスに適応した具体例で説明する。図8は会議室A、会議室B、会議開催サーバ・議事録作成サーバ830がネットワーク840で接続されている。会議開催前に会議主催者831が会議開催サーバ830にレジュメ等の会議開催情報を登録する(例:会議主催者はアメリカ人で標準英語を話し、主催者が理解できるように標準英語で会議議事録を作成する。会議室Aの端末811を利用する者は標準の日本語を話す者である。会議室Aの端末812の端末812を利用する者は関西弁の日本語を話す者である。・・・)。この会議開催情報を集めた会議開催データベースを元に、議題に最も適した言語モデル及び音響モデルを自動的に言語モデル・音響モデル配布Webサービス850から選択し、会議開催前に事前にダウンロードを各端末へ行う。また、会議開催データベース830を基に、翻訳元情報と翻訳先情報と翻訳における議題に最も適した翻訳先話題を自動的にWebサービス860から選択し、会議開催前に各端末分だけ接続先を決定する。
【0018】
議題に最も適した翻訳先話題とした具体例としては、例えば英語に翻訳する場合において、化学向けに実施する英語辞書、情報科学向けに実施する英語辞書を想定している。
【0019】
自動的に選択するためには、次のようなことを行う。すなわち、まず、URLのトップドメインで言語圏を決定する(イギリス英語なら.us、日本語へ翻訳するのなら.jp、中国語へ翻訳するのなら.cnを検索する)。この場合、さらにURLのサブドメインを確認することによりどのような分野のWebサービスかを絞り込む(または、Webサービスへの問い合わせを行い、該当ドメインがどの分野の話題を所持しているかの回答をもらう)。
【0020】
話題会議室Aと会議室Bの各端末(811、812、813、821、822)には音声認識プロセスとIP電話サービスが動作しており、端末に接続されたマイクより各国の参加者が会議発言を入力すると、音声がそれぞれの会議室で聞ける。音声認識プロセスは、ダウンロードされた言語モデル・音響モデルに切り替えされた後、音声認識を開始する。これにより自動的に発言者の言語(例:会議参加者812が関西弁で発話)毎に最適な認識結果を作成することができる。同時に音声認識結果がネットワーク経由で議事録作成サーバ830に送信され、議事録データとして登録される。議事録作成サーバ830は議事録を最適な翻訳Webサービス860を使用して任意の言語(例:会議参加者812が関西弁で発話した内容を標準英語にする)に翻訳することができる。各端末は議事録作成サーバ830に接続することにより、翻訳後の議事録を参照することができる。
【0021】
次に、本発明の実施形態の構成について図面を参照して詳細に説明する。図1を参照すると、本発明の第1の実施形態は、議事録作成部10とモデル選択部20と配布Webサービス部30と翻訳Webサービス40部を備える。議事録作成部10は、音声入力手段101と、音声認識手段102と、議事録作成手段103と、議事録表示手段104を含む。モデル選択部20は、会議開催予定入力手段201と、会議開催データベース202と、モデル選択手段203と、翻訳選択手段204を含む。配布Webサービス部30は、言語モデル301と、音響モデル302と、モデル配布手段303を含む。翻訳Webサービス部40は、翻訳実行手段401と、翻訳辞書402を含む。
【0022】
これらの手段はそれぞれ概略つぎのように動作する。会議開催に先立ち、会議の開催情報やレジュメを会議開催予定入力手段201にて入力し、会議開催データベース202に保存する。モデル選択手段203は会議開催データベース202の情報を元に適切な配布Webサービス30を選択し、モデル配布手段303にて言語モデル301及び音響モデル302を議事録作成部10にダウンロードさせる。翻訳選択手段204は、会議開催データベース202の情報を元にユーザ毎の認識データ送信先に関して、適切な翻訳実行手段401を選択する。音声認識手段102は、音声入力手段101から入力された発話音声とモデル配布手段303から得られた辞書データを元に音声認識プロセスを実行し、認識データを出力し翻訳実行手段401に渡す。翻訳実行手段401は翻訳判断情報を元に認識データを翻訳し、議事録作成手段103に翻訳済み認識データとして送信する。議事録作成手段103は、ネットワークを介して会議参加者分の翻訳済み認識データを受信し、議事録データを生成する。また議事録作成手段103は、認識前のデータを受信して議事録データを生成することでもできる。議事録表示手段104は、議事録データをクライアントの画面上に表示する。翻訳実行手段401は、翻訳元言語と翻訳先言語を翻訳選択手段204から渡される翻訳判断情報から取得する。認識前のデータとはデジタル音声そのもののことである。
【0023】
次に、図2のシーケンス図、図3、図4及び図9のアクティビティ図を参照して本発明の第1の実施形態の動作について詳細に説明する。まず、会議開催主催者は会議開催前に予め、会議開催予定入力を行い、会議開催予定データを会議開催サーバに登録する(図2の2100)。図5に会議開催通知5011をXMLデータに変換し、会議開催データ5021として登録している例を示している。次に、会議開催サーバ830は配布サービスを順に配布サービスの数だけ、配布サービスに含まれる言語モデル、音響モデルが、それぞれ、会議議題と言語情報に最適であるサービスがどれかを検索する。図2では会議議題と言語情報を元に問い合わせていて、会議議題と言語モデルが一致していない回答状況を示している(図2の2101)(この他にも、言語情報と音響モデルとが一致しないために、当該配布サービスが採用されない場合がある。)。さらに、配布サービスに会議議題と言語議題を元に問い合わせが起こっており、会議議題と言語情報が、それぞれ、配布サービスの言語モデルと音響モデルに一致した回答状況を示している(図2の2102)。言語モデルが会議議題に最適であるかどうかということの意味は、辞書がその分野に適しているかどうかということである。言語モデルと会議議題とが一致するとは、言語モデルが認識結果として出力する際に議題に最も近いものを意味している。ここで一致するとは、認識率が高まるということである。
【0024】
図3に問い合わせから回答までの詳細を示している。
【0025】
配布WEBサービス部30からWeb情報を取得し、会議開催データ読み込み310と合わせて音響モデル配布指示320は配布Webサービスの音響モデル検索360に言語・方言情報を送信する。
【0026】
図4には図3の音響モデル配布指示320の詳細を示している。
【0027】
ユーザ情報読み込み(図4の4201)の結果、ユーザ情報から言語情報を取得できる場合、参加者名から国・言語情報を決定する(図4の4202、4205)。図6に会議開催データ6201と共にユーザ情報テーブル6202を予め用意して置き、これらのデータを元に会議議題と国・言語情報をモデル選択手段203及び翻訳選択手段204に送信する例を示している。参加者の情報が未知で参加者名だけでは国・言語情報が特定できない場合は、会議開催場所を読み込み、場所名から国・言語情報を決定する(図4の4203、4204)。図7に会議開催データ6201と共に会議開催場所テーブル7202を予め用意しておきデータを元に会議議題と国・言語情報をモデル選択手段203及び翻訳選択手段204に送信する例を示している。このようにしてどの音響モデルを検索手段360の候補にするか絞り込む(図4の4206)。
【0028】
図3の音響モデル検索360は送信された言語・方言情報を元に該当言語を検索する。自サーバに見つからなかった場合、他サーバ検索363をWEBサービス・サーバ数だけ行う。見つかった場合、音響モデル二次検索361において、ユーザの方言情報と一致する音響モデルを確定し、音響モデル配布準備362から配布元URL情報を会議開催サーバに返却する。このようにして音響モデルダウンロード元を決定する。言語モデル配布指示330は配布元URLへ会議議題情報を送信する。
【0029】
図4に言語モデル配布指示330の詳細を示している。
【0030】
会議議題情報の中の会議議題をテキストマイニングし(図4の4301)、マイニング結果から言語モデルを特定できる場合は、モデル接続先情報をこの時点で決定する(図4の4305)。マイニング結果から言語モデルを特定できない場合は、レジュメ情報をテキストマイニングし(図4の4302)、同時に参考資料格納先から情報をダウンロード、これらの参考資料のテキストマイニングを実施する(図4の4303、4304)。両方のマイニング結果からモデル接続先情報を決定する(図4の4305)。言語モデル検索370は送信された会議議題情報を元に言語モデルを検索する。自サービスに見つからなかった場合、他サービス検索372をWEBサービス数だけ行う。言語モデル配布準備371において、会議議題情報と一致する言語モデルを確定し、該当URL、サービス情報を会議開催サーバに返却する。音響モデル配布指示320、言語モデル配布指示330を会議参加者分繰り返すことにより、会議開催前に辞書データを配布準備する。
【0031】
図2には翻訳元言語情報と翻訳先言語情報を元に翻訳Webサービスに問い合わせていて、翻訳が可能な状況を示している(図2の2103)。図9に問い合わせから回答までの詳細を示している。配布WEBサービスからWeb情報を取得し、会議開催データを読み込み910と合わせて翻訳選択指示920は翻訳Webサービスの翻訳辞書検索940に翻訳元・翻訳先言語情報を送信する。翻訳元情報は各発話ユーザの言語・方言情報であり、自動的に取得される。翻訳先は会議主催者の言語・方言情報として決定するなど会議で一意に決定できる。また、受信ユーザ毎の言語・方言情報も自動的に取得されるため、翻訳先はこちらにもできる。図9の翻訳辞書検索940は送信された翻訳元・翻訳先情報を元に該当言語を検索する。自サーバに見つからなかった場合、他サーバ検索943をWEBサービス・サーバ数だけ行う。見つかった場合、翻訳辞書二次検索941において、既に言語モデル選択で作成済みの会議議題情報を参照し、より翻訳精度が上がる該当分野の辞書を確定し、翻訳選択準備942から接続先URL情報、サービス情報を会議開催サーバに返却する。このようにして会議参加者分だけ翻訳Webサービス接続先を決定する。
【0032】
会議開催時間を元に開催前に会議開催サーバは会議参加者に参加可能かを確認し(図2の2110及び2111)、参加可能者は配布サービスから辞書データのダウンロードを行う(図2の2112)。会議開催時間になると、会議開催サーバから議事録作成サーバに会議開催データを送信する(図2の2121)。これにより、音声認識を使用し会話情報を議事録として受信することが可能となる(図2の2122)。会議議題送信(図2の2122)を議事録作成サーバに行うと、翻訳Webサービスに会話情報を送信し(図2の2123)、翻訳された情報を議事録作成サーバが受信する。もちろん会議中に翻訳が要らない箇所は、翻訳Webサービスへの会話情報送信は省略することができる。このようにして、会議終了(図2の2130)まで議事録作成を行う。
【0033】
次に、本発明の第1の実施形態の効果について説明する。本発明の第1の実施形態では、会議開催データを元にその議題に合った言語モデル・音響モデルを自動的にダウンロードし、音声認識辞書として適応、かつ会議開催データを元にその議題と参加者に合った翻訳辞書を用意するように構成されているため、議題に合った認識結果とその認識結果を元にした翻訳結果を期待できる(また、本発明の第1の実施形態では、さらに、各地方言→標準語変換を行った言語モデルを用意した場合、会話された各語の方言を標準語に変換してから翻訳を行うため、翻訳元情報を削減することができる)。
【0034】
次に、本発明の第2の実施形態の構成について図面を参照して説明する。図10を参照すると、本発明の第2の実施形態の構成は、第1の実施形態の構成において翻訳情報比較手段105及び翻訳情報送信手段403を追加した構成図である。すなわち第1の実施形態の構成における議事録作成、モデル選択、配布Webサービス及び作成翻訳Webサービスによる処理と同一の処理に加えて、音声認識手段102で非同期に翻訳Webサービスに認識データを送信し、翻訳手段401による翻訳終了やタイマ等のイベントを契機に、翻訳情報送信手段403は翻訳情報比較手段105に翻訳済み認識データを送信する。翻訳情報比較手段105は、翻訳済みの認識データ、翻訳前の認識データ及び音声データを基に翻訳が正確かどうか比較する。翻訳情報比較手段105は修正済みデータを議事録作成手段103へ送信する。本発明の第2の実施形態では、会議参加者が会議終了後直ぐに会議議事録の翻訳を必要とせず、違う時間、違う場所にて翻訳済みの議事録を取得したい時に、非同期に翻訳データを取得することができる。こうして、受け取った翻訳済みの議事録を自国語で確認して翻訳結果が変更された議題に合った認識結果を期待できる。
【0035】
翻訳済みの認識データ、翻訳前の認識データ及び音声データを基に翻訳が正確かどうか比較することは、人手により行う。
【0036】
図11で表される内容の図2で表される内容との違いは、図11において議事録作成サーバと翻訳サービスが非同期で動作することである。これは議事録作成サーバで認識結果による議事録を一度作成しておいて、後から一括で翻訳を行うことを前提としている。
【0037】
なお、上記の実施形態では、例えば、中国側には英語を中国語に翻訳する同時通訳者がおり、米国側には中国語を英語に翻訳する同時通訳者がいると想定しており、各参加者は、通訳者を通じて、他国の言語での発言を理解できるものとしている。
【産業上の利用可能性】
【0038】
本発明によれば、スケジューリングされた業務において、予め関連情報を提出しておくことによりデータ選択を自動的に決定すると言った用途に適用できる。例えば、専門用語が非常に多く出てくるような多言語の定期翻訳において、クライアントから音声ファイルをアップロードしWebサービスによって辞書を予め切り替えることにより、的確な認識結果を表示する翻訳事業といった用途にも適用可能である。
【図面の簡単な説明】
【0039】
【図1】本発明の実施形態による議事録作成装置の主要部の構成を示すブロック図である。
【図2】本発明の実施形態による議事録作成方法を示すシーケンス図である。
【図3】本発明の実施形態による音響モデル検索及び言語モデル検索の方法を示す第1のフローチャートである。
【図4】本発明の実施形態による音響モデル検索及び言語モデル検索の方法を示す第2のフローチャートである。
【図5】本発明の実施形態による会議開催通知及び会議開催データを示す図である。
【図6】本発明の実施形態による会議開催データ、ユーザ情報テーブル、モデル選択手段及び翻訳選択手段を示す図である。
【図7】本発明の実施形態による会議開催データ、開催場所情報テーブル、モデル選択手段及び翻訳選択手段を示す図である。
【図8】本発明の実施形態による議事録作成装置の構成を示す概念図である。
【図9】本発明の実施形態による翻訳辞書検索の方法を示すフローチャートである。
【図10】本発明の他の実施形態による議事録作成装置の主要部の構成を示すブロック図である。
【図11】本発明の他の実施形態による議事録作成方法を示すシーケンス図である。
【図12】従来例による音声認識装置の構成を示すブロック図である。
【符号の説明】
【0040】
10 議事録作成部
20 モデル選択部
30 配布Webサービス
40 翻訳Webサービス
101 音声入力手段
102 音声認識手段
103 議事録作成手段
104 議事録表示手段
201 会議開催予定入力手段
202 会議開催データベース
203 モデル選択手段
204 翻訳選択手段
301 言語モデル
302 音響モデル
303 モデル配布手段
401 翻訳実行手段
402 翻訳辞書

【特許請求の範囲】
【請求項1】
入力した音声をその言語のテキストデータとする音声認識ステップと、
前記テキストデータを所定の言語に翻訳する翻訳ステップと、
翻訳された前記テキストデータを基に、議事録を作成する議事録作成するステップと、
を備える議事録作成方法であって、
入力される言語の種類と議題、レジュメ又は参考資料とを基に、それぞれ、それらに適した音響モデル及び言語モデルとを選択するモデル選択ステップと、
入力される言語の種類と議事録で用いられる言語の種類とを基に、翻訳辞書を選択する翻訳辞書選択ステップと、
を更に備え、
前記音声認識ステップは、前記モデル選択ステップにより選択された前記音響モデル及び前記言語モデルを利用し、
前記翻訳ステップは、前記翻訳辞書選択ステップにより選択された前記翻訳辞書を利用することを特徴とする議事録作成方法。
【請求項2】
請求項1に記載の議事録作成方法であって、
前記モデル選択ステップは、会議への各参加者毎に、前記音響モデル及び前記言語モデルを選択することを特徴とする議事録作成方法。
【請求項3】
請求項2に記載の議事録作成方法において、
各参加者毎の利用言語は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている各参加者毎の利用言語を基に、各参加者毎の音響モデルを選択することを特徴とする議事録作成方法。
【請求項4】
請求項3に記載の議事録作成方法において、
前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の利用言語を基に、言語モデルを選択することを特徴とする議事録作成方法。
【請求項5】
請求項2に記載の議事録作成方法において、
各参加者毎の参加場所は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている各参加者毎の参加場所を基に、各参加者毎の音響モデルを選択することを特徴とする議事録作成方法。
【請求項6】
請求項5に記載の議事録作成方法において、
前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択ステップは、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の参加場所を基に、言語モデルを選択することを特徴とする議事録作成方法。
【請求項7】
請求項1乃至6の何れか1項に記載の議事録作成方法において、
前記翻訳辞書選択ステップは、会議への各参加者毎に、前記翻訳辞書を選択することを特徴とする議事録作成方法。
【請求項8】
請求項7に記載の議事録作成方法において、
各参加者毎の利用言語及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択ステップは、前記会議開催予定データに記述されている各参加者毎の利用言語及び議事録で利用する言語を基に、翻訳辞書を選択することを特徴とする議事録作成方法。
【請求項9】
請求項7に記載の議事録作成方法において、
各参加者毎の参加場所及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択ステップは、前記会議開催予定データに記述されている各参加者毎の参加場所及び議事録で利用する言語を基に、翻訳辞書を選択することを特徴とする議事録作成方法。
【請求項10】
入力した音声をその言語のテキストデータとする音声認識手段と、
前記テキストデータを所定の言語に翻訳する翻訳手段と、
翻訳された前記テキストデータを基に、議事録を作成する議事録作成する手段と、
を備える議事録作成装置であって、
入力される言語の種類と議題、レジュメ又は参考資料とを基に、それぞれ、それらに適した音響モデル及び言語モデルとを選択するモデル選択手段と、
入力される言語の種類と議事録で用いられる言語の種類とを基に、翻訳辞書を選択する翻訳辞書選択手段と、
を更に備え、
前記音声認識手段は、前記モデル選択手段により選択された前記音響モデル及び前記言語モデルを利用し、
前記翻訳手段は、前記翻訳辞書選択手段により選択された前記翻訳辞書を利用することを特徴とする議事録作成装置。
【請求項11】
請求項10に記載の議事録作成装置であって、
前記モデル選択手段は、会議への各参加者毎に、前記音響モデル及び前記言語モデルを選択することを特徴とする議事録作成装置。
【請求項12】
請求項11に記載の議事録作成装置において、
各参加者毎の利用言語は予め会議開催予定データに記述されており、前記モデル選択手段は、前記会議開催予定データに記述されている各参加者毎の利用言語を基に、各参加者毎の音響モデルを選択することを特徴とする議事録作成装置。
【請求項13】
請求項12に記載の議事録作成装置において、
前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択手段は、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の利用言語を基に、言語モデルを選択することを特徴とする議事録作成装置。
【請求項14】
請求項11に記載の議事録作成装置において、
各参加者毎の参加場所は予め会議開催予定データに記述されており、前記モデル選択手段は、前記会議開催予定データに記述されている各参加者毎の参加場所を基に、各参加者毎の音響モデルを選択することを特徴とする議事録作成装置。
【請求項15】
請求項14に記載の議事録作成装置において、
前記議題、レジュメ又は参考資料は予め会議開催予定データに記述されており、前記モデル選択手段は、前記会議開催予定データに記述されている議題、レジュメ又は参考資料及び各参加者毎の参加場所を基に、言語モデルを選択することを特徴とする議事録作成装置。
【請求項16】
請求項10乃至15の何れか1項に記載の議事録作成装置において、
前記翻訳辞書選択手段は、会議への各参加者毎に、前記翻訳辞書を選択することを特徴とする議事録作成装置。
【請求項17】
請求項16に記載の議事録作成装置において、
各参加者毎の利用言語及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択手段は、前記会議開催予定データに記述されている各参加者毎の利用言語及び議事録で利用する言語を基に、翻訳辞書を選択することを特徴とする議事録作成装置。
【請求項18】
請求項16に記載の議事録作成装置において、
各参加者毎の参加場所及び議事録で利用する言語は予め会議開催予定データに記述されており、前記翻訳辞書選択手段は、前記会議開催予定データに記述されている各参加者毎の参加場所及び議事録で利用する言語を基に、翻訳辞書を選択することを特徴とする議事録作成装置。
【請求項19】
コンピュータに請求項1乃至9の何れか1項に記載の方法を行わせるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2008−225191(P2008−225191A)
【公開日】平成20年9月25日(2008.9.25)
【国際特許分類】
【出願番号】特願2007−65081(P2007−65081)
【出願日】平成19年3月14日(2007.3.14)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】