説明

情報管理装置、情報管理システム、及びプログラム

【課題】表示情報に対して、利用者が注目している情報と利用者の音声とを容易に対応付けて格納することができる装置を提供する。
【解決手段】文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部とを備える情報管理装置を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、利用者の音声情報を管理する情報管理装置、情報管理システム、及びプログラムに関する。
【背景技術】
【0002】
従来、例えばモニタに文書を表示することにより、利用者に文書情報を提供する装置がある。このような装置において、利用者は提供された文書を編集することができる。例えば、利用者は、キーボード等の入力手段によって、表示された文書の所望の箇所にメモを追加することができる。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、キーボート等の入力手段によって文書の所望の位置にメモ等を追加する場合、キーボード等を操作する必要があるため、時間や手間がかかってしまう場合がある。また、利用者がキーボード等の入力手段に熟練していない場合、所望のメモを効率よく作成することが更に困難である。
【課題を解決するための手段】
【0004】
上記課題を解決するために、本発明の第1の形態においては、音声を管理する情報管理装置であって、文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部とを備えることを特徴とする情報管理装置を提供する。
【0005】
注目情報検出部は、利用者の視線が所定の時間以上停留している情報を注目情報として検出してよい。また、情報管理装置は、視線検出部が検出した利用者の視線の位置を、表示情報と合わせて表示部に表示させる表示制御部を更に備えてよい。また、表示情報を複数の表示領域に分割する領域分割部を更に備え、音声検出部は、音声を、注目情報が含まれる表示領域に対応付けて格納部に格納してよい。
【0006】
また、視線検出部が検出した、利用者の視線の位置に対応する表示領域の表示属性を変化させて表示部に表示させる表示制御部を更に備えてよい。また、格納部に対応する音声が既に格納されている表示領域の表示属性を変化させて表示部に表示させる表示制御部を更に備えてよい。
【0007】
格納部は、文書データを含む表示情報を格納し、領域分割部は、表示情報を、文書データの単語毎に表示領域に分割してよい。また、音声検出部は、音声を検出したときに利用者が注目している注目情報を含む表示領域に、当該音声を対応付けて格納部に格納してよい。
【0008】
音声検出部は、音声を検出したときから、所定の時間遡った期間において、利用者の視線が最も長く停留した表示領域に、当該音声を対応付けて格納部に格納してよい。利用者から音声の格納を指示する指示情報を受け取る入力部を更に備え、音声検出部は、指示情報を受け取った場合に音声の検出を開始してよい。
【0009】
情報管理装置は、利用者から、再生するべき音声に対応する注目情報を指示する指示情報を受け取る入力部と、入力部が指示情報を受け取った場合に、当該注目情報に対応する音声を再生する音声出力部とを更に備えてよい。
【0010】
利用者から、音声の再生を指示する指示情報を受け取る入力部と、入力部が指示情報を受け取った場合に、注目情報検出部が検出した注目情報に対応する音声を再生する音声出力部とを更に備えてよい。
【0011】
注目情報検出部は、利用者の視線が所定の時間以上停留している情報を注目情報として検出し、格納部が注目情報に対応付けられた音声を格納している場合に、当該音声を再生する音声出力部を更に備えてよい。
【0012】
注目情報検出部は、過去の所定の期間内において利用者の視線が最も長く停留し、且つ所定の時間以上停留した情報を注目情報として検出し、格納部が注目情報に対応付けられた音声を格納している場合に、当該音声を再生する音声出力部を更に備えてよい。
【0013】
情報管理装置は、利用者に関する利用者情報を受け取る入力部を更に備え、音声検出部は、音声、及び利用者情報を、注目情報に対応付けて格納部に格納してよい。また、情報管理装置は、注目情報検出部が検出した注目情報に対応して音声が既に格納されている場合に、当該音声に対応する利用者情報を表示部に表示させる表示制御部を更に備えてよい。
【0014】
情報管理装置は、音声出力部が再生する音声に対応する利用者情報を、音声の再生と同期して表示部に表示させる表示制御部を更に備えてよい。音声検出部は、音声出力部が音声を再生中又は再生後に、更に音声を検出した場合、検出した音声を、再生した音声に対応付けて格納部に格納してよい。
【0015】
情報管理装置は、格納部が音声を対応付けて格納している注目情報及び利用者情報のリストを表示部に表示させる表示制御部を更に備えてよい。表示制御部は、利用者情報に基づいて分類したリストを表示させてよい。
【0016】
情報管理装置は、それぞれの利用者の声紋を予め格納する声紋格納部と、音声検出部が検出した音声と、声紋格納部が格納した声紋とを比較し、比較結果に応じた利用者情報を音声に対応付けて、格納部に格納する利用者情報生成部とを更に備えてよい。
【0017】
情報管理装置は、それぞれの利用者の顔を含む画像を予め格納する画像格納部と、利用者の顔を含む画像を撮像する画像撮像部と、画像撮像部が撮像した画像と、画像格納部が格納した画像とを比較し、比較結果に応じた利用者情報を音声に対応付けて、格納部に格納する画像比較部とを更に備えてよい。
【0018】
本発明の第2の形態においては、音声を管理する情報管理装置を機能させるプログラムであって、情報管理装置を、文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部として機能させることを特徴とするプログラムを提供する。
【0019】
本発明の第3の形態においては、音声を管理する情報管理システムであって、文書データ又は画像データの少なくとも一方を含む表示情報を管理する主管理装置と、それぞれの利用者に割り当てられた複数の端末装置とを備え、それぞれの端末装置は、主管理装置から受信した表示情報を表示する表示部と、対応する利用者の視線を検出する視線検出部と、当該利用者の視線に基づいて、表示部に表示された表示情報のうち、当該利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部と、注目情報及び対応付けられた音声を、主管理装置に送信する送受信部とを有し、主管理装置は、端末装置から受信した音声と注目情報とを対応付けて格納する格納部を有することを特徴とする情報管理システムを提供する。
【0020】
本発明の第4の形態においては、複数の利用者により同時に利用され、それぞれの利用者の音声を管理する情報管理装置であって、文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、それぞれの利用者の視線を検出する視線検出部と、それぞれの利用者の視線に基づいて、表示部に表示された表示情報のうち、それぞれの利用者が注目している注目情報を検出する注目情報検出部と、それぞれの利用者の音声を検出し、検出した音声を当該音声に対応する利用者が注目している注目情報に対応付けて格納部に格納する音声検出部とを備えることを特徴とする情報管理装置を提供する。
【0021】
音声検出部は、二以上の利用者の音声を同時に検出した場合に、それぞれの音声を分離する手段と、音声検出部が分離した音声の方向を検出する手段とを有し、情報管理装置は、それぞれの利用者の画像を予め格納する画像格納部と、分離されたそれぞれの音声の方向の利用者の画像を撮像する画像撮像部と、画像撮像部が撮像した画像と、画像格納部が格納した画像とを比較し、比較結果に応じた利用者情報を音声に対応付けて、格納部に格納する画像比較部とを更に備えてよい。
【0022】
本発明の第5の形態においては、音声を管理する情報管理装置であって、文書データ又は画像データの少なくとも一方を含む表示情報を、複数の情報に分割して格納し、音声を表示情報の複数の領域のいずれかに対応付けて格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、格納部が音声を注目情報に対応付けて格納している場合に、当該音声を再生する音声出力部とを備えることを特徴とする情報管理装置を提供する。
【0023】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【発明を実施するための最良の形態】
【0024】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0025】
図1は、本発明の実施形態に係る情報管理装置100の構成の一例を示す。情報管理装置100は、文書、画像等の情報に、利用者の音声の情報を付して管理する。情報管理装置100は、例えばキーボード等の入力手段、モニタ等の表示手段、演算手段、及び制御手段等を備えたコンピュータである。
【0026】
情報管理装置100は、表示部10、視線検出部20、音声検出部30、音声出力部50、入力部60、表示制御部70、領域分割部72、注目情報検出部74、及び格納部76を備える。
【0027】
格納部76は、文書データ又は画像データの少なくとも一方を含む表示情報を格納する。格納部76は、例えば磁気的な手段で表示情報をディジタルデータとして記憶する記憶装置である。
【0028】
表示部10は、格納部76が格納した表示情報を表示する。本例においては、格納部76が格納した表示情報は、表示制御部70に送信され、表示部10に表示される。表示部10は、例えばCRT、液晶ディスプレイ等のモニタである。
【0029】
視線検出部20は、利用者の視線を検出する。つまり、視線検出部20は、利用者の視線が、表示部10に表示した表示情報のいずれの領域に停留しているかを検出する。視線検出部20は、例えば、利用者の目を撮像して画像解析することにより利用者の視線を検出するものであってよい。この場合、視線検出部20は、表示部10の近傍に配置されることが好ましい。また、視線検出部20は、利用者が装着するものであってもよい。
【0030】
注目情報検出部74は、視線検出部20が検出した利用者の視線に基づいて、表示部10に表示された表示情報のうち、利用者が注目している注目情報を検出する。例えば、注目情報検出部74は、表示制御部70から表示情報を受け取り、視線検出部20が検出した利用者の視線の表示部10における座標に基づいて注目情報を検出する。視線検出部20、及び注目情報検出部74は、例えばコンピュータの演算装置である。
【0031】
音声検出部30は、利用者の音声を検出し、当該音声を注目情報に対応付けて格納部76に格納する。音声検出部30は、例えば集音マイクを有する。
【0032】
また、注目情報検出部74は、利用者の視線が停留している座標を中心とした所定の大きさの領域を注目情報として検出してよい。また他の例においては、格納部76が格納した表示情報は、領域分割部72において複数の表示領域に分割され、注目情報検出部74は、利用者の視線が停留している表示領域を注目情報として検出してもよい。
【0033】
これらの場合、注目情報検出部74は、利用者の視線が所定の時間以上停留している情報を注目情報として検出してよい。また、視線検出部20は、利用者の瞬きの回数を検出し、注目情報検出部74は、利用者の瞬きの回数に更に基づいて注目情報を検出してもよい。例えば、利用者の視線が所定の時間以上停留し、且つ当該所定の時間内における利用者の瞬きの回数が所定の回数以下である領域を注目情報として検出してよい。また、注目情報検出部74は、利用者の視線の移動速度に基づいて注目情報を検出してよい。例えば、利用者の視線の移動速度が所定の期間、所定の速度以下であったときに、利用者の視線が在する領域を注目情報として検出してもよい。このような条件を用いて注目情報を検出することにより、利用者が注目している注目情報を精度よく検出することができる。
【0034】
また、注目情報検出部74は、音声検出部30が当該音声を検出したときに利用者が注目している注目情報を含む表示領域を検出し、音声検出部30は、当該表示領域に対応付けて、当該音声を格納部76に格納してよい。この場合、注目情報検出部74は、音声検出部30が当該音声を検出したときから、所定の時間遡った期間において、利用者の視線が最も長く停留した表示領域を検出し、音声検出部30は、当該音声を対応付けて格納部76に格納することが好ましい。
【0035】
また、他の例においては、注目情報検出部74は、入力部60が利用者から音声の格納を指示する指示情報を受け取った場合に、利用者の視線が在する領域を注目情報として検出し、音声検出部30は、利用者の音声の検出を開始してよい。
【0036】
次に、情報管理装置100が格納した音声を再生する場合の動作を説明する。一例として、音声出力部50は、入力部60が音声を再生するべき旨の指示情報を利用者から受け取った場合に、格納部76が格納した音声を出力する。例えば、入力部60が当該指示情報において、再生するべき音声に対応する注目情報を指示された場合、音声出力部50は、当該注目情報に対応する音声を格納部76から取り出して再生する。また、入力部60が音声の再生を指示する指示情報を利用者から受け取った場合、音声出力部50は、注目情報検出部74から利用者が注目している注目情報に関する情報を受け取り、当該注目情報に対応する音声を格納部76から取り出して再生する。この場合、利用者は簡易な操作により注目情報に対応する音声を再生することができる。
【0037】
また、音声出力部50は、所定の条件で注目情報検出部74が注目情報を検出した場合に、当該注目情報に対応する音声を格納部76から取り出して自動的に再生してもよい。この場合、利用者は再生の指示をする必要がなく、簡便に音声の再生をすることができる。
【0038】
例えば、注目情報検出部74は、利用者の視線が所定の時間以上継続して停留している情報を注目情報として検出し、音声出力部50は、格納部76が当該注目情報に対応付けられた音声を格納している場合に、当該音声を再生する。これにより、利用者の意図に応じた音声を再生することができる。
【0039】
また、他の例としては、注目情報検出部74は、過去の所定の期間内において、利用者の視線が停留した総時間が最も長く、且つ所定の時間以上継続して停留した情報を注目情報として検出し、音声出力部50は、格納部76が当該注目情報に対応付けられた音声を格納している場合に、当該音声を再生してもよい。これにより、利用者の注視点が移動している場合であっても、利用者の意図を反映した音声を再生することができる。
【0040】
また、更に他の例としては、注目情報検出部74は、過去の所定の期間内において、利用者の視線が停留した総時間が所定の総時間より長く、且つ所定の継続時間以上継続して停留した情報を注目情報として検出し、音声出力部50は、格納部76が当該注目情報に対応付けられた音声を格納している場合に、当該音声を再生してもよい。
【0041】
また、これらの音声の再生中に利用者の視線が移動した場合、注目情報検出部74は、当該音声の再生が終了してから次の注目情報を検出してよく、また利用者の視線が移動した直後から次の注目情報を検出してもよい。また、再生中の音声に対して、格納部76が他の音声を対応付けて格納している場合、音声出力部50は、再生中の音声に続き、当該対応付けられた音声を更に再生してもよい。
【0042】
以上のような動作により、利用者の操作の手間を低減し、且つ利用者の意図を反映した音声を容易に再生することができる。
【0043】
図2は、情報管理装置100の動作の一例を説明する図である。本例において、表示装置10の上部には視線検出部20が設けられ、表示装置10の側部には音声検出部30が設けられる。また、音声検出部30は、音声出力部50としても機能する。
【0044】
まず、音声の情報を注目情報に対応付けて格納する動作について説明する。表示装置10は、図2に示すように表示情報102を表示する。視線検出部20は前述したように、利用者の視線を検出し、注目情報検出部74(図1参照)は、利用者が注目している表示情報102の領域を注目情報として検出する。本例において、表示情報102は文書の行毎の表示領域に分割されており、表示制御部70(図1参照)は、視線検出部20が検出した、利用者の視線の位置に対応する表示領域(行)の表示属性を変化させて表示部10に表示させる。ここで、表示属性の変化とは、例えば文字の太さ、大きさ、色を変更すること、下線を付すこと、網掛け表示をすること等を指す。本例においては、表示制御部70は、利用者が注目している表示領域の文字を太字にして表示している。
【0045】
また、表示制御部70は、表示部10に音声入力ボタン104を表示させてもよい。利用者がマウス等の入力手段により、音声入力ボタン104を選択した場合、音声検出部30は、利用者の音声検出を開始する。このとき、音声検出部30は、所定の期間音声の検出を行ってよく、また所定の時間利用者の音声が途切れるまで、音声の検出を行ってもよい。音声検出部30が検出した音声は、図1に関連して説明したように、注目情報に対応付けて格納される。
【0046】
このような動作により、利用者は所望の注目情報に対応付けて音声の情報を容易に付加することができる。また、本例において領域分割部72は、文書の行毎に領域分割しているが、他の例においては、領域分割部72は、表示情報102を文書データの単語毎に表示領域に分割してもよく、また所望の範囲毎に分割してもよい。また、表示制御部70は、注目情報を含む表示領域の表示属性を変更させることにより、利用者に注目情報を識別させているが、他の例においては、視線検出部20が検出した利用者の視線の位置を、表示情報102と合わせて表示部10に表示させてもよい。例えば、表示情報102上に、利用者の視線の位置を示すカーソルを表示させてもよい。
【0047】
次に、格納した音声を再生する動作について説明する。表示制御部70は、格納部76に対応する音声が既に格納されている表示領域の表示属性を変化させて表示部10に表示させる。これにより、利用者に音声の情報の有無を認識させることができる。また、表示制御部70は、表示部10に、音声出力ボタン110を表示させる。
【0048】
次に、利用者が音声出力ボタン110を選択すると、注目情報検出部74は、このときに利用者が注目している注目情報を検出する。この場合も、音声出力ボタン110の選択を検出したときから、所定の時間遡った期間において、利用者の視線が最も長く停留した表示領域を注目情報として検出してよい。そして、音声出力部50は、当該注目情報に対応する音声を格納部76から取り出して再生する。また、表示制御部70は、前述したように対応する音声が格納されている表示領域の表示属性を変化させて表示させることが好ましい。
【0049】
このような動作により、情報管理装置100は、利用者の音声の情報を容易に録音、及び再生することができる。特に、利用者がキーボード等の操作に不慣れな場合であっても、容易に音声情報を録音、再生することができる。また、音声が付加されている文書を容易に判別することができる。
【0050】
図3は、情報管理装置100の動作の他の例を説明する図である。本例において、情報管理装置100は、格納部76に格納された音声に対応する利用者の情報を表示部10に表示する。
【0051】
本例においては、入力部60は、利用者に関する利用者情報を受け取る。ここで、利用者情報とは、利用者の氏名、役職、年齢、性別等である。また、利用者情報は、利用者が情報管理装置100の使用を開始する場合に入力する、利用者の識別情報に基づいて生成されてよく、また当該識別情報を利用者情報としてもよい。例えば、情報管理装置100は、利用者の識別情報と利用者情報とを対応付けて格納する手段を更に備えてもよい。当該利用者の音声を録音する場合、音声検出部30は、当該音声、及び当該利用者の利用者情報を、注目情報に対応付けて格納部76に格納する。
【0052】
また、表示制御部70は、注目情報検出部74が検出した注目情報に対応して音声が既に格納されている場合に、当該音声に対応する利用者情報を表示部10に表示させる。また、表示制御部70は、前述したように対応する音声が格納されている表示領域の表示属性を変化させて表示させることが好ましい。この場合、当該音声に対応する利用者情報に応じて、表示属性を変化させてもよい。例えば、利用者の役職に応じて表示の色を変化させてもよい。また、自己の音声が対応付けて格納された表示領域であるか、又は他の利用者の音声が対応付けて格納された表示領域であるかによって表示属性を変化させてもよい。このような動作により、他の利用者が表示情報を利用した場合に、どの利用者によって音声が付加されているかを容易に認識することができる。また、表示制御部70は、音声出力部50が音声を再生する場合、当該音声に対応する利用者情報を、音声の再生と同期して表示部10に表示させることが好ましい。
【0053】
図4は、情報管理装置100の構成の他の例を示す。本例において、情報管理装置100は、いずれの利用者によって使用されているかを識別し、当該利用者の利用者情報を音声情報と共に格納する。本例における情報管理装置100は、図1において説明した情報管理装置100の構成に加え、画像撮像部40、画像格納部42、及び画像比較部44を更に備える。図4において図1と同一の符号を付した構成要素は、図1〜図3において説明した構成要素と同一又は同様の機能及び構成を有する。
【0054】
画像撮像部40は、利用者の顔を含む画像を撮像する。また、視線検出部20が画像撮像部40として機能してもよい。
【0055】
画像格納部42は、それぞれの利用者の顔を含む画像を、それぞれの利用者情報と対応付けて予め格納する。また、画像格納部42は、それぞれの利用者の画像の特徴点のみを抽出した画像を格納していてもよく、またそれぞれの利用者について、異なる角度から撮像した複数の画像を格納していてもよい。
【0056】
画像比較部44は、画像撮像部40が撮像した画像と、画像格納部42が格納した画像とを比較し、比較結果に応じた利用者情報を画像格納部42から読み出す。そして、音声検出部30が検出した音声を格納部76に格納する場合に、当該利用者情報を当該音声に対応付けて格納部76に格納する。
【0057】
格納部76に格納された利用者情報は、図3において説明したように用いられる。本例における情報管理装置100によれば、音声を録音した利用者に関する利用者情報を容易に記録することができる。
【0058】
図5は、情報管理装置100の構成の更なる他の例を示す。本例において、情報管理装置100は、いずれの利用者によって使用されているかを識別し、当該利用者の利用者情報を音声情報と共に格納する。本例における情報管理装置100は、図1において説明した情報管理装置100の構成に加え、声紋比較部46、及び声紋格納部48を更に備える。図5において図1と同一の符号を付した構成要素は、図1〜図3において説明した構成要素と同一又は同様の機能及び構成を有する。
【0059】
声紋格納部48は、それぞれの利用者の音声の声紋を、それぞれの利用者情報と対応付けて予め格納する。声紋比較部46は、音声検出部30が検出した音声の声紋と、声紋格納部48が格納した声紋とを比較し、比較結果に応じた利用者情報を声紋格納部48から読み出す。そして、音声検出部30が検出した音声を格納部76に格納する場合に、当該利用者情報を当該音声に対応付けて格納部76に格納する。
【0060】
本例における情報管理装置100によれば、音声を録音した利用者に関する利用者情報を容易に記録することができる。また、情報管理装置100は、図4において説明した画像比較による利用者の判別と、図5において説明した声紋比較による利用者の判別とを組み合わせて、利用者を判別してもよい。
【0061】
また、表示制御部70は、格納部76が音声を対応付けて格納している注目情報及び利用者情報のリストを表示部10に表示させてよい。例えば、表示制御部70は、利用者からの指示に応じて当該リストを表示させる。
【0062】
また、情報管理装置100が複数の利用者によって同時に利用されている場合も、情報管理装置100は、それぞれの利用者の音声を利用者情報と合わせて容易に記録することができる。この場合、視線検出部20は、それぞれの利用者の視線を検出する。また、注目情報検出部74は、それぞれの利用者の視線に基づいて、表示部10に表示された表示情報のうち、それぞれの利用者が注目している注目情報を検出する。
【0063】
音声検出部30は、それぞれの利用者の音声を検出し、声紋比較部46は、検出された音声に対応する利用者を判別する。そして、声紋比較部46は、検出された音声を当該音声に対応する利用者が注目している注目情報に対応付けて格納部76に格納する。
【0064】
また、複数の利用者が同時に音声を発声した場合には、音声検出部30は、それぞれの音声を分離して検出することが好ましい。混合音声についての分離については、例えば、"マイクロホン対を用いた帯域分割型固有分解による混合音声の分離"2000年電子情報通信学会総合大会講演論文集,pp.129,(2000年3月)に記載されている。この場合、音声検出部30は、異なる位置に設けられた2以上の集音マイクを有することが好ましい。そして、声紋比較部46は、分離した音声のそれぞれについて、利用者を判別する。
【0065】
また、混合音声を分離した場合、それぞれの声紋を精度よく判別することが困難な場合がある。このため、音声検出部30は、分離したそれぞれの音声の方向を更に検出することが好ましい。例えば、前述したように異なる位置に設けられた2以上の集音マイクを有することにより、音声の方向を検出することができる。
【0066】
そして、図4に関連して説明した画像撮像部40が撮像した画像において、音声検出部30が検出した方向に対応する画像領域に撮像された利用者の画像と、画像格納部42が予め格納した画像とを画像比較部44が比較することにより、利用者を判別する。画像格納部42は、図4において説明したように、それぞれの利用者の顔を含む画像を格納してよく、利用者の目の虹彩を含む画像を格納してもよく、またこれらの両方を格納してもよい。この場合において、声紋比較によって判別した利用者と、画像比較によって判別した利用者とが異なる場合には、上述した利用者の判別を再び行うことが好ましい。
【0067】
このように、声紋比較及び画像比較を組み合わせることによって、複数の利用者が同時に発声した場合であっても、それぞれの音声とそれぞれの注目情報とを精度よく検出し、記録することができる。
【0068】
図6は、表示部10が表示する、注目情報及び利用者情報のリスト108の一例を示す。本例において、表示制御部70は、音声が対応付けられて格納部76に格納されている利用者情報のリスト108を、注目情報又は表示領域毎に表示部10に表示させる。
【0069】
また、表示制御部70は、図6に示すように、注目情報又は表示領域に対応付けられた音声を、対応する利用者情報及びその録音日時によって示すリスト108として表示させてもよい。本例において、音声出力部50は、利用者がリスト108から選択した音声を再生する。
【0070】
以上説明したように、図6に示すように情報管理装置100は、一の注目情報又は表示領域に対して、複数の音声及び利用者情報を格納してよい。例えば、一の音声に対して返信の音声が録音された場合、格納部76は、当該一の音声に対応付けて当該他の音声を格納する。
【0071】
例えば、音声検出部30は、音声出力部50が一の音声を再生後に、更に他の音声を検出した場合、検出した他の音声を、再生した一の音声に対応付けて格納部76に格納してよい。この場合、音声検出部30は、一の音声が再生されてから所定の時間以内に検出した音声を、当該他の音声として検出することが好ましい。また、音声検出部30は、音声出力部50が一の音声を再生中に検出した音声を、当該他の音声として検出してもよい。また、音声検出部30は、利用者がリスト108から選択した一の音声に、検出した他の音声を対応付けて格納してもよい。
【0072】
本例における情報管理装置100によれば、利用者は他の利用者が録音した音声に対して、自己の音声を対応付けて容易に格納することができる。例えば、表示情報が複数の利用者によって閲覧される場合に、それぞれの利用者は、他の利用者の意見を参照し、自己の意見を付加することができる。
【0073】
また、情報管理装置100は、情報管理装置100を現に利用している利用者の利用者情報に応じて、格納された他の利用者の音声のうちいずれの音声を表示又は再生するかを選択する手段を更に備えていてもよい。例えば、利用者情報が利用者の所属部署を示す場合、当該部署に属する他の利用者の音声のみ参照できるように制御してもよい。
【0074】
また、音声を録音した利用者が、当該音声を参照できる利用者を制限する情報を入力してもよい。例えば、音声を録音した利用者は、当該音声を参照できる利用者の利用者情報を入力してよい。この場合、情報管理装置100は、起動する際に利用者の識別情報を利用者情報として取得し、表示制御部70は、当該識別情報に応じて、リスト108に表示する音声、利用者情報を選択する。
【0075】
また、図1〜図6において説明した情報管理装置100は、プログラムによって動作する。当該プログラムは、情報管理装置100を図1〜図6において説明したように動作させる。一例として、プログラムは情報管理装置100を、文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部76と、格納部76が格納した表示情報を表示する表示部10と、利用者の視線を検出する視線検出部20と、利用者の視線に基づいて、表示部10に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部74と、利用者の音声を検出し、音声を注目情報に対応付けて格納部76に格納する音声検出部30として機能させる。
【0076】
図7は、本発明の他の実施形態に係る情報管理システム200の構成の一例を示す。情報管理システム200は、文書、画像等の情報に、利用者の音声の情報を付して管理する。情報管理システム200は、主管理装置202と、複数の端末装置(208a〜208c、以下208と総称する)とを備える。主管理装置202と複数の端末装置208とは、有線通信により情報の授受を行ってよく、また無線通信により情報の授受を行ってもよい。また、主管理装置202と複数の端末装置208とは、インターネット、イントラネット、エキストラネット等を介して接続されていてよい。
【0077】
主管理装置202は、文書データ又は画像データの少なくとも一方を含む表示情報を管理する。主管理装置202は、当該表示情報を格納する格納部204と、格納部204が格納した表示情報をそれぞれの端末装置208に送信する送受信部206とを有する。
【0078】
それぞれの端末装置208は、図1〜図6において説明した情報管理装置100の構成に対し、格納部76に代えて送受信部(図示せず)を備える。当該送受信部は、主管理装置202の送受信部206から表示情報を受信し、表示制御部70に送信する。それぞれの端末装置208において、送受信部以外の構成要素は、図1から図6において説明した機能を有する。
【0079】
また、それぞれの端末装置208の送受信部は、それぞれの利用者の注目情報又は表示領域と、対応付けられた当該利用者の音声とを主管理装置202に送信する。格納部204は、それぞれの端末装置208から受信した音声と注目情報とを対応付けて格納する。
【0080】
また、主管理装置202の送受信部206は、格納部204が格納した音声及び注目情報とをそれぞれの端末装置208に送信し、それぞれの利用者に自己及び他の利用者の音声を参照させる。
【0081】
つまり、本例における格納部204は、図1〜図6において説明した格納部76と同一の機能を有し、それぞれの端末装置208は、図1〜図6において説明したそれぞれの格納部76に代えて、主管理装置202の格納部204にアクセスすることにより音声の格納、表示、及び再生を行う。これにより、複数の利用者が同時に同一の文書に対して音声を録音することができる。また、それぞれの録音結果は、主管理装置202が管理してそれぞれの端末装置208が表示する表示情報に反映される。例えば、会議等において一の表示情報について議論する場合、それぞれの利用者の音声を随時録音し、それぞれの利用者に対して提供することができる。
【0082】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0083】
上記発明によれば、表示情報に対して、利用者が注目している情報と利用者の音声とを容易に対応付けて格納することができる。このため、メモ等を注目情報に付加したいような場合に、容易な操作で所望のメモを録音することができる。
【図面の簡単な説明】
【0084】
【図1】本発明の実施形態に係る情報管理装置100の構成の一例を示す図である。
【図2】情報管理装置100の動作の一例を説明する図である。
【図3】情報管理装置100の動作の他の例を説明する図である。
【図4】情報管理装置100の構成の他の例を示す図である。
【図5】情報管理装置100の構成の更なる他の例を示す図である。
【図6】表示部10が表示する、注目情報及び利用者情報のリスト108の一例を示す図である。
【図7】本発明の他の実施形態に係る情報管理システム200の構成の一例を示す図である。
【符号の説明】
【0085】
10・・・表示部、20・・・視線検出部、30・・・音声検出部、40・・・画像撮像部、42・・・画像格納部、44・・・画像比較部、46・・・声紋比較部、48・・・声紋格納部、50・・・音声出力部、60・・・入力部、70・・・表示制御部、72・・・領域分割部、74・・・注目情報検出部、76・・・格納部、100・・・情報管理装置、102・・・表示情報、104・・・音声入力ボタン、108・・・リスト、110・・・音声出力ボタン、200・・・情報管理システム、202・・・主管理装置、204・・・格納部、206・・・送受信部、208・・・端末装置

【特許請求の範囲】
【請求項1】
音声を管理する情報管理装置であって、
文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、
前記格納部が格納した前記表示情報を表示する表示部と、
利用者の視線を検出する視線検出部と、
前記利用者の視線に基づいて、前記表示部に表示された前記表示情報のうち、前記利用者が注目している注目情報を検出する注目情報検出部と、
前記利用者の音声を検出し、前記音声を前記注目情報に対応付けて前記格納部に格納する音声検出部と
を備えることを特徴とする情報管理装置。
【請求項2】
前記注目情報検出部は、前記利用者の視線が所定の時間以上停留している情報を前記注目情報として検出することを特徴とする請求項1に記載の情報管理装置。
【請求項3】
前記視線検出部が検出した前記利用者の視線の位置を、前記表示情報と合わせて前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項1又は2に記載の情報管理装置。
【請求項4】
前記表示情報を複数の表示領域に分割する領域分割部を更に備え、
前記音声検出部は、前記音声を、前記注目情報が含まれる前記表示領域に対応付けて前記格納部に格納することを特徴とする請求項1に記載の情報管理装置。
【請求項5】
前記視線検出部が検出した、前記利用者の視線の位置に対応する前記表示領域の表示属性を変化させて前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項4に記載の情報管理装置。
【請求項6】
前記格納部に対応する前記音声が既に格納されている前記表示領域の表示属性を変化させて前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項4に記載の情報管理装置。
【請求項7】
前記格納部は、文書データを含む前記表示情報を格納し、
前記領域分割部は、前記表示情報を、前記文書データの単語毎に前記表示領域に分割することを特徴とする請求項4に記載の情報管理装置。
【請求項8】
前記音声検出部は、前記音声を検出したときに前記利用者が注目している前記注目情報を含む表示領域に、当該音声を対応付けて前記格納部に格納することを特徴とする請求項4に記載の情報管理装置。
【請求項9】
前記音声検出部は、前記音声を検出したときから、所定の時間遡った期間において、前記利用者の視線が最も長く停留した表示領域に、当該音声を対応付けて前記格納部に格納することを特徴とする請求項4に記載の情報管理装置。
【請求項10】
前記利用者から音声の格納を指示する指示情報を受け取る入力部を更に備え、
前記音声検出部は、前記指示情報を受け取った場合に前記音声の検出を開始することを特徴とする請求項8又は9に記載の情報管理装置。
【請求項11】
前記利用者から、再生するべき前記音声に対応する前記注目情報を指示する指示情報を受け取る入力部と、
前記入力部が前記指示情報を受け取った場合に、当該注目情報に対応する前記音声を再生する音声出力部と
を更に備えることを特徴とする請求項1に記載の情報管理装置。
【請求項12】
前記利用者から、音声の再生を指示する指示情報を受け取る入力部と、
前記入力部が前記指示情報を受け取った場合に、前記注目情報検出部が検出した前記注目情報に対応する前記音声を再生する音声出力部と
を更に備えることを特徴とする請求項1に記載の情報管理装置。
【請求項13】
前記注目情報検出部は、前記利用者の視線が所定の時間以上停留している情報を前記注目情報として検出し、
前記格納部が前記注目情報に対応付けられた音声を格納している場合に、当該音声を再生する音声出力部を更に備えることを特徴とする請求項1に記載の情報管理装置。
【請求項14】
前記注目情報検出部は、過去の所定の期間内において前記利用者の視線が最も長く停留し、且つ所定の時間以上停留した情報を前記注目情報として検出し、
前記格納部が前記注目情報に対応付けられた音声を格納している場合に、当該音声を再生する音声出力部を更に備えることを特徴とする請求項1に記載の情報管理装置。
【請求項15】
前記利用者に関する利用者情報を受け取る入力部を更に備え、
前記音声検出部は、前記音声、及び前記利用者情報を、前記注目情報に対応付けて前記格納部に格納することを特徴とする請求項11から14のいずれかに記載の情報管理装置。
【請求項16】
前記注目情報検出部が検出した前記注目情報に対応して前記音声が既に格納されている場合に、当該音声に対応する前記利用者情報を前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項15に記載の情報管理装置。
【請求項17】
前記音声出力部が再生する前記音声に対応する前記利用者情報を、前記音声の再生と同期して前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項15に記載の情報管理装置。
【請求項18】
前記音声検出部は、前記音声出力部が前記音声を再生中又は再生後に、更に音声を検出した場合、検出した前記音声を、再生した前記音声に対応付けて前記格納部に格納することを特徴とする請求項11から14のいずれかに記載の情報管理装置。
【請求項19】
前記格納部が前記音声を対応付けて格納している前記注目情報及び前記利用者情報のリストを前記表示部に表示させる表示制御部を更に備えることを特徴とする請求項15に記載の情報管理装置。
【請求項20】
前記表示制御部は、前記利用者情報に基づいて分類した前記リストを表示させることを特徴とする請求項19に記載の情報管理装置。
【請求項21】
それぞれの利用者の声紋を予め格納する声紋格納部と、 前記音声検出部が検出した前記音声と、前記声紋格納部が格納した前記声紋とを比較し、比較結果に応じた利用者情報を前記音声に対応付けて、前記格納部に格納する利用者情報生成部と
を更に備えることを特徴とする請求項1又は2に記載の情報管理装置。
【請求項22】
それぞれの利用者の顔を含む画像を予め格納する画像格納部と、
前記利用者の顔を含む画像を撮像する画像撮像部と、
前記画像撮像部が撮像した画像と、前記画像格納部が格納した画像とを比較し、比較結果に応じた利用者情報を前記音声に対応付けて、前記格納部に格納する画像比較部と
を更に備えることを特徴とする請求項1又は2に記載の情報管理装置。
【請求項23】
音声を管理する情報管理装置を機能させるプログラムであって、
前記情報管理装置を、
文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、
前記格納部が格納した前記表示情報を表示する表示部と、
利用者の視線を検出する視線検出部と、
前記利用者の視線に基づいて、前記表示部に表示された前記表示情報のうち、前記利用者が注目している注目情報を検出する注目情報検出部と、
前記利用者の音声を検出し、前記音声を前記注目情報に対応付けて前記格納部に格納する音声検出部と
して機能させることを特徴とするプログラム。
【請求項24】
音声を管理する情報管理システムであって、
文書データ又は画像データの少なくとも一方を含む表示情報を管理する主管理装置と、
それぞれの利用者に割り当てられた複数の端末装置と
を備え、
それぞれの前記端末装置は、
前記主管理装置から受信した前記表示情報を表示する表示部と、
対応する利用者の視線を検出する視線検出部と、
当該利用者の視線に基づいて、前記表示部に表示された前記表示情報のうち、当該利用者が注目している注目情報を検出する注目情報検出部と、
前記利用者の音声を検出し、前記音声を前記注目情報に対応付ける音声検出部と、
前記注目情報及び対応付けられた前記音声を、前記主管理装置に送信する送受信部と
を有し、
前記主管理装置は、
前記端末装置から受信した前記音声と前記注目情報とを対応付けて格納する格納部を有することを特徴とする情報管理システム。
【請求項25】
複数の利用者により同時に利用され、それぞれの前記利用者の音声を管理する情報管理装置であって、
文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、
前記格納部が格納した前記表示情報を表示する表示部と、
それぞれの前記利用者の視線を検出する視線検出部と、
それぞれの前記利用者の視線に基づいて、前記表示部に表示された前記表示情報のうち、それぞれの前記利用者が注目している注目情報を検出する注目情報検出部と、
それぞれの前記利用者の音声を検出し、検出した前記音声を当該音声に対応する前記利用者が注目している前記注目情報に対応付けて前記格納部に格納する音声検出部と
を備えることを特徴とする情報管理装置。
【請求項26】
前記音声検出部は、
二以上の前記利用者の音声を同時に検出した場合に、それぞれの前記音声を分離する手段と、
前記音声検出部が分離した前記音声の方向を検出する手段と
を有し、
前記情報管理装置は、
それぞれの利用者の画像を予め格納する画像格納部と、
分離されたそれぞれの前記音声の方向の利用者の画像を撮像する画像撮像部と、
前記画像撮像部が撮像した画像と、前記画像格納部が格納した画像とを比較し、比較結果に応じた利用者情報を前記音声に対応付けて、前記格納部に格納する画像比較部と
を更に備えることを特徴とする請求項25に記載の情報管理装置。
【請求項27】
音声を管理する情報管理装置であって、
文書データ又は画像データの少なくとも一方を含む表示情報を、複数の情報に分割して格納し、前記音声を前記表示情報の複数の領域のいずれかに対応付けて格納する格納部と、
前記格納部が格納した前記表示情報を表示する表示部と、
利用者の視線を検出する視線検出部と、
前記利用者の視線に基づいて、前記表示部に表示された前記表示情報のうち、前記利用者が注目している注目情報を検出する注目情報検出部と、
前記格納部が前記音声を前記注目情報に対応付けて格納している場合に、当該音声を再生する音声出力部と
を備えることを特徴とする情報管理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−123229(P2009−123229A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2008−331331(P2008−331331)
【出願日】平成20年12月25日(2008.12.25)
【分割の表示】特願2003−51820(P2003−51820)の分割
【原出願日】平成15年2月27日(2003.2.27)
【出願人】(302064762)株式会社日本総合研究所 (367)
【Fターム(参考)】