説明

画像表示装置及び画像表示プログラム

【課題】音声情報の再生時刻に画像情報の再生タイミングが関連付けられた構成において、音声情報の内容に基づいて画像情報の表示倍率を変更する画像表示装置及び画像表示プログラムを提供する。
【解決手段】画像表示装置1は、音声情報111を再生する音声情報再生手段100と、音声情報111の再生時刻に同期して資料画像情報112を再生する資料画像情報再生手段101と、資料画像情報112を複数の分割画像情報に分割する資料画像分割手段103と、複数の分割画像情報からそれぞれ第1の文字情報を抽出する資料テキスト抽出手段104と、音声情報111を第2の文字情報に変換する音声テキスト変換手段105と、第1の文字情報と前記第2の文字情報との類似度を計算する類似度計算手段106と、類似度に基づいて、資料画像情報112の表示倍率を、分割画像情報に対応した領域に合わせて変更する表示倍率変更手段107を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像表示装置及び画像表示プログラムに関する。
【背景技術】
【0002】
音声情報及び画像情報からそれぞれキーワードを抽出し、関連性の高い音声情報及び画像情報をデータベース化する技術が提案されている(例えば、特許文献1参照。)。
【0003】
特許文献1に開示された情報分類装置は、検索対象として音声情報や文字を含む画像情報等が入力されるとそれぞれをテキスト情報に変換する変換手段と、変換されたテキスト情報から索引を作成する作成手段と、検索条件として音声情報や文字を含む画像情報等が入力されると変換手段に検索条件としてのテキスト情報に変換させて、変換された検索条件としてのテキスト情報を用いて索引から情報を検索する検索手段とを有する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7−219957号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の目的は、音声情報の再生時刻に画像情報の再生タイミングが関連付けられた構成において、音声情報の内容に基づいて画像情報の表示倍率を変更する画像表示装置及び画像表示プログラムを提供することにある。
【課題を解決するための手段】
【0006】
[1]コンピュータを、
音声情報を再生する音声情報再生手段と、
前記音声情報の再生時刻に同期して資料画像情報を再生する資料画像情報再生手段と、
前記資料画像情報を複数の分割画像情報に分割する分割手段と、
前記分割手段が分割した前記複数の分割画像情報からそれぞれ第1の文字情報を抽出する抽出手段と、
前記音声情報を第2の文字情報に変換する変換手段と、
前記第1の文字情報と前記第2の文字情報との類似度を計算する計算手段と、
前記計算手段が算出した前記類似度に基づいて、前記資料画像情報再生手段が再生した前記資料画像情報の表示倍率を、前記分割画像情報に対応した領域に合わせて変更する表示倍率変更手段として機能させるための画像表示プログラム。
【0007】
[2]前記分割手段は、領域の隣り合う前記分割画像情報において互いの領域が重複するように前記資料画像情報を分割する前記[1]に記載の画像表示プログラム。
【0008】
[3]前記分割手段は、前記第1の文字情報の文字の大きさ、文字数及び書体の少なくともいずれかに基づいて前記分割画像情報の大きさを決定する前記[1]に記載の画像表示プログラム。
【0009】
[4]音声情報を再生する音声情報再生手段と、
前記音声情報の再生時刻に同期して資料画像情報を再生する資料画像情報再生手段と、
前記資料画像情報を複数の分割画像情報に分割する分割手段と、
前記分割手段が分割した前記複数の分割画像情報からそれぞれ第1の文字情報を抽出する抽出手段と、
前記音声情報を第2の文字情報に変換する変換手段と、
前記第1の文字情報と前記第2の文字情報との類似度を計算する計算手段と、
前記計算手段が算出した前記類似度に基づいて、前記資料画像情報再生手段が再生した前記資料画像情報の表示倍率を、前記分割画像情報に対応した領域に合わせて変更する表示倍率変更手段を有する画像表示装置。
【発明の効果】
【0010】
請求項1又は4に係る発明によれば、音声情報の再生時刻に画像情報の再生タイミングが関連付けられた構成において、音声情報の内容に基づいて画像情報の表示倍率を変更することができる。
【0011】
請求項2に係る発明によれば、領域の隣り合う分割画像情報において互いの領域が重複するように資料画像情報を分割することができる。
【0012】
請求項3に係る発明によれば、第1の文字情報の文字の大きさ、文字数及び書体の少なくともいずれかに基づいて分割画像情報の大きさを決定することができる。
【図面の簡単な説明】
【0013】
【図1】図1は、画像表示装置の構成例を示すブロック図である。
【図2】図2は、同期情報の一例を示す概略図である。
【図3】図3は、画像表示装置の映像再生動作の一例を示す概略図である。
【図4A】図4A(a)及び(b)は、資料画像分割手段の動作の一例を説明するための図である。
【図4B】図4B(c)及び(d)は、類似度計算動作の一例を説明するための図である。
【図5】図5は、画像表示装置の倍率変更された映像再生動作の一例を示す概略図である。
【発明を実施するための形態】
【0014】
(画像表示装置の構成)
図1は、画像表示装置の構成例を示すブロック図である。
【0015】
画像表示装置1は、CPU(Central Processing Unit)等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記憶媒体であって情報を記憶する記憶部11と、液晶ディスプレイ等であって文字や画像を表示する表示部12と、イヤホン等が接続されて音声信号を出力する音声出力端子又は音声を出力するスピーカー等である音声出力部13と、キーボードやマウス等であって操作に応じた操作信号を発する操作部14とを備える。
【0016】
なお、画像表示装置1は、例えば、パーソナルコンピュータやPDA(Personal Data Assistants)、携帯電話等の電子機器であり、特に表示部のサイズが限られたもの(例えば、表示する画像のサイズに対して表示部の画素数が少ないもの)を対象とする。
【0017】
制御部10は、後述する画像表示プログラム110を実行することで、音声情報再生手段100、資料画像情報再生手段101、同期手段102、資料画像分割手段103、資料テキスト抽出手段104、音声テキスト変換手段105、類似度計算手段106及び表示倍率変更手段107等として機能する。
【0018】
音声情報再生手段100は、後述する音声情報111を再生し、音声信号を音声出力部13に出力する。
【0019】
資料画像情報再生手段101は、後述する資料画像情報112を再生し、資料画像信号を出力する。資料画像信号に応じて表示画面には資料画像情報112を再生した画像である再生画像が表示される。
【0020】
同期手段102は、後述する同期情報113に基づいて音声情報再生手段100の出力する音声信号と、資料画像情報再生手段101の出力する資料画像信号とを再生時刻において同期する。
【0021】
資料画像分割手段103は、資料画像情報112をその表示画像上において複数の領域(分割領域)に分割し、分割した領域から分割画像を生成する。
【0022】
資料テキスト抽出手段104は、資料画像分割手段103が生成した分割画像毎に画像からOCR(Optical Character Reader)等の方法を用いて第1の文字情報の一例としてのテキスト情報を抽出する。
【0023】
音声テキスト変換手段105は、音声情報111を、例えば、センテンス毎に第2の文字情報としてのテキスト情報に変換する。
【0024】
類似度計算手段106は、資料テキスト抽出手段104が抽出したテキスト情報と、音声テキスト変換手段105が変換したテキスト情報との類似度を計算する。
【0025】
表示倍率変更手段は、類似度計算手段106が算出した類似度に基づいて、資料画像情報再生手段101が再生した再生画像の表示を、分割した領域に拡大又は縮小する。
【0026】
記憶部11は、制御部10を上述した各手段100〜107として動作させる画像表示プログラム110と、音声を再生するためのMP3(MPEG Audio Layer−3)やWAV(RIFF waveform Audio Format)等の非可逆圧縮、可逆圧縮、または無圧縮なフォーマットの音声データである音声情報111と、動画又は静止画を再生表示するための資料画像情報112と、音声情報111の再生時刻と資料画像情報112の再生時刻とを同期するための同期情報113とを記憶する。
【0027】
図2は、同期情報113の一例を示す概略図である。
【0028】
同期情報113は、音声情報111の再生時刻が示される音声再生時刻欄113aと、音声情報111の再生時刻において再生される資料画像情報の識別子である資料画像情報IDが記録される資料画像情報ID欄113bとを有する。
【0029】
つまり、音声再生時刻欄113aに示す音声情報111の再生時刻に対応する資料画像情報ID欄113bに対応する資料画像情報112が再生される。
【0030】
(画像表示装置の動作)
以下に、画像表示装置1の動作例を図1〜図5を参照しつつ、(1)基本動作、(2)資料画像分割動作、(3)類似度計算動作及び(4)倍率変更動作に分けて説明する。
【0031】
(1)基本動作
まず、視聴者は、画像表示装置1の操作部14を操作して、音声情報111の再生を指示する。操作部14は、音声情報111の再生を指示する操作信号を制御部10に出力する。
【0032】
画像表示装置1の制御部10が操作部14から操作信号を受け付けると、音声情報再生手段100は、音声情報111を再生して音声信号を音声出力部13に出力する。また、資料画像情報再生手段101は、資料画像情報112を再生して資料画像信号を表示部12に出力する。
【0033】
なお、このとき同期手段102は、音声信号及び資料画像信号を同期情報113に基づいて同期させるべく、音声情報再生手段100及び資料画像情報再生手段101に同期信号を送信する。
【0034】
図3は、画像表示装置1の映像再生動作の一例を示す概略図である。
【0035】
図3に示すように、音声出力部13から音声情報111を構成する各音声111a〜111dが出力され、表示部12には、図2に示す同期情報113に基づいて、それぞれ音声情報111の再生時刻「00:00:30」、「00:02:01」、「00:05:45」、「00:15:00」に資料112a〜112dが表示される。
【0036】
しかし、表示部12のサイズが小さい場合、資料112b〜112dは視聴者にとって読みづらく、視認性が悪い。そこで、以下に説明する動作によって音声111a〜111dに応じて資料112b〜112dの表示を拡大する。
【0037】
(2)資料画像分割動作
以下に説明する資料画像情報112の分割動作及び後述する「(3)類似度計算動作」は、音声情報111及び資料画像情報112の再生前に行うことが望ましいが、再生中に行うものであってもよい。
【0038】
図4A(a)及び(b)は、資料画像分割手段の動作の一例を説明するための図である。
【0039】
まず、資料画像分割手段103は、図4A(a)に示すように、資料112bを分割領域d00〜d33に分割する。ここで、分割数は、資料112bに含まれる文字数やフォントサイズ等に基づいて定めるものとする。例えば、資料112bに含まれる文字数が多ければ分割数を多く、また、文字サイズが小さければ分割数を多くすることで単一又は複数の分割領域について拡大して表示した場合の視認性を確保する。
【0040】
次に、資料画像分割手段103は、複数の分割領域d00〜d33から分割画像D00〜D22を生成する。ここで、各分割画像D00〜D22は、隣り合う画像が互いに重複するような分割領域によって構成される。例えば、分割画像D00とD10は、分割領域d10及びd11が重複し、分割画像D00とD01は、分割領域d01及びd11が重複する。このように分割画像D00〜D22を生成することで、各分割画像間で一つの意味を持つ単語が分断されづらくなる。
【0041】
(3)類似度計算動作
図4B(c)及び(d)は、類似度計算動作の一例を説明するための図である。
【0042】
次に、資料テキスト抽出手段104は、図4B(c)に示すように、OCR等によって分割画像D00〜D22のそれぞれに含まれるテキスト情報を抽出する。
【0043】
また、音声テキスト変換手段105は、図3に示す音声111bをテキスト情報「さて、7ステップの改善プロセスですが…」に変換する。この変換動作は、例えば、音声のセンテンス毎に行う。
【0044】
次に、類似度計算手段106は、資料テキスト抽出手段104が抽出した各分割画像D00〜D22のテキスト情報と、音声テキスト変換手段105が変換したテキスト情報との類似度を計算し、各分割画像D00〜D22について図4B(d)に示す類似度計算結果106aを得る。この類似度計算動作も、例えば、音声のセンテンス毎に行う。
【0045】
(4)倍率変更動作
図5は、画像表示装置の倍率変更された映像再生動作の一例を示す概略図である。
【0046】
次に、表示倍率変更手段107は、図5に示すように、類似度計算結果106aに基づいて、表示部12に表示する資料112bを類似度が最も大きい分割画像D10に拡大して拡大表示107bとして表示する。また、他の資料112c、112dについても上記した動作を実行して拡大表示107c、107dとして表示する。
【0047】
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、上記実施の形態では、音声情報の内容に基づいて資料画像情報の表示の拡大又は縮小を行ったが、映像情報の内容に基づいて資料画像情報の表示の拡大縮小を行ってもよい。また、表示の拡大又は縮小に限らず、表示の変形、回転、ハイライト表示、色調の変更等を行っても良い。
【0048】
また、資料画像分割手段103が資料画像情報112を分割した後に資料テキスト抽出手段104がテキスト情報を抽出したが、資料テキスト抽出手段104が分割前の資料画像情報112からテキストを抽出した後に資料画像分割手段103が分割画像に分割してもよい。
【0049】
また、上記画像表示プログラム110をCD−ROM等の記憶媒体に格納して提供することも可能であり、インターネット等のネットワークに接続されているサーバ装置等から装置内の記憶部にダウンロードしてもよい。また、音声情報再生手段100、資料画像情報再生手段101、同期手段102、資料画像分割手段103、資料テキスト抽出手段104、音声テキスト変換手段105、類似度計算手段106及び表示倍率変更手段107の一部又は全部をASIC等のハードウエアによって実現してもよい。なお、上記実施の形態の動作説明で示した各ステップは、順序の変更、ステップの省略、追加が可能である。
【0050】
上記実施の形態では制御部10内の各手段100〜107の機能をプログラムで実現したが、各手段100〜107の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
【符号の説明】
【0051】
1 画像表示装置
10 制御部
11 記憶部
12 表示部
13 音声出力部
14 操作部
100 音声情報再生手段
101 資料画像情報再生手段
102 同期手段
103 資料画像分割手段
104 資料テキスト抽出手段
105 音声テキスト変換手段
106 類似度計算手段
106a 類似度計算結果
107 表示倍率変更手段
107b−107d 拡大表示
110 画像表示プログラム
111 音声情報
112 資料画像情報
112a−112c 資料
113 同期情報


【特許請求の範囲】
【請求項1】
コンピュータを、
音声情報を再生する音声情報再生手段と、
前記音声情報の再生時刻に同期して資料画像情報を再生する資料画像情報再生手段と、
前記資料画像情報を複数の分割画像情報に分割する分割手段と、
前記分割手段が分割した前記複数の分割画像情報からそれぞれ第1の文字情報を抽出する抽出手段と、
前記音声情報を第2の文字情報に変換する変換手段と、
前記第1の文字情報と前記第2の文字情報との類似度を計算する計算手段と、
前記計算手段が算出した前記類似度に基づいて、前記資料画像情報再生手段が再生した前記資料画像情報の表示倍率を、前記分割画像情報に対応した領域に合わせて変更する表示倍率変更手段として機能させるための画像表示プログラム。
【請求項2】
前記分割手段は、領域の隣り合う前記分割画像情報において互いに領域が一部重複するように前記資料画像情報を分割する請求項1に記載の画像表示プログラム。
【請求項3】
前記分割手段は、前記第1の文字情報の文字の大きさ、文字数及び書体の少なくともいずれかに基づいて前記分割画像情報の大きさを決定する請求項1に記載の画像表示プログラム。
【請求項4】
音声情報を再生する音声情報再生手段と、
前記音声情報の再生時刻に同期して資料画像情報を再生する資料画像情報再生手段と、
前記資料画像情報を複数の分割画像情報に分割する分割手段と、
前記分割手段が分割した前記複数の分割画像情報からそれぞれ第1の文字情報を抽出する抽出手段と、
前記音声情報を第2の文字情報に変換する変換手段と、
前記第1の文字情報と前記第2の文字情報との類似度を計算する計算手段と、
前記計算手段が算出した前記類似度に基づいて、前記資料画像情報再生手段が再生した前記資料画像情報の表示倍率を、前記分割画像情報に対応した領域に合わせて変更する表示倍率変更手段を有する画像表示装置。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate


【公開番号】特開2013−68699(P2013−68699A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2011−205730(P2011−205730)
【出願日】平成23年9月21日(2011.9.21)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】