文字抽出装置、表示方法及び文字抽出方法
【課題】映像に含まれる文字画像に対して好適な抽出処理を実行できる文字抽出装置、表示方法及び文字抽出方法の提供。
【解決手段】本実施形態の文字抽出装置は、映像データを再生する再生手段と、再生手段により再生された映像データを表示装置に出力する出力手段と、映像データを用いて表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、表示装置が表示する映像の中の、外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、抽出手段により抽出された画像から文字を抽出する文字抽出手段とを備える。
【解決手段】本実施形態の文字抽出装置は、映像データを再生する再生手段と、再生手段により再生された映像データを表示装置に出力する出力手段と、映像データを用いて表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、表示装置が表示する映像の中の、外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、抽出手段により抽出された画像から文字を抽出する文字抽出手段とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、映像データ中から文字を抽出する文字抽出装置、表示方法及び文字抽出方法に関する。
【背景技術】
【0002】
テレビ放送番組の本編やコマーシャル等において、視聴者に対してインターネットでの検索を促す映像が表示される場合がある。ここで当該映像には、インターネットでの検索ページを模した検索ボタンや検索窓の画像が配置される。そして当該検索窓内に検索対象となる文字の画像を配置することにより、視聴者に対して当該文字の検索を促す。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−44658号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、ユーザが当該文字を用いて検索等の処理を実行する場合には、テレビ受信装置や表示装置等の装置が、映像中の文字画像から文字を抽出することにより、当該文字をユーザが覚えたり書き留めたりする手間を抑制できることが好ましい。そして、当該文字の抽出の際には、装置による文字抽出の処理を好適に実行できることが好ましい。
【0005】
そこで本発明の実施形態は、映像に含まれる文字画像に対して好適な抽出処理を実行できる文字抽出装置、表示方法及び文字抽出方法の提供を目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本実施形態の文字抽出装置は、映像データを再生する再生手段と、再生手段により再生された映像データを表示装置に出力する出力手段と、映像データを用いて表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、表示装置が表示する映像の中の、外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、抽出手段により抽出された画像から文字を抽出する文字抽出手段とを備える。
【図面の簡単な説明】
【0007】
【図1】第1実施形態に係る表示装置の利用形態例を示す図。
【図2】第1実施形態に係る表示装置のシステム構成例を示す図。
【図3】第1実施形態に係る表示装置が生成する抽出文字履歴データベースの構成例を示す図。
【図4】第1実施形態に係る表示装置による文字抽出処理例を示す図。
【図5】第1実施形態に係る表示装置が表示する画面の遷移例を示す図。
【図6】第1実施形態に係る表示装置による文字抽出処理の処理フロー例を示す図。
【図7】第2実施形態に係る表示装置及び情報端末の利用形態例を示す図。
【図8】第2実施形態に係る表示装置及び情報端末のシステム構成例。
【図9】第2実施形態に係る表示装置及び情報端末による文字抽出処理シーケンス例を示す図。
【図10】第3実施形態に係る表示装置及び情報端末が表示する画面の遷移例を示す図。
【図11】第3実施形態に係る表示装置及び情報端末による文字抽出処理シーケンス例を示す図。
【発明を実施するための形態】
【0008】
(第1実施形態)
以下、図面を参照して第1実施形態を説明する。本実施形態に係る文字抽出装置は、例えば表示装置100として実現される。ここで表示装置100は、テレビ放送等の映像データを受信し、当該受信した映像データに基づいた映像を表示部107に表示する機能を有する。また表示装置100は、ポインティングデバイス200等の操作装置からの操作信号を受け付け、当該操作信号に応じた処理を実行する。
【0009】
表示装置100は、表示部107に例えばCM映像の画面P20を表示する。当該画面P20では、CM映像に含まれる検索ボックス画像P11及び検索ボタン画像P12と、表示装置100が生成するカーソル画像P21等が表示される。なおカーソル画像P21の位置は、ポインティングデバイス200からの移動指示操作入力に応じて変化する。そして実施形態に係る表示装置100は、例えばポインティングデバイス200のボタン201又は202に対する操作入力を受けた場合に、カーソル画像P12が配置されている位置の一定範囲内から検索ボックス画像P11を検出して、当該画像P11に含まれる文字を抽出できるものであるが、詳細については図2乃至図6を参照して後述する。
【0010】
図2は表示装置100のシステム構成例を示す。表示装置100は、受信部101、記憶部102、録画再生制御部103、デコード部104、合成部105、信号処理部106、表示部107、操作受付部108、GUI処理部109、画像抽出部110、文字抽出部111、抽出文字データベース112、検索部113、通信部114等を備える。
【0011】
受信部101は、例えば衛星デジタルテレビ放送や地上波デジタルテレビ放送の映像データを受信する。ここで受信部101は、録画再生制御部103からの指示に応じたチャンネルの映像データを受信し、受信した映像データを録画再生制御部103に出力する。なお受信部101は、インターネット等のネットワークを介して配信されるIPTV等の映像データを受信しても良い。更に受信部101は、放送波に重畳された番組情報や、ネットワーク上のサーバに格納された番組情報を受信してもよい。これら番組情報には、例えば放送番組毎に、放送チャンネル、放送時間、番組タイトル名、出演者名、番組内容説明文等が対応付けられている。
【0012】
記憶部102は、録画再生制御部103から入力される映像データのストリームを記憶(録画)する機能を有する。また記憶部102は、録画再生制御部103から映像データの再生指示を受けた場合、記憶した映像データのうち当該指示に応じた映像データを録画再生制御部103に出力する。
【0013】
録画再生制御部103は、映像データの再生及び録画処理を制御する。再生処理において録画再生制御部103は、受信部101が受信する映像データ又は記憶部102に記憶された映像データをデコード部104にデコード(再生)させる。つまり、例えば操作受付部108がユーザから所定のチャンネルの放送番組の再生指示入力を受けた場合、録画再生制御部103は、受信部101に対して当該チャンネルの映像データの受信及び出力を指示する。なお録画再生制御部103は、当該再生の際に、再生中の映像データについての番組情報を文字抽出部111に出力する。
【0014】
また録画再生制御部103は、録画した映像データの再生指示入力を操作受付部108が受け付けた場合、当該再生指示に応じた映像データの出力を記憶部102に指示する。そしてこのとき録画再生制御部103は、操作受付部108が受け付けた操作入力に応じて、映像データの再生及び停止を制御する。
【0015】
また録画処理において録画再生制御部103は、受信部101が受信した映像データのストリームを記憶部102に出力し、当該映像データを記憶部102に記憶(録画)させる。
【0016】
デコード部104は、録画再生制御部103から入力された映像データのストリームをデコードし、当該デコードデータを合成部105及び画像抽出部110に出力する。
【0017】
合成部105は、デコード部104から入力された映像データと、GUI処理部109から入力されたGUIの映像データとを重畳し、当該重畳した映像データを信号処理部106に出力する。次に信号処理部106は、入力された映像データをディスプレイが表示可能な形式の映像信号に変換して、当該映像信号を表示部107に出力する。そして表示部107は、入力された映像信号を用いた映像を表示する。
【0018】
操作受付部108は、ポインティングデバイス200やリモートコントローラ等の操作装置からの操作入力信号を受信する。ここで操作受付部108は、例えばカーソル画像P21の位置を移動させる移動指示操作入力、文字の抽出を指示する抽出指示操作入力、録画した映像データの再生及び停止操作入力等を受信する。そして操作受付部108は、受信した操作入力をGUI処理部109や録画再生制御部103に出力する(録画再生制御部103への出力経路は不図示)。
【0019】
GUI処理部109は、表示装置100が表示するGUI(Graphical User Interface)の映像データの生成と、GUIに対するユーザからの操作入力の処理とを行う。ここでGUI処理部109は、例えばカーソル画像P21のデータを生成し、生成したデータを合成部105に出力する。そしてGUI処理部109は、操作受付部108から入力された移動指示操作入力に応じた位置にカーソル画像P21が配置されるように映像データを生成する。
【0020】
また、ここでGUI処理部109は、抽出指示操作入力を受けた場合、画像抽出部110に画像の抽出を指示する。なお抽出指示操作入力とは、例えばポインティングデバイス200のボタン201又は202に対する操作入力等である。
【0021】
画像抽出部110には、デコード部104から映像データが入力される。そして画像抽出部110は、入力された映像データに含まれる検索ボックス画像をGUI処理部109からの指示に応じて抽出する。更に画像抽出部110は、抽出した検索ボックス画像に含まれる文字画像を抽出し、当該抽出した文字画像を文字抽出部111に出力する。
【0022】
文字抽出部111は、入力された文字画像を解析して、当該文字画像に含まれる文字を検出・抽出する。つまり文字抽出部111は、文字画像から文字データ(テキストデータ)を生成する。そして文字抽出部111は、生成した文字データを抽出文字データベース112及び検索部113に出力する。また、ここで文字抽出部111には、録画再生制御部103から、再生中の映像データについての番組情報(チャンネル、放送時間、番組タイトル名、出演者名、番組内容説明文等)が入力される。そして文字抽出部111は、抽出した文字データと、当該文字データを抽出した映像データについての番組情報とを抽出文字データベース112及び検索部113に出力する。
【0023】
抽出文字データベース112は、文字抽出部111から入力された文字データと、当該文字データが抽出された映像データの番組情報とを対応付けて格納する。なお当該データベースについては図3を参照して後述する。
【0024】
検索部113は、文字抽出部111により抽出された文字データと、例えばインターネット上のサーバに格納された検索エンジンとを用いて検索を実行する。当該検索を実行する場合、検索部113はまずインターネットを利用するためのブラウザソフトウェアを起動する。続いて検索部113は、抽出された文字データに応じたデータを、通信部114を介して検索エンジンのURIに対して送信するようにブラウザソフトウェアを制御する。
【0025】
次に検索部113は、サーバから送信された検索結果に関するウェブページのデータを受信する。ここで検索部113は、受信したウェブページのデータに基づいた検索結果画面を、ブラウザソフトウェアを用いて構成する。そして検索部113は、構成された検索結果画面の映像データの生成をGUI処理部109に指示する。
【0026】
また検索部113は、文字抽出部111又は抽出文字データベース112から入力される文字データと当該文字データに関する番組情報とについての履歴を表示する履歴画面の生成をGUI処理部109に指示することもできる。
【0027】
図3は、抽出文字データベース112のデータ構成例を示す図である。当該データベース112は、抽出した文字B1に対して、当該文字の抽出日時B2及び当該文字を抽出した番組情報B3等を対応付けて格納している。なおここで番組情報B3とは、放送波に重畳される番組情報やネットワーク上の番組情報配信サーバが配信する番組情報等に基づいた情報であり、例えば番組の番組名、放送チャンネル、放送時間、出演者名及び番組内容説明等が含まれる。
【0028】
図4は表示装置100による文字抽出の処理例を示す。そして図4(A)は、表示装置100が映像データを再生している場合に表示部107が表示する画面例を示す図である。画面300は、コマーシャル映像等における一画面の例であり、当該画面300には、再生された映像データに基づいた検索ボックス画像P11と検索ボタン画像P12とが含まれる。
【0029】
ここで検索ボックス画像P11及び検索ボタン画像P12は、例えばインターネット上の検索ウェブページで表示される検索語入力ボックスの画像と検索実行ボタンの画像とを模した画像であり、検索ボックス画像P11は、検索ボタン画像P12の左隣に配置されている。また検索ボックス画像P11には、画面P10が含まれる映像データの製作者や配信者が、ユーザに検索して欲しいと考えている文字の画像が含まれる。
【0030】
ここで、操作受付部108が例えばポインティングデバイス200からの操作入力を受け付けると、表示部107は画面P10にカーソル画像P21を重畳した画面P20を表示する。なおカーソル画像P21の画面P20上での位置は、ポインティングデバイス200からの移動操作入力に応じて変化する。
【0031】
そして操作受付部108は、例えばポインティングデバイス200からのボタン操作入力等を受け付けると、GUI処理部109は画像抽出部110に画像の抽出を指示する。なおGUI処理部109は、当該指示の際に、画面P20におけるカーソル画像P21の位置(座標)についての情報を画像抽出部110に出力する。
【0032】
画像抽出部110は、画像抽出指示を受けると、デコード部104から入力されている映像データから例えば1のフレームを抽出する。そして画像抽出部110は、カーソル画像P21の位置情報に基づき、抽出フレームの映像から、当該カーソル画像P21の位置の一定距離内にある検索ボックス画像P11の画像を抽出する。つまり画像抽出部110は、例えばカーソル画像P21の先端A1の位置から上方向に距離L1、下方向に距離L2、左方向に距離L3の範囲A2内から、例えば画像の輝度変化が小さい平坦部と輝度変化が大きいエッジ部を判別し、略矩形のエッジ部を有する所定のサイズ(解像度)の画像を抽出する。
【0033】
ここで、前述のように、コマーシャル映像等において、検索ボックス画像P11は検索ボタン画像P12の近傍左方向に配置されることが多い。また検索ボックス画像の形状は、縦方向よりも横方向の長さが長い矩形形状であることが多い。更に検索ボックス画像は、ユーザにより視認できる所定範囲のサイズ(解像度)である場合が多い。このため、カーソル画像P21が検索ボタン画像P12に対応する位置にある場合に操作受付部108が当該画像P12の位置に対応する位置への操作入力を受け付け、画像抽出部110が当該検索ボタン画像P12の位置の一定範囲内から略矩形の所定サイズの画像を検出することにより、高い精度で検索ボックス画像P11を検出でき、当該検索ボックス画像P11に含まれる文字画像を検出・抽出できる。
【0034】
しかしながら、検索ボックス画像P11の形状は必ずしも矩形であるとは限らないため、画像抽出部110は、矩形形状の画像だけでなく例えばエッジ部が周状となっている画像や横長の画像等、所定の形状の画像を抽出してもよい。なおここでは、画像抽出部110は、検索ボックス画像P11に重なる位置又は当該画像P11の近傍の位置に対する操作を受け付けた場合に、当該検索ボックス画像P11を検出・抽出しても良い。そしてこの場合にも画像抽出部110は、操作を受けた位置から所定範囲内にある所定の形状の画像を検出することにより、検索ボックス画像P11を検出できる。
【0035】
そして画像抽出部110は、図4(C)に示すような検索ボックス画像P11を抽出すると、図4(D)に示すように、当該抽出画像に含まれる文字列の画像P30及びP40を抽出する。そして文字抽出部111は、画像P30及び画像P40に含まれる文字T1及びT2を抽出する。
【0036】
図5は、表示装置100が抽出した文字を用いて検索を実行する際に表示する画面の遷移例を示す図である。
まず表示装置100は、図5(A)に示す画面P20を表示する。当該画面P20には受信部101が受信した映像又は記憶部102に格納された映像に基づいて検索ボックス画像P11及び検索ボタン画像P12が配置され、またユーザからの操作入力に応じてカーソル画像P21が配置される。ここで操作受付部108が、例えばポインティングデバイス200からのボタン操作入力等を受け付けると、画像抽出部110及び文字抽出部111により、検索ボックス画像P11に含まれる文字画像が文字データに変換される。そして検索部113は、当該文字データを用いて検索を実行する。そして表示装置100は、検索結果の情報を取得すると、図5(B)に示す画面P50を表示する。
【0037】
そして図5(B)は、表示装置100が検索結果を表示する場合の画面構成例である。画面P50には、再生映像P60、検索結果映像P70、履歴映像P80等が表示される。再生映像P60は、デコード部104がデコード(再生)している映像データの映像、つまり受信部101が受信している映像データ又は記憶部102に記憶されている映像データの映像である。
【0038】
検索結果映像P70は、例えばブラウザソフトウェアのウィンドウ等であり、当該映像P70には、インターネットサーバから取得した検索結果として、例えば検索されたウェブページP71等が表示される。履歴映像P80は、抽出文字データベース112に格納された情報に基づいた映像であり、文字抽出部111が抽出した文字P81に対して、当該文字の抽出時間P82、番組情報P83等が対応付けられて表示される。
【0039】
なお、検索結果を表示する場合の画面構成例はこれに限るものではなく、例えば画面P20においてユーザからの抽出指示操作入力を受けた場合に、検索結果映像P70を表示部107の表示画面の全画面に表示しても良い。
【0040】
図6は、表示装置100による文字抽出に係る処理フロー例を示す図である。
まず表示装置100は、映像データを再生して再生映像を表示部107に出力する(S301)。ここで画像抽出部110は、ユーザからの抽出操作入力を受けると(S302のYes)、再生映像のうち、カーソル画像P21が表示されている位置の周辺の一定範囲内から検索ボックス画像P11を検出及び抽出する(S303)。続いて画像抽出部110は、抽出した検索ボックス画像P11に含まれる文字画像を抽出する(S304)。そして文字抽出部111は、文字画像を解析して文字データに変換し(S305)、当該文字データを抽出文字データベース112に格納する(S306)。
【0041】
そして検索部113は、抽出した文字データを用いてインターネットでの検索を実行し(S307)、当該検索の結果を受信すると検索結果画面を表示部107に表示させる(S308)。なお当該処理フローにおいて、表示装置100は文字を抽出した場合に当該抽出文字を用いて検索を実行しているが、検索を実行するタイミングはこれに限るものではない。例えばS306で抽出文字を格納した後にユーザから検索を指示する操作入力を受けた場合に検索を実行してもよい。
【0042】
なお表示装置100は、S302にて抽出操作入力を受ける前に、ユーザから映像再生の停止指示操作入力を受けてもよい。そしてこの場合に表示装置100は、一時停止した映像を表示部107に表示し、停止映像に対するユーザからの抽出操作入力を受ける。また表示装置100は、受信部101が受信中の映像データを再生している場合において当該停止指示操作を受けた場合には、映像の再生を一時停止するとともに映像データの録画を開始し、抽出操作入力を受けた後に当該録画映像の再生を開始できる。
【0043】
また、本実施形態において、表示装置100は、例えばポインティングデバイス200やリモートコントローラからの操作入力を受け付けるとして説明したが、表示装置100はスマートフォンやPC等の情報端末からの操作入力を受け付けても良い。この場合、情報端末は表示装置100に対して無線/有線LAN等のネットワークで接続され、当該情報端末に入力された操作入力をネットワーク経由で表示装置100に送信する。そして表示装置100は、入力された操作入力に応じた処理を実行する。
【0044】
(第2実施形態)
次に図7及び図8を参照して第2実施形態を説明する。図7(A)は本実施形態に係る表示装置100bと情報端末300の利用形態例を示す図である。ここで、表示装置100bは情報端末300と無線/有線LAN等のネットワークで接続される。情報端末300は、表示部309の表示画面上にタッチスクリーンが設けられており、ユーザからの操作入力を受け付ける。そして情報端末300は、当該表示画面上に対するユーザのタッチ操作入力を受け付け、受け付けたタッチ操作入力をネットワーク経由で表示装置100bに送信する。
【0045】
表示装置100bは第1実施形態における表示装置100と同様に、表示部107bに画面P20を表示する。画面P20には、検索ボックス画像P11、検索ボタン画像P12及びカーソル画像P21等が表示される。カーソル画像P21の位置は、ポインティングデバイス200や情報端末300からの移動指示操作入力に応じて変化する。そして本実施形態に係る表示装置100bは、ポインティングデバイス200や情報端末300から抽出指示操作入力を受けた場合に、カーソル画像P12が配置されている位置の一定範囲内から検索ボックス画像P11を検出して、当該画像P11に含まれる文字を抽出できる。そして情報端末300は、当該抽出された文字を用いたインターネット検索を実行し、当該検索の結果を表示できる。
【0046】
図7(B)及び(C)は、情報端末300が表示する表示画面例である。画面P90には、枠画像P91、シークバー画像P92、停止ボタン画像P93、再生ボタン画像P94等が表示される。ここで枠画像P91は、表示装置100bが表示するカーソル画像P21に対する操作入力を受けるための領域である。そして情報端末300は、当該画像P91内の領域に対するタッチ操作に応じた指示を表示装置100bに送信することにより、表示装置100bに対するタッチパッドとして機能する。つまり情報端末300は、画像P91内の領域に対するタッチ操作に応じて、カーソル画像P21の位置を移動させる移動指示、及び文字の抽出を指示する抽出指示を表示装置100bに出力する。
【0047】
シークバー画像P92、停止ボタン画像P93及び再生ボタン画像P94は、表示装置100bが録画映像を再生している場合に、映像の再生位置、再生停止及び再生開始を指示するための画像である。情報端末300は、これらボタンに対するユーザのタッチ操作に応じた指示を表示装置100bに送信する。また画面P100は、検索結果を表示する画面であり、検索に応じてインターネット上のサーバから受信したウェブページの情報を表示する。なお図7には図示しないが、情報端末300は、表示装置100bが表示する放送番組の映像に関して、表示番組のチャンネル変更を指示するための画像を表示してもよい。
【0048】
図8は第2実施形態に係る表示装置100b及び情報端末300のシステム構成例を示す図である。ここで表示装置100bと情報端末300とは、無線又は有線のネットワーク400により接続されている。
【0049】
まず表示装置100bを説明する。表示装置100bは、受信部101b、記憶部102b、録画再生制御部103b、デコード部104b、合成部105b、信号処理部106b、表示部107b、操作受付部108b、GUI処理部109b、画像抽出部110b、文字抽出部111b、抽出文字データベース112b、検索部113b、通信部114b等を備える。なお表示装置100bの各構成は第1実施形態と同様の機能を有するため、ここでは第1実施形態と異なる機能を中心に説明する。
【0050】
GUI処理部109bは、抽出指示操作入力を受けた場合、画像抽出部110に画像の抽出を指示する。なおGUI処理部109は、抽出指示操作入力を受けた際のカーソル画像の位置情報を画像抽出部110bに出力する。
【0051】
画像抽出部110bは、デコード部104bから入力された映像データから、抽出指示操作入力に応じたフレーム画像を抽出する。そして画像抽出部110bは、カーソル画像の位置情報に基づき、抽出フレーム画像において当該カーソル画像の位置の一定距離内にある検索ボックス画像の画像を抽出する。さらに画像抽出部110bは当該検索ボックス画像に含まれる文字画像を抽出する。そして画像抽出部110bは、当該抽出した文字画像を、文字抽出部111又は情報端末300の通信部301に出力する。
【0052】
文字抽出部111bは、入力された文字画像から文字データ(テキストデータ)を生成する。また、ここで文字抽出部111bには、録画再生制御部103bから、再生中の映像データについての番組情報が入力される。そして文字抽出部111bは、抽出した文字データと、当該文字データを抽出した映像データについての番組情報とを抽出文字データベース112b又は情報端末300の通信部301に出力する。
【0053】
抽出文字データベース112bは、文字抽出部111bから入力された文字データと番組情報とを対応付けて格納する。検索部113bは、文字抽出部111bにより抽出された文字データを用いて検索を実行する。
【0054】
通信部114bは、情報端末300から、カーソル画像P21の位置を移動させる移動指示操作入力、文字の抽出を指示する抽出指示操作入力、録画した映像データの再生及び停止操作入力等を受けた場合、これらの操作入力を操作受付部108bに出力する。そして操作受付部108bは、受信した操作入力をGUI処理部109bや録画再生制御部103bに出力する。また通信部114bは、画像抽出部110bが抽出したフレーム画像、検索ボックス画像、文字画像、及び文字抽出部111bが抽出した文字データのうち何れかを情報端末300の通信部301に送信する機能も有する。なお通信部114bは、画像抽出部110bが抽出したフレーム画像を通信部301に送信する場合、カーソル画像の位置情報も合わせて送信する。
【0055】
次に情報端末300のシステム構成例を説明する。情報端末300は、通信部301、画像抽出部302、文字抽出部303、検索部304、GUI処理部305、信号処理部306、表示部307、操作受付部308等を備える。
【0056】
通信部301は、GUI処理部305から、表示装置100bに表示されたカーソル画像P21の位置の移動を指示する移動指示操作入力、文字の抽出を指示する抽出指示操作入力、表示装置100bが録画した映像データの再生及び停止を指示する操作入力等が入力されると、当該操作入力をネットワーク400経由で表示装置100bの通信部114bに送信する。
【0057】
また通信部301は、表示装置100bから、フレーム画像及び検索ボックス画像の何れかが入力されると、当該画像を画像抽出部302に出力する。なお通信部301はカーソル画像の位置情報が入力された場合にも当該情報を画像抽出部302に出力する。また通信部301は、表示装置100bから文字画像が入力されると当該文字画像を文字抽出部303に、文字データが入力されると当該文字データを検索部304に出力する。
【0058】
画像抽出部302は、通信部301からフレーム画像とカーソル位置情報とが入力されると、フレーム画像の中のカーソル位置情報が示す位置の一定の範囲内から検索ボックス画像を検出・抽出する。また画像抽出部302は、通信部301から検索ボックス画像が入力された場合又は画像抽出部302が検索ボックス画像を抽出した場合、当該検索ボックス画像に含まれる文字画像を抽出し、当該文字画像を文字抽出部303に出力する。
【0059】
文字抽出部303は、通信部301又は画像抽出部302から文字画像が入力されると、当該文字画像に含まれる文字を検出して文字データを生成し、検索部304に出力する。
【0060】
検索部304は、通信部301又は文字抽出部303から文字データが入力されると、当該文字データを用いたインターネット検索を実行して、インターネット上のサーバから検索結果を取得する。そして検索部304は、検索結果表示画面の生成をGUI処理部305に指示する。
【0061】
GUI処理部305は、図7(B)及び(C)で示した画面P90及びP100の映像データを生成する。またGUI処理部305には、表示部307の画面に対する操作入力の位置情報が操作受付部308から入力される。ここでGUI処理部305は、当該位置情報に応じて、表示画面の何れの画像に対する操作を受けたかを判別し、操作を受けた画像に応じた指示の送信を通信部301に指示する。
【0062】
そして信号処理部306は映像データを表示装置用の映像信号に変換し、表示部307は当該映像信号を用いて映像を出力する。
操作受付部308は、例えば表示部307の画面上に設けられたタッチパネル等であり、ユーザからの操作入力を受け付ける。そして操作受付部308は、操作を受けた画面の位置(座標)についての情報をGUI処理部305に出力する。
【0063】
次に図9を参照して、表示装置100b及び情報端末300による処理シーケンス例を説明する。まず表示装置100bは、画面P20の映像を出力する(S501)。ここで表示装置100bは、ポインティングデバイス200又は情報端末300からの抽出指示を受けると(S502のYes)、再生中の映像データのフレームを抽出する(S503)。そして表示装置100bは、抽出したフレームの、カーソル画像P21の位置情報に基づいた範囲内から検索ボックス画像を抽出する(S504)。
【0064】
続いて表示装置100bは、検索ボックス画像中の文字画像を抽出し、当該文字画像に含まれる文字を文字データとして検出する(S506)。次に表示装置100bは、検出・抽出した文字データを情報端末300に送信する(S507)。そして情報端末300は、受信した文字データを用いた検索を実行し(S508)、検索結果を示す画面を表示する(S509)。
【0065】
なお図9においては、表示装置100bは文字データを情報端末300に送信するとして説明したが、表示装置100bが情報端末300に送信するデータはこれに限るものではない。つまり表示装置100bは、S503にて抽出したフレーム画像を情報端末300に送信し、続くS504乃至S506の処理を情報端末300が処理してもよい。また表示装置100bは、S504にて抽出した検索ボックス画像を情報端末300に送信し、情報端末300がS505及びS506の処理を実行してもよい。更に表示装置100bはS505で抽出した文字画像を情報端末300に送信して、情報端末300がS506の処理を実行しても良い。
【0066】
(第3実施形態)
次に図10及び図11を参照して第3実施形態を説明する。第3実施形態は、第2実施形態に係る表示装置100b及び情報端末300により実現される。
図10は第3実施形態に係る表示装置100b及び情報端末300が表示する画面の遷移例を示す図である。まず情報端末300は画面P200を表示する。当該画面P200には、抽出指示ボタンP201等が表示される。ここで表示装置100bが画面P300を表示している場合に情報端末300が抽出指示ボタンP201への操作を受け付けると、情報端末300は表示装置100bに対して画面P300の抽出及び送信を指示する。そして表示装置100bは、画面300のフレーム画像を抽出して情報端末300に送信する。なお表示装置100bは、フレーム画像の抽出及び送信の際にも映像の再生及び表示を継続する。
【0067】
情報端末300は、フレーム画像を受信すると、画面P210に当該フレーム画像を表示し、ユーザからのタッチ操作入力を受け付ける。そして情報端末300は、当該画面P210に対する操作を受け付けると、画面P210の画像の中から当該操作を受けた位置の一定範囲内にある所定形状の画像を検出して、当該所定形状の画像内に含まれる文字を文字データとして抽出する。なおここで表示装置100bは映像の再生及び表示を継続しており、再生中の映像の画面P310を表示する。
【0068】
続いて情報端末300は、抽出した文字データに基づいた検索要求をインターネットサーバに送信し、当該要求に応じてインターネットサーバから受信した情報を画面P220に表示する。ここで表示装置100bは、前述の通り映像の再生及び表示を継続しており、再生中の映像の画面P320を表示する。
【0069】
次に図11を参照して表示装置100b及び情報端末300による処理シーケンス例を説明する。まず表示装置100bは映像の再生及び表示を行い(S601)、情報端末300は、図10に示した画面P200のような操作画面を表示する(S602)。ここで情報端末300が抽出指示ボタンP201への操作を受け付けると(S603のYes)、情報端末300は表示装置100bにフレーム抽出指示を送信する(S604)。続いて表示装置100bは、フレーム抽出指示を受けると、再生中の映像のフレーム画像を抽出して(S605)情報端末300に送信する(S607)。
【0070】
そして情報端末300は、受信したフレーム画像を表示し(S607)、当該表示画像に対する操作入力を受けた場合(S608のYes)、表示画像のうち当該操作入力に対応する位置の一定範囲内にある所定の形状の画像を抽出する(S609)。次に情報端末300は、当該所定形状の画像から文字画像を抽出し(S610)、当該文字画像に含まれる文字を文字データに変換する(S611)。そして情報端末300は、当該文字データを用いて検索を実行し(S612)、当該検索により得た情報を表示する(S613)。
【0071】
なお図11においては、情報端末300がS609乃至S611の処理を実行するとして説明したが、これらの処理は表示装置100bが実行してもよい。この場合に情報端末300は、S608において表示画像に対する操作入力を受けた場合に、当該操作入力が表示画像の何れの位置に対応しているかを判別し、操作入力の位置情報を表示装置100bに送信する。そして表示装置100bは、S605で抽出したフレーム画像の中から、S609の処理と同様に、当該位置情報が示す位置の一定範囲内にある所定の形状の画像を抽出する。続いて表示装置100bは、文字画像及び文字データを抽出して、文字データを情報端末300に送信する。
【0072】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。例えば実施形態に係る文字抽出装置は、チューナを備え、ディスプレイに映像を出力する受信装置として実現されても良い。また、これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0073】
100…表示装置、101…受信部、102…記憶部、103…録画再生制御部、104…デコード部、105…合成部、106…信号処理部、107…表示部、108…操作受付部、109…GUI処理部、110…画像抽出部、111…文字抽出部、112…抽出文字データベース、113…検索部、114…通信部、200…ポインティングデバイス、300…情報端末、301…通信部、302…画像抽出部、303…文字抽出部、304…検索部、305…GUI処理部、306…信号処理部、307…表示部、308…操作受付部、400…ネットワーク
【技術分野】
【0001】
本発明の実施形態は、映像データ中から文字を抽出する文字抽出装置、表示方法及び文字抽出方法に関する。
【背景技術】
【0002】
テレビ放送番組の本編やコマーシャル等において、視聴者に対してインターネットでの検索を促す映像が表示される場合がある。ここで当該映像には、インターネットでの検索ページを模した検索ボタンや検索窓の画像が配置される。そして当該検索窓内に検索対象となる文字の画像を配置することにより、視聴者に対して当該文字の検索を促す。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−44658号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、ユーザが当該文字を用いて検索等の処理を実行する場合には、テレビ受信装置や表示装置等の装置が、映像中の文字画像から文字を抽出することにより、当該文字をユーザが覚えたり書き留めたりする手間を抑制できることが好ましい。そして、当該文字の抽出の際には、装置による文字抽出の処理を好適に実行できることが好ましい。
【0005】
そこで本発明の実施形態は、映像に含まれる文字画像に対して好適な抽出処理を実行できる文字抽出装置、表示方法及び文字抽出方法の提供を目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本実施形態の文字抽出装置は、映像データを再生する再生手段と、再生手段により再生された映像データを表示装置に出力する出力手段と、映像データを用いて表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、表示装置が表示する映像の中の、外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、抽出手段により抽出された画像から文字を抽出する文字抽出手段とを備える。
【図面の簡単な説明】
【0007】
【図1】第1実施形態に係る表示装置の利用形態例を示す図。
【図2】第1実施形態に係る表示装置のシステム構成例を示す図。
【図3】第1実施形態に係る表示装置が生成する抽出文字履歴データベースの構成例を示す図。
【図4】第1実施形態に係る表示装置による文字抽出処理例を示す図。
【図5】第1実施形態に係る表示装置が表示する画面の遷移例を示す図。
【図6】第1実施形態に係る表示装置による文字抽出処理の処理フロー例を示す図。
【図7】第2実施形態に係る表示装置及び情報端末の利用形態例を示す図。
【図8】第2実施形態に係る表示装置及び情報端末のシステム構成例。
【図9】第2実施形態に係る表示装置及び情報端末による文字抽出処理シーケンス例を示す図。
【図10】第3実施形態に係る表示装置及び情報端末が表示する画面の遷移例を示す図。
【図11】第3実施形態に係る表示装置及び情報端末による文字抽出処理シーケンス例を示す図。
【発明を実施するための形態】
【0008】
(第1実施形態)
以下、図面を参照して第1実施形態を説明する。本実施形態に係る文字抽出装置は、例えば表示装置100として実現される。ここで表示装置100は、テレビ放送等の映像データを受信し、当該受信した映像データに基づいた映像を表示部107に表示する機能を有する。また表示装置100は、ポインティングデバイス200等の操作装置からの操作信号を受け付け、当該操作信号に応じた処理を実行する。
【0009】
表示装置100は、表示部107に例えばCM映像の画面P20を表示する。当該画面P20では、CM映像に含まれる検索ボックス画像P11及び検索ボタン画像P12と、表示装置100が生成するカーソル画像P21等が表示される。なおカーソル画像P21の位置は、ポインティングデバイス200からの移動指示操作入力に応じて変化する。そして実施形態に係る表示装置100は、例えばポインティングデバイス200のボタン201又は202に対する操作入力を受けた場合に、カーソル画像P12が配置されている位置の一定範囲内から検索ボックス画像P11を検出して、当該画像P11に含まれる文字を抽出できるものであるが、詳細については図2乃至図6を参照して後述する。
【0010】
図2は表示装置100のシステム構成例を示す。表示装置100は、受信部101、記憶部102、録画再生制御部103、デコード部104、合成部105、信号処理部106、表示部107、操作受付部108、GUI処理部109、画像抽出部110、文字抽出部111、抽出文字データベース112、検索部113、通信部114等を備える。
【0011】
受信部101は、例えば衛星デジタルテレビ放送や地上波デジタルテレビ放送の映像データを受信する。ここで受信部101は、録画再生制御部103からの指示に応じたチャンネルの映像データを受信し、受信した映像データを録画再生制御部103に出力する。なお受信部101は、インターネット等のネットワークを介して配信されるIPTV等の映像データを受信しても良い。更に受信部101は、放送波に重畳された番組情報や、ネットワーク上のサーバに格納された番組情報を受信してもよい。これら番組情報には、例えば放送番組毎に、放送チャンネル、放送時間、番組タイトル名、出演者名、番組内容説明文等が対応付けられている。
【0012】
記憶部102は、録画再生制御部103から入力される映像データのストリームを記憶(録画)する機能を有する。また記憶部102は、録画再生制御部103から映像データの再生指示を受けた場合、記憶した映像データのうち当該指示に応じた映像データを録画再生制御部103に出力する。
【0013】
録画再生制御部103は、映像データの再生及び録画処理を制御する。再生処理において録画再生制御部103は、受信部101が受信する映像データ又は記憶部102に記憶された映像データをデコード部104にデコード(再生)させる。つまり、例えば操作受付部108がユーザから所定のチャンネルの放送番組の再生指示入力を受けた場合、録画再生制御部103は、受信部101に対して当該チャンネルの映像データの受信及び出力を指示する。なお録画再生制御部103は、当該再生の際に、再生中の映像データについての番組情報を文字抽出部111に出力する。
【0014】
また録画再生制御部103は、録画した映像データの再生指示入力を操作受付部108が受け付けた場合、当該再生指示に応じた映像データの出力を記憶部102に指示する。そしてこのとき録画再生制御部103は、操作受付部108が受け付けた操作入力に応じて、映像データの再生及び停止を制御する。
【0015】
また録画処理において録画再生制御部103は、受信部101が受信した映像データのストリームを記憶部102に出力し、当該映像データを記憶部102に記憶(録画)させる。
【0016】
デコード部104は、録画再生制御部103から入力された映像データのストリームをデコードし、当該デコードデータを合成部105及び画像抽出部110に出力する。
【0017】
合成部105は、デコード部104から入力された映像データと、GUI処理部109から入力されたGUIの映像データとを重畳し、当該重畳した映像データを信号処理部106に出力する。次に信号処理部106は、入力された映像データをディスプレイが表示可能な形式の映像信号に変換して、当該映像信号を表示部107に出力する。そして表示部107は、入力された映像信号を用いた映像を表示する。
【0018】
操作受付部108は、ポインティングデバイス200やリモートコントローラ等の操作装置からの操作入力信号を受信する。ここで操作受付部108は、例えばカーソル画像P21の位置を移動させる移動指示操作入力、文字の抽出を指示する抽出指示操作入力、録画した映像データの再生及び停止操作入力等を受信する。そして操作受付部108は、受信した操作入力をGUI処理部109や録画再生制御部103に出力する(録画再生制御部103への出力経路は不図示)。
【0019】
GUI処理部109は、表示装置100が表示するGUI(Graphical User Interface)の映像データの生成と、GUIに対するユーザからの操作入力の処理とを行う。ここでGUI処理部109は、例えばカーソル画像P21のデータを生成し、生成したデータを合成部105に出力する。そしてGUI処理部109は、操作受付部108から入力された移動指示操作入力に応じた位置にカーソル画像P21が配置されるように映像データを生成する。
【0020】
また、ここでGUI処理部109は、抽出指示操作入力を受けた場合、画像抽出部110に画像の抽出を指示する。なお抽出指示操作入力とは、例えばポインティングデバイス200のボタン201又は202に対する操作入力等である。
【0021】
画像抽出部110には、デコード部104から映像データが入力される。そして画像抽出部110は、入力された映像データに含まれる検索ボックス画像をGUI処理部109からの指示に応じて抽出する。更に画像抽出部110は、抽出した検索ボックス画像に含まれる文字画像を抽出し、当該抽出した文字画像を文字抽出部111に出力する。
【0022】
文字抽出部111は、入力された文字画像を解析して、当該文字画像に含まれる文字を検出・抽出する。つまり文字抽出部111は、文字画像から文字データ(テキストデータ)を生成する。そして文字抽出部111は、生成した文字データを抽出文字データベース112及び検索部113に出力する。また、ここで文字抽出部111には、録画再生制御部103から、再生中の映像データについての番組情報(チャンネル、放送時間、番組タイトル名、出演者名、番組内容説明文等)が入力される。そして文字抽出部111は、抽出した文字データと、当該文字データを抽出した映像データについての番組情報とを抽出文字データベース112及び検索部113に出力する。
【0023】
抽出文字データベース112は、文字抽出部111から入力された文字データと、当該文字データが抽出された映像データの番組情報とを対応付けて格納する。なお当該データベースについては図3を参照して後述する。
【0024】
検索部113は、文字抽出部111により抽出された文字データと、例えばインターネット上のサーバに格納された検索エンジンとを用いて検索を実行する。当該検索を実行する場合、検索部113はまずインターネットを利用するためのブラウザソフトウェアを起動する。続いて検索部113は、抽出された文字データに応じたデータを、通信部114を介して検索エンジンのURIに対して送信するようにブラウザソフトウェアを制御する。
【0025】
次に検索部113は、サーバから送信された検索結果に関するウェブページのデータを受信する。ここで検索部113は、受信したウェブページのデータに基づいた検索結果画面を、ブラウザソフトウェアを用いて構成する。そして検索部113は、構成された検索結果画面の映像データの生成をGUI処理部109に指示する。
【0026】
また検索部113は、文字抽出部111又は抽出文字データベース112から入力される文字データと当該文字データに関する番組情報とについての履歴を表示する履歴画面の生成をGUI処理部109に指示することもできる。
【0027】
図3は、抽出文字データベース112のデータ構成例を示す図である。当該データベース112は、抽出した文字B1に対して、当該文字の抽出日時B2及び当該文字を抽出した番組情報B3等を対応付けて格納している。なおここで番組情報B3とは、放送波に重畳される番組情報やネットワーク上の番組情報配信サーバが配信する番組情報等に基づいた情報であり、例えば番組の番組名、放送チャンネル、放送時間、出演者名及び番組内容説明等が含まれる。
【0028】
図4は表示装置100による文字抽出の処理例を示す。そして図4(A)は、表示装置100が映像データを再生している場合に表示部107が表示する画面例を示す図である。画面300は、コマーシャル映像等における一画面の例であり、当該画面300には、再生された映像データに基づいた検索ボックス画像P11と検索ボタン画像P12とが含まれる。
【0029】
ここで検索ボックス画像P11及び検索ボタン画像P12は、例えばインターネット上の検索ウェブページで表示される検索語入力ボックスの画像と検索実行ボタンの画像とを模した画像であり、検索ボックス画像P11は、検索ボタン画像P12の左隣に配置されている。また検索ボックス画像P11には、画面P10が含まれる映像データの製作者や配信者が、ユーザに検索して欲しいと考えている文字の画像が含まれる。
【0030】
ここで、操作受付部108が例えばポインティングデバイス200からの操作入力を受け付けると、表示部107は画面P10にカーソル画像P21を重畳した画面P20を表示する。なおカーソル画像P21の画面P20上での位置は、ポインティングデバイス200からの移動操作入力に応じて変化する。
【0031】
そして操作受付部108は、例えばポインティングデバイス200からのボタン操作入力等を受け付けると、GUI処理部109は画像抽出部110に画像の抽出を指示する。なおGUI処理部109は、当該指示の際に、画面P20におけるカーソル画像P21の位置(座標)についての情報を画像抽出部110に出力する。
【0032】
画像抽出部110は、画像抽出指示を受けると、デコード部104から入力されている映像データから例えば1のフレームを抽出する。そして画像抽出部110は、カーソル画像P21の位置情報に基づき、抽出フレームの映像から、当該カーソル画像P21の位置の一定距離内にある検索ボックス画像P11の画像を抽出する。つまり画像抽出部110は、例えばカーソル画像P21の先端A1の位置から上方向に距離L1、下方向に距離L2、左方向に距離L3の範囲A2内から、例えば画像の輝度変化が小さい平坦部と輝度変化が大きいエッジ部を判別し、略矩形のエッジ部を有する所定のサイズ(解像度)の画像を抽出する。
【0033】
ここで、前述のように、コマーシャル映像等において、検索ボックス画像P11は検索ボタン画像P12の近傍左方向に配置されることが多い。また検索ボックス画像の形状は、縦方向よりも横方向の長さが長い矩形形状であることが多い。更に検索ボックス画像は、ユーザにより視認できる所定範囲のサイズ(解像度)である場合が多い。このため、カーソル画像P21が検索ボタン画像P12に対応する位置にある場合に操作受付部108が当該画像P12の位置に対応する位置への操作入力を受け付け、画像抽出部110が当該検索ボタン画像P12の位置の一定範囲内から略矩形の所定サイズの画像を検出することにより、高い精度で検索ボックス画像P11を検出でき、当該検索ボックス画像P11に含まれる文字画像を検出・抽出できる。
【0034】
しかしながら、検索ボックス画像P11の形状は必ずしも矩形であるとは限らないため、画像抽出部110は、矩形形状の画像だけでなく例えばエッジ部が周状となっている画像や横長の画像等、所定の形状の画像を抽出してもよい。なおここでは、画像抽出部110は、検索ボックス画像P11に重なる位置又は当該画像P11の近傍の位置に対する操作を受け付けた場合に、当該検索ボックス画像P11を検出・抽出しても良い。そしてこの場合にも画像抽出部110は、操作を受けた位置から所定範囲内にある所定の形状の画像を検出することにより、検索ボックス画像P11を検出できる。
【0035】
そして画像抽出部110は、図4(C)に示すような検索ボックス画像P11を抽出すると、図4(D)に示すように、当該抽出画像に含まれる文字列の画像P30及びP40を抽出する。そして文字抽出部111は、画像P30及び画像P40に含まれる文字T1及びT2を抽出する。
【0036】
図5は、表示装置100が抽出した文字を用いて検索を実行する際に表示する画面の遷移例を示す図である。
まず表示装置100は、図5(A)に示す画面P20を表示する。当該画面P20には受信部101が受信した映像又は記憶部102に格納された映像に基づいて検索ボックス画像P11及び検索ボタン画像P12が配置され、またユーザからの操作入力に応じてカーソル画像P21が配置される。ここで操作受付部108が、例えばポインティングデバイス200からのボタン操作入力等を受け付けると、画像抽出部110及び文字抽出部111により、検索ボックス画像P11に含まれる文字画像が文字データに変換される。そして検索部113は、当該文字データを用いて検索を実行する。そして表示装置100は、検索結果の情報を取得すると、図5(B)に示す画面P50を表示する。
【0037】
そして図5(B)は、表示装置100が検索結果を表示する場合の画面構成例である。画面P50には、再生映像P60、検索結果映像P70、履歴映像P80等が表示される。再生映像P60は、デコード部104がデコード(再生)している映像データの映像、つまり受信部101が受信している映像データ又は記憶部102に記憶されている映像データの映像である。
【0038】
検索結果映像P70は、例えばブラウザソフトウェアのウィンドウ等であり、当該映像P70には、インターネットサーバから取得した検索結果として、例えば検索されたウェブページP71等が表示される。履歴映像P80は、抽出文字データベース112に格納された情報に基づいた映像であり、文字抽出部111が抽出した文字P81に対して、当該文字の抽出時間P82、番組情報P83等が対応付けられて表示される。
【0039】
なお、検索結果を表示する場合の画面構成例はこれに限るものではなく、例えば画面P20においてユーザからの抽出指示操作入力を受けた場合に、検索結果映像P70を表示部107の表示画面の全画面に表示しても良い。
【0040】
図6は、表示装置100による文字抽出に係る処理フロー例を示す図である。
まず表示装置100は、映像データを再生して再生映像を表示部107に出力する(S301)。ここで画像抽出部110は、ユーザからの抽出操作入力を受けると(S302のYes)、再生映像のうち、カーソル画像P21が表示されている位置の周辺の一定範囲内から検索ボックス画像P11を検出及び抽出する(S303)。続いて画像抽出部110は、抽出した検索ボックス画像P11に含まれる文字画像を抽出する(S304)。そして文字抽出部111は、文字画像を解析して文字データに変換し(S305)、当該文字データを抽出文字データベース112に格納する(S306)。
【0041】
そして検索部113は、抽出した文字データを用いてインターネットでの検索を実行し(S307)、当該検索の結果を受信すると検索結果画面を表示部107に表示させる(S308)。なお当該処理フローにおいて、表示装置100は文字を抽出した場合に当該抽出文字を用いて検索を実行しているが、検索を実行するタイミングはこれに限るものではない。例えばS306で抽出文字を格納した後にユーザから検索を指示する操作入力を受けた場合に検索を実行してもよい。
【0042】
なお表示装置100は、S302にて抽出操作入力を受ける前に、ユーザから映像再生の停止指示操作入力を受けてもよい。そしてこの場合に表示装置100は、一時停止した映像を表示部107に表示し、停止映像に対するユーザからの抽出操作入力を受ける。また表示装置100は、受信部101が受信中の映像データを再生している場合において当該停止指示操作を受けた場合には、映像の再生を一時停止するとともに映像データの録画を開始し、抽出操作入力を受けた後に当該録画映像の再生を開始できる。
【0043】
また、本実施形態において、表示装置100は、例えばポインティングデバイス200やリモートコントローラからの操作入力を受け付けるとして説明したが、表示装置100はスマートフォンやPC等の情報端末からの操作入力を受け付けても良い。この場合、情報端末は表示装置100に対して無線/有線LAN等のネットワークで接続され、当該情報端末に入力された操作入力をネットワーク経由で表示装置100に送信する。そして表示装置100は、入力された操作入力に応じた処理を実行する。
【0044】
(第2実施形態)
次に図7及び図8を参照して第2実施形態を説明する。図7(A)は本実施形態に係る表示装置100bと情報端末300の利用形態例を示す図である。ここで、表示装置100bは情報端末300と無線/有線LAN等のネットワークで接続される。情報端末300は、表示部309の表示画面上にタッチスクリーンが設けられており、ユーザからの操作入力を受け付ける。そして情報端末300は、当該表示画面上に対するユーザのタッチ操作入力を受け付け、受け付けたタッチ操作入力をネットワーク経由で表示装置100bに送信する。
【0045】
表示装置100bは第1実施形態における表示装置100と同様に、表示部107bに画面P20を表示する。画面P20には、検索ボックス画像P11、検索ボタン画像P12及びカーソル画像P21等が表示される。カーソル画像P21の位置は、ポインティングデバイス200や情報端末300からの移動指示操作入力に応じて変化する。そして本実施形態に係る表示装置100bは、ポインティングデバイス200や情報端末300から抽出指示操作入力を受けた場合に、カーソル画像P12が配置されている位置の一定範囲内から検索ボックス画像P11を検出して、当該画像P11に含まれる文字を抽出できる。そして情報端末300は、当該抽出された文字を用いたインターネット検索を実行し、当該検索の結果を表示できる。
【0046】
図7(B)及び(C)は、情報端末300が表示する表示画面例である。画面P90には、枠画像P91、シークバー画像P92、停止ボタン画像P93、再生ボタン画像P94等が表示される。ここで枠画像P91は、表示装置100bが表示するカーソル画像P21に対する操作入力を受けるための領域である。そして情報端末300は、当該画像P91内の領域に対するタッチ操作に応じた指示を表示装置100bに送信することにより、表示装置100bに対するタッチパッドとして機能する。つまり情報端末300は、画像P91内の領域に対するタッチ操作に応じて、カーソル画像P21の位置を移動させる移動指示、及び文字の抽出を指示する抽出指示を表示装置100bに出力する。
【0047】
シークバー画像P92、停止ボタン画像P93及び再生ボタン画像P94は、表示装置100bが録画映像を再生している場合に、映像の再生位置、再生停止及び再生開始を指示するための画像である。情報端末300は、これらボタンに対するユーザのタッチ操作に応じた指示を表示装置100bに送信する。また画面P100は、検索結果を表示する画面であり、検索に応じてインターネット上のサーバから受信したウェブページの情報を表示する。なお図7には図示しないが、情報端末300は、表示装置100bが表示する放送番組の映像に関して、表示番組のチャンネル変更を指示するための画像を表示してもよい。
【0048】
図8は第2実施形態に係る表示装置100b及び情報端末300のシステム構成例を示す図である。ここで表示装置100bと情報端末300とは、無線又は有線のネットワーク400により接続されている。
【0049】
まず表示装置100bを説明する。表示装置100bは、受信部101b、記憶部102b、録画再生制御部103b、デコード部104b、合成部105b、信号処理部106b、表示部107b、操作受付部108b、GUI処理部109b、画像抽出部110b、文字抽出部111b、抽出文字データベース112b、検索部113b、通信部114b等を備える。なお表示装置100bの各構成は第1実施形態と同様の機能を有するため、ここでは第1実施形態と異なる機能を中心に説明する。
【0050】
GUI処理部109bは、抽出指示操作入力を受けた場合、画像抽出部110に画像の抽出を指示する。なおGUI処理部109は、抽出指示操作入力を受けた際のカーソル画像の位置情報を画像抽出部110bに出力する。
【0051】
画像抽出部110bは、デコード部104bから入力された映像データから、抽出指示操作入力に応じたフレーム画像を抽出する。そして画像抽出部110bは、カーソル画像の位置情報に基づき、抽出フレーム画像において当該カーソル画像の位置の一定距離内にある検索ボックス画像の画像を抽出する。さらに画像抽出部110bは当該検索ボックス画像に含まれる文字画像を抽出する。そして画像抽出部110bは、当該抽出した文字画像を、文字抽出部111又は情報端末300の通信部301に出力する。
【0052】
文字抽出部111bは、入力された文字画像から文字データ(テキストデータ)を生成する。また、ここで文字抽出部111bには、録画再生制御部103bから、再生中の映像データについての番組情報が入力される。そして文字抽出部111bは、抽出した文字データと、当該文字データを抽出した映像データについての番組情報とを抽出文字データベース112b又は情報端末300の通信部301に出力する。
【0053】
抽出文字データベース112bは、文字抽出部111bから入力された文字データと番組情報とを対応付けて格納する。検索部113bは、文字抽出部111bにより抽出された文字データを用いて検索を実行する。
【0054】
通信部114bは、情報端末300から、カーソル画像P21の位置を移動させる移動指示操作入力、文字の抽出を指示する抽出指示操作入力、録画した映像データの再生及び停止操作入力等を受けた場合、これらの操作入力を操作受付部108bに出力する。そして操作受付部108bは、受信した操作入力をGUI処理部109bや録画再生制御部103bに出力する。また通信部114bは、画像抽出部110bが抽出したフレーム画像、検索ボックス画像、文字画像、及び文字抽出部111bが抽出した文字データのうち何れかを情報端末300の通信部301に送信する機能も有する。なお通信部114bは、画像抽出部110bが抽出したフレーム画像を通信部301に送信する場合、カーソル画像の位置情報も合わせて送信する。
【0055】
次に情報端末300のシステム構成例を説明する。情報端末300は、通信部301、画像抽出部302、文字抽出部303、検索部304、GUI処理部305、信号処理部306、表示部307、操作受付部308等を備える。
【0056】
通信部301は、GUI処理部305から、表示装置100bに表示されたカーソル画像P21の位置の移動を指示する移動指示操作入力、文字の抽出を指示する抽出指示操作入力、表示装置100bが録画した映像データの再生及び停止を指示する操作入力等が入力されると、当該操作入力をネットワーク400経由で表示装置100bの通信部114bに送信する。
【0057】
また通信部301は、表示装置100bから、フレーム画像及び検索ボックス画像の何れかが入力されると、当該画像を画像抽出部302に出力する。なお通信部301はカーソル画像の位置情報が入力された場合にも当該情報を画像抽出部302に出力する。また通信部301は、表示装置100bから文字画像が入力されると当該文字画像を文字抽出部303に、文字データが入力されると当該文字データを検索部304に出力する。
【0058】
画像抽出部302は、通信部301からフレーム画像とカーソル位置情報とが入力されると、フレーム画像の中のカーソル位置情報が示す位置の一定の範囲内から検索ボックス画像を検出・抽出する。また画像抽出部302は、通信部301から検索ボックス画像が入力された場合又は画像抽出部302が検索ボックス画像を抽出した場合、当該検索ボックス画像に含まれる文字画像を抽出し、当該文字画像を文字抽出部303に出力する。
【0059】
文字抽出部303は、通信部301又は画像抽出部302から文字画像が入力されると、当該文字画像に含まれる文字を検出して文字データを生成し、検索部304に出力する。
【0060】
検索部304は、通信部301又は文字抽出部303から文字データが入力されると、当該文字データを用いたインターネット検索を実行して、インターネット上のサーバから検索結果を取得する。そして検索部304は、検索結果表示画面の生成をGUI処理部305に指示する。
【0061】
GUI処理部305は、図7(B)及び(C)で示した画面P90及びP100の映像データを生成する。またGUI処理部305には、表示部307の画面に対する操作入力の位置情報が操作受付部308から入力される。ここでGUI処理部305は、当該位置情報に応じて、表示画面の何れの画像に対する操作を受けたかを判別し、操作を受けた画像に応じた指示の送信を通信部301に指示する。
【0062】
そして信号処理部306は映像データを表示装置用の映像信号に変換し、表示部307は当該映像信号を用いて映像を出力する。
操作受付部308は、例えば表示部307の画面上に設けられたタッチパネル等であり、ユーザからの操作入力を受け付ける。そして操作受付部308は、操作を受けた画面の位置(座標)についての情報をGUI処理部305に出力する。
【0063】
次に図9を参照して、表示装置100b及び情報端末300による処理シーケンス例を説明する。まず表示装置100bは、画面P20の映像を出力する(S501)。ここで表示装置100bは、ポインティングデバイス200又は情報端末300からの抽出指示を受けると(S502のYes)、再生中の映像データのフレームを抽出する(S503)。そして表示装置100bは、抽出したフレームの、カーソル画像P21の位置情報に基づいた範囲内から検索ボックス画像を抽出する(S504)。
【0064】
続いて表示装置100bは、検索ボックス画像中の文字画像を抽出し、当該文字画像に含まれる文字を文字データとして検出する(S506)。次に表示装置100bは、検出・抽出した文字データを情報端末300に送信する(S507)。そして情報端末300は、受信した文字データを用いた検索を実行し(S508)、検索結果を示す画面を表示する(S509)。
【0065】
なお図9においては、表示装置100bは文字データを情報端末300に送信するとして説明したが、表示装置100bが情報端末300に送信するデータはこれに限るものではない。つまり表示装置100bは、S503にて抽出したフレーム画像を情報端末300に送信し、続くS504乃至S506の処理を情報端末300が処理してもよい。また表示装置100bは、S504にて抽出した検索ボックス画像を情報端末300に送信し、情報端末300がS505及びS506の処理を実行してもよい。更に表示装置100bはS505で抽出した文字画像を情報端末300に送信して、情報端末300がS506の処理を実行しても良い。
【0066】
(第3実施形態)
次に図10及び図11を参照して第3実施形態を説明する。第3実施形態は、第2実施形態に係る表示装置100b及び情報端末300により実現される。
図10は第3実施形態に係る表示装置100b及び情報端末300が表示する画面の遷移例を示す図である。まず情報端末300は画面P200を表示する。当該画面P200には、抽出指示ボタンP201等が表示される。ここで表示装置100bが画面P300を表示している場合に情報端末300が抽出指示ボタンP201への操作を受け付けると、情報端末300は表示装置100bに対して画面P300の抽出及び送信を指示する。そして表示装置100bは、画面300のフレーム画像を抽出して情報端末300に送信する。なお表示装置100bは、フレーム画像の抽出及び送信の際にも映像の再生及び表示を継続する。
【0067】
情報端末300は、フレーム画像を受信すると、画面P210に当該フレーム画像を表示し、ユーザからのタッチ操作入力を受け付ける。そして情報端末300は、当該画面P210に対する操作を受け付けると、画面P210の画像の中から当該操作を受けた位置の一定範囲内にある所定形状の画像を検出して、当該所定形状の画像内に含まれる文字を文字データとして抽出する。なおここで表示装置100bは映像の再生及び表示を継続しており、再生中の映像の画面P310を表示する。
【0068】
続いて情報端末300は、抽出した文字データに基づいた検索要求をインターネットサーバに送信し、当該要求に応じてインターネットサーバから受信した情報を画面P220に表示する。ここで表示装置100bは、前述の通り映像の再生及び表示を継続しており、再生中の映像の画面P320を表示する。
【0069】
次に図11を参照して表示装置100b及び情報端末300による処理シーケンス例を説明する。まず表示装置100bは映像の再生及び表示を行い(S601)、情報端末300は、図10に示した画面P200のような操作画面を表示する(S602)。ここで情報端末300が抽出指示ボタンP201への操作を受け付けると(S603のYes)、情報端末300は表示装置100bにフレーム抽出指示を送信する(S604)。続いて表示装置100bは、フレーム抽出指示を受けると、再生中の映像のフレーム画像を抽出して(S605)情報端末300に送信する(S607)。
【0070】
そして情報端末300は、受信したフレーム画像を表示し(S607)、当該表示画像に対する操作入力を受けた場合(S608のYes)、表示画像のうち当該操作入力に対応する位置の一定範囲内にある所定の形状の画像を抽出する(S609)。次に情報端末300は、当該所定形状の画像から文字画像を抽出し(S610)、当該文字画像に含まれる文字を文字データに変換する(S611)。そして情報端末300は、当該文字データを用いて検索を実行し(S612)、当該検索により得た情報を表示する(S613)。
【0071】
なお図11においては、情報端末300がS609乃至S611の処理を実行するとして説明したが、これらの処理は表示装置100bが実行してもよい。この場合に情報端末300は、S608において表示画像に対する操作入力を受けた場合に、当該操作入力が表示画像の何れの位置に対応しているかを判別し、操作入力の位置情報を表示装置100bに送信する。そして表示装置100bは、S605で抽出したフレーム画像の中から、S609の処理と同様に、当該位置情報が示す位置の一定範囲内にある所定の形状の画像を抽出する。続いて表示装置100bは、文字画像及び文字データを抽出して、文字データを情報端末300に送信する。
【0072】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。例えば実施形態に係る文字抽出装置は、チューナを備え、ディスプレイに映像を出力する受信装置として実現されても良い。また、これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0073】
100…表示装置、101…受信部、102…記憶部、103…録画再生制御部、104…デコード部、105…合成部、106…信号処理部、107…表示部、108…操作受付部、109…GUI処理部、110…画像抽出部、111…文字抽出部、112…抽出文字データベース、113…検索部、114…通信部、200…ポインティングデバイス、300…情報端末、301…通信部、302…画像抽出部、303…文字抽出部、304…検索部、305…GUI処理部、306…信号処理部、307…表示部、308…操作受付部、400…ネットワーク
【特許請求の範囲】
【請求項1】
映像データを再生する再生手段と、
前記再生手段により再生された前記映像データを表示装置に出力する出力手段と、
前記映像データを用いて前記表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、
前記表示装置が表示する前記映像の中の、前記外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、
前記抽出手段により抽出された前記画像から文字を抽出する文字抽出手段と
を備える文字抽出装置。
【請求項2】
前記画像抽出手段は、略矩形形状の前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項3】
前記画像抽出手段は、一定のサイズの前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項4】
前記画像抽出手段は、前記外部入力の位置から一定範囲内の左方向にある前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項5】
前記出力手段は、前記外部入力が対応する位置を示す画像の映像データと、前記再生された映像データとを前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項6】
前記抽出手段により抽出された前記文字を用いて検索を実行する検索手段を更に備え、
前記出力手段は、前記検索により得られた検索情報についての映像データを前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項7】
前記出力手段は、再生された前記映像データと前記検索情報についての映像データとを共に前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項8】
抽出された前記文字を記憶する文字記憶手段を更に備える、請求項1記載の文字抽出装置。
【請求項9】
前記出力手段は、前記文字記憶手段に記憶された1以上の前記文字を示す映像データを前記表示装置に出力する、請求項8記載の文字抽出装置。
【請求項10】
前記再生手段は、前記受付手段が前記外部入力とは異なる第2外部入力を受けた場合、前記映像データの再生を停止し、
前記受付手段は、前記映像データの再生が停止された後に前記外部入力を受け付ける、請求項1記載の文字抽出装置。
【請求項11】
放送番組の映像データを受信する受信手段と、
受信された前記映像データを記憶装置に記憶させる映像記憶手段とを更に備え、
前記再生手段は、受信された前記映像データを再生し、
前記映像記憶手段は、前記再生手段が前記映像データの再生を停止した場合に、受信されている前記映像データを前記記憶装置に記憶させる、請求項1記載の文字抽出装置。
【請求項12】
前記受付手段は、前記文字抽出装置にネットワークを経由して接続された外部装置からの前記外部入力を受け付ける、請求項1記載の文字抽出装置。
【請求項13】
情報処理装置である第1装置及び第2装置とを備え、前記第1装置と前記第2装置とがネットワークにより接続された表示システムにおける表示方法であって、
前記第1装置が、
映像データを再生することと、
再生された前記映像データを用いて映像を表示することと、
前記第1装置又は前記第2装置が、
表示された前記映像の何れかの位置に対応する外部入力を受け付けることと、
表示された前記映像の中の、前記外部入力に対応する位置から一定範囲内にある第1形状の画像を抽出することと、
抽出された前記第1形状の画像から文字を抽出することと、
抽出された文字を用いて検索を実行することと、
前記第2装置が、
前記検索により得られた情報を表示することと
を備える表示方法。
【請求項14】
前記第2装置が、前記外部入力を受け付けることと、
前記第1装置が、前記第2装置が前記第1外部入力を受け付けている際に、前記外部入力に対応する位置を示すカーソル画像を含まない前記映像を表示することと
を更に備える請求項12記載の表示方法。
【請求項15】
表示装置が表示する映像から文字を抽出する装置における文字抽出方法であって、
映像データを再生することと、
再生された前記映像データを前記表示装置に出力することと、
前記映像データを用いて前記表示装置が表示する前記映像の何れかの位置に対応する外部入力を受け付けることと、
前記表示装置が表示する前記映像の中の、前記外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出することと、
抽出された前記第1形状の画像から文字を抽出することと
を備える文字抽出方法。
【請求項1】
映像データを再生する再生手段と、
前記再生手段により再生された前記映像データを表示装置に出力する出力手段と、
前記映像データを用いて前記表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、
前記表示装置が表示する前記映像の中の、前記外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、
前記抽出手段により抽出された前記画像から文字を抽出する文字抽出手段と
を備える文字抽出装置。
【請求項2】
前記画像抽出手段は、略矩形形状の前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項3】
前記画像抽出手段は、一定のサイズの前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項4】
前記画像抽出手段は、前記外部入力の位置から一定範囲内の左方向にある前記画像を抽出する、請求項1記載の文字抽出装置。
【請求項5】
前記出力手段は、前記外部入力が対応する位置を示す画像の映像データと、前記再生された映像データとを前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項6】
前記抽出手段により抽出された前記文字を用いて検索を実行する検索手段を更に備え、
前記出力手段は、前記検索により得られた検索情報についての映像データを前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項7】
前記出力手段は、再生された前記映像データと前記検索情報についての映像データとを共に前記表示装置に出力する、請求項1記載の文字抽出装置。
【請求項8】
抽出された前記文字を記憶する文字記憶手段を更に備える、請求項1記載の文字抽出装置。
【請求項9】
前記出力手段は、前記文字記憶手段に記憶された1以上の前記文字を示す映像データを前記表示装置に出力する、請求項8記載の文字抽出装置。
【請求項10】
前記再生手段は、前記受付手段が前記外部入力とは異なる第2外部入力を受けた場合、前記映像データの再生を停止し、
前記受付手段は、前記映像データの再生が停止された後に前記外部入力を受け付ける、請求項1記載の文字抽出装置。
【請求項11】
放送番組の映像データを受信する受信手段と、
受信された前記映像データを記憶装置に記憶させる映像記憶手段とを更に備え、
前記再生手段は、受信された前記映像データを再生し、
前記映像記憶手段は、前記再生手段が前記映像データの再生を停止した場合に、受信されている前記映像データを前記記憶装置に記憶させる、請求項1記載の文字抽出装置。
【請求項12】
前記受付手段は、前記文字抽出装置にネットワークを経由して接続された外部装置からの前記外部入力を受け付ける、請求項1記載の文字抽出装置。
【請求項13】
情報処理装置である第1装置及び第2装置とを備え、前記第1装置と前記第2装置とがネットワークにより接続された表示システムにおける表示方法であって、
前記第1装置が、
映像データを再生することと、
再生された前記映像データを用いて映像を表示することと、
前記第1装置又は前記第2装置が、
表示された前記映像の何れかの位置に対応する外部入力を受け付けることと、
表示された前記映像の中の、前記外部入力に対応する位置から一定範囲内にある第1形状の画像を抽出することと、
抽出された前記第1形状の画像から文字を抽出することと、
抽出された文字を用いて検索を実行することと、
前記第2装置が、
前記検索により得られた情報を表示することと
を備える表示方法。
【請求項14】
前記第2装置が、前記外部入力を受け付けることと、
前記第1装置が、前記第2装置が前記第1外部入力を受け付けている際に、前記外部入力に対応する位置を示すカーソル画像を含まない前記映像を表示することと
を更に備える請求項12記載の表示方法。
【請求項15】
表示装置が表示する映像から文字を抽出する装置における文字抽出方法であって、
映像データを再生することと、
再生された前記映像データを前記表示装置に出力することと、
前記映像データを用いて前記表示装置が表示する前記映像の何れかの位置に対応する外部入力を受け付けることと、
前記表示装置が表示する前記映像の中の、前記外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出することと、
抽出された前記第1形状の画像から文字を抽出することと
を備える文字抽出方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2012−160023(P2012−160023A)
【公開日】平成24年8月23日(2012.8.23)
【国際特許分類】
【出願番号】特願2011−19243(P2011−19243)
【出願日】平成23年1月31日(2011.1.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成24年8月23日(2012.8.23)
【国際特許分類】
【出願日】平成23年1月31日(2011.1.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]