説明

画像処理装置

【課題】ユーザに対して好適な画像を提示する技術を提供する。
【解決手段】枠領域設定部122が、画像データのレイアウト構造を解析して区分けし、新聞画像に少なくとも1つの枠領域を設定する。文字画素サイズ特定部128は、枠領域に含まれる文字の画素サイズを特定する。拡大率設定部132は、ディスプレイサイズおよび解像度と、特定された文字の画素サイズにもとづいて、枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する。表示画像処理部170は、入力装置20より表示画像の変更要求信号を受け取ると、設定された拡大率に対応する解像度のタイル画像をメインメモリ60から読み出し、その拡大率に調整した表示画像を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像をディスプレイに表示する画像処理技術に関する。
【背景技術】
【0002】
ゲームプログラムを実行するだけでなく、動画を再生できる家庭用エンタテインメントシステムが提案されている。この家庭用エンタテインメントシステムでは、GPUがポリゴンを用いた三次元画像を生成する。
【特許文献1】米国特許第6563999号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来より、高精細な写真などのディジタル画像から生成された複数解像度のタイル画像を用いて、表示画像の拡大/縮小処理や、上下左右方向の移動処理を行う技術が提案されている。この画像処理技術では、原画像を複数段階に縮小して異なる解像度の画像を生成し、各階層の画像を一又は複数のタイル画像に分割して、原画像を階層構造で表現する。通常、最も解像度の低い画像は1つのタイル画像で構成され、最も解像度の高い原画像は、最も多い数のタイル画像で構成される。画像処理装置は、表示画像の拡大処理または縮小処理時に、使用しているタイル画像を、異なる階層のタイル画像に切り替えることで、拡大表示または縮小表示を迅速に行うようにしている。
【0004】
このような画像処理装置において、ユーザは、入力装置に設けられたボタンや、十字キーなどを操作することで、ディスプレイに表示される画像を自由に変更できる。たとえば表示画像が文字情報を含む新聞画像である場合、ユーザは、入力装置を使って新聞画像を上下左右方向に動かして読みたい記事をディスプレイに表示し、また記事画像を拡大/縮小して、記事画像の文字を読みやすい大きさに調整する。
【0005】
しかしながら、このような画像の調整操作は、ある程度の技術や慣れを必要とするため、意外に時間のかかる作業となる。そこで、ユーザの手を煩わせることなく、ディスプレイに表示する画像を調整できるような技術の登場が望まれる。
【0006】
そこで本発明は、ユーザに対して好適な画像を提示する技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のある態様は、画像をディスプレイに表示する画像処理装置に関する。この態様の画像処理装置は、異なる解像度ごとに少なくとも1つの圧縮したタイル画像を含む画像データを保持する記憶装置と、少なくとも1つの解像度の画像データに設定された枠領域に含まれる文字の画素サイズを特定する文字画素サイズ特定部と、ディスプレイに表示されている表示画像の変更要求信号を受け付ける受付部と、変更要求信号を受け付けると、特定された文字の画素サイズに応じた拡大率に対応する解像度のタイル画像を前記記憶装置から読み出して、その拡大率に調整した表示画像を生成する表示画像処理部とを備える。
【0008】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0009】
本発明によると、ユーザに対して好適な画像を提示する技術を提供することができる。
【発明を実施するための最良の形態】
【0010】
図1は、本発明の実施例にかかる画像処理システム1の使用環境を示す。画像処理システム1は、入力装置20と、画像処理ソフトウェアを実行する画像処理装置10と、画像処理装置10による処理結果を出力する表示装置12とを備える。表示装置12は、画像を出力するディスプレイおよび音声を出力するスピーカを備えたテレビであってよい。表示装置12は、画像処理装置10に有線ケーブルで接続されてよく、また無線LAN(Local Area Network)などにより無線接続されてもよい。なお画像処理装置10、入力装置20および表示装置12は、一体に形成されてもよく、たとえば画像処理機能を搭載した携帯端末装置として構成されてもよい。
【0011】
画像処理システム1において、画像処理装置10は、ルータ15を介してインターネットなどの外部のネットワーク16に接続する。ネットワーク16には、画像データを提供する提供サーバ18が接続されている。提供サーバ18は、たとえば新聞や雑誌などのスキャン画像を階層的に圧縮し、階層化した圧縮画像データを提供する。たとえば提供サーバ18は、新聞社や雑誌社などにより運営され、文字や写真などを含む画像データをユーザに提供する。画像処理装置10は、提供サーバ18との間で通信接続を確立することで、階層化された圧縮画像データをダウンロードして取得できる。
【0012】
画像処理装置10は、たとえばゲーム装置であってよく、画像処理用のアプリケーションプログラムをロードすることで画像処理機能を実現してもよい。なお画像処理装置10は、パーソナルコンピュータであってもよく、画像処理用のアプリケーションプログラムをロードすることで画像処理機能を実現してもよい。
【0013】
画像処理装置10は、ユーザから入力装置20に入力される要求に応じて、表示装置12のディスプレイに表示する画像の拡大/縮小処理や、上下左右方向への移動処理など、表示画像を変更する処理を行う。ユーザが、ディスプレイに表示された画像を見ながら入力装置20を操作すると、入力装置20が、表示画像の変更要求信号を画像処理装置10に送信する。
【0014】
画像処理装置10は、提供サーバ18から階層化された圧縮画像データを取得すると、少なくとも1つの解像度の画像データのレイアウト構造を解析して、一群の文字のまとまりを認識し、一群の文字を区画した枠領域を設定する。本実施例において原画像は新聞のスキャン画像であり、画像処理装置10は、新聞の1ページに含まれる記事を区分けして、1つの記事を包含する枠領域を設定する。枠領域は、矩形領域であってもよく、また矩形以外の多辺形領域であってもよい。枠領域には、1つの記事を構成する文字や写真が含まれる。設定された枠領域は、ユーザによる入力装置20のボタン操作で選択され、入力装置20のディスプレイに表示される。これによりユーザは、新聞画像をスクロールして位置合わせすることなく、記事を簡易にディスプレイに表示させることができる。
【0015】
また表示された枠領域は、入力装置20の入力操作により、複数段階の拡大率での表示が可能なように設定される。たとえば、あるボタンが1回押されると、枠領域が第1の拡大率で拡大表示され、同じまたは別のボタンがさらに1回押されると、枠領域が第1の拡大率よりも大きい第2の拡大率で拡大表示される。この拡大率は、最も低解像度の画像データを基準として定められるものとする。画像処理装置10が、枠領域ごとに複数段階の拡大率を予め好適に設定しておくことで、ユーザは、ボタンの押下操作のみで枠領域を段階的に拡大でき、表示画像の調整操作を簡易に行うことができる。
【0016】
図2は、入力装置20の外観構成を示す。入力装置20は、ユーザが操作可能な操作手段として、十字キー21、アナログスティック27a、27bと、4種の操作ボタン26を備える。4種の操作ボタン26は、○ボタン22、×ボタン23、□ボタン24および△ボタン25から構成される。
【0017】
画像処理システム1において、入力装置20の操作手段には、表示画像の拡大/縮小要求、および上下左右方向へのスクロール要求を入力するための機能が割り当てられる。たとえば、表示画像の拡大/縮小要求の入力機能は、右側のアナログスティック27bに割り当てられる。ユーザはアナログスティック27bを手前に引くことで、表示画像の縮小要求を入力でき、また手前から押すことで、表示画像の拡大要求を入力できる。また、表示画像のスクロール要求の入力機能は、左側のアナログスティック27aに割り当てられる。ユーザはアナログスティック27aを上下左右に倒すことで、倒した方向のスクロール要求を入力できる。このようにアナログスティック27a、27bは、表示画像を連続的にスクロールさせ、また連続的に拡大/縮小するために用いられる。
【0018】
本実施例においては、画像処理装置10が、新聞画像のレイアウト構造を解析して、1記事単位で枠領域を設定しており、入力装置20の操作手段には、枠領域ごとの表示要求を入力するための機能が割り当てられる。たとえば、○ボタン22は、ある1つの枠領域の表示要求を入力するための機能が割り当てられる。ユーザが○ボタン22を押下すると、たとえば新聞画像の最も左上に設定された枠領域が表示されるようにしてもよい。また表示する枠領域の変更機能は、十字キー21に割り当てられる。ユーザは十字キー21を押下することで、表示する枠領域を、十字キー21を押下した方向に存在する枠領域に変更する変更要求を入力できる。また枠領域が表示された状態で、△ボタン25には枠領域を拡大表示するための機能が割り当てられ、×ボタン23には、枠領域を縮小表示するための機能が割り当てられる。
【0019】
入力装置20は、入力された画像変更要求信号を画像処理装置10に伝送する機能をもち、本実施例では画像処理装置10との間で無線通信可能に構成される。入力装置20と画像処理装置10は、Bluetooth(ブルートゥース)(登録商標)プロトコルやIEEE802.11プロトコルなどを用いて無線接続を確立してもよい。なお入力装置20は、画像処理装置10とケーブルを介して接続して、画像変更要求信号を画像処理装置10に伝送してもよい。
【0020】
図3は、画像処理システム1において使用する画像データの階層構造を示す。画像データは、深さ(Z軸)方向に、第0階層30、第1階層32、第2階層34および第3階層36からなる階層構造を有し、以下、この階層構造をもつ画像データを「階層データ」とよぶ。図3に示す階層データは4分木の階層構造を有し、各階層は、1以上のタイル画像38で構成される。すべてのタイル画像38は同じ画素数をもつ同一サイズに形成され、たとえば256×256画素を有する。各階層の画像データは、一つの画像を異なる解像度で表現しており、最高解像度をもつ第3階層36の原画像を複数段階に縮小して、第2階層34、第1階層32、第0階層30の画像データが生成される。たとえば第N階層の解像度(Nは0以上の整数)は、左右(X軸)方向、上下(Y軸)方向ともに、第(N+1)階層の解像度の1/2であってよい。
【0021】
画像処理装置10において、階層データは、所定の圧縮形式で圧縮された状態で提供サーバ18から供給される。画像処理装置10は、階層データにおける少なくとも1つの解像度の画像データのレイアウト構造を解析し、画像中の境界を判別して、データのまとまりを区画し、枠領域を設定する。このとき画像処理装置10は、2種類以上の解像度の画像データに対して、枠領域を異なる単位で設定してもよい。たとえば最も低解像度の第0階層30に対しては、枠領域を記事単位で設定し、それよりも高解像度の階層に対しては、枠領域を記事単位で設定するだけでなく、さらに記事を細分化して枠領域を設定してもよい。たとえば新聞画像中の列単位で記事を細分化してもよく、また段単位で記事を細分化してもよい。このような枠領域を形成する単位は、記事を構成する言語(文字種)やレイアウト構造に依存し、解析対象となる新聞ごとに決定されることが好ましい。
【0022】
階層データの階層構造は、図3に示すように、左右方向をX軸、上下方向をY軸、深さ方向をZ軸として設定され、仮想的な3次元空間を構築する。画像処理装置10は、入力装置20から供給される画像変更要求信号から表示画像の変更量を導出すると、その変更量を用いて、階層を特定する情報と、その階層におけるテクスチャ座標(UV座標)を導出する。この階層特定情報およびテクスチャ座標の組み合わせを、空間座標と呼ぶ。仮想空間における空間座標は、表示画像の生成処理に利用される。なお画像処理装置10は、表示画像の変更量を用いて仮想空間におけるフレームの4隅の座標を導出してもよい。この4隅のフレーム座標も、空間座標と呼ぶ。
【0023】
図4は、画像処理装置10の機能ブロック図を示す。画像処理装置10は、無線インタフェース40、スイッチ42、表示処理部44、ハードディスクドライブ50、記録媒体装着部52、ディスクドライブ54、メインメモリ60、バッファメモリ70および制御部100を有して構成される。表示処理部44は、表示装置12のディスプレイに表示するデータをバッファするフレームメモリを有する。
【0024】
スイッチ42は、イーサネットスイッチ(イーサネットは登録商標)であって、外部の機器と有線または無線で接続して、データの送受信を行うデバイスである。スイッチ42は、ルータ15を介してネットワーク16に接続し、提供サーバ18から階層化された圧縮画像データを受信してもよい。またスイッチ42は無線インタフェース40に接続し、無線インタフェース40は、所定の無線通信プロトコルで入力装置20と接続する。入力装置20においてユーザから入力された画像変更要求信号は、無線インタフェース40、スイッチ42を経由して、制御部100に供給される。
【0025】
ハードディスクドライブ50は、データを記憶する補助記憶装置として機能する。スイッチ42を介して受信された圧縮画像データは、ハードディスクドライブ50に格納されてもよい。表示処理の実行時、ハードディスクドライブ50に格納された圧縮画像データは、メインメモリ60に読み出される。記録媒体装着部52は、メモリカードなどのリムーバブル記録媒体が装着されると、リムーバブル記録媒体からデータを読み出す。ディスクドライブ54は、読出専用のROMディスクが装着されると、ROMディスクを駆動して認識し、データを読み出す。ROMディスクは、光ディスクや光磁気ディスクなどであってよい。
【0026】
制御部100は、マルチコアCPUを備え、1つのCPUの中に1つの汎用的なプロセッサコアと、複数のシンプルなプロセッサコアを有する。汎用プロセッサコアはPPU(Power Processing Unit)と呼ばれ、残りのプロセッサコアはSPU(Synergistic-Processing Unit)と呼ばれる。
【0027】
制御部100は、メインメモリ60およびバッファメモリ70に接続するメモリコントローラを備える。PPUはレジスタを有し、演算実行主体としてメインプロセッサを備えて、実行するアプリケーションにおける基本処理単位としてのタスクを各SPUに効率的に割り当てる。なお、PPU自身がタスクを実行してもよい。SPUはレジスタを有し、演算実行主体としてのサブプロセッサとローカルな記憶領域としてのローカルメモリを備える。ローカルメモリは、バッファメモリ70として使用されてもよい。メインメモリ60およびバッファメモリ70は記憶装置であり、RAM(ランダムアクセスメモリ)として構成される。SPUは制御ユニットとして専用のDMA(Direct Memory Access)コントローラをもち、メインメモリ60とバッファメモリ70の間のデータ転送を高速に行うことができ、また表示処理部44におけるフレームメモリとバッファメモリ70の間で高速なデータ転送を実現できる。本実施例の制御部100は、複数のSPUを並列動作させることで、高速な画像処理機能を実現する。表示処理部44は、表示装置12に接続されて、ユーザからの要求に応じた画像処理結果を出力する。
【0028】
図5は、階層間の関係を説明するための説明図を示す。この階層データ構造において、各階層はL0(第0階層30)、L1(第1階層32)、L2(第2階層34)、L3(第3階層36)と表現されている。図5に示す階層データ構造において、深さ(Z軸)方向における位置は、解像度を示し、L0に近い位置ほど解像度が低く、L3に近い位置ほど解像度は高い。ディスプレイに表示される画像の大きさに注目すると、深さ方向における位置は、拡大率に対応し、L0の表示画像の拡大率を1とすると、L1における拡大率は4、L2における拡大率は16となり、L3における拡大率は64となる。したがって深さ方向において、表示画像がL0側からL3側へ向かう方向に変化する場合、表示画像は拡大していき、L3側からL0側へ向かう方向に変化する場合は、表示画像は縮小していく。
【0029】
第1境界31、第2境界33、第3境界35は、L0を基準とした拡大率として定義され、表示画像の生成に使用するタイル画像の階層を定めるための判定基準として利用される。第1境界31は拡大率2に設定され、表示画像の要求拡大率が2より小さければ、L0タイル画像が使用される。第2境界33は拡大率8に設定され、表示画像の要求拡大率が2以上であり且つ8より小さければ、L1タイル画像が使用される。同様に第3境界35は拡大率32に設定され、表示画像の要求拡大率が8以上であり且つ32より小さければ、L2タイル画像が使用される。また表示画像の要求拡大率が32以上であれば、L3タイル画像が使用される。したがって画像処理装置10は、これから表示する画像の要求拡大率が定まれば、その拡大率に対応する解像度のタイル画像をメインメモリ60から読み出して、その拡大率に調整した表示画像を生成することができる。
【0030】
図6は、画像処理装置10における制御部100の構成を示す。制御部100は、画像データ解析部120、入力信号処理部150および表示画像処理部170を備える。画像データ解析部120は、枠領域設定部122、枠領域解析部124および拡大率設定部132を有し、枠領域解析部124は、文字種特定部126、文字画素サイズ特定部128および位置関係特定部130を有する。画像データ解析部120は、画像データのレイアウト構造の解析処理を行う。入力信号処理部150は、信号受付部152、拡大率決定部154および初期位置決定部156を有する。入力信号処理部150は、入力装置20から送信される画像変更要求信号を受け付け、表示処理に必要な情報を表示画像処理部170に供給する。表示画像処理部170は、画像データ取得部174、デコード部176、変更量導出部178、空間座標決定部180および表示画像生成部182を有する。表示画像処理部170は、タイル画像をメインメモリ60から読み出してデコードし、要求される拡大率に調整した表示画像を生成する。
【0031】
図6において、さまざまな処理を行う機能ブロックとして記載される各要素は、ハードウェア的には、CPU(Central Processing Unit)、メモリ、その他のLSIで構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。既述したように、制御部100は1つのPPUと複数のSPUとを有し、PPUおよびSPUがそれぞれ単独または協同して、各機能ブロックを構成できる。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
【0032】
図7は、新聞のスキャン画像の一例を示す。このページには、5つの記事が含まれており、それぞれの記事は、図示されるように仕切り線で区分けされている。なお、階層化された画像データのレイアウト構造は、解像度の異なる各階層において変わりはない。画像データ解析部120は、入力信号処理部150および表示画像処理部170の動作に先立って、画像データのレイアウト構造を解析する。
【0033】
枠領域設定部122は、画像データのレイアウト構造から仕切り線を抽出し、1つの記事を含む枠領域を設定する。なお1つの記事においては上下左右方向ともに文字間隔が密であることを利用して、枠領域設定部122は、仕切り線ではなく、文字間隔をもとに枠領域を設定してもよい。たとえば枠領域設定部122は、文字間隔が所定値以上である場合に、2つの文字の間に記事の境界があることを判定し、新聞画像を区分けして、枠領域を設定してもよい。
【0034】
図8は、枠領域設定部122により設定された枠領域を示す。図示するように、枠領域設定部122は、記事単位で5つの枠領域200、202、204、206、208を設定する。枠領域設定部122は、各階層の画像データに対して枠領域を設定し、たとえば高解像度の画像データに対しては、図8に示す枠領域内に、さらに細かな枠領域を設定してもよい。たとえば枠領域設定部122は、段落ごとに枠領域を設定してもよく、また記事が2列以上に分かれている場合には、列ごとに枠領域を設定してもよい。図8に示す記事単位の枠領域200、202、204、206、208は、すべての階層の画像データに対して設定される。
【0035】
枠領域設定部122は、設定した枠領域に識別情報を付与し、枠領域解析部124は、枠領域の解析結果を識別情報に対応づけてメインメモリ60に保持させる。以下、枠領域200にID1、枠領域202にID2、枠領域204にID3、枠領域206にID4、枠領域208にID5が付与されたものとする。
【0036】
文字種特定部126は、枠領域に含まれる文字種を特定する。ここで文字種とは、文字体系とも呼ばれ、英字、漢字、平仮名、片仮名、アラビア文字、キリル文字など、同種の表記に使われるひとまとまりの文字の体系を意味する。文字種特定部126は、既存の文字認識技術を用いて枠領域に含まれる文字種を特定し、その新聞で使用されている言語を特定する。たとえば枠領域に含まれる文字種として、漢字、平仮名、片仮名が特定されると、文字種特定部126は、使用言語が日本語であることを特定する。また枠領域に含まれる文字種として英字が特定されると、文字種特定部126は、使用言語が英語であることを特定する。なお、1つの新聞画像において使用言語は通常1つであると考えられるため、文字種特定部126は、1つの枠領域に含まれる文字を解析して、使用言語を特定すればよい。
【0037】
文字画素サイズ特定部128は、少なくとも1つの解像度の画像データに設定された枠領域に含まれる文字の画素サイズを特定する。本実施例では、第0階層の画像データの解像度を拡大率の基準に設定しているため、文字画素サイズ特定部128は、第0階層の画像データに設定された枠領域に含まれる文字の画素サイズを特定する。なお第0階層以外の階層の解像度を、拡大率の基準に設定することも可能である。また文字画素サイズ特定部128は、全ての階層の画像データに対して文字画素サイズの特定処理を実行してもよい。
【0038】
文字の画素サイズは、高さ方向(上下方向)の画素数で定義されてよい。文字画素サイズ特定部128は、文字列を構成する文字を抽出し、各文字の高さ方向の画素数を特定する。文字種特定部126により、英字新聞画像であることが特定されている場合は、文字列は横方向に構成されるため、各行を構成する全文字について高さ方向の画素数を特定する。文字画素サイズ特定部128は、たとえば各行における全文字に対して特定された画素数を平均して、各行の文字画素サイズを特定してもよい。また文字画素サイズ特定部128は、各行において最大の高さ方向の画素数を、各行の文字画素サイズとして特定してもよい。なお文字種特定部126により日本語の新聞画像であることが特定されている場合には、文字列は縦方向に構成されるため、各列を構成する全文字について高さ方向の画素数を特定し、文字画素サイズ特定部128は、各列において平均した画素数を、各列の文字画素サイズとして特定してもよい。なお文字画素サイズ特定部128は、各列において最大の高さ方向の画素数を、各列の文字画素サイズとして特定してもよい。
【0039】
通常、1つの記事を包含する枠領域内には、記事の見出しを記述する文字(以下、「見出し文字」と呼ぶ)と、記事内容を記述する文字(以下、「記事文字」と呼ぶ)とが含まれる。見出し文字には、大見出しを記述する文字と、小見出しを記述する文字とが存在する場合もあるが、以下では、説明を簡略化するために、まとめて「見出し文字」と表現する。
【0040】
続いて文字画素サイズ特定部128は、各行の文字画素サイズの中から、最大の文字画素サイズを決定する。最大文字画素サイズをもつ文字列には、見出し文字が含まれる。本実施例において文字画素サイズ特定部128は、最大文字画素サイズの3/5〜1倍の文字画素サイズをもつ文字列に見出し文字が含まれると判定し、3/5〜1倍の範囲にある各行の文字画素サイズを平均して、見出し文字の画素サイズを特定する。最大文字画素サイズの3/5倍であっても見出し文字であると判定することで、上記した小見出しを記述する文字も含めることができる。また文字画素サイズ特定部128は、最大文字画素サイズの3/5以下の文字画素サイズをもつ文字列には、記事文字が含まれていると判定する。文字画素サイズ特定部128は、最大文字画素サイズの3/5以下である各行の文字画素サイズを平均して、記事文字の画素サイズを特定する。なお、ここでは見出し文字が含まれる文字画素サイズを最大文字画素サイズの3/5〜1倍と設定したが、この範囲は、文字種特定部126により特定された使用言語に応じて設定されてよい。
【0041】
以上のように文字画素サイズ特定部128は、見出し文字の画素サイズと、記事文字の画素サイズを、高さ方向の画素数で特定する。文字画素サイズ特定部128は、全ての枠領域における画素サイズを特定し、枠領域の識別情報に対応づけてメインメモリ60に保持させる。なお画像データに、文字の画素サイズを示すメタデータが付加されている場合には、文字画素サイズ特定部128は、そのメタデータを用いて文字の画素サイズを特定してもよい。
【0042】
拡大率設定部132は、各枠領域に対して、各枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する。複数の拡大率は、文字画素サイズ特定部128により特定された文字の画素サイズに応じて、枠領域を表示装置12のディスプレイに表示する際の文字の読みやすさに配慮して設定される。
【0043】
ディスプレイサイズ保持部140は、ディスプレイのサイズを保持する。ディスプレイサイズは、たとえば縦および横の長さで定義されてもよい。ディスプレイ解像度保持部142は、ディスプレイの解像度を保持する。ディスプレイ解像度は、縦および横の画素数で定義されてもよい。ディスプレイサイズ保持部140およびディスプレイ解像度保持部142は、ハードディスクドライブ50に形成された格納領域であってよい。ディスプレイサイズおよび解像度は、予めユーザにより画像処理装置10に入力されて、それぞれディスプレイサイズ保持部140およびディスプレイ解像度保持部142に保持される。なお表示装置12がHDMI機器である場合は、画像処理装置10が表示装置12に問い合わせることで、表示装置12がディスプレイサイズおよび解像度を画像処理装置10に知らせてもよい。
【0044】
拡大率設定部132は、文字画素サイズ特定部128により特定された文字の画素サイズに応じて、枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する。さらに詳細には、拡大率設定部132は、文字の画素サイズに加えて、ディスプレイサイズ保持部140に保持されたディスプレイサイズ、およびディスプレイ解像度保持部142に保持されたディスプレイ解像度にもとづいて、枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する。なお、拡大率設定部132は、ディスプレイサイズ、ディスプレイ解像度のいずれか一方にもとづいて複数の拡大率を設定してもよい。
【0045】
後述するが、本実施例の画像処理装置10は、新聞の表示処理に際して、まず表示装置12のディスプレイに新聞画像を全面表示する。図9は、新聞画像が全面表示された様子を示す。全面表示をした場合、記事文字だけでなく、見出し文字も小さく表示される。ユーザが見出し文字および記事文字を読めるようにするために、画像処理装置10は新聞画像を拡大表示する必要がある。
【0046】
そこで画像処理装置10は、新聞画像が全面表示された状態でユーザにより入力装置20の○ボタン22が押下されると、ある枠領域、たとえばID1で特定される枠領域200(図8参照)をディスプレイに拡大表示するようにする。このとき、枠領域200がディスプレイに対して大きければ、枠領域200の全体をディスプレイに表示したときに、依然として見出し文字や記事文字が小さく、読みにくい事態も発生しうる。このような事態を回避するために、拡大率設定部132は、文字の画素サイズ、ディスプレイサイズおよびディスプレイ解像度をもとに、枠領域200を表示する際の複数の拡大率を予め設定しておく。
【0047】
以下、図8に示す枠領域200を表示する際の拡大率の設定処理について説明するが、他の枠領域についても同様の拡大率設定処理を行う。図示されるように、ID1で特定される枠領域200には、”Coach back in Japan”と記述される見出し文字と、その下方に記述される記事文字とが含まれる。
【0048】
まず拡大率設定部132は、ディスプレイサイズおよびディスプレイ解像度から、ディスプレイの画素密度を求める。画素密度は、単位長あたりの画素数で表現される。続いて拡大率設定部132は、ディスプレイにおいてユーザが読みやすい基準文字サイズを決定する。基準文字サイズは、長さの単位で表現される。たとえば表示装置12が据置型の大型TVである場合、ユーザは数メートル離れた位置からディスプレイを見るため、読みやすい高さ方向の文字サイズは、約5センチメートル程度であると考えられる。一方、表示装置12がディスプレイを備えた携帯端末装置である場合、ユーザは数10センチメートルの位置からディスプレイを見るため、読みやすい高さ方向の文字サイズは、1センチメートル程度あれば十分と考えられる。このような事情を考慮して、拡大率設定部132は、ディスプレイサイズから据置型TVであるか、または携帯端末装置であるかを判別し、ディスプレイサイズに応じた基準文字サイズを決定する。たとえばディスプレイの縦長さが15cm以下であれば、携帯端末装置であると判定し、15cmよりも大きければ据置型TVであると判定してもよい。
【0049】
決定した基準文字サイズをSl(単位は長さ)、ディスプレイの画素密度をDp(単位は画素数/単位長)とすると、ディスプレイに表示されるべき文字の高さ方向の画素数は(Sl×Dp)となる。以下、この画素数を、基準画素数とよぶ。枠領域200において、文字画素サイズ特定部128が、見出し文字の画素サイズ(単位は画素数)をSa、記事文字の画素サイズをSb(<Sa)と特定していたとすると、拡大率設定部132は、見出し文字のための拡大率を((Sl×Dp)/Sa)(以下、Eaと表記する)、記事文字のための拡大率を((Sl×Dp)/Sb)(以下、Ebと表記する)と設定する。なお、見出し文字のための拡大率は、Ea以上に設定されてもよく、また記事文字のための拡大率は、Eb以上に設定されてもよい。このように拡大率設定部132は、見出し文字がディスプレイの高さ方向において基準画素数以上となる拡大率と、記事文字が基準画素数以上となる拡大率を設定する。
【0050】
これにより、枠領域200を表示する際に、拡大率をEa以上にして記事画像を拡大表示すると、見出し文字が読むに十分な大きさとなり、また拡大率をEb以上にして記事画像を拡大表示すると、記事文字が読むに十分な大きさとなる。拡大率設定部132は、他の枠領域についても同様に見出し文字のための拡大率と、記事文字のための拡大率を設定し、枠領域の識別情報に対応づけてメインメモリ60に保持させる。なお本実施例において拡大率は1以上の値だけでなく、1以下の値も含むものとする。
【0051】
位置関係特定部130は、枠領域間の位置関係を特定する。たとえば位置関係特定部130は、各枠領域の中心座標を定め、それぞれの中心座標をもとに、隣接する枠領域との間の位置関係を特定する。図8を参照して、枠領域200の下には枠領域202が存在し、また右には枠領域206が存在する。同様に枠領域202の上には枠領域200が存在し、右には枠領域206が存在し、また下には枠領域204が存在する。このように位置関係特定部130は、各枠領域について、その上下左右に存在する枠領域を特定し、その位置関係を枠領域の識別情報に対応づけてメインメモリ60に保持させる。
【0052】
以上のように、入力信号処理部150による入力信号の処理、および表示画像処理部170による表示画像の処理に先だって、拡大率設定部132が、設定した各枠領域における複数の拡大率を予め設定し、また位置関係特定部130が枠領域間の位置関係を特定しておく。これにより、入力信号処理部150および表示画像処理部170による各処理が実行される環境が整えられる。以下、制御部100による表示処理について説明する。
【0053】
画像処理装置10の起動後、ユーザが1枚の新聞画像を選択すると、画像データ取得部174がL0タイル画像を取得し、デコード部176がデコードして、バッファメモリ70に保持させる。表示画像生成部182は、バッファメモリ70に保持された画像データを用いて、ディスプレイに収まるようにL0タイル画像を拡大または縮小して表示画像を生成してフレームメモリ90に供給し、表示処理部44がディスプレイに表示する。これにより、表示装置12のディスプレイに新聞画像が全面表示される(図9参照)。
【0054】
ユーザが入力装置20を操作すると、画像変更要求信号が画像処理装置10に送信される。信号受付部152は、入力装置20から、ディスプレイに表示されている表示画像の変更要求信号を受け付ける。
【0055】
ユーザが入力装置20の○ボタン22を押下すると、信号受付部152は、変更要求信号が枠領域200の表示を要求していることを判定し、拡大率決定部154に通知する。拡大率決定部154は、枠領域200の識別情報ID1を用いて、拡大率設定部132により枠領域200に対して設定された拡大率をメインメモリ60から取得し、これから表示する枠領域200の拡大率として決定する。このとき拡大率決定部154は、設定された複数の拡大率のうち、最小の拡大率を取得する。上記した例において、Ea<Ebであるため、拡大率決定部154は、見出し文字の拡大率Eaを取得する。拡大率決定部154は、枠領域200の識別情報ID1および決定した拡大率Eaを表示画像処理部170に伝える。
【0056】
また初期位置決定部156は、特定された文字種に応じて、枠領域200の左上または右上のいずれかが表示画像に含まれるように枠領域の表示位置を決定する。たとえば、特定された文字種により英字新聞であることが判定された場合、英語は左から記述されるため、初期位置決定部156は、枠領域の左上隅が表示画像に必ず含まれるように枠領域の最初の表示位置を決定する。一方、特定された文字種により日本語新聞であることが判定された場合、日本語新聞では右から記述されるため、枠領域の右上隅が表示画像に必ず含まれるように枠領域の最初の表示位置を決定する。たとえば初期位置決定部156は、枠領域の左上隅または右上隅が、ディスプレイの左上隅または右上隅にくるように、最初の表示位置を決定してもよい。初期位置決定部156は、決定した表示位置を表示画像処理部170に伝える。
【0057】
図10は、図5に示す要求拡大率と使用するタイル画像の階層との関係表を示す。表示画像処理部170において、画像データ取得部174は、拡大率決定部154から枠領域200の識別情報および決定された拡大率を受け取ると、決定された拡大率に対応する解像度のタイル画像をメインメモリ60から読み出す。画像データ取得部174は、図10に示す関係表をテーブル形式で保持しており、決定された拡大率Eaに応じて、使用する階層を決定し、決定した階層において枠領域200を含んだタイル画像をメインメモリ60から取得する。デコード部176は、タイル画像をデコードし、バッファメモリ70に保持させる。
【0058】
空間座標決定部180は、拡大率決定部154により決定された拡大率Eaと、初期位置決定部156により決定された表示位置を受け取ると、拡大率および表示位置に対応したテクスチャ座標を導出して、空間座標を決定する。表示画像生成部182は、バッファメモリ70に保持された画像データを用いて、決定された拡大率Eaに調整した表示画像を生成し、フレームメモリ90に供給する。以上により、ディスプレイには、見出し文字が読みやすい大きさに調整された表示画像が映し出される。
【0059】
図11は、拡大率Eaに調整された枠領域200の表示画像を示す。表示画像が拡大率Eaで表示されることで、見出し文字が読みやすい大きさに拡大されている。このように画像処理装置10は、ユーザが面倒な操作を行うことなく、単純なボタン操作で画像を拡大表示できる。これにより、ユーザは見出し文字を認識でき、興味がある記事であれば、入力装置20の△ボタン25を押下して、記事文字を拡大する。
【0060】
このとき信号受付部152は、変更要求信号が枠領域200の拡大表示を要求していることを判定し、拡大率決定部154に通知する。拡大率決定部154は、枠領域200の識別情報ID1を用いて、拡大率設定部132により枠領域200に対して設定された拡大率をメインメモリ60から取得し、これから表示する枠領域200の拡大率として決定する。このとき拡大率決定部154は、設定された複数の拡大率のうち、変更要求信号を受け付けた時点の拡大率(Ea)に対して、その次に大きい値に設定されている拡大率(Eb)を選択して、取得する。拡大率決定部154は、枠領域200の識別情報ID1および決定した拡大率Ebを表示画像処理部170に伝える。また既述したように初期位置決定部156は、枠領域の表示位置を決定し、決定した表示位置を表示画像処理部170に伝える。
【0061】
表示画像処理部170において、画像データ取得部174は、拡大率決定部154から枠領域200の識別情報および決定された拡大率を受け取ると、決定された拡大率に対応する解像度のタイル画像をメインメモリ60から読み出す。画像データ取得部174は、図10に示す関係表を参照して、決定された拡大率Ebに応じて、使用する階層を決定し、決定した階層において枠領域200を含んだタイル画像をメインメモリ60から取得する。デコード部176は、タイル画像をデコードし、バッファメモリ70に保持させる。
【0062】
空間座標決定部180は、拡大率決定部154により決定された拡大率Ebと、初期位置決定部156により決定された表示位置を受け取ると、拡大率および表示位置に対応したテクスチャ座標を導出して、空間座標を決定する。表示画像生成部182は、バッファメモリ70に保持された画像データを用いて、決定された拡大率Ebに調整した表示画像を生成し、フレームメモリ90に供給する。以上により、ディスプレイには、記事文字が読みやすい大きさに調整された表示画像が映し出される。
【0063】
図12は、拡大率Ebに調整された枠領域200の表示画像を示す。表示画像が拡大率Ebで表示されることで、見出し文字だけでなく、記事文字も読みやすい大きさに拡大されている。これにより、ユーザは、面倒な操作を必要とすることなく、記事文字を読むことができる。
【0064】
なお枠領域が表示された状態でユーザが、十字キー21を操作すると、信号受付部152は、変更要求信号が枠領域200の変更を要求していることを判定し、初期位置決定部156に通知する。初期位置決定部156は、枠領域200の識別情報ID1を用いて、位置関係特定部130により枠領域200に対して特定された位置関係をメインメモリ60から取得し、十字キー21で指定された方向に存在する枠領域を特定する。たとえば十字キー21で下方向が指示された場合には、初期位置決定部156が、枠領域200の下に枠領域202が存在する情報を取得し(図8参照)、既述したように表示位置を決定し、決定した表示位置を表示画像処理部170に伝える。また初期位置決定部156は、枠領域202の識別情報ID2を拡大率決定部154に通知する。
【0065】
拡大率決定部154は、初期位置決定部156から通知された識別情報ID2を用いて、拡大率設定部132により枠領域202に対して設定された拡大率をメインメモリ60から取得し、これから表示する枠領域202の拡大率として決定する。拡大率決定部154は、設定された複数の拡大率のうち、最小の拡大率を取得し、枠領域202の識別情報および決定した拡大率を表示画像処理部170に伝える。表示画像処理部170は、これらの情報を用いて表示画像を生成し、表示処理部44が、ディスプレイに、見出し文字が読みやすい大きさに調整された表示画像を映し出す。
【0066】
なお以上は枠領域の段階的な表示処理について説明したが、入力装置20のアナログスティック27a、27bを用いて、新聞画像を連続的に変化させるように表示することも可能である。信号受付部152が、アナログスティック27を用いた変更要求信号を受け付けると、変更量導出部178が、変更要求信号をもとに、要求される表示画像の変更量を導出する。表示画像の変更量は、1フレームごとの上下左右方向の移動量および深さ方向の移動量である。空間座標決定部180は、前回フレームのテクスチャ座標から、導出された変更量により移動する今回フレームのテクスチャ座標を決定する。表示画像生成部182は、テクスチャ画像をもとに、バッファメモリ70に保持された画像データを用いて、表示画像を生成し、フレームメモリ90に供給する。なお枠領域が表示された状態でアナログスティック27を用いて段階的に枠領域を変更することも可能である。
【0067】
図13は、本実施例における画像処理のフローチャートを示す。まず枠領域設定部122が、画像データのレイアウト構造を解析して区分けし、新聞画像に少なくとも1つの枠領域を設定する(S10)。枠領域が設定されると、文字画素サイズ特定部128が、枠領域に含まれる文字の画素サイズを特定する(S12)。続いて拡大率設定部132が、ディスプレイサイズ保持部140からディスプレイサイズを取得し(S14)、ディスプレイ解像度保持部142からディスプレイ解像度を取得する(S16)。拡大率設定部132は、ディスプレイサイズおよび解像度と、特定された文字の画素サイズにもとづいて、枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する(S18)。これらのステップにより表示処理の環境が整い、表示画像処理部170は、入力装置20より表示画像の変更要求信号を受け取ると、設定された拡大率に対応する解像度のタイル画像をメインメモリ60から読み出し、その拡大率に調整した表示画像を生成する(S20)。
【0068】
以上、本発明を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0069】
実施例では、枠領域を段階的に拡大表示する例を示したが、ユーザは入力装置20の×ボタン23を押下することで、枠領域の拡大前の状態に変更する、すなわち枠領域を縮小表示することも可能である。
【0070】
実施例では、拡大率設定部132が、見出し文字および記事文字が読みやすい大きさとなる拡大率Ea、Ebを決定し、それぞれの文字の拡大率をEa以上、Eb以上となるように設定してもよいとした。変形例では、拡大率に上限を設定する。このとき、拡大率設定部132は、最小の基準文字サイズSlminと、最大の基準文字サイズSlmaxを設定する。ここでSlminは、実施例における基準文字サイズSlに対応する。
【0071】
見出し文字の拡大率Ehは、以下の範囲の値をとりうる。
((Slmin×Dp)/Sa)<=Eh<=((Slmax×Dp)/Sa)
同様に記事文字の拡大率Eiは、以下の範囲の値をとりうる。
((Slmin×Dp)/Sb)<=Ei<=((Slmax×Dp)/Sb)
拡大率設定部132は、拡大率Eh、Eiを、それぞれ上記の許容範囲内で設定できるが、Sa、Sbの値によっては、それぞれの許容範囲に重複が生じ、Eh、Eiを同一値にすることも可能となる。
【0072】
実施例では、枠領域200を表示する際に、見出し文字と記事文字の拡大率を異ならせて設定しているが、枠領域200が小さければ、見出し文字と記事文字の拡大率を同じくして、枠領域200をディスプレイに全面表示することが好ましい。そこで、拡大率設定部132は、Eh、Eiがそれぞれの許容範囲内であって、枠領域200を全面表示させる拡大率が存在すれば、それを1つの拡大率として設定してもよい。具体的に拡大率設定部132は、枠領域200をディスプレイに全面表示するときの拡大率を求め、その拡大率が、上記したEh、Eiのそれぞれの許容範囲に含まれていれば、その拡大率を、複数の拡大率の1つとして設定する。
【0073】
なお、この手法は、拡大率の上限を設定しない場合においても利用でき、実施例において、見出し文字の拡大率をEa以上、記事文字の拡大率をEb以上に設定可能である場合に、枠領域を全面表示するときの拡大率が、Ea以上、Eb以上の値であれば、拡大率設定部132が、全面表示時の拡大率を、複数の拡大率の1つとして設定してもよい。
【0074】
また拡大率設定部132は、ユーザのプロファイル情報に応じて、拡大率を設定してもよい。ここでプロファイル情報は、たとえばユーザの年齢情報であってよく、ユーザが画像処理装置10にログインしたときに、拡大率設定部132が、ユーザ情報に対応付けられたプロファイル情報を取得してもよい。子供や老人は、小さい文字を判別しにくい傾向にあるため、拡大率設定部132は、ユーザが所定年齢(たとえば6歳)以下、および所定年齢以上(たとえば65歳以上)である場合に、上記した見出し文字の拡大率、および記事文字の拡大率を、K倍(Kは1より大きい値)して、子供用、老人用の拡大率を設定してもよい。
【図面の簡単な説明】
【0075】
【図1】本発明の実施例にかかる画像処理システムの使用環境を示す図である。
【図2】入力装置の外観構成を示す図である。
【図3】画像処理システムにおいて使用する画像データの階層構造を示す図である。
【図4】画像処理装置の機能ブロック図である。
【図5】階層間の関係を説明するための説明図である。
【図6】画像処理装置における制御部の構成を示す図である。
【図7】新聞のスキャン画像の一例を示す図である。
【図8】枠領域設定部により設定された枠領域を示す図である。
【図9】新聞画像が全面表示された様子を示す図である。
【図10】要求拡大率と使用するタイル画像の階層との関係表を示す図である。
【図11】拡大率Eaに調整された枠領域の表示画像を示す図である。
【図12】拡大率Ebに調整された枠領域の表示画像を示す図である。
【図13】本実施例における画像処理のフローチャートを示す図である。
【符号の説明】
【0076】
1・・・画像処理システム、10・・・画像処理装置、12・・・表示装置、20・・・入力装置、38・・・タイル画像、44・・・表示処理部、50・・・ハードディスクドライブ、60・・・メインメモリ、70・・・バッファメモリ、90・・・フレームメモリ、100・・・制御部、120・・・画像データ解析部、122・・・枠領域設定部、124・・・枠領域解析部、126・・・文字種特定部、128・・・文字画素サイズ特定部、130・・・位置関係特定部、132・・・拡大率設定部、140・・・ディスプレイサイズ保持部、142・・・ディスプレイ解像度保持部、150・・・入力信号処理部、152・・・信号受付部、154・・・拡大率決定部、156・・・初期位置決定部、170・・・表示画像処理部、174・・・画像データ取得部、176・・・デコード部、178・・・変更量導出部、180・・・空間座標決定部、182・・・表示画像生成部、200,202,204,206,208・・・枠領域。

【特許請求の範囲】
【請求項1】
画像をディスプレイに表示する画像処理装置であって、
異なる解像度ごとに少なくとも1つの圧縮したタイル画像を含む画像データを保持する記憶装置と、
少なくとも1つの解像度の画像データに設定された枠領域に含まれる文字の画素サイズを特定する文字画素サイズ特定部と、
ディスプレイに表示されている表示画像の変更要求信号を受け付ける受付部と、
前記変更要求信号を受け付けると、特定された文字の画素サイズに応じた拡大率に対応する解像度のタイル画像を前記記憶装置から読み出して、その拡大率に調整した表示画像を生成する表示画像処理部と、
を備えることを特徴とする画像処理装置。
【請求項2】
前記枠領域内の少なくとも一部の文字を表示する際の複数の拡大率を設定する拡大率設定部をさらに備えることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
ディスプレイのサイズを保持するディスプレイサイズ保持部をさらに備え、
前記拡大率設定部は、文字の画素サイズおよびディスプレイサイズにもとづいて、前記複数の拡大率を設定することを特徴とする請求項2に記載の画像処理装置。
【請求項4】
ディスプレイの解像度を保持するディスプレイ解像度保持部をさらに備え、
前記拡大率設定部は、文字の画素サイズおよびディスプレイ解像度にもとづいて、前記複数の拡大率を設定することを特徴とする請求項2または3に記載の画像処理装置。
【請求項5】
前記表示画像処理部は、設定された複数の拡大率のうち、前記変更要求信号を受け付けた時点の表示画像の拡大率に対して、その次に大きい値に設定されている拡大率に調整した表示画像を生成することを特徴とする請求項2から4のいずれかに記載の画像処理装置。
【請求項6】
前記文字画素サイズ特定部が、枠領域に含まれる文字の画素サイズに、第1サイズと、第1サイズよりも小さい第2サイズが存在することを特定したとき、
前記拡大率設定部は、第2サイズの文字がディスプレイの所定方向において所定の画素数以上となる拡大率を少なくとも1つ設定することを特徴とする請求項2から5のいずれかに記載の画像処理装置。
【請求項7】
前記拡大率設定部は、第1サイズの文字がディスプレイの所定方向において所定の画素数以上となる第1拡大率と、第2サイズの文字がディスプレイの所定方向において所定の画素数以上となる第2拡大率とを設定することを特徴とする請求項6に記載の画像処理装置。
【請求項8】
枠領域に含まれる文字種を特定する文字種特定部と、
特定された文字種に応じて、枠領域の左上または右上のいずれかが表示画像に含まれるように表示位置を決定する位置決定部と、
をさらに備えることを特徴とする請求項1から7のいずれかに記載の画像処理装置。
【請求項9】
画像データのレイアウト構造を解析して区分けし、少なくとも1つの枠領域を設定する枠領域設定部をさらに備えることを特徴とする請求項1から8のいずれかに記載の画像処理装置。
【請求項10】
コンピュータに、
記憶装置に保持されている、異なる解像度ごとに少なくとも1つの圧縮したタイル画像を含む画像データのうち、少なくとも1つの解像度の画像データに設定された枠領域に含まれる文字の画素サイズを特定する機能と、
ディスプレイに表示されている表示画像の変更要求信号を受け付ける機能と、
前記変更要求信号を受け付けると、特定された文字の画素サイズに応じた拡大率に対応する解像度のタイル画像を記憶装置から読み出して、その拡大率に調整した表示画像を生成する機能と、
を実現させるためのプログラム。
【請求項11】
請求項10に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2010−109700(P2010−109700A)
【公開日】平成22年5月13日(2010.5.13)
【国際特許分類】
【出願番号】特願2008−279781(P2008−279781)
【出願日】平成20年10月30日(2008.10.30)
【出願人】(395015319)株式会社ソニー・コンピュータエンタテインメント (871)
【Fターム(参考)】