説明

検査支援プログラム、検査支援方法及び検査支援装置

【課題】コンテンツ内の画像の代替情報が適切であるかの検査を支援できる検査支援プログラム、検査支援方法及び検査支援装置を提供することを課題とする。
【解決手段】画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、コンテンツデータに画像データの代替情報が更に含まれているとき、画像データの代替情報と文字認識結果とを対応付けて出力する処理をコンピュータに実行させることで上記課題を解決する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はコンテンツ内の画像の代替情報の検査を支援する検査支援プログラム、検査支援方法及び検査支援装置に関する。
【背景技術】
【0002】
近年、Webアクセシビリティへの関心が高まっている。WebアクセシビリティとはWebページ等のコンテンツの利用のしやすさをいう。Webアクセシビリティは例えば高齢者や障害者などのハンディを持つ人にとって、どの程度、利用しやすいかという意味で使われることが多い。Webアクセシビリティについては指針がJISおよびW3Cによって提唱されている。そして、WebアクセシビリティはJISおよびW3C勧告でガイドラインが定められている(例えば非特許文献1、2参照)。
【0003】
Webアクセシビリティ指針には「画像には、利用者が画像の内容を的確に理解できるようにテキストなどの代替情報を提供しなければならない」「代替テキスト:すべての非テキストコンテンツには代替テキストを提供して、拡大印刷、点字、音声、シンボル、平易な言葉などのような、ユーザが必要とする形式に変換できるようにする」などの指針が定められている。
【0004】
Webアクセシビリティ指針によれば、高齢者および視覚障害者に配慮し、HTML文書に画像を配置する場合は、代替テキスト(ALTタグ)を入れなければならない。例えば視覚障害者は音声読み上げソフトにてWeb文書を読む。したがって、画像に対して代替テキストが無い場合、読みとばされてしまうため、視覚障害者は画像に何が書かれているか分からない。また、リンクのバナーがあるWebページなどでは、代替テキストが無い場合、重要な情報が読みとばされてしまう。
【0005】
特に公共機関では情報を平等に提供する必要があるため、Webアクセシビリティ指針に対応する必要があった。例えばWebページの表示にあたり、利用者の指示に基づき画像部分を代替情報に置き換えて表示する技術は、従来から知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特表2004−527844号公報
【非特許文献】
【0007】
【非特許文献1】JIS X 8341-3:2004 「高齢者・障害者等配慮設計指針−情報通信における機器,ソフトウェア及びサービス− 第3部:ウェブコンテンツ」技術解説 第1.1版 委員会ワーキングドラフト(7月22日版)
【非特許文献2】WCAG 2.0(W3C勧告)日本語訳 [原題:Web Content Accessibility Guidelines (WCAG) 2.0]
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、Webページの表示にあたり、利用者の指示に基づき画像部分を代替情報に置き換えて表示する技術では、Webページ内の画像部分に代替情報が付与されているとしても、その代替情報がWebページ内の画像部分の代替情報として適切であるか否か分からないため、その代替情報がWebページ内の画像部分の代替情報として適切であるか検査しなければならないという問題があった。
【0009】
本実施形態はコンテンツ内の画像の代替情報が適切であるかの検査を支援できる検査支援プログラム、検査支援方法及び検査支援装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するため、本実施形態は、画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、処理をコンピュータに実行させる検査支援プログラムであることを特徴とする。
【0011】
なお、本実施形態の構成要素、表現又は構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。
【発明の効果】
【0012】
本実施形態によればコンテンツ内の画像の代替情報が適切であるかの検査を支援できる検査支援プログラム、検査支援方法及び検査支援装置を提供可能である。
【図面の簡単な説明】
【0013】
【図1】本実施例の概要を表した説明図である。
【図2】コンピュータの一例のハードウェア構成図である。
【図3】本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。
【図4】本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。
【図5】本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。
【図6】本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例のイメージ図である。
【図7】本実施例の検査支援装置の一実施例のブロック構成図である。
【図8】画像前処理リストの一例の構成図である。
【図9】本実施例の検査支援装置の処理手順の一例を表したフローチャートである。
【図10】Webページに貼られている画像の一例のイメージ図である。
【図11】HTML文書に含まれるIMGタグの一例のイメージ図である。
【図12】本実施例の検査支援装置の処理手順の他の例を表したフローチャートである。
【図13】画像のHTML要素におけるIMGタグ近辺の文字列(近辺文字列)について説明する為のイメージ図である。
【図14】リンク先のHTMLタイトルについて説明する為のイメージ図である。
【図15】本実施例の検査支援装置の他の実施例のブロック構成図である。
【図16】本実施例の検査支援装置の処理手順の他の例を表したフローチャートである。
【発明を実施するための形態】
【0014】
次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。図1は本実施例の概要を表した説明図である。
【0015】
図1はブラウザ等により表示されたWebページ1と、Webページ1に貼られている画像2と、画像2からOCR(Optical Character Reader)などの文字認識によりテキスト化した文字列3とを表している。
【0016】
Webページ1は例えばHTML(HyperText Markup Language)文書により構成されている。HTML文書はコンテンツの一例である。画像2はバナー等である。画像2の代替情報(代替文字列)はALTタグ(ALT属性)により付与されている。
【0017】
画像2の代替文字列が適切であるかの検査としては、例えば画像2のOCR結果である文字列3と比較することが考えられる。しかしながら、バナー等の画像2は小さいものが多く、文字も同様に小さいものが多い。小さな画像2はOCRに掛けても(OCRにより文字認識しても)文字が小さすぎて認識率が非常に低いという問題があった。
【0018】
そこで、本実施例では画像2を拡大することで認識率を高める。さらに、本実施例では画像2を拡大しすぎると認識率が低くなることを考慮し、画像2のOCR結果である文字列3を補完する情報として、後述のように、HTML要素におけるIMGタグ近辺の文字列(近辺文字列)及びリンク先のHTMLタイトルを利用する。
【0019】
本実施例はWebページ1に貼られている画像2のOCR結果である文字列3、近辺文字列、リンク先のHTMLタイトルなどを利用して、画像2の代替文字列が適切に付与されているかの検査を支援するものである。
【0020】
本実施例の検査支援プログラム、検査支援方法、検査支援装置は一例であって、例えば他の名称のプログラム、方法及び装置であってもよい。例えば本実施例の検査支援プログラムは、Webアクセシビリティを診断するアクセシビリティ診断ツールなどの一機能として実現してもよい。本実施例の検査支援プログラムは一台のパーソナルコンピュータやサーバコンピュータで実行してもよいし、複数台のパーソナルコンピュータやサーバコンピュータで処理を分散して実行してもよい。
【0021】
以下では、パーソナルコンピュータ及びサーバコンピュータを単にコンピュータと総称する。本実施例の検査支援プログラムを実行させるコンピュータは例えば図2に示すようなハードウェアにより構成される。図2はコンピュータの一例のハードウェア構成図である。
【0022】
図2のコンピュータ10は、入力装置21、表示装置22、コンピュータ本体23を有している。コンピュータ本体23はバス37で相互に接続された主記憶装置31、演算処理装置32、インタフェース装置33、記録媒体読取装置34及び補助記憶装置35を有している。また、バス37には入力装置21及び表示装置22が接続されている。
【0023】
バス37で相互に接続されている入力装置21、表示装置22、主記憶装置31、演算処理装置32、インタフェース装置33、記録媒体読取装置34及び補助記憶装置35は演算処理装置32による管理下で相互にデータの送受を行うことができる。演算処理装置32は、コンピュータ10全体の動作制御を司る中央処理装置である。
【0024】
インタフェース装置33はネットワーク等からのデータを受信し、データの内容を演算処理装置32に渡す。インタフェース装置33は演算処理装置32からの指示に応じてネットワーク等にデータを送信する。
【0025】
補助記憶装置35には検査支援装置と同様の機能をコンピュータ10に発揮させるプログラムの一部として、少なくとも検査支援装置における処理をコンピュータ10に実行させる検査支援プログラムが記憶されている。そして、演算処理装置32が検査支援プログラムを補助記憶装置35から読み出して実行することで、コンピュータ10は検査支援装置として機能するようになる。検査支援装置は、演算処理装置32とアクセス可能な主記憶装置31に格納されていても良い。
【0026】
入力装置21は演算処理装置32の管理下でデータの入力を受付ける。検査支援プログラムは、コンピュータ10が読み取り可能な記録媒体36に記録しておくことができる。
【0027】
記録媒体36には、磁気記録媒体、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録媒体には、HDD、フレキシブルディスク(FD)、磁気テープ(MT)などがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc − Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。また、光磁気記録媒体には、MO(Magneto − Optical disk)などがある。
【0028】
検査支援プログラムを流通させる場合は、例えば検査支援プログラムが記録されたDVD、CD−ROMなどの可搬型の記録媒体36を販売することが考えられる。検査支援プログラムを実行するコンピュータ10は例えば記録媒体読取装置34が検査支援プログラムを記録した記録媒体36から検査支援プログラムを読み出す。演算処理装置32は、読み出された検査支援プログラムを主記憶装置31若しくは補助記憶装置35に格納する。
【0029】
コンピュータ10は自己の記憶装置である主記憶装置31若しくは補助記憶装置35から検査支援プログラムを読み取り、検査支援プログラムに従った処理を実行する。演算処理装置32は検査支援プログラムに従って、後述するような各種処理を実現している。
【0030】
コンピュータ10は主記憶装置31に格納された検査支援プログラムに従って検査支援装置の各種処理を実現している。検査支援プログラムは例えば図3〜図6に示すようなソフトウェア構成の中で利用される。
【0031】
図3は、本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。検査支援プログラムはブラウザコンポーネントをエンベデッドした(組み込んだ)形態である。図3の画面イメージはブラウザコンポーネントにより表示される領域41と、検査支援プログラムにより表示される領域42、43とを表している。領域41はブラウザコンポーネントにより表示されたWebページの一例を表している。領域42はURLなどを入力として検査支援プログラムにより表示されたWebページに貼られている画像と、その画像の代替文字列との対応関係を示す情報の一例を表している。領域43は検査支援プログラムによりテキストで表示されたHTML文書の一例を表している。
【0032】
図4は、本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。検査支援プログラムは例えばブラウザ用のツールバーとしてBHO(Browser Helper Object)により実装された形態である。
【0033】
図4の画面イメージはブラウザコンポーネントにより表示される領域51と、検査支援プログラムにより表示される領域52、53とを表している。領域51はブラウザコンポーネントにより表示されたWebページの一例を表している。領域52は検査支援プログラムにより表示されたブラウザのツールバーの一例を表している。
【0034】
領域53は例えばツールバー内の検査ボタン等をクリックすることで検査支援プログラムにより表示されたWebページに貼られている画像と、その画像の代替文字列との対応関係を示す情報の一例を表している。領域53は例えば領域51と別ウインドウに表示されている。
【0035】
図5は、本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例の画面イメージ図である。検査支援プログラムは単体の形態であり、ブラウザコンポーネントを内包していない。図5の画面イメージは検査支援プログラムにより表示される領域61を表している。領域61はURLなどを入力として検査支援プログラムにより表示されたWebページに貼られている画像と、その画像の代替文字列との対応関係を示す情報の一例を表している。
【0036】
図6は、本実施例の検査支援プログラムが利用されるソフトウェア構成を説明するための一例のイメージ図である。検査支援プログラムは例えばクローラ(Crawler)として実装された形態である。クローラはロボットとも呼ばれ、インターネット内のHTMLのリンクを辿ってWebページを周期的に取得する。
【0037】
検査支援プログラムは取得したWebページに貼られている画像と、その画像の代替文字列との対応関係を検査し、Webページに貼られている画像と、その画像の代替文字列との対応関係を示す情報をサーバ等に格納していく。
【0038】
例えばWebアクセシビリティを診断したい会社等がある場合には、その会社のURLドメインを元にリンクを辿り、その会社のWebページに貼られている画像と、その画像の代替文字列との対応関係を検査し、Webページに貼られている画像と、その画像の代替文字列との対応関係を示す情報から、その会社のWebアクセシビリティを診断することができる。
【実施例1】
【0039】
図7は本実施例の検査支援装置の一実施例のブロック構成図である。検査支援装置70は、HTML文書入力部71、HTML文書解析部72、画像取得部73、文字取得部74、画像前処理部75、文字認識処理部76、評価部77、評価結果出力部78、画像前処理リスト記録部81、取得文字記録部82、文字認識結果記録部83を有する。
【0040】
HTML文書入力部71はインターネット等からHTML文書を入力される。HTML文書解析部72は入力されたHTML文書を解析する。画像取得部73はHTML文書の解析結果に基づき、Webページに貼られている画像をインターネットや補助記憶装置35等から取得する。文字取得部74はHTML文書の解析結果に基づき、画像の代替文字列、近辺文字列、リンク先のHTMLタイトルなどを取得する。
【0041】
画像前処理部75は、画像取得部73が取得した画像を、画像前処理リストに従って前処理する。ここで前処理とは、より良い文字認識(OCR)結果を得る為の画像に対する処理である。前処理には、画像拡大、モノクロ化、コントラストアップ、グレースケール化、OCRライブラリの選択などがある。
【0042】
文字認識処理部76はOCRライブラリを呼び出し、画像前処理リストに従って前処理を行ったあとの画像各々にOCRを掛ける。評価部77は後述のようにOCR結果の評価を行い、画像の代替文字列に最も近いOCR結果を採用する。評価部77は画像のOCR結果である文字列と画像の代替文字列とを対応付ける。なお、評価部77はOCR結果である文字列を補完する情報として、後述のように、近辺文字列やリンク先のHTMLタイトルを利用するようにしてもよい。
【0043】
評価結果出力部78は画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報を出力する。なお、評価結果出力部78は、近辺文字列やリンク先のHTMLタイトルを利用する場合、画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報に加えて、近辺文字列やリンク先のHTMLタイトルを出力するようにしてもよい。
【0044】
画像前処理リスト記録部81は画像前処理リストを記録する。取得文字記録部82は文字取得部74が取得した画像の代替文字列、近辺文字列、リンク先のHTMLタイトルなどの文字を記録する。文字認識結果記録部83は前処理を行ったあとの画像各々のOCR結果を記録する。
【0045】
図8は画像前処理リストの一例の構成図である。画像前処理リストは、より良いOCR結果を得る為の画像に対する前処理の処理内容リストである。例えば図8の画像前処理リストは画像拡大率(100%、200%、300%、400%)と、モノクロ化と、コントラストUP(50%、100%)と、グレースケール化と、OCRライブラリとの組み合わせによる前処理の処理内容リストである。例えば画像前処理部75は図8の画像前処理リストに表される前処理を行う。そして、文字認識処理部76は図8の画像前処理リストに従って前処理を行ったあとの画像各々にOCRを掛ける。
【0046】
図9は本実施例の検査支援装置の処理手順の一例を表したフローチャートである。図9のステップS1において、HTML文書入力部71は検査対象となるHTML文書を入力される。ステップS2において、HTML文書解析部72はステップS1で入力されたHTML文書を解析する。
【0047】
ステップS3において、画像取得部73はHTML文書の解析結果に基づき、Webページに貼られている画像を一つずつ取得する。ステップS4において、文字取得部74は未処理の画像の有無、言い換えればステップS3で未処理の画像を取得できたか否かを判定する。
【0048】
未処理の画像があれば、文字取得部74はステップS5において、HTML文書の解析結果に基づき、画像の代替文字列を取得する。画像の代替文字列はALTタグに設定されている。
【0049】
ステップS6において、画像前処理部75は画像取得部73が取得した画像を、画像前処理リストに従って前処理する。ステップS6では、画像拡大、モノクロ化、コントラストアップ、グレースケール化などを組み合わせた前処理の数だけ前処理済みの画像が生成される。
【0050】
ステップS7において、文字認識処理部76はOCRライブラリを呼び出し、画像前処理リストに従って前処理を行ったあとの前処理済みの画像各々にOCRを掛ける。評価部77はステップS8において、前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を採用する。なお、前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を判定する処理は既存の技術を利用できる。
【0051】
ステップS8の処理後、ステップS3において、画像取得部73はHTML文書の解析結果に基づき、Webページに貼られている画像を一つずつ取得する。ステップS4において、文字取得部74は未処理の画像の有無を判定する。
【0052】
未処理の画像がある場合は上記したステップS5〜S8の処理を繰り返す。未処理の画像がなければ、評価結果出力部78はステップS9において、評価部77がステップS8で採用したOCR結果の文字列と、画像の代替文字列との対応関係を示す情報として、画像のOCR結果である文字列と、画像の代替文字列とを対応付けて出力する。例えば評価結果出力部78が出力する画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報の一例としては、図3〜図5に示した画面イメージがある。
【0053】
図9に示すフローチャートの処理によれば、画像として表された文字列をOCRにより文字認識し、画像のOCR結果である文字列と、画像の代替文字列とを対応付けて出力することにより、その画像にALTタグなどで付与されている代替文字列が適切であるかの検査を支援することができる。
【0054】
なお、Webページに貼られている画像内の文字は小さいことが多い。図10はWebページに貼られている画像の一例のイメージ図である。図10の画像2が184×101ピクセルである場合、画像2内の文字は大きいものでも高さが14ピクセルしかないために、OCRに掛けても文字が小さすぎて認識率が非常に低い。
【0055】
ところで、画像2は拡大、モノクロ化、コントラストアップ、グレースケール化などの前処理をした後でOCRに掛けることで認識率が高まる。しかし、画像2は適切な前処理を行わなければ、逆に認識率が低くなることもある。そこで、本実施例の検査支援装置70は画像前処理リストに従った前処理済みの画像各々にOCRを掛け、OCR結果である文字列から画像2の代替文字列に最も近いOCR結果の文字列を採用することで、結果として適切な前処理を行ったOCR結果を採用している。
【0056】
図11はHTML文書に含まれるIMGタグの一例のイメージ図である。図11に示したIMGタグ4はALTタグにより代替文字列「新発売 キャンペーン実施中 ○○○○BOOK ○○ Series ○○○直販 ×××××」が設定されている。
【0057】
本実施例の検査支援装置70は画像2の代替文字列「新発売 キャンペーン実施中 ○○○○BOOK ○○ Series ○○○直販 ×××××」に最も近いOCR結果の文字列を採用することにより、結果として適切な前処理を行ったOCR結果を採用している。
【0058】
また、本実施例の検査支援装置70は画像2のOCR結果である文字列を補完する情報として、HTML要素におけるIMGタグ近辺の文字列(近辺文字列)やリンク先のHTMLタイトルを図12に示すように利用できる。図12は本実施例の検査支援装置の処理手順の他の例を表したフローチャートである。なお、図12のフローチャートは一部を除いて図9のフローチャートと同様であるため、適宜説明を省略する。
【0059】
ステップS11〜S14の処理は図9のステップS1〜S4の処理と同様である。未処理の画像があれば、文字取得部74はステップS15において、HTML文書の解析結果に基づき、画像の代替文字列、近辺文字列、リンク先のHTMLタイトルを取得する。
【0060】
ステップS16において、画像前処理部75は画像取得部73が取得した画像を、画像前処理リストに従って前処理する。ステップS17において、文字認識処理部76はOCRライブラリを呼び出し、画像前処理リストに従って前処理を行ったあとの前処理済みの画像各々にOCRを掛ける。評価部77はステップS18において、前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を採用する。
【0061】
ステップS18の処理後、ステップS13において、画像取得部73はHTML文書の解析結果に基づき、Webページに貼られている画像を一つずつ取得する。ステップS14において、文字取得部74は未処理の画像の有無を判定する。未処理の画像がある場合は上記したステップS15〜S18の処理を繰り返す。
【0062】
未処理の画像がなければ、評価結果出力部78はステップS19において、評価部77がステップS18で採用したOCR結果の文字列と、近辺文字列と、リンク先のHTMLタイトルと、画像の代替文字列との対応関係を示す情報として、画像のOCR結果である文字列と、近辺文字列と、リンク先のHTMLタイトルと、画像の代替文字列とを対応付けて出力する。
【0063】
なお、近辺文字列と、リンク先のHTMLタイトルとは、必ずしも両方が必要という訳でなく、どちらか一方であってもよい。例えば近辺文字列の優先順位を高く、リンク先のHTMLタイトルの優先順位を低く設定しておき、リンク先のHTMLタイトルは近辺文字列が無いとき等に利用するようにしてもよい。
【0064】
図12に示すフローチャートの処理によれば、画像として表された文字列をOCRにより文字認識し、画像のOCR結果である文字列と、近辺文字列と、リンク先のHTMLタイトルと、画像の代替文字列とを対応付けて出力することにより、その画像にALTタグなどで付与されている代替文字列が適切であるかの検査を支援することができる。
【0065】
図13は画像のHTML要素におけるIMGタグ近辺の文字列(近辺文字列)について説明する為のイメージ図である。図13(A)はWebページ100に貼られている画像101の一例のイメージ図である。また、図13(B)はHTML文書に含まれる近辺文字列の一例のイメージ図である。
【0066】
図13(B)には、IMGタグ近辺の文字列として「Scan○○○○と連携したソフトウェア/ハードウェアをご紹介」が設定されている。本実施例の検査支援装置70は画像101の近辺文字列「Scan○○○○と連携したソフトウェア/ハードウェアをご紹介」を、画像101のOCR結果である文字列を補完する情報として利用できる。
【0067】
IMGタグ近辺の文字列は画像データ付近の文字列データの一例である。図13の例ではIMGタグと同じDIVタグ内のPタグの文字列データを利用している。IMGタグ近辺の文字列とは例えばIMGタグと同一階層のタグの文字列データをいう。
【0068】
図14はリンク先のHTMLタイトルについて説明する為のイメージ図である。例えば図14(A)のWebページ110には、リンクのあるバナーなどの画像111が貼られている。図14(B)は画像111のリンク先のWebページ112である。また、図14(C)はリンク先のWebページ112のHTMLタイトル113である。本実施例の検査支援装置70は画像111のリンク先のWebページ112のHTMLタイトル113を、画像111のOCR結果である文字列を補完する情報として利用できる。
【0069】
図9のステップS8、図12のステップS18における、前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を採用する処理の一例について更に説明する。
【0070】
評価部77は、例えば前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列として、完全一致するもの、代替文字列がOCR結果である文字列に部分一致するもの、OCR結果である文字列が代替文字列に部分一致するもの、代替文字列とOCR結果である文字列との編集距離(レーベルシュタイン)が最も小さいもの、を採用する。
【0071】
例えば完全一致するOCR結果である文字列と代替文字列とは、部分一致するものと比べて一致度が高いものと評価することができる。また、編集距離が小さいOCR結果である文字列と代替文字列とは、編集距離が大きいものと比べて一致度が高いものと評価することができる。
【0072】
このようなOCR結果である文字列と代替文字列との一致度の評価は、例えば評価結果出力部78が出力する画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報に含ませることができる。
【0073】
その他、評価結果出力部78が出力する画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報には、画像のOCR結果である文字列と画像の代替文字列とを一つ対応付けた結果と、画像のOCR結果である文字列と、OCR結果である文字列の一致度の評価である認識信頼度とを含ませることができる。
【0074】
また、評価結果出力部78が出力する画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報には、画像のOCR結果である文字列と画像の代替文字列とを複数対応付けた結果と、画像のOCR結果である文字列群と、OCR結果である文字列の一致度の評価である認識信頼度群と、選択した前処理と、選択した文字列タイプ(代替文字列、近辺文字列、リンク先のHTMLタイトル)を含ませることができる。
【実施例2】
【0075】
実施例1の検査支援装置70は画像の代替文字列がALTタグにより付与されていることを前提としてものである。しかし、画像の代替文字列は付与されていないことも考えられる。そこで、実施例2の検査支援装置70Aは画像の代替文字列が付与されていない場合にも対処できるようにする。
【0076】
図15は本実施例の検査支援装置の他の実施例のブロック構成図である。検査支援装置70Aは、HTML文書入力部71、HTML文書解析部72、画像取得部73、文字取得部74、画像前処理部75、文字認識処理部76、評価部77、評価結果出力部78、代替文字列設定部79、画像前処理リスト記録部81、取得文字記録部82、文字認識結果記録部83を有する。
【0077】
図15の検査支援装置70Aは図7の検査支援装置70の構成と一部を除いて同様であるため、適宜説明を省略する。HTML文書入力部71、HTML文書解析部72、画像取得部73、文字取得部74、画像前処理部75、文字認識処理部76は図7の検査支援装置70と同様であり、説明を省略する。
【0078】
評価部77は画像に代替文字列が付与されている場合、代替文字列を用いてOCR結果の評価を行い、画像の代替文字列に最も近いOCR結果を採用する。また、評価部77は画像に代替文字列が付与されていない場合、IMGタグ近辺の文字列(近辺文字列)を用いてOCR結果の評価を行い、近辺文字列に最も近いOCR結果を採用する。また、評価部77は画像に代替文字列が付与されておらず、且つ、近辺文字列が無い場合、リンク先のHTMLタイトルを用いてOCR結果の評価を行い、リンク先のHTMLタイトルに最も近いOCR結果を採用する。
【0079】
なお、近辺文字列又はリンク先のHTMLタイトルを用いたOCR結果の評価は順序を入れ替えてもよい。しかし、近辺文字列が無い場合、リンクを張られている可能性が高いことを考慮すると、OCR結果の評価は近辺文字列を先に用いることが望ましい。
【0080】
評価部77は画像に代替文字列が付与されている場合、画像のOCR結果である文字列と画像の代替文字列とを対応付ける。画像に代替文字列が付与されていない場合、代替文字列設定部79は近辺文字列又はリンク先のHTMLタイトルを用いて採用した画像のOCR結果である文字列を、画像の代替文字列として新たに設定する。そして、評価部77は画像のOCR結果である文字列と新たに設定した画像の代替文字列とを対応付ける。
【0081】
評価結果出力部78は画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報を出力する。なお、評価結果出力部78は、近辺文字列やリンク先のHTMLタイトルを利用した場合、画像のOCR結果である文字列と画像の代替文字列との対応関係を示す情報に加えて、近辺文字列やリンク先のHTMLタイトルを出力するようにしてもよい。画像前処理リスト記録部81、取得文字記録部82、文字認識結果記録部83は図7の検査支援装置70と同様であり、説明を省略する。
【0082】
図15の検査支援装置70Aは例えば図16に示す手順で処理を行う。図16は本実施例の検査支援装置の処理手順の他の例を表したフローチャートである。なお、図16に示すフローチャートの処理は図12に示すフローチャートの処理と一部を除いて同様であるため、適宜説明を省略する。ステップS21〜S27の処理は図12のフローチャートと同様であり、説明を省略する。
【0083】
ステップS28において、評価部77はステップS25の処理結果に基づき、画像に代替文字列があるか否かについて判定する。画像に代替文字列があれば、ステップS29において、評価部77は前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を採用する。
【0084】
画像に代替文字列がなければ、ステップS30において、評価部77はIMGタグ近辺の文字列(近辺文字列)があるか否かについて判定する。近辺文字列があれば、ステップS31において、評価部77は近辺文字列を用いてOCR結果の評価を行い、近辺文字列に最も近いOCR結果を採用する。
【0085】
近辺文字列がなければ、ステップS32において、評価部77はリンク先のHTMLタイトルを用いてOCR結果の評価を行い、リンク先のHTMLタイトルに最も近いOCR結果を採用する。ステップS31、S32の処理後、ステップS33において、代替文字列設定部79は近辺文字列又はリンク先のHTMLタイトルを用いて採用した画像のOCR結果である文字列を、画像の代替文字列として新たに設定する。
【0086】
ステップS29、S33の処理後、ステップS23において、画像取得部73はHTML文書の解析結果に基づき、Webページに貼られている画像を一つずつ取得する。ステップS24において、文字取得部74は未処理の画像の有無を判定する。
【0087】
未処理の画像がある場合は上記したステップS25〜S33の処理を繰り返す。未処理の画像がなければ、評価結果出力部78はステップS34において、評価部77が採用したOCR結果の文字列と、画像の代替文字列との対応関係を示す情報として、画像のOCR結果である文字列と、画像の代替文字列とを対応付けて出力する。
【0088】
図16に示すフローチャートの処理によれば、画像として表された文字列をOCRにより文字認識し、画像に代替文字列があれば、前処理済みの画像各々のOCR結果である文字列から画像の代替文字列に最も近いOCR結果の文字列を採用できる。また、画像に代替文字列がなければ、前処理済みの画像各々のOCR結果である文字列から近辺文字列又はリンク先のHTMLタイトルに最も近いOCR結果の文字列を採用できる。
【0089】
また、図16に示すフローチャートの処理によれば、画像の代替文字列がALTタグにより付与されていなくても、近辺文字列又はリンク先のHTMLタイトルを用いて採用した画像のOCR結果である文字列を、画像の代替文字列としてALTタグに新たに設定できる。
【0090】
さらに、図16に示すフローチャートの処理によれば、画像のOCR結果である文字列と、画像の代替文字列とを対応付けて出力することにより、その画像にALTタグなどで付与されている代替文字列が適切であるかの検査を支援することができる。
【0091】
なお、ステップS31の近辺文字列評価処理、ステップS32のリンク先文字列評価処理において、前処理済みの画像各々のOCR結果である文字列から最も近いOCR結果の文字列を判定する処理は、例えば以下のように行う。ここでは一例としてステップS31の近辺文字列評価処理において、前処理済みの画像各々のOCR結果である文字列から最も近いOCR結果の文字列を判定する処理について説明する。
【0092】
評価部77は、例えば図13(A)のWebページ100に貼られている画像101の近辺文字列「Scan○○○○と連携したソフトウェア/ハードウェアをご紹介」を利用する。評価部77は、近辺文字列を形態素解析して品詞「Scan○○○○」「連携」「ソフトウェア」「ソフト」「ハードウェア」「ハード」「紹介」に分類する。評価部77はOCR結果である文字列と、近辺文字列を形態素解析した品詞とを比較することで、OCR結果である文字列と近辺文字列との一致度を評価できる。
【0093】
以上、本実施例によれば、Webページ1に貼られている画像2のOCR結果である文字列3、近辺文字列、リンク先のHTMLタイトルなどを利用して、画像2の代替文字列が適切に付与されているかの検査を支援できる。また、本実施例によれば、Webページ1に貼られている画像2の代替文字列が付与されていなくても、近辺文字列又はリンク先のHTMLタイトルを用いて採用した画像のOCR結果である文字列を、画像の代替文字列として新たに設定できる。
【0094】
本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、
処理をコンピュータに実行させる検査支援プログラム。
(付記2)
前記出力する処理は、前記画像データの代替情報と、前記取得した文字認識結果とに、前記コンテンツデータに更に含まれる前記画像データ付近の文字列データを更に対応付けて出力する
ことを特徴とする付記1記載の検査支援プログラム。
(付記3)
前記出力する処理は、前記画像データの代替情報と前記文字認識結果とに、前記コンテンツデータに更に含まれる、前記画像データと関連付けられたリンクデータに基づき他のコンテンツデータを取得し、該取得した他のコンテンツデータに含まれるタイトルデータを更に対応付けて出力する
ことを特徴とする付記1又は2記載の検査支援プログラム。
(付記4)
前記コンテンツデータに前記画像データの代替情報が含まれていないとき、前記文字認識結果を前記画像データの代替情報として前記コンテンツデータに設定する
処理を更にコンピュータに実行させる付記1乃至3何れか一項記載の検査支援プログラム。
(付記5)
前記画像データの代替情報と前記文字認識結果とを比較して一致度を評価する
処理を更にコンピュータに実行させ、
前記出力する処理は、前記画像データの代替情報と、前記取得した文字認識結果とに、前記一致度の評価を更に対応付けて出力する
ことを特徴とする付記1乃至4何れか一項記載の検査支援プログラム。
(付記6)
前記画像データを文字認識する処理は、記録部に記録されている画像前処理リストに基づき前処理を行ったあとの前記画像データ各々を文字認識し、
前記画像データの代替情報に最も近い前記文字認識結果を採用して、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、
ことを特徴とする付記5記載の検査支援プログラム。
(付記7)
コンピュータによって実行される検査支援方法であって、
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、
ことを特徴とする検査支援方法。
(付記8)
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得する文字認識手段と、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する出力手段と、
を有することを特徴とする検査支援装置。
【0095】
本実施例における検査支援プログラムは、パッケージソフトの他、WEBサービス等によっても提供可能である。なお、上記の特許請求の範囲に記載した文字認識手段は例えば文字認識処理部76に相当し、出力手段は例えば評価結果出力部78に相当する。
【符号の説明】
【0096】
1、100、110、112 Webページ
2、101、111 画像
3 文字列
4 IMGタグ
10 コンピュータ
21 入力装置
22 表示装置
23 コンピュータ本体
31 主記憶装置
32 演算処理装置
33 インタフェース装置
34 記録媒体読取装置
35 補助記憶装置
36 記録媒体
37 バス
41〜43、51〜53、61 領域
70、70A 検査支援装置
71 HTML文書入力部
72 HTML文書解析部
73 画像取得部
74 文字取得部
75 画像前処理部
76 文字認識処理部
77 評価部
78 評価結果出力部
79 代替文字列設定部
81 画像前処理リスト記録部
82 取得文字記録部
83 文字認識結果記録部
113 HTMLタイトル

【特許請求の範囲】
【請求項1】
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、
処理をコンピュータに実行させる検査支援プログラム。
【請求項2】
前記出力する処理は、前記画像データの代替情報と、前記取得した文字認識結果とに、前記コンテンツデータに更に含まれる前記画像データ付近の文字列データを更に対応付けて出力する
ことを特徴とする請求項1記載の検査支援プログラム。
【請求項3】
前記出力する処理は、前記画像データの代替情報と前記文字認識結果とに、前記コンテンツデータに更に含まれる、前記画像データと関連付けられたリンクデータに基づき他のコンテンツデータを取得し、該取得した他のコンテンツデータに含まれるタイトルデータを更に対応付けて出力する
ことを特徴とする請求項1又は2記載の検査支援プログラム。
【請求項4】
前記コンテンツデータに前記画像データの代替情報が含まれていないとき、前記文字認識結果を前記画像データの代替情報として前記コンテンツデータに設定する
処理を更にコンピュータに実行させる請求項1乃至3何れか一項記載の検査支援プログラム。
【請求項5】
コンピュータによって実行される検査支援方法であって、
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得し、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する、
ことを特徴とする検査支援方法。
【請求項6】
画像データを含むコンテンツデータに含まれる前記画像データを文字認識して文字認識結果を取得する文字認識手段と、
前記コンテンツデータに前記画像データの代替情報が更に含まれているとき、前記画像データの代替情報と前記文字認識結果とを対応付けて出力する出力手段と、
を有することを特徴とする検査支援装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2012−118737(P2012−118737A)
【公開日】平成24年6月21日(2012.6.21)
【国際特許分類】
【出願番号】特願2010−267534(P2010−267534)
【出願日】平成22年11月30日(2010.11.30)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】