説明

ドキュメントを理解する難易度を評価するシステムおよびその方法

【課題】スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、精度よく評価する。
【解決手段】スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価するシステムであって、ページの特徴を示す特徴量に基づいて当該ページの難易度の評価値を算出する評価関数を記録する第1関数記録部と、評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を利用者から収集する収集部と、利用者から収集した特徴量および評価値に基づいて、第1関数記録部に記録された評価関数を、利用者の評価により近い評価値を出力するように更新する第1更新部とを備えるシステム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ドキュメントを理解する難易度を評価するシステムおよびその方法に関する。特に、本発明は、スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価するシステムに関する。
【背景技術】
【0002】
近年、視覚障害者がテキストデータを音声によって理解するために、スクリーンリーダ(音声読み上げシステム)が用いられている。スクリーンリーダは、ドキュメント内のテキストデータを音声データに変換して利用者に出力する。利用者は、画面を見ることなく音声データを聞くことによってドキュメントの内容を理解できる。しかしながら、ベクトルグラフィックスを構成するドキュメントは、スクリーンリーダを用いたとしてもその内容を理解するのは難しい場合がある。
【0003】
ベクトルグラフィックスの内容理解に関する技術を以下に示す。まず、従来、ある種のスクリーンリーダは、ページ中の表示オブジェクト(或いはその代替テキスト)をZオーダーに従って読み上げる(非特許文献1および2を参照。)。Zオーダーとは、複数の表示オブジェクトを重ね合わせて表示する場合の表示優先順序である。晴眼者には、表示優先順序がより高い表示オブジェクトは手前側に、表示優先順序がより低い表示オブジェクトは奥側に表示されているように見える。この技術によれば、表示オブジェクトを読み上げる一定の順序を定めることはできるが、Zオーダーの順序で読み上げてもページ全体を理解し易いとは限らない。
【0004】
また、従来、ドキュメントに対して画像処理を行うことにより、ドキュメントの構造を解析する技術が提案されている(特許文献1および2を参照。)。この技術によれば、複雑な構造やグラデーションなどの色情報を用いて表現されたドキュメントを音声データに変換することができる。しかしながら、これらの技術を適用可能とするためにはドキュメントが一定の定型的な構造を有する必要があり、一般的なドキュメントに広く適用することはできない。
【0005】
また、表示オブジェクトの画面中の表示位置に応じた音場を生成する技術が提案されている(特許文献3を参照。)。この技術は、文字の大きさやフォントなどに応じた音質の音声を、その文字が表示される画面中の相対位置に対応する音響空間上の位置に発生させる。しかしながら、音響によって知覚できる位置情報の解像度は視覚と比較して著しく低く、この技術のみによってグラフィックスの内容を理解するのは難しい場合がある。また、音声以外を用いる技術として、2次元のピンディスプレイが用いられているが(特許文献4を参照。)、人の指先の分解能は低く、視覚情報と同等の情報を得るのは困難である。
【0006】
【特許文献1】特開平5−342326号公報
【特許文献2】特開平6−68300号公報
【特許文献3】特開平8−263260号公報
【特許文献4】特開平10−232600号公報
【非特許文献1】Jaws, http://www.freedomscientific.com/fs_products/software_jaws.asp
【非特許文献2】WindowEyes, http://www.gwmicro.com/products/
【非特許文献3】Valbo, A. B. & Johanson, R. S. The tactile sensory innervation of glabrous skin of the human hand. In G. Gordon (Ed.), Active Touch. 2954,Pergamon Press, 1978.
【非特許文献4】Shardanand, U. and Maes, P. Social information filtering: Algorithms for automating "word of mouth."In Proceedings of the 1995 ACM Conference on Human Factors in Computing Systems.
【発明の開示】
【発明が解決しようとする課題】
【0007】
以上で述べたように、現状の技術水準では、視覚障害者がグラフィックスの内容を理解するのは難しい場合が多い。一方で、ドキュメントが複数のページを含む場合、ページによっては理解容易な場合もある。どのページが理解容易かを知るためには、視覚障害者はやはりスクリーンリーダを用いてそれぞれのページの理解を試みなければならず、膨大な時間と手間がかかる。
【0008】
なお、HTML(Hyper Text Markup Language)のドキュメントに関しては、情報取得の難易度を評価するガイドラインが設定されている。例えば、W3C(The World Wide Web Consortium)のWAI(Web Accessibility Initiative)によるWCAG(Web Content Accessibility Guidelines)がこれに該当する。HTMLのドキュメントは、タグと呼ばれるメタ情報を含む。そして、タグとタグとの関係によって情報の構造が定義される。タグによって定義された構造がガイドラインに準拠していれば、視覚障害者であっても内容理解が容易な場合が多く、当該構造がガイドラインに準拠していなければ、視覚障害者にとって理解が困難な場合が多い。即ち、HTMLドキュメントに関しては、各ページをスクリーンリーダで読み上げさせなくとも、ある程度の精度で難易度を知ることはできる。
【0009】
しかしながら、プレゼンテーション用ソフトウェアなどで作成された一般のグラフィックスは、HTMLドキュメントなどのタグを含んでいない場合が多い。このような場合には、難易度の評価に上記のガイドラインを応用することは難しい。また、HTMLのドキュメントは、少なくともHTMLで記述されているという統一性があるのに対し、一般のグラフィックスは、多数の種類のソフトウェアで作成され得るため統一性が無い。このため、それら何れのソフトウェアで作成されたグラフィックスに対しても難易度を統一的に判断できる基準を作成することは困難である。また、スクリーンリーダの種類も多岐に渡るため、ドキュメント作成者にとってもどのようなドキュメントを作成すべきか判断が難しい場合が多い。
【0010】
なお、参考技術として、利用者の好みに基づいてその利用者による情報の評価を推定する技術が提案されている(非特許文献4を参照。)。この技術は、ある利用者Aと好みが近似する複数の利用者について、当該複数の利用者による評価に基づいて当該利用者Aの評価を推定するものである。しかしながら、この文献は、未知の評価を推定するための一般的な考え方を示しているのに過ぎず、それを視覚障害者向けのドキュメントに応用する具体的な方法については言及していない。例えば、利用者の好みという分類はドキュメントの理解のし易さには影響しない場合が多いと考えられる。
【0011】
そこで本発明は、上記の課題を解決することのできるシステム、方法およびプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
【課題を解決するための手段】
【0012】
上記課題を解決するために、本発明の1つの形態においては、スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価するシステムであって、ページの特徴を示す特徴量に基づいて当該ページの難易度の評価値を算出する評価関数を記録する第1関数記録部と、評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を利用者から収集する収集部と、利用者から収集した特徴量および評価値に基づいて、第1関数記録部に記録された評価関数を、利用者の評価により近い評価値を出力するように更新する第1更新部とを備えるシステムを提供する。また、当該システムによって難易度を評価する方法、および、当該システムとして情報処理装置を機能させるプログラムを提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【発明の効果】
【0013】
本発明によれば、スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、精度よく評価することができる。
【発明を実施するための最良の形態】
【0014】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0015】
図1は、情報処理システム10の全体構成を示す。情報処理システム10は、サーバ装置20と、複数の利用者端末30とを備える。サーバ装置20は、ドキュメントに含まれるそれぞれのページの特徴を示す特徴量を算出するための算出プログラムを、それぞれの利用者端末30に配信する。また、サーバ装置20は、スクリーンリーダによってドキュメントの内容を理解する難易度の評価値を算出するための評価関数を、それぞれの利用者端末30に配信する。
【0016】
複数の利用者端末30のそれぞれは複数の利用者のそれぞれに対応付けられており、ドキュメントの内容を音声として出力するスクリーンリーダを備えている。それぞれの利用者端末30は、利用者により指定されたドキュメントに含まれるそれぞれのページの評価値を、サーバ装置20から配信を受けた算出プログラムおよび評価関数を用いて算出し、利用者に出力する。これにより、利用者は、ドキュメントの読み上げに先立って、各ページの内容理解の難易度を知ることができ、実際の読み上げさせるべきページを効率的に取捨選択できる。
【0017】
図2は、サーバ装置20の機能構成を示す。サーバ装置20は、第1関数記録部200と、配信部210と、収集部220と、評価値DB230と、第1更新部240とを有する。第1関数記録部200は、ページの特徴量に基づいてそのページの難易度の評価値を算出する評価関数を、その評価関数を用いる利用者のユーザプロファイルに対応付けて記録している。利用者のユーザプロファイルは、例えば、その利用者が使用するスクリーンリーダの種類、または、その利用者が理解しようとするドキュメントを作成した作成システムの種類を含む。
【0018】
配信部210は、第1関数記録部200に記録されている評価関数を、それぞれの利用者端末30に配信する。ある利用者に配信される評価関数は、その利用者のユーザプロファイルに対応したものである。また、配信部210は、後述の第1更新部240によって評価関数が更新される毎に、更新されたその評価関数を複数の利用者端末30のそれぞれに配信して、利用者端末30の第2関数記録部320に記録させる。また、配信部210は、特徴量を算出するための算出プログラムを管理者から取得したことに応じ、その算出プログラムを複数の利用者端末30のそれぞれに配信してもよい。
【0019】
収集部220は、評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を、当該利用者のユーザプロファイルに対応付けて利用者から収集する。具体的には、収集部220は、利用者端末30に記録された評価値の数が所定の基準に達したときに、または、それに関わらず定期的に、評価値および特徴量を収集してもよい。
【0020】
評価値DB230は、収集部220がそれぞれの利用者から収集した評価値および特徴量を、ユーザプロファイルに対応付けて記録する。第1更新部240は、ユーザプロファイル毎に、そのユーザプロファイルに対応付けて収集した評価値および特徴量に基づき、当該ユーザプロファイルに対応する評価関数を第1関数記録部200において更新する。また、サーバ装置20は、性能評価部250を有してもよい。性能評価部250は、収集部220によって収集された評価値に基づいて、それぞれの種類のスクリーンリーダの性能の高さを評価する。例えば、性能評価部250は、ある種類のスクリーンリーダに対応する評価値が他の種類のスクリーンリーダに対応する評価値よりも平均的に高い場合には、その種類のスクリーンリーダの性能は高いと評価してもよい。
【0021】
図3は、利用者端末30の機能構成を示す。利用者端末30は、スクリーンリーダとしての機能の他、音声出力による内容理解の難易度を評価する機能を有する。具体的には、ドキュメントDB300と、特徴量算出部310と、第2関数記録部320と、難易度評価部330と、入力部340と、評価値DB350と、第2更新部360とを有する。ドキュメントDB300は、ドキュメントの作成システムによって作成されたドキュメントを記録する。このドキュメントは複数のページを含み、それぞれのページの構成は異なっていてもよい。また、それぞれのページは、テキストのみならずグラフィックスを含んでよい。グラフィックスは更に複数の表示オブジェクトを含んでよい。
【0022】
特徴量算出部310は、利用者によるページの指定に応じ、指定された当該ページの特徴を示す特徴量を算出する。この特徴量は、指定された当該ページに含まれる複数の表示オブジェクトを予め定められた順序で走査した軌跡に基づいて算出されてもよい。第2関数記録部320は、配信部210から配信を受けることにより第1関数記録部200から評価関数を取得し、取得したその評価関数を記録する。難易度評価部330は、特徴量算出部310によって算出された特徴量をその評価関数に与えることによって当該ページの評価値を算出して利用者に出力する。評価値は、スクリーンリーダによるドキュメントの読み上げに先立って利用者に対し出力されることが望ましい。入力部340は、難易度評価部330によって算出された評価値と利用者による困難性の評価とが異なることを条件に、利用者が評価した困難性の評価値の入力を受け付ける。
【0023】
評価値DB350は、それぞれのページについて利用者から入力された評価値を、そのページの特徴量に対応付けて記録する。また、評価値DB350は、本発明に係るページ記録部の一例であり、算出した評価値と利用者による困難性の評価とが異なる複数のページのそれぞれを、そのページについて入力部340が入力を受けた評価値に対応付けて記録してもよい。第2更新部360は、それぞれのページについて入力された評価値とそのページの特徴量とに基づいて、第2関数記録部320に記録された評価関数を、利用者の評価により近い評価値を出力するように更新する。
【0024】
図4は、評価値DB230のデータ構造の一例を示す。評価値DB230は、それぞれの利用者端末30から収集部220が収集した特徴量および評価値を、収集の対象とした利用者のユーザプロファイルと、当該特徴量を算出するために使用した算出プログラムのバージョンとに対応付けて記録している。図4に例示したユーザプロファイルは、スクリーンリーダの種類と作成システムの種類とを含む。スクリーンリーダとは、必ずしも単体のソフトウェアでなくともよく、ブラウザソフトウェアのプラグインなどの、あるソフトウェアの一部であってもよい。その場合のユーザプロファイルは、そのソフトウェアおよびプラグインのそれぞれを識別可能であることが望ましい。他の例として、スクリーンリーダは、複数のソフトウェアの集合体であってもよい。例えば、スクリーンリーダは、ドキュメントのデータ形式を変換する変換プログラムと、変換後のドキュメントを読み上げる読み上げプログラムとを含んでもよい。その場合のユーザプロファイルは、スクリーンリーダを構成するそれぞれのプログラムを識別可能であることが望ましい。
【0025】
また、評価値DB230に記録される特徴量は、複数の要素を含むベクトルデータであってもよい。ベクトルデータのそれぞれの要素は、同一ページの互いに異なる特徴を示している。また、評価値DB230に記録される評価値は、例えば、音声による理解のしやすさを示す段階を示す。これに代えて、評価値は、理解のしやすさの程度を100点満点で示したような連続値であってもよい。また、算出プログラムのバージョンは、算出プログラムが更新される過渡状態において、新たな算出プログラムまたは既存の算出プログラムの何れによって評価された特徴量であるかを示している。このバージョンの情報を参照する処理については図11で後述する。
【0026】
図5は、難易度評価部330が出力する画面の第1表示例を示す。この第1表示例においてドキュメントはプレゼンテーションパッケージである。このプレゼンテーションパッケージは複数のページを示し、そのページのタイトルが画面上に表示されている。利用者端末30に備わるスクリーンリーダの機能によって、利用者は、このタイトルを音声として読み上げさせることができる。難易度評価部330は、それぞれのページのタイトルに対応付けて、そのページの難易度の評価値を表示する。例えば図5において5starの表示は、内容理解が非常に容易である旨を示す。一方で、1starの表示は、内容理解が非常に困難である旨を示す。
【0027】
図6は、難易度評価部330が出力する画面の第2表示例を示す。この第2表示例は、利用者があるページを指定したときに表示されるポップアップウィンドウを例示する。即ち、難易度評価部330は、利用者によってあるページが指定されると、そのページの評価値およびその意味をポップアップウィンドウ内に表示する。利用者は、ページを指定することにより、実際にページの内容を読み上げさせる前に、そのページの内容理解の困難性を判断できる。
【0028】
図7は、難易度評価部330が出力する画面の第3表示例を示す。この第3表示例は、入力部340が、評価値を変更するための操作を受けたときの画面を示す。入力部340は、評価値を変更するためのメニュー(例えば、ツールバーのeditメニュー)の選択操作を受けると、難易度の評価値を変更するコマンドの候補を表示する。ここでは、Change Star 1などである。入力部340は、それら何れかのコマンドを利用者に選択させることによって、利用者による困難性の評価値の入力を受け付けることができる。
【0029】
図8は、サーバ装置20によって評価値が収集され、評価関数が更新される処理のフローチャートを示す。第1更新部240は、予め定められたサンプルのドキュメントに基づいて評価関数を生成し、第1関数記録部200に記録する(S800)。配信部210は、第1関数記録部200に新たに評価関数が記録されたことを条件に、または、第1関数記録部200に記録された評価関数が更新されたことを条件に、第1関数記録部200に記録された評価関数をそれぞれの利用者端末30に配信する(S810)。収集部220は、難易度評価部330によって算出された評価値と利用者による困難性の評価とが異なることを条件に、入力部340が入力を受けた評価値および特徴量算出部310が算出した特徴量を、それぞれの利用者端末30から収集する(S820)。この収集は、例えば定期的に行われてもよい。
【0030】
第1更新部240は、ユーザプロファイルに対応付けて収集された特徴量および評価値に基づいて、第1関数記録部200に記録された評価関数を、利用者の評価により近い評価値を出力するように更新する(S830)。処理手順の詳細は例えば以下の通りである。第1更新部240は、まず、収集した特徴量および評価値を、ユーザプロファイル毎に分類する。次に、第1更新部240は、分類したそれぞれのグループについて、重回帰分析や機械学習(ニューラルネットワーク、決定木学習、または、サポートベクターマシンなど)によって、収集した特徴量から収集した評価値を算出するために尤もらしい評価関数を生成する。第1更新部240は、生成した評価関数によってもとの評価関数を更新する。
【0031】
配信部210は、特徴量の算出プログラムが更新されたかを判断する(S840)。更新されたことを条件に(S840:YES)、配信部210は、更新されたその算出プログラムを利用者端末30に配信し(S850)、処理をS810に戻す。これによって、評価関数が更新される毎に新たな評価関数が利用者端末30に配信される。
【0032】
図9は、利用者端末30によって評価値が算出して出力される処理のフローチャートを示す。特徴量算出部310は、利用者によるページの指定に応じ、そのページの特徴量を算出する(S900)。特徴量は、指定された当該ページに含まれる複数の表示オブジェクトを予め定められた順序で走査した軌跡に基づいて算出されてもよい。図10にその詳細を示す。
図10は、Zオーダーに従って表示オブジェクトを走査した軌跡を示す。Zオーダーとは、複数の表示オブジェクトを重ね合わせて表示する場合の表示優先順序である。一例として、表示オブジェクトは、その作成順序に従って奥側から手前側に向けて順次重ねて表示される。図10(a)および図10(b)の何れにおいても、矩形や矢印などの図形が表示オブジェクトを示し、それらを結ぶ点線が走査の軌跡を示す。図10(a)において、走査の軌跡は非常に込み入っている。このため、Zオーダーに従って読み上げるスクリーンリーダによれば、表示オブジェクトは、画面上のX方向やY方向の相対位置に関わらず離散的に読み上げられることとなる。この結果、表示オブジェクトの読み上げ順序は、晴眼者が直感的に把握する画面構成と大幅に異なることとなる。一方で、図10(b)において、走査の軌跡は比較的直線的である。この結果、表示オブジェクトの読み上げ順序は、晴眼者が直感的に把握する画面構成に近くなる。
【0033】
以上に例示したような画面の違いを特徴量として検出するために、特徴量算出部310は、複数の表示オブジェクトをZオーダーによって走査した軌跡に基づいて特徴量を算出する。例えば、特徴量は、軌跡の距離と角度とに基づいて算出されてもよい。詳細には以下の通りである。1つの例として、特徴量算出部310は、それぞれの表示オブジェクトについて、当該表示オブジェクトと当該表示オブジェクトの次に走査する他の表示オブジェクトの間の距離を算出する。そして、特徴量算出部310は、算出された距離の合計または平均がより大きい場合に、当該合計または平均がより小さい場合と比較して高い特徴量を算出する。即ち、あるページの走査の軌跡が込み入っていてその合計距離が大きい場合には、内容を理解しにくい恐れのあるページとして特徴的であると評価する。
【0034】
他の例として、特徴量算出部310は、それぞれの表示オブジェクトについて、その表示オブジェクトとその表示オブジェクトの次に走査する他の表示オブジェクトとを結ぶ直線と、当該他の表示オブジェクトと当該他の表示オブジェクトの次に走査する更に他の表示オブジェクトとを結ぶ直線とがなす角度を算出する。そして、特徴量算出部310は、算出された角度の合計または平均の絶対値がより大きい場合に、当該合計または平均の絶対値がより小さい場合と比較して高い特徴量を算出する。特徴量の算出式は、例えば、式(1)の通りである。これにより、図10(a)のような、走査の軌跡が重なり合う場合について高い特徴量を算出し、図10(b)のような、走査の軌跡が重なり合わない場合について低い特徴量を算出できる。
【数1】


【0035】
図10を参照して例示する処理は一例であり、特徴量算出部310は、他の複数の方法によって複数の特徴量を算出し、算出されたそれぞれの特徴量により構成されるベクトルを評価関数に入力してもよい。特徴量の算出方法は例えば以下の通りである。
(1)表示オブジェクトの数やその面積など
特徴量算出部310は、ページ中の表示オブジェクトを複数の種類に分類する。分類の基準は、表示オブジェクトがテキストデータや代替テキストデータを含むか否か、ページタイトルやアウトラインテキストを示すプレースホルダーであるか否かなどである。そして、特徴量算出部310は、分類毎のオブジェクトの数、または、それぞれの分類におけるオブジェクトが画面中で占める面積の割合を特徴量として算出する。これにより、面積の大きい(即ち重要である可能性の高い)オブジェクトが、どのような性質を持つか否かを特徴量として表すことができる。
【0036】
(2)テキストの文字数やフォントの変化量
特徴量算出部310は、ページ中の文字数の総数、または、オブジェクトごとにそのオブジェクトが含む文字数を平均または合計した数を特徴量として算出してもよい。また、特徴量算出部310は、Zオーダーに従って文字オブジェクトを読み上げた結果、読み上げの過程で文字のフォントまたは文字の色が変化した回数を特徴量として算出してもよい。文字数の短い文字列は一般に視覚障害者にとって理解しにくく、また、文字の色やフォントに表された情報は音声データに変換しにくいからである。
【0037】
(3)グルーピング階層ごとでのオブジェクト数や文字数など
表示オブジェクトは、複数の表示オブジェクトをグルーピングすることによって構成される場合がある。即ち、ドキュメント作成者は、複数の表示オブジェクトに対しグルーピング操作を行うことにより、その後これらの複数の表示オブジェクトをあたかも1つの表示オブジェクトであるかのように操作(位置変更、拡大縮小など)することができる。グルーピングは、入れ子状に構成させることもできる。
特徴量算出部310は、あるページに含まれるグループの階層レベル、または、階層レベル毎にその階層レベルに含まれる表示オブジェクトの数や文字数の平均または分散を算出し、それを特徴量として出力してもよい。一般に、階層が深すぎる場合や階層が全く無い場合には視覚障害者にとって理解が難しい場合が多いからである。
【0038】
(4)その他
その他の例として、特徴量算出部310は、ページにアニメーションを含むか否かの情報を特徴量として算出してもよい。また、特徴量算出部310は、表示オブジェクトが重ね合わせて表示されている場合に、その重ね合わせられる面積の合計に基づいて特徴量を算出してもよい。アニメーションが多用されている場合や、オブジェクトが重ね合わせられている場合には、視覚障害者にとって理解が難しい場合が多いからである。
【0039】
図9に戻る。特徴量算出部310は、特徴量の算出プログラムが変更される過渡期においては、S900の処理中に、変更によって生じる不都合を低減させるための処理を別途行う。これについては、図11において詳細に述べる。続いて、難易度評価部330は、特徴量算出部310によって算出された特徴量を、配信を受けた評価関数に与えることによって評価値を算出して(S910)、利用者に出力する(S920)。入力部340は、難易度評価部330によって算出された評価値とは異なる、利用者による困難性の評価値の入力を受け付ける(S930)。
【0040】
評価値の入力を受けたことを条件に(S930:YES)、第2更新部360は、それぞれのページについて入力された評価値とそのページの特徴量とに基づいて、第2関数記録部320に記録された評価関数を、利用者の評価により近い評価値を出力するように更新する(S940)。評価値DB350は、それぞれのページについて利用者から入力された評価値を、そのページの特徴量に対応付けて記録する(S950)。また、評価値DB350は、算出した評価値と利用者による困難性の評価とが異なる複数のページのそれぞれを、そのページについて入力部340が入力を受けた評価値に対応付けて記録してもよい。
【0041】
図11は、S900における処理の詳細を示す。既に第1算出プログラムの配信を受けていた状態において、新たに第2算出プログラムの配信を受けた場合には、既に生成された評価関数をそのまま使用すると不都合が生じる場合がある。このため、評価関数を新たに生成することが望ましいが、新たな評価関数には利用者の評価が反映されていないため、算出される評価値の精度が低い場合がある。このため、第2算出プログラムの配信を受けてから予め定められた基準期間内は算出プログラム変更の過渡期間として、利用者端末30は、以下の処理を行う。
【0042】
特徴量算出部310は、第2算出プログラムの配信を受けたか判断する(S1100)。第2プログラムの配信を受けたことに応じ(S1100:YES)、特徴量算出部310は、第2算出プログラムの配信を受けてから基準期間が経過したかを判断する(S1110)。第2プログラムの配信を受けていなければ、或いは、第2プログラムの配信を受けてから基準期間が経過していれば、特徴量算出部310は、その時点で最新の算出プログラムを用いて特徴量を算出して処理を終了する(S1105)。
【0043】
基準期間が経過していなければ(S1110:NO)、特徴量算出部310は、以下の処理を行う。なお、基準期間が経過する前に更に新たな第2算出プログラムが配信された場合については、もとの第2算出プログラムについての処理を無効とし、当該新たな第2算出プログラムについて以下の処理を行う。
【0044】
まず、特徴量算出部310は、第1算出プログラムにより特徴量を算出する(S1120)。第1算出プログラムによって算出された特徴量は、上述のS910において、難易度評価部330による評価値の算出に用いられる。次に、特徴量算出部310は、第2算出プログラムにより特徴量を算出する(S1130)。特徴量算出部310は、第2算出プログラムにより算出した特徴量を、S910において第1算出プログラムに基づき算出された評価値と、第2算出プログラムのバージョンを示す情報に対応付けてドキュメントDB300に記録する(S1140)。なお、算出された評価値が利用者による評価とは異なるとして新たに評価値の入力を受けた場合には、当該新たな評価値に対応付けて特徴量が記録される。
【0045】
ドキュメントDB300に記録された特徴量、評価値、および、バージョンを示す情報は、例えば定期的に利用者端末30によって収集される。即ち、収集部220は、難易度評価部330により算出された評価値または入力部340が入力を受けた評価値、および、特徴量算出部310が第2算出プログラムにより算出した特徴量をドキュメントDB300から収集する。これを受けて、第1更新部240は、第2算出プログラムに対応する第2評価関数を、収集した評価値および特徴量に基づいて生成する。これにより、新たな算出プログラムを配信してから基準期間が経過するまでの間に、新たな算出プログラムに対応する第2評価関数による評価の精度を高めることができる。
【0046】
以上の処理に加えて、利用者端末30は、既にドキュメントDB300に記録されているそれぞれのページ(即ち第1評価関数による評価と利用者による評価が異なっていたページ)を、第2評価関数による評価の精度を高めるために利用してもよい。具体的には、特徴量算出部310は、第2算出プログラムによって、既にドキュメントDB300に記録されているそれぞれのページについて特徴量を算出する。この算出処理は、利用者端末30の計算負荷が予め定められた基準よりも低きことを条件に行われることが望ましい。そして、収集部220は、ドキュメントDB300に記録されたそれぞれのページについて第2プログラムによって算出された特徴量を、そのページに対応付けてドキュメントDB300に記録された評価値(即ち第1評価関数による評価値または利用者に入力された評価値)に対応付けて収集する。以上の処理によれば、評価関数による評価と利用者による評価がかつて異なっていたページを、新たな評価関数の評価精度を高める目的に利用することができる。
【0047】
図12は、サーバ装置20がドキュメント作成者に対して行う処理の一例を示す。図12を参照して、ドキュメントの作成者が利用者端末30を使用する場合の処理例を示す。この例において、利用者端末30は、ドキュメントの作成システムとしても機能する。ドキュメント作成者の指示に基づき利用者端末30がページを更新する毎に(S1200:YES)、特徴量算出部310は、更新されたそのページの特徴を示す特徴量を算出する(S1210)。そして、難易度評価部330は、算出した特徴量を評価関数に与えることによって当該ページの評価値を算出して、このドキュメント作成者に対し出力する(S1220)。
【0048】
以上、図12の例のように、評価値の算出はページが更新される毎に行われてもよい。この例によれば、ドキュメント作成者は、評価値を参照しながらページを編集できるので、視覚障害者にとって理解し易いドキュメントを作成し易い。なお、利用者端末30には、視覚障害者向けのドキュメント作成に関する他の技術を組み合わせることもできる。例えば、利用者端末30は、ドキュメントを視覚障害者に理解し易くするために満たすべき基準を示す情報を予め記憶している。基準とは、例えば、画像に代えて読み上げるべき文字列が指定されていることである。他の例として、基準とは、テーブルを構成する複数の表示オブジェクトを単に離散的に画面に配置するのではなくテーブルを示す情報(タグなど)に対応付けて記録することであってもよい。また、基準とは、タイトルを示す文字列を、その文字列がタイトルであることを示す情報(プレースホルダーなど)に対応付けて記録することであってもよい。そして、利用者端末30は、ページが更新される毎に、更新されたそのページがその基準を満たすか否かを判断する。基準を満たしていない場合には、利用者端末30は、満たしていない基準をドキュメント作成者に対し出力することによって、ドキュメントの修正を促す。このような処理との組み合わせによって、視覚障害者にとって理解し易いドキュメントを一層作成し易くすることができる。
【0049】
図13は、サーバ装置20または利用者端末30として機能する情報処理装置500のハードウェア構成の一例を示す。情報処理装置500は、ホストコントローラ1082により相互に接続されるCPU1000、RAM1020、及びグラフィックコントローラ1075を有するCPU周辺部と、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部と、入出力コントローラ1084に接続されるBIOS1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部とを備える。
【0050】
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスするCPU1000及びグラフィックコントローラ1075とを接続する。CPU1000は、BIOS1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィックコントローラ1075は、CPU1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、CPU1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
【0051】
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して外部の装置と通信する。ハードディスクドライブ1040は、情報処理装置500が使用するプログラム及びデータを格納する。CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、RAM1020又はハードディスクドライブ1040に提供する。
【0052】
また、入出力コントローラ1084には、BIOS1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。BIOS1010は、情報処理装置500の起動時にCPU1000が実行するブートプログラムや、情報処理装置500のハードウェアに依存するプログラム等を格納する。フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力チップ1070を介してRAM1020またはハードディスクドライブ1040に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
【0053】
情報処理装置500に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、入出力チップ1070及び/又は入出力コントローラ1084を介して、記録媒体から読み出され情報処理装置500にインストールされて実行される。プログラムが情報処理装置500等に働きかけて行わせる動作は、図1から図12において説明したサーバ装置20または利用者端末30における動作と同一であるから、説明を省略する。
【0054】
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを情報処理装置500に提供してもよい。
【0055】
以上、本実施形態に係る情報処理システム10によれば、これまで難易度評価が困難であってグラフィックスを含むドキュメントについて、難易度を適切に評価することができる。この際、難易度を評価する関数は、複数の利用者から収集した評価に基づき適宜更新されていくので、新たにスクリーンリーダの使用を開始した利用者にとっても難易度を適切に評価できる。また、利用者の評価は、スクリーンリーダの種類などのユーザプロファイル毎に分類して収集されるので、難易度評価の精度を一層高めることができる。また、特徴量を算出する算出プログラムを更新する場合には更新の過渡期間を設けることで、更新後でも評価の精度を低下させないようにすることができる。
【0056】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【図面の簡単な説明】
【0057】
【図1】図1は、情報処理システム10の全体構成を示す。
【図2】図2は、サーバ装置20の機能構成を示す。
【図3】図3は、利用者端末30の機能構成を示す。
【図4】図4は、評価値DB230のデータ構造の一例を示す。
【図5】図5は、難易度評価部330が出力する画面の第1表示例を示す。
【図6】図6は、難易度評価部330が出力する画面の第2表示例を示す。
【図7】図7は、難易度評価部330が出力する画面の第3表示例を示す。
【図8】図8は、サーバ装置20によって評価値が収集され、評価関数が更新される処理のフローチャートを示す。
【図9】図9は、利用者端末30によって評価値が算出して出力される処理のフローチャートを示す。
【図10】図10は、Zオーダーに従って表示オブジェクトを走査した軌跡を示す。
【図11】図11は、S900における処理の詳細を示す。
【図12】図12は、サーバ装置20がドキュメント作成者に対して行う処理の一例を示す。
【図13】図13は、サーバ装置20または利用者端末30として機能する情報処理装置500のハードウェア構成の一例を示す。
【符号の説明】
【0058】
10 情報処理システム
20 サーバ装置
30 利用者端末
200 第1関数記録部
210 配信部
220 収集部
230 評価値DB
240 第1更新部
250 性能評価部
300 ドキュメントDB
310 特徴量算出部
320 第2関数記録部
330 難易度評価部
340 入力部
350 評価値DB
360 第2更新部
500 情報処理装置

【特許請求の範囲】
【請求項1】
スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価するシステムであって、
ページの特徴を示す特徴量に基づいて当該ページの前記難易度の評価値を算出する評価関数を記録する第1関数記録部と、
前記評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を利用者から収集する収集部と、
利用者から収集した前記特徴量および前記評価値に基づいて、前記第1関数記録部に記録された前記評価関数を、利用者の評価により近い評価値を出力するように更新する第1更新部と
を備えるシステム。
【請求項2】
前記第1関数記録部は、スクリーンリーダの種類毎に、当該種類のスクリーンリーダの出力音声によって内容を理解する難易度の評価値を算出するための前記評価関数を記録し、
前記収集部は、複数の利用者のそれぞれから、当該利用者によって使用されるスクリーンリーダの種類に対応する前記評価関数によって算出した評価値と当該利用者による困難性の評価とが異なるページについて、当該利用者による困難性の評価値および当該ページの特徴量を当該スクリーンリーダの種類に対応付けて収集し、
前記第1更新部は、スクリーンリーダの種類毎に、当該種類に対応付けて収集した評価値および特徴量に基づき、当該種類に対応する前記評価関数を更新する
請求項1に記載のシステム。
【請求項3】
前記第1関数記録部は、前記ドキュメントを作成する作成システムの種類毎に、当該種類のシステムによって生成されたドキュメントをスクリーンリーダの出力音声によって内容を理解する難易度の評価値を算出するための前記評価関数を記録し、
前記収集部は、ドキュメントを作成した作成システムの種類に対応する前記評価関数によって算出した評価値と利用者による困難性の評価とが異なるページについて、当該利用者による困難性の評価値および当該ページの特徴量を当該作成システムの種類に対応付けて収集し、
前記第1更新部は、作成システムの種類毎に、当該種類に対応付けて収集した評価値および特徴量に基づき、当該種類に対応する前記評価関数を更新する
請求項2に記載のシステム。
【請求項4】
前記収集部によって収集された評価値に基づいて、それぞれの種類のスクリーンリーダの性能の高さを評価する性能評価部を更に備える請求項2に記載のシステム。
【請求項5】
前記システムは、
利用者により指定されたページに含まれる複数の表示オブジェクトを、予め定められた順序で走査した軌跡に基づいて、当該ページの特徴量を算出する特徴量算出部と、
算出した特徴量を前記評価関数に与えることによって当該ページの評価値を算出して利用者に対し出力する難易度評価部と
を更に備え、
前記収集部は、前記難易度評価部によって算出された評価値と利用者による困難性の評価とが異なることを条件に、利用者による困難性の評価値を利用者から収集する
請求項1に記載のシステム。
【請求項6】
前記特徴量算出部は、前記指定されたページに含まれる複数の表示オブジェクトを、前記複数の表示オブジェクトを重ね合わせて表示する場合の表示優先順序であるZオーダーによって走査した軌跡に基づいて、当該ページの特徴量を算出する
請求項5に記載のシステム。
【請求項7】
前記特徴量算出部は、それぞれの前記表示オブジェクトについて、当該表示オブジェクトと当該表示オブジェクトの次に走査する他の表示オブジェクトの間の距離を算出し、算出された距離の合計または平均がより大きい場合に、当該合計または平均がより小さい場合と比較して高い特徴量を算出する
請求項5に記載のシステム。
【請求項8】
前記特徴量算出部は、それぞれの前記表示オブジェクトについて、当該表示オブジェクトと当該表示オブジェクトの次に走査する他の表示オブジェクトとを結ぶ直線と、当該他の表示オブジェクトと当該他の表示オブジェクトの次に走査する更に他の表示オブジェクトとを結ぶ直線とがなす角度を算出し、算出された角度の合計または平均がより大きい場合に、当該合計または平均がより小さい場合と比較して高い特徴量を算出する
請求項5に記載のシステム。
【請求項9】
前記第1関数記録部から取得した前記評価関数を記録する第2関数記録部と、
利用者により指定されたページの特徴量を算出する特徴量算出部と、
算出した特徴量を前記評価関数に与えることによって当該ページの評価値を算出して前記利用者に対し出力する難易度評価部と、
前記難易度評価部によって算出された評価値と利用者による困難性の評価とが異なることを条件に、利用者が評価した困難性の評価値の入力を受け付ける入力部と、
入力された前記評価値および算出された前記特徴量に基づいて、前記第2関数記録部に記録された評価関数を更新する第2更新部と
を有する複数の利用者端末を、複数の利用者に対応付けて更に備え、
また、前記第1関数記録部、前記収集部、および、前記第1更新部を有するサーバ装置を更に備え、
前記収集部は、前記入力部が入力を受けた評価値、および、前記特徴量算出部が算出した特徴量を、複数の利用者端末のそれぞれから収集し、
前記サーバ装置は、前記第1更新部によって更新された前記評価関数を、前記複数の利用者端末のそれぞれに配信して前記第2関数記録部に記録させる配信部を更に有する
請求項1に記載のシステム。
【請求項10】
前記配信部は、特徴量を算出するための算出プログラムを前記複数の利用者端末のそれぞれに更に配信し、
既に第1算出プログラムの配信を受けていた状態において、新たに第2算出プログラムの配信を受けたことに応じ、前記第2算出プログラムの配信を受けてから予め定められた基準期間においては、
前記特徴量算出部は、前記第1算出プログラムおよび前記第2算出プログラムのそれぞれによって特徴量を算出し、
前記難易度評価部は、前記第1算出プログラムによって算出した特徴量を前記評価関数に与えることによって当該ページの評価値を算出し、
前記収集部は、算出された当該評価値または前記入力部が入力を受けた評価値、および、前記特徴量算出部が前記第2算出プログラムによって算出した特徴量を収集し、
前記第1更新部は、前記第2算出プログラムに対応する評価関数を、収集した当該評価値および特徴量に基づいて生成して前記第1関数記録部に記録する
請求項9に記載のシステム。
【請求項11】
それぞれの前記利用者端末は、算出した前記評価値と前記利用者による困難性の評価とが異なる複数のページのそれぞれを、当該ページについて前記入力部が入力を受けた評価値に対応付けて記録するページ記録部を更に有し、
前記基準期間において、
前記特徴量算出部は、前記第2算出プログラムによって、前記ページ記録部に記録されたそれぞれのページについて特徴量を更に算出し、
前記収集部は、前記ページ記録部に記録されたそれぞれのページについて算出された特徴量を、当該ページに対応付けて前記ページ記録部に記録された評価値に対応付けて収集する
請求項10に記載のシステム。
【請求項12】
前記基準期間において、
それぞれの前記利用者端末における前記特徴量算出部は、当該利用者端末の計算負荷が予め定められた基準よりも低いことを条件に、前記第2算出プログラムによって、前記ページ記録部に記録されたそれぞれのページについて特徴量を算出する
請求項11に記載のシステム。
【請求項13】
ドキュメントを作成または編集する利用者によってページが更新される毎に、更新された当該ページの特徴を示す特徴量を算出する特徴量算出部と、
算出した特徴量を前記評価関数に与えることによって当該ページの評価値を算出して当該利用者に対し出力する難易度評価部と
を更に備える請求項1に記載のシステム。
【請求項14】
スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価する方法であって、
ページの特徴を示す特徴量に基づいて当該ページの前記難易度の評価値を算出する評価関数を記録するステップと、
前記評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を利用者から収集するステップと、
利用者から収集した前記特徴量および前記評価値に基づいて、記録された前記評価関数を、利用者の評価により近い評価値を出力するように更新するステップと
を備える方法。
【請求項15】
スクリーンリーダの出力音声によってドキュメントの内容を理解する難易度を、ドキュメントのページ毎に評価するシステムとして、情報処理装置を機能させるプログラムであって、
前記情報処理装置を、
ページの特徴を示す特徴量に基づいて当該ページの前記難易度の評価値を算出する評価関数を記録する第1関数記録部と、
前記評価関数によって算出した評価値と利用者による困難性の評価とが異なる少なくとも1つのページのそれぞれについて、利用者による困難性の評価値および当該ページの特徴量を利用者から収集する収集部と、
利用者から収集した前記特徴量および前記評価値に基づいて、前記第1関数記録部に記録された前記評価関数を、利用者の評価により近い評価値を出力するように更新する第1更新部と
して機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2007−249755(P2007−249755A)
【公開日】平成19年9月27日(2007.9.27)
【国際特許分類】
【出願番号】特願2006−74222(P2006−74222)
【出願日】平成18年3月17日(2006.3.17)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成17年度、独立行政法人情報通信機構「視覚障害者向けマルチメディアブラウジング技術の研究開発」委託研究
【出願人】(592073101)日本アイ・ビー・エム株式会社 (42)
【復代理人】
【識別番号】100104156
【弁理士】
【氏名又は名称】龍華 明裕
【Fターム(参考)】