説明

コンテンツ取得装置、方法及びプログラム

【課題】対象となるWebサイトがカテゴリの自動判定が可能なサイトであるか否かについて確実に判定することができるコンテンツ取得装置、方法及びプログラムを提供すること。
【解決手段】所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得部11と、取得部11により取得されたコンテンツ記述データを記憶する記憶部12と、所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、第2のWebブラウザを起動し、記憶部12に記憶されているコンテンツ記述データを第2のWebブラウザで表示するように制御する制御部13を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、WebブラウザによりWebサイトを閲覧可能に構成されるコンテンツ取得装置、方法及びプログラムに関する。
【背景技術】
【0002】
現在、携帯情報機器によってアクセスが可能なWebサイト(携帯サイト)が正しく動作しているか否かを自動的に確認するシステムが提案されている。このシステムでは、CCD(Charge Coupled Device)等を有する撮影部を備え、監視対象となるWebサイトに携帯情報機器によりアクセスした際に、携帯情報機器のディスプレイに表示された画像を撮像部によって撮像し、正しい表示(基準画像データ)及び現在の運用画面(表示画像データ)を取得し、それらを定期的に比較することで、監視対象となるWebサイトが正しく動作しているか否か判定している(特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006−309535号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、携帯サイトのフィルタリング等のために、携帯サイトを複数のカテゴリ(例えば、政治、経済、文化等)に分類する作業を行っている。
【0005】
携帯サイトのWebサーバにおけるアクセス制限の問題から、このカテゴリの分類は、プログラムによる運用コストが低い自動判定では行われておらず、全て人手による目視確認で行われている。
【0006】
ここで、運用コストの低い自動判定でカテゴリの分類を行うシステムが望まれている。
携帯サイトを自動判定でカテゴリの分類を行うようにするためには、携帯サイトを構成する部品(テキスト情報等)をブラウザとは別のプログラムが取得して、分析を行う必要がある。
【0007】
携帯情報機器に組み込まれている正規のブラウザ(以下、携帯ブラウザという)により携帯サイトにアクセスし、閲覧しているだけでは、携帯サイトを構成する部品を別のプログラムが取得可能かどうかは分からない。また、一般的に、携帯情報機器に組み込まれている携帯ブラウザは、その構成上、携帯サイトを構成する部品を取得して、別のプログラムに取得させることができない仕組みになっている。よって、特許文献1を単に利用しただけでは、自動判定でカテゴリの分類を行うシステムの構築はできない。
【0008】
本発明では、カテゴリの分類を自動判定する前提として、携帯ブラウザが取得した対象となるWebサイトを構成する部品を別のプログラムが取得可能か否か、すなわち、対象となるWebサイトのカテゴリの自動判定が可能なサイトであるか否かについて確実に判定することができるコンテンツ取得装置、方法及びプログラムを提供することを一つの目的とする。
【課題を解決するための手段】
【0009】
本発明では、以下のような解決手段を提供する。
(1)本発明に係るコンテンツ取得装置は、上記課題を解決するために、所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得部と、前記取得部により取得された前記コンテンツ記述データを記憶する記憶部と、前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する制御部を備える構成である。
【0010】
このような構成によれば、コンテンツ取得装置は、第1のWebブラウザによって対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得し、この取得したコンテンツ記述データを一時的に記憶部に記憶し、端末装置に組み込まれている第2のWebブラウザによって記憶部に記憶されているコンテンツ記述データを読み出して表示する。
【0011】
したがって、コンテンツ取得装置は、第1のWebブラウザによって表示された態様と同一の態様でコンテンツ記述データを端末装置の第2のWebブラウザに表示することができるので、対象となるWebサイトにアクセス制限が有るか無いかの判断に活用することができる。
【0012】
(2)また、コンテンツ取得装置では、被写体を撮像する撮像部と、前記撮像部を制御する撮像制御部を備え、前記制御部は、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御し、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行う構成であることが好ましい。
【0013】
このような構成によれば、コンテンツ取得装置は、第1のWebブラウザによって対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得し、この取得したコンテンツ記述データを一時的に記憶部に記憶し、端末装置に組み込まれている第2のWebブラウザによって記憶部に記憶されているコンテンツ記述データを読み出して表示し、表示されている態様を撮像部によって撮像する。
【0014】
したがって、コンテンツ取得装置は、第1のWebブラウザによって表示された態様と同一の態様でコンテンツ記述データを端末装置の第2のWebブラウザに表示し、その表示されている態様を撮像部によって撮像するので、撮像画像を対象となるWebサイトにアクセス制限が有るか無いかの判断に活用することができる。
【0015】
(3)また、コンテンツ取得装置では、情報を入力する入力部と、前記入力部により入力された結果に基づいて、前記対象となるWebサイトのアクセス制限の有無を判定する判定部を備え、前記制御部は、前記端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザに表示させ、また、前記端末装置又は前記端末装置とは異なる端末装置にアクセスして、前記第2のWebブラウザを起動し、前記対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを前記第2のWebブラウザに表示させ、前記判定部は、前記記憶部に記憶されているコンテンツ記述データに基づく表示と、前記対象となるWebサイトのコンテンツ記述データに基づく表示の一致又は不一致の情報が前記入力部により入力された場合、前記情報に基づいて、前記対象となるWebサイトのアクセス制限の有無を判断する構成であることが好ましい。
【0016】
このような構成によれば、コンテンツ取得装置は、第1のWebブラウザによって対象となるWebサイトから取得したコンテンツ記述データを第2のWebブラウザに表示させ、また、対象となるWebサイトから直接的に取得したコンテンツ記述データを第2のWebブラウザに表示させ、両表示を比較して対象となるWebサイトのアクセス制限の有無を判断する。
【0017】
したがって、コンテンツ取得装置は、両表示を比較して一致すれば、対象となるWebサイトを第1のWebブラウザでも第2のWebブラウザでも同様に表示できているということなので、対象となるWebサイトにアクセス制限が付されていないと判断でき、両表示を比較して一致しなければ、対象となるWebサイトを第1のWebブラウザと第2のWebブラウザで異なる表示になっているということなので、対象となるWebサイトにアクセス制限が付されていると判断でき、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0018】
(4)また、コンテンツ取得装置では、前記対象となるWebサイトのアクセス制限の有無を判定する判定部を備え、前記制御部は、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御し、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行い、前記撮像部によって撮像された第1の撮像画像と、前記端末装置又は前記端末装置とは異なる端末装置にアクセスして、前記第2のWebブラウザを起動し、前記対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを前記第2のWebブラウザに表示させ、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行い、前記撮像部によって撮像された第2の撮像画像を所定の方法によって比較し、前記判定部は、前記比較した結果に基づいて、前記対象となるWebサイトのアクセス制限の有無を判定する構成であることが好ましい。
【0019】
このような構成によれば、コンテンツ取得装置は、第1のWebブラウザによって対象となるWebサイトから取得したコンテンツ記述データを第2のWebブラウザに表示させ、その後、撮像部によって第1の撮像画像として撮像し、また、対象となるWebサイトから直接的に取得したコンテンツ記述データを第2のWebブラウザに表示させ、その後、撮像部によって第2の撮像画像として撮像し、第1の撮像画像と第2の撮像画像を比較して対象となるWebサイトのアクセス制限の有無を判断する。
【0020】
したがって、コンテンツ取得装置は、両画像を比較して一致すれば、対象となるWebサイトを第1のWebブラウザでも第2のWebブラウザでも同様に表示できているということなので、対象となるWebサイトにアクセス制限が付されていないと判断でき、両画像を比較して一致しなければ、対象となるWebサイトを第1のWebブラウザと第2のWebブラウザで異なる表示になっているということなので、対象となるWebサイトにアクセス制限が付されていると判断でき、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0021】
(5)また、コンテンツ取得装置では、前記制御部は、前記所定の方法として、前記第1の撮像画像と前記第2の撮像画像における同一の座標位置における複数の画素から構成される領域同士が一致するかどうかによって比較を行う構成であることが好ましい。
【0022】
このような構成によれば、コンテンツ取得装置は、両画像の一部を利用して一致か否かを判定するので、効率的に判定処理を行って、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0023】
(6)また、コンテンツ取得装置では、Webサイトのカテゴリを判定するカテゴリ判定部を備え、前記判定部は、前記対象となるWebサイトについてのアクセス制限が有ると判定した場合には、前記対象となるWebサイトをアクセス制限付きリストに登録し、前記対象となるWebサイトについてのアクセス制限が無いと判定した場合には、前記対象となるWebサイトをアクセス制限無しリストに登録し、前記カテゴリ判定部は、前記アクセス制限無しリストに登録されているWebサイトについて、カテゴリの判定を行う構成であることが好ましい。
【0024】
このような構成によれば、コンテンツ取得装置は、アクセス制限無しリストに登録されているWebサイトについてのみカテゴリの判定を行うので、効率的なカテゴリの判定処理を行うことができる。
【0025】
(7)また、本発明に係るコンテンツ取得方法は、上記課題を解決するために、所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得工程と、前記取得工程により取得された前記コンテンツ記述データを記憶部に記憶する記憶工程と、前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する表示制御工程を備える。
【0026】
このような構成によれば、コンテンツ取得装置は、第1のWebブラウザによって対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得し、この取得したコンテンツ記述データを一時的に記憶部に記憶し、端末装置に組み込まれている第2のWebブラウザによって記憶部に記憶されているコンテンツ記述データを読み出して表示する。
【0027】
したがって、コンテンツ取得装置は、第1のWebブラウザによって表示された態様と同一の態様でコンテンツ記述データを端末装置の第2のWebブラウザに表示することができるので、対象となるWebサイトにアクセス制限が有るか無いかの判断に活用することができる。
【0028】
(8)また、本発明に係るコンテンツ取得プログラムは、上記課題を解決するために、所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得工程と、前記取得工程により取得された前記コンテンツ記述データを記憶部に記憶する記憶工程と、前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する表示制御工程をコンピュータによって実現するためのプログラムにより構成されている。
【発明の効果】
【0029】
本発明によれば、対象となる携帯サイトがカテゴリの自動判定が可能なサイトであるか否かについて確実に判定することができる。
【図面の簡単な説明】
【0030】
【図1】本実施形態に係るコンテンツ取得装置の第1の構成を示す機能ブロック図である。
【図2】本実施形態に係るコンテンツ取得装置の第2の構成を示す機能ブロック図である。
【図3】コンテンツ管理システムの構成を示す模式図である。
【図4】コンテンツ管理システムの第1の構成を示す機能ブロック図である。
【図5】比較機能部により矩形小領域を選択する方法についての説明に供する図である。
【図6】コンテンツ管理システムの動作の流れについての説明に供するフローチャートである。
【図7】コンテンツ管理システムの第2の構成を示す機能ブロック図である。
【図8】コンテンツ管理システムの第3の構成を示す機能ブロック図である。
【図9】コンテンツ管理システムの構成を示す模式図である。
【図10】コンテンツ管理システムの第4の構成を示す機能ブロック図である。
【発明を実施するための形態】
【0031】
以下、本発明の実施形態の一例について説明する。
コンテンツ取得装置1は、図1に示すように、取得部11と、記憶部12と、制御部13を備える。
取得部11は、所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する。ここで、所定の言語とは、HTML(Hyper Text Markup Language)等の言語である。また、第1のWebブラウザとは、PC(Personal Computer)に組み込まれているHTML等で記述されているWebページの閲覧用のアプリケーションのことであり、以下、PCブラウザという。また、Webサイトは、ネットワーク100に接続されているWebサーバ101内に格納されており、特定のドメイン名によって相互に関連付けられている複数のWebページの集合である。
【0032】
記憶部12は、取得部11により取得されたコンテンツ記述データを記憶する。コンテンツ記述データとは、HTML等の言語で記述されているデータのことである。なお、本実施例では、コンテンツ記述データは、ソースコードのみ(すなわち、テキスト情報のみ)を意味していても良いし、ソースコード及びソースコードに記述されている画像データ等を含んだ包括的なデータを意味していても良い。また、Webブラウザは、Webサイトにアクセスし、コンテンツ記述データにしたがって、所定の画面を表示する機能を有している。なお、記憶部12は、詳細は後述する、ネットワーク100を介して接続されるキャッシュ用Webサーバ105に相当する。
【0033】
制御部13は、所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置102にアクセスして、第2のWebブラウザを起動し、記憶部12に記憶されているコンテンツ記述データを第2のWebブラウザで表示するように制御する。「所定の言語とは異なる言語」とは、XHTML(eXtensible Hyper Text Markup Language)やCHTML(Compact Hyper Text Markup Language)等の言語である。また、第2のWebブラウザとは、携帯電話等に組み込まれているXHTML等の言語で記述されているWebページの閲覧用のアプリケーションのことであり、以下では、携帯ブラウザという。
【0034】
このような構成によれば、コンテンツ取得装置1は、第1のWebブラウザによって対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得し、この取得したコンテンツ記述データを一時的に記憶部12に記憶し、端末装置102に組み込まれている第2のWebブラウザによって記憶部12に記憶されているコンテンツ記述データを読み出して表示する。
【0035】
したがって、コンテンツ取得装置1は、第1のWebブラウザによって表示された態様と同一の態様でコンテンツ記述データを端末装置102の第2のWebブラウザに表示することができるので、両表示が一致するか否かによって、対象となるWebサイトにアクセス制限が有るか無いかの判断に活用することができる。
【0036】
また、コンテンツ取得装置1は、図1に示すように、被写体を撮像する撮像部14aと、撮像部14aを制御する撮像制御部15を備える構成であっても良い。なお、撮像部14aは、後述する撮像機器106に相当する。
このような構成では、制御部13は、記憶部12に記憶されているコンテンツ記述データを第2のWebブラウザで表示するように制御し、その後、第2のWebブラウザで表示されている画像を撮像部14aによって撮像するように撮像制御部15に対して撮像命令を行う。
【0037】
コンテンツ取得装置1は、第1のWebブラウザによって対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得し、この取得したコンテンツ記述データを一時的に記憶部12に記憶し、端末装置102に組み込まれている第2のWebブラウザによって記憶部12に記憶されているコンテンツ記述データを読み出して表示し、表示されている態様を撮像部14aによって撮像する。
【0038】
したがって、コンテンツ取得装置1は、第1のWebブラウザによって表示された態様と同一の態様でコンテンツ記述データを端末装置102の第2のWebブラウザに表示し、その表示されている態様を撮像部14aによって撮像するので、例えば、端末装置102の第2のWebブラウザによって直接的に対象となるWebサイトにアクセスして表示される画面と比較し、両画像が一致するか否かによって、対象となるWebサイトにアクセス制限が有るか無いかの判断に活用することができる。
【0039】
また、コンテンツ取得装置1は、図2に示すように、情報を入力する入力部16と、入力部16により入力された結果に基づいて、対象となるWebサイトのアクセス制限の有無を判定する判定部17を備える構成であっても良い。
【0040】
制御部13は、端末装置102にアクセスして、第2のWebブラウザを起動し、記憶部12に記憶されているコンテンツ記述データを第2のWebブラウザに表示させ、また、端末装置102又は端末装置102とは異なる端末装置103にアクセスして、第2のWebブラウザを起動し、対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを第2のWebブラウザに表示させる。
【0041】
また、判定部17は、記憶部12に記憶されているコンテンツ記述データに基づく表示と、対象となるWebサイトのコンテンツ記述データに基づく表示の一致又は不一致の情報が入力部16により入力された場合、情報に基づいて、対象となるWebサイトのアクセス制限の有無を判断する。
【0042】
このような構成によれば、コンテンツ取得装置1は、撮像部14a、撮像部14b及び撮像制御部15を設けずに、第1のWebブラウザによって対象となるWebサイトから取得したコンテンツ記述データを第2のWebブラウザに表示させ、また、対象となるWebサイトから直接的に取得したコンテンツ記述データを第2のWebブラウザに表示させ、両表示を比較し、その比較結果を入力部16により入力することによって、対象となるWebサイトのアクセス制限の有無を判定部17により判定することができる。
【0043】
したがって、コンテンツ取得装置1は、両表示を比較して一致すれば、対象となるWebサイトを第1のWebブラウザでも第2のWebブラウザでも同様に表示できているということなので、対象となるWebサイトにアクセス制限が付されていないと判断でき、両表示を比較して一致しなければ、対象となるWebサイトを第1のWebブラウザと第2のWebブラウザで異なる表示になっているということなので、対象となるWebサイトにアクセス制限が付されていると判断でき、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0044】
また、コンテンツ取得装置1は、図1に示すように、対象となるWebサイトのアクセス制限の有無を判定する判定部17を備える。制御部13は、記憶部12に記憶されているコンテンツ記述データを端末装置102の第2のWebブラウザで表示するように制御し、その後、第2のWebブラウザで表示されている画像を撮像部14aによって撮像するように撮像制御部15に対して撮像命令を行い、撮像部14aによって第1の撮像画像を撮像する。また、制御部13は、端末装置102又は端末装置102とは異なる端末装置103にアクセスして、第2のWebブラウザを起動し、対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを第2のWebブラウザに表示させ、その後、第2のWebブラウザで表示されている画像を撮像部14bによって撮像するように撮像制御部15に対して撮像命令を行い、撮像部14bによって第2の撮像画像を撮像する。なお、撮像部14bは、後述する撮像機器107に相当する。
【0045】
そして、制御部13は、第1の撮像画像と第2の撮像画像を所定の方法によって比較する。判定部17は、比較した結果に基づいて、対象となるWebサイトのアクセス制限の有無を判定する。
【0046】
このような構成によれば、コンテンツ取得装置1は、第1のWebブラウザによって対象となるWebサイトから取得したコンテンツ記述データを端末装置102の第2のWebブラウザに表示させ、その後、撮像部14aによって第1の撮像画像として撮像する。また、コンテンツ取得装置1は、対象となるWebサイトから直接的に取得したコンテンツ記述データを端末装置103の第2のWebブラウザに表示させ、その後、撮像部14bによって第2の撮像画像として撮像する。コンテンツ取得装置1は、第1の撮像画像と第2の撮像画像を比較して対象となるWebサイトのアクセス制限の有無を判断する。
【0047】
したがって、コンテンツ取得装置1は、両画像を比較して一致すれば、対象となるWebサイトを第1のWebブラウザでも第2のWebブラウザでも同様に表示できているということなので、対象となるWebサイトにアクセス制限が付されていないと判断でき、両画像を比較して一致しなければ、対象となるWebサイトを第1のWebブラウザと第2のWebブラウザで異なる表示になっているということなので、対象となるWebサイトにアクセス制限が付されていると判断できる。このようにして、コンテンツ取得装置1は、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0048】
また、コンテンツ取得装置1は、Webサイトのカテゴリを判定するカテゴリ判定部を備える構成が好ましい。このような構成の場合には、判定部17は、対象となるWebサイトについてのアクセス制限が有ると判定した場合には、対象となるWebサイトをアクセス制限付きリストに登録し、対象となるWebサイトについてのアクセス制限が無いと判定した場合には、対象となるWebサイトをアクセス制限無しリストに登録する。カテゴリ判定部は、アクセス制限無しリストに登録されているWebサイトについて、カテゴリの判定を行う。なお、カテゴリ判定部の機能は、判定部17の機能の一つであっても良いし、判定部17とは異なる構成要素で構成されても良い。
【0049】
このような構成によれば、コンテンツ取得装置1は、アクセス制限無しリストに登録されているWebサイトについてのみカテゴリの判定を行うので、効率的なカテゴリの判定処理を行うことができる。
【0050】
また、制御部13は、所定の方法として、第1の撮像画像と第2の撮像画像における同一の座標位置における複数の画素から構成される領域同士が一致するかどうかによって比較を行う構成が好ましい。
【0051】
コンテンツ取得装置1は、両画像の一部を利用して一致か否かを判定するので、効率的に判定処理を行って、カテゴリの分類を行う前に、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0052】
また、コンテンツ取得装置1は、第1の撮像画像を撮像部14aで撮像し、第2の撮像画像を撮像部14bで撮像した場合において、端末装置102に組み込まれている第2のWebブラウザと、端末装置103に組み込まれている第2のWebブラウザのWebページを描画するアルゴリズム(レンダリングアルゴリズム)が異なる場合には、対象となるWebサイトにアクセス制限が無い場合であっても、全体として、第1の撮像画像と第2の撮像画像が不一致と判定し、対象となるWebサイトにアクセス制限が有ると判断する可能性がある。
【0053】
ここで、コンテンツ取得装置1は、第1の撮像画像と第2の撮像画像における同一の座標位置における複数の画素から構成される領域同士が一致するかどうかによって比較を行うので、多少の違いがあっても、画像の一致度の判定に影響を与えず、対象となるWebサイトのアクセス制限の有無について確実に判定することができる。
【0054】
なお、コンテンツ取得装置1は、比較する領域の大きさは任意に決定が可能であり、また、同一の座標位置の領域を複数領域指定して、領域ごとに一致度を比較し、総合的に量画像が一致するかどうかを判定する構成であっても良い。また、コンテンツ取得装置1は、画像データの中から特徴的な部分を選択し、そこを比較の対象となる座標位置としても良い。
【0055】
ここで、Webサーバのアクセス制限について説明する。Webサイトを管理しているWebサーバは、アクセス制限の観点で「アクセス制限有り」と「アクセス制限無し」の二つのパターンに分類できる。
【0056】
「アクセス制限有り」とは、端末装置に組み込まれている正規のブラウザ(携帯ブラウザ)からアクセスした場合と、PC等の他の一般的なブラウザ(PCブラウザ)からアクセスした場合で、Webサーバが異なるHTMLを応答する場合、又はPCブラウザからアクセスした場合にはエラーを応答する場合をいう。また、「アクセス制限無し」とは、携帯ブラウザからアクセスした場合と、PCブラウザからアクセスした場合で、Webサーバが同じHTMLを応答する場合をいう。
【0057】
アクセス制限有りのパターンでは、カテゴリ分類を自動判定するための部品(テキスト情報等)のダウンロードが制限されているため、人手による目視確認でのカテゴリ判定が必須であるが、アクセス制限無しのパターンでは、PCブラウザでアクセスして取得したHTMLや画像を所定の判定プログラムに渡すことができ、判定プログラムによる自動判定が可能である。
【0058】
つまり、カテゴリ判定を行う前に、対象となるWebサイトが「アクセス制限有り」か「アクセス制限無し」かについて判定することができれば、人手による目視確認作業を「アクセス制限有り」のパターンのみに限定できるため、人手による目視確認作業を大幅に軽減できる。ただし、「アクセス制限有り」か「アクセス制限無し」かについて、対象となるWebサイトを閲覧し、人手により判定する場合には、その判定作業が追加されるため作業の軽減度合いは低くなり、運用コストが高くなってしまう。
【0059】
一方、「アクセス制限有り」のパターンでも、上述したように、エラーを示すHTTPレスポンスではないHTML(例えば、「このサイトは、PCブラウザからは閲覧できません」等を内容とするHTML)をレスポンスするWebサイトも存在するため、PCブラウザによりアクセスし、Webサーバからのエラーを示すHTTPレスポンスの有無によって、単純にアクセス制限の有無を判断してしまうと、エラーを示すHTTPレスポンスではないHTMLを応答するWebサイトに対して「アクセス制限無し」の判定をしてしまい、対象となるWebサイトのカテゴリ判定を適正に行うことができなくなる。
【0060】
従来型のシステムでは、端末装置に標準的に搭載しているWebブラウザ(携帯ブラウザ)を利用して、予め判定対象となるURLにアクセスし、表示されている画像を基準画像として撮像しておき、その後、定期的に携帯ブラウザを利用して判定対象となるURLにアクセスし、表示されている画像を撮像し、基準画像と比較して、比較結果から異常を判定するだけであり、エラーを示すHTTPレスポンスではないHTMLを応答するWebサイトを見分けて、「アクセス制限有り」であるかどうかを判定することはできない。
【0061】
本実施例に係るコンテンツ取得装置1は、上述したようなエラーを示すHTTPレスポンスではないHTMLを応答するWebサイトを見分けて、対象となるWebサイトに対するアクセス制限の有無を確実に判定することができる構成を有している。
【0062】
また、Webページを構成する部品(画像やテキスト)の画面上の配置については、Webブラウザごとに異なる問題がある。すなわち、同じ系統のWebブラウザであっても、Webページを構成する個々のパーツの配置を決定するためのアルゴリズム(レンダリングアルゴリズム)の違いがあり、表示される画像が全く同じものにならない。
【0063】
本実施例に係るコンテンツ取得装置1は、レンダリングアルゴリズムが異なり、パーツの配置が一部異なるWebブラウザを利用しても、対象となるWebサイトに対するアクセス制限の有無を確実に判定することができる構成を有している。
【0064】
<第1の実施例>
つぎに、本発明の具体的な実施例について説明する。上述したように、本実施例のコンテンツ取得装置1は、カテゴリの分類を自動判定する前提として、対象となるWebサイトがカテゴリの自動判定が可能なサイトであるか否かについて確実に判定する構成になっている。また、コンテンツ取得装置1の各構成要素は、図3に示す、コンテンツ管理システム201の一部を構成している。
【0065】
コンテンツ管理システム201は、ネットワーク100を介して、Webサーバ101と、キャッシュ用Webサーバ105と、PC104と、端末装置102と、端末装置103とが相互に接続されている。また、PC104は、撮像機器106及び撮像機器107が直接接続されており、かつ、端末装置102及び端末装置103とも直接接続されている。また、各接続の方法は、有線であっても良いし、無線であっても良い。また、撮像機器106は、端末装置102のディスプレイを正面から撮像できる位置に配置されており、撮像機器107は、端末装置103のディスプレイを正面から撮像できる位置に配置されている。また、PC104は、撮像機器106及び撮像機器107の撮像角度やフォーカス等の制御を行うことができるように構成されている。
【0066】
このような構成によれば、まず、PC104は、PCブラウザによって対象となるWebサイト(Webサーバ101)にアクセスし、HTMLデータを取得し、取得したHTMLデータをキャッシュ用Webサーバ105に格納する。
【0067】
端末装置102は、PC104の制御にしたがって、キャッシュ用Webサーバ105に格納されているHTMLデータを読み出し、読み出したHTMLデータに基づき、携帯ブラウザによって表示画像を作成する。また、撮像機器106は、PC104の制御にしたがって、端末装置102のディスプレイを第1の撮像画像として撮像する。
【0068】
また、端末装置103は、PC104の制御にしたがって、対象となるWebサイトにアクセスし、HTMLデータに基づいて、携帯ブラウザによって表示画像を作成する。また、撮像機器107は、PC104の制御にしたがって、端末装置103のディスプレイを第2の撮像画像として撮像する。
PC104は、第1の撮像画像と第2の撮像画像を比較して、対象となるWebサイトに対するアクセス制限の有無を判断する。
【0069】
例えば、対象となるWebサイトが、PCブラウザに対して、エラーを示すHTTPレスポンスではないHTMLを応答する場合には、第1の撮像画像には、このHTMLに基づく画像(例えば、「このサイトは、PCブラウザからは閲覧できません」等)が表示されており、第2の撮像画像には、適正な画像(例えば、企業等のホームページ)が表示されている。PC104は、このような第1の撮像画像と第2の撮像画像を比較し、不一致であると判定し、対象となるWebサイトがアクセス制限が有るサイトであると判断する。
【0070】
このようにして、コンテンツ取得装置1は、上述したようなエラーを示すHTTPレスポンスではないHTMLを応答するWebサイトを見分けて、対象となるWebサイトに対するアクセス制限の有無を確実に判定することができる。
【0071】
また、PC104は、図4に示すように、判定対象Webサイトリスト格納部21と、キャッシュ生成機能部22と、携帯ブラウザ起動機能部23と、撮像機器制御部24と、比較機能部25と、アクセス制限有りWebサイトリスト格納部26と、アクセス制限無しWebサイトリスト格納部27を備えている。なお、キャッシュ生成機能部22は、上述した取得部11に相当し、キャッシュ用Webサーバ105は、上述した記憶部12に相当し、キャッシュ生成機能部22及び携帯ブラウザ起動機能部23は、上述した制御部13に相当する。
【0072】
キャッシュ用Webサーバ105は、対象となるWebサイトにPCブラウザによってアクセスした場合のHTMLを(一時的に)保存する機能を有している。また、キャッシュ用Webサーバ105は、キャッシュ生成機能部22からHTMLを受信し、端末装置102からアクセス可能なディレクトリに保存する。また、キャッシュ用Webサーバ105は、端末装置102からアクセスされる際のプロトコルとして、HTTP又はHTTPS(Hypertext Transfer Protocol over Secure Socket Layer)を採用している。
【0073】
キャッシュ生成機能部22は、PCブラウザと同等の機能を有し、対象となるWebサイトのURLに対し、HTTP又はHTTPSでアクセスし、HTMLを取得する。
【0074】
判定対象Webサイトリスト格納部21は、アクセス制限の有り又は無しを判定する対象となるWebサイトのURLが記録(登録)されたデータベース又はファイルを有する。
【0075】
携帯ブラウザ起動機能部23は、PC104から端末装置102及び端末装置103のブラウザ(携帯ブラウザ)をリモートにより起動する機能を有している。また、携帯ブラウザ起動機能部23は、端末装置がリモートによる起動が可能な構成の場合には、起動命令を送信して携帯ブラウザを起動する。
【0076】
また、携帯ブラウザ起動機能部23は、端末装置がリモートによる起動が可能な構成ではない場合には、リモート起動をするための専用のプログラムを端末装置側に組み込んでおき、当該専用のプログラムを介して携帯ブラウザを起動する。具体的には、携帯ブラウザ起動機能部23は、専用のプログラムに対してURLを送信する。専用プログラムは、URLを受信したことを契機として、携帯ブラウザを起動し、携帯ブラウザに対してURLを送信する。携帯ブラウザは、送信されたURLにアクセスする。
【0077】
なお、PC104と端末装置102及び端末装置103は、有線ケーブル又は無線(Bluetooth(登録商標)等)により接続されているものとする。
【0078】
撮像機器制御部24は、撮像機器106及び撮像機器107に対して撮影命令を出し、撮像機器106及び撮像機器107により撮像された画像データを取得する機能を有する。なお、撮像機器106及び撮像機器107と、PC104は、有線ケーブル(USB接続等)又は無線(無線LAN等)により接続されている。
【0079】
比較機能部25は、2つの画像を比較し、類似しているかどうかを判定する機能を有する。比較機能部25による判定方法については、上述した通りであるが、矩形小領域の選択方法は、以下の点に留意して決定することが好ましい。
【0080】
1.端末装置に固有のシステム情報表示領域(例えば、画面の上部にある時計や電波状況等を示す表示領域等)を避ける。システム情報表示領域は、時間の経過と共に変化する。したがって、比較機能部25は、システム情報表示領域を比較の対象として選択すると、比較判定を適正に行えない可能性があるので、矩形小領域として選択しないことが好ましい。
【0081】
2.広告が掲載されやすい画面上部は避ける。広告は、時間の経過や表示条件によって変化する。したがって、比較機能部25は、広告が掲載されやすい画面上部を比較の対象として選択すると、比較判定を適正に行えない可能性があるので、矩形小領域として選択しないことが好ましい。
【0082】
3.分散的に矩形小領域を選択する。比較機能部25は、上記1.及び2.を勘案して、例えば、図5に示すように、システム情報表示領域Aと広告掲載領域Bを避けた端末装置102及び端末装置103の表示領域Cにおいて、分散的に複数個所の小領域を矩形小領域画像Dとして選択し、そこを比較対象とする。
【0083】
アクセス制限有りWebサイトリスト格納部26は、人手による目視確認を必要とするWebサイトのリストを格納している。
【0084】
アクセス制限無しWebサイトリスト格納部27は、自動判定システムによる確認が可能なWebサイトのリストを格納している。
【0085】
つぎに、コンテンツ管理システム201の動作の流れについて、図6に示すフローチャートを参照して説明する。
ステップST1において、キャッシュ生成機能部22は、判定対象Webサイトリスト格納部21に格納されている対象Webサイトリストから1つのWebサイトのURLを取り出し、対象となるWebサイト(Webサーバ101)にアクセスしてHTML(コンテンツ記述データ)を取得する。
【0086】
ステップST2において、キャッシュ生成機能部22は、ステップST1の工程により、エラーを示すHTTPレスポンスを受信したかどうかを判断する。HTTPエラーを受信した場合(Yes)には、ステップST3に進み、HTTPエラーを受信していない場合(No)、すなわちHTMLを受信した場合には、ステップST5に進む。
【0087】
ステップST3において、キャッシュ生成機能部22(又は比較機能部25)は、対象となるWebサイトがアクセス制限有りのサイトであると判定する。
【0088】
ステップST4において、キャッシュ生成機能部22(又は比較機能部25)は、アクセス制限有りWebリスト格納部26のアクセス制限有りWebリストに、当該WebサイトのURLを登録する。アクセス制限有りWebリストに登録されたWebサイトは、カテゴリの自動判定が行えないので、例えば、目視によりカテゴリ判定が行われる。
【0089】
また、ステップST5において、キャッシュ生成機能部22は、取得したHTMLをキャッシュ用Webサーバ105の特定の位置に格納し、当該特定の位置を示すURLと、対象となるWebサイトのURLを携帯ブラウザ起動機能部23に送信する。携帯ブラウザ起動機能部23は、端末装置102(携帯1)と端末装置103(携帯2)に対して所定の制御を行う。
【0090】
具体的には、端末装置102は、携帯ブラウザ起動機能部23の制御にしたがって、特定の位置を示すURL(キャッシュ用Webサーバ105)にアクセスし、当該URLに格納されているHTMLに基づく画像を携帯ブラウザで表示し、その旨を撮像機器制御部24に通知する。
【0091】
また、端末装置103は、携帯ブラウザ起動機能部23の制御にしたがって、対象となるWebサイトのURL(Webサーバ101)にアクセスし、当該URLに格納されているHTMLに基づく画像を携帯ブラウザで表示し、その旨を撮像機器制御部24に通知する。
【0092】
ステップST6において、撮像機器制御部24は、端末装置102及び端末装置103の表示画面の画像を撮像機器106及び撮像機器107によって撮像する。
【0093】
また、撮像機器制御部24は、所定のタイミングで撮像機器106及び撮像機器107により端末装置102及び端末装置103のディスプレイを撮像するように制御する。具体的には、撮像機器制御部24は、撮像機器106及び撮像機器107から供給される画像に基づいて、端末装置102及び端末装置103のディスプレイに表示されている通信中を示すアイコンの点滅が静止することを確認する等の方法により、通信が完了してディスプレイ上の描画処理が完了したことを確認し、確認後に撮像機器106及び撮像機器107により端末装置102及び端末装置103のディスプレイを撮像する。
【0094】
撮像機器106及び撮像機器107は、撮像機器制御部24の制御にしたがって、端末装置102及び端末装置103のディスプレイを撮像し、撮像したデータをPC104(撮像機器制御部24)に送信する。また、以下では、撮像機器106で撮像したデータを第1の撮像画像といい、撮像機器107で撮像したデータを第2の撮像画像をいう。
【0095】
撮像機器制御部24は、第1の撮像画像及び第2の撮像画像と、対象となるWebサイトのURLを比較機能部25に送信する。
【0096】
ステップST7において、比較機能部25は、所定の方法によって第1の撮像画像と第2の撮像画像の類似度(又は一致度)を判定する。
具体的には、比較機能部25は、以下の処理手順にしたがって、第1の撮像画像と第2の撮像画像の比較処理を行う。
1.回転や拡大・縮小処理により、二つの画像の座標の整合を図る。
例えば、比較機能部25は、画像に含まれている画面部分の枠を基準にして水平になるように各画像を回転処理する。さらに、比較機能部25は、縦横比を統一するための拡大縮小を行う。なお、第1の撮像画像と第2の撮像画像を撮像する際に、座標の整合を図れるように撮像されていれば、本処理はスキップしても良い。
2.一致評価用の複数の矩形小領域画像の切り出しを行う。
例えば、比較機能部25は、それぞれの画像から、同じ場所の数か所の小さな矩形領域を抽出する。
3.矩形小領域画像を用いた一致の推定処理を行う。
例えば、比較機能部25は、色分布等に基づいて、同じ場所の矩形小領域画像を比較し、一致するかどうかを判定する。比較機能部25は、一致する矩形小領域画像の割合が高い場合に、同一であると判定する。
【0097】
ステップST8において、比較機能部25は、ステップST7の工程による比較処理の結果から、両画像が類似(又は一致)するかどうかを判断する。類似すると判断した場合(Yes)には、ステップST9に進み、類似しないと判断した場合(No)には、ステップST3に進む。
【0098】
ステップST9において、比較機能部25は、対象となるWebサイトがアクセス制限無しのサイトであると判定する。
【0099】
ステップST10において、比較機能部25は、アクセス制限無しWebリスト格納部27のアクセス制限無しWebリストに、当該WebサイトのURLを登録する。アクセス制限無しWebリストに登録されたWebサイトは、カテゴリの自動判定が行えるので、自動判定処理に利用される。
【0100】
なお、ステップST1の工程では、キャッシュ生成機能部22は、HTML(コンテンツ記述データ)として、画像データ等を含まないデータ(ソースコード)として取得しても良い。この場合には、ステップST5の工程における端末装置102の携帯ブラウザは、特定の位置を示すURLにアクセスし、当該URLに格納されているHTMLを解析し、直接、他のサーバから画像をダウンロードして、所定の表示画面を作成し、表示する。
【0101】
また、ステップST5の工程では、携帯ブラウザ起動機能部23は、端末装置102と端末装置103に対して所定の制御を行っているが、この構成に限られず、端末装置102に対してのみ所定の制御を行う構成であっても良い。
【0102】
<第2の実施例>
また、コンテンツ管理システム201は、他の実施形態として、図7に示すように、撮像機器106及び撮像機器107を削減し、PC104から撮像機器制御部24及び比較機能部25を削減する構成であっても良い。
【0103】
このような構成の場合には、コンテンツ管理システム201は、端末装置102のディスプレイに表示されている第1の撮像画像と、端末装置103のディスプレイに表示されている第2の撮像画像を目視によって見比べて、一致するかどうかの判定結果をPC104に入力する入力部16を備える。
【0104】
また、PC104は、入力部16から入力された判定結果に基づいて、携帯ブラウザ起動機能部23から送信される対象となるWebサイトのURLをアクセス制限有りWebリスト格納部26のアクセス制限有りWebリスト又はアクセス制限無しWebリスト格納部27のアクセス制限無しWebリストに登録する登録部28を備える。
【0105】
このような構成であっても、コンテンツ管理システム201は、構成要素を削減しつつ、第1の撮像画像と第2の撮像画像の比較結果に基づいて、対象となるWebサイトに対するアクセス制限の有無について判定することができ、カテゴリ判定の適正の判定に活用を図ることができる。
【0106】
<第3の実施例>
また、コンテンツ管理システム201は、他の実施形態として、図8に示すように、撮像機器106及び撮像機器107を削減し、PC104から比較機能部25を削減する構成であっても良い。
【0107】
このような構成の場合には、端末装置102は、携帯ブラウザの機能又は他の機能として、ディスプレイに表示されている第1の撮像画像を画像データとして保存できるキャプチャ機能を有する。また、同様にして、端末装置103は、携帯ブラウザの機能又は他の機能として、ディスプレイに表示されている第2の撮像画像を画像データとして保存できるキャプチャ機能を有する。
【0108】
端末装置102は、キャプチャ機能により保存した第1の撮像画像の画像データをPC104に送信する。また、同様にして、端末装置103は、キャプチャ機能により保存した第2の撮像画像の画像データをPC104に送信する。
【0109】
PC104は、第1の撮像画像の画像データと、第2の撮像画像の画像データを既述した方法によって同一かどうかの比較処理を行う。
【0110】
このような構成であっても、コンテンツ管理システム201は、構成要素を削減しつつ、第1の撮像画像の画像データと第2の撮像画像の画像データの比較結果に基づいて、対象となるWebサイトに対するアクセス制限の有無について判定することができ、カテゴリ判定の適正の判定に活用を図ることができる。
【0111】
<第4の実施例>
また、本実施例では、コンテンツ管理システム201は、二台の端末装置(端末装置102及び端末装置103)と、二台の撮像機器(撮像機器106及び撮像機器107)により構成されるものとして説明したがこれに限られず、図9及び図10に示すように、一台の端末装置102と、一台の撮像機器106により構成されても良い。なお、キャッシュ生成機能部22や比較機能部25は、端末装置や撮像機器の数の増減によらず、上述の説明と同様に動作する。
【0112】
このような構成の場合には、携帯ブラウザ起動機能部23は、順番に端末装置102と撮像機器106を制御する。具体的には、端末装置102は、携帯ブラウザ起動機能部23の制御にしたがって、特定の位置を示すURL(キャッシュ用Webサーバ105)にアクセスし、当該URLに格納されているHTMLに基づく画像を携帯ブラウザで表示し、その旨を撮像機器制御部24に通知する。
【0113】
次に、端末装置102は、携帯ブラウザ起動機能部23の制御にしたがって、対象となるWebサイトのURL(Webサーバ101)にアクセスし、当該URLに格納されているHTMLに基づく画像を携帯ブラウザで表示し、その旨を撮像機器制御部24に通知する。
【0114】
撮像機器制御部24は、所定のタイミングで撮像機器106により端末装置102のディスプレイを撮像するように制御する。具体的には、撮像機器制御部24は、撮像機器106から供給される画像に基づいて、端末装置102のディスプレイに表示されている通信中を示すアイコンの点滅が静止することを確認する等の方法により、通信が完了してディスプレイ上の描画処理が完了したことを確認し、確認後に撮像機器106により端末装置102のディスプレイを撮像する。
【0115】
撮像機器106は、撮像機器制御部24の制御にしたがって、端末装置102のディスプレイに表示されている特定の位置を示すURL(キャッシュ用Webサーバ105)に格納されているHTMLに基づく画像を第1の撮像画像として撮像し、次に、端末装置102のディスプレイに表示されている対象となるWebサイトのURL(Webサーバ101)に格納されているHTMLに基づく画像を第2の撮像画像として撮像する。
【0116】
比較機能部25は、所定の方法によって第1の撮像画像と第2の撮像画像の類似度(又は一致度)を判定し、判定結果に応じて、対象となるWebサイトのURLをアクセス制限有りWebリスト格納部26のアクセス制限無しWebリスト、又はアクセス制限無しWebリスト格納部27のアクセス制限無しWebリストに登録する。
【0117】
このように構成されることによって、コンテンツ管理システム201は、端末装置103及び撮像機器107を削減することができ、コストダウンを図りつつ、対象となるWebサイトに対するアクセス制限の有無について判定することができ、カテゴリ判定の適正の判定に活用を図ることができる。さらに、コンテンツ管理システム201は、端末装置102及び撮像機器106のみを用いることによって、機器ごとの誤差や設定の差等を排除し、第1の撮像画像と第2の撮像画像の撮像条件を完全に同一にすることができるメリットがある。なお、端末装置と撮像機器を単体で構成する場合と、複数で構成する場合とで、処理時間に差が出るので、必要な条件に応じて構成を変更することが望ましい。
【0118】
なお、本実施例では、携帯サイトを想定して説明を行ったが、これに限られず、HTMLに基づく表示を行う端末装置において、当該端末装置が受信したHTMLのソースファイルを、他のプログラムと共有できる端末内部のメモリ上、又は外部メモリ上に展開できないWebブラウザについても、本実施例で提案した方式が適用可能である。
【符号の説明】
【0119】
1 コンテンツ取得装置
11 取得部
12 記憶部
13 制御部
14 撮像部
15 撮像制御部
16 入力部
17 判定部
21 判定対象Webサイトリスト格納部
22 キャッシュ生成機能部
23 携帯ブラウザ起動機能部
24 撮像機器制御部
25 比較機能部
26 アクセス制限有りWebサイトリスト格納部
27 アクセス制限無しWebサイトリスト格納部
28 登録部
100 ネットワーク
101 Webサーバ
102 端末装置
103 端末装置
105 キャッシュ用Webサーバ
106 撮像機器
107 撮像機器
201 コンテンツ管理システム

【特許請求の範囲】
【請求項1】
所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得部と、
前記取得部により取得された前記コンテンツ記述データを記憶する記憶部と、
前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する制御部を備えるコンテンツ取得装置。
【請求項2】
被写体を撮像する撮像部と、
前記撮像部を制御する撮像制御部を備え、
前記制御部は、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御し、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行う請求項1記載のコンテンツ取得装置。
【請求項3】
情報を入力する入力部と、
前記入力部により入力された結果に基づいて、前記対象となるWebサイトのアクセス制限の有無を判定する判定部を備え、
前記制御部は、前記端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザに表示させ、また、前記端末装置又は前記端末装置とは異なる端末装置にアクセスして、前記第2のWebブラウザを起動し、前記対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを前記第2のWebブラウザに表示させ、
前記判定部は、前記記憶部に記憶されているコンテンツ記述データに基づく表示と、前記対象となるWebサイトのコンテンツ記述データに基づく表示の一致又は不一致の情報が前記入力部により入力された場合、前記情報に基づいて、前記対象となるWebサイトのアクセス制限の有無を判断する請求項1記載のコンテンツ取得装置。
【請求項4】
前記対象となるWebサイトのアクセス制限の有無を判定する判定部を備え、
前記制御部は、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御し、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行い、前記撮像部によって撮像された第1の撮像画像と、
前記端末装置又は前記端末装置とは異なる端末装置にアクセスして、前記第2のWebブラウザを起動し、前記対象となるWebサイトにアクセスさせて、当該Webサイトのコンテンツ記述データを前記第2のWebブラウザに表示させ、その後、前記第2のWebブラウザで表示されている画像を前記撮像部によって撮像するように前記撮像制御部に対して撮像命令を行い、前記撮像部によって撮像された第2の撮像画像を所定の方法によって比較し、
前記判定部は、前記比較した結果に基づいて、前記対象となるWebサイトのアクセス制限の有無を判定する請求項2記載のコンテンツ取得装置。
【請求項5】
前記制御部は、前記所定の方法として、前記第1の撮像画像と前記第2の撮像画像における同一の座標位置における複数の画素から構成される領域同士が一致するかどうかによって比較を行う請求項4記載のコンテンツ取得装置。
【請求項6】
Webサイトのカテゴリを判定するカテゴリ判定部を備え、
前記判定部は、前記対象となるWebサイトについてのアクセス制限が有ると判定した場合には、前記対象となるWebサイトをアクセス制限付きリストに登録し、前記対象となるWebサイトについてのアクセス制限が無いと判定した場合には、前記対象となるWebサイトをアクセス制限無しリストに登録し、
前記カテゴリ判定部は、前記アクセス制限無しリストに登録されているWebサイトについて、カテゴリの判定を行う請求項3又は4記載のコンテンツ取得装置。
【請求項7】
所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得工程と、
前記取得工程により取得された前記コンテンツ記述データを記憶部に記憶する記憶工程と、
前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する表示制御工程を備えるコンテンツ取得方法。
【請求項8】
所定の言語で記述されたWebサイトを閲覧可能な第1のWebブラウザにより対象となるWebサイトにアクセスし、当該Webサイトからコンテンツ記述データを取得する取得工程と、
前記取得工程により取得された前記コンテンツ記述データを記憶部に記憶する記憶工程と、
前記所定の言語とは異なる言語で記述されたWebページも閲覧可能な第2のWebブラウザを有する端末装置にアクセスして、前記第2のWebブラウザを起動し、前記記憶部に記憶されている前記コンテンツ記述データを前記第2のWebブラウザで表示するように制御する表示制御工程をコンピュータによって実現するためのコンテンツ取得プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−248522(P2011−248522A)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願番号】特願2010−119516(P2010−119516)
【出願日】平成22年5月25日(2010.5.25)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成22年度、独立行政法人情報通信研究機構「高度通信・放送研究開発委託研究/インターネット上の違法・有害情報検出技術の研究開発」、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(599108264)株式会社KDDI研究所 (233)
【Fターム(参考)】