説明

ウェブサイト判定装置およびウェブサイト判定プログラム

【課題】判定先ウェブサイトの画像を使用して、判定先ウェブサイトが偽装されているウェブサイトであるか否かを判定することが可能となる。
【解決手段】ホワイトリストDB16は、ウェブサイトの画面画像を記憶する。入力部11はウェブサイト2のURLの入力を受け付ける。キャプチャ画面取得部12は、入力部11が入力を受け付けたURLで示されるウェブサイト2の画面画像を取得する。アクセス判定部14は、キャプチャ画面取得部12が取得した画面画像と、ホワイトリストDB16が記憶する画面画像とを比較し、比較した結果に基づいて、ウェブサイト2が偽装されているウェブサイトか否か判断する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、判定先ウェブサイトが偽装されているか否かを判定する、ウェブサイト判定装置およびウェブサイト判定プログラムに関する。
【背景技術】
【0002】
従来、判定先ウェブサイトが偽装されているウェブサイトであるか否かを判定する方法として、アクセスを許可するウェブサイトのURLを予め記憶部に記憶し、判定先ウェブサイトのURLと、記憶部が記憶しているURLとを比較し、URLが一致した場合、判定先ウェブサイトは偽装されているウェブサイトではないと判断する方法が知られている(例えば特許文献1参照)。
【特許文献1】特開2007−25789号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、判定先ウェブサイトの画像を使用して、判定先ウェブサイトが偽装されているか否かを判定する方法は記載されていない。
【0004】
本発明は、判定先ウェブサイトの画像を使用して、判定先ウェブサイトが偽装されているウェブサイトであるか否かを判定することが可能なウェブサイト判定装置およびウェブサイト判定プログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明は、ウェブサイトの画面画像を記憶する記憶部と、判定先ウェブサイトのURLの入力を受け付ける入力部と、前記入力部が入力を受け付けたURLで示される前記判定先ウェブサイトの画面画像を取得する画面取得部と、前記画面取得部が取得した画面画像と、前記記憶部が記憶する画面画像とを比較する画面画像比較部と、前記画面画像比較部が比較した結果に基づいて、前記判定先ウェブサイトが偽装されているウェブサイトか否か判定するアクセス判定部と、を備えたことを特徴とするウェブサイト判定装置である。
【0006】
また、本発明のウェブサイト判定装置において、前記記憶部は、ウェブサイトの画面画像と、前記ウェブサイトのドメイン名とを関連して記憶し、前記画面画像比較部はさらに、前記記憶部が記憶する前記ウェブサイトのドメイン名と、前記URLに含まれるドメイン名とを比較することを特徴とする。
【0007】
また、本発明は、ウェブサイトの画面画像を記憶する記憶ステップと、判定先ウェブサイトのURLの入力を受け付ける入力ステップと、前記入力ステップで入力を受け付けたURLで示される前記判定先ウェブサイトの画面画像を取得する画面取得ステップと、前記画面取得ステップで取得した画面画像と、前記記憶ステップで記憶する画面画像とを比較する画面画像比較ステップと、前記画面画像比較ステップで比較した結果に基づいて、前記判定先ウェブサイトが偽装されているウェブサイトか否か判定するアクセス判定ステップと、の処理をコンピュータに実行させることを特徴とするウェブサイト判定プログラムである。
【発明の効果】
【0008】
本発明によれば、判定先ウェブサイトの画像を使用して、判定先ウェブサイトが偽装されているウェブサイトであるか否かを判定することが可能となる。
【発明を実施するための最良の形態】
【0009】
以下、図面を参照し、本発明の実施形態を説明する。図1は本発明の一実施形態によるウェブサイト判定装置の構成を示した構成図である。ウェブサイト判定装置1は、入力されたURLで示されるウェブサイトが、偽装されたウェブサイトか否か判断する。ウェブサイト判定装置1は、入力部11と、キャプチャ画面取得部12と、画像処理部13と、アクセス判定部14と、出力部15と、ホワイトリストDB16と、画像DB17とを備える。
【0010】
入力部11は、偽装されたウェブサイトか否か判定するウェブサイトのURLの入力を受け付ける。キャプチャ画面取得部12は、ウェブサイト2にアクセスし、判定対象のウェブサイトの画面イメージを取得する。画像処理部13は、判定対象のウェブサイトのキャプチャ画面の処理を行う。アクセス判定部14は、画像処理部13が処理したキャプチャ画面の情報と、ホワイトリストDB16が記憶している情報もしくは画像DB17が記憶している情報とに基づいて、入力部11が入力を受け付けたウェブサイトが偽装されたウェブサイトか否か判定する。出力部15は、アクセス判定部14が判定した結果を出力する。
【0011】
次に、ウェブサイト判定装置1が判定対象のウェブサイトが偽装されたウェブサイトか否か判定する手順について図2を参照して説明する。図2はウェブサイト判定装置1が、判定対象のウェブサイトが偽装されたウェブサイトか否か判定する手順を示したフローチャートである。
【0012】
(ステップS101)
入力部11は、判定対象のウェブサイトのURLの入力を受け付ける。入力部11におけるURLの受け付け方法としては、キーボードなどの入力装置を用いてユーザが直接指定したURLを受け付ける方法や、メールなどの文書中から抽出したURLを受け付ける方法や、ウェブブラウザがアクセスしたページから抽出したURLを受け付ける方法などが考えられる。
【0013】
(ステップS102)
キャプチャ画面取得部12は、入力部が受け付けたURLで指定されるウェブサイトにアクセスし、アクセスした先のウェブサイトのキャプチャ画面を取得する。例えば、キャプチャ画面取得部12は、ブラウザを立ち上げ、立ち上げたブラウザにステップS101で入力を受け付けたURLを読み込ませ、URLで指定されたサイトの画像をブラウザに表示させ、サイトの画像が表示された状態のブラウザのキャプチャ画面を取得しても良い。
【0014】
(ステップS103)画像処理部13は、ステップS102でキャプチャ画面取得部12が取得したキャプチャ画面の処理を行う。なお、ここでのキャプチャ画面の処理は、ステップS104もしくはステップS108でのキャプチャ画面の画像比較を行いやすくするために行う。キャプチャ画面の処理を終了後、ステップS104に進む。
【0015】
例えば、キャプチャ画面の解像度を下げて画像比較を行いやすくする手法がある。ステップS103での処理手順を以下に示す。
(ステップS201)画像処理部13は、キャプチャ画面を加工し、ブラウザ特有の画像を削除する。例えば、ブラウザの操作部分、URL入力部分などを削除する。
(ステップS202)画像処理部13は、ステップS201で加工したキャプチャ画面で使用されている色についてのヒストグラムを作成する。例えば、ヒストグラムの横軸には色、縦軸には画素数をとる。
【0016】
(ステップS203)画像処理部13は、ステップS202で作成したヒストグラムにおいて横軸を分割し、その領域ごとに色を指定して減色を行う。例えば、横軸を64個に分割して64色まで減色する。なお、色の数は予め決めておき、減色後に使用される色はどのキャプチャ画面の場合も同じとする。
(ステップS204)画像処理部13は、キャプチャ画面の各画素の色を、ステップS203で減色を行った色に基づいて変更する。その後、画像処理部13は、キャプチャ画面の画素毎に使用されている色を数え、使用されている数が少ない順に順序を付ける。
【0017】
(ステップS205)画像処理部13は、キャプチャ画面を2×2画素ごとの領域に分ける。それぞれの領域には4個の画素が含まれる。画像処理部13は、領域に含まれる4個の画素の色のうち、ステップS204で数えたキャプチャ画面内で使用されている数が一番少ない色を選択し、2×2マスの領域に含まれる画素を選択した色に変更し、1個の画素とする。例えば、領域内に含まれている色は、赤、青、黄、緑であり、ステップS204で数えたキャプチャ画面内で使用されている色の数は、黄>緑>赤>青であるとすると、領域内は1個の青の画素となる。
【0018】
(ステップS206)画面処理部13は、キャプチャ画面の画素を、ステップS205の処理で生成された画素とする。よって、キャプチャ画面の縦および横の画素数は、ステップS205時点でのキャプチャ画面の画素数と比較して半分の数の画像となる。
(ステップS207)画像処理部13は、キャプチャ画面の画素数が予め指定した大きさになるまでステップS204からステップS206の処理を繰り返し、キャプチャ画面の画素数が予め指定した大きさになるとキャプチャ画面処理を終了する。例えば、ステップS206で生成するキャプチャ画面の画素数が縦200画素かつ横200画素以下になるまで、画像処理部13は処理を繰り返し、キャプチャ画面の画素数が縦200画素かつ横200画素以下になるとキャプチャ画面処理を終了する。
【0019】
また、キャプチャ画面の特徴を抽出し、抽出した特徴に基づいて比較することで、画像比較を行いやすくする手法がある。ステップS103でのキャプチャ画面の処理手順を以下に示す。
(ステップS301)画像処理部13は、キャプチャ画面を加工し、html表示部分以外を削除する。
(ステップS302)画像処理部13は、ステップS301で加工したキャプチャ画面のヒストグラムを作成する。
【0020】
(ステップS303)画像処理部13は、ステップS302で作成したヒストグラム内を固まりに分け、その領域ごとに色を指定して減色を行う。例えば、64色まで減色する。なお、色の数は予め決めておき、減色後に使用される色はどのキャプチャ画面の場合も同じとする。
(ステップS304)画像処理部13は、ステップS303で減色を行った後のキャプチャ画面を文字領域と画像領域とに分ける。
【0021】
(ステップS305)画像処理部13は、背景色と、ステップS304で分けた文字領域、画像領域それぞれの領域の形や色、位置情報および位置関係を記憶し、画像処理を終了する。
【0022】
(ステップS104)
アクセス判定部14は、ステップS103での処理によって得られたキャプチャ画面の情報と、ホワイトリストDB16に記憶されている画像情報とを比較し、一致するか否か判断する。ステップS103での処理によって得られたキャプチャ画面の情報と、ホワイトリストDB16に記憶されている画像情報とが一致するとアクセス判定部14が判断した場合、ステップS105に進み、ステップS103での処理によって得られたキャプチャ画面と、ホワイトリストDB16に記憶されている画像情報とが一致しないとアクセス判定部14が判断した場合、ステップS108に進む。なお、ホワイトリストDB16には、予め、代表的な金融サイトや、ショッピングサイトの画像情報と、ドメイン名とが関連付けられて記憶されている。また、画像情報は、予め取得したサイトのキャプチャ画面に対して、ステップS103と同一の処理を行い作成する。
【0023】
なお、ステップS104において、ステップS103での処理によって得られたキャプチャ画面の情報と、ホワイトリストDB16に記憶されている画像情報とが一致するとアクセス判定部14が判断した場合、当該ウェブサイトへのアクセスを許可し、ステップS103での処理によって得られたキャプチャ画面と、ホワイトリストDB16に記憶されている画像情報とが一致しないとアクセス判定部14が判断した場合、当該ウェブサイトへのアクセスを許可しないとしてもよい。これにより、ステップS102でキャプチャ画面取得部12が取得したキャプチャ画面に基づいて、ウェブサイトへのアクセス可否を判定することが可能となる。
【0024】
(ステップS105)
アクセス判定部14は、ステップS101で入力を受け付けたURLに含まれるドメイン名と、ステップS104で一致すると判断した画像情報に関連付けられてホワイトリストDB16に記憶されているドメイン名とを比較し、ドメイン名が一致しているか否か判断する。ドメイン名が一致しているのであれば正規のサイトであることがわかり、ドメイン名が異なっていれば、フィッシングサイトなどの偽装サイトであることがわかる。
アクセス判定部14が、ドメイン名が一致していると判断した場合、ステップS106に進み、ドメイン名が一致していないと判断した場合、ステップS107に進む。
【0025】
(ステップS106)
アクセス判定部14は、ステップS101で受け付けたURLのサイトにはアクセスを許可すると判断する。出力部15は、アクセス判定部14が判断した結果を出力し、その後処理を終了する。
(ステップS107)
アクセス判定部14は、ステップS101で受け付けたURLのサイトにはアクセスを許可しないと判断する。出力部15は、アクセス判定部14の判断した結果を出力し、その後処理を終了する。
【0026】
(ステップS108)
アクセス判定部14は、ステップS103で処理を行ったキャプチャ画面が画像DB17に記憶されている画像情報と一致するか否か判断する。ステップS103で処理を行ったキャプチャ画面が画像DB17に記憶されている画像情報と一致するとアクセス判定部14が判断した場合、ステップS109に進み、ステップS103で処理を行ったキャプチャ画面が画像DB17に記憶されている画像情報と一致しないとアクセス判定部14が判断した場合、ステップS111に進む。なお、画像DB17には、ステップS112で取得した情報および判断した結果であるアクセス情報(画像情報と、ドメイン名と、アクセス許可もしくは不許可の許可情報とが関連付けられた情報)が記憶されている。ステップS112の処理については後述する。
【0027】
(ステップS109)
アクセス判定部14は、ステップS101で入力を受け付けたURLに含まれるドメイン名と、ステップS108で一致すると判断した画像情報に関連付けられて画像DB17に記憶されているドメイン名とを比較し、ドメイン名が一致しているか否か判断する。ドメイン名が一致しているのであれば、ステップS111で判断した処理と同一の処理を行えば良いため、ステップS110に進む。ドメイン名が異なっていれば、以前アクセスしたサイトと似ているが異なるサイトであるため、スパムサイトやフィッシングサイトであるとアクセス判定部14は判断し、ステップS107に進む。
【0028】
(ステップS110)アクセス判定部14は、ステップS108で一致すると判断した画像情報に関連付けられて画像DB17に記憶されているアクセス許可もしくは不許可の許可情報に基づいて、ステップS101で受け付けたURLのサイトへのアクセスを許可もしくは不許可を判断する。出力部15は、アクセス判定部14の判断した結果を出力し、その後処理を終了する。
【0029】
(ステップS111)ステップS103で処理を行ったキャプチャ画面と一致する画像がホワイトリストDB16および画像DB17に含まれていないため、本発明とは別の手法で、ステップS101で受け付けたURLのサイトへのアクセスを許可もしくは不許可を判断する。アクセス判定部14は、別の手法で判断したアクセスの許可もしくは不許可の判断結果と、ステップS103で処理を行ったキャプチャ画面と、ステップS101で受け付けたURLに含まれるドメイン名とを関連付けて、アクセス情報として画像DB17に記憶させる。出力部15は、別の手法で判断したアクセスの許可もしくは不許可の判断結果を出力し、その後処理を終了する。なお、別の手法は本発明とは関係なく、既存のサイト判断手法を使用する。
【0030】
上述したとおり、本実施形態では、判定対象サイトのキャプチャ画面を取得し、取得したキャプチャ画面と、予めホワイトリストDBに記憶されている画像情報とを比較する。比較した結果に基づいて、判定対象サイトが偽装されているウェブサイトであるか否かを判定する。よって、判定対象サイトのURLが変更された場合においても、判定対象サイトが偽装されているウェブサイトであるか否かを判定することを可能とする。
【0031】
また、サイトのURLが変更される場合においても、ドメイン名の部分は既存のドメイン名を使用することが多いため、キャプチャ画面と画像情報とが一致した場合、さらに判定対象サイトのドメイン名と、ホワイトリストDBに画像情報と関連付けて記憶されているドメイン名とが一致するか否か判断し、ドメイン名が一致した場合は判定先ウェブサイトは偽装されていないと判断する。これにより、さらに精度を向上させたウェブサイトの判定を行うことが可能となる。
【0032】
なお、上述した実施形態におけるウェブサイト判定装置の入力部全体あるいはその一部、キャプチャ画面取得部全体あるいはその一部、画像処理部全体あるいはその一部、およびアクセス判定部全体あるいはその一部は、これらの機能実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0033】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0034】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成や方法はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0035】
例えば、本実施形態では、画像比較の手法として、キャプチャ画面の解像度を下げて画像比較を行う手法または、キャプチャ画面の特徴を抽出し、抽出した特徴に基づいて画像比較を行う手法とを挙げたが、画像比較のための手法の種類は問わない。
【図面の簡単な説明】
【0036】
【図1】本発明の一実施形態によるウェブサイト判定装置の構成を示した構成図である。
【図2】本実施形態における、偽装されたウェブサイトか否か判定する手順を示したフローチャートである。
【符号の説明】
【0037】
1・・・ウェブサイト判定装置、2・・・ウェブサイト、11・・・入力部、12・・・キャプチャ画面取得部、13・・・画像処理部、14・・・アクセス判定部、15・・・出力部、16・・・ホワイトリストDB、17・・・画像DB

【特許請求の範囲】
【請求項1】
ウェブサイトの画面画像を記憶する記憶部と、
判定先ウェブサイトのURLの入力を受け付ける入力部と、
前記入力部が入力を受け付けたURLで示される前記判定先ウェブサイトの画面画像を取得する画面取得部と、
前記画面取得部が取得した画面画像と、前記記憶部が記憶する画面画像とを比較する画面画像比較部と、
前記画面画像比較部が比較した結果に基づいて、前記判定先ウェブサイトが偽装されているウェブサイトか否か判定するアクセス判定部と、
を備えたことを特徴とするウェブサイト判定装置。
【請求項2】
前記記憶部は、ウェブサイトの画面画像と、前記ウェブサイトのドメイン名とを関連して記憶し、
前記画面画像比較部はさらに、前記記憶部が記憶する前記ウェブサイトのドメイン名と、前記URLに含まれるドメイン名とを比較する
ことを特徴とする請求項1に記載のウェブサイト判定装置。
【請求項3】
ウェブサイトの画面画像を記憶する記憶ステップと、
判定先ウェブサイトのURLの入力を受け付ける入力ステップと、
前記入力ステップで入力を受け付けたURLで示される前記判定先ウェブサイトの画面画像を取得する画面取得ステップと、
前記画面取得ステップで取得した画面画像と、前記記憶ステップで記憶する画面画像とを比較する画面画像比較ステップと、
前記画面画像比較ステップで比較した結果に基づいて、前記判定先ウェブサイトが偽装されているウェブサイトか否か判定するアクセス判定ステップと、
の処理をコンピュータに実行させることを特徴とするウェブサイト判定プログラム。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2009−87226(P2009−87226A)
【公開日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願番号】特願2007−258813(P2007−258813)
【出願日】平成19年10月2日(2007.10.2)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】