説明

Webサイト構成分析装置およびサイト構成分析方法

【課題】Webサイトのサイト構成を他のサイト構成に移行する時の移行作業を確実に行い得るようにすると共に、移行作業時作業量を精確に把握できるようにして、作業効率および品質の向上を図る。
【解決手段】トップページ決定手段により決定されたトップページを起点としてリンクが設けられているWebページのリンクの一覧を作成するリンク一覧作成手段と、リンク一覧作成手段により作成されたWebページのリンクを辿って各Webページについて、Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素を抽出する移行作業時作業量影響要素抽出手段と、を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、Webサイトの構成を分析するWebサイト構成分析装置およびWebサイト構成分析方法に関する。
【背景技術】
【0002】
従来、Webサイト、すなわちホームページ構成を分析する場合に、特許文献1に示されているように、ホームページを構成するファイルをインターネットを介して取得し、取得されたファイルの形式を判断し、アンカータグやイメージタグ等の存在を判別し、URLを分析しURLの示すホームページを検出し、ホームページ全体の構成を分析することが行われている。
【0003】
Webサイトの分析は、Webサイト内に実際に設けられているリンクの経路を辿り、Webサイトを構成する各Webページ間のリンクの経路を分析することにより行われる。
【0004】
特許文献2には、Webサイトの構成をリンクの経路を辿って分析し、Webサイト全体の構成を視覚的に容易に認識できるように表示するWebサイト分析システムが記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平10−207756号公報
【特許文献2】特開2003−337738号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献2には、Webサイトの構成をトップページを起点とする階層構成にして、トップページを起点にする階層構造で表示することを行っているが、このようにWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量については言及していない。
Webサイトの移行作業時には、
・作業量見積り
・作業対象ファイルの洗い出し
・サイト構成の見直し検討
が必要であるが、これらの作業には手間すなわち工数がかかっており、間違いがあると、見積りや品質に影響を与えることになる。
【0007】
本発明は、かかる点に鑑みてWebサイトのサイト構成を他のサイト構成に移行する時の移行作業を確実に行い得るようにすると共に、移行作業時作業量を精確に把握できるようにして、作業効率および品質の向上を図ることを目的とする。
【課題を解決するための手段】
【0008】
本発明は、Webサイトを構成するWebページのデータを記憶し、各Webページの影響要素を記憶するデータ記憶手段と、
前記データ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページを決定するトップページ決定手段と、
前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページのリンクの一覧を作成するリンク一覧作成手段と、
前記リンク一覧作成手段により作成された前記Webページのリンクを辿って各Webページについて、前記Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素を抽出する移行作業時作業量影響要素抽出手段と、
を備えたことを特徴とするWebサイト構成分析装置を提供する。
【0009】
本発明は、また、前記移行作業時作業量影響要素抽出手段は、次に示す要素抽出機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置を提供する。
【0010】
・各Webページの文字数を数える機能
・画像のリンクを数える機能
・PDFのリンクを数える機能
・テーブルの数を数える機能
・デッドリンクを検出する機能
・Webページの総数を数える機能
・Webページの更新日時を取得する機能
本発明は、また、前記移行作業時影響要素抽出手段は、さらに次に示す機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置を提供する
・各Webページのタイトルを取得する機能
・代替テキストが付与されていない画像を検出する機能
・パンくずナビゲーションを取得する機能
本発明は、また、前記移行作業時影響要素抽出手段は、さらに次に示す機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置を提供する。・各Webページの見出しを取得する機能
・URLのディレクトリ階層を提示する機能
本発明は、データ記憶手段に、Webサイトを構成するWebページのデータが記憶され、各Webページの影響要素が記憶され、
トップページ決定手段によって、前記データ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページが決定され、
リンク一覧作成手段によって、前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページのリンクの一覧が作成され、
移行作業時作業量影響要素抽出手段によって、前記リンク一覧作成手段により作成された前記Webページのリンクが辿られて各Webページについて、前記Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素が抽出され、
を備えたことを特徴とするWebサイト構成分析方法を提供する。
【0011】
本発明は、また、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするサイト構成分析方法を提供する。
【0012】
・各Webページの文字数を数える機能
・画像のリンクを数える機能
・PDFのリンクを数える機能
・テーブルの数を数える機能
・デッドリンクを検出する機能
・Webページの総数を数える機能
・Webページの更新日時を取得する機能
本発明は、また、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするWebサイト構成分析方法を提供する。
【0013】
・各Webページのタイトルを取得する機能
・代替テキストが付与されていない画像を検出する機能
・パンくずナビゲーションを取得する機能
本発明は、また、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするWebサイト構成分析方法を提供する。
【0014】
・各Webページの見出しを取得する機能
・URLのディレクトリ階層を提示する機能
・各Webページの文字数を数える機能
【発明の効果】
【0015】
本発明によれば、上述のようにトップページを起点としてリンクを辿り、各Webページについて、移行作業時作業量に影響する要素を抽出するようにしているので、Webサイド構成を他のサイト構成に移行する時の移行作業を確実に行うことができ、かつ作業効率および品質の向上を図ることができる。
【図面の簡単な説明】
【0016】
【図1】本発明の実施例の概略構成を示す図。
【図2】本発明の実施例の構成を示すブロック図。
【図3】要素抽出手段が備える機能とこの機能によって抽出される要素(パラメータ)を示す図。
【図4】ディレクトリ階層で示されたWebサイト機能図。
【図5】その他の出力内容を示す図。
【図6】その他の出力内容を示す図。
【図7】その他の出力内容を示す図。
【図8】本発明の実施例のフローチャートを示す図。
【発明を実施するための形態】
【0017】
以下、本発明の実施例を図面に基づいて説明する。
【実施例】
【0018】
図1は、本発明の実施例の概略構成を示し、図2は本発明の実施例をブロックで示す。
【0019】
図1において、本発明に実施例であるWebサイト構成分析装置100は、ネットを介してWebサーバに接続され、各種情報、特にWebサイトを構成するWebページについての情報が収集4される。
【0020】
Webサイト構成分析装置100は、2に示すように,Webページについての情報を入力すると、Webサイトのトップページを指定して(トップページの決定)、自動的にリンクを辿って、リンク一覧作成、移行作業時作業量影響要素抽出の分析5を行い、その結果は出力6に反映される。出力の1例としては、Webサイト構成がCSV(Comma-Separated Values)ファイル6として出力7され、またディレクトリ階層構造として出力される。2の内容は、図2に詳述されている。
【0021】
図2において、Webサイト構成分析装置100は、入力手段11、トップページ手段12、リンク一覧作成手段13、移行作業時作業量影響要素(パラメータ)抽出手段14、CSVファイル形成手段15、階層構造形成手段16、出力手段17およびデータ記憶手段20を有して、表示画面を備えた画面表示手段21に接続される。画面表示手段21は、Webサイト構成分析装置100内に組み込まれる場合もあるし、通信手段を介して接続される場合もある。
【0022】
入力手段11は、ネット1を介してWebサーバ3からWebサイトを構成するWebページのデータを入力する。入力されたWebページデータはデータ記憶手段20に記憶される。データ記憶手段20には、更に各Webページの影響要素、階層化ルールおよび各種の操作のためのプログラムが格納される。
【0023】
トップページ決定手段12は、Webサイト構成分析指令があると、データ記憶手段20に記憶されているWebページの中からWebサイトのトップページを決定する。Webページに付されているタイトルあるいは名称のWebページをトップページとして決定することができる。
【0024】
Webサイト内のWebページは、原則的にリンク連結され、互いに行き来できるように構成されている。
【0025】
図3は、移行時の作業量見積りに当っての基本対応、付加対応としてのアクセシビリティ対応およびユーザビリティ対応とに分けて構成してある。
【0026】
基本対応の場合に、要素抽出手段14は対応機能として次の機能を備える、
・各Webページの文字数を数える機能
・画像のリンクを数える機能
・PDFのリンクを数える機能
・テーブルの数を数える機能
・デッドリンクを検出する機能
・ページの総数を数える機能
・ページの更新日時を取得する機能
これらの対応機能によって次の抽出要素(パラメータ)が抽出される
・各Webページの文字数
・画像のリンクの数
・PDF(Portable Document Format)のリンクの数
・テーブル(table要素)の数
・デッドリンクの数
・ページの総数
・ページの更新日時
基本対応に加えて、アクセシビリティ対応する場合に、要素抽出手段14は対応機能として次の機能を備える。
【0027】
・ページのタイトルを取得する機能
・代替テキストが付与されていない画像を検出する機能
・パンくずナビゲーションを取得する機能
これらの機能によって次の抽出要素が抽出される。
【0028】
・ページにタイトル
・画像(img要素)の代替テキスト(alt属性)
・パンくずナビゲーション
更に、上述に加えて、ユーザビリティ対応する場合に、要素抽出手段14は対応機能として次の機能を備える。
【0029】
・ページの見出しを取得する機能
・URL(Uniform Resource Locatorインターネット上に存在する情報資源(文書や画像などの)の場所を指す。)のディレクトリ階層を提供する機能
各Webページの文字数を数える機能
これらの機能によって次の抽出要素が抽出される
・ページの見出し
・ディレクトリ階層
・各Webページの文字数
CSVファイル形成手段15は、移行作業時作業量影響要素抽出手段14の制御の下に自動的にリンクを辿ってWebサイト構成をCSVファイルとして出力する。
【0030】
また、階層構造形成手段16は、自動的にリンクを辿ってWebサイト構成をデータ記憶手段20に格納された階層ルールを用いて階層構造を出力する。
【0031】
図4は、Webサイト構成をディレクトリ階層表示した例を示す。ディレクトリ階層とは、URLの各ディレクトリを前から順に並べて階層化されたものである。図4に示すように、基本的に階層が深くなるにつれ、対象とする内容が縛られるようになる。全てのファイルが階層わけして一覧になるので、Webサイトの構成が1回でわかるようになる。このように、Webサイト構成が見える化され、ユーザビリティの評価、改善検討に使用し易いものとされる。
【0032】
図5は、出力手段19から出力されるその他の出力内容を示す。すなわちWebサイトの閲覧状況を分析した結果を併せて表示することができる。
●ページタイトル
●大見出し
●テーブル数
●alt未指定img数
●URL
●文字数(タグ等は除く)
●更新日時
●h1の数(見出し。見出しのレベルはh1〜h6まであり、h1が一番大きな見出しとなる。)
●リンク情報
・全リンク数
・画像へのリンク数
・PDFへのリンク数
・外部リンク数
・デッドリンク数
※デッドリンクの一覧も別CSVで出力
【0033】
図6は、アクセシビリティ対応した場合に出力されるその他の出力内容を示す。
図7は、ユーザビリティ対応した場合に出力されるその他の出力内容を示す。
【0034】
上述の実施の形態に係るWebサイト構成分析システムにおいては、WebサイトがXML,HTML等の言語で記述されている場合、あるいはCGI(Common Gateway Interface)を用いたWebサイトや、動画を組み込んだWebサイトの構成について分析することができる。
【0035】
図8は、本発明の実施例のフローチャートを示す。
【0036】
図8において、トップページ決定手段が、データ記憶手段に記憶されているWebページの中から、Webサイトのトップページが決定する(S1)。
【0037】
リンク一覧作成手段が、トップページ決定手段により決定されたトップページを起点としてリンクが設けられているWebページのリンクの一覧を作成する(S2)。
【0038】
移行作業時作業量影響要素抽出手段が、リンク一覧作成手段により作成されたWebページのリンクを辿って各Webページについて、Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素を抽出する(S3)。
【0039】
CSVファイル形成手段が、CSVファイルを形成する(S4)。
【0040】
階層構造形成手段が、階層構造形成する(S5)。
【0041】
生成された結果はすべて画面表示手段の表示画面に表示される(S6)。
【符号の説明】
【0042】
1…ネット、3…Webサーバ、4…情報収集、5…分析、6…CSVファイル、7…出力、11…入力手段、12…トップページ決定手段、13…リンク一覧作成手段、14…移行作業時作業量影響要素抽出手段(要素抽出手段)、15…CSVファイル形成手段、16…階層構造形成手段、17…出力手段、20…データ記憶手段、21…画面表示手段、100…Webサイト構成分析装置。

【特許請求の範囲】
【請求項1】
Webサイトを構成するWebページのデータを記憶し、各Webページの影響要素と移行作業時作業量との関係を記憶するデータ記憶手段と、
前記データ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページを決定するトップページ決定手段と、
前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページのリンクの一覧を作成するリンク一覧作成手段と、
前記リンク一覧作成手段により作成された前記Webページのリンクを辿って各Webページについて、前記Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素を抽出する移行作業時作業量影響要素抽出手段と、
を備えたことを特徴とするWebサイト構成分析装置。
【請求項2】
請求項1において、前記移行作業時作業量影響要素抽出手段は、次に示す要素抽出機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置。
・各Webページの文字数を数える機能
・画像のリンクを数える機能
・PDFのリンクを数える機能
・テーブルの数を数える機能
・デッドリンクを検出する機能
・Webページの総数を数える機能
・Webページの更新日時を取得する機能
【請求項3】
請求項2において、前記移行作業時影響要素抽出手段は、さらに次に示す機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置。
・各Webページのタイトルを取得する機能
・代替テキストが付与されていない画像を検出する機能
・パンくずナビゲーションを取得する機能
【請求項4】
請求項3において、前記移行作業時影響要素抽出手段は、さらに次に示す機能の1つ以上もしくは全部を備えることを特徴とするWebサイト構成分析装置。
・各Webページの見出しを取得する機能
・URLのディレクトリ階層を提示する機能
【請求項5】
データ記憶手段に、Webサイトを構成するWebページのデータが記憶され、各Webページの影響要素と移行作業時作業量との関係が記憶され、
トップページ決定手段によって、前記データ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページが決定され、
リンク一覧作成手段によって、前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページのリンクの一覧が作成され、
移行作業時作業量影響要素抽出手段によって、前記リンク一覧作成手段により作成された前記Webページのリンクが辿られて各Webページについて、前記Webページを構成するWebサイトのサイト構成を他のサイト構成に移行する時の移行作業時作業量に影響する要素が抽出され、
を備えたことを特徴とするWebサイト構成分析方法。
【請求項6】
請求項5において、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするサイト構成分析方法。
を特徴とするWebサイト構成分析装置。
・各Webページの文字数を数える機能
・画像のリンクを数える機能
・PDFのリンクを数える機能
・テーブルの数を数える機能
・デッドリンクを検出する機能
・Webページの総数を数える機能
・Webページの更新日時を取得する機能
【請求項7】
請求項6において、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするWebサイト構成分析方法。
・各Webページのタイトルを取得する機能
・代替テキストが付与されていない画像を検出する機能
・パンくずナビゲーションを取得する機能
【請求項8】
請求項7において、次に示す要素機能の1つ以上もしくは全部を備える前記移行作業時作業量影響要素抽出手段によって、各機能に対応する要素が抽出されることを特徴とするWebサイト構成分析方法。
・各Webページの見出しを取得する機能
・URLのディレクトリ階層を提示する機能
各Webページの文字数を数える機能

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate