ID割当装置、方法及びプログラム
【課題】複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できるID割当装置、方法及びプログラムを提供すること。
【解決手段】ID割当装置1は、複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する個人ウェブサイトDB22と、複数の個人ウェブサイトのそれぞれが分類されているクラス、及びリンク情報により示されている入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、複数の個人ウェブサイトのそれぞれに対して、オンラインの個人を識別するIDを割り当てる処理部12と、を備える。
【解決手段】ID割当装置1は、複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する個人ウェブサイトDB22と、複数の個人ウェブサイトのそれぞれが分類されているクラス、及びリンク情報により示されている入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、複数の個人ウェブサイトのそれぞれに対して、オンラインの個人を識別するIDを割り当てる処理部12と、を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ウェブサイトにIDを割り当てる装置、方法及びプログラムに関する。
【背景技術】
【0002】
従来、インターネット上で公開されているウェブサイトの中には、オフラインの個人が設定した1又は複数のオンラインの個人により管理される個人ウェブサイトが存在する。
ここで、オフラインの個人とは、ネットワーク(インターネット)を利用する現実のユーザそれぞれをいい、ネットワーク上でオンラインの個人を管理している。オンラインの個人とは、ネットワークを通じて所定のサービス群の提供を受ける仮想のユーザをいい、オフラインの個人とオンラインの個人とは、1対1又は1対多の関係にある。
近年、特に中学生や高校生の間では、各人が複数のオンラインの個人を操り、それぞれのオンラインの個人で複数の個人ウェブサイトを作成し、自身のサイト間のみならず、他者とのサイト間で互いにリンクを設け、情報やメッセージの公開及び交換を行うことが多い。
【0003】
ところで、このように相互にリンクが設けられているウェブサイトのリンク構造を解析する技術も提案されている。例えば、特許文献1では、リンク構造を解析してコミュニティの境界を判定することが示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−331070号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1の手法は、ウェブサイトのリンクを抽出し、リンク先のウェブサイトを再帰的に、リンクがなくなるまで収集するものであるため、リンクで紐付けられている全てのウェブサイトが同一のコミュニティとみなされる。
【0006】
しかしながら、上述のオンラインの個人は、互いにリンクされた複数の個人ウェブサイトを管理しているが、これらの個人ウェブサイトには、同一のオンラインの個人を特定する情報(ID)が含まれていない。また、個人ウェブサイトは、上述のように、他のオンラインの個人が管理する個人ウェブサイトともリンクで紐付けられている。したがって、リンクの有無からだけでは、同一のオンラインの個人が管理する個人ウェブサイトを特定することはできなかった。
【0007】
本発明は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できるID割当装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明では、以下のような解決手段を提供する。
【0009】
(1)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶部と、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理部と、を備えるID割当装置。
【0010】
このような構成によれば、ID割当装置は、個人ウェブサイト間におけるリンクの入出力関係の構造に基づいて、予めクラスごとに設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、この個人ウェブサイトを管理しているオンラインの個人を識別するIDを割り当てることができる。これにより、ID割当装置は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。
【0011】
この結果、ID割当装置は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
【0012】
(2)前記クラスは、前記個人ウェブサイトの利用形態を表す所定数の種別であって、当該個人ウェブサイトのURLに基づいて分類される(1)に記載のID割当装置。
【0013】
このような構成によれば、ID割当装置は、個人ウェブサイトのURLに基づいて、この個人ウェブサイトの利用形態を表すクラスに分類するので、リンク構造をクラスごとの制約と容易に照合することができる。
【0014】
(3)前記個人ウェブサイトに含まれるリンクを抽出し、当該リンクの参照先である別の個人ウェブサイト、及び当該リンクの入出力関係を示したリンク情報を前記記憶部に記憶されている前記リストに追加する収集部をさらに備える(1)又は(2)に記載のID割当装置。
【0015】
このような構成によれば、ID割当装置は、個人ウェブサイトに含まれるリンクを抽出して、個人ウェブサイト及びリンク情報のリストに追加していく。したがって、ID割当装置は、この処理を繰り返すことにより、IDを割り当てるために必要な情報を自動的に収集することができる。
【0016】
(4)前記個人ウェブサイトは、複数の前記オンラインの個人が管理するグループの個人ウェブサイトを含み、前記処理部は、前記入出力関係の構造における前記グループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、当該グループの個人ウェブサイトに対して、個人の個人ウェブサイトを管理するオンラインの個人を識別するIDと異なるIDを割り当てる(1)から(3)のいずれかに記載のID割当装置。
【0017】
このような構成によれば、ID割当装置は、リンク構造における個人の個人ウェブサイトの制約と、グループの個人ウェブサイトの制約に従って、グループの個人ウェブサイトに対して、個人の個人ウェブサイトとは異なるIDを割り当てることができる。これにより、ID割当装置は、個人ウェブサイトをより正確に管理者ごとに分類することができる。
【0018】
(5)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータが実行するID割当方法。
【0019】
このような構成によれば、ID割当方法をコンピュータが実行することにより、(1)と同様の効果が期待できる。
【0020】
(6)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータに実行させるID割当プログラム。
【0021】
このような構成によれば、ID割当プログラムをコンピュータに実行させることにより、(1)と同様の効果が期待できる。
【発明の効果】
【0022】
本発明によれば、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。
【図面の簡単な説明】
【0023】
【図1】第1実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。
【図2】第1実施形態に係るID割当装置によりオンラインIDが割り当てられた結果を示す概要図である。
【図3】第1実施形態に係るID割当装置の機能構成を示すブロック図である。
【図4】第1実施形態に係る個人ウェブサイトテーブルを示す図である。
【図5】第1実施形態に係るサイト間リレーションテーブルを示す図である。
【図6】第1実施形態に係るクラスごとの制約を示す図である。
【図7】第1実施形態に係るID割当処理を示すフローチャートである。
【図8】第1実施形態に係る処理Aを示すフローチャートである。
【図9】第1実施形態に係るID変更処理を示すフローチャートである。
【図10】第1実施形態に係る処理Bを示すフローチャートである。
【図11】第1実施形態に係る処理Cを示すフローチャートである。
【図12】第2実施形態に係るグループの個人ウェブサイトを含めた個人ウェブサイトへのOnIDの割り当て例を示す概念図である。
【図13】第2実施形態に係る追加の制約を示す図である。
【図14】第2実施形態に係る処理A1を示すフローチャートである。
【発明を実施するための形態】
【0024】
<第1実施形態>
以下、本発明の第1実施形態について説明する。
本実施形態に係るID割当装置1は、オンラインの個人が管理する個人ウェブサイトに対して、このオンラインの個人を識別するオンラインIDを割り当てる装置である。なお、ID割当装置1は、サーバ装置やPC(Personal Computer)等、様々な情報処理装置(コンピュータ)であってよい。
【0025】
図1は、本実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。
現実の人物であるオフラインの個人は、ネットワーク(インターネット)上で、1又は複数のオンラインの個人を管理している。また、オンラインの個人は、1又は複数の個人ウェブサイトを管理している。
【0026】
各オンラインの個人は、例えば、同じ学校の生徒であったり、同じ趣味を持つグループの一員であったり、オンラインの他者と一定の人間関係を持っている。そのため、複数のオンラインの個人がそれぞれ管理している個人ウェブサイトの間は、リンクで参照されていることも多い。
【0027】
ここで、個人ウェブサイトとは、オンラインの個人が、自身に関する情報を公開したり、オンラインの他者とメッセージを交換したりするためのウェブサイトをいう。例えば、以下のタイプの個人ウェブサイトがそれぞれ複数のサービスプロバイダにより提供されている。
【0028】
プロフ(プロフィール)・・・個人のプロフィールを公開できるサイト
ゲスブ(ゲストブック)・・・訪問者が履歴としてコメントを投稿できるサイト
リアル(リアルタイム)・・・個人の現況を短い文章で投稿できるサイト
ブログ・・・日々更新される日記を公開できるサイト
Myリンク・・・他者の個人ウェブサイトへのリンクを掲載できるサイト
ホムペ(ホームページ)・・・個人用のサイト
【0029】
オンラインの個人は、上記の複数のタイプの個人ウェブサイトを、サービスプロバイダごとに異なるアカウントで作成しているため、同一のIDによる紐付け(名寄せ)ができていないことが多い。例えば、「オンラインID(OnID)=1」であるオンラインの個人は、「プロフ1」及び「ゲスブ1」を管理している。これらの個人ウェブサイトは、「OnID=1」の情報を有しておらず、異なるアカウントID(1及び2)で管理されている。
【0030】
ID割当装置1は、後述の処理により、管理者であるオンラインの個人が同一である個人ウェブサイトに対して、同一のオンラインID(OnID)を割り当て、複数の個人ウェブサイトをオンラインの個人ごとに分類する。
図2は、本実施形態に係るID割当装置1によりオンラインIDが割り当てられた結果を示す概要図である。
【0031】
以下、本実施形態がIDの割り当ての対象とする個人ウェブサイトは、サイトの利用形態を表す次の3種類の種別(クラスA、クラスB及びクラスC)に分類されるものとする。なお、これらのクラス及び上記のタイプは、個人ウェブサイトのURLから判別できるものとする。
【0032】
クラスA(プロフ、ホムペ)・・・オンラインの個人が他者と識別するために作成する個人ウェブサイト
クラスB(ゲスブ、Myリンク)・・・オンラインの個人がクラスAのサイトに付随して作成する個人ウェブサイト
クラスC(リアル、ブログ)・・・オンラインの個人が他者と識別するために単体で、又はクラスAのサイトに付随して作成する個人ウェブサイト
【0033】
なお、同一の個人ウェブサイトがクラスAを含んで複数のタイプ(例えば、プロフとMyリンク等)を持つ場合もある。この場合、URLから判別されるクラスは、クラスAとなる。
【0034】
図3は、本実施形態に係るID割当装置1の機能構成を示すブロック図である。
ID割当装置1は、制御部10と、記憶部20と、通信部30と、入力部40と、出力部50とを備える。
【0035】
制御部10は、ID割当装置1の全体を制御する部分であり、記憶部20に記憶された各種プログラムを適宜読み出して実行することにより、上記のハードウェアと協働し、本実施形態における各種機能を実現している。制御部10は、CPU(Central Processing Unit)であってよい。なお、制御部10が備える各部の機能は後述する。
【0036】
記憶部20は、ハードウェア群をID割当装置1として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ハードディスク(HDD)であってよい。具体的には、記憶部20には、本実施形態の各種機能を実現させるため制御部10に実行させるプログラム(ID割当プログラム)が記憶される。
【0037】
さらに、記憶部20は、サイト保存DB21と、個人ウェブサイトDB22とを備える。サイト保存DB21は、プログラムにて取得される個人ウェブサイトのページデータを記憶する。また、個人ウェブサイトDB22は、プログラムにて作成又は編集される後述の個人ウェブサイトテーブル及びサイト間リレーションテーブルを記憶する。
【0038】
通信部30は、ID割当装置1が他の装置と情報を送受信する場合のネットワーク・アダプタであり、ネットワーク(インターネット)を介して個人ウェブサイトを管理しているサーバ100にアクセスし、ページデータを取得して制御部10へ提供する。
【0039】
入力部40は、ID割当装置1に対する利用者からの指示入力を受け付けるインタフェース装置である。入力部40は、例えば、キーボード、マウス及びタッチパネル等により構成される。
【0040】
出力部50は、利用者にデータの入力を受け付ける画面を表示したり、ID割当装置1による処理結果の画面を表示したりするディスプレイ装置を含む。さらに、出力部50は、ブラウン管表示装置(CRT)や液晶表示装置(LCD)等のディスプレイ装置の他、プリンタ等の各種出力装置を含んでよい。
【0041】
次に、制御部10の機能を詳述する。
制御部10は、収集部11と、処理部12とを備える。各部は、ID割当プログラムを実行することにより実現される機能ブロックである。
【0042】
収集部11は、個人ウェブサイトに含まれるリンクを抽出し、さらにこのリンクの参照先である別の個人ウェブサイトのページデータを取得する。そして、収集部11は、サイト保存DB21にページデータを記憶すると共に、複数の個人ウェブサイトのリスト(個人ウェブサイトテーブル)、及び複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリスト(サイト間リレーションテーブル)にそれぞれデータ追加し、個人ウェブサイトDB22を更新する。
【0043】
具体的には、収集部11は、まず、収集処理の元になるルートの個人ウェブサイトのURLと、このルートの個人ウェブサイトからリンク(HTMLにおける<a>リンク)を幾つ辿るか(リンクホップ数)の指定を受け付ける。
【0044】
次に、収集部11は、インターネットにアクセスし、ルートの個人ウェブサイトのページデータをサイト保存DB21に記憶する。さらに、このルートの個人ウェブサイトのURLを、個人ウェブサイトテーブルに追加する。
【0045】
また、収集部11は、個人ウェブサイトからリンクを取得し、リンク先が個人ウェブサイトでないものを除いて、リンク元のURLとリンク先のURLとの組合せをサイト間リレーションテーブルに追加する。
【0046】
さらに、収集部11は、リンク先のURLから取得した個人ウェブサイトのページデータをサイト保存DB21に、このURLを個人ウェブサイトテーブルにそれぞれ記憶する。そして、収集部11は、指定されたリンクホップ数まで、全てのURLが個人ウェブサイトテーブルに記憶されると収集処理を終了する。また、収集部11は、個人ウェブサイトテーブルに記憶されているURLが指定されたリンクホップ数に達していない場合には、リンクの取得、サイト間リレーションテーブルの更新、ページデータの記憶及び個人ウェブサイトテーブルの更新を繰り返す。
【0047】
図4は、本実施形態に係る個人ウェブサイトテーブルを示す図である。
個人ウェブサイトテーブルは、収集ID、ルートURL、リンク元URL、個人ウェブサイトURL、個人ウェブサイトのクラス、保存先、リンクホップ数、オンラインID(OnID)及び取得日時を記憶する。
【0048】
ここで、収集IDは、上記の収集処理ごとに付与される識別番号である。また、保存先は、サイト保存DB21内における対象のページデータの記憶場所を示すURLである。オンラインIDは、後述の割当処理によって割り当てられるオンラインの個人を識別するIDである。
【0049】
図5は、本実施形態に係るサイト間リレーションテーブルを示す図である。
サイト間リレーションテーブルは、リンク元の個人ウェブサイトの情報(URL、クラス、タイプ)、リンク先の個人ウェブサイトの情報(URL、クラス、タイプ)、収集ID及び取得日時を記憶する。
【0050】
処理部12は、複数の個人ウェブサイトのそれぞれが分類されているクラス、及びサイト間リレーションテーブルのリンク情報により示されているリンクの入出力関係の構造に基づいて、予め設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、オンラインの個人を識別するIDを割り当てる。
【0051】
ここで、予め設定されている制約とは、リンク元及びリンク先の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関するクラスごとの制約である。個人ウェブサイトは、利用形態の違いにより特有のリンク構造を有している場合が多い。そこで、図6に示すように、リンク構造に関して各クラスに特有の制約を規定した。
【0052】
(クラスAの制約)
・他者の管理する個人ウェブサイトへの出リンクを持たない。
すなわち、図6(a)に示すように、IDが異なるクラスAの個人ウェブサイト間はリンクされない。逆に、クラスAの個人ウェブサイト間がリンクされていれば、両者は同一のIDとなる。
【0053】
(クラスBの制約)
・同一者の管理するクラスAの個人ウェブサイトからの入リンクを必ず1つ以上持つ。
・他者の管理するクラスAの個人ウェブサイトからの入リンクを持たない。
すなわち、図6(b)に示すように、クラスBの個人ウェブサイトは、IDが同じ(OnID=1)クラスAの個人ウェブサイトから必ずリンクされるが、IDが異なる(OnI=2)クラスAの個人ウェブサイトからはリンクされない。逆に、クラスAの個人ウェブサイトからリンクされているクラスBの個人ウェブサイトは、リンク元と同一のIDとなる。
【0054】
(クラスCの制約)
・他者の管理するクラスAの個人ウェブサイトからの入リンクを持たない。
すなわち、図6(c)に示すように、クラスCの個人ウェブサイト(OnID=1)は、IDが異なる(OnID=2)クラスAの個人ウェブサイトからはリンクされない。逆に、クラスAの個人ウェブサイトからリンクされているクラスCの個人ウェブサイトは、リンク元と同一のIDとなる。
【0055】
図7は、本実施形態に係るID割当処理を示すフローチャートである。
ステップS1では、処理部12は、個人ウェブサイトテーブル(図4)にOnIDが未割当の個人ウェブサイトがあるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS2に移し、判定がNOの場合、処理を終了する。
【0056】
ステップS2では、処理部12は、OnIDが未割当の個人ウェブサイト(X)を1つ選択する。
ステップS3では、処理部12は、ステップS2で選択された個人ウェブサイト(X)のクラスを確認する。処理部12は、(X)がクラスAの場合、処理をステップS4に、クラスBの場合、処理をステップS5に、クラスCの場合、処理をステップS6に移す。
【0057】
ステップS4では、処理部12は、後述の処理A(図8)を実行した後、処理をステップS1に戻す。
ステップS5では、処理部12は、後述の処理B(図10)を実行した後、処理をステップS1に戻す。
ステップS6では、処理部12は、後述の処理C(図11)を実行した後、処理をステップS1に戻す。
【0058】
図8は、本実施形態に係る処理Aを示すフローチャートである。処理Aは、ID割当処理(図7)のステップS4に相当する。
【0059】
ステップS11では、処理部12は、個人ウェブサイト(X)のOnIDに、(X)のURLを割り当てる。処理部12は、以降で、(X)と管理者が同一の個人ウェブサイトの存在を確認する。なお、割り当てるOnIDは、URLそのものには限られず、URLに基づく一意な文字列であってよく、以下、同様とする。
【0060】
ステップS12では、処理部12は、(X)→(Y)又は(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。なお、「→」は、リンクの参照関係を示し、「リンク元→リンク先」である。
【0061】
ステップS13では、処理部12は、ステップS12の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。この判定がYESの場合、上述のリンク構造の制約によれば、(X)と(Y)は同一のOnIDを持つといえるが、クラスAとクラスBの個人ウェブサイトが同一のURLである場合もあるため、処理部12は、処理をステップS14に移し、(X)と(Y)とが同一のOnIDとなるか否かを判断する。一方、判定がNOの場合、処理部12は、(X)と管理者が同一のクラスAの個人ウェブサイトがないと判断して処理を終了する。
【0062】
ステップS14では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たすクラスB又はクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。
【0063】
ステップS15では、処理部12は、ステップS14の条件を満たす個人ウェブサイト(Y)が抽出されたか否かを判定する。処理部12は、この判定がYESの場合、抽出された個人ウェブサイト(Y)の管理者が(X)と同一であると判断して処理をステップS16に移し、判定がNOの場合、処理を終了する。
【0064】
ステップS16では、処理部12は、ステップS14で抽出された1又は複数の個人ウェブサイト(Y)に関して、後述のID変更処理(図9)を実行した後、処理を終了する。
【0065】
図9は、本実施形態に係るID変更処理を示すフローチャートである。ID変更処理は、処理A(図8)のステップS16に相当する。
【0066】
ステップS21では、処理部12は、個人ウェブサイト(Y)のOnIDが割当済か否かを判定する。処理部12は、この判定がYESの場合、処理をステップS22に移し、判定がNOの場合、処理をステップS23に移す。
【0067】
ステップS22では、処理部12は、個人ウェブサイト(Y)と同一のOnIDが割り当てられている全ての個人ウェブサイトのOnIDを、(X)のOnIDに変更する。
【0068】
ステップS23では、処理部12は、対象とする全ての個人ウェブサイト(Y)を処理したか否かを判定する。処理部12は、この判定がYESの場合、処理を終了し、判定がNOの場合、処理をステップS21に戻す。
【0069】
図10は、本実施形態に係る処理Bを示すフローチャートである。処理Bは、ID割当処理(図7)のステップS5に相当する。
【0070】
ステップS31では、処理部12は、(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0071】
ステップS32では、処理部12は、ステップS31の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS33に移し、判定がNOの場合、処理をステップS35に移す。
【0072】
ステップS33では、処理部12は、上述のリンク構造の制約により、個人ウェブサイト(X)の管理者と(Y)の管理者とが同一と判断し、(X)のOnIDに(Y)のURLを割り当てる。なお、処理部12は、個人ウェブサイト(Y)が複数検索されている場合、検索結果の先頭や最後等、いずれかを任意に選択してよい。
【0073】
ステップS34では、処理部12は、ステップS31で検索された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0074】
ステップS35では、処理部12は、個人ウェブサイト(X)のリンク構造が上述の制約に当てはまらず、管理者を特定できないため、(X)のOnIDを「NULL」として処理を終了する。
【0075】
図11は、本実施形態に係る処理Cを示すフローチャートである。処理Cは、ID割当処理(図7)のステップS6に相当する。
【0076】
ステップS41では、処理部12は、(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0077】
ステップS42では、処理部12は、ステップS41の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS43に移し、判定がNOの場合、処理をステップS45に移す。
【0078】
ステップS43では、処理部12は、上述のリンク構造の制約により、個人ウェブサイト(X)の管理者と(Y)の管理者とが同一と判断し、(X)のOnIDに(Y)のURLを割り当てる。なお、処理部12は、個人ウェブサイト(Y)が複数検索されている場合、検索結果の先頭や最後等、いずれかを任意に選択してよい。
【0079】
ステップS44では、処理部12は、ステップS41で検索された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0080】
ステップS45では、処理部12は、個人ウェブサイト(X)が入リンクを持たず単独で存在していると判断し、(X)のOnIDに(X)のURLを割り当てて処理を終了する。
【0081】
以上のように、本実施形態によれば、ID割当装置1は、個人ウェブサイト間におけるリンクの入出力関係の構造に基づいて、予めクラスごとに設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、この個人ウェブサイトを管理しているオンラインの個人を識別するOnIDを割り当てることができる。これにより、ID割当装置1は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。この結果、ID割当装置1は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置1を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
【0082】
また、ID割当装置1は、個人ウェブサイトのURLに基づいて、この個人ウェブサイトの利用形態を表すクラスに分類するので、リンク構造をクラスごとの制約と容易に照合することができる。
【0083】
また、ID割当装置1は、個人ウェブサイトに含まれるリンクを抽出して、個人ウェブサイト及びリンク情報のリストに追加していくので、この処理を繰り返すことにより、OnIDを割り当てるために必要な情報を自動的に収集することができる。
【0084】
<第2実施形態>
以下、本発明の第2実施形態について説明する。
第1実施形態では、個人ウェブサイトは、単一のオンラインの個人により管理されているものとした。本実施形態では、個人ウェブサイトは、複数のオンラインの個人(グループ)が管理するグループの個人ウェブサイトを含むものとする。
【0085】
処理部12は、リンクの入出力関係の構造における、後述のグループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、このグループの個人ウェブサイトに対して、個人の個人ウェブサイトのOnIDと異なるOnIDを割り当てる。
【0086】
図12は、本実施形態に係るグループの個人ウェブサイトを含めた個人ウェブサイトへのOnIDの割り当て例を示す概念図である。
第1実施形態では、(a)のように、グループの個人ウェブサイトである「ホムペ」は、他の個人の個人ウェブサイトと同一のOnID(=1)となってしまう。一方、本実施形態では、(b)のように、グループの個人ウェブサイトと他の個人の個人ウェブサイトとは、異なる管理者と判断され、それぞれに異なるOnIDが割り当てられる。
【0087】
図13は、本実施形態に係る追加の制約を示す図である。
(a:グループの個人ウェブサイトの制約)
・クラスAのグループの個人ウェブサイト(X)は、クラスBの個人ウェブサイトに対し、クラスAの個人の個人ウェブサイトと共通の出リンクを持たない。
すなわち、クラスBの個人ウェブサイトへ共通してリンクしているクラスAの個人ウェブサイトは、個人の個人ウェブサイトといえる。
【0088】
(b:個人の個人ウェブサイトの制約)
・クラスAの個人の個人ウェブサイト(X)は、1リンクホップ先(リンク先又はリンク元)の複数のクラスAの個人ウェブサイトと、それぞれ別々にクラスCの個人ウェブサイトに対する共通の出リンクを持たない。
すなわち、(X)が個人の個人ウェブサイトであれば、クラスCの個人ウェブサイトへの実線で示したリンクに加えて、破線で示したリンクが存在するはずである。これら破線で示したリンクがなく、(Z1)へは(Y1)とのみ共通して、(Z2)へは(Y2)とのみ共通して別々に出リンクを持つ場合、(X)は、グループの個人ウェブサイトと判断できる。
【0089】
図14は、本実施形態に係る処理A1を示すフローチャートである。第1実施形態の処理A(図8)は、処理A1に置き換わる。
【0090】
ステップS51では、処理部12は、個人ウェブサイト(X)のOnIDに、(X)のURLを割り当てる。処理部12は、以降で、(X)と管理者が同一の個人ウェブサイトの存在を確認する。
【0091】
ステップS52では、処理部12は、(X)→(Y)又は(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0092】
ステップS53では、処理部12は、ステップS52の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS54に移す。一方、判定がNOの場合、処理部12は、(X)と管理者が同一のクラスAの個人ウェブサイトがないと判断して処理を終了する。
【0093】
ステップS54では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たすクラスBの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。
【0094】
ステップS55では、処理部12は、ステップS54の条件を満たす個人ウェブサイト(Y)が抽出されたか否かを判定する。処理部12は、この判定がYESの場合、グループの個人ウェブサイトの制約により、(X)は個人の個人ウェブサイトであると判断して処理をステップS56に移し、判定がNOの場合、処理をステップS58に移す。
【0095】
ステップS56では、処理部12は、第1実施形態における処理AのステップS14と同様に(X)→(Z)かつ(Y)→(Z)を満たすクラスB又はクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。本ステップにおいて、処理部12は、抽出された個人ウェブサイト(Y)の管理者が(X)と同一であると判断して処理をステップS57に移す。
【0096】
ステップS57では、処理部12は、ステップS56で抽出された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0097】
ステップS58では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たす共通のクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)の組合せを抽出する。例えば、「(X、Y1、Y2)→(Z1)」と「(X、Y1)→(Z2)」のリンク構造がある場合に、処理部12は、組合せとして(Y1、Y2)及び(Y1)の2通りを抽出する。
【0098】
ステップS59では、処理部12は、ステップS58で抽出された組合せの数を判定する。組合せが1通りの場合、処理部12は、(X)が個人の個人ウェブサイトであると判断して処理をステップS57に移す。一方、組合せが2通り以上の場合、処理部12は、(X)がグループの個人ウェブサイトの可能性があると判断して処理をステップS60に移す。また、処理部12は、組合せが0通り、すなわちステップS58の条件を満たす個人ウェブサイト(Y)が抽出されなかった場合、処理を終了する。
【0099】
ステップS60では、処理部12は、ステップS58で抽出された組合せが互いに背反しているか否かを判定する。この判定がYESの場合、処理部12は、個人の個人ウェブサイトの制約により、(X)がグループの個人ウェブサイトであると判断して処理をステップS61に移す。一方、判定がNOの場合、(X)が個人の個人ウェブサイトであると判断して処理をステップS57に移す。
【0100】
例えば、(Y1)及び(Y2)の2通りの組合せが抽出された場合、これらは互いに背反の組合せであるため、処理部12は、(X)がグループの個人ウェブサイトであると判断する。一方、(Y1、Y2)及び(Y1)の2通りの組合せが抽出された場合、これらは互いに背反ではない(Y1が共通している)ため、処理部12は、(X)が個人の個人ウェブサイトであると判断する。
【0101】
ステップS61では、処理部12は、(X)がグループの個人ウェブサイトと判断したので、他の個人ウェブサイトとOnIDが同一とならないように、以後、(X)のOnIDの更新を禁止して処理を終了する。
【0102】
以上のように、本実施形態によれば、ID割当装置1は、リンク構造における個人の個人ウェブサイトの制約と、グループの個人ウェブサイトの制約に従って、グループの個人ウェブサイトに対して、個人の個人ウェブサイトとは異なるIDを割り当てることができる。これにより、ID割当装置1は、個人ウェブサイトを、より正確に管理者ごとに分類することができる。
【0103】
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【符号の説明】
【0104】
1 ID割当装置
10 制御部
11 収集部
12 処理部
20 記憶部
21 サイト保存DB
22 個人ウェブサイトDB
30 通信部
40 入力部
50 出力部
100 サーバ
【技術分野】
【0001】
本発明は、ウェブサイトにIDを割り当てる装置、方法及びプログラムに関する。
【背景技術】
【0002】
従来、インターネット上で公開されているウェブサイトの中には、オフラインの個人が設定した1又は複数のオンラインの個人により管理される個人ウェブサイトが存在する。
ここで、オフラインの個人とは、ネットワーク(インターネット)を利用する現実のユーザそれぞれをいい、ネットワーク上でオンラインの個人を管理している。オンラインの個人とは、ネットワークを通じて所定のサービス群の提供を受ける仮想のユーザをいい、オフラインの個人とオンラインの個人とは、1対1又は1対多の関係にある。
近年、特に中学生や高校生の間では、各人が複数のオンラインの個人を操り、それぞれのオンラインの個人で複数の個人ウェブサイトを作成し、自身のサイト間のみならず、他者とのサイト間で互いにリンクを設け、情報やメッセージの公開及び交換を行うことが多い。
【0003】
ところで、このように相互にリンクが設けられているウェブサイトのリンク構造を解析する技術も提案されている。例えば、特許文献1では、リンク構造を解析してコミュニティの境界を判定することが示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−331070号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1の手法は、ウェブサイトのリンクを抽出し、リンク先のウェブサイトを再帰的に、リンクがなくなるまで収集するものであるため、リンクで紐付けられている全てのウェブサイトが同一のコミュニティとみなされる。
【0006】
しかしながら、上述のオンラインの個人は、互いにリンクされた複数の個人ウェブサイトを管理しているが、これらの個人ウェブサイトには、同一のオンラインの個人を特定する情報(ID)が含まれていない。また、個人ウェブサイトは、上述のように、他のオンラインの個人が管理する個人ウェブサイトともリンクで紐付けられている。したがって、リンクの有無からだけでは、同一のオンラインの個人が管理する個人ウェブサイトを特定することはできなかった。
【0007】
本発明は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できるID割当装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明では、以下のような解決手段を提供する。
【0009】
(1)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶部と、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理部と、を備えるID割当装置。
【0010】
このような構成によれば、ID割当装置は、個人ウェブサイト間におけるリンクの入出力関係の構造に基づいて、予めクラスごとに設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、この個人ウェブサイトを管理しているオンラインの個人を識別するIDを割り当てることができる。これにより、ID割当装置は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。
【0011】
この結果、ID割当装置は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
【0012】
(2)前記クラスは、前記個人ウェブサイトの利用形態を表す所定数の種別であって、当該個人ウェブサイトのURLに基づいて分類される(1)に記載のID割当装置。
【0013】
このような構成によれば、ID割当装置は、個人ウェブサイトのURLに基づいて、この個人ウェブサイトの利用形態を表すクラスに分類するので、リンク構造をクラスごとの制約と容易に照合することができる。
【0014】
(3)前記個人ウェブサイトに含まれるリンクを抽出し、当該リンクの参照先である別の個人ウェブサイト、及び当該リンクの入出力関係を示したリンク情報を前記記憶部に記憶されている前記リストに追加する収集部をさらに備える(1)又は(2)に記載のID割当装置。
【0015】
このような構成によれば、ID割当装置は、個人ウェブサイトに含まれるリンクを抽出して、個人ウェブサイト及びリンク情報のリストに追加していく。したがって、ID割当装置は、この処理を繰り返すことにより、IDを割り当てるために必要な情報を自動的に収集することができる。
【0016】
(4)前記個人ウェブサイトは、複数の前記オンラインの個人が管理するグループの個人ウェブサイトを含み、前記処理部は、前記入出力関係の構造における前記グループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、当該グループの個人ウェブサイトに対して、個人の個人ウェブサイトを管理するオンラインの個人を識別するIDと異なるIDを割り当てる(1)から(3)のいずれかに記載のID割当装置。
【0017】
このような構成によれば、ID割当装置は、リンク構造における個人の個人ウェブサイトの制約と、グループの個人ウェブサイトの制約に従って、グループの個人ウェブサイトに対して、個人の個人ウェブサイトとは異なるIDを割り当てることができる。これにより、ID割当装置は、個人ウェブサイトをより正確に管理者ごとに分類することができる。
【0018】
(5)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータが実行するID割当方法。
【0019】
このような構成によれば、ID割当方法をコンピュータが実行することにより、(1)と同様の効果が期待できる。
【0020】
(6)複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータに実行させるID割当プログラム。
【0021】
このような構成によれば、ID割当プログラムをコンピュータに実行させることにより、(1)と同様の効果が期待できる。
【発明の効果】
【0022】
本発明によれば、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。
【図面の簡単な説明】
【0023】
【図1】第1実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。
【図2】第1実施形態に係るID割当装置によりオンラインIDが割り当てられた結果を示す概要図である。
【図3】第1実施形態に係るID割当装置の機能構成を示すブロック図である。
【図4】第1実施形態に係る個人ウェブサイトテーブルを示す図である。
【図5】第1実施形態に係るサイト間リレーションテーブルを示す図である。
【図6】第1実施形態に係るクラスごとの制約を示す図である。
【図7】第1実施形態に係るID割当処理を示すフローチャートである。
【図8】第1実施形態に係る処理Aを示すフローチャートである。
【図9】第1実施形態に係るID変更処理を示すフローチャートである。
【図10】第1実施形態に係る処理Bを示すフローチャートである。
【図11】第1実施形態に係る処理Cを示すフローチャートである。
【図12】第2実施形態に係るグループの個人ウェブサイトを含めた個人ウェブサイトへのOnIDの割り当て例を示す概念図である。
【図13】第2実施形態に係る追加の制約を示す図である。
【図14】第2実施形態に係る処理A1を示すフローチャートである。
【発明を実施するための形態】
【0024】
<第1実施形態>
以下、本発明の第1実施形態について説明する。
本実施形態に係るID割当装置1は、オンラインの個人が管理する個人ウェブサイトに対して、このオンラインの個人を識別するオンラインIDを割り当てる装置である。なお、ID割当装置1は、サーバ装置やPC(Personal Computer)等、様々な情報処理装置(コンピュータ)であってよい。
【0025】
図1は、本実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。
現実の人物であるオフラインの個人は、ネットワーク(インターネット)上で、1又は複数のオンラインの個人を管理している。また、オンラインの個人は、1又は複数の個人ウェブサイトを管理している。
【0026】
各オンラインの個人は、例えば、同じ学校の生徒であったり、同じ趣味を持つグループの一員であったり、オンラインの他者と一定の人間関係を持っている。そのため、複数のオンラインの個人がそれぞれ管理している個人ウェブサイトの間は、リンクで参照されていることも多い。
【0027】
ここで、個人ウェブサイトとは、オンラインの個人が、自身に関する情報を公開したり、オンラインの他者とメッセージを交換したりするためのウェブサイトをいう。例えば、以下のタイプの個人ウェブサイトがそれぞれ複数のサービスプロバイダにより提供されている。
【0028】
プロフ(プロフィール)・・・個人のプロフィールを公開できるサイト
ゲスブ(ゲストブック)・・・訪問者が履歴としてコメントを投稿できるサイト
リアル(リアルタイム)・・・個人の現況を短い文章で投稿できるサイト
ブログ・・・日々更新される日記を公開できるサイト
Myリンク・・・他者の個人ウェブサイトへのリンクを掲載できるサイト
ホムペ(ホームページ)・・・個人用のサイト
【0029】
オンラインの個人は、上記の複数のタイプの個人ウェブサイトを、サービスプロバイダごとに異なるアカウントで作成しているため、同一のIDによる紐付け(名寄せ)ができていないことが多い。例えば、「オンラインID(OnID)=1」であるオンラインの個人は、「プロフ1」及び「ゲスブ1」を管理している。これらの個人ウェブサイトは、「OnID=1」の情報を有しておらず、異なるアカウントID(1及び2)で管理されている。
【0030】
ID割当装置1は、後述の処理により、管理者であるオンラインの個人が同一である個人ウェブサイトに対して、同一のオンラインID(OnID)を割り当て、複数の個人ウェブサイトをオンラインの個人ごとに分類する。
図2は、本実施形態に係るID割当装置1によりオンラインIDが割り当てられた結果を示す概要図である。
【0031】
以下、本実施形態がIDの割り当ての対象とする個人ウェブサイトは、サイトの利用形態を表す次の3種類の種別(クラスA、クラスB及びクラスC)に分類されるものとする。なお、これらのクラス及び上記のタイプは、個人ウェブサイトのURLから判別できるものとする。
【0032】
クラスA(プロフ、ホムペ)・・・オンラインの個人が他者と識別するために作成する個人ウェブサイト
クラスB(ゲスブ、Myリンク)・・・オンラインの個人がクラスAのサイトに付随して作成する個人ウェブサイト
クラスC(リアル、ブログ)・・・オンラインの個人が他者と識別するために単体で、又はクラスAのサイトに付随して作成する個人ウェブサイト
【0033】
なお、同一の個人ウェブサイトがクラスAを含んで複数のタイプ(例えば、プロフとMyリンク等)を持つ場合もある。この場合、URLから判別されるクラスは、クラスAとなる。
【0034】
図3は、本実施形態に係るID割当装置1の機能構成を示すブロック図である。
ID割当装置1は、制御部10と、記憶部20と、通信部30と、入力部40と、出力部50とを備える。
【0035】
制御部10は、ID割当装置1の全体を制御する部分であり、記憶部20に記憶された各種プログラムを適宜読み出して実行することにより、上記のハードウェアと協働し、本実施形態における各種機能を実現している。制御部10は、CPU(Central Processing Unit)であってよい。なお、制御部10が備える各部の機能は後述する。
【0036】
記憶部20は、ハードウェア群をID割当装置1として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ハードディスク(HDD)であってよい。具体的には、記憶部20には、本実施形態の各種機能を実現させるため制御部10に実行させるプログラム(ID割当プログラム)が記憶される。
【0037】
さらに、記憶部20は、サイト保存DB21と、個人ウェブサイトDB22とを備える。サイト保存DB21は、プログラムにて取得される個人ウェブサイトのページデータを記憶する。また、個人ウェブサイトDB22は、プログラムにて作成又は編集される後述の個人ウェブサイトテーブル及びサイト間リレーションテーブルを記憶する。
【0038】
通信部30は、ID割当装置1が他の装置と情報を送受信する場合のネットワーク・アダプタであり、ネットワーク(インターネット)を介して個人ウェブサイトを管理しているサーバ100にアクセスし、ページデータを取得して制御部10へ提供する。
【0039】
入力部40は、ID割当装置1に対する利用者からの指示入力を受け付けるインタフェース装置である。入力部40は、例えば、キーボード、マウス及びタッチパネル等により構成される。
【0040】
出力部50は、利用者にデータの入力を受け付ける画面を表示したり、ID割当装置1による処理結果の画面を表示したりするディスプレイ装置を含む。さらに、出力部50は、ブラウン管表示装置(CRT)や液晶表示装置(LCD)等のディスプレイ装置の他、プリンタ等の各種出力装置を含んでよい。
【0041】
次に、制御部10の機能を詳述する。
制御部10は、収集部11と、処理部12とを備える。各部は、ID割当プログラムを実行することにより実現される機能ブロックである。
【0042】
収集部11は、個人ウェブサイトに含まれるリンクを抽出し、さらにこのリンクの参照先である別の個人ウェブサイトのページデータを取得する。そして、収集部11は、サイト保存DB21にページデータを記憶すると共に、複数の個人ウェブサイトのリスト(個人ウェブサイトテーブル)、及び複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリスト(サイト間リレーションテーブル)にそれぞれデータ追加し、個人ウェブサイトDB22を更新する。
【0043】
具体的には、収集部11は、まず、収集処理の元になるルートの個人ウェブサイトのURLと、このルートの個人ウェブサイトからリンク(HTMLにおける<a>リンク)を幾つ辿るか(リンクホップ数)の指定を受け付ける。
【0044】
次に、収集部11は、インターネットにアクセスし、ルートの個人ウェブサイトのページデータをサイト保存DB21に記憶する。さらに、このルートの個人ウェブサイトのURLを、個人ウェブサイトテーブルに追加する。
【0045】
また、収集部11は、個人ウェブサイトからリンクを取得し、リンク先が個人ウェブサイトでないものを除いて、リンク元のURLとリンク先のURLとの組合せをサイト間リレーションテーブルに追加する。
【0046】
さらに、収集部11は、リンク先のURLから取得した個人ウェブサイトのページデータをサイト保存DB21に、このURLを個人ウェブサイトテーブルにそれぞれ記憶する。そして、収集部11は、指定されたリンクホップ数まで、全てのURLが個人ウェブサイトテーブルに記憶されると収集処理を終了する。また、収集部11は、個人ウェブサイトテーブルに記憶されているURLが指定されたリンクホップ数に達していない場合には、リンクの取得、サイト間リレーションテーブルの更新、ページデータの記憶及び個人ウェブサイトテーブルの更新を繰り返す。
【0047】
図4は、本実施形態に係る個人ウェブサイトテーブルを示す図である。
個人ウェブサイトテーブルは、収集ID、ルートURL、リンク元URL、個人ウェブサイトURL、個人ウェブサイトのクラス、保存先、リンクホップ数、オンラインID(OnID)及び取得日時を記憶する。
【0048】
ここで、収集IDは、上記の収集処理ごとに付与される識別番号である。また、保存先は、サイト保存DB21内における対象のページデータの記憶場所を示すURLである。オンラインIDは、後述の割当処理によって割り当てられるオンラインの個人を識別するIDである。
【0049】
図5は、本実施形態に係るサイト間リレーションテーブルを示す図である。
サイト間リレーションテーブルは、リンク元の個人ウェブサイトの情報(URL、クラス、タイプ)、リンク先の個人ウェブサイトの情報(URL、クラス、タイプ)、収集ID及び取得日時を記憶する。
【0050】
処理部12は、複数の個人ウェブサイトのそれぞれが分類されているクラス、及びサイト間リレーションテーブルのリンク情報により示されているリンクの入出力関係の構造に基づいて、予め設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、オンラインの個人を識別するIDを割り当てる。
【0051】
ここで、予め設定されている制約とは、リンク元及びリンク先の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関するクラスごとの制約である。個人ウェブサイトは、利用形態の違いにより特有のリンク構造を有している場合が多い。そこで、図6に示すように、リンク構造に関して各クラスに特有の制約を規定した。
【0052】
(クラスAの制約)
・他者の管理する個人ウェブサイトへの出リンクを持たない。
すなわち、図6(a)に示すように、IDが異なるクラスAの個人ウェブサイト間はリンクされない。逆に、クラスAの個人ウェブサイト間がリンクされていれば、両者は同一のIDとなる。
【0053】
(クラスBの制約)
・同一者の管理するクラスAの個人ウェブサイトからの入リンクを必ず1つ以上持つ。
・他者の管理するクラスAの個人ウェブサイトからの入リンクを持たない。
すなわち、図6(b)に示すように、クラスBの個人ウェブサイトは、IDが同じ(OnID=1)クラスAの個人ウェブサイトから必ずリンクされるが、IDが異なる(OnI=2)クラスAの個人ウェブサイトからはリンクされない。逆に、クラスAの個人ウェブサイトからリンクされているクラスBの個人ウェブサイトは、リンク元と同一のIDとなる。
【0054】
(クラスCの制約)
・他者の管理するクラスAの個人ウェブサイトからの入リンクを持たない。
すなわち、図6(c)に示すように、クラスCの個人ウェブサイト(OnID=1)は、IDが異なる(OnID=2)クラスAの個人ウェブサイトからはリンクされない。逆に、クラスAの個人ウェブサイトからリンクされているクラスCの個人ウェブサイトは、リンク元と同一のIDとなる。
【0055】
図7は、本実施形態に係るID割当処理を示すフローチャートである。
ステップS1では、処理部12は、個人ウェブサイトテーブル(図4)にOnIDが未割当の個人ウェブサイトがあるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS2に移し、判定がNOの場合、処理を終了する。
【0056】
ステップS2では、処理部12は、OnIDが未割当の個人ウェブサイト(X)を1つ選択する。
ステップS3では、処理部12は、ステップS2で選択された個人ウェブサイト(X)のクラスを確認する。処理部12は、(X)がクラスAの場合、処理をステップS4に、クラスBの場合、処理をステップS5に、クラスCの場合、処理をステップS6に移す。
【0057】
ステップS4では、処理部12は、後述の処理A(図8)を実行した後、処理をステップS1に戻す。
ステップS5では、処理部12は、後述の処理B(図10)を実行した後、処理をステップS1に戻す。
ステップS6では、処理部12は、後述の処理C(図11)を実行した後、処理をステップS1に戻す。
【0058】
図8は、本実施形態に係る処理Aを示すフローチャートである。処理Aは、ID割当処理(図7)のステップS4に相当する。
【0059】
ステップS11では、処理部12は、個人ウェブサイト(X)のOnIDに、(X)のURLを割り当てる。処理部12は、以降で、(X)と管理者が同一の個人ウェブサイトの存在を確認する。なお、割り当てるOnIDは、URLそのものには限られず、URLに基づく一意な文字列であってよく、以下、同様とする。
【0060】
ステップS12では、処理部12は、(X)→(Y)又は(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。なお、「→」は、リンクの参照関係を示し、「リンク元→リンク先」である。
【0061】
ステップS13では、処理部12は、ステップS12の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。この判定がYESの場合、上述のリンク構造の制約によれば、(X)と(Y)は同一のOnIDを持つといえるが、クラスAとクラスBの個人ウェブサイトが同一のURLである場合もあるため、処理部12は、処理をステップS14に移し、(X)と(Y)とが同一のOnIDとなるか否かを判断する。一方、判定がNOの場合、処理部12は、(X)と管理者が同一のクラスAの個人ウェブサイトがないと判断して処理を終了する。
【0062】
ステップS14では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たすクラスB又はクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。
【0063】
ステップS15では、処理部12は、ステップS14の条件を満たす個人ウェブサイト(Y)が抽出されたか否かを判定する。処理部12は、この判定がYESの場合、抽出された個人ウェブサイト(Y)の管理者が(X)と同一であると判断して処理をステップS16に移し、判定がNOの場合、処理を終了する。
【0064】
ステップS16では、処理部12は、ステップS14で抽出された1又は複数の個人ウェブサイト(Y)に関して、後述のID変更処理(図9)を実行した後、処理を終了する。
【0065】
図9は、本実施形態に係るID変更処理を示すフローチャートである。ID変更処理は、処理A(図8)のステップS16に相当する。
【0066】
ステップS21では、処理部12は、個人ウェブサイト(Y)のOnIDが割当済か否かを判定する。処理部12は、この判定がYESの場合、処理をステップS22に移し、判定がNOの場合、処理をステップS23に移す。
【0067】
ステップS22では、処理部12は、個人ウェブサイト(Y)と同一のOnIDが割り当てられている全ての個人ウェブサイトのOnIDを、(X)のOnIDに変更する。
【0068】
ステップS23では、処理部12は、対象とする全ての個人ウェブサイト(Y)を処理したか否かを判定する。処理部12は、この判定がYESの場合、処理を終了し、判定がNOの場合、処理をステップS21に戻す。
【0069】
図10は、本実施形態に係る処理Bを示すフローチャートである。処理Bは、ID割当処理(図7)のステップS5に相当する。
【0070】
ステップS31では、処理部12は、(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0071】
ステップS32では、処理部12は、ステップS31の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS33に移し、判定がNOの場合、処理をステップS35に移す。
【0072】
ステップS33では、処理部12は、上述のリンク構造の制約により、個人ウェブサイト(X)の管理者と(Y)の管理者とが同一と判断し、(X)のOnIDに(Y)のURLを割り当てる。なお、処理部12は、個人ウェブサイト(Y)が複数検索されている場合、検索結果の先頭や最後等、いずれかを任意に選択してよい。
【0073】
ステップS34では、処理部12は、ステップS31で検索された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0074】
ステップS35では、処理部12は、個人ウェブサイト(X)のリンク構造が上述の制約に当てはまらず、管理者を特定できないため、(X)のOnIDを「NULL」として処理を終了する。
【0075】
図11は、本実施形態に係る処理Cを示すフローチャートである。処理Cは、ID割当処理(図7)のステップS6に相当する。
【0076】
ステップS41では、処理部12は、(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0077】
ステップS42では、処理部12は、ステップS41の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS43に移し、判定がNOの場合、処理をステップS45に移す。
【0078】
ステップS43では、処理部12は、上述のリンク構造の制約により、個人ウェブサイト(X)の管理者と(Y)の管理者とが同一と判断し、(X)のOnIDに(Y)のURLを割り当てる。なお、処理部12は、個人ウェブサイト(Y)が複数検索されている場合、検索結果の先頭や最後等、いずれかを任意に選択してよい。
【0079】
ステップS44では、処理部12は、ステップS41で検索された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0080】
ステップS45では、処理部12は、個人ウェブサイト(X)が入リンクを持たず単独で存在していると判断し、(X)のOnIDに(X)のURLを割り当てて処理を終了する。
【0081】
以上のように、本実施形態によれば、ID割当装置1は、個人ウェブサイト間におけるリンクの入出力関係の構造に基づいて、予めクラスごとに設定されている制約に従って、複数の個人ウェブサイトのそれぞれに対して、この個人ウェブサイトを管理しているオンラインの個人を識別するOnIDを割り当てることができる。これにより、ID割当装置1は、複数の個人ウェブサイトを、管理者であるオンラインの個人ごとに分類できる。この結果、ID割当装置1は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置1を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
【0082】
また、ID割当装置1は、個人ウェブサイトのURLに基づいて、この個人ウェブサイトの利用形態を表すクラスに分類するので、リンク構造をクラスごとの制約と容易に照合することができる。
【0083】
また、ID割当装置1は、個人ウェブサイトに含まれるリンクを抽出して、個人ウェブサイト及びリンク情報のリストに追加していくので、この処理を繰り返すことにより、OnIDを割り当てるために必要な情報を自動的に収集することができる。
【0084】
<第2実施形態>
以下、本発明の第2実施形態について説明する。
第1実施形態では、個人ウェブサイトは、単一のオンラインの個人により管理されているものとした。本実施形態では、個人ウェブサイトは、複数のオンラインの個人(グループ)が管理するグループの個人ウェブサイトを含むものとする。
【0085】
処理部12は、リンクの入出力関係の構造における、後述のグループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、このグループの個人ウェブサイトに対して、個人の個人ウェブサイトのOnIDと異なるOnIDを割り当てる。
【0086】
図12は、本実施形態に係るグループの個人ウェブサイトを含めた個人ウェブサイトへのOnIDの割り当て例を示す概念図である。
第1実施形態では、(a)のように、グループの個人ウェブサイトである「ホムペ」は、他の個人の個人ウェブサイトと同一のOnID(=1)となってしまう。一方、本実施形態では、(b)のように、グループの個人ウェブサイトと他の個人の個人ウェブサイトとは、異なる管理者と判断され、それぞれに異なるOnIDが割り当てられる。
【0087】
図13は、本実施形態に係る追加の制約を示す図である。
(a:グループの個人ウェブサイトの制約)
・クラスAのグループの個人ウェブサイト(X)は、クラスBの個人ウェブサイトに対し、クラスAの個人の個人ウェブサイトと共通の出リンクを持たない。
すなわち、クラスBの個人ウェブサイトへ共通してリンクしているクラスAの個人ウェブサイトは、個人の個人ウェブサイトといえる。
【0088】
(b:個人の個人ウェブサイトの制約)
・クラスAの個人の個人ウェブサイト(X)は、1リンクホップ先(リンク先又はリンク元)の複数のクラスAの個人ウェブサイトと、それぞれ別々にクラスCの個人ウェブサイトに対する共通の出リンクを持たない。
すなわち、(X)が個人の個人ウェブサイトであれば、クラスCの個人ウェブサイトへの実線で示したリンクに加えて、破線で示したリンクが存在するはずである。これら破線で示したリンクがなく、(Z1)へは(Y1)とのみ共通して、(Z2)へは(Y2)とのみ共通して別々に出リンクを持つ場合、(X)は、グループの個人ウェブサイトと判断できる。
【0089】
図14は、本実施形態に係る処理A1を示すフローチャートである。第1実施形態の処理A(図8)は、処理A1に置き換わる。
【0090】
ステップS51では、処理部12は、個人ウェブサイト(X)のOnIDに、(X)のURLを割り当てる。処理部12は、以降で、(X)と管理者が同一の個人ウェブサイトの存在を確認する。
【0091】
ステップS52では、処理部12は、(X)→(Y)又は(Y)→(X)を満たすクラスAの個人ウェブサイト(Y)を検索する。
【0092】
ステップS53では、処理部12は、ステップS52の条件を満たす個人ウェブサイト(Y)があるか否かを判定する。処理部12は、この判定がYESの場合、処理をステップS54に移す。一方、判定がNOの場合、処理部12は、(X)と管理者が同一のクラスAの個人ウェブサイトがないと判断して処理を終了する。
【0093】
ステップS54では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たすクラスBの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。
【0094】
ステップS55では、処理部12は、ステップS54の条件を満たす個人ウェブサイト(Y)が抽出されたか否かを判定する。処理部12は、この判定がYESの場合、グループの個人ウェブサイトの制約により、(X)は個人の個人ウェブサイトであると判断して処理をステップS56に移し、判定がNOの場合、処理をステップS58に移す。
【0095】
ステップS56では、処理部12は、第1実施形態における処理AのステップS14と同様に(X)→(Z)かつ(Y)→(Z)を満たすクラスB又はクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)を抽出する。本ステップにおいて、処理部12は、抽出された個人ウェブサイト(Y)の管理者が(X)と同一であると判断して処理をステップS57に移す。
【0096】
ステップS57では、処理部12は、ステップS56で抽出された1又は複数の個人ウェブサイト(Y)に関して、(X)と同一のOnIDとするために、ID変更処理(図9)を実行した後、処理を終了する。
【0097】
ステップS58では、処理部12は、(X)→(Z)かつ(Y)→(Z)を満たす共通のクラスCの個人ウェブサイト(Z)が存在する個人ウェブサイト(Y)の組合せを抽出する。例えば、「(X、Y1、Y2)→(Z1)」と「(X、Y1)→(Z2)」のリンク構造がある場合に、処理部12は、組合せとして(Y1、Y2)及び(Y1)の2通りを抽出する。
【0098】
ステップS59では、処理部12は、ステップS58で抽出された組合せの数を判定する。組合せが1通りの場合、処理部12は、(X)が個人の個人ウェブサイトであると判断して処理をステップS57に移す。一方、組合せが2通り以上の場合、処理部12は、(X)がグループの個人ウェブサイトの可能性があると判断して処理をステップS60に移す。また、処理部12は、組合せが0通り、すなわちステップS58の条件を満たす個人ウェブサイト(Y)が抽出されなかった場合、処理を終了する。
【0099】
ステップS60では、処理部12は、ステップS58で抽出された組合せが互いに背反しているか否かを判定する。この判定がYESの場合、処理部12は、個人の個人ウェブサイトの制約により、(X)がグループの個人ウェブサイトであると判断して処理をステップS61に移す。一方、判定がNOの場合、(X)が個人の個人ウェブサイトであると判断して処理をステップS57に移す。
【0100】
例えば、(Y1)及び(Y2)の2通りの組合せが抽出された場合、これらは互いに背反の組合せであるため、処理部12は、(X)がグループの個人ウェブサイトであると判断する。一方、(Y1、Y2)及び(Y1)の2通りの組合せが抽出された場合、これらは互いに背反ではない(Y1が共通している)ため、処理部12は、(X)が個人の個人ウェブサイトであると判断する。
【0101】
ステップS61では、処理部12は、(X)がグループの個人ウェブサイトと判断したので、他の個人ウェブサイトとOnIDが同一とならないように、以後、(X)のOnIDの更新を禁止して処理を終了する。
【0102】
以上のように、本実施形態によれば、ID割当装置1は、リンク構造における個人の個人ウェブサイトの制約と、グループの個人ウェブサイトの制約に従って、グループの個人ウェブサイトに対して、個人の個人ウェブサイトとは異なるIDを割り当てることができる。これにより、ID割当装置1は、個人ウェブサイトを、より正確に管理者ごとに分類することができる。
【0103】
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【符号の説明】
【0104】
1 ID割当装置
10 制御部
11 収集部
12 処理部
20 記憶部
21 サイト保存DB
22 個人ウェブサイトDB
30 通信部
40 入力部
50 出力部
100 サーバ
【特許請求の範囲】
【請求項1】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶部と、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理部と、を備えるID割当装置。
【請求項2】
前記クラスは、前記個人ウェブサイトの利用形態を表す所定数の種別であって、当該個人ウェブサイトのURLに基づいて分類される請求項1に記載のID割当装置。
【請求項3】
前記個人ウェブサイトに含まれるリンクを抽出し、当該リンクの参照先である別の個人ウェブサイト、及び当該リンクの入出力関係を示したリンク情報を前記記憶部に記憶されている前記リストに追加する収集部をさらに備える請求項1又は請求項2に記載のID割当装置。
【請求項4】
前記個人ウェブサイトは、複数の前記オンラインの個人が管理するグループの個人ウェブサイトを含み、
前記処理部は、前記入出力関係の構造における前記グループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、当該グループの個人ウェブサイトに対して、個人の個人ウェブサイトを管理するオンラインの個人を識別するIDと異なるIDを割り当てる請求項1から請求項3のいずれかに記載のID割当装置。
【請求項5】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータが実行するID割当方法。
【請求項6】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータに実行させるID割当プログラム。
【請求項1】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶部と、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理部と、を備えるID割当装置。
【請求項2】
前記クラスは、前記個人ウェブサイトの利用形態を表す所定数の種別であって、当該個人ウェブサイトのURLに基づいて分類される請求項1に記載のID割当装置。
【請求項3】
前記個人ウェブサイトに含まれるリンクを抽出し、当該リンクの参照先である別の個人ウェブサイト、及び当該リンクの入出力関係を示したリンク情報を前記記憶部に記憶されている前記リストに追加する収集部をさらに備える請求項1又は請求項2に記載のID割当装置。
【請求項4】
前記個人ウェブサイトは、複数の前記オンラインの個人が管理するグループの個人ウェブサイトを含み、
前記処理部は、前記入出力関係の構造における前記グループの個人ウェブサイト、及びグループではない個人の個人ウェブサイトの制約に従って、当該グループの個人ウェブサイトに対して、個人の個人ウェブサイトを管理するオンラインの個人を識別するIDと異なるIDを割り当てる請求項1から請求項3のいずれかに記載のID割当装置。
【請求項5】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータが実行するID割当方法。
【請求項6】
複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるリンクの入出力関係を示したリンク情報のリストを記憶する記憶ステップと、
前記複数の個人ウェブサイトのそれぞれが分類されているクラス、及び前記リンク情報により示されている前記入出力関係の構造に基づいて、予め設定されている当該入出力の関係にある個人ウェブサイトを管理するオンラインの個人の同異に関する当該クラスごとの制約に従って、前記複数の個人ウェブサイトのそれぞれに対して、前記オンラインの個人を識別するIDを割り当てる処理ステップと、をコンピュータに実行させるID割当プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2011−237978(P2011−237978A)
【公開日】平成23年11月24日(2011.11.24)
【国際特許分類】
【出願番号】特願2010−108242(P2010−108242)
【出願日】平成22年5月10日(2010.5.10)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成23年11月24日(2011.11.24)
【国際特許分類】
【出願日】平成22年5月10日(2010.5.10)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]