情報分析装置、情報分析方法、情報分析システムおよびプログラム
【課題】組織内において使用された検索キーワードから組織の構成員によるインターネットの利用態様を簡便に把握する。
【解決手段】情報分析装置は、たとえば、端末におけるWebサイトの閲覧履歴を入力する入力手段と、入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、作成手段により作成された分析結果を出力手段とを備える。
【解決手段】情報分析装置は、たとえば、端末におけるWebサイトの閲覧履歴を入力する入力手段と、入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、作成手段により作成された分析結果を出力手段とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、各端末のインターネットの閲覧履歴を収集して分析する情報分析装置、情報分析方法、情報分析システムおよびプログラムに関する。
【背景技術】
【0002】
インターネットが普及して多くの人が利用するようになった。このような状況の中、組織においてもインターネットは必要不可欠なものになっている。また、膨大な情報の中から所望の情報を効率的に取得するために、ユーザは、検索サイトを利用する。検索サイトは、ユーザがキーワードを入力し意図した情報を得られるようなサービスを提供している。キーワードにはユーザの意思、嗜好、悩みなどが多分に含まれている。よって、キーワードを解析して利用すれば、有用な分析が可能となろう。
【0003】
非特許文献1によれば、検索結果に関連した広告を表示するサービスについて解説されている。広告主のサイトを検索結果に表示されやすくする技術であるSEO(Search Engine Optimization:検索エンジン最適化)に、キーワードの解析結果を利用できる。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】”Google Adsenseとは”、[online]、Google, Inc.、[平成22年6月17日]、インターネット<https://www.google.com/adsense/support/bin/answer.py?answer=9712&topic=8421&sourceid=aso&subid=ww-ww-et-asui&medium=link>
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、法人、官公庁、団体および学校などの組織内でもインターネットの検索サイトを活用するユーザ(組織構成員)は多い。しかしながら、従来は、検索キーワードを組織の生産性向上に活用することができなかった。非特許文献1では、検索キーワードに関連した広告が表示されるにすぎない。よって、ある組織内における組織の構成員が有している興味の傾向をその組織が把握することはできなかった。
【0006】
そこで、本発明は、このような課題および他の課題のうち、少なくとも1つを解決することを目的とする。たとえば、本発明は、組織内において検索キーワードから組織構成員によるインターネットの利用態様を簡便に把握する技術を提供することを目的とする。なお、他の課題については明細書の全体を通して理解できよう。
【課題を解決するための手段】
【0007】
本発明による情報分析装置は、組織内に配置された端末におけるWebサイトの閲覧履歴を分析する情報分析装置として実現できる。当該情報分析装置は、たとえば、前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、前記作成手段により作成された分析結果を出力手段とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力した構成員の識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。
【図面の簡単な説明】
【0009】
【図1】情報分析システムの一例を示す図である。
【図2A】端末装置のハードウエア構成を示す図である。
【図2B】ログ管理サーバのハードウエア構成を示す図である。
【図2C】情報分析装置のハードウエア構成を示す図である。
【図3】ログ管理DBの記録内容の一例を示す図である。
【図4】情報分析装置が実行する情報分析処理の流れを示すフローチャートである。
【図5】キーワード開始位置符号テーブルの一例を示す図である。
【図6A】閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。
【図6B】閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。
【図7】キーワード分類テーブルの一例を示す図である。
【図8】分析結果DBの一例を示す図である。
【図9】分析結果DBの他の例(人脈マップ)を示す図である。
【発明を実施するための形態】
【0010】
本発明の実施の形態における検索キーワードの情報分析システムについて説明する。第一実施形態では、組織内に配置された各端末装置はWebサイトへ送信されたURLと検索キーワードとを含むリクエストデータを記録し、ログ管理サーバに送信する。ログ管理サーバは、これを閲覧履歴として収集し、収集した閲覧履歴を情報分析装置に入力する。情報分析装置が、閲覧履歴に含まれている検索キーワードを抽出して出力することで、組織内のユーザの利用態様を簡便に把握することができる。
【0011】
なお、組織内に配置された端末装置とは、その組織の事業のために構成員によって使用される端末装置のことである。端末装置には、たとえば、組織から構成員に貸与された端末装置や、構成員が所有しているもののその組織の事業に使用される端末装置が含まれる。端末装置は、たとえば、その組織のイントラネットを通じてインターネットにアクセスする端末装置や、他の組織から提供されたアクセスネットワークを介してインターネットにアクセスする端末装置であってもよい。また、その組織が所有または占有している土地や建物に端末装置が設置されていてもよいし、その外部に設置されていなくてもよい。端末装置は、固定端末であってもよいし、移動端末であってもよい。組織は、法人、官公庁、団体および学校など、営利を目的とした組織や非営利の組織を含む。また、学校は、私立と公立の別を問わず、専門学校や予備校など、各種の教育事業組織も含まれる。構成員は、所属する組織によって呼び名が異なることがある。たとえば、企業であれば従業員や社員が構成員であり、学校であれば生徒や学生、教職員が構成員であり、官公庁であれば職員や公務員が構成員である。なお、これらの定義は例示にすぎない。
【0012】
(システム構成)
図1は、情報分析システムの一例を示す図である。情報分析システムは、複数の端末装置11a、11bと、ログ管理サーバ12と、情報分析装置13とを備えている。端末装置11a、11bは、組織内に配置された端末の一例である。ログ管理サーバ12は、組織内に配置された端末装置によるWebサイトの閲覧ログ(閲覧履歴)を管理する。情報分析装置13は、組織内に配置された端末装置におけるWebサイトの閲覧履歴を分析する情報分析装置の一例である。これらの装置はLAN(Local Area Network)を含むイントラネットやインターネットなどの各種のネットワーク50を介して接続されている。端末装置11a、11bに共通する事項について説明するときは、単に端末装置11と記載することにする。
【0013】
ログ管理サーバ12は、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。同様に、情報分析装置13も、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。また、ログ管理サーバ12と情報分析装置13は、同一組織によって管理されてもよいし、それぞれ他の組織によって管理されてもよい。
【0014】
Webサーバ30は、端末装置11にWebサービスを提供するコンピュータである。Webサーバ30はイントラネットに接続されているものや、インターネットに接続されているものなど様々である。
【0015】
端末装置11は、Webサーバ30が提供するWebサイトを組織内の構成員(ユーザ)が閲覧するために使用する情報処理装置(コンピュータ)である。端末装置11は、WebサイトをWebブラウザによってユーザが閲覧する際に端末装置11へ入力される各種の操作内容を監視して閲覧履歴を取得する監視部14を備えている。監視部14は、自己の端末におけるWebサイトの閲覧履歴を記録する記録手段として機能する。閲覧履歴には、たとえば、Webサイトに関する以下のものが含まれる。
・ マシン名・・・各端末装置に付与された識別情報
・ ユーザ名・・・各ユーザに付与された識別情報
・ 閲覧日時・・・Webサイトを閲覧した日時
・ WebサイトのURL
端末装置11の監視部14は、定期的(たとえば、1分ごと)または閲覧しているWebサイトが変更されるたびに閲覧履歴を取得してログ管理サーバ12に送信する。なお、ログ管理サーバ12に閲覧履歴を送信する条件は、所定時間が経過したとき(たとえば、2時間毎)、所定量以上の閲覧履歴が蓄積されたとき、端末装置11が起動したとき、端末装置11がシャットダウンを指示されたとき、ログ管理サーバ12からの閲覧履歴の送信を要求されたときなど、様々な条件を設定可能である。
【0016】
ログ管理サーバ12は、端末装置11における閲覧履歴を管理する情報処理装置である。図1が示すように、ログ管理サーバ12は、ログ管理DB15を備える。DBはデータベースの略称である。ログ管理サーバ12は、端末装置11から受信した閲覧履歴に基づいて、ログ管理DB15に、端末装置毎(またはユーザ毎)に閲覧履歴を記録する。
【0017】
情報分析装置13は、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備える。情報分析装置13は、ログ管理サーバ12からネットワーク50を介して受信した閲覧履歴に基づいて、閲覧内容(たとえば、検索キーワードの利用状況)を分析して出力する。情報分析装置13のネットワークインターフェースは、端末におけるWebサイトの閲覧ログを入力する入力手段(受付手段)の一例である。
【0018】
なお、ログ管理サーバ12から情報分析装置13への閲覧履歴の受け渡しは、ネットワーク50であってもよいし、外部記憶媒体(FD、MO、USBメモリ、CD−R、DVD−RAM等)であってもよい。情報分析装置13は、このような外部記憶媒体のドライブ装置を備え、端末におけるWebサイトの閲覧ログを入力する入力手段として機能する。
【0019】
キーワード検出部16は、キーワード開始位置符号テーブル20を参照して検索キーワードを抽出する。キーワード開始位置符号テーブル20には、Webサイトへ送信されたリクエストにおいてURLと検索キーワードとを区別するための符号(キー)が、各検索サイトごとに登録されている。この符号(キー)は、”p=”や”q=”など検索エンジンごとに異なっている。キーワード検出部16は、URLを抽出し、抽出したURLが検索サイトのURLかどうかを判定したり、検索キーワードの抽出してキーワード判定部17へ渡したりする。
【0020】
キーワード判定部17は、キーワード検出部16により抽出された検索キーワードがキーワード分類テーブル18に予め登録されている検索キーワードと一致するかどうかを判定したり、キーワード分類テーブル18を参照して抽出された検索キーワードを分類し、分類結果を分析結果DB19に記憶したりする。キーワード分類テーブル18には、検索キーワードと、その分類名とが対応付けて記録されている。情報分析装置13はこの分析結果から視覚的な分析結果(グラフや表など)を作成し表示装置や印刷装置に出力してもよい。
【0021】
(ハードウエア構成)
図2Aは、端末装置11のハードウエア構成を示す図である。端末装置11は、オフィスなどに配置されるパーソナルコンピュータなどの情報処理装置である。端末装置11では、ハードディスクドライブ(HDD25)に記憶されているソフトウエアにしたがってCPU21が各種手段として機能する。とりわけ、CPU21は、上述した監視部14として機能し、Webサイトへ送信されたWebページのリクエストデータを監視する。一般に、検索サイトへ送信されるリクエストデータには、WebサイトのURLと、Webサイトへ送信された検索キーワードとが含まれている。CPU21(監視部14)は、リクエストデータや閲覧日時、ユーザ名やコンピュータ名をWebサイトの閲覧履歴として取得し、ログ管理サーバ12へ送信する。表示装置22は、情報を表示するためのユーザインタフェースである。メモリ23は、RAMやROMなどを含む。ネットワークインターフェース24は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD25は、Webサイトから受信したWebコンテンツを表示するためのWebブラウザプログラム27や、インターネットの閲覧操作を監視して閲覧レコードを作成する監視プログラム28などを記憶する。入力部26は、ポインティングデバイス(マウスやタッチパネル)やキーボードなどである。キーボードはソフトウエアキーボードであってもよい。また、入力部26は、入力された操作者の音声を音声認識機能により認識してCPU21へ指示を入力する音声認識入力部であってもよい。
【0022】
図2Bは、ログ管理サーバ12のハードウエア構成を示す図である。ログ管理サーバ12も、コンピュータの一種である。ログ管理サーバ12では、ハードディスクドライブ(HDD35)に記憶されているソフトウエアにしたがってCPU31が各種手段として機能する。メモリ33は、RAMやROMなどを含む。ネットワークインターフェース34は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD35は、ログ管理プログラム36やログ管理DB15を記憶する。
【0023】
図2Cは、情報分析装置13のハードウエア構成を示す図である。情報分析装置13も、コンピュータの一種である。情報分析装置13では、ハードディスクドライブ(HDD45)に記憶されているソフトウエアにしたがってCPU41が各種手段として機能する。メモリ43は、RAMやROMなどを含む。ネットワークインターフェース44は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD45は、情報分析プログラム46や、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を記憶する。
【0024】
(ログ管理データベース)
図3は、ログ管理DB15の記録内容の一例を示す図である。図3では、端末装置11から受信した、Webサイトの閲覧に関する閲覧ログ(閲覧履歴)の一例を示している。PC名の欄301には、端末装置11の端末識別情報が記録される。ユーザ名の欄302には、端末装置11の利用者(ログインユーザ)の識別情報が記録される。閲覧日時の欄303には、Webサイトを閲覧した日時が記録される。URLの欄304には、端末装置11を通じてユーザが閲覧したWebサイトの識別情報(URL)が記録される。端末装置11の監視部14は、基本的に、閲覧対象のWebサイトのURLを指定したり、変更したりするたびに、1レコード分の閲覧履歴を送信する。よって、ログ管理DB15には、Webサイトの閲覧日時にしたがって、各レコードが時系列に沿って記録されている。
【0025】
(情報分析装置の処理)
図4は、情報分析装置13が実行する情報分析処理の流れを示すフローチャートである。CPU41が情報分析プログラム46をHDD45から読み出してメモリ43のRAMへロードすることで、本処理が開始される。
【0026】
S401で、情報分析装置13のCPU41は、ログ管理DB15に記録されている閲覧履歴を、ネットワーク50を介してメモリ43のRAMに入力する。なお、入力単位は、ユーザ単位、グループ単位、所定期間など、自由に設定できる。グループは、複数のユーザにより構成されている。たとえば、組織内の組織(部・課・係など)をグループとしてもよい。あるいは、グループは、複数のPCから構成されていてもよい。各グループにも固有の識別情報が付与される。上述したように、閲覧履歴は、外部記憶媒体(FD、MO、USB、CD−R、DVD−RAM等)を通じて入力されてもよい。
【0027】
S402で、CPU41は、閲覧履歴に未処理のレコードが存在するか否かを判定する。未処理のレコードが存在する場合S403に進む。未処理のレコードが存在しなければ、CPU41は、本処理を終了する。
【0028】
S403で、キーワード検出部16として機能するCPU41は、閲覧履歴から未処理のレコードを1つ読み出し、読み出したレコードからURLを抽出する。このように、キーワード検出部16やCPU41は、入力手段を通じて入力された閲覧履歴から検索に使用された検索サイトのURLを抽出する抽出手段として機能する。
【0029】
S404で、キーワード検出部16として機能するCPU41は、抽出したURLが検索サイトのURLかどうかを判定する。上述したように、キーワード開始位置符号テーブル20には、検索サイトのURLが予め登録されている。そこで、CPU41は、抽出したURLがキーワード開始位置符号テーブル20に登録されているURLかどうかを判定する。抽出したURLが検索サイトのURLであればS405に進む。一方、抽出したURLが検索サイトのURLでなければS409に進む。
【0030】
図5は、キーワード開始位置符号テーブル20の一例を示す図である。URL(ホスト名)の欄501には、検索サイトのホスト名が登録される。キーワード開始位置符号の欄502には、検索サイトのURLと検索キーワードとを区別するための符号(キー)が登録されている。すなわち、Webページのリクエストにおいてキーワード開始位置符号(例:q=)より後ろにある文字がユーザにより入力された検索キーワードである。なお、キーワード開始位置符号テーブル20は、検索キーワードの抽出だけでなく、Webサイトが検索サイトかどうかを判定するためにも使用される。
【0031】
S405で、キーワード検出部16として機能するCPU41は、読み出したレコードから検索キーワードを抽出する。CPU41は、キーワード開始位置符号テーブル20を参照し、抽出したURLに対応して登録されている検索キーワード開始位置符号を読み出す。さらに、CPU41は、読み出した検索キーワード開始位置符号に基づいて、レコードから検索キーワードを抽出する。このように、キーワード検出部16やCPU41は、入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードを抽出する抽出手段として機能する。
【0032】
図6A、6Bは、閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。とりわけ、図6Aでは、検索サイトがfooの場合の検索キーワードの抽出方法が示されている。なお、よく知られているように、foo、bar、hoge、fuga、piyoは例示のためのメタ構文変数にすぎない。検索サイトがfooのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”q=”であることがわかる。よって、CPU41は、q=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。なお、日本語の検索キーワードは、2バイト文字であるため、一般には、1バイト文字に変換(エンコード)されて表示される。よって、CPU41は、検索キーワードを抽出する際に、1バイト文字により表現されている検索キーワードを元の2バイト文字に逆変換する。
【0033】
図6Bでは、検索サイトがbarの場合の検索キーワードの抽出方法が示されている。検索サイトがbarのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”p=”であることがわかる。よって、CPU41は、p=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。このように、CPU41は、各検索エンジンのURLと、各検索エンジンへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを閲覧履歴から抽出する抽出手段として機能する。
【0034】
S406で、CPU41は、検索キーワードの抽出に成功したか否かを判定する。検索キーワードの抽出に成功していなければS409に進む。検索キーワードの抽出に成功したのであれば、S407に進む。
【0035】
S407で、キーワード判定部17として機能するCPU41は、抽出した検索キーワードを分類する。たとえば、CPU41は、キーワード分類テーブル18を参照し、抽出した検索キーワードに対応する分類を検索し、検索により見つかった分類名を当該検索キーワードに付与する。なお、キーワード分類テーブル18に一致する検索キーワードが存在しなければ、CPU41は「未分類」を示すフラグを分類名として付与する。このように、CPU41は、分類テーブルにしたがって、抽出手段により抽出された検索キーワードに分類を付与する分類付与手段として機能する。
【0036】
図7は、キーワード分類テーブル18の一例を示す図である。検索キーワードの欄701には、検索キーワードが登録される。分類名の欄702には、検索キーワードに対応する分類名(カテゴリ名)が登録される。たとえば、抽出された検索キーワードが「とらえもん」であれば、対応する分類名は「業務外」である。
【0037】
S408で、CPU41は、閲覧履歴のレコードから抽出したPC名、ユーザ名、閲覧日時および検索キーワードと、キーワード分類テーブル18から抽出した分類名との対応関係を示す分析結果レコードを作成し、分析結果DB19に登録する。このように、CPU41は、入力手段によって入力された閲覧履歴から端末において検索キーワードを入力したユーザの識別情報を抽出する抽出手段として機能する。また、CPU41は、抽出手段により抽出された検索キーワードとユーザの識別情報との対応関係を示した分析結果を作成する作成手段として機能する。S409で、CPU41は、次のレコードを読み出し、S402に戻る。すべての分析処理が終了すると、CPU41は、分析結果を表示装置に出力したり、音声出力装置に出力したり、電子メールの本文に出力して所定のアドレスへ送信したり、イントラネット内のWebサイトのWebページとして出力したり、記憶装置にデータとして出力する。このように、CPU41や協働する周辺装置は、作成手段により作成された分析結果を出力する出力手段として機能する。
【0038】
(分析結果データベース)
図8は、分析結果DBの一例を示す図である。PC名の欄801には、端末装置11の端末識別情報が記録される。ユーザ名の欄802には、ユーザの識別情報が記録される。閲覧日時の欄803には、Webサイトを閲覧した日時が記録される。つまり、閲覧日時の欄803には、検索キーワードが送信された日時を示す日時データが記録されている。検索キーワードの欄804には、検索キーワードが登録される。PC名から検索キーワードまでは、閲覧履歴のレコードから抽出されたデータである。分類名の欄805には、検索キーワードに対応する分類名が登録される。分類名は、キーワード分類テーブル18から抽出した分類名または「未分類」である。
【0039】
分析結果DBには構成員が使用した検索キーワードが含まれているため、構成員が関心を持っている検索キーワードをその上司や管理者等が把握しやすくなる。つまり、組織内で社員がどのような技術や情報を知りたがっているか、またはどのような知識が不足しているかを把握することができる。なお、CPU41は、分析結果DB19に対して様々な統計処理を適用してもよい。たとえば、CPU41は、分析結果DB19に登録されている同一または類似の検索キーワードの数を算出することで、分析結果DB19に登録されているうちで最も多く使用された検索キーワードを特定してもよい。また、CPU41は、さらに、分類名を使用して分析結果DB19をソートすることで、構成員にどのような分類の知識が不足しているかを検出し、その検索キーワードをリスト化してもよい。このリストに基づいて、経営者や管理者は適切な情報提供(参考書購入、勉強会開催など)のアクションを起こすことができるため、構成員の生産性向上に役立てることができる。なお、CPU41は、経営者や管理者のメールアドレスに当該リストを添付して送信してもよい。たとえば、HDD45は、各ユーザの識別情報と、各ユーザが所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルを記憶している。組織管理テーブルには、各構成員(ユーザ)の社員番号、氏名、メールアドレス、所属グループの識別番号、上司の社員番号などが関連付けて記憶されている。よって、CPU41は、組織管理テーブルにしたがって、各グループに所属するユーザの識別情報を抽出し、抽出した識別情報を検索キーとして分析結果DBを検索し、当該ユーザが検索に使用した検索キーワードを抽出する。そして、CPU41は、各グループに所属しているユーザによって送信された検索キーワードのリストをグループごとに作成する。さらに、CPU41やネットワークインターフェース44は、そのグループの責任者へ電子メールにより通知する通知手段として機能してもよい。
【0040】
図9は、分析結果DBの他の例(人脈マップ)を示す図である。検索キーワードの欄901には、検索キーワードが登録される。分類名の欄902には、検索キーワードに対応する分類名が登録される。PC名の欄903には、同一の検索キーワードを使用した1台以上の端末識別情報が記録される。ユーザ名の欄904には、同一の検索キーワードを使用した一人以上のユーザの識別情報が記録される。このように、CPU41は、分析結果を分類毎に並べ替えることにより、社内の人脈マップを作成することができる。図9に示した人脈マップから、同一または類似した検索を行っているユーザを把握することができる。CPU41は、経営者や管理者のメールアドレスに当該人脈マップを添付して送信してもよい。CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数のユーザの識別情報をまとめた分析結果を作成する作成手段として機能している。同様に、CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成する作成手段として機能する。
【0041】
本実施形態によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力したユーザの識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。
【0042】
とりわけ、検索キーワードを分析することで、その分析結果を組織内におけるナレッジマネジメントに活用でき、かつ、構成員の生産性の向上に役立つシステムを提供することができる。検索キーワードを組織内で情報共有することもできる。たとえば、上述したリストや人脈マップを活用すれば、自分の知りたい情報(キーワード)について、既に社内で検索した実績のあるユーザを発見することができる。同じ問題に対し、既に誰かが解決済みであれば、そのユーザに電子メールや電話で問合せることができる。そのユーザが解決した結果(失敗・成功事例など)を参照することで、各ユーザは、効率的に回答を得ることができる。例えば、CPU41は、分析結果DBに記録されている閲覧日時のデータに基づいて、第1ユーザが使用した検索キーワードと同一の検索キーワードを使用した第2ユーザであって、第1ユーザが検索キーワードを送信した日時よりも過去の日時に検索キーワードを送信した第2ユーザの識別情報を抽出する。さらに、CPU41やネットワークインターフェースは、抽出した第2ユーザの識別情報を第1ユーザへ電子メールにより通知する通知手段として機能してもよい。電子メールにより通知される第2ユーザの識別情報は、社員番号や社員名称、電子メールアドレスなどである。また、電子メールには、参考のために、検索キーワード、第1ユーザの検索日時(閲覧日時)などが、記載されてもよい。
【0043】
他人に相談しにくい個人的な悩みが検索キーワードとして使用されることもある。CPU41は、そうした「悩み」に関するキーワードを検出して、そのユーザの管理責任者(上司など)や管理責任部門に電子メール等で通知してもよい。これにより、管理責任者等は、適時構成員の状態を把握して、適切な対応を取ることができる。たとえば、うつ病・人間関係の悩みなどに分類される検索キーワードが分析結果DB19から見つかれば、CPU41は、その構成員の識別情報とその検索キーワードを電子メール等により人事部門に通知することができる。これにより、人事部門は適切な対応を取ることができる。
【0044】
CPU41は、業務と関係のない検索キーワードを検出すると、業務上不要なコンピュータ利用を行っている可能性があるユーザへ電子メールを送信して注意を行うことができる。また、組織側は、インターネットフィルタリングを導入したりするなど、生産性向上のための適切なアクションを取ることができるようになろう。
【0045】
上述したログ管理サーバ12の機能が情報分析装置13に組み込まれてもよい。これにより、単一のサーバによってログ管理サーバ12と情報分析装置13とを実現できる。この場合、情報分析装置13が、ログ管理DB15、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備えることになる。また、端末装置11の監視部14によって取得された閲覧履歴は、情報分析装置13のログ管理DB15に記録されることになる。
【0046】
このように、ログ管理サーバ12と情報分析装置13を同一のサーバ上で実現することで、端末装置が配置された組織の内部だけで閲覧履歴を管理しやすくなる。この場合、閲覧履歴が記録媒体や通信媒体によってイントラネットの外部に持ち出されることがなくなるため、よりセキュリティを考慮した分析が可能となろう。
【0047】
なお、ユーザ端末装置11a、11bの操作内容を監視して、その操作ログを各ユーザ端末装置11a、11b内の監視部14で生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成に限らず、Webサーバ30において各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。
【0048】
また、ネットワーク上を流れる情報の一部(Webサイトの閲覧履歴)を取得するネットワーク情報収集装置をネットワーク上に備え、ネットワーク情報収集装置おいて各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。
【技術分野】
【0001】
本発明は、各端末のインターネットの閲覧履歴を収集して分析する情報分析装置、情報分析方法、情報分析システムおよびプログラムに関する。
【背景技術】
【0002】
インターネットが普及して多くの人が利用するようになった。このような状況の中、組織においてもインターネットは必要不可欠なものになっている。また、膨大な情報の中から所望の情報を効率的に取得するために、ユーザは、検索サイトを利用する。検索サイトは、ユーザがキーワードを入力し意図した情報を得られるようなサービスを提供している。キーワードにはユーザの意思、嗜好、悩みなどが多分に含まれている。よって、キーワードを解析して利用すれば、有用な分析が可能となろう。
【0003】
非特許文献1によれば、検索結果に関連した広告を表示するサービスについて解説されている。広告主のサイトを検索結果に表示されやすくする技術であるSEO(Search Engine Optimization:検索エンジン最適化)に、キーワードの解析結果を利用できる。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】”Google Adsenseとは”、[online]、Google, Inc.、[平成22年6月17日]、インターネット<https://www.google.com/adsense/support/bin/answer.py?answer=9712&topic=8421&sourceid=aso&subid=ww-ww-et-asui&medium=link>
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、法人、官公庁、団体および学校などの組織内でもインターネットの検索サイトを活用するユーザ(組織構成員)は多い。しかしながら、従来は、検索キーワードを組織の生産性向上に活用することができなかった。非特許文献1では、検索キーワードに関連した広告が表示されるにすぎない。よって、ある組織内における組織の構成員が有している興味の傾向をその組織が把握することはできなかった。
【0006】
そこで、本発明は、このような課題および他の課題のうち、少なくとも1つを解決することを目的とする。たとえば、本発明は、組織内において検索キーワードから組織構成員によるインターネットの利用態様を簡便に把握する技術を提供することを目的とする。なお、他の課題については明細書の全体を通して理解できよう。
【課題を解決するための手段】
【0007】
本発明による情報分析装置は、組織内に配置された端末におけるWebサイトの閲覧履歴を分析する情報分析装置として実現できる。当該情報分析装置は、たとえば、前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、前記作成手段により作成された分析結果を出力手段とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力した構成員の識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。
【図面の簡単な説明】
【0009】
【図1】情報分析システムの一例を示す図である。
【図2A】端末装置のハードウエア構成を示す図である。
【図2B】ログ管理サーバのハードウエア構成を示す図である。
【図2C】情報分析装置のハードウエア構成を示す図である。
【図3】ログ管理DBの記録内容の一例を示す図である。
【図4】情報分析装置が実行する情報分析処理の流れを示すフローチャートである。
【図5】キーワード開始位置符号テーブルの一例を示す図である。
【図6A】閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。
【図6B】閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。
【図7】キーワード分類テーブルの一例を示す図である。
【図8】分析結果DBの一例を示す図である。
【図9】分析結果DBの他の例(人脈マップ)を示す図である。
【発明を実施するための形態】
【0010】
本発明の実施の形態における検索キーワードの情報分析システムについて説明する。第一実施形態では、組織内に配置された各端末装置はWebサイトへ送信されたURLと検索キーワードとを含むリクエストデータを記録し、ログ管理サーバに送信する。ログ管理サーバは、これを閲覧履歴として収集し、収集した閲覧履歴を情報分析装置に入力する。情報分析装置が、閲覧履歴に含まれている検索キーワードを抽出して出力することで、組織内のユーザの利用態様を簡便に把握することができる。
【0011】
なお、組織内に配置された端末装置とは、その組織の事業のために構成員によって使用される端末装置のことである。端末装置には、たとえば、組織から構成員に貸与された端末装置や、構成員が所有しているもののその組織の事業に使用される端末装置が含まれる。端末装置は、たとえば、その組織のイントラネットを通じてインターネットにアクセスする端末装置や、他の組織から提供されたアクセスネットワークを介してインターネットにアクセスする端末装置であってもよい。また、その組織が所有または占有している土地や建物に端末装置が設置されていてもよいし、その外部に設置されていなくてもよい。端末装置は、固定端末であってもよいし、移動端末であってもよい。組織は、法人、官公庁、団体および学校など、営利を目的とした組織や非営利の組織を含む。また、学校は、私立と公立の別を問わず、専門学校や予備校など、各種の教育事業組織も含まれる。構成員は、所属する組織によって呼び名が異なることがある。たとえば、企業であれば従業員や社員が構成員であり、学校であれば生徒や学生、教職員が構成員であり、官公庁であれば職員や公務員が構成員である。なお、これらの定義は例示にすぎない。
【0012】
(システム構成)
図1は、情報分析システムの一例を示す図である。情報分析システムは、複数の端末装置11a、11bと、ログ管理サーバ12と、情報分析装置13とを備えている。端末装置11a、11bは、組織内に配置された端末の一例である。ログ管理サーバ12は、組織内に配置された端末装置によるWebサイトの閲覧ログ(閲覧履歴)を管理する。情報分析装置13は、組織内に配置された端末装置におけるWebサイトの閲覧履歴を分析する情報分析装置の一例である。これらの装置はLAN(Local Area Network)を含むイントラネットやインターネットなどの各種のネットワーク50を介して接続されている。端末装置11a、11bに共通する事項について説明するときは、単に端末装置11と記載することにする。
【0013】
ログ管理サーバ12は、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。同様に、情報分析装置13も、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。また、ログ管理サーバ12と情報分析装置13は、同一組織によって管理されてもよいし、それぞれ他の組織によって管理されてもよい。
【0014】
Webサーバ30は、端末装置11にWebサービスを提供するコンピュータである。Webサーバ30はイントラネットに接続されているものや、インターネットに接続されているものなど様々である。
【0015】
端末装置11は、Webサーバ30が提供するWebサイトを組織内の構成員(ユーザ)が閲覧するために使用する情報処理装置(コンピュータ)である。端末装置11は、WebサイトをWebブラウザによってユーザが閲覧する際に端末装置11へ入力される各種の操作内容を監視して閲覧履歴を取得する監視部14を備えている。監視部14は、自己の端末におけるWebサイトの閲覧履歴を記録する記録手段として機能する。閲覧履歴には、たとえば、Webサイトに関する以下のものが含まれる。
・ マシン名・・・各端末装置に付与された識別情報
・ ユーザ名・・・各ユーザに付与された識別情報
・ 閲覧日時・・・Webサイトを閲覧した日時
・ WebサイトのURL
端末装置11の監視部14は、定期的(たとえば、1分ごと)または閲覧しているWebサイトが変更されるたびに閲覧履歴を取得してログ管理サーバ12に送信する。なお、ログ管理サーバ12に閲覧履歴を送信する条件は、所定時間が経過したとき(たとえば、2時間毎)、所定量以上の閲覧履歴が蓄積されたとき、端末装置11が起動したとき、端末装置11がシャットダウンを指示されたとき、ログ管理サーバ12からの閲覧履歴の送信を要求されたときなど、様々な条件を設定可能である。
【0016】
ログ管理サーバ12は、端末装置11における閲覧履歴を管理する情報処理装置である。図1が示すように、ログ管理サーバ12は、ログ管理DB15を備える。DBはデータベースの略称である。ログ管理サーバ12は、端末装置11から受信した閲覧履歴に基づいて、ログ管理DB15に、端末装置毎(またはユーザ毎)に閲覧履歴を記録する。
【0017】
情報分析装置13は、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備える。情報分析装置13は、ログ管理サーバ12からネットワーク50を介して受信した閲覧履歴に基づいて、閲覧内容(たとえば、検索キーワードの利用状況)を分析して出力する。情報分析装置13のネットワークインターフェースは、端末におけるWebサイトの閲覧ログを入力する入力手段(受付手段)の一例である。
【0018】
なお、ログ管理サーバ12から情報分析装置13への閲覧履歴の受け渡しは、ネットワーク50であってもよいし、外部記憶媒体(FD、MO、USBメモリ、CD−R、DVD−RAM等)であってもよい。情報分析装置13は、このような外部記憶媒体のドライブ装置を備え、端末におけるWebサイトの閲覧ログを入力する入力手段として機能する。
【0019】
キーワード検出部16は、キーワード開始位置符号テーブル20を参照して検索キーワードを抽出する。キーワード開始位置符号テーブル20には、Webサイトへ送信されたリクエストにおいてURLと検索キーワードとを区別するための符号(キー)が、各検索サイトごとに登録されている。この符号(キー)は、”p=”や”q=”など検索エンジンごとに異なっている。キーワード検出部16は、URLを抽出し、抽出したURLが検索サイトのURLかどうかを判定したり、検索キーワードの抽出してキーワード判定部17へ渡したりする。
【0020】
キーワード判定部17は、キーワード検出部16により抽出された検索キーワードがキーワード分類テーブル18に予め登録されている検索キーワードと一致するかどうかを判定したり、キーワード分類テーブル18を参照して抽出された検索キーワードを分類し、分類結果を分析結果DB19に記憶したりする。キーワード分類テーブル18には、検索キーワードと、その分類名とが対応付けて記録されている。情報分析装置13はこの分析結果から視覚的な分析結果(グラフや表など)を作成し表示装置や印刷装置に出力してもよい。
【0021】
(ハードウエア構成)
図2Aは、端末装置11のハードウエア構成を示す図である。端末装置11は、オフィスなどに配置されるパーソナルコンピュータなどの情報処理装置である。端末装置11では、ハードディスクドライブ(HDD25)に記憶されているソフトウエアにしたがってCPU21が各種手段として機能する。とりわけ、CPU21は、上述した監視部14として機能し、Webサイトへ送信されたWebページのリクエストデータを監視する。一般に、検索サイトへ送信されるリクエストデータには、WebサイトのURLと、Webサイトへ送信された検索キーワードとが含まれている。CPU21(監視部14)は、リクエストデータや閲覧日時、ユーザ名やコンピュータ名をWebサイトの閲覧履歴として取得し、ログ管理サーバ12へ送信する。表示装置22は、情報を表示するためのユーザインタフェースである。メモリ23は、RAMやROMなどを含む。ネットワークインターフェース24は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD25は、Webサイトから受信したWebコンテンツを表示するためのWebブラウザプログラム27や、インターネットの閲覧操作を監視して閲覧レコードを作成する監視プログラム28などを記憶する。入力部26は、ポインティングデバイス(マウスやタッチパネル)やキーボードなどである。キーボードはソフトウエアキーボードであってもよい。また、入力部26は、入力された操作者の音声を音声認識機能により認識してCPU21へ指示を入力する音声認識入力部であってもよい。
【0022】
図2Bは、ログ管理サーバ12のハードウエア構成を示す図である。ログ管理サーバ12も、コンピュータの一種である。ログ管理サーバ12では、ハードディスクドライブ(HDD35)に記憶されているソフトウエアにしたがってCPU31が各種手段として機能する。メモリ33は、RAMやROMなどを含む。ネットワークインターフェース34は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD35は、ログ管理プログラム36やログ管理DB15を記憶する。
【0023】
図2Cは、情報分析装置13のハードウエア構成を示す図である。情報分析装置13も、コンピュータの一種である。情報分析装置13では、ハードディスクドライブ(HDD45)に記憶されているソフトウエアにしたがってCPU41が各種手段として機能する。メモリ43は、RAMやROMなどを含む。ネットワークインターフェース44は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD45は、情報分析プログラム46や、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を記憶する。
【0024】
(ログ管理データベース)
図3は、ログ管理DB15の記録内容の一例を示す図である。図3では、端末装置11から受信した、Webサイトの閲覧に関する閲覧ログ(閲覧履歴)の一例を示している。PC名の欄301には、端末装置11の端末識別情報が記録される。ユーザ名の欄302には、端末装置11の利用者(ログインユーザ)の識別情報が記録される。閲覧日時の欄303には、Webサイトを閲覧した日時が記録される。URLの欄304には、端末装置11を通じてユーザが閲覧したWebサイトの識別情報(URL)が記録される。端末装置11の監視部14は、基本的に、閲覧対象のWebサイトのURLを指定したり、変更したりするたびに、1レコード分の閲覧履歴を送信する。よって、ログ管理DB15には、Webサイトの閲覧日時にしたがって、各レコードが時系列に沿って記録されている。
【0025】
(情報分析装置の処理)
図4は、情報分析装置13が実行する情報分析処理の流れを示すフローチャートである。CPU41が情報分析プログラム46をHDD45から読み出してメモリ43のRAMへロードすることで、本処理が開始される。
【0026】
S401で、情報分析装置13のCPU41は、ログ管理DB15に記録されている閲覧履歴を、ネットワーク50を介してメモリ43のRAMに入力する。なお、入力単位は、ユーザ単位、グループ単位、所定期間など、自由に設定できる。グループは、複数のユーザにより構成されている。たとえば、組織内の組織(部・課・係など)をグループとしてもよい。あるいは、グループは、複数のPCから構成されていてもよい。各グループにも固有の識別情報が付与される。上述したように、閲覧履歴は、外部記憶媒体(FD、MO、USB、CD−R、DVD−RAM等)を通じて入力されてもよい。
【0027】
S402で、CPU41は、閲覧履歴に未処理のレコードが存在するか否かを判定する。未処理のレコードが存在する場合S403に進む。未処理のレコードが存在しなければ、CPU41は、本処理を終了する。
【0028】
S403で、キーワード検出部16として機能するCPU41は、閲覧履歴から未処理のレコードを1つ読み出し、読み出したレコードからURLを抽出する。このように、キーワード検出部16やCPU41は、入力手段を通じて入力された閲覧履歴から検索に使用された検索サイトのURLを抽出する抽出手段として機能する。
【0029】
S404で、キーワード検出部16として機能するCPU41は、抽出したURLが検索サイトのURLかどうかを判定する。上述したように、キーワード開始位置符号テーブル20には、検索サイトのURLが予め登録されている。そこで、CPU41は、抽出したURLがキーワード開始位置符号テーブル20に登録されているURLかどうかを判定する。抽出したURLが検索サイトのURLであればS405に進む。一方、抽出したURLが検索サイトのURLでなければS409に進む。
【0030】
図5は、キーワード開始位置符号テーブル20の一例を示す図である。URL(ホスト名)の欄501には、検索サイトのホスト名が登録される。キーワード開始位置符号の欄502には、検索サイトのURLと検索キーワードとを区別するための符号(キー)が登録されている。すなわち、Webページのリクエストにおいてキーワード開始位置符号(例:q=)より後ろにある文字がユーザにより入力された検索キーワードである。なお、キーワード開始位置符号テーブル20は、検索キーワードの抽出だけでなく、Webサイトが検索サイトかどうかを判定するためにも使用される。
【0031】
S405で、キーワード検出部16として機能するCPU41は、読み出したレコードから検索キーワードを抽出する。CPU41は、キーワード開始位置符号テーブル20を参照し、抽出したURLに対応して登録されている検索キーワード開始位置符号を読み出す。さらに、CPU41は、読み出した検索キーワード開始位置符号に基づいて、レコードから検索キーワードを抽出する。このように、キーワード検出部16やCPU41は、入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードを抽出する抽出手段として機能する。
【0032】
図6A、6Bは、閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。とりわけ、図6Aでは、検索サイトがfooの場合の検索キーワードの抽出方法が示されている。なお、よく知られているように、foo、bar、hoge、fuga、piyoは例示のためのメタ構文変数にすぎない。検索サイトがfooのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”q=”であることがわかる。よって、CPU41は、q=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。なお、日本語の検索キーワードは、2バイト文字であるため、一般には、1バイト文字に変換(エンコード)されて表示される。よって、CPU41は、検索キーワードを抽出する際に、1バイト文字により表現されている検索キーワードを元の2バイト文字に逆変換する。
【0033】
図6Bでは、検索サイトがbarの場合の検索キーワードの抽出方法が示されている。検索サイトがbarのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”p=”であることがわかる。よって、CPU41は、p=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。このように、CPU41は、各検索エンジンのURLと、各検索エンジンへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを閲覧履歴から抽出する抽出手段として機能する。
【0034】
S406で、CPU41は、検索キーワードの抽出に成功したか否かを判定する。検索キーワードの抽出に成功していなければS409に進む。検索キーワードの抽出に成功したのであれば、S407に進む。
【0035】
S407で、キーワード判定部17として機能するCPU41は、抽出した検索キーワードを分類する。たとえば、CPU41は、キーワード分類テーブル18を参照し、抽出した検索キーワードに対応する分類を検索し、検索により見つかった分類名を当該検索キーワードに付与する。なお、キーワード分類テーブル18に一致する検索キーワードが存在しなければ、CPU41は「未分類」を示すフラグを分類名として付与する。このように、CPU41は、分類テーブルにしたがって、抽出手段により抽出された検索キーワードに分類を付与する分類付与手段として機能する。
【0036】
図7は、キーワード分類テーブル18の一例を示す図である。検索キーワードの欄701には、検索キーワードが登録される。分類名の欄702には、検索キーワードに対応する分類名(カテゴリ名)が登録される。たとえば、抽出された検索キーワードが「とらえもん」であれば、対応する分類名は「業務外」である。
【0037】
S408で、CPU41は、閲覧履歴のレコードから抽出したPC名、ユーザ名、閲覧日時および検索キーワードと、キーワード分類テーブル18から抽出した分類名との対応関係を示す分析結果レコードを作成し、分析結果DB19に登録する。このように、CPU41は、入力手段によって入力された閲覧履歴から端末において検索キーワードを入力したユーザの識別情報を抽出する抽出手段として機能する。また、CPU41は、抽出手段により抽出された検索キーワードとユーザの識別情報との対応関係を示した分析結果を作成する作成手段として機能する。S409で、CPU41は、次のレコードを読み出し、S402に戻る。すべての分析処理が終了すると、CPU41は、分析結果を表示装置に出力したり、音声出力装置に出力したり、電子メールの本文に出力して所定のアドレスへ送信したり、イントラネット内のWebサイトのWebページとして出力したり、記憶装置にデータとして出力する。このように、CPU41や協働する周辺装置は、作成手段により作成された分析結果を出力する出力手段として機能する。
【0038】
(分析結果データベース)
図8は、分析結果DBの一例を示す図である。PC名の欄801には、端末装置11の端末識別情報が記録される。ユーザ名の欄802には、ユーザの識別情報が記録される。閲覧日時の欄803には、Webサイトを閲覧した日時が記録される。つまり、閲覧日時の欄803には、検索キーワードが送信された日時を示す日時データが記録されている。検索キーワードの欄804には、検索キーワードが登録される。PC名から検索キーワードまでは、閲覧履歴のレコードから抽出されたデータである。分類名の欄805には、検索キーワードに対応する分類名が登録される。分類名は、キーワード分類テーブル18から抽出した分類名または「未分類」である。
【0039】
分析結果DBには構成員が使用した検索キーワードが含まれているため、構成員が関心を持っている検索キーワードをその上司や管理者等が把握しやすくなる。つまり、組織内で社員がどのような技術や情報を知りたがっているか、またはどのような知識が不足しているかを把握することができる。なお、CPU41は、分析結果DB19に対して様々な統計処理を適用してもよい。たとえば、CPU41は、分析結果DB19に登録されている同一または類似の検索キーワードの数を算出することで、分析結果DB19に登録されているうちで最も多く使用された検索キーワードを特定してもよい。また、CPU41は、さらに、分類名を使用して分析結果DB19をソートすることで、構成員にどのような分類の知識が不足しているかを検出し、その検索キーワードをリスト化してもよい。このリストに基づいて、経営者や管理者は適切な情報提供(参考書購入、勉強会開催など)のアクションを起こすことができるため、構成員の生産性向上に役立てることができる。なお、CPU41は、経営者や管理者のメールアドレスに当該リストを添付して送信してもよい。たとえば、HDD45は、各ユーザの識別情報と、各ユーザが所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルを記憶している。組織管理テーブルには、各構成員(ユーザ)の社員番号、氏名、メールアドレス、所属グループの識別番号、上司の社員番号などが関連付けて記憶されている。よって、CPU41は、組織管理テーブルにしたがって、各グループに所属するユーザの識別情報を抽出し、抽出した識別情報を検索キーとして分析結果DBを検索し、当該ユーザが検索に使用した検索キーワードを抽出する。そして、CPU41は、各グループに所属しているユーザによって送信された検索キーワードのリストをグループごとに作成する。さらに、CPU41やネットワークインターフェース44は、そのグループの責任者へ電子メールにより通知する通知手段として機能してもよい。
【0040】
図9は、分析結果DBの他の例(人脈マップ)を示す図である。検索キーワードの欄901には、検索キーワードが登録される。分類名の欄902には、検索キーワードに対応する分類名が登録される。PC名の欄903には、同一の検索キーワードを使用した1台以上の端末識別情報が記録される。ユーザ名の欄904には、同一の検索キーワードを使用した一人以上のユーザの識別情報が記録される。このように、CPU41は、分析結果を分類毎に並べ替えることにより、社内の人脈マップを作成することができる。図9に示した人脈マップから、同一または類似した検索を行っているユーザを把握することができる。CPU41は、経営者や管理者のメールアドレスに当該人脈マップを添付して送信してもよい。CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数のユーザの識別情報をまとめた分析結果を作成する作成手段として機能している。同様に、CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成する作成手段として機能する。
【0041】
本実施形態によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力したユーザの識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。
【0042】
とりわけ、検索キーワードを分析することで、その分析結果を組織内におけるナレッジマネジメントに活用でき、かつ、構成員の生産性の向上に役立つシステムを提供することができる。検索キーワードを組織内で情報共有することもできる。たとえば、上述したリストや人脈マップを活用すれば、自分の知りたい情報(キーワード)について、既に社内で検索した実績のあるユーザを発見することができる。同じ問題に対し、既に誰かが解決済みであれば、そのユーザに電子メールや電話で問合せることができる。そのユーザが解決した結果(失敗・成功事例など)を参照することで、各ユーザは、効率的に回答を得ることができる。例えば、CPU41は、分析結果DBに記録されている閲覧日時のデータに基づいて、第1ユーザが使用した検索キーワードと同一の検索キーワードを使用した第2ユーザであって、第1ユーザが検索キーワードを送信した日時よりも過去の日時に検索キーワードを送信した第2ユーザの識別情報を抽出する。さらに、CPU41やネットワークインターフェースは、抽出した第2ユーザの識別情報を第1ユーザへ電子メールにより通知する通知手段として機能してもよい。電子メールにより通知される第2ユーザの識別情報は、社員番号や社員名称、電子メールアドレスなどである。また、電子メールには、参考のために、検索キーワード、第1ユーザの検索日時(閲覧日時)などが、記載されてもよい。
【0043】
他人に相談しにくい個人的な悩みが検索キーワードとして使用されることもある。CPU41は、そうした「悩み」に関するキーワードを検出して、そのユーザの管理責任者(上司など)や管理責任部門に電子メール等で通知してもよい。これにより、管理責任者等は、適時構成員の状態を把握して、適切な対応を取ることができる。たとえば、うつ病・人間関係の悩みなどに分類される検索キーワードが分析結果DB19から見つかれば、CPU41は、その構成員の識別情報とその検索キーワードを電子メール等により人事部門に通知することができる。これにより、人事部門は適切な対応を取ることができる。
【0044】
CPU41は、業務と関係のない検索キーワードを検出すると、業務上不要なコンピュータ利用を行っている可能性があるユーザへ電子メールを送信して注意を行うことができる。また、組織側は、インターネットフィルタリングを導入したりするなど、生産性向上のための適切なアクションを取ることができるようになろう。
【0045】
上述したログ管理サーバ12の機能が情報分析装置13に組み込まれてもよい。これにより、単一のサーバによってログ管理サーバ12と情報分析装置13とを実現できる。この場合、情報分析装置13が、ログ管理DB15、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備えることになる。また、端末装置11の監視部14によって取得された閲覧履歴は、情報分析装置13のログ管理DB15に記録されることになる。
【0046】
このように、ログ管理サーバ12と情報分析装置13を同一のサーバ上で実現することで、端末装置が配置された組織の内部だけで閲覧履歴を管理しやすくなる。この場合、閲覧履歴が記録媒体や通信媒体によってイントラネットの外部に持ち出されることがなくなるため、よりセキュリティを考慮した分析が可能となろう。
【0047】
なお、ユーザ端末装置11a、11bの操作内容を監視して、その操作ログを各ユーザ端末装置11a、11b内の監視部14で生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成に限らず、Webサーバ30において各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。
【0048】
また、ネットワーク上を流れる情報の一部(Webサイトの閲覧履歴)を取得するネットワーク情報収集装置をネットワーク上に備え、ネットワーク情報収集装置おいて各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。
【特許請求の範囲】
【請求項1】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
【請求項2】
前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の構成員の識別情報をまとめた分析結果を作成することを特徴とする請求項1に記載の情報分析装置。
【請求項3】
前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成することを特徴とする請求項1または2に記載の情報分析装置。
【請求項4】
前記作成手段は、
検索キーワードと対応する分類とを示す分類テーブルと、
前記分類テーブルにしたがって、前記抽出手段により抽出された検索キーワードに分類を付与する分類付与手段と
をさらに備えることを特徴とする請求項1ないし3のいずれか1項に記載の情報分析装置。
【請求項5】
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項1ないし4のいずれか1項に記載の情報分析装置。
【請求項6】
前記分析結果には、前記検索キーワードが送信された日時を示す日時データが含まれており、
前記分析結果の日時データに基づいて、第1構成員が使用した検索キーワードと同一の検索キーワードを使用した第2構成員であって、該第1構成員が該検索キーワードを送信した日時よりも過去の日時に該検索キーワードを送信した該第2構成員の識別情報を前記第1構成員へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
【請求項7】
各構成員の識別情報と、各構成員が所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルをさらに備え、
各グループに所属する構成員によって送信された検索キーワードのリストを、そのグループの責任者へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
【請求項8】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析方法であって、
入力手段が、前記端末におけるWebサイトの閲覧履歴を入力する入力工程と、
抽出手段が、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出工程と、
作成手段が、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成工程と、
出力手段が、前記作成手段により作成された分析結果を出力する出力工程と
を有することを特徴とする情報分析方法。
【請求項9】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析するプログラムであって、
コンピュータに、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段として機能させることを特徴とするプログラム。
【請求項10】
複数の構成員によって構成される組織において該構成員がWebサイトを閲覧する際に使用する複数の端末と、各端末におけるWebサイトの閲覧履歴を分析する情報分析装置とを備える情報分析システムであって、
前記複数の端末のそれぞれは、
自己の端末におけるWebサイトの閲覧履歴を記録する記録手段
を備え、
前記情報分析装置は、
前記端末の記録手段により記録されたWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析システム。
【請求項11】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した端末の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと端末の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
【請求項12】
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項11項に記載の情報分析装置。
【請求項1】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
【請求項2】
前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の構成員の識別情報をまとめた分析結果を作成することを特徴とする請求項1に記載の情報分析装置。
【請求項3】
前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成することを特徴とする請求項1または2に記載の情報分析装置。
【請求項4】
前記作成手段は、
検索キーワードと対応する分類とを示す分類テーブルと、
前記分類テーブルにしたがって、前記抽出手段により抽出された検索キーワードに分類を付与する分類付与手段と
をさらに備えることを特徴とする請求項1ないし3のいずれか1項に記載の情報分析装置。
【請求項5】
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項1ないし4のいずれか1項に記載の情報分析装置。
【請求項6】
前記分析結果には、前記検索キーワードが送信された日時を示す日時データが含まれており、
前記分析結果の日時データに基づいて、第1構成員が使用した検索キーワードと同一の検索キーワードを使用した第2構成員であって、該第1構成員が該検索キーワードを送信した日時よりも過去の日時に該検索キーワードを送信した該第2構成員の識別情報を前記第1構成員へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
【請求項7】
各構成員の識別情報と、各構成員が所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルをさらに備え、
各グループに所属する構成員によって送信された検索キーワードのリストを、そのグループの責任者へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
【請求項8】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析方法であって、
入力手段が、前記端末におけるWebサイトの閲覧履歴を入力する入力工程と、
抽出手段が、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出工程と、
作成手段が、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成工程と、
出力手段が、前記作成手段により作成された分析結果を出力する出力工程と
を有することを特徴とする情報分析方法。
【請求項9】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析するプログラムであって、
コンピュータに、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段として機能させることを特徴とするプログラム。
【請求項10】
複数の構成員によって構成される組織において該構成員がWebサイトを閲覧する際に使用する複数の端末と、各端末におけるWebサイトの閲覧履歴を分析する情報分析装置とを備える情報分析システムであって、
前記複数の端末のそれぞれは、
自己の端末におけるWebサイトの閲覧履歴を記録する記録手段
を備え、
前記情報分析装置は、
前記端末の記録手段により記録されたWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析システム。
【請求項11】
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した端末の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと端末の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
【請求項12】
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項11項に記載の情報分析装置。
【図1】
【図2A】
【図2B】
【図2C】
【図3】
【図4】
【図5】
【図6A】
【図6B】
【図7】
【図8】
【図9】
【図2A】
【図2B】
【図2C】
【図3】
【図4】
【図5】
【図6A】
【図6B】
【図7】
【図8】
【図9】
【公開番号】特開2012−14267(P2012−14267A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2010−148010(P2010−148010)
【出願日】平成22年6月29日(2010.6.29)
【出願人】(000104652)キヤノン電子株式会社 (876)
【Fターム(参考)】
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願日】平成22年6月29日(2010.6.29)
【出願人】(000104652)キヤノン電子株式会社 (876)
【Fターム(参考)】
[ Back to top ]