情報処理装置及び情報処理方法
【課題】実施形態によれば、ユーザにとって分かりやすいリソースの履歴を生成することが可能な情報処理装置及び情報処理方法を提供することができる。
【解決手段】取得部は、リソース作業時のユーザの状況を取得する。解析部は、リソースを解析し、リソースに含まれるテキスト情報を取得する。生成部は、ユーザの状況及びテキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる作業ラベルを割り当てた作業履歴を生成する。
【解決手段】取得部は、リソース作業時のユーザの状況を取得する。解析部は、リソースを解析し、リソースに含まれるテキスト情報を取得する。生成部は、ユーザの状況及びテキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる作業ラベルを割り当てた作業履歴を生成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
パーソナルコンピュータ(PC)等の情報端末において、ユーザが電子文書等のファイルを使用した作業履歴を生成する情報処理装置がある。従来の情報処理装置では、ユーザが作業した際のファイルと、当該ファイルを使用した時刻とを対応付けて当該作業履歴を生成している。
【0003】
このため、ファイル使用時のユーザの状況(テキスト入力・閲覧や、ユーザの移動状況)を反映した作業履歴を生成することができず、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することが困難である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−75845号公報
【非特許文献】
【0005】
【非特許文献1】K. Frantsi and S. Ananiadou, Extracting Nested Collocations, in Proceedings of COLING-96, pp.41-46, 1996.
【発明の概要】
【発明が解決しようとする課題】
【0006】
発明が解決しようとする課題は、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することが可能な情報処理装置及び情報処理方法を提供することである。
【課題を解決するための手段】
【0007】
実施形態の情報処理装置は、取得部と、解析部と、生成部とを備える。取得部は、リソース作業時のユーザの状況を取得する。解析部は、前記リソースを解析し、前記リソースに含まれるテキスト情報を取得する。生成部は、前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態に係る情報処理装置1を表すブロック図。
【図2】情報処理装置1の処理を表すフローチャート。
【図3】ユーザ状況及びテキスト情報と、作業ラベルとの対応関係を表す図。
【図4】第3格納部17が格納する作業履歴の一例図。
【図5】検索部18による検索の際のアプリケーションの一例図。
【図6】表示部19が表示する作業履歴の一例図。
【図7】第2の実施形態に係る情報処理装置2を表すブロック図。
【図8】情報処理装置2の割当ルールの生成処理を表すフローチャート。
【図9】ルール生成部21が生成した決定木の一例図。
【図10】割当ルールの他の例を表す図。
【図11】情報処理装置2の作業ラベルの割り当て処理を表すフローチャート。
【図12】情報処理装置2の作業ラベルの割り当て処理の説明図。
【図13】表示部19が表示する作業履歴の一例図。
【図14】作業履歴の一例図。
【図15】作業ラベルの登録画面の一例図。
【図16】作業履歴の一例図。
【図17】工数管理の表示形態の一例図。
【図18】工数管理の表示形態の一例図。
【発明を実施するための形態】
【0009】
(第1の実施形態)
第1の実施形態に係る情報処理装置1は、電子文書等のリソース(ファイルやアプリケーション)を利用可能な情報端末(例えば、PCやスマートフォン、ネットブック等)に用いられ得る。
【0010】
情報処理装置1は、ユーザが作業したリソースの履歴(作業履歴)を生成するものである。このとき、情報処理装置1は、リソース作業時のユーザの状況(ユーザ状況)と、テキスト情報を含むリソースの内容とに基づいて、当該リソースの作業履歴を検索するための手掛かりとなるタグである「作業ラベル」を当該作業履歴に割り当てる。これにより、ユーザにとって分かりやすい作業履歴を生成することができる。
【0011】
ユーザ状況には、例えば、「移動状況」、「近接状況」、「発話状況」、「操作状況」等がある。移動状況とは、「静止」、「歩行」、「電車」、「自動車」等、ユーザの移動状態に関する状況である。近接状況とは、当該ユーザの近くに存在する他のユーザの情報(例えば、人数やID等)に関する状況である。発話状況とは、マイクから入力される音響データのうち、人間の発話とみなされたデータの有無や、音量、ピッチ(声の高さ)といった音に関する状況である。操作状況とは、情報処理装置1に対するユーザの操作に関する状況であり、例えば、「文字入力」、「ファイル編集」、「ファイル保存」、「ファイル閲覧」、「Web閲覧」等がある。
【0012】
図1は、情報処理装置1を表すブロック図である。情報処理装置1は、取得部11と、第1格納部12と、解析部13と、第2格納部14と、生成部15と、変更部16と、第3格納部17と、検索部18と、表示部19とを備える。
【0013】
取得部11は、ユーザ状況をその発生日時と対応付けて取得する。取得部11は、加速度センサやGPSセンサを用いて、移動状況を取得してよい。取得部11は、近接センサを用いて、近接する端末の数を近接状況として取得してよい。取得部11は、マイクを用いて、発話状況を取得してよい。取得部11は、当該ユーザ状況を、第1格納部12に書き込む。
【0014】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する。テキスト情報とは、例えば、ユーザが作業するアプリケーションの名称や文章中の文字列、作業時に閲覧するWebページの文章中の文字列等がある。
【0015】
このとき、解析部13は、当該テキスト情報に日時情報を対応付けて取得する。日時情報とは、開始時刻が「10:00」、終了時刻が「12:00」等、ユーザによるリソースの作業が発生した日時や期間に関する情報である。解析部13は、当該テキスト情報を、第2格納部14に書き込む。
【0016】
生成部15は、第1格納部12からユーザ状況を抽出する。生成部15は、抽出したユーザ状況の発生日時に、日時情報が対応するテキスト情報を第2格納部12から抽出する。生成部15は、抽出したユーザ状況とテキスト情報とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する。作業ラベルとは、「会議」、「移動」、「宴会」等、ユーザの行動をカテゴリ別に分類したものであり、検索用のタグとして用いられる。生成部15は、形態素解析や組み込みのルールを用いて、テキスト情報から作業ラベルを抽出する。生成部15は、生成した作業履歴を第3格納部17に書き込む。
【0017】
変更部16は、生成部15が作業ラベルを作業履歴に割り当てる際、第3格納部17に格納されている作業履歴において、生成部15が現在生成中の作業履歴の作業ラベルに対し、少なくとも一つの作業ラベルが共通する作業履歴(類似作業履歴)を検出する。
【0018】
第3格納部17に類似作業履歴が存在する場合、変更部16は、生成部15が現在生成中の作業履歴の作業ラベルを、類似作業履歴の作業ラベルと相違する作業ラベルに変更する(すなわち、検索の際にユーザが判別可能なように変更する)。詳細は後述する。第3格納部17に類似作業履歴が存在しない場合、変更部16は、作業ラベルの変更を行なわない。
【0019】
検索部18は、ユーザからの検索入力を受け付け、第3格納部17を参照し、検索条件に合致する作業履歴を抽出する。表示部19は、検索部18が抽出した作業履歴を表示する。
【0020】
取得部11と、解析部13と、生成部15と、変更部16と、検索部19とは、中央演算処理装置(CPU)、及びCPUが用いるメモリにより実現されてよい。第1格納部12と、第2格納部14と、第3格納部17とは、CPUが用いるメモリ、又は補助記憶装置により実現されてよい。
【0021】
以上、情報処理装置1の構成について説明した。
【0022】
図2は、情報処理装置1の作業履歴の生成処理を表すフローチャートである。取得部11は、ユーザ状況を、その発生日時と対応付けて取得する(S101)。取得部11は、取得したユーザ状況を、第1格納部12に書き込む。
【0023】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を、その日時情報を対応付けて取得する(S102)。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0024】
生成部15は、第1格納部12から抽出したユーザ状況と、第2格納部14から抽出したテキスト情報(当該ユーザ状況の発生日時に日時情報が対応するテキスト情報)とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する(S103)。
【0025】
例えば、解析部13が取得したテキスト情報が「A企画検討_20100721.ppt」のように、「内容(A企画検討)」、「日時(20100721)」といった5W1H情報が複数含まれる場合、生成部15は、形態素解析や組み込みのルールを用いて、当該テキスト情報を分割し、「A企画」、「検討」等のテキスト情報を作業ラベルとして抽出する。生成部15は、抽出した作業ラベルを割り当てた作業履歴を第3格納部17に書き込む。
【0026】
図3は、ユーザ状況及びテキスト情報と、作業ラベルとの対応関係を表す図である。図3に示す「作業ラベル」は、2010年7月21日におけるユーザの作業リソースのテキスト情報から、生成部15が生成した作業ラベルを表している。
【0027】
図3の例において、取得部11は、ユーザ状況として「移動状況」、「無線AP」、「近接状況」、「発話状況」、「操作状況」を取得しているとする。「移動状況」において、「歩行」等の記載がない箇所(空欄)は「静止」を表す。なお、無線APは、ユーザの近くに存在する無線機器のアクセスポイントを表す。図3における「A」、「B」、「C」は、各アクセスポイントを表し、斜線部分は、各アクセスポイントが動作中であることを表している。
【0028】
近接状況は、ユーザの近くに存在する他のユーザ端末を表している。図3における「a」、「b」、「c」、「d」は、各々の他ユーザの端末を表し、横線部分は、各ユーザ端末が動作中であることを表している。
【0029】
発話状況は、発話がある区間(図3における網掛け部分)を「発話あり」と表示している。この他にも、「発話状況」として、各作業ラベルが対応する日時における「発話あり」の区間が占める割合等を用いてもよい。
【0030】
操作状況は、2010年7月21日の10:00から11:00の期間で、「A企画検討_20100721.ppt」というファイルが編集されていたことを表している。この場合のテキスト情報には、「A企画検討_20100721.ppt」が含まれる。
【0031】
生成部15は、当該テキスト情報を分割し、作業ラベルとして、例えば、「A企画」、「検討」を抽出し、当該期間の作業履歴を生成する。図4は、作業履歴の一例図である。例えば、作業履歴は、作業ラベルと、日時(開始時刻と終了時刻)とが対応付けられたものであってよい。上述の例によれば、生成部15は、図4における「4」の作業履歴を生成している。
【0032】
変更部16は、生成部15が作業ラベルを作業履歴に割り当てる際、第3格納部17を参照し、生成部15が現在生成中の作業履歴に対する類似作業履歴を検出する(S104)。
【0033】
類似作業履歴を検出した場合(S104:YES)、変更部16は、生成部15が現在生成中の作業履歴の作業ラベルを、類似作業履歴の作業ラベルと相違する作業ラベルに変更する(S105)。例えば、類似作業履歴と共通する作業ラベルを削除してよい。あるいは、類似作業履歴の作業ラベルと異なる作業ラベルを先頭に配置してもよい。あるいは、類似作業履歴の作業ラベルと異なる作業ラベルを後の表示時に強調されるようにしてもよい。また、変更部16は、第3格納部17に格納された類似作業履歴に対しても同様に、検索の際にユーザが判別可能なように作業ラベルを変更してもよい。
【0034】
例えば、生成部15が、図4における「4」の作業履歴に対して作業ラベルを割り当てる際、変更部16は、第3格納部17を参照し、他の作業履歴(例えば、図4の「1」、「2」、「3」、の作業履歴)の中に、「A企画」、「検討」と、少なくとも一つの作業ラベル共通する類似作業履歴を検出する。この場合、「検討」の作業ラベルが共通する、「1」の作業履歴が類似作業履歴に該当する。
【0035】
この場合、変更部16は、「4」の作業履歴の作業ラベルのうち、類似作業履歴「1」の作業ラベルと共通する「検討」を削除してよい。あるいは、変更部16は、類似作業履歴「1」と共通しない作業ラベル「A企画」を、後の表示時に強調されるようにしてもよい(例えば、太字表示、色付き表示等)。あるいは、類似作業履歴の作業ラベルと異なるA企画」を、後の表示時に先頭に配置されるようにしてもよい。
【0036】
生成部15は、作業ラベルが変更された作業履歴を第3格納部17に書き込み、処理を終了する。類似作業履歴を検出しない場合(S104:NO)、変更部16は、作業ラベルの変更を行なわず処理を終了する。
【0037】
以上、情報処理装置1の作業履歴の生成処理について説明した。
【0038】
なお、変更部16は、検索部18及び第3格納部17と接続され、検索の際に、類似作業履歴を変更し、上述した変更処理を行なっても構わない。この場合、生成部15は、全ての割り当てるべき作業ラベルを全て割り当てた作業履歴を第3格納部17に書き込む。変更部16は、検索部18による検索実行時に、当該変更処理を行ない、表示部に作業履歴を表示させてもよい。
【0039】
図5は、検索部18による検索の際のアプリケーションの一例図である。例えば、検索部18は、入力装置(不図示)を用いたユーザから、「検討」という作業ラベルと、検索期間「2010年7月1日〜2010年7月31日」という検索要求を受け付ける。検索部18は、第3格納部17を参照して、当該検索期間内において、検索要求された作業ラベル「検討」を含む作業履歴を検索する。この場合、図4における「1」及び「4」の作業履歴が該当する。
【0040】
検索部18は、図4における「1」及び「4」の作業履歴を抽出し、表示部19に表示させる。図6は、表示部19が表示する作業履歴の一例図である。図6に示すように、表示部19は、「1」及び「4」の作業履歴を表示する。このとき、表示部19には、上述した変更部16の処理(S104、S105)により、共通しない作業ラベル「A企画」及び「B企画」のみが表示されている。ただし、これに限られず、表示部19は、全ての作業ラベルを表示し、「A企画」と「B企画」とを強調表示してもよい。あるいは、「A企画」と「B企画」とを各々先頭に配置して表示してもよい。
【0041】
本実施形態によれば、同様のリソース作業において、異なるテキスト情報がある場合、当該テキスト情報の違いを示す作業ラベルを生成することができるため、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することができる。
【0042】
また、図6に示すように、作業ラベルはタグとして用いられ、ユーザの作業の一覧(作業ラベル一覧)が表示される。ユーザは、そのうち、作業ラベル一覧又は作業履歴内に表示される一又は複数の作業ラベルを選択することで該当する行動の履歴を確認することができる。例えば、図6(a)の状態で、ユーザにより「レビュー」の作業ラベルが選択されることで、図6(b)に示すように「レビュー」を含む作業履歴のみを表示することができる。このように、特定の作業ラベルで表される作業履歴を検索したり、絞り込むことが可能となる。
【0043】
(第2の実施形態)
第2の実施形態に係る情報処理装置2は、テキスト情報を用いなくても、取得したユーザ状況から作業ラベルを生成可能である点が、前実施形態の情報処理装置1の場合と異なる。
【0044】
情報処理装置1では、ユーザ状況の発生日時に対応するテキスト情報が第2格納部14に存在しない場合、図4の「2」の作業履歴のように、割り当てるべき作業ラベルがない場合が生じる。
【0045】
情報処理装置2は、過去のユーザ状況と、当該ユーザ状況の発生日時に対応するテキスト情報とを用い、現在のユーザ状況から割り当てるべき作業ラベルを決定するための「割当ルール」を学習し、当該割当ルールに基づいて、作業ラベルを割り当てた作業履歴を生成する。
【0046】
図7は、情報処理装置2を表すブロック図である。情報処理装置2は、情報処理装置1に対して、ルール生成部21と、第4格納部22とをさらに備える。また、本実施形態の生成部15は、割当ルールをさらに用いて作業ラベルを生成する点が前実施形態の場合と異なる。
【0047】
ルール生成部21は、取得部11が取得したユーザ状況と、解析部13が取得したテキスト情報から、ユーザ状況と作業ラベルとを対応付けるための「割当ルール」を生成する。ルール生成部21は、前実施形態の場合と同様に、形態素解析や組み込みのルールを用いて、テキスト情報から作業ラベル抽出する。ルール生成部21は、作業ラベルを「分類クラス」とし、対応するユーザ状況を「属性」として、割当ルールを求める。詳細は後述する。
【0048】
第4格納部22は、ルール生成部21が生成した割当ルールを格納する。なお、ルール生成部21は、取得されたテキスト情報に基づいて、第4格納部22に格納されている割当ルールを更新してもよい。すなわち、ルール生成部21は、割当ルールの学習機能を備えていてもよい。
【0049】
生成部15は、前実施形態の処理に加え、第4格納部22に格納された割当ルールに基づいた作業ラベルを割り当てた作業履歴を生成する。
【0050】
ルール生成部21は、中央演算処理装置(CPU)、及びCPUが用いるメモリにより実現されてよい。第4格納部22は、CPUが用いるメモリ、又は補助記憶装置により実現されてよい。
【0051】
以上、情報処理装置2の構成(主に情報処理装置1と異なる点)について説明した。
【0052】
図8は、情報処理装置2が割当ルールを生成する処理を表すフローチャートである。取得部11は、ユーザ状況及びその発生日時を取得する(S201)。図2のS101と同様であってよい。取得部11は、取得したユーザ状況及びその発生日時を第1格納部12に書き込む。
【0053】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する(S102)。図2のS102と同様であってよい。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0054】
ルール生成部21は、第2格納部14に格納されたテキスト情報から、作業ラベルを抽出し、「割当ルール」を生成する(S203)。例えば、解析部13が取得したテキスト情報が「A企画検討_20100721.ppt」のように、「内容(A企画検討)」、「日時(20100721)」といった複数の5W1H情報が含まれる場合、ルール生成部21は、形態素解析や組み込みのルールを用いて分割し、「A企画」「検討」というテキスト情報を作業ラベルとして抽出する。
【0055】
このとき、ルール生成部21は、同時に抽出された「20100721」等、日時や場所に関するテキスト情報を、割当ルールの生成のための属性として用いる。生成部15は、生成した割当ルールを第4格納部22に書き込み、処理を終了する。
【0056】
ルール生成部21による「割当ルール」の生成について詳述する。ここでは、決定木を用いて割当ルールを生成する例について示す。ルール生成部21は、公知のC4.5アルゴリズムを用いて決定木を生成してよい。すなわち、ルール生成部21は、分類クラスと属性とを含む学習データに基づいて、情報量の偏り(ゲイン)が最大になるよう決定木を構成する。
【0057】
分類クラスには、第2格納部14に格納されたテキスト情報から抽出した作業ラベルを用いる。属性には、当該作業ラベルに対応する日時に発生したユーザ状況及びテキスト情報から抽出した日時や場所に関する情報を用いる。
【0058】
図3における10:00から11:00の例では、作業ラベル「A企画」を分類クラスとし、作業ラベル「A企画」に対応する日時における移動状況(「静止」)、無線AP(「a」「b」「c」)、近接状況(「A」「B」「C」)、操作状況(「編集」)等のユーザ状況と、開始時刻(「10:00」)、作業ラベルの継続時間長(「1時間」)等の日時から得られる情報を属性とし、決定木を学習する。
【0059】
図9は、ルール生成部21が生成した決定木の一例図である。図9に示すように、ルール生成部21は、各ノードの質問における結果に基づいて、リーフにある分類クラスに辿り着くような決定木を学習する。ルール生成部21は、決定木以外にも、図10に示すような、決定木の枝を辿る過程を照合パターンとしたルール表を割当ルールとして用いてもよい。
【0060】
なお、決定木の学習に用いる属性には、各作業ラベルに対応する日時に発生した状況だけでなく、前後に一定の幅(例えば15分)がある時間帯における状況を利用してもよい。また、本実施形態では、決定木を割当ルール(識別器)として学習したが、分類クラスとそれに対応する属性を用いて学習するものであればこれに限られない。例えば、SVM(Support Vector Machine)を識別器として割当ルールを学習してもよい。また、学習データの量が予め定められた閾値以上の分類クラスのみを学習に用いてもよい。
【0061】
また、ルール生成部21は、第2格納部14に格納されたテキスト情報から、統計的に作業ラベルを抽出してもよい。例えば、ルール生成部21は、テキスト情報を文書とみなし、文書を分類して各分類中の頻出語を作業ラベルとして採用してよい。
【0062】
その一例として、Latent Dirichlet Allocation(LDA)という公知の手法では、各文書は潜在トピックを含み、また各潜在トピックは単語の生起確率の分布を持っていると仮定する。ルール生成部21は、第2格納部14に格納されたテキスト情報の集合に対してLDAを適用して潜在トピックを推定し、推定された潜在トピックにおいて頻出する単語を作業ラベルに採用する。ここで、ルール生成部21が採用する単語は、例えば、形態素解析結果の各形態素や、固有名詞等であってよい。
【0063】
なお、ルール生成部21は、一単語ではなく、複数の単語の複合語を作業ラベルに採用してもよい。例えば、ルール生成部21は、非公知文献1における「C−value」などの手法を利用することができる。この場合、ルール生成部21は、C−valueが高い単語のうち、前述のLDAによるトピック毎の特徴語を含むものを作業ラベルに採用してよい。
【0064】
また、ルール生成部21は、当該トピックを、クラスタリングにより推定してもよい。クラスタリング手法としては、k−means法や凝集型クラスタリング等の公知の手法を用いることができる。ルール生成部21は、これらの手法により得た各クラスタをトピックとし、各クラスタに含まれる単語の頻度情報から特徴語を抽出してよい。
【0065】
以上、ルール生成部21による割当ルールの生成について説明した。
【0066】
図11は、情報処理装置2の作業ラベルの割り当て処理を表すフローチャートである。取得部11は、ユーザ状況及びその発生日時を取得する(S301)。図2のS101と同様であってよい。取得部11は、取得したユーザ状況及びその発生日時を第1格納部12に格納する。
【0067】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する(S302)。図2のS102と同様であってよい。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0068】
生成部15は、第1格納部12から抽出したユーザ状況と、第2格納部14から抽出したテキスト情報とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する(S303)。図2のS103と同様であってよい。
【0069】
生成部15は、第4格納部22に格納されている割当ルールと、第1格納部12に格納されたユーザ状況とを用いて作業ラベルを割り当て(S304)、処理を終了する。図12は、作業ラベルの割り当て処理の説明図である。本実施形態の生成部15は、割当ルールとして図9に示す決定木、あるいは図10のルール表を用いる。
【0070】
図9の決定木を用いる場合、生成部15は、作業ラベルが割り当てられていない時間帯に発生したユーザ状況とその発生日時に関する情報を利用して、決定木の先頭ノードにある質問(「移動状況は静止か?」)に答える。
【0071】
生成部15は、その答えに対応する枝を辿った先のノードにある質問に答える。そして、リーフに到達するまでノードの質問に答えながら枝を辿っていく。最終的にリーフに到達したら、そのリーフに格納された作業ラベルを当該日時における作業ラベルとして、当該日時の作業履歴に割り当てる。
【0072】
図12における10:00〜11:00の例の場合、図9の決定木によれば、「移動状況は静止か?」の答えは「YES」になる。「近接状況は2名以上?」の答えは「YES」になる。「静止の継続時間長は?」の答えは「一時間以上」になる。「静止の開始時刻は?」の答えは「18:00より前」になる。そのため、生成部15は、10:00〜11:00の時間帯の作業履歴に「会議」作業ラベルを割り当てる。
【0073】
なお、図10において、全ての条件ではなく一部の条件を満たした場合に、生成部15は、該当する作業ラベルを割り当ててもよい。この場合、一度に複数のルールが合致し作業ラベルが複数割り当てられることもあるが、生成部15は、学習時に用いる各分類クラスの学習データ量に応じて優先度を設定し、優先度の高いルールの作業ラベルを優先的に採用してもよい。
【0074】
また、生成部15は、作業ラベルを割り当てる際の日時を、特定の時間長ごとに分割してもよい。例えば、10:00から11:00、11:00から12:00のような1時間毎に分割した時間帯について、生成部15は、作業ラベルを割り当てるようにしてもよい。この他にも、生成部15は、同一の状況が一定時間以上継続している日時に作業ラベルを割り当てるようにしてもよい。例えば、同一の移動状況が30分以上継続した場合に、生成部15は、作業ラベルを割り当てるように設定してもよい。
【0075】
図13は、本例の場合に表示部19が表示する作業履歴の一例図である。本例の処理により、図6と比較し、「A企画検討_20100721.ppt」の作業履歴の作業ラベルに「会議」が追加される。
【0076】
本実施形態によれば、前実施形態の処理以外でも、上述の割当ルールにより、作業ラベルを割り当てた作業履歴を生成することができる。そのため、作業ラベルを生成するためのテキスト情報が存在しない場合であっても、作業ラベルを割り当てることができる。
【0077】
なお、本実施形態では、作業ラベルを抽出することができなかったテキスト情報が第2格納部14に格納されているような日時に対しても作業ラベルを割り当てることができる。これにより、ユーザは、不完全な状態(作業ラベルが抽出できない状態)で登録されたテキスト情報に関する履歴を検索することができる。
【0078】
(変形例1)
本実施形態では、一のユーザのテキスト情報とユーザ状況とを用いて割当ルールを学習したが、複数のユーザのテキスト情報とユーザ状況とを用いて、割当ルールを学習しても構わない。これにより、変形例では、割当ルールを学習する際の学習データ量を増やすことができる。
【0079】
また、近接するユーザの識別情報をユーザ状況として取得し、これを属性として割当ルールを学習することもできる。これにより、ある特定のユーザが参加している場合には「報告会」になるが、このユーザが参加していない場合には「検討会」になるなど、ユーザの参加状況に応じた割当ルールを学習できる。
【0080】
(変形例2)
解析部13は、チャットやマイクロブログ等、テキストを用いたコミュニケーション手段により記述されたテキスト情報を取得してもよい。例えば、ユーザが、会議中に「現在会議中」とメッセージを送信したり、立ち話の後で「さっきTさんとばったり会って話したよ」とマイクロブログに書き込んだりすることがある。これらのテキスト情報から、ルール生成部21は、割当ルールを学習してもよい。
【0081】
例えば、立ち話の後で「さっき田中さんと話したよ」と、ユーザからマイクロブログに書き込まれた場合、解析部13は、ユーザがマイクロブログに記載したテキストとその発信日時をテキスト情報として取得し、第2格納部14に格納する。そして、ルール生成部21は、第2格納部14に格納されたテキスト情報を解析し、作業ラベルと日時情報とを抽出する。ルール生成部21は、日時情報に関して、「さっき→5分前」、「今朝→同日の朝9時〜12時」のように、テキスト中の表現をスケジュールと同様な日時情報に変換する。ルール生成部21は、作業ラベルに関して、「立ち話」、「会議」、「コンサート」といった行動を表す語彙を抽出する。これにより、「さっき田中さんと立ち話したよ」とうテキストが2010年12月14日12時30分に発信されたとすると、2010年12月14日12時25分に「立ち話」というスケジュールが予め登録されていた場合と同様な処理を行うことができる。なお、ルール生成部21は、抽出した日時情報(2010年12月14日12時25分)を、割当ルールを学習する際の属性として利用してよい。
【0082】
(変形例3)
ルール生成部21は、複数の作業ラベルの中で同義語を判別し、同義語を判別した作業ラベルを同一の分類クラスとして、割当ルールを学習してよい。例えば、ルール生成部21は、「打ち合わせ」と「打合せ」という作業ラベルを同義語と判別し、「打ち合わせ」の作業ラベルに統一した分類クラスとして割当ルールを学習する。ここで、作業ラベルが同義語か否かの判定には、表記を用いる方法や、複数のユーザ状況等を用いてよい。
【0083】
表記を用いて同義語を判別する方法について説明する。この場合、ルール生成部21は、作業ラベルどうしのテキストの類似性を用いて同義語か否かを判別する。例えば、「打ち合わせ」と「打合せ」は、お互いのテキストが類似していることから同義語と判別される。テキストの類似性は、例えば編集距離の近さを用いて判別してよい。また、表記の包含関係から同義語か否かを判別してもよい。例えば、「開発会議」は、「会議」の下位概念である。これは、「開発会議」というテキストが「会議」というテキストを包含することから判別できる。このように作業ラベルどうしが包含関係にある場合、ルール生成部21は、上位概念にあたる「会議」に分類クラスを統一することができる。
【0084】
複数のユーザの状況を用いて同義語を判別する方法について説明する。同じ行動を同時に複数のユーザが行う場合、各ユーザのテキスト情報から抽出した作業ラベルの文言が異なることがある。この場合、ルール生成部21は、各作業ラベルを同義語として判別する。例えば、同じ会議に出席する2人のテキスト情報から抽出した作業ラベルが「会議」と「打ち合わせ」で異なる表記であり、2人の端末では近接情報として互いの端末が検出された場合、2人が行っている行動は同じである判別することができる。また、2人の端末で取得された状況の類似性を用いて同じ行動を行っていると判別してもよい。この場合、2人のテキスト情報から抽出した「会議」と「打ち合わせ」の作業ラベルは同義語であると判別する。統一した分類クラスには、出現回数が多い作業ラベルを用いるなどしてもよい。
【0085】
このように、ある作業ラベル同士が同義語であると判別された場合、これらの作業ラベルを同一の分類クラスとして割当ルールを学習する。これにより、本来同一の作業ラベルを割り当てるべき日時に、同義語であるが表記が異なる作業ラベルが割り当てられることを防止できる。また、分類クラスを統一することにより、この分類クラスの学習データ量を増やすことができる。
【0086】
(変形例4)
ルール生成部21は、第2格納部14に格納されているテキスト情報から作業ラベルを取得する以外に、ユーザから入力された作業ラベルを用いて割当ルールを生成してもよい。この場合、情報処理装置2は、ユーザから入力された作業ラベルを第4格納部22に書き込む登録部(不図示)を備える。例えば、図14の作業履歴表示メニューにおいて、ユーザにより選択された作業ラベル(例えば、図14(a)における「A企画」及び「レビュー」の作業ラベル)が入力された場合、登録部(不図示)は、入力された作業ラベルを第4格納部22に登録する。ルール生成部21は、登録された作業ラベルを用いて、割当ルールを更新する。これにより、図14(b)の下段の作業履歴のように、「A企画」及び「レビュー」の作業ラベルが付された作業履歴に更新される。
【0087】
(変形例5)
また、図14に示す作業履歴表示メニューにおいて、生成部15により作業ラベルが付与されなかった時間帯の行動に関しては、登録部(不図示)の利用を促してもよい。図15は、作業ラベルの登録を促す画面の一例図である。表示部19は、作業ラベルが割り当てられなかった作業履歴について、「新規登録」ボタンが表示される。ユーザがボタンを選択すると、登録フォームが表示され、ユーザが作業ラベルを入力することにより、登録部(不図示)作業ラベルを登録する。
【0088】
(変形例6)
予め定められた数種類の業務のうち、ある時間帯はどの業務にユーザは従事したかを分類するのが目的の場合、予めユーザが作業ラベルを定義し、そのいずれに行動が分類されるか否かを判定してもよい。
【0089】
例えば、「業務1」、「業務2」、「業務3」、の3種類の業務が存在する場合、図16のように、表示部19は、3種類の業務を作業ラベルとして表示する。生成部15は、3種類のいずれも付与できない場合、「その他」の作業ラベルを付与してよい。このように分類することで、第3格納部17に格納された作業履歴のうち、特定の作業ラベルが付与された行動の期間を集計することで、図17のように工数管理を行うことが可能となる。図16において「業務1」、「業務2」の、2つの作業ラベルが付与される例のように、1つの行動に複数の作業ラベルが付与される場合、生成部15は、両方の業務に所与の比率で従事したとみなし、いずれの作業ラベルを割り当ててもよい。あるいは1つの行動に対し1つの作業ラベルだけを付与する方式を採用してもよい。なお、表示部19は、図17の表示形態ではなく、図18のように業務毎の従事比率を表示してもよい。
【0090】
(変形例7)
検索部18は、ユーザの操作に応じ、作業ラベルの表示優先度を更新してもよい。例えば、ユーザが特定の作業ラベルのボタンを押下することによる絞り込みを頻繁に利用する場合、検索部18は、その作業ラベルを先頭に表示したり、強調表示してよい。
【0091】
(変形例8)
本実施形態では割当ルールとして決定木を1つだけ学習しているが、ルール生成部21は、複数の決定木、あるいは他の識別器を併用して、割当ルールを生成しても構わない。例えば、ルール生成部21は、「会議」という作業ラベルが割り当てられた日時に、別の決定木を用いて会議を詳細に分類する作業ラベル(例えば、「開発会議」、「グループ会議」など)を割り当ててもよい。
【0092】
上述した実施形態によれば、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することができる。
【0093】
本実施形態の情報処理装置は、持ち運び可能なハードウェア装置への実装を想定しているが、情報処理装置の機能の一部をネットワークに接続された外部サーバ上で実行してもよい。また、情報処理装置を、CPUなどの制御装置と、ROMやRAMなどの記憶装置と、HDDなどの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボード、マウスなどの入力装置とを備えた一般的なコンピュータに実装することもできる。
【0094】
これまで、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0095】
11・・・取得部
12・・・第1格納部
13・・・解析部
14・・・第2格納部
15・・・生成部
16・・・変更部
17・・・第3格納部
18・・・検索部
19・・・表示部
21・・・ルール生成部
22・・・第4格納部
【技術分野】
【0001】
本発明の実施形態は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
パーソナルコンピュータ(PC)等の情報端末において、ユーザが電子文書等のファイルを使用した作業履歴を生成する情報処理装置がある。従来の情報処理装置では、ユーザが作業した際のファイルと、当該ファイルを使用した時刻とを対応付けて当該作業履歴を生成している。
【0003】
このため、ファイル使用時のユーザの状況(テキスト入力・閲覧や、ユーザの移動状況)を反映した作業履歴を生成することができず、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することが困難である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−75845号公報
【非特許文献】
【0005】
【非特許文献1】K. Frantsi and S. Ananiadou, Extracting Nested Collocations, in Proceedings of COLING-96, pp.41-46, 1996.
【発明の概要】
【発明が解決しようとする課題】
【0006】
発明が解決しようとする課題は、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することが可能な情報処理装置及び情報処理方法を提供することである。
【課題を解決するための手段】
【0007】
実施形態の情報処理装置は、取得部と、解析部と、生成部とを備える。取得部は、リソース作業時のユーザの状況を取得する。解析部は、前記リソースを解析し、前記リソースに含まれるテキスト情報を取得する。生成部は、前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態に係る情報処理装置1を表すブロック図。
【図2】情報処理装置1の処理を表すフローチャート。
【図3】ユーザ状況及びテキスト情報と、作業ラベルとの対応関係を表す図。
【図4】第3格納部17が格納する作業履歴の一例図。
【図5】検索部18による検索の際のアプリケーションの一例図。
【図6】表示部19が表示する作業履歴の一例図。
【図7】第2の実施形態に係る情報処理装置2を表すブロック図。
【図8】情報処理装置2の割当ルールの生成処理を表すフローチャート。
【図9】ルール生成部21が生成した決定木の一例図。
【図10】割当ルールの他の例を表す図。
【図11】情報処理装置2の作業ラベルの割り当て処理を表すフローチャート。
【図12】情報処理装置2の作業ラベルの割り当て処理の説明図。
【図13】表示部19が表示する作業履歴の一例図。
【図14】作業履歴の一例図。
【図15】作業ラベルの登録画面の一例図。
【図16】作業履歴の一例図。
【図17】工数管理の表示形態の一例図。
【図18】工数管理の表示形態の一例図。
【発明を実施するための形態】
【0009】
(第1の実施形態)
第1の実施形態に係る情報処理装置1は、電子文書等のリソース(ファイルやアプリケーション)を利用可能な情報端末(例えば、PCやスマートフォン、ネットブック等)に用いられ得る。
【0010】
情報処理装置1は、ユーザが作業したリソースの履歴(作業履歴)を生成するものである。このとき、情報処理装置1は、リソース作業時のユーザの状況(ユーザ状況)と、テキスト情報を含むリソースの内容とに基づいて、当該リソースの作業履歴を検索するための手掛かりとなるタグである「作業ラベル」を当該作業履歴に割り当てる。これにより、ユーザにとって分かりやすい作業履歴を生成することができる。
【0011】
ユーザ状況には、例えば、「移動状況」、「近接状況」、「発話状況」、「操作状況」等がある。移動状況とは、「静止」、「歩行」、「電車」、「自動車」等、ユーザの移動状態に関する状況である。近接状況とは、当該ユーザの近くに存在する他のユーザの情報(例えば、人数やID等)に関する状況である。発話状況とは、マイクから入力される音響データのうち、人間の発話とみなされたデータの有無や、音量、ピッチ(声の高さ)といった音に関する状況である。操作状況とは、情報処理装置1に対するユーザの操作に関する状況であり、例えば、「文字入力」、「ファイル編集」、「ファイル保存」、「ファイル閲覧」、「Web閲覧」等がある。
【0012】
図1は、情報処理装置1を表すブロック図である。情報処理装置1は、取得部11と、第1格納部12と、解析部13と、第2格納部14と、生成部15と、変更部16と、第3格納部17と、検索部18と、表示部19とを備える。
【0013】
取得部11は、ユーザ状況をその発生日時と対応付けて取得する。取得部11は、加速度センサやGPSセンサを用いて、移動状況を取得してよい。取得部11は、近接センサを用いて、近接する端末の数を近接状況として取得してよい。取得部11は、マイクを用いて、発話状況を取得してよい。取得部11は、当該ユーザ状況を、第1格納部12に書き込む。
【0014】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する。テキスト情報とは、例えば、ユーザが作業するアプリケーションの名称や文章中の文字列、作業時に閲覧するWebページの文章中の文字列等がある。
【0015】
このとき、解析部13は、当該テキスト情報に日時情報を対応付けて取得する。日時情報とは、開始時刻が「10:00」、終了時刻が「12:00」等、ユーザによるリソースの作業が発生した日時や期間に関する情報である。解析部13は、当該テキスト情報を、第2格納部14に書き込む。
【0016】
生成部15は、第1格納部12からユーザ状況を抽出する。生成部15は、抽出したユーザ状況の発生日時に、日時情報が対応するテキスト情報を第2格納部12から抽出する。生成部15は、抽出したユーザ状況とテキスト情報とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する。作業ラベルとは、「会議」、「移動」、「宴会」等、ユーザの行動をカテゴリ別に分類したものであり、検索用のタグとして用いられる。生成部15は、形態素解析や組み込みのルールを用いて、テキスト情報から作業ラベルを抽出する。生成部15は、生成した作業履歴を第3格納部17に書き込む。
【0017】
変更部16は、生成部15が作業ラベルを作業履歴に割り当てる際、第3格納部17に格納されている作業履歴において、生成部15が現在生成中の作業履歴の作業ラベルに対し、少なくとも一つの作業ラベルが共通する作業履歴(類似作業履歴)を検出する。
【0018】
第3格納部17に類似作業履歴が存在する場合、変更部16は、生成部15が現在生成中の作業履歴の作業ラベルを、類似作業履歴の作業ラベルと相違する作業ラベルに変更する(すなわち、検索の際にユーザが判別可能なように変更する)。詳細は後述する。第3格納部17に類似作業履歴が存在しない場合、変更部16は、作業ラベルの変更を行なわない。
【0019】
検索部18は、ユーザからの検索入力を受け付け、第3格納部17を参照し、検索条件に合致する作業履歴を抽出する。表示部19は、検索部18が抽出した作業履歴を表示する。
【0020】
取得部11と、解析部13と、生成部15と、変更部16と、検索部19とは、中央演算処理装置(CPU)、及びCPUが用いるメモリにより実現されてよい。第1格納部12と、第2格納部14と、第3格納部17とは、CPUが用いるメモリ、又は補助記憶装置により実現されてよい。
【0021】
以上、情報処理装置1の構成について説明した。
【0022】
図2は、情報処理装置1の作業履歴の生成処理を表すフローチャートである。取得部11は、ユーザ状況を、その発生日時と対応付けて取得する(S101)。取得部11は、取得したユーザ状況を、第1格納部12に書き込む。
【0023】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を、その日時情報を対応付けて取得する(S102)。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0024】
生成部15は、第1格納部12から抽出したユーザ状況と、第2格納部14から抽出したテキスト情報(当該ユーザ状況の発生日時に日時情報が対応するテキスト情報)とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する(S103)。
【0025】
例えば、解析部13が取得したテキスト情報が「A企画検討_20100721.ppt」のように、「内容(A企画検討)」、「日時(20100721)」といった5W1H情報が複数含まれる場合、生成部15は、形態素解析や組み込みのルールを用いて、当該テキスト情報を分割し、「A企画」、「検討」等のテキスト情報を作業ラベルとして抽出する。生成部15は、抽出した作業ラベルを割り当てた作業履歴を第3格納部17に書き込む。
【0026】
図3は、ユーザ状況及びテキスト情報と、作業ラベルとの対応関係を表す図である。図3に示す「作業ラベル」は、2010年7月21日におけるユーザの作業リソースのテキスト情報から、生成部15が生成した作業ラベルを表している。
【0027】
図3の例において、取得部11は、ユーザ状況として「移動状況」、「無線AP」、「近接状況」、「発話状況」、「操作状況」を取得しているとする。「移動状況」において、「歩行」等の記載がない箇所(空欄)は「静止」を表す。なお、無線APは、ユーザの近くに存在する無線機器のアクセスポイントを表す。図3における「A」、「B」、「C」は、各アクセスポイントを表し、斜線部分は、各アクセスポイントが動作中であることを表している。
【0028】
近接状況は、ユーザの近くに存在する他のユーザ端末を表している。図3における「a」、「b」、「c」、「d」は、各々の他ユーザの端末を表し、横線部分は、各ユーザ端末が動作中であることを表している。
【0029】
発話状況は、発話がある区間(図3における網掛け部分)を「発話あり」と表示している。この他にも、「発話状況」として、各作業ラベルが対応する日時における「発話あり」の区間が占める割合等を用いてもよい。
【0030】
操作状況は、2010年7月21日の10:00から11:00の期間で、「A企画検討_20100721.ppt」というファイルが編集されていたことを表している。この場合のテキスト情報には、「A企画検討_20100721.ppt」が含まれる。
【0031】
生成部15は、当該テキスト情報を分割し、作業ラベルとして、例えば、「A企画」、「検討」を抽出し、当該期間の作業履歴を生成する。図4は、作業履歴の一例図である。例えば、作業履歴は、作業ラベルと、日時(開始時刻と終了時刻)とが対応付けられたものであってよい。上述の例によれば、生成部15は、図4における「4」の作業履歴を生成している。
【0032】
変更部16は、生成部15が作業ラベルを作業履歴に割り当てる際、第3格納部17を参照し、生成部15が現在生成中の作業履歴に対する類似作業履歴を検出する(S104)。
【0033】
類似作業履歴を検出した場合(S104:YES)、変更部16は、生成部15が現在生成中の作業履歴の作業ラベルを、類似作業履歴の作業ラベルと相違する作業ラベルに変更する(S105)。例えば、類似作業履歴と共通する作業ラベルを削除してよい。あるいは、類似作業履歴の作業ラベルと異なる作業ラベルを先頭に配置してもよい。あるいは、類似作業履歴の作業ラベルと異なる作業ラベルを後の表示時に強調されるようにしてもよい。また、変更部16は、第3格納部17に格納された類似作業履歴に対しても同様に、検索の際にユーザが判別可能なように作業ラベルを変更してもよい。
【0034】
例えば、生成部15が、図4における「4」の作業履歴に対して作業ラベルを割り当てる際、変更部16は、第3格納部17を参照し、他の作業履歴(例えば、図4の「1」、「2」、「3」、の作業履歴)の中に、「A企画」、「検討」と、少なくとも一つの作業ラベル共通する類似作業履歴を検出する。この場合、「検討」の作業ラベルが共通する、「1」の作業履歴が類似作業履歴に該当する。
【0035】
この場合、変更部16は、「4」の作業履歴の作業ラベルのうち、類似作業履歴「1」の作業ラベルと共通する「検討」を削除してよい。あるいは、変更部16は、類似作業履歴「1」と共通しない作業ラベル「A企画」を、後の表示時に強調されるようにしてもよい(例えば、太字表示、色付き表示等)。あるいは、類似作業履歴の作業ラベルと異なるA企画」を、後の表示時に先頭に配置されるようにしてもよい。
【0036】
生成部15は、作業ラベルが変更された作業履歴を第3格納部17に書き込み、処理を終了する。類似作業履歴を検出しない場合(S104:NO)、変更部16は、作業ラベルの変更を行なわず処理を終了する。
【0037】
以上、情報処理装置1の作業履歴の生成処理について説明した。
【0038】
なお、変更部16は、検索部18及び第3格納部17と接続され、検索の際に、類似作業履歴を変更し、上述した変更処理を行なっても構わない。この場合、生成部15は、全ての割り当てるべき作業ラベルを全て割り当てた作業履歴を第3格納部17に書き込む。変更部16は、検索部18による検索実行時に、当該変更処理を行ない、表示部に作業履歴を表示させてもよい。
【0039】
図5は、検索部18による検索の際のアプリケーションの一例図である。例えば、検索部18は、入力装置(不図示)を用いたユーザから、「検討」という作業ラベルと、検索期間「2010年7月1日〜2010年7月31日」という検索要求を受け付ける。検索部18は、第3格納部17を参照して、当該検索期間内において、検索要求された作業ラベル「検討」を含む作業履歴を検索する。この場合、図4における「1」及び「4」の作業履歴が該当する。
【0040】
検索部18は、図4における「1」及び「4」の作業履歴を抽出し、表示部19に表示させる。図6は、表示部19が表示する作業履歴の一例図である。図6に示すように、表示部19は、「1」及び「4」の作業履歴を表示する。このとき、表示部19には、上述した変更部16の処理(S104、S105)により、共通しない作業ラベル「A企画」及び「B企画」のみが表示されている。ただし、これに限られず、表示部19は、全ての作業ラベルを表示し、「A企画」と「B企画」とを強調表示してもよい。あるいは、「A企画」と「B企画」とを各々先頭に配置して表示してもよい。
【0041】
本実施形態によれば、同様のリソース作業において、異なるテキスト情報がある場合、当該テキスト情報の違いを示す作業ラベルを生成することができるため、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することができる。
【0042】
また、図6に示すように、作業ラベルはタグとして用いられ、ユーザの作業の一覧(作業ラベル一覧)が表示される。ユーザは、そのうち、作業ラベル一覧又は作業履歴内に表示される一又は複数の作業ラベルを選択することで該当する行動の履歴を確認することができる。例えば、図6(a)の状態で、ユーザにより「レビュー」の作業ラベルが選択されることで、図6(b)に示すように「レビュー」を含む作業履歴のみを表示することができる。このように、特定の作業ラベルで表される作業履歴を検索したり、絞り込むことが可能となる。
【0043】
(第2の実施形態)
第2の実施形態に係る情報処理装置2は、テキスト情報を用いなくても、取得したユーザ状況から作業ラベルを生成可能である点が、前実施形態の情報処理装置1の場合と異なる。
【0044】
情報処理装置1では、ユーザ状況の発生日時に対応するテキスト情報が第2格納部14に存在しない場合、図4の「2」の作業履歴のように、割り当てるべき作業ラベルがない場合が生じる。
【0045】
情報処理装置2は、過去のユーザ状況と、当該ユーザ状況の発生日時に対応するテキスト情報とを用い、現在のユーザ状況から割り当てるべき作業ラベルを決定するための「割当ルール」を学習し、当該割当ルールに基づいて、作業ラベルを割り当てた作業履歴を生成する。
【0046】
図7は、情報処理装置2を表すブロック図である。情報処理装置2は、情報処理装置1に対して、ルール生成部21と、第4格納部22とをさらに備える。また、本実施形態の生成部15は、割当ルールをさらに用いて作業ラベルを生成する点が前実施形態の場合と異なる。
【0047】
ルール生成部21は、取得部11が取得したユーザ状況と、解析部13が取得したテキスト情報から、ユーザ状況と作業ラベルとを対応付けるための「割当ルール」を生成する。ルール生成部21は、前実施形態の場合と同様に、形態素解析や組み込みのルールを用いて、テキスト情報から作業ラベル抽出する。ルール生成部21は、作業ラベルを「分類クラス」とし、対応するユーザ状況を「属性」として、割当ルールを求める。詳細は後述する。
【0048】
第4格納部22は、ルール生成部21が生成した割当ルールを格納する。なお、ルール生成部21は、取得されたテキスト情報に基づいて、第4格納部22に格納されている割当ルールを更新してもよい。すなわち、ルール生成部21は、割当ルールの学習機能を備えていてもよい。
【0049】
生成部15は、前実施形態の処理に加え、第4格納部22に格納された割当ルールに基づいた作業ラベルを割り当てた作業履歴を生成する。
【0050】
ルール生成部21は、中央演算処理装置(CPU)、及びCPUが用いるメモリにより実現されてよい。第4格納部22は、CPUが用いるメモリ、又は補助記憶装置により実現されてよい。
【0051】
以上、情報処理装置2の構成(主に情報処理装置1と異なる点)について説明した。
【0052】
図8は、情報処理装置2が割当ルールを生成する処理を表すフローチャートである。取得部11は、ユーザ状況及びその発生日時を取得する(S201)。図2のS101と同様であってよい。取得部11は、取得したユーザ状況及びその発生日時を第1格納部12に書き込む。
【0053】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する(S102)。図2のS102と同様であってよい。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0054】
ルール生成部21は、第2格納部14に格納されたテキスト情報から、作業ラベルを抽出し、「割当ルール」を生成する(S203)。例えば、解析部13が取得したテキスト情報が「A企画検討_20100721.ppt」のように、「内容(A企画検討)」、「日時(20100721)」といった複数の5W1H情報が含まれる場合、ルール生成部21は、形態素解析や組み込みのルールを用いて分割し、「A企画」「検討」というテキスト情報を作業ラベルとして抽出する。
【0055】
このとき、ルール生成部21は、同時に抽出された「20100721」等、日時や場所に関するテキスト情報を、割当ルールの生成のための属性として用いる。生成部15は、生成した割当ルールを第4格納部22に書き込み、処理を終了する。
【0056】
ルール生成部21による「割当ルール」の生成について詳述する。ここでは、決定木を用いて割当ルールを生成する例について示す。ルール生成部21は、公知のC4.5アルゴリズムを用いて決定木を生成してよい。すなわち、ルール生成部21は、分類クラスと属性とを含む学習データに基づいて、情報量の偏り(ゲイン)が最大になるよう決定木を構成する。
【0057】
分類クラスには、第2格納部14に格納されたテキスト情報から抽出した作業ラベルを用いる。属性には、当該作業ラベルに対応する日時に発生したユーザ状況及びテキスト情報から抽出した日時や場所に関する情報を用いる。
【0058】
図3における10:00から11:00の例では、作業ラベル「A企画」を分類クラスとし、作業ラベル「A企画」に対応する日時における移動状況(「静止」)、無線AP(「a」「b」「c」)、近接状況(「A」「B」「C」)、操作状況(「編集」)等のユーザ状況と、開始時刻(「10:00」)、作業ラベルの継続時間長(「1時間」)等の日時から得られる情報を属性とし、決定木を学習する。
【0059】
図9は、ルール生成部21が生成した決定木の一例図である。図9に示すように、ルール生成部21は、各ノードの質問における結果に基づいて、リーフにある分類クラスに辿り着くような決定木を学習する。ルール生成部21は、決定木以外にも、図10に示すような、決定木の枝を辿る過程を照合パターンとしたルール表を割当ルールとして用いてもよい。
【0060】
なお、決定木の学習に用いる属性には、各作業ラベルに対応する日時に発生した状況だけでなく、前後に一定の幅(例えば15分)がある時間帯における状況を利用してもよい。また、本実施形態では、決定木を割当ルール(識別器)として学習したが、分類クラスとそれに対応する属性を用いて学習するものであればこれに限られない。例えば、SVM(Support Vector Machine)を識別器として割当ルールを学習してもよい。また、学習データの量が予め定められた閾値以上の分類クラスのみを学習に用いてもよい。
【0061】
また、ルール生成部21は、第2格納部14に格納されたテキスト情報から、統計的に作業ラベルを抽出してもよい。例えば、ルール生成部21は、テキスト情報を文書とみなし、文書を分類して各分類中の頻出語を作業ラベルとして採用してよい。
【0062】
その一例として、Latent Dirichlet Allocation(LDA)という公知の手法では、各文書は潜在トピックを含み、また各潜在トピックは単語の生起確率の分布を持っていると仮定する。ルール生成部21は、第2格納部14に格納されたテキスト情報の集合に対してLDAを適用して潜在トピックを推定し、推定された潜在トピックにおいて頻出する単語を作業ラベルに採用する。ここで、ルール生成部21が採用する単語は、例えば、形態素解析結果の各形態素や、固有名詞等であってよい。
【0063】
なお、ルール生成部21は、一単語ではなく、複数の単語の複合語を作業ラベルに採用してもよい。例えば、ルール生成部21は、非公知文献1における「C−value」などの手法を利用することができる。この場合、ルール生成部21は、C−valueが高い単語のうち、前述のLDAによるトピック毎の特徴語を含むものを作業ラベルに採用してよい。
【0064】
また、ルール生成部21は、当該トピックを、クラスタリングにより推定してもよい。クラスタリング手法としては、k−means法や凝集型クラスタリング等の公知の手法を用いることができる。ルール生成部21は、これらの手法により得た各クラスタをトピックとし、各クラスタに含まれる単語の頻度情報から特徴語を抽出してよい。
【0065】
以上、ルール生成部21による割当ルールの生成について説明した。
【0066】
図11は、情報処理装置2の作業ラベルの割り当て処理を表すフローチャートである。取得部11は、ユーザ状況及びその発生日時を取得する(S301)。図2のS101と同様であってよい。取得部11は、取得したユーザ状況及びその発生日時を第1格納部12に格納する。
【0067】
解析部13は、ユーザが利用するリソースを解析し、リソースに含まれるテキスト情報を取得する(S302)。図2のS102と同様であってよい。解析部13は、取得したテキスト情報を、第2格納部14に書き込む。
【0068】
生成部15は、第1格納部12から抽出したユーザ状況と、第2格納部14から抽出したテキスト情報とを用いて、作業ラベルを生成し、当該作業ラベルを割り当てた作業履歴を生成する(S303)。図2のS103と同様であってよい。
【0069】
生成部15は、第4格納部22に格納されている割当ルールと、第1格納部12に格納されたユーザ状況とを用いて作業ラベルを割り当て(S304)、処理を終了する。図12は、作業ラベルの割り当て処理の説明図である。本実施形態の生成部15は、割当ルールとして図9に示す決定木、あるいは図10のルール表を用いる。
【0070】
図9の決定木を用いる場合、生成部15は、作業ラベルが割り当てられていない時間帯に発生したユーザ状況とその発生日時に関する情報を利用して、決定木の先頭ノードにある質問(「移動状況は静止か?」)に答える。
【0071】
生成部15は、その答えに対応する枝を辿った先のノードにある質問に答える。そして、リーフに到達するまでノードの質問に答えながら枝を辿っていく。最終的にリーフに到達したら、そのリーフに格納された作業ラベルを当該日時における作業ラベルとして、当該日時の作業履歴に割り当てる。
【0072】
図12における10:00〜11:00の例の場合、図9の決定木によれば、「移動状況は静止か?」の答えは「YES」になる。「近接状況は2名以上?」の答えは「YES」になる。「静止の継続時間長は?」の答えは「一時間以上」になる。「静止の開始時刻は?」の答えは「18:00より前」になる。そのため、生成部15は、10:00〜11:00の時間帯の作業履歴に「会議」作業ラベルを割り当てる。
【0073】
なお、図10において、全ての条件ではなく一部の条件を満たした場合に、生成部15は、該当する作業ラベルを割り当ててもよい。この場合、一度に複数のルールが合致し作業ラベルが複数割り当てられることもあるが、生成部15は、学習時に用いる各分類クラスの学習データ量に応じて優先度を設定し、優先度の高いルールの作業ラベルを優先的に採用してもよい。
【0074】
また、生成部15は、作業ラベルを割り当てる際の日時を、特定の時間長ごとに分割してもよい。例えば、10:00から11:00、11:00から12:00のような1時間毎に分割した時間帯について、生成部15は、作業ラベルを割り当てるようにしてもよい。この他にも、生成部15は、同一の状況が一定時間以上継続している日時に作業ラベルを割り当てるようにしてもよい。例えば、同一の移動状況が30分以上継続した場合に、生成部15は、作業ラベルを割り当てるように設定してもよい。
【0075】
図13は、本例の場合に表示部19が表示する作業履歴の一例図である。本例の処理により、図6と比較し、「A企画検討_20100721.ppt」の作業履歴の作業ラベルに「会議」が追加される。
【0076】
本実施形態によれば、前実施形態の処理以外でも、上述の割当ルールにより、作業ラベルを割り当てた作業履歴を生成することができる。そのため、作業ラベルを生成するためのテキスト情報が存在しない場合であっても、作業ラベルを割り当てることができる。
【0077】
なお、本実施形態では、作業ラベルを抽出することができなかったテキスト情報が第2格納部14に格納されているような日時に対しても作業ラベルを割り当てることができる。これにより、ユーザは、不完全な状態(作業ラベルが抽出できない状態)で登録されたテキスト情報に関する履歴を検索することができる。
【0078】
(変形例1)
本実施形態では、一のユーザのテキスト情報とユーザ状況とを用いて割当ルールを学習したが、複数のユーザのテキスト情報とユーザ状況とを用いて、割当ルールを学習しても構わない。これにより、変形例では、割当ルールを学習する際の学習データ量を増やすことができる。
【0079】
また、近接するユーザの識別情報をユーザ状況として取得し、これを属性として割当ルールを学習することもできる。これにより、ある特定のユーザが参加している場合には「報告会」になるが、このユーザが参加していない場合には「検討会」になるなど、ユーザの参加状況に応じた割当ルールを学習できる。
【0080】
(変形例2)
解析部13は、チャットやマイクロブログ等、テキストを用いたコミュニケーション手段により記述されたテキスト情報を取得してもよい。例えば、ユーザが、会議中に「現在会議中」とメッセージを送信したり、立ち話の後で「さっきTさんとばったり会って話したよ」とマイクロブログに書き込んだりすることがある。これらのテキスト情報から、ルール生成部21は、割当ルールを学習してもよい。
【0081】
例えば、立ち話の後で「さっき田中さんと話したよ」と、ユーザからマイクロブログに書き込まれた場合、解析部13は、ユーザがマイクロブログに記載したテキストとその発信日時をテキスト情報として取得し、第2格納部14に格納する。そして、ルール生成部21は、第2格納部14に格納されたテキスト情報を解析し、作業ラベルと日時情報とを抽出する。ルール生成部21は、日時情報に関して、「さっき→5分前」、「今朝→同日の朝9時〜12時」のように、テキスト中の表現をスケジュールと同様な日時情報に変換する。ルール生成部21は、作業ラベルに関して、「立ち話」、「会議」、「コンサート」といった行動を表す語彙を抽出する。これにより、「さっき田中さんと立ち話したよ」とうテキストが2010年12月14日12時30分に発信されたとすると、2010年12月14日12時25分に「立ち話」というスケジュールが予め登録されていた場合と同様な処理を行うことができる。なお、ルール生成部21は、抽出した日時情報(2010年12月14日12時25分)を、割当ルールを学習する際の属性として利用してよい。
【0082】
(変形例3)
ルール生成部21は、複数の作業ラベルの中で同義語を判別し、同義語を判別した作業ラベルを同一の分類クラスとして、割当ルールを学習してよい。例えば、ルール生成部21は、「打ち合わせ」と「打合せ」という作業ラベルを同義語と判別し、「打ち合わせ」の作業ラベルに統一した分類クラスとして割当ルールを学習する。ここで、作業ラベルが同義語か否かの判定には、表記を用いる方法や、複数のユーザ状況等を用いてよい。
【0083】
表記を用いて同義語を判別する方法について説明する。この場合、ルール生成部21は、作業ラベルどうしのテキストの類似性を用いて同義語か否かを判別する。例えば、「打ち合わせ」と「打合せ」は、お互いのテキストが類似していることから同義語と判別される。テキストの類似性は、例えば編集距離の近さを用いて判別してよい。また、表記の包含関係から同義語か否かを判別してもよい。例えば、「開発会議」は、「会議」の下位概念である。これは、「開発会議」というテキストが「会議」というテキストを包含することから判別できる。このように作業ラベルどうしが包含関係にある場合、ルール生成部21は、上位概念にあたる「会議」に分類クラスを統一することができる。
【0084】
複数のユーザの状況を用いて同義語を判別する方法について説明する。同じ行動を同時に複数のユーザが行う場合、各ユーザのテキスト情報から抽出した作業ラベルの文言が異なることがある。この場合、ルール生成部21は、各作業ラベルを同義語として判別する。例えば、同じ会議に出席する2人のテキスト情報から抽出した作業ラベルが「会議」と「打ち合わせ」で異なる表記であり、2人の端末では近接情報として互いの端末が検出された場合、2人が行っている行動は同じである判別することができる。また、2人の端末で取得された状況の類似性を用いて同じ行動を行っていると判別してもよい。この場合、2人のテキスト情報から抽出した「会議」と「打ち合わせ」の作業ラベルは同義語であると判別する。統一した分類クラスには、出現回数が多い作業ラベルを用いるなどしてもよい。
【0085】
このように、ある作業ラベル同士が同義語であると判別された場合、これらの作業ラベルを同一の分類クラスとして割当ルールを学習する。これにより、本来同一の作業ラベルを割り当てるべき日時に、同義語であるが表記が異なる作業ラベルが割り当てられることを防止できる。また、分類クラスを統一することにより、この分類クラスの学習データ量を増やすことができる。
【0086】
(変形例4)
ルール生成部21は、第2格納部14に格納されているテキスト情報から作業ラベルを取得する以外に、ユーザから入力された作業ラベルを用いて割当ルールを生成してもよい。この場合、情報処理装置2は、ユーザから入力された作業ラベルを第4格納部22に書き込む登録部(不図示)を備える。例えば、図14の作業履歴表示メニューにおいて、ユーザにより選択された作業ラベル(例えば、図14(a)における「A企画」及び「レビュー」の作業ラベル)が入力された場合、登録部(不図示)は、入力された作業ラベルを第4格納部22に登録する。ルール生成部21は、登録された作業ラベルを用いて、割当ルールを更新する。これにより、図14(b)の下段の作業履歴のように、「A企画」及び「レビュー」の作業ラベルが付された作業履歴に更新される。
【0087】
(変形例5)
また、図14に示す作業履歴表示メニューにおいて、生成部15により作業ラベルが付与されなかった時間帯の行動に関しては、登録部(不図示)の利用を促してもよい。図15は、作業ラベルの登録を促す画面の一例図である。表示部19は、作業ラベルが割り当てられなかった作業履歴について、「新規登録」ボタンが表示される。ユーザがボタンを選択すると、登録フォームが表示され、ユーザが作業ラベルを入力することにより、登録部(不図示)作業ラベルを登録する。
【0088】
(変形例6)
予め定められた数種類の業務のうち、ある時間帯はどの業務にユーザは従事したかを分類するのが目的の場合、予めユーザが作業ラベルを定義し、そのいずれに行動が分類されるか否かを判定してもよい。
【0089】
例えば、「業務1」、「業務2」、「業務3」、の3種類の業務が存在する場合、図16のように、表示部19は、3種類の業務を作業ラベルとして表示する。生成部15は、3種類のいずれも付与できない場合、「その他」の作業ラベルを付与してよい。このように分類することで、第3格納部17に格納された作業履歴のうち、特定の作業ラベルが付与された行動の期間を集計することで、図17のように工数管理を行うことが可能となる。図16において「業務1」、「業務2」の、2つの作業ラベルが付与される例のように、1つの行動に複数の作業ラベルが付与される場合、生成部15は、両方の業務に所与の比率で従事したとみなし、いずれの作業ラベルを割り当ててもよい。あるいは1つの行動に対し1つの作業ラベルだけを付与する方式を採用してもよい。なお、表示部19は、図17の表示形態ではなく、図18のように業務毎の従事比率を表示してもよい。
【0090】
(変形例7)
検索部18は、ユーザの操作に応じ、作業ラベルの表示優先度を更新してもよい。例えば、ユーザが特定の作業ラベルのボタンを押下することによる絞り込みを頻繁に利用する場合、検索部18は、その作業ラベルを先頭に表示したり、強調表示してよい。
【0091】
(変形例8)
本実施形態では割当ルールとして決定木を1つだけ学習しているが、ルール生成部21は、複数の決定木、あるいは他の識別器を併用して、割当ルールを生成しても構わない。例えば、ルール生成部21は、「会議」という作業ラベルが割り当てられた日時に、別の決定木を用いて会議を詳細に分類する作業ラベル(例えば、「開発会議」、「グループ会議」など)を割り当ててもよい。
【0092】
上述した実施形態によれば、ユーザにとって分かりやすい、リソースに関する作業履歴を生成することができる。
【0093】
本実施形態の情報処理装置は、持ち運び可能なハードウェア装置への実装を想定しているが、情報処理装置の機能の一部をネットワークに接続された外部サーバ上で実行してもよい。また、情報処理装置を、CPUなどの制御装置と、ROMやRAMなどの記憶装置と、HDDなどの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボード、マウスなどの入力装置とを備えた一般的なコンピュータに実装することもできる。
【0094】
これまで、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0095】
11・・・取得部
12・・・第1格納部
13・・・解析部
14・・・第2格納部
15・・・生成部
16・・・変更部
17・・・第3格納部
18・・・検索部
19・・・表示部
21・・・ルール生成部
22・・・第4格納部
【特許請求の範囲】
【請求項1】
リソース作業時のユーザの状況を取得する取得部と、
前記リソースを解析し、前記リソースに含まれるテキスト情報を取得する解析部と、
前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する生成部と
を備える、情報処理装置。
【請求項2】
前記生成部が生成した前記作業履歴の中に、少なくとも一の前記作業ラベルが共通する、複数の前記作業履歴を検出した場合、少なくとも一の前記作業履歴の前記作業ラベルを、他の前記作業履歴の前記作業ラベルと相違する作業ラベルに変更する変更部を
さらに備える、請求項1記載の情報処理装置。
【請求項3】
前記ユーザの状況及び前記テキスト情報から、前記ユーザ状況と前記作業ラベルを対応付けるための割当ルールを生成するルール生成部をさらに備え、
前記生成部は、前記割当ルールに基づいて、前記作業ラベルを割り当てた前記作業履歴を生成する、請求項2記載の情報処理装置。
【請求項4】
前記取得部は、リソース作業時のユーザの移動状態、近接状態、又は発話状態に関する状況を取得する、請求項3記載の情報処理装置。
【請求項5】
リソース作業時のユーザの状況を取得し、
前記リソースを解析し、前記リソースに含まれるテキスト情報を取得し、
前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する、
情報処理方法。
【請求項1】
リソース作業時のユーザの状況を取得する取得部と、
前記リソースを解析し、前記リソースに含まれるテキスト情報を取得する解析部と、
前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する生成部と
を備える、情報処理装置。
【請求項2】
前記生成部が生成した前記作業履歴の中に、少なくとも一の前記作業ラベルが共通する、複数の前記作業履歴を検出した場合、少なくとも一の前記作業履歴の前記作業ラベルを、他の前記作業履歴の前記作業ラベルと相違する作業ラベルに変更する変更部を
さらに備える、請求項1記載の情報処理装置。
【請求項3】
前記ユーザの状況及び前記テキスト情報から、前記ユーザ状況と前記作業ラベルを対応付けるための割当ルールを生成するルール生成部をさらに備え、
前記生成部は、前記割当ルールに基づいて、前記作業ラベルを割り当てた前記作業履歴を生成する、請求項2記載の情報処理装置。
【請求項4】
前記取得部は、リソース作業時のユーザの移動状態、近接状態、又は発話状態に関する状況を取得する、請求項3記載の情報処理装置。
【請求項5】
リソース作業時のユーザの状況を取得し、
前記リソースを解析し、前記リソースに含まれるテキスト情報を取得し、
前記ユーザの状況及び前記テキスト情報から、一又は複数の作業ラベルを生成し、検索に用いられる前記作業ラベルを割り当てた作業履歴を生成する、
情報処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【公開番号】特開2013−37498(P2013−37498A)
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願番号】特願2011−172408(P2011−172408)
【出願日】平成23年8月5日(2011.8.5)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願日】平成23年8月5日(2011.8.5)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]