説明

情報出力装置、情報出力方法、およびプログラム

【課題】従来、ブログ等の文章群の文脈を可視化できなかった。
【解決手段】一人以上の個人が入力した1以上の文章群を格納し得る文章群格納部と、前記文章群格納部に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記文章群格納部に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部とを具備する情報出力装置により、ブログ等の文章群の文脈を可視化できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ブログを含む個人が作成した文の集合である文章群を自然言語処理し、文章群の文脈を可視化するような図を出力する情報出力装置等に関するものである。
【背景技術】
【0002】
従来、特に、ブログ等の口語体の文章を対象とする自然言語処理技術を用いた自然言語処理装置があった(例えば、特許文献1参照)。
【0003】
かかる自然言語処理装置は、第一文字列と、文中における第一文字列の機能を特定する機能語情報と、前に接続され得る文字列の種類を特定する前接続記号と、後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する後接続記号とを有する辞書情報を1以上格納しており、解析対象の文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列の機能語情報または後接続記号から、第二文字列の種類を特定し、2以上の区切られた各第二文字列と、各第二文字列の種類を特定する情報を対にして出力する自然言語処理装置により、口語体の文章の解析が高い確度でできる。
【特許文献1】特開2008−71001号公報(第1頁、第1図等)
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の自然言語処理装置においては、解析した結果を図的に表示できず、例えば、ブログで記載されている内容がどのような内容かを容易に掴むことができなかった。
【課題を解決するための手段】
【0005】
本第一の発明の情報出力装置は、一人以上の個人が入力した1以上の文章群を格納し得る文章群格納部と、前記文章群格納部に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記文章群格納部に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部とを具備する情報出力装置である。
【0006】
かかる構成により、ユーザは、ブログ等の文章群で記載されている対象物と、その動作状態の対応が容易に理解できる。その結果、ユーザは、文章群の文脈が容易に理解できる。
【0007】
また、本第二の発明の情報出力装置は、第一の発明に対して、前記対応図出力部は、前記対象物と、当該対象物に対応する動作状態とを、線で結ぶ態様で出力する情報出力装置である。
【0008】
かかる構成により、ブログ等の文章群で記載されている対象物と、その動作状態の対応が、より直感的に理解できる。その結果、ユーザは、文章群の文脈が容易に理解できる。
【0009】
また、本第三の発明の情報出力装置は、第二の発明に対して、前記文章群格納部に格納されている文章群に含まれる文から、前記対象物と、当該対象物に対応する動作状態とをつなぐ非自立語である関係語を取得する関係語取得部をさらに具備し、前記対応図出力部は、前記対象物と当該対象物に対応する動作状態とを線で結ぶ態様で出力し、かつ当該線に対応付くように、前記関係語を出力する情報出力装置である。
【0010】
かかる構成により、ブログ等の文章群で記載されている対象物と、その動作状態の対応の意味が関係語の出力により容易に理解でき、ブログ等の文章群で記載されている内容が、より直感的に理解できる。
【0011】
また、本第四の発明の情報出力装置は、第一から第三いずれかの発明に対して、対応図の元になる1以上の文章群から、前記対象物取得部が取得した対象物が複数存在する場合、または、前記動作状態取得部が取得した動作状態が複数存在する場合、前記対応図出力部は、前記複数の対象物、または前記複数の動作状態を一つにした対応図であり、前記対象物と前記動作状態とを対応付けた図である対応図を出力する情報出力装置である。
【0012】
かかる構成により、ブログ等の文章群で記載されている内容が、さらにより直感的に理解できる。また、対応図を出力する場合、少ない画面スペースを有効に利用できる。
【0013】
また、本第五の発明の情報出力装置は、第四の発明に対して、前記対応図出力部は、前記対象物、または前記動作状態に対応付けて、前記対象物の出現回数、または前記動作状態の出現回数をも出力する情報出力装置である。
【0014】
かかる構成により、ブログ等の文章群で記載されている内容について、重要な内容と、重要でない内容とが区別して出力できる。
【0015】
また、本第六の発明の情報出力装置は、第一から第四いずれかの発明に対して、第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納部と、前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、前記対象物取得部は、前記文分割制御部が取得した第二文字列の種類から対象物を含む第二文字列を特定し、当該第二文字列から対象物を取得し、前記動作状態取得部は、前記対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて動作状態を含み得る第二文字列を特定し、当該第二文字列が有する動作状態を取得する情報出力装置である。
【0016】
かかる構成により、口語調のブログ等についても、ブログ等の文章群で記載されている内容が、より直感的に理解できる。
【0017】
また、本第七の発明の情報出力装置は、第三の発明に対して、第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納部と、前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、前記関係語取得部は、前記文分割制御部が取得した前記第二文字列と前記第二文字列の種類を特定する情報を用いて、前記対象物と、当該対象物に対応する動作状態とをつなぐ機能語である関係語を取得する情報出力装置である。
【0018】
かかる構成により、ユーザは、口語調のブログ等についても、容易にかつ直感的に、その内容が理解できる。
【0019】
また、本第八の発明の情報出力装置は、第一から第七いずれかの発明に対して、前記対応図出力部は、前記対象物と前記動作状態とを、視覚的に区別可能なように出力する情報出力装置である。
【0020】
かかる構成により、ユーザは、さらに容易にかつ直感的に、文章群の内容が理解できる。
【0021】
また、本第九の発明の情報出力装置は、第一から第八いずれかの発明に対して、特定の対象物である特定対象物を、1以上格納し得る特定対象物格納部と、前記1以上の各特定対象物が出現する文章群の中の1以上の文であり、前記1以上の各特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である関連対象物を取得する関連対象物取得部と、前記関連対象物と前記特定対象物とを対応付ける情報である対応情報を取得する対応情報取得部とをさらに具備し、前記対応図出力部は、前記対象物と前記動作状態とを対応付けた図であり、かつ、前記対応情報を用いて、前記関連対象物と前記特定対象物とを対応付けた図である対応図を出力する情報出力装置である。
【0022】
かかる構成により、特定対象物と所定の位置関係に出現する対象物とをも対応付けた対応図を出力することができる。
【0023】
また、本第十の発明の情報出力装置は、第九の発明に対して、1以上の特定対象物を受け付ける受付部をさらに具備し、前記特定対象物格納部の1以上の特定対象物は、前記受付部が受け付けた1以上の特定対象物である情報出力装置である。
【0024】
かかる構成により、ユーザから受け付けた特定対象物と所定の位置関係に出現する対象物とをも対応付けた対応図を出力することができる。
【0025】
また、本第十一の発明の情報出力装置は、第九、第十いずれかの発明に対して、前記対応図出力部は、前記対象物と前記動作状態とを線で結ぶ態様で出力し、かつ、前記関連対象物と前記特定対象物とを線で結ぶ態様で出力し、かつ、前記対象物と前記動作状態とを結ぶ線の属性値と前記関連対象物と前記特定対象物とを結ぶ線の属性値とが異なるように出力する情報出力装置である。
【0026】
かかる構成により、対象物と動作状態との対応付けとは、視覚的に異なる対応付けの方法で、特定対象物と対象物とを対応付けることができる。
【0027】
また、本第十二の発明の情報出力装置は、第一から第十一いずれかの発明に対して、過去に作成された文章群から構成された過去対応図を、1以上格納し得る対応図格納部をさらに具備し、前記対応図出力部は、前記過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力する情報出力装置である。
【0028】
かかる構成により、時期が異なる文章群から構成された2つ以上の対応図を同時に出力できる。
【0029】
また、本第十三の発明の情報出力装置は、第一から第十二いずれかの発明に対して、過去に作成された文章群から構成された過去対応図を、1以上格納し得る対応図格納部をさらに具備し、前記対応図出力部は、前記過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で前記新対応図を出力する情報出力装置である。
【0030】
かかる構成により、2以上の対応図を比較し、差異が一定以上である情報(新しく出現した対象物、出現回数が増えている対象物、出現回数が増えている動作状態など)を、他の情報と視覚的に異なる態様で、最新の対応図を出力することができる。
【0031】
また、本第十四の発明の情報出力装置は、第一から第十三いずれかの発明に対して、前記対応図出力部は、動作状態の種類を決定する動作状態種類決定手段を具備し、前記対応図を出力する際に、前記動作状態種類決定手段が決定した種類に応じて、視覚的に異なる態様で動作状態を出力する情報出力装置である。
【0032】
かかる構成により、動作状態の種類を特定し、その種類に応じて、動作状態を種類ごとに視覚的に異なる態様で出力できる。
【0033】
また、本第十五の発明の情報出力装置は、第十四の発明に対して、前記対応図出力部は、動作状態の種類を識別する動作状態種類識別子と、1以上の用語とを対に有する種類別動作状態データベースをさらに具備し、前記動作状態種類決定手段は、前記対応図が有する動作状態と一致する用語と対になる動作状態種類識別子を取得し、前記対応図を出力する際に、前記動作状態種類識別子に応じて、視覚的に異なる態様で動作状態を出力する情報出力装置である。
【0034】
かかる構成により、動作状態の種類を特定し、その種類に応じて、動作状態を種類ごとに視覚的に異なる態様で出力できる。また、種類ごとに用語のDBを有し、種類を容易に拡張できる。
【発明の効果】
【0035】
本発明による情報処理システムによれば、文章群を自然言語処理し、対象物と動作状態語とを取り出し、当該対象物と動作状態語との対応を示す対応図を出力できる。
【発明を実施するための最良の形態】
【0036】
以下、情報処理システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0037】
(実施の形態1)
【0038】
本実施の形態において、ブログを含む個人が作成した文の集合である文章群を自然言語処理し、対象物(例えば、名詞)と動作状態(例えば、形容詞または名詞)とを取り出し、図的にそれらの対応を出力する情報処理システムについて説明する。また、本実施の形態において、対象物と動作状態語とを線で結んだ対応図を出力する情報処理システムについて説明する。また、本実施の形態において、対象物と動作状態語とを関係付ける非自立語(機能語)を線に対応付けて出力する情報処理システムについて説明する。また、本実施の形態において、複数の対象物または複数の動作状態は一つにした対応図を出力する情報処理システムについて説明する。また、本実施の形態において、複数の対象物または複数の動作状態が表れる場合、当該複数の対象物や動作状態の出現回数を出力する情報処理システムについて説明する。また、本実施の形態において、自然言語処理の例として、機能素解析という自然言語処理の方法を説明する。さらに、本実施の形態において、対象物と動作状態語とは、視覚的に区別可能なように表示する情報処理システムについて説明する。
【0039】
図1は、本実施の形態における情報処理システム1の概念図である。情報処理システム1は、情報出力装置11、1以上の文章群格納装置12を具備する。情報出力装置11は、後述する対応図を出力する装置である。文章群格納装置12は、例えば、ブログ等の文章群を格納している装置である。
【0040】
図2は、本実施の形態における情報処理システム1のブロック図である。情報出力装置11は、文章群格納部110、辞書情報格納部111、文章群受信部112、文章群蓄積部113、受付部114、文分割制御部115、対象物取得部116、動作状態取得部117、関係語取得部118、対応図出力部119を具備する。文分割制御部115は、要素分割手段1151、要素連結手段1152を具備する。
【0041】
文章群格納装置12は、サーバ側文章群格納部121、指示受信部122、文章群送信部123を具備する。
【0042】
文章群格納部110は、一人以上の個人が入力した1以上の文章群を格納し得る。文章群とは、いわゆるブログ、電子メール、SNS、Voip、メタバース、IMなどの情報である。文章群は、いわゆるCGMも含む。CGMとは、「Consumer Generated Media」の略である。CGMには、例えば、twitter、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス、ブログ、COI(Community Of Interest)サイトなどがある。文章群は、ブログなど、タグにより構造化されている情報でも良い。文章群は、外部の装置(例えば、Web上の文章群格納装置12)などから取得し、一時的に格納されている文章群でも良い。文章群格納部110は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0043】
辞書情報格納部111は、1以上の辞書情報を格納している。辞書情報は、ここでは、解析対象の文から用語を取得しやすいように、文を区切るための情報である、と言える。また、辞書情報は、例えば、第一文字列と、機能語と、前接続記号と、後接続記号とを対に有する。第一文字列は、1文字以上の文字からなる。第一文字列は、「を」「に」「だ」などの膠着語の文の中で機能を示す機能語を含む。機能語とは、文中における第一文字列の機能または種類を特定する情報である。前接続記号とは、第一文字列の前に接続され得る文字列の種類を特定する情報である。後接続記号とは、第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である。なお、第二文字列は、第一文字列または2以上の第一文字列が結合した文字列である。第二文字列の種類は、例えば、文の「主題」、文の「副題」、「動作状態」、「準主題」などである。「主題」は、解析対象の文の主題を示す文字列であることを示す。「副題」は、解析対象の文の副題を示す文字列であることを示す。「動作状態」は、何らかの動作や状態を示す文字列であることを示す。「動作状態」は、「動作」と「状態」という具合に、2つに区別されていても良い。「準主題」は、サブの主題であることを示す。単に主題と言う場合に、準主題を含んで考えても良い。辞書情報の具体例は、後述する。辞書情報格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。辞書情報格納部111に辞書情報が記憶される過程は問わない。例えば、記録媒体を介して辞書情報が辞書情報格納部111で記憶されるようになってもよく、通信回線等を介して送信された辞書情報が辞書情報格納部111で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された辞書情報が辞書情報格納部111で記憶されるようになってもよい。なお、辞書情報は、形態素解析のために必要な情報、その他の自然言語処理に必要な情報でも良いことは言うまでもない。形態素解析のために必要な情報は、公知の情報(公知技術)であるので、説明は省略する。
【0044】
文章群受信部112は、文章群格納装置12から文章群を受信する。通常、文章群受信部112は、自身から文章群格納装置12に、文章群の送信指示を送信し、当該送信指示の送信に対応して、文章群格納装置12から文章群を受信する。なお、文章群受信部112が文章群を受信するタイミング(送信指示を送信するタイミング)は問わない。文章群受信部112は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
【0045】
文章群蓄積部113は、文章群受信部112が受信した文章群を文章群格納部110に蓄積する。文章群蓄積部113は、通常、MPUやメモリ等から実現され得る。文章群蓄積部113の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0046】
受付部114は、ユーザから指示やデータの入力などを受け付ける。指示とは、例えば、後述する対応図の出力指示である。対応図出力指示は、対応図を出力する対象となる文章群を特定する情報(例えば、文章群識別子(例えば、URLやURI)、文章群の属性(例えば、ブログ、チャットなど文章群の種類を示す情報)、文章群中で出現する用語など)を有しても良い。対応図出力指示が文章群の属性を有する場合、文章群は属性を有するものとする。対応図出力指示が文章群中で出現する用語を有する場合、後述する文分割制御部115または図示しない選択手段が、用語をキーとして文章群を検索し、当該用語が出現する文章群のみを選択する。指示やデータの入力手段は、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部114は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。受付部114は、外部の装置から対応図出力指示を受信しても良い。
【0047】
文分割制御部115は、取得した文章群の中の1以上の各文を、メモリ上に読み出し、各文について、文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する。なお、文分割制御部115は、取得した文章群の中のすべての文を処理し、すべての文から第二文字列と第二文字列の種類を特定する情報を取得する必要はない。なお、文分割制御部115は、取得した文章群の中の1以上の各文を、メモリ上に読み出し、各文について、形態素に分割する処理を行い、形態素と品詞の情報の組を取得しても良い。文分割制御部115は、通常、MPUやメモリ等から実現され得る。文分割制御部115の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0048】
文分割制御部115を構成する要素分割手段1151は、取得した文章群の中の1以上の各文をメモリ上に読み出し、当該文の先頭から予め決められたサイズ(n文字[nは2以上の整数])の第三文字列を切り出し、メモリ上に配置し、当該切り出した第三文字列を構成する文字列であって、先頭からn文字の文字列から順に、辞書情報格納部111に当該文字列(この文字列は、第一文字列である。)が存在するか否かを判断し、n文字の文字列が存在しない場合には、先頭から(n−1)文字の文字列が辞書情報格納部111に当該文字列が存在するか否かを判断し、かかる判断を、1文字ずつ文字数を減らして、文字列が辞書情報格納部111に存在するまで行い、または、文字列が辞書情報格納部111に存在しない場合には、先頭から1文字になるまでかかる判断を行い、文字列が辞書情報格納部111に存在すると判断した場合には、当該文字列(この文字列は、第一文字列である。)に対応する機能語と前接続記号と後接続記号とを、辞書情報格納部111から読み出し、読み出した機能語と前接続記号と後接続記号とを当該文字列に付与し、文字列が存在しない場合には、1文字の文字列に対して未知語であることを示す情報である未知語情報を付与する。
【0049】
要素連結手段1152は、要素分割手段1151が未知語情報を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成し、かつ連続する未知語であり、ひらがなではない文字を連結し文字列を構成し、当該連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与する。
【0050】
要素分割手段1151、および要素連結手段1152は、通常、MPUやメモリ等から実現され得る。要素分割手段1151等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0051】
対象物取得部116は、文章群格納部110に格納されている文章群に含まれる文から、対象物を取得する。対象物とは、動作や状態の主体である主体語または動作や状態の客体である客体語である。また、対象物は、主体語または客体語を示す情報(用語)であると考えても良い。また、対象物とは、主語、目的語などであると考えても良い。また、機能素解析を行った場合の主題または副題でも良い。対象物は、通常、名詞である。また、対象物とは、上述した主題、副題である。機能素解析を行う場合、対象物取得部116は、例えば、文分割制御部115が取得した第二文字列の種類から対象物を含む第二文字列を特定し、当該第二文字列から対象物を取得する。対象物取得部116は、例えば、文章群に含まれる各文を形態素解析し、その結果を用いて、主語となる名詞や、目的語となる名詞などを取得しても良い。形態素解析技術を用いて、文から、主語や目的語や述語を取得する技術は公知技術であるので、詳細な説明を省略する。
【0052】
また、対象物取得部116は、文章群に含まれるすべての文から対象物を取得しても良いし、一部の文から対象物を取得しても良い。対象物取得部116は、通常、MPUやメモリ等から実現され得る。対象物取得部116の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0053】
動作状態取得部117は、文章群格納部110に格納されている文章群に含まれる文から、対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する。また、上記の動作とは、通常、動詞により規定される用語である。さらに、状態とは、通常、形容詞または形容動詞により規定される用語である。また、機能素解析を行う場合、動作状態取得部117は、対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて動作状態を含み得る第二文字列を特定し、当該第二文字列が有する動作状態を取得する。動作状態とは、例えば、述語となる用語である。また、動作状態取得部117は、例えば、文章群格納部110に格納されている文章群に含まれる文を形態素解析し、その結果を用いて、述語となる動詞や形容詞等を取得しても良い。動作状態取得部117は、通常、MPUやメモリ等から実現され得る。動作状態取得部117の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0054】
関係語取得部118は、文章群格納部110に格納されている文章群に含まれる文から、対象物と、当該対象物に対応する動作状態とをつなぐ非自立語である関係語を取得する。また、機能素解析を行う場合、関係語取得部118は、文分割制御部115が取得した第二文字列と第二文字列の種類を特定する情報を用いて、対象物と、当該対象物に対応する動作状態とをつなぐ機能語である関係語を取得する。関係語とは、機能素解析における機能語である。また、関係語は、非自立語であり、通常、助詞である。なお、関係語取得部118は、文章群格納部110に格納されている文章群に含まれる文を形態素解析し、その結果から、主語と述語を繋ぐ助詞を取得しても良いし、目的語と述語を繋ぐ助詞を取得しても良い。関係語取得部118は、通常、MPUやメモリ等から実現され得る。関係語取得部118の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0055】
対応図出力部119は、対応図を出力する。対応図とは、対象物と、当該対象物に対応する動作状態とを対応付けた図である。対応図は、対象物と、当該対象物に対応する動作状態とを、線で結ぶ態様の図であることは好適である。線で結ぶ態様とは、対象物と動作状態とをノード(楕円や矩形で囲むなど)とし、当該ノード間を線で結んでも良いし、対象物と動作状態とを何ら囲まずに、そのまま線で結んでも良い趣旨である。なお、対応図を構成する情報の組を情報セットという。情報セットは、対象物と動作状態だけでも良いし、対象物と動作状態と関係語でも良い。
【0056】
対応図は、対象物と当該対象物に対応する動作状態とを線で結ぶ態様の図であり、かつ当該線に対応付くように、関係語が出力されている図であることは好適である。「線に対応付く」とは、線の上、線の下など、線の近くに関係語が出力されることである。また、対象物と動作状態とを結ぶ線と接続された線の近くに関係語が出力されても良い。
【0057】
また、対応図出力部119は、複数の対象物、または複数の動作状態を一つにした対応図であり、対象物と動作状態とを対応付けた図である対応図を出力することは好適である。また、対応図出力部119は、対象物、または動作状態に対応付けて、対象物の出現回数、または動作状態の出現回数をも出力することは好適である。また、対応図出力部119は、出現回数が多いほど強調する態様で、対象物または動作状態または線を出力することは好適である。強調する態様とは、線を太くする、文字を大きくする、文字を太くする、ノードの背景色をより強調する色にする、など何でも良い。
【0058】
さらに、対応図出力部119は、対象物と動作状態とを、視覚的に区別可能なように出力することは好適である。ここで、「視覚的に区別可能」とは、対象物のノードの背景色と動作状態のノードの背景色とが異なったり、対象物と動作状態の文字の属性値(色、フォント、サイズなど)が異なったりする場合である。
【0059】
なお、対応図出力部119は、対応図を表示するとともに、対応図出力部119が有する記録媒体または図示しない記録媒体に蓄積しても良い。
【0060】
また、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置(例えば、表示装置)への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。
【0061】
対応図出力部119は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。対応図出力部119は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0062】
サーバ側文章群格納部121は、文章群を格納している。サーバ側文章群格納部121は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0063】
指示受信部122は、情報出力装置11から、文章群の送信指示を受信する。指示受信部122は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
【0064】
文章群送信部123は、指示受信部122が文章群の送信指示を受信した場合、文章群をサーバ側文章群格納部121から読み出し、当該文章群を情報出力装置11に送信する。文章群送信部123は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
【0065】
次に、情報処理システム1の動作について説明する。まず、図3のフローチャートを用いて、情報出力装置11の動作について説明する。
【0066】
(ステップS301)文章群受信部112は、文章群格納装置12から文章群を受信したか否かを判断する。文章群を受信すればステップS302に行き、文章群を受信しなければステップS303に行く。
【0067】
(ステップS302)文章群蓄積部113は、ステップS301で受信した文章群を、文章群格納部110に蓄積する。ステップS301に戻る。
【0068】
(ステップS303)受付部114は、対応図出力指示を受け付けたか否かを判断する。対応図出力指示を受け付ければステップS304に行き、対応図出力指示を受け付けなければステップS301に戻る。
【0069】
(ステップS304)文分割制御部115は、対応図出力指示に対応する文章群を文章群格納部110から読み出す。
【0070】
(ステップS305)文分割制御部115は、カウンタiに1を代入する。
【0071】
(ステップS306)文分割制御部115は、i番目の文章群が存在するか否かを判断する。i番目の文章群が存在すればステップS307に行き、i番目の文章群が存在しなければステップS312に行く。
【0072】
(ステップS307)文分割制御部115は、カウンタjに1を代入する。
【0073】
(ステップS308)文分割制御部115は、i番目の文章群の中に、j番目の処理単位が存在するか否かを判断する。j番目の処理単位が存在すればステップS309に行き、j番目の処理単位が存在しなければステップS311に行く。なお、処理単位とは、通常、一文である。ただし、処理単位は、主語と述語が2文に分離されている不完全な2文である場合などがあり得る。かかる場合の処理単位は、例えば、「よかったね。今日の試合は。」などである。
【0074】
(ステップS309)文分割制御部115等は、j番目の処理単位(通常、文)に対して、自然言語処理を行い、対象物、動作状態、および関係語を取得し、当該3つの情報を対応付けて、少なくとも一時蓄積する。かかる処理を文処理といい、当該文処理について、図4のフローチャートを用いて、詳細に説明する。
【0075】
(ステップS310)文分割制御部115は、カウンタjを1、インクリメントする。ステップS308に戻る。
【0076】
(ステップS311)文分割制御部115は、カウンタiを1、インクリメントする。ステップS306に戻る。
【0077】
(ステップS312)対応図出力部119は、ステップS309で蓄積した対象物、動作状態、および関係語の組を用いて、対応図を出力する。かかる対応図出力処理について、図7のフローチャートを用いて、詳細に説明する。ステップS301に戻る。
【0078】
なお、図3のフローチャートのステップS309において、対象物と動作状態のみを取得しても良い。
【0079】
また、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0080】
次に、ステップS309の文処理について、図4のフローチャートを用いて、詳細に説明する。
【0081】
(ステップS401)文分割制御部115の要素分割手段1151は、カウンタjに1を代入する。
【0082】
(ステップS402)要素分割手段1151は、取得された処理単位(通常、一文)の中に、j番目の文字が存在するか否かを判断する。j番目の文字が存在すればステップS403に行き、j番目の文字が存在しなければステップS412に行く。
【0083】
(ステップS403)要素分割手段1151は、処理対象の文(処理単位)の中の、j番目の文字から(j+n)番目の文字までの文字列を取得し、バッファ上に置く。nは、固定の数であり、例えば、「5」である。なお、処理対象の文に、j番目の文字から(j+n)番目の文字まで存在しない場合、要素分割手段1151は、j番目の文字から文の最終文字までを取得し、バッファ上に置く。つまり、要素分割手段1151は、j番目の文字から(j+n)番目以下の文字までの文字列を取得し、バッファ上に置く。
【0084】
(ステップS404)要素分割手段1151は、ステップS403でバッファ上に配置した文字列を、辞書情報格納部111に検索しにいく。
【0085】
(ステップS405)要素分割手段1151は、ステップS404における検索結果において、ステップS403でバッファ上に配置した文字列が、辞書情報格納部111に存在するか否かを判断する。文字列が存在すればステップS410に行き、文字列が存在しなければステップS406に行く。なお、文字列が存在する場合とは、バッファ上に配置した文字列と一致する文字列が、辞書情報が有する第一文字列に存在する場合である。
【0086】
(ステップS406)要素分割手段1151は、ステップS403でバッファ上に配置した文字列の長さが、1文字であるか否かを判断する。1文字であればステップS408に行き、1文字でなければステップS407に行く。
【0087】
(ステップS407)要素分割手段1151は、ステップS403でバッファ上に配置した文字列から最後の文字を削除し、一文字少なくして、j番目から文字列を取得し、バッファ上に配置する。なお、要素分割手段1151は、単に、バッファ上の最終文字を消去するだけでも良い。ステップS404に戻る。
【0088】
(ステップS408)要素分割手段1151は、j番目の文字に未知語であることを示す情報である「未知語」フラグを付与する。「「未知語」フラグを付与する」とは、j番目の文字が他の文字または文字列と区別できれば良く、例えば、他の文字または文字列に何らかのフラグを付与し、未知語であるj番目の文字には、何も付与しなくても良い。さらに、未知語を格納するバッファがあり、そのバッファに未知語であるj番目の文字を書き込む処理も、「未知語」フラグを付与する処理とする。
【0089】
(ステップS409)要素分割手段1151は、カウンタjを1、インクリメントする。ステップS402に戻る。
【0090】
(ステップS410)要素分割手段1151は、バッファ上に配置した文字列と一致する第一文字列と対になる機能語、前接続記号、および後接続記号を、辞書情報格納部111から読み出し、メモリ上に配置する。
【0091】
(ステップS411)要素分割手段1151は、バッファ上に配置した文字列に対して、ステップS410で読み出した機能語、前接続記号、および後接続記号を付与する。
【0092】
(ステップS412)要素分割手段1151は、カウンタjに、「j+文字列の文字数」を代入する。ステップS402に戻る。なお、「文字列の文字数」の「文字列」は、バッファ上に配置した文字列である。
【0093】
(ステップS413)要素連結手段1152は、要素分割手段1151が分割した文字列のうち、連結が必要な文字列を連結する。かかる連結処理について、図5のフローチャートを用いて説明する。
【0094】
(ステップS414)対象物取得部116、動作状態取得部117、および関係語取得部118は、それぞれ必要な情報を取得する。かかる処理を情報取得処理という。情報取得処理について、図6のフローチャートを用いて説明する。
【0095】
なお、図4のフローチャートで説明した文処理により、1以上の情報セットが取得される。ここでの情報セットは、対象物と動作状態と関係語であるが、対象物と動作状態だけでも良い。
【0096】
また、図4のフローチャートにおいて、機能素解析の手法により情報セットを取得した。しかし、形態素解析等の技術を用いて、情報セットを取得してもよい。つまり、対象物取得部116は、処理単位(通常、一文)に対して、形態素解析を行い、かつ係り受け解析を行う。そして、対象物取得部116は、主語、または主語と目的語を取得する。また、動作状態取得部117は、述語を取得する。そして、関係語取得部118は、主語と述語をつなぐ助詞を関係語として取得する。さらに、関係語取得部118は、目的語と述語をつなぐ助詞を関係語として取得する。
【0097】
次に、ステップS413の連結処理について、図5のフローチャートを用いて説明する。
【0098】
(ステップS501)要素連結手段1152は、要素分割手段1151が未知語フラグ(未知語情報の一種)を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成する。また、要素連結手段1152は、要素分割手段1151が未知語フラグを付与した連続する未知語であり、ひらがなではない文字を連結し文字列を構成する。
【0099】
(ステップS502)要素連結手段1152は、ステップS501で連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与する。まとまり情報は、機能語の一種である。まとまり情報は、文字列に付与される未知語フラグでも良い。
【0100】
次に、ステップS414の情報取得処理について、図6のフローチャートを用いて説明する。
【0101】
(ステップS601)対象物取得部116は、カウンタiに1を代入する。
【0102】
(ステップS602)対象物取得部116は、処理対象の文中に、i番目のまとめられた文字列(1文字の場合もある)が存在するか否かを判断する。i番目の文字列が存在すればステップS603に行き、i番目の文字列が存在しなければ上位処理にリターンする。
【0103】
(ステップS603)対象物取得部116は、i番目の文字列の種類(未知語、対象物など)と、(i+1)番目の文字列の前接続記号を読み出す。そして、対象物取得部116は、i番目の文字列の種類と、(i+1)番目の文字列の前接続記号から、i番目の文字列と(i+1)番目の文字列が連結可能であるか否かを判断する。そして、i番目の文字列と(i+1)番目の文字列が連結可能である場合、対象物取得部116は、(i+1)番目の文字列の機能語または後接続記号から、i番目の文字列が主題または副題を構成するか否かを判断する。i番目の文字列が主題または副題を構成する場合はステップS604に行き、i番目の文字列が主題または副題を構成しない場合はステップS606に行く。
【0104】
(ステップS604)対象物取得部116は、i番目の文字列を対象物として取得し、対象物を格納するメモリの領域に書き込む。
【0105】
(ステップS605)関係語取得部118は、(i+1)番目の文字列を関係語として取得し、関係語を格納するメモリの領域に書き込む。
【0106】
(ステップS606)動作状態取得部117は、ステップS603で読み出されたi番目の文字列の後接続記号と、(i+1)番目の文字列の前接続記号から、i番目の文字列と(i+1)番目の文字列が連結可能であるか否かを判断する。そして、i番目の文字列と(i+1)番目の文字列が連結可能である場合、動作状態取得部117は、(i+1)番目の文字列の前接続記号または種類から、i番目の文字列が動作または状態を構成するか否かを判断する。i番目の文字列が動作または状態を構成する場合はステップS607に行き、i番目の文字列が動作または状態を構成しない場合はステップS608に行く。
【0107】
(ステップS607)動作状態取得部117は、i番目の文字列と(i+1)番目の文字列を合わせた文字列、またはi番目の文字列を、動作状態として取得し、動作状態を格納するメモリの領域に書き込む。
【0108】
(ステップS608)対象物取得部116は、カウンタiを、必要な数だけインクリメントする。必要な数とは、処理した文字列の数であり、通常、2である。ステップS602に戻る。
【0109】
次に、ステップS312の対応図出力処理について、図7のフローチャートを用いて、詳細に説明する。
【0110】
(ステップS701)対応図出力部119は、対象物を第一キー、動作状態を第二キー、関係語を第三キーとして、1以上(通常、2以上)の情報セットをソートする。なお、ソート処理は公知技術であるので、詳細な説明は省略する。
【0111】
(ステップS702)対応図出力部119は、初期化処理を行う。初期化処理とは、カウンタi、変数t、変数a、変数rに1を代入する処理である。カウンタiは情報セットのカウンタである、変数tは、同一の対象物を数える変数(対象物の出現回数を示す変数)である。変数aは、同一の動作状態を数える変数(動作状態の出現回数を示す変数)である。変数rは、同一の関係語を数える変数(関係語の出現回数を示す変数)である。
【0112】
(ステップS703)対応図出力部119は、i番目の情報セットが存在するか否かを判断する。i番目の情報セットが存在すればステップS704に行き、i番目の情報セットが存在しなければ上位処理にリターンする。
【0113】
(ステップS704)対応図出力部119は、i番目の情報セット中の対象物を取得し、メモリ上に配置する。
【0114】
(ステップS705)対応図出力部119は、i番目の情報セット中の対象物と(i−1)番目の情報セット中の対象物とを比較し、両者が同じであるか否かを判断する。両者が同じであればステップS706に行き、両者が同じでなければステップS710に行く。
【0115】
(ステップS706)対応図出力部119は、変数tに1を加える。
【0116】
(ステップS707)対応図出力部119は、i番目の情報セット中の動作状態を取得し、メモリ上に配置する。
【0117】
(ステップS708)対応図出力部119は、i番目の情報セット中の動作状態と(i−1)番目の情報セット中の動作状態とを比較し、両者が同じであるか否かを判断する。両者が同じであればステップS709に行き、両者が同じでなければステップS714に行く。
【0118】
(ステップS709)対応図出力部119は、変数aに1を加える。ステップS719に行く。
【0119】
(ステップS710)対応図出力部119は、変数tが1でないか否かを判断する。変数tが1でなければステップS711に行き、変数tが1であればステップS713に行く。なお、図において、「!=」は否定(NOT)を意味する。
【0120】
(ステップS711)対応図出力部119は、前の対象物(直前に出力した対象物)の出力に対応付けて、tの値(数値)を出力する。なお、ここで「対応付けて出力する」とは、tの値(数値)が、直前に出力した対象物の出現回数であることが分かるように、直前に出力した対象物の近く(例えば、閾値より小さい間隔しか空いていないところ)に出力することである。
【0121】
(ステップS712)対応図出力部119は、変数tに1を代入する。
【0122】
(ステップS713)対応図出力部119は、i番目の情報セット中の対象物を、他のノード(対象物または動作状態)と重ならない位置に出力する。なお、一の情報(文字列等)を、他の情報に重ならないように配置する技術は、公知技術であるので詳細な説明は省略する。また、対応図出力部119は、対象物を出力する場合、動作状態と視覚的に区別できる態様で対象物を出力することは好適である。つまり、対応図出力部119は、対象物のノードの背景色を青で出力し、動作状態のノードの背景色をピンクで出力することは好適である。その他、対応図出力部119は、対象物と動作状態のノードの形状を変えたり、文字色やフォントなどの文字属性を変えたりして出力することは好適である。
【0123】
(ステップS714)対応図出力部119は、変数aが1でないか否かを判断する。変数aが1でなければステップS715に行き、変数aが1であればステップS717に行く。
【0124】
(ステップS715)対応図出力部119は、前の動作状態(直前に出力した動作状態)の出力に対応付けて、aの値(数値)を出力する。なお、ここで「対応付けて出力する」とは、aの値(数値)が、直前に出力した動作状態の出現回数であることが分かるように、直前に出力した動作状態の近く(例えば、閾値より小さい間隔しか空いていないところ)に出力することである。
【0125】
(ステップS716)対応図出力部119は、変数aに1を代入する。
【0126】
(ステップS717)対応図出力部119は、i番目の情報セット中の動作状態を、他のノード(対象物または動作状態)と重ならない位置に出力する。
【0127】
(ステップS718)対応図出力部119は、既に出力したi番目の情報セット中の対象物とi番目の情報セット中の動作状態とを線で連結する。線は矢印でも良いし、実線でも破線でも一点鎖線などでも良い。つまり、線の属性(色なども含む)は問わない。対応図出力部119は、例えば、対象物から動作状態に向かう矢印の線を出力することは好適である。
【0128】
(ステップS719)対応図出力部119は、i番目の情報セット中の関係語を取得し、メモリ上に配置する。
【0129】
(ステップS720)対応図出力部119は、i番目の情報セット中の関係語と(i−1)番目の情報セット中の関係語とを比較し、両者が同じであるか否かを判断する。両者が同じであればステップS721に行き、両者が同じでなければステップS723に行く。
【0130】
(ステップS721)対応図出力部119は、変数rに1を加える。
【0131】
(ステップS722)対応図出力部119は、カウンタiを1、インクリメントする。ステップS703に戻る。
【0132】
(ステップS723)対応図出力部119は、変数rが1でないか否かを判断する。変数rが1でなければステップS724に行き、変数rが1であればステップS726に行く。
【0133】
(ステップS724)対応図出力部119は、前の関係語(直前に出力した関係語)の出力に対応付けて、rの値(数値)を出力する。なお、ここで「対応付けて出力する」とは、rの値(数値)が、直前に出力した関係語の出現回数であることが分かるように、直前に出力した関係語の近く(例えば、閾値より小さい間隔しか離れていないところ)に出力することである。また、ここで「対応付けて出力する」とは、rの値(数値)が、直前に出力した関係語の出現回数であることが分かるように、関係語に対応する線の直上、または直下などに出力することである。
【0134】
(ステップS725)対応図出力部119は、変数rに1を代入する。
【0135】
(ステップS726)対応図出力部119は、i番目の情報セット中の関係語を、他のノード(対象物または動作状態)と重ならない位置に出力する。なお、一の情報(文字列等)を、他の情報に重ならないように配置する技術は、公知技術であるので詳細な説明は省略する。
【0136】
以下、本実施の形態における情報処理システム1の具体的な動作について説明する。情報処理システム1の概念図は図1である。
【0137】
今、文章群格納部110は、いわゆるブログ、電子メール、SNS、Voip、メタバース、IMなどの情報である文章群を、1種以上、格納している。また、ブログは、1以上の人が作成したブログであり、2以上の図示しないWeb上のサーバ装置(文章群格納装置12)に格納されていても良い。また、文章群格納部110が格納している文章群の一種のブログの例を、図8に示す。
【0138】
図8のブログ(ウェブページ)は、文章群受信部112が、2以上の文章群格納装置12から受信したウェブページと、その識別子(URL)である。ウェブページは文章群、URLは識別情報である。
【0139】
また、辞書情報格納部111は、図9に示す辞書情報管理表を格納している。辞書情報管理表は、「第一文字列」「前接続記号」「後接続記号」「機能語情報」の属性を有するレコードを1以上格納している。
【0140】
図9の「前接続記号」の「−&」は、前に、未知語情報で識別される未知語や、「object」で識別される対象物などが連結されることを示す。「前接続記号」は、他にも「&&」などがあり、「&&」は、前に、「名前」や、未知語や、「object」で識別される対象物などが連結されることを示す。「名前」とは、登録している人や物などの名前である。
【0141】
また、「後接続記号」の「s%」は、区切りになり得て、「副題」となり得ることを示す。また、「後接続記号」の「&&」は、後に、「名前」や、未知語情報で識別される未知語や、「object」で識別される対象物などが連結されることを示す。また、「後接続記号」の「m%」は、区切りになり得て、「主題」となり得ることを示す。また、「後接続記号」の「n%」は、区切りになり得て、「主題」となり得ることを示す。「m%」と「n%」は、両方とも「主題」となり得るが、「m%」の方が主題になる優先度は高い、ことを意味する。また、「後接続記号」の「−−」は、「action」で識別される文字列が連結されることを示す。また、「後接続記号」の「%=」は、区切りになり得て、かつ、「object」で識別される対象物や「名前」などが連結されることを示す。また、「後接続記号」の「o%」は、区切りになり得て、「準主題(または副題)」となり得ることを示す。また、「後接続記号」の「%%」は、強制的な区切りであることを示す。
【0142】
また、「機能語情報」の「object」は、対象物を示す。また、「機能語情報」の「action」は、動作を示す。さらに、「機能語情報」の「state」は、状態を示す。
【0143】
かかる状況において、ユーザは、対応図を出力する指示「対応図出力 http://www.お店紹介.co.jp/」を入力した、とする。つまり、ユーザは、ブログ「http://www.お店紹介.co.jp/」の文脈を可視化して、ブログの内容を感覚的に掴みたいと思い、指示「対応図出力 http://www.お店紹介.co.jp/」を入力した、とする。
【0144】
次に、受付部114は、対応図出力指示「対応図出力 http://www.お店紹介.co.jp/」を受け付ける。そして、文分割制御部115は、対応図出力指示に対応する文章群「http://www.お店紹介.co.jp/」(図8のID=1の文章群)を文章群格納部110から読み出す。
【0145】
文分割制御部115は、文章群「http://www.お店紹介.co.jp/」のHTML文書から、ユーザが記載した文の集合を取得する。つまり、ここでは、文分割制御部115は、予め決められた情報「<div class=ebody」(この情報を、解析対象の文を抽出するための抽出情報、という)を用いて、当該抽出情報で特定される1以上の文「店舗Xは、おしゃれだ。店舗Xが、テレビで評判だ。・・・店舗Xは、おいしいんだ。ラーメンが好き。」を、URL「http://www.お店紹介.co.jp/」の文章群から抽出する。
【0146】
次に、文分割制御部115等は、1以上の文「店舗Xは、おしゃれだ。店舗Xが、テレビで評判だ。・・・店舗Xは、おいしいんだ。ラーメンが好き。」から、以下のように、対象物、動作状態、および関係語を取得の組である情報セットを、1以上取得する。かかる情報セットの取得までの自然言語処理の例を、図10の文の処理経過を示す図を用いて説明する。
【0147】
つまり、文分割制御部115の要素分割手段1151は、解析対象の文章群の中の1番目の文「店舗Xは、おしゃれだ。」を取得する。そして、要素分割手段1151は、以下のように、読み出した各文を分割する。まず、要素分割手段1151は、文「店舗Xは、おしゃれだ。」に対して、以下の分割処理を行う。要素分割手段1151は、文「店舗Xは、おしゃれだ。」の中の、1番目の文字から6番目(上記の「n」は「5」である)の文字までの文字列「店舗Xは、お」を取得し、バッファ上に置く(図10の(1))。
【0148】
そして、要素分割手段1151は、文字列「店舗Xは、お」を、辞書情報格納部111に検索しにいく。しかし、文字列「店舗Xは、お」に合致する第一文字列が、図9の辞書情報管理表に存在しないので、要素分割手段1151は、先の文字列より1文字少ない文字列「店舗Xは、」を構成する。そして、要素分割手段1151は、文字列「店舗Xは、」をバッファ上に置く(図10の(2))。そして、同様に、要素分割手段1151は、文字列「店舗Xは、」を、辞書情報格納部111に検索しにいく。しかし、文字列「店舗Xは、」に合致する第一文字列が、図9の辞書情報管理表に存在しないので、要素分割手段1151は、先の文字列より1文字少ない文字列「店舗Xは」を構成し、バッファ上に置く(図10の(3))。そして、要素分割手段1151は、文字列「店舗Xは」を、辞書情報格納部111に検索しにいく。同様に、文字列「店舗Xは」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納部111に検索しにいく(図10の(4)から(6))。そして、要素分割手段1151は、最後の文字「店」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「店」に、未知語であることを示す情報である「未知語」フラグを付与する(図10の(7))。なお、ここでの「未知語」フラグは、情報「未知語」である。
【0149】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、2番目の文字から6文字分の文字列「舗Xは、おし」を読み出し、バッファに配置する(図10の(8))。そして、同様に、要素分割手段1151は、文字列「舗Xは、おし」を、辞書情報格納部111に検索しにいく。同様に、文字列「舗Xは、おし」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納部111に検索しにいく(図10の(9)から(13))。そして、要素分割手段1151は、最後の文字「舗」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「舗」に、未知語であることを示す情報である「未知語」フラグを付与する(図10の(14))。
【0150】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、3番目の文字から6文字分の文字列「Xは、おしゃ」を読み出し、バッファに配置する(図10の(15))。そして、同様に、要素分割手段1151は、文字列「Xは、おしゃ」を、辞書情報格納部111に検索しにいく。同様に、文字列「Xは、おしゃ」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納部111に検索しにいく(図10の(9)から(13))。そして、要素分割手段1151は、最後の文字「X」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「X」に、未知語であることを示す情報である「未知語」フラグを付与する(図10の(21))。
【0151】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、4番目の文字から6文字分の文字列「は、おしゃれ」を読み出し、バッファに配置する(図10の(22))。同様に、文字列「は、おしゃれ」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納部111に検索しにいく(図10の(23)から(27))。そして、要素分割手段1151は、最後の文字「は」は図9の辞書情報管理表に存在する、と判断する。そして、要素分割手段1151は、バッファ上に配置した文字列と一致する第一文字列「は」と対になる前接続記号「−&」、後接続記号「m%」、および機能語情報「object」を、辞書情報格納部111から読み出し、メモリ上に配置する。そして、要素分割手段1151は、バッファ上に配置した文字列「は」に対して、読み出した前接続記号「−&」、後接続記号「m%」、および機能語情報「object」を付与する(図10の(28))。
【0152】
以上の処理を繰り返し、処理対象の文「店舗Xは、おしゃれだ。」について、図10の(X)のようなデータを得る。つまり、「店」「舗」「X」「お」「し」「ゃ」「れ」に対して、「未知語」が付与される。また、「は」に対して、「−&:m%:object」が付与される。また、「、」「。」に対して、「:%%:」が付与される。「:%%:」は、後接続記号が「%%」であることを示す。後接続記号「%%」は、無条件に、後ろが区切られることを示す。さらに、「だ」に対して、「−&:%−:state」が付与される(図10の(X))。
【0153】
次に、要素連結手段1152は、要素分割手段1151が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなではない文字「店」「舗」「X」を連結し文字列「店舗X」を構成する。また、要素連結手段1152は、要素分割手段1151が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなの連続する文字「お」「し」「ゃ」「れ」を連結した文字列「おしゃれ」を構成する。そして、要素連結手段1152は、連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報(ここでは、「未知語」)を付与し、バッファに書き込む。バッファ内の情報は、図10の(X+1)である。
【0154】
次に、対象物取得部116は、1番目の文字列「店舗X」の種類「未知語」と、2番目の文字列「は」の前接続記号「−&」を読み出す。そして、対象物取得部116は、1番目の文字列「店舗X」の種類「未知語」と、2番目の文字列「は」の前接続記号「−&」から、1番目の文字列と2番目の文字列が連結可能である、と判断する。次に、対象物取得部116は、2番目の文字列「は」の機能語情報「object」または後接続記号「m%」から、1番目の文字列「店舗X」が「主題」を構成する、と決定する(図10の(X+2)参照)。
【0155】
次に、対象物取得部116は、1番目の文字列「店舗X」を対象物として取得し、対象物を格納するメモリの領域に書き込む。
【0156】
次に、関係語取得部118は、2番目の文字列「は」を関係語として取得し、関係語を格納するメモリの領域に書き込む。
【0157】
次に、動作状態取得部117は、3番目の文字列「、」を取得し、かかる文字列「、」は、「%%」から動作状態でも、主題でも、副題でもない、と判断する。
【0158】
次に、動作状態取得部117は、4番目の文字列「おしゃれ」を取得し、かかる文字列「おしゃれ」は、5番目の文字列「だ」に対応する機能語情報「state」または後接続記号「%−」から、4番目の文字列「おしゃれ」を「状態」を構成する用語であると、判断する。そして、動作状態取得部117は、4番目の文字列「おしゃれ」と5番目の文字列「だ」を合わせた文字列「おしゃれだ」を、動作状態として取得し、動作状態を格納するメモリの領域に書き込む。
【0159】
以上の一文の処理により、図11の情報セット管理表の「ID=1」のレコードを得る。情報セット管理表は、「ID」「対象物」「動作状態」「機能語」を有する情報セットを1以上格納している、
【0160】
次に、文分割制御部115の要素分割手段1151は、解析対象の文章群の中の2番目の文「店舗Xが、テレビで評判だ。」を取得する。そして、要素分割手段1151は、以下のように、読み出した各文を分割する。まず、要素分割手段1151は、文「店舗Xが、テレビで評判だ。」に対して、以下の分割処理を行う。つまり、要素分割手段1151は、文「店舗Xが、テレビで評判だ。」の中の、1番目の文字から6番目(上記の「n」は「5」である)の文字までの文字列「店舗Xが、テ」を取得し、バッファ上に置く(図12の(1))。
【0161】
そして、要素分割手段1151は、文字列「店舗Xが、テ」を、辞書情報格納部111に検索しにいく。しかし、文字列「店舗Xが、テ」に合致する第一文字列が、図9の辞書情報管理表に存在しないので、要素分割手段1151は、先の文字列より1文字少ない文字列「店舗Xが、」を構成する。そして、要素分割手段1151は、文字列「店舗Xが、」をバッファ上に置く(図12の(2))。そして、同様に、要素分割手段1151は、文字列「店舗Xが、」を、辞書情報格納部111に検索しにいく。しかし、文字列「店舗Xが、」に合致する第一文字列が、図9の辞書情報管理表に存在しないので、要素分割手段1151は、先の文字列より1文字少ない文字列「店舗Xが」を構成し、バッファ上に置く(図12の(3))。そして、要素分割手段1151は、文字列「店舗Xが」を、辞書情報管理表に検索しにいく。同様に、文字列「店舗Xが」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報管理表に検索しにいく(図12の(4)から(6))。そして、要素分割手段1151は、最後の文字「店」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「店」に、未知語であることを示す情報である「未知語」フラグを付与する(図12の(7))。なお、ここでの「未知語」フラグは、情報「未知語」である。
【0162】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、2番目の文字から6文字分の文字列「舗Xが、テレ」を読み出し、バッファに配置する(図12の(8))。そして、同様に、要素分割手段1151は、文字列「舗Xが、テレ」を、辞書情報管理表に検索しにいく。同様に、文字列「舗Xが、テレ」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報管理表に検索しにいく(図12の(9)から(13))。そして、要素分割手段1151は、最後の文字「舗」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「舗」に、未知語であることを示す情報である「未知語」フラグを付与する(図12の(14))。
【0163】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、3番目の文字から6文字分の文字列「Xが、テレビ」を読み出し、バッファに配置する(図12の(15))。そして、同様に、要素分割手段1151は、文字列「Xが、テレビ」を、辞書情報管理表に検索しにいく。同様に、文字列「Xが、テレビ」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報管理表に検索しにいく(図12の(9)から(13))。そして、要素分割手段1151は、最後の文字「X」も図9の辞書情報管理表に存在しない、と判断する。そして、要素分割手段1151は、文字「X」に、未知語であることを示す情報である「未知語」フラグを付与する(図12の(21))。
【0164】
次に、要素分割手段1151は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段1151は、4番目の文字から6文字分の文字列「が、テレビで」を読み出し、バッファに配置する(図12の(22))。同様に、文字列「が、テレビで」に合致する第一文字列が、図9の辞書情報管理表に存在しない。そして、要素分割手段1151は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報管理表に検索しにいく(図12の(23)から(27))。そして、要素分割手段1151は、最後の文字「が」は図9の辞書情報管理表に存在する、と判断する。そして、要素分割手段1151は、バッファ上に配置した文字列と一致する第一文字列「が」と対になる前接続記号「−&」、後接続記号「n%」、および機能語情報「object」を、辞書情報管理表から読み出し、メモリ上に配置する。そして、要素分割手段1151は、バッファ上に配置した文字列「が」に対して、読み出した前接続記号「−&」、後接続記号「n%」、および機能語情報「object」を付与する(図12の(28))。
【0165】
以上の処理を繰り返し、処理対象の文「店舗Xが、テレビで評判だ。」について、図12の(X)のようなデータを得る。つまり、「店」「舗」「X」「テ」「レ」「ビ」「評」「判」に対して、「未知語」が付与される。また、「が」に対して、「−&:n%:object」が付与される。また、「、」「。」に対して、「:%%:」が付与される。また、「で」に対して、「−&:s%:object」が付与される。さらに、「だ」に対して、「−&:%−:state」が付与される(図12の(X))。
【0166】
次に、要素連結手段1152は、要素分割手段1151が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなではない文字「店」「舗」「X」を連結し文字列「店舗X」を構成する。また、要素連結手段1152は、要素分割手段1151が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなではない文字「テ」「レ」「ビ」を連結し文字列「テレビ」を構成する。また、要素連結手段1152は、要素分割手段1151が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなではない文字「評」「判」を連結し文字列「評判」を構成する。そして、要素連結手段1152は、連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報(ここでは、「未知語」)を付与し、バッファに書き込む。バッファ内の情報は、図12の(X+1)である。
【0167】
次に、対象物取得部116は、1番目の文字列「店舗X」の種類「未知語」と、2番目の文字列「が」の前接続記号「−&」を読み出す。そして、対象物取得部116は、1番目の文字列「店舗X」の種類「未知語」と、2番目の文字列「が」の前接続記号「−&」から、1番目の文字列と2番目の文字列が連結可能である、と判断する。次に、対象物取得部116は、2番目の文字列「が」の機能語情報「object」または後接続記号「n%」から、1番目の文字列「店舗X」が「主題」を構成する、と決定する(図12の(X+2)参照)。
【0168】
次に、対象物取得部116は、1番目の文字列「店舗X」を対象物として取得し、対象物を格納するメモリの領域に書き込む。
【0169】
次に、関係語取得部118は、2番目の文字列「が」を関係語として取得し、関係語を格納するメモリの領域に書き込む。
【0170】
次に、動作状態取得部117は、3番目の文字列「、」を取得し、かかる文字列「、」は、「%%」から動作状態でも、主題でも、副題でもない、と判断する。
【0171】
次に、対象物取得部116は、4番目の文字列「テレビ」の種類「未知語」と、5番目の文字列「で」の前接続記号「−&」を読み出す。そして、対象物取得部116は、4番目の文字列「テレビ」の種類「未知語」と、5番目の文字列「で」の前接続記号「−&」から、4番目の文字列と5番目の文字列が連結可能である、と判断する。次に、対象物取得部116は、5番目の文字列「で」の機能語情報「object」または後接続記号「s%」から、4番目の文字列「テレビ」が「副題」を構成する、と決定する(図12の(X+2)参照)。
【0172】
次に、対象物取得部116は、4番目の文字列「テレビ」を対象物として取得し、対象物を格納するメモリの領域に書き込む。
【0173】
次に、関係語取得部118は、5番目の文字列「で」を関係語として取得し、関係語を格納するメモリの領域に書き込む。
【0174】
次に、動作状態取得部117は、6番目の文字列「評判」を取得し、かかる文字列「評判」は、7番目の文字列「だ」に対応する機能語情報「state」または後接続記号「%−」から、6番目の文字列「評判」を「状態」を構成する用語であると、判断する。そして、動作状態取得部117は、6番目の文字列「評判」を、動作状態として取得し、動作状態を格納するメモリの領域に書き込む。なお、ここで、動作状態取得部117は、取得した動作状態が漢字列である場合は、次の機能語と合成せず、取得した動作状態がひらがな列である場合は、次の機能語と合成する、とする。ただし、動作状態取得部117は、常に動作状態を次の機能語と合成しても良いし、常に動作状態を次の機能語と合成しなくても良い。また、動作状態取得部117は、文字列「評判」を、対象物「店舗X」「テレビ」の両方に対応する動作状態とする。
【0175】
以上の一文の処理により、図11の情報セット管理表の「ID=2」「ID=3」のレコードを得る。
【0176】
同様に、文分割制御部115、対象物取得部116、動作状態取得部117、および関係語取得部118が、3文目以降のすべての文の処理を行い、図11の情報セット管理表を得た、とする。
【0177】
次に、対応図出力部119は、以下のように対応図出力処理を行う。つまり、まず、対応図出力部119は、対象物を第一キー、動作状態を第二キー、関係語を第三キーとして、図11の情報セット管理表をソートする。そして、対応図出力部119は、例えば、図13の情報セット管理表を得た、とする。
【0178】
次に、対応図出力部119は、図7のフローチャートに従い、情報セット管理表の「ID=1」のレコードから順に処理を行い、対象物および動作状態をノードとし出力する。そして、対応図出力部119は、両ノードを接続する矢印を出力する。さらに、対応図出力部119は、矢印の近傍(ここでは、上であり、中央あたり)に、関係語を出力する。なお、対応図出力部119が対象物であるノードを出力する場合、楕円で囲む。また、対応図出力部119が動作状態であるノードを出力する場合、網掛けの背景を有する楕円で囲む。
【0179】
そして、例えば、対応図出力部119は、「ID=3」のレコードを出力した場合、図14に示す出力を得る。
【0180】
また、例えば、対応図出力部119は、「ID=3、15、16、17、89」のレコードを出力した場合、図15に示す出力を得る。つまり、情報セット管理表において、同一のノード(対象物、動作状態)が複数回出現する場合でも、ノードの出力は一回のみである。また、図15に示すように、対応図出力部119は、出現回数をノードの近くに数値で出力する。
【0181】
以上、本実施の形態によれば、文章群を自然言語処理し、対象物と動作状態語とを取り出し、当該対象物と動作状態語との対応を示す対応図を出力できる。
【0182】
また、本実施の形態によれば、対応図の出力により、ブログ等の文章群の文脈を可視化でき、ユーザは、ブログ等の文章群の文脈を容易に把握できる。
【0183】
なお、本実施の形態の具体例によれば、図15に示すような対応図を出力した。しかし、対応図は、出現回数の数値を出力しないでも良い。かかる場合の出力図の例は図16である。さらに、対応図は、図11や図13に示す表でも良い。さらに、図11や図13に示す表や、図15や図16に示すような対応図において、関係語(機能語)を出力しなくても良い。
【0184】
また、本実施の形態の具体例によれば、対応図の元になる文章群は一種類および一つであった。しかし、対応図の元になる文章群は2以上でも良い。また、対応図の元になる文章群はブログとチャットの文章群など、複数種類でも良い。図8で言えば、情報出力装置11は、「ID=1」「ID=2」の2つの文章群から対応図を構成しても良い。
【0185】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報出力装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、記憶媒体に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記記憶媒体に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部として機能させるためのプログラム、である。
【0186】
また、上記プログラムにおいて、コンピュータを、前記対応図出力部は、前記対象物と、当該対象物に対応する動作状態とを、線で結ぶ態様で出力するものとして機能させるためのプログラム、であることは好適である。
【0187】
また、上記プログラムにおいて、前記記憶媒体に格納されている文章群に含まれる文から、前記対象物と、当該対象物に対応する動作状態とをつなぐ非自立語である関係語を取得する関係語取得部としてさらに機能させ、前記対応図出力部は、前記対象物と当該対象物に対応する動作状態とを線で結ぶ態様で出力し、かつ当該線に対応付くように、前記関係語を出力するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0188】
また、上記プログラムにおいて、対応図の元になる1以上の文章群から、前記対象物取得部が取得した対象物が複数存在する場合、または、前記動作状態取得部が取得した動作状態が複数存在する場合、前記対応図出力部は、前記複数の対象物、または前記複数の動作状態を一つにした対応図であり、前記対象物と前記動作状態とを対応付けた図である対応図を出力するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0189】
また、上記プログラムにおいて、前記対応図出力部は、前記対象物、または前記動作状態に対応付けて、前記対象物の出現回数、または前記動作状態の出現回数をも出力するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0190】
また、上記プログラムにおいて、前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、前記対象物取得部は、前記文分割制御部が取得した第二文字列の種類から対象物を含む第二文字列を特定し、当該第二文字列から対象物を取得し、前記動作状態取得部は、前記対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて動作状態を含み得る第二文字列を特定し、当該第二文字列が有する動作状態を取得するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0191】
また、上記プログラムにおいて、前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、前記関係語取得部は、前記文分割制御部が取得した前記第二文字列と前記第二文字列の種類を特定する情報を用いて、前記対象物と、当該対象物に対応する動作状態とをつなぐ機能語である関係語を取得するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0192】
さらに、上記プログラムにおいて、前記対応図出力部は、前記対象物と前記動作状態とを、視覚的に区別可能なように出力するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
【0193】
(実施の形態2)
【0194】
本実施の形態において、ブログを含む個人が作成した文の集合である文章群を自然言語処理し、対象物(例えば、名詞)と動作状態(例えば、形容詞または名詞)とを取り出し、図的にそれらの対応を出力する情報処理システムについて説明する。また、本実施の形態において、例えば、ユーザが指定した特定対象物と所定の位置関係(通常、文章群中の近くの文)に出現する対象物とをも対応付けた対応図を出力する情報処理システムについて説明する。また、本実施の形態において、対象物と動作状態との対応付けとは、視覚的に異なる対応付けの方法で、特定対象物と対象物とを対応付ける情報処理システムについて説明する。さらに、2以上の時期が異なる対応図を比較して出力したり、それらの差異を出力したりする情報処理システムについて説明する。図1は、本実施の形態における情報処理システム2の概念図である。
【0195】
図17は、本実施の形態における情報処理システム2のブロック図である。情報処理システム2は、情報出力装置21、文章群格納装置12を具備する。
【0196】
情報出力装置21は、文章群格納部110、辞書情報格納部111、文章群受信部112、文章群蓄積部113、受付部214、文分割制御部115、対象物取得部116、動作状態取得部117、関係語取得部118、対応図出力部219、特定対象物格納部211、対応図格納部212、関連対象物取得部212、対応情報取得部213を具備する。
【0197】
受付部214は、1以上の特定対象物を受け付ける。特定対象物とは、特定の対象物であり、通常、ユーザが着目したい対象物である。また、受付部214は、対応図履歴出力指示や特徴情報出力指示などの指示も受け付ける。対応図履歴出力指示は、後述する過去対応図と新対応図とを出力する指示である。対応図履歴出力指示は、例えば、過去対応図の時期を示す情報を含む。また、対応図履歴出力指示は、例えば、デフォルトで、前の世代の対応図(蓄積されている対応図の中の最新の対応図)と現在の対応図を出力する指示でも良い。また、対応図履歴出力指示は、例えば、デフォルトで、所定期間前(例えば、1ヶ月前)の対応図と現在の対応図を出力する指示でも良い。特徴情報出力指示とは、後述する特徴情報出力処理を行う指示であり、過去対応図と新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で新対応図を出力する指示である。特徴情報出力指示とは、例えば、過去対応図の時期を示す情報を含む。また、特徴情報出力指示とは、例えば、デフォルトで、所定期間前(例えば、1ヶ月前)の対応図と現在の対応図とを比較する指示でも良い。特定対象物等の入力手段は、キーボードやマウスやテンキーやメニュー画面によるもの等、何でも良い。受付部214は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。なお、受付部214は、ユーザから他の各種指示やデータの入力なども受け付ける。
【0198】
対応図出力部219は、対応図を出力する。ここでの対応図は、対象物と動作状態とを対応付けた図であり、かつ、関連対象物と特定対象物とを対応付けた図である。対応図出力部219は、後述する対応情報を用いて、関連対象物と特定対象物とを対応付けた対応図を出力する。また、対応図出力部219は、対象物と動作状態とを線で結ぶ態様で出力し、かつ、関連対象物と特定対象物とを線で結ぶ態様で出力することは好適である。また、対応図出力部219は、対象物と動作状態とを結ぶ線の属性値と関連対象物と特定対象物とを結ぶ線の属性値とが異なるように出力することは好適である。ここで、線の属性値が異なるとは、線種、線の色、線の太さ、矢印の属性(形、大きさなど)などが異なることである。また、対応図出力部219は、過去対応図と、新対応図の両方を出力することは好適である。過去対応図と、新対応図の両方を出力する処理を対応図履歴出力処理という。過去対応図とは、過去に作成された文章群から構成された対応図である。新対応図とは、過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力することは好適である。対応する時刻とは、通常、文章群が作成された時刻であるが、対応図が作成された時刻でも良い。対応図出力部219は、過去対応図と新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で新対応図を出力する(かかる処理を特徴情報出力処理という)。ここで、両対応図とは、表示される対応図の元になる情報も含む。また、予め決められた差異とは、例えば、新たに出現したこと、出現回数が2倍以上になった対象物および動作状態などである。予め決められた差異よりも大きい情報とは、新しく出現した対象物、出現回数が以前と比較して所定以上に増えている対象物、出現回数が以前と比較して所定以上に増えている動作状態などである。また、対応図出力部219は、対応図を表示するとともに、対応図出力部219が有する記録媒体または図示しない記録媒体に蓄積することは好適である。対応図出力部219は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。対応図出力部219は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0199】
特定対象物格納部211は、1以上の特定対象物を格納し得る。特定対象物格納部211は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。特定対象物格納部211に特定対象物が記憶される過程は問わない。例えば、記録媒体を介して特定対象物が特定対象物格納部211で記憶されるようになってもよく、通信回線等を介して送信された特定対象物が特定対象物格納部211で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された特定対象物が特定対象物格納部211で記憶されるようになってもよい。
【0200】
対応図格納部212は、1以上の過去対応図を格納し得る。過去対応図とは、表示される対応図の元になる情報も含む趣旨である。対応図格納部212は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。対応図格納部212に過去対応図が記憶される過程は問わない。例えば、記録媒体を介して過去対応図が対応図格納部212で記憶されるようになってもよく、通信回線等を介して送信された過去対応図が対応図格納部212で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された過去対応図が対応図格納部212で記憶されるようになってもよい。
【0201】
関連対象物取得部212は、関連対象物を取得する。関連対象物とは、特定対象物が出現する文章群の中の1以上の文であり、特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である。予め決められた位置関係とは、例えば、特定対象物が出現する文の直後の3文などである。また、予め決められた位置関係とは、例えば、特定対象物が出現する文の前1文および後2文などである。さらに、予め決められた位置関係とは、特定対象物が出現する文が含まれる段落や、特定対象物が出現する文が含まれる段落および次の段落である。その他、予め決められた位置関係は問わない。関連対象物取得部212は、通常、MPUやメモリ等から実現され得る。関連対象物取得部212の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0202】
対応情報取得部213は、関連対象物と特定対象物とを対応付ける情報である対応情報を取得する。なお、ここで、「関連対象物と特定対象物とを対応付ける」とは、関連対象物と特定対象物の一方の情報から、他方の情報を取得できればよいという意味である。したがって、対応情報は、関連対象物と特定対象物とを組として含む情報を有してもよく、関連対象物と特定対象物とをリンク付ける情報であってもよい。後者の場合には、対応情報は、例えば、関連対象物と特定対象物の格納されている位置を示すポインタやアドレスとを対応付ける情報であってもよい。また、関連対象物と特定対象物とは、直接対応付けられていなくてもよい。例えば、関連対象物に、第3の情報が対応しており、その第3の情報に特定対象物が対応していてもよい。対応情報取得部213は、通常、MPUやメモリ等から実現され得る。対応情報取得部213の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0203】
次に、情報処理システム2の動作について説明する。まず、図18のフローチャートを用いて、情報出力装置21の動作について説明する。図18のフローチャートにおいて、図3のフローチャートと同様のステップについて、説明を省略する。
【0204】
(ステップS1801)受付部214は、1以上の特定対象物を有する対応図出力指示を受け付けたか否かを判断する。対応図出力指示を受け付ければステップS1802に行き、対応図出力指示を受け付けなければステップS1805に行く。なお、特定対象物を有する対応図出力指示を受け付けることは、特定対象物を受け付けることでもある。
【0205】
(ステップS1802)文分割制御部115は、ステップS1801で受け付けた対応図出力指示が有する1以上の特定対象物のいずれかを含む文章群を文章群格納部110から読み出す。
【0206】
(ステップS1803)対応情報取得部213は、対応情報を取得する。対応情報取得処理について図19のフローチャートを用いて、詳細に説明する。
【0207】
(ステップS1804)対応図出力部219は、対応図を出力する。かかる対応図出力処理について、図20のフローチャートを用いて、詳細に説明する。ステップS301に戻る。また、対応図出力部219は、表示した対応図を、時刻情報と対に蓄積することは好適である。時刻情報とは、対応図を表示した時刻を示す情報でも良いし、対応図の元になった文章群の作成日などでも良い。文章群が複数存在する場合、その中の最新の作成日でも、平均的な作成日でも、最も古い作成日でも良い。
【0208】
(ステップS1805)受付部214は、対応図履歴出力指示を受け付けたか否かを判断する。対応図履歴出力指示を受け付ければステップS1806に行き、対応図履歴出力指示を受け付けなければステップS1807に行く。
【0209】
(ステップS1806)対応図出力部219等は、対応図履歴出力処理を行う。対応図履歴出力処理について、図21のフローチャートを用いて、詳細に説明する。ステップS301に戻る。
【0210】
(ステップS1807)受付部214は、特徴情報出力指示を受け付けたか否かを判断する。特徴情報出力指示を受け付ければステップS1808に行き、特徴情報出力指示を受け付けなければステップS301に戻る。
【0211】
(ステップS1808)対応図出力部219等は、特徴情報出力処理を行う。特徴情報出力処理について、図22のフローチャートを用いて、詳細に説明する。ステップS301に戻る。
【0212】
なお、図18のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0213】
次に、ステップS1803の対応情報取得処理について図19のフローチャートを用いて、詳細に説明する。
【0214】
(ステップS1901)関連対象物取得部212は、直前に取得された1以上の対象物のいずれかが特定対象物であるか否かを判断する。特定対象物であればステップS1902に行き、特定対象物でなければステップS1904に行く。
【0215】
(ステップS1902)関連対象物取得部212は、当該特定対象物をバッファに一時格納する。
【0216】
(ステップS1903)関連対象物取得部212は、カウンタnに2を代入する。なお、このnの値(ここでは「2」)は、関連対象物を取得するために検査する文の数であり、特定対象物が表れた文の後の文のうち、何文を検査するかを示す数である。「n=2」である場合、関連対象物取得部212は、特定対象物が表れた文の直後2文から、関連対象物を取得する。上位処理にリターンする。
【0217】
(ステップS1904)関連対象物取得部212は、「n!=0」であるか否かを判断する。「n!=0」であればステップS1905に行き、「n!=0」でなければ上位処理にリターンする。なお、「!=」は、一致しない、ことを言う。
【0218】
(ステップS1905)関連対象物取得部212は、直前に取得された1以上の対象物のいずれも、またはいずれかを関連対象物として取得する。2以上の対象物のいずれかを関連対象物として取得する場合、関連対象物取得部212は、例えば、主語となる一名詞のみを取得する。
【0219】
(ステップS1906)対応情報取得部213は、バッファ上の特定対象物、およびステップS1905で取得された1以上の関連対象物を用いて、1以上の対応情報を取得する。なお、特定対象物が「A」、関連対象物が「B,C」である場合、例えば、対応情報は、(A,B)と(A,C)である。
【0220】
(ステップS1907)対応情報取得部213は、ステップS1906で取得した1以上の対応情報を蓄積する。
【0221】
(ステップS1908)関連対象物取得部212は、カウンタnを1、デクリメントする。上位処理にリターンする。
【0222】
なお、図19のフローチャートにおいて、nの値は問わない。また、関連対象物取得部212は、特定対象物が出現する文の前の文から、関連対象物を取得してもよい。
【0223】
次に、ステップS1804の対応図出力処理について、図20のフローチャートを用いて、詳細に説明する。
【0224】
(ステップS2001)対応図出力部219は、図7を用いて説明した対応図出力処理を行う。
【0225】
(ステップS2002)対応図出力部219は、特定対象物を第一キー、関連対象物を第二キーとして、対象情報をソートする。
【0226】
(ステップS2003)対応図出力部219は、初期化処理を行う。初期化処理とは、カウンタiに1、変数tに1を代入する処理である。
【0227】
(ステップS2004)対応図出力部219は、ステップS1803で取得された対象情報中に、i番目の対象情報が存在するか否かを判断する。i番目の対象情報が存在すればステップS2005に行き、i番目の対象情報が存在しなければ上位処理にリターンする。
【0228】
(ステップS2005)対応図出力部219は、i番目の対象情報から特定対象物と関連対象物を取得する。
【0229】
(ステップS2006)対応図出力部219は、i番目の対象情報と(i+1)番目の対象情報とが同じであるか否かを判断する。両者が同じであればステップS2007に行き、同じでなければステップS2009に行く。
【0230】
(ステップS2007)対応図出力部219は、変数tに1を加える。
【0231】
(ステップS2008)対応図出力部219は、カウンタiを1、インクリメントする。ステップS2004に戻る。
【0232】
(ステップS2009)対応図出力部219は、変数tの値に対応したリンクであり、特定対象物と関連対象物とを接続するリンクを出力する。リンクとは、例えば、線や、矢印などである。また、変数tの値に対応したリンクとは、例えば、変数tの値と同じ太さを有する破線である。なお、対応図出力部219は、特定対象物と関連対象物との対応を示すことができればよく、その出力は、両者を線で結ぶことに限らないことは言うまでもない。ステップS2008に行く。
【0233】
次に、ステップS1806の対応図履歴出力処理について、図21のフローチャートを用いて、詳細に説明する。図21のフローチャートにおいて、図18のフローチャートと同一のステップについて、説明を省略する。
【0234】
(ステップS2101)対応図出力部219は、受付部214が受け付けた対応図履歴出力指示が示す時期に対応する対応図を記録媒体から読み出す。なお、記録媒体に対応図が存在しない場合、上述した処理により、対応図履歴出力指示が示す時期に対応する1以上の文章群から対応図がリアルタイムに構成される、とする。
【0235】
(ステップS2102)対応図出力部219は、ステップS1804で出力された最新の対応図の横に、過去対応図を出力する。なお、対応図出力部219は、最新の対応図と過去対応図を、ユーザが比較可能なように出力すればよく、その位置は問わないことは言うまでもない。
【0236】
次に、ステップS1808の特徴情報出力処理について、図22のフローチャートを用いて、詳細に説明する。図22のフローチャートにおいて、図7のフローチャートと同一のステップについて、説明を省略する。
【0237】
(ステップS2201)対応図出力部219は、特徴対象物出現回数出力処理を行う。特徴対象物出現回数出力処理について、図23のフローチャートを用いて説明する。
【0238】
(ステップS2202)対応図出力部219は、特徴対象物出力処理を行う。特徴対象物出力処理について、図24のフローチャートを用いて説明する。
【0239】
(ステップS2203)対応図出力部219は、特徴動作状態出現回数出力処理を行う。特徴動作状態出現回数出力処理について、図25のフローチャートを用いて説明する。
【0240】
(ステップS2204)対応図出力部219は、特徴動作状態出力処理を行う。特徴動作状態出力処理について、図26のフローチャートを用いて説明する。
【0241】
(ステップS2205)対応図出力部219は、特徴関係語出現回数出力処理を行う。特徴関係語出現回数出力処理について、図27のフローチャートを用いて説明する。
【0242】
(ステップS2206)対応図出力部219は、特徴関係語出力処理を行う。特徴関係語出力処理について、図28のフローチャートを用いて説明する。
【0243】
次に、ステップS2201の特徴対象物出現回数出力処理について、図23のフローチャートを用いて説明する。
【0244】
(ステップS2301)対応図出力部219は、過去対応図における、前の対象物の出現回数tを取得する。対応図出力部219は、例えば、過去対応図を構成する元となる情報セット管理表から、前の対象物の出現回数を取得しても良い。かかる処理は、単なる検索処理である。
【0245】
(ステップS2302)対応図出力部219は、現在の対応図における、前の対象物の出現回数tと、過去対応図における、前の対象物の出現回数tを用いて、tを強調表示すべきか否かを判断する。つまり、「t−t>=閾値」か否かを判断する。かかる条件を満たせばステップS2303に行き、満たさなければステップS2304に行く。なお、閾値とは、例えば、「3」などという定数であり、予め対応図出力部219が保持している、とする。
【0246】
(ステップS2303)対応図出力部219は、前の対象物の出現回数tを出力する際の属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)などである。
【0247】
(ステップS2304)対応図出力部219は、前の対象物(直前に出力した対象物)の出力に対応付けて、tの値(数値)を出力する。上位処理にリターンする。なお、ここで「対応付けて出力する」とは、tの値(数値)が、直前に出力した対象物の出現回数であることが分かるように、直前に出力した対象物の近く(例えば、閾値より小さい間隔しか空いていないところ)に出力することである。ここで、tは、強調されている場合と、通常の場合がある。強調されている場合とは、過去と比較して、現在の出現回数が多い場合である。
【0248】
なお、図23において、過去の出現回数と比較して、閾値より小さい変化しかないtの値も出力された。しかし、対応図出力部219は、過去の出現回数と比較して、閾値より小さい変化しかないtの値を出力しなくても良い。
【0249】
また、図23のステップS2302において、条件「t−t>=閾値」を満たすか否かを判断した。しかし、対応図出力部219が判断する条件は、「t−t>=閾値」に限らない。対応図出力部219が判断する条件は、tおよびtを用いた条件であれば良い。
【0250】
さらに、図23において、対象物の出現回数tに応じて変更する属性は、対象物に接続される線(矢印)の属性でも良い。線(矢印)の属性とは、例えば、線の太さや色などである。
【0251】
次に、ステップS2202の特徴対象物出力処理について、図24のフローチャートを用いて説明する。
【0252】
(ステップS2401)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、対象物を検索する。
【0253】
(ステップS2402)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、対象物が存在するか否かを判断する。対象物が存在すればステップS2404、対象物が存在しなければステップS2403に行く。
【0254】
(ステップS2403)対応図出力部219は、対象物を強調する属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)、対象物を囲む図形の属性(線種、線の太さ、線の色など)などである。
【0255】
(ステップS2404)対応図出力部219は、対象物を出力する。上位処理にリターンする。
【0256】
なお、図24において、過去対応図に存在した対象物を、新対応図において出力しなくても良い。
【0257】
次に、ステップS2203の特徴動作状態出現回数出力処理について、図25のフローチャートを用いて説明する。
【0258】
(ステップS2501)対応図出力部219は、過去対応図における、前の動作状態の出現回数aを取得する。対応図出力部219は、例えば、過去対応図を構成する元となる情報セット管理表から、前の動作状態の出現回数を取得しても良い。かかる処理は、単なる検索処理である。
【0259】
(ステップS2502)対応図出力部219は、現在の対応図における、前の動作状態の出現回数aと、過去対応図における、前の動作状態の出現回数aを用いて、aを強調表示すべきか否かを判断する。つまり、「a−a>=閾値」か否かを判断する。かかる条件を満たせばステップS2303に行き、満たさなければステップS2304に行く。なお、閾値とは、例えば、「5」などという定数であり、予め対応図出力部219が保持している、とする。なお、対応図出力部219が判断する条件は、「a−a>=閾値」に限らず、aとaを用いた条件であれば良い。
【0260】
(ステップS2503)対応図出力部219は、前の動作状態の出現回数aを出力する際の属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)などである。
【0261】
(ステップS2504)対応図出力部219は、前の動作状態(直前に出力した動作状態)の出力に対応付けて、aの値(数値)を出力する。上位処理にリターンする。なお、ここで「対応付けて出力する」とは、aの値(数値)が、直前に出力した動作状態の出現回数であることが分かるように、直前に出力した動作状態の近く(例えば、閾値より小さい間隔しか空いていないところ)に出力することである。ここで、aは、強調されている場合と、通常の場合がある。強調されている場合とは、過去と比較して、現在の出現回数が多い場合である。
【0262】
なお、図25において、過去の出現回数と比較して、閾値より小さい変化しかないaの値も出力された。しかし、対応図出力部219は、過去の出現回数と比較して、閾値より小さい変化しかないaの値を出力しなくても良い。
【0263】
さらに、図23において、動作状態の出現回数aに応じて変更する属性は、動作状態に接続される線(矢印)の属性でも良い。線(矢印)の属性とは、例えば、線の太さや色などである。
【0264】
次に、ステップS2204の特徴動作状態出力処理について、図26のフローチャートを用いて説明する。
【0265】
(ステップS2601)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、動作状態を検索する。
【0266】
(ステップS2602)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、動作状態が存在するか否かを判断する。動作状態が存在すればステップS2604、動作状態が存在しなければステップS2603に行く。
【0267】
(ステップS2603)対応図出力部219は、動作状態を強調する属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)、動作状態を囲む図形の属性(線種、線の太さ、線の色など)などである。
【0268】
(ステップS2604)対応図出力部219は、動作状態を出力する。上位処理にリターンする。
【0269】
なお、図26において、過去対応図に存在した動作状態を出力しなくても良い。
【0270】
次に、ステップS2205の特徴関係語出現回数出力処理について、図27のフローチャートを用いて説明する。
【0271】
(ステップS2701)対応図出力部219は、過去対応図における、前の関係語の出現回数rを取得する。対応図出力部219は、例えば、過去対応図を構成する元となる情報セット管理表から、前の関係語の出現回数を取得しても良い。かかる処理は、単なる検索処理である。
【0272】
(ステップS2702)対応図出力部219は、現在の対応図における、前の関係語の出現回数rと、過去対応図における、前の関係語の出現回数rを用いて、rを強調表示すべきか否かを判断する。つまり、「r−r>=閾値」か否かを判断する。かかる条件を満たせばステップS2303に行き、満たさなければステップS2304に行く。なお、閾値とは、例えば、「4」などという定数であり、予め対応図出力部219が保持している、とする。
【0273】
(ステップS2703)対応図出力部219は、前の関係語の出現回数rを出力する際の属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)などである。
【0274】
(ステップS2704)対応図出力部219は、前の関係語(直前に出力した関係語)の出力に対応付けて、rの値(数値)を出力する。上位処理にリターンする。なお、ここで「対応付けて出力する」とは、rの値(数値)が、直前に出力した関係語の出現回数であることが分かるように、直前に出力した関係語の近く(例えば、閾値より小さい間隔しか空いていないところ)に出力することである。ここで、aは、強調されている場合と、通常の場合がある。強調されている場合とは、過去と比較して、現在の出現回数が多い場合である。
【0275】
なお、図25において、過去の出現回数と比較して、閾値より小さい変化しかないrの値も出力された。しかし、対応図出力部219は、過去の出現回数と比較して、閾値より小さい変化しかないrの値を出力しなくても良い。
【0276】
次に、ステップS2206の特徴関係語出力処理について、図28のフローチャートを用いて説明する。
【0277】
(ステップS2801)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、関係語を検索する。ここで、検索する範囲は、同一の対象物でありかつ同一の動作状態のレコードであることは好適である。
【0278】
(ステップS2802)対応図出力部219は、過去対応図(過去対応図の元になっている情報セット管理表も含む)において、関係語が存在するか否かを判断する。関係語が存在すればステップS2804、関係語が存在しなければステップS2803に行く。
【0279】
(ステップS2803)対応図出力部219は、関係語を強調する属性を付与する。この属性は、例えば、特定のフォント(Boldフォントなど)、特定の文字色(赤色など)、文字サイズ(大きなサイズ)などである。また、ここで、強調する属性を付与する対象は、対象物と動作状態を接続する線(矢印を含む)であっても良いことは言うまでもない。
【0280】
(ステップS2804)対応図出力部219は、関係語を出力する。上位処理にリターンする。
【0281】
なお、図26において、過去対応図に存在した関係語を出力しなくても良い。
【0282】
以下、本実施の形態における情報処理システム2の具体的な動作について説明する。情報処理システム2の概念図は図1である。
(具体例1)
【0283】
まず、具体例1について説明する。具体例1は、一の対応図を出力する処理の例である。今、文章群格納部110は、図29に示す二人(Aさん、Bさん)のチャットでの会話である文章群を格納している、とする。
【0284】
そして、辞書情報格納部111は、形態素解析に必要な辞書等を格納している、とする。
【0285】
かかる状況において、ユーザ(例えば、シャンプーTのマーケティング部のユーザ)は、自社のシャンプー「シャンプーT」の世の中における受け入れられ方、思われ方を分析しようと思い、「対応図出力 シャンプーT」を入力した、とする。「対応図出力 シャンプーT」は、「シャンプーT」に関連する対応図を出力する指示である。
【0286】
次に、受付部114は、特定対象物「シャンプーT」を有する対応図出力指示「対応図出力 シャンプーT」を受け付ける。
【0287】
そして、文分割制御部115は、受け付けた対応図出力指示が有する特定対象物「シャンプーT」のいずれかを含む文章群を文章群格納部110から読み出す。そして、文分割制御部115は、図29の(Aさん)の会話、(Bさん)の会話の2つの文章群を読み出した、とする。
【0288】
次に、文分割制御部115等は、以下のように文処理を行い、対象物、動作状態、および関係語を取得し、当該3つの情報を対応付けた情報セットを取得し、少なくとも一時蓄積する。つまり、まず、文分割制御部115は、(Aさん)の会話の第一文「シャンプーTを、買いました。」を形態素解析し、および係り受け解析し、文の構造を取得する。そして、対象物取得部116は、主語となる名詞「シャンプーT」を取得し、対象物を格納するバッファに蓄積する。
【0289】
次に、動作状態取得部117は、(Aさん)の会話の第一文「シャンプーTを、買いました。」から、述語となる動詞または形容詞の「買いました」を取得し、動作状態を格納するバッファに蓄積する。
【0290】
次に、関係語取得部118は、主語「シャンプーT」と述語「買いました」を繋ぐ助詞「を」を取得し、関係語を格納するバッファに蓄積する。以上により、図30の情報セット管理表の「ID=1」のレコードが得られた。
【0291】
文分割制御部115等は、同様に、(Aさん)の会話の第二文以降、(Bさん)の会話の全文を文処理し、図30の情報セット管理表を得る。図30の情報セット管理表は、図11の情報セット管理表と同様の構造である。
【0292】
また、関連対象物取得部212は、特定対象物「シャンプーT」が出現した直後の2文について、対象物を取得し、当該対象物を関連対象物とする。そして、対応情報取得部213は、特定対象物と関連対象物とを対応付ける対応情報を取得し、蓄積する。
【0293】
具体的には、関連対象物取得部212は、(Aさん)の会話を構成する文から、特定対象物「シャンプーT」が出現した文「シャンプーTを、買いました。」の直後の2文「香りが良いね。」「CMも面白い。」から対象物「香り」「CM」を取得し、対応情報取得部213は、(シャンプーT,香り)(シャンプーT,CM)の対応情報を取得し、蓄積する。ここでは、対応情報取得部213は、図31に示すように、図30の情報セット管理表のレコードIDを用いて特定対象物と関連対象物とを特定するようにしている。つまり、図31の「ID=1」のレコード(1,2)から、特定対象物が図22の「ID=1」の対象物「シャンプーT」であり、関連対象物が図30の「ID=2」の対象物「香り」であることが分かる。
【0294】
次に、対応図出力部219は、以下のように、対応図出力処理を行う。つまり、まず、対応図出力部219は、実施の形態1で説明したように、図22の情報セット管理表を用いて、図32のような対応図を出力する。図32において、「買いました」と「買った」は同一の用語として処理している。つまり、対応図出力部219は、用語のゆらぎ、変形を吸収する機能を有する、とする。なお、用語のゆらぎ、変形を吸収する自然言語処理機能については公知技術であるので詳細な説明を省略する。さらに、図32において、情報セットの出現回数は、矢印の太さに反映されている。つまり、対応図出力部219は、情報セットの出現回数をパラメータとする増加関数により線の太さを決定し、矢印(線の一種)を出力している。
【0295】
そして、対応図出力部219は、特定対象物を第一キー、関連対象物を第二キーとして、対象情報管理表(図31)をソートする。そして、対応図出力部219は、図31の対象情報管理表を得る。
【0296】
次に、対応図出力部219は、図31の対象情報管理表に従って、特定対象物と関連対象物とを対応付ける。
【0297】
つまり、まず、対応図出力部219は、図31の対象情報管理表の「ID=1」のデータ(1,2)を取得し、当該データから、「特定対象物:シャンプーT,関連対象物:香り」を取得する。そして、対象物「シャンプーT」と対象物「香り」とを、破線の矢印で結ぶ。つまり、ここでは、対応図出力部219は、特定対象物「シャンプーT」と関連対象物「香り」とを破線の矢印で結ぶ処理を行う(図33参照)。
【0298】
同様に、対応図出力部219は、図31の対象情報管理表の「ID=2」以降のデータを処理し、特定対象物「シャンプーT」と関連対象物「CM」、特定対象物「シャンプーT」と関連対象物「香り」、特定対象物「シャンプーT」と関連対象物「泡立ち」とを破線の矢印で結ぶ処理を行う(図33参照)。なお、特定対象物「シャンプーT」と関連対象物「香り」は2度出現するので、太い破線の矢印で接続されている(図33参照)。
(具体例2)
【0299】
次に、具体例2について説明する。具体例2は、対応図履歴出力処理の例である。
【0300】
今、情報出力装置21は、多数のユーザのブログ(文章群)を収集し、当該複数のブログから、世の中の人々の意見、感じ方を、対応図を用いて表示する。
【0301】
そして、情報出力装置21は、2008年1月18日10時15分時点のブログから、上述した自然言語処理により、図34の情報セット管理表を得て、蓄積している、とする。なお、図34の情報セット管理表は、既に対象物、動作状態、関係語をキーとしてソートされている、とする。
【0302】
次に、情報出力装置21のユーザは、対応図履歴出力指示を情報出力装置21に入力した、とする。この対応図履歴出力指示は、「対応図履歴出力 2008年1月」である、とする。
【0303】
そして、受付部214は、対応図履歴出力指示を受け付ける。そして、情報出力装置21は、上述した処理により、現在の多数のブログを自然言語処理し、図35の情報セット管理表を得た、とする。
【0304】
そして、対応図出力部219は、図35の情報セット管理表から、上述した対応図出力処理により、現在(2008年8月10日 10時05分)の対応図を出力する。
【0305】
次に、対応図出力部219は、受付部214が受け付けた対応図履歴出力指示「対応図履歴出力 2008年1月」が示す時期に対応する図34の情報セット管理表を記録媒体から読み出す。ここで、対応図出力部219は、対応図履歴出力指示が有する時期「2008年1月」に最も近い時刻に対応する情報セット管理表を読み出す。
【0306】
そして、対応図出力部219は、現在(2008年8月10日 10時05分)の対応図の横に、2008年1月18日10時15分時点の対応図(過去対応図)を出力する。そして、対応図出力部219は、図36に示す2つの対応図を得る。
【0307】
なお、図36の対応図では、特定対象物と関連対象物との対応の表示(具体例1で説明済み)を行っていない。しかし、特定対象物と関連対象物との対応の表示を行っても良いことは言うまでもない。また、図36の対応図において、矢印の先のノード(動作状態)の一部は、省略している。
(具体例3)
【0308】
次に、具体例3について説明する。具体例3は、特徴情報出力処理の例である。
【0309】
今、情報出力装置21は、2008年1月18日10時15分時点のブログから、上述した自然言語処理により、図34の情報セット管理表を得て、蓄積している、とする。なお、図34の情報セット管理表は、既に対象物、動作状態、関係語をキーとしてソートされている、とする。
【0310】
次に、情報出力装置21のユーザは、特徴情報出力指示を情報出力装置21に入力した、とする。この特徴情報出力指示は、「特徴情報出力 2008年1月」である、とする。
【0311】
そして、受付部214は、特徴情報出力指示を受け付ける。そして、情報出力装置21は、上述した処理により、現在の多数のブログを自然言語処理し、図35の情報セット管理表を得た、とする。
【0312】
そして、対応図出力部219は、図22から図28のフローチャートを用いて説明した処理により、現時点での対応図を出力する。その際、対応図出力部219は、対象物、動作状態を出力する場合、過去対応図(ここでは、2008年1月に対応する対応図)に存在せず、現在の対応図(情報セット管理表も含む)に存在する対象物または動作状態について、他と比較して強調して出力する。強調とは、具体的には、例えば、対象物または動作状態のノードの背景を濃い網掛けとすることである。強調とは、他の比較して、異なる態様で出力する程度の意義でも良い。
【0313】
また、対応図出力部219は、現時点での対応図を出力する際、過去対応図(ここでは、2008年1月に対応する対応図)での出現回数と比較して、例えば、10回以上、出現回数が増加している場合、他と比較して強調して出力する。強調とは、具体的には、例えば、対象物または動作状態のノードの楕円の線の太さを他よりも太くすることである。
【0314】
そして、対応図出力部219は、過去対応図(図34の情報セット管理表)と現在の対応図(図35の情報セット管理表)とを比較し、「シャンプーZ」が新しく出現し、「シャンプーT」の出現回数が2回から55回と、53回(10回以上)増加している。
【0315】
したがって、対応図出力部219は、「シャンプーZ」のノードの背景を濃い網掛けとし、「シャンプーT」のノードの線の太さを他と比較して太く出力する。そして、対応図出力部219は、図37の対応図を出力する。
【0316】
なお、図37の対応図では、特定対象物と関連対象物との対応の表示(具体例1で説明済み)を行っていない。しかし、特定対象物と関連対象物との対応の表示を行っても良いことは言うまでもない。また、図37の対応図において、矢印の先のノード(動作状態)の一部は、省略している。
【0317】
以上、本実施の形態によれば、文章群を自然言語処理し、対象物と動作状態語とを取り出し、当該対象物と動作状態語との対応を示す対応図を出力できる。また、本実施の形態によれば、例えば、ユーザが指定した特定対象物に対して、どのような事が話題になっているかも一目して把握できる。つまり、本実施の形態によれば、対応図の出力により、ブログ等の文章群の文脈を可視化でき、ユーザは、ブログ等の文章群の文脈をより容易に把握できる。
【0318】
また、本実施の形態によれば、2以上の時点の対応図(例えば、過去の対応図と現在の対応図)を比較して出力できる。したがって、ユーザの話題の移り変わりなどを、容易に把握できる。なお、図36において、2つの時点の対応図のみを同時に出力できたが、3つ以上の対応図を同時に出力しても良い。また、出力する対応図は、現在のものと過去のものであったが、すべて過去の異なる時点のものでも良い。
【0319】
さらに、本実施の形態によれば、2つの時点の対応図を比較し、その差異を容易に把握できる。なお、図37において、現時点の対応図に出現する対象物等のみを出力した。しかし、過去の対応図に出現し、現在の対応図に出現しない対象物、動作状態などを、他と比較して異なる態様で出力する(例えば、グレイの文字色で薄く出力する)などしても良い。過去の対応図に出現し、現在の対応図に出現しない対象物、動作状態などを、他と比較して、目立たない態様で出力することは好適である。
【0320】
なお、本実施の形態の具体例によれば、図33に示すような対応図を出力した。しかし、対応図は、出現回数の数値を出力しないでも良い。かかる場合の出力図の例は図16である。さらに、対応図は、図30の表や、図31に示す表の数値を用語(シャンプーTや香り等)に置き換えた表でも良い。さらに、図30に示す表や、図33に示すような対応図において、関係語を出力しなくても良い。
【0321】
さらに、本実施の形態における情報出力装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、記憶媒体に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記記憶媒体に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部として機能させるためのプログラム、である。
【0322】
また、上記プログラムにおいて、コンピュータを、記憶媒体に格納されている1以上の各特定対象物が出現する文章群の中の1以上の文であり、前記1以上の各特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である関連対象物を取得する関連対象物取得部と、前記関連対象物と前記特定対象物とを対応付ける情報である対応情報を取得する対応情報取得部としてさらに機能させ、前記対応図出力部を、前記対象物と前記動作状態とを対応付けた図であり、かつ、前記対応情報を用いて、前記関連対象物と前記特定対象物とを対応付けた図である対応図を出力するように機能させることは好適である。
【0323】
また、上記プログラムにおいて、前記対応図出力部を、過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力するものとして、コンピュータを機能させることは好適である。
【0324】
さらに、上記プログラムにおいて、前記対応図出力部を、過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で前記新対応図を出力するものとして、コンピュータを機能させることは好適である。
【0325】
(実施の形態3)
【0326】
本実施の形態において、対応図を出力する場合に、動作状態の種類を特定し、その種類に応じて、動作状態を視覚的に異なる態様で出力する情報処理システムについて説明する。図1は、本実施の形態における情報処理システム3の概念図である。
【0327】
図38は、本実施の形態における情報処理システム3のブロック図である。情報処理システム3は、情報出力装置31、文章群格納装置12を具備する。
【0328】
情報出力装置31は、文章群格納部110、辞書情報格納部111、文章群受信部112、文章群蓄積部113、受付部214、文分割制御部115、対象物取得部116、動作状態取得部117、関係語取得部118、対応図出力部319、特定対象物格納部211、対応図格納部212、関連対象物取得部212、対応情報取得部213を具備する。
【0329】
対応図出力部319は、種類別動作状態データベース3191、動作状態種類決定手段3192、対応図出力手段3193を具備する。
【0330】
対応図出力部319は、対応図を出力する。対応図出力部319の主機能は、対応図出力部219と同様である。ただし、対応図出力部319は、動作状態の種類を特定し、その種類に応じて、動作状態を視覚的に異なる態様で出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。対応図出力部319は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。対応図出力部319は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0331】
種類別動作状態データベース3191は、動作状態の種類を識別する動作状態種類識別子と、1以上の用語とを対に有する。動作状態の種類には、例えば、「関心表現、行動購買表現、推奨表現」という種類の集合、「肯定、否定」という種類の集合などがある。ただし、種類は何でも良い。種類別動作状態データベース3191は、例えば、動作状態種類識別子「関心表現」と用語「興味がある、使ってみたい、買いたい、・・・」という組の情報を有する。また、種類別動作状態データベース3191は、例えば、動作状態種類識別子「肯定」と用語「良い、すばらしい、・・・」、および動作状態種類識別子「否定」と用語「悪い、良くない、・・・」という組の情報を有する。種類別動作状態データベース3191は、通常、不揮発性の記録媒体で実現され得るが、揮発性の記録媒体で実現しても良い。
【0332】
動作状態種類決定手段3192は、動作状態の種類を決定する。動作状態種類決定手段3192は、例えば、対応図が有する動作状態と一致する用語と対になる動作状態種類識別子を取得する。なお、動作状態種類決定手段3192は、他の装置に動作状態を送信し、動作状態種類を受信するなどの処理を行っても良い。動作状態種類決定手段3192は、通常、MPUやメモリ等から実現され得る。動作状態種類決定手段3192の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0333】
対応図出力手段3193は、対応図を出力する。対応図出力手段3193は、動作状態の種類に応じて、動作状態を視覚的に異なる態様で出力する。「視覚的に異なる態様」とは、例えば、動作状態の文字列の属性値(色、フォント、サイズなど)が異なること、または動作状態のノードの属性(ノードを構成する図形、ノードの背景色、ノードの輪郭線の線種、線の色、線の太さなど)が異なること等である。対応図出力手段3193は、動作状態の種類が決定されない場合は、通常、動作状態を、デフォルトの属性値で、出力する。
【0334】
次に、情報処理システム3の動作について説明する。情報処理システム3の動作と情報処理システム2の動作とを比較した場合、図7の対応図出力処理(S2001)のみが異なる。また、図7の対応図出力処理において、動作状態を出力するステップS717(これを動作状態出力処理という。)が異なる。この動作状態出力処理を、図39のフローチャートを用いて説明する。
【0335】
(ステップS3901)対応図出力部319の動作状態種類決定手段3192は、動作状態をキーとして、種類別動作状態データベース3191を検索する。
【0336】
(ステップS3902)動作状態種類決定手段3192は、ステップS3901の検索処理において、動作状態種類識別子が取得できたか否かを判断する。動作状態種類識別子が取得できればステップS3903に行き、動作状態種類識別子が取得できなければステップS3904に行く。
【0337】
(ステップS3903)対応図出力部319の対応図出力手段3193は、動作状態種類識別子に対応する属性(例えば、文字のフォント、文字サイズ、文字色などの文字属性、ノードの線種、線の色、線の太さ、ノードの背景色などのノードの属性など)を動作状態に付与する。なお、対応図出力手段3193は、動作状態種類識別子に対応する属性は、予め保持している、とする。
【0338】
(ステップS3904)対応図出力手段3193は、動作状態を出力する。なお、動作状態の出力とは、動作状態の文字列が含まれたノードの出力である。上位処理にリターンする。
【0339】
以下、本実施の形態における情報処理システム3の具体的な動作について説明する。情報処理システム3の概念図は図1である。以下、動作状態の種類に応じた、動作状態の出力を中心にして説明する。
【0340】
今、種類別動作状態データベース3191は、図40に示す種類別動作状態管理表を格納している。種類別動作状態管理表は、「ID」「動作状態種類識別子」「用語」の属性を有するレコードを1以上保持している。
【0341】
また、文章群格納部110は、図29に示す二人(Aさん、Bさん)のチャットでの会話である文章群を格納している、とする。そして、辞書情報格納部111は、形態素解析に必要な辞書等を格納している、とする。
【0342】
かかる状況において、ユーザ(例えば、シャンプーTのマーケティング部のユーザ)は、自社のシャンプー「シャンプーT」の世の中における受け入れられ方、思われ方を分析しようと思い、「対応図出力 シャンプーT」を入力した、とする。「対応図出力 シャンプーT」は、「シャンプーT」に関連する対応図を出力する指示である。
【0343】
そして、実施の形態2の具体例で説明した処理と同様の処理により、情報出力装置31は、図29の文章群から、図30の情報セット管理表を得る。
【0344】
次に、情報出力装置31は、図30の情報セット管理表から対応図を出力する。そして、情報出力装置31は、図41の対応図を出力する。図41の対応図は、図33の対応図と比較して、動作状態のみが異なる。以下、動作状態を出力する処理についてのみ詳細に説明する。
【0345】
まず、動作状態「買いました」を出力する場合に、対応図出力部319の動作状態種類決定手段3192は、動作状態「買いました」をキーとして、図40の種類別動作状態管理表を検索する。そして、動作状態種類決定手段3192は、動作状態種類識別子「購買行動」を得る。そして、対応図出力手段3193は、動作状態種類識別子「購買行動」に対応する属性を動作状態「買いました」に付与する。この属性とは、ここでは、動作状態「買いました」のノードの背景色に一の網掛けを設定する属性である。
【0346】
そして、対応図出力手段3193は、動作状態のノードを出力する(図41参照)。
【0347】
そして、同様に、対応図出力部319は、動作状態「良い」、「面白い」を出力する。なお、動作状態「良い」の動作状態種類識別子は「推奨表現」、動作状態「面白い」の動作状態種類識別子は「関心表現」である。つまり、対応図出力部319は、動作状態種類識別子「推奨表現」に対応する属性値を動作状態「良い」に設定し、動作状態「良い」を出力する。また、対応図出力部319は、動作状態種類識別子「関心表現」に対応する属性値を動作状態「面白い」に設定し、動作状態「面白い」を出力する。
【0348】
また、動作状態種類決定手段3192は、動作状態「良くない」に対応する動作状態種類識別子を取得できなかった、とする。かかる場合、対応図出力手段3193は、デフォルトの出力態様で、動作状態「良くない」を出力する(図41参照)。
【0349】
以上、本実施の形態によれば、対応図を出力する場合に、動作状態の種類を特定し、その種類に応じて、動作状態を視覚的に異なる態様で出力することができる。
【0350】
なお、本実施の形態によれば、動作状態の種類の定義は問わないことは言うまでもない。つまり、動作状態の種類とは、種々考えられる。また、動作状態の取得方法は種々存在し、その方法は問わない。動作状態の種類は、上述したように、通常は、意味内容により分類され得る種類である。ただし、動作状態の種類は、例えば、品詞など、意味内容以外のものでも良い。
【0351】
さらに、本実施の形態における情報出力装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、記憶媒体に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記記憶媒体に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部として機能させるためのプログラム、である。
【0352】
また、上記プログラムにおいて、前記対応図出力部を、動作状態の種類を決定し、前記対応図を出力する際に、前記動作状態の種類に応じて、視覚的に異なる態様で動作状態を出力するものとして、コンピュータを機能させることは好適である。
【0353】
また、図42は、本明細書で述べたプログラムを実行して、上述した実施の形態の情報出力装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図42は、このコンピュータシステム340の概観図であり、図43は、コンピュータシステム340のブロック図である。
【0354】
図42において、コンピュータシステム340は、FDドライブ、CD−ROMドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
【0355】
図43において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、MPU3413と、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM3415とに接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0356】
コンピュータシステム340に、上述した実施の形態の情報出力装置等の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
【0357】
プログラムは、コンピュータ341に、上述した実施の形態の情報出力装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
【0358】
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0359】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0360】
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0361】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0362】
以上のように、本発明にかかる情報出力装置は、ブログ等の文章群で記載されている対象物と、その動作状態の対応が容易に理解できる、という効果を有し、情報出力装置等として有用である。
【図面の簡単な説明】
【0363】
【図1】実施の形態1における情報処理システム1の概念図
【図2】同情報処理システムのブロック図
【図3】同情報出力装置の動作について説明するフローチャート
【図4】同当該文処理の動作について説明するフローチャート
【図5】同連結処理の動作について説明するフローチャート
【図6】同情報取得処理の動作について説明するフローチャート
【図7】同対応図出力処理の動作について説明するフローチャート
【図8】同文章群の一種であるブログの例を示す図
【図9】同辞書情報管理表を示す図
【図10】同自然言語処理の例を説明する図
【図11】同情報セット管理表を示す図
【図12】同自然言語処理の例を説明する図
【図13】同情報セット管理表を示す図
【図14】同対応図の例を示す図
【図15】同対応図の例を示す図
【図16】同対応図の例を示す図
【図17】実施の形態2における情報処理システムのブロック図
【図18】同情報出力装置の動作について説明するフローチャート
【図19】同対応情報取得処理の動作について説明するフローチャート
【図20】同対応図出力処理の動作について説明するフローチャート
【図21】同対応図履歴出力処理の動作について説明するフローチャート
【図22】同特徴情報出力処理の動作について説明するフローチャート
【図23】同特徴対象物出現回数出力処理の動作について説明するフローチャート
【図24】同特徴対象物出力処理の動作について説明するフローチャート
【図25】同特徴動作状態出現回数出力処理の動作について説明するフローチャート
【図26】同特徴動作状態出力処理の動作について説明するフローチャート
【図27】同特徴関係語出現回数出力処理の動作について説明するフローチャート
【図28】同特徴関係語出力処理の動作について説明するフローチャート
【図29】同文章群の例を説明する図
【図30】同情報セット管理表を示す図
【図31】同特定対象物と関連対象物とを特定する情報を示す図
【図32】同対応図を示す図
【図33】同対応図を示す図
【図34】同情報セット管理表を示す図
【図35】同情報セット管理表を示す図
【図36】同対応図を示す図
【図37】同対応図を示す図
【図38】実施の形態3における情報処理システムのブロック図
【図39】同動作状態出力処理の動作について説明するフローチャート
【図40】同種類別動作状態管理表を示す図
【図41】同対応図を示す図
【図42】同コンピュータシステムの概観図
【図43】同コンピュータシステムのブロック図
【符号の説明】
【0364】
1、2、3 情報処理システム
11、21、31 情報出力装置
12 文章群格納装置
110 文章群格納部
111 辞書情報格納部
112 文章群受信部
113 文章群蓄積部
114、214 受付部
115 文分割制御部
116 対象物取得部
117 動作状態取得部
118 関係語取得部
119、219、319 対応図出力部
121 サーバ側文章群格納部
122 指示受信部
123 文章群送信部
211 特定対象物格納部
212 対応図格納部
212 関連対象物取得部
213 対応情報取得部
1151 要素分割手段
1152 要素連結手段
3191 種類別動作状態データベース
3192 動作状態種類決定手段
3193 対応図出力手段

【特許請求の範囲】
【請求項1】
一人以上の個人が入力した1以上の文章群を格納し得る文章群格納部と、
前記文章群格納部に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、
前記文章群格納部に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、
前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部とを具備する情報出力装置。
【請求項2】
前記対応図出力部は、
前記対象物と、当該対象物に対応する動作状態とを、線で結ぶ態様で出力する請求項1記載の情報出力装置。
【請求項3】
前記文章群格納部に格納されている文章群に含まれる文から、前記対象物と、当該対象物に対応する動作状態とをつなぐ非自立語である関係語を取得する関係語取得部をさらに具備し、
前記対応図出力部は、
前記対象物と当該対象物に対応する動作状態とを線で結ぶ態様で出力し、かつ当該線に対応付くように、前記関係語を出力する請求項2記載の情報出力装置。
【請求項4】
対応図の元になる1以上の文章群から、前記対象物取得部が取得した対象物が複数存在する場合、または、前記動作状態取得部が取得した動作状態が複数存在する場合、
前記対応図出力部は、前記複数の対象物、または前記複数の動作状態を一つにした対応図であり、前記対象物と前記動作状態とを対応付けた図である対応図を出力する請求項1から請求項3いずれか記載の情報出力装置。
【請求項5】
前記対応図出力部は、
前記対象物、または前記動作状態に対応付けて、前記対象物の出現回数、または前記動作状態の出現回数をも出力する請求項4記載の情報出力装置。
【請求項6】
第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納部と、
前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、
前記対象物取得部は、
前記文分割制御部が取得した第二文字列の種類から対象物を含む第二文字列を特定し、当該第二文字列から対象物を取得し、
前記動作状態取得部は、
前記対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて動作状態を含み得る第二文字列を特定し、当該第二文字列が有する動作状態を取得する請求項1から請求項4いずれか記載の情報出力装置。
【請求項7】
第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納部と、
前記文章を構成する文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御部とをさらに具備し、
前記関係語取得部は、
前記文分割制御部が取得した前記第二文字列と前記第二文字列の種類を特定する情報を用いて、前記対象物と、当該対象物に対応する動作状態とをつなぐ機能語である関係語を取得する請求項3記載の情報出力装置。
【請求項8】
前記対応図出力部は、
前記対象物と前記動作状態とを、視覚的に区別可能なように出力する請求項1から請求項7いずれか記載の情報出力装置。
【請求項9】
特定の対象物である特定対象物を、1以上格納し得る特定対象物格納部と、
前記1以上の各特定対象物が出現する文章群の中の1以上の文であり、前記1以上の各特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である関連対象物を取得する関連対象物取得部と、
前記関連対象物と前記特定対象物とを対応付ける情報である対応情報を取得する対応情報取得部とをさらに具備し、
前記対応図出力部は、
前記対象物と前記動作状態とを対応付けた図であり、かつ、前記対応情報を用いて、前記関連対象物と前記特定対象物とを対応付けた図である対応図を出力する請求項1から請求項8いずれか記載の情報出力装置。
【請求項10】
1以上の特定対象物を受け付ける受付部をさらに具備し、
前記特定対象物格納部の1以上の特定対象物は、前記受付部が受け付けた1以上の特定対象物である請求項9記載の情報出力装置。
【請求項11】
前記対応図出力部は、
前記対象物と前記動作状態とを線で結ぶ態様で出力し、かつ、前記関連対象物と前記特定対象物とを線で結ぶ態様で出力し、かつ、前記対象物と前記動作状態とを結ぶ線の属性値と前記関連対象物と前記特定対象物とを結ぶ線の属性値とが異なるように出力する請求項9または請求項10記載の情報出力装置。
【請求項12】
過去に作成された文章群から構成された過去対応図を、1以上格納し得る対応図格納部をさらに具備し、
前記対応図出力部は、
前記過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力する請求項1から請求項11いずれか記載の情報出力装置。
【請求項13】
過去に作成された文章群から構成された過去対応図を、1以上格納し得る対応図格納部をさらに具備し、
前記対応図出力部は、
前記過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で前記新対応図を出力する請求項1から請求項12いずれか記載の情報出力装置。
【請求項14】
前記対応図出力部は、
動作状態の種類を決定する動作状態種類決定手段を具備し、
前記対応図を出力する際に、前記動作状態種類決定手段が決定した種類に応じて、視覚的に異なる態様で動作状態を出力する請求項1から請求項13いずれか記載の情報出力装置。
【請求項15】
前記対応図出力部は、
動作状態の種類を識別する動作状態種類識別子と、1以上の用語とを対に有する種類別動作状態データベースをさらに具備し、
前記動作状態種類決定手段は、
前記対応図が有する動作状態と一致する用語と対になる動作状態種類識別子を取得し、
前記対応図を出力する際に、前記動作状態種類識別子に応じて、視覚的に異なる態様で動作状態を出力する請求項14記載の情報出力装置。
【請求項16】
対象物取得部、動作状態取得部、および対応図出力部とを用いて実現される情報出力方法であり、
前記対象物取得部により、記憶媒体に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得ステップと、
前記動作状態取得部により、前記記憶媒体に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得ステップと、
前記対応図出力部により、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力ステップとを具備する情報出力方法。
【請求項17】
関連対象物取得部、および対応情報取得部とを、さらに用いて実現される情報出力方法であり、
前記関連対象物取得部により、記憶媒体に格納されている1以上の各特定対象物が出現する文章群の中の1以上の文であり、前記1以上の各特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である関連対象物を取得する関連対象物取得ステップと、
前記対応情報取得部により、前記関連対象物と前記特定対象物とを対応付ける情報である対応情報を取得する対応情報取得ステップとをさらに具備し、
前記対応図出力ステップにおいて、
前記対象物と前記動作状態とを対応付けた図であり、かつ、前記対応情報を用いて、前記関連対象物と前記特定対象物とを対応付けた図である対応図を出力する請求項16記載の情報出力方法。
【請求項18】
前記対応図出力ステップにおいて、
過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力する請求項16または請求項17記載の情報出力方法。
【請求項19】
前記対応図出力ステップにおいて、
過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で前記新対応図を出力する請求項16から請求項18いずれか記載の情報出力方法。
【請求項20】
前記対応図出力ステップにおいて、
動作状態の種類を決定し、前記対応図を出力する際に、前記動作状態の種類に応じて、視覚的に異なる態様で動作状態を出力する請求項16から請求項19いずれか記載の情報出力方法。
【請求項21】
コンピュータを、
記憶媒体に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、
前記記憶媒体に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、
前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部として機能させるためのプログラム。
【請求項22】
コンピュータを、
記憶媒体に格納されている1以上の各特定対象物が出現する文章群の中の1以上の文であり、前記1以上の各特定対象物が出現する文と、予め決められた位置関係にある文に出現する対象物である関連対象物を取得する関連対象物取得部と、
前記関連対象物と前記特定対象物とを対応付ける情報である対応情報を取得する対応情報取得部としてさらに機能させ、
前記対応図出力部を、
前記対象物と前記動作状態とを対応付けた図であり、かつ、前記対応情報を用いて、前記関連対象物と前記特定対象物とを対応付けた図である対応図を出力するように機能させる請求項21記載のプログラム。
【請求項23】
前記対応図出力部を、
過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを出力するものとして、コンピュータを機能させる請求項21または請求項22記載のプログラム。
【請求項24】
前記対応図出力部を、
過去に作成された文章群から構成された過去対応図と、当該過去対応図に対応する時刻よりも新しい時刻に作成された文章群から構成された新対応図とを比較し、両対応図が有する情報についての差異が、予め決められた差異よりも大きい情報を、他の情報と視覚的に異なる態様で前記新対応図を出力するものとして、コンピュータを機能させる請求項21から請求項23いずれか記載のプログラム。
【請求項25】
前記対応図出力部を、
動作状態の種類を決定し、前記対応図を出力する際に、前記動作状態の種類に応じて、視覚的に異なる態様で動作状態を出力するものとして、コンピュータを機能させる請求項21から請求項24いずれか記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate