説明

リンク作成支援装置、リンク作成支援方法およびプログラム

【課題】リンク作成時の作成者の負担を大幅に軽減させる技術を提供する。
【解決手段】リンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部110と、リンク目的の候補となるリンク目的候補毎に、リンク設定範囲候補を抽出するリンク設定範囲候補抽出部120と、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部130と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎に第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定部140と、第1決定部によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎に第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定部150とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リンク作成支援装置、リンク作成支援方法およびプログラムに関する。
【背景技術】
【0002】
一般に、ブログ等のWebコンテンツ(以下、単に「コンテンツ」という)の作成者は、コンテンツの作成時(記述時)に、作成中のコンテンツを充実させるために、作成中のコンテンツ内に他のコンテンツへのリンクを作成する。リンク作成は、通常、作成中のコンテンツ上に、リンクを作成する範囲(アンカーテキスト)を指定し、当該指定範囲にはるリンク先を検索し、探し出したリンク先のURLを当該指定範囲に記述する。作成者は、リンクを1つ作成する毎、上述の煩雑な作業を行う。従って、リンク作成時の作成者の負担を軽減できる仕組みが望まれている。
【0003】
現在、リンク作成時の作成者の負担を軽減できる仕組みとして、キーワードと当該キーワードを解説する解説ページのURLを格納したデータベースを予め構築し、要求があった際に、ページ中のキーワードに解説ページへのリンクを自動付与する方法が知られている(例えば、特許文献1参照)。
【0004】
また、コンテンツ等の文書作成時に、作成中の文書中に出現する対象(例:レストランA)と属性(例:営業時間)の組を文法的なパターンから認識し、属性に対する値(例:10:00−24:00)が記載されているコンテンツを、リスト構造などの情報を基に自動取得し、作成者に提示する方法も提案されている(例えば、非特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−202895号公報
【非特許文献】
【0006】
【非特許文献1】“Webから動的に獲得した属性/値を利用する文章作成支援環境,”中村和正、吉永直樹、鳥澤健太郎、DBWeb2007、Vol.5B−1
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1の方法は、データベース内のキーワードしか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。また、非特許文献1の方法は、対象と属性の組しか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。即ち、上記2方法は、作成者に、少なからず負担を感じさせてしまうという問題がある。
【0008】
本発明は、このような事情に鑑みてなされたものであり、リンク作成時の作成者の負担を大幅に軽減させる技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記問題を解決するために、本発明の一態様であるリンク作成支援装置は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定部と、第1決定部によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定部とを備えることを特徴とする。
【0010】
上記リンク作成支援装置において、第1決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定し、第2決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定するようにしてもよい。
【0011】
上記リンク作成支援装置において、第1決定部は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定し、第2決定部は、第2の評価値が最高の組のリンク設定範囲候補をリンク設定範囲として決定するようにしてもよい。
【0012】
上記リンク作成支援装置において、第1決定部は、多変量解析によって生成された第1の予測モデルを用いて、第1の評価値を算出し、第2決定部は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出するようにしてもよい。
【0013】
上記リンク作成支援装置において、リンク設定範囲候補抽出部は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。
【0014】
上記リンク作成支援装置において、基準単語抽出部は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度を示す単語スコアに基づいて、基準単語を抽出するようにしてもよい。
【0015】
上記リンク作成支援装置において、リンク設定範囲候補抽出部は、単語スコアに応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。
【0016】
上記リンク作成支援装置において、単語スコアは、単語を構成する文字列と単語の属性の組毎に付されているものであってもよい。
【0017】
上記リンク作成支援装置において、単語スコアは、自分が作成したコンテンツ内においてリンク設定範囲である場合は、他人が作成したコンテンツ内においてリンク設定範囲である場合に比べ、高いスコアが付されているものであってよい。
【0018】
上記リンク作成支援装置において、作成中のコンテンツ内において、リンク設定範囲にリンク先を設定するアンカーテキスト設定部を更に備え、第2決定部は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補をアンカーテキスト設定部に供給し、アンカーテキスト設定部は、第2決定部から取得したリンク設定範囲に、第2決定部から取得したリンク先候補を設定するようにしてもよい。
【0019】
上記問題を解決するために、本発明の他の態様であるリンク作成支援方法は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出手段と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定手段と、第1決定手段によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定手段とを備えることを特徴とする。
【0020】
上記問題を解決するために、本発明の一態様であるプログラムは、リンク作成を支援するリンク作成支援装置のコンピュータに、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定ステップと、第1決定ステップによって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定ステップとを実行させることを特徴とする。
【発明の効果】
【0021】
本発明によれば、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。
【図面の簡単な説明】
【0022】
【図1】本発明の第1の実施形態によるリンク作成支援10の機能ブロック図である。
【図2】単語スコアの算出について説明する説明図である。
【図3】リンク設定範囲候補の抽出について説明する説明図である。
【図4】リンク設定範囲候補抽出部120の動作の一例を示すフローチャートである。
【図5】リンク先候補の検出、リンク目的の決定について説明する説明図である。
【図6】予測モデル学習用データの一例である。
【図7】リンク作成支援10の動作の一例を示すフローチャートである。
【図8】本発明の第2の実施形態によるリンク作成支援12の機能ブロック図である。
【図9】リンク作成支援12の動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0023】
(第1の実施形態)
以下、本発明の第1の実施形態によるリンク作成支援10について説明する。リンク作成支援10は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンク(リンクの作成位置など)を作成者に提示する。なお、リンク目的とは、作成中のコンテンツ内にリンクを作成する際のリンク作成の目的、意図である。リンクを作成する際には、複数のリンク目的が存在し、リンク目的毎に適切なリンク先は異なる。従って、適切なリンク先を決定(推定)するためには、適切なリンク目的を決定(推定)する必要がある。
【0024】
代表的なリンク目的は次の通りである。
・過去記事参照
作成者自身が過去に作成したコンテンツ(過去記事)であって作成中のコンテンツに関連するコンテンツを参照する目的である。換言すえば、「過去記事参照」をリンク目的とするリンクは、過去記事を参照するためのリンクである。
・キーワード解説
特定のキーワードの意味について解説している辞書サイトなどのコンテンツ(解説コンテンツ)を参照する目的である。換言すえば、「キーワード解説」をリンク目的とするリンクは、解説コンテンツを参照するためのリンクである。
・公式サイト参照
企業やサービスなどの公式サイトを参照する目的である。換言すえば、「公式サイト参照」をリンク目的とするリンクは、公式サイトを参照するためのリンクである。
・情報源ページ参照
作成中のコンテンツの記述内容に関連する情報を詳細に伝えているコンテンツや記述内容の根拠となるコンテンツ(情報源ページ)を参照する目的である。換言すえば、「情報源ページ参照」をリンク目的とするリンクは、情報源ページを参照するためのリンクである。
【0025】
以下、リンク作成支援10について図面を参照して説明する。リンク作成支援10は、図1に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部150、予測モデル生成部160、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。
【0026】
入出力部100は、作成中のコンテンツ(作成後に修正するコンテンツも含む)を取得する。入出力部100は、作成中のコンテンツを基準単語抽出部110に供給する。入出力部100は、作成後のコンテンツを過去記事DB191に供給する。また、作成者に対する種々のメッセージを出力する。
【0027】
基準単語抽出部110は、入出力部100から、作成中のコンテンツを取得する。基準単語抽出部110は、作成中のコンテンツを取得した場合、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語(特徴的な単語)を抽出する。具体的には、基準単語抽出部110は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度(アンカーテキストへの含まれやすさ)を示す単語スコアに基づいて、基準単語を抽出する。
【0028】
以下、詳細に説明する。まず、基準単語抽出部110は、作成中のコンテンツ内から、形態素解析によって単語を抽出する。基準単語抽出部110が抽出する単語は、名詞、動詞であって、助詞、助動詞などの機能語は抽出しない。
【0029】
続いて、基準単語抽出部110は、単語DB190を参照し、作成中のコンテンツ内から抽出した単語(名詞、動詞)に単語スコアを付与する。なお、単語DB190には、単語スコア算出部180によって算出された単語スコアが記憶されている。なお、単語スコア算出部180は、既存のコンテンツおよびアンカーテキストを解析し、各単語の単語スコアを算出するが、単語スコアの算出については後述する。
【0030】
続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語を更に抽出(基準単語として抽出)する。なお、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語が0個の場合には、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
【0031】
続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語に対し、単語DB190に格納されている専門用語辞書や百科事典への登録状況およびアンカーテキストの直前や直後に出現する頻度に基づいて、「アンカー単語」「アンカー付属単語」または「アンカー隣接単語」の何れかを示すラベルを付与する。例えば、基準単語抽出部110は、単語スコアが第1の閾値以上であって専門用語辞書に登録されている一般的な単語に相当しない単語には「アンカー中心単語」を示すラベルを付与し、単語スコアが第1の閾値以上であって専門用語辞書に登録されていない一般的な単語に相当する単語には、「アンカー付属単語」を示すラベルを付与する。また、単語スコアが第2の閾値以下であって単語DB190に格納されているアンカーテキストの直前や直後に出現する割合が第3の閾値以上である単語には「アンカー隣接単語」を示すラベルを付与する。
【0032】
なお、アンカー中心単語とは、アンカーテキストに含まれやすく、かつ、アンカーテキストが示す内容の中心事項となりやすい単語である。アンカー中心単語は、単独でアンカーテキストを構成することができる。アンカー中心単語の一例は、企業名、地名、人名などである。アンカー付属単語とは、アンカーテキストに含まれやすく、かつ、一般的な単語である。アンカー付属単語は、単独ではアンカーテキストを構成することができない。アンカー付属単語の一例は、「記事」「発表」などである。アンカー隣接単語とは、アンカーテキストには含まれにくく、かつ、アンカーテキストの直前や直後に出現しやすい単語である。アンカー隣接単語の一例は、「による」の「よる」や「を読んだ」の「読む」といった動詞であり、リンク先の内容をアンカーテキストに明示した後に続く単語である。
【0033】
最後に、基準単語抽出部110は、入出力部100から取得した作成中のコンテンツとともに、基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。なお、基準単語抽出部110は、作成中のコンテンツおよび基準単語(ラベル付)に加え、各基準単語の単語スコアをリンク設定範囲候補抽出部120に供給してもよい。
【0034】
単語スコアの算出について説明する。なお、過去記事DB191には、入出力部100から取得したコンテンツ(過去記事)が格納され、外部取得コンテンツDB192には、ウェブクローリング(web crawling)により収集(取得)された外部のコンテンツが格納されている。単語スコア算出部180は、過去記事DB191および外部取得コンテンツDB192を参照し、ある単語を含むウェブページ、アンカーテキストに出現する単語、ある単語がアンカーテキストに含まれる割合、ある単語のアンカーテキスト内およびアンカーテキスト外の出現位置などの統計情報を解析し、単語スコアを算出する。
【0035】
具体的には、例えば、単語スコア算出部180は、図2に示すように、外部取得コンテンツDB192内の既存のコンテンツの集合および過去記事DB191内の過去記事の集合から、ある単語が出現するコンテンツ数をX、X中で当該単語をアンカーテキスト中に含むコンテンツ数をYとしたとき、Y/Xを当該単語の単語スコアとして算出する。
【0036】
図2の例では、単語毎に、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出しているが、精度向上のため、単語の属性(例えば、地名、人名)を考慮して、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出してもよい。即ち、例えば、単語を構成する文字列と単語の属性の組毎に単語スコアを付与してもよい(例えば、「山口」−「地名」と「山口」−「人名」とで異なる単語スコアを付与する)。また、自分が作成したコンテンツ(過去記事)内におけるアンカーテキストである場合は、他人が作成したコンテンツ内におけるアンカーテキストである場合に比べ、高いスコアを付与してもよい。
【0037】
リンク設定範囲候補抽出部120は、基準単語抽出部110から、作成中のコンテンツとともに、基準単語(ラベル付)を取得する。作成中のコンテンツとともに基準単語を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内から、基準単語を基準にして、リンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出する。リンク設定範囲候補抽出部120は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出してもよい。なお、リンク設定範囲候補抽出部120は、作成中のコンテンツおよび基準単語に加え、各基準単語の単語スコアを基準単語抽出部110から取得した場合には、単語スコアに応じて、または、リンク目的候補および単語スコアに応じて、異なる単語数のリンク設定範囲候補を抽出してもよい。
【0038】
リンク設定範囲候補抽出部120は、リンク目的候補毎にリンク設定範囲候補を抽出した場合、リンク目的候補毎のリンク設定範囲候補をリンク先候補検索部130に供給する。換言すれば、リンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。
【0039】
以下、リンク設定範囲候補の抽出について詳細に説明する。リンク設定範囲候補抽出部120は、基準単語抽出部110において抽出された各ラベルの基準単語に基づき、作成中のコンテンツ内の基準単語(アンカー中心単語、アンカー付属単語、アンカー隣接単語)を基準に、単語を漸次追加(追加制限数nを設定する)し、作成中のコンテンツ上での範囲を漸次拡張し、リンク目的候補毎に、当該作成中のコンテンツから、複数のリンク設定範囲候補(リンク設定範囲候補のパターン)を抽出する。換言すれば、リンク設定範囲候補抽出部120は、図3に示すように、例えば、基準単語W1について、リンク目的候補毎にリンク設定範囲候補のパターンを抽出し、リンク目的候補−リンク設定範囲候補の組を格納するリストLW1を生成する。リンク設定範囲候補抽出部120は、作成中のコンテンツ全体の全基準単語に対し同様の処理を行い、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]を生成する。換言すれば、リンク設定範囲候補抽出部120は、基準単語Wkを基準とした場合、全リンク目的分のリンク設定範囲候補のパターンを抽出する。
【0040】
なお、上記追加制限数nは、リンク目的に応じて異なる値を設定する。リンク目的「キーワード解説」、リンク目的「公式サイト参照」の場合のアンカーテキスト中の単語数は短く、リンク目的「情報源ページ参照」、リンク目的「過去記事参照」の場合のアンカーテキスト中の単語数は長いなどリンク目的とアンカーテキスト中の単語数には相関があるためである。図3に示す例においては、リンク目的「キーワード解説」の場合には、前後1語を追加制限数(追加制限数n=1)とし、リンク目的「情報源ページ参照」の場合には、前後3語を追加制限数(追加制限数n=3)としている。また、単語スコアに応じて異なる値を設定してもよい。但し、追加制限数nにかかわらず、拡張範囲は、当該基準単語の属する一文(句点区切り)の範囲内までとする(同一文内を限度として拡張するものとする)。
【0041】
なお、リンク設定範囲候補抽出部120は、基準単語がアンカー中心単語、アンカー付属単語、アンカー隣接単語であるかを考慮して、リンク設定範囲候補のパターンを抽出してもよい。例えば、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含む場合、当該文においてアンカー中心単語である基準単語を基準(当該アンカー中心単語を基点(軸))としてリンク設定範囲候補のパターンを抽出する。リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語を含む場合、当該文においてアンカー付属単語を基準(当該アンカー付属単語を基点)としてリンク設定範囲候補のパターンを抽出する。また、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語を含む場合、当該文においてアンカー隣接単語を基準(当該アンカー隣接単語の直前または直後の単語を基点)としてリンク設定範囲候補のパターンを抽出する。なお、リンク設定範囲候補抽出部120は、基準単語を含まない場合、当該文からはリンク設定範囲候補のパターンを抽出しない。
【0042】
以下、図4のフローチャートを用いて、リンク設定範囲候補抽出部120による上記動作を説明する。図4において、リンク設定範囲候補抽出部120は、作成中のコンテンツを構成する文のインデックスiを初期化する(ステップS201)。リンク設定範囲候補抽出部120は、作成中のコンテンツからi番目の文を抽出する(ステップS202)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれているか否かを判断する(ステップS203)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていると判断した場合(ステップS203:Yes)、アンカー中心単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS210)。
【0043】
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語Waを含む場合には、基準単語Waを基点としたリンク目的−リンク設定範囲候補を格納するリストLWaを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、あるリンク目的−基準単語Waを格納するLWaを生成する。次に、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Waであるリンク設定範囲候補をLWaに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS210)。
【0044】
一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていないと判断した場合(ステップS203:No)、i番目の文にアンカー付属単語である基準単語が含まれているか否かを判断する(ステップS204)。リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていると判断した場合(ステップS204:Yes)、アンカー付属単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS220)。
【0045】
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語Wbを含む場合には、基準単語Wbを基点としたリンク目的−リンク設定範囲候補を格納するリストLWbを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Wbであるリンク設定範囲候補をLWbに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。なお、LWbは、例えば、上記処理1の1回目の実行時に生成する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS220)。
【0046】
一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていないと判断した場合(ステップS204:No)、i番目の文にアンカー隣接単語である基準単語が含まれているか否かを判断する(ステップS205)。リンク設定範囲候補抽出部120は、i番目の文にアンカー隣接単語である基準単語が含まれていると判断した場合(ステップS205:Yes)、アンカー隣接単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS230)。
【0047】
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語Wcを含む場合には、基準単語Wcの直前または直後の単語を基点としたリンク目的−リンク設定範囲候補を格納するリストLWcを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを0とし、s+1個の単語から構成されるリンク設定範囲候補のうち、s+1番目の単語が基準単語Wcの1個前またはs+1個後の単語であるリンク設定範囲候補をLWcに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を0以上n(追加制限数)以下のsについて繰り返し実行する(ステップS230)。なお、LWcは、例えば、上記処理1の1回目の実行時に生成する。
【0048】
リンク設定範囲候補抽出部120は、アンカー中心単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS210)、アンカー付属単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS220)、アンカー隣接単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS230)、または、i番目の文にアンカー隣接単語である基準単語が含まれていないと判断した場合(ステップS205:No)、インデックスiをカウントアップする(ステップS206)。続いて、リンク設定範囲候補抽出部120は、作成中のコンテンツにインデックスiの文が存在するか否かを判断する(ステップS207)。リンク設定範囲候補抽出部120は、インデックスiの文が存在すると判断した場合(ステップS207:Yes)、ステップS202に戻って次の一文を抽出する。一方、リンク設定範囲候補抽出部120は、インデックスiの文が存在しないと判断した場合(ステップS207:No)、少なくとも1つのリンク設定範囲候補を抽出したか否かを判断する(ステップS208)。
【0049】
リンク設定範囲候補抽出部120は、少なくとも1つのリンク設定範囲候補を抽出したと判断した場合(ステップS208:Yes)、本フローチャートは終了する。一方、リンク設定範囲候補抽出部120は、リンク設定範囲候補を1つも抽出していないと判断した場合(ステップS208:No)、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知し、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージ(例えば、「抽出数0」)出力する(ステップS209)。そして本フローチャートは終了する。
【0050】
リンク先候補検索部130は、リンク設定範囲候補抽出部120から、リンク目的候補毎のリンク設定範囲候補を取得する。リンク目的候補毎のリンク設定範囲候補を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、図5に示すように、リンク目的候補とリンク設定範囲候補の組毎に、リンク先の候補となるリンク先候補を検索する。例えば、図5に示す例において、リンク先候補検索部130は、リンク目的候補「キーワード解説」とリンク設定範囲候補「A」の組について、リンク先候補「K1」「K2」…「K5」を検索している。
【0051】
リンク目的候補とリンク設定範囲候補とに応じた検索方法とは、リンク先候補の検索に際し、リンク目的候補とリンク設定範囲候補とに応じて異なる検索条件(検索文字列)を用いることである。即ち、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に異なる検索条件を生成し、外部のインターネットの汎用検索APIを利用してリンク先候補(リンク先候補であるコンテンツ)を検索する。
【0052】
例えば、リンク先候補検索部130は、リンク目的候補が「キーワード解説」、リンク設定範囲候補が「タイヤ交換」である場合には、「タイヤ交換とは」というような検索文字列を生成し、当該検索文字列の集合(検索文字列全体)を含むコンテンツを検索する。
【0053】
例えば、リンク先候補検索部130は、リンク目的候補が「公式サイト参照」である場合には、リンク設定範囲候補を検索文字列とし、当該検索文字列を含むコンテンツを検索する。
【0054】
例えば、リンク先候補検索部130は、リンク目的候補が「情報源ページ参照」である場合には、例えば、文章中の特徴的な単語や重要とみなされる単語を抽出するアルゴリズムであるTF−IDF(Term Frequency −Inverse Document Frequency)を使用して各単語の重要度を算出し、各単語が含まれる例えば、リンク設定範囲候補の範囲内であるか、リンク設定範囲候補の前後の所定長の文字列の範囲内であるか、その他の作成中のコンテンツ全体内であるかの場所に対応して予め定められた優先順位に基づいて検索に用いる単語(検索文字列)を選択し、当該単語を少なくとも1つ含むコンテンツを検索する。
【0055】
例えば、リンク先候補検索部130は、リンク目的候補が「過去記事参照」である場合には、例えば、過去記事DB191を指定して、リンク目的候補が「情報源ページ参照」である場合と同様にコンテンツを検索する。なお、リンク設定範囲候補または作成中のコンテンツに時間や時期を示す単語(例えば、「昨夜」「昨日」「前回」)が含まれる場合には、上記時間を用いて対象を絞り込んでもよい。
【0056】
リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索した場合、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を第1決定部140に供給する。換言すれば、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。
【0057】
なお、リンク先候補検索部130は、予め定められた件数以上のリンク先候補を検索できなかった場合には、検索条件を変更して予め定められた件数以上のリンク先候補を検索するようにしてもよい。
【0058】
第1決定部140は、リンク先候補検索部130から、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を取得する。換言すれば、第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得する。リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定(採用)する。具体的には、第1決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定する。換言すれば、第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(1つのリンク先に対し1つのリンク目的を決定する)。なお、第1の評価値に係る具体例は後述する。
【0059】
第1決定部140は、例えば、集計後の第1の評価値の高い順に上位N個(Nは2以上)のリンク目的候補をリンク目的として決定してもよい。また、第1決定部140は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定してもよい。
【0060】
第1決定部140は、リンク目的候補からリンク目的を決定した場合、当該リンク目的と当該リンク目的に対応するリンク設定範囲候補とリンク先候補を特定する情報(例えば、URL)とを第2決定部150に供給する。換言すれば、第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。
【0061】
つまり、第1決定部140は、作成中のコンテンツ全体の全基準単語を対象とし、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]について、各基準単語[W1、W2、…]毎にリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。例えば、第1決定部140は、基準単語W1に係るリンク目的候補−リンク設定範囲候補の組を格納するリストLW1からリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。
【0062】
以下、第1の評価値について更に説明する。第1決定部140は、多変量解析によって生成された第1の予測モデルを用いて第1の評価値を算出する。第1の予測モデルは、リンク目的(リンク目的候補)に特化(依存)しない予測モデルである。なお、第1の予測モデルについての詳細は後述する。
【0063】
例えば、基準単語Waを基準として抽出されたリストLWaについて処理を行う場合、まず、第1決定部140は、予測モデルDB193に格納されている第1の予測モデルに、リストLWaの一の組(リンク目的候補−リンク設定範囲候補)と当該組に対応するリンク先候補を入力し、第1の評価値を取得する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」、リンク設定範囲候補「A」、リンク先候補「K1」のURL「http://www.k1/…」を入力し、第1の評価値「0.65」を取得する。第1決定部140は、リストLWa内の他の全ての組について上記処理を同様に行う。
【0064】
次に、第1決定部140は、リンク目的候補毎に第1の評価値の平均値を算出する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」に係る第1の評価値の平均値「0.43」を算出している。次に、第1決定部140は、例えば、最も高い第1の評価値の平均値であるリンク目的候補をリンク目的として決定する。例えば、図5に示す例において、第1決定部140は、最も高い第1の評価値の平均値「0.62」であるリンク目的候補「公式サイト参照」をリンク目的として決定する。以上のようにして、第1決定部140は、基準単語Wa(リストLWa)に係るリンク目的「公式サイト参照」を決定する。第1決定部140は、他の全てのリストについて上記処理を同様に行う。
【0065】
なお、第1決定部140は、精度向上のため、第1の評価値の平均値が所定の閾値以上である場合に、リンク目的として決定するようにしてもよい。所定の閾値以上であるリンク目的候補が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
【0066】
なお、第1決定部140は、リンク先候補以外に、予め構築したリンク目的別のリンク設定範囲の構成パターン(単語ラベルおよび品詞(例えば、名詞、助詞))とのマッチ度を用いて、リンク目的決定時の精度向上および計算量削減を図ってもよい。当該マッチ度は、上記構成パターンに対する、リンク目的候補−リンク設定範囲候補の類似度を示すスコアである。
【0067】
なお、リンク目的(リンク目的候補)とリンク設定範囲候補とリンク先候補の組毎の第1の評価値、または、リンク目的(リンク目的候補)別に集計(平均)した第1の評価値を、第2決定部150によるリンク設定範囲の決定時(後述)に利用してもよい。
【0068】
第2決定部150は、第1決定部140から、リンク目的とリンク設定範囲候補とリンク先候補(リンク先候補を特定する情報(例えば、URL))の組を取得する。リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、当該リンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定(採用)する。具体的には、第2決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定する。換言すれば、第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(1つのリンク先に対し1つのリンク設定範囲を決定する)。なお、第2の評価値に係る具体例は後述する。
【0069】
第2決定部150は、例えば、第2の評価値の高い順に上位M個(Mは2以上)のリンク設定範囲候補をリンク設定範囲として決定してもよい。また、第2決定部150は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定してもよい。
【0070】
第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的とを入出力部110に供給する。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的を作成者に提示(表示)する。
【0071】
また、第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的と、リンク先(当該リンク設定範囲に対応するリンク先候補)とを、入出力部110に供給するようにしてもよい。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に提示(表示)する。
【0072】
以下、第2の評価値について更に説明する。第2決定部150は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出する。第2の予測モデルは、リンク目的に特化(依存)する予測モデルである。なお、第2の予測モデルについての詳細は後述する。
【0073】
例えば、第1決定部140により決定されたリンク目的に係る組のみを含む、リストLWaについて処理を行う場合、まず、第2決定部150は、予測モデルDB193に格納されている、当該リンク目的に特化した第2の予測モデルに、リストLWaの一の組(リンク目的−リンク設定範囲候補)のリンク設定範囲候補と、当該リンク設定範囲に対応するリンク先候補を入力し、第2の評価値を取得する。
【0074】
但し、第2決定部150は、リンク目的を決定する際に利用した第1の評価値を第2の評価値として利用する場合には、図5に示す例において、リンク目的「公式サイト参照」において、リンク設定範囲候補「A」、リンク先候補「K21」のURL「http://www.k21/…」を入力し、第1(第2)の評価値「0.65」を取得する。第2決定部150は、他の全ての組について上記処理を同様に行う。なお、第2決定部150は、第1の評価値を第2の評価値として利用する場合には、該当する第1の評価値を第1決定部140から取得してもよい。
【0075】
次に、第2決定部150は、例えば、最も高い第2の評価値であるリンク設定範囲候補およびリンク先候補の組をリンク設定範囲およびリンク先として決定する。第2決定部150は、他の全てのリストについて上記処理を同様に行う。
【0076】
なお、第2決定部150は、精度向上のため、第2の評価値の平均値が所定の閾値以上である場合に、リンク設定範囲(およびリンク先)として決定するようにしてもよい。所定の閾値以上であるリンク設定範囲(およびリンク先)が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
【0077】
続いて、第1の予測モデルおよび第2の予測モデルについて説明する。第1の予測モデルおよび第2の予測モデルは、予測モデル生成部160によって生成される。予測モデル生成部160は、予測モデル学習用データを用いて、第1の予測モデルおよび第2の予測モデルを生成する。予測モデル学習用データは、例えば、外部取得コンテンツDB192内に記憶される。
【0078】
図6は、予測モデル学習用データの一例である。図6に示す予測モデル学習用データは、既存のコンテンツ中に存在するリンク(とアンカーテキストに対して)に対するリンク先候補1件が1エントリに相当する。また、各カラムは下記の通りである。
(各カラムの内容)
「リンク先候補URL」:検索により取得したリンク先候補のURL
「リンク目的」:各リンク先候補に係るリンク目的(人手にて付与)
「評価値」:各リンク先候補の適切さ(人手にて付与)
「尺度」:リンク元とリンク先候補コンテンツから算出される、リンク先候補のコンテンツ特徴量
【0079】
図6に示す鮮度は、コンテンツの新しさを表す尺度である。鮮度の値は、最終更新日が新しいリンク先候補ほど高い。最終更新日については、例えばリンク先候補のHTTPヘッダに含まれるLast-Modifiedフィールド値を参照する。信頼度は、リンク先候補のコンテンツの信頼性を表す尺度である。信頼度の値は、情報源として信頼できると考えられるWebサイトに属するリンク先候補ほど高い。例えば、信頼できるドメイン(“go.jp”といった政府系ドメイン等)に属するリンク先候補は高い。類似度は、リンク元のコンテンツ本文とリンク先候補のコンテンツ本文とにおける内容の類似度を表す尺度である。類似度の値は、本文の内容がリンク元のコンテンツと類似するリンク先候補ほど高い。URL/タイトル一致度は、リンク元のアンカーテキストに含まれる単語と、リンク先候補のURLまたはタイトルとの一致度を表す尺度である。URL/タイトル一致度の値は、リンク元のアンカーテキストに含まれる単語が、リンク先候補のURLまたはタイトル中に多く含まれるほど高い。
【0080】
予測モデル生成部160は、評価値を目的変数、尺度の値を説明変数とし、多変量解析を行うことで、第1の予測モデルおよび第2の予測モデルを構築する。多変量解析としては、重回帰分析、SVM(Support Vector Machine)、NN(Neural Network)等、種々の方法が利用可能であるが、重回帰分析の例を説明する。なお、説明変数の値(尺度の値)をそれぞれf,r,s,uとし、それぞれの係数(重視する度合い)をa,b,c,dとしたとき、目的変数であるリンク先候補の評価値yは、下記式(1)によって表されるものとする。
【0081】
y=a×f+b×r+c×s+d×u+i…(1)
但し、iは切片である。
【0082】
予測モデル生成部160は、学習用データに重回帰分析を施すことにより、各尺度の重み(a,b,c,d)を算出する。予測モデルは、この算出した重みを用いた数式である。具体的には、予測モデル生成部160は、学習用データ全体を用いて重みを算出して第1の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜8のデータを用いて第1の予測モデルを構築する。また、予測モデル生成部160は、リンク目的固有の学習用データを用いて重みを算出して第2の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜4のデータを用いてリンク目的「キーワード解説」用の第2の予測モデルを構築し、予測モデル生成部160は、図6のNo.5〜8のデータを用いてリンク目的「公式サイト参照」用の第2の予測モデルを構築する。
【0083】
続いて、図7を用いて、リンク作成支援10の動作を説明する。なお、図7に示すフローチャートは、基準単語抽出部110が、入出力部100から作成中のコンテンツを取得することにより開始する。基準単語抽出部110は、作成中のコンテンツ内からリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する(ステップS100)。基準単語を抽出した基準単語抽出部110は、作成中のコンテンツとともに基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。
【0084】
作成中のコンテンツとともに基準単語(ラベル付)を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内からリンク設定範囲候補を抽出する(ステップS200)。なお、当該処理は、図4に示すとおりである。リンク設定範囲候補を抽出したリンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。
【0085】
リンク目的候補−リンク設定範囲候補の組を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に、リンク先候補を検索する(ステップS300)。リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索したリンク先候補検索部130は、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。
【0086】
リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(ステップS400)。基準単語毎にリンク目的を決定した第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。
【0087】
リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(ステップS500)。基準単語毎にリンク設定範囲を決定した第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。
【0088】
リンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に出力(表示)する(ステップS600)。
【0089】
以上、リンク作成支援装置10は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、リンクを作成する範囲などを自動的に提示する、リンク自動作成装置である。リンク作成支援装置10によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク目的/リンク設定範囲、リンク目的、リンク先)を作成者に提示するため、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。なお、作成者の作成スタイルに応じて、ある基準単語について、1つのリンク目的と、1つのリンク設定範囲と、1つのリンク先を作成者に提示する態様としてもよいし、1つのリンク目的と、複数のリンク設定範囲と、各リンク設定範囲に対応するリンク先を作成者に提示する態様としてもよい。
【0090】
(第2の実施形態)
以下、本発明の第2の実施形態によるリンク作成支援12について説明する。リンク作成支援12は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンクを作成中のコンテンツ内に自動的に作成する。
【0091】
以下、リンク作成支援12について図面を参照して説明する。リンク作成支援12は、図8に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部151、予測モデル生成部160、アンカーテキスト設定部170、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。第2決定部151およびアンカーテキスト設定部170以外は、図1に示すリンク作成支援10と同様であるため、説明を省略する。
【0092】
第2決定部151は、第2決定部150と同様、リンク設定範囲候補からリンク設定範囲を決定する。但し、第2決定部151は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定する。即ち、第2決定部151は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定する。
【0093】
第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先(当該リンク設定範囲に対応するリンク先候補)とをアンカーテキスト設定部170に供給する。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先をアンカーテキスト設定部170に供給する。
【0094】
また、第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先と、当該リンク設定範囲に対応するリンク目的とをアンカーテキスト設定部170に供給してもよい。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先およびリンク目的をアンカーテキスト設定部170に供給してもよい。
【0095】
アンカーテキスト設定部170は、例えば、入出力部100または基準単語抽出部110から、作成中のコンテンツを取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先を取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先およびリンク目的を取得してもよい。
【0096】
リンク設定範囲に対応付けてリンク先を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定する。また、リンク設定範囲に対応付けてリンク先およびリンク目的を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定するとともに、当該リンク設定範囲の近傍にリンク目的を表示する(例えば、カーソルを当てた場合に表示するような表示態様であってもよい)。
【0097】
図9は、リンク作成支援12の動作の一例を示すフローチャートである。図9のステップS100、ステップS200、ステップS300、ステップS400、ステップS500は、図7に示すリンク作成支援10の動作と同様である。図9に示すように、リンク作成支援12の場合、アンカーテキスト設定部170が、作成中のコンテンツにおいて、リンク設定範囲にリンク先を設定する(ステップS610)。また、上述の如く、アンカーテキスト設定部170は、リンク設定範囲の近傍にリンク目的を表示する。
【0098】
以上のように、リンク作成支援装置12は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、自動的にリンクを作成(リンクを作成する範囲、および、当該範囲によるリンク先を設定)する、リンク自動作成装置である。リンク作成支援装置12によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク先)を作成中のコンテンツ内に自動的に作成するため、リンク作成時の作成者の負担を更に大幅に軽減させることができるようになる。
【0099】
以上のように、リンク作成支援装置10またはリンク作成支援装置12によれば、作成者はリンク作成時に、アンカーテキストの選択、リンク先コンテンツの検索と選択、URLの転記といった煩雑な作業を必要とせず、リンク作成の負担を無くし(あるいは軽減し)、コンテンツ作成に注力できる。コンテンツ作成開始時に、内容に関して漠としたイメージであっても、本発明が提示する、アンカーテキスト−リンク目的−リンク先コンテンツを参照することにより、具体的な記述を支援することができる。自動的に内容が関連したコンテンツが提示されるため、これを参照することにより、作成者は自身が作成しているコンテンツ中の誤り等を発見可能である。これにより、Web上に誤った情報が公開されることを防ぐことが可能となる。本発明は、リンク目的別に適したコンテンツを推薦するため、これらへのリンクを作成することにより内容の充実を図れる。本発明を利用したコンテンツが多数作成されることにより、Web上に存在するコンテンツのうち、内容が充実しているコンテンツの割合を増加させることができる。これは、通常のWebの検索に対する満足度向上にも貢献する。
【0100】
なお、特許文献1、非特許文献1に記載の技術では、主に、リンク目的という概念しないため、作成者の意図に沿うような最適なリンク位置およびリンク先の提示、または、最適なリンク生成は非常に困難である。
【0101】
なお、本発明の一実施形態によるリンク作成支援装置10、12の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本発明の一実施形態によるリンク作成支援装置10、12の各処理に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0102】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0103】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0104】
10、12 リンク作成支援装置 100 入出力部 110 基準単語抽出部 120 リンク設定範囲候補抽出部 130 リンク先候補検索部 140 第1決定部 150、151 第2決定部 160 予測モデル生成部 170 アンカーテスト設定部 180 単語スコア算出部 190 単語DB 191 過去記事DB 192 外部取得コンテンツDB 193 予測モデルDB

【特許請求の範囲】
【請求項1】
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部と、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定部と、
前記第1決定部によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定部と
を備えることを特徴とするリンク作成支援装置。
【請求項2】
前記第1決定部は、
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク目的候補から前記リンク目的を決定し、
前記第2決定部は、
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク設定範囲候補から前記リンク設定範囲を決定することを特徴とする請求項1に記載のリンク作成支援装置。
【請求項3】
前記第1決定部は、
前記集計後の第1の評価値が最高の前記リンク目的候補を前記リンク目的として決定し、
前記第2決定部は、
前記第2の評価値が最高の前記組の前記リンク設定範囲候補を前記リンク設定範囲として決定することを特徴とする請求項1または請求項2に記載のリンク作成支援装置。
【請求項4】
前記第1決定部は、
多変量解析によって生成された第1の予測モデルを用いて、前記第1の評価値を算出し、
前記第2決定部は、
多変量解析によって生成された第2の予測モデルを用いて、前記第2の評価値を算出することを特徴とする請求項1から請求項3の何れかに記載のリンク作成支援装置。
【請求項5】
前記リンク設定範囲候補抽出部は、
前記リンク目的候補に応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項1から請求項4の何れかに記載のリンク作成支援装置。
【請求項6】
前記基準単語抽出部は、
一の単語が当該単語を含むコンテンツ内において前記リンク設定範囲となる頻度を示す単語スコアに基づいて、前記基準単語を抽出することを特徴とする請求項1から請求項5の何れかの請求項に記載のリンク作成支援装置。
【請求項7】
前記リンク設定範囲候補抽出部は、
前記単語スコアに応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項6に記載のリンク作成支援装置。
【請求項8】
前記単語スコアは、
単語を構成する文字列と単語の属性の組毎に付されていることを特徴とする請求項6または請求項7に記載のリンク作成支援装置。
【請求項9】
前記単語スコアは、
自分が作成したコンテンツ内において前記リンク設定範囲である場合は、他人が作成したコンテンツ内において前記リンク設定範囲である場合に比べ、高いスコアが付されていることを特徴とする請求項6から請求項8の何れかの請求項に記載のリンク作成支援装置。
【請求項10】
作成中のコンテンツ内において、前記リンク設定範囲にリンク先を設定するアンカーテキスト設定部
を更に備え、
前記第2決定部は、
前記第2の評価値に基づいて前記リンク設定範囲候補から一の前記リンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補を前記アンカーテキスト設定部に供給し、
前記アンカーテキスト設定部は、
前記第2決定部から取得した前記リンク設定範囲に、前記第2決定部から取得した前記リンク先候補を設定することを特徴とする請求項1から請求項9に記載のリンク作成支援装置。
【請求項11】
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出手段と、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定手段と、
前記第1決定手段によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定手段と
を備えることを特徴とするリンク作成支援方法。
【請求項12】
リンク作成を支援するリンク作成支援装置のコンピュータに、
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定ステップと、
前記第1決定ステップによって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定ステップと
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−13969(P2011−13969A)
【公開日】平成23年1月20日(2011.1.20)
【国際特許分類】
【出願番号】特願2009−158003(P2009−158003)
【出願日】平成21年7月2日(2009.7.2)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】