記事配置決定装置

【課題】記事の重要度に応じて、適切にコンテンツを配置することのできる記事配置決定装置を提供することを目的とする。
【手段】仮想記事領域生成手段２は、記録部４に記録された各記事の重要度６に基づいた面積を有する仮想記事領域を生成する。仮想記事領域配置手段１０は、生成された仮想記事領域を、仮想平面上に配置する。仮想バネ設定手段１２は、記録部４に記録された記事間の関連度に応じたバネ定数を有する仮想バネを、対応する仮想記事領域間に設定する。仮想記事領域配置決定手段１６は、力合計算出手段による合計力が小さくなるように、仮想平面上に配置された仮想記事領域の配置を変更して、決定する。記事領域配置決定手段１８は、決定された仮想記事領域の配置に基づいて、記事領域の配置を決定する。

【発明の詳細な説明】
【技術分野】
【０００１】
この発明は、複数の記事をその重要度に応じて、適切に自動配置する装置に関するものである。
【背景技術】
【０００２】
インターネットを介して、サーバ装置に記録されているコンテンツを、端末装置にて閲覧することが行われている。この際、閲覧に使用される端末装置としては、ＰＣ、スマートフォン、タブレットなどがあり、その画面の大きさも様々である。
【０００３】
このため、ＰＣのような大画面を有する機器向けに最適に配置したニュース記事などを、スマートフォンなどの小画面しかない機器で閲覧すると、記事全体が表示されなかったり、全体を表示しようとすると極端に文字を小さくしなければならないという問題があった。
【０００４】
また、閲覧する端末装置が決まっていたとしても、記事の配置を人間が手作業で決定することは煩わしかった。
【０００５】
そのため、コンテンツを自動的に配置するための装置が提案されている。たとえば、特許文献１には、コンテンツの再配置を自動的に行う装置が開示されている。この装置では、紙面のテーマに対応したコンテンツを検索し、再配置することができる。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開２００２−３１８１４３号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
しかしながら、特許文献１の装置は、一旦配置された記事を入れ替えたい時などに、その自動的な再配置を行うものであり、最初からレイアウトを決定するものではない。また、記事の重要度に応じて、適切な記事の配置を自動的に決定することはできなかった。
【０００８】
この発明は、上記のような問題点を解決して、記事の重要度に応じて、適切にコンテンツを配置することのできる記事配置決定装置を提供することを目的とする。
【課題を解決するための手段】
【０００９】
(1)(2)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段とを備えている。
【００１０】
したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。
【００１１】
(3)この発明に係る記事配置決定装置は、仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えている。
【００１２】
したがって、配置を変えながら、バネの合計力の変化を見て、適切な配置を選択することができる。
【００１３】
(4)この発明に係る記事配置決定装置は、仮想記事領域生成手段が、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴としている。
【００１４】
したがって、記事配置のシミュレーションを容易に行うことができる。
【００１５】
(5)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、最も重要度の高い仮想記事領域を、記事を配置する平面上の右上または左上に固定して配置することを特徴としている。
【００１６】
したがって、注目度の高い場所に、重要度の高い記事を配置することができる。
【００１７】
(6)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴としている。
【００１８】
したがって、関連度の大きい記事を離さずに配置することが可能となる。
【００１９】
(7)この発明に係る記事配置決定装置は、仮想バネ設定手段が、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴としている。
【００２０】
したがって、両仮想記事領域を離そうとした場合には引力が働くことになり、この引力の合計の大きさを小さくすることで、適切な配置を選択することができる。
【００２１】
(8)この発明に係る記事配置決定装置は、仮想バネ設定手段が、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴としている。
【００２２】
したがって、関連度の高い記事であるほど、離そうとすると大きな引力が働くようにシミュレーションすることができる。
【００２３】
(9)この発明に係る記事配置決定装置は、仮想記事領域配置変更決定手段が、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴としている。
【００２４】
したがって、配置変更により、合計力が小さくなる可能性が高くなる。
【００２５】
(10)(11)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段とを備えている。
【００２６】
したがって、配置変更などを行わなくとも、容易に適切な配置を実現することができる。
【００２７】
(12)この発明に係る記事配置決定装置は、解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段とをさらに備えている。
【００２８】
したがって、単語の重要度に基づいて記事の重要度を算出することができる。
【００２９】
(13)この発明に係る記事配置決定装置は、各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段をさらに備えたことを特徴としている。
【００３０】
したがって、単語に基づいて、両記事間の関連度を算出することができる。
【００３１】
(14)この発明に係る記事配置決定装置は、関連度算出手段が、各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段とを備えている。
【００３２】
したがって、検索サイトを利用して記事間の関連度を算出することができる。
【００３３】
(15)この発明に係る記事配置決定方法は、コンピュータによって平面上における複数の記事配置を決定する方法であって、当該コンピュータは、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、生成された仮想記事領域を仮想平面上に配置し、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴としている。
【００３４】
したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。
【００３５】
「仮想記事領域生成手段」は、実施形態においては、ステップＳ７１がこれに対応する。
【００３６】
「仮想記事領域配置決定手段」は、実施形態においては、ステップＳ２２〜３２、Ｓ４０、Ｓ４１がこれに対応する。
【００３７】
「仮想記事領域配置手段」は、実施形態においては、ランダムに仮想記事領域を配置する処理を実行するＣＰＵ３４がこれに対応する。
【００３８】
「仮想記事領域配置変更決定手段」は、実施形態においては、仮想記事領域の配置を入れ替える処理を実行するＣＰＵ３４がこれに対応する。
【００３９】
「仮想バネ設定手段」は、実施形態においては、ステップＳ２２がこれに対応する。
【００４０】
「力合計算出手段」は、実施形態においては、バネの引力を合計する処理を実行するＣＰＵ３４がこれに対応する。
【００４１】
「記事領域配置決定手段」は、実施形態においては、ステップＳ３３がこれに対応する。
【００４２】
「単語抽出手段」は、実施形態においては、ステップＳ２がこれに対応する。
【００４３】
「重要度算出手段」は、実施形態においては、ステップＳ３〜Ｓ８がこれに対応する。
【００４４】
「関連度算出手段」は、実施形態においては、ステップＳ１０〜Ｓ１８がこれに対応する。
【００４５】
「プログラム」とは、ＣＰＵにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。

【図面の簡単な説明】
【００４６】
【図１ａ】この発明の一実施形態による記事配置決定装置の機能ブロック図である。
【図１ｂ】この発明の一実施形態による重要度・関連度算出装置の機能ブロック図である。
【図２】記事領域配置装置および重要度・関連度算出装置のハードウエア構成である。
【図３】重要度・関連度算出プログラムのフローチャートである。
【図４】重要度・関連度算出プログラムのフローチャートである。
【図５】形態素解析プログラムのフローチャートである。
【図６】形態素解析の結果を示す図である。
【図７】形態素解析の結果を示す図である。
【図８ａ】重要度を算出する課程を示す図である。
【図８ｂ】算出された各記事の重要度を示す図である。
【図９】ＩＤＦ値算出処理のフローチャートである。
【図１０】Ｈｏｔ係数算出処理のフローチャートである。
【図１１】辞書サイトからの返信データを示す図である。
【図１２】Ｈｏｔ係数を算出するための係数表である。
【図１３】記事Ｋ1とＫ2の重要単語を示す図である。
【図１４】算出した関連度を示す図である。
【図１５】記事配置決定プログラムのフローチャートである。
【図１６】記事配置決定プログラムのフローチャートである。
【図１７】記事配置決定プログラムのフローチャートである。
【図１８】大きい順に並べた関連度のテーブルである。
【図１９】仮想記事領域の配置手順を説明するための図である。
【図２０】仮想記事領域の配置手順を説明するための図である。
【図２１】仮想記事領域の配置手順を説明するための図である。
【図２２】仮想記事領域の配置手順を説明するための図である。
【図２３】仮想記事領域の配置手順を説明するための図である。
【図２４】仮想記事領域を記事領域に変形する手順を示すための図である。
【図２５】決定された記事配置を示す図である。
【図２６】仮想バネを示す図である。
【図２７】他の実施形態による仮想記事領域の配置決定を示す図である。
【図２８】要約文生成プログラムのフローチャートである。
【図２９】要約文生成プログラムのフローチャートである。
【図３０】記事の例を示す図である。
【図３１】文に分解した記事を示す図である。
【図３２】各文について算出した重要度を示す図である。
【図３３】生成された要約文を示す図である。
【発明を実施するための形態】
【００４７】
１．記事配置決定装置の機能ブロック図
図１ａに、この発明の一実施形態による記事配置決定装置の機能ブロック図を示す。仮想記事領域生成手段２は、記録部４に記録された各記事の重要度６に基づいた面積を有する仮想記事領域を生成する。仮想記事領域配置手段１０は、生成された仮想記事領域を、仮想平面上に配置する。
【００４８】
仮想バネ設定手段１２は、記録部４に記録された記事間の関連度に応じたバネ定数を有する仮想バネを、対応する仮想記事領域間に設定する。仮想記事領域配置変更決定手段１６は、力合計算出手段による合計力が小さくなるように、仮想平面上に配置された仮想記事領域の配置を変更して、決定する。記事領域配置決定手段１８は、決定された仮想記事領域の配置に基づいて、記事領域の配置を決定する。
【００４９】
図１ｂに、図１ａの記事配置決定装置とともに用いる重要度・関連度算出装置の機能ブロック図を示す。単語抽出手段２２は、記録部４に記録されている各記事２０に含まれる単語を抽出する。重要度算出手段２４は、抽出した単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する。算出した各記事の重要度は、各記事に対応づけて記録される。関連度算出手段２６は、各記事に含まれる単語の重要度に基づいて、各記事間の関連度を算出する。たとえば、両記事における重要度の高い単語を組み合わせて検索サイトにて検索を行い、当該単語の組み合わせによるヒット件数の数によって関連度を決定する。以上のようにして算出された記事の重要度および記事間の関連度は、図１ａの記録部４に記録される。

【００５０】
２．ハードウエア構成
図２に、図１ａ、図１ｂに示す記事配置決定装置および重要度・関連度算出装置のハードウエア構成を示す。ＣＰＵ３４には、メモリ３６、ディスプレイ３８、ハードディスク４０、ＣＤ−ＲＯＭドライブ４２、キーボード／マウス４４、通信回路４６が接続されている。通信回路４６は、インターネットなどに接続するためのものである。
【００５１】
ハードディスク４０には、WINDOWS（商標）などのオペレーティングシステム５０、重要度・関連度算出プログラム５２、記事配置決定プログラム５３、形態素辞書５４、複数の記事２０が記録されている。オペレーティングシステム５０、重要度・関連度算出プログラム５２、記事配置決定プログラム５３は、ＣＤ−ＲＯＭ４８に記録されていたものをＣＤ−ＲＯＭドライブ４２を介して、インストールしたものである。形態素辞書５４には、単語とその品詞が対応づけて記録されている。

【００５２】
３．重要度・関連度算出プログラム
重要度・関連度算出プログラム５２のフローチャートを、図３、図４に示す。ＣＰＵ３４は、ハードディスク４０に記録された記事２０のうち、最初の記事２０を対象記事とする（ステップＳ１）。
【００５３】
ＣＰＵ３４は、記事に含まれる全ての文を対象として、形態素解析を行う（ステップＳ２）。図５に、形態素解析処理の詳細を示す。まず、ＣＰＵ３４は、ハードディスク４０に記録されている形態素辞書５４を参照して、記事の形態素を解析する（ステップＳ２１）。この形態素解析は、従来より行われている一般的な手法を用いることができる。形態素解析の結果を、図６に示す。
【００５４】
次に、ＣＰＵ３４は、通信回路４６を使用して、インターネットを介して、ウエブ上の百科事典や辞書（たとえばWikipedia（商標）やe-Words（商標））にアクセスする。そして、図６に示す形態素解析によって得られた連続する単語を結合し、これをウエブ上の百科事典や辞書、検索サイトにて検索する（ステップＳ２２）。たとえば、「平素」と「は」を結合して「平素は」という単語を生成し、この単語が見出し語としてウエブ上の百科事典や辞書に存在するかどうか、あるいは検索サイトにおいて所定件数以上（たとえば１万件以上）ヒットするかどうかを検索する。たとえば、「平素＋は」「格別＋の」「ＩＴ＋ソリューション」などは、ウエブ上で文節として使用されている例が多くあるので、検索サイトにおける検索で所定件数以上のヒットを得ることができる。また、「電子＋書籍」などの単語は、百科事典や辞書の見出し語として存在する可能性がある。
【００５５】
なお、この実施形態では、文の初めの単語を対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の百科事典・辞書に存在する、または検索サイトにて所定件数以上ヒットするものを抽出する。ＣＰＵ３４は、このようにして抽出した結合単語（たとえば「平素は」）を、図６のテーブルに記録するとともに、結合単語を構成する個々の単語（たとえば「平素」「は」）を図６のテーブルから削除する。これにより、テーブルは、図７に示すようになる。さらに、ＣＰＵ３４は、見いだされた結合単語を、形態素辞書５４に追加登録する。
【００５６】
続いて、抽出された単語の次の単語（抽出されなかった場合は対象単語の次の単語）を次の対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の辞書に存在するものを抽出する。この処理を、文末まで繰り返す。
【００５７】
したがって、この実施形態によれば、形態素辞書５４に登録されていない単語であっても、これを単語として抽出することができる。
【００５８】
続いて、ＣＰＵ３４は、上記で得た単語を結合する処理を行う（ステップＳ２３）。たとえば、名詞が連続する場合にはこれを結合して一つの名詞とする。「福島」「第一」「原子力」「発電所」という４つの名詞が連続する場合、これを「福島第一原子力発電所」とする。同様に、人名の姓と名が連続する場合、これを結合する。その他、形態素の結合として一般に行われている手法を用いて、単語の結合を行う。ＣＰＵ３４は、得られた結合単語（たとえば、「福島第一原子力発電所」）を、図７のテーブルに記録するとともに、結合単語を構成する個々の単語（たとえば、「福島」「第一」「原子力」「発電所」）を図７のテーブルから削除する。
【００５９】
以上のようにして、形態素解析を行うことができる。
【００６０】
(3)ＴＦ値算出
次に、ＣＰＵ３４は、上記にて抽出した単語（この実施形態では名詞を含む単語のみを対象とする）について、ＴＦ(Term Frequency)値を算出する（ステップＳ３）。つまり、図７のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、ＴＦ値を算出する。
【００６１】
ここで、ＴＦ値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。
【００６２】
ＴＦ＝単語の出現回数／各単語の出現回数の合計
図８ａに、各単語について算出したＴＦ値を示す。ＣＰＵ３４は、算出したＴＦ値をハードディスク４０に記録する。
【００６３】
この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。
【００６４】
(4)ＩＤＦ値算出
次に、ＣＰＵ３４は、各単語についてＩＤＦ(Inverse Document Frequency)値を算出する（ステップＳ４）。ここで、ＩＤＦ値は、各単語の希少性（世間に流通している単語として一般的でないこと）を表すものである。当該単語の希少性が高いほど、ＩＤＦ値は高くなる。
【００６５】
この実施形態では、ＩＤＦ値は、以下の式により算出するようにしている。
【００６６】
ＩＤＦ＝ｌｏｇ（当該単語の検索エンジンでのヒット数（ページ数）／検索エンジン上の総ページ数）
図９に、ＩＤＦ値算出処理の詳細を示す。ＣＰＵ３４は、図７のテーブルに記録された最初の単語（この実施形態では名詞を含む単語のみを対象とする）を対象単語とする（ステップＳ４１）。ＣＰＵ３４は、対象単語（たとえば「平素は」）を、インターネット上の検索サイト（たとえばYahoo!（商標）やgoogle（商標）など）にて検索する（ステップＳ４２）。
【００６７】
この検索リクエストに応じて、検索サイトから検索結果が返信されてくるので、ＣＰＵ３４はこれを受信する。ＣＰＵ３４は、検索結果に含まれる対象単語のヒット数（当該単語が含まれるページ数）および検索サイトが対象としている総ページ数を取得し、メモリ３６に記録する（ステップＳ４３）。
【００６８】
続いて、ＣＰＵ３４は、ｌｏｇ（当該単語の検索エンジンでのヒット数（ページ数）／検索エンジン上の総ページ数）を計算して、ＩＤＦ値を算出する（ステップＳ４４）。ＣＰＵ３４は、算出したＩＤＦ値を、各単語に対応づけてハードディスク４０に記録する（図８ａ参照）。
【００６９】
ＣＰＵ３４は、すべての単語についてＩＤＦ値を算出したかどうかを判断する（ステップＳ４５）。図７のテーブルにおいて未処理の単語が残っていれば、ＣＰＵ３４は、次の単語を対象単語とする（ステップＳ４６）。そして、ステップＳ４２以下を繰り返す。このようにして、対象となる全ての単語についてＩＤＦ値を算出する。
【００７０】
(5)ＴＦ−ＩＤＦ値算出
続いて、ＣＰＵ３４は、各単語につき、算出したＴＦ値とＩＤＦ値に基づいて、ＴＦ−ＩＤＦ値を計算する（ステップＳ５）。この実施形態では、ＴＦ値とＩＤＦ値との積を算出することにより、ＴＦ−ＩＤＦ値を算出するようにしている。
【００７１】
(6)Ｈｏｔ係数算出
続いて、ＣＰＵ３４は、Ｈｏｔ係数を算出する（ステップＳ６）。ここで、Ｈｏｔ係数とは、対象となる単語の現在における注目度を表す指数である。この実施形態では、ウエブ上の辞書において対象単語を検索し、当該対象単語がどの程度の頻度で、どの程度現在に近い時間で更新されているかを取得し、これに基づいて算出するようにしている。
【００７２】
具体的には、当該単語について、最新の更新日から所定件数（たとえば１００件）の更新日を取得し、これら更新日の平均日を算出して、現在の日との差を求める。この差が小さいほど、Ｈｏｔ係数を大きくする。
【００７３】
図１０に、Ｈｏｔ係数算出処理の詳細を示す。ＣＰＵ３４は、図７のテーブルに記録された最初の単語（この実施形態では名詞を含む単語のみを対象とする）を対象単語とする（ステップＳ６１）。ＣＰＵ３４は、対象単語を、インターネット上の辞書（ウエブ辞書）にアクセスし検索する（ステップＳ６２）。
【００７４】
対象単語が見出し語として存在すれば、当該対象単語に対する説明などのデータが返信されてくる。見出し語として存在しなければ、存在しない旨（あるいはエラー）が返信されてくる。ＣＰＵ３４は、これを受けて、対象単語がウエブ上の辞書に見出し語として存在するかどうかを判断する（ステップＳ６３）。
【００７５】
見出し語として存在する場合、ＣＰＵ３４は、返信されてきた解説データ中に記録されている更新日を、最新のものから所定件数（ここでは１００件）取得する（ステップＳ６４）。
【００７６】
図１１に、返信されてくる解説データの例を示す。見出し語、内容などの項目の他、更新日の項目が設けられている。この更新日には、内容等について更新が行われた履歴が順に示されている。ＣＰＵ３４は、この更新日を最新のものから１００件取得する。なお、更新が１００件以下の場合には、当該単語のＨｏｔ係数を１．０として、ステップＳ６８に進む。
【００７７】
次に、ＣＰＵ３４は、取得した１００件の更新日の平均日を算出する。次に、ＣＰＵ３４は、現在日（内部時計に基づく）と平均日との差（絶対値）を算出する（ステップＳ６６）。さらに、算出した差に基づいてＨｏｔ係数を算出する（ステップＳ６７）。
【００７８】
この実施形態では、ハードディスク４０に予め記録された係数テーブル（図１２参照）に基づいてＨｏｔ係数を決定する。たとえば、算出した差が１０日であれば、Ｈｏｔ係数は２．６として決定される。ＣＰＵ３４は、算出したＨｏｔ係数を、対象単語に対応づけて記録する（図８ａ参照）。
【００７９】
ＣＰＵ３４は、すべての単語についてＨｏｔ係数を算出したかどうかを判断する（ステップＳ６８）。図７のテーブルにおいて未処理の単語が残っていれば、ＣＰＵ３４は、次の単語を対象単語とする（ステップＳ６９）。そして、ステップＳ６２以下を繰り返す。このようにして、対象となる全ての単語についてＨｏｔ係数を算出する。
【００８０】
なお、対象単語がウエブ上の辞書に見出し語として存在しない場合には、Ｈｏｔ係数を１．０とする（ステップＳ７０）。
【００８１】
(7)重要度・関連度の算出
ＣＰＵ３４は、各単語につき、ＴＦ−ＩＤＦ値にＨｏｔ係数を乗じて、重要度を算出する（図３のステップＳ７）。ＣＰＵ３４は、このようにして算出した重要度を、対象単語に対応づけて記録する（図８ａ参照）。続いて、ＣＰＵ３４は、対象記事に含まれる単語の重要度を総合計し、記事の重要度を算出する（ステップＳ８）。ＣＰＵ３４は、算出した重要度を、対応する記事に関連づけてハードディスク４０に記録する（図８ｂ参照）。
【００８２】
続いて、ＣＰＵ３４は、全ての記事について処理をしたかどうかを判断する（ステップＳ９）。未処理の記事が残っていれば、次の記事を対象記事とする（ステップＳ１９）。全ての記事について処理をしたのであれば、ＣＰＵ３４は、記事間の関連度の算出処理に移る。
【００８３】
ＣＰＵ３４は、まず、ｉ＝１、ｊ＝ｉ＋１に設定する（ステップＳ１０）。次に、記事Ｋ1（数字は、ハードディスク４０に記録された記事の順序を表す）に含まれる単語のうち、重要度の高いものから１０語を抽出する（ステップＳ１１）。また、記事Ｋ2に含まれる単語のうち、重要度の高いものから１０語を抽出する（ステップＳ１２）。ここでは、図１３に示すように、記事Ｋ1の重要単語と、記事Ｋ2の重要単語が選択されたものとする。
【００８４】
次に、ＣＰＵ３４は、記事Ｋ1の重要単語の一つと、記事Ｋ2の重要単語の一つとを組み合わせ、当該組み合わせた用語について、通信回路４６を介して、インターネット上の検索エンジンにて検索を行う。ＣＰＵ３４は、検索結果として送られてくるヒット数を取得する（ステップＳ１３）。このような検索を、記事Ｋ1の重要単語と、記事Ｋ2の重要単語のすべのて組合せについて行う。したがって、ここでは、１０×１０＝１００件の検索が行われることになる。
【００８５】
ＣＰＵ３４は、これら検索結果としてのヒット数を合計し、合計ヒット件数を記事Ｋ1と記事Ｋ2の関連度Ｒ1,2として２５億ヒット（億の単位にて四捨五入）をハードディスク４０に記録する（ステップＳ１４）。
【００８６】
次に、ｊをインクリメントし（ステップＳ15）、記事Ｋ1と記事Ｋ3の関連度Ｒ1,3を、上記と同様の処理によって算出する（ステップＳ10〜Ｓ14）。この処理を繰り返し、記事Ｋ1と記事Ｋ5の関連度Ｒ1,5までを算出すると（つまり、ｊ＝５を超えると）、ＣＰＵ３４はｉをインクリメントする（ステップＳ１６、Ｓ１７）。また、ｊをｉ＋１とする（ステップＳ１７）。これにより、ｉは２、ｊは３となる。
【００８７】
ＣＰＵ３４は、ステップＳ１１以下を繰り返す。これにより、関連度Ｒ2,3、Ｒ2.4、Ｒ2,5が算出されることになる。さらに、ｉがインクリメントされ、関連度Ｒ3,4、Ｒ3,5が算出される。つづいて、関連度Ｒ4,5が算出される。以上のようにして、各記事の重要度および各記事間の関連度が算出される。
【００８８】
(8)記事の配置
次に、ＣＰＵ３４は、記事配置決定プログラム５３に基づき、各記事の配置を決定する。記事配置決定プログラム５３のフローチャートを図１５〜図１７に示す。この実施形態では、記事間の関連度の大きさに比例した仮想バネが仮想記事領域間に設けられているものとし、仮想記事領域を配置した際の仮想バネの引力の合計が小さくなるように配置するようにしている。
【００８９】
まず、ＣＰＵ３４は、各記事の重要度に比例した大きさの仮想記事領域を円として生成する（ステップＳ７１）。次に、ＣＰＵ３４は、関連度Ｒの大きい順に記事ＫiとＫjのペアをテーブルに記憶する（ステップＳ７２、図１８参照）。また、ＣＰＵ３４は、これら記事ペアの間に、関連度の大きさに応じたバネ定数を有する仮想バネをかける。
【００９０】
この実施形態では、図２６Ａに示すように、２つの仮想記事領域が接している状態において、仮想バネが自然長の状態となるように、仮想バネを仮想記事間にかけるようにしている。仮想記事領域が離れると、バネ定数の大きさに応じた引力が働くことになる。つまり、関連性の大きい記事ペアを離すと、仮想バネに大きな引力が生じることになる。
【００９１】
そこで、この実施形態では、仮想記事領域を配置したときの仮想バネの引力の合計が小さくなるように、配置を決定するようにしている。これにより、関連性の高い記事が近くの位置にあるように配置されることになる。
【００９２】
次に、ＣＰＵ３４は、最も重要度の高い記事に対応する仮想記事領域を、仮想平面の右上に配置する（ステップＳ７３、図１９Ａ参照）。ここでは、記事Ｋ1の重要度が最も高いものとして説明を進める。図１９Ａに示すように、記事Ｋ1に対応する仮想記事領域が仮想平面の右上に配置されることになる。なお、仮想平面は、記事を表示するための領域に対応して設定した仮想的な平面である。記事表示領域（端末装置のディスプレイの大きさ）の大きさ（縦・横）に比例して、仮想平面の大きさ（縦・横）も変化するように設定している。なお、この実施形態では、重要度の最も高い記事は、最も注目度の高い右上の場所に固定するものとしている。
【００９３】
次に、図１８のテーブル中から、最も関連度の高い記事のペアを読み出す（ステップＳ７４）。ここでは、記事Ｋ1と記事Ｋ5のペアが選択される。ＣＰＵ３４は、選択した記事ペアの少なくとも一方が、すでに、仮想平面に配置されているか否かを判断する（ステップＳ７５）。ここでは、記事Ｋ1が既に配置されているので、ステップＳ７６に進む。ステップＳ７６においては、取得した記事ペアを仮想平面に配置する。なお、配置の際に、新たに配置される記事については、ペアの記事と接するように、しかも可能な限り右上に近い位置となるように配置する（この実施形態では、上よりも右側であることを優先する）。
【００９４】
ここでは、図１９Ｂに示すように、仮想バネがかけられた記事Ｋ1と記事Ｋ5が配置されることになる。なお、記事Ｋ1は既に配置済みであるから改めて配置はしない。なお、配置の際には、互いの仮想記事領域は重なり合わないようにする。
【００９５】
上記のようにして記事ペアを配置すると、ＣＰＵ３４は、当該記事ペアを図１８のテーブルから削除する（ステップＳ７７）。次に、ＣＰＵ３４は、別置きされた記事が、仮想平面上にあるかどうかを判断する（ステップＳ７８）。ここでは、別置きした記事はないので、ステップＳ８０に進む。
【００９６】
ステップＳ８０において、ＣＰＵ３４は、図１８のテーブルに記事ペアが残っているかどうかを判断する。ここでは、まだ記事ペアが残っているので、ステップＳ７３に戻る。
【００９７】
ステップＳ７３においては、図１８のテーブルに残った記事ペアのうち、最も関連度の高いものを選択する。ここでは、記事ペアＫ3、Ｋ5が選択される。この記事ペアＫ3、Ｋ5のうち記事Ｋ5が既に仮想平面に配置されているので、この記事ペアを、仮想平面に配置する（ステップＳ７５、Ｓ７６）。ここでは、図２０Ａのように、記事Ｋ5との間に仮想バネがかけられた記事Ｋ3が配置されることになる。
【００９８】
上記の処理を終えると、次に、ＣＰＵ３４は、図１８のテーブルから記事ペアＫ1、Ｋ3を読み出して配置する。ここでは、図２０Ａに示すように、既に記事Ｋ1および記事Ｋ3がともに配置されているので、記事Ｋ1と記事Ｋ3との間に仮想バネをかける処理を行うことになる。
【００９９】
上記の処理を繰り返すことにより、すべての記事Ｋ1〜Ｋ5を仮想平面に配置する。これにより、図２０Ｂに示すように、互いに仮想バネのかけられた記事Ｋ1〜Ｋ5が配置されることになる。
【０１００】
なお、上記にて説明した図１８のテーブルとは異なるテーブルにて処理を行った場合の処理について、以下にいくつかの例を示す。たとえば、図２１Ａに示すように、記事Ｋ1とＫ5のペア、記事Ｋ1とＫ2のペア、記事Ｋ2とＫ3のペアを配置したものとする。この配置状態において、テーブルから記事Ｋ2とＫ5のペアを読み出した場合には、Ｋ3を矢印の方向に移動させるとともに、Ｋ2をＫ3に接するように矢印の方向に回転させる。このようにして、図２１Ｂのように配置する。
【０１０１】
また、図２２Ａに示すように、記事Ｋ3を配置しようとする際に、記事Ｋ3が仮想空間からはみ出る場合、はみ出ない位置を探し出して配置する。あるいは、図２２Ｂに示すように、できるだけはみ出る面積が小さくなるような位置を探し出して配置する。
【０１０２】
また、テーブルから読み出した記事ペアのいずれもが、仮想空間に配置されていない場合には、当該記事ペアを別置きしておく（ステップＳ７５、Ｓ９０、Ｓ９１）。たとえば、図２３Ａに示すように、記事Ｋ1とＫ5が配置されている状態で、記事Ｋ3とＫ4のペアをテーブルから読み出したとする。この場合には、記事Ｋ3とＫ4のペアを、図２３Ａに示すように別置きしておく。
【０１０３】
別置きした記事ペアのいずれかが、仮想空間内に配置されれば、当該別置きしておいた記事ペアを仮想空間に配置する（ステップＳ７８、Ｓ７９）。たとえば、図２３Ａの状態において、テーブルから記事ペアＫ1、Ｋ4が読み出され、記事Ｋ4が配置されたとする（図２３Ｂ参照）。いま、記事Ｋ4は記事Ｋ3とともに別置きされているので、これらペアを仮想空間に配置する。配置の仕方は、通常のペアを配置する場合と同様である。
【０１０４】
以下、図１８のテーブルに従った説明に戻る。図１８のテーブルに記事ペアが残っていなければ、ＣＰＵ３４は、ステップＳ８０からステップＳ８１に進む。ステップＳ８１においては、別置きされた記事が残っているかどうかを判断する。別置きされた記事が残っていれば、それら全てを、仮想平面において、他の記事と重複せず、しかもできるだけ右上に近くなるように配置する（ステップＳ８２）。
【０１０５】
以上のようにして、全ての記事の仮想記事領域について配置を終えると、円形の記事領域を矩形または矩形の組合せからなる記事領域に変形し、記事領域を決定する（ステップＳ８３）。矩形への変形は、中心を変えずに、同じ面積を有する正方形に置き換える（所定比率の矩形を予め定義しておいてもよい）。たとえば、図２４Ａに示す場合であれば、図２４Ｂに示すように変形されることになる。
【０１０６】
続いて、ＣＰＵ３４は、記事領域の重複部分を回避し、また、記事領域間の隙間を埋めるように、各記事領域を変形する。このようにして、図２５に示すような記事領域を得ることができる。

【０１０７】
４．その他の実施形態
(1)上記実施形態では、２つの記事の重要単語の組合せにより検索を行い、そのヒット件数の合計によって関連度を算出するようにしている。しかしながら、次のようにして、関連度を算出するようにしてもよい。一方の記事の重要単語が、他方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これで、一方の記事から、他方の記事への関連度を得ることができる。次に、他方の記事の重要単語が、一方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これにより、他方の記事から、一方の記事への関連度を得ることができる。最後に、一方の記事から他方の記事への関連度と、他方の記事から一方の記事への関連度を合計して、関連度を得る。
【０１０８】
(2)上記実施形態では、バネ定数の大きい（すなわち関連度の高い）記事ペアから順に、仮想空間に配置するようにしている。このようにすることで、バネの引力が小さくなるような配置を目指している。
【０１０９】
しかし、仮想記事領域を配置した状態において、各仮想バネに働く引力を計算し、仮想バネに働く引力の合計が小さくなるように、仮想記事領域を入れ替えるようにして、配置を決定するようにしてもよい。
【０１１０】
たとえば、最も重要度の高い記事Ｋ1の仮想記事領域を右上に配置した後、他の記事の仮想記事領域をランダムに配置する。この状態を示すのが、図２７である。
【０１１１】
ここで、ＣＰＵ３４は、各記事間のバネ定数に基づき、各バネに働く引力を合計する。つまり、下式にて力の合計Ｆを算出する。
【０１１２】
Ｆ＝Ｆ1,2＋Ｆ1,3＋Ｆ1,4＋Ｆ1,5＋Ｆ1,6＋Ｆ2,3＋Ｆ2,4＋Ｆ2,5＋Ｆ2,6＋Ｆ3,4＋Ｆ3,5＋Ｆ3,6＋Ｆ4,5＋Ｆ4,6＋Ｆ5,6
ここで、Ｆi,jは、記事ＫiとＫjに働く引力であり、記事ＫiとＫjとの間にかけられた仮想バネのバネ定数ｐi,jと、記事ＫiとＫjの互いの外周面がどれだけ離れているかを示す距離ｘi,jとの積によって求められる（図２６Ｂ参照）。
【０１１３】
次に、ＣＰＵ３４は、上記のＦ1,2、Ｆ1,3、Ｆ1,4、Ｆ1,5、Ｆ1,6、Ｆ2,3、Ｆ2,4、Ｆ2,5、Ｆ2,6、Ｆ3,4、Ｆ3,5、Ｆ3,6、Ｆ4,5、Ｆ4,6、Ｆ5,6のうち、最も大きいものを選択する。たとえば、Ｆ2,5が最も大きいとする。つまり、記事Ｋ2と記事Ｋ5の間に最も大きな力が働いていることがわかる。したがって、記事Ｋ2と記事Ｋ5を近づけるように配置替えすることで、合計の力Ｆを小さくできる可能性があることになる。つまり、より関連性の高い記事を近くに配置できる可能性があることになる。
【０１１４】
ＣＰＵ３４は、記事Ｋ2と記事Ｋ5の双方に対して、０より大きい力で引き合う記事を探し出す。たとえば、記事Ｋ6は記事Ｋ2と接しており引力は０である、同様に、記事Ｋ3は記事Ｋ5と接しており引力は０である。したがって、記事Ｋ2、Ｋ5のいずれとも接していない記事Ｋ4だけがこの条件に合致するものとして選択されることになる。なお、固定配置される記事Ｋ1は、ここでは対象としない。
【０１１５】
ＣＰＵ３４は、最も大きな力が働いている記事Ｋ2、Ｋ5と、選択した記事Ｋ4とを入れ替えて、合計の力Ｆを再計算する。つまり、選択した記事Ｋ4と記事Ｋ2の場所を入れ替える。そして、合計の力Ｆを再計算する。同様にして、記事Ｋ4と記事Ｋ5の場所を入れ替え、合計の力Ｆを再計算する。
【０１１６】
そして、元の配置、記事Ｋ4とＫ2を入れ替えた配置、記事Ｋ4とＫ5を入れ替えた配置のうち、力Ｆが最も小さい配置を選択する。
【０１１７】
最も力Ｆが小さい配置が元の配置であれば、ＣＰＵ３４は、元の配置が好ましい配置であるとして決定する。記事Ｋ4とＫ2を入れ替えた配置または記事Ｋ4とＫ5を入れ替えた配置が最も力Ｆが小さい配置であれば、当該配置において、最も大きな引力の働く記事間の組合せを見いだし、上記の処理を繰り返す。このようにして、ある程度、力Ｆが小さくなる配置を決定することができる。
【０１１８】
上記実施形態では、最も大きな力が働いている記事Ｋ2と記事Ｋ5の双方に対して、０より大きい力で引き合う記事を探し出し、当該記事の仮想記事領域と入れ替えを行うようにしている。しかし、図２７において、記事Ｋ6、Ｋ3も入れ替えを行う対象として選択するようにしてもよい。記事Ｋ6はＫ2に接しているがＫ5に接しておらず、記事Ｋ3はＫ5に接しているがＫ2に接しておらず、しかも、Ｋ6とＫ3は接していないからである。つまり、Ｋ2、Ｋ3、Ｋ6、Ｋ5の経路にて力が０ではない状態の仮想バネにてつながっているからである。
【０１１９】
この場合、ＣＰＵ３４は、記事Ｋ3の仮想記事領域と記事Ｋ2の仮想記事領域を入れ替え、記事Ｋ6の仮想記事領域と記事Ｋ5の仮想記事領域とを入れ替えて、合計力の変化を見ることになる。
【０１２０】
また、上記実施形態では、ランダムに仮想記事領域を配置するようにしている。しかし、図１５、図１６に示す処理にて仮想記事領域を配置した後、上記の入れ替えを行うようにしてもよい。
【０１２１】
さらに、上記実施形態では、入れ替えによって力Ｆの小さくなる配置を探し出している。しかし、最も重要度の大きい記事の仮想記事領域を固定配置した後、他の仮想記事領域をかなり離れた位置に仮配置し、仮想バネの力によって自然に収まる位置に決定するようにしてもよい。この場合、他の仮想記事領域（固定記事領域以外の仮想記事領域）は、移動中においての重なり合いを許容するようにする。ただし、固定配置された仮想記事領域と接した瞬間に、他の仮想記事領域との重なり合いを禁止するようにする。
【０１２２】
上記では、ステップＳ２４、Ｓ４０、Ｓ４１において、仮想空間に配置されていない記事ペアの別置きの方法を説明した。しかし、当該記事ペアを別置きせずに、既に配置されている記事群に接するように配置し（この段階では、当該記事ペアと既に配置されている記事群との間には仮想バネを設けない）、最後に上記の入れ替えによって仮想バネに働く引力の合計が小さくなるようにしてもよい。
【０１２３】
なお、上記では、バネ定数ｋによる仮想バネの引力をＦ＝ｋ×ｘとしたが、Ｆがｋおよびｘの単調増加関数となるようにすればよい。たとえば、Ｆ＝ｋ×log（ｘ）とすれば、距離の影響をより小さく評価することができる。
【０１２４】
ＣＰＵ３４が、このようなシミュレーションを行うことで、よりバネ定数の大きい仮想記事領域が早く固定配置された仮想記事領域に接することになり、適切な配置を実現することができる。
【０１２５】
(3)上記実施形態では、右上に記事領域を固定的に配置している。これは、縦書きの記事において、右上が最も注目度が高いからである。横書きの場合には、左上に配置するようにしても良い。
【０１２６】
(4)上記実施形態では、仮想記事領域として円を用いたが、矩形、三角、六角などの他の図形を用いるようにしても良い。
【０１２７】
(5)上記実施形態では、固定的に配置された仮想記事領域を設けている。しかし、全ての仮想記事領域を移動可能にしてもよい。

【０１２８】
５．要約文生成プログラム
上記実施形態では、記事の重要度・関連度に応じた記事領域の配置について説明した。このようにして配置した各記事領域には、当該記事を表示することになる。ただし、記事領域に表示できる文字数（文字フォントの大きさと記事領域の大きさによって決まる）よりも、記事の文字数が多い場合には、記事の内容を全て表示することができない。そこで、記事領域に表示できる文字数内の要約を作成し、これを記事領域に表示する必要が生じる。
【０１２９】
以下、要約文生成プログラムのフローチャートを、図２８、図２９に示す。
【０１３０】
(1)文の抽出
ＣＰＵ３４は、ステップＳ１０１において、ハードディスク４０に記録された記事の文章データから、文を抽出する（ステップＳ１０１）。この実施形態では、句点（「。」や「．」）に基づいて、文を抽出するようにしている。すなわち、句点が見いだされるまでを一つの文として抽出する。
【０１３１】
たとえば、図３０に示すような文章データ（記事）であれば、図３１に示すように、文番号「１」〜「６」までの６つの文が抽出されることになる。ＣＰＵ３４は、このようにして抽出した文を、順番を示す文番号とともにハードディスク４０に記録する。この際、ＣＰＵ３４は、各文の文字数を併せて記録する。
【０１３２】
(2)形態素解析
次に、ＣＰＵ３４は、文章データに含まれる全ての文を対象として、形態素解析を行う（ステップＳ１０２）。形態素解析処理の詳細は、図５に示すものと同様である。形態素解析の結果を、図７に示す。
【０１３３】
(3)ＴＦ値算出
次に、ＣＰＵ３４は、上記にて抽出した単語（この実施形態では名詞を含む単語のみを対象とする）について、ＴＦ(Term Frequency)値を算出する（ステップＳ１０３）。つまり、図７のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、ＴＦ値を算出する。
【０１３４】
ここで、ＴＦ値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。
【０１３５】
ＴＦ＝単語の出現回数／各単語の出現回数の合計
図８ａに、各単語について算出したＴＦ値を示す。ＣＰＵ３４は、算出したＴＦ値をハードディスク４０に記録する。
【０１３６】
この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。
【０１３７】
(4)ＩＤＦ値算出
次に、ＣＰＵ３４は、各単語についてＩＤＦ(Inverse Document Frequency)値を算出する（ステップＳ１０４）。ＩＤＦ算出処理の詳細は、図９に示すものと同様である。ＣＰＵ３４は、算出したＩＤＦ値を、各単語に対応づけてハードディスク４０に記録する（図８ａ参照）。
【０１３８】
(5)ＴＦ−ＩＤＦ値算出
続いて、ＣＰＵ３４は、各単語につき、算出したＴＦ値とＩＤＦ値に基づいて、ＴＦ−ＩＤＦ値を計算する（ステップＳ１０５）。この実施形態では、ＴＦ値とＩＤＦ値との積を算出することにより、ＴＦ−ＩＤＦ値を算出するようにしている。
【０１３９】
(6)Ｈｏｔ係数算出
続いて、ＣＰＵ３４は、Ｈｏｔ係数を算出する（ステップＳ１０６）。Ｈｏｔ係数算出処理の詳細は、図１０に示すものと同様である。ＣＰＵ３４は、算出したＨｏｔ係数を、対象単語に対応づけて記録する（図８ａ参照）。
【０１４０】
(7)重要度の算出
ＣＰＵ３４は、各単語につき、ＴＦ−ＩＤＦ値にＨｏｔ係数を乗じて、重要度を算出する（ステップＳ１０７）。ＣＰＵ３４は、このようにして算出した重要度を、対象単語に対応づけて記録する（図８ａ参照）。
【０１４１】
次に、ＣＰＵ３４は、各単語の重要度に基づいて重要単語を決定する（ステップＳ１０８）。この実施形態では、単語の重要度の平均値を算出し、この平均値を超える重要度を有する単語を重要単語として抽出している。たとえば、図８ａに示す場合であれば、単語の重要度の平均値は11.40135438である。したがって、ＣＰＵ３４は、この平均値を超える重要度を有する単語「電子書籍」「図書館」「書籍」・・・「利用価値」を重要単語として選択することになる。
【０１４２】
次に、ＣＰＵ３４は、各文のうち重要単語が含まれる文について重要度を算出する。重要度は、当該文に含まれる各単語の重要度を合計することによって算出する（ステップＳ１０９）。たとえば、図３１に示す文章の第１文「平素は、・・・申し上げます。」には、重要単語が含まれていないので、第１文についての重要度は算出しない。第２文「当社は従来より・・・参りました。」には、重要単語「当社」「図書館」「書籍」がふくまれているので重要度を算出する。ＣＰＵ３４は、各単語の重要度を図８ａを参照して取得し、これを合計して重要度57.83187を得る。
【０１４３】
ＣＰＵ３４は、算出した各文の重要度を、各文に対応づけてハードディスク４０に記録する（図３１参照）。
【０１４４】
(8)要約文の生成
次に、ＣＰＵ３４は、算出した各文の重要度に基づき、最も重要度の高い文を抽出する（ステップＳ１１０）ここでは、図３１に示す第４文の重要度が最も高いので、第４文が選択される。ＣＰＵ３４は、選択した文の文字数の合計が、予め定められた指定文字数を超えているかどうかを判断する（ステップＳ１１１）。ここでは、記事領域に表示できる文字数が指定文字数となる。ここでは、指定文字数が、２５０文字であるとして説明を進める。
【０１４５】
第４文の文字数は、６２文字である（図３１参照）。したがって、指定文字数である２５０文字を超えていないので、ステップＳ１２に進む。ステップＳ１２では、次に重要度の高い文を抽出する。ここでは、第５文が選択されることになる。第５分の文字数は９７文字である。したがって、選択された文の合計文字数は、６２文字と９７文字を合計して、１６０文字となる。よって、指定文字数である２５０文字を超えていないので、ステップＳ１１１からステップＳ１１２に進む。
【０１４６】
ステップＳ１１２では、さらに次に重要度の高い文を抽出する。このような処理を、選択された文の合計文字数が指定文字数２５０文字を超えるまで繰り返す。ここでは、第４文（６２文字）、第５文（９７文字）、第３文（７４文字）、第２文（５６文字）を抽出した時点で、合計文字数が２８９文字となって指定文字数を超える。
【０１４７】
指定文字数を超えると、ＣＰＵ３４は、最後に抽出した文を抽出文から外す（ステップＳ１１３）。ここでは、第２文が最後に抽出した文であるから、第２文を抽出したものから外す。その結果、図３２に示すように、第４文、第５文、第３文が抽出されることになる。
【０１４８】
次に、ＣＰＵ３４は、抽出した文を、元の文章における順番（つまり文番号の若い順）に従って並び替える（ステップＳ１１４）。これにより、図３３に示すような順番の抽出文を得ることができる。
【０１４９】
ＣＰＵ３４は、このようにして並び替えた抽出文を要約として出力する（ステップＳ１１５）。ここでは、図３３に示す「書籍の電子化が・・・繋げたいと考えております。」という要約を、対応する表示領域に出力する。
【０１５０】
以上の処理を、全ての表示領域について行う。これにより、各表示領域には、対応する記事の要約文が表示される。なお、ＣＰＵ３４は、要約文とともに、記事全文へのリンク情報を表示するようにしている。

【０１５１】
６．その他の実施形態
(1)上記実施形態では、ＴＦ値（強調度）、ＩＤＦ値（希少度）、Ｈｏｔ係数（注目度）に基づいて単語の重要度を算出するようにしている。しかしながら、これらのうちのいずれか一つを用いて重要度を算出したり、これらのうちのいずれか二つを組み合わせて重要度を算出するようにしてもよい。
【０１５２】
(2)上記実施形態では、当該文章における単語の出現回数に基づいて単語の強調度を算出するようにしている。しかし、文章中における単語の出現位置に基づいて、単語の強調度を判断するようにしてもよい。たとえば、文の後ろの方に出てくる単語の方が強調度を高くするようにしてもよい。さらに。出現回数と出現位置とを組み合わせて強調度を算出するようにしてもよい。
【０１５３】
(3)上記実施形態では、検索サイトにおける当該単語のヒット数と、検索対象の全ページ数との比率に基づいて希少度（ＩＤＦ値）を算出するようにしている。しかし、辞書や百科事典（ウエブ上にあるものローカルにあるものを問わない）などにおいて当該単語が何回使用されているか（見出し項目だけでなく内容中に用いられている場合も含む回数）に基づいて、当該単語の希少度を算出するようにしてもよい。
【０１５４】
(4)上記実施形態では、ウエブ上の辞書の更新日の平均値と現在日の差に基づいて、現在の注目度（Ｈｏｔ係数）を算出するようにしている。しかしながら、最新の更新日との差に基づいて、現在の注目度を算出するようにしてもよい。あるいは、所定期間内に更新が行われた回数を算出し、これに基づいて現在の注目度を算出するようにしてもよい（更新回数が多いほど、注目度が大きい）。
【０１５５】
(5)上記実施形態では、各単語の重要度の平均値をしきい値として重要単語を抽出するようにしている。しかし、標準偏差、分散なども考慮して重要単語を抽出するようにしてもよい。
【０１５６】
(6)上記実施形態では、重要単語を含む文についてのみ重要度を算出するようにしている。しかし、全ての文について重要度を算出するようにしてもよい。
【０１５７】
(7)上記実施形態では、指定文字数を超えない範囲で、文を選択するようにしている。しかし、指定文字数と合計文字数の差の絶対値が最も小さくなるように文を選択するようにしてもよい。
【０１５８】
(8)上記実施形態では、指定文字数に基づいて文を選択するようにしている。しかし、文の合計数、行の合計数、文の合計データ量などに基づいて文を選択するようにしてもよい。
【０１５９】
(9)上記実施形態では、指定文字数などの文の選択基準は予め定められているものとしている。しかし、対象とする文章の文字数などに応じて、指定文字数などを可変にするようにしてもよい（たとえば、文章の文字数の半分を指定文字数とするなど）。これにより、文章の長さに対応した長さの要約文を得ることができる。
【０１６０】
(10)上記実施形態では、端末装置側において要約文作成処理を行っている。しかしながら、サーバ装置側において、要約文作成処理を行うようにしてもよい。
【０１６１】
(11)上記実施形態では、句点に基づいて文章中から「文」を抽出するようにしている。しかし、見出しなどのように句点のない文もある。そこで、見出しであると判断した部分（他の部分よりフォントが大きい、見出しであるとの属性が付与されている等により判断する）については、全体を一文であると判断するようにしてもよい。
【０１６２】
(12)上記実施形態では、単語の重要度を算出する際に、文章全体のジャンルや属性（社会面の記事であるか、三面記事であるかや、論文であるか雑文であるかなど）により、単語について係数を設けるようにしてもよい。たとえば、社会面における「国会」は、通常出てくる単語であるから係数を低くする。一方、三面記事における「国会」は、あまり出てこない単語であるから係数を高くする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。
【０１６３】
(13)上記実施形態では、文の重要度を算出する際に、文と文の関連性を考慮せずに行っている。しかし、文と文の関連性も考慮して重要度を算出するようにしてもよい。たとえば、「その」「彼」等の指示代名詞が当該文に出てくる場合、重要度によって選択され、並び替えられた抽出文において、当該文より前の文が抽出されていない場合には、当該指示代名詞を含む文の係数を小さくする。一方、「したがって」「つまり」などの、話題を展開する接続詞が文に含まれる場合、当該文の係数を大きくする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。

【特許請求の範囲】
【請求項１】
平面上に複数の記事を配置する記事配置決定装置であって、
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。
【請求項２】
コンピュータによって平面上に複数の記事を配置する記事配置決定装置を実現するための記事配置決定プログラムであって、コンピュータを、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。
【請求項３】
請求項１の装置または請求項２のプログラムにおいて、
前記装置は、前記仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、
前記仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えていることを特徴とする装置またはプログラム。
【請求項４】
請求項１〜３のいずれかの装置またはプログラムにおいて、
前記仮想記事領域生成手段は、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴とする装置またはプログラム。
【請求項５】
請求項１〜４のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置手段は、最も重要度の高い仮想記事領域を、前記平面上の右上または左上に固定して配置することを特徴とする装置またはプログラム。
【請求項６】
請求項１〜５のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置手段は、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴とする装置またはプログラム。
【請求項７】
請求項１〜６のいずれかの装置またはプログラムにおいて、
前記仮想バネ設定手段は、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴とする装置またはプログラム。
【請求項８】
請求項１〜７のいずれかの装置またはプログラムにおいて、
前記仮想バネ設定手段は、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴とする装置またはプログラム。
【請求項９】
請求項１〜８のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置変更決定手段は、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴とする装置またはプログラム。
【請求項１０】
平面上に複数の記事を配置する記事配置決定装置であって、
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。
【請求項１１】
コンピュータによって平面上に複数の記事を配置する記事配置決定装置を実現するための記事配置決定プログラムであって、コンピュータを、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。
【請求項１２】
請求項１〜１１のいずれかの装置またはプログラムにおいて、
前記装置は、さらに、
解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、
単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段と、
を備えたことを特徴とする装置またはプログラム。
【請求項１３】
請求項１〜１２のいずれかの装置またはプログラムにおいて、
前記装置は、さらに、
各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。
【請求項１４】
請求項１３の装置またはプログラムにおいて、
前記関連度算出手段は、
各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、
前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。
【請求項１５】
コンピュータによって平面上における複数の記事配置を決定する方法であって、当該コンピュータは、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、
生成された仮想記事領域を仮想平面上に配置し、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、
前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴とする記事配置決定方法。

【図１ａ】

【図１ｂ】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８ａ】

【図８ｂ】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６】

【図１７】

【図１８】

【図１９】

【図２０】

【図２１】

【図２２】

【図２３】

【図２４】

【図２５】

【図２６】

【図２７】

【図２８】

【図２９】

【図３０】

【図３１】

【図３２】

【図３３】

【公開番号】特開２０１３−１６１３５（Ｐ２０１３−１６１３５Ａ）
【公開日】平成２５年１月２４日（２０１３．１．２４）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - 電気的デジタルデータ処理 (228,215)
    - 特定の機能に特に適合したデジタル計算またはデータ処理の装置また... (34,028)
      - 自然言語データの取扱い (7,890)
        
        テキスト処理 (6,199)
      - 情報検索；そのためのデータベース構造 (17,914)
    - 計算機で処理しうる形式にデータを変換するための入力装置；処理ユ... (73,920)
      - ユーザーと計算機との相互作用のための入力装置または入力と出力が... (38,535)
        
        グラフィカルユーザーインタフェースのための相互作用技術，例．ウ... (14,535)

【出願番号】特願２０１１−１５０３７８（Ｐ２０１１−１５０３７８）
【出願日】平成２３年７月６日（２０１１．７．６）
【出願人】（５９６１００８１２）京セラコミュニケーションシステム株式会社 (38)
【出願人】（３０５０２６１６１）京セラ丸善システムインテグレーション株式会社 (4)
【Ｆターム（参考）】

デジタル計算機のユーザインターフェイス (127,284)

[ Back to top ]

記事配置決定装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

記事配置決定装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク