説明

投稿データ評価装置

【課題】 投稿データが電子掲載に適するかを好適に判定する。
【解決手段】 クライアント端末通信部122は、評価対象となるべき投稿データを外部のクライアント端末300から受信する。外部評価装置通信部124は、投稿データが電子掲載に適する度合いを評価するための外部評価装置200に対して、投稿データを転送する。外部評価装置通信部124は、投稿データに対する評価結果を示す評価情報を外部評価装置200から受信する。外部評価装置指示部140は、評価情報に示される評価結果に応じて投稿データの電子掲載の適否を判定する。副判定部138は、評価情報において電子掲載の適否を評価者によって判定すべき旨の評価結果が示されるとき、投稿データについて電子掲載の適否を指示するための評価者からの指示入力に応じて投稿データの電子掲載の適否を判定する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、投稿データの掲載可否を評価するための技術、に関する。
【背景技術】
【0002】
近年、コンピュータの普及とネットワーク技術の進展に伴い、ネットワークを介した電子情報の交換が盛んになっている。そのような一例として、電子掲示板システムを挙げることができる。電子掲示板システムの投稿者は、ネットワークを介して接続されたサーバに対して投稿データを送信する。サーバは投稿データを電子掲載する。電子掲示板システムのユーザは、電子掲載された投稿データをクライアント端末にて確認できる。電子掲示板システムは、複数者間における情報共有に有効なツールとして、広く利用されている。
【0003】
しかし、投稿データの内容が電子掲載に不適切な内容である場合には、電子掲示板システムの公共性が損なわれてしまう。たとえば、他人を誹謗中傷するような内容、掲示板の趣旨に沿わない内容、広告的な内容などである。
【0004】
従来においては、たとえば、電子掲示板システムの管理者が投稿データの内容をチェックしていた。管理者は、投稿データの内容が電子掲載に不適切な内容であれば、その投稿データをサーバから手動で削除していた。
あるいは、投稿データがあらかじめ定義された不適切なキーワードを含むときには、不適切な投稿データであるとみなして電子掲載を拒否するシステムも考案されている(例えば、特許文献1、特許文献2参照)。
以下、電子掲載に不適切な内容とされる投稿データのことを、特に、「不良投稿データ」とよぶ。また、電子掲載に適切な内容とされる投稿データのことを、特に、「適合投稿データ」とよぶこととする。
【特許文献1】特開2004−334458号公報
【特許文献2】特開2004−246760号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
電子掲載されている投稿データの適否について管理者が責任を持たなければならないとすれば、その電子掲示板システムの管理負担は大きなものになる。
そもそも、投稿データの適否は電子掲示板システムが対象とするサブジェクトや対象ユーザ層などによって判断されるべきものである。投稿データが不適切なキーワードを含んでいても、その投稿データが不良投稿データであると判断するのは早計である。同様に、投稿データが不適切なキーワードを含んでいなくても、その投稿データが適合投稿データであるともいえない。
【0006】
本発明はこのような状況に鑑みてなされたものであり、その主たる目的は、投稿データの掲載可否を好適に評価するための技術を提供することにある。
【課題を解決するための手段】
【0007】
本発明のある態様は、投稿データ評価装置である。
この装置は、評価対象となるべき投稿データが電子掲載に適する度合いを評価するための外部の評価装置に対して、受信した投稿データを転送する。この装置は、評価装置から返信された評価結果に応じて電子掲載の可否を判定する。
電子掲載の適否が評価者によって判定されるべき旨の評価結果であったときには、評価者からの指示入力に応じて電子掲載の適否が判定される。
【0008】
この態様によると、投稿データが電子掲載に適する度合いは外部の評価装置によって判定される。また、必要に応じて評価者が電子掲載の適否を判定する機会が担保される。そのため、管理者のチェック負担を軽減しつつも、投稿データの内容についてより精緻に判定されやすくなる。
【0009】
なお、以上の構成要素の任意の組合せ、本発明を方法、装置、システム、記録媒体、コンピュータプログラムにより表現したものもまた、本発明の態様として有効である。
【発明の効果】
【0010】
本発明によれば、投稿データの掲載可否を好適に評価するための技術を提供することができる。
【発明を実施するための最良の形態】
【0011】
図1は、電子掲示板システムのハードウェア構成図である。
電子掲示板サーバ100は、インターネット12を介して接続されたクライアント端末300aやクライアント端末300bなどの複数の端末(以下、単に「クライアント端末300」という)に、サービスを提供する。また、電子掲示板サーバ100は、外部評価装置200ともインターネット12を介して接続される。電子掲示板サーバ100と外部評価装置200は専用回線にて接続されてもよい。
【0012】
電子掲示板サーバ100は、各クライアント端末300から受信した投稿データを電子掲載する。クライアント端末300は、電子掲載された投稿データの内容を閲覧できる。このようにして、複数のクライアント端末300間で投稿データの情報が共有される。電子掲示板サーバ100は、受信した投稿データの内容が電子掲載に適する内容であるか判定する機能を持つ。電子掲示板サーバ100は、投稿データの内容が電子掲載に適する内容であるかを外部評価装置200に判定させてもよい。この場合には、電子掲示板サーバ100は、投稿データを外部評価装置200に一旦送信し、外部評価装置200からその判定結果を示す評価情報を受信する。外部評価装置200は、中立的な評価機関であってもよい。外部評価装置200は、ソフトウェアにより投稿データが電子掲載に適合するかについて機械的に判定してもよい。あるいは、外部評価装置200のユーザが投稿データの内容を目視確認して掲載に適する度合いを判定してもよい。このようにして、電子掲示板サーバ100は、適合投稿データだけを電子掲載する。
本発明の主たる目的は、投稿データの掲載可否を好適に評価するための技術を提供することにある。以下、本実施例における電子掲示板サーバ100について、その掲載可否判定方法を中心として説明する。
【0013】
図2は、電子掲示板サーバの機能ブロック図である。
ここに示す各ブロックは、ハードウェア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。後に示す図3や図9の機能ブロック図についても同様である。
ここでは、主として各機能ブロックの発揮すべき機能について述べ、その具体的な作用については、図6等に関連して説明する。
【0014】
電子掲示板サーバ100は、ユーザインタフェース処理部110、通信処理部120、データ処理部130およびデータ記憶部150を含む。
ユーザインタフェース処理部110は、ユーザからの入力処理やユーザに対する情報表示のようなユーザインタフェース全般に関する処理を担当する。通信処理部120は、外部評価装置200やクライアント端末300との通信処理を担当する。
【0015】
データ処理部130は、ユーザインタフェース処理部110や通信処理部120から取得されたデータを元にして各種のデータ処理を実行する。データ処理部130は、ユーザインタフェース処理部110、通信処理部120およびデータ記憶部150の間のインタフェースの役割も果たす。
データ記憶部150は、あらかじめ用意された各種の設定データや、データ処理部130から受け取ったデータを格納する。
【0016】
ユーザインタフェース処理部110は、入力部112と表示部114を含む。入力部112は、ユーザからの入力操作を受け付ける。表示部114は、ユーザに対して各種情報を表示する。
通信処理部120は、クライアント端末通信部122と外部評価装置通信部124を含む。クライアント端末通信部122は、各クライアント端末300との通信処理を担当する。外部評価装置通信部124は、外部評価装置200との通信処理を担当する。
【0017】
データ記憶部150は、投稿データ記憶部152、評価設定データ記憶部154および掲載ステータス記憶部156を含む。
投稿データ記憶部152は、クライアント端末通信部122がクライアント端末300から受信した投稿データを記憶する。この投稿データ記憶部152が一旦記憶した投稿データについて、データ処理部130により電子掲載可否が判定されることになる。評価設定データ記憶部154は、投稿データの掲載可否を判定するための条件を示す判定設定情報を記憶する。評価設定データ記憶部154のデータ構造については、図5に関連して詳述する。掲載ステータス記憶部156は、評価中であるか、掲載中であるかといった投稿データごとの処理状態を示す掲載ステータス情報を記憶する。掲載ステータス記憶部156のデータ構造については、図4に関連して詳述する。
【0018】
データ処理部130は、投稿データ評価部132、掲載制御部134、評価手段選択部136、副判定部138、外部評価装置指示部140および設定変更部142を含む。
設定変更部142は、評価設定データ記憶部154の判定設定情報を変更する。電子掲示板サーバ100のユーザは入力部112を介して設定変更入力する。設定変更部142は、その入力内容にしたがって評価設定データ記憶部154の内容を変更する。投稿データ評価部132は、投稿データが電子掲載に適するかを判定する。投稿データ評価部132については、図3に関連して更に詳述する。外部評価装置指示部140は、投稿データの電子掲載適否を外部評価装置200に評価させるための制御を担当する。外部評価装置指示部140については、図9に関連して詳述する。以下、投稿データ評価部132による電子掲載可否判定のことを「内部判定」、外部評価装置指示部140による電子掲載可否判定のことを「外部判定」とよぶ。
【0019】
評価手段選択部136は、ユーザの設定に応じて内部判定または外部判定のいずれかを選択する。評価手段選択部136は、選択先に応じて投稿データの掲載適否判定を投稿データ評価部132か外部評価装置指示部140に指示する。評価手段選択部136は、投稿データ評価部132の処理負荷に応じて、内部判定か外部判定かを選択してもよい。あるいは、評価手段選択部136は、投稿データの種類や送信元のクライアント端末300などのあらかじめ定められた選択条件によって、内部判定か外部判定かを選択してもよい。なお、評価手段選択部136は、投稿データ評価部132、外部評価装置指示部140および副判定部138のインタフェースの役割も果たす。
【0020】
副判定部138は、内部判定や外部判定によって電子掲載可否が確定されなかったときに、ユーザからの指示入力によって電子掲載可否を決定する。以下、副判定部138による判定と区別するために、内部判定と外部判定のことをまとめて「主判定」、副判定部138による判定のことを「副判定」ともよぶことにする。掲載制御部134は主判定や副判定により、電子掲載が許可された投稿データを投稿データ記憶部152から読み出して電子掲載させる。一方、許可されない場合には、その不良投稿データを投稿データ記憶部152から削除する。主判定、または、副判定により電子掲載可否が最終的に決定されたときには、クライアント端末通信部122はその投稿データの送信元であるクライアント端末300に対して、電子掲載開始または拒否の旨を示す情報を送信する。また、投稿データ評価部132、副判定部138、外部評価装置指示部140、掲載制御部134は、投稿データの掲載ステータスが変化させたとき、適宜、掲載ステータス記憶部156の掲載ステータス情報を更新する。
以下、内部判定を中心として説明した後に、外部判定についても説明する。
【0021】
図3は、投稿データ評価部の機能ブロック図である。
投稿データ評価部132は、第1ランク特定部160、第1主判定部162、評価値算出部164およびリンク情報取得部166を含む。投稿データ評価部132は、内部判定を実行する。
評価値算出部164は、投稿データ記憶部152から評価対象となる投稿データを取得して、適合評価値を算出する。適合評価値は、0〜100の範囲で投稿データが電子掲載に適する度合いを指標化したものである。適合評価値が大きいほど、適合投稿データである可能性が高い。適合評価値の算出方法については、後述する。
【0022】
投稿データのなかにはURL(Uniform Resource Locator)が含まれている場合もある。このような他のサーバに存在する文書ファイルの位置を示すリンク情報が投稿データに含まれているとき、リンク情報取得部166は通信処理部120を介してリンク先の文書ファイルを取得する。評価値算出部164は、投稿データの内容だけでなく、リンク先の文書ファイルの内容も評価対象として、適合評価値を計算する。
投稿データのなかには、広告目的で特定サイトに閲覧者を誘導させるためのリンク情報が含まれることも多い。このような方法によれば、電子掲載の直接的な対象となる投稿データだけでなく、実質的に電子掲載の対象となる文書ファイルについても評価の対象とすることができる。そのため、電子掲載の適否をより有効に判定しやすくなる。
データ処理部130は、過去に電子掲載拒否された投稿データに含まれていたリンク情報を不正リンク先情報として蓄積しておいてもよい。投稿データに含まれるリンク情報が不正リンク先情報に該当すれば、評価値算出部164は適合評価値を0点としてもよい。このような態様によれば、電子掲載に不適当なウェブサイトに対するリンク情報が掲載されるのを防ぎやすくなる。
【0023】
第1ランク特定部160は、評価値算出部164により算出された適合評価値に応じて、投稿データをランク分けする。ランクは、電子掲載が許可されるべきランクである許可ランク、禁止されるべきランクである禁止ランクおよび電子掲示板サーバ100の管理者としてのユーザが電子掲載可否を判定すべきランクである要判定ランクの3種類である。ランクは、評価設定データ記憶部154の判定設定情報に定義されている。たとえば、判定設定情報においては、適合評価値が70点以上であるときには許可ランクに分類されるというようにランクと適合評価値の関係が定義されている。第1ランク特定部160は、適合評価値に基づいて判定設定情報から投稿データのランクを特定する。
【0024】
第1主判定部162は、特定されたランクに応じて各機能ブロックに制御命令を送る。
a)許可ランクの場合
第1主判定部162は掲載制御部134に投稿データの電子掲載を指示する。掲載制御部134は、投稿データ記憶部152から該当する投稿データを読み出して電子掲載する。掲載制御部134は、掲載ステータス記憶部156の掲載ステータス情報を更新する。クライアント端末通信部122は、投稿データの送信元に対して電子掲載された旨を通知する。
b)禁止ランクの場合
第1主判定部162は掲載制御部134に投稿データの不掲載を指示する。掲載制御部134は、投稿データ記憶部152のうち該当する投稿データを削除する。掲載制御部134は、掲載ステータス記憶部156の掲載ステータス情報を更新する。クライアント端末通信部122は、投稿データの送信元に対して電子掲載が拒否された旨を通知する。
c)要判定ランクの場合
第1主判定部162は評価手段選択部136を介して副判定部138に副判定の実行を指示する。表示部114は、管理者に対して投稿データを表示して電子掲載可否を判定するように促す画面を表示する。副判定部138は、管理者による判定が肯定的であれば、a)に示したように掲載制御部134に電子掲載を指示する。電子掲載に伴うその他の処理は基本的に同様である。管理者による判定が否定的であれば、b)に示したように掲載制御部134に不掲載を指示する。電子掲載拒否に伴うその他の処理も基本的に同様である。
【0025】
次に、適合評価値の算出原理について説明する。評価値算出部164は、いわゆる自然言語処理によって、投稿データの内容が電子掲載に適する度合いを評価する。自然言語処理としてはさまざまな方法が提案されているが、そのなかでも代表的と思われる単語重み法とベイジアンフィルタ法の原理を簡単に説明しておく。
ここでは、「青少年の健全な育成のためテレビドラマでのパチンコや万馬券の当たるシーンは避けたいという意見に対しパチンコ愛好家は反対している。」という被検査文章を例として説明する。被検査文章は、「青少年/の/健全な/育成/の/ため/テレビドラマ/での/パチンコ/や/万馬券/の/当たる/シーン/は/避けたい/という/意見/に/対し/パチンコ/愛好家/は/反対/している。」という25単語に分解される。
【0026】
1.単語重み法
単語ごとにスコアを定義したスコア設定テーブルを参照して、文章に含まれる単語ごとのスコアから、文章全体としてのスコアを算出する手法である。
スコア設定テーブルには、「パチンコ:2点」、「オッズ:1点」、「万馬券:4点」のように、単語ごとにスコアが定義されている。このスコアは、電子掲載に不適合な度合いを示すスコアである。このスコア設定テーブルでは、ギャンブル用語を電子掲載に不適合な単語として定義している。「万馬券」という単語は「パチンコ」や「オッズ」という単語に比べてより不適切であるとして高いスコア設定となっている。スコアは、電子掲示板システム10の管理者によりあらかじめ設定されればよい。
【0027】
被検査文章の単語としては、「パチンコ」が2個、「万馬券」が1個含まれている。2点×2+4点×1により総スコアは8点である。総スコア÷総単語数を計算すると、8÷25により0.32という指標値が算出される。この0.32という指標値は、いわば、電子掲載に不適切な度合いを示す数値である。この指標値をxとおく。xを電子掲載に適切な度合いを示す数値として0〜100点の範囲で正規化することにより適合評価値を算出する。一例として、xが0〜10の範囲の数値であれば、
適合評価値=(10−x)×10
とすることにより、0〜100の範囲で適合評価値を算出できる。
【0028】
ギャンブル関連用語のほかにも、暴力的用語やアルコール関連用語のように、カテゴリに応じてスコア設定テーブルが用意されてもよい。このように、各評価軸からみて電子掲載に適合する度合いを指標化した数値のことを特定評価値とよぶ。投稿データ全体としての適合評価値は、これらの特定評価値を変数として所定の評価関数による演算を実行することにより算出されてもよい。このような態様によれば、複数の評価軸からみて、電子掲載可否判定を実行できる。これは、次に示すベイジアンフィルタ法についても同様である。なお、ここでいう評価関数については、図5に関連しても説明する。
【0029】
2.ベイジアンフィルタ法
注目するカテゴリに属する文例と属さない文例を多数用意し、それぞれの文例における単語の出現頻度に応じて、被検査文章に含まれる単語を評価することにより文章全体としてのスコアを算出する手法である。
【0030】
たとえば、ギャンブル性という評価軸について、ギャンブルに関連している文例と関連していない文例を多数用意する。前者のような評価軸に合った文例を「適合文例」、後者のような評価軸に合わない文例を「非適合文例」とよぶ。仮に適合文例と非適合文例がそれぞれ100件ずつであったとき、「パチンコ」という単語が適合文例では98回、非適合文例では2回現れたとする。このとき、「パチンコ」という単語を含む文章は、98%の確率でギャンブル的な文章であり、2%の確率で非ギャンブル的な文章であると推定される。
【0031】
このように、さまざまな単語についてその単語を含む文章がギャンブル的な文章である
確率を計算する。仮に、「パチンコ:98%」、「オッズ:95%」、「万馬券:90%」、「青少年:20%」、「健全:1%」、「育成:2%」とする。先に例示した被検査文章では、「パチンコ」、「万馬券」、「青少年」、「健全」、「育成」の5つの単語が含まれている。
合成確率は、(0.98×0.90×0.20×0.01×0.02) ÷{(0.98×0.90×0.20×0.01×0.02)+(1−0.98)×(1−0.90)×(1−0.20)×(1−0.01)×(1−0.02)}≒2.2%となる。この2.2%という合成確率も、いわば、電子掲載に不適切な度合いを示す数値である。この合成確率をyとおく。yを電子掲載に適切な度合いを示す数値として0〜100点の範囲で正規化することにより適合評価値を算出する。一例として、
適合評価値=100−y
とすることにより、0〜100の範囲で適合評価値を算出できる。なお、ここでは、被検査文章における単語の出現回数は考慮しないとして説明している。
【0032】
ここでは、ギャンブル関連の文例により適合評価値を算出する場合を示した。このほかにも、暴力的用語やアルコール関連用語のように、カテゴリに応じて適合文例と非適合文例の文例集が用意されてもよい。そして、これら文例について計算された特定評価値から適合評価値を算出してもよい。
【0033】
単語重み法は、不適切な単語のスコアを加算する方法である。ベイジアンフィルタ法は、不適切な単語でなく適切な単語についてもスコア計算の対象としている。評価値算出部164は、このような単語重み法やベイジアンフィルタ法に代表される自然言語処理により、適合評価値を算出する。評価値算出部164は、単語重み法とベイジアンフィルタ法の両方で適合評価値を算出し、それらに基づいて所定の演算を実行することにより最終的な適合評価値を算出してもよい。たとえば、単語重み法とベイジアンフィルタ法の両方により算出された適合評価値を加重平均して、最終的な適合評価値としてもよい。
【0034】
図4は、掲載ステータス記憶部のデータ構造図である。
掲載ステータス記憶部156は、投稿データの処理状況を示す掲載ステータス情報を記憶する。投稿者ID欄170は、各投稿者を識別するための投稿者IDを示す。投稿者IDは、投稿者のハンドルネームであってもよいし、投稿者が利用するクライアント端末300のIPアドレスにて代用してもよい。投稿日時欄172は、投稿データの受信日時を示す。投稿データID欄174は、各投稿データを識別するための投稿データIDを示す。投稿データIDは、クライアント端末通信部122が投稿データを受信したときに一意に割り振るIDである。掲載ステータス欄176は、各投稿データの処理状況を示す。
【0035】
同図において、たとえば、投稿データID「0001」の投稿データ(以下、単に「投稿データ(0001)」とよぶ)は、掲載ステータス欄176によれば、電子掲載中である。また、投稿データ(0002)は、投稿データ評価部132による内部判定の結果として電子掲載が拒否されている。掲載制御部134は、この投稿データ(0002)を電子掲載することなく投稿データ記憶部152から削除している。また、クライアント端末通信部122は、投稿データ(0002)の送信元であるクライアント端末300に対して、掲載が拒否された旨を示す情報を送信している。
【0036】
投稿データ(0003)は、外部評価装置指示部140による外部判定の結果として電子掲載が拒否されている。掲載制御部134は、この投稿データ(0003)を電子掲載することなく投稿データ記憶部152から削除している。クライアント端末通信部122は、投稿データ(0003)の送信元であるクライアント端末300に対して掲載が拒否された旨を示す情報を送信している。
投稿データ(0005)は、副判定部138による副判定の結果として電子掲載が拒否されている。
【0037】
投稿データ(0006)や投稿データ(0007)、投稿データ(0008)の投稿データは電子掲載可否についてそれぞれ判定中である。クライアント端末通信部122は、投稿データが受信されたときには、その送信元のクライアント端末300に対して掲載可否が判定中である旨を示す待機情報を送信する。
【0038】
クライアント端末通信部122は、待機中にあるクライアント端末300からは新たに投稿データを受信しないとしてもよい。これにより、特定のクライアント端末300から連続的に大量の投稿データが送られても、電子掲示板サーバ100の処理負荷が過度に高くならないようにできる。
また、不良投稿データ(0002)を送信した投稿者ID「002」の投稿者からは、クライアント端末通信部122は不掲載の旨が判定されてから所定の不受理期間が経過するまで新たに投稿データを受信しないとしてもよい。このような態様によれば、不良投稿データを送ってきたクライアント端末300から連続的に不良投稿データが送信されることにより電子掲示板サーバ100の処理負荷が増大するのを防ぐことができる。また、投稿者にとっても、電子掲示板サーバ100に電子掲載が拒否されるような投稿データを送信した場合に、このような不受理期間というペナルティが課せられるため、適合投稿データを送信しようというインセンティブとすることができる。
【0039】
図5は、評価設定データ記憶部のデータ構造図である。
評価設定データ記憶部154は、適合評価値の算出方法や、ランク分けの方法についての判定設定情報を記憶する。評価設定データ記憶部154は、複数種類の判定設定情報を記憶する。ユーザは、入力部112から設定変更部142を介して判定設定情報を登録したり、変更することができる。
【0040】
設定欄180は、判定設定情報を識別するための設定IDを示す。新たに判定設定情報が登録されるとき、設定変更部142はその判定設定情報に対して一意に設定IDを割り振る。ランクA欄182は、許可ランク(以下、「ランクA」とよぶ)における適合評価値の範囲を示す。ランクB欄184は、要判定ランク(以下、「ランクB」とよぶ)における適合評価値の範囲を示す。ランクC欄186は、禁止ランク(以下、「ランクC」とよぶ)における適合評価値の範囲を示す。要素欄188は、適合評価値の算出のために考慮すべき評価変数を示す。評価関数欄190は、適合評価値の算出式を示す。ユーザは、これら複数の設定のなかからいずれかを選択できる。
【0041】
同図において設定ID「01」の判定設定情報においては、適合評価値が60〜100の範囲にあれば、投稿データ評価部132の第1ランク特定部160は投稿データをランクAと判定する。また、適合評価値が30〜59の範囲にあれば投稿データはランクBと判定され、0〜29の範囲にあればランクCと判定される。要素欄188や評価関数欄190によれば、適合評価値は暴力的、誹謗中傷的およびギャンブル的な表現であるかという複数の評価軸から適合評価値を算出している。たとえば、ベイジアンフィルタ法により、暴力的な表現であるか、他人を誹謗中傷するような表現であるか、ギャンブルを示唆するような表現であるかといった3つの評価軸から、それぞれ特定評価値A、B、Cが算出される。そして、評価関数欄190に示す評価関数によれば、
適合評価値=A×0.1+B×0.6+C×0.3
として適合評価値が算出されることになる。
【0042】
設定ID「02」の判定設定情報においては、アダルト的表現または広告宣伝的な表現であるかという2つの評価軸から、特定評価値A、Bが算出される。そして、評価関数欄190に示す評価関数によれば、特定評価値A、Bのいずれか大きい方の値がそのまま適合評価値となる。
また、設定ID「03」の判定設定情報においては、アダルト的表現についての特定評価値がそのまま適合評価値となる。
【0043】
このほかにも、電子掲示板の趣旨に沿った投稿データか否かにより適合評価値を算出してもよい。たとえば、電子掲示板システム10において子供服に関する情報交換がなされているときに、その趣旨に合わない投稿データが受信されたときには、不良投稿データとして判定してもよい。あるいは、投稿データの文章構造、たとえば主語、述語関係のような文法チェックすることにより、情報伝達性が高い投稿データだけを電子掲載対象としてもよい。
このように、さまざまな評価軸から特定評価値や適合評価値を算出できる。
【0044】
ここでは、ランクはA〜Cの3段階であるとして説明しているが、ランク数は3段階に限られるものではない。たとえば、ランクAを要判定ランク、ランクBを禁止ランクとする2段階のランク設定であってもよい。あるいは、ランクAを許可ランク、ランクBを要判定ランクとする2段階のランク設定であってもよい。
【0045】
また、内部判定、外部判定、副判定のすべてによって電子掲載可否を判定してもよい。たとえば、内部判定を実行してランクA〜ランクCのいずれかに分類する。ランクAは許可ランクであり、ランクCは禁止ランクである。ランクBは、外部判定を実行すべきランクである。外部判定の結果、ランクBはランクB1、ランクB2およびランクB3に細分化される。ランクB1は電子掲載許可、ランクB3は電子掲載拒否に対応するランクであり、ランクB2は副判定を実行すべきランクである。このように、複数の判定手法を多段階化させることにより、より客観的に投稿データの内容チェックが可能となる。
【0046】
電子掲示板サーバ100のユーザは、評価設定データ記憶部154のうちのいずれかの判定設定情報を有効化させる。データ処理部130は、その有効化された判定設定情報に基づいて、各投稿データの電子掲載可否を判定する。あるいは、投稿者ごとに利用すべき判定設定情報が変更されてもよい。たとえば、不良投稿データを頻繁に送信する投稿者については厳しい判定設定情報を適用するとしてもよい。
本実施例における電子掲示板サーバ100によれば、投稿データの電子掲載適否を適合評価値という度合いとして算出できるので、投稿データの掲載可否設定を柔軟に変更できる。また、ユーザは適合評価値の算出式も定義できるため、電子掲示板システム10の運用に応じた評価方法を実現できる。
【0047】
図6は、内部判定を前提とした電子掲載可否判定についての処理過程を示すフローチャートである。
まず、クライアント端末通信部122はクライアント端末300から投稿データを受信する(S10)。クライアント端末通信部122は、待機情報を送信元のクライアント端末300に送信する(S12)。このあと、クライアント端末通信部122は電子掲載可否が確定するまでは、そのクライアント端末300から新たな投稿データを受信しない。評価手段選択部136は、投稿データ評価部132に指示して内部判定を実行させる(S14)。S14において投稿データ評価部132は、投稿データのランクを特定する。S14の処理の詳細については、図7に関連して詳述する。
【0048】
ランクAであれば(S16のY)、掲載制御部134は投稿データを電子掲載する(S18)。クライアント端末通信部122は、投稿データの送信元であるクライアント端末300に対して投稿データが電子掲載された旨を通知する(S20)。以後、クライアント端末通信部122は、このクライアント端末300から新たな投稿データを受信可能となる。
【0049】
ランクBであれば(S22のY)、第1主判定部162は評価手段選択部136を介して副判定部138に副判定の実行を指示する。副判定処理については図8に関連して詳述する。掲載制御部134は、副判定の結果に応じて投稿データを電子掲載してもよい。あるいは、掲載制御部134は、一旦ランクBの投稿データを電子掲載した後、副判定の結果に応じて電子掲載を中止させてもよい。ランクBでなければ、すなわち、ランクCであれば(S22のN)、クライアント端末通信部122は電子掲載が拒否された旨をクライアント端末300に送信する(S26)。掲載制御部134は、その投稿データを投稿データ記憶部152から削除する。電子掲載が拒否されたクライアント端末300に対しては不受理期間が設定され、その期間が経過するまでは新たな投稿データが受信されないとしてもよい。
【0050】
図7は、図6のS14の内部判定処理を詳細に示すフローチャートである。
まず、評価値算出部164は、投稿データにリンク情報が含まれるか判定する(S50)。含まれていれば(S50のY)、リンク情報取得部166はリンク先の文書ファイルを取得する(S52)。評価値算出部164は、評価設定データ記憶部154の判定設定情報にしたがって、投稿データ、または、投稿データとリンク先の文書ファイルについて適合評価値を算出する(S54)。第1ランク特定部160は、適合評価値に応じてランクを特定する(S56)。
【0051】
図8は、副判定処理の処理過程を示すフローチャートである。
ランクBに分類されたときには、表示部114は、管理者としてのユーザに対して、判定を催促する旨を画面表示する。ユーザは、ランクBとして分類された投稿データを閲覧して、電子掲載の適否を入力する(S30)。掲載可として入力されたときには(S32のY)、副判定部138は掲載制御部134に指示して投稿データを掲載させる。掲載制御部134は、投稿データを電子掲載する(S34)。クライアント端末通信部122は、電子掲載された旨を投稿データの送信元であるクライアント端末300に通知する(S36)。一方、S32において掲載不可の旨が入力されたときには(S32のN)、クライアント端末通信部122は掲載が拒否された旨をクライアント端末300に通知する(S38)。
変形例として、ランクBに分類されたときには、第1主判定部162は掲載制御部134に電子掲載を実行させてもよい。第1主判定部162は同時に副判定部138に対して同図に示した副判定処理を実行させてもよい。そして、S32において掲載不可として入力されたときには、副判定部138は掲載制御部134に指示して掲載を中止させてもよい。
次に外部判定を中心として電子掲示板サーバ100を説明する。
【0052】
図9は、外部評価装置指示部の機能ブロック図である。
外部評価装置指示部140は、評価値取得部202、転送指示部204、第2ランク特定部206、第2主判定部208および時間管理部210を含む。
外部判定に際しては、転送指示部204は外部評価装置通信部124に指示して投稿データを外部評価装置200に送信させる。このとき、時間管理部210は外部評価装置200に投稿データが送信されてからの経過時間を計測する。外部評価装置200は、送信された投稿データについて適合評価値を算出する。外部評価装置200からは、適合評価値を含む評価情報が返信される。評価値取得部202は、外部評価装置通信部124を介してこの適合評価値を取得する。
【0053】
第2ランク特定部206は、評価値取得部202が取得した適合評価値に応じて、投稿データのランクを特定する。図5においては内部判定についての判定設定情報として評価設定データ記憶部154のデータ構造を示したが、これは外部判定についても同様である。第2ランク特定部206は、選択されている判定設定情報に基づいて適合評価値に応じたランクを判定する。転送指示部204は、外部評価装置200に対して、評価設定データ記憶部154の要素欄188や評価関数欄190として示した評価軸や評価関数についての情報を送信してもよい。そして、外部評価装置200は、これらの評価軸や評価関数についての情報に基づいて、適合評価値を算出してもよい。あるいは、外部評価装置200は独自の評価方法によって適合評価値を算出してもよい。この場合には、外部判定については要素欄188や評価関数欄190の欄に示す情報は必要とされなくなる。
【0054】
時間管理部210が計測する経過時間が所定の時間(以下、「外部待機時間」とよぶ)を超えたときには、第2ランク特定部206は投稿データが所定のランクに分類されたものとみなす。本実施例においては、外部待機時間が経過しても評価情報が受信されなかった場合には、ランクBへ分類された扱いとなる。
第2主判定部208は、第2ランク特定部206により特定されたランクに応じて、評価手段選択部136を介して掲載制御部134や副判定部138に対して掲載処理や副判定処理の実行を指示する。
【0055】
図10は、外部判定を前提とした電子掲載可否判定についての処理過程を示すフローチャートである。
クライアント端末通信部122は、クライアント端末300から投稿データを受信する(S10)。なお、先述したように不受理期間中であれば、クライアント端末通信部122は投稿データをそのまま判定対象とすることなく破棄してもよい。クライアント端末通信部122は、投稿データを受理するときには、待機情報をクライアント端末300に送信する(S12)。
【0056】
転送指示部204は、評価手段選択部136から外部判定の実行を指示されると、外部評価装置通信部124に指示して投稿データを外部評価装置200に送信させる(S40)。時間管理部210は、このとき転送後の経過時間を計測する(S42)。外部待機時間内に評価情報が受信されたときには、第2ランク特定部206は適合評価値に応じて投稿データのランクを特定する(S45)。ランクAであれば(S46のY)、第2主判定部208は掲載制御部134に指示して電子掲載を実行させる。掲載制御部134は投稿データを電子掲載する(S48)。クライアント端末通信部122はクライアント端末300に対して投稿データが電子掲載された旨を通知する(S50)。
【0057】
ランクCである場合(S46のN、S52のN)、第2主判定部208は掲載制御部134に不掲載を指示する。クライアント端末通信部122は、クライアント端末300に対して電子掲載が拒否された旨を通知する(S54)。掲載制御部134は、投稿データを投稿データ記憶部152から削除する。ランクBである場合(S52のY)、または、外部待機時間内に評価情報が受信されなかった場合には(S44のN)、第2主判定部208は副判定部138に副判定の実行を指示する(S56)。副判定処理については、図8に関連して説明した内容と同様である。
【0058】
本実施例に示した電子掲示板サーバ100によれば、主判定によっても掲載可否を判断しきれない投稿データについて副判定を実行する。そのため、電子掲示板サーバ100の管理者は、すべての投稿データをチェックする必要がない。また、主判定によって電子掲載可否を2値的に決定するのではなく、必要に応じて管理者によるチェックとして副判定がなされるため、投稿データの内容についてより柔軟にチェックできる。いわば、主判定による評価処理の迅速化を達成しつつも、判定が難しい内容の投稿データについては管理者による判定機会を担保できるため、評価の正確性と迅速性の両方に鑑みた電子掲示板システム10を提供できる。
また、適合評価値に応じてランクを決定することにより、電子掲示板サーバ100側で電子掲載適否の判定条件を柔軟に設定変更できる。これにより、電子掲示板サーバ100の利便性を高めることができる。
【0059】
内部判定においては、単語重み法やベイジアンフィルタ法として示したような自然言語処理によって投稿データの内容をより精緻に判定できる。このとき、投稿データのリンク情報まで考慮して内部判定を実行するため、電子掲載にふさわしくない情報が提供されるのを更に防ぎやすくなる。
また、電子掲示板サーバ100は、複数の評価軸から投稿データの電子掲載適否を判定するため、電子掲示板システム10のサブジェクトに応じて柔軟に判定条件を設定できる。
【0060】
外部判定の場合には、電子掲示板サーバ100の主判定に要する処理負荷を低減できるというメリットがある。評価手段選択部136は、内部判定処理の負荷が高い場合には、外部判定を選択してもよい。この場合、電子掲示板サーバ100の主判定に要する処理負荷を電子掲示板サーバ100と外部評価装置200の間で好適に分散することができる。また、主判定を外部判定としてのみ実行するとすれば、電子掲示板サーバ100の構成を簡単にできるというメリットがある。
【0061】
本実施例においては、外部評価装置200が適合評価値を電子掲示板サーバ100に送信する態様を示したが、外部評価装置200はランクそのものを評価情報として送信してもよい。このような場合には、電子掲示板サーバ100の処理負荷は更に軽減される。また、外部判定においては、外部評価装置200からの評価情報が外部待機時間内に受信されなかったときには、所定のランクに自動的に分類される。そのため、投稿データの外部判定に時間がかかっても、主判定処理としては過度に滞らないよう処置できる。
【0062】
投稿データを送信したクライアント端末300に対しては、その投稿データの評価が終了するまでは、新たな投稿データを受信しないとしてもよい。これにより、機械的に投稿データを連続的に送信するクライアント端末300があっても、その被害を未然に防ぐことができる。また、不受理期間を設けることにより、不正投稿者を効果的に排除できる。
【0063】
本実施例においては、電子掲示板システム10における電子掲示板サーバ100の機能について説明した。しかし、本発明の応用範囲は、電子掲示板システム10に限られるものではない。たとえば、ブログシステム(Blog System)やメーリングリスト、ニュースシステム、リンク情報を登録するためのページを管理するシステム、オークションの出品を管理するシステムなど、ネットワークを介した情報共有システムに広く応用可能である。
【0064】
以上、実施の形態をもとに本発明を説明した。なお本発明はこの実施の形態に限定されることなく、そのさまざまな変形例もまた、本発明の態様として有効である。
【0065】
請求項に記載の各構成要件が果たすべき機能は、本実施例において示された各機能ブロックの単体もしくはそれらの連係によって実現されることも当業者には理解されるところである。
【0066】
なお、上記各実施例およびその変形例から把握することのできる技術思想としては、以下のものがある。
A−1.評価対象となるべき投稿データを外部装置から受信する投稿データ受信部と、
投稿データが電子掲載に適する度合いを適合評価値として指標化するための評価関数により、前記受信された投稿データの適合評価値を算出する評価値算出部と、
適合評価値の取りうる範囲が複数のランクに分類されたランクテーブルを参照して、前記受信された投稿データのランクを前記算出された適合評価値によって特定するランク特定部と、
前記特定されたランクに応じて前記受信された投稿データの電子掲載の適否を判定する主判定部と、
電子掲載の適否が評価者によって判定されるべきランクである要判定ランクとして前記受信された投稿データのランクが特定されたときには、前記受信された投稿データについて電子掲載の適否を指示するための評価者からの指示入力に応じて前記受信された投稿データの電子掲載の適否を判定する副判定部と、
を備えることを特徴とする投稿データ評価装置。
【0067】
A−2.前記評価値算出部は、複数の単語について電子掲載に不適切な度合いを単語適合値として指標化した単語適合値テーブルを参照し、投稿データの内容情報として含まれる複数の単語についての単語適合値から投稿データの適合評価値を算出する評価関数によって、前記受信された投稿データの適合評価値を算出することを特徴とするA−1に記載の投稿データ評価装置。
【0068】
A−3.前記評価値算出部は、ベイジアンフィルタ法(Bayesian Filtering)によって投稿データが電子掲載に適する度合いを適合評価値として指標化するための評価関数により、前記受信された投稿データの適合評価値を算出することを特徴とするA−1に記載の投稿データ評価装置。
【0069】
A−4.前記評価値算出部は、前記受信された投稿データに他の文書データの所在を示す位置情報であるリンク情報が含まれているときには、その文書データの内容情報も含めて前記受信された投稿データの適合評価値を算出することを特徴とするA−1からA−3のいずれかに記載の投稿データ評価装置。
【0070】
A−5.前記副判定部は、要判定ランクとして前記受信された投稿データのランクが特定されたときには、前記受信された投稿データの電子掲載を許可した後に、前記評価者からの指示入力に応じて投稿データの電子掲載を中止するか否かを判定することを特徴とするA−1からA−4のいずれかに記載の投稿データ評価装置。
【0071】
A−6.前記ランク特定部は、電子掲載を許可すべき許可ランク、電子掲載を禁止すべき禁止ランクおよび要判定ランクの少なくとも3段階のランクを定義したランクテーブルを参照して、前記受信された投稿データのランクを特定することを特徴とするA−1からA−5のいずれかに記載の投稿データ評価装置。
【0072】
A−7.前記評価値算出部は、投稿データが電子掲載に適する度合いを複数の評価基準についての複数種類の特定評価値として指標化するための評価関数により、前記受信された投稿データについて複数種類の特定評価値を算出し、これら算出された複数種類の特定評価値を変数としてあらかじめ定められた演算を実行したときの生成値を前記受信された投稿データについての適合評価値とすることを特徴とするA−1からA−6のいずれかに記載の投稿データ評価装置。
【0073】
A−8.前記ランクテーブルにおいて適合評価値の取りうる範囲に対するランクの設定を変更するための設定入力を設定者から受け付ける設定入力部と、
前記設定入力に応じて前記ランクテーブルにおけるランクと適合評価値の関係を設定変更する設定変更部と、
を更に備えることを特徴とするA−1からA−7のいずれかに記載の投稿データ評価装置。
【図面の簡単な説明】
【0074】
【図1】電子掲示板システムのハードウェア構成図である。
【図2】電子掲示板サーバの機能ブロック図である。
【図3】投稿データ評価部の機能ブロック図である。
【図4】掲載ステータス記憶部のデータ構造図である。
【図5】評価設定データ記憶部のデータ構造図である。
【図6】内部判定を前提とした電子掲載可否判定についての処理過程を示すフローチャートである。
【図7】図6のS14の内部判定処理を詳細に示すフローチャートである。
【図8】副判定処理の処理過程を示すフローチャートである。
【図9】外部評価装置指示部の機能ブロック図である。
【図10】外部判定を前提とした電子掲載可否判定についての処理過程を示すフローチャートである。
【符号の説明】
【0075】
10 電子掲示板システム、 100 電子掲示板サーバ、 110 ユーザインタフェース処理部、 112 入力部、 114 表示部、 120 通信処理部、 122 クライアント端末通信部、 124 外部評価装置通信部、 130 データ処理部、 132 投稿データ評価部、 134 掲載制御部、 136 評価手段選択部、 138 副判定部、 140 外部評価装置指示部、 142 設定変更部、 150 データ記憶部、 152 投稿データ記憶部、 154 評価設定データ記憶部、 156 掲載ステータス記憶部、 160 第1ランク特定部、 162 第1主判定部、 164 評価値算出部、 166 リンク情報取得部、 200 外部評価装置、 202 評価値取得部、 204 転送指示部、 206 第2ランク特定部、 208 第2主判定部、 210 時間管理部、 300 クライアント端末。

【特許請求の範囲】
【請求項1】
評価対象となるべき投稿データを外部の投稿装置から受信する投稿データ受信部と、
投稿データが電子掲載に適する度合いを評価するための外部の評価装置に対して、前記投稿データを転送する投稿データ転送部と、
前記投稿データに対する評価結果を示す評価情報を前記評価装置から受信する評価情報受信部と、
前記評価情報に示される評価結果に応じて前記投稿データの電子掲載の適否を判定する主判定部と、
前記評価情報において電子掲載の適否を評価者によって判定すべき旨の評価結果が示されるとき、前記投稿データについて電子掲載の適否を指示するための評価者からの指示入力に応じて前記投稿データの電子掲載の適否を判定する副判定部と、
を備えることを特徴とする投稿データ評価装置。
【請求項2】
前記評価情報受信部は、投稿データが電子掲載に適する度合いを指標化した適合評価値を前記投稿データに対する評価結果として示す評価情報を受信し、
前記主判定部は、適合評価値の取りうる範囲が複数のランクに分類されたランクテーブルを参照して、前記投稿データのランクをその適合評価値によって特定することにより、前記投稿データの電子掲載の適否を判定し、
前記副判定部は、電子掲載の適否が評価者によって判定されるべきランクである要判定ランクとして前記投稿データのランクが特定されたときには、前記投稿データについて電子掲載の適否を指示するための評価者からの指示入力に応じて前記投稿データの電子掲載の適否を判定することを特徴とする請求項1に記載の投稿データ評価装置。
【請求項3】
前記主判定部は、前記投稿データが前記評価装置に転送されてから所定時間が経過しても前記投稿データに対する評価情報が受信されなかったときには、前記投稿データの電子掲載の適否について所定の評価結果を示す評価情報が受信されたときと同様の判定結果とすることを特徴とする請求項1または2に記載の投稿データ評価装置。
【請求項4】
前記主判定部は、前記所定の評価結果として電子掲載の適否を評価者によって判定すべき旨の評価結果とすることを特徴とする請求項3に記載の投稿データ評価装置。
【請求項5】
前記投稿データが前記評価装置に転送されたとき、前記投稿データの送信元である外部装置に対して前記投稿データの評価中である旨を示す待機情報を送信する待機情報送信部を更に備えることを特徴とする請求項1から4のいずれかに記載の投稿データ評価装置。
【請求項6】
前記投稿データ転送部は、少なくとも前記主判定部により前記投稿データについて電子掲載の適否が判定されるまでは、前記投稿データの送信元である外部装置から新たに送信される投稿データを前記評価装置に転送しないことを特徴とする請求項1から5のいずれかに記載の投稿データ評価装置。
【請求項7】
前記投稿データ転送部は、前記投稿データが電子掲載に適合しないと判定されてから所定の不受理期間が経過するまでは、その不適合とされた投稿データの送信元である外部装置から新たに送信される投稿データを前記評価装置に転送しないことを特徴とする請求項1から6のいずれかに記載の投稿データ評価装置。
【請求項8】
前記副判定部は、前記評価情報において電子掲載の適否を評価者によって判定すべき旨の評価結果が示されるときには、前記投稿データの電子掲載を許可したあとに、前記評価者からの指示入力に応じて投稿データの電子掲載を中止するか否かを判定することを特徴とする請求項1から7のいずれかに記載の投稿データ評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2006−268304(P2006−268304A)
【公開日】平成18年10月5日(2006.10.5)
【国際特許分類】
【出願番号】特願2005−84099(P2005−84099)
【出願日】平成17年3月23日(2005.3.23)
【出願人】(000155469)株式会社野村総合研究所 (1,067)