説明

電子メール評価装置および電子メール評価方法

【課題】電子メールを効率的にフィルタリングする。
【解決手段】電子メール評価装置は、電子メールに含まれる単語に基づいて、電子メールが適切な内容であるか否かを判定する。このとき、各単語ごとの適切さは適合度情報とよばれるデータベースに登録されており、単語ごとの適切さの総合評価として電子メールの適否が判定されることになる。電子メールについての判定結果は適合度情報に反映される。電子メールの評価に際しては、その電子メールの差出人が正規ユーザであれば、その電子メールが適切な電子メールと判定する。また、差出人が不当ユーザであれば、その電子メールは不適切な電子メールであると判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書ファイルの内容を評価するための技術に関し、特に、電子メールの内容の適否を判定するための技術に関する。
【背景技術】
【0002】
近年、コンピュータの普及とネットワーク技術の進展に伴い、ネットワークを介した電子情報の交換が盛んになっている。電子メールもそのひとつであるが、電子メールの多くはスパムメールなどとよばれる迷惑メールであるといわれている。
【0003】
このような状況に対応して、電子メールの内容の適否を自然言語処理により判定し、迷惑メールを自動的に排除するための技術が開発されている。
その一例として、電子メールに含まれる単語ごとの適切さを判定することにより、電子メールが迷惑メールに該当するか否かを総合評価する方法がある。たとえば、100通の電子メールのうち、70通が迷惑メールであり、残りの30通が通常の電子メール(以下、「正規メール」とよぶ)であったとする。ここで、ある単語Aが迷惑メール70通のうちの60通、正規メール30通のうちの3通から検出されたとする。この場合、単語Aは、迷惑メールに現れやすい単語であるから、単語Aが含まれている電子メールは迷惑メールである可能性が高いともいえる。このような観点から、単語ごとの適切さ、または不適切さを指標化してデータベース化し、新たに受信された電子メールに含まれている各単語からその電子メールが迷惑メールである可能性を総合評価する。また、評価結果は、データベースにフィードバックされる。
【特許文献1】特開2003−18324号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
このような方法によって電子メールの内容の適否を正確に評価するためには、データベースの充実が重要である。多くの電子メールが受信されるほど、単語ごとの評価も定まってくる。また、評価対象となる単語数も増加する。その反面、評価対象となる単語数が少ない初期段階においては、データベースが充実していないため、迷惑メールの検出精度が低くなる。したがって、初期段階においては、受信した電子メールごとに正規メールであるか迷惑メールであるかをユーザがシステムに学習させることによりデータベースの充実化を図る必要がある。
【0005】
このような課題に対処するために、最初から複数の単語についての評価を定めたデータベースを用意しておくという方法が考えられる。この初期設定されたデータベースに基づいて電子メール評価処理を実行しつつ、その評価結果に応じてデータベースをいっそう充実化させていく。しかし、迷惑メールであるか正規メールであるかは、そもそも受け手のユーザによって判断基準が異なる。したがって、単語ごとの適切さまたは不適切さをあらかじめ指標化したデータベースを用意するという方法は、必ずしも有効な解決策とは限らない。
【0006】
本発明はこうした状況に鑑みてなされたものであり、その主たる目的は、データベースを参照して電子メールの内容を評価するシステムにおいてユーザの利便性を高めるための技術を提供することにある。
【課題を解決するための手段】
【0007】
本発明のある態様は電子メール評価装置である。
この装置は、外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する適合度情報保持部と、評価対象となるべき電子メールを取得するメール取得部と、電子メールに含まれる単語を抽出する単語抽出部と、適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する適合判定部と、判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、適合度情報を更新する適合度更新部と、を備える。
適合判定部は、正規ユーザの電子メールアドレスがあらかじめ登録された正規アドレステーブルを参照し、取得された電子メールの送信元アドレスが正規ユーザの電子メールアドレスとして登録されていれば、その電子メールは適切な内容であると判定する。
【0008】
あるいは、適合判定部は、不当ユーザの電子メールアドレスがあらかじめ登録された不当アドレステーブルを参照して、取得された電子メールの送信元アドレスが不当ユーザの電子メールアドレスとして登録されていれば、その電子メールは不適切な内容であると判定してもよい。
【0009】
本発明の別の態様もまた、電子メール評価装置である。
この装置は、外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する適合度情報保持部と、評価対象となるべき電子メールを取得するメール取得部と、電子メールに含まれる単語を抽出する単語抽出部と、適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する適合判定部と、判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、適合度情報を更新する適合度更新部と、を備える。
メール取得部は、ユーザが外部装置に対して送信する電子メールも取得し、適合度更新部は、ユーザから送信される電子メールが適切な内容であるとして、その電子メールに含まれる各単語についての適合度を再計算することにより適合度情報を更新する。
【0010】
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0011】
本発明によれば、データベースを参照して電子メールの内容を評価するシステムにおいてユーザの利便性を高めることができる。
【発明を実施するための最良の形態】
【0012】
図1は、電子メール評価装置とメールブラウザの関係を示す模式図である。
クライアント端末80は、ユーザが使用するパーソナルコンピュータや携帯端末などの情報機器である。このクライアント端末80には、メールの送受信や閲覧のためのメールブラウザ90がインストールされている。本実施例においては、クライアント端末80が受信した電子メールは、まず電子メール評価装置100によって評価される。電子メール評価装置100は、電子メールが迷惑メールでなければメールブラウザ90に転送し、迷惑メールであればメールブラウザ90には転送しない。すなわち、電子メール評価装置100は電子メールのフィルタとしての機能を果たす。
【0013】
本実施例の電子メール評価装置100は、ベイジアンフィルタ法に基づいて電子メールの内容を評価し、電子メールが迷惑メールであるか否かを判定する。
その判定原理について説明する。
仮に、迷惑メール100通と、正規メール100通の計200通が取得された状態にあるとする。ここで「懸賞」という単語がこの迷惑メール群では98回、正規メール群では2回現れたとする。この場合、「懸賞」という単語が含まれる電子メールは迷惑メールである確率が高い。電子メール評価装置100は、単語ごとに「その単語が含まれている電子メールが迷惑メールである可能性の高さ」を「スパム単語確率」として指標化する。
【0014】
広く知られているPaul Graham方式の場合、ある単語wのスパム単語確率P(w)は、
P(w)=(m/M)/(2×n/N+m/M)
という式によって定義される。
ここで、
m:単語wが迷惑メール群において登場した回数
M:迷惑メールの総数
n:単語wが正規メール群において登場した回数
N:正規メールの総数
である。
さきほどの「懸賞」という単語のスパム確率をPaul Graham方式によって計算すると、m=98、M=100、n=2、N=100であることから、
P(「懸賞」)=(98/100)/(2×2/100+98/100)
により、約96%として計算される。
電子メール評価装置100は、これらの200通の電子メールに含まれる単語それぞれについてのスパム単語確率をデータベース化する。本実施例においては、このようなデータベースのことを、「適合度情報」とよぶ。
【0015】
この適合度情報において、「懸賞:96%」、「冷凍:30%」、「うどん:5%」というスパム単語確率が設定されていたとする。
以上の初期設定がなされた後において、電子メール評価装置100は、「私は、懸賞によく応募します。こないだ冷凍うどんを当てました。」という内容の電子メールを新たに受信したとする。
この電子メールが迷惑メールである確率(以下、「スパムメール確率」とよぶ)は、(0.96×0.3×0.05)/{(0.96×0.3×0.05)+(1−0.96)×(1−0.3)×(1−0.05)}=35%として算出される。
電子メール評価装置100は、スパムメール確率が90%以上となる電子メールを迷惑メールとして判定する。また、このときには、迷惑メール数の合計が101通となるため、それにあわせて電子メール中の各単語のスパム単語確率も再計算される。すなわち、m、Mがそれぞれ変更された上でP(w)が再計算されることになる。
一方、90%未満であれば、電子メール評価装置100はその電子メールを一応迷惑メールではないとして、メールブラウザ90に転送する。メールブラウザ90のユーザは、転送された電子メールが確かに正規メールであるか、それともやはり迷惑メールであるかを判定する。その判定結果は電子メール評価装置100にフィードバックされる。この判定結果を反映して、電子メール評価装置100は適合度情報を更新する。正規メールである場合、n、Nがそれぞれ変更された上でP(w)が再計算される。電子メール評価装置100は、電子メールを受信するごとに適合度情報を更新、充実させていくことになる。このようにして、正規メールや迷惑メールに現れる単語の評価が定まっていく。
なお、ユーザは、電子メール評価装置100における各種判定条件を変更することもできる。
【0016】
本実施例における電子メール評価装置100は、正規ユーザと不当ユーザの電子メールアドレスを登録したリスト(以下、「ユーザリスト」とよぶ)を保持している。電子メール評価装置100のユーザはこのユーザリストを自由に更新できる。
正規ユーザから送信された電子メールはスパムメール確率の計算に基づくことなく、一律に正規メールであると判定される。たとえば、親しい友人から送信される電子メールは、迷惑メールではないと考えられるので、この友人は正規ユーザとしてユーザリストに登録されてもよい。正規ユーザから送信された電子メールに含まれている各単語について、n、Nが変更された上でスパム単語確率が再計算される。
正規ユーザは、メールブラウザ90のアドレス帳に登録されているユーザであるとしてもよい。この場合、ユーザは明示的に正規ユーザをユーザリストに登録する作業すら不要になるため、いっそうユーザインタフェースを簡略化できる。
【0017】
一方、不当ユーザから送信された電子メールはスパムメール確率の計算に基づくことなく、一律に迷惑メールであると判定される。たとえば、過去に迷惑メールを送信した経歴のある業者が不当ユーザとして登録されてもよい。不当ユーザから送信された電子メールに含まれている各単語について、m、Mが変更された上でスパム単語確率が再計算される。
このような処理方法によれば、ユーザリストに基づいて自動的に適合度情報を充実させていくことができる。
【0018】
また、正規ユーザや不当ユーザのように類型化されたユーザからの電子メールに対しては、スパムメール確率の計算を実行しないため電子メール評価装置100の処理負荷を抑制する効果もある。
【0019】
図2は、電子メール評価装置の機能ブロック図である。
ここに示す各ブロックは、ハードウェア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組み合わせによっていろいろなかたちで実現できることは、当業者には理解されるところである。本実施例においては、電子メール評価装置100は、クライアント端末80にインストールされるアプリケーションソフトウェアによってその機能が発揮されるものとして説明する。
また、ここでは、主として各ブロックの発揮すべき機能について、その具体的な作用については、図3以降に関連して説明する。
【0020】
電子メール評価装置100は、ユーザインタフェース処理部110、メール取得部112、メール転送部114、データ処理部116およびデータ格納部118を含む。
ユーザインタフェース処理部110は、ユーザからの入力処理やユーザに対する情報表示のようなユーザインタフェース全般に関する処理を担当する。メール取得部112は、図示しない外部のメールサーバから電子メールを取得する。メール転送部114は、外部装置から取得した電子メールのうちデータ処理部116において一応迷惑メールではないと判定した電子メールをメールブラウザ90に転送する。
【0021】
なお、メール取得部112は、メールブラウザ90から外部に送信される電子メールも取得し、データ処理部116はこのような電子メールについても処理対象とする。以下、外部装置からクライアント端末80に送信される電子メールのことを「受信メール」、クライアント端末80から外部装置に送信される電子メールのことを「送信メール」とよぶ。メール取得部112により取得された送信メールは、データ処理部116により後述の処理対象とされた後、メール転送部114によってメールサーバに送出される。
【0022】
データ処理部116は、ユーザインタフェース処理部110やメール取得部112から取得されたデータを元にして各種のデータ処理を実行する。データ処理部116は、ユーザインタフェース処理部110、メール取得部112、メール転送部114およびデータ格納部118の間のインタフェースの役割も果たす。
データ格納部118は、あらかじめ用意された各種の設定データや、データ処理部116から受け取ったデータを格納する。
【0023】
データ格納部118は、適合度情報保持部136とユーザリスト保持部138を含む。適合度情報保持部136は、単語とそのスパム単語確率を対応づけた適合度情報を保持する。ユーザリスト保持部138はユーザリストを保持する。ユーザリストは、正規ユーザの電子メールアドレスと、不当ユーザの電子メールアドレスのリストである。ユーザは、ユーザインタフェース処理部110を介してこのユーザリストの内容を任意に変更できる。
【0024】
データ処理部116は、適合度情報処理部120、ユーザリスト更新部122およびメール評価部124を含む。
メール評価部124は、メール取得部112が電子メールを取得したときに、その電子メールのスパムメール確率を計算することにより、電子メールの適否を判定する。適合度情報処理部120は、その判定結果に応じて適合度情報保持部136における適合度情報を更新する。ユーザリスト更新部122は、電子メールに対するユーザの操作に応じてユーザリストを更新する。ユーザリストの更新については後述する。
【0025】
メール評価部124は、単語抽出部132と適合判定部134を含む。
単語抽出部132は、電子メールに含まれる単語を抽出する。なお、ここでいう単語とは、単語群、バイトストリームであってもよく、必ずしも文構成の最小単位としての「単語」に限る必要はない。適合判定部134は、抽出された単語のスパム単語確率を適合度情報保持部136から読み出して、スパムメール確率を算出する。既に述べたように、適合判定部134は、スパムメール確率が90%未満であれば、その電子メールをメール転送部114からメールブラウザ90に転送させ、90%以上であれば転送させない。なお、適合判定部134は、スパムメール確率の算出に先立って、ユーザリストを参照し、受信メールの送信元のアドレスが登録されていれば、その登録内容に応じて電子メールの適否を判定する。
【0026】
正規メールとは、
(1)正規ユーザからの受信メールかスパムメール確率が90%未満の受信メールであり、かつ、
(2)クライアント端末80においてユーザによって適切と判定された電子メール
である。また、
(3)送信メールは、一律に正規メールとして扱われる。
【0027】
一方、迷惑メールとは、
(1)不当ユーザからの受信メールかスパムメール確率が90%以上の受信メール、または、
(2)スパムメール確率は90%未満の受信メールでありながらユーザによって不適と判定された電子メール
である。
【0028】
このように、電子メールの適否は、電子メール評価装置100のメール評価部124とメールブラウザ90のユーザの双方または一方によって判定される。
なお、電子メールの判定基準となる90%という数値は、ユーザインタフェース処理部110を介してユーザは任意に変更できる。
【0029】
適合度情報処理部120は、更新部126と単語登録部128を含む。
更新部126は、適合度情報を更新する。すなわち、新たな電子メールについての判定結果に応じて、適合度情報に含まれる各単語のスパム単語確率をPaul Grahamの式にしたがって再計算する。単語登録部128は、電子メールに含まれる単語のうち、適合度情報に未登録の単語があれば、新たにこれを適合度情報に新規登録する。以降において、この新規登録単語についてのスパム単語確率の計算が開始される。
次に、電子メール評価装置100が新たに電子メールを受信したときの処理過程を説明する。
【0030】
図3は、電子メール取得時における電子メール評価装置の基本的な処理過程を示すフローチャートである。
まず、メール取得部112は電子メールを取得する(S10)。この電子メールが送信メールであれば(S12のY)、適合度情報を更新するための送信メール判定処理が実行される(S14)。その後、送信メールはメール転送部114により外部のメールサーバに送出される(S18)。一方、取得した電子メールが受信メールであれば(S12のN)、電子メールの適否を判定して適合度情報を更新するための受信メール処理が実行される(S16)。
S14およびS16の処理内容については後に詳述する。
【0031】
図4は、図3のS14における送信メール判定処理を詳細に示すフローチャートである。
単語抽出部132は、送信メールに含まれている単語を抽出する(S20)。この中で、適合度情報に登録されていない単語があれば(S22のY)、単語登録部128は新たにこの未登録単語を適合度情報に登録する(S24)。未登録単語がなければ(S22のN)、S24の処理はスキップされる。
【0032】
更新部126は、送信メールが正規メールであるとして、その送信メールに含まれる各単語のスパム単語確率を再計算する(S26)。これにより、適合度情報が更新される。ユーザリスト更新部122は、ユーザリストを更新するためのユーザリスト更新処理を実行する(S28)。
【0033】
図5は、図4のS28におけるユーザリスト更新処理を詳細に示すフローチャートである。
ユーザリスト更新部122は、送信メールが受信メールに対する返信として送信される電子メールであれば(S30のY)、その送信メールの宛先人、すなわち、もともとの受信メールの差出人を正規ユーザとして登録する(S36)。クライアント端末80のユーザが電子メールを受信して、その電子メールに対して返信をする場合、その返信先は不当ユーザではないと考えられるので、このようなユーザを自動的に正規ユーザとして登録している。なお、返信先のユーザが不当ユーザとしてユーザリストに既に登録されているときには、ユーザによる返信をもってそのユーザを不当ユーザから外してもよい。
【0034】
ユーザリスト更新部122は、宛先人ごとに電子メールの送信回数を管理している。S30において、送信メールが返信メールでなければ(S30のN)、ユーザリスト更新部122はその送信メールの宛先人に対する送信回数をカウントアップする(S32)。この送信回数が所定の閾値S、たとえば、5回を超えると(S34のY)、宛先人を正規ユーザとして登録する(S36)。頻繁に宛先人とされているユーザは不当ユーザではないと考えられるので、このようなユーザを自動的に正規ユーザとして登録している。一方、閾値S以下であれば(S34のN)、S28の処理は終了する。
【0035】
変形例として、たとえば、S30においては、所定回数以上返信した宛先人であることを条件として、その宛先人を正規ユーザとして登録してもよい。また、S34において、過去1ヶ月という所定期間における送信回数が閾値Sを超えることを条件として、その宛先人を正規ユーザとして登録してもよい。
【0036】
図6は、図3のS16における受信メール判定処理を詳細に示すフローチャートである。
適合判定部134は、肯定フラグと否定フラグという2種類のフラグを管理している。肯定フラグは、評価対象となる電子メールが正規メールであることを示し、否定フラグは迷惑メールであることを示す。適合判定部134は、受信メールの適否を判定する前に、まず、この各フラグをリセットする(S40)。受信メールの差出人が正規ユーザであれば(S42のY)、適合判定部134は肯定フラグをオンする(S44)。一方、受信メールの差出人が不当ユーザであれば(S42のN、S46のY)、適合判定部134は否定フラグをオンする(S48)。差出人が正規ユーザでも不当ユーザでもなければ(S42のN、S46のN)、いずれのフラグもオンされない。
このあと、受信メールの適合評価のための適合評価処理が実行される(S50)。
【0037】
図7は、図6のS50における適合評価処理を詳細に示すフローチャートである。
単語抽出部132は、受信メールに含まれている単語を抽出する(S60)。この中で、適合度情報に登録されていない単語があれば(S62のY)、単語登録部128は新たにこの未登録単語を適合度情報に登録する(S64)。未登録単語がなければ(S62のN)、S64の処理はスキップされる。
【0038】
肯定フラグがオンされていれば(S66のY)、処理はS74にスキップする。否定フラグがオンされていれば(S66のN、S68のY)、処理はS80にスキップする。肯定フラグも否定フラグもオンされていなければ(S66のN、S68のN)、適合判定部134は、受信メールから抽出された単語についてのスパム単語確率からスパムメール確率を計算する(S70)。
【0039】
スパムメール確率が、所定の閾値以上であれば(S72のN)、適合判定部134はその電子メールを迷惑メールと判定する(S80)。なお、本実施例においては、この閾値は90%として設定されるが、ユーザからの設定入力により変更可能である。一方、スパムメール確率がこの閾値未満であれば(S72のY)、適合判定部134は、一応、正規メールと仮判定する。メール転送部114はメールブラウザ90に受信メールを転送する(S74)。ユーザによって、転送した受信メールが正規メールであると判定されたときには(S76のY)、このメールは正規メールとして扱われる(S78)。ユーザによって、転送した受信メールが迷惑メールであると判定されたときには(S76のN)、この電子メールは迷惑メールとして扱われる(S80)。
更新部126は、受信メールについての判定結果に応じて、適合度情報における各単語のスパム単語確率を再計算する(S82)。
【0040】
以上、実施例に基づいて本発明を説明した。
本実施例に示した電子メール評価装置100によれば、ベイジアンフィルタ方式によってスパムメール確率を求めるときに、その判定の元となる適合度情報を効率的に充実させることができる。
【0041】
ユーザリストによって電子メールをその差出人に応じて類型化することにより、適合度情報が充実していないときにも電子メール評価装置100がフィルタリング機能を発揮することができる。また、正規ユーザや不当ユーザからの電子メールに対してはスパムメール確率を計算しないため、電子メール評価装置100の処理負荷を抑制する効果もある。そのため、適合度情報が充実した後にも本実施例に示す方法は有効に機能する。また、ユーザの送信操作に応じてユーザリストを自動的に更新することにより、ユーザリストを充実させることができるため、いっそう利便性が高められる。特に、正規ユーザをアドレス帳に登録されているユーザであるとすれば、ユーザはユーザリストの存在すら意識する必要がなくなる。
【0042】
更に、ユーザが外部に送信する送信メールはユーザの意思を反映した正規なメールであるから、このような送信メールも利用することにより、いっそう早期に適合度情報を充実させることができる。このように本実施例に示す電子メール評価装置100によれば、電子メールフィルタリングにおけるユーザの利便性をいっそう高めることができる。
本実施例においては、ベイジアンフィルタの特にPaul Graham方式を前提として説明したが、これに限らず、単語ごとの適切さをベースとした文書内容評価に広く応用可能である。
【0043】
請求項に記載の各構成要件が果たすべき機能は、本実施例において示された各機能ブロックの単体もしくはそれらの連係によって実現されることも当業者には理解されるところである。
【0044】
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0045】
たとえば、本実施例においては、ユーザの送信操作に応じて正規ユーザを自動的にユーザリストに登録する態様について説明した。変形例として、受信メールに応じて不当ユーザを更新してもよい。たとえば、単位時間当たりにおいて同一の差出人による受信メールが所定数を超えるときには、その差出人を不当ユーザとしてユーザリストに登録してもよい。このように、ユーザの適否に基づくユーザリストと単語の適否に基づく適合度情報を連携させることにより、より利便性が高く精緻な電子メールフィルタリングを実現することができる。
【図面の簡単な説明】
【0046】
【図1】電子メール評価装置とメールブラウザの関係を示す模式図である。
【図2】電子メール評価装置の機能ブロック図である。
【図3】電子メール取得時における電子メール評価装置の基本的な処理過程を示すフローチャートである。
【図4】図3のS14における送信メール判定処理を詳細に示すフローチャートである。
【図5】図4のS28におけるユーザリスト更新処理を詳細に示すフローチャートである。
【図6】図3のS16における受信メール判定処理を詳細に示すフローチャートである。
【図7】図6のS50における適合評価処理を詳細に示すフローチャートである。
【符号の説明】
【0047】
80 クライアント端末、 90 メールブラウザ、 100 電子メール評価装置、 110 ユーザインタフェース処理部、 112 メール取得部、 114 メール転送部、 116 データ処理部、 118 データ格納部、 120 適合度情報処理部、 122 ユーザリスト更新部、 124 メール評価部、 126 更新部、 128 単語登録部、 132 単語抽出部、 134 適合判定部、 136 適合度情報保持部、 138 ユーザリスト保持部。

【特許請求の範囲】
【請求項1】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する適合度情報保持部と、
評価対象となるべき電子メールを取得するメール取得部と、
電子メールに含まれる単語を抽出する単語抽出部と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する適合判定部と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する適合度更新部と、を備え、
前記適合判定部は、正規ユーザの電子メールアドレスがあらかじめ登録された正規アドレステーブルを参照し、取得された電子メールの送信元アドレスが正規ユーザの電子メールアドレスとして登録されていれば、その電子メールは適切な内容であると判定することを特徴とする電子メール評価装置。
【請求項2】
前記適合判定部は、前記正規アドレステーブルとして電子メールソフトに付属するアドレス帳(address book)を参照し、取得された電子メールの送信元アドレスが前記アドレス帳に登録されていれば、その電子メールは適切な内容であると判定することを特徴とする請求項1に記載の電子メール評価装置。
【請求項3】
外部装置から送信された電子メールに対して受け手のユーザが返信したときには、前記外部装置から送信された電子メールの差出人を正規ユーザとして前記正規アドレステーブルに登録する正規アドレステーブル更新部を更に備えることを特徴とする請求項1または2に記載の電子メール評価装置。
【請求項4】
前記正規アドレステーブル更新部は、前記ユーザから所定の宛先人に対する電子メールの送信回数が所定回数を超えたことを条件として、前記所定の宛先人を正規ユーザとして前記正規アドレステーブルに登録することを特徴とする請求項3に記載の電子メール評価装置。
【請求項5】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する適合度情報保持部と、
評価対象となるべき電子メールを取得するメール取得部と、
電子メールに含まれる単語を抽出する単語抽出部と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する適合判定部と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する適合度更新部と、を備え、
前記メール取得部は、前記ユーザが外部装置に対して送信する電子メールも取得し、
前記適合度更新部は、前記ユーザから送信される電子メールが適切な内容であるとして、その電子メールに含まれる各単語についての適合度を再計算することにより前記適合度情報を更新することを特徴とする電子メール評価装置。
【請求項6】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する適合度情報保持部と、
評価対象となるべき電子メールを取得するメール取得部と、
電子メールに含まれる単語を抽出する単語抽出部と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する適合判定部と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する適合度更新部と、を備え、
前記適合判定部は、不当ユーザの電子メールアドレスがあらかじめ登録された不当アドレステーブルを参照して、取得された電子メールの送信元アドレスが不当ユーザの電子メールアドレスとして登録されていれば、その電子メールは不適切な内容であると判定することを特徴とする電子メール評価装置。
【請求項7】
前記適合度更新部は、ベイジアンフィルタ法(Bayesian Filtering)に基づいて、取得された電子メールに含まれる各単語についての適合度を再計算することを特徴とする請求項1から6のいずれかに記載の電子メール評価装置。
【請求項8】
外部装置から送信された電子メールを取得するステップと、
電子メールに含まれる単語を抽出するステップと、
単語ごとの適切さを指標化した適合度を示す適合度情報を参照して、取得された電子メールに含まれる各単語の適合度を検出し、それらの適合度から取得された電子メールが適切な内容であるか否かを判定するステップと、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新するステップと、を備え、
電子メールの内容を判定するステップにおいては、正規ユーザの電子メールアドレスがあらかじめ登録された正規アドレステーブルを参照し、取得された電子メールの送信元アドレスが正規ユーザの電子メールアドレスとして登録されていれば、その電子メールは適切な内容であると判定することを特徴とする電子メール評価方法。
【請求項9】
外部装置から送信された電子メールを取得するステップと、
電子メールに含まれる単語を抽出するステップと、
単語ごとの適切さを指標化した適合度を示す適合度情報を参照して、取得された電子メールに含まれる各単語の適合度を検出し、それらの適合度から取得された電子メールが適切な内容であるか否かを判定するステップと、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新するステップと、
外部装置に対して送信される電子メールを取得するステップと、を備え、
前記適合度情報を更新するステップにおいては、外部装置に対して送信される電子メールが適切な内容のメールであるとして、その電子メールに含まれる各単語についての適合度を再計算することにより前記適合度情報を更新することを特徴とする電子メール評価方法。
【請求項10】
外部装置から送信された電子メールを取得するステップと、
電子メールに含まれる単語を抽出するステップと、
単語ごとの適切さを指標化した適合度を示す適合度情報を参照して、取得された電子メールに含まれる各単語の適合度を検出し、それらの適合度から取得された電子メールが適切な内容であるか否かを判定するステップと、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新するステップと、を備え、
電子メールの内容を判定するステップにおいては、不当ユーザの電子メールアドレスがあらかじめ登録された不当アドレステーブルを参照して、取得された電子メールの送信元アドレスが不当ユーザの電子メールアドレスとして登録されていれば、その電子メールは不適切な内容であると判定することを特徴とする電子メール評価方法。
【請求項11】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する機能と、
外部装置から送信された電子メールを取得する機能と、
電子メールに含まれる単語を抽出する機能と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する機能と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する機能と、
正規ユーザの電子メールアドレスがあらかじめ登録された正規アドレステーブルを参照し、取得された電子メールの送信元アドレスが正規ユーザの電子メールアドレスとして登録されていれば、その電子メールは適切な内容であると判定する機能と、
をコンピュータに発揮させることを特徴とする電子メール評価プログラム。
【請求項12】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する機能と、
外部装置から送信された電子メールを取得する機能と、
電子メールに含まれる単語を抽出する機能と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する機能と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する機能と、
前記ユーザが外部装置に対して送信する電子メールを取得する機能と、
前記ユーザから送信される電子メールが適切な内容であるとして、その電子メールに含まれる各単語についての適合度を再計算することにより前記適合度情報を更新する機能と、
をコンピュータに発揮させることを特徴とする電子メール評価プログラム。
【請求項13】
外部装置から送信された電子メールが受け手のユーザにとって適切な内容であるかを判定するために、単語ごとの適切さを指標化した適合度を適合度情報として保持する機能と、
外部装置から送信された電子メールを取得する機能と、
電子メールに含まれる単語を抽出する機能と、
前記適合度情報を参照して電子メールに含まれる各単語の適合度を検出し、それらの適合度から電子メールが適切な内容であるか否かを判定する機能と、
判定対象となった電子メールに含まれる各単語についての適合度をその電子メールに対する判定結果に応じて再計算することにより、前記適合度情報を更新する機能と、
不当ユーザの電子メールアドレスがあらかじめ登録された不当アドレステーブルを参照して、取得された電子メールの送信元アドレスが不当ユーザの電子メールアドレスとして登録されていれば、その電子メールは不適切な内容であると判定する機能と、
をコンピュータに発揮させることを特徴とする電子メール評価プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−122146(P2007−122146A)
【公開日】平成19年5月17日(2007.5.17)
【国際特許分類】
【出願番号】特願2005−309804(P2005−309804)
【出願日】平成17年10月25日(2005.10.25)
【出願人】(390024350)株式会社ジャストシステム (123)