文書管理装置
【課題】 組織内にて格納蓄積されていく文書データを介して、組織が法律や契約などの重大な約束事に違反するおそれを未然防止するのに役立つ文書管理装置を提供する。
【解決手段】 検閲対象となる文書データを所定の文書サーバから例えば定期的に受信する対象文書受信手段と、文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、NGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、を備えた文書管理装置とする。
【解決手段】 検閲対象となる文書データを所定の文書サーバから例えば定期的に受信する対象文書受信手段と、文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、NGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、を備えた文書管理装置とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、組織内における文書管理を介して、組織員の不適切な行動を未然に防止し、不適切な行動の再発防止に寄与する技術に関する。
【背景技術】
【0002】
情報処理技術の進展に伴って、法人でも個人でも、保有作成する書類に関してはペーパーレス化が進展し、書類が電子化されて保存され管理されるようになり、特に、組織内での情報検索や情報共有において、効率的な管理運営に寄与している。
さて、企業や組織に対しては、法令遵守やコンプライアンスのための活動が、以前に増して求められている。
【0003】
また、米国の訴訟制度において、訴訟の被告となった場合に必要な証拠文書を相手方に提示しなければならない「ディスカバリー」と呼ばれる制度が注目されている。
ディスカバリー制度は、知的財産関連の訴訟、金融関係の訴訟、税金関係の訴訟において用いられる制度である。
その一方、組織が大きくなると、経営部門や管理部門にて必要と認識しているコンプライアンス活動において、営業部門などの現場レベルまで管理を徹底するのは容易ではなくなる。
【0004】
近年のディスカバリー制度では、書類の電子化の進展に伴い、電子化された文書が保存された記録媒体の提出が命じられることとなる。旧来の「ディスカバリー制度」と区別するために「イー・ディスカバリー(e-Discovery)」と呼ばれることもある。
電子化された書類は、タイムスタンプといった認証技術を併用しない限り、作成日時や改訂日時を変更することは容易であるものの、作成日時や改訂日時を改ざん等したことが発覚したとすれば、裁判において不利な状況に追い込まれる可能性がある。 したがって、イー・ディスカバリーを意識した適切な書類管理が、多くの企業で求められる。
【0005】
また、たとえばメーカなどにおいては、製品の使用条件が不明確な危険性についての記録が設計書や特許明細書などに残っていれば、PL法(いわゆる製造物責任法)において免責されない可能性が出てくる。
また更に、公的入札の直前に競合他社との打ち合わせや懇談会の記録が残っていれば、談合が疑われる。独占禁止法に違反した場合、その罰則の重さもさることながら、違反後の所定期間に入札資格を喪失するなどにより、企業経営上のダメージが大きい。
【0006】
さて、企業における情報管理システムは、オーダーメイドされることも少なくないが、コストや納期の面で導入が容易な情報管理システムも望まれている。
たとえば、特許文献1に開示された技術では、各企業における機密文書を、それら企業と契約を締結した外部の事業者が管理するサーバ装置を用いることによって一括して保管するシステムが提案されている。
また、特許文献1に開示された技術に内在する問題点を見いだし、企業における一般的なセキュリティポリシーに反している等の点を解決した技術として、特許文献2に開示された情報管理システムも提案されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2001−222525号公報
【特許文献2】特開2009−9551号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
独占禁止法、PL法、労働関係の法律については、法律の条文が抽象的であったり、比較的新しい法律の場合には判例が少なかったりする。 そのような場合、該当する法律を管轄する行政機関が審査基準や指針を公開するものの、組織や業界に特有な個別具体的な事案までは明確になっていないことが多い。
したがって、杓子定規に現場を管理しようとしても、現場の行動や判断を束縛しすぎてしまいかねない。 特に営業部門は、ビジネスの相手の行動や判断によってどのように事態が進展するのか不明確であり、不明確な段階での管理は不必要あるいは無駄であることも多い。
その組織にとって不都合が生じるおそれのある事態を予め適切な段階で抽出し、しかるべき人間が判断した上で管理することが望ましい、ということになる。
【0009】
したがって、法律違反となる事態を未然に防止し、不正の芽があれば速やかに発見して改善に向かわせるシステムが求められている。
出願人は、キーワード検索などを試みた。 その結果、当組織にとって不都合が生じるおそれのある文書を発見したり、単純に修正や削除をしたりするという技術は存在するようであるが、そのような技術では、イー・ディスカバリーや訴訟手続きにおいて裁判官の心証を悪くしてしまう可能性がある。
【0010】
前記の説明では、法律についての違反について説明してきたが、遵守すべき所定の契約に対する違反についても同様である。
本発明が解決しようとする課題は、組織内にて格納蓄積されていく文書データを介して、組織が法律や契約などの重大な約束事に違反するおそれを未然防止、再発防止するのに役立つ技術を提供することにある。
【課題を解決するための手段】
【0011】
(第一の発明)
第一の発明は、 検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手段と、 前記文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、 前記対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、 その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、 そのNG判断手段がNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、を備えた文書管理装置に係る。
【0012】
「検閲対象」が文書ファイルではなくて「文書データ」であるとしているのは、文書ファイルのほか、文書ファイル中の所定の文書データや、電子メールの中の一文、といった場合もあるからである。
「文書サーバ」とは、文書管理サーバのほか、電子メールサーバなども含む。本願に係る文書管理装置を導入する組織が大きい場合には、分割された部署ごとに文書サーバが存在する。 「NG判定用辞書記憶手段」が「文書サーバ毎」に存在するのは、同じワードでも、部署毎にNGワードとなったりならなかったりするからである。
たとえば、「賄賂」というワードは全てのNG判定用辞書記憶手段に含まれるが、「侵害」のように法務知財部署では日常的なワードであっても、法務知財以外の部署が使用することは確認が必要なワードとしてNGワードに含めてよい。
「処理結果出力手段」が送信する「所定の端末」は、検閲対象となった文書データを作成した端末、検閲対象となった文書データを格納している文書サーバにアクセスする端末など、適宜設定できる。
【0013】
「対象文書受信手段」が検閲対象となる文書データを受信するタイミングについては、様々である。 管理部門において所定期間ごと(例えば毎月一度)というように設定してもよいし、文書管理サーバにおいて対象となる文書ファイルの数が所定数に達したら文書管理サーバ側からトリガーを発信してもよい。 もちろん、不定期あるいは有事の際に、文書データへ能動的にアクセスして解析してもよい。
「NGワード」とは、本願に係る文書管理装置を導入する組織において文書中に用いる単語として、または他のキーワードとの組み合わせ等によって相応しくない、と判断すべきワードである。たとえば、公序良俗を害するような言葉、差別用語、などである。 NGワードは、同一組織内であっても部署が異なればNGワードに該当したりしなかったりする場合もあるので、部署毎や組織員の個人別にNGワードを区別するようにしてもよい。また、製品開発における時期や販売商品のライフサイクルなど、時期に応じてNGワードを入れ替えたり追加したりする場合もある。
公共放送における禁止用語集などを用いることで、NG判定用辞書記憶手段への入力の手間を軽減してもよい。
【0014】
(作用)
NG判定用辞書記憶手段には、検閲対象となる文書データが格納された文書サーバ毎にNGワードを予め格納する。
検閲対象となる文書データを、所定の端末から対象文書受信手段が受信する。 その受信した文書データに対して形態素解析手段が形態素解析をし、当該文書データを単語ごとに分割する。
NG判断手段は、形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断する。 そして、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断する。 そのNG判断手段がNGと判断した修正候補を含む判断結果データは、処理結果出力手段が所定の端末へ送信する。
【0015】
(第一の発明のバリエーション1)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、 前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとしてもよい。
【0016】
「ランクデータ」とは、たとえば、どんな文書にも使ってはいけない言葉、場合によっては使うことが許される言葉、といった危険度のランクである。 どんな文書にも使ってはいけない言葉が「5」、場合によっては使うことが許される言葉が『「4」〜「1」』といった具合である。ランクデータは数値を使うこととするのが処理しやすいが、言葉や色分けにてラベルを選択する場合もある。
他の請求項にて特定する「処理結果出力手段」においては、修正候補に対してランク表示を実行する。 ここで「ランク表示」とは、NGワードとして抽出された際に、そのNGワードの危険度が文字への着色で表現される表示、ハイライトの色や濃さ、網掛けの種類や濃さ、下線の種類や太さ、イタリックの角度、フォントの変更、文字の大小、文字の太さなどで表現される表示、修正候補の出力画面にカーソルを当てると当該ランクやその危険度が吹き出しなどで表現される表示、あるいはこれらを組み合わせた表示である。
なお、NGワードの登録時にランクデータが入力されていない場合には、後に入力することとしてもよい。また、入力されていたランクデータがふさわしくない場合には、改訂して入力し直してもよい。
【0017】
(作用)
NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含んで登録されている。
NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は、当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断する。
NG判断手段による判断結果が所定ランク以上である場合には、判断結果出力手段が判断結果データを所定の端末へ送信する。
【0018】
(第一の発明のバリエーション2)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、 前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、 前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとしてもよい。
【0019】
「NG係り受け」とは、NG文例を予め構文解析した結果から抽出したサンプルや、係り受けによってNGとなる場合の規則性などに関する情報などである。
たとえば、「主語−述語」の関係において「当社−侵害」をNG係り受けとして登録しておく。 「当社」について、「弊社」、「我が社」、「うちの会社」、正式な社名などは、シソーラスとして登録すると効果的である。
係り受けにおける目的節の「A社(競合他社の正式名や俗称としての社名)−特許権」をNG係り受けとして登録しておくと、「他社の特許に抵触するおそれ」という趣旨の表現を抽出しやすくなるので、効果的である。
【0020】
(作用)
NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納している。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析する。 そして、前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断する。NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断する。
【0021】
(第一の発明のバリエーション3)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、 前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとしてもよい。
【0022】
「NG文章構成単語群」とは、NG文章である、と判断すべき文章構成単語群である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」という文章がNGワードをひとつも含まないとしても、単語の組み合わせが同一文中に併存することでNG文章を構成することとなるとして格納するのである。
【0023】
(作用)
NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納しておく。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析する。そして、NG判定用辞書記憶部を参照し、NG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断する。
【0024】
(第一の発明のバリエーション4)
前記のバリエーション3に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群を格納し、 前記NG判断手段は、その期間限定に指定された期間にのみ修正候補であるか否かを判断することとしてもよい。
【0025】
(用語説明)
「限定的にNGワード」等となる「限定NGワード」とは、平常時にNGワードとすると日常業務に支障が出かねないワードが該当する。たとえば、公的入札日の前後一ヶ月の期間を指定して、接待申請書における競合他社名をNGワードとする、などである。
【0026】
(作用)
NG判定用辞書記憶手段には、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群が格納される。NG判断手段は、指定されたその期間にのみ修正候補であるか否かを判断し、指定されていない期間であれば、修正候補とは判断しない。 これによって、指定された期間以外は修正候補とならず、業務の円滑化に寄与する。
【0027】
(第一の発明のバリエーション5)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判断手段による判断結果として修正候補と判断された部位を表示させる処理結果出力手段と、 その処理結果出力手段によって修正候補と判断された部位に対する修正データの入力を受け付ける修正入力手段と、 その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、を備えることとしてもよい。
【0028】
「修正データ」には、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。
「処理結果出力手段」および「修正入力手段」は、検閲対象となる文書ファイルを作成した端末(被管理部門端末)であってもよいし(図13参照)、検閲対象となる文書ファイルを作成した端末(被管理部門端末)以外の端末(管理部門端末)であってもよい(図1参照)。前者の場合は、検閲対象となる文書ファイルを作成した作成者が自ら「管理者」となる場合が含まれる。
【0029】
(作用)
NG判断手段による判断結果として修正候補と判断された部位を処理結果出力手段が表示させる。
所定の端末操作者(たとえば文書データの管理者)は表示された修正候補と判断された部位を閲覧し、それに対して修正入力手段を用いて修正データを入力する。その修正入力手段によって修正された文書データを適正文書データ受信手段が受信する。
以上により、本願に係る文書管理装置を導入する組織内で保管すべき文書ファイルを保管前に事前チェックをする体制が、その組織へ提供されることとなる。
また例えば、処理結果出力手段によって修正候補とともにランクデータを出力された作業者は、ランクデータを意識しながら修正作業が行える。
【0030】
(第一の発明のバリエーション6)
前述のバリエーション5に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記修正入力手段は、修正データの入力をした場合にその修正入力に対して前記NG判断手段による判断を求めるか否かを選択入力が可能であるように形成され、 前記適正文書データ受信手段にて受信した修正された文書データに前記NG判断手段による判断を求める旨が含まれている場合には、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信することとしてもよい。
【0031】
(作用)
修正候補を受信した端末の操作者は、修正入力を行ったとしても、その修正が適切なのかどうか不安な場合がある。不安な場合、その修正入力に対して前記NG判断手段による判断を求める、を選択入力する。すると、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信する。 修正入力した箇所が再び修正候補となっていなければ、バリエーション6に係る文書管理装置は、適切な修正だったと判断したこととなる。
なお、当該端末の操作者が修正入力を行い、その修正が適切であると判断した場合には、その修正入力に対して前記NG判断手段による判断を求めない、を選択入力する。
【0032】
(第一の発明のバリエーション7)
前述のバリエーション5またはバリエーション6に係る文書管理装置は、以下のように形成してもよい。
すなわち、前記修正入力手段は、修正候補と判断された部位を修正しない場合に修正保留か修正不要かを選択入力が可能であるように形成され、 修正不要が選択された場合には、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならないこととしてもよい。
【0033】
(作用)
本願に係る文書管理装置のNG判断手段が修正候補としたとしても、実際には修正が明らかに不要な場合もある。その場合、修正不要と判断した端末の操作者は、その修正候補に対して修正不要を選択入力する。すると、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならない。
一方、本願に係る文書管理装置のNG判断手段が修正候補としたとしても、端末の操作者が修正すべきか否か、判断に迷う場合もある。その場合、当該操作者は、その修正候補に対して修正保留を選択入力する。すると、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象となる。 なお、当該操作者の上司に係る端末や管理部門に係る端末へ修正保留に係る修正候補を送信し、修正データの入力または修正不要の選択が入力されるまで、所定間隔で繰り返されるようにしてもよい。
【0034】
(第一の発明のバリエーション8)
第一の発明に係る文書管理装置においては、 NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、 前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとしてもよい。
【0035】
(作用)
NG判定用辞書記憶手段に、格納されたNGワードに対応した推奨ワードを、推奨ワード辞書記憶手段が予め格納しておく。処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力する。 修正入力を行おうとする端末の操作者は、その推奨ワードを参考にして修正入力の作業をすることができる。
【0036】
(第一の発明のバリエーション9)
前記した第一の発明のバリエーション5からバリエーション8に係る文書管理装置においては、修正入力手段による修正の結果をNG判定用辞書記憶手段へ登録することとしてもよい。
ここで、「修正の結果」とは、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。 また、修正候補と判断された部位、修正入力手段によって入力された修正データ、修正データを入力した主体に関するデータ、修正データの入力日時などのデータを含む。
【0037】
(作用)
修正入力手段によって入力された修正の結果がNG判定用辞書記憶手段へ登録されるので、NG判定用辞書記憶手段は修正データが入力されるたびに修正され、その組織に適合したNG判定能力へ進化することとなる。
これによって、本願に係る文書管理装置の解析能力が徐々に向上し、修正を担当する者の負担が軽減される。
【0038】
(第一の発明のバリエーション10)
前記した第一の発明のバリエーション5からバリエーション9に係る文書管理装置においては、前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えることとしてもよい。
【0039】
「タイムスタンプ手段」とは、文書ファイルに対して保存日時を記録する手段である。 文書ファイルまたはその文書ファイルのハッシュ値を日時特定のための時計が備えられたサーバへ送信する機能、当該サーバが文書ファイルまたはその文書ファイルのハッシュ値に対して日時データを付加して送り返してきたファイルを受信する機能などが含まれる。
なお、保存日時を特定するための時計は、本願に係る文書管理装置を導入しているイントラネットの外部であることが望ましく、公的または準公的な第三者機関であることがより好ましい。日時データの客観性が高まるからである。
【0040】
(第一の発明のバリエーション11)
本願に係る文書管理装置は、前記修正候補を所定の文書サーバごとに集計して出力する集計データ出力手段を備えることとしてもよい。
【0041】
(第一の発明のバリエーション12)
前記した第一の発明のバリエーション3からバリエーション11に係る文書管理装置においては、前記NG判定用辞書記憶手段に格納されたNGワード、NG文章またはNG文章構成単語群を加除訂正するデータ入力が可能なNG判定用辞書修正手段を備えることとしてもよい。
【0042】
(第一の発明のバリエーション13)
前記した第一の発明に係る文書管理装置においては、 前記対象文書受信手段は、前記文書サーバまたはNG判定用辞書記憶手段のいずれか一方が更新された場合に、検閲対象となる文書データを受信することとしてもよい。
文書サーバが更新された場合に検閲対象についてのNG判定をすることとすれば、検閲対象となる文書データの総数を減らすことができる。
また、NG判定用辞書記憶手段が更新された場合に検閲対象についてのNG判定をすることとすれば、新たなNG判断をタイムリーに反映させることができる。
【0043】
(第一の発明のバリエーション14)
前記した第一の発明に係る文書管理装置においては、
検閲対象となる文書データを所定の文書サーバから廃棄削除する文書データ廃棄手段と、 文書データの廃棄ルールを蓄積した文書データ廃棄ルール格納手段と、 前記文書データ廃棄手段によって文書データを廃棄しようとする場合には前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する廃棄ルール判断手段とを備えることとしてもよい。
その廃棄ルール判断手段が廃棄不能と判断した場合に、前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を出力することとするのである。
【0044】
(第二の発明)
本願は、コンピュータプログラムに係る第二の発明を提供することもできる。
その第二の発明は、 検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手順と、 前記文書サーバ毎のNGワードを予めNG判定用辞書記憶手段へ格納するNG判定用辞書記憶手順と、 前記対象文書受信手順にて受信した文書データの文書を形態素解析して単語を抽出する形態素解析手順と、 その形態素解析手順にて抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手順と、 そのNG判断手順にてNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手順とを、コンピュータに実行させるためのコンピュータプログラムに係る。
【0045】
(第二の発明のバリエーション)
第二の発明は、第一の発明のバリエーション1から14に対応したバリエーションを実現可能な各手順を含んだコンピュータプログラムとしてもよい。
【0046】
第二の発明に係るコンピュータプログラムは、バリエーションを含め、ハードディスク、DVD−Rなどの記録媒体に格納して提供することもできる。 また、第二の発明に係るコンピュータプログラムを格納した記録媒体から、通信回線を介して所定の情報端末に受信することもできる。受信した情報端末(またはサーバ)は、第一の発明に係る文書管理装置となる。
【発明の効果】
【0047】
本願発明によれば、組織内にて格納蓄積されていく文書データを介して、組織が法律や契約などの重大な約束事に違反するおそれを未然に防止できるとともに、違反が生じた場合に再発を防止するのに役立つ技術を提供することができた。
【図面の簡単な説明】
【0048】
【図1】第一の実施形態の全体構成を示すブロック図である。
【図2】第一の実施形態における主要な処理手順を示すフローチャートである。
【図3】構文解析手段による解析の前後を示す図である。
【図4】NG判定用辞書記憶手段の構造を示すブロック図である。
【図5】検閲対象文書が構文解析手段によってどのように解析されるかを示す図示例である。
【図6】解析後の検閲対象文書が修正入力手段によってどのように修正されるかを示す図示例である。
【図7】検閲対象文書が構文解析手段によってどのように解析されるかを示す図示例である。
【図8】解析後の検閲対象文書が修正入力手段によってどのように修正されるかを示す図示例である。
【図9】検閲対象文書がどのような理由で修正されるかを示す図示例である。
【図10】検閲対象文書が複数回の修正を経て戻される場合を概念的に示すブロック図である。
【図11】文書ファイルにタイムスタンプが付与される手順を概念的に示すブロック図である。
【図12】文書ファイルを事後的にチェックする実施形態を示すブロック図である。
【図13】文書ファイルを管理部門が修正する場合の実施形態を示すブロック図である。
【図14】検閲対象文書を所定周期にてNG文言サーバへ送信することを示す概念図である。
【図15】NGワード等の集計をして出力する場合の例であり、単純な棒グラフによる出力例である。
【図16】NGワード等の集計をして出力する場合の例であり、部署毎の内訳までを一緒に示す出力例である。
【図17】NGワード等の集計をして出力する場合の例であり、(A)がレーダーチャート、(B)が三次元グラフである。
【発明を実施するための形態】
【0049】
以下、本発明を実施形態に基づいて更に詳しく説明する。ただし、本発明は、実施形態の態様に限られるものではない。
以下の説明に使用する図面は、図1から図17である。
【0050】
(図1)
図1では、本願発明の主要な構成を概念的にブロック図で示したものである。
管理部門に係る端末(図中では「管理部門端末」と表記)、NG文言サーバ、および管理される部門に係る端末(図中では「被管理部門端末」と表記)が、社内のイントラネットで接続されている。 事業者がインターネットなどを通じたASP形態によって必要な構成を提供してもよい。
管理部門とは、社内の各部門(「被管理部門」)にて作成されたり改訂されたりする文書に対して、法律的なチェックや適切な保管を行う部署であり、一般的には法務・知的財産部門や総務部門である。
【0051】
管理部門端末からは、NG文言入力手段(当該端末のキーボード等)を用いてNGワードやNG文例を入力する。入力されたNGワード、NG文章構成単語群、NG文例、NG係り受け等を入力する。入力されたNGワード等は、NG文言サーバにおけるNG判定用辞書データベース(NG判定用辞書手段)に格納される。
【0052】
「NG文例」とは、NGワードを含む一文のほか、NGワードではない特定のワードの組み合わせを所定の組織において文書中に用いたとすると相応しくない、と判断すべき文例(NG文章構成)である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」といった文である。
【0053】
さて、被管理部門端末の対象文書入力手段(当該端末のキーボード等)から、検閲対象の文書データを含む文書ファイルが準備され、NG文言サーバに送信されてきたとする(図中、「文書ファイル」は、単に「文書」と表記している)。
ここで、「検閲対象文書ファイル」とは、本実施形態においては、技術担当者らにメール回覧予定の電子回覧板のような文書を含むファイルであり、当該技術担当者が所属する部署の保存文書サーバに一旦格納され、文書データとして「Y社の特許abcd号は、当社の製品Aの障害となるおそれあり。」という一文のデータを含むものであったとする。
【0054】
NG文言サーバに送信されてきた検閲対象文書に対しては、まず、形態素解析手段による形態素解析処理が実行される。
形態素解析処理は、自然言語文を形態素に分割し単語辞書を参照して単語を抽出し文章を単語単位に分割する自然言語処理であり、形態素解析手段は公知の形態素解析ツールで構成できる。
なお、検閲対象文書に対する検閲は、管理部門などにおいて設定された周期で行われる。法律改正、社内事情、社外の状況などに応じて検閲のタイミングを適宜変更することも当然可能であるし、非常時などに適宜実行することも可能である。
【0055】
検閲対象文書に含まれる単語は、前述の形態素解析手段で抽出された後、NG判断手段によるNG判断処理を受ける。NG判断手段は、NG判定用辞書記憶部を参照して検閲対象文書中の単語がNGワードであるか否かを判断し、NGワードであると判断した単語があればこれを起点として修正候補であるか否かを判断する。
【0056】
NGワードであると判断した単語を起点として修正候補であるか否かを判断する方法としては、例えば以下の三つの方法がある。
第一の方法は、NG判定用辞書記録部に格納されたNGワードのランクデータを参照し、最高ランクのNGワードを起点とし、その起点のランクが所定値以上である場合に修正候補と判断する方法である。
第二の方法は、検閲対象における一文中の起点の数(すなわちNGワードの数)が所定数以上である場合に修正候補と判断する方法、検閲対象における一文中のNGワードの全てを起点とし、それぞれの起点におけるランクの合計値が所定値以上の場合に修正候補と判断する方法である。
第三の方法は、一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する方法である。
【0057】
さらに、検閲対象文にNGワードが存在しない場合、NG判断手段は構文解析処理を実行して二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当するか否かによって修正候補と判断してもよい。
「構文解析処理」とは、形態素解析処理の結果(形態素列)を入力とし、単語同士の係り受け関係や格関係を表す構文木を出力する処理であり、公知の構文解析ツールにて構成できる。構文解析処理を実行することによって、NGとして抽出する部位に対する精度が向上する。そのため、構文解析処理の手順を採用していない文書管理装置の場合に比べて、修正候補として出力される箇所が減ったり、抽出し損なう箇所が減ったりするので、修正入力の手間を軽減することに寄与する。
【0058】
なお本実施形態では、構文解析処理における「係り受けの解析手法」としては、例えば特開2004−21445号の「テキストデータ分析システム」に開示された手法を採用している。
用語間の対応関係を分析するために抽出するシステムを併用してもよい。用語間の対応関係抽出システムとしては、たとえば、特開2011−103038号に開示された手法である。
【0059】
構文解析処理が実行された後、NG判定用辞書記憶部を用いて、NGワードやNG係り受けに該当する箇所を抽出する。そして、処理結果出力手段にて、抽出した箇所を他とは区別できるように表示させる。NG判定用辞書記憶部がインテリジェント化している場合には、単なる解析結果のみならず、修正候補の文言を含んだ対象文書として、所定の端末へ送信する。図1に示す実施形態では、検閲対象文書を作成して保存した文書サーバにアクセスした端末へ送信している。
【0060】
処理結果出力手段を介して、被管理部門の端末の出力画面には、修正候補の文言を含んだ対象文書ファイルが出力される。出力された文書ファイルは、被管理部門の担当者が閲覧し、解析結果として抽出されたNGワードやNG文章を検討する。そして、その担当者が修正の必要ありと判断すれば、修正入力手段を用いて、修正データを入力する。 たとえば、「Y社の特許abcd号は、当社の製品Aの改良に参考となる。」というように修正する。
【0061】
当該担当者は、修正の必要が無く、元の文言で問題ないと判断した場合には、修正しない旨を入力する。なお、当該担当者が判断不能な場合に「保留」という選択をし、その旨を入力することとしてもよい。
修正後の文書ファイルは、文書サーバへ送信される。そして、図示は省略しているが、その文書サーバから、修正後の文書ファイルを送信すべき人や部門へ送信される。
なお、修正前の文書ファイルの扱いは、本システムを採用する組織におけるポリシーによって異なる。たとえば、修正前の文書ファイルは管理部門などの所定部署において回覧用に印刷出力し、文書サーバには保存しないとする、としてもよい。
【0062】
(図2)
図2では、前述した修正候補であるか否かを判断する手順の一例を示している。
検閲対象となる文書データに対して、まず形態素解析処理を実行し、文書データを単語に分割する。
分割された単語にNGワードが含まれているか否かを判断する。含まれていない場合には、文書データにおける一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する。
NG係り受けと判断されない場合には、構文解析を行って二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当するか否かによって修正候補と判断する。
【0063】
この図2に示したフローチャートは一例であり、本願に係る文書管理装置を導入する組織における環境、規模、予算、検閲対象文書の種類、組織における処理ポリシーなどに応じて、前述した方法の組み合わせを採択できる。
【0064】
(自主修正と管理部門とによる修正の複数チェック)
被管理部門端末にて文書ファイルを作成する段階でNG判定用辞書記憶手段にもアクセスし、NGワード等を入力したら警告が発せられるといったシステムを構築してもよい。こうすることで、検閲対象文書においてNGワード等がなるべく使われないような、事前チェックのシステムが形成できる。
【0065】
(図3)
図3では、「A社が当社の特許権を侵害している。」という一文を構文解析した場合(A)と、「当社がA社の特許権を侵害している。」という一文を構文解析した場合(B)とを示している。
構文解析を実行しないと、(A),(B)のいずれもが修正候補として抽出されてしまう可能性が高い。しかし、NG係り受けにおいて「主語=当社、述語=侵害」と登録しており、構文解析を実行していれば、(A)が修正候補として抽出されず、(B)のみが修正候補として抽出される。
【0066】
(図4)
図4は、NG文言サーバにおけるNG判定用辞書データベースの構造を概念的に示したブロック図である。 図1では、NG判定用辞書データベースが一つであるように図示されているが、NG判定用辞書データベースは、被管理部門毎(部署毎)にそれぞれ作成されている。部署毎にNGワードは異なることが多く、組織全体で統一することは困難且つ非効率だからである(例を後述する)。
予め登録しておくべきNGワードなどは、NG文言入力手段によって入力され、NGワードデータベースなどにそれぞれ登録される。
【0067】
なお、NG判定用辞書データベースには、語句の共起性(任意の複数の語句が同時に出現する割合)についても、必要に応じて登録している。
一方、前記した修正入力手段にて修正した文言は、OKワードやOK文例としてOKワードデータベースなどにそれぞれ登録される。すなわち、修正作業によって、事後的に登録され、学習される。
学習したNG文言辞書データベースは、学習前よりも、本実施形態に係る文書管理装置を導入する該当部署における不適切な表現を含んだ文書ファイルが作成される蓋然性を低くする。
【0068】
図4には図示していないが、NG判定用辞書データベースについて、検閲対象となる文書ファイルの種類ごとに、NGワードやNG文例やNG係り受けを予め格納することとしてもよい。また、システムの稼働前に、NGワードを事前チェックすることとしてもよい。 図示は省略するが、NG判定用辞書データベースの管理者の端末においては、NG判定用辞書データベースをメンテナンスする画面が提供される。
法務・知的財産部門におけるお客様向けの文書ファイルにおいては、あるワード(たとえば「クレーム」)が用いられていたとして一般的にNGワードに該当したとしても、特許文書ファイルにおいてはNGワードとならない場合(「クレーム」は「請求項」という意味しか持たない場合)があり、NGワードではないのにNGワードとして抽出されてしまっては修正作業の効率を落とすこととなってしまうからである。
【0069】
(推奨文章の出力)
検閲対象文書ファイルにNGワードやNG文章が使用されているという解析結果を所定の端末へ出力する際、前述のOKワードデータベース、OK文例データベースを用いて、推奨文章を出力することとしてもよい。修正データ入力手段を操作する操作者が推奨文章をそのまま使ってよいと判断した場合には、その推奨文章を選択するだけで修正データの入力が完了する。 そのまま使わない場合でも、操作者にとって修正の参考となる。
なお、推奨文章の採用結果(採用した場合も不採用の場合も)についても、NG判定用辞書データベースにフィードバックされ、以後の精度を高めることに寄与する。
【0070】
(図5)
図5は、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものである。
検閲対象文書ファイルは、技術開発を担当するメンバー全員に回覧される「電子回覧板」である。閲覧した者は電子的に「閲覧済み」というデータを、この検閲対象文書ファイルに格納させる。また、回覧された内容についてコメントがあれば、コメントも記入して保存できる。
構文解析手段によって解析された後の検閲対象文書ファイルにおけるメモには、「α関連と推測」という箇所と、「製品Aの障害」という箇所が抽出され、その抽出箇所は、他の箇所と識別可能であるように出力表示(いわゆるハイライト表示)される。
なお、図示を省略するが、抽出箇所における他の箇所と識別可能であるような出力表示とともに、修正の候補を表示し、さらにその修正候補を選択すれば修正が完了するように画面出力を提供しても良い。
【0071】
(図6)
図6は、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示している。
修正入力手段を操作したのは、修正候補を含む文書ファイルの作成担当者である。その担当者は、「α関連と推測」という箇所の修正は不要であると判断し、その判断を反映させている。 また、「製品Aの障害」というフレーズを含んだ箇所は、「改良に参考となる」というように修正し、その修正内容を確定させている。
なお、端末上でカーソルを修正箇所に持っていくと、修正した理由がメモとして表示されるようにしている。換言すれば、修正入力手段において、メモ書きを追加できる機能を備えているということである。修正内容を他の人が見る場合の便宜のためである。
この修正によって、製品Aが特許公開番号2011−abcd号に開示されている内容と抵触していることを伺わせる記載が、社内の文書ファイルとして保存されることを未然に防止したこととなる。
【0072】
(図7)
図7もまた、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものであり、検閲対象文書ファイルは「発明届出書」である。
構造解析手段は、「怪我をするおそれ」と「怪我のおそれ」という二カ所を抽出している。
【0073】
(図8)
図8もまた、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示したものである。
文書ファイルの作成担当者は、構造解析手段が抽出した部位のみならずその前の部分までを、修正前の文言を一切使わず、大幅に修正している。 このような修正をしたのは、いわゆる製造物責任法において、自社製品の危険性を認識しながら放置したと解釈されかねない記載が、社内の文書として保存されることを未然に防止するためである。なおここでも、端末上でカーソルを修正箇所に持っていくと、修正した理由がメモとして表示される(図中では、製造物責任法を「PL法」と表示している)。
なお、図示を省略しているが、修正後の検閲対象文書ファイルに対して、再分析の必要があるか否かを質問し、修正後の再分析も可能としている。
【0074】
(図9)
図9では、検閲対象文書ファイルがどのような理由で修正されるかを例示している。
修正前の検索対象文書ファイルの中には、以下のようなフレーズが存在していたとする。 『当社製品「A」が、例の安全基準に対してセーフであるとは思えない。』
最初の「A」は、固有名詞または登録商標に係る名称であるため、普通名称に変換している。 なお、社内文書には、こうした固有名詞や登録商標に係る名称がいろいろな部署で使われる蓋然性が高いので、予め変換テーブルをNG判定用辞書データベースに備えることとしてもよい。
営業先への提案書や自社ホームページに掲載する文書が検閲対象文書である場合、競合他社名や競合他社における製品の固有名称などについては、比較広告に該当する可能性がある。比較広告となってしまう事態を未然に防止するため、具体的な競合他社の名称を「競合他社」と抽象化したり、製品の固有名称を「製品の一般名称」としたりする変換テーブルを予め備える場合もある。
【0075】
次に、「例の安全基準」といった略語または隠語を、普通に用いられる用語(Z号安全基準)に変換している。 略語は、社内どころか、社内の他の部署でも通じない用語があるため、変換の必要性が高い。 また、隠語については、裁判などにおいては不利な証拠となりかねないため、変換の必要性が高い。
【0076】
次に、「セーフであるとは思えない」という二重否定の構文を、構文解析手段が指摘し、管理部門の担当者が修正している。
二重否定のフレーズは一般的にわかりにくく、正確な表現ではないためである。修正前における該当箇所の前後との整合性から、「安全性を確認したい」という修正を行った。
【0077】
(図10)
図10は、検閲対象文書ファイルが複数回の修正を経て戻される場合を概念的に示している。
被管理部門のA氏が検閲対象文書ファイルを作成したとする。なお、A氏の作成段階においても、A氏が文書ファイルを作成していた端末は、NG判定用辞書記憶部にアクセスし、NGワードやNG文例に該当する入力を指摘していたとする。
前記の検閲対象文書ファイルが管理部門へ送信され、管理部門のB氏が検閲対象文書ファイルを閲覧し、B氏ができる範囲で修正をし、判断がつかない箇所を保留して、上司であるC氏に係る端末へ、第一修正ファイルを保留箇所である旨のメモデータを付属させて送信する。
【0078】
C氏は、保留箇所である旨のメモデータと、その保留箇所を見ながら、必要な修正を入力し、第二修正ファイルとして被管理部門の端末(A氏に係る端末)と、文書サーバとに送信する。また、B氏に係る端末へも送信する。
以上の手順を踏めば、管理部門においてダブルチェック、A氏の自己チェックを含めればトリプルチェックを実行できたこととなる。 B氏が管理業務に成熟していない場合には、B氏のスキルアップにも寄与する。
【0079】
(図11)
図11は、修正後の文書ファイルに対し、電子的なタイムスタンプを付与するシステムについて説明するための概念図である。手順をカッコ書きのローマ数字で示している。
まず、タイムスタンプを欲する文書ファイル(ここでは、修正後の文書ファイルとしているが、修正前や修正中でも、必要に応じて含めてもよい)をタイムスタンプ要求手段にかける。 NG文言サーバ内のタイムスタンプ要求手段は、その文書ファイルのハッシュ値を算出し、第三者機関に係るサーバへ、そのハッシュ値をインターネット経由で送信する。
【0080】
第三者機関に係るサーバは、更に時刻認証局へインターネット経由でアクセスし、そのハッシュ値に対してタイムスタンプを取得する。そして、タイムスタンプ登録証をNG文言サーバへ返信する。
受信したタイムスタンプ登録証は、修正後の文書ファイルに合成する。タイムスタンプ登録証が合成された文書ファイルは、保存すべきデータベースに保存する。 その文書ファイルを必要とする端末が呼び出すと、タイムスタンプが押された文書ファイルが出力される。
【0081】
前記の例示では、文書ファイルそのものではなくその文書ファイルのハッシュ値を第三者機関へ送信することとしたが、文書ファイルそのものを第三者機関へ送信することとしても良い場合はある。
また、前記の例示では、第三者機関と時刻認証局とを分けて説明したが、時刻認証局が第三者機関として直接タイムスタンプを発行、発送することとしてもよい。
【0082】
(図12)
図12は、既に格納された文書ファイルのデータベースや、送信を終えたメールの送信済みメールの保存データベースに対して、事後的にNGワードやNG文例に該当しないかどうかをチェックする場合を示したものである。
図2と同様、NG文言サーバに送信されてきた検閲対象文書は、構文解析手段に入力され、構文解析手段では、前記のNG判定用辞書データベースのデータを用いるとともに、単語間の係り受け関係を抽出する構文分析手段などに基づいて、検閲対象文書ファイルにNGワードやNG文章が使用されているか否かを解析する。
【0083】
(事後的なNGチェック)
文書ファイルが作成され、必要なチェックもなされ、格納された後に、事後的に登録されたNGワードやNG文例に該当してしまうことがある。 図12に示したように、一旦格納された文書ファイルに対しても、事後的に構文解析を実行することができるようにしてもよい。 ただし、事後的な構文解析は、修正候補の文言を含む対象文書を抽出するにとどめる。 修正入力手段によってデータを修正できるが、修正した文書ファイルは上書きをせず、別名でなければ保存できないようにしている。
なお、送信済みメールの保存データベースではなく、メールサーバ全体を検閲対象とすることで、事前のNGチェックとしてもよい。
【0084】
(図13)
図13に示す実施形態は、図1(文書ファイルを作成した端末において検閲対象文書ファイルを修正する実施形態)と異なり、管理部門が検閲対象文書ファイルを修正する実施形態を示すブロック図である。
解析結果送信手段は、管理部門の端末へ検閲対象文書ファイルを送信する。そして、その端末の操作者(管理者)は、端末において出力された修正候補などを参照しながら、修正データを入力する。
管理部門によって修正データを入力して適正文書ファイルとなった文書ファイルは、検閲対象文書ファイルが保存されていた文書サーバへ送信される。
【0085】
(図14)
図14では、検閲対象文書を所定周期にてNG文言サーバへ送信することを概念的に示している。
(A)は平常時であり、予め設定した所定周期にて検閲対象文書をNG文言サーバが受信し、NG判定をする。
(B)は非平常時であり、たとえば公的入札日を中心として前後一ヶ月の期間は、平常時の三分の一ほどの周期にて検閲対象文書をNG文言サーバが受信し、NG判定をするのである。 こうすることによって、法律条例や契約を遵守できないような文書データが放置される期間を減らすことに寄与する。
【0086】
(図15)
図15はNGワード等の集計をして出力する場合の例であり、(A)は、一ヶ月間の部署別のNG数を棒グラフによって出力した例である。(B)は、抽出したNGワードの種類毎のNG数を棒グラフによって出力した例である。
こうした出力を通じて、同じ誤りを繰り返さないような効果も期待できる。
【0087】
(図16)
図16は、NGワード等の集計をして出力する場合の例であり、部署毎にNGワードの内訳までを一緒に示した出力例である。
部署毎の出力例としたが、個人別(端末毎)の出力とすることも可能である。
【0088】
(図17)
図17は、NGワード等の集計をして出力する場合の例であり、(A)がレーダーチャート、(B)が三次元グラフである。
図16および図17以外の主な出力としては、たとえばいわゆるバブルチャートがある。
【0089】
(翻訳への応用)
ここまでの記載では、法律的な背景から、不適切な表現を効率的に発見し、未然に修正することを趣旨として説明してきたが、別の用途もあり得る。例えば、法律の面のみならず、グローバル企業においては一つの文書ファイルを複数の言語へ翻訳する必要がある場合も多く、その翻訳に誤りがないように、あわよくば機械翻訳で済むようにする、という目的として使用しても有益である。
【0090】
(組織内の略語や隠語)
本実施形態に係る文書管理装置を導入する組織、またはその組織内の更に細かな組織(部署)内においてのみ通用している略語、特殊用語、隠語などについては、前述のNG言語辞書データベースとは別に、特殊用語データベースを備えることとしてもよい。 その場合、その特殊用語データベースには、それぞれの略語、特殊用語、隠語などに対応する一般用語をそれぞれ登録しておく。
検閲対象文書において、特殊用語データベースに登録されている用語が使われている場合には、一般用語に変換する。 そして、前述の修正入力手段を操作する管理者等が表示させる出力画面においては、その用語が変換された旨を認識できるように表示する。
なお、部署毎よりも更に細かく、例えば担当者毎にそれぞれNG判定用辞書データベースを準備してもよい。
【0091】
(NGランク)
NG文言辞書データベースへ予め格納されるNGワードは、そのNGワード毎にランクデータを含ませることとしてもよい。たとえば、
独占禁止法の規制を受ける部署におけるNGワードについては、「不正に該当する」、「不正の可能性がある」、「不正と誤解される可能性がある」、といった危険レベルに関するランクデータを含ませる。
そして解析処理結果出力手段は、検閲対象となる文書ファイルにおいてNGワードを出力する際に、当該NGワードのランクデータに応じた識別が可能なランク表示を含ませることとしてもよい。
この場合、修正を担当する者は、そのランクデータを意識しながら修正作業が行える。
【0092】
(検閲対象文書の分類)
検閲対象文書について分類が可能な場合には、NG文言辞書データベースにおいて格納されるNGワードやNG文言についても、対象とする検閲対象文書の種類についてのデータを予め入力しておいたり、追加で登録したりするようにする。 たとえば、検閲対象文書が発明届出書である場合に特有なNGワードやNG文言であるときには、検閲対象文書が発明届出書である場合にのみ、構文解析手段を用いるようにする。
なお、形態素解析手段が解析できないファイル、たとえば紙に描かれた資料をスキャニングしたのみの画像データファイルに対しては、OCR処理を実行してから形態素解析処理を実行する。
【0093】
(応用例)
前述してきた実施形態においては、組織における文書ファイル保存前の文書チェック補助技術として説明したが、本発明に示すアイディアのコンセプトは、契約書の作成支援システム、特許明細書の作成支援システムなどにも応用可能である。
特許明細書の作成支援システムにおけるNGワードとしては、例えば登録商標となっている自社や競合他社の製品名がある。 これらの製品名は、その製品を示す普通名称に自動変換することとしてもよい。 すなわち、NG判断用辞書データベース内のOKワードを格納したデータベースに、その製品を示す普通名称を登録しておき、登録商標となっている自社や競合他社の製品名が検閲対象文書ファイルに含まれていたら、自動変換するのである。
【0094】
(文書廃棄ルールとの関係)
組織内では文書データの廃棄ルールが定められていることが多く、たとえば、経理書類は、10年間は廃棄しないと社内規程にて定まっているとする。 このような文書データの廃棄ルールを文書データ廃棄ルール格納手段に蓄積して検閲対象となる文書データを所定の文書サーバから端末からの操作によって廃棄削除しようとした場合、前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する。
その廃棄ルール判断手段が廃棄不能と判断した場合には、前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を当該端末へ出力する。たとえば、「削除しようとしている文書データは、経理書類に分類されているので、10年経過しなければ廃棄できません。」といった警告を出力する。
これによって、文書データ廃棄ルールの遵守を促したり、ルールが破られる土壌が形成されることを抑制したりすることとなる。
【産業上の利用可能性】
【0095】
本発明は、所定の組織内のイントラネットを構築するシステムインテグレータ、イントラネットにインストールするためのソフトウェア開発をするソフトウェア開発業、イントラネットを構築するためのハードウェア製造業、インターネットを通じたASP事業などにおいて利用可能性を有する。
【技術分野】
【0001】
本発明は、組織内における文書管理を介して、組織員の不適切な行動を未然に防止し、不適切な行動の再発防止に寄与する技術に関する。
【背景技術】
【0002】
情報処理技術の進展に伴って、法人でも個人でも、保有作成する書類に関してはペーパーレス化が進展し、書類が電子化されて保存され管理されるようになり、特に、組織内での情報検索や情報共有において、効率的な管理運営に寄与している。
さて、企業や組織に対しては、法令遵守やコンプライアンスのための活動が、以前に増して求められている。
【0003】
また、米国の訴訟制度において、訴訟の被告となった場合に必要な証拠文書を相手方に提示しなければならない「ディスカバリー」と呼ばれる制度が注目されている。
ディスカバリー制度は、知的財産関連の訴訟、金融関係の訴訟、税金関係の訴訟において用いられる制度である。
その一方、組織が大きくなると、経営部門や管理部門にて必要と認識しているコンプライアンス活動において、営業部門などの現場レベルまで管理を徹底するのは容易ではなくなる。
【0004】
近年のディスカバリー制度では、書類の電子化の進展に伴い、電子化された文書が保存された記録媒体の提出が命じられることとなる。旧来の「ディスカバリー制度」と区別するために「イー・ディスカバリー(e-Discovery)」と呼ばれることもある。
電子化された書類は、タイムスタンプといった認証技術を併用しない限り、作成日時や改訂日時を変更することは容易であるものの、作成日時や改訂日時を改ざん等したことが発覚したとすれば、裁判において不利な状況に追い込まれる可能性がある。 したがって、イー・ディスカバリーを意識した適切な書類管理が、多くの企業で求められる。
【0005】
また、たとえばメーカなどにおいては、製品の使用条件が不明確な危険性についての記録が設計書や特許明細書などに残っていれば、PL法(いわゆる製造物責任法)において免責されない可能性が出てくる。
また更に、公的入札の直前に競合他社との打ち合わせや懇談会の記録が残っていれば、談合が疑われる。独占禁止法に違反した場合、その罰則の重さもさることながら、違反後の所定期間に入札資格を喪失するなどにより、企業経営上のダメージが大きい。
【0006】
さて、企業における情報管理システムは、オーダーメイドされることも少なくないが、コストや納期の面で導入が容易な情報管理システムも望まれている。
たとえば、特許文献1に開示された技術では、各企業における機密文書を、それら企業と契約を締結した外部の事業者が管理するサーバ装置を用いることによって一括して保管するシステムが提案されている。
また、特許文献1に開示された技術に内在する問題点を見いだし、企業における一般的なセキュリティポリシーに反している等の点を解決した技術として、特許文献2に開示された情報管理システムも提案されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2001−222525号公報
【特許文献2】特開2009−9551号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
独占禁止法、PL法、労働関係の法律については、法律の条文が抽象的であったり、比較的新しい法律の場合には判例が少なかったりする。 そのような場合、該当する法律を管轄する行政機関が審査基準や指針を公開するものの、組織や業界に特有な個別具体的な事案までは明確になっていないことが多い。
したがって、杓子定規に現場を管理しようとしても、現場の行動や判断を束縛しすぎてしまいかねない。 特に営業部門は、ビジネスの相手の行動や判断によってどのように事態が進展するのか不明確であり、不明確な段階での管理は不必要あるいは無駄であることも多い。
その組織にとって不都合が生じるおそれのある事態を予め適切な段階で抽出し、しかるべき人間が判断した上で管理することが望ましい、ということになる。
【0009】
したがって、法律違反となる事態を未然に防止し、不正の芽があれば速やかに発見して改善に向かわせるシステムが求められている。
出願人は、キーワード検索などを試みた。 その結果、当組織にとって不都合が生じるおそれのある文書を発見したり、単純に修正や削除をしたりするという技術は存在するようであるが、そのような技術では、イー・ディスカバリーや訴訟手続きにおいて裁判官の心証を悪くしてしまう可能性がある。
【0010】
前記の説明では、法律についての違反について説明してきたが、遵守すべき所定の契約に対する違反についても同様である。
本発明が解決しようとする課題は、組織内にて格納蓄積されていく文書データを介して、組織が法律や契約などの重大な約束事に違反するおそれを未然防止、再発防止するのに役立つ技術を提供することにある。
【課題を解決するための手段】
【0011】
(第一の発明)
第一の発明は、 検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手段と、 前記文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、 前記対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、 その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、 そのNG判断手段がNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、を備えた文書管理装置に係る。
【0012】
「検閲対象」が文書ファイルではなくて「文書データ」であるとしているのは、文書ファイルのほか、文書ファイル中の所定の文書データや、電子メールの中の一文、といった場合もあるからである。
「文書サーバ」とは、文書管理サーバのほか、電子メールサーバなども含む。本願に係る文書管理装置を導入する組織が大きい場合には、分割された部署ごとに文書サーバが存在する。 「NG判定用辞書記憶手段」が「文書サーバ毎」に存在するのは、同じワードでも、部署毎にNGワードとなったりならなかったりするからである。
たとえば、「賄賂」というワードは全てのNG判定用辞書記憶手段に含まれるが、「侵害」のように法務知財部署では日常的なワードであっても、法務知財以外の部署が使用することは確認が必要なワードとしてNGワードに含めてよい。
「処理結果出力手段」が送信する「所定の端末」は、検閲対象となった文書データを作成した端末、検閲対象となった文書データを格納している文書サーバにアクセスする端末など、適宜設定できる。
【0013】
「対象文書受信手段」が検閲対象となる文書データを受信するタイミングについては、様々である。 管理部門において所定期間ごと(例えば毎月一度)というように設定してもよいし、文書管理サーバにおいて対象となる文書ファイルの数が所定数に達したら文書管理サーバ側からトリガーを発信してもよい。 もちろん、不定期あるいは有事の際に、文書データへ能動的にアクセスして解析してもよい。
「NGワード」とは、本願に係る文書管理装置を導入する組織において文書中に用いる単語として、または他のキーワードとの組み合わせ等によって相応しくない、と判断すべきワードである。たとえば、公序良俗を害するような言葉、差別用語、などである。 NGワードは、同一組織内であっても部署が異なればNGワードに該当したりしなかったりする場合もあるので、部署毎や組織員の個人別にNGワードを区別するようにしてもよい。また、製品開発における時期や販売商品のライフサイクルなど、時期に応じてNGワードを入れ替えたり追加したりする場合もある。
公共放送における禁止用語集などを用いることで、NG判定用辞書記憶手段への入力の手間を軽減してもよい。
【0014】
(作用)
NG判定用辞書記憶手段には、検閲対象となる文書データが格納された文書サーバ毎にNGワードを予め格納する。
検閲対象となる文書データを、所定の端末から対象文書受信手段が受信する。 その受信した文書データに対して形態素解析手段が形態素解析をし、当該文書データを単語ごとに分割する。
NG判断手段は、形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断する。 そして、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断する。 そのNG判断手段がNGと判断した修正候補を含む判断結果データは、処理結果出力手段が所定の端末へ送信する。
【0015】
(第一の発明のバリエーション1)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、 前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとしてもよい。
【0016】
「ランクデータ」とは、たとえば、どんな文書にも使ってはいけない言葉、場合によっては使うことが許される言葉、といった危険度のランクである。 どんな文書にも使ってはいけない言葉が「5」、場合によっては使うことが許される言葉が『「4」〜「1」』といった具合である。ランクデータは数値を使うこととするのが処理しやすいが、言葉や色分けにてラベルを選択する場合もある。
他の請求項にて特定する「処理結果出力手段」においては、修正候補に対してランク表示を実行する。 ここで「ランク表示」とは、NGワードとして抽出された際に、そのNGワードの危険度が文字への着色で表現される表示、ハイライトの色や濃さ、網掛けの種類や濃さ、下線の種類や太さ、イタリックの角度、フォントの変更、文字の大小、文字の太さなどで表現される表示、修正候補の出力画面にカーソルを当てると当該ランクやその危険度が吹き出しなどで表現される表示、あるいはこれらを組み合わせた表示である。
なお、NGワードの登録時にランクデータが入力されていない場合には、後に入力することとしてもよい。また、入力されていたランクデータがふさわしくない場合には、改訂して入力し直してもよい。
【0017】
(作用)
NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含んで登録されている。
NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は、当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断する。
NG判断手段による判断結果が所定ランク以上である場合には、判断結果出力手段が判断結果データを所定の端末へ送信する。
【0018】
(第一の発明のバリエーション2)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、 前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、 前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとしてもよい。
【0019】
「NG係り受け」とは、NG文例を予め構文解析した結果から抽出したサンプルや、係り受けによってNGとなる場合の規則性などに関する情報などである。
たとえば、「主語−述語」の関係において「当社−侵害」をNG係り受けとして登録しておく。 「当社」について、「弊社」、「我が社」、「うちの会社」、正式な社名などは、シソーラスとして登録すると効果的である。
係り受けにおける目的節の「A社(競合他社の正式名や俗称としての社名)−特許権」をNG係り受けとして登録しておくと、「他社の特許に抵触するおそれ」という趣旨の表現を抽出しやすくなるので、効果的である。
【0020】
(作用)
NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納している。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析する。 そして、前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断する。NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断する。
【0021】
(第一の発明のバリエーション3)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、 前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとしてもよい。
【0022】
「NG文章構成単語群」とは、NG文章である、と判断すべき文章構成単語群である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」という文章がNGワードをひとつも含まないとしても、単語の組み合わせが同一文中に併存することでNG文章を構成することとなるとして格納するのである。
【0023】
(作用)
NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納しておく。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析する。そして、NG判定用辞書記憶部を参照し、NG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断する。
【0024】
(第一の発明のバリエーション4)
前記のバリエーション3に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群を格納し、 前記NG判断手段は、その期間限定に指定された期間にのみ修正候補であるか否かを判断することとしてもよい。
【0025】
(用語説明)
「限定的にNGワード」等となる「限定NGワード」とは、平常時にNGワードとすると日常業務に支障が出かねないワードが該当する。たとえば、公的入札日の前後一ヶ月の期間を指定して、接待申請書における競合他社名をNGワードとする、などである。
【0026】
(作用)
NG判定用辞書記憶手段には、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群が格納される。NG判断手段は、指定されたその期間にのみ修正候補であるか否かを判断し、指定されていない期間であれば、修正候補とは判断しない。 これによって、指定された期間以外は修正候補とならず、業務の円滑化に寄与する。
【0027】
(第一の発明のバリエーション5)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判断手段による判断結果として修正候補と判断された部位を表示させる処理結果出力手段と、 その処理結果出力手段によって修正候補と判断された部位に対する修正データの入力を受け付ける修正入力手段と、 その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、を備えることとしてもよい。
【0028】
「修正データ」には、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。
「処理結果出力手段」および「修正入力手段」は、検閲対象となる文書ファイルを作成した端末(被管理部門端末)であってもよいし(図13参照)、検閲対象となる文書ファイルを作成した端末(被管理部門端末)以外の端末(管理部門端末)であってもよい(図1参照)。前者の場合は、検閲対象となる文書ファイルを作成した作成者が自ら「管理者」となる場合が含まれる。
【0029】
(作用)
NG判断手段による判断結果として修正候補と判断された部位を処理結果出力手段が表示させる。
所定の端末操作者(たとえば文書データの管理者)は表示された修正候補と判断された部位を閲覧し、それに対して修正入力手段を用いて修正データを入力する。その修正入力手段によって修正された文書データを適正文書データ受信手段が受信する。
以上により、本願に係る文書管理装置を導入する組織内で保管すべき文書ファイルを保管前に事前チェックをする体制が、その組織へ提供されることとなる。
また例えば、処理結果出力手段によって修正候補とともにランクデータを出力された作業者は、ランクデータを意識しながら修正作業が行える。
【0030】
(第一の発明のバリエーション6)
前述のバリエーション5に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記修正入力手段は、修正データの入力をした場合にその修正入力に対して前記NG判断手段による判断を求めるか否かを選択入力が可能であるように形成され、 前記適正文書データ受信手段にて受信した修正された文書データに前記NG判断手段による判断を求める旨が含まれている場合には、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信することとしてもよい。
【0031】
(作用)
修正候補を受信した端末の操作者は、修正入力を行ったとしても、その修正が適切なのかどうか不安な場合がある。不安な場合、その修正入力に対して前記NG判断手段による判断を求める、を選択入力する。すると、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信する。 修正入力した箇所が再び修正候補となっていなければ、バリエーション6に係る文書管理装置は、適切な修正だったと判断したこととなる。
なお、当該端末の操作者が修正入力を行い、その修正が適切であると判断した場合には、その修正入力に対して前記NG判断手段による判断を求めない、を選択入力する。
【0032】
(第一の発明のバリエーション7)
前述のバリエーション5またはバリエーション6に係る文書管理装置は、以下のように形成してもよい。
すなわち、前記修正入力手段は、修正候補と判断された部位を修正しない場合に修正保留か修正不要かを選択入力が可能であるように形成され、 修正不要が選択された場合には、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならないこととしてもよい。
【0033】
(作用)
本願に係る文書管理装置のNG判断手段が修正候補としたとしても、実際には修正が明らかに不要な場合もある。その場合、修正不要と判断した端末の操作者は、その修正候補に対して修正不要を選択入力する。すると、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならない。
一方、本願に係る文書管理装置のNG判断手段が修正候補としたとしても、端末の操作者が修正すべきか否か、判断に迷う場合もある。その場合、当該操作者は、その修正候補に対して修正保留を選択入力する。すると、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象となる。 なお、当該操作者の上司に係る端末や管理部門に係る端末へ修正保留に係る修正候補を送信し、修正データの入力または修正不要の選択が入力されるまで、所定間隔で繰り返されるようにしてもよい。
【0034】
(第一の発明のバリエーション8)
第一の発明に係る文書管理装置においては、 NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、 前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとしてもよい。
【0035】
(作用)
NG判定用辞書記憶手段に、格納されたNGワードに対応した推奨ワードを、推奨ワード辞書記憶手段が予め格納しておく。処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力する。 修正入力を行おうとする端末の操作者は、その推奨ワードを参考にして修正入力の作業をすることができる。
【0036】
(第一の発明のバリエーション9)
前記した第一の発明のバリエーション5からバリエーション8に係る文書管理装置においては、修正入力手段による修正の結果をNG判定用辞書記憶手段へ登録することとしてもよい。
ここで、「修正の結果」とは、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。 また、修正候補と判断された部位、修正入力手段によって入力された修正データ、修正データを入力した主体に関するデータ、修正データの入力日時などのデータを含む。
【0037】
(作用)
修正入力手段によって入力された修正の結果がNG判定用辞書記憶手段へ登録されるので、NG判定用辞書記憶手段は修正データが入力されるたびに修正され、その組織に適合したNG判定能力へ進化することとなる。
これによって、本願に係る文書管理装置の解析能力が徐々に向上し、修正を担当する者の負担が軽減される。
【0038】
(第一の発明のバリエーション10)
前記した第一の発明のバリエーション5からバリエーション9に係る文書管理装置においては、前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えることとしてもよい。
【0039】
「タイムスタンプ手段」とは、文書ファイルに対して保存日時を記録する手段である。 文書ファイルまたはその文書ファイルのハッシュ値を日時特定のための時計が備えられたサーバへ送信する機能、当該サーバが文書ファイルまたはその文書ファイルのハッシュ値に対して日時データを付加して送り返してきたファイルを受信する機能などが含まれる。
なお、保存日時を特定するための時計は、本願に係る文書管理装置を導入しているイントラネットの外部であることが望ましく、公的または準公的な第三者機関であることがより好ましい。日時データの客観性が高まるからである。
【0040】
(第一の発明のバリエーション11)
本願に係る文書管理装置は、前記修正候補を所定の文書サーバごとに集計して出力する集計データ出力手段を備えることとしてもよい。
【0041】
(第一の発明のバリエーション12)
前記した第一の発明のバリエーション3からバリエーション11に係る文書管理装置においては、前記NG判定用辞書記憶手段に格納されたNGワード、NG文章またはNG文章構成単語群を加除訂正するデータ入力が可能なNG判定用辞書修正手段を備えることとしてもよい。
【0042】
(第一の発明のバリエーション13)
前記した第一の発明に係る文書管理装置においては、 前記対象文書受信手段は、前記文書サーバまたはNG判定用辞書記憶手段のいずれか一方が更新された場合に、検閲対象となる文書データを受信することとしてもよい。
文書サーバが更新された場合に検閲対象についてのNG判定をすることとすれば、検閲対象となる文書データの総数を減らすことができる。
また、NG判定用辞書記憶手段が更新された場合に検閲対象についてのNG判定をすることとすれば、新たなNG判断をタイムリーに反映させることができる。
【0043】
(第一の発明のバリエーション14)
前記した第一の発明に係る文書管理装置においては、
検閲対象となる文書データを所定の文書サーバから廃棄削除する文書データ廃棄手段と、 文書データの廃棄ルールを蓄積した文書データ廃棄ルール格納手段と、 前記文書データ廃棄手段によって文書データを廃棄しようとする場合には前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する廃棄ルール判断手段とを備えることとしてもよい。
その廃棄ルール判断手段が廃棄不能と判断した場合に、前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を出力することとするのである。
【0044】
(第二の発明)
本願は、コンピュータプログラムに係る第二の発明を提供することもできる。
その第二の発明は、 検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手順と、 前記文書サーバ毎のNGワードを予めNG判定用辞書記憶手段へ格納するNG判定用辞書記憶手順と、 前記対象文書受信手順にて受信した文書データの文書を形態素解析して単語を抽出する形態素解析手順と、 その形態素解析手順にて抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手順と、 そのNG判断手順にてNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手順とを、コンピュータに実行させるためのコンピュータプログラムに係る。
【0045】
(第二の発明のバリエーション)
第二の発明は、第一の発明のバリエーション1から14に対応したバリエーションを実現可能な各手順を含んだコンピュータプログラムとしてもよい。
【0046】
第二の発明に係るコンピュータプログラムは、バリエーションを含め、ハードディスク、DVD−Rなどの記録媒体に格納して提供することもできる。 また、第二の発明に係るコンピュータプログラムを格納した記録媒体から、通信回線を介して所定の情報端末に受信することもできる。受信した情報端末(またはサーバ)は、第一の発明に係る文書管理装置となる。
【発明の効果】
【0047】
本願発明によれば、組織内にて格納蓄積されていく文書データを介して、組織が法律や契約などの重大な約束事に違反するおそれを未然に防止できるとともに、違反が生じた場合に再発を防止するのに役立つ技術を提供することができた。
【図面の簡単な説明】
【0048】
【図1】第一の実施形態の全体構成を示すブロック図である。
【図2】第一の実施形態における主要な処理手順を示すフローチャートである。
【図3】構文解析手段による解析の前後を示す図である。
【図4】NG判定用辞書記憶手段の構造を示すブロック図である。
【図5】検閲対象文書が構文解析手段によってどのように解析されるかを示す図示例である。
【図6】解析後の検閲対象文書が修正入力手段によってどのように修正されるかを示す図示例である。
【図7】検閲対象文書が構文解析手段によってどのように解析されるかを示す図示例である。
【図8】解析後の検閲対象文書が修正入力手段によってどのように修正されるかを示す図示例である。
【図9】検閲対象文書がどのような理由で修正されるかを示す図示例である。
【図10】検閲対象文書が複数回の修正を経て戻される場合を概念的に示すブロック図である。
【図11】文書ファイルにタイムスタンプが付与される手順を概念的に示すブロック図である。
【図12】文書ファイルを事後的にチェックする実施形態を示すブロック図である。
【図13】文書ファイルを管理部門が修正する場合の実施形態を示すブロック図である。
【図14】検閲対象文書を所定周期にてNG文言サーバへ送信することを示す概念図である。
【図15】NGワード等の集計をして出力する場合の例であり、単純な棒グラフによる出力例である。
【図16】NGワード等の集計をして出力する場合の例であり、部署毎の内訳までを一緒に示す出力例である。
【図17】NGワード等の集計をして出力する場合の例であり、(A)がレーダーチャート、(B)が三次元グラフである。
【発明を実施するための形態】
【0049】
以下、本発明を実施形態に基づいて更に詳しく説明する。ただし、本発明は、実施形態の態様に限られるものではない。
以下の説明に使用する図面は、図1から図17である。
【0050】
(図1)
図1では、本願発明の主要な構成を概念的にブロック図で示したものである。
管理部門に係る端末(図中では「管理部門端末」と表記)、NG文言サーバ、および管理される部門に係る端末(図中では「被管理部門端末」と表記)が、社内のイントラネットで接続されている。 事業者がインターネットなどを通じたASP形態によって必要な構成を提供してもよい。
管理部門とは、社内の各部門(「被管理部門」)にて作成されたり改訂されたりする文書に対して、法律的なチェックや適切な保管を行う部署であり、一般的には法務・知的財産部門や総務部門である。
【0051】
管理部門端末からは、NG文言入力手段(当該端末のキーボード等)を用いてNGワードやNG文例を入力する。入力されたNGワード、NG文章構成単語群、NG文例、NG係り受け等を入力する。入力されたNGワード等は、NG文言サーバにおけるNG判定用辞書データベース(NG判定用辞書手段)に格納される。
【0052】
「NG文例」とは、NGワードを含む一文のほか、NGワードではない特定のワードの組み合わせを所定の組織において文書中に用いたとすると相応しくない、と判断すべき文例(NG文章構成)である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」といった文である。
【0053】
さて、被管理部門端末の対象文書入力手段(当該端末のキーボード等)から、検閲対象の文書データを含む文書ファイルが準備され、NG文言サーバに送信されてきたとする(図中、「文書ファイル」は、単に「文書」と表記している)。
ここで、「検閲対象文書ファイル」とは、本実施形態においては、技術担当者らにメール回覧予定の電子回覧板のような文書を含むファイルであり、当該技術担当者が所属する部署の保存文書サーバに一旦格納され、文書データとして「Y社の特許abcd号は、当社の製品Aの障害となるおそれあり。」という一文のデータを含むものであったとする。
【0054】
NG文言サーバに送信されてきた検閲対象文書に対しては、まず、形態素解析手段による形態素解析処理が実行される。
形態素解析処理は、自然言語文を形態素に分割し単語辞書を参照して単語を抽出し文章を単語単位に分割する自然言語処理であり、形態素解析手段は公知の形態素解析ツールで構成できる。
なお、検閲対象文書に対する検閲は、管理部門などにおいて設定された周期で行われる。法律改正、社内事情、社外の状況などに応じて検閲のタイミングを適宜変更することも当然可能であるし、非常時などに適宜実行することも可能である。
【0055】
検閲対象文書に含まれる単語は、前述の形態素解析手段で抽出された後、NG判断手段によるNG判断処理を受ける。NG判断手段は、NG判定用辞書記憶部を参照して検閲対象文書中の単語がNGワードであるか否かを判断し、NGワードであると判断した単語があればこれを起点として修正候補であるか否かを判断する。
【0056】
NGワードであると判断した単語を起点として修正候補であるか否かを判断する方法としては、例えば以下の三つの方法がある。
第一の方法は、NG判定用辞書記録部に格納されたNGワードのランクデータを参照し、最高ランクのNGワードを起点とし、その起点のランクが所定値以上である場合に修正候補と判断する方法である。
第二の方法は、検閲対象における一文中の起点の数(すなわちNGワードの数)が所定数以上である場合に修正候補と判断する方法、検閲対象における一文中のNGワードの全てを起点とし、それぞれの起点におけるランクの合計値が所定値以上の場合に修正候補と判断する方法である。
第三の方法は、一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する方法である。
【0057】
さらに、検閲対象文にNGワードが存在しない場合、NG判断手段は構文解析処理を実行して二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当するか否かによって修正候補と判断してもよい。
「構文解析処理」とは、形態素解析処理の結果(形態素列)を入力とし、単語同士の係り受け関係や格関係を表す構文木を出力する処理であり、公知の構文解析ツールにて構成できる。構文解析処理を実行することによって、NGとして抽出する部位に対する精度が向上する。そのため、構文解析処理の手順を採用していない文書管理装置の場合に比べて、修正候補として出力される箇所が減ったり、抽出し損なう箇所が減ったりするので、修正入力の手間を軽減することに寄与する。
【0058】
なお本実施形態では、構文解析処理における「係り受けの解析手法」としては、例えば特開2004−21445号の「テキストデータ分析システム」に開示された手法を採用している。
用語間の対応関係を分析するために抽出するシステムを併用してもよい。用語間の対応関係抽出システムとしては、たとえば、特開2011−103038号に開示された手法である。
【0059】
構文解析処理が実行された後、NG判定用辞書記憶部を用いて、NGワードやNG係り受けに該当する箇所を抽出する。そして、処理結果出力手段にて、抽出した箇所を他とは区別できるように表示させる。NG判定用辞書記憶部がインテリジェント化している場合には、単なる解析結果のみならず、修正候補の文言を含んだ対象文書として、所定の端末へ送信する。図1に示す実施形態では、検閲対象文書を作成して保存した文書サーバにアクセスした端末へ送信している。
【0060】
処理結果出力手段を介して、被管理部門の端末の出力画面には、修正候補の文言を含んだ対象文書ファイルが出力される。出力された文書ファイルは、被管理部門の担当者が閲覧し、解析結果として抽出されたNGワードやNG文章を検討する。そして、その担当者が修正の必要ありと判断すれば、修正入力手段を用いて、修正データを入力する。 たとえば、「Y社の特許abcd号は、当社の製品Aの改良に参考となる。」というように修正する。
【0061】
当該担当者は、修正の必要が無く、元の文言で問題ないと判断した場合には、修正しない旨を入力する。なお、当該担当者が判断不能な場合に「保留」という選択をし、その旨を入力することとしてもよい。
修正後の文書ファイルは、文書サーバへ送信される。そして、図示は省略しているが、その文書サーバから、修正後の文書ファイルを送信すべき人や部門へ送信される。
なお、修正前の文書ファイルの扱いは、本システムを採用する組織におけるポリシーによって異なる。たとえば、修正前の文書ファイルは管理部門などの所定部署において回覧用に印刷出力し、文書サーバには保存しないとする、としてもよい。
【0062】
(図2)
図2では、前述した修正候補であるか否かを判断する手順の一例を示している。
検閲対象となる文書データに対して、まず形態素解析処理を実行し、文書データを単語に分割する。
分割された単語にNGワードが含まれているか否かを判断する。含まれていない場合には、文書データにおける一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する。
NG係り受けと判断されない場合には、構文解析を行って二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当するか否かによって修正候補と判断する。
【0063】
この図2に示したフローチャートは一例であり、本願に係る文書管理装置を導入する組織における環境、規模、予算、検閲対象文書の種類、組織における処理ポリシーなどに応じて、前述した方法の組み合わせを採択できる。
【0064】
(自主修正と管理部門とによる修正の複数チェック)
被管理部門端末にて文書ファイルを作成する段階でNG判定用辞書記憶手段にもアクセスし、NGワード等を入力したら警告が発せられるといったシステムを構築してもよい。こうすることで、検閲対象文書においてNGワード等がなるべく使われないような、事前チェックのシステムが形成できる。
【0065】
(図3)
図3では、「A社が当社の特許権を侵害している。」という一文を構文解析した場合(A)と、「当社がA社の特許権を侵害している。」という一文を構文解析した場合(B)とを示している。
構文解析を実行しないと、(A),(B)のいずれもが修正候補として抽出されてしまう可能性が高い。しかし、NG係り受けにおいて「主語=当社、述語=侵害」と登録しており、構文解析を実行していれば、(A)が修正候補として抽出されず、(B)のみが修正候補として抽出される。
【0066】
(図4)
図4は、NG文言サーバにおけるNG判定用辞書データベースの構造を概念的に示したブロック図である。 図1では、NG判定用辞書データベースが一つであるように図示されているが、NG判定用辞書データベースは、被管理部門毎(部署毎)にそれぞれ作成されている。部署毎にNGワードは異なることが多く、組織全体で統一することは困難且つ非効率だからである(例を後述する)。
予め登録しておくべきNGワードなどは、NG文言入力手段によって入力され、NGワードデータベースなどにそれぞれ登録される。
【0067】
なお、NG判定用辞書データベースには、語句の共起性(任意の複数の語句が同時に出現する割合)についても、必要に応じて登録している。
一方、前記した修正入力手段にて修正した文言は、OKワードやOK文例としてOKワードデータベースなどにそれぞれ登録される。すなわち、修正作業によって、事後的に登録され、学習される。
学習したNG文言辞書データベースは、学習前よりも、本実施形態に係る文書管理装置を導入する該当部署における不適切な表現を含んだ文書ファイルが作成される蓋然性を低くする。
【0068】
図4には図示していないが、NG判定用辞書データベースについて、検閲対象となる文書ファイルの種類ごとに、NGワードやNG文例やNG係り受けを予め格納することとしてもよい。また、システムの稼働前に、NGワードを事前チェックすることとしてもよい。 図示は省略するが、NG判定用辞書データベースの管理者の端末においては、NG判定用辞書データベースをメンテナンスする画面が提供される。
法務・知的財産部門におけるお客様向けの文書ファイルにおいては、あるワード(たとえば「クレーム」)が用いられていたとして一般的にNGワードに該当したとしても、特許文書ファイルにおいてはNGワードとならない場合(「クレーム」は「請求項」という意味しか持たない場合)があり、NGワードではないのにNGワードとして抽出されてしまっては修正作業の効率を落とすこととなってしまうからである。
【0069】
(推奨文章の出力)
検閲対象文書ファイルにNGワードやNG文章が使用されているという解析結果を所定の端末へ出力する際、前述のOKワードデータベース、OK文例データベースを用いて、推奨文章を出力することとしてもよい。修正データ入力手段を操作する操作者が推奨文章をそのまま使ってよいと判断した場合には、その推奨文章を選択するだけで修正データの入力が完了する。 そのまま使わない場合でも、操作者にとって修正の参考となる。
なお、推奨文章の採用結果(採用した場合も不採用の場合も)についても、NG判定用辞書データベースにフィードバックされ、以後の精度を高めることに寄与する。
【0070】
(図5)
図5は、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものである。
検閲対象文書ファイルは、技術開発を担当するメンバー全員に回覧される「電子回覧板」である。閲覧した者は電子的に「閲覧済み」というデータを、この検閲対象文書ファイルに格納させる。また、回覧された内容についてコメントがあれば、コメントも記入して保存できる。
構文解析手段によって解析された後の検閲対象文書ファイルにおけるメモには、「α関連と推測」という箇所と、「製品Aの障害」という箇所が抽出され、その抽出箇所は、他の箇所と識別可能であるように出力表示(いわゆるハイライト表示)される。
なお、図示を省略するが、抽出箇所における他の箇所と識別可能であるような出力表示とともに、修正の候補を表示し、さらにその修正候補を選択すれば修正が完了するように画面出力を提供しても良い。
【0071】
(図6)
図6は、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示している。
修正入力手段を操作したのは、修正候補を含む文書ファイルの作成担当者である。その担当者は、「α関連と推測」という箇所の修正は不要であると判断し、その判断を反映させている。 また、「製品Aの障害」というフレーズを含んだ箇所は、「改良に参考となる」というように修正し、その修正内容を確定させている。
なお、端末上でカーソルを修正箇所に持っていくと、修正した理由がメモとして表示されるようにしている。換言すれば、修正入力手段において、メモ書きを追加できる機能を備えているということである。修正内容を他の人が見る場合の便宜のためである。
この修正によって、製品Aが特許公開番号2011−abcd号に開示されている内容と抵触していることを伺わせる記載が、社内の文書ファイルとして保存されることを未然に防止したこととなる。
【0072】
(図7)
図7もまた、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものであり、検閲対象文書ファイルは「発明届出書」である。
構造解析手段は、「怪我をするおそれ」と「怪我のおそれ」という二カ所を抽出している。
【0073】
(図8)
図8もまた、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示したものである。
文書ファイルの作成担当者は、構造解析手段が抽出した部位のみならずその前の部分までを、修正前の文言を一切使わず、大幅に修正している。 このような修正をしたのは、いわゆる製造物責任法において、自社製品の危険性を認識しながら放置したと解釈されかねない記載が、社内の文書として保存されることを未然に防止するためである。なおここでも、端末上でカーソルを修正箇所に持っていくと、修正した理由がメモとして表示される(図中では、製造物責任法を「PL法」と表示している)。
なお、図示を省略しているが、修正後の検閲対象文書ファイルに対して、再分析の必要があるか否かを質問し、修正後の再分析も可能としている。
【0074】
(図9)
図9では、検閲対象文書ファイルがどのような理由で修正されるかを例示している。
修正前の検索対象文書ファイルの中には、以下のようなフレーズが存在していたとする。 『当社製品「A」が、例の安全基準に対してセーフであるとは思えない。』
最初の「A」は、固有名詞または登録商標に係る名称であるため、普通名称に変換している。 なお、社内文書には、こうした固有名詞や登録商標に係る名称がいろいろな部署で使われる蓋然性が高いので、予め変換テーブルをNG判定用辞書データベースに備えることとしてもよい。
営業先への提案書や自社ホームページに掲載する文書が検閲対象文書である場合、競合他社名や競合他社における製品の固有名称などについては、比較広告に該当する可能性がある。比較広告となってしまう事態を未然に防止するため、具体的な競合他社の名称を「競合他社」と抽象化したり、製品の固有名称を「製品の一般名称」としたりする変換テーブルを予め備える場合もある。
【0075】
次に、「例の安全基準」といった略語または隠語を、普通に用いられる用語(Z号安全基準)に変換している。 略語は、社内どころか、社内の他の部署でも通じない用語があるため、変換の必要性が高い。 また、隠語については、裁判などにおいては不利な証拠となりかねないため、変換の必要性が高い。
【0076】
次に、「セーフであるとは思えない」という二重否定の構文を、構文解析手段が指摘し、管理部門の担当者が修正している。
二重否定のフレーズは一般的にわかりにくく、正確な表現ではないためである。修正前における該当箇所の前後との整合性から、「安全性を確認したい」という修正を行った。
【0077】
(図10)
図10は、検閲対象文書ファイルが複数回の修正を経て戻される場合を概念的に示している。
被管理部門のA氏が検閲対象文書ファイルを作成したとする。なお、A氏の作成段階においても、A氏が文書ファイルを作成していた端末は、NG判定用辞書記憶部にアクセスし、NGワードやNG文例に該当する入力を指摘していたとする。
前記の検閲対象文書ファイルが管理部門へ送信され、管理部門のB氏が検閲対象文書ファイルを閲覧し、B氏ができる範囲で修正をし、判断がつかない箇所を保留して、上司であるC氏に係る端末へ、第一修正ファイルを保留箇所である旨のメモデータを付属させて送信する。
【0078】
C氏は、保留箇所である旨のメモデータと、その保留箇所を見ながら、必要な修正を入力し、第二修正ファイルとして被管理部門の端末(A氏に係る端末)と、文書サーバとに送信する。また、B氏に係る端末へも送信する。
以上の手順を踏めば、管理部門においてダブルチェック、A氏の自己チェックを含めればトリプルチェックを実行できたこととなる。 B氏が管理業務に成熟していない場合には、B氏のスキルアップにも寄与する。
【0079】
(図11)
図11は、修正後の文書ファイルに対し、電子的なタイムスタンプを付与するシステムについて説明するための概念図である。手順をカッコ書きのローマ数字で示している。
まず、タイムスタンプを欲する文書ファイル(ここでは、修正後の文書ファイルとしているが、修正前や修正中でも、必要に応じて含めてもよい)をタイムスタンプ要求手段にかける。 NG文言サーバ内のタイムスタンプ要求手段は、その文書ファイルのハッシュ値を算出し、第三者機関に係るサーバへ、そのハッシュ値をインターネット経由で送信する。
【0080】
第三者機関に係るサーバは、更に時刻認証局へインターネット経由でアクセスし、そのハッシュ値に対してタイムスタンプを取得する。そして、タイムスタンプ登録証をNG文言サーバへ返信する。
受信したタイムスタンプ登録証は、修正後の文書ファイルに合成する。タイムスタンプ登録証が合成された文書ファイルは、保存すべきデータベースに保存する。 その文書ファイルを必要とする端末が呼び出すと、タイムスタンプが押された文書ファイルが出力される。
【0081】
前記の例示では、文書ファイルそのものではなくその文書ファイルのハッシュ値を第三者機関へ送信することとしたが、文書ファイルそのものを第三者機関へ送信することとしても良い場合はある。
また、前記の例示では、第三者機関と時刻認証局とを分けて説明したが、時刻認証局が第三者機関として直接タイムスタンプを発行、発送することとしてもよい。
【0082】
(図12)
図12は、既に格納された文書ファイルのデータベースや、送信を終えたメールの送信済みメールの保存データベースに対して、事後的にNGワードやNG文例に該当しないかどうかをチェックする場合を示したものである。
図2と同様、NG文言サーバに送信されてきた検閲対象文書は、構文解析手段に入力され、構文解析手段では、前記のNG判定用辞書データベースのデータを用いるとともに、単語間の係り受け関係を抽出する構文分析手段などに基づいて、検閲対象文書ファイルにNGワードやNG文章が使用されているか否かを解析する。
【0083】
(事後的なNGチェック)
文書ファイルが作成され、必要なチェックもなされ、格納された後に、事後的に登録されたNGワードやNG文例に該当してしまうことがある。 図12に示したように、一旦格納された文書ファイルに対しても、事後的に構文解析を実行することができるようにしてもよい。 ただし、事後的な構文解析は、修正候補の文言を含む対象文書を抽出するにとどめる。 修正入力手段によってデータを修正できるが、修正した文書ファイルは上書きをせず、別名でなければ保存できないようにしている。
なお、送信済みメールの保存データベースではなく、メールサーバ全体を検閲対象とすることで、事前のNGチェックとしてもよい。
【0084】
(図13)
図13に示す実施形態は、図1(文書ファイルを作成した端末において検閲対象文書ファイルを修正する実施形態)と異なり、管理部門が検閲対象文書ファイルを修正する実施形態を示すブロック図である。
解析結果送信手段は、管理部門の端末へ検閲対象文書ファイルを送信する。そして、その端末の操作者(管理者)は、端末において出力された修正候補などを参照しながら、修正データを入力する。
管理部門によって修正データを入力して適正文書ファイルとなった文書ファイルは、検閲対象文書ファイルが保存されていた文書サーバへ送信される。
【0085】
(図14)
図14では、検閲対象文書を所定周期にてNG文言サーバへ送信することを概念的に示している。
(A)は平常時であり、予め設定した所定周期にて検閲対象文書をNG文言サーバが受信し、NG判定をする。
(B)は非平常時であり、たとえば公的入札日を中心として前後一ヶ月の期間は、平常時の三分の一ほどの周期にて検閲対象文書をNG文言サーバが受信し、NG判定をするのである。 こうすることによって、法律条例や契約を遵守できないような文書データが放置される期間を減らすことに寄与する。
【0086】
(図15)
図15はNGワード等の集計をして出力する場合の例であり、(A)は、一ヶ月間の部署別のNG数を棒グラフによって出力した例である。(B)は、抽出したNGワードの種類毎のNG数を棒グラフによって出力した例である。
こうした出力を通じて、同じ誤りを繰り返さないような効果も期待できる。
【0087】
(図16)
図16は、NGワード等の集計をして出力する場合の例であり、部署毎にNGワードの内訳までを一緒に示した出力例である。
部署毎の出力例としたが、個人別(端末毎)の出力とすることも可能である。
【0088】
(図17)
図17は、NGワード等の集計をして出力する場合の例であり、(A)がレーダーチャート、(B)が三次元グラフである。
図16および図17以外の主な出力としては、たとえばいわゆるバブルチャートがある。
【0089】
(翻訳への応用)
ここまでの記載では、法律的な背景から、不適切な表現を効率的に発見し、未然に修正することを趣旨として説明してきたが、別の用途もあり得る。例えば、法律の面のみならず、グローバル企業においては一つの文書ファイルを複数の言語へ翻訳する必要がある場合も多く、その翻訳に誤りがないように、あわよくば機械翻訳で済むようにする、という目的として使用しても有益である。
【0090】
(組織内の略語や隠語)
本実施形態に係る文書管理装置を導入する組織、またはその組織内の更に細かな組織(部署)内においてのみ通用している略語、特殊用語、隠語などについては、前述のNG言語辞書データベースとは別に、特殊用語データベースを備えることとしてもよい。 その場合、その特殊用語データベースには、それぞれの略語、特殊用語、隠語などに対応する一般用語をそれぞれ登録しておく。
検閲対象文書において、特殊用語データベースに登録されている用語が使われている場合には、一般用語に変換する。 そして、前述の修正入力手段を操作する管理者等が表示させる出力画面においては、その用語が変換された旨を認識できるように表示する。
なお、部署毎よりも更に細かく、例えば担当者毎にそれぞれNG判定用辞書データベースを準備してもよい。
【0091】
(NGランク)
NG文言辞書データベースへ予め格納されるNGワードは、そのNGワード毎にランクデータを含ませることとしてもよい。たとえば、
独占禁止法の規制を受ける部署におけるNGワードについては、「不正に該当する」、「不正の可能性がある」、「不正と誤解される可能性がある」、といった危険レベルに関するランクデータを含ませる。
そして解析処理結果出力手段は、検閲対象となる文書ファイルにおいてNGワードを出力する際に、当該NGワードのランクデータに応じた識別が可能なランク表示を含ませることとしてもよい。
この場合、修正を担当する者は、そのランクデータを意識しながら修正作業が行える。
【0092】
(検閲対象文書の分類)
検閲対象文書について分類が可能な場合には、NG文言辞書データベースにおいて格納されるNGワードやNG文言についても、対象とする検閲対象文書の種類についてのデータを予め入力しておいたり、追加で登録したりするようにする。 たとえば、検閲対象文書が発明届出書である場合に特有なNGワードやNG文言であるときには、検閲対象文書が発明届出書である場合にのみ、構文解析手段を用いるようにする。
なお、形態素解析手段が解析できないファイル、たとえば紙に描かれた資料をスキャニングしたのみの画像データファイルに対しては、OCR処理を実行してから形態素解析処理を実行する。
【0093】
(応用例)
前述してきた実施形態においては、組織における文書ファイル保存前の文書チェック補助技術として説明したが、本発明に示すアイディアのコンセプトは、契約書の作成支援システム、特許明細書の作成支援システムなどにも応用可能である。
特許明細書の作成支援システムにおけるNGワードとしては、例えば登録商標となっている自社や競合他社の製品名がある。 これらの製品名は、その製品を示す普通名称に自動変換することとしてもよい。 すなわち、NG判断用辞書データベース内のOKワードを格納したデータベースに、その製品を示す普通名称を登録しておき、登録商標となっている自社や競合他社の製品名が検閲対象文書ファイルに含まれていたら、自動変換するのである。
【0094】
(文書廃棄ルールとの関係)
組織内では文書データの廃棄ルールが定められていることが多く、たとえば、経理書類は、10年間は廃棄しないと社内規程にて定まっているとする。 このような文書データの廃棄ルールを文書データ廃棄ルール格納手段に蓄積して検閲対象となる文書データを所定の文書サーバから端末からの操作によって廃棄削除しようとした場合、前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する。
その廃棄ルール判断手段が廃棄不能と判断した場合には、前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を当該端末へ出力する。たとえば、「削除しようとしている文書データは、経理書類に分類されているので、10年経過しなければ廃棄できません。」といった警告を出力する。
これによって、文書データ廃棄ルールの遵守を促したり、ルールが破られる土壌が形成されることを抑制したりすることとなる。
【産業上の利用可能性】
【0095】
本発明は、所定の組織内のイントラネットを構築するシステムインテグレータ、イントラネットにインストールするためのソフトウェア開発をするソフトウェア開発業、イントラネットを構築するためのハードウェア製造業、インターネットを通じたASP事業などにおいて利用可能性を有する。
【特許請求の範囲】
【請求項1】
検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手段と、
前記文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、
前記対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、
その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、
そのNG判断手段がNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、
を備えた文書管理装置。
【請求項2】
前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、
前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとし、
前記判断結果出力手段は、前記NG判断手段による判断結果が所定ランク以上である場合に判断結果データを所定の端末へ送信することとした
請求項1に記載の文書管理装置。
【請求項3】
前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、
前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとした請求項1または請求項2のいずれかに記載の文書管理装置。
【請求項4】
前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとした
請求項1から請求項3のいずれかに記載の文書管理装置。
【請求項5】
前記NG判定用辞書記憶手段は、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群を格納し、
前記NG判断手段は、その期間限定に指定された期間にのみ修正候補であるか否かを判断することとした請求項4に記載の文書管理装置。
【請求項6】
前記NG判断手段によって修正候補と判断された部位に対する修正データの入力を所定の端末から受け付ける修正入力手段と、
その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、
を備えた請求項1から請求項5のいずれかに記載の文書管理装置。
【請求項7】
前記修正入力手段は、修正データの入力をした場合にその修正入力に対して前記NG判断手段による判断を求めるか否かを選択入力が可能であるように形成されており、
前記適正文書データ受信手段にて受信した修正された文書データに前記NG判断手段による判断を求める旨が含まれている場合には、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信することとした請求項6に記載の文書管理装置。
【請求項8】
前記修正入力手段は、修正候補と判断された部位を修正しない場合に修正保留か修正不要かを選択入力が可能であるように形成されており、
修正不要が選択された場合には、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならないこととした請求項6または請求項7のいずれかに記載の文書管理装置。
【請求項9】
NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、
前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとした請求項1から請求項8のいずれかに記載の文書管理装置。
【請求項10】
前記NG判定用辞書記憶手段は、前記の修正入力手段による修正の結果を登録することとした請求項6から請求項9に記載の文書管理装置。
【請求項11】
前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えた請求項6から請求項10のいずれかに記載の文書管理装置。
【請求項12】
前記修正候補を所定の文書サーバごとに集計して出力する集計データ出力手段を備えた請求項1から請求項11のいずれかに記載の文書管理装置。
【請求項13】
前記NG判定用辞書記憶手段に格納されたNGワード、NG文章またはNG文章構成単語群を加除訂正するデータ入力が可能なNG判定用辞書修正手段を備えた請求項4から請求項12のいずれかに記載の文書管理装置。
【請求項14】
前記対象文書受信手段は、前記文書サーバまたはNG判定用辞書記憶手段のいずれか一方が更新された場合に、検閲対象となる文書データを受信することとした請求項1から請求項13のいずれかに記載の文書管理装置。
【請求項15】
検閲対象となる文書データを所定の文書サーバから廃棄削除する文書データ廃棄手段と、
文書データの廃棄ルールを蓄積した文書データ廃棄ルール格納手段と、
前記文書データ廃棄手段によって文書データを廃棄しようとする場合には前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する廃棄ルール判断手段とを備え、
その廃棄ルール判断手段が廃棄不能と判断した場合には前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を出力することとした請求項1から請求項14のいずれかに記載の文書管理装置。
【請求項1】
検閲対象となる文書データを所定の文書サーバから受信する対象文書受信手段と、
前記文書サーバ毎のNGワードを格納するNG判定用辞書記憶手段と、
前記対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、
その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、
そのNG判断手段がNGと判断した修正候補を含む判断結果データを所定の端末へ送信する処理結果出力手段と、
を備えた文書管理装置。
【請求項2】
前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、
前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとし、
前記判断結果出力手段は、前記NG判断手段による判断結果が所定ランク以上である場合に判断結果データを所定の端末へ送信することとした
請求項1に記載の文書管理装置。
【請求項3】
前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、
前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとした請求項1または請求項2のいずれかに記載の文書管理装置。
【請求項4】
前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとした
請求項1から請求項3のいずれかに記載の文書管理装置。
【請求項5】
前記NG判定用辞書記憶手段は、ある期間において限定的にNGワード、NG文章またはNG文章構成単語群となる限定NGワード、限定NG文章または限定NG文章構成単語群を格納し、
前記NG判断手段は、その期間限定に指定された期間にのみ修正候補であるか否かを判断することとした請求項4に記載の文書管理装置。
【請求項6】
前記NG判断手段によって修正候補と判断された部位に対する修正データの入力を所定の端末から受け付ける修正入力手段と、
その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、
を備えた請求項1から請求項5のいずれかに記載の文書管理装置。
【請求項7】
前記修正入力手段は、修正データの入力をした場合にその修正入力に対して前記NG判断手段による判断を求めるか否かを選択入力が可能であるように形成されており、
前記適正文書データ受信手段にて受信した修正された文書データに前記NG判断手段による判断を求める旨が含まれている場合には、修正された文書データに対して修正候補であるか否かをNG判断手段が判断し、その判断結果を前記処理結果出力手段が所定の端末へ送信することとした請求項6に記載の文書管理装置。
【請求項8】
前記修正入力手段は、修正候補と判断された部位を修正しない場合に修正保留か修正不要かを選択入力が可能であるように形成されており、
修正不要が選択された場合には、当該文書データにおける修正不要の箇所はNG判断手段による次の機会の判断において判断対象とはならないこととした請求項6または請求項7のいずれかに記載の文書管理装置。
【請求項9】
NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、
前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとした請求項1から請求項8のいずれかに記載の文書管理装置。
【請求項10】
前記NG判定用辞書記憶手段は、前記の修正入力手段による修正の結果を登録することとした請求項6から請求項9に記載の文書管理装置。
【請求項11】
前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えた請求項6から請求項10のいずれかに記載の文書管理装置。
【請求項12】
前記修正候補を所定の文書サーバごとに集計して出力する集計データ出力手段を備えた請求項1から請求項11のいずれかに記載の文書管理装置。
【請求項13】
前記NG判定用辞書記憶手段に格納されたNGワード、NG文章またはNG文章構成単語群を加除訂正するデータ入力が可能なNG判定用辞書修正手段を備えた請求項4から請求項12のいずれかに記載の文書管理装置。
【請求項14】
前記対象文書受信手段は、前記文書サーバまたはNG判定用辞書記憶手段のいずれか一方が更新された場合に、検閲対象となる文書データを受信することとした請求項1から請求項13のいずれかに記載の文書管理装置。
【請求項15】
検閲対象となる文書データを所定の文書サーバから廃棄削除する文書データ廃棄手段と、
文書データの廃棄ルールを蓄積した文書データ廃棄ルール格納手段と、
前記文書データ廃棄手段によって文書データを廃棄しようとする場合には前記文書データ廃棄ルール格納手段に蓄積された廃棄ルールに従っているか否かを判断する廃棄ルール判断手段とを備え、
その廃棄ルール判断手段が廃棄不能と判断した場合には前記文書データ廃棄手段による文書データの廃棄削除の実行前に警告を出力することとした請求項1から請求項14のいずれかに記載の文書管理装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2013−109642(P2013−109642A)
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願番号】特願2011−255200(P2011−255200)
【出願日】平成23年11月22日(2011.11.22)
【出願人】(000155469)株式会社野村総合研究所 (1,067)
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願日】平成23年11月22日(2011.11.22)
【出願人】(000155469)株式会社野村総合研究所 (1,067)
[ Back to top ]