説明

情報処理装置、画像形成装置、プログラム、文書データ構成方法

【課題】文書作成における表現の決定や構成の設定を容易にする情報処理装置等を提供すること。
【解決手段】文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段131と、文書データ入力手段112,126により入力された文書データが含む文字又は文字列に対応づけて文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段22と、文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段133と、種別判定手段が判定した文書データの文書種別に対応づけた文書構成情報記憶手段に記憶された文書構成情報に基づき入力された文書データの体裁を整える文書構成手段24と、を有することを特徴とする情報処理装置111を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データの文書種別を判別して文書データを構成する情報処理装置、画像形成装置、プログラム及び文書データ構成方法に関する。
【背景技術】
【0002】
報告書やレポートなどで紙文書や電子文書(以下、単に文書という)を回覧したり提出する場面は極めて多い。ユーザは報告書やレポートなどの使用目的、使用場面等に応じて文書を作成する度に、適切な文章に推敲したりレイアウトを検討する。ところで、文書のレイアウトは文書の種類や使用場面に応じて定まっている場合が多い(例えば、特許文献1参照。)。特許文献1には、スキャンした文書のレイアウトに基づいて、文書の種類を特定しその種類毎に分類して電子化する文書処理装置が記載されている。
【特許文献1】特開2007−052615号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
特許文献1に記載されているように、文書のレイアウトは文書の種類や使用場面等に応じて定まっているが、これまで文書の種類に応じて自動的にレイアウトを定めたり文章を推敲することはできなかった。このため、ユーザは文書の種類や使用場面に応じて適切な言葉やレイアウトを調べて文書を作成する必要があるという問題があった。
【0004】
本発明は、上記課題に鑑み、文書作成における表現の決定や構成の設定を容易にする情報処理装置、画像形成装置、プログラム及び文書データ構成方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題に鑑み、本発明は、文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段と、文書データを入力する文書データ入力手段と、前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、前記種別判定手段が判定した文書データの文書種別に応じて、前記文書構成情報記憶手段に記憶された前記文書構成情報に従い入力された文書データの体裁を整える文書構成手段と、を有することを特徴とする情報処理装置を提供する。
【0006】
本発明によれば、文書データの文書種別を判定して、文書種別に適切な文書構成に再構成することができる。
【0007】
また、本発明の一形態において、文書種別毎に、校正前の文字又は文字列に対応づけて校正後の文字又は文字列を記憶した校正情報記憶手段と、前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、を有することを特徴とする。
【0008】
本発明によれば、文書種別に応じて文書データを校正することができる。
【0009】
また、本発明の一形態において、前記種別判定手段は、前記文書データ入力手段により入力された文書データが含む文字又は文字列のうち、前記文書種別情報記憶手段に記憶された数を文書種別毎にカウントし、カウントされた数が最も大きい文書種別の文書データであると判定する、ことを特徴とする。
【0010】
本発明によれば、文書データに文書種別の異なる文字又は文字列が含まれていても、文書種別を適切に判定することができる。
【0011】
また、本発明の一形態において、種別判定手段が、文書データ入力手段により入力された文書データを事務や取引等で用いられるビジネス文書と判定した場合、文書構成手段は、ビジネス文書の文書構成情報に従い、文書データの箇条書きの行頭に行頭記号を付加する、ことを特徴とする。
【0012】
本発明によれば、ビジネス文書に対し、箇条書きの行頭に自動的に記号を付加できるのでユーザの利便性が向上する。
【0013】
また、本発明の一形態において、前記種別判定手段が、前記文書データ入力手段により入力された文書データを事務や取引等で用いられるビジネス文書と判定した場合、 前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データに含まれた日時情報又は場所情報を所定の位置に配置する、ことを特徴とする。
【0014】
本発明によれば、ビジネス文書に対し、日時や場所を適切な位置に配置できるのでユーザの利便性が向上する。
【0015】
また、本発明の一形態において、前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、前記文書構成手段は、年賀状の前記文書構成情報に従い、文書データに含まれる新年の挨拶を構成する文字のフォントを毛筆体に変換する、ことを特徴とする。
【0016】
本発明によれば、年賀状の新年の挨拶を毛筆体に変換できるのでユーザの利便性が向上する。
【0017】
また、本発明の一形態において、前記文書構成情報記憶手段は、十二支の干支毎に、各干支に対応した動物の画像データを記憶しており、前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、前記文書構成手段は、文書データを入力した年の次の年の干支に対応した動物の画像データを前記文書構成情報記憶手段から抽出し、年賀状の前記文書構成情報に従い、前記年賀状の所定の位置に配置する、ことを特徴とする。
【0018】
本発明によれば、年賀状に干支に適した画像データを貼り付けることができるので、ユーザの利便性が向上する。
【0019】
また、本発明の一形態において、前記校正手段は、文書データに含まれた校正前の文字又は文字列と共に、複数の校正後の文字又は文字列を表示装置に表示し、複数の校正後の文字又は文字列のうちポインティングデバイスにより選択された文字又は文字列を用いて、文書データの校正前の文字又は文字列を校正する、ことを特徴とする。
【0020】
本発明によれば、複数の候補から適切な校正後の文字又は文字列を選択することができる。
【発明の効果】
【0021】
文書作成における表現の決定や構成の設定を容易にする情報処理装置、画像形成装置、プログラム及び文書データ構成方法を提供することができる。
【発明を実施するための最良の形態】
【0022】
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
【実施例1】
【0023】
本実施形態の情報処理装置は、文書に含まれる文言から文書の種別(以下、文書種別という)を判定し、文書種別に応じて表現を校正すると共に文書構成の体裁を整える。これにより、ユーザが文書の種類に応じて表現を校正したり文書構成を定めることなく、文書種別に応じて適切な表現及び文書構成にすることができるので、ユーザの利便性を向上させることができる。
【0024】
なお、文書種別とは、文書が使用される場面に応じて定まる文書の種類、例えば、ビジネス文書、年賀状、プロジェクターにより投影されるプレゼンテーション資料、歓送迎会等の案内状、等である。また、ビジネス文書には、企画書、見積書、成果報告書、出張報告書等、種々のものがありこれらを区別することも可能であるが、以下では単にビジネス文書という。
【0025】
また、表現を校正するとは、誤字、脱字及び文法誤用以外の適切でない言い回しを修正することをいう。誤字脱字、文法的な誤り、文章の表記ゆれ、等を修正してもよい。また、文書構成とは、例えば段落毎の配置位置、センタリング・左詰め・右詰め、文字のフォント、サイズ、太字・細字の別、文字や背景の色、箇条書き部の行頭記号、段落の枠の有無、等をいう。
【0026】
図1は、文書種別を判定する情報処理装置111がネットワークNを介して画像形成装置110と接続された印刷システムの概略構成を示す図である。情報処理装置111は、例えばPC(パーソナルコンピュータ)、携帯電話、PDA(Personal Digital(Data) Assistants)、PHS(Personal Handyphone System)等のコンピュータにより構成される。画像形成装置110は、プリンタ、ファクシミリ装置、スキャナ装置、MFP(Multi Function Printer)等、文書を印刷、送信、保存する文書の出力装置である。
【0027】
例えば、ユーザはワープロソフトウェアなどのアプリケーションプログラムを起動した後、情報処理装置111のキーボード112及びマウス113を操作して文字を入力する。入力された文字は順次ディスプレイ114に反映され、最終的には文書や表等が生成される。以下、文書データや電子メールなど文字を含むデータをテキストデータという。テキストデータがバイナリファイルに保存されるかテキストファイルに保存されるかは問わない。
【0028】
本実施形態の情報処理装置111は、テキストデータを構成する自立語(主に日本語の場合)や単語(主に英語の場合)を抽出し、文書種別情報データベース(以下、DBという)を参照し、テキストデータの文書種別を判定する。自立語を日本語の構成要素と、単語は英語の構成要素としたが、他の言語であっても自立語や単語に相当する構成要素から文書種別を判定できる。
【0029】
また、例えば、情報処理装置111がテキストデータを受信したり、可搬型の記憶媒体128に記憶されたテキストデータを読み出し、記憶装置126に記憶した場合、情報処理装置111はテキストデータに含まれる自立語や単語に基づき、テキストデータの文書種別を判定する。
【0030】
図2は、情報処理装置111のハードウェア構成例を示す図である。情報処理装置111は、バスBで相互に接続されているRAM(Random Access Memory )121、ROM(Read-Only Memory)122、入力装置(図1のキーボード112、マウス113に相当)112,113、NIC(Network Interface Card)123、ドライブ装置124、表示制御部125、記憶装置126及びCPU127とを有する。
【0031】
RAM121は、OSやプログラムを実行する作業メモリになり、ROM122はBIOSなどOSを起動するためのプログラムや設定ファイルを記憶している。入力装置112、113はキーボードやマウスなど、ユーザからの様々な操作を入力するためのデバイスである。NIC123は、ネットワークNに接続するためのインターフェイスであり、TCP(Transmission Control Protocol )/IP(Internet Protocol)等のプロトコル処理を実行する。ドライブ装置124は、CD−RWやメモリカード等の記憶媒体128が着脱可能に構成されており、記憶媒体128にプログラムやデータを書き込む際に使用され、また、記憶媒体128に記録されたプログラムやデータを読み込み、記憶装置126に送出する。
【0032】
表示制御部125は、アプリケーションソフトウェアが指示する画面情報に基づき所定の解像度や色数等で、GUI(Graphical User Interface)画面を形成し、操作に必要な各種ウィンドウやデータ等をディスプレイ114に表示する。
【0033】
記憶装置126は、HDD(ハードディスクドライブ)やフラッシュメモリなど不揮発性メモリであり、OS、アプリケーションソフトウェア、プログラム134が記憶されている。CPU127は、OS、アプリケーションソフトウェア及びプログラム134を記憶装置126からロードして実行することで種々の機能を提供すると共に、情報処理装置111が行う処理を統括的に制御する。
【0034】
また、記憶装置126には、後述する文書種別情報DB131、校正情報DB132及び文書構成情報DB133が記憶されている。
【0035】
情報処理装置111が実行するプログラム134は、記録媒体128に記憶して配布されるか、所定のサーバからネットワークNを介して配布される。プログラム134を記録した記録媒体128がドライブ装置124にセットされると、プログラム134が記録媒体128からドライブ装置124を介して記憶装置126にインストールされる。また、サーバからプログラムが送信された場合、NIC123を介して記憶装置126にインストールされる。
【0036】
CPU127がプログラム134を実行することで、テキストデータの種別を判定する文書種別判定手段22、テキストデータの表現を校正する表現校正手段23、テキストデータの文書構成の体裁を整える文書構成手段24、文字列を抽出する文字列抽出手段25と、が実現される。次述するように、表現校正手段23はワープロソフトウェアなどのアプリケーションソフトウェア27の表現を校正し、文書構成手段24は同様にアプリケーションソフトウェア27の表示画面を利用するので、アプリケーションソフトウェア27のアドインなどで構成されることが好ましい。
【0037】
図3は、情報処理装置111の機能構成図を示す。文書種別判定手段22はテキストデータ20から文書種別を判定するので、OS上ではテキストデータ20を入力するためのアプリケーションソフトウェア27が実行されている。アプリケーションソフトウェア27は、例えば、ワープロソフトウェア、表計算ソフトウェア、電子メールソフトウェア等、テキストデータ20を入力しうるものであればよい。
【0038】
文字列抽出手段25及び文書種別判定手段22は、情報処理装置111の起動と共に実行されるか、アプリケーションソフトウェア27の起動に伴い実行される。また、表現校正手段23及び文書構成手段24は、ユーザの所定の操作により起動する。
【0039】
キーボード112は指でキーを操作することで情報処理装置111に文字を入力する。ユーザがキーを押すと、対応するキーコード(例えば、ASCIIコード)が情報処理装置111に送られる。キーコードは例えばBIOS(Basic Input Output System)により対応する文字コードに変換される。なお、キーボード112はタッチパネルや手書き文字入力、音声入力等、文字に対応したキーコードを発生するものであればよい。
【0040】
テキストを日本語で入力する場合、ユーザの操作によりIM(Input Method)21が起動し、文字コードはIM21により日本語に変換される。変換せずに直接テキストを入力する場合は、文字コードは直接アプリケーションソフトウェア27及び文書種別判定手段22に入力される。
【0041】
IM21は、一連の文字コードを日本語等の言語に変換する、いわゆる、かな漢字変換システムである。例えば、キーボード112から「N・O・U・K・I」と入力された場合、IM21は辞書を参照して一連の文字コードを「のうき」と変換すると共に、所定の操作や設定に応じて「納期」や「農機」等に変換することを可能にする。「納期」と変換した場合には「納」「期」それぞれに対応する2つの文字コードが生成される。なお、文字コードは、Unicode、JISコード、シフトJISコード等、いずれであってもよい。以下、文書種別を判定する言葉を種別判定語という。
【0042】
文字列抽出手段25は、所定の文字又は文字列を抽出する。文字列抽出手段25は、テキストデータ20の文字コードを1語1語参照し、テキストデータ20から文書種別情報DB131に登録されている種別判定語を抽出する。また、辞書を参照しながらテキストデータ20の例えば一文ごとに周知の日本語構文解析を行い係り受け関係を抽出し、文節の区分や自立語を抽出してから種別判定語を抽出してもよい。
【0043】
そして、文書種別判定手段22は、文書種別情報DB131に登録された種別判定語に対応つけられた文書種別をテキストデータ20の文書種別として判定する。
【0044】
図4は、情報処理装置111の機能構成図の他の一例を示す。なお、図4において図3と同一構成部には同一の符号を付しその説明は省略する。図3では、キーボード112からテキストデータ20を入力する形態について説明したが、1つのファイルに含まれるテキストデータ20からも同様に文書種別を判定することができる。
【0045】
情報処理装置111が電子メール等で受信したテキストデータ20はいったん記憶装置126に記憶される。アプリケーションソフトウェア27はテキストデータ20を読み出しディスプレイ114に表示したり音声で読み上げたりするが、その際に、文書種別判定手段22はテキストデータ20を抽出し、図3と同様に、種別判定語から文書種別を判定することができる。
【0046】
〔文書種別の判定〕
文書種別の判定について説明する。図5は、文書種別情報DB131に記憶される情報の一例を示す。図5では、種々の種別判定語に文書種別が対応づけられている。例えば、「調査」、「資料」、「納期」、「企業」、「成果」にはビジネス文書の文書種別が、「謹賀新年」、「明けまして」、「元旦」、「賀正」、「賀春」には年賀状の文書種別が、「ビール」、「飲み放題」、「パーティ」、「歓迎会」、「歌い放題」には案内状の文書種別が、それぞれ対応づけられている。
【0047】
文書種別判定手段22はテキストデータ20が含む、文書種別を特徴づける種別判定語に基づき文書種別情報DB131を参照して、それぞれの種別判定語に対応づけられた文書種別を抽出する。そして、例えば、1つのテキストデータ20毎に文書種別を判定する。
【0048】
なお、1つのテキストデータ20から異なる文書種別が検出された場合、検出された回数が最も多い文書種別に属すると判定する。文書種別判定手段22は、メタデータとして文書種別を示す情報をテキストデータ20に付加する。
【0049】
図6は、文書種別情報DB131のより詳細な構成を示す図である。図6では文書種別に対応づけて、種別判定語及び種別判定語を構成する文字の文字コードが登録されている。したがって、文書種別判定手段22は、テキストデータ20に含まれた種別判定語と文書種別情報DB131の一連の文字コードを比較することで、種別判定語に対応する文書種別を抽出することができる。
【0050】
図7は、文書種別判定手段22が文書種別を判定する手順を示すフローチャート図である。まず、情報処理装置111にテキストデータ20が入力される。例えば、「競争力のある製品を核にして開拓推進を行う。」というテキストデータ20が入力される。
【0051】
文書種別判定手段22は、テキストデータ20の文字コード、8B23「競」、9188「争」、97CD「力」…8A6A「核」…8A4A「開」、91F1「拓」…から、文書種別情報DB131に登録された種別判定語に一致する文字列を抽出する(S20)。そして、抽出された種別判定語を用いて文書種別を判定する(S30)。
【0052】
テキストデータ20から「核」、「開拓」、「推進」という種別判定語が抽出されるが、これらはビジネス文書の文書種別に対応づけられているので、文書種別判定手段22はこのテキストデータ20をビジネス文書の文書種別と判定する。
【0053】
〔表現校正〕
文書種別に応じた表現校正について説明する。表現校正手段23は文書種別判定手段22が判定した文書種別に応じて、テキストデータ20の表現を校正する。
【0054】
ビジネス文書、年賀状、プレゼンテーション資料、歓送迎会等の案内状、では好ましい表現が決まっていたり、使用すべきでない表現が知られている(以下、被修正表現という)。本実施形態では、文書種別が検出された後、テキストデータ20に被修正表現が含まれていた場合、被修正表現を校正する。被修正表現と校正後の表現は、校正情報DB132に記憶されている。
【0055】
図8は、校正情報DB132に記憶される情報の一例を示す。校正情報DB132では、文書種別毎に、被修正表現と校正後の表現が対応づけて記憶されている。例えば、ビジネス文書の場合、「開拓を行う」という被修正表現に「開拓推進」という表現が対応づけられており、また、「調査を行う」という被修正表現に「精査」という表現が対応づけられている。このように誤用ではない表現でも、よりビジネスに適した表現に校正することができる。
【0056】
同様に、マナー上、修正した方がよい被修正表現について校正後の表現を対応づけておくことができる。
・お名前を頂戴できますでしょうか → お名前を伺えますでしょうか
・おまちください → おまちいただけますか
・後で → 後ほど
・一応 → 念のため
・今 → ただ今
・すぐ → 早速
・すごく → 非常に
・調査を行う → 精査する
・多分 → 推測するところ
・だれ → どなた
・どこ → どちら
・どう → どのように
・前に → 以前に
また、例えば年賀状の場合、漢字で記載した方が好ましい被修正表現に、校正後の表現を対応づけられている。
・あけまして → 明けまして
また、年賀状では、マナー上、修正した方がよい被修正表現に、校正後の表現が対応づけられている。「迎春」は簡略表現なので目上の人に対しては好ましくない。
・迎春 → 謹賀新年
また、年賀状で使用しがちな二重表現となる被修正表現に、校正後の表現が対応づけられている。「新年 あけましておめでとうございます」は、「新年」と「明けまして」の意味が重複する。
・新年 あけましておめでとうございます → 新年 おめでとうございます
また、年賀状では忌み言葉を避けるのがマナーであるので、忌み言葉に当たる被修正表現には校正後の表現が対応づけられている。
・去年 → 昨年
・枯れる → 乾燥する
・滅びる → なくなる
表現校正手段23は、文書種別に応じて校正情報DB132を参照して、テキストデータ20に含まれる被修正表現を校正後の表現に置き換える。図9は、表現校正手段23が文書種別に応じて表現を校正する手順を示すフローチャート図である。
【0057】
まず、情報処理装置111にテキストデータ20が入力される(S10)。例えば、「競争力のある製品を核にして開拓を行う。」というテキストデータ20が入力される。また、表現校正手段23は文書種別判定手段22が判定した文書種別を取得する(S110)。そして、校正情報DB132を参照して、被修正表現を校正後の表現に校正する(S120)。
【0058】
なお、表現校正手段23はアプリケーションソフトウェア27に、被修正表現を校正後の表現に置き換えるよう要求する。
【0059】
図10は、ディスプレイ114に表示されるテキストデータ20の構成例を示す図である。校正前のテキストデータ20は「競争力のある製品を核にして開拓を行う。」であるが、「開拓を行う」がビジネス文書では被修正表現なので、テキストデータ20は「競争力のある製品を核にして開拓推進する。」に校正される。校正後の表現は、ユーザが把握できるよう下線を付されたり四角で囲まれたり、反転表示したり、色を変えて表現される。なお、校正後の表現を表示し、ユーザが校正を許可したら校正してもよい。
【0060】
また、被修正表現によっては校正後の表現に複数の候補がある場合があるが、この場合は、複数の候補を選択可能とすることが好ましい。図11は校正後の表現の複数の候補が表示されたテキストデータ20の一例を示す。例えば、表現校正手段23は被修正表現「開拓を行う」に下線を付したり四角で囲む等して表示し、ユーザがマウス113で右クリックすると複数の候補を表示する。ユーザは複数の候補の中からテキストデータ20に適切な表現を選択できる。
【0061】
〔文書構成の体裁の調整〕
文書種別に応じた文書構成の体裁の調整について説明する。文書構成手段24は、文書種別判定手段22が判定した文書種別に応じて、テキストデータ20の文書構成の体裁を整える。
【0062】
ビジネス文書、年賀状、プレゼンテーション資料、歓送迎会等の案内状、では好ましい文書構成が決まっている場合が多い。本実施形態では、文書種別に応じて種々の文書構成を予め用意しておき、その文書構成にテキストデータ20の文書構成の体裁を整えることで、ユーザが文書構成を設定する煩わしさを低減する。文書種別毎の文書構成を指定する文書構成情報は文書構成情報DB133に記憶されている。
【0063】
<ビジネス文書>
図12は、ビジネス文書の文書構成の一例を示す。図12の文書構成例は、例えばA4の用紙の領域にテキストデータ20を配置するよう、複数の文字配置欄31〜36を有する。
【0064】
文字配置欄31〜36は、用紙に対する左上のコーナの位置が定められていると共に、フォント、文字のサイズ、太字・細字、センタリング、行間隔、文字間隔、文字色、等、予め設定されている。なお、「件名欄」など「」で囲まれた文字列はテキストデータ20を配置すると自動的に削除される。
【0065】
例えば、文字配置欄31は、用紙の右上に配置され、文書構成手段24がテキストデータ20の文書構成の体裁を整える日付をOSから取得して設定する。また、文字配置欄31にはテキストデータ20の作成者の氏名が配置される。作成者の氏名は、情報処理装置111にログインしたユーザの氏名が自動的に取得される。
【0066】
文字配置欄32は、テキストデータ20の件名を配置する欄で、例えば、ゴシック体で16〜20ポイントの文字をセンタリングして配置する欄である。文字配置欄33は、テキストデータ20の概略、背景、要約等を配置する欄で、例えば、明朝体で10.5ポイントの文字を左詰して配置する欄である。また、文字配置欄34,35は、テキストデータ20が伝達する核となる内容を配置する欄で、例えば、明朝体で10.5ポイントの文字を左詰して配置する欄である。文字配置欄34、35は、テキストデータ20によっては複数存在した方が便利であるため、図示するように複数用意されている(図では2個)。また、箇条書きのテキストデータ20に対応するため文字配置欄35には、番号(1)〜(3)が予め設定されている。また、文字配置欄36は、定型的に通知する内容を配置する欄で、例えば、明朝体で10.5ポイントの文字をセンタリングして配置する欄である。図ではさらに文字配置欄36を影つきの四角で囲むことで、通知する内容に視認しやすくしている。なお、この他、テキストデータ20を提出する宛先を示す欄、テキストデータ20の内容の問い合わせ先を示す欄、Jpegなど文字以外のオブジェクトを貼り付ける欄、等を設けてもよい。
【0067】
文書構成手段24は、テキストデータ20を解析し、文字配置欄31〜36にテキストデータ20を配置する。図13は、文書構成手段24が、テキストデータ20を文書構成情報に従い構成する手順を示すフローチャート図である。
【0068】
すでにユーザは、テキストデータ20をワープロソフトウェアなどのアプリケーションソフトウェア27で編集中であり、文書種別判定手段22により文書種別はビジネス文書であると判定されている。そして、ユーザが所定のメニューから文書構成手段24を起動すると図13のフローチャート図がスタートする。なお、文書構成の体裁の調整を容易にするため、テキストデータ20の所定範囲を選択してから文書構成手段24を起動してもよい。文書構成手段24は起動されると、日付とユーザの氏名をOSから取得し、文字配置欄31に配置する。
【0069】
ここで、テキストデータ20は図14(a)に示すように次の文章であったとする。
これからの取組方法
市場調査
競合他社の調査
パンフレット作成
まず、文書構成手段24は、テキストデータ20の1行目の末尾に句読点があるか否か判定する(S210)。句読点がない場合は、テキストデータ20の件名である可能性が高いので、文書構成手段24は1行目を件名に対応した欄に配置する(S220)。図12では、文字配置欄32に「これからの取組方法」が配置される。
【0070】
ついで、文書構成手段24は、段落に箇条書きがあるか否かを判定する(S230)。なお、段落とは、例えば字下げして始まる行から次に字下げのある行の直前をいう。箇条書きは、各行の最初に、「・」「(1)」「I」「◆」「A.」等の記号が付されることが多いので、これらの記号が検出された場合、箇条書きがあると判定する。また、箇条書きは行の終わりに句点「。」を付さないので、句点がない場合は箇条書きであると判定する。これらのいずれかを満たす場合に箇条書きであると判定してもよいし、全てを満たす場合に箇条書きであると判定しもよい。
【0071】
また、箇条書きの段落の次の段落は、1行空けて記載されることがあるので、箇条書きの段落は空行の手前までとすることができる。また、箇条書きの次の文が句点「。」で終了している場合は、句点「。」で終了する文の手前の行までを箇条書きを含む段落であると判定する。
【0072】
図14(a)のテキストデータ20では、「市場調査」「競合他社の調査」「パンフレット作成」に句点「。」がないので、この3行は箇条書きを含む段落と判定される。段落の終了は、テキストデータ20の終了に一致している。
【0073】
段落に箇条書きがある場合(S230のYes)、文書構成手段24はその段落を箇条書きに対応した欄に配置する(S240)。図12では、箇条書きに対応した文字配置欄35に「市場調査」「競合他社の調査」「パンフレット作成」が配置される。
【0074】
ついで、文書構成手段24は、「日時」又は「場所」の文字列があるか否かを判定する(S250)。なお、「日時」又は「場所」を含むことに加え、行の終わりに句点「。」が付されていないことを判定基準にくわえてもよい。
【0075】
「日時」又は「場所」の文字列がある場合(S250のYes)、日時、場所を含む段落は、定型的に通知する内容の段落であるので、文書構成手段24は、図12の文字配置欄36に配置する(S270)。
【0076】
文書構成手段24は、「日時」の後に連続して含まれる文字列(例えば20XX年1月1日)、「場所」の後に連続して含まれる文字列(例えばXX公園)を通知欄に配置する。
【0077】
段落に「日時」又は「場所」の文字列がない場合(S250のNo)、文書構成手段24は上方の文字配置欄から順番に段落を配置する(S260)。図12では、文字配置欄33,34に配置される。
【0078】
文書構成手段24は以上の処理を段落毎にテキストデータ20が終了するまで繰り返す(S280)。
【0079】
図14(b)は、文書構成手段24が図14(a)のテキストデータ20を文書構成した結果の一例を示す。「これからの取組方法」は文字配置欄32に配置されたので、大きめの文字かつ太文字に変更され、「市場調査」「競合他社の調査」「パンフレット作成」は文字配置欄35に配置されたので、行頭に(1)〜(3)の番号が付与されている。
【0080】
したがって、ユーザがテキストデータ20を入力するだけで、文書種別が判定され、表現が校正されると共に、文書種別に応じてテキストデータ20を適切に文書構成することができる。
【0081】
ところで、図12のように紙面全体の文書構成を決定するのでなく、段落毎やユーザが選択した範囲など、紙面の一部のみの文書構成の体裁を整えてもよい。この場合、文書構成情報DB133には、文字配置欄32〜36が個別に登録されていて、ユーザの操作に応じて文字配置欄32〜36と同様の文書構成ボックスが一覧表示され、ユーザの選択に応じて、テキストデータ20が選択された文書構成ボックスのいずれかの文書構成の体裁に整える。
図15は、ディスプレイ114に表示されたテキストデータ20と文書構成ボックス41〜44の一例を示す。ユーザが所定のメニューから文書構成手段24を起動すると、アプリケーションソフトウェア27がフレームに分割され、文書構成ボックス41〜44が表示される。
【0082】
文書構成ボックス41〜44は、「件名用」など概略の用途を表示すると共に、選択を容易にするため各文書構成ボックス41〜44のフォント、太字・細字、文字のサイズ、センタリング・左詰め・右詰め、等が表示されている。また、実際にテキストデータ20の文書構成の体裁を整えた場合の例として、「×××…」で示す文字列が表示されている。ユーザは、文書構成ボックス41〜44からテキストデータ20に適切な文書構成を選択することができる。
【0083】
<年賀状>
続いて、年賀状の文書構成について説明する。図16は、年賀状の文書構成の一例を示す。図16の文書構成例は、例えばハガキ内の領域にテキストデータ20を配置するよう複数の文字配置欄37〜39を有し、また、イラスト欄40を有する。
【0084】
文字配置欄37〜39は、ハガキに対する左上のコーナの位置が定められていると共に、フォント、文字のサイズ、太字・細字、行間隔、文字間隔、文字色、等、予め設定されている。
【0085】
例えば、文字配置欄37は、新年の挨拶を配置する欄で、毛筆体で20〜24ポイントの文字を配置する欄である。また、文字配置欄38は、その他の文章を配置する欄で、例えば、毛筆体で12ポイントの文字を配置する欄である。文字配置欄39は、新年の西暦を設定する欄で、文書構成手段24がOSから取得した西暦に1を足して設定する。
【0086】
また、イラスト欄40は、JPEG、GIF、TIFF等の画像データを配置する欄である。イラスト欄40に配置する画像データは予め文書構成情報DB133に登録されている。ユーザが優先的にイラスト欄40に配置する画像データを設定しておいてもよいし、干支に応じて自動的に配置してもよい。文書構成情報DB133には、干支毎の画像データが記憶されている。また、画像データの好みはユーザによって異なるので、年齢に対応づけて干支の画像データが記憶されている。例えば、年齢層が低いユーザ向けに、干支の動物を擬人化したアニメーション的な画像データが記憶されており、年齢層が高いユーザ向けに、干支の動物のイラストに松をモチーフにしたイラストがあしらわれた画像データが記憶されている。なお、ユーザの年齢は情報処理装置111に登録されている。
【0087】
文書構成手段24は、テキストデータ20を解析し、文字配置欄37、38にテキストデータ20を配置する。図17は、文書構成手段24がテキストデータ20を文書構成する手順を示すフローチャート図である。
【0088】
すでにユーザは、テキストデータ20をワープロソフトウェアなどのアプリケーションソフトウェア27で編集中であり、文書種別判定手段22により文書種別は年賀状であると判定されている。そして、ユーザが所定のメニューから文書構成手段24を起動すると図17のフローチャート図がスタートする。なお、文書構成の体裁の調整を容易にするため、テキストデータ20の所定範囲を選択してから文書構成手段24を起動してもよい。文書構成手段24は起動されると、西暦をOSから取得し、文字配置欄39に配置する。
【0089】
ここで、テキストデータ20は図18(a)に示すように次の文章であったとする。
謹賀新年
旧年中は大変お世話になりました
今年もよろしくお願い致します
まず、文書構成手段24は、テキストデータ20から新年の挨拶を検出する(S310)。文書種別が年賀状であるので、謹賀新年、賀正などの新年の挨拶が検出される。
【0090】
そして、文書構成手段24は検出した新年の挨拶を対応した欄に配置する(S320)。図16では、文字配置欄37に「謹賀新年」が配置される。
【0091】
ついで、文書構成手段24は、その他の文章を対応する欄に配置する(S330)。図18(a)のテキストデータ20では、「旧年中は大変お世話になりました 今年もよろしくお願い致します」が、文字配置欄38に配置される。「謹賀新年」やその他の文のフォント等をユーザの年齢層に適当なフォント等で記載してもよい。
【0092】
ついで、文書構成手段24は、干支に応じた画像データをイラスト欄40に配置する(S340)。文書構成手段24は、西暦から対応する干支を算出し、ユーザの年齢層に適当な画像データを文書構成情報DB133から抽出して、イラスト欄40に配置する。画像データの大きさとイラスト欄40の大きさが一致しない場合は、拡大又は縮小してもよい。
【0093】
図18(b)は、文書構成手段24が図18(a)のテキストデータ20を文書構成した結果の一例を示す。「謹賀新年」は文字配置欄37に配置されたので、毛筆体かつ大きめの文字で配置されている。イラスト欄40には干支(卯年の場合)にちなんでウサギの画像データが配置されている。
【0094】
したがって、ユーザがテキストデータ20を入力するだけで、文書種別が判定され、表現が校正されると共に、文書種別に応じてテキストデータ20を適切に文書構成することができる。
【0095】
〔変形例〕
上述した実施形態では情報処理装置111が文書種別を判定し、表現を校正し、また、文書構成の体裁を整えたが、画像形成装置110が同様な処理を行ってもよい。
【0096】
画像形成装置110はコンピュータを搭載しているのでプログラム134を実行することで、文書種別判定手段22、表現校正手段23、文書構成手段24及び文字列抽出手段25として機能できる。
【0097】
テキストデータ20を例えば印刷する場合、テキストデータ20は文字コードのまま画像形成装置110に送信される場合と、情報処理装置111でラスタデータに変換されてから画像形成装置110に送信される場合があるが、オフィスユースでは文字コードのまま画像形成装置110に送信されるので、画像形成装置110は上述した実施形態と同様に文書種別を判定し、表現を校正し、また、文書構成の体裁を整えることができる。
【0098】
図19は、画像形成装置110が文書種別を判定する手順のシーケンス図を示す。情報処理装置111のアプリケーションソフトウェア27は画像形成装置110にテキストデータ20の印刷を要求する(S410)。テキストデータ20の送信時、情報処理装置111はテキストデータ20と共に、文書種別に応じた表現の校正及び文書構成の体裁の調整を要求する情報を添付する。
【0099】
この情報に基づき画像形成装置110の文字列抽出手段25は文字列を抽出し(S420)、文書種別判定手段22はテキストデータ20の文書種別を判定する(S430)。
【0100】
ついで、表現校正手段23は文書種別に応じて表現を校正し(S440)、文書構成手段24は文書構成の体裁を整える(S450)。印刷手段は体裁が整えられた文書構成のテキストデータ20を印刷することができる(S460)。印刷が終了すると、画像形成装置110は印刷終了を示す情報を情報処理装置111に送信する(S470)。
【0101】
なお、印刷の前に、文書構成手段24が配置したテキストデータ20の配置をイメージデータにして情報処理装置111に送信し、ユーザが印刷を許可した場合に、調整後の文書構成で印刷してもよい。また、ネットワークNを介して接続されたサーバにより文書構成の体裁の調整を要求し、印刷のみを画像形成装置110にて実行してもよい。
【0102】
本変形例によれば、画像形成装置110がテキストデータ20の文書構成の体裁を自動的に調整するので、各情報処理装置111が文書種別判定手段22、表現校正手段23、文書構成手段24及び文字列抽出手段25を備える必要がなく、情報処理装置111のコストを低減できる。
【実施例2】
【0103】
本実施例では公序良俗を害するおそれの高い文書種別を判定し、このような文書種別のテキストデータ20の転送の禁止し、また、公的機関に通報する情報処理装置111について説明する。公序良俗を害するおそれの高いテキストデータ20とは、例えば、読んだ者に羞恥心や不快感を呼び起こさせ、また、世間体を著しく害する単語を含むものである。本実施例では、一例として、迷惑な単語、いじめの単語、ストーカー用単語、反社会性単語を含むテキストデータ20を、公序良俗を害するおそれがあるものとする。
【0104】
公序良俗を害するおそれの高いテキストデータ20は、作成者がテキストデータ20を作成した以降であれば判定可能となるが、作成者が本実施形態の情報処理装置111を適用することは考えにくい。また、公序良俗を害するおそれの高いテキストデータ20は、主に電子メールで送信されたり、電子掲示板に投稿されることが多い。このため、受信者、電子掲示板の管理人、又は、プロバイダのメールサーバ等が使用する情報処理装置111が、文書種別を判定することが考えられる。したがって、電子メールや投稿用のポストデータが作成者の端末から送信された以降であれば、テキストデータ20の文書種別を判別できる。
【0105】
ところで、公序良俗を害するおそれが高い文書種別であると判定された場合、受信者に送信する必要性は低く、また、電子掲示板に掲示する必要性も低い。受信者に送信したり、電子掲示板に掲示してしまうと、公序良俗を害するおそれが高いテキストデータ20を送信者が作成することを助長することにもなる。このため、公序良俗を害するおそれが高いテキストデータ20は、プロバイダのメールサーバが受信者への送信を禁止することが好ましい。また、公序良俗を害するおそれが高いか否か不明な場合(必ずしも公序良俗を害するとは言えない場合)、例えば、迷惑な単語等を削除して受信者へ送信してもよい。いずれにしても、受信者が公序良俗を害するおそれが高いテキストデータ20を受信したり、掲示板で見たりして不快な思いをすることを防止できる。
【0106】
また、公序良俗を害するおそれが高い電子メール等を送信する送信者を識別する情報(例えば、電子メールの送信者のメールアドレス、ポストデータを送信した端末のIPアドレス等)を記録しておけば、犯罪性の高い悪質な電子メールや電子掲示板の送信者の特定に結びつけることができる。なお、テキストデータ20の文書種別の判定方法は電子メールとポストデータで同じなので、以下では、主に電子メールを例に説明する。
【0107】
〔機能構成図〕
図20は、情報処理装置111の機能構成図の一例を示す。なお、図20において図4と同一構成部には同一の符号を付しその説明は省略する。上記のとおり、図20の情報処理装置111は、例えば、プロバイダや携帯電話事業者のSMTPサーバ、POPサーバである。情報処理装置111が電子メール等で受信したテキストデータ20はいったん記憶装置126に記憶され、転送する前に文書種別判定手段22がテキストデータ20を抽出し、種別判定語から文書種別を判定する。
【0108】
また、転送禁止手段28は、公序良俗を害するおそれが高いテキストデータ20の転送を禁止する。転送の禁止とは、テキストデータ20が電子メールの場合は、例えば、SMTPサーバからPOPサーバへの転送の禁止、POPサーバから受信者の端末への送信の禁止である。また、テキストデータ20が電子掲示板への投稿用のポストデータの場合、ポストデータを端末で表示するために端末に送信することを禁止する。
【0109】
また、公序良俗を害するおそれが高いか否か不明な場合は、表現校正手段23はテキストデータ20から種別判定語を削除した後、電子メールの転送を許可する。また、プロパティ情報記録手段26は、プロパティ情報DB135に公序良俗を害するおそれが高いテキストデータ20を送信した送信者などのプロパティ情報を記録する。さらに、通報手段27は、プロパティ情報DB135を参照して、公序良俗を害するおそれが高いテキストデータ20を多く送信する送信者を警察などの公的機関に通報する。
【0110】
〔文書種別の判定〕
公序良俗を害するおそれの高いテキストデータ20の文書種別の判定について説明する。図21は、文書種別情報DB131に記憶される情報の一例を示す。図21では文書種別に対応づけて、種別判定語及び種別判定語を構成する文字の文字コードが登録されている。図21では、公序良俗を害するおそれの高い文書種別として、迷惑文書、いじめ文書、ストーカー文書、反社会文書、を挙げた。
【0111】
文書種別判定手段22は、テキストデータ20に含まれた種別判定語と文書種別情報DB131の一連の文字コードを比較することで、種別判定語に対応する文書種別を抽出することができる。例えば、「エッチ」「淫ら」「人妻」「ホテル直行」には迷惑文書の文書種別が対応づけられており、「死ね」「うざい」「きもい」にはいじめ文書の文書種別が対応づけられており、「会いたい」にはストーカ文書の文書種別が対応づけられており、「拳銃」「ダイナマイト」には反社会文書の文書種別が対応づけられている。
【0112】
文書種別判定手段22は、種別判定語に基づき文書種別情報DB131を参照して、1つのテキストデータ20毎に、それぞれの種別判定語に対応づけられた文書種別を抽出する。そして、所定数以上(例えば、3個以上)の種別判定語が抽出された場合、文書種別判定手段22は、抽出された種別判定語に対応づけられた文書種別であると判定する。なお、1つのテキストデータ20から異なる文書種別が検出された場合、検出された回数が最も多い文書種別に属すると判定すればよい。本実施例ではどの文書種別と判定しても、それらは公序良俗を害するおそれが高いテキストデータ20であり、種別判定語が削除されたり、転送が禁止される点で同じであるが、このように厳密に区別しておくことで文書種別毎の処理も可能となる(例えば、通報する公的機関を切り替える)。
【0113】
また、種別判定語が所定数未満(例えば、3個未満)の場合、文書種別判定手段22は、公序良俗を害するおそれが高いか否か不明であると判定する。
【0114】
〔文書種別の判定に応じた処理〕
文書種別判定手段22が文書種別を判定した結果、テキストデータ20は、公序良俗を害するおそれがない、公序良俗を害するおそれが高い、又は、公序良俗を害するおそれが高いか否か不明の、3つの態様に区分することができる。公序良俗を害するおそれがない場合、テキストデータ20はそのまま転送が許可される。
【0115】
公序良俗を害するおそれが高いか否か不明の場合、テキストデータ20から種別判定語が削除される。例えば、「お前うざい、きもい」というテキストデータ20の場合、テキストデータ20は受信者は「お前(不適切な表現があるので省略しました)、(不適切な表現があるので省略しました)」というテキストデータ20を受信することになる。受信者が不快な思いをすることを防止できる。
【0116】
なお、この場合も、プロパティ情報記録手段26が、プロパティ情報DB135にこのテキストデータ20を送信した送信者などのプロパティ情報を記録しておくことができる。公序良俗を害するおそれが高いかどうか不明な場合にも、プロパティ情報DB135に記録することで、例えば悪意のある送信者が、1回に送信するテキストデータ20に含まれる文書種別判定語の数を少なくし、送信回数を増やしてテキストデータ20を送信する場合にも、該送信者を抽出することができる。
【0117】
一方、「あの映画きもい、出演者が死ぬ場面も多いし…」というテキストデータ20の場合、「あの映画(不適切な表現があるので省略しました)、出演者が(不適切な表現があるので省略しました)場面も多いし…」に修正されたテキストデータ20が受信者に送信される。このテキストデータ20は、種別判定語はあるが、実際には映画の内容を論評したものであるで、受信者又は受信者から通知された送信者が、メールサーバに元のテキストデータ20の再送を要求すると、種別判定語が削除されていないテキストデータ20が受信者に送信される。
【0118】
したがって、テキストデータ20に種別判定語が含まれていても、実際の内容を人間が判別して、元のテキストデータ20を送信することができる。プロパティ情報をプロパティ情報DB135に記録した場合、再送要求によってプロパティ情報から削除される。
【0119】
テキストデータ20の再送要求が面倒なユーザ、種別判定語を厭わないユーザは、メールサーバに登録される、公序良俗を害するおそれが高いか否か不明なテキストデータ20の配信にかかるポリシーに、削除せず配信するよう設定することができる。
【0120】
公序良俗を害するおそれが高い場合、転送禁止手段28はテキストデータ20の転送を禁止し、また、プロパティ情報記録手段26はプロパティ情報DB135にテキストデータ20のプロパティ情報を記録する。
【0121】
図22は、プロパティ情報DB135に記録されるプロパティ情報の一例を示す。図22に示すように、プロパティ情報DB135に記録されるプロパティ情報は、送信者の電子メールアドレス、受信者(宛先)の電子メールアドレス、文書種別、種別判定語の数、送信日時、等である。したがって、公序良俗を害するおそれが高いテキストデータ20を送信する送信者及び受信者の電子メールアドレスを検出でき、日時からその頻度、種別判定語の数から悪質さを把握できる。
【0122】
なお、プロパティ情報だけでなく、テキストデータ20そのものを記録しておくことが好ましい。後述する公的機関への通報時には重要な証拠となるからである。
【0123】
図23は、文書種別判定手段22が文書種別を判定する手順を示すフローチャート図である。まず、情報処理装置111に電子メールなどのテキストデータ20が送信される。例えば、テキストデータ20が「うざい、うざい、うざい、うざい…。」というテキストデータ20であるとすると、文書種別判定手段22は、「うざい」の文字コード、82A4「う」、82B4「ざ」、82A2「い」を検出して、文書種別情報DB131に登録された種別判定語から「うざい」を一致する文字列として抽出する(S20)。そして、抽出された種別判定語を用いて文書種別を判定する(S30)。
【0124】
テキストデータ20から「うざい」という種別判定語が抽出されるが、これらはいじめ文書の文書種別に対応づけられているので、文書種別判定手段22はこのテキストデータ20をいじめ文書の文書種別と判定する。
【0125】
情報処理装置111は、公序良俗を害するおそれの程度に応じて、テキストデータ20を処理する(S40)。まず、公序良俗を害するおそれがない場合、文書種別判定手段22はテキストデータ20の転送を許可する。
【0126】
公序良俗を害するおそれが高い場合、転送禁止手段28はテキストデータ20の転送を禁止する(S60)。そして、プロパティ情報記録手段26は、そのテキストデータ20を送信した送信者の電子メールアドレス、受信者の電子メールアドレス、文書種別、種別判定語の数、送信日時をプロパティ情報DB135に記録する。また、公序良俗を害するおそれが高いかどうか不明な場合、表現校正手段23はテキストデータ20から種別判定語を削除する(S80)。そして、文書種別判定手段22はテキストデータ20の転送を許可する(S90)。公序良俗を害するおそれが高いかどうか不明な場合にも、プロパティ情報DB135に記録する。
【0127】
〔公的機関への通報〕
図23のような手順により、公序良俗を害するおそれが高いテキストデータ20を受信者に送信することを防止できる。しかしながら、送信回数が多い悪質なテキストデータ20については、警察や管轄省庁などの公的機関へ通報することが好ましい。例えば、電子メールや電子掲示板上の発言でも、刑法上の名誉毀損罪や民法上の不法行為、ストーカー規制法のストーカー行為、等に該当する場合がある。公的機関は種々あるが、文書種別に応じて通報先を切り替えることが好ましい。例えば、迷惑文書、ストーカー文書、反社会文書の場合は警察に、いじめ文書の場合はいじめ相談窓口や文部科学省、教育委員会、校長、等である。
【0128】
通報手段27は、プロパティ情報DB135に記録された送信者の電子メールアドレス等を解析して、例えば10回以上の送信のように悪質なテキストデータ20の送信について、公的機関へ通報する。悪質な送信行為には、例えば次のような態様がある。
a)一人の送信者から → 一人の受信者
b)一人の送信者から → 複数の受信者
c)複数の送信者から → 一人の受信者
d)複数の送信者から → 複数の受信者
a)の態様は、例えば、迷惑文書、ストーカー文書やいじめ文書のように、特定の加害者Aが特定の被害者Bにテキストデータ20を送信する態様である。b)の態様は、例えば、特定の加害者Aが、特定の被害者Bの名誉毀損等のため複数の第三者X〜Zにテキストデータ20を送信する態様、又は、特定の加害者Aが、反社会文書を複数の第三者X〜Zにテキストデータ20を送信する態様である。c)の態様は、例えば、いじめ文書のように、特定の複数の加害者A、A'、A''が特定の被害者Bにテキストデータ20を送信する態様である。また、d)の態様は、例えば、特定の加害者A、A'、A''等が、特定の被害者Bの名誉毀損等のため複数の第三者X〜Zにテキストデータ20を送信する態様である。
【0129】
公序良俗を害する態様としては、a)及びc)の態様が最も多いと考えられる。これに対し、b)d)の態様は、第三者X〜Zの電子メールアドレスを特定の加害者A等が取得している必要があり、また、第三者X〜Zは特定の被害者Bの知人である必要があるため、公序良俗を害する態様としては少ない。
【0130】
したがって、最も簡単に加害者Aを特定するには、プロパティ情報DB135に記録された送信者の電子メールアドレスの数が多い(例えば10以上)送信者を抽出すればよい( a)b)の態様)。また、送信者が複数の電子メールアドレスを使い分けて、テキストデータ20を送信する場合でも、テキストデータ20の宛先になることが多い(例えば、10回以上)受信者のメールアドレスが特定できる( c)の態様)。この場合でもいじめやストーカー等の行為であるとしてよいので、同じ受信者のメールアドレスに送信した複数の送信者が通報の対象となる。したがって、電子メールを用いて公序良俗を害するおそれが高いテキストデータ20を送信する態様のほとんど(a)〜c))に対し有効である。
【0131】
なお、b)やd)の態様は、電子メールよりも電子掲示板の態様に近いので、テキストデータ20を電子掲示板にアップロードした端末のIPアドレスが、送信者(アップロードした者)を特定する手がかりとなる。このため、プロパティ情報記録手段26は、端末のIPアドレスをプロパティ情報DB135に記録する。
【0132】
通報手段27は、プロパティ情報DB135に記録された数の多い送信者の電子メールアドレス、又は、記録された数の多い受信者の電子メールアドレスに送信した送信者の電子メールアドレスを公的機関に通報する。より好ましくは、公的機関への送信時に、プロバイダの電子証明やタイムスタンプを添付することで、通報手段27の通報の証拠機能が向上する。
【0133】
これにより公的機関は、プロバイダ責任制限法及び関連するガイドラインに基づきプロバイダ等に送信者の情報を開示するよう要求でき、送信者の情報から実際の住所、氏名、連絡先等を特定することができるようになる。
【0134】
図24は、通報手段27がテキストデータ20の送信者を抽出する手順を示すフローチャート図の一例を示す。図24のフローチャート図は、例えば、所定のサイクル時間(1日1回)毎に繰り返し実行される。
【0135】
まず、通報手段27は、プロパティ情報DB135に例えば10以上記録された送信者の電子メールアドレスを抽出する(S510)。これによりa)及びb)の態様の送信者を検出することができる。
【0136】
ついで、通報手段27は、プロパティ情報DB135に例えば10以上記録された受信者に送信する送信者の電子メールアドレスを抽出する(S520)。これによりc)の態様の送信者を検出することができる。
【0137】
かかる処理により、単に公序良俗を害するおそれの高いテキストデータ20の送信を禁止するだけでなく公的機関に通報することができるので、自動的に証拠保存され、公的機関も犯罪検挙がしやすくなり、さらなる犯罪を抑止することができるようになる。
【図面の簡単な説明】
【0138】
【図1】文書種別を判定する情報処理装置がネットワークNを介して画像形成装置と接続された印刷システムの概略構成例を示す図である。
【図2】情報処理装置のハードウェア構成例を示す図である。
【図3】情報処理装置の機能構成図の一例である。
【図4】情報処理装置の機能構成図の他の一例を示す図である。
【図5】文書種別情報DBに記憶される情報の一例を示す図である。
【図6】文書種別情報DBに記憶される情報のより詳細な例を示す図である。
【図7】文書種別判定手段が文書種別を判定する手順を示すフローチャート図の一例である。
【図8】校正情報DBに記憶される情報の一例を示す図である。
【図9】表現校正手段が文書種別に応じて表現を校正する手順を示すフローチャート図の一例である。
【図10】ディスプレイに表示されるテキストデータの構成例を示す図である。
【図11】校正後の表現の複数の候補が表示されたテキストデータの一例を示す図である。
【図12】ビジネス文書の文書構成の一例を示す図である。
【図13】文書構成手段が、テキストデータを文書構成情報に従い構成する手順を示すフローチャート図の一例である。
【図14】構成前と構成後のテキストデータの一例を示す図である。
【図15】ディスプレイに表示されたテキストデータと文書構成ボックスの一例を示す図である。
【図16】年賀状の文書構成の一例を示す図である。
【図17】文書構成手段がテキストデータを文書構成する手順を示すフローチャート図である。
【図18】構成前と構成後のテキストデータの一例を示す図である。
【図19】画像形成装置が文書種別を判定する手順のシーケンス図の一例である。
【図20】情報処理装置の機能構成図の一例である(実施例2)。
【図21】文書種別情報DBに記憶される情報の一例を示す図である(実施例2)。
【図22】プロパティ情報DBに記録されるプロパティ情報の一例を示す図である。
【図23】文書種別判定手段が文書種別を判定する手順を示すフローチャート図の一例である。
【図24】通報手段がテキストデータの送信者を抽出して通報する手順を示すフローチャート図の一例である。
【符号の説明】
【0139】
20 テキストデータ
21 IM(インプットメソッド)
22 文書種別判定手段
23 表現校正手段
24 文書構成手段
26 プロパティ情報記録手段
27 通報手段
28 転送禁止手段
31〜39 文字配置欄
40 イラスト欄
110 画像形成装置
111 情報処理装置
112 キーボード
113 マウス
114 ディスプレイ
126 記憶装置
131 文書種別情報DB
132 校正情報DB
133 文書構成情報DB
134 プログラム
135 プロパティ情報DB

【特許請求の範囲】
【請求項1】
文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段と、
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
を有することを特徴とする情報処理装置。
【請求項2】
文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段と、
前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、
前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、
を有することを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記種別判定手段は、前記文書データ入力手段により入力された文書データが含む文字又は文字列のうち、前記文書種別情報記憶手段に記憶された数を文書種別毎にカウントし、カウントされた数が最も大きい文書種別の文書データであると判定する、
ことを特徴とする請求項1又は2記載の情報処理装置。
【請求項4】
前記種別判定手段が、前記文書データ入力手段により入力された文書データを、事務や取引等で用いられるビジネス文書と判定した場合、
前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データの箇条書きの行頭に行頭記号を付加する、
ことを特徴とする請求項1〜3いずれか1項記載の情報処理装置。
【請求項5】
前記種別判定手段が、前記文書データ入力手段により入力された文書データを、事務や取引等で用いられるビジネス文書と判定した場合、
前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データに含まれた日時情報又は場所情報を所定の位置に配置する、
ことを特徴とする請求項1〜4いずれか1項記載の情報処理装置。
【請求項6】
前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、
前記文書構成手段は、年賀状の前記文書構成情報に従い、文書データに含まれる新年の挨拶を構成する文字のフォントを毛筆体に変換する、
ことを特徴とする請求項1〜3いずれか1項記載の情報処理装置。
【請求項7】
前記文書構成情報記憶手段は、十二支の干支毎に、各干支に対応した動物の画像データを記憶しており、
前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、
前記文書構成手段は、文書データを入力した年の次の年の干支に対応した動物の画像データを前記文書構成情報記憶手段から抽出し、年賀状の前記文書構成情報に従い、前記年賀状の所定の位置に配置する、
ことを特徴とする請求項1〜3いずれか1項記載の情報処理装置。
【請求項8】
前記校正手段は、
文書データに含まれた校正前の文字又は文字列と共に、複数の校正後の文字又は文字列を表示装置に表示し、
複数の校正後の文字又は文字列のうちポインティングデバイスにより選択された文字又は文字列を用いて、文書データの校正前の文字又は文字列を校正する
ことを特徴とする請求項2記載の情報処理装置。
【請求項9】
文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段と、
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
を有することを特徴とする画像形成装置。
【請求項10】
文書データの文書種別と対応づけて、該文書種別で用いられる文字又は文字列を記憶する文書種別情報記憶手段と、
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段、から情報を読み取るコンピュータを、
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
として機能させるプログラム。
【請求項11】
文書データ入力手段から文書データを入力するステップと、
種別判定手段が、文書データの文書種別と対応づけて、該文書種別で用いられる文字又は文字列を記憶する文書種別情報記憶手段を参照して、入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定するステップと、
文書構成手段が、判定された文書データの文書種別に応じて、文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段を参照して、前記文書構成情報記憶手段に記憶された前記文書構成情報に従い、入力された文書データの体裁を整えるステップと、を有することを特徴とする文書データ構成方法。
【請求項12】
文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段と、
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
前記種別判定手段が文書データを、公序良俗を害するおそれがある文書種別と判定した場合、文書データの転送を禁止する転送禁止手段と、
前記転送禁止手段が禁止した文書データから送信者等のプロパティ情報を抽出してプロパティ情報データベースに記録するプロパティ情報記録手段と、
前記プロパティ情報データベースにプロパティ情報が記録された文書データの送信者を公的機関に通報する通報手段と、
を有することを特徴とする情報処理装置。
【請求項13】
前記種別判定手段、が文書データに公序良俗を害するおそれのある文字又は文字列が含まれていると判定した場合、文書データから公序良俗を害するおそれがある文字又は文字列を削除する表現校正手段、を有し、
前記転送禁止手段は、公序良俗を害するおそれがある文字又は文字列を削除した文書データの転送を禁止しない、
ことを特徴とする請求項12記載の情報処理装置。
【請求項14】
前記種別判定手段は、文書データの文書種別を、いじめ文書、迷惑文書、ストーカー文書、又は、反社会文書のいずれかに判定する、
ことを特徴とする請求項12記載の情報処理装置。
【請求項15】
文書データが電子メールの場合、前記転送禁止手段は、文書データの宛先の受信者に文書データを送信することを禁止し、
文書データが電子掲示板に投稿用のポストデータの場合、前記転送禁止手段は、文書データを端末に転送することを禁止する、
ことを特徴とする請求項12記載の情報処理装置。
【請求項16】
文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段、から文書種別を読み出すコンピュータを、
文書データを入力する文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
前記種別判定手段が文書データを、公序良俗を害するおそれがある文書種別と判定した場合、文書データの転送を禁止する転送禁止手段と、
前記転送禁止手段が禁止した文書データから送信者等のプロパティ情報を抽出してプロパティ情報データベースに記録するプロパティ情報記録手段と、
前記プロパティ情報データベースにプロパティ情報が記録された文書データの送信者を公的機関に通報する通報手段と、
として機能させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2009−110497(P2009−110497A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2008−135892(P2008−135892)
【出願日】平成20年5月23日(2008.5.23)
【出願人】(000006747)株式会社リコー (37,907)
【出願人】(596017761)リコーテクノシステムズ株式会社 (37)
【Fターム(参考)】