説明

文書管理装置及び文書管理プログラム

【課題】どのようなキーワードで検索すればよいのか分からない場合であっても、所望の文書を効率よく検索することができる技術を提供する。
【解決手段】画像形成装置は、ボックス部に各文書データ(文書A,文書B,文書C)を記憶する際に、各文書データに含まれる単語を抽出し、抽出した単語のうち各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択し、そのキーワードを各文書データに関連付けて記憶しておく。文書データを検索する際には、全ての文書データ(文書A,文書B,文書C)における出現頻度の高い上位数個のキーワードを表示する(単語B;16回、単語A;14回、単語C;8回)。表示されたキーワードのいずれかをユーザが選択することにより、選択されたキーワードに関連付けられた文書データが検索される。これらの表示処理、選択処理、検索処理を繰り返すことにより、文書データの絞り込み検索が行えるようになる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データを管理する文書管理装置及び文書管理プログラムに関するものである。
【背景技術】
【0002】
従来、この種の文書管理装置の先行技術として、文書中から関連文書に適した出現回数の多いキーワードを抽出する技術が開示されている(例えば、特許文献1参照)。
この先行技術によれば、文書中に直接現れないが関連の強いキーワードを検索用キーワード候補として提示することができるので、利用者は期待する関連語句を簡単に検索することができると考えられる。また、この先行技術を利用して、関連文書を検索するためのキーワードを選択項目として追加提示するように設定すれば、キーワードの入力操作の簡便化を図ることができると考えられる。
【0003】
一方、この種の文書管理装置の他の先行技術として、キーワードに対応する文書を検索して、検索された文書をクラスタリングする(集団化してまとめる)技術が知られている。
この先行技術では、検索サーバからユーザに対して絞り込みの提案を行うことができるので、ユーザは、キーワードを追加したり、検索条件を変更したりと積極的に検索を進めることなく、検索サーバからの提案に対して「はい」又は「いいえ」を単に選択するだけで、容易に検索結果を絞り込んでいくことができる。一般に、検索時においては、1つめのキーワードが思い浮かんだとしても、2つめのキーワードを追加する(思い浮かぶ)ことが困難であることが多いが、この先行技術によれば、ユーザは新たなキーワードを考える必要がなくなり、利便性を向上させることができると考えられる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−355166号公報
【特許文献2】特開2009−301221号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述した先行文献の技術は、ユーザをサポートして単語や文書の検索処理を補助する点では優れているが、いずれの技術についても、ユーザが定めた特定の単語(1つめのキーワード)から出発して、その後の検索の手間等を軽減するためのものである。
【0006】
しかし、ユーザが所望している文書を検索する際に、ユーザが過去に保存した文書の内容を曖昧にしか覚えていないため、どのようなキーワードで検索すればよいのか分からない場合には、上記いずれの先行技術においても、ユーザが所望している文書を検索することができないという問題がある。
【0007】
すなわち、比較的最近に保存した文書であれば、ユーザは文書の内容をある程度は覚えていることも多いものであるが、保存してから長く時間が経過していたり、一応保存はしたもののそれほど興味のある文書でなかったり、内容が似通った複数の文書を保存したりした場合等は、文書を保存した事実は覚えていても、一体どのような内容の文書を保存したのかを忘れてしまうことがある。このような場合には、そもそも1つめのキーワードすらも頭に浮びづらい状況であるので、上述した先行文献の技術は利用できないという問題がある。
【0008】
そこで本発明は、保存した文書の内容を曖昧にしか覚えていないため、どのようなキーワードで検索すればよいのか分からない場合であっても、所望の文書を効率よく検索することができる技術の提供を課題としたものである。
【課題を解決するための手段】
【0009】
上記課題を解決するため、本発明は、第1に文書管理装置を提供する。また本発明は、第2に文書管理プログラムを提供する。
【0010】
〔文書管理装置〕
本発明の文書管理装置は、複数の文書データを記憶する文書データ記憶手段と、文書データ記憶手段に各文書データを記憶する際に、各文書データに含まれる単語を抽出する単語抽出手段と、単語抽出手段が抽出した単語のうち、各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手段と、キーワード選択手段が選択したキーワードを、各文書データに関連付けて記憶するキーワード記憶手段と、キーワード記憶手段が記憶しているキーワードの中から、文書データ記憶手段が記憶している全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手段と、キーワード表示手段が表示したキーワードのいずれかを選択する選択手段と、選択手段により選択されたキーワードに関連付けられた文書データを文書データ記憶手段から検索する検索手段と、検索手段が検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、選択手段により選択されたキーワードを除いて、選択手段により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、選択手段及び検索手段に再び処理を行わせる判断手段とを備える文書管理装置である。
【0011】
この発明によれば、各文書データにおける出現頻度の高い上位数個の単語がキーワードとして各文書データに関連付けて記憶されており、検索時には、全ての文書データにおける出現頻度の高い上位数個のキーワードが表示されるので、1つめのキーワードが頭に浮かばない場合であっても、ユーザは表示されているキーワードの中から、探している文書に最も近いと思われるキーワードを選択すればよい。
【0012】
したがって、保存した文書の内容を曖昧にしか覚えていない場合であっても、いくつかのキーワードを確認すればユーザの記憶が蘇ってくる場合があるので、その場合は思いついたキーワードを選択すればいよい。一方、保存した文書の内容を完全に忘れてしまっている場合であって、いくつかのキーワードを確認してもユーザの記憶がまったく蘇ってこない場合であっても、適当なキーワードを選択していれば、いずれは検索終了条件が満たされるので、所望の文書データにたどり着くことができる。
【0013】
これにより、保存した文書の内容を曖昧にしか覚えていない場合や、保存した文書の内容を完全に忘れてしまっている場合であっても、ユーザに対しては検索効率のよいキーワードが提示されるので、所望の文書を効率よく検索することができる。
【0014】
文書管理装置の構成として、所定の検索終了条件は、検索手段が検索した文書データの該当数が1であることが好ましい。
【0015】
この発明によれば、検索した文書データの該当数が1である場合に検索終了条件が満たされるので、ユーザが最終的に所望している最後の文書データまで検索することができ、所望の文書データを確実に検索することができる。
【0016】
文書管理装置の構成として、判断手段が検索対象の文書データであると判断した場合、その文書データに関する情報を表示する文書データ情報表示手段をさらに備えることが好ましい。
【0017】
この発明によれば、検索対象の文書データであると判断された文書データに関する情報が表示されるので、ユーザは即時に所望の文書データの内容を確認することができる。
【0018】
文書管理装置の構成として、選択手段は、キーワード表示手段が表示したキーワード以外の情報であって、いずれのキーワードにも該当するものがない旨の非該当情報を選択可能であり、キーワード表示手段は、選択手段により非該当情報が選択された場合、一旦表示した出現頻度の高い上位数個のキーワードを非表示として、その次に出現頻度の高い上位数個のキーワードを表示することが好ましい。
【0019】
この発明によれば、非該当情報が選択された場合、一旦表示した出現頻度の高い上位数個のキーワードを非表示として、その次に出現頻度の高い上位数個のキーワードを表示するので、検索時にユーザの記憶がある程度蘇った状態である場合に、提示されたキーワードだけでなく、自らの記憶も頼りにしながらキーワードの表示を柔軟に変更させることができ、検索効率をより一層高めることができる。
【0020】
文書管理装置の構成として、判断手段は、検索手段が前回検索した文書データの該当数と、検索手段が今回検索した文書データの該当数とが同じである場合、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断することが好ましい。
【0021】
この発明によれば、前回検索した文書データの該当数と、今回検索した文書データの該当数とが同じである場合、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断するので、検索対象の文書が最後まで見つからないということはなく、適当な段階で検索処理を終了させることができる。
【0022】
〔文書管理プログラム〕
本発明の文書管理プログラムは、複数の文書データを記憶する機能を有する文書管理装置のコンピュータに、各文書データを記憶する際に、各文書データに含まれる単語を抽出する単語抽出手順と、単語抽出手順で抽出した単語のうち、各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手順と、キーワード選択手順で選択したキーワードを、各文書データに関連付けて記憶するキーワード記憶手順と、キーワード記憶手順で記憶しているキーワードの中から、複数の文書データの全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手順と、キーワード表示手順で表示したキーワードのいずれかが選択される選択手順と、選択手順により選択されたキーワードに関連付けられた文書データを複数の文書データの中から検索する検索手順と、検索手順で検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、選択手順により選択されたキーワードを除いて、選択手順により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、選択手順及び検索手順を再び行わせる判断手順とを実行させるための文書管理プログラムである。
【0023】
この発明によれば、上述した文書管理装置の発明と同様な効果を得つつ、その効果をプログラム(ソフトウエア)で実現することができるという有用性がある。
【発明の効果】
【0024】
本発明によれば、保存した文書の内容を曖昧にしか覚えていないため、どのようなキーワードで検索すればよいのか分からない場合であっても、所望の文書を効率よく検索することができる。
【図面の簡単な説明】
【0025】
【図1】文書管理システムの構成図である。
【図2】画像形成装置の概略構成図である。
【図3】画像形成装置により実行されるメイン処理について説明するフローチャートである。
【図4】文書データ記憶処理の詳細について説明するフローチャートである。
【図5】文書データ検索処理の詳細について説明するフローチャートである。
【図6】文書管理処理の内容を説明するための概念図である。
【図7】文書管理処理の内容を説明するための概念図である。
【図8】文書管理処理の内容を説明するための概念図である。
【発明を実施するための形態】
【0026】
以下、本発明の文書管理装置及び文書管理プログラムの実施形態について説明する。
【0027】
図1は、本実施形態に係る文書管理システムの構成図である。
文書管理システム1は、例えばLAN等のネットワーク2を用いて構成され、このネットワーク2には、画像形成装置4及び複数のクライアントPC6がそれぞれ接続されている。
【0028】
図2は、画像形成装置の概略構成図である。
画像形成装置4は、文書管理装置の一例として挙げるものであり、ネットワークインターフェース26を介してネットワーク2(図1参照)に接続され、公衆回線にも接続されている。また、この画像形成装置4は、デジタル複合機であり、いわゆる多機能周辺機器(Multiple Function Peripheral)である。そして、画像形成装置4は、プログラムの命令にしたがって各種動作を実行する。
【0029】
この画像形成装置4には、例えば、印刷機能、送信機能及びボックス機能(保存機能)が備えられている。
より具体的には、HDD(ハードディスク)32は、スキャナ部22で読み込まれたデータや、クライアントPC6(図1参照)から送信されたデータ、FAX通信部24にて受信したデータ等の種々のデータを逐次保存するボックス機能を有している。ボックス機能は、HDD32のボックス部34によって実現される。
【0030】
ボックス部34は、上述した種々のデータを記憶する手段として機能する他、本実施形態では、複数の文書データを記憶する文書データ記憶手段として機能するとともに、所定のキーワードやキーワードの出現頻度等を記憶するキーワード記憶手段としても機能する。
【0031】
FAX通信部24は、HDD32に保存されたデータを相手先に向けて送信する送信機能を有している。
【0032】
プリントエンジン20は、HDD32に保存されたデータを印刷する印刷機能を有している。プリントエンジン20は、スキャナ部22の画像読取位置に原稿を搬送する自動原稿搬送装置(ADF)、用紙を供給する用紙供給部、画像を用紙に転写する画像形成部、転写済みの用紙にソート、孔開けやステープル処理等を行う後処理装置等に接続されている。
【0033】
また、画像形成装置4は、操作パネル28を備えており、この操作パネル28は、タッチパネル式の入力兼表示装置となっている。この操作パネル28には、タッチ操作用のボタンの他、文字情報や案内画像等が表示され、ユーザの操作を受け付け可能に構成されている。操作パネル28では、検索機能によるキーワードが、表示可能かつ選択可能に構成されており、この操作パネル28によるユーザの操作内容は、制御部10に通知される。
【0034】
操作パネル28には、例えば「印刷ボタン」や「FAXボタン」の他、「文書データ記憶ボタン」、「文書データ検索ボタン」等が表示される。この操作パネル28は、キーワードを表示するキーワード表示手段として機能するとともに、キーワードを選択する選択手段や、文書データに関する情報を表示する文書データ情報表示手段としても機能する。
【0035】
さらに、画像形成装置4は、メモリ30を備え、このメモリ30はROMやRAM等を有しており、印刷に伴う設定データや各種のプログラム(文書管理プログラム等)が格納されている。
【0036】
画像形成装置4の各種動作は、制御部10により制御される。この制御部10は、コンピュータとして機能する要素であり、CPU等のハードウエア資源を有している。そして、制御部10は、このハードウエア資源を用いて所定のプログラム(文書管理プログラム等)を実行しており、上述のプリントエンジン20、スキャナ部22やFAX通信部24を制御する。
【0037】
また、制御部10は、文書管理プログラムを実行することにより、単語抽出処理部11、キーワード選択処理部12、キーワード記憶処理部13、キーワード表示処理部14、選択処理部15、検索処理部16、判断処理部17及び文書データ情報表示処理部18として機能する。
【0038】
単語抽出処理部11は、単語を抽出する処理を実行する。キーワード選択処理部12は、キーワードを選択する処理を実行する。
キーワード記憶処理部13は、キーワードを各文書データに関連付けて記憶する処理を実行する。
キーワード表示処理部14は、全ての文書データにおける出現頻度の高い上位数個のキーワードを表示する処理を実行する。
選択処理部15は、キーワードのいずれかを選択する処理を実行する。
検索処理部16は、キーワードに関連付けられた文書データを検索する処理を実行する。
判断処理部17は、所定の場合に検索対象の文書データであると判断する処理を実行する。
文書データ情報表示処理部18は、文書データに関する情報を表示する処理を実行する。
なお、上記各種処理部による処理の詳細については後述する。
【0039】
次に、図3〜図5のフローチャートを参照しながら、図6〜図8の概念図を用いて、本実施形態の文書管理システム1により実行される文書管理処理の内容について説明する。また以下の説明により、文書管理システム1の文書管理処理を実行するための内容が明らかとなる。図3〜図5は、画像形成装置により実行される文書管理処理の内容を示すフローチャートであり、図6〜図8は、文書管理処理の内容を説明するための概念図である。
【0040】
〔メイン処理〕
図3は、画像形成装置により実行されるメイン処理について説明するフローチャートである。
ステップS100:制御部10は、文書データ記憶指示を受信したか否かを確認する。具体的には、ユーザが操作パネル28を操作して、「文書データ記憶ボタン」を押下(タッチ)することにより、操作パネル28から文書データ記憶指示を受信した場合、制御部10は、ステップS200の処理を実行する。
操作パネル28から文書データ記憶指示を受信していない場合、制御部10は、何も処理をせずに、ステップS300に進む。
【0041】
ステップS200:制御部10は、文書データ記憶処理を実行する。文書データ記憶処理の具体的な処理の流れについては、別のフローチャート(図4)を用いて後述する。
【0042】
ステップS300:制御部10は、文書データ検索指示を受信したか否かを確認する。具体的には、ユーザが操作パネル28を操作して、「文書データ検索ボタン」を押下することにより、操作パネル28から文書データ検索指示を受信した場合、制御部10は、ステップS400の処理を実行する。
操作パネル28から文書データ検索指示を受信していない場合、制御部10は、何も処理をせずに、ステップS500に進む。
【0043】
ステップS400:制御部10は、文書データ検索処理を実行する。文書データ検索処理の具体的な処理の流れについては、別のフローチャート(図5)を用いて後述する。
【0044】
ステップS500:制御部10は、その他の指示を受信したか否かを確認する。具体的には、ユーザが操作パネル28を操作して、「印刷ボタン」や「FAXボタン」を押下することにより、操作パネル28からその他の指示を受信した場合、制御部10は、ステップS600の処理を実行する。ここで、その他の指示とは、通常の印刷指示やFAX指示等のことである。
操作パネル28からその他の指示を受信していない場合、制御部10は、何も処理をせずに、ステップS100に戻る。
【0045】
ステップS500:制御部10は、その他の処理を実行する。具体的には、印刷指示やFAX指示等に基づいて、それらに対応する印刷処理やFAX処理等を通常通り行う。
【0046】
〔文書データ記憶処理〕
次に、図3におけるステップS200の文書データ記憶処理の詳細について説明する。
図4は、文書データ記憶処理の詳細について説明するフローチャートである。
ステップS201:単語抽出処理部11は、単語抽出処理を実行する。この処理は、ボックス部34に各文書データを記憶する際に、各文書データに含まれる単語を抽出する処理である(単語抽出手順)。具体的には、スキャンした文書データ(原稿)の文字認識を行って、文書データに含まれる全ての単語を抽出する。文字認識は、OCR(Optical Character Reader;光学式読取装置)によって実現することができる。
【0047】
図6に示すように、例えばボックス部34には、3つの文書A,文書B,文書Cが保存されるものとする。文書A〜文書Cは、例えば1〜2ページの原稿を、スキャナ部22の機能を用いてデータ化したものである。この場合、文書Aを保存する際には文書Aに含まれる単語を全て抽出し、文書Bを保存する際には文書Bに含まれる単語を全て抽出し、文書Cを保存する際には文書Cに含まれる単語を全て抽出するといったように、それぞれの文書を保存する際に単語の抽出を行う。
【0048】
ステップS202(図4参照):キーワード選択処理部12は、キーワード選択処理を実行する。この処理は、ステップS201の単語抽出処理で抽出した単語のうち、各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択する処理である(キーワード選択手順)。上述した単語抽出処理では、文書中に含まれる全ての単語を抽出するが、このキーワード選択処理では、出現頻度の高い上位数個の単語をキーワードとして選択する。
【0049】
図6に示すように、キーワード選択処理部12は、3つの文書A,文書B,文書Cのそれぞれに対して、出現頻度の高い上位4個の単語をキーワードとして選択している。キーワードとして選択した単語は以下の通りである。
【0050】
〔文書A〕
単語A;出現頻度10回
単語B;出現頻度8回
単語C;出現頻度5回
単語D;出現頻度3回
【0051】
〔文書B〕
単語B;出現頻度6回
単語C;出現頻度3回
単語D;出現頻度2回
単語E;出現頻度1回
なお、文書Bには、単語Aは登場しない。
【0052】
〔文書C〕
単語A;出現頻度4回
単語B;出現頻度2回
単語D;出現頻度1回
単語E;出現頻度1回
なお、文書Cには、単語Cは登場しない。
【0053】
ここで、単語とは、文法上、所定の意味を持つ最小の言語単位のことである。例えば「犬が歩く」という文は、「犬」「が」「歩く」という3つの単語によって構成されるが、「が」等の1文字の単語は、一般的な文書において頻繁に登場する単語であるため、上述したキーワード選択処理では、所定の文字数以上の単語(例えば2文字以上の単語や3文字以上の単語)のみをキーワードとして選択するとよい。
【0054】
例えば文書A〜文書Cが複写機関係の文書であれば、単語A〜単語Eは、文書A〜文書Cに含まれる「複写機」、「スキャナ」、「メモリ」、「操作パネル」、「FAX」等の単語である。
【0055】
ステップS203(図4参照):キーワード記憶処理部13は、キーワード記憶処理を実行する。この処理は、ステップS202のキーワード選択処理で選択したキーワードを、各文書データに関連付けて(紐付けて)記憶する処理である(キーワード記憶手順)。例えば、図6に示すように、文書Aでは、出現頻度の高い上位4個の単語が、単語A,単語B,単語C,単語Dであるため、文書Aに単語A,単語B,単語C,単語Dを関連付けて記憶しておく。関連付けは、所定の識別情報を用いて行ってもよいし、文書と同じ記憶領域に関連する単語を合わせて記憶しておいてもよい。
そして、これらの処理を終えると、制御処理は、図3のメインループ処理のステップS200の末尾のアドレスに復帰する。
【0056】
〔文書データ検索処理〕
次に、図3におけるステップS400の文書データ検索処理の詳細について説明する。
図5は、文書データ検索処理の詳細について説明するフローチャートである。
ステップS401:キーワード表示処理部14は、キーワード表示処理を実行する。この処理は、ボックス部34が各文書とともに記憶している全てのキーワードの中から、ボックス部34が記憶している全ての文書データ(文書A,文書B,文書Cの全て)における出現頻度の高い上位数個のキーワードを表示する処理である(キーワード表示手順)。
【0057】
具体的には、文書データの検索対象であるボックス部34に保存されている全文書に対してそれぞれ関連付けられたキーワードのうち、全文書の中で最も出現頻度が高い上位数個のキーワードを操作パネル28にリスト表示させる。
本実施形態においては、リスト表示するキーワードは、図6の全てのキーワードの中から、出現頻度が高い上位3個のキーワードを表示するようにしている。図6において、出現頻度が高い上位3個のキーワードは、以下の通りである。
【0058】
(1)上位1位;単語B、出現頻度16回(文書Aの出現頻度8回+文書Bの出現頻度6回+文書Cの出現頻度2回)
(2)上位2位;単語A、出現頻度14回(文書Aの出現頻度10回+文書Bの出現頻度0回+文書Cの出現頻度4回)
(3)上位3位;単語C、出現頻度8回(文書Aの出現頻度5回+文書Bの出現頻度3回+文書Cの出現頻度0回)
【0059】
そして、これらの出現頻度が高い上位3個の単語をキーワードとしてリスト表示すると、図7に示す表示状態となる。なお、実際の操作パネル28の画面上には、図7中一点鎖線の部分のみが表示される(図7中X1参照)。
【0060】
ステップS402(図5参照):選択処理部15は、選択処理を実行する。この処理は、ステップS401のキーワード表示処理にて、操作パネル28に表示されたキーワードのいずれかを、ユーザが操作パネル28を操作するのに応じて選択する処理である(選択手順)。ここで、操作パネル28は、タッチパネル式の入力装置であるため、ユーザが、単語Bや単語A、単語Cを押下することで、ユーザが意図するキーワードを選択することができる。また、ユーザは、「その他ボタン」を押下することで、いずれのキーワードにも該当するものがない旨の非該当情報を選択することも可能である。
【0061】
ステップS403(図5参照):選択処理部15は、ステップS402の選択処理において、キーワードが選択されたか否かを判断する。キーワードが選択された場合は、ステップS404に進む。選択処理部15は、「その他ボタン」が選択された場合は、キーワードが選択されていないと判断して、ステップS401に戻る。このように、操作パネル28により「その他ボタン」が押下され、非該当情報が選択されてステップS401に戻った場合、キーワード表示処理部14は、一旦表示した出現頻度の高い上位3個のキーワード(単語B,単語A,単語C)を非表示として、その次に出現頻度の高い上位数個(例えば単語E等)のキーワードを表示する。
【0062】
ステップS404:検索処理部16は、検索処理を実行する。この処理は、操作パネル28により選択されたキーワードに関連付けられた文書データをボックス部34から検索する処理である(検索手順)。
図7に示す表示状態において、ユーザが操作パネル28にて単語Aを選択したとすると、単語Aを含む文書C・文書Aが検索結果となる。上述したように、本実施形態では、操作パネル28の選択画面では、図7中一点鎖線の部分のみが表示されるので、ユーザが操作パネル28にて単語Aを選択しても、基本的には、検索対象となった文書C・文書Aは、操作パネル28に表示されない。ただし、仕様や設計によっては、検索対象となった文書C・文書Aを一旦表示するようにしてもよい。
【0063】
ステップS405(図5参照):判断処理部17は、検索終了条件を満たすか否かを判断する。
判断処理部17は、ステップS404の検索処理で検索した文書データに関して、所定の検索終了条件を満たすと判断した場合、その文書データが検索対象の文書データであると判断して、ステップS406に進む(判断手順)。
これに対して、ステップS404の検索処理で検索した文書データに関して、判断処理部17が所定の検索終了条件を満たさないと判断した場合、ステップS401に戻る。このように、所定の検索終了条件を満たさないと判断してステップS401に戻った場合、判断処理部17は、ステップS401のキーワード表示処理において、操作パネル28で選択されたキーワードに関連付けられた文書データに関して、操作パネル28で選択されたキーワードを除く出現頻度の高い上位数個のキーワードを表示させて、ステップS402の選択処理及びステップS404の検索処理を再び行わせる(判断手順)。
【0064】
ここで、本実施形態での検索終了条件は、「ステップS404の検索処理で検索した文書データの該当数が1であること」を1つの条件として設定している。図7の例では、単語Aを選択した時点では、文書C,文書Aが該当しているので、文書データの該当数が2であり、検索終了条件は満たされていない。
【0065】
したがって、この場合、判断処理部17は操作パネル28で選択されたキーワード(単語A)を操作パネル28に表示するキーワードの対象外とする。キーワード表示処理部14は、操作パネル28で選択されたキーワード(単語A)に関連付けられた文書データ(文書C,文書A)において、対象外とされたキーワード(単語A)を除く出現頻度の高い上位数個のキーワードを表示する。そして、選択処理部15がステップS402の選択処理を、検索処理部16がステップS404の検索処理を再び行うことになる。
【0066】
具体的には、図8に示すように、キーワード表示処理部14は、検索結果として特定された文書A及び文書Cのいずれかに含まれる出現頻度の高い上位3個の単語をキーワードとして操作パネル28に表示する。ただし、この際、単語Aについては、上記選択処理にて、ユーザが一度選択しているキーワードであるため、表示の対象外としている。
【0067】
図8の表示例では、文書C及び文書Aに含まれる出現頻度が高い上位3個のキーワード(単語B,単語C,単語D)が検索画面に表示されている。文書C,文書Aにおいて、単語Bの出現頻度は10回であり、単語Cの出現頻度は5回であり、単語Dの出現頻度は4回である。なお、この際も上記選択処理(ステップS402)と同様に「その他ボタン」を選択することもできる。その他ボタンを選択した場合は次候補のキーワードが適宜表示される。また、実際の操作パネル28の画面上には、図8中一点鎖線の部分のみが表示される(図8中X2参照)。
【0068】
例えば、図8の表示状態において、ユーザが操作パネル28にて単語Cを選択したものとする。この場合、単語Cを含む文書は、文書Aと文書Cとの中では文書Aしか存在しないため、文書該当数が1となり、検索終了条件が満たされ、単語Cを含む文書Aが検索対象の文書データであると判断される。
【0069】
一方、図8の表示状態において、ユーザが操作パネル28にて単語Bを選択したものとすると、単語Bは文書Aにも文書Cにも存在しているため、文書該当数が2となり、前回検索した文書データの該当数(2個)と、今回検索した文書データの該当数(2個)とが同じ値になってしまい、検索終了条件が満たされない。そこで、このような場合、選択処理部15は、文書Aと文書Cとにおいて、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断することとしている。
【0070】
図6の例では、文書Aの単語Bの出現頻度は8回であり、文書Cの単語Bの出現頻度は2回であるため、単語Bの出現頻度がより多い文書Aを検索対象の文書データであると判断することとしている。これにより、文書該当数が1となり、検索終了条件が満たされ、その文書Aが検索対象の文書データであると判断される。
【0071】
ステップS406:文書データ情報表示処理部18は、文書データ情報表示処理を実行する。この処理は、ステップS405の判断処理にて検索対象の文書データが特定された場合、その文書データに関する情報を表示する処理である。
【0072】
具体的には、文書Aが検索対象の文書データであると判断されているため、その文書Aに関するアイコン等の画像やファイル名、リンク先等の情報を操作パネル28に表示する。そして、最終的には、ユーザは、画像形成装置4の印刷機能を用いてこの文書Aを印刷したり、画像形成装置4の送信機能を用いて文書AをクライアントPC6に保存したりすることができる。
これらの処理を終えると、制御処理は、図3のメインループ処理のステップS400の末尾のアドレスに復帰する。
【0073】
このように、本実施形態によれば、ユーザに一定のキーワードを提示し、ユーザにそのキーワードを選択させ、そのキーワードを含む文書データを検索結果として表示させ、これらの処理を繰り返すことにより、検索文書の絞り込み検索が行えるようになる。したがって、保存した文書の内容を曖昧にしか覚えていないため、どのようなキーワードで検索すればよいのか分からない場合であっても、操作パネル28に提示されたキーワードを選択的に絞り込んでいくことにより、所望の文書を効率よく検索することができる。
【0074】
また、検索した文書データの該当数が1である場合に検索終了条件が満たされるので、ユーザが最終的に所望している最後の文書データまで検索することができ、検索対象となる複数の文書データを1つにまで絞り込むことによって、検索結果のあいまいさをなくし、検索処理の効率化を図ることができる。
【0075】
さらに、検索対象の文書データであると判断された文書データに関する情報は、操作パネル28に表示されるので、ユーザは操作パネル28を操作しながら、即時に検索対象となった文書データの内容を確認することができる。
【0076】
さらにまた、「その他ボタン」が選択された場合は、次に出現頻度の高い上位数個のキーワードが表示されるので、検索途中でユーザの記憶がある程度蘇った場合に、提示されたキーワードに自らの記憶を加えて、文書検索を行うことができるので、検索の効率化を図ることができる。
【0077】
そのうえ、前回検索した文書データの該当数と、今回検索した文書データの該当数とが同じである場合、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断するので、検索対象の文書が最後まで見つからないということはなく、適当な段階で検索処理を終了させることができる。
【0078】
本発明は、上述した一実施形態に制約されることなく、各種の変形や置換を伴って実施することができる。
(1)文書管理装置は、画像形成装置に適用する例で説明したが、複写機やプリンタ、ファクシミリ装置、スキャナとそれらの複合機等に適用することもできる。
【0079】
(2)文書管理装置は、スキャナが接続された情報処理装置(例えば、パーソナルコンピュータ等)にも適用することができる。例えばパーソナルコンピュータであれば、別途接続したスキャナによって文書データをHDD等に取り込むことができ、そのHDDに保存しておいた文書データを、上述した文書管理処理にて簡単に検索することができる。
【0080】
(3)上述した実施形態では、検索終了条件は、文書データの該当数が1であることを条件に満たされる例で説明したが、保存する文書の数が多い場合は、例えば文書データの該当数が2又は2以上の特定の値であることを条件に満たされるようにしてもよい。文書データの該当数が2であることを条件に検索終了条件が満たされることと設定した場合には、図7の表示状態で単語Aを選択した時点で、文書データの該当数が2となるため、ここで検索は終了する。この場合は、図7に示すように、文書A及び文書Cを表示して、それをユーザに選択させることができる。
【0081】
(4)キーワードは、上位3個を表示する例で説明したが、上位1,2個を表示してもよく、上位4個以上を表示してもよい。キーワードの表示数は、保存している文書データの数や文書量によって適宜変更することができる。
【0082】
(5)一実施形態で挙げた画像形成装置等の構成はいずれも好ましい例示であり、これらを適宜変形して実施可能であることはいうまでもない。
【符号の説明】
【0083】
1 文書管理システム
2 ネットワーク
4 画像形成装置
6 クライアントPC
10 制御部
11 単語抽出処理部
12 キーワード選択処理部
13 キーワード記憶処理部
14 キーワード表示処理部
15 選択処理部
16 検索処理部
17 判断処理部
18 文書データ情報表示処理部
20 プリントエンジン
22 スキャナ部
24 FAX通信部
26 ネットワークインターフェース
28 操作パネル
30 メモリ
32 HDD
34 ボックス部

【特許請求の範囲】
【請求項1】
複数の文書データを記憶する文書データ記憶手段と、
前記文書データ記憶手段に各文書データを記憶する際に、前記各文書データに含まれる単語を抽出する単語抽出手段と、
前記単語抽出手段が抽出した単語のうち、前記各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手段と、
前記キーワード選択手段が選択したキーワードを、前記各文書データに関連付けて記憶するキーワード記憶手段と、
前記キーワード記憶手段が記憶しているキーワードの中から、前記文書データ記憶手段が記憶している全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手段と、
前記キーワード表示手段が表示したキーワードのいずれかを選択する選択手段と、
前記選択手段により選択されたキーワードに関連付けられた文書データを前記文書データ記憶手段から検索する検索手段と、
前記検索手段が検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、前記選択手段により選択されたキーワードを除いて、前記選択手段により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、前記選択手段及び前記検索手段に再び処理を行わせる判断手段と
を備える文書管理装置。
【請求項2】
請求項1に記載の文書管理装置において、
前記所定の検索終了条件は、
前記検索手段が検索した文書データの該当数が1であることを特徴とする文書管理装置。
【請求項3】
請求項1又は2に記載の文書管理装置において、
前記判断手段が検索対象の文書データであると判断した場合、その文書データに関する情報を表示する文書データ情報表示手段をさらに備えることを特徴とする文書管理装置。
【請求項4】
請求項1から3までのいずれかに記載の文書管理装置において、
前記選択手段は、
前記キーワード表示手段が表示したキーワード以外の情報であって、いずれのキーワードにも該当するものがない旨の非該当情報を選択可能であり、
前記キーワード表示手段は、
前記選択手段により前記非該当情報が選択された場合、一旦表示した出現頻度の高い上位数個のキーワードを非表示として、その次に出現頻度の高い上位数個のキーワードを表示することを特徴とする文書管理装置。
【請求項5】
請求項1から4までのいずれかに記載の文書管理装置において、
前記判断手段は、
前記検索手段が前回検索した文書データの該当数と、前記検索手段が今回検索した文書データの該当数とが同じである場合、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断することを特徴とする文書管理装置。
【請求項6】
複数の文書データを記憶する機能を有する文書管理装置のコンピュータに、
前記各文書データを記憶する際に、前記各文書データに含まれる単語を抽出する単語抽出手順と、
前記単語抽出手順で抽出した単語のうち、前記各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手順と、
前記キーワード選択手順で選択したキーワードを、前記各文書データに関連付けて記憶するキーワード記憶手順と、
前記キーワード記憶手順で記憶しているキーワードの中から、前記複数の文書データの全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手順と、
前記キーワード表示手順で表示したキーワードのいずれかが選択される選択手順と、
前記選択手順により選択されたキーワードに関連付けられた文書データを前記複数の文書データの中から検索する検索手順と、
前記検索手順で検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、前記選択手順により選択されたキーワードを除いて、前記選択手順により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、前記選択手順及び前記検索手順を再び行わせる判断手順と
を実行させるための文書管理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate