説明

文例辞書生成プログラム及び文例辞書生成装置

【課題】文例辞書への文例の登録を簡便化すること。
【解決手段】文例辞書生成プログラムは、複数のプログラムからアクセス可能なメモリ領域に記憶された第一の文字列を取得し、前記第一の文字列に含まれる空白及び/または制御コードを除去して第二の文字列を生成し、前記第二の文字列より文例を抽出し、前記文例を読みに対応付けて記憶部に記憶する処理をコンピュータに実行させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文例辞書生成プログラム及び文例辞書生成装置に関する。
【背景技術】
【0002】
従来、読みに対応付けて文例が記録された辞書(以下、「文例辞書」という。)を有し、読みの入力に応じて、当該読みに対応する文例の一覧を、入力候補として提示するソフトウェア(以下、「文例入力ソフト」という。)が有る。文例入力ソフトによれば、文書の作成負担を軽減することができる。なお、文例とは単語または複数の単語の連鎖である。
【0003】
但し、文書の作成負担の削減効果は、文例辞書の内容に大きく依存する。すなわち、入力頻度が極めて低い文例ばかりが登録されていても、文例入力ソフトによる効果は得られない。
【0004】
そこで、従来から、文例入力ソフトは学習機能を有している。例えば、文例入力ソフトは、ユーザによって入力される文字列から逐次的に文例を抽出し、抽出された文例を文例辞書に登録する。斯かる学習機能によれば、ユーザが過去に入力した文字列から抽出された文例が文例辞書に蓄積され、ユーザにとって利用頻度の高い文例が提示される可能性を高めることができる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2001−209638号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、文例の入力頻度の高さは、同じユーザであっても、作成中の文書の主題又はジャンル等に応じて異なる場合が有る。例えば、新聞記事において、政治に関する記事について入力される文例と、スポーツに関して入力される文例とは、異なる可能性が高い。
【0007】
したがって、これまで作成したことの無い新たな主題等に関する文書を作成する場合、当該文書の作成中に学習された文例が文例辞書に蓄積されるまで、文例辞書を効果的に利用することができない可能性が有る。
【0008】
そこで、例えば、作成中の文書の主題等に関連の深い既存の文書データから文字列をカット&ペーストすることによって、当該文字列を文例の抽出元として利用することが考えられる。
【0009】
しかしながら、例えば、画面に表示された情報からカット&ペーストが行われると、画面のレイアウトに合わせた改行位置にスペース又は改行等が含まれてしまう場合がある。その場合、文例入力ソフトは、当該スペース又は改行等を文の区切りと認識してしまい、正しく文例を抽出できない可能性が有る。
【0010】
そこで、1側面では、文例辞書への文例の登録を簡便化することのできる文例辞書生成プログラム及び文例辞書生成装置の提供を目的とする。
【課題を解決するための手段】
【0011】
一つの案では、文例辞書生成プログラムは、複数のプログラムからアクセス可能なメモリ領域に記憶された第一の文字列を取得し、前記第一の文字列に含まれる空白及び/または制御コードを除去して第二の文字列を生成し、前記第二の文字列より文例を抽出し、前記文例を読みに対応付けて記憶部に記憶する処理をコンピュータに実行させる。
【発明の効果】
【0012】
一態様によれば、文例辞書への文例の登録を簡便化することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の実施の形態における入力支援装置のハードウェア構成例を示す図である。
【図2】本発明の実施の形態における入力支援装置の機能構成例を示す図である。
【図3】文例辞書の生成処理の処理手順の一例を説明するためのフローチャートである。
【図4】文例抽出画面の構成例を示す図である。
【図5】辞書名テーブルの構成例を示す図である。
【図6】文例抽出画面への文字列の転写の一例を説明するための図である。
【図7】抽出文例一覧の一例を示す図である。
【図8】文例辞書の構成例を示す図である。
【図9】文例の入力処理の処理手順の一例を説明するためのフローチャートである。
【図10】文例一覧の表示例を示す図である。
【図11】使用対象の文例辞書の切り替え処理の処理手順の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0014】
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における入力支援装置のハードウェア構成例を示す図である。図1の入力支援装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
【0015】
入力支援装置10での処理を実現するプログラムは、記録媒体101によって提供される。プログラムを記録した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0016】
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って入力支援装置10に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。表示装置106はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置107はキーボード及びマウス等であり、様々な操作指示を入力させるために用いられる。
【0017】
なお、記録媒体101の一例としては、CD−ROM、DVDディスク、又はUSBメモリ等の可搬型の記録媒体が挙げられる。また、補助記憶装置102の一例としては、HDD(Hard Disk Drive)又はフラッシュメモリ等が挙げられる。記録媒体101及び補助記憶装置102のいずれについても、コンピュータ読み取り可能な記録媒体に相当する。
【0018】
図2は、本発明の実施の形態における入力支援装置の機能構成例を示す図である。図2において、入力支援装置10は、編集部11、かな漢字変換部12、及び入力支援部13等を有する。これら各部は、入力支援装置10にインストールされたプログラムが、CPU104に実行させる処理により実現される。
【0019】
編集部11は、入力装置107を介して入力されるユーザの指示に応じて、文書データD1の表示、生成、及び編集等を行う。編集部11は、例えば、ワープロソフト等がCPU104に実行させる処理によって実現される。
【0020】
かな漢字変換部12は、文書データD1に入力される文字に関して、かな漢字変換を行う。かな漢字変換部12は、例えば、IME(Input Method Editor)又はFEP(Front End Processor)等と呼ばれる、文字入力用ソフトの一例であるかな漢字変換ソフトがCPU104に実行させる処理によって実現される。
【0021】
入力支援部13は、文書データD1への文字列の入力の支援を行う。入力支援部13は、読み又は未確定文字列の入力に応じ、入力候補とする文例の一覧を表示する。入力支援部13は、当該一覧の中から選択された文例を文書データD1に入力(又は展開)する。入力支援部13は、また、文例辞書の生成をも行う。文例辞書とは、文例の読みに対応付けて文例や文例の利用回数等が記録されているデータである。本実施の形態において、一つの文例辞書は一つのファイルに格納される。以下、文例辞書を格納するファイルを「辞書ファイル」という。格納する文例辞書が相互に異なる複数の辞書ファイルが生成されうる。
【0022】
なお、本実施の形態において、文例とは、単語、又は一以上の文節等、文の構成要素となる文字列や、一以上の文の集合を含む文字列等をいう。
【0023】
図2において、入力支援部13は、文字列取得部131、文字列補正部132、文例抽出部133、文例登録部134、文例一覧表示部135、文例入力部136、使用辞書切替部137、及び文例辞書記憶部141等を有する。
【0024】
文字列取得部131は、クリップボードCbに複写された(記憶された)文字列を、文例の抽出元として取得する(読み込む)。クリップボードCbは、複数のプログラム(プロセス)からアクセス可能なメモリ領域の一例である。クリップボードCbには、例えば、文書データD1とは別の画面に表示されている文書データであって、表示装置106に表示されている文書データの一部又は全部の文字列が複写される。したがって、文字列取得部131は、当該一部又は全部の文字列を文例の抽出元として取得する。
【0025】
文字列補正部132は、文字列取得部131によって取得された文字列から、空白(スペース)や制御コードを除去する。制御コードとは、ディスプレイやプリンタの出力を制御する文字コードである。制御コードは例えばタブ、改行コード、エスケープコードなどである。すなわち、例えば、PDF(Portable Document Format)データが表示されている画面からクリップボードCbに複写された文字列には、文の区切りでない箇所(例えば、単語の途中等)に改行コードが含まれている場合がある。また、他のデータに関しても、表示上、改行されて見える箇所にスペース又は制御コードが含まれてクリップボードCbに複写される場合がある。更に、電子メールのように、読み易さ等を考慮して、文の区切りでない箇所で改行が行われている文字列がクリップボードCbに複写されることも考えられる。
【0026】
文の区切りでない箇所に空白や改行コードを含む文字列から文例が抽出されたとしても、実用性の有る文例辞書が生成される可能性は低い。そこで、文字列補正部132は、文字列取得部131によって取得された文字列から空白及び改行コードを除去し、一行の文字列(以下、「補正文字列」という。)を生成する。
【0027】
文例抽出部133は、補正文字列から文例を抽出する。文例登録部134は、抽出された文例を文例辞書に登録(記憶)する。
【0028】
文例一覧表示部135は、文字の入力に応じて、当該文字を読みの一部に含む文例の一覧を表示させる。文例入力部136は、表示された文例の一覧の中から選択された文例を、編集部11によって編集対象とされている文書データD1に入力(展開)する。
【0029】
使用辞書切替部137は、使用対象の文例辞書を切り替えるための処理を実行する。すなわち、本実施の形態において、ユーザは、任意のタイミングで、使用対象の文例辞書を切り替えることができる。
【0030】
文例辞書記憶部141は、一以上の辞書ファイルを記憶する。文例辞書記憶部141は、例えば、補助記憶装置102を用いて実現可能である。
【0031】
以下、入力支援装置10が実行する処理手順について説明する。図3は、文例辞書の生成処理の処理手順の一例を説明するためのフローチャートである。
【0032】
文字列取得部131は、文例抽出指示の入力を検知すると(S101)、文例抽出画面を表示装置106に表示させる(S102)。文例抽出指示は、例えば、入力支援部13が、表示装置106に表示させている、入力支援部13のアイコン(以下、「入力支援アイコン」という。)が右クリックされることにより表示されるコンテキストメニューを介して入力される。
【0033】
文例抽出画面は、文例の抽出元とする文字列の転写(又は貼り付け)を受け付けるための画面である。図4は、文例抽出画面の構成例を示す図である。
【0034】
図4において、文例抽出画面510は、コンボボックス511及び転写領域512等を含む。転写領域512は、クリップボードCbに複写されている文字列の転写を受け付けるための領域である。
【0035】
コンボボックス511は、これから抽出される文例の登録先の文例辞書を選択させるための表示部品である。コンボボックス511のテキストボックス511Tには、新規の文例辞書を生成する場合に、当該文例辞書の識別名(辞書名)が入力される。コンボボックス511のリストボックス511Lには、文例辞書記憶部141に既に記憶されている文例辞書(既存の文例辞書)の辞書名の一覧が表示される。
【0036】
既存の辞書ファイルの辞書名の一覧は、例えば、文例辞書記憶部141が記憶する辞書名テーブル141Tより取得される。
【0037】
図5は、辞書名テーブルの構成例を示す図である。図5において、辞書名テーブル141Tは、文例辞書ごとに、辞書番号、辞書名、及び辞書ファイル名等を記憶する。
【0038】
辞書番号は、文例辞書の識別番号である。辞書ファイル名は、文例辞書を格納する辞書ファイルのファイル名である。
【0039】
なお、図5に示されるように、辞書ファイル名から拡張子を除いた文字列が辞書名とされる場合は、必ずしも辞書名テーブル141Tは設けられなくてもよい。すなわち、文例辞書記憶部141に記憶されている辞書ファイル群の各ファイル名から辞書名が抽出されてもよい。
【0040】
また、登録先の辞書ファイルの選択は、文例抽出画面510とは別に表示されるダイアログによって行われてもよい。この場合、当該ダイアログは、ステップS101の後からステップS107の前までのいずれかのタイミングで表示されればよい。
【0041】
続いて、ユーザが、転写領域512に対してクリップボードCbからの貼り付け(転写)を指示すると、文字列取得部131は、転写領域512を介して、クリップボードCbに記憶されている文字列の転写を受け付ける(S103)。
【0042】
図6は、文例抽出画面への文字列の転写の一例を説明するための図である。図6において、画面520は、例えば、文書データD1以外の文書データD2(例えば、PDF)を表示させているアプリケーションプログラムの画面である。画面520において、文書データD2の一部分である範囲Aが選択され、クリップボードCbへのコピー(複写)が指示されると、範囲Aに含まれる文字列は、クリップボードCbに転送される(S103a)。この際、当該文字列は、画面520に表示されている状態において改行して見える箇所に、例えば、改行コードが含まれてクリップボードCbに転送される。すなわち、当該文字列中には、文の区切りとは関係なく、改行コードが含まれる。なお、図6において、改行コードは、黒い三角「▲」で表現されている。
【0043】
続いて、文例抽出画面510がアクティブ状態(操作対象)とされ、クリップボードCbからの貼り付けが指示されると、クリップボードCbに記憶されている文字列が、転写領域512に転写される(S103b)。転写された文字列は、クリップボードCbに格納されていたときと同じ箇所に改行コードを含む。
【0044】
続いて、文字列補正部132は、転写領域512に転写された文字列を作業用のメモリ領域に読み込む(S104)。なお、当該文字列は、転写領域512から取得されてもよいし、クリップボードCbから取得されてもよい。
【0045】
続いて、文字列補正部132は、取得された文字列から、空白及び制御コードを除去して、補正文字列を生成する(S105)。続いて、文例抽出部133は、補正文字列から文例を抽出する(S106)。例えば、形態素解析等が用いられて、単語、文節、又は文等が文例として入力文字列より抽出される。なお、補正文字列は、空白や制御コード等が除去されているため、文例の抽出の際に、文の区切りとは無関係な位置が区切りとして認識される可能性は低い。換言すれば、文字列に含まれる文の構成に従って、正しく文例が抽出される可能性が高い。
【0046】
続いて、文例抽出部133は、抽出された各文例の読みを、各文例からの逆変換(逆読み変換)によって生成する(S107)。文例から読みへの逆変換は、公知技術を用いればよい。抽出された文例及び読みの一覧(以下、「抽出文例一覧」という。)は、例えば、図7に示されるような形式で、メモリ装置103に記憶される。
【0047】
図7は、抽出文例一覧の一例を示す図である。図7に示されるように、抽出文例一覧は、抽出された各文例に対応付けて、当該文例から逆変換された読みを含む。
【0048】
続いて、文例登録部134は、文例抽出画面510のコンボボックス511において指定された辞書名に対応する辞書ファイル(以下、「対象辞書ファイル」という。)をオープンする(S108)。対象辞書ファイルが既存の辞書ファイルでない場合、新たな辞書ファイルが生成され、当該辞書名及び辞書ファイル名が、辞書名テーブル141Tに登録される。
【0049】
続いて、文例登録部134は、抽出文例一覧に含まれる一つの文例及び読みを処理対象とする(S109)。続いて、文例登録部134は、当該文例及び読みが、対象辞書ファイルに格納されている文例辞書に既に登録されているか否かを判定する(S110)。当該文例及び読みが、当該文例辞書に登録されていない場合(S110でNo)、文例登録部134は、当該文例及び読みを当該文例辞書に登録する(S111)。
【0050】
図8は、文例辞書の構成例を示す図である。文例辞書は、文例ごとに、読み、及び利用頻度等を含む。
【0051】
読みは、文例に対する読みである。利用回数は、文例が利用された(入力対象として選択された)回数である。本実施の形態において、利用回数は、文例が利用された累積回数である。但し、過去所定期間(例えば、過去数日間)において文例が利用された回数であってもよい。
【0052】
なお、ステップS111において登録された文例に関する利用回数は、0に初期化される。
【0053】
一方、処理対象の文例及び読みが、対象辞書ファイルに格納されている文例辞書に既に登録されている場合(S110でYes)、文例登録部134は、当該文例に対して当該文例辞書に記録されている利用回数に1を加算する。
【0054】
ステップS109〜S112が、抽出文例一覧に含まれている全ての文例及び読みに関して実行されると(S113でYes)、使用辞書切替部137は、使用対象の辞書を、対象辞書ファイルに格納されている文例辞書に切り替える(S114)。例えば、使用辞書切替部137は、当該文例辞書の辞書名又は対象辞書ファイルのファイル名等、当該文例辞書の識別情報を、使用対象の文例辞書の識別情報として、メモリ装置103に記憶する。その結果、以降の文例入力において、当該文例辞書が使用される。
【0055】
続いて、文書データD1に対する文例の入力時に実行される処理手順の一例について説明する。図9は、文例の入力処理の処理手順の一例を説明するためのフローチャートである。
【0056】
文例一覧表示部135は、文書データD1を表示している画面において、文字入力イベントを検知すると(S201でYes)、入力された文字又は文字列を、読み又は未確定文字列として、当該読み又は未確定文字列に対応する文例を文例辞書より検索する(S202)。ここで、検索先とされる文例辞書は、その識別情報が使用対象の識別情報としてメモリ装置103に記憶されている文例辞書である。
【0057】
読み又は未確定文字列に対応する文例とは、当該文例に対応する読みが、入力された読みに適合する文例、又は当該文例自体が未確定文字列に適合する文例をいう。入力された読みに適合する読みとは、例えば、入力された読みを先頭から含む読みをいう。入力された読みと文例辞書の読みとが完全に一致する場合も含まれるし、文例辞書の読みの先頭の一部分が、入力された読みに一致する場合も含まれる。また、未確定文字列に適合する文例とは、例えば、未確定文字列を先頭から含む文例をいう。未確定文字列と文例とが完全に一致する場合も含まれるし、文例の先頭の一部分が、未確定文字列に一致する場合も含まれる。未確定文字列とは、入力された読みが、かな漢字変換部12によって変換された文字列であって、かつ、入力が確定されていない文字列をいう。
【0058】
なお、文字入力イベントは、文字の入力に応じて発生するイベントをいう。
【0059】
該当する文例が検索された場合(S203でYes)、文例一覧表示部135は、検索された文例の一覧(文例一覧)を表示装置106に表示させる(S204)。
【0060】
図10は、文例一覧の表示例を示す図である。図10において、画面530は、編集部11が表示させている、文書データD1の編集用の画面である。図10では、画面530において、「あき」という読みが入力された時点において表示される文例一覧L1が示されている。
【0061】
なお、文例一覧表示部135は、検索された文例を、例えば、利用回数の降順にソートして、文例一覧を表示させる。すなわち、利用回数が相対的に多い文例が上位となるように文例一覧が表示される。
【0062】
続いて、文例一覧における文例の選択イベントが検知されると(S205でYes)、文例入力部136は、文例一覧の中から選択された文例を、編集部11によって編集対象とされている文書データD1に入力(又は展開)する(S206)。続いて、文例入力部136は、当該文例に対して使用対象の文例辞書に記録されている利用回数に1を加算する(S207)。
【0063】
続いて、使用対象の文例辞書の切り替え時に実行される処理手順について説明する。図11は、使用対象の文例辞書の切り替え処理の処理手順の一例を説明するためのフローチャートである。
【0064】
使用辞書切替部137は、使用対象の文例辞書の切り替え指示の入力を検知すると(S301でYes)、辞書名テーブル141T(図5)に登録されている辞書名の一覧を表示装置106に表示させる(S302)。使用対象の文例辞書の切り替え指示は、例えば、入力支援アイコンが右クリックされることにより表示されるコンテキストメニューを介して入力される。
【0065】
当該一覧において、いずれかの辞書名が選択されると(S303でYes)、使用辞書切替部137は、使用対象の文例辞書を、選択された辞書名に係る文例辞書に切り替える(S304)。すなわち、使用辞書切替部137は、当該文例辞書の識別情報を、使用対象の文例辞書の識別情報として、メモリ装置103に記憶する。その結果、以降の文例入力において、当該文例辞書が使用される。
【0066】
使用対象の文例辞書の切り替えによって、図9の処理の際に表示される文例一覧の内容を、作成対象の文書データの主題又はジャンル等に即した文例に限定することができる。その結果、目的とする文例を探し易くすることができ、文書の作成作業の更なる効率化を期待することができる。
【0067】
なお、図11の処理は、入力支援装置10を入力支援部13として機能させるプログラムの起動時に実行されてもよい。
【0068】
上述したように、本実施の形態によれば、他の文書データの一部又は全部の文字列を入力として、新たな文例を含む文例辞書を作成することができる。その結果、例えば、これまで作成したことの無い新たな主題又はジャンル等に関する文書データを作成する場合、当該主題等に関連の深い文書データの一部又は全部の文字列を、文例抽出画面に転写することで、当該主題等に関する文例を含む文例辞書を容易に作成することができる。
【0069】
特に、文例抽出画面510では、他の文書データの一部の文字列からの文例辞書の作成を簡単な操作(カット&ペースト)で行うことができる。一つの文書データには、複数の主題等に関する文章が含まれている場合がある。また、共通する主題に沿って作成された文章であっても、数字の羅列部分、図形、又はイメージ等が含まれていたり、文例辞書にとって不要な文字列が続く部分が含まれていたりする場合もある。このような文書データに関しても、その一部分をカット&ペーストすることにより、これから作成する文書データにとって有用な部分に関して、容易に文例辞書を作成することができる。
【0070】
また、本実施の形態では、文例抽出画面510に転写された文字列に含まれている空白又は制御コード等を除去した後に、文例の抽出が行われる。したがって、クリップボードCbに複写された文字列において、文の区切りでない箇所に空白又は制御コードが含まれている場合であっても、実用性の有る文例が抽出される可能性を高めることができる。
【0071】
なお、本実施の形態では、各文例辞書がファイル単位で区別される例を説明したが、各文例辞書は、同一のファイルに記憶されてもよい。この場合、例えば、文例ごとに、いずれの文例辞書に属するのかを示す識別情報(例えば、辞書名等)を付与することで、各文例辞書が区別されてもよい。
【0072】
また、文例辞書の格納先は、ファイルでなくてもよい。例えば、データベース等、他の情報管理手段に文例辞書が格納されてもよい。
【0073】
なお、本実施の形態において、入力支援装置10は、文例辞書生成装置の一例である。文字列取得部131は、取得部の一例である。文字列補正部132は、生成部の一例である。文例抽出部133は、抽出部の一例である。文例辞書記憶部141は、記憶部の一例である。
【0074】
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0075】
10 入力支援装置
11 編集部
12 かな漢字変換部
13 入力支援部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
106 表示装置
107 入力装置
131 文字列取得部
132 文字列補正部
133 文例抽出部
134 文例登録部
135 文例一覧表示部
136 文例入力部
137 使用辞書切替部
141 文例辞書記憶部
B バス

【特許請求の範囲】
【請求項1】
複数のプログラムからアクセス可能なメモリ領域に記憶された第一の文字列を取得し、
前記第一の文字列に含まれる空白及び/または制御コードを除去して第二の文字列を生成し、
前記第二の文字列より文例を抽出し、
前記文例を読みに対応付けて記憶部に記憶する処理をコンピュータに実行させる文例辞書生成プログラム。
【請求項2】
前記コンピュータに、
前記メモリ領域に記憶する前記第一の文字列を転写させる第一の画面を表示させ、
前記読み込む処理は、前記第一の画面に転写された前記第一の文字列を読み込む請求項1記載の文例辞書生成プログラム。
【請求項3】
前記読み込む処理は、第二の画面に表示されている文書データの一部分が複写された前記メモリ領域から前記第一の文字列を読み込む請求項1又は2記載の文例辞書生成プログラム。
【請求項4】
前記記憶部と該記憶部とは異なる他の記憶部のうち、いずれかを選択する命令を受付け、
選択された前記記憶部または前記他の記憶部に格納された文例を、入力された文字列に対応する入力候補として使用することを特徴とする請求項1ないし請求項3のいずれか一項に記載の文例辞書生成プログラム。
【請求項5】
複数のプログラムからアクセス可能なメモリ領域に記憶された第一の文字列を取得する取得部と、
前記第一の文字列に含まれる空白及び/または制御コードを除去して第二の文字列を生成する生成部と、
前記第二の文字列より文例を抽出する抽出部と、
前記文例を読みに対応付けて記憶する記憶部とを有する文例辞書生成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2013−77084(P2013−77084A)
【公開日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2011−215676(P2011−215676)
【出願日】平成23年9月29日(2011.9.29)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】