文字処理装置

【課題】品詞に応じて割り当てるフォントデータを変化させる文字処理装置を提供する。
【解決手段】本発明の文字処理装置１０において、文字列解析部２４は、入力された文字列における単語の品詞を解析する。フォントデータ格納部４４は、品詞に対応付けてフォントデータを格納しており、割当部２６は、解析された単語の品詞に応じて、入力された文字に、フォントデータを割り当てる。このフォントデータ格納部４４は、同一の文字につき複数のフォントデータを保持して構成される。また、フォントデータ格納部４４は、所定の文字列を表現したフォントデータを保持してもよい。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、文字を表現する文字処理装置に関し、特に手で書いたような文字を画面上や印刷紙上などに表現する文字処理装置に関する。
【背景技術】
【０００２】
従来のワープロソフトには、様々な種類のフォントが組み込まれている。「フォント」とは、文字をコンピュータを使って表示したり印刷したりする際の文字の形であり、「書体」とも呼ばれる。ワープロソフトは、ゴシック体や明朝体など複数のフォントタイプを予め用意しておき、ユーザが文章の種類に応じてフォントを使い分けることで、文章の表現力を向上させることができる。
【０００３】
フォントデータをコンピュータに持たせる代表的な手法として、文字の形を小さな正方形の点（ドット）の集まりとして表現するビットマップフォントと、基準となる点の座標と輪郭線の集まりとして表現するアウトラインフォントが存在する。これらは、表示処理または印刷処理の高速性を重視するか、または文字の美観性を重視するかにより、使い分けがなされる。例えばビットマップフォントは高速処理が可能である一方で、拡大・縮小すると文字の形が崩れてしまうという欠点がある。アウトラインフォントは、表示や印刷に時間がかかるが、いくら拡大・縮小しても美しい出力が可能である。近年では、コンピュータの処理速度の向上、およびプリンタの高解像度化にともなって、アウトラインフォントによる処理時間の遅延が低減されるようになり、アウトラインフォントが好まれて利用される場面がふえている。
【０００４】
単なる情報を伝達するためであれば、ゴシック体や明朝体などのフォントが典型的に用いられる。例えば事務書類では、フォントを工夫することによる美観性は重視されず、情報の伝達を主目的とするため、ゴシック体や明朝体などのフォントで文書を作成することが一般に行われている。一方で、年賀状や挨拶状などのフォーマルな文書や、知人に宛てる手紙などでは、毛筆体のフォントが用いられることが多い。毛筆体の書体は、力強く、またときに爽やかな雰囲気を醸しだす。このように、状況に応じて適切なフォントを選択することで、文章の内容だけでなく、その文章全体から文書作成者の意図を読み手に伝えようとしている。
【０００５】
このようなフォントを工夫する技術として、例えば特許文献１に開示されるように、手書きの文字フォントで個性を表現するものや、特許文献２、３に開示されるように、フォントの濃淡を調整するものなどが提案されている。
【特許文献１】特開２００２−２９７１１５号公報
【特許文献２】特開平５−２３８０６６号公報
【特許文献３】特開２００４−６１９０９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００６】
古来より長らく文字は毛筆で書かれていたが、現在では毛筆を使う人は少なく、特に若者にいたっては皆無という状況にある。さらに万年筆についてみると、毛筆よりもさらに使用される機会が少なくなっており、万年筆の文化自体が廃れつつある現状がある。万年筆や毛筆による文字は、手のぬくもりを相手に伝えることができ、手書きならではの味わいを醸し出す。例えば、墨やインクのかすれ、にじみなどを見て、読み手は書き手の心理状態を想像し、思いを巡らすこともある。これは、一つの日本文化である。
【０００７】
上記したように、毛筆フォントを提供するワープロソフトは従来から存在するが、明朝体やゴシック体などの他のフォントと同様に、一つ一つの文字に同じ大きさのフォントデータが用意されているにすぎない。そのため、明朝体やゴシック体などの典型的なフォントに比べて、文字単体による美観を構成することはできるが、それらの文字は、決められた大きさのマスにそれぞれ画一的に表現されるため、文章全体として見た場合の美観性は乏しいといえる。文章を手書きする場合、文字の大きさは全てが同じになることはなく、また正確に直線的に並ぶものでもない。手書きの文書には抑揚があり、全てが画一的に統一されたものでもなく、それらのある種雑然とした視覚効果により、手書き感が発生するということが言える。
【０００８】
そこで本発明は、手書きの雰囲気を醸し出す文字処理装置を提供することを目的とする。
【課題を解決するための手段】
【０００９】
上記課題を解決するために、本発明のある態様の文字処理装置は、ユーザからの文字入力を受け付ける受付部と、入力された文字列における単語の品詞を解析する解析部と、フォントデータを格納する格納部と、解析された単語の品詞に応じて、入力された文字に、格納部に格納されたフォントデータを割り当てる割当部とを備える。
【００１０】
この態様によると、品詞に応じて入力された文字にフォントデータを割り当てることで、同一の文字であっても、その使われ方によって異なるフォントデータを使用することができる。これにより、この態様の文字処理装置は、作成する文書の手書き感を向上することができる。
【００１１】
格納部は、１つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持してもよい。また格納部は、所定の文字列を表現したフォントデータを保持してもよい。さらに格納部は、フォントデータを画像データとして保持してもよい。
【００１２】
本態様の文字処理装置は、仮想的な基準線を設定し、その基準線を基準として受付部において受け付けた文字の位置を決定する配置部をさらに備えてもよい。また前後に続く単語の品詞の関係から、その単語間の間隔を決定する配置部をさらに備えてもよい。
【００１３】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【００１４】
本発明によれば、手書きの雰囲気を醸し出すことのできる文字処理装置を提供することができる。
【発明を実施するための最良の形態】
【００１５】
図１は、本発明の実施例にかかる文字処理装置の構成を示す。文字処理装置１０は、入力受付部２０、前処理部２２、文字列解析部２４、割当部２６、配置部２８、表示変換処理部３０、選択部３２および格納部４０を備える。格納部４０は、辞書データ格納部４２およびフォントデータ格納部４４を有する。本実施例の文字処理装置１０は、ワードプロセッサないしはワードプロセッサ用のソフトウエアを組み込んだコンピュータであり、ユーザより入力された文字の表示態様を、その文字が属する単語の品詞に応じて変化させる機能をもつ。
【００１６】
本実施例における文字処理装置１０の文字処理機能は、ＣＰＵ、メモリ、メモリにロードされたプログラムなどによって実現され、ここではそれらの連携によって実現される機能ブロックを描いている。プログラムは、文字処理装置１０に内蔵されていてもよく、また記録媒体に格納された形態で外部から供給されるものであってもよい。また、ネットワークを介して外部から供給される形態をとってもよい。例えば、図１に示す機能ブロックを実行するソフトウェアの形態で文字処理機能が実現されてもよい。このとき、例えば本実施例の文字処理機能を実現する製品は、ワードプロセッサ用のソフトウエアとなる。したがってこれらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者に理解されるところである。
【００１７】
文字処理装置１０は、例えばコンピュータ上でワープロソフトを起動することで実現される。入力受付部２０は、ユーザからの入力を受け付ける。ユーザは、例えばキーボードやマウスなどの入力インタフェースを利用して入力を行う。本実施例のワープロソフトを起動すると、モニタには、例えば複数のフォントタイプの選択画面が表示される。
【００１８】
複数種類のフォントタイプは、男性用と女性用に分けて作成されてもよい。一般に男性と女性の筆圧は異なり、手書きされた文字をみると、書き手が男性であるか、または女性であるかの判断がつくことが多い。「書は人を表す」とはよくいわれるが、手書き文字は、人の性別のみならず、内面の性格的な要素も表す。筆使いに心が表れるということは、筆をもったことのある人であれば容易に理解ができるであろう。本実施例の文字処理装置１０は、コンピュータ上での入力でありながら、あたかも手書きしたかのような文章を出力できる。そのため、本実施例のフォントデータ格納部４４は、ユーザの選択肢を広げるために、様々な種類の万年筆フォントタイプを用意する。なお、本実施例の文字処理装置１０は、万年筆書体だけでなく、毛筆書体やその他の書体を用意してもよい。
【００１９】
ユーザは、モニタに表示されるフォントタイプの選択画面をみて、入力インタフェースを用いて、いずれか気に入ったフォントタイプを選択する。例えば、選択画面には、フォントタイプ選択用のボタンが複数用意され、いずれかのボタンを選択することで、フォントタイプの選択指示がなされる。入力受付部２０が、ユーザのフォントタイプ選択指示を受け付けると、選択部３２が、フォントデータ格納部４４に格納された複数のフォントファイルの中から、使用するフォントファイルを選択する。フォントファイルは、フォントタイプのフォントデータを保持したファイルであり、フォントタイプの数だけ存在する。フォントタイプのそれぞれは、例えば力強い書体、線の細い書体、かすれの多い書体、躍動感のある書体など、何らかの主題を有し、対応するフォントファイルは、その主題に沿ったフォントデータを有するように作成される。
【００２０】
これらの書体は、それぞれ書体の作成時に、実際に万年筆を用いて手書きした文字をスキャナで読み取ることで作成されてもよい。このとき、フォントタイプをユーザに対して表現するものは、フォントデータのモデルとなった人の名前であってもよく、万年筆や筆などの筆記具の名称、または上記したようにフォントタイプの主題であってもよい。なお、複数種類のフォントファイルをデフォルトとして用意しておき、さらにユーザ自身が、自分で手書きしたフォントデータを、フォントファイルとして作成できるようにしてもよい。また、デフォルトで用意されたフォントファイルに、ユーザが手書きして作成したフォントデータを組み込めるようにしてもよい。フォントデータ格納部４４は、フォントデータを画像データとして格納している。なお、フォントデータ格納部４４は、少なくとも全てのひらがな文字の画像データを一文字ずつ保持する。印刷技術の進歩により、家庭用のプリンタでも細かな濃淡まで再現可能になった。万年筆で書かれた手書き文字を高解像度でスキャンした画像データをフォントデータとすることで、印刷して得られる書面は万年筆の濃淡やかすれ具合までを再現したものになる。以上のように、本実施例では、フォントデータが、画像データとして用意されているものとするが、例えばフォントデータは、従来のようにアウトラインフォントないしはビットマップフォントとして用意することも可能であり、また関数として表現することも可能である。また、フォントデータは、アウトラインフォントを特定する情報と文字サイズや文字修飾の種類を特定する情報の組み合わせとして用意してもよい。
【００２１】
選択部３２がフォントタイプを選択すると、以降の処理においては、選択されたフォントタイプのフォントデータのみが利用されることになる。なお、文章の入力途中でフォントタイプを変更することを可能としてもよいが、この場合には、複数の人間が協同して一つの文書を手書きしたような印象を与えることになる。
【００２２】
フォントデータ格納部４４は、１つのフォントタイプにおいて、同一の文字につき、複数のフォントデータを保持する。例えば、ひらがなの「の」について、サイズの大きいものと、サイズの小さいものを用意する。もちろんサイズの違いだけでなく、横長のフォントデータや、縦長のフォントデータなど、上下左右の比率が異なるものを用意してもよい。なお、フォントデータ格納部４４は、全ての文字について複数のフォントデータを保持する必要はなく、少なくとも一部の文字について複数のフォントデータを保持していればよい。
【００２３】
またフォントデータ格納部４４は、所定の文字列を表現したフォントデータを保持する。例えば、「ぼんやり」という文字列を出力する場合、フォントデータ格納部４４は、「ぼ」、「ん」、「や」、「り」をそれぞれ一文字の画像データとして保持しているが、一文字の画像データとは別に、文字列「ぼんやり」を一つの画像データとして保持してもよい。これにより、文字処理装置１０では、４つの画像データを配列して文字列「ぼんやり」を出力できるだけでなく、１つの画像データで文字列「ぼんやり」を出力することもできる。
【００２４】
フォントデータ格納部４４のデータ量を削減するため、一つの画像データで表現する所定の文字列は、一続きの文字列として多用されるものに限定することが好ましい。人が文章を書くとき、一つの単語は、一気に書き上げられる傾向がある。一気に書き上げる文字列は、文字同士が繋がり、読み手からみても、繋がった文字は一つの意味を構成することが推測できる。このような効果を実現するために、複数の文字から構成される所定の文字列については、フォントデータ格納部４４が、文字同士を繋げて表現したフォントデータを保持することが好ましい。
【００２５】
フォントタイプが選択された後、前処理部２２は、モニタに文字の入力画面を表示する。入力画面は、既存のワープロソフトで見られるようなものであってよく、画面中の入力位置にカーソルが点滅して、ユーザが文字入力をすると、カーソルが行方向に動くとともに、そのカーソルの点滅箇所から入力文字が表示される。
【００２６】
入力受付部２０は、ユーザから文字入力を受け付け、前処理部２２は、画面中に入力された文字をひらがなで表示する。このとき、前処理部２２は、フォントデータ格納部４４において選択されたフォントファイルを用いるのではなく、例えば明朝体などのフォントデータを用いて入力された文字を表示してもよい。入力された文字は、文字処理装置１０の入力インターフェースとして設けられた変換キーが押下されると、フォントデータ格納部４４の対応するフォントデータに変換される。この処理は、基本的には、既存のワープロソフトにおける処理と同様である。したがって、変換キーをユーザが押すまでは、未変換の状態で、入力されたひらがなが画面上の行に並べられていく。
【００２７】
図２は、ユーザより入力されて、前処理部２２により画面に表示された例を示す。入力受付部２０が、ユーザから「のんびりとしためざめ。」とかな入力を受け付け、前処理部２２が画面に文字列を表示させる。図２では、明朝体のフォントで文字が表示されている。なお、文章の横に付した点線は、入力文字が変換前であることを示している。
【００２８】
なお、図２では明朝体のフォントで文字を表示しているが、フォントデータ格納部４４に格納されたひらがなのフォントデータで文字を画面を表示してもよい。明朝体で表示させているのは、データの処理量を軽くするためであり、文字処理装置１０がハイスペックなハードウエアで構成されていれば、フォントデータ格納部４４に格納された文字の画像データ（フォントデータ）を用いて、画面の表示を行ってもよい。
【００２９】
ユーザが、キーボード上の変換ボタンを押下すると、入力受付部２０が、その押下を受け付け、文字列解析部２４が、自然言語で書かれた文を形態素の列に分割する形態素解析を行う。具体的に、文字列解析部２４は、単語の境界を判別する「わかち書き」処理を行い、品詞を解析する。まずわかち書き処理により、入力文字列「のんびりとしためざめ」は、「のんびり」、「と」、「し」、「た」、「めざめ」、「。」の単語に分けられる。なお、本実施例では、句読点も単語の一つとしてわかち書き処理している。
【００３０】
文字列解析部２４は、入力された複数文字からなる文字列における品詞を解析する。わかち書き処理と品詞の解析は、同時に実行されてもよい。つまり、わかち書き処理が行われた際に、分割された単語に対して品詞を割り当てる処理が行われてもよい。形態素解析は、単語を文法的な機能や形態などにより分類することで実行される。品詞の分類法としては、形態的な分類法、意味的な分類法、統語的な分類法などが考えられており、本実施例において形態素解析は、既存の文法解析アルゴリズムを利用することで行われてもよい。
【００３１】
文字列解析部２４の解析機能を実現するために、辞書データ格納部４２は、日本語文法の知識と品詞付きの単語リストを保持した辞書データを格納する。さらに辞書データ格納部４２は、読み（かな）と漢字との変換対応表を保持する。文字列解析部２４は、単語の品詞を求め、さらに辞書データ格納部４２に格納された辞書および変換対応表を参照して、ひらがな文を漢字仮名混じり文に変換する。この例では、かな文字列「めざめ」を、「目ざめ」に変換する。
【００３２】
図３は、文字列解析部２４による品詞解析結果を示す。「のんびりとしためざめ。」を品詞解析すると、わかち書き処理された単語が、それぞれ対応する品詞に分けられる。
【００３３】
図４は、従来のフォントタイプの一つである明朝体で記述した例文を示す。この例文は、従来のワープロソフトにより文字処理したものである。一般に、明朝体はビジネス文書など、フォーマルな堅い文書に使われることが多い。従来のワープロソフトでは、全ての文字が同じ大きさで出力され、また一文字が決められたマス内に出力されて、文字間隔が等しく設定されている。
【００３４】
図５は、図４に示した例文を従来のフォントタイプの一つである毛筆の楷書体で記述したものを示す。毛筆体のフォントで文字を記述すると、明朝体やゴシック体よりも柔らかい雰囲気を醸し出すことができる。しかしながら、全ての文字が同じ大きさで出力され、また文字間隔が等しく設定される点は、明朝体などの出力と同じである。
【００３５】
図４および図５に示したように、従来のフォントタイプで文字出力すると、文字の大きさおよび文字間隔が全て等しいために、書き手の思いが読み手に伝わりにくい。毛筆体の場合には、明朝体などよりも若干雰囲気を和らげる効果は確かにあるが、それでもなお、単なる文字の羅列としか捉えられないことは否めない。そこで、本実施例の文字処理装置１０では、手書き文章であるような雰囲気をだすことのできる文字処理機能を提供する。
【００３６】
図１に戻って、割当部２６が、文字列解析部２４において解析された単語の品詞に応じて、フォントデータ格納部４４に格納されたフォントデータを当該単語に割り当てる。フォントデータ格納部４４は、１つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持する。例えば、ひらがな文字「の」に対して、複数のフォントデータを画像データとして保持する。
【００３７】
図６は、フォントデータ格納部４４が格納するフォントデータの一例を示す。ここでは、フォントデータ格納部４４が、同一文字「の」に関して、複数のフォントデータを保持している状態を示す。なお、フォントデータ格納部４４は、全ての文字について複数のフォントデータを保持する必要はなく、少なくとも特定の文字についてのみ複数のフォントデータを保持していればよい。なお、ハードディスク等のハードウエアの性能に余裕があれば、全ての文字について複数のフォントデータを保持しておき、それらのフォントデータを使い分けて、文章の統一感をあえて崩すことで、手書きの雰囲気を一層醸し出すことができる。
【００３８】
フォントデータ格納部４４は、フォントデータを、その文字が含まれる単語の品詞に対応付けて格納する。単語が一文字で構成される場合には、対応付けを行う品詞は、その文字自体で表現される単語の品詞を示し、単語が複数文字で構成される場合、対応付けを行う品詞は、その文字が含まれる単語の品詞を示す。例えば、単語「のんびり」は副詞であるが、割当部２６は、単語「のんびり」に含まれる「の」に対して、副詞に対応付けて記憶されているフォントデータを割り当てることになる。
【００３９】
図中、フォントデータとして、画面に表示するための表示データと、印刷用の印刷データの２種類を設定している。図６の例では、表示データおよび印刷データが同一の画像データで構成されているが、これらは異なるものであってもよい。印刷の解像度は一般に画面に表示する解像度よりも高いため、例えば印刷用のフォントデータを、表示用のフォントデータよりも解像度の高い画像データで作成してもよい。また、表示データおよび印刷データを別個のものとして用意しない場合には、１つのフォントデータのみ用意すればよい。
【００４０】
本実施例において、フォントデータ格納部４４は、選択されたフォントタイプにおいて、文字「の」に対して、大きいフォントデータと小さいフォントデータを保持している。大きいフォントデータは、動詞、形容詞、名詞、連体詞、副詞、接続詞に対応付けられている。また、小さいフォントデータは、助詞、助動詞に対応付けられている。このように本実施例では、２種類のフォントデータを、自立語または付属語の一方に対応付けている。自立語とは、単独で文節を構成できる品詞であり、また付属語とは、単独で文節を構成できない品詞である。自立語および付属語は、さらに活用の有無によって分類することができ、活用の有無に応じて別のフォントデータを対応付けてもよい。
【００４１】
本実施例では、文字処理に関するいくつかのポリシーをもとに、フォントデータと品詞とを対応づける。例えば、自立語は文章において重要な役割を果たすというポリシーのもとで、自立語、すなわち動詞、形容詞、名詞、連体詞、副詞、接続詞などの品詞に含まれる文字は、大きなフォントデータで表現する。一方で、付属語は文章において相対的に重要な役割を果たさないというポリシーのもとで、付属語、すなわち助詞、助動詞などの品詞に含まれる文字は、小さなフォントデータで表現する。フォントデータの割当て方法は、品詞に応じてさらに細分化されてもよい。例えば、活用の有無に応じて、フォントデータの割当てが設定されてもよい。さらに、品詞ごとに複数（３種類以上）のフォントデータを用意して、フォントデータの割当てが設定されてもよい。
【００４２】
また図６において、データ項目「配置位置」では、フォントデータの行中の配置位置が設定される。本実施例の文字処理装置１０において、文章は、画面中ないしは印刷紙中に設定された行に入力される。本実施例では、文字を配列するための行が、表示されるか否かは問わず設定されており、縦書きの場合には縦方向の行に、また横書きの場合には横方向の行に、文字が並んで配置される。配置位置が「中央」に設定されている場合、その文字は、行中の中央に配置される。また行の中心から左右方向のいずれかに寄らせて配置する場合には、配置位置が「右２０％」、「左１５％」と設定される。ここで、％は、行中心から右端または左端に対するずれ量を示し、例えば右５０％であれば、行中心線と右端の真ん中に配置位置がくることになる。
【００４３】
割当部２６は、フォントデータ格納部４４に格納したフォントファイルを参照して、入力された文字に対してフォントデータを割り当てる。例えば、図３に示した品詞解析結果を参照すると、単語「のんびり」の品詞は副詞であるため、割当部２６は、「のんびり」における「の」に対しては、図６に示す大小のフォントデータのうち、大きな方の「の」を割り当てることになる。
【００４４】
図７は、文字列解析部２４による品詞解析結果を示す。図４ないしは図５の３行目に示した「頭の隅の方でぼんやりと思う朝の目ざめ。」を品詞解析すると、わかち書き処理された単語の品詞が設定される。
【００４５】
例文の３行目には、３つの「の」が登場するが、それぞれ品詞は助詞である。したがって、割当部２６は、フォントデータ格納部４４に格納したフォントファイルを参照して、この３つの「の」に対しては、図６に示すフォントデータのうち、小さな方の「の」を割り当てる。以上のように、割当部２６は、解析された単語の品詞に応じてフォントデータを割り当て、同一文字であっても品詞に応じて文字の形を異ならせることができる。
【００４６】
配置部２８は、割当部２６において割り当てられたフォントデータの配置位置を決定する。このとき、配置部２８は、図６に示すフォントファイルの「配置位置」のデータ項目を参照して、文字の配置位置を決定する。フォントファイルにおいて、「配置位置」を行中心だけでなく、行の左右方向にふれる位置に設定しておくことで、全ての文字が整然として配置されるのではなく左右方向にばらけて配置されることで、手書きの雰囲気をもった文章を作成することができる。
【００４７】
配置部２８は、仮想的な基準線を設定し、その基準線を基準として文字の位置を決定してもよい。
図８は、行中に設定される仮想的な基準線を示す。図８において、行は２本の実線で囲まれる領域であり、行中に設定する基準線を点線で示す。図８の例では、基準線は、行の中心線として直線の形態をとる。
【００４８】
配置部２８は、この基準線を基準として、文字の位置を決定する。配置部２８は、配置する文字の重心位置が基準線上にくるように、文字を配置する。文字の重心位置は、予め求められており、フォントデータの属性としてフォントデータ格納部４４に格納されていることが好ましい。重心位置の求め方には様々なものが考えられるが、最も簡単には、上下左右の長さから中心位置を算出することで、重心位置としてもよい。さらに、線要素の太さを考慮し、濃度分布の中心点を探ることで、重心位置を求めてもよい。このとき、重心位置は、見た目の中心位置となるように求められることが好ましい。このように、重心位置の求め方としては、様々な手法を利用することが可能であり、本実施例では、公知の重心位置の探索手法を利用して、重心位置を予め設定しておく。
【００４９】
配置部２８が基準線上にフォントデータの重心位置を配置することで、文字列の基本的なラインを設定することができる。なお、この基準線に対して、フォントファイルにおいて設定された配置位置を適用してもよい。これにより、基準線に対して、文字の配置を左右方向にばらけさせることが可能となる。
【００５０】
配置部２８は、一つの単語における文字間隔を所定値に設定する。この所定値は、複数文字が一塊の集合であることを示すために、例えば０ｍｍや０．１ｍｍなどの小さい間隔が設定される。一方、配置部２８は、単語間の区切りにおいては、単語同士の間隔を設定する。これにより、行内における文字の位置が決定されることになる。具体的に配置部２８は、前後の単語の品詞に応じて、その間隔を設定する。
【００５１】
例えば、動詞や助動詞の次に名詞が続く場合、名詞の前の文字列は、名詞を修飾することが多い。そのため、動詞ないしは助動詞と名詞の間隔を広げて、名詞の前の文字列が名詞の修飾語であることを示すようにする。例えば、このときの単語間の区切りは、０．５ｍｍなどの比較的大きい所定値に設定する。なお、この場合の単語間の間隔は、単語内の文字間隔よりも広い値に設定されることが好ましい。
【００５２】
助動詞と名詞が続く例は、図４および図５に示す例文の１行目における「のんびりとした」と、「目ざめ」の区切りに相当する。同様に、助詞の次に副詞が続く場合、副詞の前の文字列は、その後の文字列と意味がきれることが多い。これは、例文の２行目における「まぶたは」と、「まだ」の区切りに相当する。助詞の次に名詞が続く場合も同様である。これは、例文の３行目の「隅の方で」、「ぼんやり」の区切りに相当する。なお、このような特別の関係にある場合には、単語同士の間隔を、広い値に設定し、それ以外の単語同士の区切りは、それよりも狭い値に設定する。単語同士の間隔を広げるための前後の品詞の条件は、配置部２８が予め保持しておく。このように単語同士の間隔を設定することで、読み手は意味をとりやすくなり、また手書き感を向上することができる。
【００５３】
なお、単語同士の間隔を広げるための前後の品詞の条件を設定した場合、この条件が満足されると常に単語間隔を広げてもよいが、ランダムにこの決定がなされてもよい。例えば、単語間隔を広げるか否かの確率を予め設定しておき、条件が満足された場合に、この確率で抽選を行うことで、単語間隔を広げるか否かの判定を行ってもよい。
【００５４】
なお、単語間隔を広げる場合、隣の文章と比較して、単語間隔の広いところが著しく多かったり、または少なかったりすると、見た目上好ましくない場合もある。そのため、例えば、配置部２８は、所定の文字数のうち、単語間隔を広げる箇所の上限を有していてもよい。例えば、１５文字のうちで、６箇所に単語間隔の広いところがあると、全体として間延びした印象を与えることも考えられる。そのため、１５文字のうちで単語間隔を５箇所以下とするように、配置部２８が、上限を定めてもよい。間隔を広げる上限を満たす箇所が６箇所以上ある場合には、その６箇所につき抽選等を行うことで、５箇所以内に収めるようにする。本実施例の文字処理機能によると、文字が同一の大きさに構成されているわけではないため、例えば文字数をみるのではなく、文字列の長さで判断してもよい。
【００５５】
表示変換処理部３０は、配置部２８において配置位置を決定された文字を、画面中に配置する。これにより、画面中の表示を、万年筆フォントの文字に変換することができる。なお、画面に表示する場合には、割当部２６により表示データが割り当てられ、印刷する場合には、印刷データが割り当てられることになる。
【００５６】
図９は、文字処理装置１０により文字処理されて画面に表示される例文を示す。本実施例の文字処理装置１０によると、品詞に応じて文字のフォントデータを変化させることにより、全ての文字が無機質に並べられるのではなく、手書き感を醸し出した出力を得ることができる。１行目の「の」と、３行目の「の」を比較すると、１行目の「の」の方が、３行目の「の」よりも大きく表示されていることが分かる。また、全ての文字が中心線にしたがって配置されているわけではなく、文字によっては、左右方向にぶれた位置に配置されていることが分かる。なお、実施例では、特に文字「の」について説明したが、他の文字についても同様であり、様々な文字について複数のフォントデータを用意することで、画一的な文章スタイルではなく、気持ちのこもった文章を自動的に作成することが可能となる。
【００５７】
図１０は、行中に設定される仮想的な基準線の別の例を示す。図１０において、行は２本の実線で囲まれた領域であり、行中に設定する基準線が点線で示される。図示されるように、基準線は、行内において波線として設定されている。
【００５８】
一般に、人が文章を書くとき、一直線に文字を並べて書くことは稀であり、曲がったり、傾いたりすることが多い。例えば、便箋に行を示す２本の直線が引かれている場合であっても、人は書くことに関して何らかの癖を持っていることが常であるため、縦書きの場合には文章が右よりになったり、また横書きの場合には文章が右上がりになったりする。例えば、人が文字を書く姿勢であったり、筆の持ち方であったり、そういったものが影響を与えて、結果として味のある文書が作成されるのである。本発明者は、この点に注目し、単に文字を直線的に並べるのではなく、何らかのリズムをつけて文字を並べることで、手書き感の向上を図ることにした。
【００５９】
配置部２８が、それぞれの文字の重心位置を、図１０に示す波線の基準線に重なるように文字の配置位置を決定することで、文字が適度に左右方向に散らばった文章を作成できる。これにより、整然と文字が配列された文章ではなく、手書きで作成した文書のように、ある意味、雑然とした雰囲気を出すことができ、手書き感を向上できる。なお、基準線は、波線だけでなく、例えば行の右上から左下に結ぶような直線であってもよい。この場合には、右側に傾いた文章が作成されることになる。以上は縦書きの場合であるが、横書きの場合であっても同様である。このように、中心線とは異なる直線ないしは曲線を基準線として設定し、各文字の重心位置が基準線上にくるように文字の配置位置を決定することで、手書き感の高い文章を作成できる。
【００６０】
図１１は、フォントデータ格納部４４が格納するフォントデータの別の例を示す。ここでは、フォントデータ格納部４４が、複数文字からなる所定の文字列に関して、フォントデータを保持している状態を示す。所定の文字列は、一つの品詞から構成される単語だけでなく、複数の品詞から構成されるものであってもよい。図１１に示す例において、文字列「ぼんやり」は一つの名詞であるが、文字列「とした」は、助詞「と」、動詞「し」、助動詞「た」の３つの品詞から構成されている。フォントデータ格納部４４は、例えば文章に頻出する文字列を予め一つのフォントデータとして保持しておく。
【００６１】
手書きの文章において、頻出する文字列は、続け字として書かれることが多い。これは、よく書くことで、筆の走りを手が覚えていることにも一因がある。また、文字の書き始め位置と書き終わり位置との関係から、続け字として書きやすい文字列もある。このような文字列は、走り書きされて、文字が続けて書かれることになる。そこで、フォントデータ格納部４４が、所定の文字列を、続け字として作成したフォントデータとして保持して、割当部２６が、このフォントデータを、入力された文字列に割り当てることで、筆の勢いを感じさせる文章を作成できる。図１１のフォントファイルの例では、ひらがなの文字列のみを示しているが、当然のことながら、漢字の文字列、およびかな漢字混在文字列であってもよい。図９に示した例文では、この文字列のフォントデータが割り当てられている。
【００６２】
なお、文字列のフォントデータは、続け字に限定するものではない。フォントデータ格納部４４の格納するデータ量に配慮した場合には、文字列のフォントデータの数を制限することが好ましいが、フォントデータ格納部４４の記憶容量が大きければ、文字列のフォントデータを数多く持たせてもよい。この場合には、一般の単語について、文字列のフォントデータを作成してもよい。なお、フォントデータ格納部４４は、ひらがなの文字データについては全て保持しているため、ある単語の文字列が保持されていない場合であっても、その単語を少なくともひらがなで表現することは可能である。
【００６３】
文字列のフォントデータには、選択するための重みが設定されていてもよい。例えば、名詞「めざめ」に対して、フォントデータとして、「めざめ」、「目ざめ」、「目覚め」の３種類が用意されている場合を想定する。３種類のフォントデータのうち、「目ざめ、「目覚め」、「めざめ」の順に重み付けがされている場合、割当部２６は、単語「めざめ」に対して、重みの高い「目ざめ」を優先的に割り当てる。この重みは、割当ての優先順位として設定されていてもよい。優先順位は、より味わい深いフォントデータの順に設定されることが好ましい。優先順位は、フォント作成者ないしは文字処理装置１０の文字処理機能の作成者（例えば、ソフトウェアの作成者）によりデフォルトで設定される。なお、ユーザには、選択肢が提示され、ユーザが他のフォントデータを選択する場合には、そのフォントデータが割り当てられることになる。このとき、デフォルト設定した優先順位が変化し、選択したフォントデータの優先順位が１番になることが好ましい。このように、フォントデータの優先順位を可変とすることで、ユーザの好みを反映したフォントデータの割当てが可能となる。
【００６４】
またフォントデータ格納部４４は、文字毎に「流れ具合」、「にじみ具合」、「かすれ具合」をそれぞれ段階的に表現したフォントデータを保持し、割当部２６は、それらを予め決められた比率に応じて選択してもよい。
【００６５】
図１２は、本実施例における文字処理を実現するフローチャートである。この文字処理フローでは、フォントデータ格納部４４のフォントタイプが選択されていることを前提とする。入力受付部２０が、ユーザから文字入力を受け付ける（Ｓ１０）。複数文字を入力した状態でユーザが変換キーを押下すると、入力受付部２０が、その変換指示を受け付ける（Ｓ１２）。文字列解析部２４は、入力された文字列における単語の品詞を形態素解析し（Ｓ１４）、かな漢字変換処理を行う（Ｓ１６）。なお、形態素解析およびかな漢字変換処理は、文字処理装置１０の内部処理として実行され、この時点では、その処理結果は画面中には表れていない。
【００６６】
入力された文字列において、割当部２６は、所定の文字列が存在するか否かを判定する（Ｓ１８）。この所定の文字列とは、フォントデータ格納部４４のフォントデータとして登録されている文字列である。所定の文字列が存在する場合（Ｓ１８のＹ）、割当部２６は、その文字列に対して、フォントデータ格納部４４に保持されている文字列フォントデータを割り当てる（Ｓ２０）。一方で、所定の文字列に含まれない文字については（Ｓ１８のＮ）、割当部２６が、形態素解析により解析された品詞に基づいて、入力文字に文字フォントデータを割り当てる（Ｓ２２）。
【００６７】
続いて、配置部２８が、文字を配置する位置を決定する（Ｓ２４）。全ての文字の位置が決定されると、表示変換処理部３０が、割り当てられたフォントデータを、決定された位置に配置し（Ｓ２６）、手書き感の高い文書を生成する。
【００６８】
図１３は、図１２のＳ２４に示す文字位置決定処理のフローチャートである。まず、配置部２８は、文字列における前後の単語の品詞を取得する（Ｓ３０）。前後の単語の品詞に所定の関係がある場合（Ｓ３２のＹ）、配置部２８は、単語間隔を広く設定する（Ｓ３４）。一方、前後の単語の品詞に所定の関係がない場合（Ｓ３２のＮ）、単語間隔を狭く設定する（Ｓ３６）。なお、単語内における文字間隔は固定値として予め設定されていてもよい。さらに配置部２８は、フォントデータ格納部４４のフォントファイルに含まれる配置位置データを読み出し（Ｓ３８）、行内に設定した基準線を用いて、文字の位置を決定する（Ｓ４０）。具体的には、基準線上に各文字の重心位置が重なるように文字の位置を仮決めし、さらに仮決めされた位置から、配置位置データで示される方向にフォントデータを移動する。例えば、配置位置データが「中央」と設定されている文字については、フォントデータの仮決め位置で確定することになり、配置位置データが「右１０％」と設定されている文字については、フォントデータの重心位置を、行の半分の幅の１０％分だけ右にずらされることになる。以上のようにして、文字の位置が決定される。
【００６９】
以上、本発明を実施例をもとに説明した。これらの実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【００７０】
本実施例においては、図２に示すように、入力した一文をまとめて文字処理する場合について説明したが、一文より短い文節を単位として文字処理することも可能である。文字処理は、ユーザが変換キーを押下することを実行のトリガとし、したがって入力受付部２０が変換指示を受け付けたタイミングで、入力された文字列に関して文字処理が実行される。
【００７１】
配置部２８は、前後の単語の品詞の関係をもとに、単語同士の間隔を決定するが、間隔を決定する際には、既に文字処理された直前の単語との関係を考慮する。既に文字処理された単語の品詞も参照することで、配置部２８は、単語同士の間隔を適切に設定することができる。
【００７２】
また割当部２６は、フォントデータの拡大・縮小を行って、フォントデータの割当て処理を行ってもよい。フォントデータの拡大・縮小機能をもつことで、拡大したフォントデータ、縮小したフォントデータをフォントデータ格納部４４にあらためて持たせる必要がなくなる。
【００７３】
また、全ての文字処理が終了すると、文書が完成することになるが、割当部２６は、その時点で、フォントデータの割当て処理を再実行してもよい。例えば、割当て処理を再実行するための指示がユーザより入力され、その指示を受けて割当部２６が、フォントデータの割当て処理を実行する。このとき、例えば、予めデフォルトとして設定された優先順位の低いフォントデータが割り当てられている場合、そのフォントデータを、より優先順位の高いものに変更できる可能性をユーザに示唆してもよい。例えば、その文字の色を変えて表示などすることで、ユーザに対する示唆を行うことができる。
【００７４】
また、全ての文字処理が終了したとき、文字列解析部２４が、再度、品詞解析処理を行ってもよい。これは、品詞解析処理を再実行するための指示がユーザより入力され、その指示を受けて文字列解析部２４が、文字列を解析する。
【００７５】
また、実施例では主として文字について説明したが、配置部２８は、さらに句読点や括弧などの記号の位置を設定する機能をもつ。配置部２８は、例えば記号の位置を、左右方向のランダムな位置に配置してもよい。特に、句読点については、必ず右側に配置しなければならないものでもなく、中央付近や左側寄りに配置することで、手書き感を向上できる。
【００７６】
また、実施例ではユーザがフォントタイプを選択することとしたが、例えばフォントデータに、文字の雰囲気をアナログ的に評価した値が設定されており、ユーザがフォントタイプを選択するのではなく、そのアナログ評価の数値範囲を指定することで、フォントデータが文字割当の候補としてフォントデータ格納部４４から抽出されるものであってもよい。アナログ評価は、フォントの作成者ないしはソフトウエアの作成者によって行われ、この評価値をもとに、文字割当処理が実行されてもよい。
【００７７】
また本実施例の文字処理装置１０はスタンドアロン型の端末として説明したが、ネットワークを介したクライアントサーバ型のシステムとして構築されてもよい。この場合、ユーザは、クライアント端末から文章を入力して、サーバに送信し、サーバは、一括して、送信されてきた文章の文字処理を行う。この文字処理機能は、上述したものに相当する。これにより、クライアント端末は文字処理機能を有する必要はなくなる。この場合、サーバから、文字処理された結果物が送信され、クライアント端末は、それを画面に表示または印刷することが可能となる。
【図面の簡単な説明】
【００７８】
【図１】本発明の実施例にかかる文字処理装置の構成を示す図である。
【図２】ユーザより入力されて、前処理部により画面に表示された文字列の例を示す図である。
【図３】文字列解析部による品詞解析結果を示す図である。
【図４】従来のフォントタイプの一つである明朝体で記述した例文を示す図である。
【図５】図４に示した例文を従来のフォントタイプの一つである毛筆の楷書体で記述したものを示す図である。
【図６】フォントデータ格納部が格納するフォントデータの一例を示す図である。
【図７】文字列解析部による品詞解析結果を示す図である。
【図８】行中に設定される仮想的な基準線を示す図である。
【図９】文字処理装置により文字処理されて画面に表示される例文を示す図である。
【図１０】行中に設定される仮想的な基準線の別の例を示す図である。
【図１１】フォントデータ格納部が格納するフォントデータの別の例を示す図である。
【図１２】本実施例における文字処理を実現するフローチャートである。
【図１３】図１２のＳ２４に示す文字位置決定処理のフローチャートである。
【符号の説明】
【００７９】
１０・・・文字処理装置、２０・・・入力受付部、２２・・・前処理部、２４・・・文字列解析部、２６・・・割当部、２８・・・配置部、３０・・・表示変換処理部、３２・・・選択部、４０・・・格納部、４２・・・辞書データ格納部、４４・・・フォントデータ格納部。

【特許請求の範囲】
【請求項１】
ユーザからの文字入力を受け付ける受付部と、
入力された文字列における単語の品詞を解析する解析部と、
フォントデータを格納する格納部と、
解析された単語の品詞に応じて、入力された文字に、前記格納部に格納されたフォントデータを割り当てる割当部と、
を備えることを特徴とする文字処理装置。
【請求項２】
前記格納部は、１つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持することを特徴とする請求項１に記載の文字処理装置。
【請求項３】
前記格納部は、所定の文字列を表現したフォントデータを保持することを特徴とする請求項１または２に記載の文字処理装置。
【請求項４】
前記格納部は、フォントデータを画像データとして保持することを特徴とする請求項１から３のいずれかに記載の文字処理装置。
【請求項５】
仮想的な基準線を設定し、その基準線を基準として前記受付部において受け付けた文字の位置を決定する配置部をさらに備えることを特徴とする請求項１から４のいずれかに記載の文字処理装置。
【請求項６】
前後に続く単語の品詞の関係から、その単語間の間隔を決定する配置部をさらに備えることを特徴とする請求項１から４のいずれかに記載の文字処理装置。

【図１】