説明

文字処理装置

【課題】 品詞に応じて割り当てるフォントデータを変化させる文字処理装置を提供する。
【解決手段】 本発明の文字処理装置10において、文字列解析部24は、入力された文字列における単語の品詞を解析する。フォントデータ格納部44は、品詞に対応付けてフォントデータを格納しており、割当部26は、解析された単語の品詞に応じて、入力された文字に、フォントデータを割り当てる。このフォントデータ格納部44は、同一の文字につき複数のフォントデータを保持して構成される。また、フォントデータ格納部44は、所定の文字列を表現したフォントデータを保持してもよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字を表現する文字処理装置に関し、特に手で書いたような文字を画面上や印刷紙上などに表現する文字処理装置に関する。
【背景技術】
【0002】
従来のワープロソフトには、様々な種類のフォントが組み込まれている。「フォント」とは、文字をコンピュータを使って表示したり印刷したりする際の文字の形であり、「書体」とも呼ばれる。ワープロソフトは、ゴシック体や明朝体など複数のフォントタイプを予め用意しておき、ユーザが文章の種類に応じてフォントを使い分けることで、文章の表現力を向上させることができる。
【0003】
フォントデータをコンピュータに持たせる代表的な手法として、文字の形を小さな正方形の点(ドット)の集まりとして表現するビットマップフォントと、基準となる点の座標と輪郭線の集まりとして表現するアウトラインフォントが存在する。これらは、表示処理または印刷処理の高速性を重視するか、または文字の美観性を重視するかにより、使い分けがなされる。例えばビットマップフォントは高速処理が可能である一方で、拡大・縮小すると文字の形が崩れてしまうという欠点がある。アウトラインフォントは、表示や印刷に時間がかかるが、いくら拡大・縮小しても美しい出力が可能である。近年では、コンピュータの処理速度の向上、およびプリンタの高解像度化にともなって、アウトラインフォントによる処理時間の遅延が低減されるようになり、アウトラインフォントが好まれて利用される場面がふえている。
【0004】
単なる情報を伝達するためであれば、ゴシック体や明朝体などのフォントが典型的に用いられる。例えば事務書類では、フォントを工夫することによる美観性は重視されず、情報の伝達を主目的とするため、ゴシック体や明朝体などのフォントで文書を作成することが一般に行われている。一方で、年賀状や挨拶状などのフォーマルな文書や、知人に宛てる手紙などでは、毛筆体のフォントが用いられることが多い。毛筆体の書体は、力強く、またときに爽やかな雰囲気を醸しだす。このように、状況に応じて適切なフォントを選択することで、文章の内容だけでなく、その文章全体から文書作成者の意図を読み手に伝えようとしている。
【0005】
このようなフォントを工夫する技術として、例えば特許文献1に開示されるように、手書きの文字フォントで個性を表現するものや、特許文献2、3に開示されるように、フォントの濃淡を調整するものなどが提案されている。
【特許文献1】特開2002−297115号公報
【特許文献2】特開平5−238066号公報
【特許文献3】特開2004−61909号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
古来より長らく文字は毛筆で書かれていたが、現在では毛筆を使う人は少なく、特に若者にいたっては皆無という状況にある。さらに万年筆についてみると、毛筆よりもさらに使用される機会が少なくなっており、万年筆の文化自体が廃れつつある現状がある。万年筆や毛筆による文字は、手のぬくもりを相手に伝えることができ、手書きならではの味わいを醸し出す。例えば、墨やインクのかすれ、にじみなどを見て、読み手は書き手の心理状態を想像し、思いを巡らすこともある。これは、一つの日本文化である。
【0007】
上記したように、毛筆フォントを提供するワープロソフトは従来から存在するが、明朝体やゴシック体などの他のフォントと同様に、一つ一つの文字に同じ大きさのフォントデータが用意されているにすぎない。そのため、明朝体やゴシック体などの典型的なフォントに比べて、文字単体による美観を構成することはできるが、それらの文字は、決められた大きさのマスにそれぞれ画一的に表現されるため、文章全体として見た場合の美観性は乏しいといえる。文章を手書きする場合、文字の大きさは全てが同じになることはなく、また正確に直線的に並ぶものでもない。手書きの文書には抑揚があり、全てが画一的に統一されたものでもなく、それらのある種雑然とした視覚効果により、手書き感が発生するということが言える。
【0008】
そこで本発明は、手書きの雰囲気を醸し出す文字処理装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明のある態様の文字処理装置は、ユーザからの文字入力を受け付ける受付部と、入力された文字列における単語の品詞を解析する解析部と、フォントデータを格納する格納部と、解析された単語の品詞に応じて、入力された文字に、格納部に格納されたフォントデータを割り当てる割当部とを備える。
【0010】
この態様によると、品詞に応じて入力された文字にフォントデータを割り当てることで、同一の文字であっても、その使われ方によって異なるフォントデータを使用することができる。これにより、この態様の文字処理装置は、作成する文書の手書き感を向上することができる。
【0011】
格納部は、1つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持してもよい。また格納部は、所定の文字列を表現したフォントデータを保持してもよい。さらに格納部は、フォントデータを画像データとして保持してもよい。
【0012】
本態様の文字処理装置は、仮想的な基準線を設定し、その基準線を基準として受付部において受け付けた文字の位置を決定する配置部をさらに備えてもよい。また前後に続く単語の品詞の関係から、その単語間の間隔を決定する配置部をさらに備えてもよい。
【0013】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0014】
本発明によれば、手書きの雰囲気を醸し出すことのできる文字処理装置を提供することができる。
【発明を実施するための最良の形態】
【0015】
図1は、本発明の実施例にかかる文字処理装置の構成を示す。文字処理装置10は、入力受付部20、前処理部22、文字列解析部24、割当部26、配置部28、表示変換処理部30、選択部32および格納部40を備える。格納部40は、辞書データ格納部42およびフォントデータ格納部44を有する。本実施例の文字処理装置10は、ワードプロセッサないしはワードプロセッサ用のソフトウエアを組み込んだコンピュータであり、ユーザより入力された文字の表示態様を、その文字が属する単語の品詞に応じて変化させる機能をもつ。
【0016】
本実施例における文字処理装置10の文字処理機能は、CPU、メモリ、メモリにロードされたプログラムなどによって実現され、ここではそれらの連携によって実現される機能ブロックを描いている。プログラムは、文字処理装置10に内蔵されていてもよく、また記録媒体に格納された形態で外部から供給されるものであってもよい。また、ネットワークを介して外部から供給される形態をとってもよい。例えば、図1に示す機能ブロックを実行するソフトウェアの形態で文字処理機能が実現されてもよい。このとき、例えば本実施例の文字処理機能を実現する製品は、ワードプロセッサ用のソフトウエアとなる。したがってこれらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者に理解されるところである。
【0017】
文字処理装置10は、例えばコンピュータ上でワープロソフトを起動することで実現される。入力受付部20は、ユーザからの入力を受け付ける。ユーザは、例えばキーボードやマウスなどの入力インタフェースを利用して入力を行う。本実施例のワープロソフトを起動すると、モニタには、例えば複数のフォントタイプの選択画面が表示される。
【0018】
複数種類のフォントタイプは、男性用と女性用に分けて作成されてもよい。一般に男性と女性の筆圧は異なり、手書きされた文字をみると、書き手が男性であるか、または女性であるかの判断がつくことが多い。「書は人を表す」とはよくいわれるが、手書き文字は、人の性別のみならず、内面の性格的な要素も表す。筆使いに心が表れるということは、筆をもったことのある人であれば容易に理解ができるであろう。本実施例の文字処理装置10は、コンピュータ上での入力でありながら、あたかも手書きしたかのような文章を出力できる。そのため、本実施例のフォントデータ格納部44は、ユーザの選択肢を広げるために、様々な種類の万年筆フォントタイプを用意する。なお、本実施例の文字処理装置10は、万年筆書体だけでなく、毛筆書体やその他の書体を用意してもよい。
【0019】
ユーザは、モニタに表示されるフォントタイプの選択画面をみて、入力インタフェースを用いて、いずれか気に入ったフォントタイプを選択する。例えば、選択画面には、フォントタイプ選択用のボタンが複数用意され、いずれかのボタンを選択することで、フォントタイプの選択指示がなされる。入力受付部20が、ユーザのフォントタイプ選択指示を受け付けると、選択部32が、フォントデータ格納部44に格納された複数のフォントファイルの中から、使用するフォントファイルを選択する。フォントファイルは、フォントタイプのフォントデータを保持したファイルであり、フォントタイプの数だけ存在する。フォントタイプのそれぞれは、例えば力強い書体、線の細い書体、かすれの多い書体、躍動感のある書体など、何らかの主題を有し、対応するフォントファイルは、その主題に沿ったフォントデータを有するように作成される。
【0020】
これらの書体は、それぞれ書体の作成時に、実際に万年筆を用いて手書きした文字をスキャナで読み取ることで作成されてもよい。このとき、フォントタイプをユーザに対して表現するものは、フォントデータのモデルとなった人の名前であってもよく、万年筆や筆などの筆記具の名称、または上記したようにフォントタイプの主題であってもよい。なお、複数種類のフォントファイルをデフォルトとして用意しておき、さらにユーザ自身が、自分で手書きしたフォントデータを、フォントファイルとして作成できるようにしてもよい。また、デフォルトで用意されたフォントファイルに、ユーザが手書きして作成したフォントデータを組み込めるようにしてもよい。フォントデータ格納部44は、フォントデータを画像データとして格納している。なお、フォントデータ格納部44は、少なくとも全てのひらがな文字の画像データを一文字ずつ保持する。印刷技術の進歩により、家庭用のプリンタでも細かな濃淡まで再現可能になった。万年筆で書かれた手書き文字を高解像度でスキャンした画像データをフォントデータとすることで、印刷して得られる書面は万年筆の濃淡やかすれ具合までを再現したものになる。以上のように、本実施例では、フォントデータが、画像データとして用意されているものとするが、例えばフォントデータは、従来のようにアウトラインフォントないしはビットマップフォントとして用意することも可能であり、また関数として表現することも可能である。また、フォントデータは、アウトラインフォントを特定する情報と文字サイズや文字修飾の種類を特定する情報の組み合わせとして用意してもよい。
【0021】
選択部32がフォントタイプを選択すると、以降の処理においては、選択されたフォントタイプのフォントデータのみが利用されることになる。なお、文章の入力途中でフォントタイプを変更することを可能としてもよいが、この場合には、複数の人間が協同して一つの文書を手書きしたような印象を与えることになる。
【0022】
フォントデータ格納部44は、1つのフォントタイプにおいて、同一の文字につき、複数のフォントデータを保持する。例えば、ひらがなの「の」について、サイズの大きいものと、サイズの小さいものを用意する。もちろんサイズの違いだけでなく、横長のフォントデータや、縦長のフォントデータなど、上下左右の比率が異なるものを用意してもよい。なお、フォントデータ格納部44は、全ての文字について複数のフォントデータを保持する必要はなく、少なくとも一部の文字について複数のフォントデータを保持していればよい。
【0023】
またフォントデータ格納部44は、所定の文字列を表現したフォントデータを保持する。例えば、「ぼんやり」という文字列を出力する場合、フォントデータ格納部44は、「ぼ」、「ん」、「や」、「り」をそれぞれ一文字の画像データとして保持しているが、一文字の画像データとは別に、文字列「ぼんやり」を一つの画像データとして保持してもよい。これにより、文字処理装置10では、4つの画像データを配列して文字列「ぼんやり」を出力できるだけでなく、1つの画像データで文字列「ぼんやり」を出力することもできる。
【0024】
フォントデータ格納部44のデータ量を削減するため、一つの画像データで表現する所定の文字列は、一続きの文字列として多用されるものに限定することが好ましい。人が文章を書くとき、一つの単語は、一気に書き上げられる傾向がある。一気に書き上げる文字列は、文字同士が繋がり、読み手からみても、繋がった文字は一つの意味を構成することが推測できる。このような効果を実現するために、複数の文字から構成される所定の文字列については、フォントデータ格納部44が、文字同士を繋げて表現したフォントデータを保持することが好ましい。
【0025】
フォントタイプが選択された後、前処理部22は、モニタに文字の入力画面を表示する。入力画面は、既存のワープロソフトで見られるようなものであってよく、画面中の入力位置にカーソルが点滅して、ユーザが文字入力をすると、カーソルが行方向に動くとともに、そのカーソルの点滅箇所から入力文字が表示される。
【0026】
入力受付部20は、ユーザから文字入力を受け付け、前処理部22は、画面中に入力された文字をひらがなで表示する。このとき、前処理部22は、フォントデータ格納部44において選択されたフォントファイルを用いるのではなく、例えば明朝体などのフォントデータを用いて入力された文字を表示してもよい。入力された文字は、文字処理装置10の入力インターフェースとして設けられた変換キーが押下されると、フォントデータ格納部44の対応するフォントデータに変換される。この処理は、基本的には、既存のワープロソフトにおける処理と同様である。したがって、変換キーをユーザが押すまでは、未変換の状態で、入力されたひらがなが画面上の行に並べられていく。
【0027】
図2は、ユーザより入力されて、前処理部22により画面に表示された例を示す。入力受付部20が、ユーザから「のんびりとしためざめ。」とかな入力を受け付け、前処理部22が画面に文字列を表示させる。図2では、明朝体のフォントで文字が表示されている。なお、文章の横に付した点線は、入力文字が変換前であることを示している。
【0028】
なお、図2では明朝体のフォントで文字を表示しているが、フォントデータ格納部44に格納されたひらがなのフォントデータで文字を画面を表示してもよい。明朝体で表示させているのは、データの処理量を軽くするためであり、文字処理装置10がハイスペックなハードウエアで構成されていれば、フォントデータ格納部44に格納された文字の画像データ(フォントデータ)を用いて、画面の表示を行ってもよい。
【0029】
ユーザが、キーボード上の変換ボタンを押下すると、入力受付部20が、その押下を受け付け、文字列解析部24が、自然言語で書かれた文を形態素の列に分割する形態素解析を行う。具体的に、文字列解析部24は、単語の境界を判別する「わかち書き」処理を行い、品詞を解析する。まずわかち書き処理により、入力文字列「のんびりとしためざめ」は、「のんびり」、「と」、「し」、「た」、「めざめ」、「。」の単語に分けられる。なお、本実施例では、句読点も単語の一つとしてわかち書き処理している。
【0030】
文字列解析部24は、入力された複数文字からなる文字列における品詞を解析する。わかち書き処理と品詞の解析は、同時に実行されてもよい。つまり、わかち書き処理が行われた際に、分割された単語に対して品詞を割り当てる処理が行われてもよい。形態素解析は、単語を文法的な機能や形態などにより分類することで実行される。品詞の分類法としては、形態的な分類法、意味的な分類法、統語的な分類法などが考えられており、本実施例において形態素解析は、既存の文法解析アルゴリズムを利用することで行われてもよい。
【0031】
文字列解析部24の解析機能を実現するために、辞書データ格納部42は、日本語文法の知識と品詞付きの単語リストを保持した辞書データを格納する。さらに辞書データ格納部42は、読み(かな)と漢字との変換対応表を保持する。文字列解析部24は、単語の品詞を求め、さらに辞書データ格納部42に格納された辞書および変換対応表を参照して、ひらがな文を漢字仮名混じり文に変換する。この例では、かな文字列「めざめ」を、「目ざめ」に変換する。
【0032】
図3は、文字列解析部24による品詞解析結果を示す。「のんびりとしためざめ。」を品詞解析すると、わかち書き処理された単語が、それぞれ対応する品詞に分けられる。
【0033】
図4は、従来のフォントタイプの一つである明朝体で記述した例文を示す。この例文は、従来のワープロソフトにより文字処理したものである。一般に、明朝体はビジネス文書など、フォーマルな堅い文書に使われることが多い。従来のワープロソフトでは、全ての文字が同じ大きさで出力され、また一文字が決められたマス内に出力されて、文字間隔が等しく設定されている。
【0034】
図5は、図4に示した例文を従来のフォントタイプの一つである毛筆の楷書体で記述したものを示す。毛筆体のフォントで文字を記述すると、明朝体やゴシック体よりも柔らかい雰囲気を醸し出すことができる。しかしながら、全ての文字が同じ大きさで出力され、また文字間隔が等しく設定される点は、明朝体などの出力と同じである。
【0035】
図4および図5に示したように、従来のフォントタイプで文字出力すると、文字の大きさおよび文字間隔が全て等しいために、書き手の思いが読み手に伝わりにくい。毛筆体の場合には、明朝体などよりも若干雰囲気を和らげる効果は確かにあるが、それでもなお、単なる文字の羅列としか捉えられないことは否めない。そこで、本実施例の文字処理装置10では、手書き文章であるような雰囲気をだすことのできる文字処理機能を提供する。
【0036】
図1に戻って、割当部26が、文字列解析部24において解析された単語の品詞に応じて、フォントデータ格納部44に格納されたフォントデータを当該単語に割り当てる。フォントデータ格納部44は、1つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持する。例えば、ひらがな文字「の」に対して、複数のフォントデータを画像データとして保持する。
【0037】
図6は、フォントデータ格納部44が格納するフォントデータの一例を示す。ここでは、フォントデータ格納部44が、同一文字「の」に関して、複数のフォントデータを保持している状態を示す。なお、フォントデータ格納部44は、全ての文字について複数のフォントデータを保持する必要はなく、少なくとも特定の文字についてのみ複数のフォントデータを保持していればよい。なお、ハードディスク等のハードウエアの性能に余裕があれば、全ての文字について複数のフォントデータを保持しておき、それらのフォントデータを使い分けて、文章の統一感をあえて崩すことで、手書きの雰囲気を一層醸し出すことができる。
【0038】
フォントデータ格納部44は、フォントデータを、その文字が含まれる単語の品詞に対応付けて格納する。単語が一文字で構成される場合には、対応付けを行う品詞は、その文字自体で表現される単語の品詞を示し、単語が複数文字で構成される場合、対応付けを行う品詞は、その文字が含まれる単語の品詞を示す。例えば、単語「のんびり」は副詞であるが、割当部26は、単語「のんびり」に含まれる「の」に対して、副詞に対応付けて記憶されているフォントデータを割り当てることになる。
【0039】
図中、フォントデータとして、画面に表示するための表示データと、印刷用の印刷データの2種類を設定している。図6の例では、表示データおよび印刷データが同一の画像データで構成されているが、これらは異なるものであってもよい。印刷の解像度は一般に画面に表示する解像度よりも高いため、例えば印刷用のフォントデータを、表示用のフォントデータよりも解像度の高い画像データで作成してもよい。また、表示データおよび印刷データを別個のものとして用意しない場合には、1つのフォントデータのみ用意すればよい。
【0040】
本実施例において、フォントデータ格納部44は、選択されたフォントタイプにおいて、文字「の」に対して、大きいフォントデータと小さいフォントデータを保持している。大きいフォントデータは、動詞、形容詞、名詞、連体詞、副詞、接続詞に対応付けられている。また、小さいフォントデータは、助詞、助動詞に対応付けられている。このように本実施例では、2種類のフォントデータを、自立語または付属語の一方に対応付けている。自立語とは、単独で文節を構成できる品詞であり、また付属語とは、単独で文節を構成できない品詞である。自立語および付属語は、さらに活用の有無によって分類することができ、活用の有無に応じて別のフォントデータを対応付けてもよい。
【0041】
本実施例では、文字処理に関するいくつかのポリシーをもとに、フォントデータと品詞とを対応づける。例えば、自立語は文章において重要な役割を果たすというポリシーのもとで、自立語、すなわち動詞、形容詞、名詞、連体詞、副詞、接続詞などの品詞に含まれる文字は、大きなフォントデータで表現する。一方で、付属語は文章において相対的に重要な役割を果たさないというポリシーのもとで、付属語、すなわち助詞、助動詞などの品詞に含まれる文字は、小さなフォントデータで表現する。フォントデータの割当て方法は、品詞に応じてさらに細分化されてもよい。例えば、活用の有無に応じて、フォントデータの割当てが設定されてもよい。さらに、品詞ごとに複数(3種類以上)のフォントデータを用意して、フォントデータの割当てが設定されてもよい。
【0042】
また図6において、データ項目「配置位置」では、フォントデータの行中の配置位置が設定される。本実施例の文字処理装置10において、文章は、画面中ないしは印刷紙中に設定された行に入力される。本実施例では、文字を配列するための行が、表示されるか否かは問わず設定されており、縦書きの場合には縦方向の行に、また横書きの場合には横方向の行に、文字が並んで配置される。配置位置が「中央」に設定されている場合、その文字は、行中の中央に配置される。また行の中心から左右方向のいずれかに寄らせて配置する場合には、配置位置が「右20%」、「左15%」と設定される。ここで、%は、行中心から右端または左端に対するずれ量を示し、例えば右50%であれば、行中心線と右端の真ん中に配置位置がくることになる。
【0043】
割当部26は、フォントデータ格納部44に格納したフォントファイルを参照して、入力された文字に対してフォントデータを割り当てる。例えば、図3に示した品詞解析結果を参照すると、単語「のんびり」の品詞は副詞であるため、割当部26は、「のんびり」における「の」に対しては、図6に示す大小のフォントデータのうち、大きな方の「の」を割り当てることになる。
【0044】
図7は、文字列解析部24による品詞解析結果を示す。図4ないしは図5の3行目に示した「頭の隅の方でぼんやりと思う朝の目ざめ。」を品詞解析すると、わかち書き処理された単語の品詞が設定される。
【0045】
例文の3行目には、3つの「の」が登場するが、それぞれ品詞は助詞である。したがって、割当部26は、フォントデータ格納部44に格納したフォントファイルを参照して、この3つの「の」に対しては、図6に示すフォントデータのうち、小さな方の「の」を割り当てる。以上のように、割当部26は、解析された単語の品詞に応じてフォントデータを割り当て、同一文字であっても品詞に応じて文字の形を異ならせることができる。
【0046】
配置部28は、割当部26において割り当てられたフォントデータの配置位置を決定する。このとき、配置部28は、図6に示すフォントファイルの「配置位置」のデータ項目を参照して、文字の配置位置を決定する。フォントファイルにおいて、「配置位置」を行中心だけでなく、行の左右方向にふれる位置に設定しておくことで、全ての文字が整然として配置されるのではなく左右方向にばらけて配置されることで、手書きの雰囲気をもった文章を作成することができる。
【0047】
配置部28は、仮想的な基準線を設定し、その基準線を基準として文字の位置を決定してもよい。
図8は、行中に設定される仮想的な基準線を示す。図8において、行は2本の実線で囲まれる領域であり、行中に設定する基準線を点線で示す。図8の例では、基準線は、行の中心線として直線の形態をとる。
【0048】
配置部28は、この基準線を基準として、文字の位置を決定する。配置部28は、配置する文字の重心位置が基準線上にくるように、文字を配置する。文字の重心位置は、予め求められており、フォントデータの属性としてフォントデータ格納部44に格納されていることが好ましい。重心位置の求め方には様々なものが考えられるが、最も簡単には、上下左右の長さから中心位置を算出することで、重心位置としてもよい。さらに、線要素の太さを考慮し、濃度分布の中心点を探ることで、重心位置を求めてもよい。このとき、重心位置は、見た目の中心位置となるように求められることが好ましい。このように、重心位置の求め方としては、様々な手法を利用することが可能であり、本実施例では、公知の重心位置の探索手法を利用して、重心位置を予め設定しておく。
【0049】
配置部28が基準線上にフォントデータの重心位置を配置することで、文字列の基本的なラインを設定することができる。なお、この基準線に対して、フォントファイルにおいて設定された配置位置を適用してもよい。これにより、基準線に対して、文字の配置を左右方向にばらけさせることが可能となる。
【0050】
配置部28は、一つの単語における文字間隔を所定値に設定する。この所定値は、複数文字が一塊の集合であることを示すために、例えば0mmや0.1mmなどの小さい間隔が設定される。一方、配置部28は、単語間の区切りにおいては、単語同士の間隔を設定する。これにより、行内における文字の位置が決定されることになる。具体的に配置部28は、前後の単語の品詞に応じて、その間隔を設定する。
【0051】
例えば、動詞や助動詞の次に名詞が続く場合、名詞の前の文字列は、名詞を修飾することが多い。そのため、動詞ないしは助動詞と名詞の間隔を広げて、名詞の前の文字列が名詞の修飾語であることを示すようにする。例えば、このときの単語間の区切りは、0.5mmなどの比較的大きい所定値に設定する。なお、この場合の単語間の間隔は、単語内の文字間隔よりも広い値に設定されることが好ましい。
【0052】
助動詞と名詞が続く例は、図4および図5に示す例文の1行目における「のんびりとした」と、「目ざめ」の区切りに相当する。同様に、助詞の次に副詞が続く場合、副詞の前の文字列は、その後の文字列と意味がきれることが多い。これは、例文の2行目における「まぶたは」と、「まだ」の区切りに相当する。助詞の次に名詞が続く場合も同様である。これは、例文の3行目の「隅の方で」、「ぼんやり」の区切りに相当する。なお、このような特別の関係にある場合には、単語同士の間隔を、広い値に設定し、それ以外の単語同士の区切りは、それよりも狭い値に設定する。単語同士の間隔を広げるための前後の品詞の条件は、配置部28が予め保持しておく。このように単語同士の間隔を設定することで、読み手は意味をとりやすくなり、また手書き感を向上することができる。
【0053】
なお、単語同士の間隔を広げるための前後の品詞の条件を設定した場合、この条件が満足されると常に単語間隔を広げてもよいが、ランダムにこの決定がなされてもよい。例えば、単語間隔を広げるか否かの確率を予め設定しておき、条件が満足された場合に、この確率で抽選を行うことで、単語間隔を広げるか否かの判定を行ってもよい。
【0054】
なお、単語間隔を広げる場合、隣の文章と比較して、単語間隔の広いところが著しく多かったり、または少なかったりすると、見た目上好ましくない場合もある。そのため、例えば、配置部28は、所定の文字数のうち、単語間隔を広げる箇所の上限を有していてもよい。例えば、15文字のうちで、6箇所に単語間隔の広いところがあると、全体として間延びした印象を与えることも考えられる。そのため、15文字のうちで単語間隔を5箇所以下とするように、配置部28が、上限を定めてもよい。間隔を広げる上限を満たす箇所が6箇所以上ある場合には、その6箇所につき抽選等を行うことで、5箇所以内に収めるようにする。本実施例の文字処理機能によると、文字が同一の大きさに構成されているわけではないため、例えば文字数をみるのではなく、文字列の長さで判断してもよい。
【0055】
表示変換処理部30は、配置部28において配置位置を決定された文字を、画面中に配置する。これにより、画面中の表示を、万年筆フォントの文字に変換することができる。なお、画面に表示する場合には、割当部26により表示データが割り当てられ、印刷する場合には、印刷データが割り当てられることになる。
【0056】
図9は、文字処理装置10により文字処理されて画面に表示される例文を示す。本実施例の文字処理装置10によると、品詞に応じて文字のフォントデータを変化させることにより、全ての文字が無機質に並べられるのではなく、手書き感を醸し出した出力を得ることができる。1行目の「の」と、3行目の「の」を比較すると、1行目の「の」の方が、3行目の「の」よりも大きく表示されていることが分かる。また、全ての文字が中心線にしたがって配置されているわけではなく、文字によっては、左右方向にぶれた位置に配置されていることが分かる。なお、実施例では、特に文字「の」について説明したが、他の文字についても同様であり、様々な文字について複数のフォントデータを用意することで、画一的な文章スタイルではなく、気持ちのこもった文章を自動的に作成することが可能となる。
【0057】
図10は、行中に設定される仮想的な基準線の別の例を示す。図10において、行は2本の実線で囲まれた領域であり、行中に設定する基準線が点線で示される。図示されるように、基準線は、行内において波線として設定されている。
【0058】
一般に、人が文章を書くとき、一直線に文字を並べて書くことは稀であり、曲がったり、傾いたりすることが多い。例えば、便箋に行を示す2本の直線が引かれている場合であっても、人は書くことに関して何らかの癖を持っていることが常であるため、縦書きの場合には文章が右よりになったり、また横書きの場合には文章が右上がりになったりする。例えば、人が文字を書く姿勢であったり、筆の持ち方であったり、そういったものが影響を与えて、結果として味のある文書が作成されるのである。本発明者は、この点に注目し、単に文字を直線的に並べるのではなく、何らかのリズムをつけて文字を並べることで、手書き感の向上を図ることにした。
【0059】
配置部28が、それぞれの文字の重心位置を、図10に示す波線の基準線に重なるように文字の配置位置を決定することで、文字が適度に左右方向に散らばった文章を作成できる。これにより、整然と文字が配列された文章ではなく、手書きで作成した文書のように、ある意味、雑然とした雰囲気を出すことができ、手書き感を向上できる。なお、基準線は、波線だけでなく、例えば行の右上から左下に結ぶような直線であってもよい。この場合には、右側に傾いた文章が作成されることになる。以上は縦書きの場合であるが、横書きの場合であっても同様である。このように、中心線とは異なる直線ないしは曲線を基準線として設定し、各文字の重心位置が基準線上にくるように文字の配置位置を決定することで、手書き感の高い文章を作成できる。
【0060】
図11は、フォントデータ格納部44が格納するフォントデータの別の例を示す。ここでは、フォントデータ格納部44が、複数文字からなる所定の文字列に関して、フォントデータを保持している状態を示す。所定の文字列は、一つの品詞から構成される単語だけでなく、複数の品詞から構成されるものであってもよい。図11に示す例において、文字列「ぼんやり」は一つの名詞であるが、文字列「とした」は、助詞「と」、動詞「し」、助動詞「た」の3つの品詞から構成されている。フォントデータ格納部44は、例えば文章に頻出する文字列を予め一つのフォントデータとして保持しておく。
【0061】
手書きの文章において、頻出する文字列は、続け字として書かれることが多い。これは、よく書くことで、筆の走りを手が覚えていることにも一因がある。また、文字の書き始め位置と書き終わり位置との関係から、続け字として書きやすい文字列もある。このような文字列は、走り書きされて、文字が続けて書かれることになる。そこで、フォントデータ格納部44が、所定の文字列を、続け字として作成したフォントデータとして保持して、割当部26が、このフォントデータを、入力された文字列に割り当てることで、筆の勢いを感じさせる文章を作成できる。図11のフォントファイルの例では、ひらがなの文字列のみを示しているが、当然のことながら、漢字の文字列、およびかな漢字混在文字列であってもよい。図9に示した例文では、この文字列のフォントデータが割り当てられている。
【0062】
なお、文字列のフォントデータは、続け字に限定するものではない。フォントデータ格納部44の格納するデータ量に配慮した場合には、文字列のフォントデータの数を制限することが好ましいが、フォントデータ格納部44の記憶容量が大きければ、文字列のフォントデータを数多く持たせてもよい。この場合には、一般の単語について、文字列のフォントデータを作成してもよい。なお、フォントデータ格納部44は、ひらがなの文字データについては全て保持しているため、ある単語の文字列が保持されていない場合であっても、その単語を少なくともひらがなで表現することは可能である。
【0063】
文字列のフォントデータには、選択するための重みが設定されていてもよい。例えば、名詞「めざめ」に対して、フォントデータとして、「めざめ」、「目ざめ」、「目覚め」の3種類が用意されている場合を想定する。3種類のフォントデータのうち、「目ざめ、「目覚め」、「めざめ」の順に重み付けがされている場合、割当部26は、単語「めざめ」に対して、重みの高い「目ざめ」を優先的に割り当てる。この重みは、割当ての優先順位として設定されていてもよい。優先順位は、より味わい深いフォントデータの順に設定されることが好ましい。優先順位は、フォント作成者ないしは文字処理装置10の文字処理機能の作成者(例えば、ソフトウェアの作成者)によりデフォルトで設定される。なお、ユーザには、選択肢が提示され、ユーザが他のフォントデータを選択する場合には、そのフォントデータが割り当てられることになる。このとき、デフォルト設定した優先順位が変化し、選択したフォントデータの優先順位が1番になることが好ましい。このように、フォントデータの優先順位を可変とすることで、ユーザの好みを反映したフォントデータの割当てが可能となる。
【0064】
またフォントデータ格納部44は、文字毎に「流れ具合」、「にじみ具合」、「かすれ具合」をそれぞれ段階的に表現したフォントデータを保持し、割当部26は、それらを予め決められた比率に応じて選択してもよい。
【0065】
図12は、本実施例における文字処理を実現するフローチャートである。この文字処理フローでは、フォントデータ格納部44のフォントタイプが選択されていることを前提とする。入力受付部20が、ユーザから文字入力を受け付ける(S10)。複数文字を入力した状態でユーザが変換キーを押下すると、入力受付部20が、その変換指示を受け付ける(S12)。文字列解析部24は、入力された文字列における単語の品詞を形態素解析し(S14)、かな漢字変換処理を行う(S16)。なお、形態素解析およびかな漢字変換処理は、文字処理装置10の内部処理として実行され、この時点では、その処理結果は画面中には表れていない。
【0066】
入力された文字列において、割当部26は、所定の文字列が存在するか否かを判定する(S18)。この所定の文字列とは、フォントデータ格納部44のフォントデータとして登録されている文字列である。所定の文字列が存在する場合(S18のY)、割当部26は、その文字列に対して、フォントデータ格納部44に保持されている文字列フォントデータを割り当てる(S20)。一方で、所定の文字列に含まれない文字については(S18のN)、割当部26が、形態素解析により解析された品詞に基づいて、入力文字に文字フォントデータを割り当てる(S22)。
【0067】
続いて、配置部28が、文字を配置する位置を決定する(S24)。全ての文字の位置が決定されると、表示変換処理部30が、割り当てられたフォントデータを、決定された位置に配置し(S26)、手書き感の高い文書を生成する。
【0068】
図13は、図12のS24に示す文字位置決定処理のフローチャートである。まず、配置部28は、文字列における前後の単語の品詞を取得する(S30)。前後の単語の品詞に所定の関係がある場合(S32のY)、配置部28は、単語間隔を広く設定する(S34)。一方、前後の単語の品詞に所定の関係がない場合(S32のN)、単語間隔を狭く設定する(S36)。なお、単語内における文字間隔は固定値として予め設定されていてもよい。さらに配置部28は、フォントデータ格納部44のフォントファイルに含まれる配置位置データを読み出し(S38)、行内に設定した基準線を用いて、文字の位置を決定する(S40)。具体的には、基準線上に各文字の重心位置が重なるように文字の位置を仮決めし、さらに仮決めされた位置から、配置位置データで示される方向にフォントデータを移動する。例えば、配置位置データが「中央」と設定されている文字については、フォントデータの仮決め位置で確定することになり、配置位置データが「右10%」と設定されている文字については、フォントデータの重心位置を、行の半分の幅の10%分だけ右にずらされることになる。以上のようにして、文字の位置が決定される。
【0069】
以上、本発明を実施例をもとに説明した。これらの実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0070】
本実施例においては、図2に示すように、入力した一文をまとめて文字処理する場合について説明したが、一文より短い文節を単位として文字処理することも可能である。文字処理は、ユーザが変換キーを押下することを実行のトリガとし、したがって入力受付部20が変換指示を受け付けたタイミングで、入力された文字列に関して文字処理が実行される。
【0071】
配置部28は、前後の単語の品詞の関係をもとに、単語同士の間隔を決定するが、間隔を決定する際には、既に文字処理された直前の単語との関係を考慮する。既に文字処理された単語の品詞も参照することで、配置部28は、単語同士の間隔を適切に設定することができる。
【0072】
また割当部26は、フォントデータの拡大・縮小を行って、フォントデータの割当て処理を行ってもよい。フォントデータの拡大・縮小機能をもつことで、拡大したフォントデータ、縮小したフォントデータをフォントデータ格納部44にあらためて持たせる必要がなくなる。
【0073】
また、全ての文字処理が終了すると、文書が完成することになるが、割当部26は、その時点で、フォントデータの割当て処理を再実行してもよい。例えば、割当て処理を再実行するための指示がユーザより入力され、その指示を受けて割当部26が、フォントデータの割当て処理を実行する。このとき、例えば、予めデフォルトとして設定された優先順位の低いフォントデータが割り当てられている場合、そのフォントデータを、より優先順位の高いものに変更できる可能性をユーザに示唆してもよい。例えば、その文字の色を変えて表示などすることで、ユーザに対する示唆を行うことができる。
【0074】
また、全ての文字処理が終了したとき、文字列解析部24が、再度、品詞解析処理を行ってもよい。これは、品詞解析処理を再実行するための指示がユーザより入力され、その指示を受けて文字列解析部24が、文字列を解析する。
【0075】
また、実施例では主として文字について説明したが、配置部28は、さらに句読点や括弧などの記号の位置を設定する機能をもつ。配置部28は、例えば記号の位置を、左右方向のランダムな位置に配置してもよい。特に、句読点については、必ず右側に配置しなければならないものでもなく、中央付近や左側寄りに配置することで、手書き感を向上できる。
【0076】
また、実施例ではユーザがフォントタイプを選択することとしたが、例えばフォントデータに、文字の雰囲気をアナログ的に評価した値が設定されており、ユーザがフォントタイプを選択するのではなく、そのアナログ評価の数値範囲を指定することで、フォントデータが文字割当の候補としてフォントデータ格納部44から抽出されるものであってもよい。アナログ評価は、フォントの作成者ないしはソフトウエアの作成者によって行われ、この評価値をもとに、文字割当処理が実行されてもよい。
【0077】
また本実施例の文字処理装置10はスタンドアロン型の端末として説明したが、ネットワークを介したクライアントサーバ型のシステムとして構築されてもよい。この場合、ユーザは、クライアント端末から文章を入力して、サーバに送信し、サーバは、一括して、送信されてきた文章の文字処理を行う。この文字処理機能は、上述したものに相当する。これにより、クライアント端末は文字処理機能を有する必要はなくなる。この場合、サーバから、文字処理された結果物が送信され、クライアント端末は、それを画面に表示または印刷することが可能となる。
【図面の簡単な説明】
【0078】
【図1】本発明の実施例にかかる文字処理装置の構成を示す図である。
【図2】ユーザより入力されて、前処理部により画面に表示された文字列の例を示す図である。
【図3】文字列解析部による品詞解析結果を示す図である。
【図4】従来のフォントタイプの一つである明朝体で記述した例文を示す図である。
【図5】図4に示した例文を従来のフォントタイプの一つである毛筆の楷書体で記述したものを示す図である。
【図6】フォントデータ格納部が格納するフォントデータの一例を示す図である。
【図7】文字列解析部による品詞解析結果を示す図である。
【図8】行中に設定される仮想的な基準線を示す図である。
【図9】文字処理装置により文字処理されて画面に表示される例文を示す図である。
【図10】行中に設定される仮想的な基準線の別の例を示す図である。
【図11】フォントデータ格納部が格納するフォントデータの別の例を示す図である。
【図12】本実施例における文字処理を実現するフローチャートである。
【図13】図12のS24に示す文字位置決定処理のフローチャートである。
【符号の説明】
【0079】
10・・・文字処理装置、20・・・入力受付部、22・・・前処理部、24・・・文字列解析部、26・・・割当部、28・・・配置部、30・・・表示変換処理部、32・・・選択部、40・・・格納部、42・・・辞書データ格納部、44・・・フォントデータ格納部。

【特許請求の範囲】
【請求項1】
ユーザからの文字入力を受け付ける受付部と、
入力された文字列における単語の品詞を解析する解析部と、
フォントデータを格納する格納部と、
解析された単語の品詞に応じて、入力された文字に、前記格納部に格納されたフォントデータを割り当てる割当部と、
を備えることを特徴とする文字処理装置。
【請求項2】
前記格納部は、1つのフォントタイプにおいて、同一の文字につき複数のフォントデータを保持することを特徴とする請求項1に記載の文字処理装置。
【請求項3】
前記格納部は、所定の文字列を表現したフォントデータを保持することを特徴とする請求項1または2に記載の文字処理装置。
【請求項4】
前記格納部は、フォントデータを画像データとして保持することを特徴とする請求項1から3のいずれかに記載の文字処理装置。
【請求項5】
仮想的な基準線を設定し、その基準線を基準として前記受付部において受け付けた文字の位置を決定する配置部をさらに備えることを特徴とする請求項1から4のいずれかに記載の文字処理装置。
【請求項6】
前後に続く単語の品詞の関係から、その単語間の間隔を決定する配置部をさらに備えることを特徴とする請求項1から4のいずれかに記載の文字処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2006−302068(P2006−302068A)
【公開日】平成18年11月2日(2006.11.2)
【国際特許分類】
【出願番号】特願2005−124587(P2005−124587)
【出願日】平成17年4月22日(2005.4.22)
【出願人】(505151427)有限会社カタオカデザインワークス (1)
【Fターム(参考)】