説明

絵文字付与文生成装置、方法、及びプログラム

【課題】実際の絵文字の用法に沿った絵文字の付与を行う。
【解決手段】絵文字とその絵文字が表現する語義との組を複数記憶した絵文字語義辞書から、入力文に含まれる単語Kiと一致する語義を含む絵文字を抽出する。複数の絵文字が抽出された場合には、入力文の文脈と絵文字との意味的な距離が最も近い絵文字を選択する。単語Kiの概念ベクトルと選択された絵文字の概念ベクトルとの距離(t)を、単語Kiと選択された絵文字との意味的な距離として算出する。距離(t)が、閾値(k)より小さい場合には、単語Kiをその絵文字で置換するように決定し、距離(t)が閾値(k)より大きい場合には、単語Kiの後にその絵文字を付加するように決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、絵文字付与文生成装置、方法、及びプログラムに係り、特に、絵文字を入力文に含まれる単語と置換、または単語に付加することにより絵文字付与文を生成する絵文字付与文生成装置、方法、及びプログラムに関する。
【背景技術】
【0002】
従来、携帯電話機やパソコンなどの文字入力装置において、絵文字の入力を支援することが行われている。例えば、「です」や「ます」といった特定の文末文字列が入力されると、文末文字列に続く可能性が高い絵文字や句点などの文字列候補を自動的に挿入することによって、文末文字の入力の手間を省くことができる文字入力装置が提案されている(例えば、特許文献1参照)。
【0003】
また、実際に、ユーザがマニュアルで入力文に絵文字を付与するときには、絵文字だけで単語を推定することが可能な場合には、単語と絵文字とを置換し、また、単語と非常に近い意味を持っているが、絵文字だけで単語を推定することが困難な場合には、単語に絵文字を付加する、という用法で絵文字が用いられることが多い。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−331066号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、文末文字の入力支援に特化した特許文献1の技術では、文章の内容を考慮しない絵文字が入力候補として表示される可能性がある、という問題がある。また、絵文字の挿入位置についても文末のみへの挿入であり、文中で用いられることもある絵文字の実際の使用方法には沿っていない、という問題もある。
【0006】
本発明は上記問題点に鑑みてなされたものであり、実際の絵文字の用法に沿った絵文字の付与を行うことができる絵文字付与文生成装置、方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するために、本発明の絵文字付与文生成装置は、絵文字と該絵文字が表す少なくとも1つの語義との組を複数記憶した絵文字語義記憶手段から、入力文に含まれる単語と一致する語義を表す絵文字を抽出する一致絵文字抽出手段と、前記一致絵文字抽出手段により抽出された絵文字の意味的特徴量、及び前記単語の意味的特徴量から求まる該絵文字と該単語との意味的な距離が、予め定めた絵文字単語距離閾値より小さい場合には、前記絵文字の付与方法を置換に決定し、前記距離が前記絵文字単語距離閾値以上の場合には前記絵文字の付与方法を付加に決定する決定手段と、前記決定手段により置換に決定された場合には、前記単語を前記一致絵文字抽出手段により抽出された絵文字に置換し、前記決定手段により付加に決定された場合には、前記単語の前または後に前記一致絵文字抽出手段により抽出された絵文字を付加することにより、前記入力文に絵文字を付与した絵文字付与文を生成する生成手段と、を含んで構成されている。
【0008】
本発明の絵文字付与文生成装置によれば、絵文字語義記憶手段に、絵文字とその絵文字が表す少なくとも1つの語義との組が複数記憶されている。ここで、絵文字とは、語義の内容をイラスト化した記号であって、文字として入力できる記号、すなわちイラスト化された記号文字である。一致絵文字抽出手段は、絵文字語義記憶手段から、入力文に含まれる単語と一致する語義を表す絵文字を抽出する。決定手段は、一致絵文字抽出手段により抽出された絵文字の意味的特徴量、及び単語の意味的特徴量から求まる絵文字と単語との意味的な距離が、予め定めた絵文字単語距離閾値より小さい場合には、絵文字の付与方法を置換に決定し、絵文字と単語との意味的な距離が絵文字単語距離閾値以上の場合には絵文字の付与方法を付加に決定する。そして、生成手段が、決定手段により置換に決定された場合には、単語を一致絵文字抽出手段により抽出された絵文字に置換し、決定手段により付加に決定された場合には、単語の前または後に一致絵文字抽出手段により抽出された絵文字を付加することにより、入力文に絵文字を付与した絵文字付与文を生成する。
【0009】
このように、単語と絵文字との意味的な距離が閾値より小さい場合には、単語と絵文字とを置換し、単語と絵文字との意味的な距離が閾値以上の場合には、単語に絵文字を付加するように、絵文字の付与方法を使い分けるため、絵文字だけで単語を表現できる場合には、単語を絵文字で置換し、絵文字だけでは単語を推定することが困難な場合には、単語に絵文字を付加するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0010】
また、本発明の絵文字付与文生成装置は、前記入力文に含まれる単語と一致する語義を表す絵文字が、前記一致絵文字抽出手段により抽出されなかった場合に、前記絵文字語義記憶手段に記憶された語義各々の意味的特徴量、及び前記単語の意味的特徴量から求まる該語義各々と該単語との意味的な距離が、予め定めた語義単語距離閾値より小さい語義を表す絵文字を、前記絵文字語義記憶手段から抽出する近距離絵文字抽出手段を含んで構成することができ、前記生成手段は、前記単語の前または後に前記近距離絵文字抽出手段により抽出された絵文字を付加することができる。これにより、単語と絵文字の語義とが一致する絵文字が存在しない場合でも、単語と絵文字の語義との意味的な距離が近い絵文字を単語に付加するため、単語に近い意味を持った絵文字により単語を強調するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0011】
また、本発明の絵文字付与文生成装置は、前記絵文字語義記憶手段に記憶された絵文字各々の意味的特徴量、及び前記入力文の文脈を示す特徴量から求まる該絵文字各々と該入力文との意味的な距離が、予め定めた絵文字文脈距離閾値より小さい絵文字を、前記絵文字語義記憶手段から抽出する文脈絵文字抽出手段を含んで構成することができ、前記生成手段は、前記入力文の先頭または末尾に、前記文脈絵文字抽出手段により抽出された絵文字を付加することができる。これにより、入力文と絵文字との意味的な距離が近い絵文字を入力文の先頭または文末に付与するため、文章全体の意味を反映した絵文字を付与するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0012】
また、本発明の絵文字付与文生成方法は、一致絵文字抽出手段と、決定手段と、生成手段とを含む絵文字付与文生成装置における絵文字付与文生成方法であって、前記一致絵文字抽出手段は、絵文字と該絵文字が表す少なくとも1つの語義との組を複数記憶した絵文字語義記憶手段から、入力文に含まれる単語と一致する語義を表す絵文字を抽出し、前記決定手段は、前記一致絵文字抽出手段により抽出された絵文字の意味的特徴量、及び前記単語の意味的特徴量から求まる該絵文字と該単語との意味的な距離が、予め定めた絵文字単語距離閾値より小さい場合には、前記絵文字の付与方法を置換に決定し、前記距離が前記絵文字単語距離閾値以上の場合には前記絵文字の付与方法を付加に決定し、前記生成手段は、前記決定手段により置換に決定された場合には、前記単語を前記一致絵文字抽出手段により抽出された絵文字に置換し、前記決定手段により付加に決定された場合には、前記単語の前または後に前記一致絵文字抽出手段により抽出された絵文字を付加することにより、前記入力文に絵文字を付与した絵文字付与文を生成する方法である。
【0013】
また、本発明の絵文字付与文生成方法は、近距離絵文字抽出手段をさらに含む絵文字付与文生成装置における絵文字付与文生成方法であって、前記近距離絵文字抽出手段は、前記入力文に含まれる単語と一致する語義を表す絵文字が、前記一致絵文字抽出手段により抽出されなかった場合に、前記絵文字語義記憶手段に記憶された語義各々の意味的特徴量、及び前記単語の意味的特徴量から求まる該語義各々と該単語との意味的な距離が、予め定めた語義単語距離閾値より小さい語義を表す絵文字を、前記絵文字語義記憶手段から抽出し、前記生成手段は、前記単語の前または後に前記近距離絵文字抽出手段により抽出された絵文字を付加する方法である。
【0014】
また、本発明の絵文字付与文生成方法は、文脈絵文字抽出手段をさらに含む絵文字付与文生成装置における絵文字付与文生成方法であって、前記文脈絵文字抽出手段は、前記絵文字語義記憶手段に記憶された絵文字各々の意味的特徴量、及び前記入力文の文脈を示す特徴量から求まる該絵文字各々と該入力文との意味的な距離が、予め定めた絵文字文脈距離閾値より小さい絵文字を、前記絵文字語義記憶手段から抽出し、前記生成手段は、前記入力文の先頭または末尾に、前記文脈絵文字抽出手段により抽出された絵文字を付加する方法である。
【0015】
また、本発明の絵文字付与文生成プログラムは、コンピュータを、上記の絵文字付与文生成装置を構成する各手段として機能させるためのプログラムである。
【発明の効果】
【0016】
以上説明したように、本発明の絵文字付与文生成装置、方法、及びプログラムによれば、単語と絵文字との意味的な距離が閾値より小さい場合には、単語と絵文字とを置換し、単語と絵文字との意味的な距離が閾値以上の場合には、単語に絵文字を付加するように、絵文字の付与方法を使い分けるため、絵文字だけで単語を表現できる場合には、単語を絵文字で置換し、絵文字だけでは単語を推定することが困難な場合には、単語に絵文字を付加するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる、という効果が得られる。
【図面の簡単な説明】
【0017】
【図1】本実施の形態で用いられる絵文字の一例を示す図である。
【図2】本実施の形態の絵文字付与文生成装置の機能的構成を示すブロック図である。
【図3】絵文字文字辞書の一例を示す図である。
【図4】絵文字語義辞書の一例を示す図である。
【図5】本実施の形態の絵文字付与文生成装置における絵文字付与文生成処理ルーチンの内容を示すフローチャートである。
【図6】文字絵文字置換処理ルーチンの内容を示すフローチャートである。
【図7】入力文への文字IDの割り当てを説明するための図である。
【図8】文字置換絵文字記憶部に記憶された絵文字の一例を示す図である。
【図9】単語一致絵文字置換付加処理ルーチンの内容を示すフローチャートである。
【図10】入力文への単語IDの割り当てを説明するための図である。
【図11】単語置換絵文字記憶部に記憶された絵文字の一例を示す図である。
【図12】付加絵文字記憶部に記憶された絵文字の一例を示す図である。
【図13】単語近距離絵文字付加処理ルーチンの内容を示すフローチャートである。
【図14】文脈絵文字付加処理ルーチンの内容を示すフローチャートである。
【図15】文末絵文字記憶部に記憶された絵文字の一例を示す図である。
【図16】生成処理ルーチンの内容を示すフローチャートである。
【図17】絵文字付与文の生成を説明するための図である。
【発明を実施するための形態】
【0018】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0019】
まず、本実施の形態で用いられる絵文字は、図1に示すように、携帯端末から入力可能な絵文字とする。これらの絵文字は、その用法により以下の4種類がある。
【0020】
(1)文字の代わりとして用いられている絵文字
(2)単語の代わりとして用いられている絵文字
(3)単語に付加して用いられる絵文字
(4)文末で要約のように使われる絵文字
【0021】
(3)の場合、絵文字は単語に非常に近い意味を持ってはいるものの、絵文字からだけでは、単語を推定することが困難な場合に用いられる。(4)の文末に用いられるものは、文章全体の意味を反映したものが付与される。本実施の形態の絵文字付与文生成装置は、これらの絵文字の用法に沿って、入力文に自動的に絵文字を付与するものである。
【0022】
本実施の形態に係る絵文字付与文生成装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する絵文字付与文生成処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図2に示すように、形態素解析部12、文字絵文字置換部14、単語一致絵文字置換付加部16、単語近距離絵文字付加部18、文脈絵文字付加部20、文字置換絵文字記憶部22、単語置換絵文字記憶部24、付加絵文字記憶部26、文末絵文字記憶部28、及び絵文字付与文生成部30を含んだ構成で表すことができる。
【0023】
形態素解析部12は、周知の形態素解析器により、入力された入力文を形態素解析し、解析結果を出力する。
【0024】
文字絵文字置換部14は、上記(1)の絵文字の用法に相当する処理を行うもので、入力文中に含まれる1文字が絵文字に置換可能か否かを判断し、置換可能な文字を絵文字に置換する。例えば、図3に示すような、絵文字と文字とを対応させた絵文字文字辞書を予め定めておき、入力文の先頭の文字から順次、絵文字文字辞書を参照して、その文字に対応する絵文字を抽出する。文字に対応する絵文字が存在する場合には、絵文字に置換する文字の位置を示す位置ID、及び検索された絵文字を文字置換絵文字記憶部22に記憶する。
【0025】
単語一致絵文字置換付加部16は、上記(2)及び(3)の絵文字の用法に相当する処理を行うもので、形態素解析された入力文中に含まれる1単語が絵文字に置換可能か否かを判断し、置換可能な文字を絵文字に置換する。例えば、本実施の形態の絵文字付与文生成装置10で使用される全ての絵文字について、図4に示すような、絵文字とその絵文字が表現する語義とを対応させた絵文字語義辞書を予め定めておく。そして、入力文の先頭の単語から順次、絵文字語義辞書を参照して、その単語を語義として含む絵文字を抽出する。なお、絵文字語義辞書では、1つの絵文字に複数の語義を対応させておいてもよいし、異なる絵文字について同一の語義を対応させてもよい。また、絵文字語義辞書には、全ての絵文字が格納されているため、上述の絵文字文字辞書に格納されている絵文字と重複するものも存在する。すなわち、1文字と置換可能な絵文字は、絵文字語義辞書及び絵文字文字辞書の両方に格納されていることになる。
【0026】
また、単語一致絵文字置換付加部16は、1つの単語に対して複数の絵文字が抽出された場合には、入力文の文脈に最も沿った1つの絵文字を選択する。
【0027】
また、単語一致絵文字置換付加部16は、抽出された絵文字を単語と置換するか、または単語に付加するかを、単語と絵文字との意味的な距離に基づいて決定する。距離が近い場合には、単語と絵文字とを置換可能であると判断し、距離が近くない場合には、単語と絵文字とを置換不可であると判断し、単語に絵文字を付加するように決定する。単語と絵文字とを置換する場合には、絵文字に置換する単語の位置を示す位置ID、及び抽出された絵文字を単語置換絵文字記憶部24に記憶する。また、単語に絵文字を付加する場合には、絵文字を付加する位置を示す位置ID、及び抽出された絵文字を付加絵文字記憶部26に記憶する。
【0028】
単語近距離絵文字付加部18は、上記(3)の絵文字の用法に相当する処理を実行するもので、単語一致絵文字置換付加部16において、単語を語義として含む絵文字が抽出されなかった場合に、単語と絵文字の語義との意味的な距離に基づいて、単語の意味に近い絵文字を、絵文字語義辞書から抽出する。ここで抽出される絵文字は、単語を語義として含むわけではなく、単語と意味的な距離が非常に近い語義を含む絵文字である。例えば、「ケーキを表現した絵文字」と、その絵文字の語義として「ケーキ」とが絵文字語義辞書に登録されている場合、単語「デザート」について、単語「デザート」とケーキの絵文字の語義「ケーキ」との意味的な距離は非常に近くなると考えられる。このように、単語と絵文字の語義との意味的な距離を用いることで、「ケーキを表現した絵文字」が絵文字語義辞書において語義として「デザート」を含まない場合でも、入力文中の単語「デザート」に付加する絵文字として「ケーキを表現した絵文字」が抽出される。
【0029】
また、単語近距離絵文字付加部18は、単語の意味に近い絵文字が抽出された場合には、絵文字を付加する位置を示す位置ID、及び抽出された絵文字を付加絵文字記憶部26に記憶する。なお、単語近距離絵文字付加部18で抽出された絵文字は、単語一致絵文字置換付加部16で抽出されなかった絵文字であるので、絵文字から単語を推定することが困難な絵文字であるとみなして、絵文字の付与方法は付加のみとする。
【0030】
文脈絵文字付加部20は、上記(4)の絵文字の用法に相当する処理を実行するもので、入力文の文脈と意味的な距離が近い絵文字を、絵文字語義辞書から抽出し、抽出された絵文字を文末絵文字記憶部28に記憶する。
【0031】
絵文字付与文生成部30は、文字置換絵文字記憶部22、単語置換絵文字記憶部24、付加絵文字記憶部26、及び文末絵文字記憶部28に記憶された情報に基づいて、入力文に絵文字を置換または付加して、絵文字付与文を生成する。
【0032】
次に、図5を参照して、本実施の形態の絵文字付与文生成装置10において実行される絵文字付与文生成処理ルーチンについて説明する。
【0033】
ステップ100で、入力文を取得する。ここでは、「晴れだったので、車で出かけた!」という入力文が取得されたものとする。次に、ステップ200で、文字絵文字置換処理を実行する。
【0034】
ここで、図6を参照して、文字絵文字置換処理ルーチンについて説明する。
【0035】
ステップ202で、例えば、図7に示すように、入力文の先頭の文字から順に文字IDとしてMp(p=1,2,・・・,n:nは入力文に含まれる文字数)を割り当てる。また、変数pに1をセットする。
【0036】
次に、ステップ204で、文字IDがMpの文字(入力文のp番目の文字)と絵文字文字辞書とを比較する。次に、ステップ206で、絵文字文字辞書に文字Mpに対応する絵文字が存在するか否かを判定する。存在する場合には、その絵文字を抽出して、ステップ208へ移行し、絵文字に置換する文字の位置を示す位置IDとしてMpと、上記ステップ206で抽出された絵文字とを、文字置換絵文字記憶部22に記憶する。例えば、文字M15=「!」について、図3の絵文字文字辞書を参照すると、文字「!」に一致する絵文字が存在するため、この絵文字が抽出される。そして、図8に示すように、文字置換絵文字記憶部22に記憶される。
【0037】
次に、ステップ210で、pがnになったか否かを判定することにより、入力文の全ての文字について処理を終了したか否かを判定する。p≠nの場合には、ステップ212へ移行して、pを1インクリメントして、ステップ204へ戻って処理を繰り返す。p=nとなった場合には、絵文字付与文生成処理(図5)へリターンし、ステップ300へ移行する。
【0038】
ステップ300では、上記ステップ100で取得された入力文を形態素解析する。次に、ステップ400で、単語一致絵文字置換付加処理を実行する。
【0039】
ここで、図9を参照して、単語一致絵文字置換付加処理ルーチンについて説明する。
【0040】
ステップ402で、例えば、図10に示すように、入力文の形態素解析結果を用いて、先頭の単語から順に単語IDとしてKi(i=1,2,・・・,m:mは入力文に含まれる単語数)を割り当てる。また、変数iに1をセットする。
【0041】
次に、ステップ404で、単語IDがKiの文字(入力文のi番目の単語)と絵文字語義辞書とを比較する。次に、ステップ406で、絵文字語義辞書に単語Kiを語義に含む絵文字が存在するか否かを判定する。存在する場合には、その絵文字を抽出して、ステップ408へ移行する。存在しない場合には、ステップ500へ移行して、後述する単語近距離絵文字付加処理を実行する。
【0042】
ステップ408では、上記ステップ406で抽出された絵文字が複数か否かを判定し、複数の場合には、ステップ410へ移行し、1つだけの場合には、ステップ410をスキップして、ステップ412へ移行する。
【0043】
ステップ410では、上記ステップ406で抽出された複数の絵文字から、入力文の文脈と絵文字との意味的な距離が最も近い絵文字を、最も入力文の文脈に沿った絵文字として選択する。具体的には、まず、入力文全体の文脈を表現する特徴ベクトルを算出する。文脈を表現する特徴ベクトルは、例えば特開2007−317132号公報に開示されている手法で生成された概念ベクトル集合を用いて、入力文中の単語各々の概念ベクトルaKiを求め、これらの概念ベクトルの重心を入力文の文脈を表現する特徴ベクトルとする。概念ベクトルの重心は、下記(1)式により算出する。
【0044】
【数1】

【0045】
また、上述の単語各々の概念ベクトルaKiを求めたのと同様の手法により、抽出された複数の絵文字各々の概念ベクトルを求める。そして、求めた絵文字の概念ベクトル各々と文脈を表現する特徴ベクトルとの距離を算出し、その距離が最も小さい絵文字を選択する。
【0046】
次に、ステップ412で、単語Kiと選択された絵文字との意味的な距離を算出する。具体的には、上記ステップ410の処理過程で得られた単語Kiの概念ベクトルaKiと選択された絵文字の概念ベクトルとの距離(t)を算出する。
【0047】
次に、ステップ414で、上記ステップ412で算出した距離(t)が、閾値(k)よりも小さいか否かを判定する。この判定は、選択された絵文字から単語Kiを推定可能か否かの判定、すなわち、単語Kiを絵文字で置換可能であるか否かを判定するものである。閾値(k)はこの判定のための値を学習処理等により予め定めておく。距離(t)<閾値(k)の場合には、絵文字から単語Kiを推定可能、すなわち置換可能であると判定して、ステップ416へ移行する。一方、距離(t)≧閾値(t)の場合には、絵文字から単語Kiを推定不可、すなわち置換不可であるため、絵文字の付加を行うと判定して、ステップ418へ移行する。
【0048】
ステップ416では、絵文字に置換する単語の位置を示す位置IDとしてKiと、上記ステップ406で抽出された、または上記ステップ410で選択された絵文字とを、単語置換絵文字記憶部24に記憶する。例えば、単語K4=「車」について、車を表現する絵文字に置換可能であると判定された場合には、図11に示すように、単語置換絵文字記憶部24に記憶される。
【0049】
一方、ステップ418では、絵文字を付加する単語の位置を示す位置IDとしてKiと、上記ステップ406で抽出された、または上記ステップ410で選択された絵文字とを、付加絵文字記憶部26に記憶する。例えば、単語K1=「晴れ」について、晴れを表現する絵文字を付加すると判定された場合には、図12に示すように、付加絵文字記憶部26に記憶される。
【0050】
次に、ステップ420で、iがmになったか否かを判定することにより、入力文の全ての単語について処理を終了したか否かを判定する。i≠mの場合には、ステップ422へ移行して、iを1インクリメントして、ステップ404へ戻って処理を繰り返す。i=mとなった場合には、絵文字付与文生成処理(図5)へリターンし、ステップ600へ移行する。
【0051】
ここで、図13を参照して、単語一致絵文字置換付加処理(図9)のステップ500で実行される単語近距離絵文字付加処理ルーチンについて説明する。
【0052】
ステップ502で、単語Kiと絵文字語義辞書に含まれる語義各々との意味的な距離を算出する。具体的には、上記ステップ410の処理過程で得られた単語Kiの概念ベクトルaKiと、同様の処理により求められる語義の概念ベクトルとの距離(o)を算出する。
【0053】
次に、ステップ504で、上記ステップ502で算出した距離(o)が閾値(Y)より小さい絵文字が存在するか否かを判定する。この判定は、単語と一致する語義を含む絵文字ではないが、単語に付加して用いることでその単語を強調する役割を果たす絵文字が存在するか否かを判定するものである。閾値(Y)はこの判定のための値を学習処理等により予め定めておく。距離(o)<閾値(Y)の絵文字が存在する場合には、その絵文字を抽出して、ステップ506へ移行する。
【0054】
ステップ506では、絵文字を付加する単語の位置を示す位置IDとしてKiと、上記ステップ506で抽出された絵文字とを、付加絵文字記憶部26に記憶して、単語一致絵文字置換付加処理(図9)へリターンして、ステップ420へ移行する。一方、上記ステップ504で、距離(o)<閾値(Y)の絵文字が存在しないと判定された場合には、ステップ506をスキップして、そのままリターンする。
【0055】
次に、図14を参照して、絵文字付与文生成処理(図5)のステップ600で実行される文脈絵文字付加処理ルーチンについて説明する。
【0056】
ステップ602で、入力文の文脈と絵文字語義辞書に含まれる絵文字各々との意味的な距離を算出する。具体的には、上記ステップ410の処理で得られた入力文の文脈を表現する特徴ベクトルと、ステップ410と同様の処理により求められる絵文字語義辞書に含まれる絵文字各々の概念ベクトルとの距離(u)を算出する。
【0057】
次に、ステップ604で、上記ステップ602で算出した距離(u)が閾値(V)より小さい絵文字が存在するか否かを判定する。この判定は、入力文全体を表現する絵文字が存在するか否かを判定するものである。閾値(V)はこの判定のための値を学習処理等により予め定めておく。距離(u)<閾値(V)の絵文字が存在する場合には、その絵文字を抽出して、ステップ606へ移行する。
【0058】
ステップ606では、上記ステップ604で抽出された絵文字を、図15に示すように、文末絵文字記憶部28に記憶する。なお、文末絵文字記憶部28に記憶される絵文字は、予め付加位置が定められているため(ここでは文末)、文字置換絵文字記憶部22、単語置換絵文字記憶部24、及び付加絵文字記憶部26とは異なり、絵文字を置換または付与する位置を示す位置IDの項目は含まれない。そして、絵文字付与文生成処理(図5)へリターンして、ステップ700へ移行する。一方、上記ステップ604で、距離(u)<閾値(V)の絵文字が存在しないと判定された場合には、ステップ606をスキップして、そのままリターンする。
【0059】
次に、図16を参照して、絵文字付与文生成処理(図5)のステップ700で実行される生成処理ルーチンについて説明する。
【0060】
ステップ702で、文字置換絵文字記憶部22に記憶された絵文字を読み出し、記憶された位置IDが示す文字と絵文字とを置換する。例えば、図17(a)に示すように、入力文の文字「!」が絵文字に置換される。
【0061】
次に、ステップ704で、単語置換絵文字記憶部24に記憶された絵文字を読み出す。次に、ステップ706で、上記ステップ704で読み出した絵文字が、上記ステップ702の文字と絵文字との置換処理で既に付与済みの絵文字か否かを判定する。付与されていない絵文字の場合には、ステップ708へ移行し、記憶された位置IDが示す単語と絵文字とを置換する。例えば、図17(b)に示すように、入力文の単語「車」が絵文字に置換される。一方、既に付与済みの絵文字の場合には、ステップ708をスキップして、ステップ710へ移行する。
【0062】
ステップ710では、付加絵文字記憶部26に記憶された絵文字を読み出す。次に、ステップ712で、上記ステップ710で読み出した絵文字が、上記ステップ702の文字と絵文字との置換処理、または上記ステップ708の単語と絵文字との置換処理で既に付与済みの絵文字か否かを判定する。付与されていない絵文字の場合には、ステップ714へ移行し、記憶された位置IDが示す単語の後に絵文字を付加する。例えば、図17(c)に示すように、入力文の単語「晴れ」の後に絵文字が付加される。一方、既に付与済みの絵文字の場合には、ステップ714をスキップして、ステップ716へ移行する。
【0063】
ステップ716では、文末絵文字記憶部28に記憶された絵文字を読み出す。次に、ステップ718で、上記ステップ716で読み出した絵文字が、上記ステップ702の文字と絵文字との置換処理、上記ステップ708の単語と絵文字との置換処理、または上記ステップ714の単語への絵文字の付加処理で既に付与済みの絵文字か否かを判定する。付与されていない絵文字の場合には、ステップ720へ移行し、入力文の文末に絵文字を付加する。例えば、図17(d)に示すように、文末に絵文字が付加される。一方、既に付与済みの絵文字の場合には、ステップ720をスキップして、ステップ722へ移行する。
【0064】
ステップ722では、入力文に対して絵文字が置換または付加されることにより生成された絵文字付与文を出力して、処理を終了する。
【0065】
以上説明したように、本実施の形態の絵文字付与文生成装置によれば、単語の概念ベクトルと絵文字の概念ベクトルとの距離が閾値より小さい場合には、単語と絵文字とを置換し、距離が閾値以上の場合には、単語に絵文字を付加するように、絵文字の付与方法を使い分けるため、絵文字だけで単語を表現できる場合には、単語を絵文字で置換し、絵文字だけでは単語を推定することが困難な場合には、単語に絵文字を付加するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0066】
また、単語と絵文字の語義とが一致しない場合でも、単語の概念ベクトルと絵文字の語義の概念ベクトルとの距離が近い絵文字を単語に付加するため、単語に近い意味を持った絵文字により単語を強調するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0067】
また、入力文全体の文脈を表現する特徴ベクトルと絵文字の概念ベクトルとの距離が近い絵文字を文末に付与するため、文章全体の意味を反映した絵文字を付与するという、実際の絵文字の用法に沿った絵文字の付与を行うことができる。
【0068】
また、単語単位や文単位だけでなく、文字単位でも絵文字との置換を行うため、より細やかな絵文字付与を行うことができる。
【0069】
なお、上記実施の形態では、単語に絵文字を付加する場合に、単語の後に付加する場合について説明したが、単語の前に付加するようにしてもよい。また、入力文全体を表現する絵文字を付加する場合に、入力文の末尾に付加する場合について説明したが、入力文の先頭に付加するようにしてもよい。また、入力文一文全体を表現する絵文字を付加する場合について説明したが、入力文を文節毎に分解し、各文節を表現する絵文字を各文節の前または後に付加するようにしてもよい。
【0070】
また、上記実施の形態では、単語一致絵文字置換付与処理において、絵文字を置換するか付加するかを決定する際に、単語及び絵文字の概念ベクトルを求めて、単語と絵文字との意味的な距離を算出する場合について説明したが、概念ベクトルまたは絵文字と語義との意味的な距離を予め登録しておいてもよい。例えば、絵文字語義辞書に、[「絵文字(b)」:「語義1(c1)」,「語義2(c2)」,「語義3(c3)」] (( )内は概念ベクトル)のように登録しておくことができる。この場合、入力文中のある単語が絵文字語義辞書の語義1と一致した場合には、その単語と絵文字との意味的な距離(t)を、絵文字語義辞書に登録された概念ベクトルbと概念ベクトルc1との距離として算出することができる。また、[「絵文字」:「語義1(t1)」,「語義2(t2)」,「語義3(t3)」] (( )内は絵文字との意味的な距離)のように登録しておくこともできる。この場合、入力文中のある単語が絵文字語義辞書の語義1と一致した場合には、その単語と絵文字との意味的な距離(t)は、絵文字語義辞書に登録された(t1)をそのまま用いることができる。
【0071】
また、上記実施の形態では、単語一致絵文字置換付加部及び単語近距離絵文字付加部の処理において、入力文に含まれる全ての単語を対象として処理する場合について説明したが、自立語である単語のみを処理対象とするようにしてもよい。
【0072】
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0073】
また、上述の絵文字付与文生成装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
【0074】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
【符号の説明】
【0075】
10 絵文字付与文生成装置
12 形態素解析部
14 文字絵文字置換部
16 単語一致絵文字置換付加部
18 単語近距離絵文字付加部
20 文脈絵文字付加部
22 文字置換絵文字記憶部
24 単語置換絵文字記憶部
26 付加絵文字記憶部
28 文末絵文字記憶部
30 絵文字付与文生成部

【特許請求の範囲】
【請求項1】
絵文字と該絵文字が表す少なくとも1つの語義との組を複数記憶した絵文字語義記憶手段から、入力文に含まれる単語と一致する語義を表す絵文字を抽出する一致絵文字抽出手段と、
前記一致絵文字抽出手段により抽出された絵文字の意味的特徴量、及び前記単語の意味的特徴量から求まる該絵文字と該単語との意味的な距離が、予め定めた絵文字単語距離閾値より小さい場合には、前記絵文字の付与方法を置換に決定し、前記距離が前記絵文字単語距離閾値以上の場合には前記絵文字の付与方法を付加に決定する決定手段と、
前記決定手段により置換に決定された場合には、前記単語を前記一致絵文字抽出手段により抽出された絵文字に置換し、前記決定手段により付加に決定された場合には、前記単語の前または後に前記一致絵文字抽出手段により抽出された絵文字を付加することにより、前記入力文に絵文字を付与した絵文字付与文を生成する生成手段と、
を含む絵文字付与文生成装置。
【請求項2】
前記入力文に含まれる単語と一致する語義を表す絵文字が、前記一致絵文字抽出手段により抽出されなかった場合に、前記絵文字語義記憶手段に記憶された語義各々の意味的特徴量、及び前記単語の意味的特徴量から求まる該語義各々と該単語との意味的な距離が、予め定めた語義単語距離閾値より小さい語義を表す絵文字を、前記絵文字語義記憶手段から抽出する近距離絵文字抽出手段を含み、
前記生成手段は、前記単語の前または後に前記近距離絵文字抽出手段により抽出された絵文字を付加する
請求項1記載の絵文字付与文生成装置。
【請求項3】
前記絵文字語義記憶手段に記憶された絵文字各々の意味的特徴量、及び前記入力文の文脈を示す特徴量から求まる該絵文字各々と該入力文との意味的な距離が、予め定めた絵文字文脈距離閾値より小さい絵文字を、前記絵文字語義記憶手段から抽出する文脈絵文字抽出手段を含み、
前記生成手段は、前記入力文の先頭または末尾に、前記文脈絵文字抽出手段により抽出された絵文字を付加する
請求項1記載または請求項2記載の絵文字付与文生成装置。
【請求項4】
一致絵文字抽出手段と、決定手段と、生成手段とを含む絵文字付与文生成装置における絵文字付与文生成方法であって、
前記一致絵文字抽出手段は、絵文字と該絵文字が表す少なくとも1つの語義との組を複数記憶した絵文字語義記憶手段から、入力文に含まれる単語と一致する語義を表す絵文字を抽出し、
前記決定手段は、前記一致絵文字抽出手段により抽出された絵文字の意味的特徴量、及び前記単語の意味的特徴量から求まる該絵文字と該単語との意味的な距離が、予め定めた絵文字単語距離閾値より小さい場合には、前記絵文字の付与方法を置換に決定し、前記距離が前記絵文字単語距離閾値以上の場合には前記絵文字の付与方法を付加に決定し、
前記生成手段は、前記決定手段により置換に決定された場合には、前記単語を前記一致絵文字抽出手段により抽出された絵文字に置換し、前記決定手段により付加に決定された場合には、前記単語の前または後に前記一致絵文字抽出手段により抽出された絵文字を付加することにより、前記入力文に絵文字を付与した絵文字付与文を生成する
絵文字付与文生成方法。
【請求項5】
近距離絵文字抽出手段をさらに含む絵文字付与文生成装置における絵文字付与文生成方法であって、
前記近距離絵文字抽出手段は、前記入力文に含まれる単語と一致する語義を表す絵文字が、前記一致絵文字抽出手段により抽出されなかった場合に、前記絵文字語義記憶手段に記憶された語義各々の意味的特徴量、及び前記単語の意味的特徴量から求まる該語義各々と該単語との意味的な距離が、予め定めた語義単語距離閾値より小さい語義を表す絵文字を、前記絵文字語義記憶手段から抽出し、
前記生成手段は、前記単語の前または後に前記近距離絵文字抽出手段により抽出された絵文字を付加する
請求項4記載の絵文字付与文生成方法。
【請求項6】
文脈絵文字抽出手段をさらに含む絵文字付与文生成装置における絵文字付与文生成方法であって、
前記文脈絵文字抽出手段は、前記絵文字語義記憶手段に記憶された絵文字各々の意味的特徴量、及び前記入力文の文脈を示す特徴量から求まる該絵文字各々と該入力文との意味的な距離が、予め定めた絵文字文脈距離閾値より小さい絵文字を、前記絵文字語義記憶手段から抽出し、
前記生成手段は、前記入力文の先頭または末尾に、前記文脈絵文字抽出手段により抽出された絵文字を付加する
請求項4記載または請求項5記載の絵文字付与文生成方法。
【請求項7】
コンピュータを、請求項1〜請求項3のいずれか1項記載の絵文字付与文生成装置を構成する各手段として機能させるための絵文字付与文生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−208639(P2012−208639A)
【公開日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2011−72741(P2011−72741)
【出願日】平成23年3月29日(2011.3.29)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】