説明

オノマトペ自動生成システム

【課題】ユーザが入力した印象評価値に近いオノマトペを生成して提示する。
【解決手段】オノマトペを特定する特徴値配列を所定の発生条件に基づいて発生させたオノマトペデータを所定数生成することで初期状態のオノマトペ群を生成する手段と、ユーザから所望するオノマトペの印象評価値を入力する手段と、オノマトペデータについて個々に印象評価値を算出する手段と、算出した個々のオノマトペデータの印象評価値とユーザから入力された印象評価値との類似度を算出する手段と、算出された類似度に基づいて、オノマトペデータの類似度がオノマトペ群全体として高くなるように、個々のオノマトペデータのうちの少なくとも一部を更新する手段と、所定の終了条件を満たすまで、上記の各手段の処理を繰り返す手段と、終了条件を満たした時点のオノマトペ群のオノマトペデータを出力する手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータを用いてオノマトペ(擬音語・擬態語)を自動生成する技術に関する。
【背景技術】
【0002】
日本語は「ふんわり」や「さらさら」などといったオノマトペ表現が豊富に存在する言語であるとされる(非特許文献1)。オノマトペは音によって実際の音声や心情、様子などを象徴的に表した言語表現であり、新聞・雑誌などの活字媒体や宣伝広告、さらには俳句・詩歌・漫画・絵本などの文学作品といった幅広い分野で頻繁に利用されている。また、日常会話においても、ありありとした情景や、心身の具体的な状態などを描写するため頻繁に用いられる表現である。このように、オノマトペは日本語における言語表現として独特ながら重要な位置を占めているといえる。
【0003】
オノマトペを感覚的たらしめる特徴のひとつとして、音象徴がある。日本語のオノマトペは多様に見えるが、ほとんどのオノマトペは、オノマトペの基本的な意味と結びつく数音からなる基本形の組み合わせで構成され、そこにオノマトペの付随的な意味と結びつく要素が組み合わさることによって構成されている。たとえば「ふんわり」というオノマトペは、「ふわ」という2モーラ(「モーラ」とは音節単位を表し、基本的に一母音と一子音との組み合わせにより「1モーラ」が構成される。)の基本形に撥音要素(「ん」)と語末の「り」要素が組み合わさることで構成される。一般的に言語表現を構成する音韻と、その表現によって表される意味との間の関係は恣意的なものであるとされてきたが、オノマトペにおいては音韻と意味に何らかの関係性が見られる場合がある。
【0004】
オノマトペを特徴づける独特の音韻形態を体系化し、それぞれの音韻形態により表わされる独自の意味が提示されている(非特許文献2)。
【0005】
また、日本語のオノマトペ表現について、特定の音素や、音素の組み合わせが特有の音象徴的意味を喚起するとし、日本語オノマトペの音象徴が体系化され、あるオノマトペの基本的な音象徴的意味はそのオノマトペの形態と音韻の構成から予測できることが示されている(非特許文献3)。図1は日本語オノマトペ音素の音象徴的意味の例を示したものであり、特定の母音および子音についての音象徴的意味を示している。
【0006】
さらに、評価実験により、各音韻特性要素の有無がオノマトペの印象に与える影響を数値化し、この数値の線形和で当該オノマトペのイメージが決定されると仮定することで、オノマトペの音韻と印象評価値との関係がモデル化されている(非特許文献4)。
【0007】
オノマトペは生き生きとした表現が必要とされる分野で効果的に用いられる。商品名や商品広告に使われるキャッチコピーは、できるだけ簡潔な表現で、なおかつ見た人がすぐに商品のことを理解できるような具体的な描写力を持った、インパクトのある表現であることが望まれる(非特許文献5)。このような表現のひとつがオノマトペである。表したいイメージに適合し、かつ新奇性のあるオノマトペ表現を創作し用いることによって、受け手の感性に直接的にうったえかけることができる。オノマトペは感覚的で曖昧な表現であるため,新しいオノマトペ表現の創作は個人の感覚に依存するところが大きいとされる(非特許文献6)。よって、オノマトペによる表現が必要とされる分野では、クリエイター自身の主観的な感性によって表現を創り出すことが多く、客観的な評価の基準が少ないと考えられる。
【0008】
また、オノマトペは、多くの日本人にとって意味が直感的に理解できることが多いものの、日本語を母語としない話者が理解するためには学習を必要とする。近年では、日本語を非母語とする学習者向けに日本語オノマトペを扱う教材がある(非特許文献7)。また、一般的なオノマトペを網羅してその意味や用法を解説した辞書・辞典が出版されている(非特許文献8、9)。しかし、これらは日本語で記述されているため、日本語の非母語話者が読んで理解することは難しい。そのため、非母語話者にとって、オノマトペを客観的に理解する手段が少ないのが現状である。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2010-256957,坂本真樹・清水祐一郎:オノマトペのイメージ評価システム、イメージ評価装置、およびイメージ評価用プログラム、2010.
【非特許文献】
【0010】
【非特許文献1】田守育啓: 日本語オノマトペ ‐多様な音と様態の表現‐,日本音響学会誌,54(3), pp.215-222,1998.
【非特許文献2】田守育啓・Lawrence Schourup. 『オノマトペ 形態と意味』. くろしお出版.1999.
【非特許文献3】Shoko Hamano: The Sound-symbolic System of Japanese,Doctoral dissertation,Gainesville,University of Florida,1986.
【非特許文献4】藤沢望,尾畑文野,高田正幸,岩宮眞一郎: 2モーラの擬音語からイメージされる音の印象,日本音響学会誌,62(11),pp.774-783,2006.
【非特許文献5】田守育啓: オノマトペ 擬音・擬態語をたのしむ,東京:岩波書店,2002.
【非特許文献6】那須昭夫: 新しく生まれるオノマトペ - 新造語の音韻特徴(特集 おのまとぺ),國文學:解釈と教材の研究,53(14),pp.24-32,2008.
【非特許文献7】山口仲美:暮らしのことば 擬音・擬態語辞典,東京,講談社,2003.
【非特許文献8】飛田良文・浅田鶴子:現代擬音語擬態語用法辞典,東京,東京堂出版,2002.
【非特許文献9】阿久津智:絵でわかる ぎおんご・ぎたいご 日本語の表現力が身につくハンドブック,東京,アルク,1994.
【発明の概要】
【発明が解決しようとする課題】
【0011】
上述したように、日本語のオノマトペの音韻形態を分析する技術や、オノマトペの音韻とその音韻により表される意味や印象評価値との関係について、学術的な観点から整理することを試みた研究もいくつか行われている。
【0012】
しかしながら、これを実際の製品に応用しようとする試みはなされておらず、例えば、創作したオノマトペがどのような音韻形態を有しているか分析し、その音韻形態に基づいて、そのオノマトペの意味やイメージを特定可能な技術が望まれていた。
【0013】
そこで、本発明者は、ユーザが入力したオノマトペについて、音韻と意味の関係から予測されるイメージを定量的評価と定性的評価から同時に行うシステムを実装した(特許文献1)。
【0014】
しかし、このシステムはオノマトペ表現を入力するとその印象を評価し出力することができるものの、その逆の処理であるユーザが所望する印象評価値に合致したオノマトペ表現の生成を行うことはできなかった。
【0015】
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、ユーザが入力した印象評価値に近いオノマトペを生成して提示することのできるオノマトペ自動生成システムを提供することにある。
【課題を解決するための手段】
【0016】
上記の課題を解決するため、本発明にあっては、オノマトペを特定する特徴値配列を所定の発生条件に基づいて発生させたオノマトペデータを所定数生成することで初期状態のオノマトペ群を生成する初期状態オノマトペ群生成手段と、ユーザから所望するオノマトペの印象評価値を入力する印象評価値入力手段と、前記オノマトペ群に含まれるオノマトペデータについて個々に印象評価値を算出する印象評価値算出手段と、算出した個々のオノマトペデータの印象評価値と前記ユーザから入力された印象評価値との類似度を算出する類似度算出手段と、算出された類似度に基づいて、前記オノマトペ群に含まれるオノマトペデータの前記類似度が前記オノマトペ群全体として高くなるように、前記オノマトペ群に含まれる個々のオノマトペデータのうちの少なくとも一部を更新する更新手段と、所定の終了条件を満たすまで、前記印象評価値算出手段、前記類似度算出手段および前記更新手段の処理を繰り返す最適化制御手段と、前記終了条件を満たした時点の前記オノマトペ群のオノマトペデータを出力する出力手段とを備える。
【発明の効果】
【0017】
本発明のオノマトペ自動生成システムにあっては、ユーザが入力した印象評価値に近いオノマトペを生成して提示することができ、ユーザの表現したいイメージにあてはまる、新奇性のあるオノマトペ表現の創作を支援することができる。
【図面の簡単な説明】
【0018】
【図1】日本語オノマトペ音素の音象徴的意味の例を示す図である。
【図2】オノマトペの遺伝子個体配列の定義の例を示す図である。
【図3】本発明の一実施形態にかかるオノマトペ生成システムの構成例を示す図である。
【図4】オノマトペ生成システムを実現する情報処理装置200の構成例を示す図である。
【図5】本発明の実施形態の処理例を示すフローチャートである。
【図6】「オノマトペ群から印象評価値の算出」の処理例を示すフローチャートである。
【図7】オノマトペデータのデータ構造例を示す図である。
【図8】ユーザから入力される印象評価値のデータ構造例を示す図である。
【図9】オノマトペ形態データのデータ構造例を示す図である。
【図10】定量評価データのデータ構造例を示す図である。
【図11】オノマトペの選択・交叉・突然変異の例を示す図である。
【図12】印象評価を個別に行う場合の出力画面の例を示す図である。
【発明を実施するための形態】
【0019】
以下、本発明の好適な実施形態につき説明する。
【0020】
<オノマトペ生成の原理>
オノマトペ生成システムは、ユーザの入力した印象評価値に適合した音素と形態をもち、なおかつオノマトペとしての一般的な構造を保った表現を複数個生成し、ユーザに提示する。本システムでは起動時に無作為に生成された初期オノマトペ群に対し、ユーザがシステム上で入力した印象評価値を目的として、遺伝的アルゴリズムによりオノマトペ群の最適化を試みることによってユーザの印象評価値へ近づけてゆく。
【0021】
システムが生成したオノマトペ群の個々のオノマトペをユーザの入力した印象評価値と比較するため、個々のオノマトペの印象評価値を算出する必要があり、本発明者が既に開発したイメージ評価システムの技術を用いている(特許文献1参照)。イメージ評価システムは、ユーザが任意に創作したオノマトペ表現を入力として、オノマトペ表現を構成する音素と形態を解析し、音象徴によって音素が喚起する印象を定量的に評価する。これらの印象を総合して得られたオノマトペ表現全体の印象を評価結果としてユーザに提示する。
【0022】
<オノマトペの最適化手法>
オノマトペの最適化は、システムの起動時にシステム内部で無作為に生成した初期オノマトペ群を、ユーザが入力した印象評価値を目的とした遺伝的アルゴリズムによって淘汰していくことによって試みられる。
【0023】
遺伝的アルゴリズムは、アルゴリズム内における世代(1回の淘汰が行われる一連の処理)ごとに、各遺伝子個体の適応度を算出し、適応度の低い、すなわち最適ではない遺伝子個体を淘汰してゆく。世代ごとに淘汰を繰り返すことにより、最終的にオノマトペ群に存在する遺伝子個体すなわちオノマトペ表現は、ユーザの入力した印象評価値に適合した表現となることが見込まれる。
【0024】
適応度は、ユーザが入力した印象評価値と、オノマトペ群における遺伝子個体すなわちオノマトペ表現の印象評価値とをそれぞれベクトルと考え、両者の類似度をコサイン尺度により計算し、類似度の高いものを適応度の高い遺伝子個体とする。ここで、オノマトペ表現の印象評価値の算出には、前述のイメージ評価システムの技術を用いる。適応度の評価は世代ごとに実行され、各世代のオノマトペ群の遺伝子個体それぞれの適応度が計算される。
【0025】
遺伝的アルゴリズムでは、遺伝子個体の淘汰の方法として、適応度をもとにした選択・交叉を行う。これは、適応度の高い遺伝子個体が次の世代に残るように親となる遺伝子個体を選択し、交叉によって子となる遺伝子個体を生み出す操作である。本システムでは、例えば、適応度の高い遺伝子個体2つを親の遺伝子個体として選択して、子の遺伝子個体を2つ生成したのち、適応度の最も低い遺伝子個体2つを子の遺伝子個体と置き換えることによって、適応度の低い遺伝子個体を淘汰していく。
【0026】
親の遺伝子個体の選択手法として、適応度に比例した選択を行う。これは、算出された全遺伝子個体の適応度を用い、ある遺伝子個体が親として選択される確率が、その遺伝子個体の適応度に比例するようにする手法である。適応度が高い遺伝子個体であるほど親として選択される確率が高まるため、オノマトペ群全体として適応度が高くなりやすい。
【0027】
子となる遺伝子個体は親の遺伝子個体の交叉によって生まれる。遺伝子個体の交叉とは、選択によって選ばれた親の遺伝子個体の遺伝子配列の一部を採り、そこから子の遺伝子個体の遺伝子配列を作り出す操作のことをいう。本システムでは、もっとも基本的な交叉である1点交叉を採用した。1点交叉では、遺伝子配列上の無作為な位置に交叉点をとり、その前後で親の遺伝子個体の遺伝子配列を入れ替える手法である。交叉によって親の遺伝子個体の特性をある程度受け継ぎつつ、新しい特性をもった遺伝子個体を生成することができる。
【0028】
最後に、本システムには遺伝子個体の突然変異を導入している。突然変異とは、一定の確率で遺伝子個体に無作為な変化を与えることで、その時点でのオノマトペ群には存在しない特性をもちうる遺伝子個体を新たに生じさせる操作である。突然変異の導入により、新奇性があり、変化に富んだオノマトペ表現の候補が生成できると考えられる。
【0029】
<オノマトペのデータ表現>
本システムで扱うオノマトペ表現の構成音素は、母音(V)/a/、/i/、/u/、/e/、/o/、子音(C)/k/、/g/、/s/、/z/、/t/、/d/、/n/、/h/、/b/、/p/、/m/、/r/、/w/、拗音つき子音/ky/、/gy/、/sy/、/zy/、/ty/、/dy/、/ny/、/hy/、/by/、/py/、/my/、/ry/、促音「っ」/Q/、撥音「ん」/N/、長音「ー」/R/、語末の「り」/ri/の全34音である。例えば、「ふんわり」というオノマトペの構成は/h/ /u/ /N/ /w/ /a/ /ri/となる。
【0030】
図2はオノマトペの遺伝子個体配列の定義の例を示す図である。
【0031】
オノマトペ表現を遺伝的アルゴリズムで最適化するために、遺伝子個体を模した数値配列データによってオノマトペ表現を扱うこととした。オノマトペ遺伝子個体の配列は、17列の整数値データ(0〜9の範囲)からなる。配列の各列がオノマトペを構成する要素に対応し、各列の数値が構成要素の種類や有無などを決定する。このようにして、配列の数値がすべて決定されるとオノマトペ表現がひとつ決定される。配列の各列の数値と対応するオノマトペの構成要素の関係を図2は示している。
【0032】
なお、「モーラ」とは音節単位を表し、基本的に一母音と一子音との組み合わせにより「1モーラ」が構成される。また、反復とは1モーラまたは2モーラで構成された形態を繰り返すことである。撥音とは「ん」、促音とは「っ」、長音とは「ー」に相当する。「〜り」とは、2モーラを基本形とするオノマトペに付与される語末の「り」(/ri/)に相当する。この語末の「〜り」は、オノマトペ特有の音韻形態を構成音素として、遺伝子配列上においても独立した要素として表したものであり、「ゆったりした動き」や「動作の完了」を意味する。
【0033】
例として、生成された遺伝子配列が{7,1,2,2,4,5,0,3,2,8,6,3,4,9,6,7,1}の場合、オノマトペは「しゅるりーん」(モーラ数:2、反復:なし、1モーラ目子音:/s/、濁音:なし、拗音:あり、母音:/u/、長音:なし、撥音:なし、促音:なし、2モーラ目子音:/r/、濁音:あり(無視)、拗音:なし、母音:/u/、「〜り」:あり、長音:あり、撥音:あり、促音:なし、に相当)に決定される。
【0034】
また、以下に挙げた場合は特殊な処理を行う。特殊な処理は、オノマトペの遺伝子個体配列を評価する際に行われる。
【0035】
・子音が/h/と決定されたとき、濁音としては濁音(バ行)と半濁音(パ行)の2種類がありうる。このため、子音が/h/であり、かつ濁音ありのとき、等確率で濁音・半濁音の場合に分かれるように取り扱う。
【0036】
・オノマトペのモーラ数が1モーラであるとき、2モーラ目の構成要素を決定する10〜17列目の数値は無視する。
【0037】
・子音が、濁音化することのない/n/、/m/、/y/、/r/、/w/であるとき、濁音の有無を決定する4列目または11列目は無視する。
【0038】
<印象評価値の算出手法>
本システムではさまざまなオノマトペ表現の印象を定量的に評価するため、非特許文献4による擬音語の印象に関する研究による、擬音語の音韻特性と印象評価尺度の関係を印象評価処理のためのデータとして用いた。
【0039】
非特許文献4では、擬音語の印象を評価するための尺度として、以下に挙げる15個の形容詞対について、7段階カテゴリ尺度を設定している。
【0040】
・きたない − きれいな
・ざらざらした − 滑らかな
・暗い − 明るい
・粗い − きめの細かい
・濁った − 澄んだ
・不快な − 快い
・やわらかい − かたい
・丸みのある − とげとげしい
・鈍い − 鋭い
・軽い − 重い
・細い − 太い
・弱々しい − 力強い
・静かな − 騒々しい
・乾いた − 潤いのある
・地味な − 派手な
【0041】
これらの形容詞対はいずれも音色評価に関する研究で用いられているものであり、擬音語の印象をとらえるために十分であるとされる。
【0042】
非特許文献4では、2モーラの擬音語(子音音素+母音音素+語尾/N/、/Q/、/R/;例えば「パッ」や「カン」など)について印象評価実験を行い、擬音語を構成する音韻特性のもつカテゴリ数量の線形和によって、擬音語の印象評価値の予測を与えるモデルを次式のように考えた。
【0043】
【数1】

ここで
【0044】
【数2】

は、ある評価尺度における印象の評価値である。そして、X〜Xは音韻特性のカテゴリ数量を表し、それぞれ子音の種類、濁音・半濁音の有無、拗音の有無、母音の種類、語尾の種類が擬音語の印象に与える影響の大きさを、評価尺度対ごとに数値化したものである。これら5つのカテゴリ数量および定数項Constの線形和によって、2モーラの擬音語の印象が決定されるという予測モデルである。このモデルに基づき、数量化理論第I類を用いて、音韻特性と評価尺度の関係をカテゴリ数量として求めたものを定量評価データ(117)(図10)として予め用意しておく。
【0045】
非特許文献4で行った印象評価実験では2モーラの擬音語を対象としているため、実験より得られた音韻特性のカテゴリ数量および上記モデルにおける印象評価値は、オノマトペ表現が2モーラのときの値である。このため本システムでは、入力された任意のモーラ数のオノマトペ表現について、X〜Xのカテゴリ数量を算出するとともに、入力されたオノマトペ表現のモーラ数Moraをカウントし、評価値の重みが2モーラの擬音語の場合と等しくなるよう、次式のようにモデルを正規化して評価値の補正を行う。この操作によって、2モーラのオノマトペだけでなく、任意のモーラ数のオノマトペを評価することを可能とする。
【0046】
【数3】

以上で述べた印象評価処理を15組の形容詞評価尺度それぞれに対して行い、計15個の印象評価値を得る。
【0047】
<システム構成>
図3は本発明の一実施形態にかかるオノマトペ生成システム100の構成例を示す図である。
【0048】
図3において、オノマトペ生成システム100は、機能部として、インターフェース部101と初期オノマトペ群生成部103と加工部108とオノマトペ最適化部109と印象評価値算出部118とを備えている。これらの機能部は、オノマトペ生成システム100を構成する、図4で後述する情報処理装置(コンピュータ)200のCPU(Central Processing Unit)202、ROM(Read Only Memory)203、RAM(Random Access Memory)204等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。このコンピュータプログラムは、CD−ROM等の記録媒体からインストールされたものであってもよいし、インターネット等を介して通信可能に接続されたサーバの記憶装置からダウンロードされ、インストールされたものであってもよい。
【0049】
インターフェース部101は、グラフィカルインターフェース部102を備え、ユーザUとの間で対話的に情報の入力および出力(表示等)を行う機能を有している。
【0050】
初期オノマトペ群生成部103は、一連のオノマトペ生成処理の初期に、初期状態のオノマトペ群を構成するオノマトペデータを無作為に生成してデータ記憶領域104に格納する機能を有している。データ記憶領域104には、オノマトペ群を構成するオノマトペデータ105の他、ユーザUからインターフェース部101を介して入力される印象評価値106や制約条件107も格納される。
【0051】
加工部108は、生成するオノマトペに制約条件(例えば、「ら」で始まるオノマトペに制限等)を付す場合に、ユーザUからインターフェース部101を介して入力されてデータ記憶領域104に格納された制約条件107に基づき、オノマトペ群を構成するオノマトペデータ105に対して加工を行う機能を有している。
【0052】
オノマトペ最適化部109は、最適化管理部110と選択部111と交叉部112と突然変異発生部113と淘汰(置換)部114とを備え、データ記憶領域104に格納されたオノマトペ群を構成するオノマトペデータ105に対し、選択・交叉・突然変異発生・淘汰(置換)を行ってオノマトペを最適化する機能を有している。
【0053】
最適化管理部110は、選択部111、交叉部112、突然変異発生部113および淘汰(置換)部114を制御し、予め設定された終了条件(例えば、「適応度が○○以上になるまで」、「○○世代になるまで」等)を満足するか否かにより最適化の終了を判断する機能を有している。
【0054】
選択部111は、データ記憶領域104に格納されたオノマトペ群を構成するオノマトペデータ105の中から所定の基準で所定数のオノマトペデータ105を選択する機能を有している。
【0055】
交叉部112は、選択部111により選択されたオノマトペデータ105から交叉処理を行って子のオノマトペを生成する機能を有している。
【0056】
突然変異発生部113は、交叉部112により生成されたオノマトペもしくはオノマトペ群から所定の基準で選択されたオノマトペデータ105に対して突然変異化を行う機能を有している。なお、突然変異発生部113による突然変異は常に行われるわけではなく、予め設定された所定の確率に基づいて突然変異が起こる。
【0057】
淘汰(置換)部114は、突然変異発生部113の処理を経たオノマトペにより、オノマトペ群を構成するオノマトペデータ105の中から所定の基準で選択したオノマトペデータ105を置き換える機能を有している。
【0058】
印象評価値算出部118は、印象評価管理部119と音韻形態解析部120と印象評価値算出部121とを備え、オノマトペ最適化部109の最適化管理部110から指示された、オノマトペデータ105もしくは文字列の状態のオノマトペにつき、印象評価値を算出する機能を有している。
【0059】
印象評価管理部119は、音韻形態解析部120および印象評価値算出部121を制御する機能を有している。
【0060】
音韻形態解析部120は、文字列の状態のオノマトペが入力された場合に、データ記憶領域115に格納されたオノマトペ形態データ116に基づいて音韻形態の解析を行う機能を有している。
【0061】
印象評価値算出部121は、評価対象のオノマトペデータ105もしくは文字列の状態のオノマトペの解析結果に基づき、データ記憶領域115に格納された定量評価データ117に基づいて印象評価値を算出する機能を有している。
【0062】
図4はオノマトペ生成システム100を実現する情報処理装置200の構成例を示す図である。
【0063】
図4において、情報処理装置200は、システムバス201に接続されたCPU202、ROM203、RAM204、NVRAM(Non-Volatile Random Access Memory)205、I/F(Interface)206と、I/F206に接続された、キーボード、マウス、モニタ、CD/DVD(Compact Disk/Digital Versatile Disk)ドライブ等のI/O(Input/Output Device)207、HDD208、NIC(Network Interface Card)209等を備えている。Mはプログラムもしくはデータが格納されたCD/DVD等のメディア(記録媒体)である。
【0064】
<動作>
図5は本発明の実施形態の処理例を示すフローチャートである。また、図6は図5における「オノマトペ群から印象評価値の算出」(ステップS107)の処理例を示すフローチャートである。
【0065】
図5において、処理を開始すると(ステップS101)、初期オノマトペ群生成部103は、オノマトペを特定する特徴値(図2で定義される17列の整数値データから構成される遺伝子個体配列)を無作為に発生させたオノマトペデータ105を所定数(例えば、300個)生成することで、初期状態のオノマトペ群を生成する(ステップS102)。
【0066】
図7はオノマトペデータ105のデータ構造例を示す図である。オノマトペデータ105は、「オノマトペID」「遺伝子個体配列」「印象評価値」「類似度」等の項目を含んでいる。「オノマトペID」は、個々のオノマトペを識別する情報である。「遺伝子個体配列」は、図2で定義される17列の整数値データである。「印象評価値」は、後に算出される印象評価値が設定される項目であり、初期状態ではブランクである。「類似度」は、後に算出される類似度が設定される項目であり、初期状態ではブランクである。所定数(例えば、300個)のオノマトペデータ105によりオノマトペ群が構成される。
【0067】
次いで、図5に戻り、インターフェース部101は、グラフィカルインターフェース部102によりユーザUから印象評価値を入力し、入力した印象評価値106をデータ記憶領域104に格納する(ステップS103)。なお、初期状態のオノマトペ群を生成し(ステップS102)、その後に印象評価値を入力する(ステップS103)としているが、先に印象評価値を入力し、その後に初期状態のオノマトペ群を生成してもよいし、両ステップを並列に行ってもよい。
【0068】
図8はユーザUから入力される印象評価値106のデータ構造例を示す図である。ここでは、オノマトペの印象を評価するための尺度として、非特許文献4に示された、以下に挙げる15個の形容詞対について、1〜7までの整数値による7段階カテゴリ尺度を設定し、各形容詞対についてユーザUが入力した整数値を連続させたものを印象評価値としている。なお、印象評価値の各カテゴリの値は、1〜7までの値に限るものではなく(例えば、1〜10でも可)、更に整数値とせずに小数点以下の数値を許容するようにしてもよい。また、新しい形容詞対を設定し、実験によりデータをとることで、新しい評価尺度を追加することができる。評価尺度として何を用いるかによっては、本システムは限定されない。
【0069】
・きたない − きれいな
・ざらざらした − 滑らかな
・暗い − 明るい
・粗い − きめの細かい
・濁った − 澄んだ
・不快な − 快い
・やわらかい − かたい
・丸みのある − とげとげしい
・鈍い − 鋭い
・軽い − 重い
・細い − 太い
・弱々しい − 力強い
・静かな − 騒々しい
・乾いた − 潤いのある
・地味な − 派手な
【0070】
次いで、図5に戻り、生成するオノマトペに制約条件(例えば、「ら」で始まるオノマトペに制限等)を付す場合に、インターフェース部101は、グラフィカルインターフェース部102によりユーザUから制約条件を入力し、入力した制約条件107をデータ記憶領域104に格納する(ステップS104)。制約条件としては、『先頭文字が「ら」』といった条件を記述したものとなる。
【0071】
次いで、生成するオノマトペに制約条件が付された場合に、加工部108は、ユーザUから入力されてデータ記憶領域104に格納された制約条件107に従って、データ記憶領域104に格納されたオノマトペ群を構成するオノマトペデータ105に加工を行う(ステップS105)。例えば、制約条件107が『先頭文字が「ら」』を示す場合、図2の定義に従い、全てのオノマトペデータ105につき、第3列(1モーラ目の子音)の値を強制的に「8」(/r/)に書き換え、第6列(1モーラ目の母音)の値を強制的に「0」(/a/)に書き換える。
【0072】
次いで、図5に戻り、オノマトペ最適化部109および印象評価値算出部118は、オノマトペ群に対して以下の最適化の処理を行う(ステップS106)。
【0073】
先ず、データ記憶領域104に格納されたオノマトペ群を構成するオノマトペデータ105の個々について印象評価値を算出し、オノマトペデータ105内の「印象評価値」の項目に設定する(ステップS107)。なお、既に印象評価値が算出されたオノマトペデータ105については、オノマトペに変化がない場合、再び印象評価値を算出する必要はない。
【0074】
図6により印象評価値の算出の処理例を説明する。
【0075】
図6において、処理を開始すると(ステップS201)、オノマトペ最適化部109の最適化管理部110の制御に基づき、印象評価値算出部118の印象評価管理部119は、印象評価値の算出の対象となるオノマトペを入力する(ステップS202)。印象評価値の算出の対象となるオノマトペとしては、初回は例えばオノマトペIDの小さい順に全てのオノマトペが対象となり、次回からは交叉・突然変異により変化のあったオノマトペのみを対象とすることができる。また、入力するオノマトペとしては、データ記憶領域104に格納されたオノマトペデータ105そのものの状態である場合の他、文字列に変換した状態としてもよい。
【0076】
次いで、文字列の状態のオノマトペを入力する場合、印象評価管理部119の制御のもと、音韻形態解析部120は、データ記憶領域115に格納されたオノマトペ形態データ116に基づいて音韻形態の解析を行う(ステップS203)。
【0077】
図9はオノマトペ形態データ116のデータ構造例を示す図である。文字列として入力したオノマトペの先頭文字から順にオノマトペ形態データ116の「ひらがな・カタナカ」の項目と比較し、一致したレコードの「音素」および「形態」の項目を取得し、これらの並びからオノマトペの特徴を取得する。例えば、オノマトペ「しゅるりーん」が入力された場合、モーラ数:2、反復:なし、1モーラ目子音:/s/、濁音:なし、拗音:あり、母音:/u/、長音:なし、撥音:なし、促音:なし、2モーラ目子音:/r/、濁音:あり(無視)、拗音:なし、母音:/u/、「〜り」:あり、長音:あり、撥音:あり、促音:なし、等を取得する。
【0078】
次いで、図6に戻り、印象評価管理部119の制御のもと、印象評価値算出部121は、データ記憶領域115に格納された定量評価データ117に基づいて印象評価値を算出し、算出した印象評価値を、オノマトペ最適化部109の最適化管理部110を介してもしくは直接に、データ記憶領域104のオノマトペデータ105の「印象評価値」の項目に格納する(ステップS204)。
【0079】
図10は定量評価データ117のデータ構造例を示す図である。オノマトペデータ105そのもの、もしくは文字列からの音韻形態の解析結果に基づき、各モーラについて、定量評価データ117の「子音行」「濁音・半濁音」「拗音」「母音」「語尾」の特徴の一致する数値と定数項の値を「評価尺度」毎に求め、前述した数式(数3)に基づいて印象評価値を算出する。なお、オノマトペデータが数値配列の場合、数値配列の位置・値とテーブルの項目とは、参照テーブル(図2に示したような数値配列のコード表)、または、ロジック(IF 数値配列の3桁目の値が1 THEN 「カ行」のようなもの)で対応づけを行う。
【0080】
次いで、図6に戻り、次の対象となるオノマトペがないかどうか判断し(ステップS205)、ある場合(ステップS205のNo)にはオノマトペの入力(ステップS202)に戻る。
【0081】
次の対象となるオノマトペがない場合(ステップS205のYes)、処理を終了する(ステップS206)。
【0082】
次いで、図5に戻り、印象評価値の算出(ステップS107)が終了すると、オノマトペ最適化部109の最適化管理部110は、ユーザUから入力されてデータ記憶領域104に格納された印象評価値106と、印象評価値算出部118により算出されてデータ記憶領域104の各オノマトペデータ105に格納された印象評価値との類似度を算出し、算出した類似度をデータ記憶領域104のオノマトペデータ105の「類似度」の項目に格納する(ステップS108)。類似度の算出の対象となるオノマトペとしては、初回は例えばオノマトペIDの小さい順に全てのオノマトペが対象となり、次回からは交叉・突然変異により変化のあったオノマトペのみを対象とすることができる。
【0083】
類似度は、例えば、ユーザUから入力された印象評価値106とオノマトペデータ105の印象評価値とを、それぞれ多次元(15次元)のベクトルと考え、両者の類似度をコサイン尺度により計算する。より具体的には、ユーザUから入力された印象評価値106のベクトルをA、オノマトペデータ105の印象評価値のベクトルをBとした場合、
A・B / (|A|*|B|)
で算出する。ここで、A・BはベクトルA、Bの内積、|A|はベクトルAの長さ(ノルム)、|B|ベクトルBの長さ(ノルム)である。
【0084】
次いで、最適化管理部110は、終了条件を満足したかどうか判断する(ステップS109)。
【0085】
終了条件を満足していないと判断した場合(ステップS109のNo)、最適化管理部110制御のもと、選択部111は、データ記憶領域104に格納されたオノマトペデータ105から、例えば、類似度の高いものほど選択される確率を高く設定した確率に基づいて、例えば、2つのオノマトペデータ105を選択する(ステップS110)。
【0086】
次いで、最適化管理部110の制御のもと、交叉部112は、選択された例えば2つのオノマトペデータ105から、例えば、1点交叉により2つの子のオノマトペを生成する(ステップS111)。
【0087】
図11(a)は、ID「191」の「ひぇーんっいりん」のオノマトペとID「54」の「りゅーっいりーんっ」のオノマトペが選択され、無作為に選ばれた矢印の位置で1点交叉が行われる状態を示している。それぞれのオノマトペの遺伝子個体配列の矢印の位置より前の数列と矢印の位置より後ろの数列とが2つのオノマトペの間で交換されることで、図11(b)に示すように「ひぇーっいりーんっ」「りゅーんっいりん」の2つの子のオノマトペが生成されている。
【0088】
なお、処理開始時にユーザUから制約条件が入力されている場合には、交叉部112は、加工部108と同様に(加工部108の機能を利用することも可能)、ユーザUから入力されてデータ記憶領域104に格納された制約条件107に従って、交叉によって生成したオノマトペに対して加工を行う。
【0089】
次いで、図5に戻り、最適化管理部110の制御のもと、突然変異発生部113は、交叉により生成された子のオノマトペに対して突然変異を発生させる(ステップS112)。突然変異は、所定の確率で発生させ(常に発生するわけではない)、オノマトペの遺伝子個体配列上の無作為に決定される1もしくは複数の位置の値を無作為に変化させることで行う。
【0090】
図11(b)の2つの子のオノマトペは矢印で示す位置に突然変異が発生するものとしており、図11(c)に示すように突然変異が発生した位置の値が変化することで、オノマトペが変化する。ただし、突然変異が発生する位置によってはオノマトペに変化が生じない場合もあり、図11(c)の上段のオノマトペに変化はなく、下段のオノマトペは「りゅーんっいりん」から「じゅーんっいりん」に変化している。
【0091】
なお、処理開始時にユーザUから制約条件が入力されている場合には、突然変異発生部113は、加工部108と同様に(加工部108の機能を利用することも可能)、ユーザUから入力されてデータ記憶領域104に格納された制約条件107に従って、突然変異によって生成したオノマトペに対して加工を行う。
【0092】
次いで、図5に戻り、最適化管理部110の制御のもと、淘汰(置換)部114は、データ記憶領域104に格納されたオノマトペデータ105から、例えば、類似度の低い順に、生成された子のオノマトペの数のオノマトペデータ105を選択し、子のオノマトペ(突然変異化後)に置き換え、オノマトペデータ105を更新(上書き)する(ステップS113)。そして、印象評価値の算出(ステップS107)に戻る。
【0093】
なお、上述した例では、交叉により生成された子のオノマトペに対して突然変異を発生させているが、これに限らず、オノマトペ群から所定の基準で選択されたオノマトペに対して突然変異を発生させ、既存のオノマトペと置き換えてもよい。
【0094】
そして、上述した最適化の処理を複数世代にわたって繰り返した後、最適化管理部110が終了条件を満足したと判断した場合(ステップS109のYes)は、その時点でデータ記憶領域104に格納されているオノマトペデータ105を、例えば類似度の高い順に所定数をオノマトペの候補としてインターフェース部101からユーザUに対して一覧等により表示(出力)し(ステップS114)、処理を終了する(ステップS115)。
【0095】
生成されたオノマトペの候補を見たユーザUは、その中から所望のオノマトペを採用するか、入力する印象評価値を変えて再びオノマトペの生成処理を実行する。
【0096】
この際、個別のオノマトペについて印象評価値の詳細を知りたい場合、印象評価値算出部118の機能を単独に利用することができる。この場合、図6に示した処理により印象評価値を算出し、15組の形容詞評価尺度それぞれの値をインターフェース部101によりユーザUに出力することで実現することができる。図12は印象評価を個別に行う場合の出力画面の例を示す図であり、15対の形容詞評価尺度上の印象評価値をグラフで提示するようにしている。なお、オノマトペ形態データ116の一部として図1に示した意味についての説明語句を保持しておき、入力されたオノマトペの意味を併せて表示するようにしてもよい。
【0097】
<総括>
以上説明したように、本実施形態によれば、ユーザが入力した印象評価値に近いオノマトペを生成して提示することができ、ユーザの表現したいイメージにあてはまる、新奇性のあるオノマトペ表現の創作を支援することができる。
【0098】
本技術は、印刷・出版業界や情報通信業界等の、言語の意味や言語が喚起するイメージに関わる分野で需要があり、広範な市場で利用されることが期待できる。
【0099】
また、本技術は日本語を非母語とする学習者向けの新しいオノマトペ辞書の作成に貢献できることも期待できる。
【0100】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
【0101】
例えば、上記実施形態では、オノマトペ群の最適化手法として、遺伝的アルゴリズムを用いているが、他の進化的アルゴリズムの手法を採用してもよい。
【0102】
また、ユーザの入力した印象評価値を教師データとする機械学習によって、オノマトペ群の最適化を図ることも考えられる。例えば、階層型ニューラルネットワークに対する誤差逆伝播法を用いた学習を用いることが考えられる(詳細は、http://ipr20.cs.ehime-u.ac.jp/column/neural/chapter6.html等参照)。
【0103】
具体的には、初期オノマトペ群に属する個々のオノマトペとその印象評価値を入力信号とし、ユーザの入力した印象評価値を教師信号とし、n番目の中間層のm番目のニューロンは、オノマトペの数値配列のn列目の値をm−1に改変する処理を対応づける。例えば、図2に示したオノマトペの数値配列の場合、6番目の中間層の1番目のニューロンには、オノマトペの数値配列の6列目の値を0に改変する処理、すなわち、1モーラ目の母音を/a/に改変する処理を対応づける。
【0104】
そして、生成された初期オノマトペが入力信号として入力層から入力され、その信号が、中間層において、ニューロン間の重み(学習によって変化された結合強度)に応じて確率的に分岐して伝播する。その際、各ニューロンでは、オノマトペ数値配列に対して、そのニューロンに対応づけられた改変処理が行われる。中間層を経て出力層から出力された出力信号は、初期オノマトペから生成されたオノマトペを表す。そして、生成されたオノマトペの印象評価値と教師信号(ユーザの入力した印象評価値)との誤差を用いて、各ニューロン間の重みを更新する。この一連の処理を繰り返すことによって、ニューラルネットワークが教師信号によって学習され最適化されていき、上記誤差が所定の範囲内となったときのオノマトペを最終出力とする。これにより、ユーザの入力印象評価に対する妥当性と、ある程度のオノマトペらしさとを保ちつつ、多様なオノマトペ表現を出力することが期待できる。
【0105】
また、上記実施形態のように遺伝的アルゴリズムを用いる場合においても、選択の手法についても、例えば、ランキング選択やトーナメント選択、エリート選択等を採用してもよい。交叉の手法についても、例えば、二点交叉、多点交叉、一様交叉等を採用してもよい。
【0106】
オノマトペの遺伝子個体配列の構成、例えば、列の数(オノマトペのモーラ数も含めて)、各列の並び順、各列の値の種類・意味等についても、図2に示したものに限定されず、適宜変更することができる。
【0107】
評価尺度形容詞対として用いられる形容詞の種類、対の数、段階数についても、上記実施形態には限定されず、適宜変更することができる。
【0108】
印象評価値の正規化手法についても、上記実施形態には限定されず、適宜変更することができる。
【符号の説明】
【0109】
U ユーザ
100 オノマトペ生成システム
101 インターフェース部
102 グラフィカルインターフェース部
103 初期オノマトペ群生成部
104 データ記憶領域
105 オノマトペデータ
106 印象評価値
107 制約条件
108 加工部
109 オノマトペ最適化部
110 最適化管理部
111 選択部
112 交叉部
113 突然変異発生部
114 淘汰(置換)部
115 データ記憶領域
116 オノマトペ形態データ
117 定量評価データ
118 印象評価値算出部
119 印象評価管理部
120 音韻形態解析部
121 印象評価値算出部
200 情報処理装置
201 システムバス
202 CPU
203 ROM
204 RAM
205 NVRAM
206 I/F
207 I/O
208 HDD
209 NIC
M メディア

【特許請求の範囲】
【請求項1】
オノマトペを特定する特徴値配列を所定の発生条件に基づいて発生させたオノマトペデータを所定数生成することで初期状態のオノマトペ群を生成する初期状態オノマトペ群生成手段と、
ユーザから所望するオノマトペの印象評価値を入力する印象評価値入力手段と、
前記オノマトペ群に含まれるオノマトペデータについて個々に印象評価値を算出する印象評価値算出手段と、
算出した個々のオノマトペデータの印象評価値と前記ユーザから入力された印象評価値との類似度を算出する類似度算出手段と、
算出された類似度に基づいて、前記オノマトペ群に含まれるオノマトペデータの前記類似度が前記オノマトペ群全体として高くなるように、前記オノマトペ群に含まれる個々のオノマトペデータのうちの少なくとも一部を更新する更新手段と、
所定の終了条件を満たすまで、前記印象評価値算出手段、前記類似度算出手段および前記更新手段の処理を繰り返す最適化制御手段と、
前記終了条件を満たした時点の前記オノマトペ群のオノマトペデータを出力する出力手段と
を備えたことを特徴とするオノマトペ自動生成システム。
【請求項2】
請求項1に記載のオノマトペ自動生成システムにおいて、
前記更新手段は、算出された類似度に基づいて前記オノマトペ群からオノマトペデータの選択を行い、選択されたオノマトペデータから交叉を行って新たなオノマトペデータを生成し、前記オノマトペ群に含まれる、前記類似度に基づいて決定されるオノマトペデータを新たに生成されたオノマトペデータで置き換えて淘汰する処理を行うものである
ことを特徴とするオノマトペ自動生成システム。
【請求項3】
請求項2に記載のオノマトペ自動生成システムにおいて、
前記更新手段は、更に、前記交叉により生成されたオノマトペデータに対して突然変異を発生させる突然変異発生手段
を備えたことを特徴とするオノマトペ自動生成システム。
【請求項4】
請求項3に記載のオノマトペ自動生成システムにおいて、
前記更新手段は、更に、前記オノマトペ群に含まれるオノマトペデータからオノマトペデータの選択を行い、選択されたオノマトペデータに突然変異を発生させる第2の突然変異発生手段
を備えたことを特徴とするオノマトペ自動生成システム。
【請求項5】
請求項1乃至4のいずれか一項に記載のオノマトペ自動生成システムにおいて、
ユーザから生成するオノマトペの制約条件を入力する制約条件入力手段と、
前記初期状態のオノマトペ群に含まれるオノマトペデータに対して前記制約条件に従って前記特徴値配列の加工を行う加工手段と
を備えたことを特徴とするオノマトペ自動生成システム。
【請求項6】
コンピュータを、
オノマトペを特定する特徴値配列を所定の発生条件に基づいて発生させたオノマトペデータを所定数生成することで初期状態のオノマトペ群を生成する初期状態オノマトペ群生成手段、
ユーザから所望するオノマトペの印象評価値を入力する印象評価値入力手段、
前記オノマトペ群に含まれるオノマトペデータについて個々に印象評価値を算出する印象評価値算出手段、
算出した個々のオノマトペデータの印象評価値と前記ユーザから入力された印象評価値との類似度を算出する類似度算出手段、
算出された類似度に基づいて、前記オノマトペ群に含まれるオノマトペデータの前記類似度が前記オノマトペ群全体として高くなるように、前記オノマトペ群に含まれる個々のオノマトペデータのうちの少なくとも一部を更新する更新手段、
所定の終了条件を満たすまで、前記印象評価値算出手段、前記類似度算出手段および前記更新手段の処理を繰り返す最適化制御手段、
前記終了条件を満たした時点の前記オノマトペ群のオノマトペデータを出力する出力手段
として機能させるオノマトペ自動生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−33351(P2013−33351A)
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願番号】特願2011−168539(P2011−168539)
【出願日】平成23年8月1日(2011.8.1)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 掲載アドレス (1)2011年度 人工知能学会全国大会(第25回)プログラム http://www.ai−gakkai.or.jp/jsai/conf/2011/jsai2011program.pdf https://kaigi.org/jsai/webprogram/2011/ https://kaigi.org/jsai/webprogram/2011/paper_list.html https://kaigi.org/jsai/webprogram/2011/paper−61.html https://kaigi.org/jsai/webprogram/2011/person−1892.html https://kaigi.org/jsai/webprogram/2011/person−1895.html https://kaigi.org/jsai/webprogram/2011/session−144.html (2)「音象徴的意味を利用したオノマトペ生成・イメージ判定システム」の講演予稿 https://kaigi.org/jsai/webprogram/2011/pdf/61.pdf 掲載年月日 (1)平成23年5日17日 (2)平成23年5日27日
【出願人】(504133110)国立大学法人電気通信大学 (383)