説明

語彙爆発時期検出装置、方法、及びプログラム

【課題】語彙爆発以降のデータが多くない場合でも、個人差も考慮してリアルタイムに語彙爆発の時期にさしかかっているか否かを検出する。
【解決手段】直線近似部22で、幼児が新しい単語を発話するようになった単語獲得日齢とそれまでに獲得した累積単語数との組からなるデータセットを、x軸に獲得日齢、y軸に累積単語数を取った座標系にプロットし、獲得日齢が大きい方からk個のデータを除いたn個のデータポイントを直線で近似する。変化点検出部24で、n+1〜n+k番目のデータポイント1つずつ加えながら、直線近似部22で求めた直線との差分を算出し、差分が閾値を超えた点を変化点として検出し、語彙爆発時期にさしかかったと判定する。また、変化点に対応する日齢を語彙爆発の開始日とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、語彙爆発時期検出装置、方法、及びプログラムに係り、特に、幼児が語彙爆発時期にさしかかったか否かを検出する語彙爆発時期検出装置、方法、及びプログラムに関する。
【背景技術】
【0002】
ヒトの言語発達は「人間とは何か」を考える上で重要な科学的知見や示唆を提供し得るものでありながら、現状としては未解決の問題が多いため、言語発達に関する測定技術の進展や商業上でのサービス展開はほとんど見られないのが現状である。特に、音声認知や語彙獲得、文法操作などの基本能力の中でも、語彙獲得に関する科学技術はほとんど進展が見られていない。しかし、健やかな発達を緩やかに後押しする教育や、言語発達遅滞を含む発達障害に関する早期発見・支援などの必要性を考えると、本分野での技術開発は重要な意味をもつと考えられる。
【0003】
幼児の言語発達の中でも特に特徴的で且つ個人性を捉える上で重要な現象のひとつは、語彙爆発(またはボキャブラリー・スパート)である。これは、発達心理学者が20世紀中頃から注目してきた現象であり、1歳後半に起こるとされる語彙学習速度の急激な変化のことを指す。基本的には、幼児は1歳の誕生日前後に初語を発するようになるが、しばらくは非常に緩やかな速度で単語を覚えていくことになる。しかし1歳半以降になると、急激に単語を発するようになるため、その劇的な変化を「爆発」や「スパート」と呼んできた。語彙爆発は多くの親が意識的に気づくほど劇的な変化を伴うため、心理学の分野だけでなく育児産業の関係者にもよく知られている。
【0004】
従来、発達心理学の分野では、語彙チェックリスト(親の回答に基づくアンケート調査)を用いた大規模集団データで語彙爆発の現象を複数の言語で確認してきた。月齢毎に集団データの平均値をプロットすると、ゆるやかな上昇を示す2次曲線になり、その変曲点が18−20ヶ月頃に現れることを見出してきた。こうした集団データから、語彙爆発が多くの子どもでみられる一般的な現象であるとみなしてきた。
【0005】
この語彙爆発について、語彙爆発が個人毎にいつ起こるのか、また、語彙爆発時期(語彙爆発が開始される時期)をどのように検出及び推定するのかということに関して、従来、主に以下の4つの手法が提案されている。
【0006】
1つ目は、特に計算などせずグラフを描き、目視で判定する目視法である。2つ目は、50語覚えた時点を語彙爆発時期と定義する50語達成基準法である。3つ目は、ある特定の期間(例えば3週間)で達成基準(例えば30語以上)を満たした時期を語彙爆発時期にするという特定期間達成基準法である。4つめは、時間軸に沿った語彙獲得データの速度成分をロジスティック回帰式に近似させ、その変曲点を語彙爆発時期とするロジスティック回帰近似法である(非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Ganger, J., & Brent, M. R. (2004). Reexamining the vocabulary spurt. Developmental Psychology, Vol. 40, No. 4, 621-632.
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、1つ目の手法は、現象の有無をある程度確認可能であるが、語彙爆発時期を正確に判定する場合には不向きである、という問題がある。
【0009】
また、2つ目の手法は、実証データに基づいた基準ではあるが、英語圏の中流階層の非常に少ないサンプルに基づく基準であったため、多くの文化圏の様々な子どもに当てはまる保証はない、という問題がある。また、語彙爆発の個人差が全く想定されていない、という問題もある。
【0010】
また、3つ目の手法は、ある特定の時間範囲で語彙獲得速度の変化を検出可能であるが、一義的で恣意的な達成基準の設定は、個人間の語彙獲得速度を考慮に入れていないため、個人によっては語彙爆発時期を完全に見誤る可能性がある、という問題がある。
【0011】
また、4つめの手法は、個人毎にデータを近似させることで、個人間の語彙獲得速度がたとえ異なっていても対応はできるものの、幼児の語彙発達の特徴を正確に捉えきれていないため、ロジスティック回帰の近似精度が低く、語彙爆発の存在自体も確認できない場合が多い、という問題がある。また、この手法では、ある程度蓄積されたデータを遡って解析するタイプの推定法であるため、子どもが発達していく中で、いわばリアルタイムに語彙爆発時期を検出したい場合には利用できない、という問題もある。
【0012】
本発明は上記問題点に鑑みてなされたものであり、語彙爆発以降のデータが多くない場合でも、個人差も考慮してリアルタイムに語彙爆発の時期にさしかかっているか否かを検出することができる語彙爆発時期検出装置、方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
上記目的を達成するために、本発明の語彙爆発時期検出装置は、幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す複数のデータのうち、前記日齢が大きい方から所定個のデータを除いたデータの推移を直線で近似する近似手段と、前記近似手段で近似された直線と前記所定個のデータとの差分、及び予め定めた閾値に基づいて、前記複数のデータ内に、前記幼児の語彙爆発時期を示すデータが含まれるか否かを判定する判定手段と、を含んで構成されている。
【0014】
本発明の語彙爆発時期検出装置によれば、近似手段が、幼児が新しい単語を発話するようになった日齢と、その日齢までに幼児が発話するようになった単語の累積数との関係を示す複数のデータのうち、日齢が大きい方から所定個のデータを除いたデータの推移を直線で近似する。そして、判定手段が、近似手段で近似された直線と所定個のデータとの差分、及び予め定めた閾値に基づいて、複数のデータ内に、幼児の語彙爆発時期を示すデータが含まれるか否かを判定する。
【0015】
このように、幼児の語彙発達の特徴を捉えて、幼児が新しい単語を発話するようになった日齢と単語の累積数との関係を示すデータを、日齢が大きい方から所定個のデータを除いて直線近似し、直線と所定個のデータとの差分に基づいて、語彙爆発の有無を判定するため、個人差も考慮してリアルタイムに語彙爆発の時期にさしかかっているか否かを検出することができる。
【0016】
また、前記判定手段は、前記所定個のデータの前記日齢が小さい方のデータから1つずつ加算しながら前記差分を算出し、前記差分が前記閾値を超えたときに、該差分の算出に用いられたデータの中で最大の日齢を、前記幼児の語彙爆発時期として検出することができる。
【0017】
また、本発明の語彙爆発時期検出方法は、近似手段と、判定手段とを含む語彙爆発時期検出装置における語彙爆発時期検出方法であって、前記近似手段は、幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す複数のデータのうち、前記日齢が大きい方から所定個のデータを除いたデータの推移を直線で近似し、前記判定手段は、前記近似手段で近似された直線と前記所定個のデータとの差分、及び予め定めた閾値に基づいて、前記複数のデータ内に、前記幼児の語彙爆発時期を示すデータが含まれるか否かを判定する方法である。
【0018】
また、本発明の語彙爆発時期検出プログラムは、コンピュータを、上記語彙爆発時期検出装置を構成する各手段として機能させるためのプログラムである。
【発明の効果】
【0019】
以上説明したように、本発明の語彙爆発時期検出装置、方法、及びプログラムによれば、幼児の語彙発達の特徴を捉えて、幼児が新しい単語を発話するようになった日齢と単語の累積数のデータを、日齢が大きい方から所定個のデータを除いて直線近似し、直線と所定個のデータとの差分に基づいて、語彙爆発の有無を判定するため、個人差も考慮してリアルタイムに語彙爆発の時期にさしかかっているか否かを検出することができる、という効果が得られる。
【図面の簡単な説明】
【0020】
【図1】本実施の形態の語彙爆発時期検出装置の機能的構成を示すブロック図である。
【図2】入力画面の一例を示す図である。
【図3】入力データセットの一例を示す図である。
【図4】語彙爆発時期の検出を説明するための図である。
【図5】検出結果の出力例を示す図である。
【図6】本実施の形態の語彙爆発時期検出装置における語彙爆発時期検出処理ルーチンの内容を示すフローチャートである。
【発明を実施するための形態】
【0021】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0022】
図1に示すように、本実施の形態に係る語彙爆発時期検出装置10は、種々のデータの入力を受け付ける入力部12と、語彙爆発の有無を判定する演算部14と、検出結果を出力する出力部16と、を備えている。
【0023】
入力部12は、既知のキーボード、マウス、記憶装置などの入力器により実現され、入力データを受け付ける。
【0024】
ここで、幼児の語彙爆発の時期を判定するために、どういったデータを参照するかがまずは問題となる。幼児の発話を全てデジタルビデオレコーダーなどの電子メディアで記録可能であれば、それを分析するのが最も高精度な方法といえるが、データ取得にかかるコストは膨大で、かつ幼児の曖昧な発話データを自動で認識し単語レベルで分析する工学的技術もまだ存在しないので、実現は大変難しい。一方、所定期間毎に(例えば、3ヶ月に1度)アンケートに回答してもらい、幼児が新たに発話した単語数の変化を把握する方法もある。この場合、所定期間が長ければ、語彙爆発の時期にさしかかったか否かをリアルタイムに把握するのは困難である。また、所定期間が短ければ、アンケートの回答者(幼児の親)への負担が増大する。従って、現実的には、データを記録する親への負担を軽減しつつ、かつ細かい時間ポイントでデータ取得が可能な方法が望ましい。
【0025】
そこで、本実施の形態では、ウェブ日誌法を利用したデータ取得を適用する。この方法は、幼児が単語を新たに学習(発話)した場合に、ウェブ上の特定のサイトに携帯電話やパーソナルコンピュータからネットワークを介してアクセスし、その日の日誌と共に、幼児が覚えた単語を記録するものである(非特許文献2「小林哲生、永田昌明(2009)、「ウェブを用いた幼児言語発達研究:大規模縦断データ収集の試み」、言語処理学会第15回年次大会論文集、p.534−537.」、非特許文献3「小林哲生、永田昌明(2010年3月)、「ウェブ上で収集した幼児語彙発達データの信頼性検証」、言語処理学会第16回年次大会論文集、p.403−406.」参照)。この方法の有効性は科学的に検証されている点で非常によい。
【0026】
また、この方法によるデータ取得の利点は、親にとっても比較的容易に記録できる方式でありながら、記録年月日(幼児が新たな単語を覚えた年月日)と幼児の生年月日との差から、幼児が新たな単語を覚えた日齢を算出可能な点である。このように取得されたデータを用いることによって、本実施の形態の語彙爆発時期検出装置10により、語彙爆発時期にさしかかっているか否かを日齢単位で検出可能になる。
【0027】
例えば、図2に示すような入力画面50を入力インターフェースとして入力部12に設け、データ入力を行う。図2の入力画面50には、日付入力領域52と、単語入力領域54と、生年月日表示領域56と、登録修正ボタン58とが設けられている。
【0028】
日付入力領域52は、直接入力やプルダウンメニューからの選択により、幼児が新しい単語を発話した日付(単語獲得年月日)を入力可能となっている。また、入力画面50を開いた際に、その日の日付が初期値として入力されるようにしてもよい。単語入力領域54には、直接入力により、幼児が新たに覚えた単語の発話及び意味を入力可能となっている。生年月日表示領域56は、予め登録された幼児の生年月日が表示される。生年月日が未登録の場合、または登録済みの生年月日を修正する場合には、登録修正ボタン58を押下することにより、生年月日入力画面を表示させ、生年月日の入力を受け付ける。
【0029】
このように入力されたデータを受け付けることにより、図3に示すような、いつ(例:2009年9月12日)、どんな単語(例:わんわん)をどんな意味(例:犬)で発話したかを表す、生年月日、単語獲得年月日、発話、及び意味で構成されたデータセットが取得される。なお、予め記憶装置に蓄積されたデータセットを取得する形式としてもよい。
【0030】
演算部14は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する語彙爆発時期検出処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。演算部14は、機能的には、単語獲得日齢算出部20と、直線近似部22と、変化点検出部24と、を含んだ構成で表すことができる。なお、変化点検出部24が、本発明の判定手段の一例である。
【0031】
単語獲得日齢算出部20は、入力部12から入力されたデータセットの単語獲得年月日と生年月日との差から、それぞれの単語が生後何日目に獲得されたかを示す「獲得日齢」を算出する。例えば、単語獲得年月日が「2009年9月12日」、生年月日が「2008年9月12日」であれば、獲得日齢=2009年9月12日−2008年9月12日=365日齢、と算出することができる。算出された各単語の獲得日齢を昇順に並べ、小さい方から1,2,3,・・・と整数系列を割り当て、累積単語数(何番目に覚えた単語か)を算出する。これにより、獲得日齢と累積単語数との組からなるデータセットが生成される。
【0032】
なお、入力部12において直接、獲得日齢と累積単語数との組からなるデータセットを取得する形式としてもよい。この場合、演算部14において、単語獲得日齢算出部20の構成を省略することができる。
【0033】
直線近似部22は、獲得日齢と累積単語数との組からなるデータセットを、1つの直線で近似する。実データを用いた事前検証では,語彙爆発前の語彙学習速度は80%以上の精度で直線近似できることがわかっている。そこで、累積単語数をy軸、獲得日齢をx軸とする座標系に各データをプロットし、プロットされた各データポイントのノルムが最小になるような直線を求める。このとき、獲得日齢が大きい方からk個のデータポイントを除外し、残りのデータポイントを用いて直線近似を行う。
【0034】
変化点検出部24では、直線近似部22により求めた直線と、直線近似部22で近似直線を求めるときに除外したk個のデータポイントとの差が、所定の閾値以上となったときに語彙爆発が起こったと判定する。具体的には、図4に示すように、累積単語数の時系列をy、獲得日齢をxとし(1≦i≦I)、i=n+kまでのプロットが得られたとする。このプロットされたデータポイントの内n番目までのデータポイント(図中白丸)を利用し、下記(1)式により直線近似を仮定し、直線のパラメータa及びbを求める。
【0035】
【数1】

【0036】
ここでは,ノルムとして二乗ノルムを利用する。次に、この直線と除外したk個のデータポイント(図中黒丸)との差分distを、下記(2)式により計算する。
【0037】
【数2】

【0038】
なお、k個全てを積算した差分dist値を一度に求めるのではなく、まずi=n+1のときの差分distと閾値dとを比較し、iを1ずつ増やしたときのデータポイントと直線との差分を順番にdistに加算しながら閾値dと比較する処理を繰り返すそして、差分distが初めて閾値dを超えたときに、語彙爆発の時期にさしかかったと判定し、語彙爆発が有ることを示す情報、及び差分distが初めて閾値dを超えたときのxを語彙爆発の開始日として出力する。なお、k個のデータポイント全てを積算しても差分distが閾値dを超えなかった場合には、語彙爆発が無い(まだ語彙爆発の時期に到達していない)ことを示す情報を出力する。
【0039】
出力部16は、ディスプレイ、プリンタ、磁気ディスクなどで実装され、演算部14での演算結果が出力される。例えば、図5に示すような出力インターフェースに演算結果を出力する。語彙爆発が検出された場合は、その日時を合わせて表示してもよい。また、入力部12にて所定の日時の入力を受け付け、その日時と検出された語彙爆発の開始日とを比較し、入力された日時が語彙爆発の開始日より前であれば、当該日時において語彙爆発がないことを示す情報を表示し、語彙爆発の開始日であれば、当該日時において語彙爆発にさしかかったことを示す情報を表示してもよい。なお、図5の例では、語彙爆発の開始日は、日齢にて表示されている。
【0040】
次に、図6を参照して、本実施の形態の語彙爆発時期検出装置10において実行される語彙爆発時期検出処理ルーチンについて説明する。
【0041】
ステップ100で、生年月日、単語獲得年月日、発話、及び意味で構成されたデータセットを取得する。ここでは、n+k個のデータが取得されたものとする。
【0042】
次に、ステップ102で、上記ステップ100で取得したデータセットの単語獲得年月日と生年月日との差から、それぞれの単語の獲得日齢を算出する。そして、算出された各単語の獲得日齢を昇順に並べ、小さい方から1,2,3,・・・と整数系列を割り当て、累積単語数を算出する。これにより、獲得日齢と累積単語数との組からなるデータセットを生成する。
【0043】
次に、ステップ104で、上記ステップ102で生成した獲得日齢と累積単語数との組からなるデータセットを、累積単語数をy軸、獲得日齢をx軸とする座標系にプロットし、プロットされたデータポイントのうち、n番目までのデータポイントを用いて、ノルムが最小になるような直線(y=ax+b)を求める。
【0044】
次に、ステップ106で、変数jに1をセットし、次に、ステップ108で、上記(1)式に従って、上記ステップ104で求めた直線と、(n+1)番目から(n+j)番目までのデータポイントとの差分distを算出する。
【0045】
次に、ステップ110で、上記ステップ108で算出した差分distが閾値dを超えたか否かを判定する。差分dist>閾値dの場合には、ステップ112へ移行して、データポイント(xn+j,yn+j)を変化点として検出する。一方、差分dist≦閾値dの場合には、ステップ114へ移行して、j=kとなったか否かを判定する。j≠kの場合には、ステップ116へ移行して、jを1インクリメントして、ステップ108へ戻る。一方、j=kの場合には、k個のデータポイント全てを積算しても差分distが閾値dを超えなかったことを示しているため、ステップ118へ移行して、変化点なしを検出結果として出力する。
【0046】
次に、ステップ120で、上記ステップ112で変化点が検出された場合には、語彙爆発にさしかかっていることを示す情報、及び変化点(xn+j,yn+j)から得られる語彙爆発の開始日xn+jを出力する。また、上記ステップ118で変化点が検出されていない場合には、語彙爆発が無いことを示す情報を出力して、処理を終了する。
【0047】
実際に、本実施の形態の手法で、k=5、d=1.0という値を使って実験を行った。本手法で15名分の実データで検証を行ったところ,約53%のデータで語彙爆発日の検出に成功した。つまり,この結果は,語彙学習速度がある1つの変化点で変化することを科学的にも意味していると思われる。
【0048】
以上説明したように、本実施の形態の語彙爆発時期検出装置によれば、幼児の語彙発達の特徴を捉えて、単語の獲得日齢と累積単語数とのデータセットを、日齢が大きい方から所定個のデータを除いて直線近似し、直線と所定個のデータとの差分が閾値を超える変化点を検出することで語彙爆発の有無を判定するため、個人差も考慮してリアルタイムに語彙爆発の時期にさしかかっているか否かを検出することができる。
【0049】
このように、幼児の語彙爆発を正確に且つ迅速に検出することの効果として、(1)語彙爆発前後で変わる発達段階に即した教育の実施、(2)個人の語彙学習速度や特徴に合わせたオーダーメード型教育の実施、(3)言語発達遅滞などの発達障害児の早期発見および支援教育プログラムの開発、などが挙げられる。また語彙発達データの取得の時点からウェブなどで一元的に管理すれば、より効果的な幼児教育や育児支援が可能となり、少子高齢化社会を支えるICT技術として、社会および産業に大きな効果をもたらす可能性がある。
【0050】
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0051】
また、上述の語彙爆発時期推定装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
【0052】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
【符号の説明】
【0053】
10 語彙爆発時期検出装置
12 入力部
14 演算部
16 出力部
20 単語獲得日齢算出部
22 直線近似部
24 変化点検出部

【特許請求の範囲】
【請求項1】
幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す複数のデータのうち、前記日齢が大きい方から所定個のデータを除いたデータの推移を直線で近似する近似手段と、
前記近似手段で近似された直線と前記所定個のデータとの差分、及び予め定めた閾値に基づいて、前記複数のデータ内に、前記幼児の語彙爆発時期を示すデータが含まれるか否かを判定する判定手段と、
を含む語彙爆発時期検出装置。
【請求項2】
前記判定手段は、前記所定個のデータの前記日齢が小さい方のデータから1つずつ加算しながら前記差分を算出し、前記差分が前記閾値を超えたときに、該差分の算出に用いられたデータの中で最大の日齢を、前記幼児の語彙爆発時期として検出する請求項1記載の語彙爆発時期検出装置。
【請求項3】
近似手段と、判定手段とを含む語彙爆発時期検出装置における語彙爆発時期検出方法であって、
前記近似手段は、幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す複数のデータのうち、前記日齢が大きい方から所定個のデータを除いたデータの推移を直線で近似し、
前記判定手段は、前記近似手段で近似された直線と前記所定個のデータとの差分、及び予め定めた閾値に基づいて、前記複数のデータ内に、前記幼児の語彙爆発時期を示すデータが含まれるか否かを判定する
語彙爆発時期検出方法。
【請求項4】
前記判定手段は、前記所定個のデータの前記日齢が小さい方のデータから1つずつ加算しながら前記差分を算出し、前記差分が前記閾値を超えたときに、該差分の算出に用いられたデータの中で最大の日齢を、前記幼児の語彙爆発時期として検出する請求項3記載の語彙爆発時期検出方法。
【請求項5】
コンピュータを、請求項1または請求項2記載の語彙爆発時期検出装置を構成する各手段として機能させるための語彙爆発時期検出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate