教材選択システムの方法とプログラム
【課題】受験者の学習評価データに基づいて最適な教材を選択する教材選択方法、コンピュータ・プログラムおよび教材選択装置を提供すること。
【解決手段】教材選択方法であって、コンピュータが、受講者の学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算するステップと、達成度と学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、重要度に基づいて教材の価値を計算するステップと、教材の価値を基に教材を選択するための計算を行うステップと、を含む。
【解決手段】教材選択方法であって、コンピュータが、受講者の学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算するステップと、達成度と学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、重要度に基づいて教材の価値を計算するステップと、教材の価値を基に教材を選択するための計算を行うステップと、を含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータを利用した教育支援システムに関するものであり、特に、受験者の学習評価データに基づいて最適な教材を選択する教材選択方法、コンピュータ・プログラムおよび教材選択に関する。
【背景技術】
【0002】
従来より、教育の現場において、講師が受験者の学習評価データに基づいて最適な教材を選択することは容易ではなかった。近年ではコンピュータの発達に伴い、上記問題を解決するために、コンピュータを用いて教材を選択するいくつかの先行技術が存在する。前記教材の選択に関する先行技術は、主に、以下のように分類される。
1)成績別に設定したルール等によってトピックや教材を陽に指定する方式。
2)数理計画的にトピックや教材の組合せを求める方式。
3)上記2方式の併用。
前記先行技術の多くは学習カリキュラムの特性を利用している。前記学習カリキュラムの特性の例として、学校や塾が持つ学年別,科目別の学習カリキュラムが複数の学力領域(以下、トピックという)から構成されていること、カリキュラムに沿って用いられる教材はある特定のトピックに紐付くか、または複数のトピックに紐付いていることが挙げられる。
【0003】
上記1)の成績別に設定したルール等によってトピックや教材を陽に指定する方式の技術が、特許文献1〜3、非特許文献1に記載されている。特許文献1には、授業別に紐付けられた教材を提供する技術が開示されている。また、非特許文献1には、過去の学習履歴や、教材情報から優先順位つき教材リストの提供を行う技術が開示されている。特許文献2には、テスト問題を解く能力、得点の伸び、解答時間を総合して成績を評価し、その値を予め設定した閾値と比較し、選択対象とする教材のレベルを動的に変える技術が開示されている。また、特許文献3には、得点と合格基準点から理解度を算出し、その値が予め設定した閾値より低い教材を選択する技術が開示されている。
【0004】
非特許文献2には、上記2)の数理計画的にトピックや教材の組合せを求める方式の技術が記載されている。すなわち、これまでのテストに新たにテスト問題を加える場合に、テスト問題が理解の容易性と知識の応用性の両者を兼ね備えるように、前記テスト問題の知識の組合せを決定するための技術が記載されている。新テスト問題数と知識数を制約条件として、理解の容易性、知識の応用性、テスト問題作成の容易性を総合した目的関数が最大化されるように新テスト問題の知識の組合せを決定する。知識の組合せの決定においては、整数計画問題として定式化し、遺伝的アルゴリズムによって解を検索する。
【0005】
一方、トピック関連構造に関する先行技術はインターネット検索の主要技術の1つであるPAGERANK(登録商標)アルゴリズム(非特許文献3)とその発展(非特許文献4)等(以下、総じてPageRank方式という)がある。これらのアルゴリズムまたは方式はトピックに相当するもの(例えば、インターネットのホームページ)の構造で決まる隣接行列の最大固有値に対応する固有ベクトルによって、トピックの順位を定める手法である。
【0006】
【特許文献1】特開2005−241914号公報
【特許文献2】特開2000−66572号公報
【特許文献3】特開2003−345908号公報
【非特許文献1】阿部博:ナビゲーション機能を有する学習管理システムに関する研究 北陸先端科学技術大学院大学修士論文 2003年3月
【非特許文献2】竹内俊彦、佐久間章行:問題提示型試験における援用システムに関する研究 日本経営工学会論文誌 Vol.53,No.3,pp.189−200,2002年8月15日
【非特許文献3】L.Page,S.Brin,R.Motwani,T.Winograd:The PageRank Citation Ranking: Bringing Order to the Web, Stanford Digital Library Technologies Project, 1998.
【非特許文献4】T.H.Haveliwala:Topic−sensitive PageRank,Proc.of the 11th WWW Conference,2002.
【発明の開示】
【発明が解決しようとする課題】
【0007】
上記1)に関する従来技術では受験者等の成績等の情報から適する教材を選択することができる。しかしながら、成績等の元の情報がカバーしているトピックの教材のみが選択対象であり、関連するトピックの教材は選択の対象外である。学習において、各トピックは関連しており、あるトピックが理解できていないことは、そのトピックではなく関連するトピックが原因となる場合があるため、関連するトピックの教材が選択されることも必要である。
【0008】
また、上記2)に関する従来技術では、数理計画的アプローチにより問題に適する知識を選択することができる。前記数理計画的アプローチとして、例えば遺伝的アルゴリズムによって解を検索すると膨大な計算量が必要となり、時間を要することとなる。前記従来技術にて遺伝的アルゴリズムを用いるのは1つのテスト問題を作成するためであり、解の検索を行うのは1回であるからである。一方、教材選択は生徒別に行うので、生徒数分の解の検索が必要である。そのため、1回の計算量が膨大であり、時間がかかる遺伝的アルゴリズムを用いるのでは、現実的な時間で生徒数分の教材を選択することは困難となる。
【0009】
そこで、本発明は上記課題に鑑み、受験者に最適な教材を選択する方法とその装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の1つの態様では、以下のような解決手段を提供する。本発明の第1の形態によると、受験者の学習評価データに基づいて教材を選択する方法において、コンピュータが前記学習評価データと学力領域の難易度に基づいて受験者の各学力領域の達成度を計算するステップと、前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、前記重要度に基づいて教材の価値を計算するステップと、前記教材の価値を基に教材を選択するための計算を行うステップとを備えた教材選択方法が提供される。
【0011】
本発明の第2の態様によると、達成度を計算するステップでは、達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出する。
【0012】
本発明の第3の態様によると、重要度を計算するステップでは、各トピック間の遷移を定義し、コンピュータが前記定義と前記達成度から重要度を計算する。
【0013】
別の態様によると、重要度を計算するステップでは、各トピック間の遷移に遷移確率を設定する。
【0014】
また、本発明は、別の態様としてコンピュータにおいて実行されるコンピュータ・プログラムあるいは、そのコンピュータ・プログラムをインストールした教材選択装置としても提供できる。
【0015】
ここで、「学習評価データ」とは、受験者の成績や、学習時間、塾への通学の有無等受験者の学習に関するデータを意味する。「学力領域(トピック)」とは、学年別、科目別の学習カリキュラムの中の学習項目を示す。学習カリキュラムとは、生徒、児童が学習するコースとして立てられた教育内容の系列である。「学力領域関連構造」とは、トピック間の依存関係をいい、非閉路有向グラフ(Directed acyclic graph、以下、DAGという)で表される。「LCA」(Least Common Ancestor)とは、最も親等が近い共通の祖先を意味する。本態様においては、達成度の低いトピック集合の最も近い共通のトピックを意味し、前記共通のトピックを基礎トピックという。「所定の値」とは平均の達成度や、予め設定した閾値等を示す。
【0016】
本発明の利点は以下のとおりである。
【0017】
第1に、受験者の学習評価データから求めたトピックの達成度と、トピック関連構造より重要度を計算し、前記重要度を基に教材価値を計算し、教材価値を用いて教材の組合せを取得することにより、従来技術よりも高速で結果を得ることができる。
【0018】
第2に、トピック関連構造においてLCAを用いることにより、教材を選択する上で重要である達成度が不明なトピックを抽出することができる。
【0019】
第3に、重要度を計算するステップにおいて、各トピック間の遷移を定義し用いること
により、教材を選択する際に必要となるトピックをすべて考慮に入れることができる。第4に、トピック間の遷移に遷移確率を設定することにより、精度の高い重要度を導きだすことができる。
【発明の効果】
【0020】
本発明によれば、受験者の学習評価データに基づいて最適な教材を従来の方法よりも短時間かつ高い精度で選択することができる教材選択方法、コンピュータ・プログラムおよび教材選択装置を提供することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施形態について図面を参照して説明する。図1は、本発明の一実施形態にかかる教材選択装置の機能構成を示す。線矢印は本例において少なくとも必要なデータの流れを示し、点線矢印は場合によっては用いられるデータの流れを示す。以下、簡略のためデータベースをDBと表記する。本例の教材選択装置1は、生徒と生徒の成績を関連付けて保持するテスト成績DB3、テスト問題に関する情報を保持しているテスト問題DB4、トピックの難易度を保持しているトピックDB5、生徒と各トピックの達成度および重要度を関連付けて保持するトピックスコアDB6、教材の難易度を保持している教材DB7、教材の価値を保持する教材価値DB8を備えている。テスト成績DB3は受験者と受験者の学習評価データを関連付けて記憶している学習評価データ記憶手段の一例である。同様に、テスト問題DB4は受験された問題に関する情報を記憶している問題情報記憶手段、トピックDB5は、学力領域関連構造の情報を記憶している学力領域関連構造記憶手段、トピックスコアDB6は受験者とトピックの達成度および重要度を関連付けて記憶している重要度記憶手段、教材DB7は教材情報を予め記憶している教材記憶手段、教材価値DB8は受験者と教材の価値を関連付けて記憶している教材価値記憶手段、の一例である。なお、各記憶手段はハード・ディスク上のDBに限らず、メモリ、磁気テープやフレキシブル・ディスク(FD)等の外部記憶装置でもよい。
【0022】
また、同装置は生徒のトピックの達成度を計算する達成度処理部10、達成度を基にトピックの重要度を計算する重要度処理部11、重要度を基に教材の価値を計算する教材価値処理部12、生徒にとって最適な教材を選ぶ教材選択処理部13を備えている。さらに、データ入力を行う入力部2、データ出力を行う出力部9も備えている。なお、本実施形態では教材選択装置1が1台の装置にて構成されているが、DBと処理部を分散して、複数の装置から構成することも可能である。また、ネットワークを介したサーバー/クライアント構成をとることも可能である。
【0023】
次に、上記の各DBおよび各機能部の詳細な機能とともに、本装置における処理を説明する。図2は、本実施形態の教材選択装置による処理の概要を示す。大きく分けて、図示するように、本装置は下記の4つの処理を行う。達成度処理部10による生徒の成績から達成度を計算する達成度処理(S21)、重要度処理部11による達成度からトピックの重要度を計算する重要度処理(S22)、教材価値処理部12による重要度から教材の価値を計算する教材価値処理(S23)、教材選択処理部13による教材価値に基づいて生徒に最適な教材を選択する教材選択処理(S24)の手順で実行される。
【0024】
以下、各DBの機能および最低限必要なデータ項目について説明する。
[テスト成績DB3]
テスト成績を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:テスト問題ID
Score:生徒の成績
【0025】
[テスト問題DB4]
テスト問題とトピックの関係を表すDBで、テスト問題の採点結果から生徒のトピックの達成度を計算するために用いる。以下のデータ項目を保持する
ID:テスト問題ID
Level:テスト問題の難易度
Topics:関連トピックのリスト
Ave.Score:全生徒の平均スコア
【0026】
[トピックDB5]
トピック関連構造(前提や後続条件等)を保持するDBで、トピックの重要度を計算するために用いる。以下のデータ項目を保持する。
ID:トピックID
Level:トピックの難易度
Related Topics:親(前提トピック)、子(後続トピック)、とそれ以外の関連トピックのリスト(親子関係が容易に断定できないトピック集)
Avg.Score:全生徒の平均達成度
【0027】
[トピックスコアDB6]
トピックの達成度および重要度を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:トピックID
Score:トピックの達成度
Relevancy:トピックの重要度
【0028】
[教材DB7]
教材とトピックの関連を保持するDBである。以下のデータ項目を保持する。
ID:教材ID
Level:教材の難易度
Hours:教材の学習時間
Topics:被覆したトピックリスト
【0029】
[教材の価値DB8]
教材の価値等の情報を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:教材ID
Number of Use:過去に選ばれた回数
Value:教材の価値
【0030】
<達成度処理部>
上記DBを利用して生徒に対する教材選択のための個々の処理について説明する。図3は、達成度処理部の処理フローを示す。まず、テスト採点者は、キーボード、マウス、ディジタルペン等の入力部2を通じて、テスト成績DB3に問題ごとに成績を記憶させる。テスト成績DB3から生徒の問題ごとの成績を取得する(S31)。そして、S31にて取得した問題の難易度と生徒の平均点数をテスト問題DB4から取得する(S32)。続いて、前記問題に関連するトピックをテスト問題DB4から取得する(S33)。S33にて取得した問題に関するトピックの達成度を成績と問題の難易度から計算し(S34)、達成度の低いトピックだけを抽出する(S35)。S33で取得した全トピックについてテスト問題がない、または少ないトピックであるかを判断する(S36)。テスト問題がある、または少ないトピックではない場合、全生徒の平均達成度を計算し(S37)、平均達成度をトピックDB5へ登録する(S38)。一方、テスト問題がない、または少ないトピックの場合には、そのトピックが達成度の低いトピックから形成されるDAGのLCAであるかを判断する(S39)。DAGについては後述にて詳細を説明する。前記トピックが達成度の低いトピックから形成されるDAGのLCAでない場合は、そのトピックを選択から除外する(S40)。他方、前記トピックが達成度の低いトピックから形成されるDAGのLCAである場合には、そのトピックを達成度が不明な基礎トピックとして抽出する(S41)。以上より、抽出された達成度が低いトピックおよび達成度が不明な基礎トピックをトピックDB5へ登録する(S42)。ここで、達成度が低いとは、例えば、平均の達成度と比較して低い場合や、予め設定した閾値より低い場合を示す。
【0031】
上記達成度処理において、生徒が難しい問題を正解した時にその問題の関連トピックへの達成度を高くすること、逆に簡単なテスト問題を間違った時にその問題の関連トピックの達成度を低くすること等が可能である。また、同処理により、テストの対象となるトピックを全生徒の平均達成度と比較し、それぞれ達成度が高い(good)、低い(bad)、平均的(average)、または不明(unknown)と分類することが可能である。全生徒の平均達成度が計算されることにより、客観的にトピックの難易度の評価をすることも可能である。これにより、トピックDB5の難易度を変更することも可能である。
【0032】
ここで、DAGとは、閉路を含むパスが存在しない有向グラフをいう。有向グラフとは、いくつかの点の集まりと異なる2つの点を結ぶ矢印の集まりで描かれた図をいい、閉路とは、同じ点を繰り返し含むようなパスをいう。
【0033】
本発明の実施態様においてトピック関連構造をDAGで表現する理由を説明する。トピック関連構造は、教師の知識や、カリキュラムの構成から所与として、基本的にDAGで表現する。その理由は、多くのカリキュラム(または講座)のトピックが決まった順番に教えられ、その順番によりトピックがDAGを形成しているからである。図4は、一例として、あるプロジェクト・マネジメント研修のトピック関連構造を示したものである。四角で囲まれた各講座は、プロジェクト・マネジメント研修のトピックであり、矢印は講座の受ける順番を表している。図5は、図4の講座を白丸にて置き換え簡略化および骨格を明確化したものである。図4、図5からプロジェクト・マネジメント研修はいくつかのトピックの集まりと異なる2つのトピックを結ぶ矢印で表すことができる。また、同じトピックを繰り返し含むパスもないことから、DAGを形成していると言える。プロジェクトの計画技法52および適用業務開発プロジェクトの管理56の親トピックは入門講座51である。またプロジェクトの計画技法52の子トピックは、適用業務開発プロジェクトの計画演習53、プロジェクトの運営技法54である。プロジェクト・リーダー疑似体験コース57の親トピックはプロジェクトの運営技法54、適用業務開発プロジェクトの運営演習55、適用業務開発プロジェクトの管理56である。このように、複数の親トピックを持つことも可能である。DAGは有向グラフであるため、トピック間が矢印で結ばれていることが必要である。しかし、本発明の実施態様においては、トピック間の矢印が不明であっても、各生徒のコースを受ける順番や、成績の値等から、向きを後で固定することが可能である。また、非特許文献2のように、教育システムの構築においては、トピック関連構造がDAGとしてよく表現される。
【0034】
以上より、学習カリキュラムのトピック関連構造をDAGとして仮定することは当然の手法であるといえる。学習カリキュラムのトピック関連構造がDAGでない場合であっても、本発明の実施態様においては達成度を用いてトピック関連構造をDAGに変換することができる。
【0035】
S38にて達成度が低いトピックを全トピック関連構造図から抽出するのは、選択すべき教材は達成度の低いトピックに関するものであるからである。トピック関連構造図は連結したDAGであるため、抽出した結果のトピックは非閉路有向グラフの集合(以下、F−DAG:Forest of DAGという)となる。S41にて、達成度の低いトピックからなるF−DAGの基礎トピックが抽出される。トピックは関連構造をしているので、あるトピックの達成度が低いことはそのトピックに関連するトピックが原因である場合があり、学習カリキュラムにおいては特に基礎トピックが原因となることが多く、重要である。そのため、達成度の低いトピックからなるF−DAGの基礎トピックを達成度の低いトピックと合わせて抽出し、次に説明する重要度計算に用いる。しかし、基礎トピックはテスト問題がない、または少ないトピックである。そのため、テスト問題がないトピックの達成度は計算されておらず、また、テスト問題が少ないトピックはトピックに紐付く問題数のばらつきによりトピックの信頼度にばらつきが生じるという問題点がある。そこで、これらの問題を、基礎トピックを達成度の低いトピックからなるF−DAGのルートとして重要度計算に適用し基礎トピックの重要度を推定することで解消する。
【0036】
基礎トピックは、達成度が低いトピック集合に対し、従来技術であるLCA発見アルゴリズムにて高速に計算することで見つけることが可能である。ただし、LCAが離れている場合やLCAがルートに近い場合、多数のトピックが選ばれる可能性がある。この場合には、DAG上でトピックをいくつさかのぼれるか最大値を設定することで、選ばれるトピック数を制限する。
【0037】
上述S38とS41によるトピック抽出を図で表したのが図6である。図6は、S38における達成度が低いトピック抽出前後のトピック関連構造およびS41の処理により抽出される達成度が低いトピック関連構造の基礎トピックを示している。達成度の低いトピックは黒丸、達成度の高いトピックは白丸、基礎トピックは斜線丸で表している。達成度計算後のトピック関連構造71から、S38の処理にて達成度の低いトピックを抽出し、S41の処理にて達成度の不明な基礎トピックを抽出したものがトピック関連構造72である。なお、上述したとおり抽出後のトピック関連構造はF−DAGになっている。図6において基礎トピックはF−DAGの一番上に位置する。
【0038】
<重要度処理部>
達成度処理部10の処理が終了すると、重要度処理部11にてトピック関連構造を考慮したトピックの重要度計算を行う。重要度計算においては2つのステップ、達成度から重要度を求めるステップと前記重要度からDAGを考慮した重要度を求めるステップがある。達成度から求めた重要度を以下初期重要度という。初期重要度からDAGを考慮した重要度を求める重要度計算には、以下の原理が使用される。
(原理1)
重要度が高いトピックの親は重要である。これは、達成度の低いトピックに関して、そのトピック自体の復習だけでなく、そのトピックの親(基礎)の復習も、生徒にとっては重要であることに基づいた原理である。つまり、あるトピックの達成度が低い原因はそのトピック、または、その親トピック、の理解不足からであると仮定する。
(原理2)
重要度の高い子トピックが多いトピックは重要である。これは、複数の子トピックである応用トピックの達成度が低い場合、それらの応用トピックの共通の基礎トピック復習の重要度が上がることを意味する原理である。上記原理に加え、達成度処理部にて抽出した達成度の低いトピックのF−DAGに「トピック間の遷移」を定義する。
【0039】
「トピック間の遷移」は、達成度処理部10にて抽出した達成度の低いトピックのF−DAGの矢印の方向を逆に反転し、同トピックへの遷移を付け加えていることにより定義される。図7を用いて具体的に説明をする。図7は、簡単なF−DAGに「トピック間の遷移」を定義した一例を示す。左図は、達成度処理部10により抽出された達成度の低い、つまり初期重要度の高いトピックのF−DAGを、また、右図は左図のF−DAGに「トピック間の遷移」を定義したものを示している。左図のF−DAGはトピック91〜93の子トピックがトピック94という構造をしている。左図に「トピック間の遷移」を定義すると、トピック91〜93からトピック94への矢印がそれぞれ逆になり、トピック94自身への遷移の矢印が付加された右図となる。上記原理に加えF−DAGに「トピック間の遷移」を定義した場合、トピックの重要度は(1)遷移元のトピックの初期重要度と、(2)遷移元となるトピックの数と、(3)トピックの連鎖の長さと、(4)自己トピックの達成度にて決定される。上記重要度決定手法はPageRank方式と似ている。
【0040】
PAGERANKとは、World Wide Web上のウェブページの重要性を測るアルゴリズムのひとつであり、Web上でのWebページの重要度を示す評価要素である。PageRank方式とは、PAGERANKを以下のように決定する方法である。ページAからページBへのリンクをページAからページBへの支持投票とみなし、この投票数によりそのページの重要性を判断する。しかし、単に票数、つまりリンク数を見るだけでなく、票を投じたページについても分析を行う。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていく。つまり、ページの重要度は、(1)リンク元ページの重要度と、(2)リンク元ページの数により決定される。
【0041】
以上より、トピックの重要度決定手法とPageRank方式は、前記(1)のリンク元の重要度と、前記(2)のリンク元の数を基とする点について共通していることから似ているということができる。しかし、本実施形態におけるトピックの重要度決定手法は(3)トピックの連鎖が長いほど重要度が高くなる点、(4)自己トピックの重要度も用いている点の2点において両者は異なる。トピックの重要度の決定に、(4)自己トピックの達成度を用いるのは、学習カリキュラムにおいて理解不足の原因には関連するトピックだけでなく自己トピックも含まれるからである。
【0042】
次に重要度計算に用いられる「トピック間の遷移」における遷移確率について図7を用いて説明する。遷移確率とは、1つのトピックからはいくつかの遷移があるが、それらがそれぞれ起こる確率をいう。PageRank方式の遷移確率は、トピックごとに決まる数値、例えば重要度を考慮しない。つまり、全リンク元の遷移確率は同じである。一方、本発明の実施形態において遷移確率はトピックごとに決まる数値、達成度を考慮し、リンク元ごとに異なる。達成度を考慮した際の、遷移確率を決定する条件について図7を用いて説明する。
【0043】
図7においては、トピック94から91、92、93、94への4つの遷移が起こるそれぞれの確率が遷移確率である。トピック94からトピック94への遷移確率をWs、トピック94からトピック91への遷移確率をWh、トピック94からトピック92への遷移確率をWl、トピック94からトピック93への遷移確率をWrとする。遷移確率Ws、Wh、Wl、Wrの重みを以下のように設定する。遷移確率Ws、Wh、Wl、Wrの和は1になるようにする。
(1)トピックが基礎トピックの場合、遷移先は全トピックとし、その重みは同じとする。また、トピックはDAGのルートの場合、遷移先は自分と他のすべてのトピックとする。
(1)以外については、
(2)達成度の低いトピックは同トピックの遷移確率Wsをより高く設定。
(3)遷移先のトピックの達成度が自分の達成度より低い場合、そのトピックへの遷移確率Whを低く設定。
(4)遷移先のトピックの達成度が自分の達成度より高い場合、そのトピックへの遷移確率Wrを高く設定。
(5)遷移先のトピックは基礎トピックの場合、そのトピックへの遷移確率Wrを低く設定。
前記原理、前記「トピック間の遷移」および、上記に述べた条件により遷移確率を決定すること、により、PageRank方式に比べ高い精度でトピックの重要度を得ることができる。この点については、実施例1にて後述する。
【0044】
図8は、重要度処理部の処理フローを示す。達成度処理部にて抽出されたトピックについて、達成度が判明しているかを判断する(S71)。達成度が計算されているトピックについては、達成度と難易度を取得し(S72)、初期重要度r(t)を計算する(S74)。初期重要度r(t)は、トピック関連構造を反映していない。一方、トピックの達成度が判明していない場合は、その達成度が判明していないトピックとトピック関連構造にて関連したトピックの達成度が判明しているかを判断する(S73)。達成度が判明していないトピックとトピック関連構造にて関連したトピックの達成度が判明しているならば、その関連したトピックの初期重要度r(t)を計算する(S74)。他方、トピック関連構造での達成度が判明していないトピックと関連したトピックの達成度が判明していないならば、初期重要度r(t)はゼロとする。次に、達成度の低いトピックを抽出後のF−DAGの各トピックグラフGに対する遷移確率を上述した条件に沿った最適な値となるように計算し、遷移行列M(G)を取得する(S75)。ここで、S74で求めた各トピックの初期重要度r(t)を列ベクトルとし、トピックグラフGの重要度ベクトルr(G)を下記の式(1)のように表す。重要度ベクトルr(G)はトピック達成度および難易度に比例して初期化される。
【数1】
上記のようにして求められた、重要度ベクトルr(G)と遷移行列M(G)について、下記の式(2)と式(3)の計算をr(G)が収束するまで繰り返す(S76)。
【数2】
【数3】
その結果、収束したトピック重要度r(G)が得られ(S77)、各トピックの重要度r(t)’がトピックスコアDB6へ出力される(S78)。
上記計算により、求められたr(G)はトピック関連構造を反映した値となっている。なお、遷移確率をWs:Wh:Wl:Wr=2:1:1:2とすることで、10回ぐらいの反復で十分なトピック重要度r(G)が得られることが実験より判明している。
【0045】
<教材価値処理部>
図9に教材価値処理部の処理フローを示す。教材価値処理部12においては、重要度処理部にて求められた各トピックの重要度r(t)’をトピックスコアDB6から取得し(S91)、トピックDB5に保持されているトピックの難易度、教材DB7に保持されている教材の難易度、教材価値DB8に保持されている教材が過去に選ばれた回数等を基に教材kの価値(平準化した数値)v(k)を計算する(S92)。計算されたv(k)は教材価値DB8へ出力される(S93)。
【0046】
以下にv(k)の計算例として、重要度をそのまま教材の価値とする場合の式(4)と、ほかの方法で計算する重要度、例えば、トピックの難易度等と合わせる場合の式(5)を下記に示す。なお、教材が複数のトピックをカバーしているのであれば、複数のトピックの重要度を足し合わせることで教材の価値を求めることも可能である。また、他の方法で計算する重要度を複数合わせることも可能である。
【数4】
【数5】
【0047】
<教材選択処理部>
図10に教材価値処理部の処理フローを示す。教材選択処理部13においては、教材価値処理部にて求められた教材の価値を教材価値DB8から取得し(S101)、教材の価値が最大になるような教材の組合せを整数計画法により得る(S102)。S102にて得られた結果の教材の組合せは、出力部9を通じてディスプレイやプリンターによって教師へと結果が出力される(S103)。本実施形態の整数計画法には、以下に示すKnapsack型、および、集合被覆問題型の整数計画問題として定式化し解く手法を用いる。教材価値処理部12にて教材の価値が得られたことから、前記手法を用いることができる。
【0048】
Knapsack型の整数計画問題とは、容量Cのナップサックが1つと、n個の品物(各々、価値pi,容積ci)が与えられたとき、ナップサックの容量Cを超えない範囲でいくつかの品物をナップサックに詰め、ナップサックに入れた品物の価値の和を最大化する問題である。集合被覆問題とは、集合Uとその部分集合の族S1,・・・・,Smが与えられたとき、Uの要素をすべてカバーするように部分集合の族から最小個数の部分集合を選ぶ問題である。ここで、S1,・・・・,Smの和集合は、Uに等しくなるものとする。Knapsack型、および、集合被覆問題型はNP−hard問題であり、正確な解を求めることは困難であるが、高速な近似アルゴリズムが存在する。よって、Knapsack型、および、集合被覆問題型として定式化し解くことで従来よりも高速に解を得ることが可能である。教材価値を最大化する場合の定例式化例として式(6)と、被覆されるトピック数を考慮した教材価値最大化の定式化例として式(7)を示す。ここで、T、K、c(k)、x(k)、t(i)、K(i)、とcはそれぞれ、(重要度の高い)トピックの集合、トピックに関連する教材の集合、教材kのコスト(学習時間等)、教材kの選択変数、トピックiのカバー変数(選択された教材によってトピックが被覆されたかどうかの変数)、トピックiを被覆した教材の集合、および、コストの上限とする。
(1)教材価値を最大化する場合の定例式化例
【数6】
(2)被覆されるトピック数を考慮した教材価値最大化の定式化例
【数7】
αは被覆するトピック数を考慮して定められる正定数とする。α=0は教材価値の最大化と、αが大きな数の場合は被覆するトピック数の最大化と対応する。
【実施例1】
【0049】
本発明の一実施形態である、トピック関連構造に基づく「トピック間の遷移」の原理と遷移確率を用いた場合のトピックを重要度の高いものから並べる順位付け(以下、トピック・ランクという)の性能の実験結果を示す。図11には重要度の高いトピックグラフ例を示す。図11のグラフA〜Mは簡単なトピックグラフである。グラフのトピックの左横または下に記載されている数字はトピックの初期重要度を示している。グラフA、BはグラフCの同じ番号のトピックと同じ初期重要度である。同様にグラフDはグラフEと、グラフF、GはグラフHと、グラフI、JはグラフKとそれぞれ対応している。グラフA〜MについてPageRank方式を適用した場合のトピックの重要度と、本実施形態におけるトピック関連構造に基づく「トピック間の遷移」の原理と遷移確率を適用した場合のトピックの重要度の結果を図12〜図14に示す。
【0050】
図12は、トピックグラフが直線(図11のグラフA、B、C、D、E)の場合の結果を、各トピックに対する重要度の表として示す。グラフA、B、Cはトピックの連鎖が長いほど、その連鎖の基礎トピック(グラフのルート)の重要度が上がり、ランクが高くなることを検証するためである。また、グラフDとEは、基本形がグラフBとCに似ているが、それらの基礎トピックに関する達成度のデータがない(または判定に不十分である)場合を検証するためである。
【0051】
図12の結果から、本実施形態では重要度の高いトピックの連鎖が長くなればなるほど、その連鎖の基礎トピックの重要度およびランクが上がることがわかる。また、本実施形態では、連鎖の基礎トピックの重要度のデータがない場合、以上の性質が成り立つことに加えて、重要度のデータがある場合に比べて重要度が低いことも得られる。一方、図12からわかるように、PageRank式を適用した場合にはこのような特徴は得られない。ただし、本実施形態による実験結果はPageRank方式の場合と異なって、グラフの全トピックの重要度を足しても1になっていない。その理由は図10に記載されているトピックの初期重要度から計算された値であるからである。
【0052】
図13はトピックグラフが櫛状(図11のグラフF、G、H、I、J、K)の場合の結果を、各トピックに対する重要度の表として示す。グラフF〜Hは、重要度の高い子トピックが多いほど、基礎トピックの重要度およびランクが高いことを検証するためである。グラフI〜Kは、基本形がグラフF〜Kに似ているが、それらの基礎トピックの達成度のデータがない(または、判定に不十分である)場合を検証するためである。
【0053】
図13の結果から、本実施形態では、あるトピックの子トピックのうち重要度の高いものが多ければ多いほどその親の重要度およびランクは上がることがわかる。PageRank式を適用した場合でも、ランクは同じではある。しかしながら、PageRank方式では、子トピックが多いものはランクが低くなっており、また、基礎トピックの重要度が異なっていても重要度が同じ結果となる。これらのことより、重要度のデータがないトピックに関しても適切な重要度を得ることを目的としている本実施形態の目的を達することができず、直接使うことはできない。
【0054】
図14は、トピックグラフが線と櫛状の組合せ(図11のグラフL、M)の場合の結果を、各トピックに対する重要度の表として示す。図14の結果から、本実施形態では重要度の高いトピックは線と櫛状の組合せになってもランク付けは正しく得られることが示される。具体的には、グラフLにおいて連鎖の長いトピック1が1番となっており、グラフMにおいては子トピックが7つあるトピック1が1番、次に子トピックが3つのトピック3、子トピックが2つのトピック2となっている。つまり、連鎖の長い親トピックと子トピックが多い親トピックのランクが高くなっている。
【0055】
グラフL(そしてM)の中のトピック・ランクについて、PageRank式と本実施形態は同じ結果を示したが、グラフLとMを直接比べるときにランク付けが異なる。本実施形態は、遷移確率を設定することによって、長い連鎖の基礎トピックを重視するか、または、子トピックの多い基礎トピックを重視するかを直接調整することができる点で、PageRank式と異なる。
【0056】
学習カリキュラムにおけるトピックは以下の特徴を有する。
(1) トピックの連鎖が長いトピックほど重要度が高い。
(2) 子トピックが多いトピックほど重要度が高い。
(3)達成度が不明のトピックについても関連があるため、重要度が必要とされる。
上記結果より、上記3点の特徴を考慮した結果はPageRank方式を適用した場合では得られないが、本実施形態におけるトピック関連構造に基づく「トピック間遷移」の原理と遷移確率を適用した場合は得ることができることが判明した。
【実施例2】
【0057】
図15は、本発明の具体的な使用例における、実力テスト結果、小6算数トピック依存関係、小6算数教材DBとの繋がりを示す。繋がりは点線にて表す。テスト問題は、DAGを構成するトピックに関連付いている。図15においては、テスト問題A151は直方体(1)154に、テスト問題B152は直方体(1)154と直方体(2)155の2つに、逆に直方体(1)154がテスト問題A151とテスト問題B152に関連付いている。同様に、トピックは教材に関連付いており、図15においては、図形(小5学力領域復習)153は教材A156に、直方体(1)154は教材A156に関連付いている。上記より、テスト問題とトピック、トピックと教材は必ずしも1対1対応ではないこと、テスト教材と復習教材は、トピックを介して関連付けられていることがわかる。
【0058】
本実施形態とマッチングによる教材選択を組合せることも可能である。マッチング教材選択とは、マッチング教材選択の対象とする学力領域を設定、学力領域別の教材難易度を設定、条件に合致する教材の一覧生成を行う。本実施形態とマッチングによる教材選択を組合せの例として、得点上位X%ならマッチングモード、得点下位Y%ならマッチングモード、それ以外の得点では本実施形態とするものが挙げられる。
【0059】
図16は、本発明の実施形態にかかる教材選択装置1のハードウェア構成を示す図である。以下は、コンピュータを典型とする情報処理装置として全般的な構成を説明するが、専用機や組み込み型装置の場合、その環境に応じて必要最小限な構成を選択できることはいうまでもない。
【0060】
教材選択装置1は、CPU(Central Processing Unit)1010、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、パラレルポート1080、USBポート1090、グラフィック・コントローラ1020、VRAM1024、音声プロセッサ1030、I/Oコントローラ1070、ならびにキーボードおよびマウス・アダプタ等1100、ディジタルペン1101の入力手段を備える。I/Oコントローラ1070には、フレキシブル・ディスク(FD)ドライブ1072、ハード・ディスク1074、光ディスク・ドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。グラフィック・コントローラ1020には、表示装置1022が接続されている。また、オプションとして、音声プロセッサ1030には、増幅回路1032およびスピーカ1034が接続される。
【0061】
BIOS1060は、教材選択装置1の起動時にCPU1010が実行するブートプログラムや、教材選択装置1のハードウェアに依存するプログラム等を格納する。FDドライブ1072は、フレキシブル・ディスク1071からプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハード・ディスク1074に提供する。
【0062】
光ディスク・ドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この際は各ドライブに対応した光ディスク1077を使用する必要がある。光ディスク・ドライブ1076は光ディスク1077からプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハード・ディスク1074に提供することもできる。
【0063】
教材選択装置1に提供されるコンピュータ・プログラムは、フレキシブル・ディスク1071、光ディスク1077、またはメモリカード等の記録媒体に格納されて利用者によって提供される。このコンピュータ・プログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、または通信I/F1040を介してダウンロードされることによって、教材選択装置1にインストールされ実行される。コンピュータ・プログラムが教材選択装置1に働きかけて行わせる動作は、既に説明した装置における動作と同一であるので省略する。
【0064】
上述のコンピュータ・プログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としてはフレキシブル・ディスク1071、光ディスク1077、またはメモリカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバーシステムに設けたハード・ディスクまたは光ディスク・ライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してコンピュータ・プログラムを教材選択装置1に提供してもよい。
【0065】
以上の例は、教材選択装置1について主に説明したが、コンピュータに、上記機能を有するプログラムをインストールして、上記で説明した教材選択装置1の機能を実現することができる。したがって、本発明において1つの実施形態として説明した教材選択装置1は、方法およびそのコンピュータ・プログラムによっても実現可能である。
【0066】
上記で説明したように本発明の教材選択装置1は、ハードウェア、ソフトウェア、またはハードウェアおよびソフトウェアの組合せとして実現可能である。ハードウェアとソフトウェアの組合せによる実施では、所定のプログラムを有するコンピュータ・システムでの実施が典型的な例として挙げられる。かかる場合、該所定のプログラムが該コンピュータ・システムにロードされ実行されることにより、該プログラムは、コンピュータ・システムに本発明にかかる処理を実行させる。このプログラムは、任意の言語、コード、または表記によって表現可能な命令群から構成される。そのような命令群は、システムが特定の機能を直接実行すること、または(1)他の言語、コード、もしくは表記への変換、(2)他の媒体への複製、のいずれか一方もしくは双方が行われた後に、実行することを可能にするものである。もちろん、本発明は、そのようなプログラム自体のみならず、プログラムを記録した媒体を含むプログラム製品もその範囲に含むものである。本発明の機能を実行するためのプログラムは、フレキシブル・ディスク、MO、CD−ROM、DVD、ハード・ディスク装置、ROM、MRAM、RAM等の任意のコンピュータ可読媒体に格納することができる。かかるプログラムは、コンピュータ可読媒体への格納のために、通信回線で接続する他のコンピュータ・システムからダウンロードしたり、他の媒体から複製したりすることができる。また、かかるプログラムは、圧縮し、または複数に分割して、単一または複数の記録媒体に格納することもできる。
【0067】
以上、本発明を実施形態に則して説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態または実施例に記載されたものに限定されるものではない。
【図面の簡単な説明】
【0068】
【図1】本発明の一実施形態にかかる教材選択装置の機能構成を示す図である。
【図2】本発明の一実施形態の教材選択装置による処理の概要を示す図である。
【図3】達成度処理部の処理フローを示す図である。
【図4】あるプロジェクト・マネジメント研修のトピック関連構造を示す図である。
【図5】図4を簡略化し、構造のみを残した図である。
【図6】S38における達成度が低いトピック抽出前後のトピック関連構造およびS41の処理により抽出される達成度が低いトピック関連構造の基礎トピックを示す図である。
【図7】簡単なF−DAGに「トピック間の遷移」を定義した一例を示す図である。
【図8】重要度処理部の処理フローを示す図である。
【図9】教材価値処理部の処理フローを示す図である。
【図10】教材選択処理部の処理フローを示す図である。
【図11】重要度の高いトピックグラフ例を示す図である。
【図12】トピックグラフが直線(図11のグラフA、B、C、D、E)の場合の結果を示す表である。
【図13】トピックグラフが櫛状(図11のグラフF、G、H、I、J、K)の場合の結果を示す表である。
【図14】トピックグラフが線と櫛状の組合せ(図11のグラフL、M)の場合の結果を示す表である。
【図15】本発明の具体的な使用例における、実力テスト結果、小6算数トピック依存関係、小6算数教材DBとの繋がりを示す図である。
【図16】教材選択装置のハードウェア構成を示す図である。
【符号の説明】
【0069】
1 教材選択装置
2 入力部
9 出力部
3 テスト成績DB
4 テスト問題DB
5 トピックDB
6 トピックスコアDB
7 教材DB
8 教材価値DB
10 達成度処理部
11 重要度処理部
12 教材価値処理部
13 教材選択処理部
【技術分野】
【0001】
本発明は、コンピュータを利用した教育支援システムに関するものであり、特に、受験者の学習評価データに基づいて最適な教材を選択する教材選択方法、コンピュータ・プログラムおよび教材選択に関する。
【背景技術】
【0002】
従来より、教育の現場において、講師が受験者の学習評価データに基づいて最適な教材を選択することは容易ではなかった。近年ではコンピュータの発達に伴い、上記問題を解決するために、コンピュータを用いて教材を選択するいくつかの先行技術が存在する。前記教材の選択に関する先行技術は、主に、以下のように分類される。
1)成績別に設定したルール等によってトピックや教材を陽に指定する方式。
2)数理計画的にトピックや教材の組合せを求める方式。
3)上記2方式の併用。
前記先行技術の多くは学習カリキュラムの特性を利用している。前記学習カリキュラムの特性の例として、学校や塾が持つ学年別,科目別の学習カリキュラムが複数の学力領域(以下、トピックという)から構成されていること、カリキュラムに沿って用いられる教材はある特定のトピックに紐付くか、または複数のトピックに紐付いていることが挙げられる。
【0003】
上記1)の成績別に設定したルール等によってトピックや教材を陽に指定する方式の技術が、特許文献1〜3、非特許文献1に記載されている。特許文献1には、授業別に紐付けられた教材を提供する技術が開示されている。また、非特許文献1には、過去の学習履歴や、教材情報から優先順位つき教材リストの提供を行う技術が開示されている。特許文献2には、テスト問題を解く能力、得点の伸び、解答時間を総合して成績を評価し、その値を予め設定した閾値と比較し、選択対象とする教材のレベルを動的に変える技術が開示されている。また、特許文献3には、得点と合格基準点から理解度を算出し、その値が予め設定した閾値より低い教材を選択する技術が開示されている。
【0004】
非特許文献2には、上記2)の数理計画的にトピックや教材の組合せを求める方式の技術が記載されている。すなわち、これまでのテストに新たにテスト問題を加える場合に、テスト問題が理解の容易性と知識の応用性の両者を兼ね備えるように、前記テスト問題の知識の組合せを決定するための技術が記載されている。新テスト問題数と知識数を制約条件として、理解の容易性、知識の応用性、テスト問題作成の容易性を総合した目的関数が最大化されるように新テスト問題の知識の組合せを決定する。知識の組合せの決定においては、整数計画問題として定式化し、遺伝的アルゴリズムによって解を検索する。
【0005】
一方、トピック関連構造に関する先行技術はインターネット検索の主要技術の1つであるPAGERANK(登録商標)アルゴリズム(非特許文献3)とその発展(非特許文献4)等(以下、総じてPageRank方式という)がある。これらのアルゴリズムまたは方式はトピックに相当するもの(例えば、インターネットのホームページ)の構造で決まる隣接行列の最大固有値に対応する固有ベクトルによって、トピックの順位を定める手法である。
【0006】
【特許文献1】特開2005−241914号公報
【特許文献2】特開2000−66572号公報
【特許文献3】特開2003−345908号公報
【非特許文献1】阿部博:ナビゲーション機能を有する学習管理システムに関する研究 北陸先端科学技術大学院大学修士論文 2003年3月
【非特許文献2】竹内俊彦、佐久間章行:問題提示型試験における援用システムに関する研究 日本経営工学会論文誌 Vol.53,No.3,pp.189−200,2002年8月15日
【非特許文献3】L.Page,S.Brin,R.Motwani,T.Winograd:The PageRank Citation Ranking: Bringing Order to the Web, Stanford Digital Library Technologies Project, 1998.
【非特許文献4】T.H.Haveliwala:Topic−sensitive PageRank,Proc.of the 11th WWW Conference,2002.
【発明の開示】
【発明が解決しようとする課題】
【0007】
上記1)に関する従来技術では受験者等の成績等の情報から適する教材を選択することができる。しかしながら、成績等の元の情報がカバーしているトピックの教材のみが選択対象であり、関連するトピックの教材は選択の対象外である。学習において、各トピックは関連しており、あるトピックが理解できていないことは、そのトピックではなく関連するトピックが原因となる場合があるため、関連するトピックの教材が選択されることも必要である。
【0008】
また、上記2)に関する従来技術では、数理計画的アプローチにより問題に適する知識を選択することができる。前記数理計画的アプローチとして、例えば遺伝的アルゴリズムによって解を検索すると膨大な計算量が必要となり、時間を要することとなる。前記従来技術にて遺伝的アルゴリズムを用いるのは1つのテスト問題を作成するためであり、解の検索を行うのは1回であるからである。一方、教材選択は生徒別に行うので、生徒数分の解の検索が必要である。そのため、1回の計算量が膨大であり、時間がかかる遺伝的アルゴリズムを用いるのでは、現実的な時間で生徒数分の教材を選択することは困難となる。
【0009】
そこで、本発明は上記課題に鑑み、受験者に最適な教材を選択する方法とその装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の1つの態様では、以下のような解決手段を提供する。本発明の第1の形態によると、受験者の学習評価データに基づいて教材を選択する方法において、コンピュータが前記学習評価データと学力領域の難易度に基づいて受験者の各学力領域の達成度を計算するステップと、前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、前記重要度に基づいて教材の価値を計算するステップと、前記教材の価値を基に教材を選択するための計算を行うステップとを備えた教材選択方法が提供される。
【0011】
本発明の第2の態様によると、達成度を計算するステップでは、達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出する。
【0012】
本発明の第3の態様によると、重要度を計算するステップでは、各トピック間の遷移を定義し、コンピュータが前記定義と前記達成度から重要度を計算する。
【0013】
別の態様によると、重要度を計算するステップでは、各トピック間の遷移に遷移確率を設定する。
【0014】
また、本発明は、別の態様としてコンピュータにおいて実行されるコンピュータ・プログラムあるいは、そのコンピュータ・プログラムをインストールした教材選択装置としても提供できる。
【0015】
ここで、「学習評価データ」とは、受験者の成績や、学習時間、塾への通学の有無等受験者の学習に関するデータを意味する。「学力領域(トピック)」とは、学年別、科目別の学習カリキュラムの中の学習項目を示す。学習カリキュラムとは、生徒、児童が学習するコースとして立てられた教育内容の系列である。「学力領域関連構造」とは、トピック間の依存関係をいい、非閉路有向グラフ(Directed acyclic graph、以下、DAGという)で表される。「LCA」(Least Common Ancestor)とは、最も親等が近い共通の祖先を意味する。本態様においては、達成度の低いトピック集合の最も近い共通のトピックを意味し、前記共通のトピックを基礎トピックという。「所定の値」とは平均の達成度や、予め設定した閾値等を示す。
【0016】
本発明の利点は以下のとおりである。
【0017】
第1に、受験者の学習評価データから求めたトピックの達成度と、トピック関連構造より重要度を計算し、前記重要度を基に教材価値を計算し、教材価値を用いて教材の組合せを取得することにより、従来技術よりも高速で結果を得ることができる。
【0018】
第2に、トピック関連構造においてLCAを用いることにより、教材を選択する上で重要である達成度が不明なトピックを抽出することができる。
【0019】
第3に、重要度を計算するステップにおいて、各トピック間の遷移を定義し用いること
により、教材を選択する際に必要となるトピックをすべて考慮に入れることができる。第4に、トピック間の遷移に遷移確率を設定することにより、精度の高い重要度を導きだすことができる。
【発明の効果】
【0020】
本発明によれば、受験者の学習評価データに基づいて最適な教材を従来の方法よりも短時間かつ高い精度で選択することができる教材選択方法、コンピュータ・プログラムおよび教材選択装置を提供することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施形態について図面を参照して説明する。図1は、本発明の一実施形態にかかる教材選択装置の機能構成を示す。線矢印は本例において少なくとも必要なデータの流れを示し、点線矢印は場合によっては用いられるデータの流れを示す。以下、簡略のためデータベースをDBと表記する。本例の教材選択装置1は、生徒と生徒の成績を関連付けて保持するテスト成績DB3、テスト問題に関する情報を保持しているテスト問題DB4、トピックの難易度を保持しているトピックDB5、生徒と各トピックの達成度および重要度を関連付けて保持するトピックスコアDB6、教材の難易度を保持している教材DB7、教材の価値を保持する教材価値DB8を備えている。テスト成績DB3は受験者と受験者の学習評価データを関連付けて記憶している学習評価データ記憶手段の一例である。同様に、テスト問題DB4は受験された問題に関する情報を記憶している問題情報記憶手段、トピックDB5は、学力領域関連構造の情報を記憶している学力領域関連構造記憶手段、トピックスコアDB6は受験者とトピックの達成度および重要度を関連付けて記憶している重要度記憶手段、教材DB7は教材情報を予め記憶している教材記憶手段、教材価値DB8は受験者と教材の価値を関連付けて記憶している教材価値記憶手段、の一例である。なお、各記憶手段はハード・ディスク上のDBに限らず、メモリ、磁気テープやフレキシブル・ディスク(FD)等の外部記憶装置でもよい。
【0022】
また、同装置は生徒のトピックの達成度を計算する達成度処理部10、達成度を基にトピックの重要度を計算する重要度処理部11、重要度を基に教材の価値を計算する教材価値処理部12、生徒にとって最適な教材を選ぶ教材選択処理部13を備えている。さらに、データ入力を行う入力部2、データ出力を行う出力部9も備えている。なお、本実施形態では教材選択装置1が1台の装置にて構成されているが、DBと処理部を分散して、複数の装置から構成することも可能である。また、ネットワークを介したサーバー/クライアント構成をとることも可能である。
【0023】
次に、上記の各DBおよび各機能部の詳細な機能とともに、本装置における処理を説明する。図2は、本実施形態の教材選択装置による処理の概要を示す。大きく分けて、図示するように、本装置は下記の4つの処理を行う。達成度処理部10による生徒の成績から達成度を計算する達成度処理(S21)、重要度処理部11による達成度からトピックの重要度を計算する重要度処理(S22)、教材価値処理部12による重要度から教材の価値を計算する教材価値処理(S23)、教材選択処理部13による教材価値に基づいて生徒に最適な教材を選択する教材選択処理(S24)の手順で実行される。
【0024】
以下、各DBの機能および最低限必要なデータ項目について説明する。
[テスト成績DB3]
テスト成績を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:テスト問題ID
Score:生徒の成績
【0025】
[テスト問題DB4]
テスト問題とトピックの関係を表すDBで、テスト問題の採点結果から生徒のトピックの達成度を計算するために用いる。以下のデータ項目を保持する
ID:テスト問題ID
Level:テスト問題の難易度
Topics:関連トピックのリスト
Ave.Score:全生徒の平均スコア
【0026】
[トピックDB5]
トピック関連構造(前提や後続条件等)を保持するDBで、トピックの重要度を計算するために用いる。以下のデータ項目を保持する。
ID:トピックID
Level:トピックの難易度
Related Topics:親(前提トピック)、子(後続トピック)、とそれ以外の関連トピックのリスト(親子関係が容易に断定できないトピック集)
Avg.Score:全生徒の平均達成度
【0027】
[トピックスコアDB6]
トピックの達成度および重要度を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:トピックID
Score:トピックの達成度
Relevancy:トピックの重要度
【0028】
[教材DB7]
教材とトピックの関連を保持するDBである。以下のデータ項目を保持する。
ID:教材ID
Level:教材の難易度
Hours:教材の学習時間
Topics:被覆したトピックリスト
【0029】
[教材の価値DB8]
教材の価値等の情報を保持し、生徒別に構成されるDBである。以下のデータ項目を保持する。
ID:教材ID
Number of Use:過去に選ばれた回数
Value:教材の価値
【0030】
<達成度処理部>
上記DBを利用して生徒に対する教材選択のための個々の処理について説明する。図3は、達成度処理部の処理フローを示す。まず、テスト採点者は、キーボード、マウス、ディジタルペン等の入力部2を通じて、テスト成績DB3に問題ごとに成績を記憶させる。テスト成績DB3から生徒の問題ごとの成績を取得する(S31)。そして、S31にて取得した問題の難易度と生徒の平均点数をテスト問題DB4から取得する(S32)。続いて、前記問題に関連するトピックをテスト問題DB4から取得する(S33)。S33にて取得した問題に関するトピックの達成度を成績と問題の難易度から計算し(S34)、達成度の低いトピックだけを抽出する(S35)。S33で取得した全トピックについてテスト問題がない、または少ないトピックであるかを判断する(S36)。テスト問題がある、または少ないトピックではない場合、全生徒の平均達成度を計算し(S37)、平均達成度をトピックDB5へ登録する(S38)。一方、テスト問題がない、または少ないトピックの場合には、そのトピックが達成度の低いトピックから形成されるDAGのLCAであるかを判断する(S39)。DAGについては後述にて詳細を説明する。前記トピックが達成度の低いトピックから形成されるDAGのLCAでない場合は、そのトピックを選択から除外する(S40)。他方、前記トピックが達成度の低いトピックから形成されるDAGのLCAである場合には、そのトピックを達成度が不明な基礎トピックとして抽出する(S41)。以上より、抽出された達成度が低いトピックおよび達成度が不明な基礎トピックをトピックDB5へ登録する(S42)。ここで、達成度が低いとは、例えば、平均の達成度と比較して低い場合や、予め設定した閾値より低い場合を示す。
【0031】
上記達成度処理において、生徒が難しい問題を正解した時にその問題の関連トピックへの達成度を高くすること、逆に簡単なテスト問題を間違った時にその問題の関連トピックの達成度を低くすること等が可能である。また、同処理により、テストの対象となるトピックを全生徒の平均達成度と比較し、それぞれ達成度が高い(good)、低い(bad)、平均的(average)、または不明(unknown)と分類することが可能である。全生徒の平均達成度が計算されることにより、客観的にトピックの難易度の評価をすることも可能である。これにより、トピックDB5の難易度を変更することも可能である。
【0032】
ここで、DAGとは、閉路を含むパスが存在しない有向グラフをいう。有向グラフとは、いくつかの点の集まりと異なる2つの点を結ぶ矢印の集まりで描かれた図をいい、閉路とは、同じ点を繰り返し含むようなパスをいう。
【0033】
本発明の実施態様においてトピック関連構造をDAGで表現する理由を説明する。トピック関連構造は、教師の知識や、カリキュラムの構成から所与として、基本的にDAGで表現する。その理由は、多くのカリキュラム(または講座)のトピックが決まった順番に教えられ、その順番によりトピックがDAGを形成しているからである。図4は、一例として、あるプロジェクト・マネジメント研修のトピック関連構造を示したものである。四角で囲まれた各講座は、プロジェクト・マネジメント研修のトピックであり、矢印は講座の受ける順番を表している。図5は、図4の講座を白丸にて置き換え簡略化および骨格を明確化したものである。図4、図5からプロジェクト・マネジメント研修はいくつかのトピックの集まりと異なる2つのトピックを結ぶ矢印で表すことができる。また、同じトピックを繰り返し含むパスもないことから、DAGを形成していると言える。プロジェクトの計画技法52および適用業務開発プロジェクトの管理56の親トピックは入門講座51である。またプロジェクトの計画技法52の子トピックは、適用業務開発プロジェクトの計画演習53、プロジェクトの運営技法54である。プロジェクト・リーダー疑似体験コース57の親トピックはプロジェクトの運営技法54、適用業務開発プロジェクトの運営演習55、適用業務開発プロジェクトの管理56である。このように、複数の親トピックを持つことも可能である。DAGは有向グラフであるため、トピック間が矢印で結ばれていることが必要である。しかし、本発明の実施態様においては、トピック間の矢印が不明であっても、各生徒のコースを受ける順番や、成績の値等から、向きを後で固定することが可能である。また、非特許文献2のように、教育システムの構築においては、トピック関連構造がDAGとしてよく表現される。
【0034】
以上より、学習カリキュラムのトピック関連構造をDAGとして仮定することは当然の手法であるといえる。学習カリキュラムのトピック関連構造がDAGでない場合であっても、本発明の実施態様においては達成度を用いてトピック関連構造をDAGに変換することができる。
【0035】
S38にて達成度が低いトピックを全トピック関連構造図から抽出するのは、選択すべき教材は達成度の低いトピックに関するものであるからである。トピック関連構造図は連結したDAGであるため、抽出した結果のトピックは非閉路有向グラフの集合(以下、F−DAG:Forest of DAGという)となる。S41にて、達成度の低いトピックからなるF−DAGの基礎トピックが抽出される。トピックは関連構造をしているので、あるトピックの達成度が低いことはそのトピックに関連するトピックが原因である場合があり、学習カリキュラムにおいては特に基礎トピックが原因となることが多く、重要である。そのため、達成度の低いトピックからなるF−DAGの基礎トピックを達成度の低いトピックと合わせて抽出し、次に説明する重要度計算に用いる。しかし、基礎トピックはテスト問題がない、または少ないトピックである。そのため、テスト問題がないトピックの達成度は計算されておらず、また、テスト問題が少ないトピックはトピックに紐付く問題数のばらつきによりトピックの信頼度にばらつきが生じるという問題点がある。そこで、これらの問題を、基礎トピックを達成度の低いトピックからなるF−DAGのルートとして重要度計算に適用し基礎トピックの重要度を推定することで解消する。
【0036】
基礎トピックは、達成度が低いトピック集合に対し、従来技術であるLCA発見アルゴリズムにて高速に計算することで見つけることが可能である。ただし、LCAが離れている場合やLCAがルートに近い場合、多数のトピックが選ばれる可能性がある。この場合には、DAG上でトピックをいくつさかのぼれるか最大値を設定することで、選ばれるトピック数を制限する。
【0037】
上述S38とS41によるトピック抽出を図で表したのが図6である。図6は、S38における達成度が低いトピック抽出前後のトピック関連構造およびS41の処理により抽出される達成度が低いトピック関連構造の基礎トピックを示している。達成度の低いトピックは黒丸、達成度の高いトピックは白丸、基礎トピックは斜線丸で表している。達成度計算後のトピック関連構造71から、S38の処理にて達成度の低いトピックを抽出し、S41の処理にて達成度の不明な基礎トピックを抽出したものがトピック関連構造72である。なお、上述したとおり抽出後のトピック関連構造はF−DAGになっている。図6において基礎トピックはF−DAGの一番上に位置する。
【0038】
<重要度処理部>
達成度処理部10の処理が終了すると、重要度処理部11にてトピック関連構造を考慮したトピックの重要度計算を行う。重要度計算においては2つのステップ、達成度から重要度を求めるステップと前記重要度からDAGを考慮した重要度を求めるステップがある。達成度から求めた重要度を以下初期重要度という。初期重要度からDAGを考慮した重要度を求める重要度計算には、以下の原理が使用される。
(原理1)
重要度が高いトピックの親は重要である。これは、達成度の低いトピックに関して、そのトピック自体の復習だけでなく、そのトピックの親(基礎)の復習も、生徒にとっては重要であることに基づいた原理である。つまり、あるトピックの達成度が低い原因はそのトピック、または、その親トピック、の理解不足からであると仮定する。
(原理2)
重要度の高い子トピックが多いトピックは重要である。これは、複数の子トピックである応用トピックの達成度が低い場合、それらの応用トピックの共通の基礎トピック復習の重要度が上がることを意味する原理である。上記原理に加え、達成度処理部にて抽出した達成度の低いトピックのF−DAGに「トピック間の遷移」を定義する。
【0039】
「トピック間の遷移」は、達成度処理部10にて抽出した達成度の低いトピックのF−DAGの矢印の方向を逆に反転し、同トピックへの遷移を付け加えていることにより定義される。図7を用いて具体的に説明をする。図7は、簡単なF−DAGに「トピック間の遷移」を定義した一例を示す。左図は、達成度処理部10により抽出された達成度の低い、つまり初期重要度の高いトピックのF−DAGを、また、右図は左図のF−DAGに「トピック間の遷移」を定義したものを示している。左図のF−DAGはトピック91〜93の子トピックがトピック94という構造をしている。左図に「トピック間の遷移」を定義すると、トピック91〜93からトピック94への矢印がそれぞれ逆になり、トピック94自身への遷移の矢印が付加された右図となる。上記原理に加えF−DAGに「トピック間の遷移」を定義した場合、トピックの重要度は(1)遷移元のトピックの初期重要度と、(2)遷移元となるトピックの数と、(3)トピックの連鎖の長さと、(4)自己トピックの達成度にて決定される。上記重要度決定手法はPageRank方式と似ている。
【0040】
PAGERANKとは、World Wide Web上のウェブページの重要性を測るアルゴリズムのひとつであり、Web上でのWebページの重要度を示す評価要素である。PageRank方式とは、PAGERANKを以下のように決定する方法である。ページAからページBへのリンクをページAからページBへの支持投票とみなし、この投票数によりそのページの重要性を判断する。しかし、単に票数、つまりリンク数を見るだけでなく、票を投じたページについても分析を行う。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていく。つまり、ページの重要度は、(1)リンク元ページの重要度と、(2)リンク元ページの数により決定される。
【0041】
以上より、トピックの重要度決定手法とPageRank方式は、前記(1)のリンク元の重要度と、前記(2)のリンク元の数を基とする点について共通していることから似ているということができる。しかし、本実施形態におけるトピックの重要度決定手法は(3)トピックの連鎖が長いほど重要度が高くなる点、(4)自己トピックの重要度も用いている点の2点において両者は異なる。トピックの重要度の決定に、(4)自己トピックの達成度を用いるのは、学習カリキュラムにおいて理解不足の原因には関連するトピックだけでなく自己トピックも含まれるからである。
【0042】
次に重要度計算に用いられる「トピック間の遷移」における遷移確率について図7を用いて説明する。遷移確率とは、1つのトピックからはいくつかの遷移があるが、それらがそれぞれ起こる確率をいう。PageRank方式の遷移確率は、トピックごとに決まる数値、例えば重要度を考慮しない。つまり、全リンク元の遷移確率は同じである。一方、本発明の実施形態において遷移確率はトピックごとに決まる数値、達成度を考慮し、リンク元ごとに異なる。達成度を考慮した際の、遷移確率を決定する条件について図7を用いて説明する。
【0043】
図7においては、トピック94から91、92、93、94への4つの遷移が起こるそれぞれの確率が遷移確率である。トピック94からトピック94への遷移確率をWs、トピック94からトピック91への遷移確率をWh、トピック94からトピック92への遷移確率をWl、トピック94からトピック93への遷移確率をWrとする。遷移確率Ws、Wh、Wl、Wrの重みを以下のように設定する。遷移確率Ws、Wh、Wl、Wrの和は1になるようにする。
(1)トピックが基礎トピックの場合、遷移先は全トピックとし、その重みは同じとする。また、トピックはDAGのルートの場合、遷移先は自分と他のすべてのトピックとする。
(1)以外については、
(2)達成度の低いトピックは同トピックの遷移確率Wsをより高く設定。
(3)遷移先のトピックの達成度が自分の達成度より低い場合、そのトピックへの遷移確率Whを低く設定。
(4)遷移先のトピックの達成度が自分の達成度より高い場合、そのトピックへの遷移確率Wrを高く設定。
(5)遷移先のトピックは基礎トピックの場合、そのトピックへの遷移確率Wrを低く設定。
前記原理、前記「トピック間の遷移」および、上記に述べた条件により遷移確率を決定すること、により、PageRank方式に比べ高い精度でトピックの重要度を得ることができる。この点については、実施例1にて後述する。
【0044】
図8は、重要度処理部の処理フローを示す。達成度処理部にて抽出されたトピックについて、達成度が判明しているかを判断する(S71)。達成度が計算されているトピックについては、達成度と難易度を取得し(S72)、初期重要度r(t)を計算する(S74)。初期重要度r(t)は、トピック関連構造を反映していない。一方、トピックの達成度が判明していない場合は、その達成度が判明していないトピックとトピック関連構造にて関連したトピックの達成度が判明しているかを判断する(S73)。達成度が判明していないトピックとトピック関連構造にて関連したトピックの達成度が判明しているならば、その関連したトピックの初期重要度r(t)を計算する(S74)。他方、トピック関連構造での達成度が判明していないトピックと関連したトピックの達成度が判明していないならば、初期重要度r(t)はゼロとする。次に、達成度の低いトピックを抽出後のF−DAGの各トピックグラフGに対する遷移確率を上述した条件に沿った最適な値となるように計算し、遷移行列M(G)を取得する(S75)。ここで、S74で求めた各トピックの初期重要度r(t)を列ベクトルとし、トピックグラフGの重要度ベクトルr(G)を下記の式(1)のように表す。重要度ベクトルr(G)はトピック達成度および難易度に比例して初期化される。
【数1】
上記のようにして求められた、重要度ベクトルr(G)と遷移行列M(G)について、下記の式(2)と式(3)の計算をr(G)が収束するまで繰り返す(S76)。
【数2】
【数3】
その結果、収束したトピック重要度r(G)が得られ(S77)、各トピックの重要度r(t)’がトピックスコアDB6へ出力される(S78)。
上記計算により、求められたr(G)はトピック関連構造を反映した値となっている。なお、遷移確率をWs:Wh:Wl:Wr=2:1:1:2とすることで、10回ぐらいの反復で十分なトピック重要度r(G)が得られることが実験より判明している。
【0045】
<教材価値処理部>
図9に教材価値処理部の処理フローを示す。教材価値処理部12においては、重要度処理部にて求められた各トピックの重要度r(t)’をトピックスコアDB6から取得し(S91)、トピックDB5に保持されているトピックの難易度、教材DB7に保持されている教材の難易度、教材価値DB8に保持されている教材が過去に選ばれた回数等を基に教材kの価値(平準化した数値)v(k)を計算する(S92)。計算されたv(k)は教材価値DB8へ出力される(S93)。
【0046】
以下にv(k)の計算例として、重要度をそのまま教材の価値とする場合の式(4)と、ほかの方法で計算する重要度、例えば、トピックの難易度等と合わせる場合の式(5)を下記に示す。なお、教材が複数のトピックをカバーしているのであれば、複数のトピックの重要度を足し合わせることで教材の価値を求めることも可能である。また、他の方法で計算する重要度を複数合わせることも可能である。
【数4】
【数5】
【0047】
<教材選択処理部>
図10に教材価値処理部の処理フローを示す。教材選択処理部13においては、教材価値処理部にて求められた教材の価値を教材価値DB8から取得し(S101)、教材の価値が最大になるような教材の組合せを整数計画法により得る(S102)。S102にて得られた結果の教材の組合せは、出力部9を通じてディスプレイやプリンターによって教師へと結果が出力される(S103)。本実施形態の整数計画法には、以下に示すKnapsack型、および、集合被覆問題型の整数計画問題として定式化し解く手法を用いる。教材価値処理部12にて教材の価値が得られたことから、前記手法を用いることができる。
【0048】
Knapsack型の整数計画問題とは、容量Cのナップサックが1つと、n個の品物(各々、価値pi,容積ci)が与えられたとき、ナップサックの容量Cを超えない範囲でいくつかの品物をナップサックに詰め、ナップサックに入れた品物の価値の和を最大化する問題である。集合被覆問題とは、集合Uとその部分集合の族S1,・・・・,Smが与えられたとき、Uの要素をすべてカバーするように部分集合の族から最小個数の部分集合を選ぶ問題である。ここで、S1,・・・・,Smの和集合は、Uに等しくなるものとする。Knapsack型、および、集合被覆問題型はNP−hard問題であり、正確な解を求めることは困難であるが、高速な近似アルゴリズムが存在する。よって、Knapsack型、および、集合被覆問題型として定式化し解くことで従来よりも高速に解を得ることが可能である。教材価値を最大化する場合の定例式化例として式(6)と、被覆されるトピック数を考慮した教材価値最大化の定式化例として式(7)を示す。ここで、T、K、c(k)、x(k)、t(i)、K(i)、とcはそれぞれ、(重要度の高い)トピックの集合、トピックに関連する教材の集合、教材kのコスト(学習時間等)、教材kの選択変数、トピックiのカバー変数(選択された教材によってトピックが被覆されたかどうかの変数)、トピックiを被覆した教材の集合、および、コストの上限とする。
(1)教材価値を最大化する場合の定例式化例
【数6】
(2)被覆されるトピック数を考慮した教材価値最大化の定式化例
【数7】
αは被覆するトピック数を考慮して定められる正定数とする。α=0は教材価値の最大化と、αが大きな数の場合は被覆するトピック数の最大化と対応する。
【実施例1】
【0049】
本発明の一実施形態である、トピック関連構造に基づく「トピック間の遷移」の原理と遷移確率を用いた場合のトピックを重要度の高いものから並べる順位付け(以下、トピック・ランクという)の性能の実験結果を示す。図11には重要度の高いトピックグラフ例を示す。図11のグラフA〜Mは簡単なトピックグラフである。グラフのトピックの左横または下に記載されている数字はトピックの初期重要度を示している。グラフA、BはグラフCの同じ番号のトピックと同じ初期重要度である。同様にグラフDはグラフEと、グラフF、GはグラフHと、グラフI、JはグラフKとそれぞれ対応している。グラフA〜MについてPageRank方式を適用した場合のトピックの重要度と、本実施形態におけるトピック関連構造に基づく「トピック間の遷移」の原理と遷移確率を適用した場合のトピックの重要度の結果を図12〜図14に示す。
【0050】
図12は、トピックグラフが直線(図11のグラフA、B、C、D、E)の場合の結果を、各トピックに対する重要度の表として示す。グラフA、B、Cはトピックの連鎖が長いほど、その連鎖の基礎トピック(グラフのルート)の重要度が上がり、ランクが高くなることを検証するためである。また、グラフDとEは、基本形がグラフBとCに似ているが、それらの基礎トピックに関する達成度のデータがない(または判定に不十分である)場合を検証するためである。
【0051】
図12の結果から、本実施形態では重要度の高いトピックの連鎖が長くなればなるほど、その連鎖の基礎トピックの重要度およびランクが上がることがわかる。また、本実施形態では、連鎖の基礎トピックの重要度のデータがない場合、以上の性質が成り立つことに加えて、重要度のデータがある場合に比べて重要度が低いことも得られる。一方、図12からわかるように、PageRank式を適用した場合にはこのような特徴は得られない。ただし、本実施形態による実験結果はPageRank方式の場合と異なって、グラフの全トピックの重要度を足しても1になっていない。その理由は図10に記載されているトピックの初期重要度から計算された値であるからである。
【0052】
図13はトピックグラフが櫛状(図11のグラフF、G、H、I、J、K)の場合の結果を、各トピックに対する重要度の表として示す。グラフF〜Hは、重要度の高い子トピックが多いほど、基礎トピックの重要度およびランクが高いことを検証するためである。グラフI〜Kは、基本形がグラフF〜Kに似ているが、それらの基礎トピックの達成度のデータがない(または、判定に不十分である)場合を検証するためである。
【0053】
図13の結果から、本実施形態では、あるトピックの子トピックのうち重要度の高いものが多ければ多いほどその親の重要度およびランクは上がることがわかる。PageRank式を適用した場合でも、ランクは同じではある。しかしながら、PageRank方式では、子トピックが多いものはランクが低くなっており、また、基礎トピックの重要度が異なっていても重要度が同じ結果となる。これらのことより、重要度のデータがないトピックに関しても適切な重要度を得ることを目的としている本実施形態の目的を達することができず、直接使うことはできない。
【0054】
図14は、トピックグラフが線と櫛状の組合せ(図11のグラフL、M)の場合の結果を、各トピックに対する重要度の表として示す。図14の結果から、本実施形態では重要度の高いトピックは線と櫛状の組合せになってもランク付けは正しく得られることが示される。具体的には、グラフLにおいて連鎖の長いトピック1が1番となっており、グラフMにおいては子トピックが7つあるトピック1が1番、次に子トピックが3つのトピック3、子トピックが2つのトピック2となっている。つまり、連鎖の長い親トピックと子トピックが多い親トピックのランクが高くなっている。
【0055】
グラフL(そしてM)の中のトピック・ランクについて、PageRank式と本実施形態は同じ結果を示したが、グラフLとMを直接比べるときにランク付けが異なる。本実施形態は、遷移確率を設定することによって、長い連鎖の基礎トピックを重視するか、または、子トピックの多い基礎トピックを重視するかを直接調整することができる点で、PageRank式と異なる。
【0056】
学習カリキュラムにおけるトピックは以下の特徴を有する。
(1) トピックの連鎖が長いトピックほど重要度が高い。
(2) 子トピックが多いトピックほど重要度が高い。
(3)達成度が不明のトピックについても関連があるため、重要度が必要とされる。
上記結果より、上記3点の特徴を考慮した結果はPageRank方式を適用した場合では得られないが、本実施形態におけるトピック関連構造に基づく「トピック間遷移」の原理と遷移確率を適用した場合は得ることができることが判明した。
【実施例2】
【0057】
図15は、本発明の具体的な使用例における、実力テスト結果、小6算数トピック依存関係、小6算数教材DBとの繋がりを示す。繋がりは点線にて表す。テスト問題は、DAGを構成するトピックに関連付いている。図15においては、テスト問題A151は直方体(1)154に、テスト問題B152は直方体(1)154と直方体(2)155の2つに、逆に直方体(1)154がテスト問題A151とテスト問題B152に関連付いている。同様に、トピックは教材に関連付いており、図15においては、図形(小5学力領域復習)153は教材A156に、直方体(1)154は教材A156に関連付いている。上記より、テスト問題とトピック、トピックと教材は必ずしも1対1対応ではないこと、テスト教材と復習教材は、トピックを介して関連付けられていることがわかる。
【0058】
本実施形態とマッチングによる教材選択を組合せることも可能である。マッチング教材選択とは、マッチング教材選択の対象とする学力領域を設定、学力領域別の教材難易度を設定、条件に合致する教材の一覧生成を行う。本実施形態とマッチングによる教材選択を組合せの例として、得点上位X%ならマッチングモード、得点下位Y%ならマッチングモード、それ以外の得点では本実施形態とするものが挙げられる。
【0059】
図16は、本発明の実施形態にかかる教材選択装置1のハードウェア構成を示す図である。以下は、コンピュータを典型とする情報処理装置として全般的な構成を説明するが、専用機や組み込み型装置の場合、その環境に応じて必要最小限な構成を選択できることはいうまでもない。
【0060】
教材選択装置1は、CPU(Central Processing Unit)1010、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、パラレルポート1080、USBポート1090、グラフィック・コントローラ1020、VRAM1024、音声プロセッサ1030、I/Oコントローラ1070、ならびにキーボードおよびマウス・アダプタ等1100、ディジタルペン1101の入力手段を備える。I/Oコントローラ1070には、フレキシブル・ディスク(FD)ドライブ1072、ハード・ディスク1074、光ディスク・ドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。グラフィック・コントローラ1020には、表示装置1022が接続されている。また、オプションとして、音声プロセッサ1030には、増幅回路1032およびスピーカ1034が接続される。
【0061】
BIOS1060は、教材選択装置1の起動時にCPU1010が実行するブートプログラムや、教材選択装置1のハードウェアに依存するプログラム等を格納する。FDドライブ1072は、フレキシブル・ディスク1071からプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハード・ディスク1074に提供する。
【0062】
光ディスク・ドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この際は各ドライブに対応した光ディスク1077を使用する必要がある。光ディスク・ドライブ1076は光ディスク1077からプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハード・ディスク1074に提供することもできる。
【0063】
教材選択装置1に提供されるコンピュータ・プログラムは、フレキシブル・ディスク1071、光ディスク1077、またはメモリカード等の記録媒体に格納されて利用者によって提供される。このコンピュータ・プログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、または通信I/F1040を介してダウンロードされることによって、教材選択装置1にインストールされ実行される。コンピュータ・プログラムが教材選択装置1に働きかけて行わせる動作は、既に説明した装置における動作と同一であるので省略する。
【0064】
上述のコンピュータ・プログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としてはフレキシブル・ディスク1071、光ディスク1077、またはメモリカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバーシステムに設けたハード・ディスクまたは光ディスク・ライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してコンピュータ・プログラムを教材選択装置1に提供してもよい。
【0065】
以上の例は、教材選択装置1について主に説明したが、コンピュータに、上記機能を有するプログラムをインストールして、上記で説明した教材選択装置1の機能を実現することができる。したがって、本発明において1つの実施形態として説明した教材選択装置1は、方法およびそのコンピュータ・プログラムによっても実現可能である。
【0066】
上記で説明したように本発明の教材選択装置1は、ハードウェア、ソフトウェア、またはハードウェアおよびソフトウェアの組合せとして実現可能である。ハードウェアとソフトウェアの組合せによる実施では、所定のプログラムを有するコンピュータ・システムでの実施が典型的な例として挙げられる。かかる場合、該所定のプログラムが該コンピュータ・システムにロードされ実行されることにより、該プログラムは、コンピュータ・システムに本発明にかかる処理を実行させる。このプログラムは、任意の言語、コード、または表記によって表現可能な命令群から構成される。そのような命令群は、システムが特定の機能を直接実行すること、または(1)他の言語、コード、もしくは表記への変換、(2)他の媒体への複製、のいずれか一方もしくは双方が行われた後に、実行することを可能にするものである。もちろん、本発明は、そのようなプログラム自体のみならず、プログラムを記録した媒体を含むプログラム製品もその範囲に含むものである。本発明の機能を実行するためのプログラムは、フレキシブル・ディスク、MO、CD−ROM、DVD、ハード・ディスク装置、ROM、MRAM、RAM等の任意のコンピュータ可読媒体に格納することができる。かかるプログラムは、コンピュータ可読媒体への格納のために、通信回線で接続する他のコンピュータ・システムからダウンロードしたり、他の媒体から複製したりすることができる。また、かかるプログラムは、圧縮し、または複数に分割して、単一または複数の記録媒体に格納することもできる。
【0067】
以上、本発明を実施形態に則して説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態または実施例に記載されたものに限定されるものではない。
【図面の簡単な説明】
【0068】
【図1】本発明の一実施形態にかかる教材選択装置の機能構成を示す図である。
【図2】本発明の一実施形態の教材選択装置による処理の概要を示す図である。
【図3】達成度処理部の処理フローを示す図である。
【図4】あるプロジェクト・マネジメント研修のトピック関連構造を示す図である。
【図5】図4を簡略化し、構造のみを残した図である。
【図6】S38における達成度が低いトピック抽出前後のトピック関連構造およびS41の処理により抽出される達成度が低いトピック関連構造の基礎トピックを示す図である。
【図7】簡単なF−DAGに「トピック間の遷移」を定義した一例を示す図である。
【図8】重要度処理部の処理フローを示す図である。
【図9】教材価値処理部の処理フローを示す図である。
【図10】教材選択処理部の処理フローを示す図である。
【図11】重要度の高いトピックグラフ例を示す図である。
【図12】トピックグラフが直線(図11のグラフA、B、C、D、E)の場合の結果を示す表である。
【図13】トピックグラフが櫛状(図11のグラフF、G、H、I、J、K)の場合の結果を示す表である。
【図14】トピックグラフが線と櫛状の組合せ(図11のグラフL、M)の場合の結果を示す表である。
【図15】本発明の具体的な使用例における、実力テスト結果、小6算数トピック依存関係、小6算数教材DBとの繋がりを示す図である。
【図16】教材選択装置のハードウェア構成を示す図である。
【符号の説明】
【0069】
1 教材選択装置
2 入力部
9 出力部
3 テスト成績DB
4 テスト問題DB
5 トピックDB
6 トピックスコアDB
7 教材DB
8 教材価値DB
10 達成度処理部
11 重要度処理部
12 教材価値処理部
13 教材選択処理部
【特許請求の範囲】
【請求項1】
受験者の学習評価データに基づいて教材を選択する教材選択方法であって、
コンピュータが、
前記学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算するステップと、
前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、
前記重要度に基づいて教材の価値を計算するステップと、
前記教材の価値を基に教材を選択するステップと、
を実行する教材選択方法。
【請求項2】
前記達成度を計算するステップは、前記学力領域関連構造に基づいて達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出することを含む請求項1に記載の方法。
【請求項3】
前記達成度を計算するステップは、前記達成度が所定の値より低い学力領域を抽出することを含む請求項1に記載の方法。
【請求項4】
前記重要度を計算するステップは、達成度が明らかでない学力領域を前記におけるルートとして重要度を計算することを含む請求項1に記載の方法。
【請求項5】
前記重要度を計算するステップは、学力領域間の遷移を定義し、前記定義と前記達成度から重要度を計算することを特徴とする請求項1に記載の方法。
【請求項6】
前記重要度を計算するステップは、学力領域間の遷移に遷移確率を設定することを特徴とする請求項5に記載の方法。
【請求項7】
前記教材の価値を計算するステップは、学力領域の情報と前記学力領域に対応する教材の情報から、前記教材の価値を計算することを特徴とする請求項1に記載の方法。
【請求項8】
前記教材を選択するステップは、整数計画法により前記教材の価値から最適な前記教材の組合せを求めることを特徴とする請求項1に記載の方法。
【請求項9】
請求項1から8までのいずれか一項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。
【請求項10】
受験者の学習評価データに基づいて教材を選択する教材選択装置であって、
前記受験者の学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算する達成度処理部と、
前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算する重要度処理部と、
前記重要度に基づいて教材の価値を計算する教材価値処理部と、
前記教材の価値に基づいて教材を選択するための計算を行う教材選択処理部と、
を備える教材選択装置。
【請求項11】
前記達成度処理部は、前記学力領域関連構造に基づいて達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出することを備えることを特徴とする請求項10に記載の教材選択装置。
【請求項12】
前記達成度処理部は、前記受験者と前記学習評価データを関連付けて記憶している学習評価データ記憶手段と、受験された問題に関する情報を記憶している問題情報記憶手段と、前記学力領域関連構造の情報を記憶している学力領域関連構造記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項13】
前記重要度処理部は、達成度処理部と共有する学力領域関連構造記憶手段と、前記受験者と各学力領域の前記重要度を関連付けて記憶している重要度記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項14】
前記教材価値処理部は、前記重要度処理部と共有する重要度記憶手段と、教材情報を予め記憶している教材記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項15】
前記教材選択処理部は受験者と教材の価値を関連付けて記憶している教材価値記憶手段を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項1】
受験者の学習評価データに基づいて教材を選択する教材選択方法であって、
コンピュータが、
前記学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算するステップと、
前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算するステップと、
前記重要度に基づいて教材の価値を計算するステップと、
前記教材の価値を基に教材を選択するステップと、
を実行する教材選択方法。
【請求項2】
前記達成度を計算するステップは、前記学力領域関連構造に基づいて達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出することを含む請求項1に記載の方法。
【請求項3】
前記達成度を計算するステップは、前記達成度が所定の値より低い学力領域を抽出することを含む請求項1に記載の方法。
【請求項4】
前記重要度を計算するステップは、達成度が明らかでない学力領域を前記におけるルートとして重要度を計算することを含む請求項1に記載の方法。
【請求項5】
前記重要度を計算するステップは、学力領域間の遷移を定義し、前記定義と前記達成度から重要度を計算することを特徴とする請求項1に記載の方法。
【請求項6】
前記重要度を計算するステップは、学力領域間の遷移に遷移確率を設定することを特徴とする請求項5に記載の方法。
【請求項7】
前記教材の価値を計算するステップは、学力領域の情報と前記学力領域に対応する教材の情報から、前記教材の価値を計算することを特徴とする請求項1に記載の方法。
【請求項8】
前記教材を選択するステップは、整数計画法により前記教材の価値から最適な前記教材の組合せを求めることを特徴とする請求項1に記載の方法。
【請求項9】
請求項1から8までのいずれか一項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。
【請求項10】
受験者の学習評価データに基づいて教材を選択する教材選択装置であって、
前記受験者の学習評価データと学力領域の難易度に基づいて受験者の学力領域の達成度を計算する達成度処理部と、
前記達成度と前記学力領域の相互依存関係を表した学力領域関連構造に基づいて前記学力領域の重要度を計算する重要度処理部と、
前記重要度に基づいて教材の価値を計算する教材価値処理部と、
前記教材の価値に基づいて教材を選択するための計算を行う教材選択処理部と、
を備える教材選択装置。
【請求項11】
前記達成度処理部は、前記学力領域関連構造に基づいて達成度が明らかでない学力領域のうち最小共通祖先(LCA)に対応する前記学力領域を抽出することを備えることを特徴とする請求項10に記載の教材選択装置。
【請求項12】
前記達成度処理部は、前記受験者と前記学習評価データを関連付けて記憶している学習評価データ記憶手段と、受験された問題に関する情報を記憶している問題情報記憶手段と、前記学力領域関連構造の情報を記憶している学力領域関連構造記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項13】
前記重要度処理部は、達成度処理部と共有する学力領域関連構造記憶手段と、前記受験者と各学力領域の前記重要度を関連付けて記憶している重要度記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項14】
前記教材価値処理部は、前記重要度処理部と共有する重要度記憶手段と、教材情報を予め記憶している教材記憶手段と、
を備えることを特徴とする請求項10に記載の教材選択装置。
【請求項15】
前記教材選択処理部は受験者と教材の価値を関連付けて記憶している教材価値記憶手段を備えることを特徴とする請求項10に記載の教材選択装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2009−104003(P2009−104003A)
【公開日】平成21年5月14日(2009.5.14)
【国際特許分類】
【出願番号】特願2007−276943(P2007−276943)
【出願日】平成19年10月24日(2007.10.24)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【復代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
【Fターム(参考)】
【公開日】平成21年5月14日(2009.5.14)
【国際特許分類】
【出願日】平成19年10月24日(2007.10.24)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【復代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
【Fターム(参考)】
[ Back to top ]