説明

データ処理装置およびデータ処理方法

【課題】ユーザの観点に基づいて文書内容を評価する。
【解決手段】評価基準設定部は、文書内容を評価するための1以上の評価基準を「語彙」としてユーザからの入力により設定する。用語設定部は、1つの語彙に対して1以上の用語をユーザからの入力により「対応用語」として設定する。用語分類部は、授業に対する生徒の感想が記述された感想メールから用語を抽出する。そして、その抽出された用語がいずれかの対応用語に一致するかを判定する。統計部は、感想メールの集合における内容傾向を、各語彙を基準とした語彙値として指標化する。評価表示部は語彙分布グラフ画面290を表示させ、感想メールの集合における内容傾向をグラフ表示させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書内容を評価するための技術に関する。
【背景技術】
【0002】
近年、コンピュータの普及とネットワーク技術の進展に伴い、ネットワークを介した電子情報の交換が盛んになっている。これにより、従来においては紙ベースで行われていた事務処理の多くが、ネットワークベースの処理に置き換えられつつある。デジタル化とネットワーク技術の進展は、情報取得コストを急激に低下させている。このような状況において、大量の情報からその内容を自動解析する技術が希求されている。
【特許文献1】特開2004−252632号公報
【特許文献2】特開2003−18324号公報
【非特許文献1】塚本榮一,赤堀侃司、「携帯電話による学習者レスポンスの収集と分析による授業改善」、教育システム情報学会誌、日本、教育システム情報学会、2004年、21、3、p.214−222
【発明の開示】
【発明が解決しようとする課題】
【0003】
一例として、電子メールの内容の適否を自然言語処理により判定し、迷惑メールを自動的に排除するスパムフィルタを挙げることができる。スパムフィルタは、電子メールに含まれる単語ごとの適切さを判定することにより、電子メールが迷惑メールに該当するか否かを判定する。しかし、このようなスパムフィルタは、電子メールの適否をいわば2値的に判定しているにすぎない。本発明者は、文章を読むとき、読者は意識的・無意識的に設定するさまざまな観点から文書内容を総合評価している点に着目した。
【0004】
本発明は、本発明者の上記着目に基づいてなされた発明であり、その主たる目的は、簡易なユーザインタフェースにて、ユーザの観点に基づいて文書内容を評価するための技術、を提供することにある。
【課題を解決するための手段】
【0005】
本発明のある態様は、データ処理装置である。
まず、この装置は、1以上の評価基準、および、評価基準のそれぞれに対する1以上の対応用語をユーザからの入力により設定する。そして、外部装置から受信した文書中の用語がいずれかの評価基準について設定された対応用語であるかを判定し、評価対象となる文書データの集合について、評価基準ごとに対応用語の出現頻度を算出する。
【0006】
このような処理によって、文書データの集合における内容傾向を、ユーザが設定した評価基準に基づいて対応用語の出現頻度により指標化することができる。ここでいう「用語」とは、単語であってもよいし、句を構成する単語群やバイトストリームであってもよい。
【0007】
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0008】
本発明によれば、簡易なユーザインタフェースにて、ユーザの設定した観点から文書内容を分析できる。
【発明を実施するための最良の形態】
【0009】
本実施例においては、授業評価システムを例とし、まず、授業評価システムの概要を述べてから、本発明の主たる特徴である「語彙分析処理」について説明する。
【0010】
図1は、授業評価システムのハードウェア構成図である。
授業評価システム10は、大学のような教育機関への導入を想定した、生徒が授業内容を評価するためのシステムである。授業評価システム10は、教師と生徒によって利用されるシステムであり、授業に対する生徒の反応を授業内容にフィードバックさせるための仕組みを提供する。
【0011】
授業評価システム10は、授業評価装置100、メールサーバ202および複数のクライアント端末204を含む。これらは、インターネット200を介して互いに接続されている。授業評価装置100は、教師によって使用される装置である(以下、授業評価装置100のユーザであることを明示する意味で、「教師」のことを「ユーザ」ともよぶことにする)。各クライアント端末204は、生徒によって使用される携帯電話やノートパソコンなど、メール送受信機能を搭載した一般的な通信端末である。
【0012】
まず、教師は講座の開設に際して、講座専用のメールアドレスを設定する(以下、「講座アドレス」とよぶ)。たとえば、「フランス語A」という計12回の授業からなる講座には、「fraA@xxx.co.jp」のように講座アドレスが設定される。フランス語Aの授業を受ける生徒は、その講座アドレスを介して授業評価装置100と電子メールを送受する。たとえば、生徒は授業に出席したときに、講座アドレスに対して出席を通知するための「出席メール」を送信する。メールサーバ202は、クライアント端末204から受信した出席メールを授業評価装置100に転送する。このメールサーバ202は、一般的な既知の装置でよい。授業評価装置100では、出席メールによって、どの講座にどの生徒が出席したかを自動的に集計する。
【0013】
このほかにも、生徒は、授業に対する感想を記述した感想メールを講座アドレスに送信する。授業評価装置100は、感想メールを自然言語解析して、生徒の授業に対する理解度や意欲を定量的に評価する。たとえば、「やった」、「できた」、「してみたい」というあらかじめ定義された「意欲的な単語」を感想メールが多く含んでいる場合、生徒の理解度や学習意欲が高いと判定できる。このように、本実施例に示す授業評価装置100は、感想メールの用語を分析することにより、生徒の授業に対する反応を定量化する。このような処理を本明細書においては「語彙分析処理」とよぶことにする。
生徒の電子メールから得られるさまざまな情報は、授業内容の改善するための有用な情報として利用される。
【0014】
図2は、授業評価装置の機能ブロック図である。
ここに示す各ブロックは、ハードウェア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
【0015】
授業評価装置100は、ユーザインタフェース処理部110、通信部120、データ処理部130およびデータ保持部150を含む。
ユーザインタフェース処理部110は、教師であるユーザからの入力処理やユーザに対する情報表示のようなユーザインタフェース全般に関する処理を担当する。通信部120は、メールサーバ202を介してクライアント端末204との通信処理を担当する。データ処理部130は、ユーザインタフェース処理部110や通信部120から取得されたデータを元にして各種のデータ処理を実行する。データ処理部130は、ユーザインタフェース処理部110、通信部120およびデータ保持部150の間のインタフェースの役割も果たす。
データ保持部150は、予め用意された設定データや、データ処理部130から受け取った電子メールなど、さまざまなデータを格納する。通信部120は、メールの送受信を処理するメール送受信部122を含んでいる。
【0016】
ユーザインタフェース処理部110は、表示部112と入力部118を含む。入力部118は、ユーザからの入力操作を受け付ける。表示部112は、ユーザに対して各種情報を表示する。表示部112は、更に、評価表示部114を含む。評価表示部114は、後の図7等に示す表示形式にて、語彙分析処理のための各種ユーザインタフェース画面を表示させる。
【0017】
データ保持部150は、メールデータ保持部152、生徒データ保持部154、授業データ保持部156および評価基準データ保持部158を含む。
メールデータ保持部152は、生徒から受信した電子メールを保持する。生徒データ保持部154は、生徒データを保持する。生徒データとは、学部、年齢、性別、生徒番号など、生徒についてあらかじめ登録されているデータである。授業データ保持部156は、授業データを保持する。授業データとは、各講座ごとに、生徒の出席率、試験結果、授業に対する感想など、電子メールから得られた情報を元にして集計される授業に関連するデータである。評価基準データ保持部158は、評価基準データを保持する。評価基準データは、「語彙」と「対応用語」の対応関係をあらかじめ定義したデータであるが、これについては、後の図7に関連する説明の際にあわせて詳述する。
【0018】
データ処理部130は、メール処理部132と授業データ管理部138を含む。
メール処理部132は、電子メールを内容を解析する。メール処理部132は、分類部134および整合判定部136を含む。分類部134は、電子メールの内容に応じて分類する。すでに述べたように、生徒から受信する電子メールは、出席メールや感想メールなどさまざまである。分類部134は、電子メールを内容に応じて分類する。たとえば、「件名」に「出席」という単語が含まれている電子メールは出席メールであるという条件のように、所定の分類条件にしたがって分類する。
【0019】
整合判定部136は、受信された電子メールが処理対象として有効なメールであるかを判定する。たとえば、授業の開始前に受信された出席メールは有効ではないといえる。整合判定部136は、受信された電子メールの有効性を所定の整合条件にしたがって判定する。有効でない電子メールは解析対象外とされる。
【0020】
授業データ管理部138は、講座に関するデータを授業ごとに授業データとして管理する。たとえば、試験の平均点や、感想メールから解析される生徒の理解度、授業計画などのようなさまざまなデータが授業データとして管理対象となる。授業データ管理部138は、生徒管理部140、設定部142および分析部164を含む。生徒管理部140は、出席率や試験結果など生徒の学習状態を管理する。設定部142は、整合判定部136や分類部134の条件のような電子メールの解析に関する各種条件を設定する。
【0021】
設定部142は、更に、評価基準設定部144、用語設定部146および文書属性設定部148を含む。語彙分析処理により、生徒から受信した感想メール群の内容傾向が指標化される。評価基準設定部144は、その評価基準を「語彙」として設定する。たとえば、生徒の授業に対する理解度や意欲、満足感等を指標化したい場合、「知識」、「興味」、「達成」、「洞察」の4つの語彙が評価基準として設定されてもよい。ここでいう「知識」とは、「生徒が授業の内容を理解しているか」という観点から感想メールを分析するための評価基準の名前である。語彙の設定に関しては、図7に関連して更に詳述する予定である。
【0022】
用語設定部146は、各語彙に属する用語(以下、「対応用語」とよぶ)を設定する。たとえば、感想メールに「知った」、「覚えた」、「学んだ」という用語が多く含まれている場合、生徒が授業から着実に「知識」を身につけていると推測できる。この場合、先ほど設定した「知識」という語彙に対して、これらの用語が「知識」の対応用語として設定される。感想メールにどのような用語が含まれているかに応じて、各語彙を基準とした内容傾向が後述の「語彙値」として指標化されることになる。まとめると、感想メールに含まれる用語、対応用語、語彙の関係から、感想メール群の内容傾向が指標化されることになる。具体的な処理プロセスについては、図11に関連して詳述する。
【0023】
文書属性設定部148は、感想メールを分類するための文書属性をユーザによる入力に応じて設定する。たとえば、男子生徒からの感想メールの集合と、女子生徒からの感想メールの集合をそれぞれ別個に語彙分析処理対象とするときには、感想メールの差出人が男子生徒であるか女子生徒であるかが文書属性となる。
【0024】
分析部164は、設定部142による各種設定条件にしたがって、感想メール群を対象として語彙分析処理を実行する。分析部164は、用語分類部160と統計部162を含む。用語分類部160は、メール処理部132から感想メールを取得し、感想メールから用語を抽出する。用語抽出は、既知の形態素解析などの手法を応用すればよい。次に、用語分類部160は、抽出した用語が用語設定部146にて設定されたいずれかの対応用語に一致するか判定する。ここでいう一致とは、完全一致であってもよいし、前方一致または後方一致等の部分的な一致まで含めた概念であってもよい。統計部162は、評価対象となる感想メールの集合について、対応用語の出現回数をカウントする。そして、各語彙ごとに対応用語の出現頻度を「語彙値」として算出する。語彙値は、先ほどの例でいえば、「知識」、「興味」、「達成」、「洞察」の4つの語彙のうち、感想メールに含まれる用語がどの語彙に偏っているかを指標化した数値であるが、その算出方法の詳細については後述する。語彙値は、評価表示部114により図7に示す形式にてグラフ表示されることになる。
【0025】
図3は、授業評価装置のメニュー画面の画面図である。
教師であるユーザが授業評価装置100にログインしたときには、まず、このメニュー画面210が表示される。講座選択領域212は、現在開設されている講座を一覧表示する。ここでは、「フランス語A2005」、「フランス語B2005」および「フランス語C2005」という3つの講座が開設されている。同図においては、「フランス語A2005」が選択されている。
【0026】
メニューボタン群214に含まれるいずれかのボタンが選択されると、講座選択領域212で選択された講座についての各種授業データにアクセスする画面が表示される。出席簿ボタン216は、生徒の出席状況を表示させるためのボタンである。感想受付ボタン218は、生徒から受信された感想メールの内容を一覧表示させるためのボタンである。提出物管理ボタン220は、宿題などの提出状況を表示させるためのボタンである。試験結果ボタン222は、試験結果を一覧表示させるためのボタンである。整合性チェックボタン224は、整合条件を設定するための画面を表示させるボタンである。カルテボタン226は、生徒の授業態度や成績に関する情報を「カルテ」として表示させるためのボタンである。通知ボタン228は、休講通知などのように授業に関する連絡事項を通知するための画面を表示させるボタンである。投票ボタン230は、生徒の意見を募るための画面を表示させるためのボタンである。
【0027】
ここでは、授業評価装置100の基本的な機能の説明にとどめるため、メニューボタン群214のボタン群のうちの出席簿ボタン216、感想受付ボタン218および試験結果ボタン222が選択されたときにそれぞれ表示される出席簿画面240、感想受付画面250および試験結果画面260について説明する。その後、語彙分析処理を中心として説明する。
【0028】
図4は、出席簿画面の画面図である。
出席簿画面240は、図3のメニュー画面210において、出席簿ボタン216がクリックされたときに表示される。教師は、授業開始時に、その授業の合い言葉を生徒に示す。合い言葉は、教室で口頭で示されてもよい。授業に出席した生徒はこの合い言葉を入力して出席メールを講座アドレスに送信する。分類部134が出席メールを分類し、整合判定部136がその出席メールに正しい合い言葉が記述されているかを判定する。有効な出席メールであれば、授業データ管理部138は出席メールの送信元である生徒を正規の出席者として認定する。表示部112は、授業に出席している生徒名を出席簿画面240に表示する。
【0029】
合い言葉は、実際には出席していない生徒を出席扱いしないための仕組みである。出席管理のための変形例としては、クライアント端末204の位置に基づく出席管理方法も考えられる。たとえば、クライアント端末204がGPS(Global Positioning System)機能を搭載する場合、出席メールは、その送信時におけるクライアント端末204の位置情報を含んでもよい。整合判定部136は、この位置情報に基づいて、実際に教室にいる生徒からの出席メールであるかを判定する。クライアント端末204は、GPSのほかにも、接続した最寄りの基地局IDを位置情報として送信してもよい。
【0030】
授業選択領域242は、「フランス語A2005」講座の各授業に関する出席状況を表示する。同図によれば、この講座の授業は4回目であり、4回分の授業の出席率が一覧表示されている。授業選択領域242では、4回目の「Rの発音」というテーマの授業が選択されている。出欠状況表示領域244は、授業選択領域242で選択された4回目の授業に出席している生徒名を一覧表示させている。ここでは、講座に登録されている6人の生徒のうち、「竹治義克」を除く5名が授業に出席している。
授業評価装置100が出席メールを受け付けると、表示部112は自動的に出席簿画面240の内容が更新するため、出席簿画面240によって、教師は各生徒の出席状況をリアルタイムかつ正確に把握できる。
【0031】
図5は、試験結果画面の画面図である。
試験結果画面260は、図3のメニュー画面210において、試験結果ボタン222がクリックされたときに表示される。授業中に試験を行ったときには、ユーザはその採点結果をユーザインタフェース処理部110を介して入力する。生徒は、試験に対する解答を記載した解答メールを講座アドレス宛に送信してもよい。また、授業評価装置100が採点機能を備えてもよい。採点結果は、各生徒の試験の結果として試験結果画面260に表示される。
【0032】
試験選択領域262は、「フランス語A2005」講座に関する各試験の結果を表示する。同図によれば、過去5回試験が実施されている。試験選択領域262では、そのうち4回目の6月22日の試験結果が選択されている。試験結果一覧領域264は、試験選択領域262にて選択された4回目の試験に対する生徒の試験結果を一覧表示している。試験結果としては、得点、順位、前回の試験と比べた点数の変化などが表示対象となる。
【0033】
試験結果は、CSV(Comma Separated Values)形式のファイルとして保存することもできる。たとえば、生徒「石田英行」の場合、「得点」や「順位」などの各項目に対して、それぞれ「80(点)」、「2(位)」といったデータが属性値として設定される。授業データ管理部138は、あらかじめ定められたフォーマットにしたがって、生徒データや授業データからCSV形式の試験結果ファイルを生成する。
【0034】
図6は、感想受付画面の画面図である。
感想受付画面250は、図3のメニュー画面210において、感想受付ボタン218がクリックされたときに表示される。生徒は、授業がおわると、講座アドレス宛に感想メールを送信する。この感想メールによって、教師は、授業に対する生徒の反応を即座に知ることができる。授業選択領域252は、「フランス語A2005」講座の各授業に関する感想メールの受け付け状態を表示する。授業選択領域252では、4回目の授業が選択されている。感想一覧領域256は、授業選択領域252で選択された4回目の授業に対する生徒の感想を一覧表示させている。更に、感想表示領域254は、感想一覧領域256で選択された生徒「新井真由美」の感想が表示されている。
【0035】
ここで、教師が「質問」というキーワードを設定すると、感想メールの中に「質問」という単語が含まれている生徒には星印が付記されている。この機能によって、教師は、質問事項が含まれている感想メールを簡単に見つけることができる。
【0036】
ここでは、3名の生徒の感想メールを一覧表示させているが、生徒が何十名もいるとき、また感想メールの文字数が多いときには、各生徒の授業に対する反応を把握するのは容易ではない。本実施例に示す授業評価装置100の語彙分析機能は、感想メールの集合における内容傾向を指標化し、これをグラフ形式で視覚的に表示することができる。
【0037】
図7は、語彙登録画面の画面図である。
感想メールの集合における内容傾向を指標化するにあたって、まず、評価表示部114は同図に示す語彙登録画面270を表示させる。語彙セット入力領域272は、語彙セット名を指定するための領域である。ここでは、生徒の授業内容に対する反応を探るために、「授業評価」という名前の語彙セットが設定されている。語彙名入力領域274は、語彙セット入力領域272の語彙セットについて、1以上の語彙を設定する。ここでは、「知識」、「洞察」、「興味」、「達成」という4つの語彙が設定されている。感想メールに含まれる用語が、これら4つの語彙のいずれかの意味的な範疇に含まれるときに、その用語は語彙分析の処理対象となる。ここでは、生徒が、知識を身につけているか、授業内容に対して洞察力を発揮しているか、授業に興味を持っているか、達成感を感じているか、という4つの観点から感想メールの内容傾向を指標化するために、このような語彙が設定されているものとする。対応用語入力領域276は、語彙名入力領域274で選択されている語彙についての対応用語を設定するための領域である。
【0038】
同図においては、「知識」という語彙に対して、「知った」、「覚えた」等の対応用語が設定されている。これは、「知識」という語彙の概念の中に「知った」、「覚えた」等の用語が含まれることを示している。すなわち、感想メールから、「知った」や「覚えた」といった用語が抽出されると、統計部162は、「知識」という語彙について語彙値に所定値、たとえば、「1」を加算する。たとえば、感想メールの集合から「知った」、「覚えた」という用語がそれぞれ10回、30回検出されたときには、語彙値は10+30により「40」として算出される。これにより、感想メール群に含まれる用語と、設定された語彙および対応用語に基づいて、語彙ごとに語彙値が加算方式にて算出される。語彙値によって、感想メール群の内容傾向を語彙という評価基準から指標化できる。語彙値の計算方法は、これに限るものではなく、評価対象となる感想メール群において、各語彙に基づいてその内容傾向を指標化した数値であればよい。たとえば、対応用語の出現個数÷感想メールの数、対応用語の出現個数÷感想メールの総文字数などを語彙値として算出してもよい。
【0039】
おなじ語彙に属する対応用語間でも、語彙値に対する寄与度に差を設けてもよい。たとえば、「知った」という用語は「参考になる」という用語よりも、「知識」という語彙に適合しているといえるかもしれない。その場合、「知った」という用語には2点、「参考になる」という用語には1点という評点が設定されてもよい。そして、感想メールから「知った」という用語が抽出されたときには、「知識」の語彙値に「2」を加算し、「参考になる」という用語が抽出されたときには、「1」を加算してもよい。このような処理方法によれば、用語のニュアンスまで反映させた語彙分析処理が可能となる。
【0040】
語彙登録画面270においては、評価基準データ保持部158が保持する評価基準データに定義されている語彙および対応用語が設定されてもよい。この評価基準データには、あらかじめ「知識」という語彙とそれに対する「知った」、「覚えた」という対応用語が定義されていてもよい。この場合、ユーザは評価基準データに定義されている語彙のうち「知識」という語彙を設定対象として選択すると、「知った」、「覚えた」という対応用語が自動的に対応用語入力領域276に設定される。ユーザは、既存の「知識」という語彙に新たに対応用語を追加してもよいし、対応用語入力領域276に自動設定された既存の対応用語を設定対象外としてもよい。あらかじめ評価基準データを用意しておけば、ユーザの語彙登録画面270における入力負担を軽減させることができる。特に、授業評価装置100の操作に慣れていないユーザにとって、語彙分析機能の利便性を向上させることができる。
【0041】
ところで、仮に、感想メールに「認識した」という用語が含まれていた場合、この用語は「知識」の対応用語として設定されていないので、この用語が「知識」の語彙値に反映されることはない。しかし、対応用語の1つである「知った」と、抽出された用語「認識した」は類語関係にあるといえる。用語分類部160は、用語間の類語関係をさだめた類語辞書データを保持してもよい。そして、用語分類部160は、この類語辞書データを参照して、感想メールから抽出した用語が対応用語と一致しなくとも、対応用語の類語にあたるときには、その語彙に属する対応用語であるとみなしてもよい。この例の場合、「認識した」という用語は、「知った」の類語であるから、これにより「知識」の語彙値が加算されることになる。このような処理方法によれば、対応用語入力領域276に設定されている以上に多くの用語を評価の対象に含めることができるので、より精緻な語彙分析が可能となる。また、語彙登録画面270におけるユーザの入力負担を軽減させる上でも効果がある。
【0042】
図8は、属性別集計設定画面の画面図である。
生徒から受信した感想メールのすべてを対象として語彙分析処理を行ってもよいが、たとえば、男子生徒と女子生徒、成績上位者と下位者のように、評価対象とすべき感想メールの集合を特定したい場合も存在する。属性別集計設定画面280を介して、ユーザは評価対象とすべき感想メールを特定することができる。
【0043】
属性別チェック領域282がチェックされると、感想メールの分類が行われる。その分類基準のことを「文書属性」とよぶことにする。属性名入力領域284は文書属性を設定するための領域である。ここでは、差出人の性別を文書属性として設定している。すなわち、男子生徒からの感想メール群と、女子生徒からの感想メール群のそれぞれについて語彙分析処理が実行されることになる。文書属性は、このほかにも、「成績上位者と成績下位者」、「100文字以上の感想メール、50〜99文字の感想メール、49文字以下の感想メール」のように、さまざまな観点から設定可能である。
【0044】
表示属性設定領域286は、設定された文書属性に基づき、次の図9に示す語彙分布グラフ画面290で表示対象となる文書属性を選択するための領域である。ここでは、男子生徒の感想メール群と女子生徒の感想メール群のそれぞれについての語彙分析処理結果が1画面にて表示されるよう設定されている。
語彙登録画面270における設定と、属性別集計設定画面280における設定がなされたあと、分析部164はメール処理部132から感想メールを受け取って語彙分析処理を開始する。
【0045】
図9は、語彙分布グラフ画面の画面図である。
語彙分布グラフ画面290では、図8の属性別集計設定画面280において設定されたように、男子生徒の感想メール群と、女子生徒の感想メール群に分けて、それぞれの語彙分析処理の結果がグラフ表示されている。語彙分布グラフ画面290には、「知識」、「洞察」、「興味」、「達成」という図7の語彙登録画面270で設定された4つの語彙を評価軸とし、各語彙についての語彙値をパラメータとするグラフが表示されている。同図によれば、男子生徒は女子生徒よりも、知識や達成、洞察という面ではすぐれているものの、女子生徒の方が授業に対して高い興味を持っていることがわかる。
このような語彙分析および表示の方法によれば、フリーフォーマットの感想メールから、生徒の授業に対する反応を任意の観点から指標化および視覚化できる。
【0046】
図10は、感想分析画面の画面図である。
この感想分析画面292は、図6の感想受付画面250のメニューから所定項目が選択されたときに表示される。感想分析画面292の語彙セット選択領域294は、語彙登録画面270において設定される語彙セットを一覧表示させる。ここでは、「授業評価」、「感覚表現」という2種類の語彙セットが示されている。語彙名一覧領域296は、語彙セット選択領域294にて選択された語彙セット「授業評価」の詳細を示す。この語彙セット「授業評価」では、「知識」、「興味」、「達成」、「洞察」の4つの語彙についての語彙値を示している。また、同図の語彙分布グラフ画面290については、図9に関連して説明した通りである。
【0047】
図11は、語彙分析の基本的な処理過程を示すフローチャートである。
ここでは、語彙登録画面270および属性別集計設定画面280による設定が完了しているとして説明する。まず、メール送受信部122が生徒から感想メールを受信し、メール処理部132は適切な感想メールを用語分類部160に転送する。こうして、用語分類部160は感想メールを取得する(S10)。用語分類部160は、属性別集計設定画面280にて文書属性が設定されている場合には、感想メールを文書属性に応じて分類する(S12)。
【0048】
用語分類部160は、感想メールから用語を抽出する(S14)。この用語が、対応用語に該当するときには(S16のY)、統計部162はその対応用語が属する語彙の語彙値を更新する(S20)。対応用語に該当しないときであっても(S16のN)、対応用語の類語にあたるときには(S18のY)、その対応用語が属する語彙の語彙値を更新する(S20)。対応用語でも類語でもないときには(S16のN、S18のN)、S20の処理はスキップされる。
【0049】
S10において取得された感想メールに更に用語が含まれているときには(S22のY)、処理はS14に戻ってあらためて用語が抽出され、同様の処理が繰り返される。一方、感想メールに新たに抽出すべき用語が含まれていないときには(S22のN)、用語分類部160はメール処理部132に対して次に処理対象となる感想メールを要求する(S24)。次に処理対象とすべき感想メールがあれば(S24のY)、処理はS10に戻って次の感想メールを取得し、同様の処理が繰り返される。次に処理すべき感想メールがなければ(S24のN)、評価表示部114は、各語彙についての語彙値をパラメータとして、語彙分布グラフ画面290を表示させる(S26)。
【0050】
以上、実施例に基づいて本発明を説明した。
本実施例に示した授業評価装置100によれば、授業評価システム10を運用する上で得られる感想メールから、生徒の授業に対する反応を定量評価できる。実際、成績が下位の生徒は「興味」どまりであり、成績が上位の生徒は「知識」にまで至っていることが多い。したがって、このような語彙分析処理によって、生徒の授業に対する実際の理解度を探りやすくなる。また、経験の浅い教師ほど、授業の進行に重点をおくあまり、生徒の反応のチェックをおろそかにしやすい。本実施例に示した授業評価装置100によれば、授業に対する生徒の反応を即時的・客観的・視覚的に把握できるので、生徒の反応に応じて授業内容を柔軟に変化させやすくなる。授業に対する理解度や意欲、生徒の性格等についての情報は、クラス分けや授業のレベル調整、補習授業の必要性などの各種判断に対して有益である。
【0051】
文書属性としては、1回目の授業に対する感想メール、2回目の授業に対する感想メールのように、時期を基準として感想メールを分類してもよい。このような分類方法によれば、授業回数を重ねると共に、生徒の授業に対する反応がどのように変化しているかを経時的に把握できる。これは、教師の人事評価に際しても有益な情報となる。たとえば、授業を重ねるごとに生徒の意欲が向上しているとき、そのような事実を指標化できるので、生徒の意欲を向上させる授業をしている教師を適正に評価しやすくなる。
【0052】
授業評価システム10の運用実績が積み重なっていくと、生徒の反応、語彙、対応用語の関係について、さまざまな知見が得られる可能性がある。たとえば、生徒が授業についていけなくなるときによく使われる典型的な用語が発見されるかもしれない。このような用語をあらかじめ評価基準データとして登録しておけば、はじめて授業評価装置100を使用する教師であっても、過去のさまざまな教師の経験を利用して、早期にケアすべき生徒を発見しやすくなる。そのため、評価基準データそのものが商品価値を持ってくる可能性もある。
【0053】
近年の少子化により、今後定員割れをおこす大学が増えていくことは確実な状勢である。こうした中で生き残っていくために、かつてないほど授業の質に対する要求が高まってきている。このような社会的背景に鑑みても、本実施例に示した授業評価装置100は授業の質を高めるためのツールとして効果的である。
【0054】
本実施例においては、授業評価システム10を題材として語彙分析機能を説明したが、本実施例で説明した語彙分析機能は、授業評価システム10に限らず広く応用可能であることはいうまでもない。たとえば、裁判の判決文やビジネス文書などにおいて、「断定」、「曖昧」といった語彙を設定することにより、文章の執筆者ごとの個性を定量分析するという応用が考えられる。このように、本発明は、文書の内容を評価する場面に対して広く応用可能である。なお、本実施例において特徴的な語彙分析機能は、既存の文書処理ソフトに対するプラグイン(Plug-In)として提供されてもよい。
【0055】
請求項に記載の文書データ取得部の機能は、本実施例においては主としてメール送受信部122によって実現される。
これら請求項に記載の各構成要件が果たすべき機能は、本実施例において示された各機能ブロックの単体もしくはそれらの連係によって実現されることも当業者には理解されるところである。
【0056】
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0057】
たとえば、以下のような変形例が考えられる。
1.本実施例においては、語彙分布グラフは、「知識」、「達成」、「洞察」、「興味」の4つの語彙に対応して4軸のグラフとして表示されている。しかし、語彙分布グラフは4軸に限る必要はなく、それ以上の軸を備えてもよい。たとえば、語彙分布グラフ「知識」、「興味」、「経験」、「見聞」、「会得」のような5軸グラフとして形成されてもよい。また、「洞察」という語彙は、「先見」と「反省」という2種類の語彙に更に分類されてもよい。このような場合、上位の語彙である「洞察」だけでなく、下位の語彙である「先見」と「反省」に応じて、新たに軸が設定されてもよい。
【0058】
2.図9では、各授業において取得される電子メール全体を対象とした語彙分布を示したが、語彙分布グラフ画面290では、1回の授業あたりの語彙分布が表示されてもよい。授業ごとの語彙分布を比較することにより、授業の回数が進むごとに、クラスの語彙分布がどのように変化しているかを視覚的に確認することもできる。
【0059】
3.図9の語彙分布グラフ画面290では、各軸の値は0〜100の範囲で設定されている。しかし、この軸の範囲は、語彙分布グラフの大きさによって適度に調整されてもよい。たとえば、図9の場合、「興味」は、女子生徒が「80」、男子生徒が「60」という値になっているため、「興味」という軸の値は0〜80の範囲に設定されてもよい。このような表示制御によれば、語彙値の大きさにかかわらず、グラフを適度な大きさにて表示させることができる。また、語彙値は、0〜100の範囲に収まるように正規化されてもよい。このような処理方法によっても、語彙値の大きさにかかわらず、グラフを適度な大きさにて表示させることができる。
【0060】
4.語彙分布グラフ画面290では、クラス全体の電子メール群における各語彙に対する対応用語の出現頻度を語彙値として表示している。これに対し、各語彙に対する生徒の位置をグラフ表示させてもよい。たとえば、生徒Aの感想メール群から、「知識」、「達成」、「洞察」、「興味」の各語彙値を計算し、それらの4つの語彙値から形成される語彙分布グラフの重心を、生徒Aの位置として特定してもよい。そして、語彙分布グラフ画面290上において、各生徒の位置分布を表示させてもよい。このような処理方法によれば、生徒ごとの用語使用傾向を一画面にてまとめて確認できる。たとえば、単なる「興味」ではなく「洞察」の域に理解度が達している生徒がどのくらいいるのか、また、それは誰なのかを確認できる。
【0061】
5.感想メールに「〜だと考えたが、〜ではないとわかった」というような前言を否定するような文型が含まれていた場合、前者の「考えた」は、現在の生徒の心情を反映した言葉ではないといえる。このような場合、用語分類部160は文章の係り受けを踏まえて、「考えた」を語彙値計算の対象外としてもよい。このように、単に感想メールに含まれる用語から語彙値を計算するのではなく、その関係性まで考慮して語彙値の計算をすることにより、より実情に即した語彙値の算出が可能となる。
【0062】
6.語彙分布グラフ画面290において、たとえば、「洞察」軸付近の領域がクリックされると、講座に登録している生徒のうち、「洞察」の対応用語が頻出する生徒名が表示される。たとえば、「洞察」の対応用語をよく使っている上位5人の生徒が一覧表示されるとしてもよい。表示された生徒名のうちのいずれかをクリックすると、その生徒の学習状況を示すカルテデータが表示される。
【0063】
7.図7の語彙登録画面270に示した、語彙と対応用語の関係はファイル化されてもよい。そして、生徒や教師、あるいは、授業内容に応じて、異なる設定のファイルが使用されてもよい。たとえば、試験の成績が良くない生徒の感想メールにおいて頻出する用語と、成績の良い生徒の感想メールにおいて頻出する用語は異なる傾向を示すかもしれない。このような場合、「知識」や「洞察」の対応用語として「成績の良い生徒の間でだけ頻出する用語」を割り当ててもよい。同様に、「興味」や「達成」の対応用語として「成績の良くない生徒の間でだけ頻出する用語」を割り当ててもよい。これにより、授業経験が積み重なっていくと、語彙や対応用語の適切な関係も定まってゆくことが期待される。また、講座の種類に応じて頻出用語も変化すると考えられる。たとえば、数学や物理のような理系科目の場合と、古文や美術史のような文系科目の場合では、感想メールに使用される用語も異なるかもしれない。このような点も踏まえて、科目に応じて、語彙と対応用語の関係を設定してもよい。
【0064】
8.生徒Aと生徒Bが感想メールにおいて、同じ用語「わかった」を使用しても、必ずしも2人の理解度が同程度とは言えない。たとえば、成績優秀な生徒Aの「わかった」は、実際に授業内容を理解している可能性が高いが、成績の悪い生徒Bの「わかった」は、表層的な理解にとどまっているかもしれない。このようなとき、生徒Aの「わかった」は「洞察」の対応用語、生徒Bの「わかった」は「知識」の対応用語として設定されてもよい。あるいは、生徒Aの「わかった」は「洞察」の語彙値を1点分加算するが、生徒Bの「わかった」は「洞察」の語彙値を0.5点分加算するとしてもよい。このように、生徒に応じて、生徒から得られる情報の信頼度を設定してもよい。この信頼度は、生徒の授業態度やテストの成績に応じてリアルタイムに変化してもよい。
【0065】
9.授業評価装置100はコンサルテーション機能を備えてもよい。たとえば、授業回数が重なるごとに「洞察」から「興味」に語彙が変化している生徒は、授業の内容についていけなくなっているのかもしれない。また、感想文字数が増加傾向にあり、かつ、「興味」の語彙が特に増加している生徒は、授業に対する意欲は高いもののその意欲が充分に満たされていないのかもしれない。授業評価装置100のコンサルテーション機能は、語彙分布の変化についてあらかじめ定められた条件が成立したときには、教師に対する警告やアドバイスのメッセージを表示させる。このようなコンサルテーション機能を実行するための条件やメッセージの内容はファイル(以下、「コンサルテーションファイル」とよぶ)に設定されてもよい。経験の浅い教師でも、経験豊富な教師が設定したコンサルテーションファイルを利用することにより、他の教師の経験による支援をうけつつ授業を行うことができる。
【0066】
10.性格検査の結果に応じて、生徒をいくつかのタイプに分類してもよい。生徒のタイプに応じて、使用する用語や適切な授業のやり方も異なってくると考えられる。たとえば、Aタイプの生徒とBタイプの生徒は互いの学習効果を高めるという相乗効果を発揮しやすいかもしれないが、AタイプとCタイプは逆効果となるかもしれない。また、Aタイプが得意な教師もいれば、Bタイプが得意な教師がいるかもしれない。授業評価装置100は、生徒が使用する言葉によって生徒をいくつかのタイプに類型化し、この結果をクラス分けや担当教師の選定等において考慮してもよい。また、生徒のタイプや理解度に応じて、どのようなタイミングでどのような課題を出せばよいかといったコンサルテーションがなされてもよい。
【0067】
11.同じ講座を同時に受けている生徒だけではなく、今年の講座を受講している生徒と、去年の講座を受講している生徒を比較してもよい。たとえば、今年の生徒Aの語彙分布の変化が、去年の生徒Bの語彙分布の変化と同等である場合には、生徒Aの語彙分布の今後の変化や成績を生徒Bのデータに応じてある程度予測できるかもしれない。生徒Bに相当する生徒が過去に何名もいる場合には、予測精度の向上が期待できる。予測よりも生徒Aの成績が向上した場合には、教師の授業能力は高く評価されるべきである。このように、同傾向の生徒について比較することにより、教師の授業能力を評価する上でも有効である。
【図面の簡単な説明】
【0068】
【図1】授業評価システムのハードウェア構成図である。
【図2】授業評価装置の機能ブロック図である。
【図3】授業評価装置のメニュー画面の画面図である。
【図4】出席簿画面の画面図である。
【図5】試験結果画面の画面図である。
【図6】感想受付画面の画面図である。
【図7】語彙登録画面の画面図である。
【図8】属性別集計設定画面の画面図である。
【図9】語彙分布グラフ画面の画面図である。
【図10】感想分析画面の画面図である。
【図11】語彙分析の基本的な処理過程を示すフローチャートである。
【符号の説明】
【0069】
10 授業評価システム、 100 授業評価装置、 110 ユーザインタフェース処理部、 112 表示部、 114 評価表示部、 118 入力部、 120 通信部、 122 メール送受信部、 130 データ処理部、 132 メール処理部、 134 分類部、 136 整合判定部、 138 授業データ管理部、 140 生徒管理部、 142 設定部、 144 評価基準設定部、 146 用語設定部、 148 文書属性設定部、 150 データ保持部、 152 メールデータ保持部、 154 生徒データ保持部、 156 授業データ保持部、 158 評価基準データ保持部、 160 用語分類部、 162 統計部、 164 分析部、 200 インターネット、 202 メールサーバ、 204 クライアント端末、 210 メニュー画面、 240 出席簿画面、 250 感想受付画面、 260 試験結果画面、 270 語彙登録画面、 280 属性別集計設定画面、 290 語彙分布グラフ画面、 292 感想分析画面。

【特許請求の範囲】
【請求項1】
文書内容を評価するための1以上の評価基準をユーザからの入力により設定する評価基準設定部と、
1つの評価基準に対して1以上の用語をユーザからの入力により対応用語として設定する用語設定部と、
文書データを外部装置から受信する文書データ取得部と、
受信された文書データから用語を抽出し、抽出した用語がいずれかの評価基準について設定された対応用語であるかを判定する用語分類部と、
評価対象となる文書データの集合について、評価基準ごとに対応用語の出現頻度を算出する統計部と、
を備えることを特徴とするデータ処理装置。
【請求項2】
評価基準ごとの対応用語の出現頻度をパラメータとして形成される図形により、前記評価対象となる文書データの集合における内容傾向を視覚的に表示させる評価表示部、を更に備えることを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
文書データの分類基準としての文書属性をユーザからの入力により設定する文書属性設定部、を更に備え、
前記統計部は、受信された文書データを文書属性に応じて分類し、各文書属性に応じて分類された文書データの集合ごとに、評価基準ごとの対応用語の出現頻度を算出することを特徴とする請求項1または2に記載のデータ処理装置。
【請求項4】
前記用語分類部は、抽出した用語がいずれの評価基準の対応用語にも該当しないときには、用語間の類語関係を定めた所定の類語辞書データを参照し、前記抽出した用語がいずれかの評価基準の対応用語に対する類語に当たるときには前記抽出した用語をその評価基準の対応用語とみなすことを特徴とする請求項1から3のいずれかに記載のデータ処理装置。
【請求項5】
前記文書データ取得部は、授業に対する生徒の感想が記述された電子メールを文書データとして受信し、
前記評価基準設定部は、生徒の授業に対する感想の内容傾向を指標化するための評価基準として1以上の評価基準を設定することを特徴とする請求項1から4のいずれかに記載のデータ処理装置。
【請求項6】
複数種類の評価基準と、評価基準のそれぞれに対して1以上の対応用語が定義された所定の評価基準データを保持する評価基準データ保持部、を更に備え、
前記評価基準設定部は、前記評価基準データに定義された複数種類の評価基準のうち、ユーザにより指定された評価基準を設定対象として選択し、
前記用語設定部は、選択された評価基準について定義されている1以上の対応用語をその評価基準についての対応用語として設定することを特徴とする請求項1から5のいずれかに記載のデータ処理装置。
【請求項7】
文書内容を評価するための1以上の評価基準をユーザからの入力により設定するステップと、
1つの評価基準に対して1以上の用語をユーザからの入力により対応用語として設定するステップと、
文書データを外部装置から受信するステップと、
受信された文書データから用語を抽出し、抽出した用語がいずれかの評価基準について設定された対応用語であるかを判定するステップと、
評価対象となる文書データの集合について、評価基準ごとに対応用語の出現頻度を算出するステップと、
を備えることを特徴とするデータ処理方法。
【請求項8】
文書内容を評価するための1以上の評価基準をユーザからの入力により設定する機能と、
1つの評価基準に対して1以上の用語をユーザからの入力により対応用語として設定する機能と、
外部装置から受信された文書データの用語を抽出し、抽出した用語がいずれかの評価基準について設定された対応用語であるかを判定する機能と、
評価対象となる文書データの集合について、評価基準ごとに対応用語の出現頻度を算出する機能と、
をコンピュータに発揮させることを特徴とするデータ処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2007−226460(P2007−226460A)
【公開日】平成19年9月6日(2007.9.6)
【国際特許分類】
【出願番号】特願2006−45834(P2006−45834)
【出願日】平成18年2月22日(2006.2.22)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】