双方向学習システム用アクセスコントロール
【課題】コンピュータ設備のコンピュータネットワーク資源へのアクセスを管理する技術を提供する。
【解決手段】コードがマイク装置128からユーザコンピュータ104に提供され、ユーザコンピュータ104からコンピュータ設備108にネットワーク106を通して転送され、転送されたコードが既知のコードと一致する場合にユーザが認可されていると決定し、ユーザ102が認可されたユーザであると決定されたときだけ、ユーザ102に語学学習応答の提出を許可する。
【解決手段】コードがマイク装置128からユーザコンピュータ104に提供され、ユーザコンピュータ104からコンピュータ設備108にネットワーク106を通して転送され、転送されたコードが既知のコードと一致する場合にユーザが認可されていると決定し、ユーザ102が認可されたユーザであると決定されたときだけ、ユーザ102に語学学習応答の提出を許可する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータネットワーク資源のためのアクセスコントロールに関し、より詳しくは、双方向学習プロセスを提供するネットワークロケーションへのアクセスの管理に関する。
【背景技術】
【0002】
商業がより世界的になるので、第2言語を理解することおよびそれらの中でコミュニケーション可能であることへの要求は増大している。そのため、外国語/第2言語訓練産業は、急速に拡大している産業であり、そのような訓練にインターネットのような新技術をいかに適用するかを現在研究している。現行の語学教育製品要素は、印刷物、オーディオカセット、アプリケーションソフトウェア、ビデオカセットおよび情報提供と遠隔学習授業の提供がなされているインターネットサイトを含む。インターネット世界へ様々な外国語/第2言語訓練プロセスを適用するいろいろな試みがなされているが、それらの大部分は、印刷物、オーディオおよびビデオの教材をコンピュータサーバアプリケーションに単に変換したものである。すなわち、インターネットアプリケーションは、一般的には、従来の媒体が現に提供している特徴を超える新しい特徴を提供するものではない。
【0003】
外国語/第2言語訓練にからむ出版産業は、印刷された訓練教材の偽造、貸与、コピー、中古購入のために収益を失うことに対して無防備である。偽造は、何者かが違法コピーのようなオリジナル訓練教材の無認可の複製を行ったときに生じる。偽造品は認可された教材、本物として人手に渡ることがある。偽造品が販売されると、出版者は何の保証も受け取れないし、偽造品によるすべての収益は偽造コピーの販売者によって集められる。貸与による損失は、オリジナル訓練教材の複製が第三者に貸し出され、そのとき第三者は原教材を購入する必要がないことによって生じる。同様に、オリジナル教材の無認可コピーは、その教材の需要を小さくする結果となる。中古購入は、中古販売者がそのような売上から収益を得るために、出版者の収入を奪う。これらすべてのオリジナル教材の使用は、無認可であるか、現に出版者の管理を超えており、すべてが出版者の収益を減少させる。もし語学教材の製造者が、そのような彼らの印刷物のユーザから失われた収入のいくらかを獲得することができたなら、それは有利である。
【0004】
最新のコンピュータ技術は、アプリケーションソフトウェアのネットワーク上での実行を提供して、教材のオンライン版を入手可能にし、それにより、多数のユーザがアクセスし申し入れすることを可能にする。コンピュータ技術は、教材の追加とプレゼンテーションの向上にもまた使用される。そのような教材へのネットワークアクセスは、インターネットを通じて便利に実行される。オンラインアクセスは容易に行われるため、容易なアクセスは、新しい媒体中のアプリケーションおよび教材の無認可使用機会がより多いことをも意味する。話者認識技術は、オンラインアクセスを通じての語学教育の効率、品質および楽しみを増強させる、潜在的に強力な手段である。話者認識技術がユーザの正確な身元確認を保証する対策として適用されている異なる分野(クレジットカードの処理認可、セキュリティアクセス、コンピュータ化されたシステムへのアクセスのパスワードによる保護のような)には多くのアプリケーションが存在する。
【0005】
多様な話者認識製品が、米国マサチューセッツ州ボストンのスピーチワークス社および米国ニュージャージー州パーシッパニーのダイアロジックコーポレーションなどといった会社から現に提供されている。話者認識技術も、ITT SpeakerKey, NetKey and WEBKey, Lucent Speaker Verification および "SpeakEZ" が、米国コロラド州エングルウッドのT−ネッティクス社から現に提供されている。市販アプリケーションの例は、米国カリフォルニア州キューパーティノのアップルコンピュータ社による、コンピュータオペレーションシステムへのユーザアクセスの音声照合のための、"Mac OS 9" オペレーティングシステムへの話者認識の統合である。そのようなシステムでは、話者認識処理が完了するまでアクセスは拒否される。
【0006】
コピー、中古購入、貸与および偽造の現象は、出版産業の重大な問題である。出版産業は、すでに使用された教材の中古販売の著しい伸びにより、また、主として教育分野において、本の購入および本の貸与とコピーにより、潜在的収入の重大な損失を被っている。貸与とコピーの法律の制定を提唱する管轄体が存在する。これらの法の多数は、需要者のためになるかもしれないが、出版者からのオリジナル教材の購入が減少する結果となるため、出版者にとって非常に不利益である。加えて、デザイナーブランド衣類産業で一般的に行われている偽造現象は、出版産業にも同様に浸透してきており、結果として出版者に深刻な利益の損失を生じている。
【0007】
教育的プロバイダはウェブサイトのようなインターネットロケーションを維持し、ユーザは教育ウェブサイトを訪れ、指導と技能の査定の両方を受け取るという、インターネット上での遠隔学習技術が使用されている。しかしながら、上記のように、そのような学習サイトの不正使用の機会は多い。例えば、認可されたユーザはコンピュータ学習セッションのためにアクセスするに至る、しかし、それからコンピュータを離れ、異なる生徒が認可された生徒に代わって続けることができる。これは少なくとも二つの理由で望ましくない。第1に、サービスプロバイダが見る能力が、実際の生徒が持っている能力ではない。そして第2に、1人だけが支払いをするか課金されるにもかかわらず、少なくとも2人が学習サイトを利用し、ウェブプロバイダの収入損失という結果になる。
【0008】
上記の議論から、印刷とインターネットの両方の教材を組み込み、それらが認可された人にのみ使用される出版製品への要求がある。そのようなアクセスコントロールは、出版者に、ライセンス料からの利益およびこのように出版者以外の出所からの製品を取得したユーザからの収入を稼ぐことを可能にするだろう。本発明はこの要求にかなうものである。
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明は、ユーザにネットワークのコンピュータノードを通しての前記コンピュータ設備との対話を許可し、ここで、前記ユーザ対話は、前記コンピュータノードを通して前記コンピュータ設備に対して出す語学学習応答を含み、前記許可されたユーザ対話が認可されているか決定するための、ユーザ認証処理を実行し、前記ユーザが認可されていないと決定されたときの、前記許可されたユーザ対話を継続すべきかを決定し、前記ユーザ認証処理は、前記許可されたユーザ対話の間に前記コンピュータ設備により入手されたユーザ認証情報、および、前記ユーザの語学学習応答から抽出されたユーザ認証情報により実行されることにより、コンピュータ設備のコンピュータネットワーク資源へのアクセスを管理する技術を提供する。このようにユーザ認証は、コンピュータ設備の利用を邪魔することなく生じる。
【課題を解決するための手段】
【0010】
ユーザ認証は、現にコンピュータ設備にアクセスしているユーザから集められた、音声情報を利用する話者識別処理の結果として発生する。アクセスコントロールは、特に、ユーザから通常操作の一部として音声情報を集める語学教育システムに適している。このように、この発明は、教材の出版者が、コンピュータ設備が認可された人のみによって使用可能となるという信頼をもって、印刷およびコンピュータ設備上のインターネットの両方の教材を組み込むことを可能にする。
【0011】
この発明の他の局面として、システムに無認可ユーザと判断されたユーザは、追加登録費の支払いなどによって、認可されたユーザになることを勧められる。このように、ユーザは、実行されるあからさまなユーザ身元確認チェック作業に気づかない、そして一度無認可ユーザが発見されると、彼らは認可されたユーザになることと費用の支払いと引き換えに彼らの学習プロセスを継続することを勧められる。このように、無認可の人は直ちにシステムの使用を停止されはしないが、かわりに追加販売の機会として扱われる。
【0012】
この発明のさらに他の局面として、マイク装置などの入力装置が、購入対象として提示できることである。ここで、マイク装置はコードジェネレータを含み、該コードジェネレータはコード出力を生成し、あるチャネル上で、ユーザコンピュータと通信する。このチャネルを介して、マイク装置はユーザコンピュータに電気信号を提供する。また、この発明の他の局面では、マイク装置はユーザにより使用され、これによりユーザ認証情報は、マイク装置のコードジェネレータによって生成されたユーザコードを含む。
【発明を実施するための最良の形態】
【0013】
本発明のその他の特徴と利点は、本発明の原理の例として示された、好ましい実施形態についての以下の説明によって明らかとなるであろう。
【0014】
図1は、本発明に従ってネットワークアクセスコントロールを提供するシステム100のブロック図である。パーソナルコンピュータ104のユーザ102は、インターネットのようなネットワーク106上で通信セッションを開始し、双方向ネットワーク資源108にアクセスするに至る。ネットワーク資源108は、例えば、話者認識プロッセッサ112と協調して動作する学習サーバ110によって提供される双方向学習コンピュータ設備を含んでもよい。学習サーバ110は、ユーザ102からアクセス要求を受け取り、コンピュータネットワーク設備108を使用するユーザによる、コンピュータネットワーク設備108へのアクセスを許可する。その設備使用の間、ユーザは、音声コマンドを与えることおよびシステムの質問に答えることで、時折、音声情報を提供する。コンピュータ設備108は、ユーザがアクセスを開始してから所定時間待ち、そして、ユーザの音声情報がコンピュータ設備108に保存されているネットワーク認可データベース114に入力されたことを確認する。
【0015】
もし、ユーザ音声情報データがあらかじめ入力されていなければ、そのとき、サーバコンピュータ110は、ユーザクライアントノード104でのユーザの話しの結果として、進行中の通信セッションの間、確認されたユーザ102からの音声データを受け取る。サーバコンピュータは、話者認識技術を使用してユーザが認可されたユーザであるか否かを決定することに応答して、確認されたユーザによるコンピュータネットワーク設備108へのアクセスの継続を許可するかどうか決定する。それにより、本発明は、ユーザにアクセスを認め、ユーザがコンピュータ設備を利用している間に、話者認識技術でユーザ認証を目立たず実行することで、コンピュータ設備へのオンラインアクセスを管理する。
【0016】
図1の実施形態において、コンピュータ設備108は、語学指導を提供する。希望により、他の種類の情報とサービスを前記設備により提供することができる。ユーザのコンピュータ設備とのオンライン対話の間、ユーザは、授業データベース120から検索した後、コンピュータ設備から語学授業を受ける。受ける授業は、視聴覚、文字および図形情報の組合せ122を含むことができる。ユーザは、視覚要素をパーソナルコンピュータ104のディスプレイで見ることができ、音響要素をパーソナルコンピュータ104のスピーカ、イヤホンまたはヘッドフォン124で聞くことができる。授業データベース120は、語学指導のプログラムから授業またはデータモジュールを提供する。データモジュールは、ウェブページの転送によってまたはインターネットストリーミング技術を通して提供されるような対話ベースで受け取られ、もしくは、データモジュールは、後にユーザが見るためのファイル転送技術を通してするようなネットワークダウンロードによって受け取られる。
【0017】
ユーザ102は、パーソナルコンピュータ104のマイク装置128が受け取られる音声126を生ずることで、受け取った学習モジュールに対して応答する。さらに、ユーザは、パーソナルコンピュータのキーボードとディスプレイマウスデバイスによってコンピュータ設備108に入力を与える。そのようなコンピュータとユーザの対話の間、コンピュータ104は、当業者に公知の方法で、ユーザの音声126を音声情報に変換し、学習設備108にそのデータを提供する。そして、音声情報は、話者認識プロセッサ112によって、認可データベース114に記憶された音声情報と比較される。そのような比較技術は当業者に公知である。話者認識プロセッサ112と学習サーバ110は、コンピュータ設備108の独立のコンピュータからなっていてもよく、またはそれらの機能は1つのコンピュータに結合されていてもよい。ユーザ音声情報は、話者照合情報または”声紋”情報と言及してもよい。音声認識情報比較に基づき、学習サーバ110は、ユーザによるアクセスの継続を許可するかどうかを決定する。この処理は図2により詳しく記述される。
(ユーザ認可)
【0018】
図2は、この発明に従って、アクセスコントロールを提供しユーザ認可を確認するために、図1に示されたシステム100によって実行される処理を示す流れ図である。処理は、流れ図のボックス符号202によって示された、ユーザ確認のためのシステムのユーザ呼び出しから始まる。この操作において、ユーザは彼または彼女のパスワードまたはコードと名前を訊かれるかもしれない。この初期の自己確認は、キーボード入力または音声入力によって与えられる。音声入力の場合、ユーザはコンピュータのスピーカに発声することによって応答し、それにより、当業者に公知の方法で、ユーザの声紋が生成される。代案として、初期の確認202は、ユーザの声を自動的にサンプリングし、または、自動的にユーザの情報を入手することにより、自動的に行われるかもしれない。
【0019】
どちらの場合でも、ユーザ確認202は、名前とパスワードのような与えられた身元確認パラメータを有する者が、与えられた名前とパスワードの認可データベースの登録事項と合致したことを確認する結果となる。そのとき、システムは、ユーザによるコンピュータ設備へのアクセスを許可する。もし、認可データベースに一致が見られなければ、システムは、それ以上のアクセスを妨げるか、料金を支払って認可されたユーザになる機会をユーザに与える。このように、この好ましい実施形態では、新規のユーザは、ユーザ確認202の一部である登録処理に振り分けられる。
【0020】
ユーザの話者照合情報が受け取られたとき、システムは、ユーザの声紋情報がシステムに既に存在するかを決定するために確認する。これは、判断ボックス204によって表現されている。もし、声紋が既に受け取ったものであるとの判断ボックス204の肯定的な結論であれば、ボックス206で、授業または学習モジュールは、ユーザに配信するためのものと認められる。例えば、システムは、授業計画における連続した授業を提供する。もし、確認される声紋が以前に受け取ったものではないとの、判断ボックス204の否定的な結論ならば、新規ユーザがコンピュータ設備にアクセスしようと試みているということを示している。ユーザ声紋情報は、実際、システムがユーザを認可または照合をする手段である。それゆえ、ユーザが新規ユーザであれば、そのときボックス208で新規ユーザの声紋が構築され、データベースに記憶される。この処理は、以下により詳細に説明する。
【0021】
一度システムがユーザ声紋情報は有効であると確認すると、授業は、流れ図206番のボックスにおいて、ユーザに配信されるものと認められる。一度ユーザがすべての授業を一巡し通すと、授業シーケンスはボックス210で終了する。授業は、流れ図のボックス番号212で示される授業データベースから検索される。個々の授業を終了させるためのシステムとの対話の通常の過程の中で、ユーザはユーザコンピュータのディスプレイ上に1つ以上の質問を提示される。それらの質問もまた、ボックス212で示される、ユーザに対し提示するための学習設備の学習データベースから抜粋される。質問は、ユーザに言葉で答えることを要求し語句214を記録する。ユーザの声による応答は、また、声紋認可データベースに記録され、対応する音声パラメータとともにリアルタイム声紋を造る。この声紋情報は、授業を終了させるためのシステムとの対話の通常の過程の中で集められ、システムによって、授業を続けるか否かを決めるために使用される。
【0022】
更に詳しくは、システムは、好ましくは通常の授業操作が生じることを許可し、授業を学習しているユーザが、以前に上(ボックス202)で得られたパスワードおよび名前により確認された同一の個人であるかを決定するために定期的に確認を行う。これは、ある人が認可されたユーザの名前とパスワードを手に入れ、その別のユーザであると見せかけて授業の学習を進めようと試みるような事態を防止する。図2は、「確認」ボックス216で描かれた、ユーザ認可の確認を実行する3つの方法があることを示す。これら3つの確認は、アクセスパラメータ認可結果を与える。システムは、ユーザの声紋確認218を実行し、以前の授業進捗に対する学習しているユーザの進捗を追跡220し、そして、学習しているユーザの能力を評価222できる。それら3つの認可確認218,220,222は、ユーザの対話を邪魔せずにユーザに認可抜取り処理を気づかせることなく、ユーザの言語応答から情報を抽出することは注記すべきである。
【0023】
声紋確認218を実行するために、システムは、音声認識技術を使用して、認可されたユーザの記録された声紋情報を授業を学習しているユーザのそれと比較する。これは以下に、より詳細に記述する。比較は、ユーザまたは授業のいずれも妨害することなく、背景下で行われる。ユーザ進捗追跡プログラム220を実行するために、システムは、授業計画中のユーザの進捗に追随して異常を確認する。学習しているユーザによる進行中の授業レベルの予想外のまたは異常な変化(上昇も下降も)は、認可されたユーザが他のだれかにシステムに入ることを許したことのしるし(indication)であるかもしれない。一度このように潜在的な問題に対して警告が出されると、システムは、好ましくは、学習しているユーザの声紋情報を記録されたユーザの声紋情報に対して再確認することで、学習しているユーザが実際に認可されたユーザであるかどうかを決定する。学習しているユーザの能力の評価222を実行するために、システムは、授業計画の中でユーザの能力を追跡する。予想外に低い(高い)能力結果は、認可されたユーザが無認可のユーザにアクセスを許したことのしるしかもしれない。システムがこのように潜在的な問題に対して警告をうけた後は、システムは、好ましくは、ユーザの声紋情報を再確認することで、ユーザが実際に認可されたユーザであるかどうかを決定する。
【0024】
必要なユーザ認可確認が行われた後、システムは、学習しているユーザが、最初にボックス202で入手したユーザ名とパスワードと関連する予め認可されたユーザと同じ人であるかどうかについての結論を出す。ボックス224において、システムはユーザの身元確認についての決定をする。すなわち、システムは、ユーザが適正に許可されまたは認可されたユーザであるか否かを決定する。次に、システムは、継続ボックス226に示された、アクセスの続行と授業の継続について決定をする。もし、システムがなにかユーザの身元に疑いを持ったならば、学習しているユーザのコンピュータ画面にメッセージが現れ、好ましくは、進行中の授業はボックス228で直ちに停止する。もし、システムが継続が好ましいと決定したならば、処理はボックス206の授業提供に戻る。
(ユーザパスワード確認)
【0025】
上記のようにボックス202において、ユーザが最初にシステムを使用しようと試みたときに、ユーザ確認が実行される。図3は、ユーザ名とパスワードが確認される最初のユーザ確認処理の詳細を示す。先ず、ユーザは、パスワード情報を与えるよう訊ねられ、このパスワード情報は、言語訓練出版者が出版した教科書のユーザコピーに表示された、または、マイクまたは以下に説明するマイク装置のような限定されたアクセス入力装置を使用して提供される。例えば、以下のメッセージがユーザのコンピュータ画面に現れるかもしれない:「パスワードを入れてください。」。図3の流れ図302番のボックスにおいて、ユーザは、例えば教科書に見出すことができるかマイクまたは入力装置に貼付されたパスワードを入力する。それから、システムは、ボックス304の認可データベースでそのパスワードを探し、ボックス306でユーザが入力したパスワードをデータベースパスワードと対照して確認する。もしシステムがそのパスワードが存在しないと、判断ボックス308における否定的な結論として判断するならば、ユーザのコンピュータ画面に警告メッセージが現れる。例えば以下のメッセージが画面に現れるかもしれない:「あなたは、間違ったユーザパスワードを入力しました。我々に連絡してください。喜んであなたの手助けを手短にいたします。」。そして、システムは、ボックス310で授業の進行を直ちに停止する。
【0026】
もし、システムがユーザによって入力されたパスワードが存在すると確定すれば、ユーザは彼または彼女の名前を入れるように訊ねられる。例えば、以下のメッセージがユーザのコンピュータ画面に表示されるかもしれない:「あなたの名前を入れてください。」。ボックス312でユーザは彼または彼女の名前を入れる。システムは、ユーザ名を確認し、判断ボックス314で示されたように、そのユーザが新規ユーザであるかどうかを決定する。もし、そのユーザ名がデータベース中に見当たらなければ、そのユーザは新規ユーザであり、判断ボックス314での肯定的な結論を出し、ボックス316でそのユーザ名はパスワード認可データベースに加えられ、ボックス318で新規ユーザとして表示される。認可データベースは、好ましくは、名前、パスワード(例えば添付の教科書から)、ユーザ習熟パラメータ(授業レベル、能力評価)および声紋サンプルパラメータのような認可ユーザに関する情報を含む。この情報を後で使用することで、システムは、他のユーザが同じパスワードを使用するのを防止する。この段階で(ボックス318)、新規ユーザの名が始めて認可データベースに加えられたとき、すべてのユーザ習熟パラメータはレベルゼロに設定される。
【0027】
これにより、システムは、与えられたパスワードが適正なパスワードであることを照合し(ボックス308)、データベース中のユーザ名を照合(または入力)した(ボックス314)。システムは、判断ボックス320で示されるように、パスワードデータベース中のユーザを探すことで、ユーザ名がパスワードと適合するかを決定するために次の確認をする。もし、そのユーザが認可されたユーザでないとの判断ボックス320の否定的な結論であれば、システムはそのユーザが継続することを防止し、ボックス322で停止させる。例えば、以下のメッセージが画面に現れる:「あなたを確認することができません。我々に連絡してください。喜んであなたの手助けを手短にいたします。」。そして、システムは、授業計画の進行を直ちに停止する。
【0028】
もし、そのユーザ名がユーザパスワードと適合するとの、320番の判断ボックスの肯定的な結論であれば、システムは、流れ図324番のボックスのエラーカウントを初期化する。エラーカウントは、無認可ユーザのしるしである。エラーカウントで表わされる身元確認失敗の所定の回数の後、システムは、そのユーザを無認可ユーザとして認識し、すべての処理は停止する。システムは、326でパスワード認可データベースから授業レベルを検索し、ボックス328において、現行のユーザのためにこの検索されたレベルに授業レベルを設定する。このステップは、ユーザ確認処理を終了する。
(ユーザ声紋の構築)
【0029】
ユーザ確認の方法として、新規ユーザの声紋を構築する処理は図4に示される。この処理は、学習設備へのアクセスを望む身元確認されたユーザに対して声紋情報が存在しないとシステムが判断したときに実行される。図4の流れ図402番のボックスで表わされる最初のステップで、システムは声紋パラメータを初期化する。当業者は、ディジタル形式の音声情報が特によく知られたパラメータで表わされることを理解するだろう。ボックス402は、システムがそれらパラメータをゼロまたは他の初期状態に設定し、確認されたユーザに対応するパラメータを受け取る準備ができていることを示す。
【0030】
流れ図404番のボックスで表わされる次のステップで、システムは声紋情報を集める。もし、声紋情報がうまく記録されれば、処理はボックス406で終了する。もし、声紋情報がまだうまく集められていなければ、それはいまだパスワードデータベース中に存在しないことを意味し、ボックス404で、システムは、ユーザにユーザのコンピュータのマイクに語句を発声させることにより声紋情報を集める。例えば、ユーザは、ディスプレイ画面に現れる質問に答えるように求められてもよい。質問は、好ましくは、流れ図410番のボックスで示された、授業データベースから無作為に選択された語句である。マイク出力信号によって表わされる、ユーザの発声した応答は、流れ図412番のボックスでディジタル化され、ユーザのコンピュータに記録される。記録された発声された応答は、ボックス414で処理される。この処理は、ケプストラム(Cepstral)係数と言及されているような特殊なデータ形式でのディジタル化情報を表現し、発声ピッチの推定値を与えるよく知られた処理技術を含む。そのような処理は、例えば、文献「ローバストテキストの独立話者認識のための非線型判別特徴抽出(Nonlinear Discriminant Feature Extraction For Robust Text Independent Speaker Recognition)」Y. Koning, L. Heck, M. Weintraub および K. Sonmez (1988) による、会報 RLA2C-ESCA, 話者認識とその商業的および法医学的応用(Speaker Recognition and its Commercial and Forensic Applications) 72〜75頁、フランス、アビニョン、に記述されている。
【0031】
次に、流れ図416番のボックスで示されたように、システムは声紋パラメータを抽出し、そこで、システムがユーザ確認に使用する音声情報を定める。抽出されたパラメータは、声紋情報をより簡潔に表現することを可能にする。このステップは、好ましくは、学習設備へコンピュータネットワーク上で送らねばならないデータ量を最小化するために、ユーザのコンピュータによって実行される。最後に、ボックス418に示されているように、抽出された声紋情報は学習設備に与えられ、ボックス420に示されているように、学習サーバは認可データベースに声紋情報を記録する。
(音声情報確認)
【0032】
上記のように、音声認識技術は、授業過程の中で認可されたユーザの声紋を新しいユーザの記録と比較するために使用され、アクセス認可の結論を出す3つの方法の内の1つである。声紋比較は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。図5はその処理の詳細を示す。
【0033】
図5の流れ図502番のボックスで示される最初の声紋確認ステップでは、システムは語句の記録を処理する。その処理は、1つの可能な手法を紹介する上記参考文献から理解されるように、よく知られている。上記参考文献に記述された処理(「ローバストテキストの独立話者認識のための非線型判別特徴抽出(Nonlinear Discriminant Feature Extraction For Robust Text Independent Speaker Recognition)」)は、以下の処理を含む:
1. それぞれの発声フレームに対して、17のケプストラム係数とピッチの推定値を抽出する。
2. 過去4フレームを加え、将来4フレームを加えた現在のフレームの特徴を5層のMLPの、162次元ベクトルに入力し31の出力を作り出す。
3. 目標話者のためのGMMを訓練する。
次に、学習設備は、判断ボックス504に示されたように、処理された声紋情報と学習設備データベースに記録されたユーザ声紋情報とを比較する。もし、2つの情報が適合しないとの、判断ボックス504での否定的な結論であれば、ボックス506でエラーカウントに1つのエラーが加算される。エラーカウントは、以下に説明する他の学習設備の処理に使用される。比較ステップは声紋確認処理を完了する。
(ユーザ進捗追跡)
【0034】
他のユーザ認可確認およびアクセス認可結果生成(図2)の方法は、授業計画を通して認可されたユーザの進捗を追跡することである。システムは、学習しているユーザによってなされた授業レベルのいかなる変化も、無認可ユーザが製品を使用し、学習設備にアクセスしていることのしるしであることを認識する。システムの援助によるユーザ進捗の追跡は、使用中のユーザの声紋情報の再確認を開始することで、そのような無認可の使用を防止する。ユーザ進捗追跡は図6に示される。声紋比較処理(図5)とともに、ユーザ進捗追跡は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。
【0035】
最初のユーザ進捗追跡ステップでは、システムは、図6の流れ図602番のボックスに示される、学習設備認可データベースから学習計画における確認されているユーザの授業レベルを検索し、このレベルを、ボックス604で示されるように、確認されたユーザにより現在使用されている授業レベルと比較する。いくらかの授業計画の反復および復習または予習は予測されが、以前のユーザセッションの授業レベルと比較した、進行中の授業計画レベルの大きな不一致は、認可されたユーザ以外の者が認可されたユーザ名とパスワードにアクセスするに至ったことを示すかもしれない。このため、606番の判断ボックスでシステムは、現在の授業レベルが以前の授業レベルと所定の許容差よりも大きく異なるかを決定する。予測されるまたは許容される差は、典型的には、授業計画の中の授業の総数と授業計画の難易度の関数である。許容される差は、システムの授業計画の開発することに関係した人によって与えられねばならない。
【0036】
判断ボックス606で、もし、現在の授業レベルが、以前の通信セッションのレベルと比較して許容範囲の差の外にあるものでないとの、判断ボックスの否定的な結論であれば、ユーザ進捗追跡確認は完了する。もし、現在の授業レベルが、以前の授業レベルと比較して低過ぎるまたは高過ぎるならば、ボックス608でシステムは、ユーザ認可エラーカウントに1つのエラーを加算する。このとき、エラーカウントは、好ましくは、ボックス610で、図5に関連して上述した処理であるユーザ声紋確認を開始する。これはユーザ進捗追跡確認を完了する。
(ユーザ能力評価)
【0037】
他のユーザ認可確認およびアクセス認可結果生成(図2)の方法は、授業計画の中で学習しているユーザの能力を評価することである。システムは、認可されたユーザと比較して、学習しているユーザの能力に対する劇的な(すなわち、著しい)変化は、無認可ユーザが製品を使用しているしるしであるかもしれないことを認識する。システムの援助によるユーザ能力評価は、使用中に、ユーザの声紋情報の再確認を開始することにより、そのような無認可の使用を防止する。ユーザ進捗追跡は図7に示されている。声紋比較処理(図5)とともに、ユーザ能力評価は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。
【0038】
最初のユーザ能力評価ステップでは、システムは、流れ図702番のボックスで示されるように、認可データベースから身元確認されたユーザの能力データを検索し、流れ図のボックス704で示されるように、それを現在のユーザの能力と対照して確認する。システムは、能力が高過ぎることおよび低過ぎることを確認する。判断ボックス706で、システムは、ユーザによる低い能力を確認する。もし、現在学習しているユーザの能力が以前のユーザの能力と比較して低過ぎるという、判断ボックス710の肯定的結論ならば、ボックス708で1つのエラーがエラーカウントに加算され、ボックス710でユーザの声紋が再び確認される。
【0039】
エラーカウントの修正、およびそれに続く、学習しているユーザの能力が低過ぎない(判断ボックス706の否定的結論)というシステムの決定の後、システムは判断ボックス712でいずれかの能力が高過ぎることの確認処理をする。もし、現在学習しているユーザの能力レベルが以前のユーザレベルと比較して高過ぎると思われたならば、無認可ユーザによる使用の可能性を示す。それはまた、同じ認可されたユーザが彼または彼女の習熟を向上させたことのしるしであるかもしれない。このように、もしユーザの能力が高過ぎるという、判断ボックス712の肯定的な結論であれば、流れ図番号714で示されたようにユーザの声紋が再び確認される。
【0040】
ユーザ能力がユーザの正確な発音能力をも含むことができることは注記すべきである。例えば、日本人(ネイティブでないアメリカ人)ユーザは、アメリカ英語の文字「R」の音を正確に発音するように訓練されるかもしれない。最初は、そのユーザの発音はアメリカ英語の「L」の音として認識されたであろう、そして、徹底的な訓練の後にそれは正しいアメリカ英語の「R」の音のように聞こえることができる。そのような習熟(アメリカ英語の「R」の正しい発音)は、上述のユーザ能力の一例である。
(認可決定)
【0041】
システムがユーザ認可の無作為確認を行い、アクセス認可パラメータを受け取った(図2)後、システムは、アクセス認可パラメータに基づき授業を継続するか否かを決定する。上述のシステムで、アクセス認可パラメータは、学習サーバにより保存されたエラーカウントを含む。アクセス認可パラメータは図8に示される。システムは判断ボックス802でエラーカウントを確認する。もし、エラーカウントが所定の限度の数よりも少ない声紋確認の失敗回数を示すという、判断ボックス802の肯定的な結論ならば、システムは、現在のユーザが認可されたユーザであると決定し、ボックス804で授業計画を継続させる。例えば、エラーカウントの最大数は3回のエラーでもよい。もし、エラーカウントが許容される最大の数より少なくないという、判断ボックス802の否定的な結論であれば、システムは、現在のユーザを認可されたユーザではないと決定し、ボックス806で授業の進行を停止する。いずれの場合でも、システムは継続フラグをYESの値またはNOの値にセットし、それにより、授業の進行を管理する。もし、失敗した声紋確認の回数にもかかわらず、システムが特定のユーザを無認可であると確固として決めることができなければ、システムは、授業の継続を可能とする。このように、そのような場合、継続フラグはYESの値に更新される。
(コンピュータの構造)
【0042】
図1に関連して上述したように、学習サーバ110および話者認識プロセッサ112の機能性は、並列コンピュータに分散されてもよいし、または1台のコンピュータの中で実行されてもよい。コンピュータ設備の処理を実行するコンピュータ、ユーザのパーソナルコンピュータの処理を実行するコンピュータまたはシステムの他のコンピュータ装置は、ハンドヘルドコンピュータ装置、情報携帯端末(PDA)およびここに記述する機能性を実現するに適したあらゆる従来のコンピュータのような、種々の処理装置を含むことができる。
【0043】
図9は、PCまたは図1に示されるサーバコンピュータ装置を含むであろう、典型的なコンピュータ装置900のブロック図である。それぞれのコンピュータ900は、多くの販売者による特定用途用集積回路(ASIC)または米国カリフォルニア州サンタクララのインテル社から入手可能なペンティアム級マイクロプロセッサおよび関連集積回路チップのような中央演算装置(CPU)902の制御の下で動作する。命令とデータはユーザコントロールパネル、遠隔操作装置、またはキーボードとマウスの組合せ904によって入力でき、入力と出力はディスプレイ906で見ることができる。ディスプレイは、典型的にはビデオモニタまたはフラットパネルディスプレイ装置である。ユーザのPC(図1)はユーザからの音声入力を受け取ることができる音声可用装置であり、それゆえ、ユーザのPCは、キーボードとマウスに加えて、周辺装置904の一部としてマイクおよびサウンドカードを含む。
【0044】
コンピュータ装置900は、パーソナルコンピュータを含み、またはクライアント機の場合、コンピュータ装置は、ウェブ機器または他のネットワーク通信に適したもの、音声可用化装置を含む。パーソナルコンピュータの場合、装置900は、好ましくは、固定ハードディスクドライブ(HDD)のような直接アクセス記憶装置(DASD)908である。メモリ910は、典型的には、揮発性半導体メモリ(RAM)である。もし、コンピュータ装置900がパーソナルコンピュータであるならば、好ましくは、プログラム製品記憶装置914を受け入れ、それからデータを読むことができる(随意にデータを書き込むことができる)プログラム製品読取装置912を含む。プログラム製品読取装置は、例えば、ディスクドライブ、およびプログラム製品記憶装置を含むことができる。プログラム製品記憶装置は、フロッピーディスク、光学CD−ROMディスク、CD−Rディスク、CD−RWディスク、DVDディスクまたは同様のものなどの交換可能な記憶媒体を含むことができる。データ記憶のための半導体メモリ装置および対応する読み出し装置もまた使用可能である。コンピュータ装置900は、ネットワークとコンピュータ装置との間の回線920を通しての通信を可能にする、ネットワークインターフェイス918を通してネットワーク(インターネットのような)の上の他の接続されたコンピュータと交信することができる。
【0045】
CPU902は、コンピュータ900のメモリ910に一時的に記憶されたプログラミングステップのコントロールの下で動作する。プログラミングステップが実行されたとき、関連システム構成要素はその機能を果たす。このように、プログラミングステップは、図1に示されたシステムの機能性を実行する。プログラミングステップは、プログラム製品914を通して、または、ネットワーク回線920を通して、DASD908から受け取ることができ、もしくはコンピュータ装置の製造工程の一部としてASISに組み込むことができる。もしコンピュータ装置が記憶ドライブ912を含んでいるならば、プログラム製品を受け入れ、そこに記録されたプログラミングステップを読み出し、CPU902により実行されるように、メモリ910にプログラミングステップを転送することができる。上記のように、プログラム製品記憶装置は、コンピュータが読むことができる指示が記録された、多様で交換可能な媒体のいずれの1つを含んでもよく、その媒体は、磁気フロッピーディスク、CD−ROM、およびDVD記憶ディスクを含む。他の適当なプログラム製品記憶装置は、磁気テープおよび半導体メモリチップを含むことができる。このように、本発明に従って動作するのに必要な処理ステップは、プログラム製品上に具体化することができる。
【0046】
代案として、プログラムステップは、ネットワークから操作メモリ910に受け入れることが可能である。ネットワーク方式において、コンピュータは、ネットワーク回線920を通して、これ以上の説明がなくても当業者なら理解するよく知られた方法で確立されたネットワーク通信により、ネットワークインターフェイス918を通してメモリ910に、プログラムステップを含むデータを受け取る。そして、プログラムステップは、CPU902により実行され、システムの処理を実行する。
【0047】
上記のように、ユーザのパーソナルコンピュータ900は、コンピュータ設備108の機能性(図1)を与えるであろう他のコンピュータ装置と通信できる。
(コードジェネレータによる付加的なアクセス認可)
【0048】
上述ユーザ対話の分析に加えて、本発明に沿って構成された語学教育システムの好ましい実施形態は、認可動作を補足し、コンピュータ設備108(図1)から取得された授業モジュールと一緒に取引され、販売される入力装置を利用する。図10は、そのような入力装置を有するユーザコンピュータの模式図である。好ましい実施例において、ユーザは、ユーザ入力装置がユーザコンピュータに接続されない限り、語学教育プログラムに参加することができない。
【0049】
ユーザコンピュータ1002は、従来のパーソナルコンピュータ(PC)について図9に示したものと同様の構成である。ユーザPC1002は、マイク装置のようなユーザ入力装置のための、PCに付属するように示されているアナログ入力ポート1004を含む。接続電線1008はマイク装置をPCに接続し、マイク変換機1007(音の刺激に対応する電気信号を生成する)とPC1002との間の通信の通信路を提供する。赤外線(IR)ポート、無線周波数(ワイヤレス)通信、および、ユニバーサル・シリアル・バス(USB)接続のような、マイクをPCに接続する他の手段も使用できる。
【0050】
スイッチ1010は、アナログ入力ポート1004へのコード出力信号を生成するコードジェネレータ1012の作動トリガを与えるように設けられている。もし、スイッチ1010が閉じていなければ、電力はコードジェネレータに供給されず、マイク変換器出力がアナログ入力ポートに与えられる。バッテリ1014は、コードジェネレータ1012に、電源供給するために電気エネルギー源を提供し、該コードジェネレータは、PC1002のアナログ入力ポート1004に与えられる所定のシーケンスのトーンを生成する。コードジェネレータは、例えば、300Hz,400H,500Hz,・・・,1200Hzのような対応するコード周波数が設定された、コード符号0,1,2,・・・,9が表示されるシングルトーンジェネレータから成ることができ、または、コードジェネレータは、モデム送信機または他のマルチ・トーンのジェネレータから成ることができる。PC1002は、アナログポート1004で受信しているトーンを認識し、生成されている適正コード(コード符号に相応する)を決定する処理を提供されることができる。そのような処理は当業者には明らかなものである。
【0051】
スイッチ1010は、好ましくは、PC1002で受け取られるとともに、ユーザが確認するためにPCのディスプレイに表示されるメッセージの求めによって、ユーザが作動させるスイッチである。スイッチ1010を作動させることによって、ユーザは、出力トーンの所定のシーケンスをコードジェネレータ1012に生成させる。これらのトーンは、PC1002に受信され、それらがコンピュータ設備に通信される前に、ユーザコンピュータによって分析され、ディジタルコードに変換される。もし、送信されたコードが既知のコードに一致するか、または有効であれば、ユーザは認可されたユーザであると決定される。もし、生成されたトーンが、コンピュータ設備に知られた所定のコードに一致しなければ、ユーザは認可されていない。そのとき、語学教育プログラムへのアクセスは中止され得る。アクセスコントロールに従属するマイク装置1006は、上記の授業モジュールとは独立して取引、販売され、または、マイク装置は、次に説明するように、管理された授業モジュールへのアクセスと関連して取引、販売されることができる。
(限定アクセス販売)
【0052】
システムの好ましい実施形態において、図10に示されるマイク装置のような入力装置は、語学教育プログラムへのアクセス許可と結びついたユニットとしてユーザに販売される。ユーザがマイク装置を購入するとき、ユーザは、語学教育プログラムの定められた数のデータモジュールまたは構成要素にアクセスすることを保証される。例えば、語学教育プログラムは、20のモジュールを含んでいる。マイク装置を購入するとユーザには、例えば2つのモジュールといったある数のモジュールを選択する権利が与えられる。もし、ユーザが所定の数より多くの利用を望むならば、ユーザは追加の金額を支払わねばならない。
【0053】
図10のジェネレータが装備されたマイク装置を販売することの代案として、印刷されたコードを同梱して従来のマイクを販売できる。購入後、ユーザはユーザコンピュータのキーボードを通じて印刷されたコードを入力するよう要求され、入力されたコードは確認処理を受ける。ユーザはコードによる最初の登録の上に、再び限定アクセス権を許可され、所定の数の語学教育モジュールが選択される。
【0054】
好ましい実施形態において、語学教育プログラムは、インターネットのようなネットワーク上で利用可能である。図11はユーザコンピュータのディスプレイで見られるウェブページ1102の実例である。ウェブページは、ビジネス用語1104、医療用語1106、観光用語1108およびそのようなものに関する教育を含む択一語彙モジュールの選択のような、選択メニューがユーザに提示されることを示している。ユーザは、例えばディスプレイのマウスカーソルを使用して1104、1106、1108の選択を「クリック」する。このように、マイク装置を購入したユーザは、コンピュータにマイクを接続する。そして、ユーザは、語学教育プロバイダのウェブサイトに行く。ログインと登録手続きの後、ユーザは、図11に示されたウェブページを提示され、語学教育プロバイダが設定した所定の限度までの選択対象の選択を行う。ユーザは、ユーザの母国語および教育の対象言語をもまた選択できる。
【0055】
最初のユーザによるモジュールの選択のためにユーザにアクセスを認める前に、ウェブサイトは、上述のように、マイク装置のスイッチを入れるようにユーザに指示する。生成されたコードは、ユーザのリモートコンピュータに通信回線を通じて、マイク装置のコードジェネレータから送られ、リモートコンピュータからその情報が語学教育ウェブサイトに送られる。上述のように、もし、生成されたコードが適正であれば、ユーザは選択したモジュールにアクセスを許可される。
【0056】
その後は、もし、ユーザが追加の語学教育モジュールを使用したいと望むならば、ユーザはモジュールを要求し、支払いを認可しなければならない。ウェブサイトの実施形態では、ユーザは、語学教育プロバイダのウェブサイトで追加モジュールについての情報を見ることができ、追加モジュールへのアクセスを要求でき、そして、クレジットカードの課金認可のような支払い認可を送ることができる。この情報は、要求されたモジュールへのアクセスを許可する語学教育プロバイダによって受信され、処理される。上記のように、モジュールは対話形式のオンライン方式で提供され、または、モジュールはユーザコンピュータのネットワークダウンロードによって受け取られる。ユーザは、マイク装置により生成されたコードにより身元確認され、認可されたモジュールで継続するために追加モジュールのために支払ったユーザに、引き続いてのセッションの間、使用許可を与える。
【0057】
このように、本発明は、ネットワーク資源へのアクセスを管理する技術を提供し、そこでは、ネットワーク設備にアクセスする前に、クライアントノード上で身元確認されたユーザは、ネットワークユーザパスワードデータベースに加入しているものとして照合される。そして、システムはユーザにアクセスを享受することを許可し、そして、アクセスの後の所定の時間、身元確認されたユーザの声紋データがネットワーク声紋データベースに入力されるのを待ち、または、それが入力されなければ、所定の語句のユーザの発声の結果として、身元確認されたユーザからの声紋データを受け取る。システムは、身元確認されたユーザの少なくとも1つのアクセスパラメータ認可結果から、コンピュータネットワーク設備へのアクセス継続を許可するか否かを決定する。いかなる無認可ユーザも、代金を支払うことで認可されたユーザになる機会を、都合よく与えられる。このように、ネットワーク設備へのアクセスは管理され、無認可ユーザはもしかすると認可されたユーザに変わるかもしれない。
【0058】
本発明は、本発明の理解を導き出せるように、現在好ましい実施形態に関して上に説明してきた。しかしながら、ネットワークアクセスコントロールシステムのためには、ここに明確に説明していないが、本発明が適用可能な多くの形態が存在する。それゆえ、本発明は、ここに記述された特定の実施形態に限定するものと見てはならず、むしろ、ネットワークアクセス管理一般に広く適用できるものと理解すべきである。すべての実施形態、様々なまたは均等の組合せおよび実行は、添付した請求の範囲の範囲内にあり、それゆえ本発明の範囲の中にあると考えられる。
【図面の簡単な説明】
【0059】
【図1】本発明に従って構築したネットワークコンピュータシステムのブロック図である。
【図2】本発明に従ってアクセスコントロールを提供する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図3】図2に示すユーザ身元確認処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図4】ユーザ声紋処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図5】ユーザ声紋照合処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図6】ユーザ追跡処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図7】ユーザ能力評価処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図8】アクセス継続判断処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図9】本発明に従って構築した図1に示したシステムのコンピュータのブロック図である。
【図10】ユーザ入力装置が付属したユーザのコンピュータの模式図である。
【図11】ユーザの選択したデータモジュールを示す、ユーザのコンピュータのディスプレイに表示されるウェブページの実例表示である。
【符号の説明】
【0060】
102…ユーザ
104…ユーザコンピュータ
106…インターネット
108…コンピュータ設備
110…学習サーバ
112…話者認識プロセッサ
114…認可データベース
120…授業データベース
126…マイク
128…音声
【技術分野】
【0001】
本発明は、コンピュータネットワーク資源のためのアクセスコントロールに関し、より詳しくは、双方向学習プロセスを提供するネットワークロケーションへのアクセスの管理に関する。
【背景技術】
【0002】
商業がより世界的になるので、第2言語を理解することおよびそれらの中でコミュニケーション可能であることへの要求は増大している。そのため、外国語/第2言語訓練産業は、急速に拡大している産業であり、そのような訓練にインターネットのような新技術をいかに適用するかを現在研究している。現行の語学教育製品要素は、印刷物、オーディオカセット、アプリケーションソフトウェア、ビデオカセットおよび情報提供と遠隔学習授業の提供がなされているインターネットサイトを含む。インターネット世界へ様々な外国語/第2言語訓練プロセスを適用するいろいろな試みがなされているが、それらの大部分は、印刷物、オーディオおよびビデオの教材をコンピュータサーバアプリケーションに単に変換したものである。すなわち、インターネットアプリケーションは、一般的には、従来の媒体が現に提供している特徴を超える新しい特徴を提供するものではない。
【0003】
外国語/第2言語訓練にからむ出版産業は、印刷された訓練教材の偽造、貸与、コピー、中古購入のために収益を失うことに対して無防備である。偽造は、何者かが違法コピーのようなオリジナル訓練教材の無認可の複製を行ったときに生じる。偽造品は認可された教材、本物として人手に渡ることがある。偽造品が販売されると、出版者は何の保証も受け取れないし、偽造品によるすべての収益は偽造コピーの販売者によって集められる。貸与による損失は、オリジナル訓練教材の複製が第三者に貸し出され、そのとき第三者は原教材を購入する必要がないことによって生じる。同様に、オリジナル教材の無認可コピーは、その教材の需要を小さくする結果となる。中古購入は、中古販売者がそのような売上から収益を得るために、出版者の収入を奪う。これらすべてのオリジナル教材の使用は、無認可であるか、現に出版者の管理を超えており、すべてが出版者の収益を減少させる。もし語学教材の製造者が、そのような彼らの印刷物のユーザから失われた収入のいくらかを獲得することができたなら、それは有利である。
【0004】
最新のコンピュータ技術は、アプリケーションソフトウェアのネットワーク上での実行を提供して、教材のオンライン版を入手可能にし、それにより、多数のユーザがアクセスし申し入れすることを可能にする。コンピュータ技術は、教材の追加とプレゼンテーションの向上にもまた使用される。そのような教材へのネットワークアクセスは、インターネットを通じて便利に実行される。オンラインアクセスは容易に行われるため、容易なアクセスは、新しい媒体中のアプリケーションおよび教材の無認可使用機会がより多いことをも意味する。話者認識技術は、オンラインアクセスを通じての語学教育の効率、品質および楽しみを増強させる、潜在的に強力な手段である。話者認識技術がユーザの正確な身元確認を保証する対策として適用されている異なる分野(クレジットカードの処理認可、セキュリティアクセス、コンピュータ化されたシステムへのアクセスのパスワードによる保護のような)には多くのアプリケーションが存在する。
【0005】
多様な話者認識製品が、米国マサチューセッツ州ボストンのスピーチワークス社および米国ニュージャージー州パーシッパニーのダイアロジックコーポレーションなどといった会社から現に提供されている。話者認識技術も、ITT SpeakerKey, NetKey and WEBKey, Lucent Speaker Verification および "SpeakEZ" が、米国コロラド州エングルウッドのT−ネッティクス社から現に提供されている。市販アプリケーションの例は、米国カリフォルニア州キューパーティノのアップルコンピュータ社による、コンピュータオペレーションシステムへのユーザアクセスの音声照合のための、"Mac OS 9" オペレーティングシステムへの話者認識の統合である。そのようなシステムでは、話者認識処理が完了するまでアクセスは拒否される。
【0006】
コピー、中古購入、貸与および偽造の現象は、出版産業の重大な問題である。出版産業は、すでに使用された教材の中古販売の著しい伸びにより、また、主として教育分野において、本の購入および本の貸与とコピーにより、潜在的収入の重大な損失を被っている。貸与とコピーの法律の制定を提唱する管轄体が存在する。これらの法の多数は、需要者のためになるかもしれないが、出版者からのオリジナル教材の購入が減少する結果となるため、出版者にとって非常に不利益である。加えて、デザイナーブランド衣類産業で一般的に行われている偽造現象は、出版産業にも同様に浸透してきており、結果として出版者に深刻な利益の損失を生じている。
【0007】
教育的プロバイダはウェブサイトのようなインターネットロケーションを維持し、ユーザは教育ウェブサイトを訪れ、指導と技能の査定の両方を受け取るという、インターネット上での遠隔学習技術が使用されている。しかしながら、上記のように、そのような学習サイトの不正使用の機会は多い。例えば、認可されたユーザはコンピュータ学習セッションのためにアクセスするに至る、しかし、それからコンピュータを離れ、異なる生徒が認可された生徒に代わって続けることができる。これは少なくとも二つの理由で望ましくない。第1に、サービスプロバイダが見る能力が、実際の生徒が持っている能力ではない。そして第2に、1人だけが支払いをするか課金されるにもかかわらず、少なくとも2人が学習サイトを利用し、ウェブプロバイダの収入損失という結果になる。
【0008】
上記の議論から、印刷とインターネットの両方の教材を組み込み、それらが認可された人にのみ使用される出版製品への要求がある。そのようなアクセスコントロールは、出版者に、ライセンス料からの利益およびこのように出版者以外の出所からの製品を取得したユーザからの収入を稼ぐことを可能にするだろう。本発明はこの要求にかなうものである。
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明は、ユーザにネットワークのコンピュータノードを通しての前記コンピュータ設備との対話を許可し、ここで、前記ユーザ対話は、前記コンピュータノードを通して前記コンピュータ設備に対して出す語学学習応答を含み、前記許可されたユーザ対話が認可されているか決定するための、ユーザ認証処理を実行し、前記ユーザが認可されていないと決定されたときの、前記許可されたユーザ対話を継続すべきかを決定し、前記ユーザ認証処理は、前記許可されたユーザ対話の間に前記コンピュータ設備により入手されたユーザ認証情報、および、前記ユーザの語学学習応答から抽出されたユーザ認証情報により実行されることにより、コンピュータ設備のコンピュータネットワーク資源へのアクセスを管理する技術を提供する。このようにユーザ認証は、コンピュータ設備の利用を邪魔することなく生じる。
【課題を解決するための手段】
【0010】
ユーザ認証は、現にコンピュータ設備にアクセスしているユーザから集められた、音声情報を利用する話者識別処理の結果として発生する。アクセスコントロールは、特に、ユーザから通常操作の一部として音声情報を集める語学教育システムに適している。このように、この発明は、教材の出版者が、コンピュータ設備が認可された人のみによって使用可能となるという信頼をもって、印刷およびコンピュータ設備上のインターネットの両方の教材を組み込むことを可能にする。
【0011】
この発明の他の局面として、システムに無認可ユーザと判断されたユーザは、追加登録費の支払いなどによって、認可されたユーザになることを勧められる。このように、ユーザは、実行されるあからさまなユーザ身元確認チェック作業に気づかない、そして一度無認可ユーザが発見されると、彼らは認可されたユーザになることと費用の支払いと引き換えに彼らの学習プロセスを継続することを勧められる。このように、無認可の人は直ちにシステムの使用を停止されはしないが、かわりに追加販売の機会として扱われる。
【0012】
この発明のさらに他の局面として、マイク装置などの入力装置が、購入対象として提示できることである。ここで、マイク装置はコードジェネレータを含み、該コードジェネレータはコード出力を生成し、あるチャネル上で、ユーザコンピュータと通信する。このチャネルを介して、マイク装置はユーザコンピュータに電気信号を提供する。また、この発明の他の局面では、マイク装置はユーザにより使用され、これによりユーザ認証情報は、マイク装置のコードジェネレータによって生成されたユーザコードを含む。
【発明を実施するための最良の形態】
【0013】
本発明のその他の特徴と利点は、本発明の原理の例として示された、好ましい実施形態についての以下の説明によって明らかとなるであろう。
【0014】
図1は、本発明に従ってネットワークアクセスコントロールを提供するシステム100のブロック図である。パーソナルコンピュータ104のユーザ102は、インターネットのようなネットワーク106上で通信セッションを開始し、双方向ネットワーク資源108にアクセスするに至る。ネットワーク資源108は、例えば、話者認識プロッセッサ112と協調して動作する学習サーバ110によって提供される双方向学習コンピュータ設備を含んでもよい。学習サーバ110は、ユーザ102からアクセス要求を受け取り、コンピュータネットワーク設備108を使用するユーザによる、コンピュータネットワーク設備108へのアクセスを許可する。その設備使用の間、ユーザは、音声コマンドを与えることおよびシステムの質問に答えることで、時折、音声情報を提供する。コンピュータ設備108は、ユーザがアクセスを開始してから所定時間待ち、そして、ユーザの音声情報がコンピュータ設備108に保存されているネットワーク認可データベース114に入力されたことを確認する。
【0015】
もし、ユーザ音声情報データがあらかじめ入力されていなければ、そのとき、サーバコンピュータ110は、ユーザクライアントノード104でのユーザの話しの結果として、進行中の通信セッションの間、確認されたユーザ102からの音声データを受け取る。サーバコンピュータは、話者認識技術を使用してユーザが認可されたユーザであるか否かを決定することに応答して、確認されたユーザによるコンピュータネットワーク設備108へのアクセスの継続を許可するかどうか決定する。それにより、本発明は、ユーザにアクセスを認め、ユーザがコンピュータ設備を利用している間に、話者認識技術でユーザ認証を目立たず実行することで、コンピュータ設備へのオンラインアクセスを管理する。
【0016】
図1の実施形態において、コンピュータ設備108は、語学指導を提供する。希望により、他の種類の情報とサービスを前記設備により提供することができる。ユーザのコンピュータ設備とのオンライン対話の間、ユーザは、授業データベース120から検索した後、コンピュータ設備から語学授業を受ける。受ける授業は、視聴覚、文字および図形情報の組合せ122を含むことができる。ユーザは、視覚要素をパーソナルコンピュータ104のディスプレイで見ることができ、音響要素をパーソナルコンピュータ104のスピーカ、イヤホンまたはヘッドフォン124で聞くことができる。授業データベース120は、語学指導のプログラムから授業またはデータモジュールを提供する。データモジュールは、ウェブページの転送によってまたはインターネットストリーミング技術を通して提供されるような対話ベースで受け取られ、もしくは、データモジュールは、後にユーザが見るためのファイル転送技術を通してするようなネットワークダウンロードによって受け取られる。
【0017】
ユーザ102は、パーソナルコンピュータ104のマイク装置128が受け取られる音声126を生ずることで、受け取った学習モジュールに対して応答する。さらに、ユーザは、パーソナルコンピュータのキーボードとディスプレイマウスデバイスによってコンピュータ設備108に入力を与える。そのようなコンピュータとユーザの対話の間、コンピュータ104は、当業者に公知の方法で、ユーザの音声126を音声情報に変換し、学習設備108にそのデータを提供する。そして、音声情報は、話者認識プロセッサ112によって、認可データベース114に記憶された音声情報と比較される。そのような比較技術は当業者に公知である。話者認識プロセッサ112と学習サーバ110は、コンピュータ設備108の独立のコンピュータからなっていてもよく、またはそれらの機能は1つのコンピュータに結合されていてもよい。ユーザ音声情報は、話者照合情報または”声紋”情報と言及してもよい。音声認識情報比較に基づき、学習サーバ110は、ユーザによるアクセスの継続を許可するかどうかを決定する。この処理は図2により詳しく記述される。
(ユーザ認可)
【0018】
図2は、この発明に従って、アクセスコントロールを提供しユーザ認可を確認するために、図1に示されたシステム100によって実行される処理を示す流れ図である。処理は、流れ図のボックス符号202によって示された、ユーザ確認のためのシステムのユーザ呼び出しから始まる。この操作において、ユーザは彼または彼女のパスワードまたはコードと名前を訊かれるかもしれない。この初期の自己確認は、キーボード入力または音声入力によって与えられる。音声入力の場合、ユーザはコンピュータのスピーカに発声することによって応答し、それにより、当業者に公知の方法で、ユーザの声紋が生成される。代案として、初期の確認202は、ユーザの声を自動的にサンプリングし、または、自動的にユーザの情報を入手することにより、自動的に行われるかもしれない。
【0019】
どちらの場合でも、ユーザ確認202は、名前とパスワードのような与えられた身元確認パラメータを有する者が、与えられた名前とパスワードの認可データベースの登録事項と合致したことを確認する結果となる。そのとき、システムは、ユーザによるコンピュータ設備へのアクセスを許可する。もし、認可データベースに一致が見られなければ、システムは、それ以上のアクセスを妨げるか、料金を支払って認可されたユーザになる機会をユーザに与える。このように、この好ましい実施形態では、新規のユーザは、ユーザ確認202の一部である登録処理に振り分けられる。
【0020】
ユーザの話者照合情報が受け取られたとき、システムは、ユーザの声紋情報がシステムに既に存在するかを決定するために確認する。これは、判断ボックス204によって表現されている。もし、声紋が既に受け取ったものであるとの判断ボックス204の肯定的な結論であれば、ボックス206で、授業または学習モジュールは、ユーザに配信するためのものと認められる。例えば、システムは、授業計画における連続した授業を提供する。もし、確認される声紋が以前に受け取ったものではないとの、判断ボックス204の否定的な結論ならば、新規ユーザがコンピュータ設備にアクセスしようと試みているということを示している。ユーザ声紋情報は、実際、システムがユーザを認可または照合をする手段である。それゆえ、ユーザが新規ユーザであれば、そのときボックス208で新規ユーザの声紋が構築され、データベースに記憶される。この処理は、以下により詳細に説明する。
【0021】
一度システムがユーザ声紋情報は有効であると確認すると、授業は、流れ図206番のボックスにおいて、ユーザに配信されるものと認められる。一度ユーザがすべての授業を一巡し通すと、授業シーケンスはボックス210で終了する。授業は、流れ図のボックス番号212で示される授業データベースから検索される。個々の授業を終了させるためのシステムとの対話の通常の過程の中で、ユーザはユーザコンピュータのディスプレイ上に1つ以上の質問を提示される。それらの質問もまた、ボックス212で示される、ユーザに対し提示するための学習設備の学習データベースから抜粋される。質問は、ユーザに言葉で答えることを要求し語句214を記録する。ユーザの声による応答は、また、声紋認可データベースに記録され、対応する音声パラメータとともにリアルタイム声紋を造る。この声紋情報は、授業を終了させるためのシステムとの対話の通常の過程の中で集められ、システムによって、授業を続けるか否かを決めるために使用される。
【0022】
更に詳しくは、システムは、好ましくは通常の授業操作が生じることを許可し、授業を学習しているユーザが、以前に上(ボックス202)で得られたパスワードおよび名前により確認された同一の個人であるかを決定するために定期的に確認を行う。これは、ある人が認可されたユーザの名前とパスワードを手に入れ、その別のユーザであると見せかけて授業の学習を進めようと試みるような事態を防止する。図2は、「確認」ボックス216で描かれた、ユーザ認可の確認を実行する3つの方法があることを示す。これら3つの確認は、アクセスパラメータ認可結果を与える。システムは、ユーザの声紋確認218を実行し、以前の授業進捗に対する学習しているユーザの進捗を追跡220し、そして、学習しているユーザの能力を評価222できる。それら3つの認可確認218,220,222は、ユーザの対話を邪魔せずにユーザに認可抜取り処理を気づかせることなく、ユーザの言語応答から情報を抽出することは注記すべきである。
【0023】
声紋確認218を実行するために、システムは、音声認識技術を使用して、認可されたユーザの記録された声紋情報を授業を学習しているユーザのそれと比較する。これは以下に、より詳細に記述する。比較は、ユーザまたは授業のいずれも妨害することなく、背景下で行われる。ユーザ進捗追跡プログラム220を実行するために、システムは、授業計画中のユーザの進捗に追随して異常を確認する。学習しているユーザによる進行中の授業レベルの予想外のまたは異常な変化(上昇も下降も)は、認可されたユーザが他のだれかにシステムに入ることを許したことのしるし(indication)であるかもしれない。一度このように潜在的な問題に対して警告が出されると、システムは、好ましくは、学習しているユーザの声紋情報を記録されたユーザの声紋情報に対して再確認することで、学習しているユーザが実際に認可されたユーザであるかどうかを決定する。学習しているユーザの能力の評価222を実行するために、システムは、授業計画の中でユーザの能力を追跡する。予想外に低い(高い)能力結果は、認可されたユーザが無認可のユーザにアクセスを許したことのしるしかもしれない。システムがこのように潜在的な問題に対して警告をうけた後は、システムは、好ましくは、ユーザの声紋情報を再確認することで、ユーザが実際に認可されたユーザであるかどうかを決定する。
【0024】
必要なユーザ認可確認が行われた後、システムは、学習しているユーザが、最初にボックス202で入手したユーザ名とパスワードと関連する予め認可されたユーザと同じ人であるかどうかについての結論を出す。ボックス224において、システムはユーザの身元確認についての決定をする。すなわち、システムは、ユーザが適正に許可されまたは認可されたユーザであるか否かを決定する。次に、システムは、継続ボックス226に示された、アクセスの続行と授業の継続について決定をする。もし、システムがなにかユーザの身元に疑いを持ったならば、学習しているユーザのコンピュータ画面にメッセージが現れ、好ましくは、進行中の授業はボックス228で直ちに停止する。もし、システムが継続が好ましいと決定したならば、処理はボックス206の授業提供に戻る。
(ユーザパスワード確認)
【0025】
上記のようにボックス202において、ユーザが最初にシステムを使用しようと試みたときに、ユーザ確認が実行される。図3は、ユーザ名とパスワードが確認される最初のユーザ確認処理の詳細を示す。先ず、ユーザは、パスワード情報を与えるよう訊ねられ、このパスワード情報は、言語訓練出版者が出版した教科書のユーザコピーに表示された、または、マイクまたは以下に説明するマイク装置のような限定されたアクセス入力装置を使用して提供される。例えば、以下のメッセージがユーザのコンピュータ画面に現れるかもしれない:「パスワードを入れてください。」。図3の流れ図302番のボックスにおいて、ユーザは、例えば教科書に見出すことができるかマイクまたは入力装置に貼付されたパスワードを入力する。それから、システムは、ボックス304の認可データベースでそのパスワードを探し、ボックス306でユーザが入力したパスワードをデータベースパスワードと対照して確認する。もしシステムがそのパスワードが存在しないと、判断ボックス308における否定的な結論として判断するならば、ユーザのコンピュータ画面に警告メッセージが現れる。例えば以下のメッセージが画面に現れるかもしれない:「あなたは、間違ったユーザパスワードを入力しました。我々に連絡してください。喜んであなたの手助けを手短にいたします。」。そして、システムは、ボックス310で授業の進行を直ちに停止する。
【0026】
もし、システムがユーザによって入力されたパスワードが存在すると確定すれば、ユーザは彼または彼女の名前を入れるように訊ねられる。例えば、以下のメッセージがユーザのコンピュータ画面に表示されるかもしれない:「あなたの名前を入れてください。」。ボックス312でユーザは彼または彼女の名前を入れる。システムは、ユーザ名を確認し、判断ボックス314で示されたように、そのユーザが新規ユーザであるかどうかを決定する。もし、そのユーザ名がデータベース中に見当たらなければ、そのユーザは新規ユーザであり、判断ボックス314での肯定的な結論を出し、ボックス316でそのユーザ名はパスワード認可データベースに加えられ、ボックス318で新規ユーザとして表示される。認可データベースは、好ましくは、名前、パスワード(例えば添付の教科書から)、ユーザ習熟パラメータ(授業レベル、能力評価)および声紋サンプルパラメータのような認可ユーザに関する情報を含む。この情報を後で使用することで、システムは、他のユーザが同じパスワードを使用するのを防止する。この段階で(ボックス318)、新規ユーザの名が始めて認可データベースに加えられたとき、すべてのユーザ習熟パラメータはレベルゼロに設定される。
【0027】
これにより、システムは、与えられたパスワードが適正なパスワードであることを照合し(ボックス308)、データベース中のユーザ名を照合(または入力)した(ボックス314)。システムは、判断ボックス320で示されるように、パスワードデータベース中のユーザを探すことで、ユーザ名がパスワードと適合するかを決定するために次の確認をする。もし、そのユーザが認可されたユーザでないとの判断ボックス320の否定的な結論であれば、システムはそのユーザが継続することを防止し、ボックス322で停止させる。例えば、以下のメッセージが画面に現れる:「あなたを確認することができません。我々に連絡してください。喜んであなたの手助けを手短にいたします。」。そして、システムは、授業計画の進行を直ちに停止する。
【0028】
もし、そのユーザ名がユーザパスワードと適合するとの、320番の判断ボックスの肯定的な結論であれば、システムは、流れ図324番のボックスのエラーカウントを初期化する。エラーカウントは、無認可ユーザのしるしである。エラーカウントで表わされる身元確認失敗の所定の回数の後、システムは、そのユーザを無認可ユーザとして認識し、すべての処理は停止する。システムは、326でパスワード認可データベースから授業レベルを検索し、ボックス328において、現行のユーザのためにこの検索されたレベルに授業レベルを設定する。このステップは、ユーザ確認処理を終了する。
(ユーザ声紋の構築)
【0029】
ユーザ確認の方法として、新規ユーザの声紋を構築する処理は図4に示される。この処理は、学習設備へのアクセスを望む身元確認されたユーザに対して声紋情報が存在しないとシステムが判断したときに実行される。図4の流れ図402番のボックスで表わされる最初のステップで、システムは声紋パラメータを初期化する。当業者は、ディジタル形式の音声情報が特によく知られたパラメータで表わされることを理解するだろう。ボックス402は、システムがそれらパラメータをゼロまたは他の初期状態に設定し、確認されたユーザに対応するパラメータを受け取る準備ができていることを示す。
【0030】
流れ図404番のボックスで表わされる次のステップで、システムは声紋情報を集める。もし、声紋情報がうまく記録されれば、処理はボックス406で終了する。もし、声紋情報がまだうまく集められていなければ、それはいまだパスワードデータベース中に存在しないことを意味し、ボックス404で、システムは、ユーザにユーザのコンピュータのマイクに語句を発声させることにより声紋情報を集める。例えば、ユーザは、ディスプレイ画面に現れる質問に答えるように求められてもよい。質問は、好ましくは、流れ図410番のボックスで示された、授業データベースから無作為に選択された語句である。マイク出力信号によって表わされる、ユーザの発声した応答は、流れ図412番のボックスでディジタル化され、ユーザのコンピュータに記録される。記録された発声された応答は、ボックス414で処理される。この処理は、ケプストラム(Cepstral)係数と言及されているような特殊なデータ形式でのディジタル化情報を表現し、発声ピッチの推定値を与えるよく知られた処理技術を含む。そのような処理は、例えば、文献「ローバストテキストの独立話者認識のための非線型判別特徴抽出(Nonlinear Discriminant Feature Extraction For Robust Text Independent Speaker Recognition)」Y. Koning, L. Heck, M. Weintraub および K. Sonmez (1988) による、会報 RLA2C-ESCA, 話者認識とその商業的および法医学的応用(Speaker Recognition and its Commercial and Forensic Applications) 72〜75頁、フランス、アビニョン、に記述されている。
【0031】
次に、流れ図416番のボックスで示されたように、システムは声紋パラメータを抽出し、そこで、システムがユーザ確認に使用する音声情報を定める。抽出されたパラメータは、声紋情報をより簡潔に表現することを可能にする。このステップは、好ましくは、学習設備へコンピュータネットワーク上で送らねばならないデータ量を最小化するために、ユーザのコンピュータによって実行される。最後に、ボックス418に示されているように、抽出された声紋情報は学習設備に与えられ、ボックス420に示されているように、学習サーバは認可データベースに声紋情報を記録する。
(音声情報確認)
【0032】
上記のように、音声認識技術は、授業過程の中で認可されたユーザの声紋を新しいユーザの記録と比較するために使用され、アクセス認可の結論を出す3つの方法の内の1つである。声紋比較は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。図5はその処理の詳細を示す。
【0033】
図5の流れ図502番のボックスで示される最初の声紋確認ステップでは、システムは語句の記録を処理する。その処理は、1つの可能な手法を紹介する上記参考文献から理解されるように、よく知られている。上記参考文献に記述された処理(「ローバストテキストの独立話者認識のための非線型判別特徴抽出(Nonlinear Discriminant Feature Extraction For Robust Text Independent Speaker Recognition)」)は、以下の処理を含む:
1. それぞれの発声フレームに対して、17のケプストラム係数とピッチの推定値を抽出する。
2. 過去4フレームを加え、将来4フレームを加えた現在のフレームの特徴を5層のMLPの、162次元ベクトルに入力し31の出力を作り出す。
3. 目標話者のためのGMMを訓練する。
次に、学習設備は、判断ボックス504に示されたように、処理された声紋情報と学習設備データベースに記録されたユーザ声紋情報とを比較する。もし、2つの情報が適合しないとの、判断ボックス504での否定的な結論であれば、ボックス506でエラーカウントに1つのエラーが加算される。エラーカウントは、以下に説明する他の学習設備の処理に使用される。比較ステップは声紋確認処理を完了する。
(ユーザ進捗追跡)
【0034】
他のユーザ認可確認およびアクセス認可結果生成(図2)の方法は、授業計画を通して認可されたユーザの進捗を追跡することである。システムは、学習しているユーザによってなされた授業レベルのいかなる変化も、無認可ユーザが製品を使用し、学習設備にアクセスしていることのしるしであることを認識する。システムの援助によるユーザ進捗の追跡は、使用中のユーザの声紋情報の再確認を開始することで、そのような無認可の使用を防止する。ユーザ進捗追跡は図6に示される。声紋比較処理(図5)とともに、ユーザ進捗追跡は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。
【0035】
最初のユーザ進捗追跡ステップでは、システムは、図6の流れ図602番のボックスに示される、学習設備認可データベースから学習計画における確認されているユーザの授業レベルを検索し、このレベルを、ボックス604で示されるように、確認されたユーザにより現在使用されている授業レベルと比較する。いくらかの授業計画の反復および復習または予習は予測されが、以前のユーザセッションの授業レベルと比較した、進行中の授業計画レベルの大きな不一致は、認可されたユーザ以外の者が認可されたユーザ名とパスワードにアクセスするに至ったことを示すかもしれない。このため、606番の判断ボックスでシステムは、現在の授業レベルが以前の授業レベルと所定の許容差よりも大きく異なるかを決定する。予測されるまたは許容される差は、典型的には、授業計画の中の授業の総数と授業計画の難易度の関数である。許容される差は、システムの授業計画の開発することに関係した人によって与えられねばならない。
【0036】
判断ボックス606で、もし、現在の授業レベルが、以前の通信セッションのレベルと比較して許容範囲の差の外にあるものでないとの、判断ボックスの否定的な結論であれば、ユーザ進捗追跡確認は完了する。もし、現在の授業レベルが、以前の授業レベルと比較して低過ぎるまたは高過ぎるならば、ボックス608でシステムは、ユーザ認可エラーカウントに1つのエラーを加算する。このとき、エラーカウントは、好ましくは、ボックス610で、図5に関連して上述した処理であるユーザ声紋確認を開始する。これはユーザ進捗追跡確認を完了する。
(ユーザ能力評価)
【0037】
他のユーザ認可確認およびアクセス認可結果生成(図2)の方法は、授業計画の中で学習しているユーザの能力を評価することである。システムは、認可されたユーザと比較して、学習しているユーザの能力に対する劇的な(すなわち、著しい)変化は、無認可ユーザが製品を使用しているしるしであるかもしれないことを認識する。システムの援助によるユーザ能力評価は、使用中に、ユーザの声紋情報の再確認を開始することにより、そのような無認可の使用を防止する。ユーザ進捗追跡は図7に示されている。声紋比較処理(図5)とともに、ユーザ能力評価は、学習しているユーザにその処理を気づかれずに、ユーザおよび授業進行のいずれの邪魔もすることなく、背景下で行われる。
【0038】
最初のユーザ能力評価ステップでは、システムは、流れ図702番のボックスで示されるように、認可データベースから身元確認されたユーザの能力データを検索し、流れ図のボックス704で示されるように、それを現在のユーザの能力と対照して確認する。システムは、能力が高過ぎることおよび低過ぎることを確認する。判断ボックス706で、システムは、ユーザによる低い能力を確認する。もし、現在学習しているユーザの能力が以前のユーザの能力と比較して低過ぎるという、判断ボックス710の肯定的結論ならば、ボックス708で1つのエラーがエラーカウントに加算され、ボックス710でユーザの声紋が再び確認される。
【0039】
エラーカウントの修正、およびそれに続く、学習しているユーザの能力が低過ぎない(判断ボックス706の否定的結論)というシステムの決定の後、システムは判断ボックス712でいずれかの能力が高過ぎることの確認処理をする。もし、現在学習しているユーザの能力レベルが以前のユーザレベルと比較して高過ぎると思われたならば、無認可ユーザによる使用の可能性を示す。それはまた、同じ認可されたユーザが彼または彼女の習熟を向上させたことのしるしであるかもしれない。このように、もしユーザの能力が高過ぎるという、判断ボックス712の肯定的な結論であれば、流れ図番号714で示されたようにユーザの声紋が再び確認される。
【0040】
ユーザ能力がユーザの正確な発音能力をも含むことができることは注記すべきである。例えば、日本人(ネイティブでないアメリカ人)ユーザは、アメリカ英語の文字「R」の音を正確に発音するように訓練されるかもしれない。最初は、そのユーザの発音はアメリカ英語の「L」の音として認識されたであろう、そして、徹底的な訓練の後にそれは正しいアメリカ英語の「R」の音のように聞こえることができる。そのような習熟(アメリカ英語の「R」の正しい発音)は、上述のユーザ能力の一例である。
(認可決定)
【0041】
システムがユーザ認可の無作為確認を行い、アクセス認可パラメータを受け取った(図2)後、システムは、アクセス認可パラメータに基づき授業を継続するか否かを決定する。上述のシステムで、アクセス認可パラメータは、学習サーバにより保存されたエラーカウントを含む。アクセス認可パラメータは図8に示される。システムは判断ボックス802でエラーカウントを確認する。もし、エラーカウントが所定の限度の数よりも少ない声紋確認の失敗回数を示すという、判断ボックス802の肯定的な結論ならば、システムは、現在のユーザが認可されたユーザであると決定し、ボックス804で授業計画を継続させる。例えば、エラーカウントの最大数は3回のエラーでもよい。もし、エラーカウントが許容される最大の数より少なくないという、判断ボックス802の否定的な結論であれば、システムは、現在のユーザを認可されたユーザではないと決定し、ボックス806で授業の進行を停止する。いずれの場合でも、システムは継続フラグをYESの値またはNOの値にセットし、それにより、授業の進行を管理する。もし、失敗した声紋確認の回数にもかかわらず、システムが特定のユーザを無認可であると確固として決めることができなければ、システムは、授業の継続を可能とする。このように、そのような場合、継続フラグはYESの値に更新される。
(コンピュータの構造)
【0042】
図1に関連して上述したように、学習サーバ110および話者認識プロセッサ112の機能性は、並列コンピュータに分散されてもよいし、または1台のコンピュータの中で実行されてもよい。コンピュータ設備の処理を実行するコンピュータ、ユーザのパーソナルコンピュータの処理を実行するコンピュータまたはシステムの他のコンピュータ装置は、ハンドヘルドコンピュータ装置、情報携帯端末(PDA)およびここに記述する機能性を実現するに適したあらゆる従来のコンピュータのような、種々の処理装置を含むことができる。
【0043】
図9は、PCまたは図1に示されるサーバコンピュータ装置を含むであろう、典型的なコンピュータ装置900のブロック図である。それぞれのコンピュータ900は、多くの販売者による特定用途用集積回路(ASIC)または米国カリフォルニア州サンタクララのインテル社から入手可能なペンティアム級マイクロプロセッサおよび関連集積回路チップのような中央演算装置(CPU)902の制御の下で動作する。命令とデータはユーザコントロールパネル、遠隔操作装置、またはキーボードとマウスの組合せ904によって入力でき、入力と出力はディスプレイ906で見ることができる。ディスプレイは、典型的にはビデオモニタまたはフラットパネルディスプレイ装置である。ユーザのPC(図1)はユーザからの音声入力を受け取ることができる音声可用装置であり、それゆえ、ユーザのPCは、キーボードとマウスに加えて、周辺装置904の一部としてマイクおよびサウンドカードを含む。
【0044】
コンピュータ装置900は、パーソナルコンピュータを含み、またはクライアント機の場合、コンピュータ装置は、ウェブ機器または他のネットワーク通信に適したもの、音声可用化装置を含む。パーソナルコンピュータの場合、装置900は、好ましくは、固定ハードディスクドライブ(HDD)のような直接アクセス記憶装置(DASD)908である。メモリ910は、典型的には、揮発性半導体メモリ(RAM)である。もし、コンピュータ装置900がパーソナルコンピュータであるならば、好ましくは、プログラム製品記憶装置914を受け入れ、それからデータを読むことができる(随意にデータを書き込むことができる)プログラム製品読取装置912を含む。プログラム製品読取装置は、例えば、ディスクドライブ、およびプログラム製品記憶装置を含むことができる。プログラム製品記憶装置は、フロッピーディスク、光学CD−ROMディスク、CD−Rディスク、CD−RWディスク、DVDディスクまたは同様のものなどの交換可能な記憶媒体を含むことができる。データ記憶のための半導体メモリ装置および対応する読み出し装置もまた使用可能である。コンピュータ装置900は、ネットワークとコンピュータ装置との間の回線920を通しての通信を可能にする、ネットワークインターフェイス918を通してネットワーク(インターネットのような)の上の他の接続されたコンピュータと交信することができる。
【0045】
CPU902は、コンピュータ900のメモリ910に一時的に記憶されたプログラミングステップのコントロールの下で動作する。プログラミングステップが実行されたとき、関連システム構成要素はその機能を果たす。このように、プログラミングステップは、図1に示されたシステムの機能性を実行する。プログラミングステップは、プログラム製品914を通して、または、ネットワーク回線920を通して、DASD908から受け取ることができ、もしくはコンピュータ装置の製造工程の一部としてASISに組み込むことができる。もしコンピュータ装置が記憶ドライブ912を含んでいるならば、プログラム製品を受け入れ、そこに記録されたプログラミングステップを読み出し、CPU902により実行されるように、メモリ910にプログラミングステップを転送することができる。上記のように、プログラム製品記憶装置は、コンピュータが読むことができる指示が記録された、多様で交換可能な媒体のいずれの1つを含んでもよく、その媒体は、磁気フロッピーディスク、CD−ROM、およびDVD記憶ディスクを含む。他の適当なプログラム製品記憶装置は、磁気テープおよび半導体メモリチップを含むことができる。このように、本発明に従って動作するのに必要な処理ステップは、プログラム製品上に具体化することができる。
【0046】
代案として、プログラムステップは、ネットワークから操作メモリ910に受け入れることが可能である。ネットワーク方式において、コンピュータは、ネットワーク回線920を通して、これ以上の説明がなくても当業者なら理解するよく知られた方法で確立されたネットワーク通信により、ネットワークインターフェイス918を通してメモリ910に、プログラムステップを含むデータを受け取る。そして、プログラムステップは、CPU902により実行され、システムの処理を実行する。
【0047】
上記のように、ユーザのパーソナルコンピュータ900は、コンピュータ設備108の機能性(図1)を与えるであろう他のコンピュータ装置と通信できる。
(コードジェネレータによる付加的なアクセス認可)
【0048】
上述ユーザ対話の分析に加えて、本発明に沿って構成された語学教育システムの好ましい実施形態は、認可動作を補足し、コンピュータ設備108(図1)から取得された授業モジュールと一緒に取引され、販売される入力装置を利用する。図10は、そのような入力装置を有するユーザコンピュータの模式図である。好ましい実施例において、ユーザは、ユーザ入力装置がユーザコンピュータに接続されない限り、語学教育プログラムに参加することができない。
【0049】
ユーザコンピュータ1002は、従来のパーソナルコンピュータ(PC)について図9に示したものと同様の構成である。ユーザPC1002は、マイク装置のようなユーザ入力装置のための、PCに付属するように示されているアナログ入力ポート1004を含む。接続電線1008はマイク装置をPCに接続し、マイク変換機1007(音の刺激に対応する電気信号を生成する)とPC1002との間の通信の通信路を提供する。赤外線(IR)ポート、無線周波数(ワイヤレス)通信、および、ユニバーサル・シリアル・バス(USB)接続のような、マイクをPCに接続する他の手段も使用できる。
【0050】
スイッチ1010は、アナログ入力ポート1004へのコード出力信号を生成するコードジェネレータ1012の作動トリガを与えるように設けられている。もし、スイッチ1010が閉じていなければ、電力はコードジェネレータに供給されず、マイク変換器出力がアナログ入力ポートに与えられる。バッテリ1014は、コードジェネレータ1012に、電源供給するために電気エネルギー源を提供し、該コードジェネレータは、PC1002のアナログ入力ポート1004に与えられる所定のシーケンスのトーンを生成する。コードジェネレータは、例えば、300Hz,400H,500Hz,・・・,1200Hzのような対応するコード周波数が設定された、コード符号0,1,2,・・・,9が表示されるシングルトーンジェネレータから成ることができ、または、コードジェネレータは、モデム送信機または他のマルチ・トーンのジェネレータから成ることができる。PC1002は、アナログポート1004で受信しているトーンを認識し、生成されている適正コード(コード符号に相応する)を決定する処理を提供されることができる。そのような処理は当業者には明らかなものである。
【0051】
スイッチ1010は、好ましくは、PC1002で受け取られるとともに、ユーザが確認するためにPCのディスプレイに表示されるメッセージの求めによって、ユーザが作動させるスイッチである。スイッチ1010を作動させることによって、ユーザは、出力トーンの所定のシーケンスをコードジェネレータ1012に生成させる。これらのトーンは、PC1002に受信され、それらがコンピュータ設備に通信される前に、ユーザコンピュータによって分析され、ディジタルコードに変換される。もし、送信されたコードが既知のコードに一致するか、または有効であれば、ユーザは認可されたユーザであると決定される。もし、生成されたトーンが、コンピュータ設備に知られた所定のコードに一致しなければ、ユーザは認可されていない。そのとき、語学教育プログラムへのアクセスは中止され得る。アクセスコントロールに従属するマイク装置1006は、上記の授業モジュールとは独立して取引、販売され、または、マイク装置は、次に説明するように、管理された授業モジュールへのアクセスと関連して取引、販売されることができる。
(限定アクセス販売)
【0052】
システムの好ましい実施形態において、図10に示されるマイク装置のような入力装置は、語学教育プログラムへのアクセス許可と結びついたユニットとしてユーザに販売される。ユーザがマイク装置を購入するとき、ユーザは、語学教育プログラムの定められた数のデータモジュールまたは構成要素にアクセスすることを保証される。例えば、語学教育プログラムは、20のモジュールを含んでいる。マイク装置を購入するとユーザには、例えば2つのモジュールといったある数のモジュールを選択する権利が与えられる。もし、ユーザが所定の数より多くの利用を望むならば、ユーザは追加の金額を支払わねばならない。
【0053】
図10のジェネレータが装備されたマイク装置を販売することの代案として、印刷されたコードを同梱して従来のマイクを販売できる。購入後、ユーザはユーザコンピュータのキーボードを通じて印刷されたコードを入力するよう要求され、入力されたコードは確認処理を受ける。ユーザはコードによる最初の登録の上に、再び限定アクセス権を許可され、所定の数の語学教育モジュールが選択される。
【0054】
好ましい実施形態において、語学教育プログラムは、インターネットのようなネットワーク上で利用可能である。図11はユーザコンピュータのディスプレイで見られるウェブページ1102の実例である。ウェブページは、ビジネス用語1104、医療用語1106、観光用語1108およびそのようなものに関する教育を含む択一語彙モジュールの選択のような、選択メニューがユーザに提示されることを示している。ユーザは、例えばディスプレイのマウスカーソルを使用して1104、1106、1108の選択を「クリック」する。このように、マイク装置を購入したユーザは、コンピュータにマイクを接続する。そして、ユーザは、語学教育プロバイダのウェブサイトに行く。ログインと登録手続きの後、ユーザは、図11に示されたウェブページを提示され、語学教育プロバイダが設定した所定の限度までの選択対象の選択を行う。ユーザは、ユーザの母国語および教育の対象言語をもまた選択できる。
【0055】
最初のユーザによるモジュールの選択のためにユーザにアクセスを認める前に、ウェブサイトは、上述のように、マイク装置のスイッチを入れるようにユーザに指示する。生成されたコードは、ユーザのリモートコンピュータに通信回線を通じて、マイク装置のコードジェネレータから送られ、リモートコンピュータからその情報が語学教育ウェブサイトに送られる。上述のように、もし、生成されたコードが適正であれば、ユーザは選択したモジュールにアクセスを許可される。
【0056】
その後は、もし、ユーザが追加の語学教育モジュールを使用したいと望むならば、ユーザはモジュールを要求し、支払いを認可しなければならない。ウェブサイトの実施形態では、ユーザは、語学教育プロバイダのウェブサイトで追加モジュールについての情報を見ることができ、追加モジュールへのアクセスを要求でき、そして、クレジットカードの課金認可のような支払い認可を送ることができる。この情報は、要求されたモジュールへのアクセスを許可する語学教育プロバイダによって受信され、処理される。上記のように、モジュールは対話形式のオンライン方式で提供され、または、モジュールはユーザコンピュータのネットワークダウンロードによって受け取られる。ユーザは、マイク装置により生成されたコードにより身元確認され、認可されたモジュールで継続するために追加モジュールのために支払ったユーザに、引き続いてのセッションの間、使用許可を与える。
【0057】
このように、本発明は、ネットワーク資源へのアクセスを管理する技術を提供し、そこでは、ネットワーク設備にアクセスする前に、クライアントノード上で身元確認されたユーザは、ネットワークユーザパスワードデータベースに加入しているものとして照合される。そして、システムはユーザにアクセスを享受することを許可し、そして、アクセスの後の所定の時間、身元確認されたユーザの声紋データがネットワーク声紋データベースに入力されるのを待ち、または、それが入力されなければ、所定の語句のユーザの発声の結果として、身元確認されたユーザからの声紋データを受け取る。システムは、身元確認されたユーザの少なくとも1つのアクセスパラメータ認可結果から、コンピュータネットワーク設備へのアクセス継続を許可するか否かを決定する。いかなる無認可ユーザも、代金を支払うことで認可されたユーザになる機会を、都合よく与えられる。このように、ネットワーク設備へのアクセスは管理され、無認可ユーザはもしかすると認可されたユーザに変わるかもしれない。
【0058】
本発明は、本発明の理解を導き出せるように、現在好ましい実施形態に関して上に説明してきた。しかしながら、ネットワークアクセスコントロールシステムのためには、ここに明確に説明していないが、本発明が適用可能な多くの形態が存在する。それゆえ、本発明は、ここに記述された特定の実施形態に限定するものと見てはならず、むしろ、ネットワークアクセス管理一般に広く適用できるものと理解すべきである。すべての実施形態、様々なまたは均等の組合せおよび実行は、添付した請求の範囲の範囲内にあり、それゆえ本発明の範囲の中にあると考えられる。
【図面の簡単な説明】
【0059】
【図1】本発明に従って構築したネットワークコンピュータシステムのブロック図である。
【図2】本発明に従ってアクセスコントロールを提供する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図3】図2に示すユーザ身元確認処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図4】ユーザ声紋処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図5】ユーザ声紋照合処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図6】ユーザ追跡処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図7】ユーザ能力評価処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図8】アクセス継続判断処理を実行する図1に示したコンピュータにより実行される処理を示す流れ図である。
【図9】本発明に従って構築した図1に示したシステムのコンピュータのブロック図である。
【図10】ユーザ入力装置が付属したユーザのコンピュータの模式図である。
【図11】ユーザの選択したデータモジュールを示す、ユーザのコンピュータのディスプレイに表示されるウェブページの実例表示である。
【符号の説明】
【0060】
102…ユーザ
104…ユーザコンピュータ
106…インターネット
108…コンピュータ設備
110…学習サーバ
112…話者認識プロセッサ
114…認可データベース
120…授業データベース
126…マイク
128…音声
【特許請求の範囲】
【請求項1】
語学学習コンピュータ設備からユーザに対してネットワークのコンピュータノードのユーザコンピュータを通して与えられた語学学習要求に応じて、ユーザが前記ユーザコンピュータに接続されたマイク装置から入力する音声入力を含む語学学習応答を提出するユーザ対話を、認可されたユーザに対して許可するために前記コンピュータ設備へのコンピュータアクセスを管理する方法であって、
前記コンピュータ設備において、
確認コードが、前記マイク装置から前記ユーザコンピュータに提供されて、前記ユーザコンピュータから前記コンピュータ設備に前記ネットワークを通して転送されたとき、転送された前記確認コードが既知のコードと一致する場合にユーザが認可されていると決定し、ユーザが認可されたユーザであると決定されたときだけ、前記ユーザに前記語学学習応答の提出を許可する方法。
【請求項2】
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられている前記ユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡の実行と、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止することとをさらに含む請求項1に記載の方法。
【請求項3】
前記コンピュータ設備に設けた話者認識プロセッサによって、現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、現在前記語学学習要求が提供されている前記ユーザが認可されていない可能性があると認識するユーザ進捗追跡の実行をさらに含む請求項1に記載の方法。
【請求項4】
前記コンピュータ設備に設けた話者認識プロセッサによって、現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡の実行と、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止することとをさらに含む請求項1に記載の方法。
【請求項5】
前記マイク装置は、前記ユーザコンピュータとUSB接続を通して通信する請求項1から4のいずれかに記載の方法。
【請求項6】
前記確認コードは、前記マイク装置のコードジェネレータによって生成される請求項1から5のいずれかに記載の方法。
【請求項7】
前記音声入力から生成したユーザの声紋を、前記コンピュータ設備に記憶した前記ユーザの声紋と比較することで、前記ユーザが認可されていることを確認することをさらに含む請求項1から6のいずれかに記載の方法。
【請求項8】
前記ユーザ対話の間、前記ユーザの声紋の比較を定期的に行う請求項7に記載の方法。
【請求項9】
ネットワークを通してコンピュータ設備にアクセスするユーザコンピュータとともに使用するマイク装置であって、
前記ユーザの音声入力を電気信号に変換し、前記電気信号を前記ユーザコンピュータに提供するマイク変換器と、
予め定められた確認コードを生成し、前記ユーザコンピュータが、前記マイク装置の認証およびユーザ認可のために前記確認コードを前記コンピュータ設備に転送し、前記コンピュータ設備にアクセスするように、前記確認コードを前記ユーザコンピュータに提供するコードジェネレータとを含むマイク装置。
【請求項10】
前記コードジェネレータは、モデム伝送器を含む請求項9に記載のマイク装置。
【請求項11】
前記マイク装置は、前記確認コードの生成を開始させるユーザスイッチを含む請求項9または10に記載のマイク装置。
【請求項12】
前記コンピュータ設備が、
前記マイク装置から所定の確認コードを受信したとき、伝送された前記確認コードが既知のコードである場合だけ、前記ユーザが認可されたユーザであると決定し、
前記ユーザに、アクセスを許可し、
前記ユーザが、前記コンピュータ設備によって語学学習設備が前記ユーザコンピュータを通して前記ユーザに提供した語学学習要求に応じて、前記マイク装置を通して音声入力を含む語学学習応答を提出するユーザ対話を許可し、
前記語学学習応答を含む前記ユーザの音声入力を受け取る請求項9から11のいずれかに記載のマイク装置。
【請求項13】
前記コンピュータ設備が、
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較し、
これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、現在前記語学学習要求が与えられているユーザが認可されていない可能性があると認識するユーザ進捗追跡を実行する請求項9から12のいずれかに記載のマイク装置。
【請求項14】
前記コンピュータ設備が、
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられている前記ユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較し、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡を実行し、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止する請求項9から12のいずれかに記載のマイク装置。
【請求項15】
ネットワークのサーバノードにおけるコンピュータ装置であって、語学学習コンピュータ設備からユーザに対してネットワークのコンピュータノードのユーザコンピュータを通して与えられた語学学習要求に応じて、ユーザが前記ユーザコンピュータに接続されたマイク装置を通して音声入力を含む語学学習応答を提出するユーザ対話を許可するために前記コンピュータ設備へのコンピュータアクセスを管理するコンピュータ装置であって、
前記ユーザコンピュータとの前記ネットワークを通しての通信を可能にするネットワーク通信インターフェイス、
前記コンピュータ設備へのアクセスが認可されていることを示す確認コードを記憶する認可データベース、および、
確認コードが、前記マイク装置から前記ユーザコンピュータに提供され、前記ユーザコンピュータから転送され、前記ネットワークを通して前記コンピュータ設備に受け取られ、前認可データベースに記憶されたコードと一致すると確認されたときのみ、前記ユーザ対話を許可する話者認識プロセッサを含むコンピュータ装置。
【請求項16】
前記マイク装置は、前記ユーザコンピュータとUSB接続を通して通信する請求項15に記載のコンピュータ装置。
【請求項17】
前記確認コードは、前記マイク装置のコードジェネレータによって生成される請求項15または16に記載のコンピュータ装置。
【請求項18】
前記話者認識プロセッサは、前記音声入力からユーザの声紋を生成し、前記コンピュータ設備に記憶した前記ユーザの声紋と比較することで、前記ユーザが認可されていることを確認する請求項15から17のいずれかに記載のコンピュータ装置。
【請求項19】
前記ユーザの声紋の比較は、前記ユーザ対話の間、定期的に実行される請求項18に記載のコンピュータ装置。
【請求項1】
語学学習コンピュータ設備からユーザに対してネットワークのコンピュータノードのユーザコンピュータを通して与えられた語学学習要求に応じて、ユーザが前記ユーザコンピュータに接続されたマイク装置から入力する音声入力を含む語学学習応答を提出するユーザ対話を、認可されたユーザに対して許可するために前記コンピュータ設備へのコンピュータアクセスを管理する方法であって、
前記コンピュータ設備において、
確認コードが、前記マイク装置から前記ユーザコンピュータに提供されて、前記ユーザコンピュータから前記コンピュータ設備に前記ネットワークを通して転送されたとき、転送された前記確認コードが既知のコードと一致する場合にユーザが認可されていると決定し、ユーザが認可されたユーザであると決定されたときだけ、前記ユーザに前記語学学習応答の提出を許可する方法。
【請求項2】
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられている前記ユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡の実行と、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止することとをさらに含む請求項1に記載の方法。
【請求項3】
前記コンピュータ設備に設けた話者認識プロセッサによって、現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、現在前記語学学習要求が提供されている前記ユーザが認可されていない可能性があると認識するユーザ進捗追跡の実行をさらに含む請求項1に記載の方法。
【請求項4】
前記コンピュータ設備に設けた話者認識プロセッサによって、現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較して、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡の実行と、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止することとをさらに含む請求項1に記載の方法。
【請求項5】
前記マイク装置は、前記ユーザコンピュータとUSB接続を通して通信する請求項1から4のいずれかに記載の方法。
【請求項6】
前記確認コードは、前記マイク装置のコードジェネレータによって生成される請求項1から5のいずれかに記載の方法。
【請求項7】
前記音声入力から生成したユーザの声紋を、前記コンピュータ設備に記憶した前記ユーザの声紋と比較することで、前記ユーザが認可されていることを確認することをさらに含む請求項1から6のいずれかに記載の方法。
【請求項8】
前記ユーザ対話の間、前記ユーザの声紋の比較を定期的に行う請求項7に記載の方法。
【請求項9】
ネットワークを通してコンピュータ設備にアクセスするユーザコンピュータとともに使用するマイク装置であって、
前記ユーザの音声入力を電気信号に変換し、前記電気信号を前記ユーザコンピュータに提供するマイク変換器と、
予め定められた確認コードを生成し、前記ユーザコンピュータが、前記マイク装置の認証およびユーザ認可のために前記確認コードを前記コンピュータ設備に転送し、前記コンピュータ設備にアクセスするように、前記確認コードを前記ユーザコンピュータに提供するコードジェネレータとを含むマイク装置。
【請求項10】
前記コードジェネレータは、モデム伝送器を含む請求項9に記載のマイク装置。
【請求項11】
前記マイク装置は、前記確認コードの生成を開始させるユーザスイッチを含む請求項9または10に記載のマイク装置。
【請求項12】
前記コンピュータ設備が、
前記マイク装置から所定の確認コードを受信したとき、伝送された前記確認コードが既知のコードである場合だけ、前記ユーザが認可されたユーザであると決定し、
前記ユーザに、アクセスを許可し、
前記ユーザが、前記コンピュータ設備によって語学学習設備が前記ユーザコンピュータを通して前記ユーザに提供した語学学習要求に応じて、前記マイク装置を通して音声入力を含む語学学習応答を提出するユーザ対話を許可し、
前記語学学習応答を含む前記ユーザの音声入力を受け取る請求項9から11のいずれかに記載のマイク装置。
【請求項13】
前記コンピュータ設備が、
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられているユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較し、
これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、現在前記語学学習要求が与えられているユーザが認可されていない可能性があると認識するユーザ進捗追跡を実行する請求項9から12のいずれかに記載のマイク装置。
【請求項14】
前記コンピュータ設備が、
現在ユーザに提供している前記語学学習要求の授業レベルと、現在前記語学学習要求が与えられている前記ユーザに対して以前に提供した前記語学学習要求の授業レベルとを比較し、これらの前記語学学習要求の授業レベルの差が所定の許容範囲の外にあるときは、エラーカウントに1つのエラーを加算するユーザ進捗追跡を実行し、
前記エラーカウントが予め定めた最大値以上であれば、前記ユーザ対話を停止する請求項9から12のいずれかに記載のマイク装置。
【請求項15】
ネットワークのサーバノードにおけるコンピュータ装置であって、語学学習コンピュータ設備からユーザに対してネットワークのコンピュータノードのユーザコンピュータを通して与えられた語学学習要求に応じて、ユーザが前記ユーザコンピュータに接続されたマイク装置を通して音声入力を含む語学学習応答を提出するユーザ対話を許可するために前記コンピュータ設備へのコンピュータアクセスを管理するコンピュータ装置であって、
前記ユーザコンピュータとの前記ネットワークを通しての通信を可能にするネットワーク通信インターフェイス、
前記コンピュータ設備へのアクセスが認可されていることを示す確認コードを記憶する認可データベース、および、
確認コードが、前記マイク装置から前記ユーザコンピュータに提供され、前記ユーザコンピュータから転送され、前記ネットワークを通して前記コンピュータ設備に受け取られ、前認可データベースに記憶されたコードと一致すると確認されたときのみ、前記ユーザ対話を許可する話者認識プロセッサを含むコンピュータ装置。
【請求項16】
前記マイク装置は、前記ユーザコンピュータとUSB接続を通して通信する請求項15に記載のコンピュータ装置。
【請求項17】
前記確認コードは、前記マイク装置のコードジェネレータによって生成される請求項15または16に記載のコンピュータ装置。
【請求項18】
前記話者認識プロセッサは、前記音声入力からユーザの声紋を生成し、前記コンピュータ設備に記憶した前記ユーザの声紋と比較することで、前記ユーザが認可されていることを確認する請求項15から17のいずれかに記載のコンピュータ装置。
【請求項19】
前記ユーザの声紋の比較は、前記ユーザ対話の間、定期的に実行される請求項18に記載のコンピュータ装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2009−80816(P2009−80816A)
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願番号】特願2008−270691(P2008−270691)
【出願日】平成20年10月21日(2008.10.21)
【分割の表示】特願2002−551819(P2002−551819)の分割
【原出願日】平成13年12月18日(2001.12.18)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(507350989)バーリントン・イングリッシュ・リミテッド (1)
【氏名又は名称原語表記】Burlington English Ltd.
【Fターム(参考)】
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願日】平成20年10月21日(2008.10.21)
【分割の表示】特願2002−551819(P2002−551819)の分割
【原出願日】平成13年12月18日(2001.12.18)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(507350989)バーリントン・イングリッシュ・リミテッド (1)
【氏名又は名称原語表記】Burlington English Ltd.
【Fターム(参考)】
[ Back to top ]