教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置
【課題】高精度な識別器を生成するための良好な教師データを作成する。
【解決手段】データ読み込み部130はデータを読み込み、教師データ作成部112及びGUI制御部116を介して出力装置150に出力する。ユーザはクラス設定部120を用いて、データに対する第1のクラスを入力する。推薦クラス生成部114は、第1のクラスに対して、類似/共起/関連データベースとユーザデータベースとに基づいて第2のクラスを生成する。第2のクラスは、GUI制御部116を介して出力装置150に出力される。ユーザは、入力装置160から第2のクラスに対する評価を入力する。ユーザデータベース更新部118は、この評価を取得し、それに基づいてユーザデータベース144を更新する。教師データ作成部112は、この評価を考慮した第2のクラスと、第1のクラスとを読み込んだデータと関連付けて、教師データを作成する。
【解決手段】データ読み込み部130はデータを読み込み、教師データ作成部112及びGUI制御部116を介して出力装置150に出力する。ユーザはクラス設定部120を用いて、データに対する第1のクラスを入力する。推薦クラス生成部114は、第1のクラスに対して、類似/共起/関連データベースとユーザデータベースとに基づいて第2のクラスを生成する。第2のクラスは、GUI制御部116を介して出力装置150に出力される。ユーザは、入力装置160から第2のクラスに対する評価を入力する。ユーザデータベース更新部118は、この評価を取得し、それに基づいてユーザデータベース144を更新する。教師データ作成部112は、この評価を考慮した第2のクラスと、第1のクラスとを読み込んだデータと関連付けて、教師データを作成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置に関する。
【背景技術】
【0002】
近年、統計的機械学習によるパターン認識技術に関する提案が多数なされている。このパターン認識技術では、大量の教師データに基づいて学習を実施し、認識処理を行う識別器を構成する。良好な識別器を構成するためには、学習に用いる良好な教師データが必要である。教師データは、例えば、画像等のデータとそのデータに対して認識結果として出力されるべきであるクラスとを組み合わせたものである。一般に、このような教師データは、ユーザがデータに対して適すると考えられるクラスを設定することにより生成する。しかしながら、大量の教師データを作成する際に、ユーザが各データに対するクラスを適切に設定することには多大な労力を伴う。
【0003】
そこで、例えば特許文献1には、認識システムのための教師データを作成する方法の一例が開示されている。特許文献1には、教師データに適合するクラスを追加し、その教師データの精度を向上させる技術について開示されている。特許文献1に係る技術では、まず、教師データベースから教師データを取得し、次に、取得した教師データとともに出現する用語の組合せを取得する。取得した用語の組合せにおいて、教師データの出現部分に任意の置き換え可能な用語が入るとみなした場合に得られるパターンを抽出する。抽出したパターンの置き換え可能な部分に入る用語であるパターン対応用語を、コーパスの中から取得する。その後、取得したパターン対応用語が固有の表現に適合するか否かを判定し、適合すると判定されたパターン対応用語を取得する。この適合するパターン対応用語を教師データベースに追加することで、教師データの精度を向上させる。
【0004】
また、特許文献2には、画像処理装置において、画像に関連するキーワードを選択し、そのキーワードに基づいて、文章を作成する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−198189号公報
【特許文献2】特開2009−032154号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に係る技術では、教師データに対して追加されたクラスに対応するパターン対応用語を、コーパスの中から取得する。そして、そのパターン対応用語に対する判定に基づいて選択されたパターン対応用語を、教師データに追加する。したがって、このパターン対応用語の追加方法では、システムによって画一的に選択された用語の追加しか行うことができない。その結果、それら教師データを用いた学習では、識別器の性能の向上に限界がある。また、特許文献2に係る技術では、認識結果に関連する文章を提示するのみであり、それを教師データとして用いることはない。したがって、その文章によって識別器の性能が向上することを期待できない。
【0007】
そこで本発明は、高精度な識別器を生成するための良好な教師データを作成できる教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
前記目的を果たすため、本発明の教師データの作成方法の一態様は、認識システムの学習に用いる教師データの作成方法であって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、前記第2のクラスを前記ユーザに提示する第3のステップと、前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、前記評価に基づいて、前記重み係数を更新する第6のステップと、を含むことを特徴とする。
【0009】
前記目的を果たすため、本発明の教師データの作成のためのプログラムの一態様は、認識システムの学習に用いる教師データの作成のためのプログラムであって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、前記第2のクラスを前記ユーザに提示する第3のステップと、前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、前記評価に基づいて、前記重み係数を更新する第6のステップと、をコンピュータに発揮させることを特徴とする。
【0010】
前記目的を果たすため、本発明の教師データ作成装置の一態様は、認識システムの学習に用いる教師データを作成するための教師データ作成装置であって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部と、前記第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、前記第2のクラスに対する重み係数を含む第2のデータベースと、前記第1のデータベースと前記第2のデータベースとに基づいて、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの前記第2のクラスを生成する推薦クラス生成部と、前記第2のクラスを前記ユーザに提示する出力部と、前記第2のクラスに対する前記ユーザの評価を受け取る入力部と、前記評価に基づいて、前記重み係数を更新するデータベース更新部と、前記評価に基づいて変更した前記第2のクラスと、前記基礎データと、前記第1のクラスとに基づいて教師データを作成する教師データ作成部と、を具備することを特徴とする。
【発明の効果】
【0011】
本発明によれば、第1のクラスに類似、共起又は関連し、ユーザによる評価を受けた第2のクラスと、第1のクラスとに基づいて教師データが作成されるので、高精度な識別器を生成するための良好な教師データを作成できる教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置を提供できる。
【図面の簡単な説明】
【0012】
【図1】第1の実施形態に係る教師データ作成装置の構成の一例を示すブロック図。
【図2】第1の実施形態に係る教師データ作成装置による処理の一例を示すフローチャート。
【図3】第1の実施形態に係る教師データの作成の例を説明するための図。
【図4】第1の実施形態に係る類似/共起/関連データベースに含まれる類似度表の一例を示す図。
【図5】第1の実施形態に係るユーザデータベースに含まれる重み付け表の一例を示す図。
【図6】第1の実施形態に係る作成されるユーザ類似度表の一例を示す図。
【図7】第1の実施形態に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図8】第1の実施形態に係る更新されたユーザデータベースに含まれる重み付け表の一例を示す図。
【図9】第1の実施形態の第1の変形例に係るユーザデータベースに含まれる重み付け表の一例を示す図。
【図10】第1の実施形態の第1の変形例に係る作成されるユーザ類似度表の一例を示す図。
【図11】第1の実施形態の第1の変形例に係る更新されたユーザデータベースに含まれる重み付け表の一例を示す図。
【図12】第1の実施形態の第2の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図13】第1の実施形態の第3の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図14】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図15】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図16】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図17】第1の実施形態の第5の変形例に係る教師データの作成の例を説明するための図。
【図18】第1の実施形態の第6の変形例に係る教師データの作成の例を説明するための図。
【図19】第3の実施形態に係る作成されるユーザ類似度表の一例を示す図。
【図20】第4の実施形態に係る類似/共起/関連データベースに含まれる類似度表の一例を示す図。
【発明を実施するための形態】
【0013】
[第1の実施形態]
本発明の第1の実施形態について図面を参照して説明する。図1に本実施形態に係る教師データ作成装置100の構成を示す。教師データ作成装置100は、例えば画像認識等を行う識別器の学習のための教師データを作成する装置である。
【0014】
教師データ作成装置100は、演算装置110と、クラス設定部120と、データ読み込み部130と、記憶装置140と、出力装置150と、入力装置160とを備える。演算装置110は、教師データ作成部112と、推薦クラス生成部114と、GUI制御部116と、ユーザデータベース更新部118とを有する。演算装置110は、例えプログラムを実行するコンピュータであり、パーソナルコンピュータ等でもよいし、専用の計算機でもよいし、ネットワークに接続された計算機でもよい。記憶装置140は、類似/共起/関連データベース142と、ユーザデータベース144とを記憶している。データ読み込み部130には、データ入力部132とデータベース記憶装置134とが接続されている。
【0015】
データ読み込み部130は、データ入力部132又はデータベース記憶装置134から基礎データを読み込む。この基礎データは、画像データ、動画データ、音声データ、文字データ等種々のデータのうち何れでもよい。本実施形態の説明では、画像データを例として説明する。データ読み込み部130は、読み込んだ基礎データを教師データ作成部112に出力する。ここで、データ入力部132は、基礎データを記憶する手段である。例えば基礎データが画像データであれば、データ入力部132は、例えば画像を記憶した記憶媒体やデジタルカメラ等である。また、データベース記憶装置134は、例えば画像等のデータベースを記憶した記憶媒体であり、これは例えばネットワークサーバであってもよい。
【0016】
出力装置150は、例えばディスプレイである。出力装置150は、ユーザに情報を伝達するために各種情報を表示する。クラス設定部120は、例えばキーボードやタッチパネルである。クラス設定部120は、ユーザが設定するキーワードや意味等である第1のクラスを受け取る。ここで、ユーザは、後述するようにデータ読み込み部130によって読み込まれて教師データ作成部112及びGUI制御部116を介して出力装置150に表示された基礎データを確認する。ユーザは、その基礎データにふさわしい第1のクラスを、クラス設定部120を用いて入力する。基礎データが画像データである場合、ユーザは出力装置150に表示された画像を確認し、その画像と関連するキーワード等である第1のクラスを入力する。クラス設定部120は、入力された第1のクラスを推薦クラス生成部114に出力する。
【0017】
記憶装置140は、ハードディスク、スラッシュメディア、ネットワークサーバ等である。記憶装置140は、先述のとおり、類似/共起/関連データベース142と、ユーザデータベース144とを記憶する。類似/共起/関連データベース142は、例えば第1のクラスに対して類似、共起又は関連する関連語である第2のクラスを記録したテーブル等を含む。ユーザデータベース144は、類似/共起/関連データベース142に記録されている第2のクラスに対するユーザの評価を記憶するテーブル等を含む。
【0018】
入力装置160は、キーボード、タッチパネル、マウス、ボタンスイッチ、スライダ等である。入力装置160は、第2のクラスに対するユーザの評価の入力を受け付ける。ここで、ユーザは、後述するように推薦クラス生成部114が生成し、GUI制御部116を介して出力装置150に表示された第2のクラスを確認する。ユーザは、その第2のクラスに対する評価を、入力装置160を用いて入力する。入力装置160は、受け取ったユーザの評価を、GUI制御部116に出力する。このユーザの評価は、ユーザデータベース更新部118に伝達される。なお、同一のタッチパネル等が、クラス設定部120と入力装置160とを兼ねてもよい。
【0019】
推薦クラス生成部114は、クラス設定部120から入力された第1のクラスに対して、類似、共起、または関連するキーワードや意味等を推薦クラス(第2のクラス)として生成する。ここで、キーワードや意味を生成するにあたり、推薦クラス生成部114は、類似/共起/関連データベース142を参照し、第1のクラスとの類似度、共起度又は関連度等に基づいて第2のクラスを生成したり、第1のクラスに対する協調フィルタリング処理を行って第2のクラスを生成したりする。第2のクラスの生成では、推薦クラス生成部114は、ユーザデータベース144に記憶されたユーザの評価も考慮する。推薦クラス生成部114は、生成した第2のクラスを第1のクラスと共にGUI制御部116に出力する。また、推薦クラス生成部114は、第1のクラスと第2のクラスとをユーザデータベース更新部118に出力する。また、後述のとおり、推薦クラス生成部114は、第1のクラス及び第2のクラスと、ユーザデータベース更新部118から入力された第1のクラス及び第2のクラスに対するユーザの評価とを教師データ作成部112に出力する。
【0020】
GUI制御部116は、出力装置150への出力を制御する。また、GUI制御部116は、入力装置160からの入力を受け取る。例えば出力装置150はディスプレイであり、GUI制御部116は出力装置150に表示する画像を制御する。また、例えば入力装置160は、マウスやタッチパネル等であり、出力装置150に表示させた画像との対応関係に基づいて、ユーザの指示を取得する。GUI制御部116は、取得したユーザの指示をユーザデータベース更新部118に出力する。
【0021】
ユーザデータベース更新部118は、GUI制御部116から入力された第2のクラスに対するユーザの評価に基づいて、記憶装置140に記憶されたユーザデータベース144を更新する。また、ユーザデータベース更新部118は、ユーザの評価を推薦クラス生成部114にも伝達する。
【0022】
教師データ作成部112は、データ読み込み部130から入力された基礎データと、推薦クラス生成部114から入力された第1のクラス及び第2のクラスと、第2のクラスに対するユーザの評価とに基づいて、教師データを作成する。すなわち、基礎データと、第1のクラスと、ユーザの評価を反映させた第2のクラスとを関連付けた教師データを作成する。教師データ作成部112は、作成した教師データを外部装置へ出力する。この外部装置は、例えば教師データに基づいて学習を行う識別器であったり、教師データを蓄積する記憶装置であったりする。例えば基礎データが画像である場合、教師データは、画像とその画像に対してユーザが関連すると考えるキーワード等の組み合わせを表すデータとなる。
【0023】
このように、例えばクラス設定部120は、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部として機能し、例えば類似/共起/関連データベースは、第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースとして機能し、ユーザデータベース144は、第2のクラスに対する重み係数を含む第2のデータベースとして機能し、例えば推薦クラス生成部114は、第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを生成する推薦クラス生成部として機能し、例えばGUI制御部116及び出力装置150は、第2のクラスをユーザに提示する出力部として機能し、例えばGUI制御部116及び入力装置160は、第2のクラスに対するユーザの評価を受け取る入力部として機能し、例えばユーザデータベース更新部118は、ユーザの評価に基づいて、重み係数を更新するデータベース更新部として機能し、例えば教師データ作成部112は、ユーザの評価に基づいて変更した第2のクラスと、基礎データと、第1のクラスとに基づいて教師データを作成する教師データ作成部として機能する。
【0024】
次に本実施形態に係る教師データ作成装置100の動作を説明する。教師データ作成装置100における演算装置110で行われる処理のフローチャートを図2に示す。例えばコンピュータである演算装置110は、プログラムを実行することで図2に示す処理を実行できる。また、この処理の模式図を図3に示す。図2に示すように、この処理において演算装置110は、教師データ追加ループを開始する。
【0025】
ステップS101において演算装置110の教師データ作成部112は、データ読み込み部130を介して例えばデータ入力部132から教師データの基礎となる基礎データを読み込む。この基礎データは、例えば図3に示すように画像301を表すデータである。教師データ作成部112は、読み込んだ基礎データをGUI制御部116に出力する。GUI制御部116は、出力装置150を制御して基礎データをユーザに提示させる。例えばGUI制御部116は、ディスプレイである出力装置150に基礎データである画像301を表示させる。
【0026】
ステップS102において演算装置110の推薦クラス生成部114は、出力装置150に提示された基礎データに対してユーザが設定した第1のクラスを、クラス設定部120から取得する。例えば、図3に示すように、ユーザは、出力装置150に表示された画像301を見て、その画像301に対応する言葉である例えば「山」を第1のクラス302としてクラス設定部120に入力する。クラス設定部120は、ユーザから入力された第1のクラスを推薦クラス生成部114に出力する。
【0027】
ステップS103において演算装置110の推薦クラス生成部114は、推薦クラスとしての第2のクラスを生成する。ここで、推薦クラス生成部114は、類似/共起/関連データベース142とユーザデータベース144とを参照する。第2のクラスの生成には、例えば図4に示すような言葉の類似度表1421が用いられる。この類似度表1421は、類似/共起/関連データベース142の一部として記憶装置140に記憶されている。類似度表1421は、シソーラスのような、言葉の間の関連性を示すものであれば任意の表を用いることができる。また、第2のクラスの生成には、例えば図5に示すようなユーザによる重み付け表1441が用いられる。この重み付け表1441は、ユーザデータベース144の一部として、記憶装置140に記憶されている。
【0028】
推薦クラス生成部114は、例えば、このような類似度表1421のそれぞれの値に、対応する重み付け表1441のそれぞれの値を掛け合わせて図6に示すような内容のユーザ類似度表1461を作成する。このようなユーザ類似度表1461に基づいて、推薦クラス生成部114は、第1のクラスとしてのキーワードと類似度が高い方から順に一定数だけ第2のクラスとしてのキーワードを選択する。
【0029】
ここでは簡単のため、図4に示すような言葉の類似度表1421、図5に示すようなユーザによる重み付け表1441、図6に示すような内容のユーザ類似度表1461を示したが、これらはもちろん一例であり、形式や内容はこれらに限らない。ユーザ類似度表1461の作成も、類似度表1421と重み付け表1441とに基づいていれば種々の演算を組み合わせて行うことができる。
【0030】
第1のクラスの生成にあたっては、各種キーワードに対して情報推薦システムで行われているような手法、例えば、コンテンツに基づくフィルタリングや、集合知に基づく協調フィルタリングといった、関連キーワードや推薦キーワードを出力する手法を用いることもできる。例えば協調フィルタリングに基づくと、類似するという観点ではなく、同一の画像に同時に写っている確率が高いような第2のクラスが選定される。したがって、推薦クラス生成部114は、類似する第2のクラスのみならず、より多様な関連語を生成できる。この際も、ユーザデータベース144に記憶されているユーザによる重み付け表1441を考慮して第2のクラスの選定を行う。また、前記したコンテンツに基づくフィルタリングや、集合知に基づく協調フィルタリングといった手法により予め第2のクラスを生成しておき、それらを類似/共起/関連データベース142として、記憶装置140に記憶させておくこともできる。
【0031】
このようにして例えば図3に示すように、推薦クラス生成部114は、第1のクラス「山」に類似、共起又は関連する「木」という第2のクラス303と「花」という第2のクラス304を生成する。
【0032】
ステップS104において演算装置110の推薦クラス生成部114は、第2のクラスをGUI制御部116に出力する。GUI制御部116は、出力装置150を用いて第2のクラスをユーザに提示する。例えば図3に示すように、推薦クラス生成部114は、ディスプレイである出力装置150に、グラフィカル・ユーザ・インタフェース(GUI)に係る画像を出力する。このGUIに係る画像には、「木」という第2のクラス303と、その適切度に関する評価をユーザが入力する際に用いるチェックボックスとを含む画像305が含まれる。また、このGUIに係る画像には、「花」という第2のクラス304と、チェックボックスとを含む画像306が含まれる。
【0033】
ステップS105において演算装置110のGUI制御部116は、入力装置160から第2のクラスに対するユーザの評価を取得する。GUI制御部116は、取得したユーザの評価をユーザデータベース更新部118に出力する。ステップS104及びステップS105においてGUI制御部116が出力装置150に表示させるGUIの例を図7に示す。図7に示す例では、第1のクラス及び第2のクラスと、ユーザが第2のクラスが適切であるか否かを選択するためのチェックボックスとが表示される。この例では、ユーザは、入力装置160である例えばマウスを使って、チェックボックスにチェックを入れたりチェックを外したりし、最後に決定ボタンを押す。
【0034】
このチェックボックスにより、ユーザは、第2のクラスに対する評価を入力することができる。より具体的には、ユーザは、画像305及び画像306を確認しながら、「木」という第2のクラス303、及び「花」という第2のクラス304のそれぞれについて、チェックボックスを使い、○又は×の2者択一による評価結果の入力を行うことができる。ステップS105においてGUI制御部116は、入力装置160によるユーザの操作を取得して、その操作に応じた画像を出力装置150に表示させながら、ユーザの第2のクラスに対する評価を取得する。例えば図7に示すように、ユーザによって第2のクラス「木」が○であり第2のクラス「花」が×であると評価されたとしたら、GUI制御部116はその評価を取得する。GUI制御部116は、取得した評価をユーザデータベース更新部118に出力する。
【0035】
ステップS106において演算装置110のユーザデータベース更新部118は、取得したユーザの評価に基づいて、ユーザデータベース144を更新する。例えば、ユーザデータベース更新部118は、図6に示したユーザによる重み付け表1441を、図8に示すように更新する。また、ユーザデータベース更新部118は、取得したユーザの評価を推薦クラス生成部114に出力する。
【0036】
ステップS107において演算装置110の教師データ作成部112は、データ読み込み部を介して取得した基礎データと、推薦クラス生成部114から入力された第1のクラス及び第2のクラス並びにそれらに対するユーザの評価とに基づいて、教師データを作成する。教師データ作成部112は、作成した教師データを外部装置に出力する。例えば、教師データ作成部112は、画像301に対してユーザが設定した第1のクラスである「山」と、ユーザがよいと評価した第2のクラスである「木」とを関連付けた教師データを作成する。演算装置110は、以上の処理を教師データ追加ループとし、ステップS101乃至ステップS107の処理を繰り返す。なお、ステップS106とステップS107とは、処理順序を入れ替えることも可能である。
【0037】
本実施形態によれば、推薦クラスとしての第2のクラスに対するユーザによる評価に基づいて、ユーザデータベースが更新される。このため、推薦クラス生成部114は、評価を行うユーザの意図に従って良好なクラスの生成を行うことができるようになる。その結果、本実施形態に係る教師データ作成装置100は、ユーザの意図に従った良好な教師データを作成できる。このような良好な教師データを用いて学習を行うと、良好な識別器が構成される。なお、教師データの作成を、複数のユーザで行うような場合には、各ユーザの平均的な意図がユーザデータベースに反映されるため、汎用的に良好なクラスの生成を行うことも可能となる。また、複数のユーザの各々に対するユーザデータベースを用意することで、ユーザ毎に異なる意思を反映した教師データを作成することができるようになる。
【0038】
以上の説明では、画像に対する教師データの作成を想定して説明を行ったが、本発明は、特に画像に限定されることなく、一般的なマルチメディアデータ、例えば、動画データや音楽データ等に対する教師データの作成にも適用できる。
【0039】
[第1の実施形態の第1の変形例]
第1の実施形態の第1の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。ある第2のクラスに対して、ユーザの評価が低い場合であっても、その第2のクラスの重みが常に低いとは限らない。ユーザの評価が低く入力された場合であっても、それは例えばユーザが設定した第1のクラスとの組み合わせにおいて評価が低く、他の第1のクラスとの組み合わせにおいては評価が高い場合もある。そこで本変形例では、ユーザデータベース144に、第1のクラスに対する第2のクラスの組み合わせに応じたユーザの重み付けを記憶しておく。
【0040】
ユーザデータベース144の一部である重み付け表1442の一例を図9に示す。重み付け表1442は、第1のクラスと第2のクラスとの関係に対するユーザの重み付けを表す。本変形例では、ステップS103において推薦クラス生成部114は、図4に示したような類似度表1421と、図9に示したような重み付け表1442とを掛け合わせて、例えば図10のような内容のユーザ類似度表1462を作成する。作成したこのようなユーザ類似度表1462に基づいて、推薦クラス生成部114は、第2のクラスとしてのキーワードを、第1のクラスとしてのキーワードと類似度が高い方から順に一定数だけ選択する。
【0041】
ステップS105において第2のクラスに対する評価を得たら、その評価に基づいて、ユーザデータベース更新部118は、ユーザデータベース144の重み付け表1442を更新する。例えば第1の実施形態の場合と同様に、第1のクラスが「山」であり、それに対して推薦クラス生成部114が「木」と「花」という第2のクラスを提示したとする。このとき、ユーザが「木」に対しては○、「花」に対しては×と評価したとする。このとき、ユーザデータベース更新部118は、図9に示したような重み付け表1442を、図11に示すように更新する。
【0042】
本変形例によれば、ユーザによって設定された第1のクラスと、それに対する各第2のクラスに応じて、異なる重み付けが与えられる。したがって、ある第1のクラスをユーザが設定した場合にその第1のクラスに対して評価が低かった第2のクラスであっても、他の第1のクラスに対して、高い評価が得られる第2のクラスとして推薦され得る。複数のユーザを対象とする場合、ユーザ毎にユーザデータベース144を設けることもできる。
【0043】
[第1の実施形態の第2の変形例]
第1の実施形態の第2の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ステップS104において推薦クラス生成部114が出力装置150に表示させるグラフィカル・ユーザ・インタフェース(GUI)が第1の実施形態と異なる。
【0044】
本変形例におけるGUIの例を図12に示す。この例では、第1のクラス及び第2のクラスと、ユーザがそれらの適切さを入力するためのスライダとを表示する。この例においてユーザは、表示されたスライダを操作することにより、各第2のクラスの適切さを評価結果として入力する。すなわち、本変形例では、ユーザによる評価が、図7に例を示した第1の実施形態のように○又は×による2値の評価ではなく、実数による評価値として入力される。例えば、「木」という第2のクラス303に対する評価値が0.7であり、「花」という第2のクラス304に対する評価値が0.2であるといったように、それぞれの評価値が入力され得る。
【0045】
本変形例では、ステップS105及びステップS106において、ユーザデータベース更新部118は、評価値を重みとして、この重みを考慮してユーザによる例えば重み付け表1442等のユーザデータベース144を更新する。このように、重みを考慮してユーザデータベース144を更新すると、○又は×による2値の評価を用いて更新する場合と比較して、効率的にユーザデータベース144を更新でき、より早くユーザの意図に合致した第2のクラスを推薦できるようになる。
【0046】
[第1の実施形態の第3の変形例]
第1の実施形態の第3の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ステップS104において推薦クラス生成部114が出力装置150に表示させるGUIを、図13に示すように2次元グラフ状の表示とする。
【0047】
この例では、表示領域401に2次元グラフ402が表示される。2次元グラフ402において、縦軸は「木」という第2のクラスの適切さを示し、横軸は「花」という第2のクラスの適切さを示す。ステップS104において推薦クラス生成部114は、ステップS101において教師データ作成部112が読み込んだ画像403を、2次元グラフ402上に配置して表示させる。初期状態では、画像403は、例えばグラフの中央に表示される。ユーザは、縦軸に設定された「木」という第2のクラスの適切さと、横軸に設定された「花」という第2のクラスの適切さとを評価する。ユーザは、その評価結果を表すようなグラフ上の位置に、画像を移動させるように、当該GUIを用いて操作する。例えば、「木」という第2のクラスの適切さを上昇させ、「花」という第2のクラスの適切さを減少させる場合、図13に示すように画像403の位置から画像404の位置へ画像を移動させる。
【0048】
このようにしてユーザは、第2のクラスの適切さの評価結果を入力することができる。ユーザデータベース更新部118は、ステップS105において、ユーザによって画像が移動された先の位置を検出することでユーザの評価を取得する。ユーザデータベース更新部118は、取得した評価に基づいて、ステップS106においてユーザデータベース144の更新を行う。第1の変形例と同様に、実数の評価値を得ることができるので、評価値を重みとして、この重みを考慮して効率的にユーザデータベース144を更新することができる。
【0049】
[第1の実施形態の第4の変形例]
第1の実施形態の第4の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ユーザが設定した第1のクラスをユーザが再評価できる。このため、例えば図7又は図12に示すような画像において、第1のクラスに対しても、第2のクラスに対するものと同様のチェックボックスやスライダを設ける。また、図14に示すように、2次元グラフにおいて、縦軸が「山」という第1のクラスの適切さを示し、横軸が「木」という第2のクラスの適切さを示すようなグラフを設定する。また、図15に示すように、2次元グラフにおいて、縦軸が「山」という第1のクラスの適切さを示し、横軸が「花」という第2のクラスの適切さを示すようにグラフを設定する。
【0050】
推薦クラス生成部114から複数の第2のクラスが出力される場合、例えば、図14に示すようなGUIと図15に示すようなGUIとを、出力装置150に順次表示し、ユーザの評価結果を、順次入力できるようにすることができる。このように、第2のクラスの数だけこのような2次元グラフの表示を繰り返せばよい。また、例えば、図14に示すようなGUIと図15に示すようなGUIとを、ディスプレイに並べて同時に表示することで、ユーザの評価結果を入力できるように構成することができる。
【0051】
また、図16に示すように、表示領域401に、3次元座標系412を設定し、1つの軸を第1のクラスの適切さを示す軸とし、他の2軸を第2のクラスの適切さを示す軸とすることができる。ユーザは、読み込んだ画像413の表示された位置を、評価結果を表すような3次元グラフ上の画像414の位置に、GUIにより移動させることができる。このようにしてユーザは、クラスの適切さの評価結果を入力することができる。
【0052】
[第1の実施形態の第5の変形例]
第1の実施形態の第5の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、推薦クラス生成部114が、ユーザが設定した第1のクラスに対して信頼度を付与した第2のクラスを生成する。
【0053】
本変形例を図17に示す模式図を参照して説明する。この例では、ステップS101において、教師データ作成部112が画像301を取得したとする。教師データ作成部112は、取得した画像301を出力装置150に表示させ、画像301をユーザに提示する。ユーザは、出力装置150に表示された画像301を確認し、その画像301に対応する言葉である「山」を、第1のクラス302として入力装置160に入力する。推薦クラス生成部114は、ステップS102において、ユーザが設定した「山」という第1のクラスを入力装置160から取得する。
【0054】
推薦クラス生成部114は、ステップS103において、類似/共起/関連データベース142とユーザデータベース144とを参照して、第1のクラス「山」に類似、共起又は関連する第2のクラスとして、「木」という第2のクラス303と「花」という第2のクラス304とを生成する。さらに、推薦クラス生成部114は、「木」という第2のクラス303の信頼度を例えば0.8と算出し、その信頼度の情報307もユーザデータベース更新部118に出力する。同様に、関連語生成部113は、「花」という第2のクラス304の信頼度を例えば0.7と算出し、その信頼度の情報308もユーザデータベース更新部118に出力する。
【0055】
推薦クラス生成部114は、ステップS104において、出力装置150に、「木」という第2のクラス303について、○及び×並びにそれらに対応するチェックボックスを含む画像305と、「花」という第2のクラス304について、○及び×並びにそれらに対応するチェックボックスを含む画像306とを表示させる。この場合、ユーザは、画像305及び画像306を確認しながら、チェックボックスと入力装置160を用いて、「木」という第2のクラス303と「花」という第2のクラス304とのそれぞれについて、○又は×の2者択一によって評価結果の入力を行うことができる。ステップS106においてユーザデータベース更新部118は、ユーザの評価結果とそれぞれの第2のクラスに対する信頼度に基づいて、ユーザデータベース144を更新する。このように信頼度に基づく重みを考慮してユーザデータベース144を更新すると、より早く精度のよいユーザデータベースが作成される。
【0056】
なお、ユーザによる評価は、○又は×の2者択一によらずとも、図12乃至16を参照して説明した第2乃至第4の変形例のように、実数値による評価でもよい。この場合、例えば、ユーザの評価と、関連語生成部113が算出した信頼度との和や積を重みとして、ユーザデータベース更新部118がユーザデータベース144を更新してもよい。
【0057】
[第1の実施形態の第6の変形例]
第1の実施形態の第6の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、GUIにおいて、例えばディスプレイである出力装置150に表示された複数の第2のクラスの位置を、ユーザが入れ替えることで第2のクラスの重要度を入力する。
【0058】
本変形例を図18を参照して説明する。この例では、ステップS101において、教師データ作成部112が画像301を取得したとする。教師データ作成部112は、取得した画像301を出力装置150に表示させ、画像301をユーザに提示する。ユーザは、出力装置150に表示された画像301を見て、その画像301に対応する言葉である「山」を第1のクラスとして入力装置160に入力する。推薦クラス生成部114は、ステップS102において、ユーザが設定した「山」という第1のクラスを取得する。
【0059】
推薦クラス生成部114は、ステップS103において、第1のクラス「山」に類似、共起又は関連する第2のクラスとして、類似/共起/関連データベース142とユーザデータベース144に基づいて算出される推薦度が高いものから順に、第1候補「木」311と、第2候補「花」312と、第3候補「川」313とを生成する。推薦クラス生成部114は、ステップS104において、出力装置150にGUIとして、例えば第1候補「木」311と、第2候補「花」312と、第3候補「川」313とを、上から順に表示させる。
【0060】
ユーザは、自己の評価結果に基づいて、このGUIにおいて候補の順序を入れ換える。例えばより重要度が高いものを上に表示するように、ユーザは各候補の位置を入れ替える。ユーザデータベース更新部118は、ステップS105において、この入れ換えを取得し、ステップS106において、その入れ換え結果に基づいてユーザデータベース144を更新する。本変形例によれば、ユーザは、第2のクラスに対する自己の評価をより直感的に入力することができる。
なお、本変形例の説明では、推薦度が高いものから順に3つの第2のクラスをユーザに提示する例を示したが、ユーザに提示する第2のクラスはいくつでもよいことはもちろんである。
【0061】
[第2の実施形態]
本発明の第2の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については、同一の符号を付してその説明を省略する。本実施形態は、ユーザが複数の第1のクラスを入力する例である。
【0062】
例えば、ある画像に対してユーザが「山」と「川」という2つのキーワードを第1のクラスとしてクラス設定部120から入力したとする。このとき、推薦クラス生成部114は、「山」という第1のクラスと「川」という第1のクラスとに対して統計処理を施す。ここで、統計処理として例えば協調フィルタリングを用いることができる。なお、推薦クラス生成部114は、この統計処理においてユーザデータベース144を用いる。その結果、推薦クラス生成部114は、「山」という第1のクラスと「川」という第1のクラスとに基づいて、「空」という第2のクラスを生成する。本実施形態では、出力装置150によって、「空」という第2のクラスがユーザに提示され、この第2のクラスに対する評価が入力される。教師データ作成部112は、画像と、「山」及び「川」という第1のクラスと、「空」という第2のクラス及びそれに対するユーザの評価とに基づいて、教師データを作成する。また、ユーザデータベース更新部118は、ユーザの評価に基づいて、ユーザデータベース144を更新する。
【0063】
本実施形態によれば、推薦クラス生成部114は、クラス設定部120から出力された複数の第1のクラスに互いに関連、類似又は共起する第2のクラスを選定するので、各第1のクラスに類似、共起又は関連する第2のクラスのみを選定する場合とは異なる新たな第2のクラスを選定することができる。その結果、教師データ作成装置100は、より多様なクラスを出力できるようになる。
【0064】
[第2の実施形態の変形例]
第2の実施形態の変形例について、第2の実施形態との相違点について説明する。本変形例では、ユーザが入力した「山」及び「川」という第1のクラスと、「山」及び「川」という第1のクラスに基づいて作成した「空」という第2のクラスに加えて、第1の実施形態の場合と同様に、図4を参照して説明したような類似表1421を用いて、第1の実施形態と同様に第2のクラスを生成する。すなわち、推薦クラス生成部114は、「山」という第1のクラスに対する「木」という第2のクラスを生成し、「川」という第1のクラスに対する「海」という第2のクラスを生成する。以上によって、推薦クラス生成部114は、「木」、「海」、「空」という第2のクラスをユーザに提示する。
【0065】
本変形例において教師データ作成部112は、ユーザによる評価を考慮した「木」、「海」、「空」という第2のクラスと、「山」及び「川」という第1のクラスとを用いて教師データを作成する。
【0066】
本変形例によっても第2の実施形態と同様に、各第1のクラスに類似、共起又は関連する第2のクラスのみを選定する場合とは異なる、新たな第2のクラスを選定することができる。その結果、教師データ作成装置100は、より多様なクラスを出力できるようになる。
【0067】
[第3の実施形態]
本発明の第3の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については、同一の符号を付してその説明を省略する。本実施形態も、ユーザが複数の第1のクラスを入力する例である。本実施形態では、類似/共起/関連データベース142に基づいて、ユーザが入力した複数の第1のクラスに対する類似度表を作成し、作成した類似度表に基づいて第2のクラスを生成する。
【0068】
例えば、ある画像に対してユーザが「山」と「川」という2つのキーワードを第1のクラスとしてクラス設定部120から入力したとする。このとき、推薦クラス生成部114は、図4にその一部の例を示したような類似/共起/関連データベース142を参照して、例えば「山」に対する関連度と「川」に対する関連度との和を算出し、例えば図19のようなユーザ類似度表1463を作成する。推薦クラス生成部114は、このユーザ類似度表1463と、ユーザデータベース144とに基づいて、例えば「木」という第2のクラスを生成する。その他の動作は第1の実施形態と同様である。本実施形態によれば、複数の第1のクラスに応じた第2のクラスを生成することができる。
【0069】
[第4の実施形態]
本発明の第4の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については同一の符号を付して、その説明は省略する。本実施形態では、クラス設定部120から入力する第1のクラスを複数のカテゴリに分類したときに、推薦クラス生成部114は、複数のカテゴリ間の関連性に基づいて関連語の選定を行う。
【0070】
図4に示す表には、画像内に存在する物体に関する言葉とその関連性が示されている。このような物体に関する複数の言葉を1つのカテゴリと考える。このようなカテゴリの他にも、例えば図20に示すようなカテゴリを考えることもできる。図20には、画像内の状態に関する言葉とその関連性が示されている。このように、言葉はいくつかのカテゴリに分類され得る。本実施形態では、推薦クラス生成部114は、同一のカテゴリから第2のクラスを選定するのみならず、異なるカテゴリ間での言葉の関連性に基づいて、クラス設定部120から入力したキーワードが属するカテゴリ以外のカテゴリに属する関連語を選定する。
【0071】
例えばクラス設定部120からユーザが図4に示すような物体的なカテゴリから「山」という第1のクラスを入力し、それとともに図19に示すような状態的なカテゴリから「暖かい」という第1のクラスを入力する場合を考える。このとき、「山」と「暖かい」という第1のクラスから、推薦クラス生成部114は、類似/共起/関連データベース142及びユーザデータベース144に基づいて、前記物体的なカテゴリとも前記状態的なカテゴリとも異なる季節というカテゴリに属する「春」という第2のクラスを選定する。
【0072】
このようなカテゴリの異なる関連語を生成する場合に、カテゴリについての優先度の評価を行うことも可能である。推薦クラス生成部114は、カテゴリの優先度を考慮の上、各カテゴリに含まれる言葉から、異なるカテゴリ間の関係に基づいて、関連語を選定することができる。すなわち、推薦クラス生成部114は、カテゴリの優先度も考慮した関連語の選定を行うことができる。
【0073】
本実施形態によれば、選定された第2のクラスに対するユーザの評価に基づいて、ユーザデータベース更新部118がユーザデータベース144の更新を行うことで、推薦クラス生成部114は、より多様でユーザの嗜好にマッチした第2のクラスを生成することが可能となる。
【0074】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても、発明が解決しようとする課題の欄で述べられた課題が解決でき、かつ、発明の効果が得られる場合には、この構成要素が削除された構成も発明として抽出され得る。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0075】
100…教師データ作成装置、110…演算装置、112…教師データ作成部、113…関連語生成部、114…推薦クラス生成部、116…GUI制御部、118…ユーザデータベース更新部、120…クラス設定部、130…データ読み込み部、132…データ入力部、134…データベース記憶装置、140…記憶装置、142…類似/共起/関連データベース、1421…類似度表、144…ユーザデータベース、1441,1442…重み付け表、1461,1462,1463…ユーザ類似度表、150…出力装置、160…入力装置。
【技術分野】
【0001】
本発明は、教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置に関する。
【背景技術】
【0002】
近年、統計的機械学習によるパターン認識技術に関する提案が多数なされている。このパターン認識技術では、大量の教師データに基づいて学習を実施し、認識処理を行う識別器を構成する。良好な識別器を構成するためには、学習に用いる良好な教師データが必要である。教師データは、例えば、画像等のデータとそのデータに対して認識結果として出力されるべきであるクラスとを組み合わせたものである。一般に、このような教師データは、ユーザがデータに対して適すると考えられるクラスを設定することにより生成する。しかしながら、大量の教師データを作成する際に、ユーザが各データに対するクラスを適切に設定することには多大な労力を伴う。
【0003】
そこで、例えば特許文献1には、認識システムのための教師データを作成する方法の一例が開示されている。特許文献1には、教師データに適合するクラスを追加し、その教師データの精度を向上させる技術について開示されている。特許文献1に係る技術では、まず、教師データベースから教師データを取得し、次に、取得した教師データとともに出現する用語の組合せを取得する。取得した用語の組合せにおいて、教師データの出現部分に任意の置き換え可能な用語が入るとみなした場合に得られるパターンを抽出する。抽出したパターンの置き換え可能な部分に入る用語であるパターン対応用語を、コーパスの中から取得する。その後、取得したパターン対応用語が固有の表現に適合するか否かを判定し、適合すると判定されたパターン対応用語を取得する。この適合するパターン対応用語を教師データベースに追加することで、教師データの精度を向上させる。
【0004】
また、特許文献2には、画像処理装置において、画像に関連するキーワードを選択し、そのキーワードに基づいて、文章を作成する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−198189号公報
【特許文献2】特開2009−032154号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に係る技術では、教師データに対して追加されたクラスに対応するパターン対応用語を、コーパスの中から取得する。そして、そのパターン対応用語に対する判定に基づいて選択されたパターン対応用語を、教師データに追加する。したがって、このパターン対応用語の追加方法では、システムによって画一的に選択された用語の追加しか行うことができない。その結果、それら教師データを用いた学習では、識別器の性能の向上に限界がある。また、特許文献2に係る技術では、認識結果に関連する文章を提示するのみであり、それを教師データとして用いることはない。したがって、その文章によって識別器の性能が向上することを期待できない。
【0007】
そこで本発明は、高精度な識別器を生成するための良好な教師データを作成できる教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
前記目的を果たすため、本発明の教師データの作成方法の一態様は、認識システムの学習に用いる教師データの作成方法であって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、前記第2のクラスを前記ユーザに提示する第3のステップと、前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、前記評価に基づいて、前記重み係数を更新する第6のステップと、を含むことを特徴とする。
【0009】
前記目的を果たすため、本発明の教師データの作成のためのプログラムの一態様は、認識システムの学習に用いる教師データの作成のためのプログラムであって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、前記第2のクラスを前記ユーザに提示する第3のステップと、前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、前記評価に基づいて、前記重み係数を更新する第6のステップと、をコンピュータに発揮させることを特徴とする。
【0010】
前記目的を果たすため、本発明の教師データ作成装置の一態様は、認識システムの学習に用いる教師データを作成するための教師データ作成装置であって、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部と、前記第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、前記第2のクラスに対する重み係数を含む第2のデータベースと、前記第1のデータベースと前記第2のデータベースとに基づいて、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの前記第2のクラスを生成する推薦クラス生成部と、前記第2のクラスを前記ユーザに提示する出力部と、前記第2のクラスに対する前記ユーザの評価を受け取る入力部と、前記評価に基づいて、前記重み係数を更新するデータベース更新部と、前記評価に基づいて変更した前記第2のクラスと、前記基礎データと、前記第1のクラスとに基づいて教師データを作成する教師データ作成部と、を具備することを特徴とする。
【発明の効果】
【0011】
本発明によれば、第1のクラスに類似、共起又は関連し、ユーザによる評価を受けた第2のクラスと、第1のクラスとに基づいて教師データが作成されるので、高精度な識別器を生成するための良好な教師データを作成できる教師データの作成方法、教師データの作成のためのプログラム、及び教師データ作成装置を提供できる。
【図面の簡単な説明】
【0012】
【図1】第1の実施形態に係る教師データ作成装置の構成の一例を示すブロック図。
【図2】第1の実施形態に係る教師データ作成装置による処理の一例を示すフローチャート。
【図3】第1の実施形態に係る教師データの作成の例を説明するための図。
【図4】第1の実施形態に係る類似/共起/関連データベースに含まれる類似度表の一例を示す図。
【図5】第1の実施形態に係るユーザデータベースに含まれる重み付け表の一例を示す図。
【図6】第1の実施形態に係る作成されるユーザ類似度表の一例を示す図。
【図7】第1の実施形態に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図8】第1の実施形態に係る更新されたユーザデータベースに含まれる重み付け表の一例を示す図。
【図9】第1の実施形態の第1の変形例に係るユーザデータベースに含まれる重み付け表の一例を示す図。
【図10】第1の実施形態の第1の変形例に係る作成されるユーザ類似度表の一例を示す図。
【図11】第1の実施形態の第1の変形例に係る更新されたユーザデータベースに含まれる重み付け表の一例を示す図。
【図12】第1の実施形態の第2の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図13】第1の実施形態の第3の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図14】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図15】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図16】第1の実施形態の第4の変形例に係るグラフィカル・ユーザ・インタフェースの一例を示す図。
【図17】第1の実施形態の第5の変形例に係る教師データの作成の例を説明するための図。
【図18】第1の実施形態の第6の変形例に係る教師データの作成の例を説明するための図。
【図19】第3の実施形態に係る作成されるユーザ類似度表の一例を示す図。
【図20】第4の実施形態に係る類似/共起/関連データベースに含まれる類似度表の一例を示す図。
【発明を実施するための形態】
【0013】
[第1の実施形態]
本発明の第1の実施形態について図面を参照して説明する。図1に本実施形態に係る教師データ作成装置100の構成を示す。教師データ作成装置100は、例えば画像認識等を行う識別器の学習のための教師データを作成する装置である。
【0014】
教師データ作成装置100は、演算装置110と、クラス設定部120と、データ読み込み部130と、記憶装置140と、出力装置150と、入力装置160とを備える。演算装置110は、教師データ作成部112と、推薦クラス生成部114と、GUI制御部116と、ユーザデータベース更新部118とを有する。演算装置110は、例えプログラムを実行するコンピュータであり、パーソナルコンピュータ等でもよいし、専用の計算機でもよいし、ネットワークに接続された計算機でもよい。記憶装置140は、類似/共起/関連データベース142と、ユーザデータベース144とを記憶している。データ読み込み部130には、データ入力部132とデータベース記憶装置134とが接続されている。
【0015】
データ読み込み部130は、データ入力部132又はデータベース記憶装置134から基礎データを読み込む。この基礎データは、画像データ、動画データ、音声データ、文字データ等種々のデータのうち何れでもよい。本実施形態の説明では、画像データを例として説明する。データ読み込み部130は、読み込んだ基礎データを教師データ作成部112に出力する。ここで、データ入力部132は、基礎データを記憶する手段である。例えば基礎データが画像データであれば、データ入力部132は、例えば画像を記憶した記憶媒体やデジタルカメラ等である。また、データベース記憶装置134は、例えば画像等のデータベースを記憶した記憶媒体であり、これは例えばネットワークサーバであってもよい。
【0016】
出力装置150は、例えばディスプレイである。出力装置150は、ユーザに情報を伝達するために各種情報を表示する。クラス設定部120は、例えばキーボードやタッチパネルである。クラス設定部120は、ユーザが設定するキーワードや意味等である第1のクラスを受け取る。ここで、ユーザは、後述するようにデータ読み込み部130によって読み込まれて教師データ作成部112及びGUI制御部116を介して出力装置150に表示された基礎データを確認する。ユーザは、その基礎データにふさわしい第1のクラスを、クラス設定部120を用いて入力する。基礎データが画像データである場合、ユーザは出力装置150に表示された画像を確認し、その画像と関連するキーワード等である第1のクラスを入力する。クラス設定部120は、入力された第1のクラスを推薦クラス生成部114に出力する。
【0017】
記憶装置140は、ハードディスク、スラッシュメディア、ネットワークサーバ等である。記憶装置140は、先述のとおり、類似/共起/関連データベース142と、ユーザデータベース144とを記憶する。類似/共起/関連データベース142は、例えば第1のクラスに対して類似、共起又は関連する関連語である第2のクラスを記録したテーブル等を含む。ユーザデータベース144は、類似/共起/関連データベース142に記録されている第2のクラスに対するユーザの評価を記憶するテーブル等を含む。
【0018】
入力装置160は、キーボード、タッチパネル、マウス、ボタンスイッチ、スライダ等である。入力装置160は、第2のクラスに対するユーザの評価の入力を受け付ける。ここで、ユーザは、後述するように推薦クラス生成部114が生成し、GUI制御部116を介して出力装置150に表示された第2のクラスを確認する。ユーザは、その第2のクラスに対する評価を、入力装置160を用いて入力する。入力装置160は、受け取ったユーザの評価を、GUI制御部116に出力する。このユーザの評価は、ユーザデータベース更新部118に伝達される。なお、同一のタッチパネル等が、クラス設定部120と入力装置160とを兼ねてもよい。
【0019】
推薦クラス生成部114は、クラス設定部120から入力された第1のクラスに対して、類似、共起、または関連するキーワードや意味等を推薦クラス(第2のクラス)として生成する。ここで、キーワードや意味を生成するにあたり、推薦クラス生成部114は、類似/共起/関連データベース142を参照し、第1のクラスとの類似度、共起度又は関連度等に基づいて第2のクラスを生成したり、第1のクラスに対する協調フィルタリング処理を行って第2のクラスを生成したりする。第2のクラスの生成では、推薦クラス生成部114は、ユーザデータベース144に記憶されたユーザの評価も考慮する。推薦クラス生成部114は、生成した第2のクラスを第1のクラスと共にGUI制御部116に出力する。また、推薦クラス生成部114は、第1のクラスと第2のクラスとをユーザデータベース更新部118に出力する。また、後述のとおり、推薦クラス生成部114は、第1のクラス及び第2のクラスと、ユーザデータベース更新部118から入力された第1のクラス及び第2のクラスに対するユーザの評価とを教師データ作成部112に出力する。
【0020】
GUI制御部116は、出力装置150への出力を制御する。また、GUI制御部116は、入力装置160からの入力を受け取る。例えば出力装置150はディスプレイであり、GUI制御部116は出力装置150に表示する画像を制御する。また、例えば入力装置160は、マウスやタッチパネル等であり、出力装置150に表示させた画像との対応関係に基づいて、ユーザの指示を取得する。GUI制御部116は、取得したユーザの指示をユーザデータベース更新部118に出力する。
【0021】
ユーザデータベース更新部118は、GUI制御部116から入力された第2のクラスに対するユーザの評価に基づいて、記憶装置140に記憶されたユーザデータベース144を更新する。また、ユーザデータベース更新部118は、ユーザの評価を推薦クラス生成部114にも伝達する。
【0022】
教師データ作成部112は、データ読み込み部130から入力された基礎データと、推薦クラス生成部114から入力された第1のクラス及び第2のクラスと、第2のクラスに対するユーザの評価とに基づいて、教師データを作成する。すなわち、基礎データと、第1のクラスと、ユーザの評価を反映させた第2のクラスとを関連付けた教師データを作成する。教師データ作成部112は、作成した教師データを外部装置へ出力する。この外部装置は、例えば教師データに基づいて学習を行う識別器であったり、教師データを蓄積する記憶装置であったりする。例えば基礎データが画像である場合、教師データは、画像とその画像に対してユーザが関連すると考えるキーワード等の組み合わせを表すデータとなる。
【0023】
このように、例えばクラス設定部120は、基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部として機能し、例えば類似/共起/関連データベースは、第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースとして機能し、ユーザデータベース144は、第2のクラスに対する重み係数を含む第2のデータベースとして機能し、例えば推薦クラス生成部114は、第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを生成する推薦クラス生成部として機能し、例えばGUI制御部116及び出力装置150は、第2のクラスをユーザに提示する出力部として機能し、例えばGUI制御部116及び入力装置160は、第2のクラスに対するユーザの評価を受け取る入力部として機能し、例えばユーザデータベース更新部118は、ユーザの評価に基づいて、重み係数を更新するデータベース更新部として機能し、例えば教師データ作成部112は、ユーザの評価に基づいて変更した第2のクラスと、基礎データと、第1のクラスとに基づいて教師データを作成する教師データ作成部として機能する。
【0024】
次に本実施形態に係る教師データ作成装置100の動作を説明する。教師データ作成装置100における演算装置110で行われる処理のフローチャートを図2に示す。例えばコンピュータである演算装置110は、プログラムを実行することで図2に示す処理を実行できる。また、この処理の模式図を図3に示す。図2に示すように、この処理において演算装置110は、教師データ追加ループを開始する。
【0025】
ステップS101において演算装置110の教師データ作成部112は、データ読み込み部130を介して例えばデータ入力部132から教師データの基礎となる基礎データを読み込む。この基礎データは、例えば図3に示すように画像301を表すデータである。教師データ作成部112は、読み込んだ基礎データをGUI制御部116に出力する。GUI制御部116は、出力装置150を制御して基礎データをユーザに提示させる。例えばGUI制御部116は、ディスプレイである出力装置150に基礎データである画像301を表示させる。
【0026】
ステップS102において演算装置110の推薦クラス生成部114は、出力装置150に提示された基礎データに対してユーザが設定した第1のクラスを、クラス設定部120から取得する。例えば、図3に示すように、ユーザは、出力装置150に表示された画像301を見て、その画像301に対応する言葉である例えば「山」を第1のクラス302としてクラス設定部120に入力する。クラス設定部120は、ユーザから入力された第1のクラスを推薦クラス生成部114に出力する。
【0027】
ステップS103において演算装置110の推薦クラス生成部114は、推薦クラスとしての第2のクラスを生成する。ここで、推薦クラス生成部114は、類似/共起/関連データベース142とユーザデータベース144とを参照する。第2のクラスの生成には、例えば図4に示すような言葉の類似度表1421が用いられる。この類似度表1421は、類似/共起/関連データベース142の一部として記憶装置140に記憶されている。類似度表1421は、シソーラスのような、言葉の間の関連性を示すものであれば任意の表を用いることができる。また、第2のクラスの生成には、例えば図5に示すようなユーザによる重み付け表1441が用いられる。この重み付け表1441は、ユーザデータベース144の一部として、記憶装置140に記憶されている。
【0028】
推薦クラス生成部114は、例えば、このような類似度表1421のそれぞれの値に、対応する重み付け表1441のそれぞれの値を掛け合わせて図6に示すような内容のユーザ類似度表1461を作成する。このようなユーザ類似度表1461に基づいて、推薦クラス生成部114は、第1のクラスとしてのキーワードと類似度が高い方から順に一定数だけ第2のクラスとしてのキーワードを選択する。
【0029】
ここでは簡単のため、図4に示すような言葉の類似度表1421、図5に示すようなユーザによる重み付け表1441、図6に示すような内容のユーザ類似度表1461を示したが、これらはもちろん一例であり、形式や内容はこれらに限らない。ユーザ類似度表1461の作成も、類似度表1421と重み付け表1441とに基づいていれば種々の演算を組み合わせて行うことができる。
【0030】
第1のクラスの生成にあたっては、各種キーワードに対して情報推薦システムで行われているような手法、例えば、コンテンツに基づくフィルタリングや、集合知に基づく協調フィルタリングといった、関連キーワードや推薦キーワードを出力する手法を用いることもできる。例えば協調フィルタリングに基づくと、類似するという観点ではなく、同一の画像に同時に写っている確率が高いような第2のクラスが選定される。したがって、推薦クラス生成部114は、類似する第2のクラスのみならず、より多様な関連語を生成できる。この際も、ユーザデータベース144に記憶されているユーザによる重み付け表1441を考慮して第2のクラスの選定を行う。また、前記したコンテンツに基づくフィルタリングや、集合知に基づく協調フィルタリングといった手法により予め第2のクラスを生成しておき、それらを類似/共起/関連データベース142として、記憶装置140に記憶させておくこともできる。
【0031】
このようにして例えば図3に示すように、推薦クラス生成部114は、第1のクラス「山」に類似、共起又は関連する「木」という第2のクラス303と「花」という第2のクラス304を生成する。
【0032】
ステップS104において演算装置110の推薦クラス生成部114は、第2のクラスをGUI制御部116に出力する。GUI制御部116は、出力装置150を用いて第2のクラスをユーザに提示する。例えば図3に示すように、推薦クラス生成部114は、ディスプレイである出力装置150に、グラフィカル・ユーザ・インタフェース(GUI)に係る画像を出力する。このGUIに係る画像には、「木」という第2のクラス303と、その適切度に関する評価をユーザが入力する際に用いるチェックボックスとを含む画像305が含まれる。また、このGUIに係る画像には、「花」という第2のクラス304と、チェックボックスとを含む画像306が含まれる。
【0033】
ステップS105において演算装置110のGUI制御部116は、入力装置160から第2のクラスに対するユーザの評価を取得する。GUI制御部116は、取得したユーザの評価をユーザデータベース更新部118に出力する。ステップS104及びステップS105においてGUI制御部116が出力装置150に表示させるGUIの例を図7に示す。図7に示す例では、第1のクラス及び第2のクラスと、ユーザが第2のクラスが適切であるか否かを選択するためのチェックボックスとが表示される。この例では、ユーザは、入力装置160である例えばマウスを使って、チェックボックスにチェックを入れたりチェックを外したりし、最後に決定ボタンを押す。
【0034】
このチェックボックスにより、ユーザは、第2のクラスに対する評価を入力することができる。より具体的には、ユーザは、画像305及び画像306を確認しながら、「木」という第2のクラス303、及び「花」という第2のクラス304のそれぞれについて、チェックボックスを使い、○又は×の2者択一による評価結果の入力を行うことができる。ステップS105においてGUI制御部116は、入力装置160によるユーザの操作を取得して、その操作に応じた画像を出力装置150に表示させながら、ユーザの第2のクラスに対する評価を取得する。例えば図7に示すように、ユーザによって第2のクラス「木」が○であり第2のクラス「花」が×であると評価されたとしたら、GUI制御部116はその評価を取得する。GUI制御部116は、取得した評価をユーザデータベース更新部118に出力する。
【0035】
ステップS106において演算装置110のユーザデータベース更新部118は、取得したユーザの評価に基づいて、ユーザデータベース144を更新する。例えば、ユーザデータベース更新部118は、図6に示したユーザによる重み付け表1441を、図8に示すように更新する。また、ユーザデータベース更新部118は、取得したユーザの評価を推薦クラス生成部114に出力する。
【0036】
ステップS107において演算装置110の教師データ作成部112は、データ読み込み部を介して取得した基礎データと、推薦クラス生成部114から入力された第1のクラス及び第2のクラス並びにそれらに対するユーザの評価とに基づいて、教師データを作成する。教師データ作成部112は、作成した教師データを外部装置に出力する。例えば、教師データ作成部112は、画像301に対してユーザが設定した第1のクラスである「山」と、ユーザがよいと評価した第2のクラスである「木」とを関連付けた教師データを作成する。演算装置110は、以上の処理を教師データ追加ループとし、ステップS101乃至ステップS107の処理を繰り返す。なお、ステップS106とステップS107とは、処理順序を入れ替えることも可能である。
【0037】
本実施形態によれば、推薦クラスとしての第2のクラスに対するユーザによる評価に基づいて、ユーザデータベースが更新される。このため、推薦クラス生成部114は、評価を行うユーザの意図に従って良好なクラスの生成を行うことができるようになる。その結果、本実施形態に係る教師データ作成装置100は、ユーザの意図に従った良好な教師データを作成できる。このような良好な教師データを用いて学習を行うと、良好な識別器が構成される。なお、教師データの作成を、複数のユーザで行うような場合には、各ユーザの平均的な意図がユーザデータベースに反映されるため、汎用的に良好なクラスの生成を行うことも可能となる。また、複数のユーザの各々に対するユーザデータベースを用意することで、ユーザ毎に異なる意思を反映した教師データを作成することができるようになる。
【0038】
以上の説明では、画像に対する教師データの作成を想定して説明を行ったが、本発明は、特に画像に限定されることなく、一般的なマルチメディアデータ、例えば、動画データや音楽データ等に対する教師データの作成にも適用できる。
【0039】
[第1の実施形態の第1の変形例]
第1の実施形態の第1の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。ある第2のクラスに対して、ユーザの評価が低い場合であっても、その第2のクラスの重みが常に低いとは限らない。ユーザの評価が低く入力された場合であっても、それは例えばユーザが設定した第1のクラスとの組み合わせにおいて評価が低く、他の第1のクラスとの組み合わせにおいては評価が高い場合もある。そこで本変形例では、ユーザデータベース144に、第1のクラスに対する第2のクラスの組み合わせに応じたユーザの重み付けを記憶しておく。
【0040】
ユーザデータベース144の一部である重み付け表1442の一例を図9に示す。重み付け表1442は、第1のクラスと第2のクラスとの関係に対するユーザの重み付けを表す。本変形例では、ステップS103において推薦クラス生成部114は、図4に示したような類似度表1421と、図9に示したような重み付け表1442とを掛け合わせて、例えば図10のような内容のユーザ類似度表1462を作成する。作成したこのようなユーザ類似度表1462に基づいて、推薦クラス生成部114は、第2のクラスとしてのキーワードを、第1のクラスとしてのキーワードと類似度が高い方から順に一定数だけ選択する。
【0041】
ステップS105において第2のクラスに対する評価を得たら、その評価に基づいて、ユーザデータベース更新部118は、ユーザデータベース144の重み付け表1442を更新する。例えば第1の実施形態の場合と同様に、第1のクラスが「山」であり、それに対して推薦クラス生成部114が「木」と「花」という第2のクラスを提示したとする。このとき、ユーザが「木」に対しては○、「花」に対しては×と評価したとする。このとき、ユーザデータベース更新部118は、図9に示したような重み付け表1442を、図11に示すように更新する。
【0042】
本変形例によれば、ユーザによって設定された第1のクラスと、それに対する各第2のクラスに応じて、異なる重み付けが与えられる。したがって、ある第1のクラスをユーザが設定した場合にその第1のクラスに対して評価が低かった第2のクラスであっても、他の第1のクラスに対して、高い評価が得られる第2のクラスとして推薦され得る。複数のユーザを対象とする場合、ユーザ毎にユーザデータベース144を設けることもできる。
【0043】
[第1の実施形態の第2の変形例]
第1の実施形態の第2の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ステップS104において推薦クラス生成部114が出力装置150に表示させるグラフィカル・ユーザ・インタフェース(GUI)が第1の実施形態と異なる。
【0044】
本変形例におけるGUIの例を図12に示す。この例では、第1のクラス及び第2のクラスと、ユーザがそれらの適切さを入力するためのスライダとを表示する。この例においてユーザは、表示されたスライダを操作することにより、各第2のクラスの適切さを評価結果として入力する。すなわち、本変形例では、ユーザによる評価が、図7に例を示した第1の実施形態のように○又は×による2値の評価ではなく、実数による評価値として入力される。例えば、「木」という第2のクラス303に対する評価値が0.7であり、「花」という第2のクラス304に対する評価値が0.2であるといったように、それぞれの評価値が入力され得る。
【0045】
本変形例では、ステップS105及びステップS106において、ユーザデータベース更新部118は、評価値を重みとして、この重みを考慮してユーザによる例えば重み付け表1442等のユーザデータベース144を更新する。このように、重みを考慮してユーザデータベース144を更新すると、○又は×による2値の評価を用いて更新する場合と比較して、効率的にユーザデータベース144を更新でき、より早くユーザの意図に合致した第2のクラスを推薦できるようになる。
【0046】
[第1の実施形態の第3の変形例]
第1の実施形態の第3の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ステップS104において推薦クラス生成部114が出力装置150に表示させるGUIを、図13に示すように2次元グラフ状の表示とする。
【0047】
この例では、表示領域401に2次元グラフ402が表示される。2次元グラフ402において、縦軸は「木」という第2のクラスの適切さを示し、横軸は「花」という第2のクラスの適切さを示す。ステップS104において推薦クラス生成部114は、ステップS101において教師データ作成部112が読み込んだ画像403を、2次元グラフ402上に配置して表示させる。初期状態では、画像403は、例えばグラフの中央に表示される。ユーザは、縦軸に設定された「木」という第2のクラスの適切さと、横軸に設定された「花」という第2のクラスの適切さとを評価する。ユーザは、その評価結果を表すようなグラフ上の位置に、画像を移動させるように、当該GUIを用いて操作する。例えば、「木」という第2のクラスの適切さを上昇させ、「花」という第2のクラスの適切さを減少させる場合、図13に示すように画像403の位置から画像404の位置へ画像を移動させる。
【0048】
このようにしてユーザは、第2のクラスの適切さの評価結果を入力することができる。ユーザデータベース更新部118は、ステップS105において、ユーザによって画像が移動された先の位置を検出することでユーザの評価を取得する。ユーザデータベース更新部118は、取得した評価に基づいて、ステップS106においてユーザデータベース144の更新を行う。第1の変形例と同様に、実数の評価値を得ることができるので、評価値を重みとして、この重みを考慮して効率的にユーザデータベース144を更新することができる。
【0049】
[第1の実施形態の第4の変形例]
第1の実施形態の第4の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、ユーザが設定した第1のクラスをユーザが再評価できる。このため、例えば図7又は図12に示すような画像において、第1のクラスに対しても、第2のクラスに対するものと同様のチェックボックスやスライダを設ける。また、図14に示すように、2次元グラフにおいて、縦軸が「山」という第1のクラスの適切さを示し、横軸が「木」という第2のクラスの適切さを示すようなグラフを設定する。また、図15に示すように、2次元グラフにおいて、縦軸が「山」という第1のクラスの適切さを示し、横軸が「花」という第2のクラスの適切さを示すようにグラフを設定する。
【0050】
推薦クラス生成部114から複数の第2のクラスが出力される場合、例えば、図14に示すようなGUIと図15に示すようなGUIとを、出力装置150に順次表示し、ユーザの評価結果を、順次入力できるようにすることができる。このように、第2のクラスの数だけこのような2次元グラフの表示を繰り返せばよい。また、例えば、図14に示すようなGUIと図15に示すようなGUIとを、ディスプレイに並べて同時に表示することで、ユーザの評価結果を入力できるように構成することができる。
【0051】
また、図16に示すように、表示領域401に、3次元座標系412を設定し、1つの軸を第1のクラスの適切さを示す軸とし、他の2軸を第2のクラスの適切さを示す軸とすることができる。ユーザは、読み込んだ画像413の表示された位置を、評価結果を表すような3次元グラフ上の画像414の位置に、GUIにより移動させることができる。このようにしてユーザは、クラスの適切さの評価結果を入力することができる。
【0052】
[第1の実施形態の第5の変形例]
第1の実施形態の第5の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、推薦クラス生成部114が、ユーザが設定した第1のクラスに対して信頼度を付与した第2のクラスを生成する。
【0053】
本変形例を図17に示す模式図を参照して説明する。この例では、ステップS101において、教師データ作成部112が画像301を取得したとする。教師データ作成部112は、取得した画像301を出力装置150に表示させ、画像301をユーザに提示する。ユーザは、出力装置150に表示された画像301を確認し、その画像301に対応する言葉である「山」を、第1のクラス302として入力装置160に入力する。推薦クラス生成部114は、ステップS102において、ユーザが設定した「山」という第1のクラスを入力装置160から取得する。
【0054】
推薦クラス生成部114は、ステップS103において、類似/共起/関連データベース142とユーザデータベース144とを参照して、第1のクラス「山」に類似、共起又は関連する第2のクラスとして、「木」という第2のクラス303と「花」という第2のクラス304とを生成する。さらに、推薦クラス生成部114は、「木」という第2のクラス303の信頼度を例えば0.8と算出し、その信頼度の情報307もユーザデータベース更新部118に出力する。同様に、関連語生成部113は、「花」という第2のクラス304の信頼度を例えば0.7と算出し、その信頼度の情報308もユーザデータベース更新部118に出力する。
【0055】
推薦クラス生成部114は、ステップS104において、出力装置150に、「木」という第2のクラス303について、○及び×並びにそれらに対応するチェックボックスを含む画像305と、「花」という第2のクラス304について、○及び×並びにそれらに対応するチェックボックスを含む画像306とを表示させる。この場合、ユーザは、画像305及び画像306を確認しながら、チェックボックスと入力装置160を用いて、「木」という第2のクラス303と「花」という第2のクラス304とのそれぞれについて、○又は×の2者択一によって評価結果の入力を行うことができる。ステップS106においてユーザデータベース更新部118は、ユーザの評価結果とそれぞれの第2のクラスに対する信頼度に基づいて、ユーザデータベース144を更新する。このように信頼度に基づく重みを考慮してユーザデータベース144を更新すると、より早く精度のよいユーザデータベースが作成される。
【0056】
なお、ユーザによる評価は、○又は×の2者択一によらずとも、図12乃至16を参照して説明した第2乃至第4の変形例のように、実数値による評価でもよい。この場合、例えば、ユーザの評価と、関連語生成部113が算出した信頼度との和や積を重みとして、ユーザデータベース更新部118がユーザデータベース144を更新してもよい。
【0057】
[第1の実施形態の第6の変形例]
第1の実施形態の第6の変形例について、第1の実施形態との相違点について説明する。第1の実施形態と同一の部分については同一の符号を付して説明を省略する。本変形例では、GUIにおいて、例えばディスプレイである出力装置150に表示された複数の第2のクラスの位置を、ユーザが入れ替えることで第2のクラスの重要度を入力する。
【0058】
本変形例を図18を参照して説明する。この例では、ステップS101において、教師データ作成部112が画像301を取得したとする。教師データ作成部112は、取得した画像301を出力装置150に表示させ、画像301をユーザに提示する。ユーザは、出力装置150に表示された画像301を見て、その画像301に対応する言葉である「山」を第1のクラスとして入力装置160に入力する。推薦クラス生成部114は、ステップS102において、ユーザが設定した「山」という第1のクラスを取得する。
【0059】
推薦クラス生成部114は、ステップS103において、第1のクラス「山」に類似、共起又は関連する第2のクラスとして、類似/共起/関連データベース142とユーザデータベース144に基づいて算出される推薦度が高いものから順に、第1候補「木」311と、第2候補「花」312と、第3候補「川」313とを生成する。推薦クラス生成部114は、ステップS104において、出力装置150にGUIとして、例えば第1候補「木」311と、第2候補「花」312と、第3候補「川」313とを、上から順に表示させる。
【0060】
ユーザは、自己の評価結果に基づいて、このGUIにおいて候補の順序を入れ換える。例えばより重要度が高いものを上に表示するように、ユーザは各候補の位置を入れ替える。ユーザデータベース更新部118は、ステップS105において、この入れ換えを取得し、ステップS106において、その入れ換え結果に基づいてユーザデータベース144を更新する。本変形例によれば、ユーザは、第2のクラスに対する自己の評価をより直感的に入力することができる。
なお、本変形例の説明では、推薦度が高いものから順に3つの第2のクラスをユーザに提示する例を示したが、ユーザに提示する第2のクラスはいくつでもよいことはもちろんである。
【0061】
[第2の実施形態]
本発明の第2の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については、同一の符号を付してその説明を省略する。本実施形態は、ユーザが複数の第1のクラスを入力する例である。
【0062】
例えば、ある画像に対してユーザが「山」と「川」という2つのキーワードを第1のクラスとしてクラス設定部120から入力したとする。このとき、推薦クラス生成部114は、「山」という第1のクラスと「川」という第1のクラスとに対して統計処理を施す。ここで、統計処理として例えば協調フィルタリングを用いることができる。なお、推薦クラス生成部114は、この統計処理においてユーザデータベース144を用いる。その結果、推薦クラス生成部114は、「山」という第1のクラスと「川」という第1のクラスとに基づいて、「空」という第2のクラスを生成する。本実施形態では、出力装置150によって、「空」という第2のクラスがユーザに提示され、この第2のクラスに対する評価が入力される。教師データ作成部112は、画像と、「山」及び「川」という第1のクラスと、「空」という第2のクラス及びそれに対するユーザの評価とに基づいて、教師データを作成する。また、ユーザデータベース更新部118は、ユーザの評価に基づいて、ユーザデータベース144を更新する。
【0063】
本実施形態によれば、推薦クラス生成部114は、クラス設定部120から出力された複数の第1のクラスに互いに関連、類似又は共起する第2のクラスを選定するので、各第1のクラスに類似、共起又は関連する第2のクラスのみを選定する場合とは異なる新たな第2のクラスを選定することができる。その結果、教師データ作成装置100は、より多様なクラスを出力できるようになる。
【0064】
[第2の実施形態の変形例]
第2の実施形態の変形例について、第2の実施形態との相違点について説明する。本変形例では、ユーザが入力した「山」及び「川」という第1のクラスと、「山」及び「川」という第1のクラスに基づいて作成した「空」という第2のクラスに加えて、第1の実施形態の場合と同様に、図4を参照して説明したような類似表1421を用いて、第1の実施形態と同様に第2のクラスを生成する。すなわち、推薦クラス生成部114は、「山」という第1のクラスに対する「木」という第2のクラスを生成し、「川」という第1のクラスに対する「海」という第2のクラスを生成する。以上によって、推薦クラス生成部114は、「木」、「海」、「空」という第2のクラスをユーザに提示する。
【0065】
本変形例において教師データ作成部112は、ユーザによる評価を考慮した「木」、「海」、「空」という第2のクラスと、「山」及び「川」という第1のクラスとを用いて教師データを作成する。
【0066】
本変形例によっても第2の実施形態と同様に、各第1のクラスに類似、共起又は関連する第2のクラスのみを選定する場合とは異なる、新たな第2のクラスを選定することができる。その結果、教師データ作成装置100は、より多様なクラスを出力できるようになる。
【0067】
[第3の実施形態]
本発明の第3の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については、同一の符号を付してその説明を省略する。本実施形態も、ユーザが複数の第1のクラスを入力する例である。本実施形態では、類似/共起/関連データベース142に基づいて、ユーザが入力した複数の第1のクラスに対する類似度表を作成し、作成した類似度表に基づいて第2のクラスを生成する。
【0068】
例えば、ある画像に対してユーザが「山」と「川」という2つのキーワードを第1のクラスとしてクラス設定部120から入力したとする。このとき、推薦クラス生成部114は、図4にその一部の例を示したような類似/共起/関連データベース142を参照して、例えば「山」に対する関連度と「川」に対する関連度との和を算出し、例えば図19のようなユーザ類似度表1463を作成する。推薦クラス生成部114は、このユーザ類似度表1463と、ユーザデータベース144とに基づいて、例えば「木」という第2のクラスを生成する。その他の動作は第1の実施形態と同様である。本実施形態によれば、複数の第1のクラスに応じた第2のクラスを生成することができる。
【0069】
[第4の実施形態]
本発明の第4の実施形態について説明する。ここでは、第1の実施形態との相違点について説明し、同一の部分については同一の符号を付して、その説明は省略する。本実施形態では、クラス設定部120から入力する第1のクラスを複数のカテゴリに分類したときに、推薦クラス生成部114は、複数のカテゴリ間の関連性に基づいて関連語の選定を行う。
【0070】
図4に示す表には、画像内に存在する物体に関する言葉とその関連性が示されている。このような物体に関する複数の言葉を1つのカテゴリと考える。このようなカテゴリの他にも、例えば図20に示すようなカテゴリを考えることもできる。図20には、画像内の状態に関する言葉とその関連性が示されている。このように、言葉はいくつかのカテゴリに分類され得る。本実施形態では、推薦クラス生成部114は、同一のカテゴリから第2のクラスを選定するのみならず、異なるカテゴリ間での言葉の関連性に基づいて、クラス設定部120から入力したキーワードが属するカテゴリ以外のカテゴリに属する関連語を選定する。
【0071】
例えばクラス設定部120からユーザが図4に示すような物体的なカテゴリから「山」という第1のクラスを入力し、それとともに図19に示すような状態的なカテゴリから「暖かい」という第1のクラスを入力する場合を考える。このとき、「山」と「暖かい」という第1のクラスから、推薦クラス生成部114は、類似/共起/関連データベース142及びユーザデータベース144に基づいて、前記物体的なカテゴリとも前記状態的なカテゴリとも異なる季節というカテゴリに属する「春」という第2のクラスを選定する。
【0072】
このようなカテゴリの異なる関連語を生成する場合に、カテゴリについての優先度の評価を行うことも可能である。推薦クラス生成部114は、カテゴリの優先度を考慮の上、各カテゴリに含まれる言葉から、異なるカテゴリ間の関係に基づいて、関連語を選定することができる。すなわち、推薦クラス生成部114は、カテゴリの優先度も考慮した関連語の選定を行うことができる。
【0073】
本実施形態によれば、選定された第2のクラスに対するユーザの評価に基づいて、ユーザデータベース更新部118がユーザデータベース144の更新を行うことで、推薦クラス生成部114は、より多様でユーザの嗜好にマッチした第2のクラスを生成することが可能となる。
【0074】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても、発明が解決しようとする課題の欄で述べられた課題が解決でき、かつ、発明の効果が得られる場合には、この構成要素が削除された構成も発明として抽出され得る。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0075】
100…教師データ作成装置、110…演算装置、112…教師データ作成部、113…関連語生成部、114…推薦クラス生成部、116…GUI制御部、118…ユーザデータベース更新部、120…クラス設定部、130…データ読み込み部、132…データ入力部、134…データベース記憶装置、140…記憶装置、142…類似/共起/関連データベース、1421…類似度表、144…ユーザデータベース、1441,1442…重み付け表、1461,1462,1463…ユーザ類似度表、150…出力装置、160…入力装置。
【特許請求の範囲】
【請求項1】
認識システムの学習に用いる教師データの作成方法であって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、
前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、
前記第2のクラスを前記ユーザに提示する第3のステップと、
前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、
前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、
前記評価に基づいて、前記重み係数を更新する第6のステップと、
を含むことを特徴とする教師データの作成方法。
【請求項2】
前記第2のステップにおいて、各々が推薦度を有する複数の前記第2のクラスを生成し、
前記第3のステップにおいて、複数の前記第2のクラスを前記推薦度順に並べて提示し、
前記第4のステップにおいて、前記推薦度順に並べられた前記第2のクラスを前記ユーザが並べ替える操作を検出することで前記ユーザの評価を受け取る、
ことを特徴とする請求項1に記載の教師データの作成方法。
【請求項3】
前記第1のステップにおいて、複数の前記第1のクラスを受け取り、
前記第1のデータベースは、複数の前記第1のクラスの組み合わせに対する前記第2のクラスの類似度、共起度又は関連度を記録しており、
前記第2のステップにおいて、前記第1のデータベースに基づいて、複数の前記第1のクラスの組み合わせに応じた前記第2のクラスを生成する、
ことを特徴とする請求項1又は2に記載の教師データの作成方法。
【請求項4】
前記第1のステップにおいて、複数の前記第1のクラスを受け取り、
前記第1のデータベースは、複数の前記第1のクラスのそれぞれに対する前記第2のクラスの類似度、共起度又は関連度を記録したデータを有しており、
前記第2のステップは、
前記第1のデータベースに基づいて、複数の前記第1のクラスの組み合わせに応じた類似度、共起度又は関連度を算出することと、
前記算出した複数の前記第1のクラスの組み合わせに応じた類似度、共起度又は関連度に基づいて前記第2のクラスを生成することと、
を含む、
ことを特徴とする請求項1又は2に記載の教師データの作成方法。
【請求項5】
前記第1のデータベースは、協調フィルタリングを用いて作成されることを特徴とする請求項1乃至4のうち何れか1項に記載の教師データの作成方法。
【請求項6】
複数の前記第1のクラスは、それぞれ異なるカテゴリに属するクラスであることを特徴とする請求項4に記載の教師データの作成方法。
【請求項7】
前記重み係数は、前記第1のクラスと前記第2のクラスとの組み合わせ毎に設定されており、
前記重み係数は、前記第1のクラスと前記第2のクラスとの組み合わせ毎に前記評価に基づいて更新される、
ことを特徴とする請求項1乃至6のうち何れか1項に記載の教師データの作成方法。
【請求項8】
認識システムの学習に用いる教師データの作成のためのプログラムであって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、
前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、
前記第2のクラスを前記ユーザに提示する第3のステップと、
前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、
前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、
前記評価に基づいて、前記重み係数を更新する第6のステップと、
をコンピュータに発揮させることを特徴とする教師データの作成のためのプログラム。
【請求項9】
認識システムの学習に用いる教師データを作成するための教師データ作成装置であって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部と、
前記第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、
前記第2のクラスに対する重み係数を含む第2のデータベースと、
前記第1のデータベースと前記第2のデータベースとに基づいて、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの前記第2のクラスを生成する推薦クラス生成部と、
前記第2のクラスを前記ユーザに提示する出力部と、
前記第2のクラスに対する前記ユーザの評価を受け取る入力部と、
前記評価に基づいて、前記重み係数を更新するデータベース更新部と、
前記評価に基づいて変更した前記第2のクラスと、前記基礎データと、前記第1のクラスとに基づいて教師データを作成する教師データ作成部と、
を具備することを特徴とする教師データ作成装置。
【請求項1】
認識システムの学習に用いる教師データの作成方法であって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、
前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、
前記第2のクラスを前記ユーザに提示する第3のステップと、
前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、
前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、
前記評価に基づいて、前記重み係数を更新する第6のステップと、
を含むことを特徴とする教師データの作成方法。
【請求項2】
前記第2のステップにおいて、各々が推薦度を有する複数の前記第2のクラスを生成し、
前記第3のステップにおいて、複数の前記第2のクラスを前記推薦度順に並べて提示し、
前記第4のステップにおいて、前記推薦度順に並べられた前記第2のクラスを前記ユーザが並べ替える操作を検出することで前記ユーザの評価を受け取る、
ことを特徴とする請求項1に記載の教師データの作成方法。
【請求項3】
前記第1のステップにおいて、複数の前記第1のクラスを受け取り、
前記第1のデータベースは、複数の前記第1のクラスの組み合わせに対する前記第2のクラスの類似度、共起度又は関連度を記録しており、
前記第2のステップにおいて、前記第1のデータベースに基づいて、複数の前記第1のクラスの組み合わせに応じた前記第2のクラスを生成する、
ことを特徴とする請求項1又は2に記載の教師データの作成方法。
【請求項4】
前記第1のステップにおいて、複数の前記第1のクラスを受け取り、
前記第1のデータベースは、複数の前記第1のクラスのそれぞれに対する前記第2のクラスの類似度、共起度又は関連度を記録したデータを有しており、
前記第2のステップは、
前記第1のデータベースに基づいて、複数の前記第1のクラスの組み合わせに応じた類似度、共起度又は関連度を算出することと、
前記算出した複数の前記第1のクラスの組み合わせに応じた類似度、共起度又は関連度に基づいて前記第2のクラスを生成することと、
を含む、
ことを特徴とする請求項1又は2に記載の教師データの作成方法。
【請求項5】
前記第1のデータベースは、協調フィルタリングを用いて作成されることを特徴とする請求項1乃至4のうち何れか1項に記載の教師データの作成方法。
【請求項6】
複数の前記第1のクラスは、それぞれ異なるカテゴリに属するクラスであることを特徴とする請求項4に記載の教師データの作成方法。
【請求項7】
前記重み係数は、前記第1のクラスと前記第2のクラスとの組み合わせ毎に設定されており、
前記重み係数は、前記第1のクラスと前記第2のクラスとの組み合わせ毎に前記評価に基づいて更新される、
ことを特徴とする請求項1乃至6のうち何れか1項に記載の教師データの作成方法。
【請求項8】
認識システムの学習に用いる教師データの作成のためのプログラムであって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取る第1のステップと、
前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの第2のクラスを、該第1のクラスと該第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、該第2のクラスに対する重み係数を含む第2のデータベースとに基づいて生成する第2のステップと、
前記第2のクラスを前記ユーザに提示する第3のステップと、
前記第2のクラスに対する前記ユーザの評価を受け取る第4のステップと、
前記基礎データと、前記第1のクラスと、前記第2のクラスと、前記評価とに基づいて教師データを作成する第5のステップと、
前記評価に基づいて、前記重み係数を更新する第6のステップと、
をコンピュータに発揮させることを特徴とする教師データの作成のためのプログラム。
【請求項9】
認識システムの学習に用いる教師データを作成するための教師データ作成装置であって、
基礎データに対して出力されるべきであるとユーザが指定する第1のクラスを受け取るクラス設定部と、
前記第1のクラスと第2のクラスとの類似度、共起度又は関連度についての情報を記録した第1のデータベースと、
前記第2のクラスに対する重み係数を含む第2のデータベースと、
前記第1のデータベースと前記第2のデータベースとに基づいて、前記第1のクラスに類似、共起又は関連するクラスとして少なくとも1つの前記第2のクラスを生成する推薦クラス生成部と、
前記第2のクラスを前記ユーザに提示する出力部と、
前記第2のクラスに対する前記ユーザの評価を受け取る入力部と、
前記評価に基づいて、前記重み係数を更新するデータベース更新部と、
前記評価に基づいて変更した前記第2のクラスと、前記基礎データと、前記第1のクラスとに基づいて教師データを作成する教師データ作成部と、
を具備することを特徴とする教師データ作成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【公開番号】特開2013−25745(P2013−25745A)
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2011−163005(P2011−163005)
【出願日】平成23年7月26日(2011.7.26)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願日】平成23年7月26日(2011.7.26)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
[ Back to top ]