説明

マルチメディアコンテンツの推薦キーワード生成システム及びその方法

【課題】放送コンテンツとの高い相関度を有し、視聴者の関心が反映された推薦キーワードを生成するシステム及び方法が開示される。
【解決手段】特定放送コンテンツの放送時間及びキーワードを用いて前記コンテンツの視聴見込者グループが生成され、前記コンテンツの放送時間の前後を含む所定時間の間に前記視聴見込者が伝送した検索語のうち、前記コンテンツとの相関度がしきい値以上である検索語が選択されることによってキーワードセットが生成される。前記キーワードセット内の各キーワードに対する時間帯別検索回数を用いて前記キーワードセットから時間帯別キーワードが抽出され、前記コンテンツの再生時間に同期化された再生時間帯別推薦キーワードが格納される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチメディアコンテンツと関連した推薦キーワードを生成して提供できるシステム及び方法に関するもので、より詳細には、特定時間帯に放送されるコンテンツの視聴見込者から収集した現実的に信頼性のあるキーワードを推薦キーワードとして活用できるシステム及び方法に関するものである。
【背景技術】
【0002】
最近、放送技術とデータ通信技術が融合するにつれ、ビデオ・オン・デマンド(VOD)、データ放送、T―コマース、IPテレビなどの様々なインタラクティブ放送サービスが活発に開発されている。
【0003】
このようなインタラクティブ放送は、ユーザに放送コンテンツを提供するだけでなく、リターンチャンネルを用いて視聴者の要求を反映しており、視聴者が直接選択したコンテンツを提供するサービスが可能である。
【0004】
一方、インターネットの多様なサービスが放送と融合するにつれ、インターネットサービスのうち最も主要なサービスの一つである検索サービスも放送受信機器で提供可能になった。一例として、IPテレビは、インターネットIPベースのネットワークを用いて、放送コンテンツと同様に放送と融合した多様な既存のIPベースのサービスを提供している。
【0005】
特に、放送コンテンツに対する視聴者の好奇心を直ちに満足させるコンテンツ関連キーワード検索サービスには、現在も多くの需要が存在している。
【0006】
図1は、従来技術に係るコンテンツ関連補充情報を検索するシステムを概略的に示した図である。
【0007】
特許文献1は、ラジオ聴取者又はテレビ視聴者が、リアルタイムに受信される放送番組に関する補充情報を受ける構成を開示している。
【0008】
図1に示した従来技術のシステムは、放送受信装置10、ユーザ装置11、放送局21、チャンネル情報サーバ22及びウェブサーバ23を含む。
【0009】
放送受信装置10は、放送局21から伝送される放送コンテンツを受信する。
【0010】
チャンネル情報サーバ22は、放送局21から放送される放送コンテンツ別に補充情報に関するURLを提供している。視聴者が現在放送されるコンテンツに関する補充情報を検索したいときは、ユーザ装置11を用いてチャンネル情報サーバ22に補充情報に関するURLを要請する。
【0011】
チャンネル情報サーバ22は、チャンネル又は放送番組の主題別URLをユーザ装置11に伝送し、ユーザ装置11は、前記主題別URLを用いてウェブサーバ23から補充情報を検索する。
【0012】
一方、特許文献2は、現在放送中の番組の芸能人と商品情報を予め格納したDBを用いて、前記芸能人と商品情報を、電子番組ガイド(EPG)を基盤にして提供する技術を開示している。
【0013】
また、特許文献3は、テレビで放送される番組に関する情報を含むウェブサイトを用いて、放送番組と前記情報を共にディスプレイする技術を開示している。
【0014】
しかしながら、このような従来技術では、番組と関連した情報を予め格納することを前提にしているが、このような番組関連情報に関する検索語キーワードや主題を収集する手段は全く提供されていない。
【0015】
結局、従来技術では、管理者の選択によって放送番組コンテンツに関する補充情報又は関連情報を手作業で収集して提供するしかない。ところが、この場合、数多くの放送コンテンツに対して関連性の高い情報を提供することは現実的に不可能である。また、特定コンテンツに対する多様な検索キーワードが存在し得るが、このような多様な検索キーワードを手作業で設定することにも限界がある。さらに、このように管理者が選択した関連情報は、視聴者が検索しようとする情報と一致する可能性が非常に低いだけでなく、視聴者に提供される情報量も、予め準備しておいた情報データに限定されるので、非常に制限的であるといえる。
【0016】
上記のように、手作業で予め準備しておいたコンテンツに関するキーワードや情報を放送番組と同期させて提供する技術は、視聴者の関心と一致しないという問題を有する。
【0017】
したがって、上述した各従来技術は、コンテンツと高い相関度を有し、視聴者の関心が反映されたコンテンツ関連キーワードを提供する方法を開示していない。
【先行技術文献】
【特許文献】
【0018】
【特許文献1】韓国公開特許第2003―96362号
【特許文献2】韓国公開特許第2002―81767号
【特許文献3】韓国公開特許第2004―101235号
【発明の概要】
【発明が解決しようとする課題】
【0019】
上述した問題点を解決するために、本発明は、視聴者の関心が反映されたコンテンツ関連キーワードを提供するシステム及び方法を提供する。
【0020】
また、本発明は、コンテンツとの相関度が高い多様なキーワードを推薦できるシステム及び方法を提供する。
【0021】
また、本発明は、コンテンツの再生時間帯別に視聴者の関心を反映しコンテンツとの相関度が高い推薦キーワードを提供するシステム及び方法を提供する。
【0022】
また、本発明は、コンテンツの多様な応用に互換し得るコンテンツ別推薦キーワードをデータベースに格納するシステム及び方法を提供する。
【課題を解決するための手段】
【0023】
上述した技術的課題を解決するための本発明の第1の側面によるコンテンツ別推薦キーワードを生成するシステムは、コンテンツと関連した予め定められたシードキーワード及び前記コンテンツの放送時間を格納するシードキーワードDBと、前記放送時間及び前記シードキーワードを用いて検索エンジンに検索語を伝送したユーザのうち前記コンテンツの視聴見込者を分類する視聴見込者分類部と、前記視聴見込者のユーザ識別番号と前記放送時間に基づいて、前記視聴見込者が伝送した検索語のうちコンテンツとの相関度がしきい値以上であるキーワードを選択してキーワードセットを生成する推薦キーワード生成部とを含む。
【0024】
また、前記推薦キーワード生成システムは、前記キーワードセットに含まれたキーワードの放送時間帯別検索回数に基づいて、前記コンテンツの再生時間帯別推薦キーワードを生成するコンテンツ―キーワード時間同期化部をさらに含むことができる。
【0025】
ここで、前記視聴見込者分類部は、前記放送時間の前後を含む所定時間の間にシードキーワードを検索したユーザが予め定められた回数以上前記シードキーワードを入力した場合、前記ユーザを視聴見込者として分類することができる。
【0026】
なお、前記推薦キーワード生成部は、前記視聴見込者が検索した特定キーワードの検索回数と前記視聴見込者が検索した全てのキーワードの検索回数との比率を用いて前記キーワードセットを生成することができる。
【0027】
また、本発明の第2の側面によれば、コンテンツ別推薦キーワードを生成する方法は、コンテンツと関連して予め格納されたシードキーワード及び前記コンテンツの放送時間を用いて前記コンテンツの視聴見込者を分類し、前記視聴見込者が前記コンテンツの放送時間を含む所定時間の間に伝送した検索語のうち前記コンテンツとの相関度がしきい値以上であるキーワードを選択して推薦キーワードセットを生成することを含む。
【0028】
なお、前記推薦キーワードセットを生成することにおいて、特定キーワードに対する視聴見込者の検索回数と非視聴見込者の検索回数との比率を用いて前記キーワードセットを生成することができる。
【0029】
また、前記推薦キーワードセットを生成することにおいて、前記特定キーワードを検索した視聴見込者の数をさらに用いて前記キーワードセットを生成したり、前記放送時間を含む所定時間帯の前記キーワードの検索回数比率をさらに用いて前記キーワードセットを生成することができる。
【0030】
また、本発明の第3の側面によれば、コンテンツ別推薦キーワードを提供するデータ構造が記録された記録媒体において、前記データ構造は、コンテンツを識別するコンテンツ識別データと、前記コンテンツの全体再生時間を予め定められた値で分割した再生時間帯別識別データと、前記再生時間帯別識別データに対応する少なくとも一つ以上の再生時間帯別キーワードデータとを含み、前記再生時間帯別キーワードデータは、前記コンテンツの再生時間と同期化されて提供される。
【発明の効果】
【0031】
本発明によれば、視聴者の関心が反映され、コンテンツとの相関度が高い推薦キーワードを提供することができる。
【0032】
また、本発明は、コンテンツの再生時間帯別にユーザの関心が反映され、コンテンツとの相関度が高い推薦キーワードを提供することによって、多様なコンテンツの応用サービスに互換し得るようにコンテンツ別推薦キーワードをデータベースに格納したり、ファイル形式で提供することができる。
【図面の簡単な説明】
【0033】
【図1】コンテンツに関連する補充情報を検索する従来システムを概略的に示した図である。
【図2】本発明の一実施例に係る推薦キーワード提供システムを示したブロック図である。
【図3】本発明の一実施例に係るシードキーワードDB121に格納されたデータ構造を示した図である。
【図4】本発明の一実施例に係る視聴見込者DB122に格納されたデータ構造を示した図である。
【図5】本発明の一実施例に係るコンテンツ別推薦キーワードDB123のデータ構造及びこれを生成する過程を示した図である。
【図6】本発明の一実施例に係る推薦キーワード生成方法を示したフローチャートである。
【図7】本発明の一実施例に係る視聴見込者グループを分類し格納する方法をより具体的に示したフローチャートである。
【図8】本発明の一実施例に係るキーワードセットを生成する方法を具体的に示したフローチャートである。
【図9】本発明の一実施例に係るコンテンツ再生時間帯別推薦キーワードを生成する方法を具体的に示したフローチャートである。
【図10】本発明の一実施例に係る推薦キーワードが活用される画面の概観を示した図である。
【発明を実施するための形態】
【0034】
以下、本発明の属する技術分野で通常の知識を有する者が容易に実施できるように、添付の図面を参照して本発明の実施例を詳細に説明する。本発明は、多様な形態で具現可能であり、ここで説明する実施例によって限定されるものでない。そして、図面では、本発明を明確に説明するために、説明と関係のない部分は省略し、明細書全体にわたって類似した部分には類似した図面符号を付した。
【0035】
明細書全体で、一つの部分が他の部分と「連結」されているというとき、これは、「直接的に連結」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結」されている場合も含む。また、一つの部分が一つの構成要素を「含む」というとき、これは、特別に反対の記載がない限り、他の構成要素を除外するのでなく、他の構成要素をさらに含むことができることを意味する。
【0036】
本明細書で使用される「検索語」という用語は、ユーザが検索エンジンを介して入力した単語又は単語の組み合わせを意味する。
【0037】
また、本明細書で使用される「キーワード」という用語は、特定コンテンツと関連する可能性のある単語又は単語の組み合わせを意味する。
【0038】
したがって、「キーワード」は、既に入力された「検索語」から選択されてもよい。
【0039】
図2は、本発明の一実施例に係る推薦キーワード提供システムを示したブロック図である。
【0040】
推薦キーワード提供システム100は、概略コンテンツ別推薦キーワード生成部110及びDBサーバ120を含む。
【0041】
コンテンツ別推薦キーワード生成部110は、視聴見込者分類部111、推薦キーワード生成部112及びコンテンツ―キーワード時間同期化部113を含む。DBサーバ120は、シードキーワードDB121、視聴見込者DB122及びコンテンツ別推薦キーワードDB123を含む。
【0042】
推薦キーワード提供システム100は、通常の検索エンジン200と互いに連動して動作してもよい。本発明の一実施例に係る推薦キーワード提供システム100は、検索エンジンに伝送された検索クエリのログを格納した検索クエリログDB210の情報を実際に活用することができる。
【0043】
以下、各構成要素の動作及び各構成要素相互の関係について詳細に説明する。
【0044】
放送番組が放送受信装置10を通して放送される場合、統計によれば、放映時間の前後にわたって放送番組に関するキーワード検索がユーザ装置11の中で集中的に実行される。
【0045】
このような検索クエリは、検索エンジン200が受信し、通常の検索サービスシステムは、検索クエリログDB210に検索キーワード、検索時間及びユーザ識別番号が格納される。
【0046】
この場合では、前記ユーザ識別番号は、例えば、Bcookieであってもよい。前記Bcookieは、ユーザ装置11に与えられる一種の識別番号であり、会員登録及び会員ログインと関係なしにユーザがユーザ装置11を介して検索ページに接続したとき、例えば、IPアドレス及びブラウザセッション値などに基づいて与えられるシリアルナンバーである。前記Bcookieは、ユーザによって削除されない限り、検索ページに再接続時にも使用可能であるので、1台のPCに与えられるシリアルナンバーとしてユーザ装置11を識別するために使用される。
【0047】
以下では、Bcookieのようにユーザを識別する値を「ユーザ識別番号」と称して本発明の実施例を説明する。
【0048】
視聴見込者分類部111は、検索エンジン200及びシードキーワードDB121と連動して動作する。
【0049】
シードキーワードDB121には、特定放送番組と関連した基本的なキーワード、すなわち、コンテンツ名と放送時間に対応するシードキーワードが格納されている。例えば、コンテンツの番組名(第何話、副題)及び放映日時は、シードキーワードに対応して共に格納される。この場合、前記シードキーワードは、前記放送コンテンツの名称又はその変形名称を含んでもよい。一方、シードキーワードはカテゴリ別に分類され、各カテゴリには異なる加重値が与えられる。例えば、ドラマカテゴリのうち、第1のカテゴリはタイトル及び配役名を含み、第2のカテゴリは俳優名及び製作陣を含んでもよい。この場合、検索頻度のより高い第1のカテゴリには、第2のカテゴリより高い加重値が与えられる。
【0050】
視聴見込者分類部111は、放送時間の前後にわたった所定の時間区間内に検索エンジン200が受信した検索語のうち前記シードキーワードDB121に格納されたシードキーワードがあるかどうかを調査し、前記シードキーワードを検索したユーザの識別番号を、例えば、Bcookieなどから読み取る。読み取られたユーザ識別番号は、視聴見込者として分類される。この時に、視聴見込者として分類するために、接続が正常かどうかを調査し、しきい値回数以上のシードキーワードを入力したユーザの識別番号を視聴見込者として分類してもよい。ここで、検索エンジンが検索ウィンドウ上に検索語の自動補完機能を提供する場合は、自動補完機能により得られた検索語を入力したユーザが視聴見込者として含まれてもよいが、検索エンジンサイトの画面で既に提供された検索語(例えば、人気検索語、推薦検索語)を入力したユーザは視聴見込者から除外される。
【0051】
視聴見込者が分類されれば、前記視聴見込者のユーザ識別番号は視聴見込者DB122に格納される。視聴見込者DB122には、特定放送コンテンツ又は特定放送コンテンツのシリーズやグループとマッチングされたユーザ識別番号が格納される。
【0052】
推薦キーワード生成部112は、視聴見込者DB122を参照して該当コンテンツの放送時間帯に視聴見込者が伝送した検索語を収集する。また、収集された検索語が特定条件を満足する場合、推薦キーワード生成部112は該当検索語をキーワードとして分類し、該当キーワードをキーワードセットに付け加える。前記特定条件としては、例えば、キーワードと該当コンテンツとの相関度がしきい値以上であることが挙げられる。
【0053】
例えば、放送時間中の該当キーワードに対する視聴見込者の検索回数の比率を、以下の特定条件として考慮することができる。すなわち、該当キーワードを検索したユーザの数が予め定めた値以上になること、又は該当キーワードの検索回数が特定時間帯(例えば、該当コンテンツの放送時間)に集中することを条件にすることができる。
【0054】
推薦キーワード生成部112は、上述した条件を満足するキーワードを該当コンテンツに対する推薦キーワードとして分類し、該当コンテンツに関するキーワードセットを生成する。
【0055】
コンテンツ―キーワード時間同期化部113は、前記キーワードセットに含まれたキーワードをコンテンツの再生時間帯別にマッチングさせる機能を行う。例えば、60秒間隔で時間帯別キーワードの検索回数を測定し、各時間帯別検索回数比率の高いキーワードを選定する。この場合、予め定められた適切でないキーワードは除外される。例えば、「生放送」、「再放送」、「再視聴」、「番組編成」、「放映時間」などのようなキーワードは不適切なキーワードとして除去する。検索クエリログDB210は、推薦キーワードとして選定されたキーワードに関する検索時間情報をさらに含んでいる。したがって、コンテンツの放送開始時間とキーワードの検索時間とを組み合わせれば、コンテンツ再生時間帯とキーワード検索時間を同期化させることができる。
【0056】
最終的に、コンテンツ別にマッチングされたキーワードは、コンテンツ別推薦キーワードDB123に格納される。コンテンツ別推薦キーワードDB123は、それぞれのコンテンツの再生時間帯と同期化された推薦キーワードを格納する。したがって、特定コンテンツが多様なサービスを通して提供される場合、コンテンツ別推薦キーワードDB123に格納されたデータを別途のファイルとして共に提供することができる。この場合、視聴者は、前記ファイルを用いてコンテンツを鑑賞するとともに、コンテンツ再生時間と同期化された推薦キーワードを用いることができる。
【0057】
図3は、本発明の一実施例に係るシードキーワードDB121に格納されたデータ構造を示した図である。
【0058】
シードキーワードDB121は、各コンテンツに対応する放送時間及びシードキーワードを格納している。例えば、Xファイル第1話の放送時間と、シードキーワードとして「Xファイル」、「宇宙人」などの最も基礎的なキーワードを格納する。
【0059】
上述したように、特定コンテンツと関連したキーワードが放送時間の前後にわたってますます検索されるので、Xファイル第1話が放映される時間前後の所定の時間帯にシードキーワードを検索したユーザは、前記Xファイル第1話を視聴している視聴見込者であると判断される。
【0060】
上述したように、シードキーワードが放送されるコンテンツ別に設定される場合、本発明の一実施例によってコンテンツ別の視聴見込者の候補を収集することができる。
【0061】
図4は、本発明の一実施例に係る視聴見込者DB122に格納されたデータ構造を示した図である。
【0062】
上述した過程を経て視聴見込者が分類されれば、各視聴見込者のユーザ識別番号(UID_1、UID_2、UID_3)は、該当コンテンツとマッチングされて視聴見込者DB122に格納される。したがって、今後、同一種類のコンテンツの放送時間帯中に視聴見込者から伝送された検索語は、前記コンテンツに対応する推薦キーワードの候補になる。
【0063】
図5は、本発明の一実施例に係るコンテンツ別推薦キーワードDB123のデータ構造及びこれを生成する過程を示した図である。
【0064】
視聴見込者DB122に格納された各コンテンツに対するユーザ識別番号を通して該当コンテンツの視聴見込者を把握できるので、検索クエリログDB210に格納された検索クエリログを分析することによって推薦キーワードを生成することができる。
【0065】
検索クエリログDB210は、検索エンジンが受信した検索クエリに関するユーザ識別番号、検索時間及び検索キーワードを含むログを格納しているので、視聴見込者が検索したキーワード及び時間を読み取ることができる。
【0066】
例えば、視聴見込者UID_1が「Xファイル第2話」の放送時間に「ウイルス」、「FBI」、「スカリー」というキーワードの検索を行い、前記キーワードが特定条件を満足して推薦キーワードのセットに含まれている場合には、前記キーワードはコンテンツ別推薦キーワードDB123に格納される。
【0067】
例えば、「Xファイル第2話」が20時に放送開始され、「ウイルス」が20時30分に、「FBI」が20時40分に、「スカリー」が20時45分に検索された場合、これらのキーワードは、それぞれ再生時間区間30〜31分、40〜41分、45分〜46分の推薦キーワードの一つとして採択される。
【0068】
このように、コンテンツ別推薦キーワードDB123が各コンテンツに対して再生時間帯別推薦キーワードを格納すれば、IP_TV、ウェブTVなどの通信―放送融合サービスを介して、コンテンツ別のユーザの関心が反映された多様な推薦キーワードを提供することができる。前記キーワードは、文字入力に不便な環境(例えば、リモコンを用いた操作環境)において、ユーザが所望の検索語を選択することを容易にするために使用され、あるいは検索語の一部を入力するときに動作する自動補完機能に使用される。
【0069】
上述した推薦キーワード提供システムの各構成要素は、分離されて具現されるが、一つのハードウェア上に統合されて具現されることも可能であることは当業者であれば容易に理解することができる。さらに、本発明の一実施例は、推薦キーワード提供機能を有する検索エンジン200の一部の構成として統合されて具現されてもよい。
【0070】
図6は、本発明の一実施例に係る推薦キーワード生成方法を示したフローチャートである。
【0071】
本発明の一実施例に係る推薦キーワード生成方法において、まず、特定放送コンテンツの視聴見込者グループが分類され、次に前記コンテンツに対応する前記視聴見込者グループが格納される(ステップS100)。
【0072】
一旦視聴見込者が分類されてからは、前記視聴見込者から伝送された検索語からキーワードセットが生成される(ステップS200)。前記キーワードセットは、前記視聴見込者が同一の放送コンテンツ又はコンテンツのシリーズの放映時間中に伝送した検索語のうち、該当コンテンツとの相関度が高いと判断された特定条件を満足した各検索語から生成される。
【0073】
キーワードセットが生成された後、コンテンツの再生時間帯別キーワードが生成される(ステップS300)。キーワードセットに含まれた検索語の検索時間を用いることによって、各検索語に対応するキーワードが放送コンテンツ再生時間のどちらの期間で検索されたかを判断することができる。したがって、キーワードセットに含まれた各推薦キーワードを、コンテンツの再生時間区間とマッチングすることが可能になる。
【0074】
ステップS400では、コンテンツ別に時間同期化された推薦キーワードがデータベースに格納される。このようにデータベースに格納された推薦キーワードは、別途のファイル形態で提供されてもよいし、あるいは特定サーバを介してコンテンツと同期化されて提供されてもよい。
【0075】
以下、図6に示したステップS100、S200、S300、S400についてより具体的に説明する。
【0076】
図7は、本発明の一実施例に係る視聴見込者グループを分類し格納する方法をより具体的に示したフローチャートである。
【0077】
視聴見込者を分類するために、まず、放送時間及に対応するコンテンツに関連するシードキーワードを入力する(ステップS110)。前記シードキーワードは、コンテンツを代表する最も基本的なキーワードのグループであってもよい。例えば、前記シードキーワードはコンテンツ名、出演者、主題などを含んでもよい。前記放送時間は、コンテンツが放送される時間に関する情報を含み、日付に関する情報を含んでもよい。また、放送時間の前後の一定時間(例えば、30分)を含む所定時間帯を前記放送時間に含ませてもよい。
【0078】
ステップS120では、前記放送時間又は所定時間帯で行われた検索が正常な検索であるかどうかを判断する。正常でない検索が行われた場合、例えば、検索結果が伝送される前にブラウザが閉じられる場合などにはプロセスが終了され(ステップS170)、そのような正常でない検索は視聴見込者分類過程で考慮されない。前記正常な検索であるかどうかを判断するのは、ブラウザが検索結果ページと正常に接続したかどうかを判断する変数値を参照して行われる。また、検索エンジンが提供するページに既に補完して提供された検索語を用いた検索も、視聴見込者を分類する時に考慮されない。
【0079】
ステップS130では、放送時間の前後を含む所定時間帯にシードキーワードが検索されたかどうかを判断する。特定ユーザがシードキーワードを検索した場合、次のステップに進行する。
【0080】
シードキーワードが検索された場合は、前記検索キーワードを伝送したユーザがしきい値nより多い数の検索語を伝送したか否かを判断し、しきい値n以上検索した場合、このユーザを視聴見込者として登録するために次のステップに進行する(ステップS140)。
【0081】
最後に、視聴見込者として登録されるユーザの識別番号が識別可能であるかどうかを判断する(ステップS150)。例えば、Bcookieの値が「―」である場合は、Bcookieが存在せず、ユーザの識別が不可能な場合である。
【0082】
一方、図7に示していないが、一人のユーザが放送時間の間、非常に多くの回数又は頻度で検索語を入力する場合は、前記ユーザを視聴見込者から除外することが望ましい。
【0083】
また、上述したように、シードキーワードの各カテゴリに対する加重値が与えられたケースにおいて検索されたシードキーワードにカテゴリ加重値を適用した合計値が予め定められた値以上になった場合、そのユーザを視聴見込者として分類することも可能である。本実施例によれば、他のコンテンツに重複して出演したり、コンテンツと関係なく話題となった俳優に対応するシードキーワードには低い加重値を与え、該当コンテンツと関係のない検索を行ったユーザを視聴見込者グループから排除することが可能である。例えば、多数のコンテンツに出演する俳優や、コンテンツと関係のない社会的話題と関連して関心を受けている俳優が偶然に該当コンテンツの出演者である場合、その俳優名に関するシードキーワードには低い加重値を与え、現在放送中のコンテンツを視聴していないユーザが視聴見込者として分類されないようにする。
【0084】
以上の判断過程を満足した場合、放送コンテンツを視聴しながら、該当コンテンツと関連したキーワードを入力したユーザを視聴見込者として分類し、分類されたユーザの識別番号を視聴見込者グループに登録する(ステップS160)。前記視聴見込者グループのユーザ識別番号は、後で該当コンテンツ又は同一コンテンツのシリーズの視聴者を識別するのに用いられる。
【0085】
図8は、本発明の一実施例に係るキーワードセットを生成する方法を具体的に示したフローチャートである。
【0086】
コンテンツに対応する視聴見込者グループが生成されてから、前記視聴見込者の検索結果を用いて、各コンテンツに対する推薦キーワードを収集する。
【0087】
ステップS210では、所定時間の間の視聴見込者の検索結果を収集する。例えば、前記所定時間は、特定コンテンツの放送時間の前後30分を含んでもよい。このステップにおいて、視聴見込者によって伝送された各検索語は、該当コンテンツの推薦キーワードになれるかどうかを判断する。
【0088】
ステップS220では、視聴見込者によって入力された該当キーワードの検索回数比率がしきい値Kより大きいかどうかを判断する。ここで、視聴者見込者の検索回数比率の判断は、以下の数式1によって行われる。
【0089】
[数式1]
(QC A/QC A‐total)/(QC B/QC B‐total)>K(ここで、K>0)
【0090】
ここで、各パラメータの意味は、以下の通りである。
QC A:視聴見込者の該当キーワード検索回数
QC A‐total:視聴見込者の全キーワード検索回数
QC B:非視聴見込者の該当キーワード検索回数
QC B‐total:非視聴見込者の全キーワード検索回数
【0091】
すなわち、特定キーワードに対して、非視聴見込者が入力する検索回数比率より、視聴見込者が入力する検索回数比率が高い場合、該当キーワードとコンテンツとの相関度が高いと判断される。
【0092】
ステップS230では、該当キーワードを検索した視聴見込者の数がしきい値mより大きいかどうかを判断する。すなわち、少なくともしきい値m以上の視聴見込者によって該当キーワードの検索が行われた場合にのみ次のステップに進行する。
【0093】
一方、視聴見込者が予め定められた数以上のシードキーワードを検索することによって分類された場合に限って、前記視聴見込者が伝送した検索語をキーワードセットに含ませる方法も可能である。何故なら、単一のシードキーワードのみを検索することによって分類された視聴見込者が伝送した検索語は、前記シードキーワードと同様な綴りを含む他の意味の検索語であるかもしれないからである。
【0094】
例えば、シードキーワードのうち一つが「file」である場合、「profile」を検索したユーザも視聴見込者として分類されるので、「file」などの一つのシードキーワードのみを検索することによって分類された視聴見込者から伝送された検索語は、キーワードセットから除外することが望ましい。
【0095】
ステップS240では、該当キーワードの放送時間を含む所定時間の間の検索回数比率(すなわち、所定時間の間の検索回数/一日の検索回数)がしきい値Pより大きいかどうかを判断する(ここで、0<P<1)。前記所定時間の間の該当キーワード検索回数比率がしきい値Pより大きい場合、該当キーワードが放送時間に集中的に検索されたと判断される。
【0096】
以上の条件を満足した場合、該当キーワードをコンテンツに対する推薦キーワードとしてキーワードセットに含ませる(ステップS250)。
【0097】
上述したステップS220、ステップS230、ステップS240は、既に説明したシードキーワードDB120、視聴見込者DB122及び検索クエリログDB210に格納された情報を用いて充分に行われる。
【0098】
また、ステップS220、ステップS230、ステップS240で説明した具体的な数式又は条件は、例示に過ぎないもので、検索回数、検索者数、検索時間などを用いてキーワードとコンテンツとの相関度を把握するために他の条件を用いることも可能である。
【0099】
図9は、本発明の一実施例に係るコンテンツ再生時間帯別に推薦キーワードを生成する方法を具体的に示したフローチャートである。
【0100】
上述したように、特定コンテンツに対する推薦キーワードセットが生成されれば、そのキーワード自体でも充分に有用であるが、これをコンテンツの再生時間帯別に同期化させた場合、ユーザの利便性がより高まる。
【0101】
ステップS310では、時間帯別の検索回数を算出する。すなわち、キーワードが検索された時間を特定時間区間(例えば、60秒)毎に分けて該当キーワードの検索回数を求める。
【0102】
該当キーワードの時間帯別検索回数比率(すなわち、時間帯別検索回数/放送時間の間の検索回数)を計算し、この比率がしきい値Qより大きいかどうかを判断する(ステップS320)。この場合、放送時間の間の検索回数を放送時間の間の検索回数+A(A>0)に取り替えることができる。前記比率がしきい値Qより大きくない場合、推薦キーワードが該当時間帯のキーワードから除外され(ステップS360)、前記比率がしきい値Qより大きい場合、次のステップに進行する。
【0103】
このステップでは、しきい値Qを利用せずに、前記時間帯別検索回数比率の高い順に予め定められた数のキーワードを時間帯別推薦キーワードとして選定することも可能である。
【0104】
ステップS330では、該当キーワードが不適切なキーワードであるかどうかを判断する。ここで、不適切なキーワードとは、「生放送」、「再放送」、「再視聴」などのコンテンツと関係のない予め定められたキーワードである。
【0105】
ステップS340では、時間帯別検索回数比率が高く、不適切なキーワードでないキーワードが該当時間帯別推薦キーワードとして登録される。
【0106】
全ての時間帯別に推薦キーワードが登録されれば、前記コンテンツの放送時間とコンテンツ再生時間とを同期化させる(ステップS350)。放送開始時間から時間帯別に選定された推薦キーワードは、再生開始時間から時間帯別推薦キーワードとして前記コンテンツにマッチングされる。
【0107】
図10は、本発明の一実施例に係る推薦キーワードが活用される画面を示した図である。
【0108】
図10では、特定コンテンツ(例えば、Xファイル)の再生開始後、10分が経過した時点での画面を示している。前記画面には、主人公に該当する人物、主人公が搭乗した自動車、UFOなどが表示されている。
【0109】
画面に表示されている前記コンテンツに対応する推薦キーワードは、例えば、「Xファイル」、「Xファイルの主人公」、「Xファイルの結末」、「宇宙人」、「UFO」、「デービッド・ドゥカブニー(Xファイルの主人公の実名)」、「Xファイルの自動車」、「フェラーリ(主人公が搭乗した車種)」などになり、このような推薦キーワードは、ユーザの要請によって画面上に又は別途に提供される。
【0110】
前記キーワードは、IP_TVのようにインターネット検索が共に提供されるサービスにおいて検索用キーワードとして用いられる。この場合、文字入力に不便な入力環境であっても、ユーザの望むキーワードを選択して容易に検索を行うことができる。
【0111】
また、インターネット通信を直ちに用いることができるウェブTV環境でも、上述した推薦キーワードを検索に用いることができる。さらに、推薦キーワードファイルをコンテンツのマルチメディアファイルと同期させれば、多様なマルチメディアサービスに推薦キーワードを提供することが可能である。
【0112】
なお、前記推薦キーワードに特定情報又は広告に関するデータを与えて商業的に活用することができる。また、単一のキーワードを複数の検索エンジンを通して検索した結果を提供し、多様な情報を要求するユーザの利便性を高めることが可能である。
【0113】
以上説明したように、本発明の実施例に係る推薦キーワード提供システム及び方法は、コンテンツとの相関度が高く、視聴者の関心を反映できるという点で任意のサービスに多様に応用される。
【0114】
本発明の一実施例は、コンピュータによって実行されるプログラムモジュールのようなコンピュータによって実行可能な命令語を含む記録媒体の形態で具現されてもよい。
【0115】
また、本発明の一実施例に係るデータ構造も、コンピュータによって実行可能な記録媒体に格納されてもよい。
【0116】
コンピュータ読取可能な媒体は、コンピュータによってアクセスできる任意の可用媒体であってもよく、揮発性及び非揮発性媒体、分離型及び非分離型媒体を全て含む。また、コンピュータ読取可能な媒体は、コンピュータ格納媒体及び通信媒体を全て含んでもよい。コンピュータ格納媒体は、コンピュータ読取可能な命令語、データ構造、プログラムモジュール又はその他データのような情報格納のための任意の方法又は技術で具現された揮発性及び非揮発性、分離型及び非分離型媒体を全て含む。通信媒体は、典型的にコンピュータ読取可能な命令語、データ構造、プログラムモジュール、搬送波のような変調されたデータ信号のその他データ、又はその他伝送メカニズムを含み、任意の情報伝達媒体を含む。
【0117】
本発明の方法及びシステムを、特定実施例と関連して説明したが、それらの構成要素又は動作の一部若しくは全部は、汎用ハードウェアアーキテクチャを有するコンピュータシステムを使用しても具現される。
【0118】
上述した本発明の説明は、例示のためのものであり、本発明の属する技術分野の通常の知識を有する者であれば、本発明の技術思想や必須な特徴を変更しない範囲で他の具体的な形態に容易に変形可能であることを理解することができる。したがって、上述した各実施例は、全ての面で例示的なものであり、限定的なものでないことを理解しなければならない。
【0119】
本発明の範囲は、上述した詳細な説明より後述する特許請求の範囲によって定めるもので、特許請求の範囲の意味及び範囲、そして、その均等概念から導出される全ての変更又は変形された形態は、本発明の範囲に含まれるものと解釈されなければならない。






























【特許請求の範囲】
【請求項1】
コンテンツと関連した予め定められたシードキーワード及び前記コンテンツの放送時間を格納するシードキーワードDBと、
前記放送時間及び前記シードキーワードを用いて検索エンジンに検索語を伝送したユーザのうち前記コンテンツの視聴見込者を分類する視聴見込者分類部と、
前記視聴見込者のユーザ識別番号と前記放送時間に基づいて、前記視聴見込者が伝送した前記検索語のうち前記コンテンツとの相関度がしきい値以上であるキーワードを選択してキーワードセットを生成する推薦キーワード生成部と、を含むことを特徴とする推薦キーワード生成システム。
【請求項2】
前記キーワードセットに含まれたキーワードの放送時間帯別検索回数に基づいて、前記コンテンツの再生時間帯別推薦キーワードを生成するコンテンツ―キーワード時間同期化部をさらに含むことを特徴とする、請求項1に記載の推薦キーワード生成システム。
【請求項3】
前記コンテンツ―キーワード時間同期化部は、前記キーワードセットに含まれた前記キーワードのうち予め定められた不適切なキーワードを除去することを特徴とする、請求項2に記載の推薦キーワード生成システム。
【請求項4】
前記コンテンツ―キーワード時間同期化部は、前記再生時間帯別推薦キーワードを前記コンテンツの再生時間と同期化し、前記同期化した推薦キーワードを格納することを特徴とする、請求項2に記載の推薦キーワード生成システム。
【請求項5】
前記視聴見込者の前記ユーザ識別番号をコンテンツ別に格納する視聴見込者DBをさらに含むことを特徴とする、請求項1に記載の推薦キーワード生成システム。
【請求項6】
前記視聴見込者分類部は、前記放送時間を含む所定時間の間、ユーザが予め定められた回数以上前記シードキーワードを検索した場合に、前記ユーザを視聴見込者として分類することを特徴とする、請求項5に記載の推薦キーワード生成システム。
【請求項7】
前記推薦キーワード生成部は、前記視聴見込者が検索した特定キーワードの検索回数と前記視聴見込者が検索した全てのキーワードの検索回数との比率を用いて前記キーワードセットを生成することを特徴とする、請求項5に記載の推薦キーワード生成システム。
【請求項8】
前記推薦キーワード生成部は、前記特定キーワードを検索した視聴見込者の数をさらに用いて前記キーワードセットを生成することを特徴とする、請求項7に記載の推薦キーワード生成システム。
【請求項9】
前記推薦キーワード生成部は、一日全体の前記キーワード検索回数と前記放送時間の間の前記キーワードの検索回数との比率をさらに用いて前記キーワードセットを生成することを特徴とする、請求項7に記載の推薦キーワード生成システム。
【請求項10】
コンテンツと関連して予め格納されたシードキーワード及び前記コンテンツの放送時間を用いて前記コンテンツの視聴見込者を分類し、
前記視聴見込者が前記コンテンツの放送時間を含む所定時間の間に伝送した検索語のうち前記コンテンツとの相関度がしきい値以上である検索語を選択して推薦キーワードセットを生成すること、を含むことを特徴とする推薦キーワード生成方法。
【請求項11】
各キーワードに対する時間帯別検索回数を用いて前記キーワードセットから時間帯別キーワードを抽出し、
前記コンテンツの再生時間と同期化して前記時間帯別推薦キーワードを格納することをさらに含むことを特徴とする、請求項10に記載の推薦キーワード生成方法。
【請求項12】
前記コンテンツの視聴見込者を分類することにおいて、特定コンテンツの放送時間を含む所定時間の間、予め定められた回数以上前記シードキーワードを含む検索語を検索したユーザを視聴見込者として分類することを特徴とする、請求項10に記載の推薦キーワード生成方法。
【請求項13】
前記シードキーワードは、異なる加重値を有するカテゴリに分類され、検索された各シードキーワードに適用された前記加重値の合計値が予め定められた値以上である場合、前記検索語を検索したユーザを視聴見込者として分類することを特徴とする、請求項12に記載の推薦キーワード生成方法。
【請求項14】
前記推薦キーワードセットを生成することにおいて、特定キーワードに対する視聴見込者の検索回数と非視聴見込者の検索回数との比率を用いて前記キーワードセットを生成することを特徴とする、請求項10に記載の推薦キーワード生成方法。
【請求項15】
前記推薦キーワードセットを生成することにおいて、前記特定キーワードを検索した視聴見込者の数をさらに用いて前記キーワードセットを生成することを特徴とする、請求項14に記載の推薦キーワード生成方法。
【請求項16】
前記特定キーワードを検索した視聴見込者は、予め定められた数以上のシードキーワードを検索した視聴見込者であることを特徴とする、請求項15に記載の推薦キーワード生成方法。
【請求項17】
前記推薦キーワードセットを生成することにおいて、前記放送時間を含む所定時間帯での前記キーワードの検索回数比率をさらに用いて前記キーワードセットを生成することを特徴とする、請求項14に記載の推薦キーワード生成方法。
【請求項18】
前記キーワードセットから時間帯別キーワードを抽出することにおいて、前記放送時間を予め定められた時間区間に分け、各時間区間に対する特定キーワードの検索回数比率又は順位を用いて前記時間帯別推薦キーワードを生成することを特徴とする、請求項11に記載の推薦キーワード生成方法。
【請求項19】
請求項10から18のうちいずれか一項に記載の方法を実行するためのプログラムが記録されているコンピュータ読取可能な記録媒体。
【請求項20】
データ構造が記録された記録媒体において、
前記データ構造は、
コンテンツを識別するコンテンツ識別データと、
前記コンテンツの全体再生時間を予め定められた値で分割した再生時間帯別識別データと、
前記再生時間帯別識別データに対応する少なくとも一つ以上の再生時間帯別キーワードデータと、を含み、
前記再生時間帯別キーワードデータは、前記コンテンツの再生時間と同期化されて提供されることを特徴とするデータ構造が記録された記録媒体。
【請求項21】
前記再生時間帯別キーワードデータは、前記コンテンツの放送時間の間、シードキーワードを含む検索語を伝送したユーザから分類された視聴見込者の検索語のうち、前記コンテンツとの相関度がしきい値以上である検索語に基づいて生成されることを特徴とする、請求項20に記載のデータ構造が記録された記録媒体。
【請求項22】
前記キーワードデータの検索時間と前記コンテンツの放送時間に基づいて、前記再生時間帯別キーワードデータと前記再生時間帯別識別データをマッチングさせることを特徴とする、請求項21に記載のデータ構造が記録された記録媒体。








【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公表番号】特表2010−536233(P2010−536233A)
【公表日】平成22年11月25日(2010.11.25)
【国際特許分類】
【出願番号】特願2010−519876(P2010−519876)
【出願日】平成20年8月29日(2008.8.29)
【国際出願番号】PCT/KR2008/005083
【国際公開番号】WO2009/054610
【国際公開日】平成21年4月30日(2009.4.30)
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)
【Fターム(参考)】