端末装置、サーバ装置、マスキングシステムおよびプログラム
【課題】会話をする者が移動しても移動先で会話をマスキングできるようにする。
【解決手段】携帯電話機10においてユーザの音声を録音する。録音された音声のデータはサーバ装置40に送られる。サーバ装置40は、携帯電話機10から送られた音声データからユーザの音声をマスキングするマスカー音のファイルを生成して記憶する。ユーザは、マスカー音を必要とする時は、携帯電話機10を操作してサーバ装置40にアクセスしてマスカー音を取得する。携帯電話機10は、取得したマスカー音ファイルを再生すると、マスカー音が携帯電話機10のスピーカから放音され、ユーザの音声がマスキングされる。
【解決手段】携帯電話機10においてユーザの音声を録音する。録音された音声のデータはサーバ装置40に送られる。サーバ装置40は、携帯電話機10から送られた音声データからユーザの音声をマスキングするマスカー音のファイルを生成して記憶する。ユーザは、マスカー音を必要とする時は、携帯電話機10を操作してサーバ装置40にアクセスしてマスカー音を取得する。携帯電話機10は、取得したマスカー音ファイルを再生すると、マスカー音が携帯電話機10のスピーカから放音され、ユーザの音声がマスキングされる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声をマスキングする技術に関する。
【背景技術】
【0002】
マスキング効果を利用した発明として、特許文献1,2に開示された発明がある。特許文献1に開示されているサウンドマスキングシステムは、マイクロホンを音響空間に配置し、マイクロホンで収音された音声を複数のフレームに分割する。また、分割した音声を各フレーム内で逆の波形に置き換え、フレーム同士のつながりを滑らかにする処理をした後、フレームの順序をランダムに並べ替えてマスキングサウンドを生成し、生成したマスキングサウンドをマイクロホンがある音響空間とは別な音響空間にあるスピーカから放音する。これにより、マイクロホンがある音響空間で会話が行われても、スピーカがある音響空間には生成されたマスキングサウンドが放音される。スピーカがある音響空間とマイクロホンがある音響空間が近くても、スピーカがある音響空間にはマイクロホンで収音された音声から生成されたマスキングサウンドが放音されるので、マイクロホンがある音響空間でされた会話がマスキングされる。
また、特許文献2に開示されている音声処理装置は、会話が行われる場所にマイクロホンを配置し、会話が行われる場所の近傍にスピーカを配置する。ここで、音声処理装置は、マイクロホンで収音された音声のスペクトルを変形した変形スペクトルを生成し、生成した変形スペクトルから音声信号を生成する。生成された音声信号はスピーカへ供給され、スピーカからは、マイクロホンで収音された音声が聞き取られるのを防ぐ妨害音が放音される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−233671号公報
【特許文献2】特開2006−243178号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、会話の内容が他者に聞き取られるのを防ぎたい状況としては、様々な状況がある。例えば、医師からもらった処方箋に記載された薬を薬局で購入する場合、処方箋に記載された薬の効果や副作用の説明を受けることや、服用中の薬の名称を薬剤師に告げることがある。ここで、薬の名称、効果や副作用などを他者に聞かれると、他者に病気を特定される虞がある。特許文献1,2に開示された発明を設置すれば、他者に会話を聞かれる虞はなくなるものの、そのような場所に必ず特許文献1,2に開示された装置を配置するのは非常に手間やコストがかかる。また、ある薬局で特許文献1,2に開示された発明があっても他の薬局に特許文献1,2に開示された発明がなければ、結局会話の内容を他者に聞き取られる。
【0005】
本発明は、上述した背景の下になされたものであり、会話する者が移動しても移動先で会話をマスキングできる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決するため、本発明は、音を収音する収音手段と、前記収音手段で収音された音を表すデータを生成するデータ生成手段と、前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、前記マスカー音生成手段が生成した信号が表す音を放音する放音手段とを備える端末装置を提供する。
【0007】
本発明においては、前記収音手段は、人間の発する音と、当該収音手段の周囲の暗騒音を収音する構成であってもよい。
また本発明においては、前記収音手段は、人間の発する音を収音し、前記人間が発する音は所定の文章を音読した音である構成であってもよい。
また本発明においては、前記収音手段は、人間の発する音を収音し、前記人間が発する音は会話の音である構成であってもよい。
また本発明においては、前記人間の発する音は複数の場所で収音され、前記マスカー音のデータは、前記複数の場所毎に生成され、前記複数の場所のいずれかを選択し、選択された場所で収音された音のデータから生成された前記マスカー音のデータを取得する構成であってもよい。
【0008】
また本発明は、収音手段で収音された音を表すデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを受信する受信手段と、前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する生成手段と、前記生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、前記記憶手段において端末装置から送信された認証データに対応づけられているデータを前記端末装置へ送信する送信手段とを備えるサーバ装置を提供する。
【0009】
また本発明は、音を収音する収音手段と、前記収音手段で収音された音を表すデータを生成する第1生成手段と、前記第1生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する第1送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、前記マスカー音生成手段が生成した信号が表す音を放音する放音手段とを備える端末装置と、前記第1送信手段から送信されたデータを受信する受信手段と、前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する第2生成手段と、前記第2生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、前記記憶手段において前記取得手段から送信された認証データに対応づけられているデータを前記端末装置へ送信する第2送信手段とを備えるサーバ装置を具備するマスキングシステムを提供する。
【0010】
また本発明は、コンピュータを、音を収音する収音手段で収音された音を表すデータを生成するデータ生成手段と、前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段として機能させるためのプログラムを提供する。
【発明の効果】
【0011】
本発明によれば、会話する者が移動しても移動先で会話をマスキングすることができる。
【図面の簡単な説明】
【0012】
【図1】本発明の一実施形態に係るマスキングシステム1の構成を示した図。
【図2】携帯電話機10のハードウェア構成を示した図。
【図3】サーバ装置40のハードウェア構成を示した図。
【図4】マスカー音テーブルTBの内容を示した図。
【図5】マスカー音ファイルを生成する時の動作を説明するための図。
【図6】携帯電話機10が表示する画面を示した図。
【図7】携帯電話機10が表示する画面を示した図。
【図8】携帯電話機10が表示する画面を示した図。
【図9】携帯電話機10が表示する画面を示した図。
【図10】マスカー音ファイルを取得する時の動作を説明するための図。
【図11】携帯電話機10が表示する画面を示した図。
【図12】携帯電話機10が表示する画面を示した図。
【発明を実施するための形態】
【0013】
[実施形態]
(全体構成)
図1は、本発明の実施形態に係わるマスキングシステム1を構成する装置を示した図である。なお、このマスキングシステム1には多数の携帯電話機(端末装置)およびサーバ装置が存在するが、図面が繁雑になるのを防ぐため、図1においては、一つの携帯電話機10と、一つのサーバ装置40のみを示している。
【0014】
移動体通信網30Aは、携帯電話機10に音声通話サービスやデータ通信サービスを提供する通信網である。移動体通信網30Aは、携帯電話機10と無線通信を行う無線基地局、無線基地局に接続された交換機、交換機および固定電話網に接続された関門交換機、関門交換機とインターネット30Bに接続されデータ通信を中継するゲートウェイサーバ(いずれも図示略)を有している。移動体通信網30Aは、移動体通信網30Aを運用する通信事業者と加入契約を行った者が所有する携帯電話機10に対して音声通話サービスやパケット通信を用いたデータ通信サービスを提供する。また、移動体通信網30Aは、インターネット30Bに接続されたサーバ装置40と携帯電話機10との間で行われるデータ通信を中継する。
【0015】
サーバ装置40は、クライアント−サーバシステムのサーバとして機能するコンピュータ装置であり、インターネット30Bに接続されている。サーバ装置40は、携帯電話機10のユーザの音声をマスキングするマスカー音を表すマスカー音データを生成して記憶し、記憶したマスカー音データを携帯電話機10へ提供する機能を備えている。
携帯電話機10は、図示を省略したユーザが所有する携帯電話機であり、移動体通信網30Aが提供する様々な通信サービス受けることができる。また、携帯電話機10は、サーバ装置40とデータ通信を行い、マスカー音データをサーバ装置40から取得し、取得したマスカー音データを再生する機能を備えている。
【0016】
(携帯電話機10の構成)
図2は、携帯電話機10のハードウェア構成を例示する図である。図2に示したように、携帯電話機10の各部はバス101に接続されている。携帯電話機10の各部は、このバス101を介して各部間でデータの授受を行う。
【0017】
通信部108は、無線通信を行うインターフェースの機能を有しており、CPU(Central Processing Unit)102の制御の下、通信部108に接続されているアンテナ(図示略)を介して、移動体通信網30Aの無線基地局との間で無線通信を行う。通信部108は、音声通信とデータ通信を同時に行うことが可能であり、デジタル化された音声信号や、データ通信で用いられるデータの送受信を行う。
通信部108は、無線基地局から送信された音声信号やデータを受信すると、受信した音声信号を音声処理部109へ供給し、受信したデータをCPU102へ供給する。また通信部108は、データ通信に係るデータが供給されると、このデータを無線基地局へ送信する。また通信部108は、デジタル化された音声信号が音声処理部109から供給されると、この音声信号を無線基地局へ送信する。
【0018】
音声処理部109は、スピーカと、携帯電話機10の周囲の音を収音する収音手段の一例であるマイクロホンを備えている。音声処理部109は、マイクロホンに音声が入力されると、入力された音声をデジタル化した音声信号を生成し、この音声信号を通信部108へ供給する。また、音声処理部109は、音声信号が供給されると、この音声信号をアナログ信号に変換し、アナログ化された音声信号をスピーカへ供給する。
【0019】
表示部107は、例えば液晶ディスプレイ装置を備えており、CPU102の制御の下、文字やグラフィック画面、携帯電話機10を操作するためのメニュー画面などを表示する。
操作部106は、図示を省略したテンキーや操作指示などを入力するための複数のキーを備えている。携帯電話機10のユーザが、これらのキーを操作すると、操作されたキーを示す信号が操作部106からCPU102へ出力される。また操作部106は、静電容量方式で矩形の形状をした透明なタッチセンサーを有している。タッチセンサーは、表示部107の液晶ディスプレイ装置の表面全体を覆うように配置されており、液晶ディスプレイ装置に表示された画像を透過する。タッチセンサーは、矩形の領域内においてユーザが指で触れた位置を検知し、検知した位置を示す信号をCPU102へ出力する。
記憶部105は、不揮発性メモリであり、携帯電話機10を制御するためのデータやマスカー音ファイル等の様々なデータを記憶する。また、記憶部105には、マスカー音ファイルの生成や再生に係る機能を実現するアプリケーションプログラム(以下、マスカー音アプリと称する)を記憶している。
【0020】
ROM(Read Only Memory)103には、CPU102により実行される各種プログラムが記憶されており、CPU102および携帯電話機各部の初期化を行う初期化プログラム、携帯電話機10の全体を制御するOS(Operating System)プログラム、データ通信の機能や音声通信の機能を実現するプログラムなどが記憶されている。RAM(Random Access Memory)104は、CPU102がプログラムを実行するときの作業エリアとして使用され、CPU102がプログラムを実行するときに使用するデータが記憶される。
【0021】
CPU102は、携帯電話機10の各部を制御する制御部である。携帯電話機10において図示を省略した電源が入れられると、CPU102が、ROM103から初期化プログラムを読み出して実行し、CPU102の初期化および携帯電話機10各部の初期化を行う。CPU102は、初期化プログラムの実行を終了するとROM103からOSプログラムや各種プログラムを読み出し実行する。CPU102がOSプログラムを実行すると、携帯電話機としての各種機能が実現し、携帯電話機10において音声通信やデータ通信を行うことが可能となる。また、CPU102は、操作部106のキーやタッチセンサーから送られた信号によりユーザの操作を特定し、各種制御を行う。また、CPU102がOSプログラムを実行すると、記憶部105に記憶されているマスカー音アプリを実行することが可能となる。
【0022】
(サーバ装置40の構成)
図3は、サーバ装置40のハードウェア構成を例示したブロック図である。同図に示したように、サーバ装置40の各部はバス401に接続されており、このバス401を介して各種データの授受を行う。
【0023】
操作部406は、キーボードやマウス等、サーバ装置40を操作するための装置を備えている。サーバ装置40の操作者によりこれらの装置が操作されると、行われた操作に応じてCPU402が各種処理を行う。表示部407は、液晶ディスプレイ装置を有しており、CPU402の制御の下、サーバ装置40を操作するためのメニュー画面やサーバ装置40が有するデータなどを表示する。通信部410は、インターネット30Bに接続されており、インターネット30Bを介して他の装置と通信を行う際のインターフェースとして機能する。
【0024】
記憶部405は、ハードディスク装置であり、サーバ装置40においてオペレーティングシステムの機能を実現するOSプログラムを記憶している。また、記憶部405は、マスカー音を生成する機能や、マスカー音を記憶部405に記憶させる機能、マスカー音を携帯電話機10に送信する機能などをサーバ装置40において実現するアプリケーションプログラムを記憶している。また、記憶部405は、マスカー音テーブルTBを記憶している。図4は、マスカー音テーブルTBの一例を示した図である。図4に示したテーブルは、「ユーザ識別子」のフィールド、「パスワード」のフィールド、および「ファイル名」のフィールドを有している。「ファイル名」のフィールドには、マスカー音を表すファイルのファイル名が格納される。「ユーザ識別子」のフィールドには、マスカー音のユーザを一意に識別する識別子が格納される。また、「パスワード」のフィールドには、マスカー音のユーザを認証するためのパスワードが格納される。
【0025】
(実施形態の動作)
次に、本実施形態の動作について、まずマスカー音ファイルを生成する時の動作について説明する。まず、携帯電話機10のユーザが、操作部106においてマスカー音アプリの起動を指示する操作を行うと、CPU102が記憶部105からマスカー音アプリを読み出して実行する。マスカー音アプリが実行されると、CPU102により表示部107が制御されて図6に示した画面が表示される。図6は、マスカー音ファイルの生成処理とマスカー音ファイルの再生処理のいずれかを選択させるために表示される画面の一例を示している。この画面が表示されている状態において、ユーザが「マスカー音ファイルを生成する」のボタンに触れる操作を行うと、図5に示したマスカー音ファイルの生成処理が実行される。なお、ユーザが「マスカー音を取得する」のボタンに触れる操作を行うと、後述するマスカー音の取得処理と再生処理が実行される。またユーザが「終了」ボタンに触れる操作を行うと、CPU102は、マスカー音アプリの実行を終了する。
【0026】
図6に示した画面において「マスカー音ファイルを生成する」のボタンをユーザが触ると、CPU102は図7に示したように、ユーザに音読させる文章を表示部107に表示させる(ステップS101)。ここで、ユーザが画面に表示された録音開始ボタンに触れて文章の音読を始めると、マイクロホンで収音されたユーザの音声が音声処理部109においてユーザの音声を表すデータ(以下、音声データと称する)に変換され、この音声データは記憶部105に記憶される(ステップS102)。つまり、ここでCPU102は、音を表すデータを生成するデータ生成手段として機能する。なお、ユーザの音声を収音して音声データを記憶するのは、マスカー音を生成する際にはマスカー音を使用するユーザの音声を使用するためである。次に、ユーザが文章の音読を終了し、図7に示した録音終了ボタンに触れると、図8に示した画面が表示される。
【0027】
図8の画面は、マスカー音を使用するユーザを識別する識別子が入力されるテキストボックスと、ユーザを認証するためのパスワードが入力されるテキストボックスを備えている。図8の画面が表示されると、ユーザは、マスカー音を使用するユーザを識別する識別子と、ユーザを認証するためのパスワードを、操作部106を操作して入力する。ユーザが、識別子とパスワードを入力した後、表示されている生成ボタンに触れる操作を行うと、CPU102は、テキストボックスに入力された識別子とパスワードを取得する(ステップS104)。CPU102は、識別子とパスワードを取得すると、記憶部105に記憶された音声データ、取得した識別子およびパスワードを、通信部108を制御してサーバ装置40へ送信する(ステップS105)。ここで、CPU102と通信部108はデータを送信する送信手段として機能する。
【0028】
携帯電話機10から送信された音声データ、識別子およびパスワードは、移動体通信網30Aおよびインターネット30Bを介してサーバ装置40へ送られ、通信部410によって受信される。そして、通信部410で受信された音声データ、識別子およびパスワードは記憶部405に記憶される(ステップS106)。CPU402は、音声データを記憶部405に記憶させると、記憶部405に記憶された音声データからマスカー音を表すファイル(以下、マスカー音ファイルと称する)を生成し、生成したマスカー音ファイルを記憶部405に記憶させる(ステップS107)。なお、マスカー音ファイルを生成する方法としては、本実施形態では特開2008−233671号公報に開示されている方法を採用し、まず、音声データが表す音声を複数のフレームに分割する。次に、分割した音声を各フレーム内で逆の波形に置き換え、フレーム同士のつながりを滑らかにする処理をした後、フレームの順序をランダムに並べ替えてマスカー音を生成し、生成したマスカー音を表すマスカー音ファイルを生成する。なお、マスカー音を生成する方法は、特開2008−233671号公報に開示されている方法に限定されるものではなく、例えば、音声データが表す音声を複数のフレームに分割し、分割したフレームを並べ替えた音声をマスカー音としてもよい。
【0029】
CPU402は、マスカー音ファイルを生成すると、生成したマスカー音ファイルのファイル名を携帯電話機10から送信された識別子およびパスワードと対応づけてマスカー音テーブルTBに格納する(ステップS108)。CPU402は、マスカー音テーブルTBにファイル名を格納すると、マスカー音ファイルが生成されたことを通知するメッセージを通信部410を制御して携帯電話機10へ送信する(ステップS109)。サーバ装置40から送信されたメッセージは、インターネット30Bおよび移動体通信網30Aを介して携帯電話機10へ送られ、通信部108によって受信される。通信部108で受信されたメッセージがCPU102へ供給されると、CPU102は図9に示したメッセージを、表示部107に表示させる(ステップS110)。これにより、ユーザは、自分の音声のマスカー音がサーバ装置40に記憶されたことを知ることができる。この後、ユーザが図9の戻るボタンに触れる操作を行うと、図6に示した画面が表示される。
【0030】
次に、サーバ装置40に記憶されたマスカー音ファイルを取得して再生する時の動作について説明する。まず、図6に示した画面が表示されている状態において、ユーザが「マスカー音ファイルを取得する」のボタンに触れる操作を行うと、図10に示したマスカー音ファイルの取得処理と再生処理が行われる。具体的には、図6に示した画面において「マスカー音ファイルを取得する」のボタンに触れる操作をユーザが行うと、CPU102は図11に示した画面を表示部107に表示させる(ステップS201)。図11の画面は、マスカー音を使用するユーザを識別する識別子が入力されるテキストボックスと、ユーザを認証するためのパスワードが入力されるテキストボックスを備えている。図11の画面が表示されると、ユーザは、操作部106を操作してマスカー音を生成する時に入力した識別子とパスワードを入力する。ユーザが、識別子とパスワードを入力した後、表示されている「マスカー音ファイルを取得」のボタンに触れる操作を行うと、CPU102は、テキストボックスに入力された識別子とパスワードを取得する(ステップS202)。CPU102は、識別子とパスワードを取得すると、取得した識別子およびパスワードを、通信部108を制御してサーバ装置40へ送信する(ステップS203)。
【0031】
携帯電話機10から送信された識別子およびパスワードは、サーバ装置40へ送られ、通信部410によって受信される。携帯電話機10から送信された識別子およびパスワードは、サーバ装置40へ送られ、通信部410によって受信される。そして、通信部410で受信された識別子およびパスワードはCPU402へ供給される。CPU402は、識別子およびパスワードが供給されると、マスカー音ファイルを記憶部405から取得する(ステップS204)。具体的には、CPU402は、受信した識別子をマスカー音テーブルTBにおいて検索する。ここで、検索した識別子がマスカー音テーブルTBに格納されている場合、検索した識別子に対応づけられているパスワードと、受信したパスワードが同じであるか判断する。CPU402は、ここでパスワードが同じである場合、検索した識別子に対応づけられているファイル名で特定されるマスカー音ファイルを記憶部405から取得する。CPU402は、マスカー音ファイルを取得すると、取得したマスカー音ファイルを携帯電話機10へ送信する(ステップS205)。サーバ装置40から送信されたマスカー音ファイルは、インターネット30Bおよび移動体通信網30Aを介して携帯電話機10へ送られ、通信部108によって受信される。
このように、CPU102と通信部108は、識別子とパスワードを送信してマスカー音ファイルを取得する取得手段として機能する。
【0032】
CPU102は、マスカー音ファイルが通信部108で受信されると、受信されたマスカー音ファイルを記憶部105に記憶させる(ステップS206)。CPU102は、マスカー音ファイルを記憶部105に記憶させると、図12に示した画面を表示部107に表示させる(ステップS207)。これによりユーザは、携帯電話機10がマスカー音ファイルを取得したことを知ることができる。次に、図12に示した再生ボタンに触れる操作を行うと、マスカー音ファイルが再生される(ステップS208)。具体的には、記憶されたマスカー音ファイルが音声処理部109へ供給される。音声処理部109は、マスカー音ファイルが供給されると、マスカー音ファイルが表すマスカー音の音声信号を生成し、生成した音声信号をスピーカへ供給する。ここで、CPU102と音声処理部109は、マスカー音を表す信号を生成するマスカー音生成手段として機能している。これにより、ユーザの音声から生成されたマスカー音が携帯電話機10のスピーカから放音される。即ち、ユーザの音声から生成されたマスカー音が携帯電話機10のスピーカから放音されている状態で当該ユーザが会話を行うと、放音されているマスカー音によりユーザ自らの音声がマスキングされる。ユーザは、会話を終了してマスカー音ファイルの再生を終了する場合には、図12に示した終了ボタンに触れる操作をする。この操作が行われると、CPU102は、マスカー音ファイルの再生を停止し、記憶部105に記憶されたマスカー音ファイルを消去する。
【0033】
以上説明したように本実施形態によれば、ユーザの音声から生成したマスカー音で当該ユーザの音声がマスキングされるため、高いマスキング効果が得られる。また、マスカー音ファイルの生成はCPUに負荷をかける処理であるが、この処理は、携帯電話機10では行われないため、携帯電話機10のCPUにかかる負荷を抑えることができる。また、マスカー音ファイルは、サーバ装置40に記憶されているため、移動体通信網30Aやインターネット30Bに接続できる環境であれば、マスカー音が必要となる任意の場所や時間において、マスカー音ファイルを自由に取得して再生することができる。例えば、スピーカを備え、マスカー音アプリがインストールされたパーソナルコンピュータをインターネット30Bに接続すれば、識別子とパスワードを入力してサーバ装置40からマスカー音ファイルを取得し、マスカー音を再生することができる。この場合、移動体通信網30Aからの電波が届かない建物内の会議室などにパーソナルコンピュータがあっても、マスカー音ファイルを取得してユーザの音声をマスキングすることができる。
【0034】
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
【0035】
マスカー音アプリがインストールされる端末装置は、携帯電話機10に限定されるものではない。マイクおよびスピーカを備え、移動体通信網30Aまたはインターネット30Bに接続してサーバ装置40と通信可能な装置であれば、例えば、PDA(Personal Digital Assistant)やパーソナルコンピュータであってもよい。
【0036】
上述した実施形態においては、マスカー音ファイルの再生を停止すると記憶部105に記憶されたマスカー音ファイルを消去しているが、マスカー音ファイルを消去せずに、記憶部105に記憶させたままにしてもよい。この場合、CPU102は、「マスカー音ファイルを再生する」のボタンに触れる操作が行われると、記憶部105にマスカー音ファイルが記憶されているか判断し、記憶されていない場合には上述した動作を行う。一方、マスカー音ファイルが記憶部105に記憶されている場合には、記憶部105に記憶されているマスカー音ファイルを取得して再生する。
【0037】
本発明においては、マスカー音ファイルの再生中に音声処理部109のマイクロホンで携帯電話機10の周囲の音声を収音し、収音したマスカー音以外の音声の音量に応じてマスカー音の音量を制御してもよい。例えば、マスカー音以外の音声の音量が小さい場合にはマスカー音の音量も小さくし、マスカー音以外の音声の音量が大きい場合にはマスカー音の音量も大きくする構成としてもよい。
【0038】
上述した実施形態においては、携帯電話機10のユーザの音声のみを収音して音声データを生成し、この音声データからマスカー音ファイルを生成していたが、このユーザの話し相手の音声もユーザの音声と同時に収音して音声データを生成し、この音声データからマスカー音ファイルを生成してもよい。この構成によれば、ユーザの音声だけでなくユーザの話し相手の音声もマスキングすることができる。また、会議などで複数の話し相手がいる場合には、これら複数の話し相手の音声も収音してマスカー音ファイルを生成するようにしてもよい。また、複数人で話しをする場合、各人が携帯電話機10でマスカー音を放音するようにしてもよい。
【0039】
本発明においては、マイクロホンで収音した音声から音声データを生成する際、同時に収音される暗騒音をフィルタ処理によりカットした音声データを生成するようにしてもよい。また、暗騒音をカットせずに暗騒音を含む音声データを生成するようにしてもよい。
また、マスカー音ファイルを生成する場合、収音した場所を表す場所情報を入力し、入力された場所情報をマスカー音ファイルのファイル名に対応づけてマスカー音テーブルTBに格納するようにしてもよい。また、マスカー音ファイルを生成する場合、異なる複数の場所で収音し、場所毎にマスカー音ファイルを生成して記憶するようにしてもよい。また、マスカー音ファイルを取得する場合、マスカー音ファイルを生成する時に収音した場所の場所情報を入力し、入力された場所情報に対応づけられているマスカー音ファイルをサーバ装置40から携帯電話機10に送信するようにしてもよい。
【0040】
上述した実施形態においては、音声データの内容は所定の文章をユーザが音読したものであるが、音声データの内容は所定の文章を音読したものに限定されるものではない。例えば、会議室で会議中のユーザの音声を録音し、この録音した音声の音声データからマスカー音ファイルを生成してもよく、また、レストランで食事中のユーザの音声を録音し、この録音した音声の音声データからマスカー音ファイルを生成してもよい。また、このように、場所および会話の内容が異なる毎にマスカー音ファイルを生成してサーバ装置40に記憶させ、会議室にいる場合には会議室で録音した音声から生成したマスカー音ファイルを取得して再生し、レストランにいる場合にはレストランで録音した音声から生成したマスカー音ファイルを取得して再生するようにしてもよい。
また、携帯電話機10で音声通話中の音声と暗騒音を収音し、この収音した音声の音声データからマスカー音ファイルを生成してもよい。なお、この構成においては、音声通話中に携帯電話機10から放音される通話相手の音声を、収音された音声からカットするようにしてもよい。
【0041】
本発明においては、マスカー音ファイルの生成を有料とし、サーバ装置40にマスカー音ファイルの生成を行わせる場合、音声データを送信する携帯電話機10のユーザからマスカー音ファイルの代金を徴収するようにしてもよい。また、マスカー音ファイルの使用について使用期限を設け、使用期限を越えたマスカー音ファイルは再生しない構成としてもよい。また、マスカー音ファイルの生成を有料とし、且つ、マスカー音ファイルの使用期限を設ける場合、マスカー音ファイルの使用期限に応じて、徴収する料金を異ならせるようにしてもよい。例えば、使用期限が長い場合には徴収する料金を高くし、使用期限が短い場合には徴収する料金を低くしてもよい。また、マスカー音ファイルの生成を有料とする場合、マスカー音ファイルを音質毎に複数生成し、マスカー音ファイルの音質に応じて徴収する料金を異ならせるようにしてもよい。
【0042】
上述した実施形態においては、携帯電話機10を使用した電話相手の音声から生成したマスカー音ファイルを電話相手から取得し、この電話相手と携帯電話機10で音声通話を行う場合、電話相手から取得したマスカー音ファイルを再生するようにしてもよい。
【0043】
本発明においては、ユーザを識別するための識別子は、携帯電話機10を一意に識別する個体識別番号であってもよい。また、携帯電話機10に装着されるSIM(Subscriber Identity Module)に割り当てられたSIMに固有の番号(例えば、IMSI(International Mobile Subscriber Identity))であってもよい。
【0044】
上述した携帯電話機10に記憶されているマスカー音アプリは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスク(CD(Compact Disc)、DVD(Digital Versatile Disk))など)、光磁気記録媒体、半導体メモリなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供し、携帯電話機10にインストールしてもよい。また、移動体通信網30Aやインターネット30Bを介してマスカー音アプリをダウンロードして携帯電話機10にインストールしてもよい。
【符号の説明】
【0045】
1…マスキングシステム、10…携帯電話機、30A…移動体通信網、30B…インターネット、40…サーバ装置、101…バス、102…CPU、103…ROM、104…RAM、105…記憶部、106…操作部、107…表示部、108…通信部、109…音声処理部、401…バス、402…CPU、403…ROM、404…RAM、405…記憶部、406…操作部、407…表示部、410…通信部
【技術分野】
【0001】
本発明は、音声をマスキングする技術に関する。
【背景技術】
【0002】
マスキング効果を利用した発明として、特許文献1,2に開示された発明がある。特許文献1に開示されているサウンドマスキングシステムは、マイクロホンを音響空間に配置し、マイクロホンで収音された音声を複数のフレームに分割する。また、分割した音声を各フレーム内で逆の波形に置き換え、フレーム同士のつながりを滑らかにする処理をした後、フレームの順序をランダムに並べ替えてマスキングサウンドを生成し、生成したマスキングサウンドをマイクロホンがある音響空間とは別な音響空間にあるスピーカから放音する。これにより、マイクロホンがある音響空間で会話が行われても、スピーカがある音響空間には生成されたマスキングサウンドが放音される。スピーカがある音響空間とマイクロホンがある音響空間が近くても、スピーカがある音響空間にはマイクロホンで収音された音声から生成されたマスキングサウンドが放音されるので、マイクロホンがある音響空間でされた会話がマスキングされる。
また、特許文献2に開示されている音声処理装置は、会話が行われる場所にマイクロホンを配置し、会話が行われる場所の近傍にスピーカを配置する。ここで、音声処理装置は、マイクロホンで収音された音声のスペクトルを変形した変形スペクトルを生成し、生成した変形スペクトルから音声信号を生成する。生成された音声信号はスピーカへ供給され、スピーカからは、マイクロホンで収音された音声が聞き取られるのを防ぐ妨害音が放音される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−233671号公報
【特許文献2】特開2006−243178号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、会話の内容が他者に聞き取られるのを防ぎたい状況としては、様々な状況がある。例えば、医師からもらった処方箋に記載された薬を薬局で購入する場合、処方箋に記載された薬の効果や副作用の説明を受けることや、服用中の薬の名称を薬剤師に告げることがある。ここで、薬の名称、効果や副作用などを他者に聞かれると、他者に病気を特定される虞がある。特許文献1,2に開示された発明を設置すれば、他者に会話を聞かれる虞はなくなるものの、そのような場所に必ず特許文献1,2に開示された装置を配置するのは非常に手間やコストがかかる。また、ある薬局で特許文献1,2に開示された発明があっても他の薬局に特許文献1,2に開示された発明がなければ、結局会話の内容を他者に聞き取られる。
【0005】
本発明は、上述した背景の下になされたものであり、会話する者が移動しても移動先で会話をマスキングできる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決するため、本発明は、音を収音する収音手段と、前記収音手段で収音された音を表すデータを生成するデータ生成手段と、前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、前記マスカー音生成手段が生成した信号が表す音を放音する放音手段とを備える端末装置を提供する。
【0007】
本発明においては、前記収音手段は、人間の発する音と、当該収音手段の周囲の暗騒音を収音する構成であってもよい。
また本発明においては、前記収音手段は、人間の発する音を収音し、前記人間が発する音は所定の文章を音読した音である構成であってもよい。
また本発明においては、前記収音手段は、人間の発する音を収音し、前記人間が発する音は会話の音である構成であってもよい。
また本発明においては、前記人間の発する音は複数の場所で収音され、前記マスカー音のデータは、前記複数の場所毎に生成され、前記複数の場所のいずれかを選択し、選択された場所で収音された音のデータから生成された前記マスカー音のデータを取得する構成であってもよい。
【0008】
また本発明は、収音手段で収音された音を表すデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを受信する受信手段と、前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する生成手段と、前記生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、前記記憶手段において端末装置から送信された認証データに対応づけられているデータを前記端末装置へ送信する送信手段とを備えるサーバ装置を提供する。
【0009】
また本発明は、音を収音する収音手段と、前記収音手段で収音された音を表すデータを生成する第1生成手段と、前記第1生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する第1送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、前記マスカー音生成手段が生成した信号が表す音を放音する放音手段とを備える端末装置と、前記第1送信手段から送信されたデータを受信する受信手段と、前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する第2生成手段と、前記第2生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、前記記憶手段において前記取得手段から送信された認証データに対応づけられているデータを前記端末装置へ送信する第2送信手段とを備えるサーバ装置を具備するマスキングシステムを提供する。
【0010】
また本発明は、コンピュータを、音を収音する収音手段で収音された音を表すデータを生成するデータ生成手段と、前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段として機能させるためのプログラムを提供する。
【発明の効果】
【0011】
本発明によれば、会話する者が移動しても移動先で会話をマスキングすることができる。
【図面の簡単な説明】
【0012】
【図1】本発明の一実施形態に係るマスキングシステム1の構成を示した図。
【図2】携帯電話機10のハードウェア構成を示した図。
【図3】サーバ装置40のハードウェア構成を示した図。
【図4】マスカー音テーブルTBの内容を示した図。
【図5】マスカー音ファイルを生成する時の動作を説明するための図。
【図6】携帯電話機10が表示する画面を示した図。
【図7】携帯電話機10が表示する画面を示した図。
【図8】携帯電話機10が表示する画面を示した図。
【図9】携帯電話機10が表示する画面を示した図。
【図10】マスカー音ファイルを取得する時の動作を説明するための図。
【図11】携帯電話機10が表示する画面を示した図。
【図12】携帯電話機10が表示する画面を示した図。
【発明を実施するための形態】
【0013】
[実施形態]
(全体構成)
図1は、本発明の実施形態に係わるマスキングシステム1を構成する装置を示した図である。なお、このマスキングシステム1には多数の携帯電話機(端末装置)およびサーバ装置が存在するが、図面が繁雑になるのを防ぐため、図1においては、一つの携帯電話機10と、一つのサーバ装置40のみを示している。
【0014】
移動体通信網30Aは、携帯電話機10に音声通話サービスやデータ通信サービスを提供する通信網である。移動体通信網30Aは、携帯電話機10と無線通信を行う無線基地局、無線基地局に接続された交換機、交換機および固定電話網に接続された関門交換機、関門交換機とインターネット30Bに接続されデータ通信を中継するゲートウェイサーバ(いずれも図示略)を有している。移動体通信網30Aは、移動体通信網30Aを運用する通信事業者と加入契約を行った者が所有する携帯電話機10に対して音声通話サービスやパケット通信を用いたデータ通信サービスを提供する。また、移動体通信網30Aは、インターネット30Bに接続されたサーバ装置40と携帯電話機10との間で行われるデータ通信を中継する。
【0015】
サーバ装置40は、クライアント−サーバシステムのサーバとして機能するコンピュータ装置であり、インターネット30Bに接続されている。サーバ装置40は、携帯電話機10のユーザの音声をマスキングするマスカー音を表すマスカー音データを生成して記憶し、記憶したマスカー音データを携帯電話機10へ提供する機能を備えている。
携帯電話機10は、図示を省略したユーザが所有する携帯電話機であり、移動体通信網30Aが提供する様々な通信サービス受けることができる。また、携帯電話機10は、サーバ装置40とデータ通信を行い、マスカー音データをサーバ装置40から取得し、取得したマスカー音データを再生する機能を備えている。
【0016】
(携帯電話機10の構成)
図2は、携帯電話機10のハードウェア構成を例示する図である。図2に示したように、携帯電話機10の各部はバス101に接続されている。携帯電話機10の各部は、このバス101を介して各部間でデータの授受を行う。
【0017】
通信部108は、無線通信を行うインターフェースの機能を有しており、CPU(Central Processing Unit)102の制御の下、通信部108に接続されているアンテナ(図示略)を介して、移動体通信網30Aの無線基地局との間で無線通信を行う。通信部108は、音声通信とデータ通信を同時に行うことが可能であり、デジタル化された音声信号や、データ通信で用いられるデータの送受信を行う。
通信部108は、無線基地局から送信された音声信号やデータを受信すると、受信した音声信号を音声処理部109へ供給し、受信したデータをCPU102へ供給する。また通信部108は、データ通信に係るデータが供給されると、このデータを無線基地局へ送信する。また通信部108は、デジタル化された音声信号が音声処理部109から供給されると、この音声信号を無線基地局へ送信する。
【0018】
音声処理部109は、スピーカと、携帯電話機10の周囲の音を収音する収音手段の一例であるマイクロホンを備えている。音声処理部109は、マイクロホンに音声が入力されると、入力された音声をデジタル化した音声信号を生成し、この音声信号を通信部108へ供給する。また、音声処理部109は、音声信号が供給されると、この音声信号をアナログ信号に変換し、アナログ化された音声信号をスピーカへ供給する。
【0019】
表示部107は、例えば液晶ディスプレイ装置を備えており、CPU102の制御の下、文字やグラフィック画面、携帯電話機10を操作するためのメニュー画面などを表示する。
操作部106は、図示を省略したテンキーや操作指示などを入力するための複数のキーを備えている。携帯電話機10のユーザが、これらのキーを操作すると、操作されたキーを示す信号が操作部106からCPU102へ出力される。また操作部106は、静電容量方式で矩形の形状をした透明なタッチセンサーを有している。タッチセンサーは、表示部107の液晶ディスプレイ装置の表面全体を覆うように配置されており、液晶ディスプレイ装置に表示された画像を透過する。タッチセンサーは、矩形の領域内においてユーザが指で触れた位置を検知し、検知した位置を示す信号をCPU102へ出力する。
記憶部105は、不揮発性メモリであり、携帯電話機10を制御するためのデータやマスカー音ファイル等の様々なデータを記憶する。また、記憶部105には、マスカー音ファイルの生成や再生に係る機能を実現するアプリケーションプログラム(以下、マスカー音アプリと称する)を記憶している。
【0020】
ROM(Read Only Memory)103には、CPU102により実行される各種プログラムが記憶されており、CPU102および携帯電話機各部の初期化を行う初期化プログラム、携帯電話機10の全体を制御するOS(Operating System)プログラム、データ通信の機能や音声通信の機能を実現するプログラムなどが記憶されている。RAM(Random Access Memory)104は、CPU102がプログラムを実行するときの作業エリアとして使用され、CPU102がプログラムを実行するときに使用するデータが記憶される。
【0021】
CPU102は、携帯電話機10の各部を制御する制御部である。携帯電話機10において図示を省略した電源が入れられると、CPU102が、ROM103から初期化プログラムを読み出して実行し、CPU102の初期化および携帯電話機10各部の初期化を行う。CPU102は、初期化プログラムの実行を終了するとROM103からOSプログラムや各種プログラムを読み出し実行する。CPU102がOSプログラムを実行すると、携帯電話機としての各種機能が実現し、携帯電話機10において音声通信やデータ通信を行うことが可能となる。また、CPU102は、操作部106のキーやタッチセンサーから送られた信号によりユーザの操作を特定し、各種制御を行う。また、CPU102がOSプログラムを実行すると、記憶部105に記憶されているマスカー音アプリを実行することが可能となる。
【0022】
(サーバ装置40の構成)
図3は、サーバ装置40のハードウェア構成を例示したブロック図である。同図に示したように、サーバ装置40の各部はバス401に接続されており、このバス401を介して各種データの授受を行う。
【0023】
操作部406は、キーボードやマウス等、サーバ装置40を操作するための装置を備えている。サーバ装置40の操作者によりこれらの装置が操作されると、行われた操作に応じてCPU402が各種処理を行う。表示部407は、液晶ディスプレイ装置を有しており、CPU402の制御の下、サーバ装置40を操作するためのメニュー画面やサーバ装置40が有するデータなどを表示する。通信部410は、インターネット30Bに接続されており、インターネット30Bを介して他の装置と通信を行う際のインターフェースとして機能する。
【0024】
記憶部405は、ハードディスク装置であり、サーバ装置40においてオペレーティングシステムの機能を実現するOSプログラムを記憶している。また、記憶部405は、マスカー音を生成する機能や、マスカー音を記憶部405に記憶させる機能、マスカー音を携帯電話機10に送信する機能などをサーバ装置40において実現するアプリケーションプログラムを記憶している。また、記憶部405は、マスカー音テーブルTBを記憶している。図4は、マスカー音テーブルTBの一例を示した図である。図4に示したテーブルは、「ユーザ識別子」のフィールド、「パスワード」のフィールド、および「ファイル名」のフィールドを有している。「ファイル名」のフィールドには、マスカー音を表すファイルのファイル名が格納される。「ユーザ識別子」のフィールドには、マスカー音のユーザを一意に識別する識別子が格納される。また、「パスワード」のフィールドには、マスカー音のユーザを認証するためのパスワードが格納される。
【0025】
(実施形態の動作)
次に、本実施形態の動作について、まずマスカー音ファイルを生成する時の動作について説明する。まず、携帯電話機10のユーザが、操作部106においてマスカー音アプリの起動を指示する操作を行うと、CPU102が記憶部105からマスカー音アプリを読み出して実行する。マスカー音アプリが実行されると、CPU102により表示部107が制御されて図6に示した画面が表示される。図6は、マスカー音ファイルの生成処理とマスカー音ファイルの再生処理のいずれかを選択させるために表示される画面の一例を示している。この画面が表示されている状態において、ユーザが「マスカー音ファイルを生成する」のボタンに触れる操作を行うと、図5に示したマスカー音ファイルの生成処理が実行される。なお、ユーザが「マスカー音を取得する」のボタンに触れる操作を行うと、後述するマスカー音の取得処理と再生処理が実行される。またユーザが「終了」ボタンに触れる操作を行うと、CPU102は、マスカー音アプリの実行を終了する。
【0026】
図6に示した画面において「マスカー音ファイルを生成する」のボタンをユーザが触ると、CPU102は図7に示したように、ユーザに音読させる文章を表示部107に表示させる(ステップS101)。ここで、ユーザが画面に表示された録音開始ボタンに触れて文章の音読を始めると、マイクロホンで収音されたユーザの音声が音声処理部109においてユーザの音声を表すデータ(以下、音声データと称する)に変換され、この音声データは記憶部105に記憶される(ステップS102)。つまり、ここでCPU102は、音を表すデータを生成するデータ生成手段として機能する。なお、ユーザの音声を収音して音声データを記憶するのは、マスカー音を生成する際にはマスカー音を使用するユーザの音声を使用するためである。次に、ユーザが文章の音読を終了し、図7に示した録音終了ボタンに触れると、図8に示した画面が表示される。
【0027】
図8の画面は、マスカー音を使用するユーザを識別する識別子が入力されるテキストボックスと、ユーザを認証するためのパスワードが入力されるテキストボックスを備えている。図8の画面が表示されると、ユーザは、マスカー音を使用するユーザを識別する識別子と、ユーザを認証するためのパスワードを、操作部106を操作して入力する。ユーザが、識別子とパスワードを入力した後、表示されている生成ボタンに触れる操作を行うと、CPU102は、テキストボックスに入力された識別子とパスワードを取得する(ステップS104)。CPU102は、識別子とパスワードを取得すると、記憶部105に記憶された音声データ、取得した識別子およびパスワードを、通信部108を制御してサーバ装置40へ送信する(ステップS105)。ここで、CPU102と通信部108はデータを送信する送信手段として機能する。
【0028】
携帯電話機10から送信された音声データ、識別子およびパスワードは、移動体通信網30Aおよびインターネット30Bを介してサーバ装置40へ送られ、通信部410によって受信される。そして、通信部410で受信された音声データ、識別子およびパスワードは記憶部405に記憶される(ステップS106)。CPU402は、音声データを記憶部405に記憶させると、記憶部405に記憶された音声データからマスカー音を表すファイル(以下、マスカー音ファイルと称する)を生成し、生成したマスカー音ファイルを記憶部405に記憶させる(ステップS107)。なお、マスカー音ファイルを生成する方法としては、本実施形態では特開2008−233671号公報に開示されている方法を採用し、まず、音声データが表す音声を複数のフレームに分割する。次に、分割した音声を各フレーム内で逆の波形に置き換え、フレーム同士のつながりを滑らかにする処理をした後、フレームの順序をランダムに並べ替えてマスカー音を生成し、生成したマスカー音を表すマスカー音ファイルを生成する。なお、マスカー音を生成する方法は、特開2008−233671号公報に開示されている方法に限定されるものではなく、例えば、音声データが表す音声を複数のフレームに分割し、分割したフレームを並べ替えた音声をマスカー音としてもよい。
【0029】
CPU402は、マスカー音ファイルを生成すると、生成したマスカー音ファイルのファイル名を携帯電話機10から送信された識別子およびパスワードと対応づけてマスカー音テーブルTBに格納する(ステップS108)。CPU402は、マスカー音テーブルTBにファイル名を格納すると、マスカー音ファイルが生成されたことを通知するメッセージを通信部410を制御して携帯電話機10へ送信する(ステップS109)。サーバ装置40から送信されたメッセージは、インターネット30Bおよび移動体通信網30Aを介して携帯電話機10へ送られ、通信部108によって受信される。通信部108で受信されたメッセージがCPU102へ供給されると、CPU102は図9に示したメッセージを、表示部107に表示させる(ステップS110)。これにより、ユーザは、自分の音声のマスカー音がサーバ装置40に記憶されたことを知ることができる。この後、ユーザが図9の戻るボタンに触れる操作を行うと、図6に示した画面が表示される。
【0030】
次に、サーバ装置40に記憶されたマスカー音ファイルを取得して再生する時の動作について説明する。まず、図6に示した画面が表示されている状態において、ユーザが「マスカー音ファイルを取得する」のボタンに触れる操作を行うと、図10に示したマスカー音ファイルの取得処理と再生処理が行われる。具体的には、図6に示した画面において「マスカー音ファイルを取得する」のボタンに触れる操作をユーザが行うと、CPU102は図11に示した画面を表示部107に表示させる(ステップS201)。図11の画面は、マスカー音を使用するユーザを識別する識別子が入力されるテキストボックスと、ユーザを認証するためのパスワードが入力されるテキストボックスを備えている。図11の画面が表示されると、ユーザは、操作部106を操作してマスカー音を生成する時に入力した識別子とパスワードを入力する。ユーザが、識別子とパスワードを入力した後、表示されている「マスカー音ファイルを取得」のボタンに触れる操作を行うと、CPU102は、テキストボックスに入力された識別子とパスワードを取得する(ステップS202)。CPU102は、識別子とパスワードを取得すると、取得した識別子およびパスワードを、通信部108を制御してサーバ装置40へ送信する(ステップS203)。
【0031】
携帯電話機10から送信された識別子およびパスワードは、サーバ装置40へ送られ、通信部410によって受信される。携帯電話機10から送信された識別子およびパスワードは、サーバ装置40へ送られ、通信部410によって受信される。そして、通信部410で受信された識別子およびパスワードはCPU402へ供給される。CPU402は、識別子およびパスワードが供給されると、マスカー音ファイルを記憶部405から取得する(ステップS204)。具体的には、CPU402は、受信した識別子をマスカー音テーブルTBにおいて検索する。ここで、検索した識別子がマスカー音テーブルTBに格納されている場合、検索した識別子に対応づけられているパスワードと、受信したパスワードが同じであるか判断する。CPU402は、ここでパスワードが同じである場合、検索した識別子に対応づけられているファイル名で特定されるマスカー音ファイルを記憶部405から取得する。CPU402は、マスカー音ファイルを取得すると、取得したマスカー音ファイルを携帯電話機10へ送信する(ステップS205)。サーバ装置40から送信されたマスカー音ファイルは、インターネット30Bおよび移動体通信網30Aを介して携帯電話機10へ送られ、通信部108によって受信される。
このように、CPU102と通信部108は、識別子とパスワードを送信してマスカー音ファイルを取得する取得手段として機能する。
【0032】
CPU102は、マスカー音ファイルが通信部108で受信されると、受信されたマスカー音ファイルを記憶部105に記憶させる(ステップS206)。CPU102は、マスカー音ファイルを記憶部105に記憶させると、図12に示した画面を表示部107に表示させる(ステップS207)。これによりユーザは、携帯電話機10がマスカー音ファイルを取得したことを知ることができる。次に、図12に示した再生ボタンに触れる操作を行うと、マスカー音ファイルが再生される(ステップS208)。具体的には、記憶されたマスカー音ファイルが音声処理部109へ供給される。音声処理部109は、マスカー音ファイルが供給されると、マスカー音ファイルが表すマスカー音の音声信号を生成し、生成した音声信号をスピーカへ供給する。ここで、CPU102と音声処理部109は、マスカー音を表す信号を生成するマスカー音生成手段として機能している。これにより、ユーザの音声から生成されたマスカー音が携帯電話機10のスピーカから放音される。即ち、ユーザの音声から生成されたマスカー音が携帯電話機10のスピーカから放音されている状態で当該ユーザが会話を行うと、放音されているマスカー音によりユーザ自らの音声がマスキングされる。ユーザは、会話を終了してマスカー音ファイルの再生を終了する場合には、図12に示した終了ボタンに触れる操作をする。この操作が行われると、CPU102は、マスカー音ファイルの再生を停止し、記憶部105に記憶されたマスカー音ファイルを消去する。
【0033】
以上説明したように本実施形態によれば、ユーザの音声から生成したマスカー音で当該ユーザの音声がマスキングされるため、高いマスキング効果が得られる。また、マスカー音ファイルの生成はCPUに負荷をかける処理であるが、この処理は、携帯電話機10では行われないため、携帯電話機10のCPUにかかる負荷を抑えることができる。また、マスカー音ファイルは、サーバ装置40に記憶されているため、移動体通信網30Aやインターネット30Bに接続できる環境であれば、マスカー音が必要となる任意の場所や時間において、マスカー音ファイルを自由に取得して再生することができる。例えば、スピーカを備え、マスカー音アプリがインストールされたパーソナルコンピュータをインターネット30Bに接続すれば、識別子とパスワードを入力してサーバ装置40からマスカー音ファイルを取得し、マスカー音を再生することができる。この場合、移動体通信網30Aからの電波が届かない建物内の会議室などにパーソナルコンピュータがあっても、マスカー音ファイルを取得してユーザの音声をマスキングすることができる。
【0034】
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
【0035】
マスカー音アプリがインストールされる端末装置は、携帯電話機10に限定されるものではない。マイクおよびスピーカを備え、移動体通信網30Aまたはインターネット30Bに接続してサーバ装置40と通信可能な装置であれば、例えば、PDA(Personal Digital Assistant)やパーソナルコンピュータであってもよい。
【0036】
上述した実施形態においては、マスカー音ファイルの再生を停止すると記憶部105に記憶されたマスカー音ファイルを消去しているが、マスカー音ファイルを消去せずに、記憶部105に記憶させたままにしてもよい。この場合、CPU102は、「マスカー音ファイルを再生する」のボタンに触れる操作が行われると、記憶部105にマスカー音ファイルが記憶されているか判断し、記憶されていない場合には上述した動作を行う。一方、マスカー音ファイルが記憶部105に記憶されている場合には、記憶部105に記憶されているマスカー音ファイルを取得して再生する。
【0037】
本発明においては、マスカー音ファイルの再生中に音声処理部109のマイクロホンで携帯電話機10の周囲の音声を収音し、収音したマスカー音以外の音声の音量に応じてマスカー音の音量を制御してもよい。例えば、マスカー音以外の音声の音量が小さい場合にはマスカー音の音量も小さくし、マスカー音以外の音声の音量が大きい場合にはマスカー音の音量も大きくする構成としてもよい。
【0038】
上述した実施形態においては、携帯電話機10のユーザの音声のみを収音して音声データを生成し、この音声データからマスカー音ファイルを生成していたが、このユーザの話し相手の音声もユーザの音声と同時に収音して音声データを生成し、この音声データからマスカー音ファイルを生成してもよい。この構成によれば、ユーザの音声だけでなくユーザの話し相手の音声もマスキングすることができる。また、会議などで複数の話し相手がいる場合には、これら複数の話し相手の音声も収音してマスカー音ファイルを生成するようにしてもよい。また、複数人で話しをする場合、各人が携帯電話機10でマスカー音を放音するようにしてもよい。
【0039】
本発明においては、マイクロホンで収音した音声から音声データを生成する際、同時に収音される暗騒音をフィルタ処理によりカットした音声データを生成するようにしてもよい。また、暗騒音をカットせずに暗騒音を含む音声データを生成するようにしてもよい。
また、マスカー音ファイルを生成する場合、収音した場所を表す場所情報を入力し、入力された場所情報をマスカー音ファイルのファイル名に対応づけてマスカー音テーブルTBに格納するようにしてもよい。また、マスカー音ファイルを生成する場合、異なる複数の場所で収音し、場所毎にマスカー音ファイルを生成して記憶するようにしてもよい。また、マスカー音ファイルを取得する場合、マスカー音ファイルを生成する時に収音した場所の場所情報を入力し、入力された場所情報に対応づけられているマスカー音ファイルをサーバ装置40から携帯電話機10に送信するようにしてもよい。
【0040】
上述した実施形態においては、音声データの内容は所定の文章をユーザが音読したものであるが、音声データの内容は所定の文章を音読したものに限定されるものではない。例えば、会議室で会議中のユーザの音声を録音し、この録音した音声の音声データからマスカー音ファイルを生成してもよく、また、レストランで食事中のユーザの音声を録音し、この録音した音声の音声データからマスカー音ファイルを生成してもよい。また、このように、場所および会話の内容が異なる毎にマスカー音ファイルを生成してサーバ装置40に記憶させ、会議室にいる場合には会議室で録音した音声から生成したマスカー音ファイルを取得して再生し、レストランにいる場合にはレストランで録音した音声から生成したマスカー音ファイルを取得して再生するようにしてもよい。
また、携帯電話機10で音声通話中の音声と暗騒音を収音し、この収音した音声の音声データからマスカー音ファイルを生成してもよい。なお、この構成においては、音声通話中に携帯電話機10から放音される通話相手の音声を、収音された音声からカットするようにしてもよい。
【0041】
本発明においては、マスカー音ファイルの生成を有料とし、サーバ装置40にマスカー音ファイルの生成を行わせる場合、音声データを送信する携帯電話機10のユーザからマスカー音ファイルの代金を徴収するようにしてもよい。また、マスカー音ファイルの使用について使用期限を設け、使用期限を越えたマスカー音ファイルは再生しない構成としてもよい。また、マスカー音ファイルの生成を有料とし、且つ、マスカー音ファイルの使用期限を設ける場合、マスカー音ファイルの使用期限に応じて、徴収する料金を異ならせるようにしてもよい。例えば、使用期限が長い場合には徴収する料金を高くし、使用期限が短い場合には徴収する料金を低くしてもよい。また、マスカー音ファイルの生成を有料とする場合、マスカー音ファイルを音質毎に複数生成し、マスカー音ファイルの音質に応じて徴収する料金を異ならせるようにしてもよい。
【0042】
上述した実施形態においては、携帯電話機10を使用した電話相手の音声から生成したマスカー音ファイルを電話相手から取得し、この電話相手と携帯電話機10で音声通話を行う場合、電話相手から取得したマスカー音ファイルを再生するようにしてもよい。
【0043】
本発明においては、ユーザを識別するための識別子は、携帯電話機10を一意に識別する個体識別番号であってもよい。また、携帯電話機10に装着されるSIM(Subscriber Identity Module)に割り当てられたSIMに固有の番号(例えば、IMSI(International Mobile Subscriber Identity))であってもよい。
【0044】
上述した携帯電話機10に記憶されているマスカー音アプリは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスク(CD(Compact Disc)、DVD(Digital Versatile Disk))など)、光磁気記録媒体、半導体メモリなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供し、携帯電話機10にインストールしてもよい。また、移動体通信網30Aやインターネット30Bを介してマスカー音アプリをダウンロードして携帯電話機10にインストールしてもよい。
【符号の説明】
【0045】
1…マスキングシステム、10…携帯電話機、30A…移動体通信網、30B…インターネット、40…サーバ装置、101…バス、102…CPU、103…ROM、104…RAM、105…記憶部、106…操作部、107…表示部、108…通信部、109…音声処理部、401…バス、402…CPU、403…ROM、404…RAM、405…記憶部、406…操作部、407…表示部、410…通信部
【特許請求の範囲】
【請求項1】
音を収音する収音手段と、
前記収音手段で収音された音を表すデータを生成するデータ生成手段と、
前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、
前記マスカー音生成手段が生成した信号が表す音を放音する放音手段と
を備える端末装置。
【請求項2】
前記収音手段は、人間の発する音と、当該収音手段の周囲の暗騒音を収音することを特徴とする請求項1に記載の端末装置。
【請求項3】
前記収音手段は、人間の発する音を収音し、前記人間が発する音は所定の文章を音読した音であることを特徴とする請求項1または請求項2に記載の端末装置。
【請求項4】
前記収音手段は、人間の発する音を収音し、前記人間が発する音は会話の音であることを特徴とする請求項1または請求項2に記載の端末装置。
【請求項5】
前記人間の発する音は複数の場所で収音され、
前記マスカー音のデータは、前記複数の場所毎に生成され、
前記複数の場所のいずれかを選択し、選択された場所で収音された音のデータから生成された前記マスカー音のデータを取得すること
を特徴とする請求項2乃至請求項4のいずれかに記載の端末装置。
【請求項6】
収音手段で収音された音を表すデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを受信する受信手段と、
前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する生成手段と、
前記生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、
前記記憶手段において端末装置から送信された認証データに対応づけられているデータを前記端末装置へ送信する送信手段と
を備えるサーバ装置。
【請求項7】
音を収音する収音手段と、
前記収音手段で収音された音を表すデータを生成する第1生成手段と、
前記第1生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する第1送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、
前記マスカー音生成手段が生成した信号が表す音を放音する放音手段と
を備える端末装置と、
前記第1送信手段から送信されたデータを受信する受信手段と、
前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する第2生成手段と、
前記第2生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、
前記記憶手段において前記取得手段から送信された認証データに対応づけられているデータを前記端末装置へ送信する第2送信手段と
を備えるサーバ装置
を具備するマスキングシステム。
【請求項8】
コンピュータを、
音を収音する収音手段で収音された音を表すデータを生成するデータ生成手段と、
前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段
として機能させるためのプログラム。
【請求項1】
音を収音する収音手段と、
前記収音手段で収音された音を表すデータを生成するデータ生成手段と、
前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、
前記マスカー音生成手段が生成した信号が表す音を放音する放音手段と
を備える端末装置。
【請求項2】
前記収音手段は、人間の発する音と、当該収音手段の周囲の暗騒音を収音することを特徴とする請求項1に記載の端末装置。
【請求項3】
前記収音手段は、人間の発する音を収音し、前記人間が発する音は所定の文章を音読した音であることを特徴とする請求項1または請求項2に記載の端末装置。
【請求項4】
前記収音手段は、人間の発する音を収音し、前記人間が発する音は会話の音であることを特徴とする請求項1または請求項2に記載の端末装置。
【請求項5】
前記人間の発する音は複数の場所で収音され、
前記マスカー音のデータは、前記複数の場所毎に生成され、
前記複数の場所のいずれかを選択し、選択された場所で収音された音のデータから生成された前記マスカー音のデータを取得すること
を特徴とする請求項2乃至請求項4のいずれかに記載の端末装置。
【請求項6】
収音手段で収音された音を表すデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを受信する受信手段と、
前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する生成手段と、
前記生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、
前記記憶手段において端末装置から送信された認証データに対応づけられているデータを前記端末装置へ送信する送信手段と
を備えるサーバ装置。
【請求項7】
音を収音する収音手段と、
前記収音手段で収音された音を表すデータを生成する第1生成手段と、
前記第1生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する第1送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段と、
前記マスカー音生成手段が生成した信号が表す音を放音する放音手段と
を備える端末装置と、
前記第1送信手段から送信されたデータを受信する受信手段と、
前記受信手段で受信されたデータを基に前記マスカー音を表すデータを生成する第2生成手段と、
前記第2生成手段で生成されたデータを前記受信手段が受信した認証データに対応づけて記憶する記憶手段と、
前記記憶手段において前記取得手段から送信された認証データに対応づけられているデータを前記端末装置へ送信する第2送信手段と
を備えるサーバ装置
を具備するマスキングシステム。
【請求項8】
コンピュータを、
音を収音する収音手段で収音された音を表すデータを生成するデータ生成手段と、
前記データ生成手段で生成されたデータと、前記音から生成されるマスカー音の使用者を一意に特定する認証データを予め定められたサーバ装置へ送信する送信手段と、
前記認証データを前記サーバ装置へ送信し、前記サーバ装置において該送信した認証データに対応づけられており、前記送信手段から送信されたデータを基に生成されたデータであって、前記マスカー音を表すデータを前記サーバ装置から取得する取得手段と、
前記取得手段で取得したデータから前記マスカー音を表す信号を生成するマスカー音生成手段
として機能させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−226172(P2012−226172A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−94429(P2011−94429)
【出願日】平成23年4月20日(2011.4.20)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願日】平成23年4月20日(2011.4.20)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】
[ Back to top ]