説明

音声処理装置、音声処理方法、及びプログラム

【課題】音声処理装置、通話録音方法、及びプログラムを提供する。
【解決手段】電話機を接続可能に構成された音声処理装置において、前記電話機での通話内容を録音する録音手段と、前記録音手段により録音された前記通話内容に基づいて録音ファイルを生成するファイル生成手段と、前記電話機から通話相手に関する情報を取得する情報取得手段と、前記情報取得手段により取得された前記通話相手に関する情報を前記ファイル生成手段により生成された録音ファイルに付与する情報付与手段と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声処理装置、音声処理方法、及びプログラムに関する。
【背景技術】
【0002】
近年、不揮発メモリに楽曲データ等を記憶するデジタルオーディオプレーヤー(Digital Audio Player:DAP)と呼ばれるポータブル機器が開発され、市販されている。このようなDAPは、従来の携帯型のCDプレーヤーやMDプレーヤー等と比べて、音飛びが発生しないこと、より多くの楽曲データを記憶できること、そしてより小型化(薄型化)・軽量化されたこと等の理由から、広く普及してきている。
【0003】
電話機による通話時に、上記したDAPを用いて通話相手との通話内容を録音する場合、電話機にDAPを接続して、手動でDAPの録音キーを押下することにより録音していた。また、録音を終了したい場合には、同様に手動で停止キーを押下することで停止させていた。
そして、録音された通話内容は、一度再生することによって確認していた。
以下、一連の録音動作について図5を用いて説明する。
【0004】
図5は、従来のDAP内で行われる通話録音処理の一例について示したフローチャートである。
図5に示すように、ステップS1では、録音キーが入力されたか否かが判定される。録音キーが入力されていた場合は、次のステップS2へと移行し、録音キーが入力されていなかった場合は、当該ステップS1の処理を繰り返す。
ステップS2では、通話内容の録音が開始される。
ステップS3では、停止キーが入力されたか否かが判定される。停止キーが入力されていた場合は、次のステップS4へと移行し、停止キーが入力されていなかった場合は、当該ステップS3の処理を繰り返す。
ステップS4では、録音が停止される。録音が停止されると、録音された通話データに基づいて録音ファイルが生成される。
ステップS5では、生成されたファイルのファイル名に現在の日時(録音が停止された日時)を付与して記憶される。
【0005】
このように、従来のDAPを用いた通話内容の録音処理は、ユーザの手動操作により行われていた。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−233139号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、ユーザの手動で録音処理を行う場合、録音キーを押し忘れたり、通話の途中から録音を開始したりする虞があり、必要な記録が取れない可能性がある。
また、生成されたファイルのファイル名に録音が停止された日時しか表記されないため、実際に再生してみないと電話での通話内容を録音したデータなのか判断することができない。
また、録音したデータが複数ある場合も、実際に再生してみないと相手先や内容を確認することができない。
【0008】
また、電話での通話内容を録音したデータと他の録音データ(会議内容や音楽等を録音したデータ)とを混在してしまう虞があり、ユーザは録音データを再生して振り分ける操作を行うか、又は必要に応じてファイル名を変更する必要がある。
また、携帯電話の通話記録の機能を使用して録音データを確認する場合は携帯電話で聞き直す必要があり、携帯電話の使用が制限されている場所で確認することができない。
【0009】
本発明は、記憶されている録音ファイルの内容を一目で判別可能にファイル名を付与することが可能な音声処理装置、音声処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
請求項1に記載の発明は、上記目的を達成するためになされたものであり、電話機を接続可能に構成された音声処理装置において、前記電話機での通話内容を録音する録音手段と、前記録音手段により録音された前記通話内容に基づいて録音ファイルを生成するファイル生成手段と、前記電話機から通話相手に関する情報を取得する情報取得手段と、前記情報取得手段により取得された前記通話相手に関する情報を前記ファイル生成手段により生成された録音ファイルに付与する情報付与手段と、を備えることを特徴とする。
【0011】
請求項2に記載の発明は、請求項1に記載のコンテンツ処理装置において、前記通話相手に関する情報は、当該通話相手の電話番号を含むことを特徴とする。
【0012】
請求項3に記載の発明は、請求項2に記載のコンテンツ処理装置において、前記通話相手に関する情報は、前記電話機内で前記電話番号に対応付けられた文字列を含むことを特徴とする。
【0013】
請求項4に記載の発明は、請求項1から3のいずれか一項に記載のコンテンツ処理装置において、前記情報付与手段により前記通話相手に関する情報を付与された録音ファイルを記憶する記憶手段を更に備え、前記記憶手段は、前記通話相手に関する情報に対応付けされたフォルダに分類して前記録音ファイルを記憶することを特徴とする。
【0014】
請求項5に記載の発明は、電話機を接続可能に構成された音声処理装置において、前記電話機での通話内容を録音する録音ステップと、録音された前記通話内容に基づいて録音ファイルを生成するファイル生成ステップと、前記電話機から通話相手に関する情報を取得する情報取得ステップと、取得された前記通話相手に関する情報を生成された前記録音ファイルに付与する情報付与ステップと、を含む音声処理方法である。
【0015】
請求項6に記載の発明は、電話機を接続可能に構成された音声処理装置において、コンピュータに、前記電話機での通話内容を録音する録音機能と、録音された前記通話内容に基づいて録音ファイルを生成するファイル生成機能と、前記電話機から通話相手に関する情報を取得する情報取得機能と、取得された前記通話相手に関する情報を生成された前記録音ファイルに付与する情報付与機能と、を実現させるためのプログラムである。
【発明の効果】
【0016】
本発明によれば、記憶されている録音ファイルの内容を一目で判別可能にファイル名を付与することが可能な音声処理装置、音声処理方法、及びプログラムを提供することができる。
【図面の簡単な説明】
【0017】
【図1】本実施形態に係るDAP100の概略構成を示すブロック図である。
【図2】本実施形態に係るDAP100内で行われる録音ファイル生成処理の一例について示したフローチャートである。
【図3】本実施形態に係る電話機200内で行われる通話録音処理の一例について示したフローチャートである。
【図4】生成された録音ファイルをグループ分けして記憶するためのフォルダ構成の一例について示した図である。
【図5】従来のDAP内で行われる通話録音処理の一例について示したフローチャートである。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態を図面に基づいて説明する。
【0019】
以下、本発明の実施の形態を図面に基づいて説明する。なお、本実施形態では、本発明
に係る音声処理装置をDAPに適用した場合について例示する。
【0020】
図1は、本実施形態に係るDAP100の概略構成を示すブロック図である。
図1に示すように、DAP100は、表示部1と、操作部2と、アンプ3と、出力部4と、記憶部5と、制御部6と、I/F7と、を備えて構成される。また、DAP100は、I/F7を介して電話機200と接続されている。なお、電話機200は、固定電話でも携帯電話でもよい。
【0021】
表示部1は、例えば、液晶や有機EL(Electro Luminescence)等のディスプレイを備え、制御部6から出力された表示データに基づいて、楽曲情報等の各種情報(例えば、楽曲のトラック名や歌詞等のテキストファイル、ジャケット写真等の画像ファイル等)を表示する。
操作部2は、DAP100を操作するための操作キー群(例えば方向指示キー、決定キー、再生キー、録音キー、停止キー等)を備える。操作部2は、ユーザにより操作キーが押下されると、操作キーに応じた操作信号を生成し、制御部6に出力する。
【0022】
アンプ3は、制御部6から出力された音声信号を増幅して出力部4に出力する。
出力部4は、アンプ3から出力された音声信号に基づく音声をヘッドホンやスピーカ、外部機器へ出力する。
【0023】
記憶部5は、例えば、半導体メモリ(例えば、NAND型FlashROM)やHDDで構成され、音声ファイル(例えばmp3、wma、aac、wav等)、画像ファイル(jpg等)、テキストファイル(txt等)等の各種コンテンツを記憶する。なお、音声ファイルは、音源となる音声データの他、音声ファイルの基本的な情報について示したタグ情報(コンテンツ情報)を有する。
記憶部5に記憶された音声データは、制御部6で信号処理され、音声信号としてアンプ3に出力される。また、記憶部5に記憶された画像ファイルは、制御部6で信号処理され、表示部1に出力される。
【0024】
制御部6は、例えば、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、DSP(Digital Signal Processor)64等を備えて構成され、DAP100の各部を制御する。
CPU61は、ROM63に格納された処理プログラム等を読み出して、RAM62に展開して実行することにより、DAP100全体の制御を行う。
RAM62は、CPU61により実行された処理プログラム等を、RAM62内のプログラム格納領域に展開するとともに、入力データや上記処理プログラムが実行される際に生じる処理結果等をデータ格納領域に格納する。
ROM63は、例えば、半導体メモリで構成され、処理プログラムやデータ等が予め記憶されている。ROM63には、例えば、電話での通話内容を録音したファイルを生成する録音ファイル生成プログラム等が記憶されている。
DSP64は、音声ファイル、画像ファイル等のエンコードやデコード、音質調整等を行う。
【0025】
また、CPU61は、電話機200での通話内容を録音し、録音された通話内容に基づいて録音ファイルを生成し、電話機から通話相手に関する情報を取得し、取得された通話相手に関する情報をファイル生成手段により生成された録音ファイルに付与する。
通話相手に関する情報を付与された録音ファイルは記憶部5に記憶される。
【0026】
I/F7は、例えば、SDカード、USBメモリ等の記憶媒体を着脱可能に構成され、当該記憶媒体との間で定められた形式に従って、音声ファイル等の送受信を行う。また、I/F7は、電話機200を接続可能に構成され、電話機200からの各種情報(例えば、音声、着信開始、通話開始、通話終了、電話番号、電話帳の登録名、日時等の情報)を受信する。
【0027】
このように、DAP100は、電話機(電話機200)を接続可能に構成され、電話機での通話内容を録音する録音手段(制御部6)と、録音手段により録音された通話内容に基づいて録音ファイルを生成するファイル生成手段(制御部6)と、電話機から通話相手に関する情報を取得する情報取得手段(制御部6)と、情報取得手段により取得された通話相手に関する情報をファイル生成手段により生成された録音ファイルに付与する情報付与手段(制御部6)と、を備える。
【0028】
図2は、本実施形態に係るDAP100内で行われる録音ファイル生成処理の一例について示したフローチャートである。この録音ファイル生成処理は、DAP100の電源がONされたことを契機に、CPU61がROM63に格納されている録音ファイル生成プログラムを実行することにより実現される。
【0029】
図2に示すように、ステップS101では、電話機200が接続されているか否かが判定される。電話機200が接続されていた場合は、次のステップS102へと移行し、電話機200が接続されていなかった場合は、当該ステップS101の処理を繰り返す。
ステップS102では、着信があった旨の信号(以下着信信号)が受信されたか否かが判定される。着信信号が受信されていた場合は、次のステップS103へと移行し、着信信号が受信されていなかった場合は、当該ステップS102の処理を繰り返す。
ステップS103では、DAP100が再生中であるか否かが判定される。DAP100が再生中であった場合は、次のステップS104へと移行し、DAP100が再生中でなかった場合は、ステップS105へと移行する。
ステップS104では、DAP100の再生が停止される。
【0030】
ステップS105では、通話を開始した旨の信号(以下通話開始信号)が受信されたか否かが判定される。通話開始信号が受信されていた場合は、次のステップS106へと移行し、通話開始信号が受信されていなかった場合は、ステップS107へと移行する。
ステップS106では、通話内容の録音が開始される。
ステップS107では、着信が終了した旨の信号(以下着信終了信号)が受信されたか否かが判定される。着信終了信号が受信されていた場合は、当該録音ファイル生成処理を終了し、着信終了信号が受信されていなかった場合は、ステップS105へと移行する。
ステップS108では、通話を終了した旨の信号(以下通話終了信号)が受信されたか否かが判定される。通話終了信号が受信されていた場合は、次のステップS109へと移行し、通話終了信号が受信されていなかった場合は、当該ステップS108の処理を繰り返す。
ステップS109では、録音が停止される。録音が停止されると、録音された通話データに基づいて録音ファイルが生成され、記憶部5に記憶される。
【0031】
ステップS110では、電話機200に対して通話相手に関する情報(通話開始・終了日時、電話番号、登録名等の情報)の送信要求が行われる。
ステップS111では、通話相手に関する情報が受信されたか否かが判定される。通話相手に関する情報が受信されていた場合は、次のステップS112へと移行し、通話相手に関する情報が受信されていなかった場合は、当該録音ファイル生成処理を終了する。
ステップS112では、ステップS109で生成された録音ファイルに通話相手に関する情報が付与される。具体的には、ステップS111で受信された通話相手に関する情報が、録音ファイルのタグ情報に記録される。
【0032】
このように、録音ファイルのタグ情報に通話相手に関する情報を記録することにより、録音データを再生せずとも録音ファイルの内容を把握することができる。
【0033】
図3は、本実施形態に係る電話機200内で行われる通話録音処理の一例について示したフローチャートである。
図3に示すように、ステップS201では、着信があるか否かが判定される。着信があった場合は、次のステップS202へと移行し、着信がなかった場合は、当該ステップS201の処理を繰り返す。
ステップS202では、DAP100が接続されているか否かが判定される。DAP100が接続されていた場合は、次のステップS203へと移行し、DAP100が接続されていなかった場合は、当該通話録音処理を終了する。
ステップS203では、DAP100に着信があった旨の信号(着信信号)が送信される。
【0034】
ステップS204では、通話が開始されたか否かが判定される。通話が開始されていた場合は、次のステップS205へと移行し、通話が開始されていなかった場合は、ステップS210へと移行する。
ステップS205では、DAP100に通話を開始した旨の信号(通話開始信号)が送信される。
ステップS206では、通話が終了したか否かが判定される。通話が終了していた場合は、次のステップS207へと移行し、通話が終了していなかった場合は、当該ステップS206の処理を繰り返す。
ステップS207では、DAP100に通話を終了した旨の信号(通話終了信号)が送信される。
【0035】
ステップS208では、DAP100から通話相手に関する情報の送信要求があったか否かが判定される。通話相手に関する情報が要求されていた場合は、次のステップS209へと移行し、通話相手に関する情報が要求されていなかった場合は、当該通話録音処理を終了する。
ステップS209では、DAP100に通話相手に関する情報が送信される。
【0036】
ステップS210では、着信が終了したか否かが判定される。着信が終了していた場合は、次のステップS211へと移行し、着信が終了していなかった場合は、ステップS204へと移行する。
ステップS211では、DAP100に着信を終了した旨の信号(着信終了信号)が送信される。
【0037】
以上、本発明に係る実施形態に基づいて具体的に説明したが、本発明は上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲で変更可能である。
【0038】
例えば、上記実施形態では、生成された録音ファイルに通話相手に関する情報(電話番号等)を付与するようにしているが、ファイル名に特定の文字列(例えば、「電話」、「TEL」等の文字列、日付、登録名等)を付与することで、電話での通話内容が録音されていることを一目で判別できるようにしてもよい。
【0039】
また、生成された録音ファイルのタグ情報のタイトル、アーティスト、アルバム、コメントなどの各エリアに情報をそれぞれ入力するようにしてもよい。例えば、タイトルに電話番号、アーティストに電話、アルバムに日時等を入力する。
【0040】
また、電話での通話内容を録音した場合は、電話の録音データとわかるようにフォルダ(PHONEフォルダ)を作成し、そのフォルダに録音データを振り分けるようにしてもよい。
また、電話機により電話番号をグループ分けして登録できる場合は、グループの名称を電話機より取得し、その名称をフォルダ名として録音データを振り分けるようにしてもよい。すなわち、記憶部5に、電話番号等の通話相手に関する情報に対応付けされたフォルダを構成し、当該フォルダごとに分類して録音ファイルを記憶させるようにしてもよい。そうすることで、ユーザの所望する録音ファイルの検索が容易となる。
以下、図4を用いて、生成された録音ファイルをグループ分けして記憶するためのフォルダ構成の一例について説明する。
【0041】
図4では、音楽ファイルを「MUSIC」フォルダ、会議内容を録音したファイルを「RECORD」フォルダ、電話での通話内容を録音したファイルを「PHONE」フォルダにそれぞれ格納した様子が示されている。
「MUSIC」フォルダ内には、楽曲をアルバム単位で記憶するための「Album」フォルダが作成されており、例えば、「Album001」フォルダには、「musicA01.mp3」ファイル、「musicA02.mp3」ファイル、・・が格納されている。
【0042】
また、「RECORD」フォルダには、例えば、「081215101833.wav」ファイル、「081216101833.wav」ファイル、・・が格納されている。
また、「PHONE」フォルダ内には、通話相手の電話番号をフォルダ名に冠したフォルダ(例えば「080XX33XXXX」フォルダ)や通話相手の名前を冠したフォルダ(例えば「○○さん」フォルダ)、或いは非通知でかかってきた通話データを格納するための「非通知」フォルダが作成されている。通話相手の電話番号をフォルダ名に冠した「080XX33XXXX」フォルダには、例えば、当該通話相手との通話を録音した日時をファイル名とした「081220223033.mp3」ファイル、「081221165114.mp3」ファイル、・・が格納されている。当該通話相手との通話を録音した日時を表すファイル名「081220223033.mp3」は、2008年12月20日22時30分33秒に生成されたファイルであることを示す。また、通話相手の名前を冠したフォルダ「○○さん」フォルダにも同様に、通話を録音した日時をファイル名とした「080526180614.mp3」ファイル、「081105194224.mp3」ファイル、・・が格納されている。また、「非通知」フォルダには、例えば、「081204145503.mp3」フォルダ、・・が格納されている。
【0043】
ここで、フォルダ名に付与される通話相手の電話番号や名前は、DAP側の処理に基づいて、電話機から取得され付与される。通話相手の名前は、電話機における電話帳に登録されている名前を用いるが、DAP側の処理に基づいて、取得した電話番号に名前を対応付けてもよい。
【0044】
また、DAP側で録音したい電話番号を登録できるようにしてもよい。そうすることで、例えば、DAP内に登録されている電話番号のときに録音する、又はDAP内に登録されていない電話番号や非通知、公衆電話等のときに録音する等の条件に基づいて、録音を行うか否か判断させることが可能となる。そうすることで、必要なデータのみを残すことができる。
また、録音後に、電話番号、非通知、公衆電話等の情報を電話機から取得して、ファイル名やタグ情報に記録するようにしてもよい。
【0045】
また、電話機からDAPに電話番号を登録した電話帳を転送し、DAP側で電話帳の登録内容を検索することで、録音を行うか否かを判断させるようにしてもよい。
また、DAPの再生中に電話の録音処理を行った場合、録音終了後、録音前に再生していたコンテンツのつづきを再生するようにしてもよい。
【0046】
その他、DAP100を構成する各装置の細部構成及び細部動作に関しても、本発明の趣旨を逸脱することのない範囲で適宜変更可能である。
【符号の説明】
【0047】
100 DAP
1 表示部
2 操作部
3 アンプ
4 出力部
5 記憶部
6 制御部
61 CPU
62 RAM
63 ROM
64 DSP
7 I/F

【特許請求の範囲】
【請求項1】
電話機を接続可能に構成された音声処理装置において、
前記電話機での通話内容を録音する録音手段と、
前記録音手段により録音された前記通話内容に基づいて録音ファイルを生成するファイル生成手段と、
前記電話機から通話相手に関する情報を取得する情報取得手段と、
前記情報取得手段により取得された前記通話相手に関する情報を前記ファイル生成手段により生成された録音ファイルに付与する情報付与手段と、
を備えることを特徴とする音声処理装置。
【請求項2】
前記通話相手に関する情報は、当該通話相手の電話番号を含むことを特徴とする請求項1に記載の音声処理装置。
【請求項3】
前記通話相手に関する情報は、前記電話機内で前記電話番号に対応付けられた文字列を含むことを特徴とする請求項2に記載の音声処理装置。
【請求項4】
前記情報付与手段により前記通話相手に関する情報を付与された録音ファイルを記憶する記憶手段を更に備え、
前記記憶手段は、前記通話相手に関する情報に対応付けされたフォルダに分類して前記録音ファイルを記憶することを特徴とする請求項1から3のいずれか一項に記載の音声処理装置。
【請求項5】
電話機を接続可能に構成された音声処理装置において、
前記電話機での通話内容を録音する録音ステップと、
録音された前記通話内容に基づいて録音ファイルを生成するファイル生成ステップと、
前記電話機から通話相手に関する情報を取得する情報取得ステップと、
取得された前記通話相手に関する情報を生成された前記録音ファイルに付与する情報付与ステップと、
を含む音声処理方法。
【請求項6】
電話機を接続可能に構成された音声処理装置において、
コンピュータに、
前記電話機での通話内容を録音する録音機能と、
録音された前記通話内容に基づいて録音ファイルを生成するファイル生成機能と、
前記電話機から通話相手に関する情報を取得する情報取得機能と、
取得された前記通話相手に関する情報を生成された前記録音ファイルに付与する情報付与機能と、
を実現させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−171762(P2010−171762A)
【公開日】平成22年8月5日(2010.8.5)
【国際特許分類】
【出願番号】特願2009−12692(P2009−12692)
【出願日】平成21年1月23日(2009.1.23)
【出願人】(000003595)株式会社ケンウッド (1,981)
【Fターム(参考)】