説明

音声記録装置及び通信端末

【課題】記録する音声の言語の種別に適切な標本化周波数を装置での情報の表示に使用する言語に応じて決定する。
【解決手段】マイクから出力されるアナログ音声信号をディジタル音声信号に変換して記録する音声記録装置であって、自装置を操作するための操作手段、情報を表示するための表示手段、言語の種別とその言語の種別に対応する標本化周波数を記憶する第1記録手段、操作手段の操作に応じて決定された、表示手段による情報の表示に使用する言語の種別を特定する言語特定手段、言語特定手段が特定した言語の種別に対応する第1記録手段に記録された標本化周波数を決定する周波数決定手段、マイクが出力するアナログ音声信号を周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換する変換手段、変換手段が変換したディジタル音声信号を記録する第2記録手段を備える。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声記録装置及び通信端末に関し、特に例えば、アナログ音声信号をディジタル音声信号に変換して記録する音声記録装置及び通信端末に関する。
【背景技術】
【0002】
この種の音声記録装置の例が、特許文献1(発明が解決しようとする課題)に記載されている。この音声記録装置では、アナログ音声信号をディジタル音声信号に変換する際の標本化の周波数を複数の中から選択可能とし、ディジタル音声信号を記録する記録媒体の記憶容量の残りの程度や、ディジタル音声信号に必要な音質に応じて標本化周波数を使い分けている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平06−124100号公報[G10L 9/18,G11C 27/00]
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、従来の技術では、音声記録装置の利用者が音声の言語を記録するために必要な音質とその音質を得るための標本化周波数を自身で判断しなければならなかったため、利用者の利便性に問題があった。
【0005】
つまり、録音する音声の言語としては、日本語、英語、ドイツ語など、利用者に応じて様々な言語が考えられる。そして、それぞれの言語には発音方法などの特徴があり、録音する場合、各言語を同じ標本化周波数で録音すると、その再生音が言語によっては明瞭でない場合も発生する。
【0006】
例えば、記録する音声の言語の発音に破裂音が含まれている場合には、破裂音が含まれていない言語に比べて高い標本化周波数にしなければ破裂音が明瞭に聞こえない。また、破裂音が含まれていない言語を、破裂音が含まれている言語と同じ高い標本化周波数とすると、ディジタル音声信号を記録する記録媒体の記憶容量を無駄に消費することになり無駄な電力を消費することにもなる。
【0007】
なお、「破裂音」とは、「発音器官で閉鎖を作り、息がそれを破る際に発せられる子音」(広辞苑第六版)である。
【0008】
ここで、高い標本化周波数を必要とする音として、上記の破裂音の他、「口腔内の発音器官が狭めを作り、息がそこを通過する際に発せられる子音」(広辞苑第六版)である摩擦音や、「破裂音の直後に摩擦音がつづき全体で一つの単音とみなされる音」(広辞苑第六版)である破擦音、なども挙げることができる。なお、上記破裂音、摩擦音および破擦音を総称して阻害音ともいう。
【0009】
それゆえに、この発明の主たる目的は、新規な音声記録装置を提供することである。
【0010】
また、この発明の他の目的は、上記の課題を解決するために、標本化周波数を音声記録装置で使用する言語の設定に応じて切り替えることができる音声記録装置を提供することである。
【課題を解決するための手段】
【0011】
本発明は、上記の課題を解決するために、以下の構成を採用した。なお、括弧内の参照符号および補足説明等は、本発明の理解を助けるために後述する実施の形態との対応関係を示したものであって、本発明を何ら限定するものではない。
【0012】
第1の発明は、マイクから出力されるアナログ音声信号をディジタル音声信号に変換して記録する音声記録装置であって、操作手段、情報を表示するための表示手段、言語の種別とその言語の種別に対応する標本化周波数を記録する第1記録手段、操作手段の操作に応じて決定された、表示手段による情報の表示に使用する言語の種別を特定する言語特定手段、言語特定手段が特定した言語の種別に対応する前記第1記録手段に記録された標本化周波数を決定する周波数決定手段、マイクが出力するアナログ音声信号を周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換する変換手段、および変換手段が変換したディジタル音声信号を記録する記録手段を備える、音声記録装置である。
【0013】
第1の発明では、音声記録装置(10)はマイク(32)から出力されるアナログ音声信号をディジタル音声信号に変換して記録するものであり、操作手段(20)を備え、表示手段(22、30)によって情報が表示される。また、第1記録手段(16)は言語の種別とその言語の種別に対応する標本化周波数を記録し、言語特定手段(12、S1)は操作手段の操作に応じて決定された、表示手段による情報の表示に使用する言語の種別を特定し、周波数決定手段(12、S3)は言語特定手段が特定した言語の種別に対応した第1記録手段に記録された標本化周波数を決定する。そして、変換手段(24)はマイクが出力するアナログ音声信号を周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換し、第2記録手段(18)は変換手段が変換したディジタル音声信号を記録する。つまり、言語の種別に応じた最適な標本化周波数を予め記憶しておき、音声記録装置で使用する言語の種別が切り替えられたとき、その切り替えられた言語の種別に応じた最適な標本化周波数を用いて標本化を行う。
【0014】
第1の発明によれば、音声記録装置で情報を表示するために使用する言語の種別に応じて標本化周波数を決定することができる。したがって、音声の言語の種別に最適な標本化周波数を決定することによって、高い標本化周波数が必要な言語の種別については高い標本化周波数で標本化して破裂音などを含む阻害音などの高周波成分を含む微妙な音声を記録できるとともに、高い標本化周波数が必要でない言語の種別については低い標本化周波数で標本化して、録音された音声が再生された場合、その再生音を明瞭にすることが可能になるとともに、音声データの記録に費やす記録媒体の記憶容量を小さくしたり、消費電力を少なくしたりすることができる。
【0015】
第2の発明は、マイクが出力するアナログ音声信号をディジタル音声信号に変換して記録する音声記録装置であって、操作手段、言語の種別とその言語の種別に対応する標本化周波数を記録する第1記録手段、操作手段の操作に応じて言語の種別を決定する言語決定手段、言語決定手段が決定した言語の種別に対応する第1記録手段に記録された標本化周波数を決定する周波数決定手段、マイクが出力するアナログ音声信号を周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換する変換手段、および変換手段が変換したディジタル音声信号を記録する記録手段を備える、音声記録装置である。
【0016】
第2の発明では、音声記録装置(1000)はマイク(1032)が出力するアナログ音声信号をディジタル音声信号に変換して記録するものであり、操作手段(1020)を備える。また、第1記録手段(1016)は言語の種別とその言語の種別に対応する標本化周波数を記録し、言語決定手段(1012、S11)は操作手段の操作に応じて言語の種別を決定し、周波数決定手段(1012、S13)は言語決定手段が決定した言語の種別に対応する第1記録手段に記録された標本化周波数を決定する。そして、変換手段(1024)はマイクが出力するアナログ音声信号を前記周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換し、第2記録手段(1018)は音声変換手段が変換したディジタル音声信号を記録する。つまり、言語の種別に応じた最適な標本化周波数を予め算出して記憶しておき、記録する音声の言語の種別が切り替えられたとき、その切り替えられた言語の種別に応じた最適な標本化周波数を用いて標本化を行う。
【0017】
第2の発明によれば、利用者が操作して決定した言語の種別に応じて、その言語の音声を記録するために適切な標本化周波数を決定することができる。したがって、音声の言語の種別に最適な標本化周波数を決定することによって、高い標本化周波数が必要な言語の種別については高い標本化周波数で標本化して破裂音などを含む阻害音などの高周波成分を含む微妙な音声を記録できるとともに、高い標本化周波数が必要でない言語の種別については低い標本化周波数で標本化して、録音された音声が再生された場合、その再生音を明瞭にすることが可能になるとともに、音声データの記録に費やす記録媒体の記憶容量を小さくしたり、消費電力を少なくしたりすることができる。
【0018】
第3の発明は、第1の発明または第2の発明の音声記録装置と、他の装置と音声で通信を行う音声通信手段とを備える、通信端末である。
【0019】
第3の発明では、音声記録装置と、他の装置と音声で通信を行う音声通信手段(12、28、36)とを備える。
【0020】
第3の発明によれば、音声で通信を行う通信端末において、言語の種別に応じてその言語の音声を記録するために適切な標本化周波数を決定することができる。
【0021】
第4の発明は、第3の発明に従属する発明であって、マイクが出力するアナログ音声信号は変換手段によってディジタル音声信号に変換されて第2記録手段に記録されるとともに、音声通話手段によって他の装置に送信される、通信端末である。
【0022】
第4の発明では、マイクが出力するアナログ音声信号は変換手段によってディジタル音声信号に変換されて第2記録手段に記録されるとともに、音声通話手段によって他の装置に送信される。
【0023】
第4の発明によれば、音声通話時の音声を記録する場合にも、音声の言語の種別に適切な標本化周波数を言語の種別に応じて決定することができる。
【発明の効果】
【0024】
この発明によれば、音声を記録する利用者が話す言語の種別に適切な標本化周波数を音声記録装置で使用する言語の種別に応じて決定することができる。
【0025】
この発明の上述の目的、その他の目的、特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
【図面の簡単な説明】
【0026】
【図1】この発明の一実施例を示す音声記録装置としての携帯電話機の構成例を示すブロック図である。
【図2】図1の携帯電話機の外観の一例を示す正面図である。
【図3】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図4】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図5】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図6】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図7】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図8】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図9】図1の携帯電話機のLCDモニタの表示の一例を示す図解図である。
【図10】図1の携帯電話機のプロセッサが実行する処理の一例を示すフロー図である。
【図11】この発明の一実施例を示す音声記録装置としてのボイスレコーダの構成例を示すブロック図である。
【図12】図11のボイスレコーダの外観の一例を示す正面図である。
【図13】図11のボイスレコーダのLCDモニタの表示の一例を示す図解図である。
【図14】図11のボイスレコーダのプロセッサが実行する処理の一例を示すフロー図である。
【発明を実施するための形態】
【0027】
<第1実施形態>
図1を参照して、本発明の音声記録装置および通信端末としての携帯電話機10は、プロセッサ12を含む。図1からわかるように、プロセッサ12には、RAM14、ROM16、フラッシュメモリ18、キー入力装置20、LCDドライバ22、AD変換器24、DA変換器26、および無線通信回路28がそれぞれ接続されている。
【0028】
RAM14は、プロセッサ12から直接的にアクセスが可能な記憶装置であり、プロセッサ12の情報演算処理の際の一時記憶に利用される。
【0029】
ROM16は、たとえば、電気的に書き換えが可能なEEPROMであり、プロセッサ12によって実行される各種のプログラムやこれらのプログラムで利用される種々のデータを記憶する。なお、ROM16に記憶されたデータには、携帯電話機10において後述するLCDモニタ30に情報を表示するために使用する言語の種別と、その種別の言語の音声を記録する際のアナログ音声信号からディジタル音声信号に変換するための標本化(サンプリング)の標本化周波数とが対応つけられた周波数テーブル16aが含まれる。
【0030】
フラッシュメモリ18は、フラッシュROMとも呼ばれ、データの読み書きが自由で不揮発性を備えた記憶装置である。このフラッシュメモリ18には、当該携帯電話機10の所有者のプロフィールやアドレス帳などの他に、後述する言語識別情報18aやディジタル音声ファイル18bが記録される。
【0031】
キー入力装置20は、テンキー群20T(図2参照)をはじめとする複数のキーを備えており、利用者がそれぞれのキーを操作することによってプロセッサ12に対して指示を与えることができる。
【0032】
LCDドライバ22は、当該LCDドライバ22に接続されたLCDモニタ30を制御してプロセッサ12からの指示に応じた文字や画像などをLCDモニタ30に表示させる。
【0033】
AD変換器24は、当該AD変換器24に接続された、利用者の発する音声を拾うマイク32から入力されるアナログ音声信号を、ROM16に記録された周波数テーブル16aに基づいて決定した標本化周波数で標本化してディジタル音声信号に変換するためのものである。
【0034】
DA変換器26は、フラッシュメモリ18から読み出された標本化されたディジタル音声信号をアナログ音声信号に変換(復元)してスピーカ34に出力するためのものである。
【0035】
無線通信回路28は、たとえば、CDMA(Code Division Multiple Access:符号分割多重接続)方式での無線通信を実現するための回路である。キー入力装置20に対して発呼操作が行われると、プロセッサ12は、無線通信回路28を制御して発呼信号を出力する。無線通信回路28から出力された発呼信号は、アンテナ36から出力され、基地局を含む移動通信網を経て相手の電話機に送信される。通信相手の電話機で着呼操作が行われると、通信可能状態が確立される。
【0036】
通信可能状態に移行した後にキー入力装置20に対して通話終了操作が行われると、プロセッサ12は、無線通信回路28を制御して、通信相手の電話機に通話終了信号を送信する。通話終了信号の送信後、プロセッサ12は、通話処理を終了する。先に通信相手から通話終了信号を受信した場合も、プロセッサ12は、通話処理を終了する。また、通信相手によらず、移動通信網から通話終了信号を受信した場合も、プロセッサ12は通話処理を終了する。
【0037】
通信相手の電話機からの発呼信号がアンテナ36によって捉えられると、無線通信回路28は、着信をプロセッサ12に通知する。プロセッサ12は、着信通知に記述された発信元情報をLCDモニタ30に出力し、図示しない着信通知用のスピーカから着信音を出力する。キー入力装置20に対して着呼操作が行われると、通信可能状態が確立される。
【0038】
通信可能状態では、次のような処理が実行される。通信相手の電話機から送られてきた変調音声信号(高周波信号)が、アンテナ36によって受信される。受信された変調音声信号は、無線通信回路28によって復調処理および復号処理が施される。これらの処理によって得られた受話音声信号は、スピーカ34から出力される。マイク32によって取り込まれた送話音声信号は、無線通信回路28によって符号化処理および変調処理が施される。これらの処理によって得られた変調音声信号は、上述と同様に、アンテナ36を介して通信相手の電話機に送信される。
【0039】
図2は、携帯電話機10の外観図である。図2を参照して、携帯電話機10は、板状に形成されたケースC1を有する。ケースC1の長さ方向の一端の側面には、無線通信用のアンテナ36が配置されている。ケースC1の表面の下部には、キー入力装置20が配置されている。キー入力装置20は、テンキー群20T、上方向キー20a、下方向キー20b、左方向キー20c、右方向キー20d、センターキー20e、電源/終話キー20f、発信キー20g、クリア/メモキー20hなどを含んでおり、各キーはプッシュスイッチである。また、ケースC1の表面の上部には、LCDモニタ30が配置されている。
【0040】
さらに、ケースC1の表面の上端付近には、図2では図示しないスピーカ34に通じる開口OP1が設けられ、ケースC1の表面の下端付近には、同じく図2では図示しないマイク32に通じる開口OP2が設けられている。したがって、利用者は、開口OP1を通じてスピーカ34から出力される音声を聞き、開口OP2を通じてマイク32に自身の声を入力する。
【0041】
このような携帯電話機10では、LCDモニタ30に各種の情報を表示するために使用する言語の種別を選択することができる。言語の種別を選択する場合には、まず、LCDモニタ30に表示された図示しないメインメニュー画面においてキー入力装置20に対する操作を行って、携帯電話機10についての種々の設定を行うための“設定”の項目名(メニューの項目名)を選択する。
【0042】
“設定”の項目名を選択すると、LCDモニタ30には、図3に示すような、設定メニュー選択画面100が表示される。図示するように、設定メニュー選択画面100には、設定することができる項目の項目名と項目番号の一覧が表示される。設定を行う項目を選択する際には、キー入力装置20の上方向キー20aおよび下方向キー20bを操作してカーソル(図3において網掛けで表示)を移動させて項目名に合わせ、センターキー20eを操作する。また、各項目名に対応する項目番号の数字のキーをテンキー群20Tから選んで操作することによっても設定を行う項目を選択することができる。以下において、各メニューの項目名を選択する際には同様の操作を行う。
【0043】
図3に示すように、設定メニュー選択画面100には、通話時間や料金を確認するための“時間/料金”の項目名、着信などを報知するための音の出力やバイブの駆動について設定するための“音/バイブ”の項目名、LCDモニタ30の画面表示についての設定を行うための“画面表示”の項目名、携帯電話機10のセキュリティーについての設定を行うための“プライバシー”の項目名、ユーザによる携帯電話機10の利用の補助のための設定を行う“ユーザ補助”の項目名、および携帯電話機10の所有者の情報を設定(登録・編集)するための“プロフィール”の項目名が表示される。
【0044】
この設定メニュー選択画面100では、キー入力装置20を操作して3番目の“画面表示”の項目名を選択する。“画面表示”の項目名を選択すると、LCD30には、図4に示すような画面表示メニュー選択画面101が表示される。図4に示すように、画面表示メニュー選択画面101には、LCDモニタ30に表示する待ち受け画面などの設定を行うための“ディスプレイ”の項目名、LCDモニタ30の照明について設定するための“照明”の項目名、LCDモニタ30に情報を表示する文字のサイズを設定するための“文字サイズ”の項目名、およびLCDモニタ30に情報を表示する際に使用する言語の種別を設定するための“言語”の項目名が表示される。
【0045】
したがって、キー入力装置20を操作して、4番目の“言語”の項目名を選択することによって、携帯電話機10で情報をLCDモニタ30に表示するために使用する言語の種別を設定することができる。
【0046】
“言語”の項目名を選択すると、LCDモニタ30には、図5に示すような言語選択画面102aが表示される。なお、図5の言語選択画面102aがLCDモニタ30に表示された時点では、言語の種別として日本語が選択されて携帯電話機10に設定されているものとする。
【0047】
図5に示すように、言語選択画面102aには、言語の種別を選択するメニューとして、“日本語”の項目名、“英語”の項目名、“フランス語”の項目名、“ドイツ語”の項目名、および“中国語”の項目名が表示される。ただし、図5の言語選択画面102aはあくまで選択できる言語の種別の一例を示したものであり、本発明で使用できる言語は図5にあげた言語の種別に限定されるわけではない。
【0048】
LCDモニタ30に表示された図5の言語選択画面102aにおいて、キー入力装置20を操作して、例えば2番目の“英語”の項目名を選択すると、LCDモニタ30の表示は、図6に示す言語選択画面102bのように、英語による表示に切り替わる。
【0049】
この言語選択画面102a、102bにおいてキー入力装置20の操作で言語の種別が選択されると、その選択された言語の種別を識別する言語識別情報18aが、フラッシュメモリ18に記録される。
【0050】
このような携帯電話機10は、利用者の発する音声を記録するボイスレコード機能を備えている。そして、このボイスレコード機能を利用して音声を記録する際には、利用者の発する音声の言語の種別に適切な標本化周波数で標本化してアナログ音声信号をディジタル音声信号に変換する。なお、利用者が携帯電話機10を利用する際にLCDモニタ30に情報を表示する言語として選択している言語の種別を、利用者の発する音声の言語の種別とみなす。つまり、図5に示した言語選択画面102aで選択した言語の種別が、利用者の発する音声の言語とみなされる。したがって、フラッシュメモリ18に記録されている言語識別情報18aによって特定される言語の種別が利用者の発する音声の言語の種別となる。
【0051】
ボイスレコード機能を利用する際には、LCDモニタ30に表示された図示しないメインメニュー画面においてキー入力装置20に対する操作を行って携帯電話機10が備えている種々の機能を利用するための“機能”の項目名を選択する。
【0052】
“機能”の項目名を選択すると、LCDモニタ30には、図7に示すような、機能メニュー選択画面103が表示される。図示するように、機能メニュー選択画面103には、利用することができる機能の項目の項目名と項目番号の一覧が表示される。
【0053】
図7に示すように、機能メニュー選択画面103には、辞書機能を利用するための“辞書”の項目名、時計機能およびカレンダー機能を利用するための“時計/カレンダー”の項目名、電卓機能を利用するための“電卓”の項目名、およびテキストによるメモを記録したり音声によるメモなどを記録したりする機能を利用するための“ボイス/メモ”の項目名が表示される。
【0054】
ボイスレコード機能を利用するためには、キー入力装置20を操作して4番目の項目である“ボイス/メモ”の項目名を選択する。“ボイス/メモ”の項目名を選択すると、LCDモニタ30には、図8に示すような、ボイス/メモメニュー選択画面104が表示される。図示するように、このボイス/メモメニュー選択画面104には、テキストによるメモを記録するための“メモ帳”の項目名、利用者がマイク32に入力した音声を記録するための“ボイスレコード”の項目名、および携帯電話機10によって音声通話をしている際に、利用者がマイク32に入力した音声と、無線通信回路28からプロセッサ12に入力される通話相手の音声とを記録したディジタル音声ファイルを再生するための“通話音声メモ”の項目名が項目番号とともに表示される。
【0055】
このようなボイス/メモメニュー選択画面104において、キー入力装置20を操作して、2番目の“ボイスレコード”の項目名を選択すると、LCDモニタ30には、図9に示すような、記録/再生選択画面105が表示される。図示するように、記録/再生選択画面105には、音声を記録するための“記録”の項目名と記録した音声(ディジタル音声ファイル)を再生するための“再生”の項目名とが項目番号とともに表示される。
【0056】
そして、この記録/再生メニュー選択画面105において1番目の“記録”の項目名を選択することによって、ボイスレコード機能を利用して利用者の音声を記録することができる。
【0057】
“記録”の項目名が選択されてボイスレコード機能の記録機能が起動されると、携帯電話機10のプロセッサ12は、音声の記録の開始前に、図10のフロー図に示すような処理を実行する。
【0058】
まず、プロセッサ12は、ステップS1で、フラッシュメモリ18に記録されている言語識別情報18aを参照して携帯電話機10のLCDモニタ30に情報を表示するために使用する言語の種別を特定する。次に、プロセッサ12は、ステップS3で、ROM16に記録されている周波数テーブル16aを参照し、ステップS1において特定した言語の種別に適切なAD変換器24の標本化周波数を決定する。
【0059】
ここで、周波数テーブル16aは、言語の種別毎に、その言語で発話される音声を記録するために適切な標本化周波数を記録したものである。具体的には、周波数テーブル16aには、各言語の種別を識別する言語識別情報18aに標本化周波数が対応つけて記録されている。
【0060】
言語識別情報18aに対応つけられている標本化周波数は、言語識別情報18aが示す言語の種別に最適な標本化周波数となっている。この最適な標本化周波数は、例えば、標本化周波数が高いほど、破裂音、摩擦音、破擦音などの微妙な音を記録できる傾向があるという標本化の特性などに基づいて決定してもよい。例えば、日本語<英語<フランス語・ドイツ語・中国語の順に標本化周波数の値が高くなる。
【0061】
こうして周波数テーブル16aを参照することによって標本化周波数を決定すると、次にプロセッサ12はステップS5で、決定した標本化周波数をAD変換器24に設定する。
【0062】
AD変換器24は、マイク32から入力されるアナログ音声信号を設定された標本化周波数で標本化してディジタル音声信号に変換し、プロセッサ12に出力する。
【0063】
プロセッサ12は、AD変換器24から出力されたディジタル音声信号から、例えばACC(Advanced Audio Coding)形式のディジタル音声ファイル18bを形成し、このACC形式のディジタル音声ファイル18b(以下、“ACCファイル18b”とも記載する)をフラッシュメモリ18に記録する。なお、AD変換器24でアナログ音声信号からディジタル音声信号に変換するための標本化の標本化周波数は、ACCファイルのヘッダに記録される。
【0064】
このようにしてフラッシュメモリ18に記録された通話音声メモ機能で記録したACCファイル18bは、先に示した図9の記録/再生メニュー選択画面105で、2番目の“再生”の項目名をキー入力装置20を操作して選択してLCDモニタ30にACCファイル18bの一覧を表示し、その一覧から目的のファイルを選択することによって再生することができる。
【0065】
フラッシュメモリ18に記録されたACCファイル18bを再生する場合には、プロセッサ12によって、フラッシュメモリ18に記録されたACC形式の音声ファイルのヘッダから標本化周波数が読み出され、読み出された標本化周波数がDA変換器26に設定される。
【0066】
プロセッサ12は、フラッシュメモリ18から読み出したACC形式のディジタル音声ファイルからディジタル音声信号を取得し、これをDA変換器26に与える。そして、DA変換器26は、与えられたディジタル音声信号を設定された標本化周波数に基づいてアナログ音声信号に変換する。変換されたアナログ音声信号は、スピーカ34に与えられ、スピーカ34から音声が出力される。
【0067】
このようにして、携帯電話機10によれば、利用者が発話する音声を言語の種別に適した標本化周波数で標本化して記録することができる。
【0068】
つまり、携帯電話機10や後述のボイスレコーダ1000などの機器では、コスト・消費電力を抑える必要があるため、音声を標本化する標本化周波数を最適な値に設定する必要がある。ここでいう最適な標本化周波数とは、同一の条件で標本化した音声を再生した場合に最も明瞭に聞こえる標本化周波数のうち最も値の低い周波数である。
【0069】
この値、つまり標本化周波数は言語により異なる。一般的に破裂音や摩擦音や破擦音などの阻害音などが多く含まれている言語は、破裂音や摩擦音や破擦音などの阻害音などが多く含まれていない言語に対して標本化周波数を高くしなければ、明瞭に聞こえないことが知られている。
【0070】
そのため、言語に応じて明瞭に聞こえる最適な標本化周波数を予め算出し、記憶しておく。そして、携帯電話機10で情報の表示に使用する言語の種別の設定が切り替えられたときは、記憶した標本化周波数のうちその言語の種別に最も適切な標本化周波数を用いる。
【0071】
また、この携帯電話機10では、他の電話機とで通話中の会話の音声も記録することができる。この機能のことを“通話音声メモ機能”と呼ぶ。携帯電話機10を利用して会話をしている最中に、例えば、キー入力装置20のクリア/メモキー20hを操作することにより、会話の音声を記録することができる。
【0072】
通話音声メモ機能で会話を記録する場合、携帯電話機10の利用者がマイク32に入力する音声は、上述のボイスレコード機能における利用者の音声の記録と同様に、フラッシュメモリ18に記録されている言語識別情報18aによって特定される言語の種別に適切な標本化周波数でAD変換器24によって標本化されてディジタル音声信号に変換される。
【0073】
一方、アンテナ36を介して無線通信回路28で受信されてプロセッサ12に入力される通話相手のディジタル音声信号は、その標本化周波数が、マイク32から入力されるアナログ音声信号(携帯電話機10の利用者の音声の信号)をAD変換器24でディジタル音声信号に変換する際の標本化周波数と同じになるように周波数を上げたり(アップサンプリング)下げたり(ダウンサンプリング)して周波数変換される。なお、通話相手のディジタル音声信号の周波数変換をする際には、無線通信のために施されている暗号化を解除して復号化が行われる。
【0074】
そして、周波数変換された通話相手のディジタル音声信号と、携帯電話機10の利用者のディジタル音声信号(マイク32に入力されてAD変換器24で変換されたディジタル音声信号)とが、プロセッサ12によって混合され、混合されたディジタル音声信号がさらにACC形式のファイル(ACCファイル18b)に形成されてフラッシュメモリ18に記録される。
【0075】
このようにしてフラッシュメモリ18に記録された通話音声メモ機能で記録したACCファイル18bは、先に示した図8のボイス/メモメニュー選択画面104で、3番目の“通話音声メモ”の項目名をキー入力装置20を操作して選択してLCDモニタ30にACCファイル18bの一覧を表示し、その一覧から目的のファイルを選択することによって再生することができる。
【0076】
なお、上述の実施形態では、携帯電話機10は、ボイスレコード機能と通話音声メモ機能との両方を備える構成としたが、これに限らず、携帯電話機10は、ボイスレコード機能と通話音声メモ機能とのいずれか一方の機能を備える構成であってもよい。
【0077】
また、上述の実施形態における通話音声メモ機能では、通話相手の電話機から送られてくるディジタル音声信号をディジタル音声信号のまま周波数変換し、これを携帯電話機10の利用者のディジタル音声信号と混合する構成とした。しかし、これに替えて、通話相手の電話機から送られてくるディジタル音声信号を一旦アナログ音声信号に変換し、これを携帯電話機10の利用者の音声のアナログ音声信号と混合し、この混合されたアナログ音声信号をディジタル音声信号に変換するようにしてもよい。
【0078】
さらに、フラッシュメモリ18に記録するディジタル音声信号のファイル形式をACC形式としたが、ファイル形式はこれに限らず、例えば、3GPP(Third Generation Partnership Project)形式などであってもよい。
【0079】
また、上述の実施形態においては、言語の種別に適切な標本化周波数の具体的な数値を示さなかったが、標本化周波数は、例えば、日本語(8KHz)、英語(9KHz)、フランス語・ドイツ語・中国語(10KHz)とすることができる。
<第2実施形態>
図11を参照して、本発明の音声記録装置としてのボイスレコーダ1000は、プロセッサ1012を含む。図11からわかるように、プロセッサ1012には、RAM1014、ROM1016、フラッシュメモリ1018、キー入力装置1020、LCDドライバ1022、AD変換器1024、およびDA変換器1026がそれぞれ接続されている。
【0080】
RAM1014は、プロセッサ1012から直接的にアクセスが可能な記憶装置であり、プロセッサ1012の情報演算処理の際の一時記憶に利用される。
【0081】
ROM1016は、たとえば、電気的に書き換えが可能なEEPROMであり、プロセッサ1012によって実行されるプログラムやこのプログラムで利用される種々のデータを記憶する。なお、ROM1016に記憶されたデータには、ボイスレコーダ1000において記録する音声の言語の種別と、その種別の言語の音声を記録する際にアナログ音声信号からディジタル音声信号に変換するための標本化の適切な標本化周波数とが対応つけられた周波数テーブル1016aが含まれる。
【0082】
フラッシュメモリ1018は、フラッシュROMとも呼ばれ、データの読み書きが自由で不揮発性を備えた記憶装置である。このフラッシュメモリ1018には、後述する言語識別情報1018aやディジタル音声ファイル1018bが記録される。
【0083】
キー入力装置1020は、電源キー1020a、カーソルキー1020b、決定キー1020c、録音開始/停止キー1020d、音量調節キー1020eなどを備えており、利用者がそれぞれのキーを操作することによってプロセッサ1012に対して指示を与えることができる。
【0084】
LCDドライバ1022は、当該LCDドライバ1022に接続されたLCDモニタ1030を制御してプロセッサ1012からの指示に応じた文字や画像などをLCDモニタ1030に表示させる。
【0085】
AD変換器1024は、当該AD変換器1024に接続された、利用者の発する音声を拾うマイク1032から入力されるアナログ音声信号を、ROM1016に記録された周波数テーブル1016aに基づいて決定した標本化周波数で標本化してディジタル音声信号に変換するためのものである。
【0086】
DA変換器1026は、フラッシュメモリ1018から読み出された標本化されたディジタル音声信号をアナログ音声信号に変換(復元)してスピーカ1034に出力するためのものである。
【0087】
図12は、ボイスレコーダ1000の外観図である。図12を参照して、ボイスレコーダ1000は、ケースC2を有する。ケースC2の表面には、キー入力装置1020が配置されている。キー入力装置1020は上述したように、ケースC2の右側面の上部に位置する電源キー1020a、ケースC2の正面の中央部に位置するカーソルキー1020b、カーソルキー1020bの中心部分に位置する決定キー1020c、ケースC2の右側面の中央部に位置する録音開始/停止キー1020d、ケースC2の右側面の録音開始/停止キー1020dの下方に位置する音量調節キー1020eから構成される。
【0088】
ケースC2の表面の上部には、LCDモニタ1030が配置されている。また、ケースC2の上端付近には、図12では図示しないマイク1032に通じる開口OP3が設けられ、ケースC2の正面の下部には、同じく図12では図示しないスピーカ1034に通じる複数の開口OP4が設けられている。したがって、利用者は、開口OP3を通じてマイク1032に自身などの音声を入力し、開口OP4を通じてスピーカ1034から出力される音声を聞く。
【0089】
このようなボイスレコーダ1000によれば、記録する音声の言語の種別に適切な標本化周波数でアナログ音声信号を標本化してディジタル音声信号に変換することができる。
【0090】
ボイスレコーダ1000で音声を記録する場合には、利用者は、ボイスレコーダ1000の録音開始/停止キー1020dを操作する。この操作が行われると、音声の記録のための処理が開始され、ボイスレコーダ1000のプロセッサ1012は、音声の記録の開始前に、後に説明する図14のフロー図に示すような処理を実行する。
【0091】
録音開始/停止キー1020dが操作されると、LCDモニタ1030には、図13に示すような、言語選択画面200が表示される。この画面は、利用者がこれから記録する音声の言語の種別をボイスレコーダ1000に設定するための画面である。図示するように、言語選択画面200には、選択できる言語の種別の項目名として、“日本語”の項目名、“英語”の項目名、“フランス語”の項目名、“ドイツ語”の項目名、および“中国語”の項目名が表示される。ただし、図13の言語選択画面200はあくまで選択できる言語の種別の一例を示したものであり、本発明で使用できる言語は図13にあげた言語に限定されるわけではない。
【0092】
利用者は、カーソルキー1020bを操作して上方向および下方向を入力してカーソル(図13において網掛けで表示)を言語の種別の項目名に合わせて決定キー1020cを操作する。
【0093】
この操作により、ボイスレコーダ1000のプロセッサ1012は、図14のステップS11で言語の種別を決定する。このとき、決定された言語の種別に応じてその言語の種別を識別するための言語識別情報1018aがフラッシュメモリ1018に記録される。
【0094】
次に、プロセッサ1012は、ステップS13で、ROM1016に記録されている周波数テーブル1016aを参照し、ステップS11において決定した言語の種別に適切なAD変換器1024の標本化周波数を決定する。
【0095】
ここで、周波数テーブル1016aは、言語の種別毎に、その言語で発話される音声を記録するために適切な標本化周波数を記録したものである。具体的には、周波数テーブル1016aには、各言語の種別を識別する言語識別情報1018aに標本化周波数が対応つけて記録されている。
【0096】
言語識別情報1018aに対応つけられている標本化周波数は、言語識別情報1018aが示す言語の種別に最適な標本化周波数となっている。この最適な標本化周波数は、例えば、標本化周波数が高いほど、破裂音、摩擦音、破擦音などの微妙な音を記録できる傾向があるという標本化の特性などに基づいて決定してもよい。例えば、日本語<英語<フランス語・ドイツ語・中国語の順に標本化周波数の値が高くなる。
【0097】
こうして周波数テーブル1016aを参照することによって標本化周波数を決定すると、次にプロセッサ1012は、ステップS15で、決定した標本化周波数をAD変換器1024に設定する。
【0098】
AD変換器1024は、マイク1032から入力されるアナログ音声信号を設定された標本化周波数で標本化してディジタル音声信号に変換し、プロセッサ1012に出力する。
【0099】
プロセッサ1012は、AD変換器1024から出力されたディジタル音声信号から、例えばMP3(MPEG Audio Layer-3)形式のディジタル音声ファイル1018bを形成し、このMP3形式のファイルをフラッシュメモリ1018に記録する。なお、AD変換器1024でアナログ音声信号からディジタル音声信号に変換するための標本化の標本化周波数は、MP3ファイルのヘッダに記録されている。
【0100】
したがって、フラッシュメモリ1018に記録されたMP3形式のディジタル音声ファイル1018b(以下“MP3ファイル1018b”とも記載する)を再生する場合には、プロセッサ1012によって、フラッシュメモリ1018に記録されたMP3ファイル1018bのヘッダから標本化周波数が読み出され、読み出された標本化周波数がDA変換器1026に設定される。
【0101】
プロセッサ1012は、フラッシュメモリ1018から読み出したMP3ファイル1018bからディジタル音声信号を取得し、これをDA変換器1026に与える。そして、DA変換器1026は、与えられたディジタル音声信号を設定された標本化周波数でアナログ音声信号に変換する。変換されたアナログ音声信号は、スピーカ1034に与えられ、スピーカ1034から音声が出力される。
【0102】
このようにして、ボイスレコーダ1000によれば、利用者が発話する音声を言語の種別に適した標本化周波数で標本化して記録することができる。
【0103】
なお、上述の実施形態においては、言語の種別に適切な標本化周波数の具体的な数値を示さなかったが、標本化周波数は、例えば、日本語(8KHz)、英語(9KHz)、フランス語・ドイツ語・中国語(10KHz)とすることができる。
【産業上の利用可能性】
【0104】
この発明は、例えば、アナログ音声信号をディジタル音声信号に変換して記録する音声記録装置及び通信端末に利用できる。
【符号の説明】
【0105】
10 …携帯電話機(音声記録装置および通信端末)
12 …プロセッサ
20 …キー入力装置
24 …AD変換器
28 …無線通信回路
36 …アンテナ
1000 …ボイスレコーダ(音声記録装置)
1012 …プロセッサ
1020 …キー入力装置
1024 …AD変換器

【特許請求の範囲】
【請求項1】
マイクから出力されるアナログ音声信号をディジタル音声信号に変換して記録する音声記録装置であって、
操作手段、
情報を表示するための表示手段、
言語の種別とその言語の種別に対応する標本化周波数を記録する第1記録手段、
前記操作手段の操作に応じて決定された、前記表示手段による情報の表示に使用する言語の種別を特定する言語特定手段、
前記言語特定手段が特定した言語の種別に対応する前記第1記録手段に記録された標本化周波数を決定する周波数決定手段、
前記マイクが出力するアナログ音声信号を前記周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換する変換手段、および
前記変換手段が変換したディジタル音声信号を記録する第2記録手段を備える、音声記録装置。
【請求項2】
マイクから出力されるアナログ音声信号をディジタル音声信号に変換して記録する音声記録装置であって、
操作手段、
言語の種別とその言語の種別に対応する標本化周波数を記録する第1記録手段、
前記操作手段の操作に応じて言語の種別を決定する言語決定手段、
前記言語決定手段が決定した言語の種別に対応する前記第1記録手段に記録された標本化周波数を決定する周波数決定手段、
前記マイクが出力するアナログ音声信号を前記周波数決定手段が決定した標本化周波数で標本化してディジタル音声信号に変換する変換手段、および
前記変換手段が変換したディジタル音声信号を記録する第2記録手段を備える、音声記録装置。
【請求項3】
請求項1または2記載の音声記録装置と、
他の装置と音声で通信を行う音声通信手段とを備える、通信端末。
【請求項4】
前記マイクが出力するアナログ音声信号は前記変換手段によってディジタル音声信号に変換されて前記第2記録手段に記録されるとともに、前記音声通信手段によって前記他の装置に送信される、請求項3記載の通信端末。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2010−164735(P2010−164735A)
【公開日】平成22年7月29日(2010.7.29)
【国際特許分類】
【出願番号】特願2009−6398(P2009−6398)
【出願日】平成21年1月15日(2009.1.15)
【出願人】(000006633)京セラ株式会社 (13,660)
【Fターム(参考)】