説明

ストリームドットを用いた音声情報記録装置

【課題】 ドットパターン毎に異なる音声情報を関係付けたり、複数の異なるドットパターンで同一の音声情報を再生させたりすることが可能な、ストリームドットを用いた音声情報記録方式を提供する。
【解決手段】 リンクテーブルを生成して、ストリームドットを用いたドットパターン毎に音声情報を関連付けておき、スキャナで前記ドットパターンを読み取った際に、当該ドットパターンに関係付けられた音声情報をスピーカから再生する。これにより、絵本やカード等の表面にドットパターンを印刷しておき、絵本の図柄や物語に対応した音声情報を再生したり、カードに記載されたキャラクタに対応した音声情報を再生したりすることができる。またリンクテーブルによって、新たなドットパターンに新たな音声情報を関係付けたり、解除したり変更することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、印刷物等に形成したストリームドットパターン情報を光学的に読み取ることにより、音声情報を出力させるストリームドットパターンを用いた情報入出力方法に関するものである。
【背景技術】
【0002】
従来より、印刷物等に印刷されたバーコードを読み取り、このバーコードに対応する音声等の情報をメモリから読み出して出力させる情報出力方法が提案されている。たとえば、あらかじめ記憶手段に与えられたキー情報に一致する情報を記憶させておき、バーコードリーダで読み込まれたキーから検索して情報等を出力する方法が提案されている。また、多彩な音声情報を出力できるように、微細なドットを所定の法則で並べたドットパターンを生成し、印刷物等に印刷したドットパターンをカメラにより画像データとして取り込み、デジタル化して音声情報を出力させる技術も提案されている。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、上記従来のバーコードにより音声等を出力させる方法は、印刷物等に印刷されたバーコードが目障りであるという問題を有していた。また、バーコードが大きく、紙面の一部を占有するため、このようにバーコードが大きいと、一部分の文章やセンテンスまたは、写真、絵、グラフィックの画像の中に登場する意味を有するキャラクタや対象物毎に分り易く数多くのバーコードを割り当てることはレイアウト上不可能であるという問題を有していた。
【0004】
さらには、バーコードに割り当てられた音声は固定的なものであり、同一のバーコードを読み取った場合には常に同一の音声情報しか出力できなかった。
【0005】
本発明は、かかる問題点を解決するために創案されたものである。すなわち、本発明の目的は、ドットパターンと音声情報との関係(リンク)をユーザが任意に設定・解除できる仕組みを提案することで、任意のドットパターンに関連付けた音声情報の記録を可能にし、かつ、音声情報とドットパターンとの関係(リンク)の設定・解除を可能にすることで、両者の関係に柔軟性を持たせて、ドットパターン毎に異なる音声情報を関係付けたり、複数の異なるドットパターンで同一の音声情報を再生させることが可能な音声情報記録方式を提供することを技術的課題とする。
【課題を解決するための手段】
【0006】
本発明は、前記課題を解決するために、以下の手段を採用した。
【0007】
(1)本発明に係る音声情報記録装置は、音声情報を入力する音声情報入力手段と、入力された音声情報を記憶する記憶手段と、あらかじめ印刷された、所定の規則にしたがって線状に連続して複数の基準ドットを配置する工程と、該複数の基準ドットを結ぶ、直線、折れ線および/または曲線からなる第一の仮想基準線を設ける工程と、該基準ドットおよび/または該第一の仮想基準線から所定の位置に定義される、直線および/または曲線からなる少なくとも1以上の第二の仮想基準線を設ける工程と、該第二の仮想基準線上の所定の位置に複数の仮想基準点を設ける工程と、該仮想基準点を始点としてベクトルにより表現した終点に、該仮想基準点からの距離と方向とでXY座標値および/またはコード値が定義される情報ドットを配置する工程に従って配列したストリームドットパターンを1ラインまたは複数並べて形成したドットパターンを読み取る光学読取手段と、光学読取手段で読み取られたドットパターンをコード情報・座標情報に変換する変換手段と、前記変換手段によって変換されたコード情報・座標情報を前記音声情報と関係付ける関係付け指示手段と、関係付け指示手段によって関係付けられたコード情報・座標情報と前記音声情報との関係付けを登録するリンクテーブルと、前記光学読取手段で再度ドットパターンを読み取った後に、前記リンクテーブルで関係付けられた前記音声情報を前記記憶手段から読み出して出力する音声情報再生手段とからなる音声情報記録装置である。
【0008】
この音声情報記録装置によれば、ドットパターン毎に音声情報を関連付けておき、光学読取手段で前記ドットパターンを読み取った際に、当該ドットパターンに関係付けられた音声情報を音声情報再生手段から出力することができる。これにより、絵本やカード等の表面にドットパターンを印刷しておき、絵本の図柄や物語に対応した音声情報を再生したり、カードに記載されたキャラクタに対応した音声情報を再生することができる。また関係付け指示手段によって、新たなドットパターンに音声情報を新たに関係付けたり、解除したり変更することができる。
【0009】
なお、ドットパターンは、前記の絵本やカードの他に、名刺、手帳、シール等いかなる媒体に設けられたものでもよい。
【0010】
また、ドットパターンは記憶手段に記憶された音声情報に対応するコード情報であってもよいし、座標情報であってもよい。コード情報である場合には、コード情報に対応したアドレスに記録された音声情報を再生することができ、座標情報の場合には、光学読取手段が読み取った位置(座標情報)に対応した音声情報を再生することができる。
【0011】
また、基準点の間隔が一定のストリームドットパターンが複数並べて形成されることにより、XY座標値が媒体に隙間なく定義され軌跡情報を生成することができる。さらに、文字や五線譜、地図、図形などが媒体に印刷され、その線分上をスキャナーペンでなぞるかまたはタッチして操作する場合、その線分に沿ってのみストリームドットパターンを形成することにより、合理的にドットパターンを配置できる。また、XY座標が定義されたドットパターンを2次元コードとして形成される際(インデックスとして使用)の矩形領域の形状に制約されることなく、媒体表面上に可視的に形成された情報領域に合わせた自由な形状での一定情報のまとまりの繰り返しによるドットパターンを形成することが可能となる。
【0012】
(2)また、前記ストリームドットパターンは、前記第二の仮想基準線を定義するために、および/または前記ドットパターンの方向と1つのXY座標値および/またはコード値を定義するために、基準となる基準ドットを所定の位置に設けてもよい。
【0013】
これによれば、新たな基準点を設けることにより、ストリームドットパターンの向きと一定情報のまとまりを、情報ドットを使用せず簡易に定義することができ、余計な情報の低減を押さえられる。さらに、新たな基準点の配置により情報ドットの始点となる仮想基準点の位置を正確に示すことができる。
【0014】
(3)また、前記リンクテーブルは、1つの音声情報に対して、複数のコード情報・座標情報を関係付けることを特徴としてもよい。
【0015】
このように1つの音声情報を複数のドットパターンに関係付けることにより、ドットパターンが異なる複数のカードを光学読取手段で読み取った場合にも同一の音声情報を再生させることができる。
【0016】
(4)また、本発明の請求項3は、前記音声情報を記憶する記憶手段は、カード記憶媒体であってもよい。
【0017】
当該音声情報記録装置に着脱自在なカード記憶媒体を装着することにより、カード記憶媒体毎に異なる音声情報を再生することができる。また、このカード記憶媒体毎に照合テーブルと照合コードを設けておくことにより、音声情報の再生条件をカード記憶媒体毎に変更することができる。具体的には企業毎、ゲーム毎に異なる照合コードを設定しておき、ドットパターンに登録された当該照合コードが正しいか否かで音声情報の再生の許可・不許可を判定するような仕様とすることもできる。
【0018】
(5)また、少なくとも、前記音声情報の入力開始と、音声情報の入力終了と、音声情報の再生と、再生の停止とを指示するために、前記光学読取手段で読取可能なドットパターンが印刷された印刷媒体を有してもよい。
【0019】
音声情報の入力開始等の指示入力をドットパターンの読み取りで行うことによって、ハードウエアスイッチでこれらを行う場合に較べて視覚的かつ直感的に音声情報記録装置を操作することが可能となる。
【0020】
(6)また、前記コード情報・座標情報と前記音声情報との関係付け、または関係付けの解除を指示する前記関係付け指示手段として、前記光学読取手段で読取可能なドットパターンが印刷された印刷媒体を装置本体とは別体に有してもよい。
【0021】
ドットパターンと音声情報との関係付けおよび解除指示もドットパターンの読み取りで行うことによって、さらには視覚的かつ直感的に音声情報記録装置を操作することが可能となる。
【0022】
このようなドットパターンが印刷された印刷媒体(所謂ペーパーコントローラ)を用いて音声情報記録装置を構成することによって、印刷部分を目視することによって音声情報記録装置の可視的なオペレーションが可能となる。
【0023】
(7)また、前記ドットパターンは前記媒体面と前記光学読取手段との位置関係によって向きを有するドットパターンであって、前記光学読取手段で撮影したドットパターンが画素群として格納される画像記憶領域において、そこに格納された画素群に基づくXY座標のX正方向またはY正方向と、ドットパターンの向きとが成す角度とを計算する手段を備え、前記コード情報・座標情報に加えて角度情報毎に異なる前記音声情報を記憶・再生可能にする手段を有してもよい。
【0024】
ドットパターンは媒体面と前記光学読取手段との位置関係によって向きを有するため、これに着目して向き毎に異なる音声情報を出力させるようにしたものである。
【図面の簡単な説明】
【0025】
【図1】ボイスレコーダの正面図(1)である。
【図2】ボイスレコーダの左側面図である。
【図3】ボイスレコーダの右側面図である。
【図4】ボイスレコーダの使用状態を示す説明図である。
【図5】ボイスレコーダの内部構成ブロック図である。
【図6】指示ボードのシンボルの配置状態を示す図である。
【図7】音声ファイルフォーマットを示す図である。
【図8】照合テーブル、照合コードの説明図である。
【図9】ボイスレコーダの正面図(2)である。
【図10】リンクテーブルの説明図である。
【図11】メモリカードを示す図である。
【図12】ストリームドットパターンを説明するための図(1)である。
【図13】ストリームドットパターンを説明するための図(2)である。
【図14】ストリームドットパターンを説明するための図(3)である。
【図15】ストリームドットパターンを説明するための図(4)である。
【図16】ストリームドットパターンを説明するための図(5)である。
【図17】ストリームドットパターンを説明するための図(6)である。
【図18】メモリカードとしてSDカードを使用した状態を説明するための図である。
【図19】ボイスレコーダの他の実施形態について説明するための図である。
【図20】角度を検出する機能を有するボイスレコーダについて説明するための図である。
【図21】図20において使用される指示ボードのシンボルの配置状態を示す図である。
【図22】録音・リンク処理を示すフローチャート(1)である。
【図23】録音・リンク処理を示すフローチャート(2)である。
【図24】リンク済みの音声を再生する処理を示すフローチャートである。
【図25】角度を検出する方法について説明するための図(1)である。
【図26】音声決定テーブルについて説明するための図である。
【図27】角度を検出する方法について説明するための図(2)である。
【図28】角度を検出する機能を有するボイスレコーダの、他の実施形態について説明するための図(1)である。
【図29】角度を検出する機能を有するボイスレコーダの、他の実施形態について説明するための図(2)である。
【図30】角度を検出する機能を有するボイスレコーダの、他の実施形態について説明するための図(3)である。
【図31】本発明の他の実施形態について説明するための図である。
【図32】図31の実施例において使用される指示ボードのシンボルの配置状態を示す図である。
【図33】本発明の一実施形態であるボイスメールシステムにおけるネットワーク構成図である。
【図34】ボイスメールシステムにおいて使用するペーパーコントローラのシンボルの配置状態を示す図である。
【図35】ボイスメールデータベースについて説明するための図である。
【図36】ボイスメールを送受信する処理を示すフローチャートである。
【図37】ボイスメールの送受信について説明するための図である。
【図38】ボイスメールシステムの一実施例であるボイスメールマネージャについて説明するための図である。
【図39】ボイスメールマネージャにおいて使用するペーパーコントローラのシンボルの配置状態を示す図である。
【図40】本発明の一実施形態である音声認識データ通信による機器制御について説明するための図である。
【図41】機器制御において使用するペーパーコントローラのシンボルの配置状態を示す図である。
【発明を実施するための最良の形態】
【0026】
図1は、本発明の実施形態であるボイスレコーダ(音声情報記録装置)の正面図であり、図2はその右側面図、図3はその左側面図である。
【0027】
ボイスレコーダ101には、その筐体表面にスピーカ102が設けられており、音声情報の再生出力が可能となっている。スピーカ102の上方には、録音・停止ボタン103,録音再生表示部104、リンク表示部105、左上方には音声情報入力用のマイク107が設けられている。
【0028】
なお、ボイスレコーダ101の筐体表面には図9に示すような液晶画面901を設けてもよい。この液晶画面901には、録音状態、再生状態、停止状態、リンク状態、録音・再生トラック番号等を表示することが可能である。
【0029】
ボイスレコーダ101の右側面には、電源スイッチ108とボリューム109が配置されており、ボイスレコーダ101の電源投入とスピーカ102から再生される音声情報の音量調節が可能となっている。
【0030】
ボイスレコーダ101の左側面には、コネクタ端子(SCANNER)110、音声出力端子(PHNE)111および外部電源端子(DC IN)112が設けられている。コネクタ端子110は、たとえばUSB端子等の汎用シリアルインターフェースであり、図4に示すようにスキャナ113(光学読取手段)のケーブル114の端部に設けられたUSBコネクタ115が装着されるようになっている。
【0031】
スキャナ113には、図5に示すように、CMOS撮像素子(CMOSS)が配置されており、LED(IRLED)からの照射光をドットパターンの印刷面に照射し、その反射光が可視光フィルタ(図示せず)を介することによって赤外線領域のみの波長光として受光し、これがレンズを介してCMOS撮像素子によって撮影され、該撮影画像が中央処理装置(MPU)によって解析され、解析結果のコード情報(32bitのドットコード)または座標情報としてボイスレコーダ101に送信される。なお、このときドットパターンにはキードット2(図12および図14参照)が配置されてドットパターンを構成するブロックの向き(角度)も角度情報として受信可能となっている。
【0032】
つまり、ドットパターンの撮影画像をビデオメモリに展開することで、各ドットのXY座標値がわかるので、これを元に格子ドットとキードットを探索することで当該ドットパターンの向き(ビデオメモリの正XY座標軸に対するドットパターンの角度)が検出できる。
【0033】
なお、スキャナ内には解析ソフトウエアがROM等に格納されており、中央処理装置(MPU)は、当該ROMから当該ソフトウエアを読み込むことによって撮影画像の解析処理(ドットパターンの認識→数値変換→ドットコード、座標情報、角度情報に変換)を実行する。
【0034】
ボイスレコーダ101本体内は、図5に示すように、中央処理装置(MPU)を中心に構成されている。すなわち、中央処理装置(MPU)の制御によって、マイクから入力された音声情報は、アンプを介してA/Dコンバータ、圧縮回路によって処理され、デジタル音声情報として、コネクタを介してメモリカード106(記憶手段)に記録される。
【0035】
このメモリカード106の外観を示したのが図11である。このメモリカード106は、たとえばメモリとしてのICチップを内蔵したクレジットカードサイズのプラスチックカードであり、信号ピン、電源ピンを構成する接触型の電極106aを有している。なお、非接触の無線通信型のRFIDカードであってもよい。また、このようなカードの他、SDカード(商標名)、ミニSDカード(商標名)、メモリースティック(商標名)、メモリースティック・デュオ(商標名)等の規格型のメモリカードであってもよい。
【0036】
当該ボイスレコーダ101において、音声情報を再生する際には、メモリカード106(記憶手段)から読み出されたデジタル音声情報は、コネクタを介して中央処理装置(MPU)に読み込まれ、圧縮回路で逆圧縮(展開)されて、A/Dコンバータでアナログ情報に変換されてアンプ(AMP)を介してスピーカから出力される。
【0037】
なお、ボイスレコーダ101の駆動電流は、電池からDC−DCコンバータを介して、中央処理装置(MPU)、圧縮回路、アンプ(AMP)に供給されるようになっている。
【0038】
図6は、ボイスレコーダ101の操作指示をスキャナ113の読み取りで行うための指示ボード600(ペーパーコントローラ:印刷媒体)である。この指示ボード600は、ボイスレコーダ101の操作指示を示すシンボルが印刷されている。このシンボルの領域には操作指示に対応したコードを意味するドットパターンが印刷されている。ドットパターンについては後述する。
【0039】
この指示ボード600は紙材で構成され、紙材の表面にドットパターンが印刷され、さらにはその上層にラミネート加工が施されている。
【0040】
指示ボード600上には、録音601、音声品質602a〜602c、再生604、早送り605、停止606、一時停止619、戻り・再生607、送り・再生608、先頭・再生609、後尾・再生610が設けられておりボイスレコーダ101でのそれぞれの機能が命令可能となっている。
【0041】
また、指示ボード600の下部には、リンク関連の指示シンボルが印刷されている。すなわち、リンク開始611、リンク終了612、リンク解除613、全リンク解除614の各指示シンボルが配置されている。
【0042】
さらには、指示ボード600の最下部には、音声消去615、全音声消去616の各指示シンボルと、実行617、中止618の各指示シンボルが配置されている。
【0043】
なお、図示はしなかったが、この他に指示ボード600には、音声ナビゲーションのシンボルを印刷しておいてもよい。この音声ナビゲーションは、ボイスレコーダ101や指示ボード600を操作する際の音声ガイダンスの有無を指示入力するためのシンボルである。
【0044】
図7は、記憶手段(メモリカード)に記録される音声情報のフォーマットを示している。音声情報は、インデックス701と、複数の音声ファイルトラック702とで構成されている。
【0045】
インデックス701には、トラック毎の管理情報と、再生フラグが登録されるようになっている。
【0046】
また、インデックス701は各音声ファイルトラック702の音声情報の消去・更新の禁止情報が記録されており、これによって音声ファイルトラックは消去・更新が可能なトラックと、消去・更新が禁止されているトラックの2種類に分けて管理することが可能となっている。
【0047】
たとえば、消去・更新を禁止するトラックとしては、ボイスレコーダ101や指示ボード600の次の操作を音声で指示するナビゲーション音声ファイルが格納されたトラックや、絵本等とのセットで販売されたメモリカード106であらかじめ絵本のストーリーにしたがって声優が音声を記録しているトラック等が考えられる。一方、消去・更新が可能なトラックには、購入したユーザが絵本の登場人物になって発声するセリフ等を入力しておくことができる。
【0048】
また、消去・更新を禁止するトラックには、前述の音声ナビゲーションのガイダンス音声等を登録しておいてもよい。
【0049】
図8は、記憶手段(メモリカード)に設けられた照合テーブルおよび照合コードを示している。
【0050】
同図に示すように、本実施形態での照合テーブルはC8〜C22,C31の値を照合範囲として設定しており、この範囲に存在する照合コードがドットパターンから読み取った照合コードと一致する場合には、当該ドットパターンが当該ボイスレコーダに適合しているものとして音声情報の再生を許可する。
【0051】
なお、照合テーブルは任意に変更可能であり、たとえば当該ボイスレコーダのメーカー毎、メモリカードのメーカー毎、ゲームの種類毎に照合テーブルの照合範囲を変更してもよい。
【0052】
このような照合テーブル、照合コードをメモリカード106に登録しておくことにより、当該照合コードと同一のコードがドットパターンとして印刷されている絵本でしか音声情報の録音・再生ができないようにすることが可能である。すなわち、セットで販売されている絵本とメモリカード106との組合せでなければ音声録音・再生が行えない仕組みを提供することができる。
【0053】
このとき、中央処理装置(MPU)はスキャナ113が読み込んだドットパターンに基づいて、所定の領域のドットコード(照合コード)をスキャナ113から受信して、これをメモリカード106の照合コードと比較して一致していればメモリカード106内の音声情報の録音・再生を許可する。
【0054】
図10は、リンクテーブルについて説明したものであり、当該リンクテーブルはメモリカード106に設けられている。リンクテーブルは、同図に示すように、登録順を示すラベルと、音声ファイルトラック番号と、32bitのドットコードとで構成されている。本実施形態において、1つの音声ファイルトラック番号に対して複数のドットコードを関係付けることができるようになっている。これによって、異なる多数のドットパターンの印刷された写真、シール、絵本等の媒体をスキャナ113で読み取った場合でも同一の音声情報を再生させることが可能となる。
【0055】
次に、本実施形態で用いられるドットパターンについて説明する。
【0056】
図12、図13は、ストリームドットパターンを形成する工程の一例を順に示すものである。
【0057】
本発明に係るドットパターンは、従来のドットパターンとは異なり、まず工程1として媒体表面上の可視的な情報に対応して、情報を入出力させたい箇所に基準ドット1を線状に連続して複数個配置する。
【0058】
図11(a)では基準ドット1を曲線状に配置しているが、基準ドット1の配置はこれに限定されるものではなく、直線と曲線を織り交ぜたり、複数の線分により構成される折れ線状にするなど、情報を入出力させる領域にあわせた形状にドットパターンを形成するための種々の変更が可能である。
【0059】
また、媒体表面上に可視的に形成された実在線上に基準ドット1を配置してもよいし、実在線に沿って所定の規則により基準ドット1を配置してもよい。ここでいう実在線とは仮想線に対する概念で、実際に存在している線の全てを含むものである。例えば、実線、破線、点線、直線や曲線などが挙げられ、本発明においては、線が形成される媒体(例えば映像表示装置のディスプレイ)や、線を構成する物質(例えばインク)の如何を問わない。なお、ドットパターンは、印刷やディスプレイ表示、さらに金属やプラスチック上での穴や溝等の凸凹であってもよい。
【0060】
なお、基準ドットは読取り精度向上の観点から、等間隔に配置することが望ましいが、これに限定されるものではなく、複数の間隔を混在させてドットパターンの一定情報のまとまりを定義したり、一定情報のまとまり内における3つの異なる基準ドットの配置間隔によりドットパターンの一定情報のまとまりとドットパターンの方向の両方を定義することも可能である。
【0061】
次に、工程2として、線状に配置された基準ドット1を結ぶ、第一の仮想基準線2を設ける。図12(b)では第一の仮想基準線2を曲線により設けているが、第一の仮想基準線2はこれに限定されるものではなく、曲線状に配置された基準ドット1に対して直線の第一の仮想基準線2を設けてもよいし、直線状に配置された基準ドット1に対して曲線の第一の仮想基準線2を設けてもよい。すなわち、後述する工程3〜工程5における第二の仮想基準線3、仮想基準点4、情報ドット5をどの位置に配置するかによって、基準ドットを結ぶ、直線、折れ線および/または曲線からなる第一の仮想基準線8を自由に定義することが可能である。
【0062】
なお、図13に例を示すように、曲線である場合の第一の仮想基準線2は、ベジェ曲線によることが望ましい。
【0063】
すなわち、まず、第一の仮想基準線2上にある基準ドット1をP0、P3とし、P1、P2を与えられた制御点とする。次に、制御点を順に結んで得られる3つの線分・P0―P1、P1―P2、P2―P3・をそれぞれ1対1の比率で分割する点P4、P5、P6を求める。そして、これらの点を順に結んで得られる2つの線分・P4―P5、P5―P6・を、それぞれ1対1の比率で分割する点P7、P8を求める。
【0064】
最後に、この2点を結ぶ線分・P7―P8・をさらに1対1の比率で分割する点P9を求め、この点がベジェ曲線上の点となる。
【0065】
この手順を繰り返し行うことで、P0、P1、P2、P3を制御点とするベジェ曲線が得られる。
【0066】
なお、ベジェ曲線に限らず、スプライン関数を利用して求められるスプライン曲線、n次多項式、楕円弧など、種々のアルゴリズムを用いて第一の仮想基準線8を設けてもよい。
【0067】
また、第二の仮想基準線3においても、第一の仮想基準線2と同様に当該方法を用いて曲線を定義することが可能である。
【0068】
次に、工程3として、線状に配置された基準ドット1および/または第一の仮想基準線2から所定の位置に定義される第二の仮想基準線3を設ける。図12(c)では第二の仮想基準線3を、隣り合う基準ドット1の中間点における第一の仮想基準線2の接線に対して垂直線上の所定位置に向かって、隣り合う基準ドット1から任意の角度をもって設けているが、第二の仮想基準線3はこれに限定されるものではなく、後に示すようにドットパターンにより情報を入出力させたい領域に合わせて仮想基準点を設けるために、種々の方法により定義することが可能である。
【0069】
また、第一の仮想基準線2に対して片側のみに第二の仮想基準線3を設けてドットパターンの方向を定義してもよいし、情報量を増やすために両側各々に設けてもよい。
【0070】
次に、工程4として、第二の仮想基準線3上の所定の位置に複数の仮想基準点4を設ける。図13(a)では仮想基準点4を、第二の仮想基準線3の交点、すなわち隣り合う基準ドット1を結んだ直線を底辺とし、第二の仮想基準線3を対辺とする二等辺三角形の頂点に設けているが、仮想基準点4の位置はこれに限定されるものではなく、第二の仮想基準線3の中点に設けたり、第二の仮想基準線3上に代えて基準ドット1上に設けるなど、種々の変更が可能である。
【0071】
そして、工程5として、仮想基準点4を始点としてベクトルにより表現した終点に情報ドット5を配置する。図13(b)では情報ドット5を、仮想基準点10からのベクトル方向を8方向、仮想基準点4からの距離が等距離となるよう、一個の仮想基準点4に対し1個配置しているが、情報ドット5の配置はこれに限定されるものではなく、仮想基準点4上に配置したり、ベクトル方向を16方向として配置したり、一個の仮想基準点4に対し2個配置するなど、任意の方向に任意の長さに、複数配置することが可能である。
【0072】
図15はドットパターンの情報ドットおよびそれに定義されたデータのビット表示の一例を示す拡大図である。
【0073】
情報ドット5は種々の情報を認識させるドットである。この情報ドット5は、仮想基準点4を始点としてベクトルにより表現した終点に配置したものである。たとえば、この情報ドット5は、図5に示すように、その仮想基準点5から0.1mm離れたドットは、ベクトルで表現される方向と長さを有するために、時計方向に45度ずつ回転させて8方向に配置し、3ビットを表現している。
【0074】
なお、図示例では8方向に配置して3ビットを表現しているが、これに限定されずに、16方向に配置して4ビットを表現することも可能であり、任意の方向に任意の長さに配置できることはもちろんである。
【0075】
さらに、図13(b)では全ての仮想基準点5において、この仮想基準点5を始点としてその終点位置に情報ドット3を配置したが、これに限定されることなく、仮想基準点上にドットが配置されているか否かで情報を定義するようにしてもよい。たとえば仮想基準点上にドットが配置されていれば「1」、配置されていなければ「0」というように情報を定義することができる。
【0076】
図16は情報ドットおよびそこに定義されたデータのビット表示の例であり、他の形態を示すものである。
【0077】
また、情報ドット5について基準ドット1から導き出された仮想基準点4から短(図16の上段)・長(図16の下段)の2種類を使用し、ベクトル方向を8方向とすると、4ビットを表現することができる。このとき、長い方が隣接する仮想基準点5間の距離の25〜30%程度、短い方は15〜20%程度が望ましい。ただし、長・短の情報ドット5の中心間隔は、これらのドットの径より長くなることが望ましい。
【0078】
情報ドット5は、その見栄えを考慮し、1ドットが望ましい。しかし、見栄えを無視し、情報量を多くしたい場合は、1ベクトル毎に、1ビットを割り当てて情報ドット5を複数のドットで表現することにより、多量の情報を有することができる。たとえば、同心円8方向のベクトルでは、基準ドット1から定義された情報ドット5で2の情報を表現でき、1の一定情報のまとまりの情報ドット8個で264となる。
【0079】
このように、本発明に係るストリームドットパターンは、本発明者が提唱している従来のドットパターンでは2次元的に格子状に形成される基準ドットとは異なり、曲線を含む線状に連続して配置された基準ドットに基づいて形成される。
【0080】
図17は、ストリームドットパターンを上下方向に並べた状態の一例について示す図である。
【0081】
同図では、基準ドット、情報ドットの他に、キードットおよびサイドドットを配置している。キードットは、一定情報のまとまりの両端に配置されたドットである。このキードットは、ひとまとまりの情報ドット群を表す1領域分のドットパターン1の代表点である。サイドドットは、キードット2のずれの正負の延長線上に配置されたドットである。
【0082】
同図(b)は、基準ドットおよびストリームドットパターンを等間隔に並べている。このように、基準点の間隔が一定のストリームドットパターンが複数並べて形成されることにより、XY座標値が隙間なく定義される。しかし、本発明に係るストリームドットパターンはこれに限らず、同図(a)に示すように、ドットパターン同士の間隔を任意に設定してよい。また、基準ドット同士の間隔も、任意に設定することができる。
【0083】
これにより、XY座標が定義されたドットパターンを2次元コードとして形成される際(インデックスとして使用)の矩形領域の形状に制約されることなく、媒体表面上に可視的に形成された情報領域に合わせた自由な形状での一定情報のまとまりの繰り返しによるドットパターンを形成することが可能となる。
【0084】
なお、本発明に係る仮想基準線及び仮想基準点は、実際に媒体表面上に印刷形成されるわけではなく、あくまでコンピュータの画像メモリ上に、ドットパターンの配置の際、またはドットパターンの読み取りの際に仮想的に設定されるものである。
【0085】
このストリームドットパターンを用いることで、地球儀を初めとする曲面体や、人体模型、立体地図などの三次元造形物にもドットパターンを形成することができ、平面地図や絵本等に限らず本発明に係る入出力装置を利用することが可能となる。
【0086】
このようなドットパターンは、写真116(図4参照)や、絵本、カード等の表面に印刷されている。また、図6で説明した指示ボード600(ペーパーコントローラ)の各シンボル部分にも設けられている。
【0087】
次に、本実施形態のボイスレコーダ101を用いた操作手順について説明する。
【0088】
(基本機能)
ドットパターンが絵柄と重畳印刷された絵本と、録音済みメモリカード106とがセットで販売されており、これを購入したユーザは、メモリカード106をボイスレコーダ101に装着する。そして、図4に示すように、スキャナ113のコネクタ115をコネクタ端子110に装着する。そして、絵本のたとえば犬の絵に重畳印刷されているドットパターンをスキャナ113が読み取ると、スキャナの中央処理装置(MPU)は当該ドットパターンを解析ソフトによって解析し、ドットコード(コード情報)に変換する。このドットコードはボイスレコーダ101の中央処理装置(MPU)に送信される。ボイスレコーダ101では、当該ドットコードに基づいてメモリカード106のリンクテーブル(図10参照)を検索する。そして、このドットコードに対応する音声ファイルトラック702を索出して、メモリカード106内の該当する音声ファイルトラック702(たとえば、犬の鳴き声)を読み出す。この音声ファイルトラック702の音声情報は、圧縮回路で逆圧縮(展開)され、A/Dコンバータでアナログ音声情報に変換されて、アンプ(AMP)を介してスピーカから出力される。このようにして、絵本の犬の絵の部分をスキャナ113で読み取ると、ボイスレコーダ101のスピーカ102から犬の鳴き声が再生される。
【0089】
(再生手順)
次に、あらかじめメモリカード106内に、ドットパターンに音声情報が関係付けられている場合の種々の再生方法について詳しく説明する。
【0090】
まず、スキャナでドットパターンが印刷された絵本、写真、シール等をクリック(撮像)すると、前記のようにドットパターンに対応したドットコードが解析されて、リンクテーブルが参照されて、当該ドットコードに対応する音声情報が再生される。このとき、中央処理装置(MPU)は、音声情報の再生とともに、録音・再生表示部のLEDを点灯させる。
【0091】
次に、音声再生中に、スキャナ113で指示ボード600の早送り605のシンボルがクリック(撮像)されると、早送り再生(x倍速再生:xは任意の整数)が実行される。
【0092】
ここで再生速度を元に戻したい場合(通常音声再生)には、指示ボード600の早送り605のシンボルを再度クリックするか、再生604のシンボルをクリックする。
【0093】
また、音声再生中に、スキャナ113で指示ボード600の一時停止619のシンボルがクリックされると、再生が一時停止(ポーズ状態)となる。再度一時停止619のシンボルがクリックされることによって再生が再開される。
【0094】
さらには、音声再生中に、送り・再生608がクリックされると、中央処理装置(MPU)は、メモリカード106内のリンクテーブル(図10参照)を検索し、現在再生している音声ファイルトラック702の次のラベル(登録順)に登録されている音声ファイルトラック702の再生を開始する。また、戻り・再生607がクリックされると、中央処理装置(MPU)は、リンクテーブル(図10参照)を検索し、現在再生している音声ファイルトラック702の前のラベル(登録順)に登録されている音声ファイルトラック702の再生を開始する。
【0095】
また、音声再生中に、後尾・再生610がクリックされると、中央処理装置(MPU)は、メモリカード106内のリンクテーブル(図10参照)を検索し、音声ファイルトラック702の最後のトラック(図10では音声ファイルトラックNo.4)の再生を開始する。また、先頭・再生609がクリックされると、音声ファイルトラック702の先頭のトラック(図10では音声ファイルトラックNo.3)の再生を開始する。
【0096】
(録音手順)
ボイスレコーダ101に新たに音声を録音する場合、スキャナ113で指示ボード600の録音601のシンボルをクリックするか、本体の録音・再生ボタン103を押すことによって録音が開始される。マイク107に向かって発声された音声はA/Dコンバータによりデジタル変換され、圧縮回路によって圧縮される。このような圧縮データ形式で音声情報は順次メモリカード106に登録される。
【0097】
この録音中に、スキャナ113で指示ボード600の録音601のシンボルまたは停止606のシンボルをクリックするか、本体の録音・停止ボタン103を押すことによって録音を停止する。このときまでに録音された音声情報がメモリカード106に記録される。
【0098】
これらの音声を消去する場合には、スピーカ102から音声が再生されている状態、または音声の再生終了後5秒以内に指示ボード600の音声消去615のシンボルがスキャナ113でクリックされるとスピーカ102から「ピー」音が出力されて録音・再生表示部106のLEDが5秒間点滅する。この5秒間の間に、指示ボード600の実行617のシンボルがクリックされると再生されている音声が消去される。このとき中央処理装置(MPU)は当該音声ファイルトラック702のデータをメモリカード106から削除する処理を行う。
【0099】
また、前記5秒間の間に中止618のシンボルがスキャナ113でクリックされるか、5秒間の間いずれのシンボルもクリックされない場合には、この音声消去モードを終了する。
【0100】
また、メモリカード106に録音されている全ての音声情報を消去したい場合には、上記音声消去615の代わりに全音声消去616のシンボルをスキャナ113でクリックすればよい。
【0101】
(リンク作業)
本実施形態では、ユーザが自分自身で録音した音声情報またはメモリカード106に記憶された既存の音声情報をどのドットパターンと関係付けるかを自由に設定することができる。これをリンク設定という。
【0102】
リンク設定は図10に示すリンクテーブル(メモリカード106内に設定)によって管理されている。
【0103】
リンクを作成する際には、まず指示ボード600の録音601のシンボルをスキャナ113でクリックするか、録音・停止ボタン103を押して音声の録音を開始する。このとき録音再生表示部104のLEDが点滅状態となる。
【0104】
次に、録音状態を維持したまま、絵本、写真、シール、カード等に印刷されたドットパターンがスキャナ113でクリック(撮像)されると、中央処理装置(MPU)は録音状態を停止するとともに、録音された音声ファイルトラック番号に対して撮像したドットパターンのドットコードを関連付けて登録する。このとき、スピーカ102から「ピッ」音を出力させてリンクの生成をユーザに通知する。
【0105】
また、ドットパターンをスキャナ113でクリックしたときに、既にリンクテーブルに当該ドットパターンに対応するドットコードに他の音声ファイルトラック702が関係付けられて登録されている場合には、中央処理装置(MPU)は、スピーカ102から「ブッ」音を出力させてリンク作成ができないことをユーザに通知する。
【0106】
次に、既にメモリカード106に音声情報が登録されている場合に、ドットパターンとのリンクを生成する手順について説明する。
【0107】
まず、指示ボード600のリンク開始611のシンボルをスキャナ113でクリックすると、ボイスレコーダ101の中央処理装置(MPU)は、リンク表示部105のLEDを点滅させてリンク開始をユーザに通知する。
【0108】
次に、指示ボード600の再生604のシンボルをスキャナ113でクリックしてリンクさせる音声ファイルトラック702の音声を再生させる。このとき、ユーザは指示ボード600の送り・再生608、戻り・再生607、先頭・再生609、後尾・再生610をクリックすることによって再生する音声ファイルトラック702を順次切り替えて所望の音声ファイルトラック702を探し出す。
【0109】
このようにして所望の音声ファイルトラック702を再生している間、または音声再生終了後5秒以内に絵本、写真、シール、カード等に印刷されたドットパターンをスキャナ113でクリックすると、当該音声ファイルトラック702とドットパターンのドットコードとが関係付けられてリンクテーブルに登録される。なおここで、既にリンクテーブルに当該ドットパターンに対応するドットコードに他の音声ファイルトラック702が関係付けられて登録されている場合には、中央処理装置(MPU)は、スピーカ102から「ブッ」音を出力させてリンク作成ができないことをユーザに通知する。
【0110】
このように、1つのドットパターン(ドットコード)は1つの音声ファイルトラックにしかリンクさせることはできないが、逆に1つの音声ファイルトラック702は複数のドットパターン(ドットコード)とリンクさせることができる。したがって、全く異なるドットパターンであってもクリックすることによって同一の音声情報を再生させることが可能となる。
【0111】
以上のリンクモードを終了する場合には、指示ボード600のリンク終了612のシンボルをスキャナ113でクリックする。これによって、ボイスレコーダ101は、電源スイッチ108をオン状態にしたときの初期状態に戻る。
【0112】
次に、以上のように設定されたリンクテーブルのリンクを消去する手順について説明する。
【0113】
いずれかのリンクを消去したい場合には、まずリンクテーブルに既にリンクが生成されているドットパターンをスキャナ113でクリックして、中央処理装置(MPU)は、関係付けられた音声ファイルトラックを読み出して再生する。
【0114】
次に、当該音声の再生中、または再生終了後5秒間の間にリンク解除613のシンボルをスキャナ113でクリックする。次に、中央処理装置(MPU)はスピーカ102から「ピー」音を5秒間出力するとともに、リンク表示部105のLEDを点滅させる。この間に指示ボード600の実行617のシンボルをスキャナ113でクリックすると、当該ドットパターン(ドットコード)と音声ファイルトラックとのリンクが解除される。このとき、リンクが解除されるだけで関係付けられていた音声ファイルトラックは消去されない。
【0115】
また、前記5秒間の間に中止618のシンボルがスキャナ113でクリックされるか、5秒間の間いずれのシンボルもクリックされない場合には、このモードを終了する。
【0116】
次に、リンクテーブル内の全てのリンクを解除する場合には、前記リンク解除613のシンボルの代わりに、全リンク解除614のシンボルをスキャナ113でクリックすればよい。その手順は前記の個々のリンクの解除と同様であるので説明は省略する。
【0117】
(その他の機能)
ボイスレコーダ101は、以上の機能の他に以下の付加機能を有している。
【0118】
5分間いずれのスイッチやボタンも操作されず、かつスキャナ113でいずれのドットパターンまたはシンボルもクリックされない場合には電源オフ状態となる。これは中央処理装置(MPU)がクロックを用いて5分間の計数を行い、中央処理装置(MPU)とDC−DCコンバータとの間にあるスイッチを開放する制御を行うことによって実現される。
【0119】
ボイスレコーダ101は録音する音声に対して音声品質(ビットレート)を可変にすることができる。音声品質の「低」602cのシンボルをスキャナ113でクリックした場合、録音されるビットレートが低く設定されて長時間録音が可能となる。一方、「高」602aのシンボルがクリックされた場合にはビットレートが高く設定され高品位な録音が可能となる。「中」602bのシンボルはその中間のビットレートに設定可能となっている。
【0120】
中央処理装置(MPU)はメモリカード106の空き容量を監視しており、空き容量が0.2Mbyte未満になると録音・再生表示部104のLEDを点滅させて録音可能時間が少ないことをユーザに通知するようになっている。このとき、前述のように、指示ボード600で音声ナビゲーションのシンボルをスキャナ113でクリックした場合には、ユーザへの通知を音声情報、たとえば「メモリが残り少なくなっています」というような音声情報をスピーカ102から出力させてもよい。
【0121】
なお、以上の実施形態では、写真、絵本、カード、シール等に形成されたドットパターンとしてコード情報(ドットコード)の場合のみを説明したが、これに限らず座標情報、コード情報と座標情報の組合せ、さらにはキードット2による角度情報の組合せをスキャナで読み取るようにしてもよい。
【0122】
角度情報を組合せた場合、たとえばスキャナ113に対して読み取るドットパターンが印刷されたカードの向き(角度)によって異なる音声情報を出力させることも可能となる。
【0123】
図18、図19は、本発明の他の実施形態を示すものである。
【0124】
図18に示すボイスレコーダ101aは、図1に示したボイスレコーダ101とほぼ同様のものであるが、メモリカードとしてSDカード106Aを用いたものである。その他の機能は図1で説明したものと同じであるので説明は省略する。なお、図18ではSDカードを例示したが、メモリ媒体であればminiSD、メモリースティック、メモリースティックDuo等いかなる媒体であってもよい。
【0125】
図19は、スキャナを一体化したボイスレコーダ1901を示している。
【0126】
このボイスレコーダ1901の装置本体の先端(図で上端)には、センサユニット1903が内蔵されており、図示は省略するが、赤外線LED等の赤外線照射手段やドットパターンからの反射光を撮影するCCDやCMOSからなる撮像手段が設けられている。すなわち、図4および図5で説明したスキャナ113がボイスレコーダ1901の本体に一体的に内蔵された構造となっている。
【0127】
本体の底部近傍の側面にはスピーカ1902が設けられており、マイク1908から入力した音声や、SDカード106A(図19では図示せず)や内蔵されたメモリにあらかじめ登録された音声、音楽等が出力されるようになっている。
【0128】
本ボイスレコーダ1903の正面(操作面、図19(b)に示す面)には、センサユニット側からスキャンボタン1904、録音ボタン1905、ボリューム1906、LED1907およびマイク1908がそれぞれ配置されている。
【0129】
<回転パラメータを有する実施形態>
図20から図27は、本発明の他の実施形態を示すものである。
【0130】
これらの実施形態は、ドットパターン(フィギアの向き)の角度を認識することにより、ドットコードおよびその角度に対応した音声を出力することのできる台座(音声情報記録装置)に関するものである。
【0131】
本実施形態は、図20に示す如く、台座2001と、それに接続されたスキャナ113とそのスキャナ113で読み取るためのペーパーコントローラ2006と、台座2001の上面のステージ2002に載置されるフィギア2003とで構成される。
【0132】
また、台座2001の周面の正面側には、マイク2004と液晶表示部2005とが設けられている。
【0133】
フィギア2003の底面には図12〜17で説明したドットパターンが印刷されたシールが貼付されている。
【0134】
台座2001の内部には、図示しない赤外線照射手段(たとえば赤外線照射LED)と、撮像手段(CCD、CMOS等)が設けられており、台座2001のステージ2002に設けられた読取孔を介してフィギア2003底面のドットパターンが撮像可能となっている。
【0135】
本実施形態に用いる指示ボード(ペーパーコントローラ2006)は、図21に示すものである。
【0136】
このペーパーコントローラ2006には、録音を指定する録音領域、リンク領域、回転パラメータ領域、再生、早送り、戻り・再生、送り・再生、先頭・再生、後尾・再生等の再生制御を行う再生制御領域、リンクの生成や解除ならびに音声の消去を制御するリンク制御領域が設けられ、それぞれにドットパターンが印刷されている。
【0137】
すなわち、ペーパーコントローラ2006のこれらの領域をスキャナ113で撮像することによって、音声の入力、再生、フィギアとの関係付け(リンク)が制御できるようになっている。
【0138】
さらには、ペーパーコントローラ2006には、回転パラメータのON/OFF領域が設けられている。
【0139】
この回転パラメータON/OFF領域は、フィギアの底面に設けられたドットパターンの向きのパラメータをON状態(向きのパラメータも付加して制御を行うモード)にするかOFF状態(向きのパラメータを無視して制御を行うモード)にするかを指示するための領域であり、ONの領域をスキャナ113で撮像したときには、ステージ2002上でのフィギア2003の向き、たとえば正面を向かせて載置したとき(図20(a))、横に向かせて載置したとき(図20(b))、正面に背中を向けて載置したとき(図20(c))のそれぞれで異なる音声を出力することが可能となる。
【0140】
図25は、ドットパターンの向きを検出するための技術を説明した図である。
【0141】
図12で説明したように、ドットパターン1は、キードット2を中心に情報ドット3を配置した構成となっている。したがって、ドットパターン1から情報ドットの意味する値を抽出するためのアルゴリズム(中央処理装置によって実行される解析プログラム)では、スキャナ113やセンサユニット1903で撮像されたドットパターン1の画像データをビデオメモリに展開し、このビデオメモリの画素を解析してまずキードット2を探す。したがって、キードット2が索出されるとドットパターン1の向き(撮像基準線2501(ここではY正方向)に対するドットパターン1の傾きの角度θ)が計算できる。
【0142】
本実施形態はこの向きの角度をドットパターンが意味するコード値にパラメータとして付加したものであり、同一のドットパターンであっても角度によって出力させる音声データ(ボイスアドレス)を変化させることができる。
【0143】
なお、ここではY正方向に対するドットパターンの向きとの角度で説明したがこれにX正方向を基準にしてもよいことはいうまでもない。
【0144】
図26はその角度をパラメータとして付加した場合の音声決定テーブルである。これを具体的に図20で説明したフィギア2003の向きと対応付けて説明すると、フィギア2003が正面を向いて載置されているとき(図20(a))には、角度は−46〜+45(0±45)度であるので、音声決定テーブルにより角度No.001が選択されボイスアドレスaに登録された「おはよう」という音声が台座2001のスピーカ(図示省略)から発声される。
【0145】
また、図20(b)に示すようにフィギア2003を左方向に向けて載置した場合には、角度は+46〜+135(90±45)度であるので、音声決定テーブルにより角度No.002が選択され、ボイスアドレスbに登録された「こんにちは」という音声が台座2001のスピーカ(図示省略)から発声される。
【0146】
さらには、図20(c)に示すようにフィギア2003が正面からみて後ろ向きに載置された場合、角度は+136〜+225(180±45)度であるので、音声決定テーブルにより角度No.003が選択され、ボイスアドレスcに登録された「こんばんは」という音声が台座2001のスピーカ(図示省略)から発声される。
【0147】
<録音およびリンク処理>
次に、図22〜24を用いて、本実施形態のボイスレコーダの操作手順について説明する。
【0148】
まず、スキャナの中央処理装置(MPU)は、プログラムに基づいて、ユーザにより、回転パラメータON804のシンボルがクリックされたか否かを判定する(2201)。ここで、クリックされたと判断した場合にはステップ2202に処理を移し、クリックされたと判断しなかった場合には、本処理を終了する。
【0149】
ステップ2202では、回転パラメータをONにする。スキャナの中央処理装置(MPU)は、ステップ2201で読み取られたドットパターンを解析ソフトによって解析し、ドットコード(コード情報)に変換する。このドットコードが台座2001の中央処理装置(MPU)に送信される。そして、台座2001の中央処理装置(MPU)は、回転パラメータをONにする。
【0150】
次に、録音801がクリックされたか否かを判断する(2203)。クリックされたと判断した場合にはステップ2204に処理を移し、クリックされたと判断しなかった場合には、本処理を終了する。
【0151】
ステップ2204では、録音モードをONにする。
【0152】
次に、録音処理を行う(2205)。台座2001の中央処理装置(MPU)は、マイク2004に向かって発声された音声をA/Dコンバータによりデジタル変換し、圧縮回路によって圧縮する。このような圧縮データ形式で音声情報を順次メモリに登録する。
【0153】
次に、リンク開始802のシンボルがクリックされたか否かを判断する(ステップ2206)。クリックされたと判断した場合には録音を停止し(2301)、クリックされたと判断しなかった場合にはステップ2207に処理を移す。
【0154】
ステップ2207では、音声の録音が完了したか否かを判断する(2207)。録音801のシンボルまたは停止808のシンボルがクリックされたと判断した場合には、録音が完了したと判断する。録音が完了したと判断した場合には本処理を終了し、録音が完了したと判断しなかった場合には、再度ステップ2207の処理を行う。
【0155】
ステップ2301では、録音状態を停止する。そして、リンクモードをONにする(2302)。
【0156】
次に、リンク終了803のシンボルがクリックされたか否かを判断する(2303)。クリックされたと判断した場合には本処理を終了し、クリックされたと判断しなかった場合にはステップ2304に処理を移す。
【0157】
ステップ2304では、フィギア2003が台座2001のステージ2002に載置されているか否かを判断する。フィギア2003が載置されているか否かの判断は、台座のセンサユニットがフィギア2003底面のドットパターンを読取可能な状態となっているか否かで判断する。載置されている場合には、センサが読み取ったドットパターンを中央処理装置(MPU)に送信する。
【0158】
ステップ2305では、コード情報の抽出および角度の検出を行う。中央処理装置(MPU)は、画像処理アルゴリズムにより、読み取った画像情報からコード情報を抽出する。そして、キードットの位置から当該ドットパターンの角度を計算する。
【0159】
次に、ドットコードと角度が既にリンクされているか否かを判断する(2306)。台座の中央処理装置(MPU)は、既にリンクテーブルに、当該ドットコードかつ当該角度に他の音声ファイルトラックが関係付けられて登録されているか否かを判断する。既にリンクされている場合にはステップ2303からの処理を再度行い、リンクされていると判断しなかった場合には、ステップ2307に処理を移す。
【0160】
ステップ2307では、リンク処理を行う。中央処理装置(MPU)は、録音された音声ファイルトラック番号に対して、コード情報および角度を関連付けて登録する。
【0161】
次に、中央処理装置(MPU)は、タイマの値を読み取り、リンク開始802のシンボルがクリックされてから5秒経過したか否かを判断する。5秒未満である場合にはステップ2303からの処理を再度行い、5秒経過した場合には、本処理を終了する。
【0162】
なお、本処理においては、録音とリンクを連続して行ったが、既にメモリに登録されている音声情報とのリンクを生成することも可能である。
【0163】
<リンク済音声再生処理>
次に、図22、23の処理によりリンクした音声を再生する手順について、図24を用いて説明する。
【0164】
まず、スキャナの中央処理装置(MPU)は、ユーザにより、回転パラメータON804のシンボルがクリックされたか否かを判断する。クリックされたと判断した場合には回転パラメータをONとし(2402)、クリックされたと判断しなかった場合には、本処理を終了する。
【0165】
次に、フィギアが載置されたか否かを判断する(2403)。フィギアが載置されていると判断した場合には、センサが読み取ったドットパターンを中央処理装置(MPU)に送信する。そして、読み取った画像情報からコード情報を抽出し(2404)、キードットの位置から当該ドットパターンの角度を計算する(2405)。
【0166】
次に、音声再生処理を行う(2406)。中央処理装置(MPU)は、メモリ内のリンクテーブルを検索し、コード情報と角度の両方に対応する音声ファイルトラックを索出して、メモリ内の該当する音声ファイルトラックを読み出す。この音声ファイルトラック702の音声情報は、圧縮回路で逆圧縮(展開)され、A/Dコンバータでアナログ音声情報に変換されて、アンプ(AMP)を介してスピーカから出力される。
【0167】
<角度検出方法>
前述のように、図25は、ドットパターン1の角度を説明したものであり、前述のキードット2の位置を検出することによって、平面方向でのドットパターン1の傾きの角度(向き)を検出することができるようになっている。図26の音声決定テーブルは、キャラクタコード、角度、角度No.、ボイスアドレスから構成されている。センサによりドットパターン1が読み取られると、このドットパターン1に記録されたキャラクタコードがまず決定される。次に、キードット2を基準としてドットパターン1の角度が計算されると、この角度より角度No.が決定される。そして、キャラクタコードおよび角度No.により、対応するボイスアドレスが決定される。ボイスアドレスと音声とは対応付けられており、たとえば、ボイスアドレスがaの場合は「こんにちは」、bの場合は「さようなら」との音声が出力される。
【0168】
なお、図26では、90度毎、すなわち4方向で角度No.を決定している。この場合、角度情報は2bitで表現される。しかし、本発明はこれに限らず、任意の方向数で角度No.を決定してよい。たとえば、8方向の場合は45度毎に角度No.を設け、角度情報は3bitで表現される。16方向の場合は22.5度毎に角度No.を設け、角度情報は4bitで表現される。
【0169】
図27は、センサの傾きと角度との関係を説明した図である。
【0170】
(a)に示す如く、ドットパターンの向きと、センサの向きとが成す角度をαとする。また、(b)に示す如く、センサの傾きとセンサの向きとが成す角度をβとする。この場合に、ドットの向きとセンサの傾きとが成す角度γが、フィギアを傾けた角度となる。すなわち、角度γは、γ=α+βとなる。
【0171】
<角度パラメータがOFFの場合>
次に、角度パラメータがOFFの場合に、ドットパターンにリンクされた音声を再生する手順について説明する。
【0172】
ユーザにより、角度パラメータOFF805のシンボルがクリックされると、角度パラメータがOFFとなる。次に、台座2001のセンサが、ステージ上に載置されたフィギア2003底面のドットパターンを読み取ると、中央処理装置(MPU)は当該ドットパターンを解析ソフトによって解析し、ドットコード(コード情報)に変換する。そして、当該ドットコードに基づいてメモリのリンクテーブルを検索し、このドットコードに対応する音声ファイルトラックを読み出す。ここで、当該ドットコードに、異なる角度で複数の音声がリンクされている場合は、最後に録音された音声が読み出される。
【0173】
<パーソナルコンピュータに接続して操作>
上述した実施形態では、指示ボード800を用いて操作を行ったが、本発明では、これに限られない。
【0174】
たとえば、図28に示す如く、台座2001を、コネクタを用いてパーソナルコンピュータ2801に接続する形態としてもよい。この場合ユーザは、キーボードおよびマウス(図示せず)を用いて録音、再生、リンク等の操作を行う。
【0175】
<台座にボタンを設けて操作>
また、図29に示すように、この台座2001自体をパーソナルコンピュータ2801のUSB端子に接続できるようにし、パーソナルコンピュータ側で音声の制御やアラーム時間の設定等を行うようにしてもよい。この場合、台座2001に設けた液晶表示部2005は不要としてもよい。
【0176】
また、図30に示すように、台座2001上にカードを載置し、カードに印刷されたドットパターンを読み取ることにより上記操作を行うようにしてもよい。
【0177】
<音声認識機能付ボイスレコーダ>
図31は、スキャナを一体化したボイスレコーダの、他の形態を示したものである。
【0178】
このボイスレコーダ3101は、図19で示した一体型ボイスレコーダの機能に加え、音声認識のための入力機能と液晶表示画面3110を有している。
【0179】
このボイスレコーダ3101は、録音ボタン3105が音声入力ボタンを兼用しており、音声入力機器として用いる場合には、当該録音ボタン3105を押しながらマイク3108に向かって発声することによって、この音声情報がボイスレコーダ3101内に入力される。
【0180】
そして、この発声情報は、ボイスレコーダ内の図示しないA/Dコンバータによってデジタル変換された後に、音声認識回路によって解析されて、発声情報に対応するテキスト情報に変換される。
【0181】
たとえば、あらかじめ出張等のスケジュール情報が登録されている場合には、ユーザは録音ボタン3105を押しながら「スケジュール」または「予定」と発声すると、これが音声認識回路によって解析されて、それぞれ「スケジュール」または「予定」というテキストデータに変換され、これらのテキストデータを検索キーとしてメモリに構築されたデータベースが検索されて、「○○出張」というテキスト情報が抽出され、これが音声情報に変換されてスピーカ3102より「○○出張」と発声される。
【0182】
なお、データベースには「○○出張」という音声情報自体がメモリに記憶されており、これにテキストで日付情報(たとえば「4月28日」)が関連付けられていてもよい。
【0183】
この場合、ボイスレコーダ3101に対して音声で「4月28日」と発声するだけで、この音声がテキストデータに変換されてデータベースを検索し、このテキストデータに対応する「○○出張」の音声情報をスピーカ3102から出力させてもよい。
【0184】
なお、上記の例では、入力された音声情報に基づいてボイスレコーダ内のデータベースを検索して索出したデータをスピーカ3102から発声させた場合で説明したが、当該ボイスレコーダを音声認識のための入力機器としてのみ使用してもよいし、録音機能を省略してスキャナ機能を備えた音声認識用端末として使ってもよい。また、パーソナルコンピュータには複数のボイスレコーダを接続して互いにボイスメールのやりとりをしてもよい。
【0185】
たとえば、ユーザが録音ボタン3105を押しながら発声した音声情報が入力されると、当該ボイスレコーダの中央処理装置(MPU)は、この音声情報を図示しない通信インターフェースを通じてアンテナ3109からパーソナルコンピュータに送信し、パーソナルコンピュータ内の音声認識プログラムによって当該音声情報を解析し、これをテキストデータに変換してパーソナルコンピュータ内に構築されたデータベースまたはネットワーク上のデータベースを検索し、検索結果をパーソナルコンピュータのディスプレイ装置に出力してもよい。
【0186】
また、検索結果データを通信機能を用いてボイスレコーダに返信させてボイスレコーダのスピーカ3102から音声情報として発声させてもよい。
【0187】
図32は、この音声認識精度を高めるため、および入力した音声情報の分類のためのペーパーコントローラ3200の構成を示したものである。
【0188】
同図に示すように、このペーパーコントローラ3200には、「氏名入力」(3208)、「郵便番号入力」(3209)、「住所入力」(3210)、「電話番号入力」(3211)、「メールアドレス入力」(3214)等の入力音声カテゴリがそれぞれ領域として印刷されており、これらの領域にはそれぞれ異なるコードがドットパターンとして印刷されている。また同じく入力機能として、「上へ」、「決定」、「下へ」の領域が印刷されており、ディスプレイ画面上に表示された候補またはメニューを選択できるようになっている。
【0189】
すなわち、本ボイスレコーダ3101の録音ボタン3105を押して音声入力を行う際に、前もってカテゴリコード(ドットパターン)をセンサユニット3103でスキャンすることによって、音声認識精度を高めるとともに、入力した音声情報を分類するものである。
【0190】
たとえば、「上野」と発声した場合、それが地名の上野なのか人名の上野なのかを把握することは難しいが、「住所入力」がスキャンされた後に「上野」という発声が音声情報として入力された場合、住所入力のカテゴリコードとともに「上野」の音声情報がパーソナルコンピュータに送信される。
【0191】
パーソナルコンピュータの中央処理装置(MPU)は、住所入力のカテゴリコードが付加されていることによって、当該「上野」の音声情報が「住所」のカテゴリであることが容易に判別できるため、ただちに上野近辺の地図情報をパーソナルコンピュータのディスプレイ画面に表示することができる。
【0192】
なお、ボイスレコーダの通信先はこのようなパーソナルコンピュータに限定されず、カーナビゲーション装置、情報家電、制御機器、ロボット等いかなるものであってもよい。つまり、本ボイスレコーダを音声認識機能の入力装置として用いることによって、あらゆる情報機器、情報家電の制御が可能となる。
【0193】
次に、本実施形態の一例として、図32に示す指示ボート(ペーパーコントローラ)3200を用いて音声認識を行う場合について説明する。
【0194】
指示ボード3200は、通信販売のカタログから商品を注文する場合等に使用される。通信販売のカタログ(図示せず)には、商品の写真上にドットパターンが重畳印刷されており、ユーザがボイスレコーダ3101のセンサユニット3103で商品の写真をクリック(センサユニットで当該写真部分のドットパターンを撮像)すると、パーソナルコンピュータ(図示せず)のディスプレイ画面上に、当該ドットパターンの意味するコードに対応した商品説明の画面が表示される。また、カタログの商品番号を印刷した部分にもドットパターンが重畳印刷されており、商品番号の印刷面をクリックすると、パーソナルコンピュータのディスプレイ画面上に注文商品情報が表示され、クリックした商品が注文リストに登録される。次に、確認3201をクリックすると、画面上に注文リストが表示される。注文リストに登録された商品を選択する場合には上へ3202および下へ3203の各シンボルをクリックし、注文数を変更する場合には、注文数を増加3204または注文数を減らす3205の各シンボルをクリックする。登録した商品の注文リストを取り消す場合には全取消3206をクリックし、注文する商品および個数が決定した場合には、ご注文3207をクリックする。また、最後に閲覧した商品カタログ画面に戻るには戻る3212をクリックし、注文プログラムを終了する場合には、終了3213をクリックする。これらの操作を行う場合には、ユーザは、スキャンボタン3104を押下しながら、所望の商品写真およびシンボルをクリックする。
【0195】
ユーザは、注文する商品が決定した後で、氏名、住所等の入力を行う。ユーザが、スキャンボタン3104を押下しながら氏名入力3208をクリックすると、スキャナ3101に内蔵された中央処理装置(MPU)で当該ドットパターンを解析し、ドットコード(コード情報)に変換する。このドットコードがコンピュータの中央処理装置(MPU)に送信されると、当該ドットコードに基づいて、音声認識モードをONにする。
【0196】
次にユーザは、録音ボタン3105を押下しながら、マイク3108に向かって氏名を発声する。すると、中央処理装置(MPU)は、マイクに向かって発声された音声をA/Dコンバータ(図示せず)によりデジタル変換し、圧縮回路によって圧縮および/または変換する。このような圧縮データを、アンテナ3109を通してコンピュータに送信する。コンピュータの中央処理装置(MPU)は、当該音声データを音声解析ソフトによって解析し、文字情報に変換し、当該文字情報を画面上に表示する。同様の操作により、郵便番号、住所、電話番号も、音声入力機能により入力される。
【0197】
このような音声入力機能を有することにより、ユーザは、キーボードやスキャナを用いた煩雑な操作を行うことなく、簡易な操作で住所等の情報を入力することが可能となる。
【0198】
なお、本実施形態においては、前述した如く、スキャンボタン3104が押下された状態でドットパターンがクリックされたときのみ、ドットパターンが読み取られる。センサユニット3103内には、LED、CMOSセンサ等が内蔵されているが、これらは、電力を消費する。さらに、当該ボイスレコーダ3101はワイヤレスであるため、通信機能を常に維持しておくためのアイドリング電力が必要なため、電池(充電器も含む)を使用しており、この電力の消費を抑制する必要がある。
【0199】
そこで、電力の消費を最小限とするために、スキャンボタン3104が押下された場合にのみ、センサユニット3103に通電が行われ、機能するようにした。
【0200】
また、音声認識機能においても、録音ボタン3105が押下されている間のみ、音声の入力が行われる。常時音声入力が行われる状態であると、マイク3108は、ユーザが入力しようとしていない音声も認識してしまい、ユーザの意図しない情報が入力されてしまう可能性がある。ユーザが所望する情報のみを入力することが可能となるように、音声入力ボタン3105が押下されている間のみ、音声の入力が行われるようにした。
【0201】
なお、図31に示したボイスレコーダ3101では、アンテナ3109を設けてワイヤレス通信方式でパーソナルコンピュータと通信を行うようにし、これで音声情報とドットパターンを読み取ったコード情報とをパーソナルコンピュータ側に送信するようにしたが、音声情報のみ、またはコード情報のみをパーソナルコンピュータに送信するようにしてもよい。
【0202】
<ボイスメールシステム>
図33から図39は、本発明におけるボイスレコーダを用いたボイスメールシステムについて説明するものである。
【0203】
図33は、本実施形態におけるネットワーク構成図である。本発明のボイスメールシステムにおいては、パーソナルコンピュータがインターネット等のネットワークを介して他のパーソナルコンピュータと接続されており、データの送受信が可能となっている。そしてこれらのパーソナルコンピュータは、ブルートゥース等の近距離無線通信システムによって、ボイスレコーダとの通信が可能となっている。なお、ボイスレコーダとパーソナルコンピュータとの通信はこのようなブルートゥースに限らず、赤外線通信、無線LAN、USBケーブルによる有線接続等いかなるものであってもよい。
【0204】
図34は、ユーザがボイスメールの登録、送受信等を行うときに用いるペーパーコントローラ3400について説明した図である。
【0205】
ペーパーコントローラ3400の左部には、音声の録音、再生、リンクを行うためのシンボルが印刷され、右側には、ボイスメールの送受信等を行うためのシンボルが印刷されている。
【0206】
図35は、ボイスメールデータベースについて説明した図である。
【0207】
同図は、ボイスレコーダ同士がブルートゥースインターフェース(I/F)を介して、ボイスメール制御部と通信を行いながらボイスレコーダで入力されたボイスメール、すなわち音声データを送受信するシステムである。
【0208】
ボイスメール制御部は、ネットワーク接続可能な汎用のサーバまたはパーソナルコンピュータで構成されており、このサーバまたはパーソナルコンピュータに接続されたハードディスク装置にボイスデータ格納部が設けられている。
【0209】
ボイスデータ格納部には、受信用インデックステーブルと、送信用インデックステーブルが設けられている。ここで受信用インデックステーブルには、受信ID(発信元のアドレスまたは受信側ボイスレコーダのID番号)とデータ格納アドレスとが関係付けられて登録されている。また、送信用インデックステーブルには送信ID(送信先のアドレスまたは送信先ボイスレコーダのID番号)とデータ格納アドレスとが関係付けられて登録されている。
【0210】
すなわち、ボイスメール制御部は、そのボイスメール制御部が管理すべきボイスレコーダのIDを受信用インデックステーブルに登録しておき、当該ボイスレコーダに定義付けられた受信IDを宛先とするボイスメールを自身のボイスデータ格納部の受信用インデックステーブルに登録するようになっている。
【0211】
一方、ボイスメール制御部が管理するボイスレコーダよりボイスメールが入力されたときには、送信用インデックステーブルに送信ID(送信先のアドレスや送信先のボイスレコーダのID)を一旦登録しておく。その後、ボイスメール制御部は、定期的に送信用インデックステーブルにアクセスして、ここに未送信のボイスメールがある場合には、ネットワークインターフェース(NW I/F)およびネットワークを介してボイスメールデータを送信IDを管理する図示しないボイスメール制御部に対して送信する。
【0212】
図36は、ボイスレコーダとパーソナルコンピュータ(ボイスメール制御部)間でのデータの送受信について説明するフローチャートである。
【0213】
まず、通信可能エリアにボイスレコーダがあるかどうかを判断する(3601)。ボイスレコーダが、パーソナルコンピュータの近傍に配置されると、ブルートゥース等の近距離無線通信システムにより、ボイスレコーダIDがパーソナルコンピュータに送信される。このボイスレコーダIDが送信された場合には、通信可能エリアにボイスレコーダがあると判断する。
【0214】
次に、ボイスレコーダIDが読み込まれたか否かを判断する(3602)。パーソナルコンピュータは、ブルートゥースI/Fを介してボイスレコーダIDを読み込む。
【0215】
次に、受信インデックステーブルに一致するIDがあるか否かを判断する(3603)。制御部は、ボイスデータデータベース内の受信インデックステーブルに、読み込んだボイスレコーダIDに一致するIDが存在するかどうかを判断する。受信IDが存在すると判断した場合には、受信IDに対応するデータ格納アドレスにアクセスし、受信データを読み出す(3604)。そして、読み出した受信データを、ブルートゥースI/Fを介してボイスレコーダに転送し(3605)、本処理を終了する。
【0216】
一方、受信インデックステーブルに一致するIDがなかった場合には、ボイスレコーダ内に送信データがあるか否かを判断する(3606)。送信データがある場合には、送信データ、すなわち、送信先のアドレスとボイスデータを読み込み、データベース内の送信データインデックステーブルに登録する(3607)。登録が完了したら、本処理を終了する。
【0217】
図37は、ユーザ同士でボイスメールの送受信を行う具体例を示したものである。同図は図38にも示したように、ネットワーク上にボイスメール管理サーバが接続されて、ボイスメールを一元的に管理するシステムとなっている。
【0218】
ユーザAが、屋外でボイスレコーダのマイクに向かって入力したい音声を発すると、ボイスレコーダのマイクを介してそのメモリ内に、ボイスデータがデジタルデータとして蓄積される。
【0219】
次にユーザAは、ボイスメールの送信先を決定する。すなわち、ペーパーコントローラを用いて、送信先のアドレスを入力する。入力したアドレスは、ボイスレコーダのメモリ内に登録される。
【0220】
ユーザAは、自宅や職場等の屋内に入り、ボイスメールの送信処理を行うときには、まずユーザは、ボイスメールをパーソナルコンピュータの近傍に配置する。すると、ブルートゥース通信機能により、パーソナルコンピュータは、ボイスレコーダ毎に定義された装置ID、すなわちボイスレコーダIDの読み込みを行う。次に、メモリに蓄積されたボイスデータ及びメールアドレスが、パーソナルコンピュータに送信される。
【0221】
パーソナルコンピュータ(ボイスメール制御部)は、ボイスデータ及びメールアドレスを受信すると、モニタ(ディスプレイ装置)に「ボイスメール受信中」の表示を行う。そして、ボイスメール管理サーバに対して前記ボイスデータ及びメールアドレスを送信する。
【0222】
ボイスメール管理サーバは、受信したボイスデータ及びアドレスを、サーバ内のデータベースに登録する。そして、ネットワークI/Fを介して、ボイスデータを該当するメールアドレス宛てに送信する。ボイスメールを受信したパーソナルコンピュータは、モニタ(ディスプレイ装置)に「ボイスメール取得・送信」の表示を行う。そして、ブルートゥースI/Fを通じて、ボイスデータをユーザBのボイスレコーダに送信する。ボイスレコーダは、ボイスデータを受信すると、「ボイスメールが届いています」と、音声および/またはボイスレコーダのモニタで、ユーザBに通知する。これによりユーザBは、ユーザAが送信したメッセージを受信する。
【0223】
図38は、パーソナルコンピュータ(PC)にインストールされた制御プログラム(ボイスメールマネージャ)によって、ボイスメール管理サーバと連動しつつボイスレコーダを使用する場合の例を示したものである。
【0224】
ユーザはCD−ROM、もしくはインターネットの配信サーバにアクセスしてダウンロードしたインストールプログラムをパーソナルコンピュータ(PC)上で実行し、OS(オペレーティングシステム)上にボイスメールマネージャを常駐プログラムとして登録する。
【0225】
次に、ボイスレコーダが、パーソナルコンピュータ(PC)の近傍に配置されると、ブルートゥース等の近距離無線通信システムにより、パーソナルコンピュータ(PC)にボイスレコーダIDが送信される。パーソナルコンピュータ(PC)内の中央処理装置(CPU)は、ボイスメール管理サーバにおいて、ボイスレコーダIDの認証を行う。すなわち、送信されたボイスレコーダIDが、当該パーソナルコンピュータ(PC)を用いてデータの送受信をすることが可能なボイスレコーダのIDであるかどうかの認証を行う。
【0226】
ここで、送受信可能なボイスレコーダである場合には、パーソナルコンピュータ(PC)内のボイスメール管理テーブル(ドットコード管理テーブル)を参照し、当該ボイスレコーダID宛てに送信されたボイスメールが格納されているかどうかを確認する。
【0227】
ボイスメールが格納されている場合には、中央処理装置(CPU)は、そのボイスメールを読み出し、ブルートゥース等の近距離無線通信システムにより、ボイスレコーダに送信する。
【0228】
次に、パーソナルコンピュータから受信した(ダウンロードした)ボイスデータを当該ボイスレコーダで再生することによって、受信者はボイスメールを聞くことができるようになっている。
【0229】
ボイスメール管理テーブル(ドットコード管理テーブル)にボイスメールが格納されていない場合には、インターネット上のボイスメール管理サーバを参照する。ここで、ボイスメール管理サーバのボイスメール管理テーブルに、当該ボイスレコーダID宛てに送信されたボイスメールが格納されていれば、そのボイスメールを読み出し、パーソナルコンピュータ(PC)内にダウンロードする。
【0230】
ボイスレコーダを管理しているパーソナルコンピュータ毎に必要なボイスメールがパーソナルコンピュータ(PC)内にダウンロードされたときには、そのボイスメールとともに、そのボイスメールを起動するためのボイスメール管理テーブルの追加データ(ボイスデータ格納アドレス、ドットコード)もダウンロードされ、以後はパーソナルコンピュータ内のボイスメール管理テーブルのみで管理されるようになっている。
【0231】
したがって、その後は前記と同一のボイスレコーダIDが送信された場合、再度インターネット上のボイスメール管理サーバにアクセスすることはなく、新たに追加されたデータを含むボイスメール管理テーブルに基づいて、パーソナルコンピュータのハードディスク装置(HD)内にダウンロードされたボイスメールを読み出すことになる。
【0232】
なお、ボイスレコーダを使用した送信処理を行う場合には、パーソナルコンピュータは、自身が管理するボイスレコーダが近傍に配置されたときは、当該ボイスレコーダとのブルートゥース通信を行い、ボイスレコーダのID(デバイスID)を読み込むとともに、当該ボイスレコーダのメモリから蓄積されたボイスメールを読み込む。このとき、ボイスレコーダでの録音時にドットパターンをスキャンしたときのドットコードをデバイスIDに関係付けて登録しておく。
【0233】
そして、バッチ処理により、定期的に当該パーソナルコンピュータはボイスメール管理サーバへのアクセスを行い、当該ボイスメール管理テーブルのデータをボイスメール管理サーバに送信する。ボイスメール管理サーバでは、当該データを受信すると、このデータに基づいて自身のボイスメール管理テーブルを更新する。
【0234】
<音声認識データ通信>
図40は、本発明の実施形態について説明したものである。本発明では、音声認識データ通信を行うことにより、種々の制御を行うことができる。図40は、その一例として、工場で制御を行う場合の具体例を示したものであり、図41は、制御の際に用いるペーパーコントローラを示したものである。
【0235】
このように、本願発明では、ドットパターンで入力を制御したボイスレコーダを用いて、工作ロボットや印刷機の制御が可能になる。例えば、印刷機を制御する場合には、図41のペーパーコントローラの「印刷機」「音声命令入力」のアイコンをクリックしてから、「倍速で動け」「印刷開始」等の指示を音声で入力する。また、監視カメラを制御する場合には、「監視カメラ」「音声命令入力」をクリックしてから、「ライト明るくしろ」
「広角にしろ」等の指示を音声で入力する。
【0236】
なお、本発明は、本実施形態で説明した態様の他に、たとえば取材用のボイスレコーダの制御技術としても応用可能である。たとえば、インタビューアがインタビューするときのボイスレコーダとして使い、音声認識の制御を図34で示したペーパーコントローラにより行ってもよい。
【0237】
また、図37および図38で説明したボイスレコーダはネットワークを介してボイスデータを送受信する機能を有しているため、当該ボイスレコーダをたとえばIP電話のマイクとスピーカを備えた端末として使うこともできる。この場合、ボイスレコーダが常にパーソナルコンピュータの近傍に配置されている場合には、通常のIP電話端末として使用可能であるため、音声データを蓄積しておく内蔵メモリは不要となるが、このようなメモリを装備しておくことにより、パーソナルコンピュータとの通信ができない隔離された場所にいるときでもボイスメールを当該ボイスレコーダに登録しておくことができる。この場合、パーソナルコンピュータの近傍にボイスレコーダが配置されたときに、ブルートゥース通信によりパーソナルコンピュータにインストールされたボイスメールマネージャ等により自動的にボイスメールが送信されたり、受信されたりすることも可能になる。
【0238】
図39はこのような用途に用いるペーパーコントローラを示しており、パーソナルコンピュータで受信された自分宛のボイスメールを再生したり、ダウンロードすることができる。
【0239】
また、パーソナルコンピュータに対してボイスメールを作成・登録したり、アップロードすることができる。
【0240】
また、パーソナルコンピュータ内のボイスメールとボイスレコーダのメモリの内容をシンクロナイズするモード(PCとシンクロ)のドットパターンが登録された領域も用意されている。
【産業上の利用可能性】
【0241】
本発明は、絵本、写真、カード、シール等の媒体と音声情報の再生との関係付けに関するもので、音声録音機、音声再生装置、音声認識のための入力機器として利用することができる。
【符号の説明】
【0242】
1 基準ドット
2 第一の仮想基準線
3 第二の仮想基準線
4 仮想基準点
5 情報ドット
101、1901、3101 ボイスレコーダ
102、1902、3102 スピーカ
103 録音・停止ボタン
104 録音・再生表示部
105 リンク表示部
106 メモリカード
107 マイク
108 電源スイッチ
109 ボリューム
110 コネクタ端子
111 音声出力端子
112 外部電源端子
113 スキャナ(光学読取手段)
114 ケーブル
115 USBコネクタ
116 写真
600 指示ボード
701 インデックス
702 音声ファイルトラック

【特許請求の範囲】
【請求項1】
音声情報を入力する音声情報入力手段と、
入力された音声情報を記憶する記憶手段と、
あらかじめ印刷された、所定の規則にしたがって線状に連続して複数の基準ドットを配置する工程と、該複数の基準ドットを結ぶ、直線、折れ線および/または曲線からなる第一の仮想基準線を設ける工程と、該基準ドットおよび/または該第一の仮想基準線から所定の位置に定義される、直線および/または曲線からなる少なくとも1以上の第二の仮想基準線を設ける工程と、該第二の仮想基準線上の所定の位置に複数の仮想基準点を設ける工程と、該仮想基準点を始点としてベクトルにより表現した終点に、該仮想基準点からの距離と方向とでXY座標値および/またはコード値が定義される情報ドットを配置する工程に従って配列したストリームドットパターンを1ラインまたは複数並べて形成したドットパターンを読み取る光学読取手段と、
光学読取手段で読み取られたドットパターンをコード情報・座標情報に変換する変換手段と、
前記変換手段によって変換されたコード情報・座標情報を前記音声情報と関係付ける関係付け指示手段と、
関係付け指示手段によって関係付けられたコード情報・座標情報と前記音声情報との関係付けを登録するリンクテーブルと、
前記光学読取手段で再度ドットパターンを読み取った後に、前記リンクテーブルで関係付けられた前記音声情報を前記記憶手段から読み出して出力する音声情報再生手段とからなる音声情報記録装置。
【請求項2】
前記ストリームドットパターンは、前記第二の仮想基準線を定義するために、および/または前記ドットパターンの方向と1つのXY座標値および/またはコード値を定義するために、基準となる基準ドットを所定の位置に設けた、請求項1記載の音声情報記録装置。
【請求項3】
前記リンクテーブルは、1つの音声情報に対して、複数のコード情報・座標情報を関係付けることを特徴とする請求項1記載の音声情報記録装置。
【請求項4】
前記音声情報を記憶する記憶手段は、カード記憶媒体であることを特徴とする請求項1記載の音声情報記録装置。
【請求項5】
少なくとも、前記音声情報の入力開始と、音声情報の入力終了と、音声情報の再生と、
再生の停止とを指示するために、前記光学読取手段で読取可能なドットパターンが印刷された印刷媒体を装置本体とは別体に有する請求項1記載の音声情報記録装置。
【請求項6】
前記コード情報・座標情報と前記音声情報との関係付け、または関係付けの解除を指示する前記関係付け指示手段として、前記光学読取手段で読取可能なドットパターンが印刷された印刷媒体を装置本体とは別体に有する請求項3記載の音声情報記録装置。
【請求項7】
前記ドットパターンは前記媒体面と前記光学読取手段との位置関係によって向きを有するドットパターンであって、
前記光学読取手段で撮影したドットパターンが画素群として格納される画像記憶領域において、そこに格納された画素群に基づくXY座標のX正方向またはY正方向と、ドットパターンの向きとが成す角度とを計算する手段を備え、
前記コード情報・座標情報に加えて角度情報毎に異なる前記音声情報を記憶・再生可能にする手段を有する請求項1〜5記載の音声情報記録装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate


【公開番号】特開2012−22424(P2012−22424A)
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願番号】特願2010−158471(P2010−158471)
【出願日】平成22年7月13日(2010.7.13)
【出願人】(503349741)
【Fターム(参考)】