説明

自動取引装置、音声読み上げ方法及び音声読み上げプログラム

【課題】不正確な読み上げの発生を抑制する。
【解決手段】自動取引装置1では、漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。これにより、読み上げ対象の対象文字列の、不自然な発音で不正確な読み上げの発生が低減する。

【発明の詳細な説明】
【技術分野】
【0001】
自動取引装置、音声読み上げ方法及び音声読み上げプログラムに関する。
【背景技術】
【0002】
銀行等の金融機関では、全国銀行協会から全国の金融機関に関する所定のフォーマットが提供されている。当該フォーマットは、例えば、金融機関及び当該金融機関の各支店のコードと、漢字並びに当該漢字の振り仮名で表された名称と、さらに、標準通信プロトコル等を含んでいる。金融機関では、例えば、自動取引装置(ATM(Automated Teller Machine))における通帳の印字には、このフォーマットに含まれる金融機関・支店の漢字並びに当該漢字に対応する振り仮名が用いられている。
【0003】
また、金融機関等に設置されるATMは、視覚障害がある利用者でも操作できるように、音声による操作等の案内を行う機能を備えている(例えば、特許文献1参照)。
この場合でも、案内中に発せされる金融機関及び支店の名称等は、既述のフォーマットが含む金融機関及び支店の名称等の漢字並びに当該漢字に対応する振り仮名から音声合成された音声情報に基づいて読み上げられる。
【0004】
なお、当該フォーマットの振り仮名は、50音の大書きの文字、即ち、清音、清音に対する濁音及び清音に対する半濁音のみにより構成されている。つまり、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平1−163894号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上記のように音声合成した音声情報を利用する場合には次のような問題点があった。
金融機関及び支店の漢字で表された名称を利用する場合には、漢字を一旦振り仮名に変換する処理が行われる。しかし、このような処理では、必ずしも当該漢字に対応する正しい振り仮名に変換されるとは限らない(例えば、「国立」の「クニタチ」に対して「コクリツ」)ため、この場合は金融機関及び支店の名称等が正確に読み上げられないという問題点があった。
【0007】
また、このような問題に対して、金融機関及び支店の名称を表す漢字に対応する振り仮名から音声合成する方法が考えられる。しかし、当該フォーマットの振り仮名は全て大書きの文字で構成されているために、振り仮名によっては、音声合成された音声情報から正確に読み上げられない(例えば、「東京」の「トウキョウ」に対して「トウキヨウ」)という問題点があった。
【0008】
本発明はこのような点に鑑みてなされたものであり、不正確な読み上げの発生を抑制した自動取引装置、音声読み上げ方法及び音声読み上げプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、音声案内を行う自動取引装置において、漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段と、変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段と、を有する自動取引装置が提供される。
【0010】
また、上記目的を達成するために、上記の自動取引装置と同様の音声読み上げ方法及び音声読み上げプログラムが提供される。
【発明の効果】
【0011】
このような自動取引装置、音声読み上げ方法及び音声読み上げプログラムにより、不正確な読み上げの発生が抑制される。
【図面の簡単な説明】
【0012】
【図1】第1の実施の形態に係る自動取引装置の概念図である。
【図2】第2の実施の形態に係るATMの外観例を示す図である。
【図3】第2の実施の形態に係るATMのハードウェア構成例を示す図である。
【図4】第2の実施の形態に係るATMが備える機能を表すブロック図である。
【図5】第2の実施の形態に係るATMが備える金融機関情報の例を示す図である。
【図6】第2の実施の形態に係るATMが備える音声案内情報を示す図である。
【図7】第2の実施の形態に係るATMの音声読み上げ処理手順を示すフローチャートである。
【図8】第2の実施の形態に係るATMの文字列比較処理手順を示すフローチャートである。
【図9】第2の実施の形態に係る文字列の比較を模式的に説明するための図(その1)である。
【図10】第2の実施の形態に係る文字列の比較を模式的に説明するための図(その2)である。
【発明を実施するための形態】
【0013】
以下、図面を参照にして実施の形態について説明する。
[第1の実施の形態]
図1は、第1の実施の形態に係る自動取引装置の概念図である。
【0014】
自動取引装置1は、音声を読み上げる際に不正確な読み上げの発生を抑制できるものである。
このような自動取引装置1は、辞書情報格納手段2、文字列情報格納手段3及び波形情報格納手段4を備える。さらに、変換手段5、比較判定手段6、生成手段7及び音声出力手段8を備える。なお、変換手段5、比較判定手段6、生成手段7及び音声出力手段8は、自動取引装置1が備える図示しないCPU(Central Processing Unit:中央演算処理装置)によって音声読み上げプログラムが実行されることにより、その処理機能が実現される。
【0015】
辞書情報格納手段2は、音声合成処理の対象となる語彙のテキスト情報の構文解析を行う際に参照する辞書を格納しており、予め語彙ごとに、その表記、仮名読み、アクセント情報、品詞情報の詳細な情報を対応付けて登録したものである。
【0016】
文字列情報格納手段3は、漢字を含む対象文字列に予め設定された振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列の情報を予め格納している。文字列情報格納手段3は、例えば、全国銀行協会の金融機関に関するフォーマットの読み上げ対象である金融機関及び支店の漢字を含む名称(対象文字列)と、当該名称に対応する振り仮名を表す仮名文字列とを保持する。なお、既述の通り、当該フォーマットの振り仮名は、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表されている。したがって、当該フォーマットでは、例えば、支店名の「あざみ野(対象文字列)」に対して「アザミノ(仮名文字列)」、支店名の「虎ノ門(対象文字列)」に対して「トラノモン(仮名文字列)」、支店名の「京都(対象文字列)」に対して「キヨウト(仮名文字列)」等と表現される。
【0017】
波形情報格納手段4は、表音文字列及び仮名文字列にそれぞれ含まれる仮名文字に対応する音声波形の情報を格納している。なお、表音文字列は、例えば、仮名文字と、当該仮名文字の読み及びアクセントを表記する発音記号である特殊文字(コロン、カンマ、引用符、パーセント記号等)とで構成されている。
【0018】
変換手段5は、漢字を含む対象文字列を当該対象文字列の表音を表す表音文字列に変換する。
比較判定手段6は、変換手段5が変換した表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき対象文字列を読み上げるためにいずれかの文字列を選択する。
【0019】
生成手段7は、比較判定手段6が選択した文字列を波形情報格納手段4に基づいて、対象文字列の音声情報を生成する。
音声出力手段8は、生成手段7で生成された音声情報に基づいて、対象文字列を読み上げる。
【0020】
このような構成を有する自動取引装置1の音声読み上げ方法について説明する。
まず、変換手段5は、読み上げ対象の、漢字を含む対象文字列について、辞書情報格納手段2に基づき、当該対象文字列の表音を表す表音文字列に変換する。
【0021】
比較判定手段6は、変換された表音文字列と、文字列情報格納手段3に格納されている読み上げ対象の対象文字列の振り仮名を表す仮名文字列とを比較する。比較の際には、表音文字列と仮名文字列とを先頭から末尾まで仮名文字のみを1文字ずつ一致の条件に基づき比較する。一致の条件の具体例としては、例えば、比較対象の表音文字列が含む仮名文字が、仮名文字列の小書きの文字に対応する大書きの文字である場合、また、表音文字列の長音と、仮名文字列の「オ」または「ウ」とが比較対象である場合にはそれぞれ一致するようにする。
【0022】
比較判定手段6は、このような比較の結果に基づいて読み上げ対象の対象文字列を読み上げるために表音文字列または仮名文字列のいずれかを選択する。例えば、比較の結果、表音文字列と仮名文字列とが一致する場合には、対象文字列の音声読み上げに表音文字列を選択する。一方、一致しない場合には、仮名文字列を選択する。
【0023】
生成手段7は、波形情報格納手段4が格納する音声波形に基づいて、比較判定手段6で選択された文字列から読み上げ対象の対象文字列の音声情報を生成して、音声出力手段8が、当該音声情報に基づいて、読み上げた対象の対象文字列の読み上げを実行する。
【0024】
このように自動取引装置1では、漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。つまり、このように比較して、対象文字列の表音文字列と仮名文字列とが一致すると、表音文字列が対象文字列に予め設定された振り仮名に対応していることになり、また、表音文字列と仮名文字列とが一致しない場合には、表音文字列が対象文字列に予め設定された振り仮名に対応していないことになる。このため、表音文字列と仮名文字列とが一致する場合には表音文字列を選択し、一致しない場合には仮名文字列を選択して、対象文字列を正しく読み上げるようにした。これにより、読み上げ対象の対象文字列が不自然な発音で不正確に読み上げられることが抑制されるようになる。
【0025】
[第2の実施の形態]
第2の実施の形態では、第1の実施の形態についてより具体的に説明する。
図2は、第2の実施の形態に係るATMの外観例を示す図である。
【0026】
ATM10は、取引等に関する画面を表示する表示手段30a、前面にカード挿入/排出口40aを有するカード処理ユニット、通帳挿入/排出口50aを有する通帳処理ユニット、紙幣挿入/放出口60aを有する紙幣処理ユニット、及び硬貨投入/放出口70aを有する硬貨処理ユニットを有する。さらに、ATM10は、視覚障害がある利用者によって利用され、当該利用者に操作手順及び操作入力の指示を音声案内する受話器80を有する。
【0027】
次に、このような外観のATM10のハードウェア構成について説明する。
図3は、第2の実施の形態に係るATMのハードウェア構成例を示す図である。
ATM10は、ATM10で行われる振り込み、入金、送金、記帳等の金融取引に関する処理を実行する制御ユニット20、利用者からの操作入力を受け付けて、出力結果を表示する表示ユニット30を有する。さらに、ATM10には、図2で説明した、カード挿入/排出口40aを有するカード処理ユニット40、通帳挿入/排出口50aを有する通帳処理ユニット50、紙幣挿入/放出口60aを有する紙幣処理ユニット60、及び硬貨投入/放出口70aを有する硬貨処理ユニット70、さらに、視覚障害がある利用者によって利用される受話器80を有する。
【0028】
制御ユニット20は、CPU20a、RAM(Random Access Memory)20b、HDD(Hard Disk Drive)20c、グラフィックインタフェース20d、ホスト通信制御手段20e及び入出力インタフェース20fを備えており、これらの各手段はバス20gで相互に接続されている。
【0029】
CPU20aは、HDD20c等の記憶媒体に記憶された各種プログラムを実行することにより、このATM10全体を統括的に制御する。
RAM20bには、CPU20aに実行させるOS(Operating System)並びにプログラムの少なくとも一手段が一時的に格納される。また、RAM20bには、CPU20aによる処理に必要な各種データが格納される。
【0030】
HDD20cには、ATM10上のOS及びアプリケーションのプログラムが格納される。また、HDD20cには、CPU20aによる処理に必要な各種データが格納される。
【0031】
グラフィックインタフェース20dには、表示ユニット30が接続されている。グラフィックインタフェース20dは、CPU20aからの命令に従って、画像を表示ユニット30の表示手段30aに表示させる。また、グラフィックインタフェース20dは、表示ユニット30の入力検知手段30bで検知された操作入力に応じた情報を取得する。
【0032】
ホスト通信制御手段20eは、様々な場所に設置したATMの管理を行う管理センターのホストコンピュータ(図示を省略)と通信可能に例えばLAN(Local Area Network)で接続されており、ホストコンピュータと送受信信号の通信を行うことができる。
【0033】
入出力インタフェース20fには、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60、硬貨処理ユニット70及び受話器80が接続されている。入出力インタフェース20f、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60、硬貨処理ユニット70及び受話器80は、バス20gを介してCPU20aと相互に信号の送受信を行う。
【0034】
表示ユニット30は、表示手段30aと、入力検知手段30bとを備える、例えば、タッチパネルである。
表示手段30aは、ATM10の処理に応じ画面情報に基づいて画面を表示する、例えばLCD(Liquid Crystal Display:液晶ディスプレイ)である。
【0035】
入力検知手段30bは、表示手段30aが表示する画面に対する利用者のタッチを検知する。具体的には、利用者のタッチによる操作入力によって赤外線ビームが遮光された赤外線LED(Light Emitting Diode)とフォトトランジスタとから操作入力の位置情報を検出して、当該位置情報を制御ユニット20に送信する。なお、制御ユニット20のCPU20aにより、検知したタッチ位置に該当する画面に表示されている処理内容を識別して、当該処理を実行する。
【0036】
カード処理ユニット40は、カード挿入/排出口40aから挿入された利用者のカードの実行指示に応じて所定の処理の処理結果を記録する。また、カード処理ユニット40は、処理結果の記録が完了したカードを、カード挿入/排出口40aから排出して、利用者に返却する。
【0037】
通帳処理ユニット50は、通帳挿入/排出口50aから挿入された利用者の通帳を所定位置まで搬送し、利用者からの実行指示に応じて所定の処理の処理結果を記録する。また、通帳処理ユニット50は、処理結果の記録が完了した通帳を搬送して、通帳挿入/排出口50aから排出して、利用者に返却する。
【0038】
紙幣処理ユニット60及び硬貨処理ユニット70は、紙幣挿入/放出口60a及び硬貨投入/放出口70aから挿入された紙幣及び硬貨を受け入れて、紙幣及び硬貨をそれぞれ計数する。また、利用者の所定の実行指示に応じて、紙幣挿入/放出口60a及び硬貨投入/放出口70aから処理に応じた額の紙幣及び硬貨を放出することができる。
【0039】
受話器80は、音声案内が出力されるスピーカを備え、プッシュホン式のテンキーのボタンが配列されている。視覚障害がある利用者は、この受話器80を持ち上げて、受話器80のスピーカから聞こえる音声案内にガイドされてプッシュホンのボタンを操作してプッシュホンのボタンに応じた取引処理を実行させて、暗証番号、金額等の入力を行うことができる。
【0040】
このようなカード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60及び硬貨処理ユニット70は、利用者による表示ユニット30を介した操作入力に応じて、制御ユニット20のCPU20aによってそれぞれ制御される。また、受話器80に対する利用者のプッシュホンのボタン操作に応じて、制御ユニット20のCPU20aによって、所定の処理が実行され、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60及び硬貨処理ユニット70がそれぞれ制御される。
【0041】
次いで、このようなハードウェア構成であるATM10が備える制御機能について説明する。
図4は、第2の実施の形態に係るATMが備える機能を表すブロック図である。また、図5は第2の実施の形態に係るATMが備える金融機関情報の例を示す図、図6は第2の実施の形態に係るATMが備える音声案内情報を示す図である。特に図6は、音声案内の情報の例であって、この場合は、振り込みに関する情報の入力後、振り込み内容を確認するための発話情報を表している。
【0042】
ATM10は、視覚障害がある利用者に対して音声案内を行う際に、不正確な音声読み上げの発生を抑制して、操作に関する案内の読み上げを実行することができるものである。
【0043】
このようなATM10は、まず、金融機関情報格納手段21、出力文字列情報記憶手段22及び音声案内情報格納手段23を有する。
金融機関情報格納手段21は、全国銀行協会から提供されるフォーマットであって、金融機関に関する情報が格納されている。例えば、図5に示されるように、金融機関コード、金融機関コードに対応付けられた金融機関の振り仮名及び漢字で表示された名称の情報が格納されている。また、当該金融機関の支店についても同様に、支店コードと、振り仮名及び漢字で表された支店の名称との情報が格納されている。全国銀行協会から提供されるフォーマットの振り仮名は、既述の通り、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表される。具体的には、図5の場合では、金融機関「九州銀行」について、金融機関コード「0111」、金融機関名「キユシユウギンコウ(振り仮名)」・「九州銀行(漢字)」の情報が格納されている。支店名「国立支店」について、支店コード「0024」、支店名「クニタチシテン(振り仮名)」・「国立支店(漢字)」の情報が格納されている。
【0044】
出力文字列情報記憶手段22は、後述する比較判定手段27が比較結果から選択した読み上げ対象の金融機関及び支店の名称に対応する表音文字列または仮名文字列の情報を記憶する。また、後述する変換手段26cにより数字の読み方に対応する表音文字列と、依頼人及び受取人の氏名を表す仮名文字列との情報を記憶する。
【0045】
音声案内情報格納手段23は、ATM10から視覚障害のある利用者に対して音声案内される発話内容を表す発話情報を保持する。例えば、振り込み実行前に、振り込み内容を確認するために、図6に示されるように、発話情報が識別番号ごとに対応付けられて保持されている。具体的には、識別番号「011」には、発話情報「只今、処理中です。そのままお待ち下さい。」が保持されている。また、識別番号「003」には、発話情報「支店名は(b.支店名)」が保持されている。なお、「(b.支店名)」には、ATM10で音声合成された支店名が併合される。
【0046】
さらに、ATM10は、カード読取手段24、検索手段25、音声合成手段26、比較判定手段27、発話情報併合手段28、数字情報通知手段29、入力受付手段31、発話情報通知手段32及び音声出力制御手段33を備える。
【0047】
カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aに利用者が挿入した振り込みカードに記録されている情報を読み取る。振り込みカードとは、予め受取人及びその振込先銀行口座、依頼人の氏名及び電話番号等の振り込み情報が、例えば、磁気的に記録されているものである。なお、受取人及び依頼人の氏名は振り仮名を表す仮名文字列で記録されている。このような振り込みカードをカード処理ユニット40に挿入するだけで、記録されている振込先を指定して振り込み操作を行うことができ、振り込み操作を簡単にするものである。カード読取手段24は、このようにして読み取った受取人及び依頼人の氏名を表す仮名文字列を出力文字列情報記憶手段22に記憶させ、口座番号、電話番号等の数字に関する情報は数字情報通知手段29に通知し、その他の情報については検索手段25に通知する。
【0048】
検索手段25は、カード読取手段24で読み取った振り込みカードに記憶されている金融機関または支店のコードに対応する、読み上げ対象の金融機関または支店名の振り仮名及び漢字で表された名称を金融機関情報格納手段21から検索する。
【0049】
音声合成手段26は、読み上げ対象の金融機関または支店の振り仮名及び漢字で表された名称と、数字と、受取人及び依頼人の氏名とが所定箇所に併合された、音声案内情報格納手段23が保持する発話内容から音声情報を合成する。また、音声合成手段26は、このような機能を実現するために、さらに、辞書情報格納手段26a、波形情報格納手段26b、変換手段26c及び生成手段26dを有する。
【0050】
辞書情報格納手段26aは、音声合成処理の対象となる語彙及び数字のテキスト情報の構文解析を行う際に参照する辞書を格納しており、予め語彙及び数字ごとに、その表記、仮名読み、アクセント情報、品詞情報の詳細な情報を対応付けて登録したものである。
【0051】
波形情報格納手段26bは、既述の通り、表音文字列及び仮名文字列を構成する仮名文字に対応する音声波形の情報を格納している。なお、表音文字列は、例えば、仮名文字と、当該仮名文字の読み及びアクセントを表記する発音記号である特殊文字(コロン、カンマ、引用符、パーセント記号等)とで構成されている。
【0052】
変換手段26cは、辞書情報格納手段26aが格納する辞書情報に基づいて、金融機関または支店の漢字で表された名称と、電話番号、口座番号等の数字との表音を表す表音文字列にそれぞれ変換する。また、変換手段26cは、当該名称に対応する表音文字列は比較判定手段27に通知し、数字の表音文字列を出力文字列情報記憶手段22に記憶させる。なお、表音文字列の具体例については後述する。
【0053】
生成手段26dは、金融機関または支店の漢字で表された名称と、口座番号及び電話番号等の数字と、受取人及び依頼人の氏名とに対応する表音文字列または仮名文字列が、金融機関または支店の名称及び数字が入る箇所(例えば、図6の(a.銀行名)、(b.支店名)、(c.口座番号)、(e.受取人名)等)に併合された発話情報について、波形情報格納手段26bに格納されている波形情報に基づき、必要に応じて、金融機関または支店の名称と、数字と、受取人及び依頼人の氏名とそれぞれを含んだ発話情報の音声情報を生成する。
【0054】
そして、比較判定手段27は、音声合成手段26の変換手段26cで変換された表音文字列と、対象文字列の振り仮名を表す仮名文字列とを比較して、当該比較結果に基づいて、当該対象文字列を読み上げるために表音文字列または仮名文字列のいずれかを選択する。比較判定手段27は、選択した対象文字列に対応する表音文字列または仮名文字列を出力文字列情報記憶手段22に記憶させる。
【0055】
発話情報併合手段28は、出力文字列情報記憶手段22が記憶する金融機関または支店の名称に対応する表音文字列または仮名文字列を、音声案内情報格納手段23が保持する発話内容の金融機関または支店の名称が入る箇所に併合する。また、出力文字列情報記憶手段22が記憶する電話番号等の数字の振り仮名を表す表音文字列を音声案内情報格納手段23が保持する発話内容の電話番号等が入る箇所に併合する。さらに、出力文字列情報記憶手段22が記憶する受取人及び依頼人の氏名の振り仮名を表す仮名文字列を音声案内情報格納手段23が保持する発話内容の依頼人及び受取人が入る箇所に併合する。また、発話情報併合手段28は、ATM10で実行される取引処理の進行に応じて、出力文字列情報記憶手段22が記憶するこれらの情報を、音声案内情報格納手段23が格納する発話情報に併合して音声合成手段26の生成手段26dに通知する。例えば、ATM10が振り込み処理を実行する前に、振り込みカードから取得した振り込み情報及び振り込み金額を確認するために、これらの振り込み情報及び振り込み金額を併合した発話情報を音声合成手段26の生成手段26dに通知すること等を行う。
【0056】
数字情報通知手段29は、カード読取手段24が振り込みカードから読み取った電話番号、口座番号等と、入力受付手段31が受け付けた振り込み金額等とに対応する数字を音声合成手段26の変換手段26cに通知する。
【0057】
入力受付手段31は、受話器80のプッシュホンのボタンに対する操作入力を受け付ける。また、入力受付手段31は、受話器80のプッシュホンのボタンに対する操作入力による振り込み金額の情報を数字情報通知手段29に通知する。
【0058】
発話情報通知手段32は、入力受付手段31が受け付けたプッシュホンのボタンに対する操作入力に応じた発話情報を音声案内情報格納手段23から選択して、選択した発話情報を音声合成手段26の生成手段26dに通知する。また、発話情報通知手段32は、ATM10で実行される取引処理の進行に応じて、音声案内情報格納手段23から発話情報を選択して、選択した発話情報を音声合成手段26の生成手段26dに通知する。例えば、ATM10で振り込みカードの受け付け後に、利用者の暗証番号の入力を要求する場合には暗証番号の入力を促す発話情報が、また、取引を終了した場合には終了した旨を表す発話情報等が音声案内情報格納手段23から選択される。
【0059】
音声出力制御手段33は、音声合成手段26の生成手段26dから音声情報が通知されると、当該音声情報に基づいた音声の出力要求を受話器80に通知して、受話器80のスピーカから当該音声情報に基づいた音声を出力させる。
【0060】
このような構成を有するATM10で行われる金融機関及び支店の名称の音声読み上げ処理について説明する。
図7は、第2の実施の形態に係るATMの音声読み上げ処理手順を示すフローチャートである。なお、図7は、主として、金融機関及びその支店の名称に関する音声読み上げ処理を示す。
【0061】
まず、視覚障害がある利用者がATM10の受話器80を持ち上げると、当該利用者に所望の取引を選択させるために、受話器80の各取引の実行に対応するプッシュホンのボタンを押下するように受話器80のスピーカから音声案内が出力される。
【0062】
当該利用者は、例えば、受話器80の振り込み取引に対応するプッシュホンのボタンを押下すると、入力受付手段31が当該押下に応じた信号を受け付けて、発話情報通知手段32が当該信号に対応する、例えば、振り込みカードの挿入を促すような発話情報を音声案内情報格納手段23から選択する。音声合成手段26の生成手段26dが、波形情報格納手段26bに基づいて、振り込みカードの挿入を促すような発話情報から音声情報を生成する。音声出力制御手段33は、当該音声情報に基づいた音声の出力要求を受話器80に通知して、受話器80のスピーカから利用者に振り込みカードを挿入するような音声案内がされる。
【0063】
[ステップS11] 利用者はカード処理ユニット40のカード挿入/排出口40aに振り込みカードを挿入すると、カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aから利用者の振り込みカードに記録されている振込先の金融機関コード及び支店コードを読み取る。
【0064】
[ステップS12] 検索手段25は、ステップS11で読み取った金融機関コード及び支店コードに対応する、読み上げ対象の金融機関または支店の振り仮名及び漢字で表された名称を金融機関情報格納手段21から検索する。
【0065】
[ステップS13] 音声合成手段26の変換手段26cは、検索手段25が検索した金融機関または支店の漢字で表された名称を、辞書情報格納手段26aが格納する辞書情報に基づいて、当該名称の表音を表す表音文字列に変換する。
【0066】
[ステップS20] 比較判定手段27は、ステップS13で変換された表音文字列と、金融機関または支店の振り仮名で表される名称の振り仮名を表す仮名文字列との比較を行う。この比較の結果に基づき金融機関または支店の名称を読み上げるために、表音文字列または仮名文字列のいずれかが選択される。
【0067】
[ステップS14] 比較判定手段27はステップS20で選択した金融機関または支店の名称に対応する表音文字列または仮名文字列を出力文字列情報記憶手段22に記憶する。
【0068】
[ステップS15] 検索手段25は、音声合成手段26の変換手段26cで変換する必要がある他の金融機関または支店の名称の有無を判別する。
判別の結果、変換する名称があればステップS12に進められ、なければステップS16に進められる。
【0069】
[ステップS16] 発話情報併合手段28は、ステップS14で出力文字列情報記憶手段22に記憶された表音文字列または仮名文字列を、音声案内情報格納手段23が保持する処理内容に対応した発話内容に併合して、音声合成手段26に通知する。
【0070】
音声合成手段26の生成手段26dは、波形情報格納手段26bに格納されている波形情報に基づき、通知された金融機関または支店の漢字で表された名称の表音文字列または、金融機関または支店の振り仮名で表された名称の仮名文字列が所定の発話位置に併合された発話情報から音声情報を生成する。
【0071】
[ステップS17] 音声出力制御手段33は、音声合成手段26の生成手段26dから通知された音声情報と共に当該音声情報の出力要求を受話器80に通知して、受話器80から発話情報に基づいた音声案内を出力させる。
【0072】
このような読み上げ処理に基づいて受話器80のスピーカから出力される音声案内に促されて利用者が操作を行うことができる。
さらに、ステップS20で比較判定手段27が行う文字列比較の処理について説明する。
【0073】
なお、文字列比較処理では、表音文字列と仮名文字列との比較の際には、単に一致する場合に加えて、一致の条件を新たに設けている。まず、表音文字列の発音記号を表す特殊文字は比較の際には用いない。さらに、表音文字列の選択した文字が小書きであって、仮名文字列の選択した仮名文字に対応している場合、表音文字列の選択した文字が長音であって、仮名文字列が「オ」または「ウ」である場合はそれぞれ一致するものとする。このような条件により、表音文字列と仮名文字列との比較を行うものとする。
【0074】
図8は、第2の実施の形態に係るATMの文字列比較処理手順を示すフローチャートである。
[ステップS21] 比較判定手段27は、音声合成手段26の変換手段26cから通知された金融機関または支店の漢字で表された名称から変換された表音文字列と、金融機関情報格納手段21が格納する金融機関または支店の振り仮名で表された名称の仮名文字列との先頭の仮名文字(i=1)を選択する。
【0075】
[ステップS22] 比較判定手段27は、表音文字列で選択した文字が特殊文字であるか否かを判定する。
判定の結果、選択した文字が特殊文字である場合にはステップS27に進められ、特殊文字でない場合にステップS23に進められる。
【0076】
[ステップS23] 比較判定手段27は、表音文字列及び仮名文字列から選択した文字同士を比較する。
[ステップS24] ステップS23の比較の結果、選択した文字同士が一致する場合にはステップS27に進められ、一致しない場合にはステップS25に進められる。
【0077】
[ステップS25] ステップS23の比較の結果、表音文字列の選択した文字が小書きであって、仮名文字列の選択した仮名文字に対応している場合には一致したものとしてステップS27に進められて、対応していない場合にはステップS26に進められる。
【0078】
[ステップS26] ステップS23の比較の結果、表音文字列の選択した文字が長音であって、仮名文字列が「オ」または「ウ」である場合には一致したものとしてステップS27に進められて、仮名文字列が「オ」または「ウ」ではない場合には、ステップS29bに進められる。
【0079】
[ステップS27] 比較判定手段27は、選択した表音文字列と仮名文字列との文字が末尾の文字であるか否かを判定する。
判定の結果、末尾の文字であればステップS29aに進められ、末尾の文字ではなく比較する文字がまだあればステップS28に進められる。
【0080】
[ステップS28] 比較判定手段27は、選択している表音文字列及び仮名文字列の文字の末尾方向に隣接する文字(i=i+1)を新たに選択する。
[ステップS29a] 比較判定手段27は、表音文字列を選択する。
【0081】
[ステップS29b] 比較判定手段27は、仮名文字列を選択する。
次にこのようなATM10で行われる音声読み上げ処理及び文字列比較処理の具体例を説明する。なお、以下では、ATM10に対して振り込みカードで振り込み情報及び振り込み金額の入力後、振り込み取引を実行する前に振り込み内容を確認する場合を例に挙げて説明する。
【0082】
まず、視覚障害がある利用者はカード処理ユニット40のカード挿入/排出口40aに振り込みカードを挿入する。なお、振り込みカードには、例えば、振込先の口座番号と、当該口座番号に対応する金融機関である「九州銀行」の金融コード「0111」と、その支店である「国立支店」の支店コード「0024」と、受取人及び依頼人の氏名(振り仮名)と、依頼人の電話番号とが磁気的に記録されている。
【0083】
すると、カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aから利用者の振り込みカードに記録されている振込先の金融機関コード「0111」及び支店名コード「0024」を読み取る。また、依頼人及び受取人の氏名も読み取り、出力文字列情報記憶手段22に記憶させ、振込先の口座番号及び依頼人の電話番号を数字情報通知手段29に通知する(ステップS11)。
【0084】
検索手段25は、金融機関コード「0111」及び支店コード「0024」に対応する、金融機関及び支店の振り仮名及び漢字で表された名称(「キユシユウギンコウ」及び「九州銀行」、「クニタチシテン」及び「国立支店」)を図5の金融機関情報格納手段21から検索する(ステップS12)。
【0085】
次いで、音声合成手段26の変換手段26cは、まず、金融機関の名称である「九州銀行」を、辞書情報格納手段26aが格納する辞書情報に基づいて、表音文字列に変換する。また、音声合成手段26の変換手段26cは、同様に、振込先の口座番号、依頼人の電話番号も表音文字列に変換して、出力文字列情報記憶手段22に記憶させる(ステップS13)。
【0086】
比較判定手段27は、「九州銀行」について、金融機関情報格納手段21に格納されている仮名文字列(「キユシユウギンコウ」)と、変換された表音文字列とを比較する(ステップS20)。
【0087】
ここで、「九州銀行」の比較処理について具体的に説明する。
図9は、第2の実施の形態に係る文字列の比較を模式的に説明するための図である。なお、図9(A)は読み上げ対象の対象文字列に対応する表音文字列を表し、図9(B)は、当該対象文字列に対応する仮名文字列を表す。
【0088】
図9(A)に示される金融機関の漢字で表される名称(対象文字列)の「九州銀行」に対応する表音文字列である。図9(A)中の左から8文字目及び12文字目のアポストロフィ及びカンマは「ギンコー」の仮名読み、アクセントを表す発音記号の特殊文字である。
【0089】
まず、比較判定手段27は、「九州銀行」の表音文字列と仮名文字列との先頭の仮名文字「キ」を選択する(ステップS21)。
両者の仮名文字は「キ」であって、特殊文字ではなく、また一致しており、仮名文字の「キ」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S27)。
【0090】
次に、比較判定手段27は、表音文字列及び仮名文字列の「キ」の隣の仮名文字「ュ」と「ユ」とをそれぞれ選択する(ステップS28)。
選択した表音文字列の「ュ」は特殊文字ではなく、表音文字列「ュ」は、仮名文字列の「ユ」の小書きに対応し、表音文字列の「ュ」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S25,S27)。
【0091】
次に、比較判定手段27は、表音文字列の「ュ」及び仮名文字列「ユ」の隣の長音「ー」及び「ウ」を選択する(ステップS28)。
この場合も、選択した表音文字列の「ー」は長音であって特殊文字ではなく、表音文字列「ー」は、仮名文字列の「ウ」と一致しないものの、対応しており、表音文字列の「ー」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S25,S26,S27)。
【0092】
表音文字列の4文字目〜7文字目も同様に比較して一致して、次に、比較判定手段27は、表音文字列の「‘」を選択すると、これは特殊文字であるために、当該文字を飛ばして、次の「ン」を選択する(ステップS22,S27,S28)。
【0093】
そして、比較判定手段27は、表音文字列の末尾の「,」を選択すると、これは特殊文字であるために、当該文字を飛ばして、また、当該特殊文字は末尾文字であるために、表音文字列を選択する(ステップS22,S27,S29a)。
【0094】
比較判定手段27は、このようにして選択した金融機関名「九州銀行」の表音文字列を出力文字列情報記憶手段22に記憶する(ステップS14)。
検索手段25が「九州銀行」以外の読み上げ対象の「国立支店」を検索する。
【0095】
次いで、比較判定手段27は、図10に示すようにして、「国立支店」について、金融機関情報格納手段21に格納されている仮名文字列(「クニタチシテン」)と、変換された表音文字列とを比較する(ステップS20)。
【0096】
「国立支店」の比較処理について具体的に説明する。
図10は、第2の実施の形態に係る文字列の比較を模式的に説明するための図である。なお、図10(A)は読み上げ対象の対象文字列に対応する表音文字列を表し、図10(B)は、当該対象文字列に対応する仮名文字列を表す。
【0097】
まず、比較判定手段27は、「国立支店」の表音文字列と仮名文字列との先頭の仮名文字「コ」及び「ク」を選択する(ステップS21)。
比較判定手段27は、両者の仮名文字は「コ」及び「ク」であって、特殊文字ではないが、一致しておらず、表音文字列の「コ」は仮名文字列の「ク」の小書きに対応しておらず、表音文字列の「コ」は長音でもないことを判定して、支店名「国立支店」の仮名文字列を選択する(ステップS22〜S26,S29b)。
【0098】
比較判定手段27は、このようにして選択した支店名「国立支店」の仮名文字列を出力文字列情報記憶手段22に記憶する(ステップS14)。
なお、このように振り込みカードから振り込み情報の取得後、図示を省略するが、発話情報通知手段32が音声案内情報格納手段23から振り込み金額の入力を促す発話情報を選択して、生成手段26dにより当該発話情報から生成された音声情報に基づいて、利用者に受話器80のスピーカから振り込み金額の入力を案内する。
【0099】
利用者は受話器80のプッシュホンのボタンにより振り込み金額を入力すると、入力受付手段31が当該振り込み金額を受け付けて、数字情報通知手段29に当該振り込み金額を通知する。変換手段26cは、数字情報通知手段29から通知された振り込み金額について、既述の方法により、表音文字列に変換して、出力文字列情報記憶手段22に記憶させる。
【0100】
ATM10に対してこのような振り込み情報及び振り込み金額の入力が完了すると、発話情報併合手段28は、出力文字列情報記憶手段22に記憶された「九州銀行」の表音文字列及び「国立支店」の仮名文字列と、振込先の口座番号、依頼人の電話番号、振り込み金額からそれぞれ変換された表音文字列とを、音声案内情報格納手段23が保持する処理内容に対応した発話内容に併合して、音声合成手段26に通知する。
【0101】
音声合成手段26の生成手段26dは、波形情報格納手段26bに格納されている波形情報に基づき、金融機関及び支店の名称、依頼人の口座番号、受取人及び依頼人の氏名、依頼人の電話番号及び振り込み金額が併合された発話情報から音声情報を生成する(ステップS16)。
【0102】
音声出力制御手段33は、これらの音声情報と共に当該音声情報の出力要求を受話器80に通知して、金融機関及び支店の名称、依頼人の口座番号、受取人及び依頼人の氏名、依頼人の電話番号及び振り込み金額が併合された、図6に示される発話情報に基づいた音声案内を受話器80のスピーカから出力させる(ステップS17)。
【0103】
このようにATM10では、比較判定手段27が漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを一致の条件に基づいて比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。このように比較して、対象文字列の表音文字列と仮名文字列とが一致すると、表音文字列が対象文字列に予め設定された振り仮名に対応していることになり、また、表音文字列と仮名文字列とが一致しない場合には、表音文字列が対象文字列に予め設定された振り仮名に対応していないことになる。このため、表音文字列と仮名文字列とが一致する場合には表音文字列を選択し、一致しない場合には仮名文字列を選択して、対象文字列を正しく読み上げるようにした。これにより、音声読み上げ対象の対象文字列が不自然な発音で不正確に読み上げられることが抑制されるようになる。
【0104】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、自動取引装置1及びATM10が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリ等がある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープ等がある。光ディスクには、DVD(Digital Versatile Disc)、CD(Compact Disc)−ROM(Read Only Memory)/RW(Re-Writable)等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。
【0105】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0106】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0107】
また、上記の処理機能の少なくとも一手段を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)等の電子回路で実現することもできる。
【符号の説明】
【0108】
1 自動取引装置
2,26a 辞書情報格納手段
3 文字列情報格納手段
4,26b 波形情報格納手段
5,26c 変換手段
6,27 比較判定手段
7,26d 生成手段
8 音声出力手段
10 ATM
20 制御ユニット
20a CPU
20b RAM
20c HDD
20d グラフィックインタフェース
20e ホスト通信制御手段
20f 入出力インタフェース
20g バス
21 金融機関情報格納手段
22 出力文字列情報記憶手段
23 音声案内情報格納手段
24 カード読取手段
25 検索手段
26 音声合成手段
28 発話情報併合手段
29 数字情報通知手段
30 表示ユニット
30a 表示手段
30b 入力検知手段
31 入力受付手段
32 発話情報通知手段
33 音声出力制御手段
40 カード処理ユニット
40a カード挿入/排出口
50 通帳処理ユニット
50a 通帳挿入/排出口
60 紙幣処理ユニット
60a 紙幣投入/放出口
70 硬貨処理ユニット
70a 硬貨挿入/放出口
80 受話器

【特許請求の範囲】
【請求項1】
音声案内を行う自動取引装置において、
漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段と、
変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段と、
を有することを特徴とする自動取引装置。
【請求項2】
前記表音文字列は、仮名文字と、前記仮名文字の発音を表記する発音記号を表す特殊文字とで構成されている、
ことを特徴とする請求項1記載の自動取引装置。
【請求項3】
前記比較判定手段は、前記表音文字列を構成する前記仮名文字と前記仮名文字列とを一致の条件に基づいて、先頭の文字から末尾の文字まで1文字ずつ比較する、
ことを特徴とする請求項2記載の自動取引装置。
【請求項4】
前記一致の条件は、比較対象の文字について、前記表音文字列を構成する前記仮名文字が、前記仮名文字列の清音に対応する拗音または促音の小書きの文字である場合には、一致する、
ことを特徴とする請求項3記載の自動取引装置。
【請求項5】
前記一致の条件は、比較対象の文字について、前記表音文字列を構成する前記仮名文字の長音を表す文字が、前記仮名文字列の「ウ」または「オ」に対応する場合には、一致する、
ことを特徴とする請求項3記載の自動取引装置。
【請求項6】
前記比較判定手段は、前記表音文字列と前記仮名文字列とが一致する場合には、前記対象文字列を読み上げるために前記表音文字列を選択する、
ことを特徴とする請求項1記載の自動取引装置。
【請求項7】
前記比較判定手段は、前記表音文字列と前記仮名文字列とが一致しない場合には、前記対象文字列を読み上げるために前記仮名文字列を選択する、
ことを特徴とする請求項1記載の自動取引装置。
【請求項8】
音声案内の音声読み上げ方法において、
変換手段が、漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換し、
比較判定手段が、変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する、
ことを特徴とする音声読み上げ方法。
【請求項9】
コンピュータを、
漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段、
変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段、
として機能させることを特徴とする音声読み上げプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−194264(P2012−194264A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−56852(P2011−56852)
【出願日】平成23年3月15日(2011.3.15)
【出願人】(000237639)富士通フロンテック株式会社 (667)