説明

自動翻訳装置

【課題】騒音下の野外でも自然に近い形で自動翻訳通話が実現できるようにする。
【解決手段】第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備する。当該装置を装着した第一国語話者に対してはオーラルに、対する第二国語話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はリアルタイムで、しかもユーザーフレンドリーに、2国語間の通訳処理を実行する自動翻訳装置に関するものである。
【背景技術】
【0002】
従来の自動翻訳装置としては、以下列記するものがある。まず特許文献1には第一国語の話者の音声を認識した後第二国語に翻訳・変換してさらに音声変換し第二国語の聞き手に伝える、またその逆を行うものが記載されている。また翻訳され第二国語を携帯電話に設けられた専用スピーカーから音声出力させる形態の発明が特許文献2に記載されている。また、音声ではなく、ディスプレイ表示で二国語間の翻訳を実行する技術が特許文献3に、さらにポータブルタイプに適した構成が特許文献4〜6に記載されている。また、音声と表示の双方を用い、ディスプレイに音声入力の確認表示がされるといった技術が特許文献7に記載されている。特に特許文献7においては、音声入力の自動翻訳を実行するにあたって、今日の技術では未だ完全に音声言語を認識することはできないことに鑑み、ある程度の”聞き取りミス”を許容するため、第一国語と第二国語を同時表示させる旨が記載されている。
【特許文献1】特開平9−292971号公報
【特許文献2】特開平8−265445号公報
【特許文献3】特開平6−119372号公報
【特許文献4】特開平6−325072号公報
【特許文献5】特開平8−77176号公報
【特許文献6】特開平9−160881号公報
【特許文献7】特開平8−278972号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、前記列記した従来の構成では、実使用上問題となるところがある。まず、特許文献1に記載されている音声−音声間の翻訳実行方式の課題について説明する。この方式は一見、同時通訳者を介したかのように二カ国語間の会話が実現できるといった点で優れているが、モバイルにしかも野外で用いる場合に問題がある。すなわち、音声でもって相手に情報を伝達しようとすれば十分な音量で音声を発する必要がある。特に野外で使用する場合は周囲の雑音に十分うち勝つだけの音量が必要である。出力の十分大きいスピーカーを用いればよいという見方もあるが、機器の形状が大きくなり、しかも消費電力が増えるといったモバイル機器にとって致命的な課題が生じる。次に、特許文献2に記載されているような携帯電話の形式をとれば耳とスピーカーを接近させることができ、サイズ・電力の問題は発生しない。しかし、自分のみならず、相手方も同等の機器を持っている必要がある。その機器を会話時に一時的に相手に貸与する方法もあるが、そのまま盗難される危険性もある。
【0004】
音声対話よりも、むしろディスプレイ表示、つまり文字によって相手と会話をする方式のもの(特許文献3〜7)のがモバイルでの使用下に適していると考えられる。しかし、もともと”筆談”というのは日常会話からすれば自然な形態ではなく、会話中は相手よりもその翻訳機の表示を見る方に注意が行くことから、コミュニケーションがとりにくくなるのと、やはり安全上の問題(例えば筆談に目を取られているすきにピッキングに遭う、等)が発生するおそれがある。
【課題を解決するための手段】
【0005】
前記従来の課題を解決するために、本発明の請求項1の発明は、第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、また、請求項2の発明は、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とした。
【0006】
本構成によって、当該装置を装着した第一国語(日本語)話者に対してはオーラルに、対する第二国語(英語)話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。
【発明の効果】
【0007】
本発明の自動翻訳装置によれば、モバイルに適した、しかもより自然な形で、二国語間の会話を実現することができる。
【発明を実施するための最良の形態】
【0008】
以下本発明の実施の形態について、図面を参照しながら説明する。
【0009】
(実施の形態1)
図1は、本発明の実施の形態1における自動翻訳装置のブロック図、図2はその一部の外観図である。図1において、第一国語(以下、日本語)話者の音声はマイク1によって電気信号に変換され、音声分析モジュール2に供給される、音声分析モジュール2は前記音声を認識し、(第一の)中間言語C1を生成する。ここで中間言語とは、単語の意味と構文上の属性(すなわち動詞、名詞、形容詞の分類および接続関係)が明らかになったデータ列と意味する。例えば日本語話者が図2に示すようにマイク1に向かって「おおきに」と音声を発した場合、図3に示すように、この電気信号列が(日本語)辞書20に基づいて音声分析モジュール2によって分析された結果、感謝を意味する符号(図3では”CF5A88Dh”)が生成される。
【0010】
この中間言語は翻訳モジュール4によって第二国語(英語)に変換されると同時に、音声合成モジュール3に供給され、再度音声に変換される。日本語話者は図2に示すように、この再合成された音声を耳に近接して装着したスピーカーから聞くことになる。音声合成モジュール3は感謝の意味を持つ符号を、辞書20を用いて日本語に変換する。ここで話言葉と中間言語は必ずしも1:1に対応しているわけではない。たとえば、「ありがとう」も「おおきに」も「だんだん」も(辞書20に登録されていれば)感謝の意と表す同一の中間言語”CF5A88Dh”に変換されてもよい。逆に、共通の中間言語C1から日本語に変換する場合、どの日本語を選択するのかが問題となるが、標準語の「ありがとう」を選択すれば、少なくとも日本語話者にはその意味が通じる。
【0011】
このように、一旦音声認識・中間言語生成された符号を再度日本語に変換したもの「ありがとう」を日本語話者が”聞く”ことによって、自分が発した言葉が正しく認識されたことを知ることができる。
【0012】
中間言語C1は翻訳モジュール4によって第二国語(英語)の中間言語C2に翻訳される。日本語と英語とでは文法体系が異なるので、中間言語の構造体(修飾、接続関係など)を所定の規則に基づいて変換する必要がある。翻訳された中間言語C2は辞書80に基づいて文字合成モジュール5によって文書化され、ディスプレイ6に表示される。本実施の携帯の場合、感謝の意を表す「Thank you」に翻訳される。ディスプレイ6は図2に示すように、第二国語(英語)話者が自然な目線で判読できるように、第一国語(日本語)話者の胸から方のあたりに装着されるようにするのがよい。図2の配置では日本語話者はディスプレイ6を(自然な格好で)見ることはできないが、既に、自分の話言葉が正確に意味認識されたことをスピーカー11からの音声で把握できているので、後は、その中間言語が機械的に英語に翻訳されるものと思っていればよい。仮にディスプレイ6の表示が読めたところで、第二国語が自分が全く理解できない言語であった場合は全く用をなさない。なおディスプレイ6の具体的構成として低電力タイプの反射型液晶素子、若しくは電気泳動素子などを用いてもよい。
【0013】
一方英語話者は本実施形態におけるマイク7に向かって音声を発する(「You are welcome」)。電気信号に変換された英語の音声は辞書80に基づいて音声分析(8)され、中間言語C2(”FAC653B0h”)が生成される(図4)。この中間言語は文字合成モジュール5によって文書化され、ディスプレイ6に表示される。この表示によって英語話者は自分の話した言葉が認識されたことを確認することができる。
【0014】
さらに中間言語C2は翻訳モジュール10によって日本語中間言語に翻訳され、音声合成モジュール3に送られる。その結果スピーカー11からは「どういたしまして」という音声が発せられる。
【0015】
以上、本実施の形態によれば、モバイルに適した構成で、より自然な形で二国語間の自動翻訳を実行することができる。つまり、日本語話者は認識された自己の言葉と、日本語に翻訳された英語話者の言葉を、スピーカー11からリアルタイムで聞くことができる。ここで「スピーカー」とあるのは、いわゆるイヤホンのようなものであってもよい。また、英語話者は、認識された自己の言葉と、英語に翻訳された日本語話者の言葉をディスプレイ6の表示として見ることができる。これは野外の騒音下においても可能である。
【0016】
なお、図1において9および12はセレクタであり、自己の音声情報を通すか相手話者の音声を通すか決定付けるものである。具体的には(図示していないが)マイクロプロセッサーによって制御され、例えば、マイク1からの音声入力をマイク2からの音声入力の振幅の大小に応じて、切り替えるものであってもよい。
【0017】
(実施の形態2)
図5は、本発明の実施の形態2の自動翻訳装置ブロック図である。図5において、図1と同じ構成要素については同じ符号を用い、説明を省略する。図5において、51は音声合成モジュールであり翻訳モジュール4によって英語に翻訳された中間言語のみ音声信号に変換するものである。この音声信号は図5に示されるようにディスプレイ6の近くに設けられたスピーカー61によって音声化される。以上の動作により英語話者は日本語話者の話言葉の翻訳をディスプレイを介して目視することもでき(比較的静かな環境下であれば)スピーカー6からの音声として聞くこともでき、合わせて、より確度の高い会話を実現することが可能となる。
【0018】
ここで、本実施の形態ではスピーカー61はディスプレイ6近傍に別途設ける構成にしたが、透明圧電スピーカーをディスプレイ表示面に貼り付けたものであってもよい。
【産業上の利用可能性】
【0019】
本発明にかかる自動翻訳装置は、日本語話者に対してはオーラルに、対する英語話者に対してはビジュアルに会話情報を伝達する機能を有し、モバイル用電子通訳機等として、特に海外旅行中の使用する際に有用である。また国際会議等の用途にも応用できる。
【図面の簡単な説明】
【0020】
【図1】本発明の実施の形態1における自動翻訳装置のブロック図
【図2】本発明の実施の形態1における自動翻訳装置の一部外観図
【図3】同実施の形態の動作説明のためのフローチャート
【図4】同実施の形態の動作説明のためのフローチャート
【図5】本発明の実施の形態2における自動翻訳装置のブロック図
【図6】本発明の実施の形態2における自動翻訳装置の一部外観図
【符号の説明】
【0021】
1,7 マイク
2,8 音声分析モジュール
3 音声合成モジュール
4,10 翻訳モジュール
5 文字合成モジュール
6 ディスプレイ
11 スピーカー
20,80 辞書
9,12 セレクタ

【特許請求の範囲】
【請求項1】
第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とする自動翻訳装置。
【請求項2】
第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
【請求項3】
第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、さらに、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
【請求項4】
第1の翻訳モジュールの出力から音声信号を生成する第二の音声合成モジュールをさらに備えたことを特徴とする自動翻訳装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate