説明

電子機器、不適切語句判定方法、プログラム、及び、記録媒体

【課題】特に、第1言語では認識できない、翻訳後の第2言語中に不適切語句が含まれることを確実に防止する。
【解決手段】第1言語による文章を入力するための入力手段4、5と、入力手段4、5により入力された文章を第2言語に翻訳する翻訳手段10、13、17と、不適切語句を記憶する不適切語句記憶手段14と、不適切語句記憶手段14に記憶させた不適切語句が、翻訳手段10、13、17により翻訳された文章中に含まれるか否かを判定する不適切語句判定手段19と、不適切語句判定手段19により不適切語句が含まれていると判定されれば、その旨を報知する報知手段4、6とを備えた構成とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳文中に不適切語句が含まれているか否かを検出することのできる電子機器、不適切語句判定方法、プログラム、及び、記録媒体に関するものである。
【背景技術】
【0002】
従来、文書中に存在する誤った表記や曖昧性を含む表現などの不適切な表現を検出する不適切表現検出部と、適切な表現に変更するための書き換え情報を作成する書き換え情報生成部と、検出された不適切な表現に優先度を付加する優先度設定部とを持ち、優先度に基づいて検出された不適切な表現をユーザに提示する構成が開示されている(例えば、特許文献1参照)。
【0003】
【特許文献1】特開平6−266715号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、前記従来の構成では、言語翻訳ではなく文章編集をする場合に、誤った表現や曖昧性を含む不適切表現に優先度を設定し、その優先度に基づいて検出された不適切な表現をユーザに提示できるだけである。
【0005】
そこで、本発明は、特に、第1言語では認識できない、翻訳後の第2言語中に不適切語句が含まれることを確実に防止することのできる電子機器、不適切語句判定方法、プログラム、及び、記録媒体を提供することを課題とする。
【課題を解決するための手段】
【0006】
本発明は、前記課題を解決するための手段として、
電子機器を、
第1言語による文章を入力するための入力手段と、
前記入力手段により入力された文章を第2言語に翻訳する翻訳手段と、
不適切語句を記憶する不適切語句記憶手段と、
前記不適切語句記憶手段に記憶させた不適切語句が、前記翻訳手段により翻訳された文章中に含まれるか否かを判定する不適切語句判定手段と、
前記不適切語句判定手段により不適切語句が含まれていると判定されれば、その旨を報知する報知手段と、
を備えた構成としたものである。
【0007】
ここで、不適切語句とは、そのまま第2言語として出力するのに好ましくない語句、例えば、使用したユーザに危害が及ぶ可能性のある語句、使用場面として適切でない語句、差別用語等が該当する。
【0008】
前記構成により、翻訳後の文章中に不適切語句が含まれる場合、自動的にその旨を報知させることができるので、ユーザは安心して使用することができる。特に、第1言語では気付かなかった、翻訳後の第2言語による文章中に不適切語句が含まれるような場合に有効である。
【0009】
前記不適切語句記憶手段により記憶された各不適切語句の不適切度をレベル分けした不適切レベルを記憶した不適切レベル記憶手段をさらに備え、
前記報知手段は、前記不適切語句判定手段により不適切語句が含まれていると判定されれば、判定された不適切語句の不適切レベルを前記不適切レベル記憶手段から呼び出し、該不適切レベルを報知するのが好ましい。
【0010】
ここで、不適切度とは、その語句を使用すると、ユーザの身に危険が及ぶ可能性をレベル分けしたものや、使用場面として相応しくない程度をレベル分けしたもの等により設定したものが該当する。レベルは、予め登録したもののほか、ユーザが任意に登録可能としてもよい。
【0011】
前記構成により、翻訳後の文章中に不適切語句が含まれる場合、レベルを見て、その語句を使用することによるリスクを容易に把握することが可能となる。
【0012】
前記不適切語句記憶手段により記憶された各不適切語句を分野別に区分けした分野フラグを記憶した分野フラグ記憶手段をさらに備え、
前記報知手段は、前記不適切語句判定手段により不適切語句が含まれていると判定されれば、前記分野フラグに基づいて不適切語句の分野を報知するのが好ましい。
【0013】
この構成により、不適切語句がどの分野、例えば、危険用語であるのか、差別用語であるのか等を一目で判別することが可能となる。
【0014】
前記不適切語句に関連付けて変換候補となる適切語句を記憶する変換候補記憶手段と、
前記不適切語句判定手段により前記入力手段により入力された文章中に不適切語句が含まれていると判定されれば、前記変換候補記憶手段に記憶した変換候補を提示する変換候補提示手段と、
をさらに備えるのが好ましい。
【0015】
この構成により、翻訳後の文章中に不適切語句が含まれる場合、自動的にこの不適切語句に代わる適切語句を示すことができるので、ユーザの使い勝手を向上しつつ、不適切語句がそのまま出力されてしまうことを確実に防止することができる。
【0016】
少なくとも類語辞書データを記憶する辞書データ記憶手段を、さらに備え、
前記変換候補提示手段は、翻訳手段による翻訳後の文章中に不適切語句が含まれる場合、前記辞書データ記憶手段に記憶した類語辞書データから該不適切語句の類語を検索し、検索した類語を変換候補として提示するのが好ましい。
【0017】
この構成により、類語辞書データを搭載するだけで、変換候補を提示することが可能となる。
【0018】
また、本発明は、前記課題を解決するための手段として、
不適切語句判定方法を、
第1言語により入力された文章を第2言語に翻訳する翻訳ステップと、
前記翻訳ステップで翻訳された文章中に、不適切語句が含まれているか否かを判定する不適切語句判定ステップと、
前記不適切語句判定ステップで、翻訳文中に不適切語句が含まれていると判断すれば、その旨を報知する報知ステップと、
で行うものである。
【0019】
前記不適切語句判定ステップは、不適切語句を不適切度に応じて分類したいずれのレベルに該当するのかを判定するレベル判定ステップを含むのが好ましい。
【0020】
前記不適切語句判定ステップで、翻訳文中に不適切語句が含まれていると判定されれば、判定された不適切語句の分野フラグに基づいた該不適切語句の分野を報知する分野報知ステップを含むのが好ましい。
【0021】
前記変換候補提示ステップで、翻訳文中に不適切語句が含まれる場合、類語辞書データから該不適切語句の類語を検索し、検索した類語を変換候補として提示するのが好ましい。
【0022】
前記変換候補提示ステップで、さらに、検索した類語の中で、不適切語句が含まれていない語句を変換候補として提示するのが好ましい。
【0023】
また、本発明は、前記課題を解決するための手段として、プログラムを、前記不適切語句判定方法の各ステップを含むものとしたものである。
【0024】
また、本発明は、前記課題を解決するための手段として、記録媒体に、前記プログラムを記録したものである。
【発明の効果】
【0025】
本発明によれば、翻訳された文章中に不適切語句が含まれているか否かを判定することができ、含まれている場合にはその旨を報知させることができるので、ユーザが安心して使用することが可能となる。
【発明を実施するための最良の形態】
【0026】
以下、本発明に係る実施形態を添付図面に従って説明する。
【0027】
(構成)
図1は、本実施形態に係る電子機器のブロック図である。この電子機器は、大略、入出力装置1、表示装置2、及び、制御装置3を備える。
【0028】
入出力装置1は、例えば、表示部を兼ねるタッチパネル4(ソフトウェアキーボードを含む)、音声入力部5、音声出力部6、各種キー等の携帯端末に搭載可能なものが該当する。但し、電子機器がノートパソコン等であれば、マウス等を含めてもよい。タッチパネル4には、指及びペンのいずれの入力でも可能なアナログ抵抗膜方式のものが採用されている。また、圧力検出方式、静電容量方式、超音波表面弾性波方式、赤外線遮光方式、電磁誘導方式、画像認識方式等の他の方式のものを採用することも可能である。但し、電磁誘導方式の場合、磁界を発生可能な特別なペンを使用する必要があり、又、指を認識できるように圧力センサ等、別途、構成に工夫が必要である。音声入力部5にはマイク等が使用でき、音声出力部6にはスピーカ等が使用できる。
【0029】
制御装置3は、ROM7(Read Only Memory)、RAM8(Random Access Memory)、他の記憶媒体9、及び、CPU10(Central Processing Unit)を備える。
【0030】
ROM7には、音声認識辞書データベース11、例文データベース12、翻訳データベース13、不適切語句データベース14、及び、類語辞書データベース15と、音声認識プログラム16、翻訳文修正プログラム17、例文表示プログラム18、及び、不適切語句判定プログラム19とがそれぞれ格納されている。
【0031】
前記不適切語句データベース14には、例えば、図2に示すように、分野フラグ、マッチング対象、原形、入力文(日本語)、及び、不適切レベルの各項目で構成したものが記憶されている。分野フラグと不適切レベルとが対応しており、不適切レベルの数字が大きくなればなる程、不適切度が高くなっている。例えば、「stick(刺す)」、「fire(撃つ)」等の単語は、その単語を聞いた相手によって危害を加えられる恐れが最も高いとして不適切レベルを5としている。マッチング対象には、その単語が変形して使用される例(例えば、複数形等)が含まれる。また、分野フラグは、不適切語句データベース14中の各単語について、不適切な分野毎に異なるフラグを持ち、どのような分野の語句であるかが分かるようになっている。例えば、図2では、CW、IW、MW、DL、DWのフラグがあるが、それぞれ、下品な表現、無礼な表現、ばかにした表現、差別的な表現、命に係わる表現というように分類されている。なお、図2では、分野フラグ毎に、不適切レベルを対応して決めているが、これに限らず、同じ分野フラグを持っている語句であっても、不適切の度合いが異なるように設定しても構わない。つまり、不適切レベルの値が異なっていても構わない。
【0032】
RAM8には、音声認識テキスト記憶領域20、翻訳テキスト記憶領域21、及び、音声データ記憶領域22が確保されている。
【0033】
他の記憶媒体9には、電気的に書換可能な不揮発性メモリであるEEPROMやFlash ROM等のほか、ハードディスク、メモリカード等が含まれ、新たに登録される不適切語句を含む、ROM7に記憶させたデータベースには格納されていないデータを記憶するために使用する。
【0034】
CPU10は、入出力装置1から入力される文章に基づいて、ROM7に記憶させた各種プログラムを実行し、後述するようにして翻訳し、不適切語句を判定し、翻訳文を出力する。
【0035】
(動作)
次に、前記構成の電子機器の動作について説明する。但し、以下の説明では、主に、日本語を英語に翻訳させる場合について言及するが、本発明は、これに限定されるものではない。例えば、英語を日本語に翻訳したり、日本語を中国語に翻訳したりする場合等、言語の種類については問わない。
【0036】
図3及び図4のフローチャートに示すように、図示しないスイッチ等により電源を入れると(ステップS1:YES)、タッチパネル4には、図5(a)に示す初期画面が表示される。ユーザが音声により文章を入力すると(ステップS2)、音声認識プログラム16が起動し、音声認識辞書データベース11を参照して、音声認識テキスト記憶領域20に、認識された文章が記憶される(ステップS3)。このとき、図5(b)に示す音声認識中画面を表示させ、「日本語音声認識中」と表示することにより、ユーザに音声認識中であることを報知する。
【0037】
認識された文章は、図6(a)に示す音声認識結果画面に表示される。すなわち、日本語の場合、日本語欄31に、英語の場合、英語欄32にそれぞれ表示される(ここでは、日本語欄31に「ここをさしてください」と表示される。また、その下方側に別ウィンドウで「正しければ「翻訳ボタン」を押してください」と表示される。)。そこで、ユーザは表示された文章を見て適切に認識されているか否かを判断する。適切に認識されていなければ、戻るボタン33をタッチ操作し(ステップS4:NO)、初期画面に復帰させる。そして、再度、音声により文章を入力すればよい。適切に認識されていれば、翻訳ボタン34をタッチ操作することにより(ステップS5:YES)、機械翻訳を開始させる(ステップS6)。このとき、タッチパネル4には、図6(b)に示すように、「翻訳中」の文字が表示された翻訳中画面が表示される。
【0038】
続いて、翻訳後の文章が英語であると判断されれば(ステップS7:YES)、文章中に含まれる各単語を、図2に示す不適切語句データベース14のマッチング対象(ここでは、英単語のリスト)と比較する(ステップS8)。そして、不適切語句が文章中に含まれると判断すれば(ステップS9:YES)、タッチパネル4に、図7(a)に示す注意文表示画面を表示させる(ステップS10)。具体的には、「危険を招いたり、相手を不快にする英語が混じっています。」と表示させ、ユーザに、その文章をそのまま使用するのは不適切である可能性がある旨を報知する。
【0039】
さらに、例文呼出ボタン35が操作されるか、所定時間が経過すれば、注意文表示画面を図7(b)に示す翻訳文表示画面に切り替える。翻訳文表示画面としては、例えば、次のような表示とすることができる。
【0040】
図7(b)は、不適切語句に該当する部分の表示を他の部分と判別容易な内容とする。具体的には、翻訳文中に含まれる単語が不適切語句データベース14に含まれるか否かを検索し、含まれていれば、不適切語句の表示部分の下縁に沿ってアンダーバーを表示し、不適切語句自身は異なる色(例えば、赤)で表示する。これにより、ユーザは、一目見て不適切語句がどれであるのかを認識することができる。
【0041】
図8(a)は、不適切度レベルをゲージで表示させた例を示す。ここでは、前記不適切語句データベース14でランク付けした5つの不適切レベルを区別して表示できるように、5つの目盛りからなるインジケータで構成されている。この場合、不適切レベルが「5」や「4」等の不適切度が高いものは赤色で表示したりする等、色分け表示するようにするのが好ましい。
【0042】
図8(b)は、図7(a)に示す包括的な表現から、分野フラグに基づいて、単語の表現ジャンルに応じたコメントを表示する例を示す。ここでは、不適切度が大きな単語「stick(刺す)」が含まれるので、「命に関わる単語が含まれています。」と表示されている。これにより、単に色分けしたり、インジケータを表示したりするだけでなく、ユーザはその理由を理解することができる点で好ましい。但し、これらの表示は併用することも可能である。
【0043】
また、前記図7(a)、(b)及び図8(a)、(b)に示すような不適切度を示す表示を行うほか、表示された不適切語句に代わる他の用語(語句)を一覧表示させるようにしてもよい。例えば、不適切語句データベース14の各用語と同義語等であって、不適切語句とはならない他の用語を関連付けて登録しておく。そして、不適切語句がタッチ操作されることにより、その関連付けした用語を表示させるようにしてもよい。図9(a)に示すように、登録する用語は1つに限らず、複数登録しておき、その中から選択できるようにすることも可能である。複数表示する場合には、図9(a)に示すように、不快度レベルを示すランクを表示したり、候補となる用語に解説文を付加したり、より適切な単語順に並び替えたり、色分けしたりするのが好ましい。そして、いずれかの単語が選択されることにより、英語欄32の表示を、図9(b)に示すように置き換えて表示するようにすればよい。
【0044】
一方、英語不適切語句リストに含まれる単語が含まれていなければ、前記ステップS6での翻訳結果を英語欄に表示させる(ステップS11)。これにより、ユーザが、安心して、図示しない音声ボタンを操作して英語を音声により出力させたり、表示された文章を読んだり、表示された文字を提示したりすることができる。
【0045】
また、翻訳後の文章が日本語であると判断すれば(ステップS12:YES)、前記同様、文章中に含まれる各単語を、日本語不適切語句リストと比較し(ステップS13)、該当するものがあれば(ステップS14:YES)、その旨を表示させる(ステップS15)。また、日本語不適切語句リストに含まれる単語がなければ、翻訳結果を表示させる(ステップS16)。中国語であると判断した場合も同様であり(ステップS17〜S21)、その他の言語への翻訳機能が備わっていれば、各言語についても同様の処理を行う。
【0046】
このように、ユーザに対して翻訳文を表示させる前に、その翻訳文に不適切語句が含まれていれば、その旨を報知するようにしているので、安心して使用することができる。また、翻訳文を表示する場合でも、不適切語句を他の部分と識別可能とし、ユーザに注意を促すようにしているので、その部分の単語のみを変更して使用すれば、新たに翻訳作業をし直す手間を省くことができる。しかも、不適切語句の変換候補を表示できるようにすれば、より一層使い勝手を向上させることができる。
【0047】
なお、前記実施形態では、予め不適切語句をデータベースとして登録しておき、そのデータベース中の単語が含まれる文章に翻訳された場合、その単語をデータベースに登録した他の単語に変換可能としたが、類語辞書データベース15を登録しておき、この類語辞書データベース15によって変換候補を表示するようにしてもよい。これによれば、新たに不適切語句データベース14に関連用語(変換候補)を登録する必要な、既存の類語辞書データベース15を使用利用して対処することが可能となる。
【0048】
また、前記実施形態では、不適切語句データベース14を参照して翻訳文中に不適切語句が含まれているか否かを判断するようにしたが、不適切語句には例として挙げた危険用語に限らず、使用場面で不適切である語句(差別用語を含む)等、翻訳文として出力するのに適していない語句を含む。この場合、表示方法を異なる危険用語を示す場合とは異なる形態で表示するようにすればよい。
【0049】
また、前記実施形態では、不適切語句を単一の基準(不適切レベル)で管理するようにしたが、例えば、第2言語の種類あるいは使用される地域(英語圏のどの地域で使用するのか)に応じて不適切レベルを変更することも可能である。この場合、起動時に、使用地域を特定させる等、予め使用条件を登録するようにすれば、不適切レベルを確実に所定の値に設定することができる点で好ましい。
【図面の簡単な説明】
【0050】
【図1】本実施形態に係る電子機器のブロック図である。
【図2】不適切語句データベースの内容を示す図表である。
【図3】翻訳処理を示すフローチャート図である。
【図4】翻訳処理を示すフローチャート図である。
【図5】(a)は図1のタッチパネルに表示される初期画面、(b)は音声認識中画面をそれぞれ示す図である。
【図6】(a)は音声認識結果画面、(b)は翻訳中画面をそれぞれ示す図である。
【図7】(a)は注意文表示画面、(b)は翻訳文表示画面の一例をそれぞれ示す図である。
【図8】(a)、(b)は翻訳文表示画面の他の例を示す図である。
【図9】(a)は翻訳文表示画面で変換候補を一覧表示させた状態、(b)は(a)で変換候補の1つ選択した状態をそれぞれ示す図である。
【符号の説明】
【0051】
1…入出力装置
2…表示装置
3…制御装置
4…タッチパネル
5…音声入力部
6…音声出力部
7…ROM
8…RAM
9…記憶媒体
10…CPU
11…音声認識辞書データベース
12…例文データベース
13…翻訳データベース
14…不適切語句データベース
15…類語辞書データベース
16…音声認識プログラム
17…翻訳文修正プログラム
18…例文表示プログラム
19…不適切語句判定プログラム
20…音声認識テキスト記憶領域
21…翻訳テキスト記憶領域
22…音声データ記憶領域
31…日本語欄
32…英語欄
33…戻るボタン
34…翻訳ボタン

【特許請求の範囲】
【請求項1】
第1言語による文章を入力するための入力手段と、
前記入力手段により入力された文章を第2言語に翻訳する翻訳手段と、
不適切語句を記憶する不適切語句記憶手段と、
前記不適切語句記憶手段に記憶させた不適切語句が、前記翻訳手段により翻訳された文章中に含まれるか否かを判定する不適切語句判定手段と、
前記不適切語句判定手段により不適切語句が含まれていると判定されれば、その旨を報知する報知手段と、
を備えたことを特徴とする電子機器。
【請求項2】
前記不適切語句記憶手段により記憶された各不適切語句の不適切度をレベル分けした不適切レベルを記憶した不適切レベル記憶手段をさらに備え、
前記報知手段は、前記不適切語句判定手段により不適切語句が含まれていると判定されれば、判定された不適切語句の不適切レベルを前記不適切レベル記憶手段から呼び出し、該不適切レベルを報知することを特徴とする請求項1に記載の電子機器。
【請求項3】
前記不適切語句記憶手段により記憶された各不適切語句を分野別に区分けした分野フラグを記憶した分野フラグ記憶手段をさらに備え、
前記報知手段は、前記不適切語句判定手段により不適切語句が含まれていると判定されれば、前記分野フラグに基づいて不適切語句の分野を報知することを特徴とする請求項1又は2に記載の電子機器。
【請求項4】
前記不適切語句に関連付けて変換候補となる適切語句を記憶する変換候補記憶手段と、
前記不適切語句判定手段により前記入力手段により入力された文章中に不適切語句が含まれていると判定されれば、前記変換候補記憶手段に記憶した変換候補を提示する変換候補提示手段と、
をさらに備えたことを特徴とする請求項1乃至3のいずれか1項に記載の電子機器。
【請求項5】
少なくとも類語辞書データを記憶する辞書データ記憶手段を、さらに備え、
前記変換候補提示手段は、翻訳手段による翻訳後の文章中に不適切語句が含まれる場合、前記辞書データ記憶手段に記憶した類語辞書データから該不適切語句の類語を検索し、検索した類語を変換候補として提示することを特徴とする請求項4に記載の電子機器
【請求項6】
前記変換候補提示手段は、さらに、検索した類語の中で、前記不適切語句記憶手段に含まれていない語句を変換候補として提示することを特徴とする請求項5に記載の電子機器。
【請求項7】
第1言語により入力された文章を第2言語に翻訳する翻訳ステップと、
前記翻訳ステップで翻訳された文章中に、不適切語句が含まれているか否かを判定する不適切語句判定ステップと、
前記不適切語句判定ステップで、翻訳文中に不適切語句が含まれていると判断すれば、その旨を報知する報知ステップと、
を含むことを特徴とする不適切語句判定方法。
【請求項8】
前記不適切語句判定ステップは、不適切語句を不適切度に応じて分類したいずれのレベルに該当するのかを判定するレベル判定ステップを含むことを特徴とする請求項7に記載の不適切語句判定方法。
【請求項9】
前記不適切語句判定ステップで、翻訳文中に不適切語句が含まれていると判定されれば、判定された不適切語句の分野を報知する分野報知ステップを含むことを特徴とする請求項7又は8に記載の不適切語句判定方法。
【請求項10】
前記不適切語句判定ステップで、翻訳文中に不適切語句が含まれていると判定されれば、前記不適切語句に関連付けた変換候補を提示する変換候補提示ステップを、さらに含むことを特徴とする請求項7乃至9のいずれか1項に記載の不適切語句判定方法。
【請求項11】
前記変換候補提示ステップで、翻訳文中に不適切語句が含まれる場合、類語辞書データから該不適切語句の類語を検索し、検索した類語を変換候補として提示することを特徴とする請求項10に記載の不適切語句判定方法。
【請求項12】
前記変換候補提示ステップで、さらに、検索した類語の中で、不適切語句が含まれていない語句を変換候補として提示することを特徴とする請求項11に記載の不適切語句判定方法。
【請求項13】
前記請求項7乃至12のうち、いずれか1項に記載の方法の各ステップを含むことを特徴とするプログラム。
【請求項14】
前記請求項13に記載のプログラムを記録したことを特徴とするコンピュータにより読取可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate