説明

情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体

【課題】テキストデータに区切り文字と同じ文字データが含まれる場合でも、情報処理装置間のデータ交換に際し、短時間で効率が良く、かつ、区切りに使われる文字と、その区切り文字と同じ文字データとの誤判読がなくテキストデータの授受が行える情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体を提供すること。
【解決手段】テキストデータに区切り文字と同じ文字データが含まれる場合、その文字データを、該文字データの配置情報を表す特定文字配置データに変換する変換手段と、変換により得られたデータを区切り文字で区切って羅列する組み立て手段と、組み立て手段で組み立てられたデータを、区切り文字で区切られたデータごとに分解する分解手段と、特定文字配置データに基づいて、分解されたデータを単語列ごとにまとめる逆変換手段と、を備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストデータを授受する情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体に関し、特にテキストデータに区切りを有するデータの送信または受信を行う情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体に関する。
【背景技術】
【0002】
複数の情報処理装置間を伝送手段により接続し、データの授受を行うことが一般に行われている。ここで文字データだけで構成されたテキストデータは、種類の異なる情報処理装置間の通信にも用いることができるので利便性が高い。
【0003】
このようなテキストデータの授受にあたっては、受信側は受信したテキストデータを単語列に分解しその内容を解釈する必要がある。また、送信側は受信側がテキストデータを正しい単語列に分解できるように一定の表現規則に基づいてテキストデータを組み立てる必要がある。
【0004】
このような表現規則として、空白、ピリオド、カンマなどの区切り文字を用いてテキストデータの組み立てと分解が行われることがある。このうち、テキストデータの各要素をフィールドごとに区切る文字としてカンマを用いるものにCSV(Comma Separated Values)と呼ばれる形式がある。CSV形式はテキストデータの各要素をフィールドごとにカンマで区切ったファイル形式であり、汎用性が高く、種類の異なる情報処理装置間の通信によく用いられる。
【0005】
また、CSV形式では、区切り文字であるカンマと、通常のカンマとを区別し、テキストデータの各要素の誤判読を防止する手段として、区切り文字であるカンマを含むテキストデータの各要素をテキスト区切り記号で囲むことが行われている。このようなテキスト区切り記号としては、一般的にはダブルコーテーションマーク(double quatation mark)が用いられることが多い。
【0006】
このようなCSV形式による通信は、製造装置や加工装置においても行われる。例えば、当該装置外部にある情報処理装置と、これら装置に内蔵されている情報処理装置部分とをケーブルなどの伝送手段で接続し、プロセス条件に関するデータや装置稼働状況に関するデータをCSV形式のテキストデータによりデータ交換することが行われている(例えば、特許文献1)。
【0007】
しかしながら、特許文献1に開示されているような技術においては、ダブルコーテーションマークのようなテキスト区切り記号を検出する手段が別途必要となる上、テキストデータの組み立てと分解に時間がかかっていた。また、テキスト区切り記号を用いないテキストデータのデータ交換では、区切り文字であるカンマと通常のカンマとの誤判読を生じテキストデータの汎用性を十分に発揮することができなかった。
【0008】
また、情報処理装置間のテキストデータの交換を効率よく行えるようにするための装置も開示されている(例えば、特許文献2)。
【0009】
特許文献2に開示されている技術は、テキストデータの圧縮・展開に関するものであり、この場合においてもダブルコーテーションマークのようなテキスト区切り記号を検出する手段が必要となる上、テキストデータの組み立てと分解に時間がかかっていた。また、テキスト区切り記号を用いないテキストデータのデータ交換では、区切り文字であるカンマと通常のカンマとの誤判読を生じテキストデータの汎用性を十分に発揮することができなかった。
【特許文献1】特開2004−30119号公報
【特許文献2】特開平9−312574号公報
【発明の開示】
【発明が解決しようとする課題】
【0010】
本発明は、テキストデータに区切り文字と同じ文字データが含まれる場合でも、情報処理装置間のデータ交換に際し、短時間で効率が良く、かつ、区切りに使われる文字と、その区切り文字と同じ文字データとの誤判読がなくテキストデータの授受が行える情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体を提供する。
【課題を解決するための手段】
【0011】
上記目的を達成するため、本発明の一態様によれば、
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する変換手段と、
前記変換により得られたデータを、区切り文字で区切って羅列する組み立て手段と、
を備えたことを特徴とする情報処理装置が提供される。
【0012】
また、本発明の他の一態様によれば、
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する分解手段と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる逆変換手段と、
を備えたことを特徴とする情報処理装置が提供される。
【0013】
また、本発明のさらに他の一態様によれば、
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する手順と、
前記変換により得られたデータを、区切り文字で区切って羅列する手順と、
を備えたことを特徴とする情報処理方法が提供される。
【0014】
また、本発明のさらに他の一態様によれば、
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する手順と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる手順と、
を備えたことを特徴とする情報処理方法が提供される。
【0015】
また、本発明のさらに他の一態様によれば、
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する処理と、
前記変換により得られたデータを、区切り文字で区切って羅列する処理と、
をコンピュータに実行させるための情報処理プログラムが提供される。
【0016】
また、本発明のさらに他の一態様によれば、
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する処理と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる処理と、
をコンピュータに実行させるための情報処理プログラムが提供される。
【0017】
また、本発明のさらに他の一態様によれば、
上述のいずれかの情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体が提供される。
【発明の効果】
【0018】
本発明によれば、テキストデータに区切り文字と同じ文字データが含まれる場合でも、情報処理装置間のデータ交換に際し、短時間で効率が良く、かつ、区切りに使われる文字と、その区切り文字と同じ文字データとの誤判読がなくテキストデータの授受が行える情報処理装置及び情報処理方法を提供することができる。そのため、産業上のメリットは多大である。
【発明を実施するための最良の形態】
【0019】
以下、本発明の実施の形態について、具体例を参照しつつ詳細に説明する。
図1は、本発明をパーソナルコンピュータのような情報処理装置間のデータ交換に用いた場合を例示した概念図である。
【0020】
送信側の情報処理装置1aは、テキストデータを入力する入力手段9と、入力されたテキストデータに区切り文字と同じ文字データが含まれる場合、その文字データをテキストデータ中から除去すると共に、代わりにその文字データの配置情報を表す特定文字配置データを付加する変換手段13と、変換手段13で得られたデータを区切り文字で区切って羅列する組み立て手段3と、組み立て手段3で得られたデータを送信する送信手段4と、を備えている。
【0021】
「特定文字配置データ」とは、例えば、区切り文字と同じ文字(特定文字)がテキストデータ中に含まれる個数(特定文字が0個、すなわち特定文字が配置されていないということも含む)や、テキストデータ中のどの位置に特定文字が配置されるかといった情報を表す。
【0022】
受信側の情報処理装置1bは、送信手段4から送信されたデータを受信する受信手段5と、受信したデータを、区切り文字で区切られたデータごとに分解する分解手段6と、特定文字配置データに基づいて、分解手段6で分解されたデータを単語列ごとにまとめる逆変換手段16と、逆変換手段16で得られたデータを出力する出力手段10と、を備えている。
【0023】
上記各手段及び情報処理装置間は、伝送手段2で接続されている。伝送手段2は例えば、通信ケーブル、電話線、光ファイバ、インターネットの様な有線を用いた手段であるが、これに限定されるものではなく、無線を利用するものやCD−ROMの様な記録媒体でデータを受け渡すものであってもよい。
【0024】
図1では便宜上、情報処理装置1aは、入力手段9、変換手段13、組み立て手段3、送信手段4を備え、情報処理装置1bは、受信手段5、分解手段6、逆変換手段16、出力手段10を備えている場合を例示している。しかし、本発明はこれに限定されるものではなく、入力手段9、変換手段13、組み立て手段3、送信手段4、受信手段5、分解手段6、逆変換手段16、出力手段10をそれぞれ備え、テキストデータの双方向の送受信が可能である情報処理装置としてもよい。そして、このような情報処理装置同士を伝送手段2で接続すれば、相互にテキストデータの交換をすることができる。
【0025】
次に、本発明の情報処理方法の具体例について、区切り文字としてカンマ(,)を用いたCSV形式(Comma Separated Values)のテキストデータを授受する場合を例にして説明する。
図2は、本具体例にかかる情報処理方法の手順の流れを表す図である。
図3は、本具体例にかかる情報処理方法における具体的なデータの流れを表す図である。
【0026】
まず、ステップS1として、入力手段9を介して、変換手段13にテキストデータが入力される。本具体例では、例えば、「AB,C」と「DE」という2つのデータが入力されるとして説明する。データ「AB,C」、「DE」は、それぞれ1つのまとまった単語列である。データ「AB,C」は、CSV形式の区切り文字であるカンマ(,)を通常の文字データとして含んでいる。そのデータ「AB,C」中のカンマを、区切りに使われるものと区別して特定文字と呼ぶ。
【0027】
入力手段9としては、例えば、キーボードのような手動入力装置、もしくは温度検出器、圧力検出器などからのデータをテキストデータに変換し、それらを自動的に入力する装置などが挙げられるが、これらに限定されるものではない。
【0028】
次に、ステップS2として、変換手段13が、データ「AB,C」と「DE」を、カンマの配置情報を表す特定文字配置データ「1」及び「0」を含む5個のデータ「1」、「AB」、「C」、「0」、「DE」に変換する。本具体例では、特定文字配置データ「1」、「0」は、それぞれの後続のデータ「AB」、「DE」の後ろに配置されるカンマの個数を表している。データ「AB,C」に含まれるカンマは、このカンマの配置情報を表す特定文字配置データ「1」に置き換えられる。データ「DE」に含まれるカンマは0個であるので、これを表す特定文字配置データ「0」が付加される。
【0029】
次に、ステップS3として、組み立て手段3が、変換手段13で得られた各データ「1」、「AB」、「C」、「0」及び「DE」をカンマで区切ってその順に羅列し、カンマ区切りのCSVデータ「1,AB,C,0,DE」として組み立てる。
【0030】
次に、ステップS4として、組み立て手段3で組み立てられたCSVデータ「1,AB,C,0,DE」を送信手段4を介して送信し、次のステップS5として、その送信されたデータを受信手段5が受信する。なお、図3では、送信手段4と受信手段5とをひとまとめにして表している。また、ここでの送受信は、有線や無線を介してデータを送受信する形態に限らず、記録媒体を介してデータを受け渡す形態でもよい。
【0031】
次に、ステップS6として、分解手段6が、受信されたCSVデータ「1,AB,C,0,DE」を受け、これを個々のデータに分解する。これにより、組み立て手段3で組み立てられる前の5個のデータ「1」、「AB」、「C」、「0」及び「DE」に分解される。
【0032】
次に、ステップS7として、分解手段6で分解されたデータを逆変換手段16が受け、変換手段13で変換される前の2つのデータ「AB,C」と「DE」に逆変換する。
【0033】
具体的には、逆変換手段16は、分解されたデータのうちの特定文字配置データ「1」に基づき、この後ろに続くデータ「AB」とデータ「C」との間に1個のカンマ(,)が配置され、かつそれらデータ「AB」と「カンマ(,)」と「C」とがひとまとまりの(1つの単語列)のデータ「AB,C」として認識する。
【0034】
さらに、逆変換手段16は、特定文字配置データ「0」に基づき、この後ろに続くデータ「DE」の後ろに配置されるカンマ(,)の数は0(ゼロ)、すなわち、データ「DE」はカンマ(,)を含まず、それだけでひとまとまりの(1つの単語列)のデータ「DE」であると認識する。
【0035】
すなわち、逆変換手段16は、分解されたデータ「1」、「AB」、「C」、「0」、「DE」から特定文字配置データ「1」、「0」を除去すると共に、その特定文字配置データ「1」、「0」に基づいて、特定文字配置データ以外のデータ「AB」、「C」、「DE」を、必要であればカンマと結びつけて、かつ各単語列の境界も認識して、変換手段13で変換される前のデータ「AB,C」と「DE」に戻す。これにより、受信側は、送信側に入力されて送られてきたデータの正しい解釈を行える。
【0036】
次に、ステップS8として、逆変換手段16で得られたデータ「AB,C」と「DE」は、出力手段10を介して出力され、例えば、表示装置に表示されたり、プリンタによって紙などに印刷されたり、データ記憶部に格納されたり、データ記憶部に記憶されていた古いデータと置き換えられたりする。それら出力されたデータをもとに、例えば、半導体装置や液晶表示装置等の製造装置のプロセス条件を変えて被加工物の加工をしたり、運転手順や管理条件を変えて被加工物の加工や装置の管理をしたりする。
【0037】
上述した一連の処理は、磁気ディスク、光ディスク、半導体メモリなどの記録媒体に格納された本発明の実施形態にかかる情報処理プログラムにしたがって実行される。変換手段13、組み立て手段3、分解手段6、逆変換手段16が個別に備える制御部、もしくは別途設けられた制御部が、上記プログラムを読み込みその命令にしたがって上述した処理を各手段に実行させる。
【0038】
ここで、例えば、比較例として、カンマを含む単語列をダブルコーテーションマーク(“ ”)で囲んでCSV形式データの授受を行う場合を考えると、「“AB,C”,DE」というデータを受けた分解手段は、ひとまとめの単語列とされるダブルコーテーションマークで囲まれた領域を検出して「“AB,C”」と「DE」とに分解する必要がある。そのためには、ダブルコーテーションマークで囲まれた領域を検出する機能が分解手段に必要となる上、データの分解に時間もかかる。
【0039】
一般に、CSV形式データにおいては、カンマが単語列の境界という原則以外の細かい仕様は受け渡しのシステム間で比較的自由に取り決められ、このため汎用性のあるものとなっている。そして、受け取り側がダブルコーテーションマークを想定していなかったり、無条件にカンマだけで分解するような方法で受け取る仕組みのものだと、区切り文字であるカンマと、通常の文字データであるカンマとの誤判読を生じ、これに対応しようとすると、分解手段に大幅な改造が必要となり、場合によっては対応をあきらめざるをえず、CSV形式データの汎用性を十分に発揮することができなかった。
【0040】
これに対して、本具体例では、分解手段6は、単純にカンマを境界として、受けたデータを「1」と「AB」と「C」と「0」と「DE」とに分解するだけでよい。すなわち、本具体例では、データをカンマで区切って受け渡すという汎用的な仕組み自体は変更なく、CSV形式データの組み立てから分解までの間の機能を担う装置・プログラムに改造を要しない。その汎用的なシステムの前段と後段に、カンマの配置情報を認識する仕組みを付加するという簡単な対応で、既存のCSV形式データ授受システムにおいてカンマを区切り文字と区別して文字データとして扱わせることができる。
【0041】
次に、図4は、本発明を、製造装置7と、この装置の外部に設けられたパーソナルコンピュータのような情報処理装置8bとの間のデータ交換に用いた場合を例示した概念図である。
なお、製造装置7としては、例えば、半導体装置や液晶表示装置の製造や加工に用いられるスパッタ装置、蒸着装置、CVD(chemical vapor deposition)装置、エッチング装置、アッシング装置などを挙げることができるが、これらに限定されるものではない。
【0042】
製造装置7は、情報処理装置8aを備えている。情報処理装置8aは、前述のような入力手段9a、変換手段13a、組み立て手段3a、送信手段4a、受信手段5a、分解手段6a、逆変換手段16a、出力手段10aをそれぞれ備え、テキストデータの送受信が可能である。情報処理装置8bも前述のような入力手段9b、変換手段13b、組み立て手段3b、送信手段4b、受信手段5b、分解手段6b、逆変換手段16b、出力手段10bをそれぞれ備えテキストデータの送受信が可能である。そして、これらはそれぞれ伝送手段2で接続されている。そのため、情報処理装置8aと情報処理装置8bは、相互にデータの交換ができるようになっている。
【0043】
なお、説明の便宜上、伝送手段2を一つのものとして表しているが複数のものであっても良い。また、製造装置7は前述のように例えば、半導体装置や液晶表示装置の製造や加工に用いられるものであるが、情報処理装置8a以外の装置の構成は、公知の装置と基本的には同じであるため、その構成の説明は省略する。
【0044】
製造装置7の情報処理装置8aから送信されるデータとしては、例えば、装置稼働状況や装置管理に関するデータがある。具体的には、装置稼働率、生産数量、異常発生時のデータ、プロセス条件に関するリアルタイムなデータ、メンテナンスの要否判断のためのデータなどがあるがこれらに限定されるものではない。また、データの送信は定期的に自動送信されるようにしたものでも良く、情報処理装置8b側からの要求で特定のデータを送信するようにしたものでも良い。
【0045】
製造装置7の情報処理装置8a側から送信されたこれらのデータは情報処理装置8bの受信手段5bにより受信され、前述と同様に分解手段6b及び逆変換手段16bでの処理を経て、出力手段10bにより出力され、図示しない表示装置に表示されたり、情報処理装置8b内の図示しないデータ加工装置でデータの加工が行われたり、情報処理装置8b内の図示しないデータの記憶装置に格納されたりする。
【0046】
情報処理装置8bから送信されるデータとしては、例えば、製造装置7のプロセス条件変更のデータ(例えば、温度、圧力、ガス流量、加工速度などの条件変更に関するデータなど)、製造装置7の運転手順(例えば、処理手順や加工手順など)や管理条件(例えば、メンテナンスや装置の稼動条件に関するものなど)の変更に関するデータなどがあるがこれらに限定されるものではない。また、データの送信は、製造装置7側からの要求で自動的に行われるものでも良く、作業者の判断で特定のデータを送信するようにしたものであっても良い。
【0047】
情報処理装置8b側から送信されたこれらのデータは製造装置7の情報処理装置8aの受信手段5aにより受信され、前述と同様に分解手段6a及び逆変換手段16aでの処理を経て、出力手段10aにより出力され、図示しない製造装置7の制御装置のデータ記憶部に格納されたり、記憶されていた古いデータと置き換えられたりする。そして、これらのデータにより製造装置7はプロセス条件を変えて被加工物の加工や処理をしたり、運転手順や管理条件を変えて被加工物の加工や装置の管理をしたりする。
【0048】
本具体例においても、前述の具体例と同様、テキストデータにカンマが文字データとして含まれる場合でも、カンマを含む単語列をダブルコーテーションマーク(“ ”)で囲むことなくCSV形式データに組み立ててそのまま送信する。ただし、カンマの配置情報を表す特定文字配置データは付加される。
【0049】
例えば、データ「AB」を送信する場合は、カンマの数が0なので、先頭に特定文字配置データ「0」を付加した「0,AB」というCSV形式データを組み立て、また、カンマを1個含むデータ「A,B」を送信する場合は、先頭に特定文字配置データ「1」を付加した「1,A,B」というCSV形式データを組み立て、これを送信する。
【0050】
前述の要領で組み立てられたデータを受ける側は、付加された特定文字配置データに基づいて、データを正しい単語列ごとにまとめる。例えば、「0,AB」というCSV形式データは、まず、分解手段にて、区切り文字であるカンマを境界として、「0」と「AB」に分解され、その上で特定文字配置データ「0」より、カンマの数が0なので、カンマを含まないデータ「AB」と認識される。同様に、「1,A,B」というCSV形式データは、分解手段にて、区切り文字であるカンマを境界として、「1」と「A」と「B」に分解され、その上で特定文字配置データ「1」により、カンマの数が1なので、「A」と「B」の間にあるカンマは区切り文字であり、AとBはひとまとめとされ、かつ、それら間にカンマを含むデータ「A,B」であると認識される。
【0051】
以上具体例を参照しつつ本発明の実施の形態について説明した。しかし、本発明は、これらの具体例に限定されるものではない。
【0052】
特定文字配置データがカンマの個数を表すという上述の例を適用すると、「AB,,C」と「DE」という2つのデータは、「2,AB,,C,0,DE」というCSV形式データで表せる。尚、ABとCとの間は「空白」であり、本具体例は「空白」をデータとして送る場合の例でもある。
【0053】
なお、特定文字配置データは、カンマが後ろに配置されるべきデータの前に付加することに限らず、カンマが配置される位置に配置してもよい。これに基づくと、例えば、「AB,C」と「DE」という2つのデータは、「AB,1,C,DE,0」というCSV形式のデータで表せる。
【0054】
また、特定文字配置データは、カンマの個数を表すことに限らない。例えば、「2,AB,C,DE」というCSV形式データにおける特定文字配置データ「2」は、この後ろの2つのデータ「AB」と「C」とをカンマを挟んで連結してひとまとめにするということを表すこととしてもよい。これに基づいて、「2,AB,C,DE」というCSV形式データを分解及び逆変換すると、「AB,C」と「DE」という2つのデータになる。これと同様な規則に基づくと、「3,AB,C,D,0,EF」というCSV形式データは、「AB,C,D」と「EF」という2つのデータになる。
【0055】
また、上述の具体例では、区切り文字にカンマを用いるCSV形式(Comma Separated Values)のデータの場合を説明したが、タブ区切りデータ(TSV形式:Tab Separated Values)やSYLK形式(Symbolic Link format)のデータ、スペース区切りのデータなどでも良い。
【0056】
本発明に適応されるデータ自体に関しても具体例に限定されるものではない。具体例に例示した、製造装置の稼働状況、プロセス条件、運転手順、管理条件などに限られず各種のテキストデータが含まれる。
【図面の簡単な説明】
【0057】
【図1】本発明の具体例にかかる情報処理装置の要部基本構成を説明するための概念図である。
【図2】本発明の具体例にかかる情報処理方法の手順の流れを表す図である。
【図3】本発明の具体例にかかる情報処理方法における具体的なデータの流れを表す図である。
【図4】本発明の第二の具体例にかかる情報処理装置の要部基本構成を説明するための概念図である。
【符号の説明】
【0058】
1a,1b 情報処理装置
1 伝送手段
3 組み立て手段
4 送信手段
5 受信手段
6 分解手段
7 製造装置
8a,8b 情報処理装置
13,13a,13b 変換手段
16,16a,16b 逆変換手段

【特許請求の範囲】
【請求項1】
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する変換手段と、
前記変換により得られたデータを、区切り文字で区切って羅列する組み立て手段と、
を備えたことを特徴とする情報処理装置。
【請求項2】
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する分解手段と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる逆変換手段と、
を備えたことを特徴とする情報処理装置。
【請求項3】
前記区切り文字で区切られて羅列されたデータの形式は、CSV形式(Comma Separated Values)であることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する手順と、
前記変換により得られたデータを、区切り文字で区切って羅列する手順と、
を備えたことを特徴とする情報処理方法。
【請求項5】
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する手順と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる手順と、
を備えたことを特徴とする情報処理方法。
【請求項6】
前記区切り文字で区切られて羅列されたデータの形式は、CSV形式(Comma Separated Values)であることを特徴とする請求項4または5に記載の情報処理方法。
【請求項7】
テキストデータに区切り文字と同じ文字データが含まれる場合、前記文字データを、該文字データの配置情報を表す特定文字配置データに変換する処理と、
前記変換により得られたデータを、区切り文字で区切って羅列する処理と、
をコンピュータに実行させるための情報処理プログラム。
【請求項8】
区切り文字と同じ文字データを含まず、かつ前記文字データの配置情報を表す特定文字配置データを含むテキストデータが区切り文字で区切られて羅列されたデータを、前記区切り文字で区切られたデータごとに分解する処理と、
前記特定文字配置データに基づいて、前記分解されたデータを単語列ごとにまとめる処理と、
をコンピュータに実行させるための情報処理プログラム。
【請求項9】
請求項7または8に記載の情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2007−179384(P2007−179384A)
【公開日】平成19年7月12日(2007.7.12)
【国際特許分類】
【出願番号】特願2005−378249(P2005−378249)
【出願日】平成17年12月28日(2005.12.28)
【出願人】(000002428)芝浦メカトロニクス株式会社 (907)