説明

電子ジャーナル編集システム及び原稿編集方法

【課題】原稿中の引用文献の記述に基づいて、引用文献の記述に誤記があるか否か等を示すチェックシートを作成することのできるシステムを提供する。
【解決手段】電子ジャーナル編集システムは、テキストデータを含む原稿を受け付ける受付手段51と、受付手段51によって受け付けた原稿に記述されている引用文献から書誌情報を抽出し、抽出した書誌情報に基づいてデータベースを検索し、当該書誌情報に対応する文献の識別情報を取得する文書検索手段52と、原稿に記述されている引用文献毎に、書誌情報と識別情報とを対応付けたチェックシートを作成するチェックシート作成手段55と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子ジャーナル等において原稿を編集するための情報処理技術に関する。
【背景技術】
【0002】
従来、学術論文の発表は、紙媒体の学術誌を通して行われていたが、昨今、インターネット上の電子ジャーナルで論文が公開されることが一般的になっている。
【0003】
ところで、インターネット上で公開される論文には、多くの場合、各論文をユニークに特定するための識別子であるDOI(デジタル・オブジェクト識別子:Digital Object Identifier)が付与される。DOIとは、インターネット上で公開された論文の所在地を示すための世界共通のコード体系であり、URLの変更等に左右されず論文のオリジナルの所在地を特定できる。
【0004】
具体的には、DOIは「10.1039/j29710000797」のようなコードであり、図書や雑誌の単位だけでなく、その中に含まれる章、論文、表など、どのような単位にでも付与可能である。そして、このDOIを使うことによって、当該DOIに対応付けられる論文のオリジナルデータにアクセスすることが可能となる。
【0005】
DOIを用いて論文のオリジナルデータを閲覧する場合、例えば、crossref.org(非特許文献1)により提供されるWebページにおいて、DOIを入力するためのテキストボックスにDOIを入力して検索ボタンを押すと、当該DOIに対応付けられたURLをディレクトリサーバから取得し、当該URLを用いて論文のオリジナルデータにアクセスできる。また、DOIのディレクトリサーバを示すURL「http://dx.doi.org/」の後ろにDOIを付加したURL「http://dx.doi.org/10.1039/j29710000797」を使用して、文献に直接アクセスすることもできる。なお、ディレクトリサーバには、DOIと当該DOIによって特定される論文のオリジナルデータが存在するURLとが対応付けられて管理されている。また、crossref.orgには、論文等の書誌情報とDOIとが対応付けられたデータベースも管理されている。
【非特許文献1】「crossref.org」、[online]、[平成19年9月4日検索]、インターネット<URL:http://www.crossref.org/>
【発明の開示】
【発明が解決しようとする課題】
【0006】
ところで、上述のとおり、インターネット上の電子ジャーナルで論文が公開されることが一般的になり、紙媒体で論文誌を発行していた頃と比べて、研究者の論文執筆・閲覧環境は変化している。しかしながら、各々の論文の引用文献の記載の正確さについては、電子化前と変わらず、依然として著者の記述を信用するにとどまっている。論文の原稿を受領後、論文を公開する前の段階で、編集出版側で引用文献の記載に誤記等がないかを検証し、必要に応じて修正することは、検証負担という人的な観点並びに査読及び出版スケジュールという時間的な観点から見て、非常に困難である。
【0007】
本発明は、かかる事情に鑑み、論文等の原稿文書において、引用文献として記述された文献に基づいて、チェックシートを作成することのできるシステムを提供しようとするものである。また、原稿中の引用文献の記述に誤記があるか否かを自動的に検証し、投稿者に誤記の可能性等を指摘して修正を促すことのできるシステムを提供することを目的とする。さらに、引用文献の電子ジャーナル等へのリンクの存在を自動的に確認し、リンクが存在する場合には当該リンクを文書原稿に埋め込んだ上で、当該文書を利用(公開、流通、印刷等)できるようにすることを目的としている。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明の電子ジャーナル編集システムは、テキストデータを含む原稿を受け付ける受付手段と、受付手段によって受け付けた原稿に記述されている引用文献から書誌情報を抽出し、抽出した書誌情報に基づいてデータベースを検索し、当該書誌情報に対応する文献の識別情報を取得する検索手段と、原稿に記述されている引用文献毎に、書誌情報と識別情報とを対応付けたチェックシートを作成するチェックシート作成手段と、を備える。なお、ここでいう「データベース」とは、本電子ジャーナル編集システムとネットワークを介して接続される文献データベースのことであり、例えば、crossref.org等のデータベースを含む。
【0009】
このとき、検索手段は、書誌情報に基づいた検索をしても識別情報を取得できない場合、書誌情報の一部を変更した検索式を用いた曖昧検索を実行して識別情報の取得を試み、曖昧検索によって識別情報を取得できた場合には、当該曖昧検索に用いた検索式を基に誤記の箇所を推定し、チェックシート作成手段は、誤記の箇所に関する情報を含むチェックシートを作成する、ことが好ましい。
【0010】
また、チェックシート作成手段は、識別情報を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、生成されたリンク情報を埋め込んだチェックシートを作成する、ことが好ましい。
【0011】
さらに、チェックシート作成手段は、作成したチェックシートを電子メールに添付して、原稿の投稿者又は著者宛にメール送信する、ことが好ましい。
【0012】
また、好適には、検索手段が書誌情報を用いた検索により識別情報を取得した後、当該識別情報で識別される文献の著者名と、原稿に記述されている著者名とを比較して、原稿の記述に誤りがないか否かを確認するダブルチェック手段と、をさらに備える。
【0013】
さらに好適には、チェックシートを作成した後、識別情報を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、生成されたリンク情報を原稿に埋め込んだ電子論文を作成するリンク埋込手段と、をさらに備える。
【0014】
ここで、書誌情報は、文献のジャーナル名、発行年、巻、及び、ページを含む、ことが好ましい。
【0015】
また、本発明の原稿編集方法は、システムの動作又は処理を制御するための制御手段を備える電子ジャーナル編集システムにおいて、制御手段が原稿を編集する方法である。この方法は、テキストデータを含む原稿を受け付けるステップと、受け付けた原稿に記述されている引用文献から書誌情報を抽出し、抽出した書誌情報に基づいてデータベースを検索し、当該書誌情報に対応する文献の識別情報を取得するステップと、原稿に記述されている引用文献毎に、書誌情報と識別情報とを対応付けたチェックシートを作成するステップと、を備える。
【0016】
本発明のプログラムは、本発明のリンク生成方法の各ステップをコンピュータに実行させることを特徴とする。本発明のプログラムは、CD−ROM等の光学ディスク、磁気ディスク、半導体メモリなどの各種の記録媒体を通じて、又は通信ネットワークなどを介してダウンロードすることにより、コンピュータにインストール又はロードすることができる。
【0017】
なお、本明細書等において、手段とは、単に物理的手段を意味するものではなく、その手段が有する機能をソフトウェアによって実現する場合も含む。また、1つの手段が有する機能が2つ以上の物理的手段により実現されても、2つ以上の手段の機能が1つの物理的手段により実現されてもよい。
【発明の効果】
【0018】
本電子ジャーナル編集システムによれば、論文等の原稿文書において、引用文献として記述された文献に基づいて、書誌情報及び識別情報を含むチェックシートを作成することができる。そして、作成されたチェックシートを利用することにより、引用文献の記述に誤りがないか否かを確認できるという効果を奏する。
【0019】
また、本電子ジャーナル編集システムによれば、原稿中の引用文献の記述に誤記があるか否かを自動的に検証し、誤記の可能性がある場合には、その誤記の箇所を含む情報を投稿者等に指摘して修正を促すことができる。これにより、引用文献の記述に誤記がある場合に、速やかに修正できるという効果を有する。
【0020】
さらに、本電子ジャーナル編集システムによれば、引用文献の電子ジャーナル等へのリンクの存在を自動的に確認し、リンクが存在する場合には当該リンクを文書原稿に埋め込んだ上で、当該文書を利用(公開、流通、印刷等)できるようにしている。このように、文書を公開する段階で、リンクを埋め込んだ形で公開するため、文書を利用する際の利便性が向上するという効果を奏する。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施の形態について図面を参照しつつ詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。
【0022】
図1は本発明の一実施形態に係る電子ジャーナル編集システム10を含むシステム全体の概略構成を示すブロック図である。図1に示すように、本電子ジャーナル編集システム10は、文献データベースサーバ(文献DBサーバ)20と、一以上のユーザ端末装置30とが、ネットワークNを介して相互に接続されることにより構成される。
【0023】
電子ジャーナル編集システム10は、電子ジャーナルに投稿された論文原稿の電子データ(以下、「電子原稿」という)に含まれる引用文献へのリンクを当該電子原稿に自動的に埋め込む機能、及び、引用文献のリンクに関するレポートを作成し、論文投稿者に送信する機能を備えるコンピュータシステムである。詳細は後述する。
【0024】
文献DBサーバ20は、既に公開されている電子論文のメタデータである属性情報と当該電子論文を識別するための識別情報とを対応付けて文献データベース(文献DB)25に管理し、電子論文の属性情報の入力に基づいて当該文献DB25を検索し、当該属性情報に対応付けられた識別情報を出力するためのコンピュータサーバである。ここで、属性情報とは、ジャーナル(論文誌)の名称、発行年、巻、及びページを含む書誌情報、並びに、著者名等、電子論文を一意に特定するための各種情報(メタデータ)の一部又は全部を意味する。また、識別情報とは、既に公開済みの電子論文を一意に特定するための識別子であり、例えば、DOI(デジタル・オブジェクト識別子)などを利用することが好ましい。
【0025】
なお、文献DBサーバ20には、インターネット上の電子論文誌等で公表される論文や、紙媒体で発行された論文誌等に掲載される論文が電子データ化されたものが管理されることが好ましい。具体的には、crossref.orgなどのDOIを管理するWebサーバや、PubMedなどのデータベースサーバ等が該当する。また、複数の文献DBサーバ20を併用してもよい。
【0026】
ユーザ端末装置30は、論文投稿者が使用するパーソナルコンピュータ(PC)や携帯電話機、携帯情報端末等の端末装置であり、電子ジャーナル編集システム10に電子原稿を送信し、引用文献の記載に関するチェックシートを受信する機能を備える。好適には、電子メールを送受信するためのメーラを備える。また、Webサイトを閲覧するためのブラウザを備え、ネットワークN上で公開されている電子論文を閲覧できることが好ましい。
【0027】
ネットワークNは、電子ジャーナル編集システム10と、文献DBサーバ20と、ユーザ端末装置30との間で情報を送受信するための通信回線である。例えば、インターネット、LAN、専用線、パケット通信網、電話回線、企業内ネットワーク、その他の通信回線、それらの組み合わせ等のいずれであってもよく、有線であるか無線であるかを問わない。
【0028】
なお、電子ジャーナル編集システム10や文献DBサーバ20は、単一のコンピュータより構成されるものであっても、ネットワーク上に分散した複数のコンピュータより構成されるものであってもよい。
【0029】
図2は、電子ジャーナル編集システム10の構成の一例を示すブロック図である。電子ジャーナル編集システム10は、電子ジャーナル編集システム10全体の処理や動作を制御するCPU等の制御手段50と、電子ジャーナル編集システム10の実行する処理に必要な各種情報を記憶するためのメモリや記憶装置等を含む記憶手段60とを備える。また、図示省略するが、情報の入出力を行う入出力インタフェース、通信を行うための通信インタフェースと、これら各手段を結ぶバスなどを備える。
【0030】
制御手段50は、受付手段51と、文書検索手段52と、識別情報取得手段53と、ダブルチェック手段54と、チェックシート作成手段55と、リンク埋込手段56と、を含んで構成される。なお、電子ジャーナル編集システム10は、制御手段50が記憶手段60などに記憶された所定のプログラムを実行することにより、上記各手段を実装するよう、電子ジャーナル編集システム10を機能させる。
【0031】
また、記憶手段60は、ISSN記憶手段61と、引用文献情報記憶手段62と、曖昧辞書情報記憶手段63とを含んで構成される。また、好ましくは、記憶手段60は、以前に引用した文献(電子論文)の属性情報と識別情報とを対応付けて記憶するキャッシュを備えることが好ましい。
【0032】
受付手段51は、論文原稿の投稿を受け付ける機能を備える。好ましくは、論文の著者等の投稿者が、電子メールに電子原稿を添付又は貼り付けて、ユーザ端末装置30から電子ジャーナル編集システム10に当該電子メールを送信し、受付手段51が当該電子メールに添付又は貼り付けられた電子原稿を受け取る。
【0033】
電子原稿のフォーマットは、テキストデータ、文書作成アプリケーション(ワープロソフト)を用いて作成した文書データ、PDF等の文書データ、TIFF等の画像データを利用することができるが、LaTeX等の組版データの形式で電子原稿が記述されることが望ましい。本実施形態では、電子原稿がLaTeXで記述されているものとして説明する。
【0034】
文書検索手段52は、受付手段51により受け付けられた電子原稿から引用文献が記述されている箇所を識別して書誌事項を抽出し、抽出した書誌事項を文献DBサーバ20に送り、文献DB25を検索する機能を備える。電子原稿がLaTeXのようなマークアップ言語で記述されている場合は、原稿中のタグを利用して引用文献を抽出することが好ましい。また、電子原稿を全文検索し、「参考文献」又は「References」等の単語や項目立てを検出することによって引用文献を抽出してもよい。他にも、引用文献の記載は、所定の型に沿って記載されることが一般的であるので、この所定の型を用いたパターンマッチングにより、引用文献を抽出してもよい。そして、電子原稿に記述されている引用文献の一つ一つにから、ジャーナル名、発行年、巻、ページを含む書誌情報を抽出する。なお、検索に使用する書誌情報は、必要に応じて任意のものを使用すればよい。
【0035】
また、論文に記載される引用文献は、投稿するジャーナルごとに一定のフォーマットに従って記載されることが一般的である。そこで、ジャーナルごとに書誌情報を抽出するためのフォーム情報を予め設定しておくことにより、検索に必要な書誌情報を取得することができる。
【0036】
電子論文から抜き出した書誌情報をそのまま利用して文献DBサーバ20を検索しても、検索結果を得られないとき、文書検索手段52は、検索式の一部を変更した曖昧検索を行う。このとき、曖昧辞書情報記憶手段63に記憶される曖昧辞書を利用して検索式を変更する。例えば、曖昧辞書情報記憶手段63を参照して、検索式中のジャーナル名称を「Journal of International ・・・」から「Jour. Int. ・・・」に変更する。また、検索する書誌情報の種類を一部入れ替えたり、除いたりしてもよい。
【0037】
識別情報取得手段53は、文書検索手段52によって書誌情報に対応する文献を文献DB25から取得できた場合に、DOI等の文献固有の識別情報を取得する機能を備える。取得した識別情報は、引用文献情報記憶手段62に記録する。なお、識別情報取得手段53の機能を文書検索手段52に組み込んで、文書検索手段52としてまとめて構成してもよい。
【0038】
ダブルチェック手段54は、書誌情報を用いて検索した文献が正しいものであるか否かを再確認する機能を備える。本実施形態では、ジャーナル名、発行年、巻、ページによって文献DB25を検索するため、例えば、発行年に誤記があっても、それ以外のジャーナル名、巻、ページがたまたま一致する文献があれば、そのたまたま一致した文献の識別情報を取得してしまうというエラーが起きる。そこで、検索に用いた書誌情報とは異なる属性情報を用いて、検索の結果取得した文献が正しいか否かを確認する。
【0039】
本実施形態では、第一著者名に基づいて、ダブルチェック処理を行う。すなわち、書誌情報を用いて文献DB25から取得した文献の第一著者名と、電子原稿に記述された第一著者名とを比較して、両者が一致しない場合には、第一著者名が異なる旨を引用文献情報記憶手段62に記録して、その旨を投稿者に報告する。なお、第一著者名とは、論文の著者が複数の場合は、最初に記載されている筆頭の著者の氏名であり、論文の著者が単独の場合は、当該単独の著者の氏名である。
【0040】
チェックシート作成手段55は、引用文献情報記憶手段62に記録された情報に基づいて、電子原稿で引用された引用文献のチェックシートを作成する機能を備える。チェックシートの詳細は後述するが、本実施形態では、電子原稿内に記述された引用文献の書誌情報、識別情報、及び、誤記等の可能性がある場合にはその旨等を含むHTMLの一覧表形式のチェックシートが作成され、作成されたチェックシートは、電子メール添付で電子原稿の投稿者等に送信される。このとき、電子メールの送信先には、受付手段51により受け付けた電子メールの送信元や、電子原稿中に著者の電子メールアドレスが記載されている場合にはそのアドレスを使用すればよい。
【0041】
リンク埋込手段56は、識別情報取得手段53により取得されたDOI等の識別情報に基づいて、引用文献のオリジナルデータに直接アクセスするためのリンク情報(URL)を生成し、当該生成されたリンク情報を電子原稿中の当該引用文献が記載されている部分に埋め込む機能を備える。なお、識別情報取得手段53が識別情報を取得できなかった文献については、リンクを埋め込まない。
【0042】
また、ISSN記憶手段61は、ジャーナル名(論文誌の名称)とISSNとを対応付けて記憶したデータベースである。ジャーナル名として、正式名称や省略名称等、複数のバリエーションを記憶させてもよい。
【0043】
引用文献情報記憶手段62は、チェックシートを作成する際の基になる情報を記憶する機能を備える。本実施形態では、文献毎に、電子原稿中の引用文献の記述から抜き出した著者名及びジャーナル名と、文献の照合可否及び相違箇所等の有無を示すステータスと、電子原稿中に引用文献として記述されたジャーナル名に基づいて抽出したISSNと、電子原稿中の引用文献の記述から抽出した発行年、巻(ボリュームナンバー)及びページと、文献DBを照合した結果取得した文献の識別情報と、電子原稿中の引用文献の記述と文献DBから取得した文献との間で記載に相違箇所がある場合にはその相違箇所と、を対応付けて記憶する。
【0044】
曖昧辞書情報記憶手段63は、ジャーナル名からISSNを検索する際、又は、書誌情報から文献を検索する際に、検索式の一部を変更等して曖昧検索を実行する場合に参照される辞書情報を記憶するデータベースである。例えば、ジャーナルの正式名称と略称との対応付けや、単語とその略語との対応付けが曖昧辞書情報として記憶されている。
【0045】
図3は、電子ジャーナル編集システム10における処理手順の一例を示すフローチャートである。
【0046】
まず、研究者等が論文を執筆した後、論文を電子ジャーナル編集システム10に投稿する。このとき、研究者等は、電子メールに論文の電子ファイル(電子原稿)を添付して、ユーザ端末装置30から電子ジャーナル編集システムに当該電子メールを送信することによって論文を投稿する。
【0047】
研究者等がユーザ端末装置30から電子原稿を電子メールで送信すると、電子ジャーナル編集システム10は当該電子メールを受信し、受付手段51が電子原稿の投稿を受け付ける(S101)。
【0048】
文書検索手段52は、受け付けた電子原稿に記載されている引用文献のうち、ある一つの引用文献について書誌情報を抽出し、当該書誌情報に基づいて文献DB25を検索する(S102)。具体的には、文書検索手段52は、まず、引用文献の記載から書誌情報を抽出する。書誌情報とは、文献DB25を検索する際の検索キーに用いる情報であり、引用文献の国際標準逐次刊行物番号(ISSN: International Standard Serial Number)、発行年、巻、ページを含むことが好ましい。ISSNについては、引用文献のジャーナル名(雑誌名)を抽出してISSN記憶手段61を検索することにより、当該ジャーナル名に対応するISSNを取得する。そして、文書検索手段52は、抽出した書誌情報を文献DBサーバ20に送って文献DB25を検索し、文献DBサーバ20から検索結果を受信する。書誌情報に対応する文献を照合できた場合は、当該文献の識別情報を受信し、照合できなかった場合は、検索エラーの旨を受信する。なお、ISSNに換えて、引用文献の記載から抽出したジャーナル名をそのまま書誌情報として利用して、文献DB25を検索するようにしてもよい。
【0049】
書誌情報に基づいて文献DB25で文献を照合できた場合、すなわち、電子ジャーナル編集システム10が文献DBサーバ20から識別情報を受信した場合(S103:YES)、識別情報取得手段53は、受信した識別情報を、引用文献の識別情報として取得して、識別情報を書誌情報とともに引用文献情報記憶手段62に格納する(S107)。
【0050】
一方、文献DB25から文献を照合できず検索エラーを受信した場合や、引用文献記載のジャーナル名からISSNを取得できない場合(S103:NO)、文書検索手段52は、書誌情報に基づく曖昧検索を行う(S104)。曖昧検索とは、検索キーの一部を変更・削除等して行う検索である。そして、曖昧検索の結果、書誌情報に対応する文献を照合できた場合、すなわち、電子ジャーナル編集システム10が文献DBサーバ20から識別情報を受信した場合(S105:YES)、識別情報取得手段53は、識別情報と書誌情報を引用文献情報記憶手段62に格納するとともに、曖昧検索の結果から推定される引用文献の誤記の箇所(相違箇所)を引用文献情報記憶手段62に格納する(S106、S107)。
【0051】
本実施形態においては、曖昧辞書情報記憶手段63を参照して検索キーの一部を変更・削除等することによって曖昧検索を行う。例えば、検索エラーを受信した場合、巻もしくは発行年を間違えて書いている可能性があるので、書誌情報の中の一部の条件だけで照合が取れるかどうか試し、これで文献を照合できた場合は当該照合条件から外した間違っている可能性のある項目(相違箇所)を引用文献情報記憶手段62に記録する。つまり、書誌情報から巻を削除して、ISSN、発行年、ページで検索を再実行し、文献を照合できたときには、巻を相違箇所として記録する。また、書誌情報から発行年を削除して、ISSN、発行年、ページで検索を再度実行し、文献を照合できたときには、発行年を相違箇所として記録する。これにより、単に発行年や巻に誤記があるだけの場合であれば、正しい文献の識別情報を取得可能になる。
【0052】
また、論文中に記載される引用文献は、分野やジャーナルにより、書誌情報の各項目の記載順序、特に、発行年、巻、ページの記載の順番が異なることがある。また、ジャーナルによっては巻の項目がなく、年の情報だけで代用している場合がある。このような表記方法の間違いや流儀の違いを吸収するため、例えば、括弧でくくられている4桁の1900〜2000番台の数字は年とみなすといったルールや、年だけ記述して巻の記述は不要なジャーナル名のリスト等を曖昧辞書情報記憶手段63に蓄積し、パターンマッチングにより曖昧検索を実行してもよい。
【0053】
さらに、ジャーナル名からISSNを取得できない場合には、曖昧辞書情報記憶手段63を参照して、ジャーナル名の候補をいくつか変えることにより、ジャーナル名の記述の曖昧さを吸収することが好ましい。すなわち、略称表記のバリエーション、よくある間違い例などを予め曖昧辞書情報記憶手段63に登録しておき、パターンマッチングにより正しい雑誌名の候補を挙げる。例えば、「Jour. Int. ・・・」との記述を「Journal of International ・・・」に変更してISSNの取得を試みる。
【0054】
文書検索手段52は、文献を照合できるまで、或いは、曖昧辞書情報記憶手段63を参照して実行し得る全ての曖昧検索のバリエーションを試みるまで、曖昧検索を繰り返す。曖昧検索の全てのバリエーションを試みても文献を照合できなかった場合(S105:NO)、識別情報取得手段53は、識別情報欄を文献未発見の旨を示すブランクにして、書誌情報のみを引用文献情報記憶手段62に記録する(S108)。なお、識別情報取得手段53は、引用文献の記述から、引用文献が一般の書籍(本)であることを判別可能な場合は、引用文献情報記憶手段62に、書誌情報と文献タイプが本であることを記録する。
【0055】
文書検索手段52により文献が照合され、識別情報を取得したときには(S107)、さらに、ダブルチェック手段54が、照合の結果として文献DB25から取得した文献と、電子原稿中で実際に引用文献として記述されている文献との間で、第一著者名(ファーストオーサー(first author))の名字を比較する(S109)。両者の第一著者名が一致していない場合は(S110:NO)、引用文献の記述に間違いのある可能性があると判断して、不一致箇所を引用文献情報記憶手段62に記録する(S111)。第一著者名が一致する場合は(S110:YES)、そのまま処理を続ける。
【0056】
電子ジャーナル編集システム10は、受領した電子原稿に記載されている全ての引用文献に対して、ステップS102からステップS111までの文献照合処理を実行する。なお、電子原稿がLaTaXで記述されていれば、引用文献記述用のタグを利用して、引用文献の記載を自動抽出することができる。また、ワープロやPDF等の文書データであれば、テキストのパターンマッチングで、引用文献の記載を自動抽出することができる。
【0057】
電子原稿に記載されている全ての引用文献に対して文献照合処理を終えると(S112:YES)、チェックシート作成手段55は、引用文献情報記憶手段62に記録された内容に基づいて、引用文献のチェックシートを作成し、作成したチェックシートを電子メールに添付して論文投稿者にメール送信する(S113)。このチェックシートとは、受領した電子原稿に記述されていた引用文献の表記及びこれより抽出された各書誌情報が、表と
して表された表データである。本実施形態では、HTML形式のチェックシートが作成され、この際、電子原稿中の引用文献の記述が間違っている可能性がある場合は、チェックシートの中でその旨がコメントとして付記されるようになっている。
【0058】
図4乃至図7はそれぞれ、チェックシートの一例を示す図である。本実施形態において、チェックシート作成手段55は、HTMLの表形式で、チェックシートを作成する。なお、チェックシートは引用文献情報記憶手段62に格納された情報に基づいて作成されるものであり、引用文献情報記憶手段62のデータ構造と、チェックシートに出力される表の構造とは、一致することが好ましい。
【0059】
本実施形態において作成されるチェックシートは、電子原稿中の引用文献の記述から抜き出した著者名及びジャーナル名を表示する表記欄71と、文献の照合可否及び相違箇所等の有無を示すステータス欄72と、電子原稿中に引用文献として記述されたジャーナル名に基づいて抽出したISSNを表示するISSN欄73と、電子原稿中の引用文献の記述から抽出した発行年、巻(ボリュームナンバー)及びページをそれぞれ表示する発行年欄74、巻欄75及びページ欄76と、照合の結果取得した文献の識別情報を表示し、相違箇所がある場合にはその相違箇所を指摘するコメント欄77とを含む。すなわち、表記欄71、発行年欄74、巻欄75及びページ欄76には、受領した電子原稿の引用文献の記述から抽出した著者名及びジャーナル名、発行年、巻並びにページがそのまま表示される。
【0060】
ステータス欄72は、「OK」、「CHECK」、「BOOK」、又はブランク(空白)、のいずれかが表示される。文献DB25から文献を照合でき、かつ、引用文献の記述に誤りがないと判定される引用文献には「OK」が表示される。文献を照合できたものの、電子原稿に記述された引用文献の記述内容と文献DB25から取得した文献の記述内容に相違等があり、論文投稿者の確認を要する引用文献には「CHECK」が表示される。引用文献が一般の書籍であると判定された引用文献には「BOOK」が表示される。また、文献DB25から文献を照合できなかった引用文献は、何も表示されず、ブランク(空白)になる。
【0061】
コメント欄77は、照合の結果文献DB25から取得したDOI等の識別情報を表示する。この識別情報に対して、DOI等に基づくリンクを埋め込んでおくことが好ましい。
【0062】
例えば、図4に示すチェックシートにおいて、行81に表示される引用文献1は、表記欄71の上段の著者名表記が「F.Yin,H.−K.Shin,Y.−S.Kwon」であり、下段のジャーナル名表記が「Biosens.Bioelectron.2005,21,21」である。ジャーナル名表記から判別・抽出したISSN、発行年、巻、ページはISSN欄73、発行年欄74、巻欄75、ページ欄76に表示され、それぞれ、「09565663」、「2005」、「21」、「21」であることを示している。そして、これらのISSN、発行年、巻、ページによって抽出された識別情報(本実施形態では、DOI)が、コメント欄77に、「10.1016/j.bios.2005.04.014」というように表示される。なお、このコメント欄77に表示される識別情報には、当該識別情報を用いたリンク情報が埋め込まれ、ユーザがこのリンクをクリック等することにより、引用文献を閲覧できるようになっている。そして、引用文献1については、検索結果に問題が無いので、ステータス欄72に「OK」が表示される。
【0063】
また、行82の引用文献2は、電子原稿中に実際に記述されている内容と、文献DB25から抽出された文献との間で、著者名に相違が見られる場合を示している。このとき、図4に示すように、ステータス欄72に「CHECK」を表示するとともに、コメント欄77に、第一著者名が相違する旨を表示して、投稿者等に注意喚起を促す。このとき、コメント欄77には、文献DB25に登録されている第一著者名の表記が表示されるとともに、書誌情報から取得した識別情報(DOI)も合わせて表示する。ユーザは、識別情報からリンクされる文献を閲覧して、抽出された引用文献(当該識別情報により識別される文献)が自分の意図していた文献か否か、また、著者名の表示が正しいか否か等を確認することができる。
【0064】
図5の行83に表示される引用文献1は、電子原稿中に記述されている引用文献のジャーナル名の表記が、ISSN記憶手段61に記憶されているジャーナル名の表記と相違する場合の一例である。ジャーナル名の表記等については、多少の表記に相違があっても識別情報を取得できるよう、曖昧辞書情報記憶手段63に表記の揺れを吸収するための辞書が記憶されている。この曖昧辞書情報記憶手段63を用いてISSNを取得した場合には、図5に示すように、ステータス欄72に「OK」を表示しつつ、ISSN欄73には括弧書きでISSNを表示し、コメント欄77に、正しいジャーナル名として予想される表記の候補と、当該候補に基づいて取得した識別情報(DOI)を表示する。識別情報からリンクされている文献を閲覧して、当該識別情報が正しいか否かをユーザが確認できる点は、上述と同様である。
【0065】
図6の行84に表示される引用文献1aは、一般の書籍(本)を引用している場合の一例である。文書検索手段52は、電子原稿に記述されている引用文献が一般の書籍等であると判断した場合には、図6に示すように、ステータス欄72に「BOOK」と表示し、ISSN欄73からコメント欄77までをブランク表示する。
【0066】
行85の引用文献6は、識別情報を取得できなかった場合の一例である。この例では、電子原稿に記述されている引用文献のジャーナル名の表記から、ISSNを取得することができなかったため、ISSN欄73がブランク(空欄)になっている。それにより、文献DB25から識別情報を取得できなかったため、コメント欄77のブランクになっていて、結果的に、ステータス欄72もブランクになっている。このように、ISSNや識別情報を取得できない場合には、チェックシートの該当箇所がブランク表示されるため、ユーザは、このブランク表示の項目を見て、引用文献の記述が正しいものであるか否かを確かめることができる。
【0067】
図7の行86に表示される引用文献10は、電子原稿中に記述されている引用文献のジャーナル名の表記が、ISSN記憶手段61に記憶されているジャーナル名の表記と相違し、かつ、電子原稿中に記述されている発行年の表記が誤っていると判断された場合の一例である。本実施形態では、この例に示すように、引用文献の記述に多少の誤記が存在しても、曖昧検索により識別情報を取得できるようになっている。そして、曖昧検索の結果、誤記であると判断された箇所は、チェックシート中に括弧書きで表示させ、かつ、コメント欄に誤記の確認を促すコメントを付ける。なお、識別情報のリンクに基づいて、予想される文献を簡単に閲覧することができるので、誤記の確認及び修正を容易に行うことができる。
【0068】
こうして、論文投稿者は、電子メールで受信したチェックシートに基づいて、引用文献の記述に誤りがないか否か、また、引用文献の記述に基づいて取得された識別情報(DOI)が正しいか否かを確認し、引用文献の記述や識別情報に誤りがあれば、正しい引用文献の記述や、識別情報に誤りがある旨を、電子ジャーナル編集システム10に電子メール等により連絡する。
【0069】
電子ジャーナル編集システム10は、チェックシートを送信した後、論文投稿者からの確認を受信したとき若しくは所定期間応答がないとき、又は、論文投稿者からの修正等の依頼を受けて電子原稿の記述及び引用文献情報記憶手段62の該当箇所を修正等した後、リンク埋込手段56が、引用文献情報記憶手段62に記憶されている情報に基づいて、引用文献のオリジナルデータに直接アクセスするためのリンク情報(URL)を生成し、電子原稿の引用文献記載箇所に当該リンク情報を付加する(S114)。
【0070】
図8は、リンク埋込手段56により電子原稿に埋め込まれるリンク情報の一例を示す図である。同図(A)は、リンク情報が埋め込まれる前の電子原稿の引用文献記載箇所の記述の一例を示す図である。この例では、a)〜c)の3文献が引用されている。同図(B)は、リンク情報が埋め込まれた後の引用文献記載箇所の記述の一例を示す図である。なお、同図において、下線は説明のために付記したものである。同図の例では、a)とc)の2文献についてはDOIを取得でき、b)の文献についてはDOIを取得できなかった場合を示している。リンク埋込手段76は、取得したDOI(例えば、10.1039/j29710000797)に所定の文字列(http://dx.doi.org/)を付加して文献のオリジナルデータにアクセスするためのURL等のリンク情報(例えば、http://dx.doi.org/10.1039/j29710000797)を生成し、公開する電子原稿のファイル形式に合わせた所定フォーマット(例えば、\href[http://dx.doi.org/10.1039/j29710000797])よって電子原稿にリンク情報を埋め込む。
【0071】
なお、図8に示すように、本実施形態では、論文投稿者から受領したLaTeX形式で記述されたテキストデータに、テキストデータで記述されたリンク用のタグを追加する形で、リンク情報の埋め込み処理を行っている。このため、リンク情報が埋め込まれたテキストデータも、やはりLaTeX形式で記述されているため、LaTeX処理系で加工等を行うことができる点に特徴を有している。
【0072】
こうして、引用文献へのリンク情報が埋め込まれた後、電子原稿は公開され、電子論文として広く利用されるようになる(S115)。公開された電子論文は、例えば、LaTeXの種々の処理系を介して様々な形で利用可能である。例えば、処理系を介してPDF等の画像データを生成し、電子ジャーナルとして公開してもよい。このとき、電子論文に付加されたリンク情報に基づいて、画像データ中の引用文献記載箇所に、クリッカブルなリンクを埋め込むと、当該電子ジャーナルの読者が引用文献を容易に閲覧することができるので、画像データの利便性が高まる。
【0073】
また、リンク情報が付加された電子論文は、そのまま組版データとして利用することもできるので、組版用に特別な加工等を施すことなく、容易に論文の印刷や出版を行うことができる。
【0074】
なお、本発明は、上記した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述の各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更して又は並列に実行することができる。
【0075】
例えば、本実施形態においては、電子ジャーナルに投稿される論文の引用文献にリンク情報を自動的に埋め込む例を示したが、論文に限らず、レポートや本の電子データ、その他、文献を引用するあらゆる文書データに適用できる。
【0076】
また、本実施形態においては、識別情報としてDOIを利用して電子論文を識別し、リンク情報を生成するものとしたが、識別情報はDOIに限定されない。さらに、本実施形態においては、電子原稿中の引用文献のリンクを自動生成する例を示したが、文献以外にも音楽や映像データ等のデジタルオブジェクトを引用する場合にも適用可能である。
【0077】
さらに、本実施形態においては、文献DBサーバ20が文献DB25を備えるものとしたが、文献DB25に相当するデータベースを電子ジャーナル編集システム10が備えるものとしてもよい。このとき、文書検索手段52は、まず、電子ジャーナル編集システム10のローカルで管理されるデータベースを検索し、文献を取得できない場合に初めて、外部の文献DBサーバ20にアクセスして文献DB25を検索する。このように、まずローカルのデータベースを検索して識別情報の取得を試みることによって、通信コストやトラフィックの負荷を抑えることができるとともに、全体の処理スピードを向上させることができる。
【0078】
また、識別情報取得手段53が、文献DBサーバ20から識別情報を取得したとき、取得した識別情報と当該識別情報に係る文献の属性情報とを対応付けて、電子ジャーナル編集システム10のローカルデータベースに蓄積する機能を備えてもよい。これにより、過去に識別情報を取得した文献をローカルで管理することができ、文書検索手段52が文献を検索・取得する際に、ローカルデータベースをキャッシュとして利用することが可能となる。論文に引用される文献は特定の文献に集中することが多いため、一度使用した識別情報をローカルで管理することは、処理効率の大幅な向上に寄与する。
【図面の簡単な説明】
【0079】
【図1】電子ジャーナル編集システム10を含むシステム全体の概略構成を示すブロック図である。
【図2】電子ジャーナル編集システム10の構成の一例を示すブロック図である。
【図3】電子ジャーナル編集システム10における処理手順の一例を示すフローチャートである。
【図4】チェックシートの一例を示す図である。
【図5】チェックシートの一例を示す図である。
【図6】チェックシートの一例を示す図である。
【図7】チェックシートの一例を示す図である。
【図8】電子原稿に埋め込まれるリンク情報の一例を示す図である。
【符号の説明】
【0080】
10 電子ジャーナル編集システム
20 文献データベースサーバ
25 文献データベース
30 ユーザ端末装置
50 制御手段
51 受付手段
52 文書検索手段(検索手段)
53 識別情報取得手段
54 ダブルチェック手段
55 チェックシート作成手段
56 リンク埋込手段
60 記憶手段
61 ISSN記憶手段
62 引用文献情報記憶手段
63 曖昧辞書情報記憶手段
N ネットワーク

【特許請求の範囲】
【請求項1】
テキストデータを含む原稿を受け付ける受付手段と、
前記受付手段によって受け付けた原稿に記述されている引用文献から書誌情報を抽出し、抽出した書誌情報に基づいてデータベースを検索し、当該書誌情報に対応する文献の識別情報を取得する検索手段と、
前記原稿に記述されている引用文献毎に、前記書誌情報と前記識別情報とを対応付けたチェックシートを作成するチェックシート作成手段と、
を備える電子ジャーナル編集システム。
【請求項2】
前記検索手段は、
前記書誌情報に基づいた検索をしても識別情報を取得できない場合、前記書誌情報の一部を変更した検索式を用いた曖昧検索を実行して識別情報の取得を試み、曖昧検索によって識別情報を取得できた場合には、当該曖昧検索に用いた検索式を基に誤記の箇所を推定し、
前記チェックシート作成手段は、
前記誤記の箇所に関する情報を含むチェックシートを作成する、
ことを特徴とする請求項1記載の電子ジャーナル編集システム。
【請求項3】
前記チェックシート作成手段は、
前記識別情報を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、生成されたリンク情報を埋め込んだチェックシートを作成する、
ことを特徴とする請求項1又は2記載の電子ジャーナル編集システム。
【請求項4】
前記チェックシート作成手段は、
作成したチェックシートを電子メールに添付して、前記原稿の投稿者又は著者宛にメール送信する、
ことを特徴とする請求項1乃至3のいずれかに記載の電子ジャーナル編集システム。
【請求項5】
前記検索手段が前記書誌情報を用いた検索により識別情報を取得した後、当該識別情報で識別される文献の著者名と、前記原稿に記述されている著者名とを比較して、前記原稿の記述に誤りがないか否かを確認するダブルチェック手段と、
をさらに備えることを特徴とする請求項1乃至4のいずれかに記載の電子ジャーナル編集システム。
【請求項6】
前記チェックシートを作成した後、前記識別情報を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、生成されたリンク情報を前記原稿に埋め込んだ電子論文を作成するリンク埋込手段と、
をさらに備えることを特徴とする請求項1乃至5のいずれかに記載の電子ジャーナル編集システム。
【請求項7】
前記書誌情報は、
文献のジャーナル名、発行年、巻、及び、ページを含む、
ことを特徴とする請求項1乃至6のいずれかに記載の電子ジャーナル編集システム。
【請求項8】
システムの動作又は処理を制御するための制御手段を備える電子ジャーナル編集システムにおいて、前記制御手段が原稿を編集する方法であって、
テキストデータを含む原稿を受け付けるステップと、
前記受け付けた原稿に記述されている引用文献から書誌情報を抽出し、抽出した書誌情報に基づいてデータベースを検索し、当該書誌情報に対応する文献の識別情報を取得するステップと、
前記原稿に記述されている引用文献毎に、前記書誌情報と前記識別情報とを対応付けたチェックシートを作成するステップと、
を備える原稿編集方法。
【請求項9】
請求項8に記載の原稿編集方法をコンピュータに実行させるためのプログラム。
【請求項10】
請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−64091(P2009−64091A)
【公開日】平成21年3月26日(2009.3.26)
【国際特許分類】
【出願番号】特願2007−229225(P2007−229225)
【出願日】平成19年9月4日(2007.9.4)
【出願人】(394004332)小宮山印刷工業株式会社 (2)
【出願人】(506009095)
【Fターム(参考)】