説明

URL短縮装置、短縮URL処理装置、方法及びプログラム

【課題】対照DB無しでURL短縮を実現する。
【解決手段】与えられた本来のURLの少なくとも一部をn進数に見立て、そのn進数より基数の大きなn+x進数に変換する(例えば、URLの数字部分を10進数に見立てて64進数に変換)ことにより、URLを短縮できるとともに、変換が可逆圧縮であることから実際のアクセス時には、圧縮されていた部分を元のn進数に逆変換することで変換前の部分が復元できるので、変換前後を対照するデータベースが不要となる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、URLの短縮に関する。
【背景技術】
【0002】
近年、ウェブ技術の普及高度化に伴い、ウェブページのURLは、ドメイン名、サブドメイン名、ディレクトリ名、ファイル名、引数の記述などで長くなりがちである。他方、ミニブログの文字数制限や電子メールの改行などメッセージ伝達上の都合で、少ない文字数でウェブページを特定する需要がある。これらの事情から、URLを短い文字列で表現するURL短縮の技術が提案されている。
【0003】
従来、URL短縮の技術としては、数字など比較的短い文字列を本来のURLと予め対応付け、そのような文字列の入力を専用のプログラムやサイトで受け付けて対応する本来のURLへのアクセスを発生させる提案(例えば、特許文献1参照)や、そのような文字列を特定のURLと組合せた短縮URLへのアクセスを、対応する本来のURLへアクセスを転送する提案(例えば、特許文献2参照)などが知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−24117号
【特許文献2】特開2002−91847号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、これら従来の技術では、本来のURLと、それに対応する文字列や短縮URLなどの情報とを対応付けるデータベース(以下「対照DB」と略称する)が必須であったため、その更新や維持などの負担が大きいという課題があった。なお、ハッシュ関数を用いてURLを圧縮する手法も提案されているが、この手法も、圧縮したURL等と本来のURLとを対応させる対照DBを不要とするものではなかった。
【0006】
上記の課題に対し本発明の目的は、対照DB無しでURL短縮を実現することである。
【課題を解決するための手段】
【0007】
上記の目的をふまえ、本発明の一態様(1)は、URL短縮装置であって、本来のURLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換する変換手段を有することを特徴とする。
【0008】
本発明の他の態様(10)は、上記態様を方法のカテゴリで捉えたもので、URL短縮方法であって、コンピュータが、URLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換する変換処理を含むことを特徴とする。
【0009】
本発明の他の態様(14)は、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、URL短縮プログラムであって、コンピュータを制御することにより、URLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換させることを特徴とする。
【0010】
本発明の他の態様(7)は、第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列から本来のURLを復元する短縮URL処理装置であって、与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元手段を有することを特徴とする。
【0011】
本発明の他の態様(12)は、上記態様を方法のカテゴリで捉えたもので、コンピュータが、第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列からURLを復元する短縮URL処理方法であって、コンピュータが、与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元処理を含むことを特徴とする。
【0012】
本発明の他の態様(16)は、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、コンピュータを制御することにより、第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列からURLを復元する短縮URL処理プログラムであって、コンピュータに、与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元処理を行わせることを特徴とする。
【0013】
このように、与えられた本来のURLの少なくとも一部をn進数に見立て、そのn進数より基数の大きなn+x進数に変換する(例えば、URLの数字部分を10進数に見立てて64進数に変換)ことにより、URLを短縮できるとともに、変換が可逆圧縮であることから実際のアクセス時には、圧縮されていた部分を元のn進数に逆変換することで変換前の部分が復元できるので、変換前後を対照するデータベースが不要となる。
【0014】
本発明の他の態様(2)は、上記いずれかの態様において、前記本来のURLのうち前記変換の対象とする前記一部を識別する識別手段を有し、前記識別手段は、ウェブサイトのトップページのURLと所定の関係を有するウェブページのURLを複数収集し、それら複数のURLの共通部分と差分を特定し、差分を前記一部と識別することを特徴とする。
【0015】
このように、同一ウェブサイト群を構成するウェブページ群のURL間の差分となる部分を変換の対象として識別することにより、変換対象を予め人手で識別し設定する負担無しで自動識別可能となる。
【0016】
本発明の他の態様(3)は、上記いずれかの態様において、短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成する生成手段を有することを特徴とする。
【0017】
本発明の他の態様(11)は、上記態様を方法のカテゴリで捉えたもので、上記いずれかの態様において、コンピュータが、短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成する生成処理を含むことを特徴とする。
【0018】
本発明の他の態様(15)は、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、上記いずれかの態様において、コンピュータを制御することにより、短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成させることを特徴とする。
【0019】
本発明の他の態様(8)は、上記いずれかの態様において、前記文字列復元手段は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元するURL復元手段を有することを特徴とする。
【0020】
本発明の他の態様(13)は、上記態様を方法のカテゴリで捉えたもので、上記いずれかの態様において、前記文字列復元処理は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、コンピュータが、前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元するURL復元処理を含むことを特徴とする。
【0021】
本発明の他の態様(17)は、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、上記いずれかの態様において、前記文字列復元処理は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、コンピュータを制御することにより、前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元させることを特徴とする。
【0022】
このように、短縮URLを処理するためのリダイレクト・サーバなどで、そのサーバなどにアクセスする所定のURLに続く圧縮文字列を原文字列に変換し、本来のURLを構成するドメイン名などのURL文字列と結合して本来のURLを復元することにより、アクセス元の端末側にウェブ・ブラウザのプラグイン・ソフトウェアといった特別な機能を予め導入しておくことは不要となるので、どのようなアクセス環境からでも、本発明で圧縮された短縮URLを円滑容易に活用することが可能となる。
【0023】
本発明の他の態様(4)は、上記いずれかの態様において、前記本来のURLのうち変換に係る前記一部を除く部分であるURL文字列を、そのURL文字列の内容に対応する所定の識別文字列に変換する識別変換手段を有し、前記生成手段は、変換された前記識別文字列を前記短縮URLに含めることを特徴とする。
【0024】
本発明の他の態様(5)は、上記いずれかの態様において、前記URL文字列は、トップレベルドメイン名もしくはセカンドレベルドメイン名の全体もしくは一部分、又はファイル拡張子であることを特徴とする。
【0025】
このように、ドメイン名や拡張子を対応する識別文字列に変換することにより、限られた対応付けのデータで効果的なURL短縮が可能となる。
【0026】
本発明の他の態様(9)は、上記いずれかの態様において、前記短縮URLに含まれる所定の識別文字列を、URLを構成する所定の文字列であるURL文字列であって前記識別文字列に対応付けられているものに変換する識別復元手段を有し、前記URL復元手段は、変換された前記URL文字列を、復元に係る前記本来のURLに含めることを特徴とする。
【0027】
このように、変換に係る部分を除く例えばドメイン名などに応じたカテゴリーコード等の識別文字列を短縮URLに含めることにより、従来よりも大幅にコンパクトなデータベースにより、位取り記数法を用いた変換以上の圧縮率で効果的にURLを短縮可能となる。
【0028】
本発明の他の態様(6)は、上記いずれかの態様において、前記変換手段は、前記第二の基数による位取り記数法で数を表記する際に、アラビア数字を含まない文字セットを用いることを特徴とする。
【0029】
このように、変換による圧縮文字列を、アラビア数字を含まない文字セットを用いて例えば54進数などで表現することにより、原文字列で10進表現された日付、通し番号などを変換対象部分として容易に識別できる。また、復元時も、短縮URLのうち圧縮文字列の部分を、アラビア数字を用いていないという特徴から容易に識別できる。
【0030】
なお、上記の各態様とは異なるカテゴリ(装置に対し方法、方法に対しプログラムなど)や、以下に説明するさらに具体的な各態様も本発明に含まれる。異なるカテゴリについては、「手段」を「処理」又は「ステップ」のように適宜読み替えるものとする。また、処理やステップの実行順序は以上記述したものに限定されず、適宜変更したりまとめて処理するなど、変更可能である。
【発明の効果】
【0031】
本発明によれば、対照DB無しでURL短縮を実現することができる。
【図面の簡単な説明】
【0032】
【図1】本発明の実施形態の構成を示す機能ブロック図。
【図2】本発明の実施形態で用いる情報(データ)を例示する図。
【図3】本発明の実施形態における端末によるURLの短縮及び復元について処理手順の一例を示すフローチャート。
【図4】本発明の実施形態におけるURLの短縮を例示する概念図。
【図5】本発明の実施形態におけるURLの復元を例示する概念図。
【図6】本発明の実施形態におけるサーバによるURLの短縮について処理手順の一例を示すフローチャート。
【図7】本発明の実施形態におけるURLの短縮を例示する概念図。
【図8】本発明の実施形態におけるサーバによるURLの復元について処理手順の一例を示すフローチャート。
【図9】本発明の実施形態におけるURLの復元を例示する概念図。
【発明を実施するための形態】
【0033】
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について、図に沿って説明する。なお、背景技術や課題などで既に述べた内容と共通の前提事項については適宜省略する。
【0034】
〔1.構成〕
本実施形態は、図1がその構成図であり、ウェブブラウザB(単に「ブラウザB」又は「ブラウザ」とも表す)を備えた端末T(T1,T2,T3,T5)でURLの短縮や復元を利用する例である。このようにURLの短縮と復元の機能について、端末T1とT2は自前で備え、端末T3とT5はサーバ4に依存する。このため、端末T1とT2にとって、端末T3やT5とサーバ4は省略可能で、また、端末T3やT5とサーバ4にとって、端末T1とT2は省略可能である。但し、端末T1又はT2と、端末T3又はT5との間で短縮URLを受け渡して利用する例も考えられ、それぞれ後述する。なお、装置(端末やサーバ)間の通信は通信ネットワークN(インターネット、携帯電話網、LANなど)を経て行う。
【0035】
図1に示す要素のうち、各端末Tは、エンドユーザがウェブページを閲覧する情報処理装置で、パーソナル・コンピュータ(PC)、ポータブル電子情報端末装置(スマートフォン、タブレットPC、携帯電話端末装置)などの他、インターネット接続機能付きのテレビ(テレビジョン受像機)など具体的な種類は自由で、また、図1では少数を模式的に例示するが、実際は多数存在する。
【0036】
各装置(端末T1,T2,T3,T5及びサーバ4)は、一般的なコンピュータの構成として少なくとも、CPUなどの演算制御部6と、記憶装置7(主メモリ、フラッシュメモリ、HDD等)と、通信ネットワークNとの通信手段8(無線や有線のLANアダプタ、通信ゲートウェイ装置など)と、を有する。特に各端末Tは、端末T1及びT2に例示するように、入出力装置9として、液晶表示パネルや有機EL(エレクトロ・ルミネセンス)表示パネルなどの表示装置と、その表示装置と一体のタッチパネル機能やその他ボタンなどの入力装置と、を有するが、他に音響の入出力装置としてマイクロフォンやスピーカ、ヘッドフォン機能などを用いてもよい。
【0037】
そして、各装置(端末T1,T2,T3,T5及びサーバ4)では、記憶装置7に予め記憶(インストール)した図示しない所定のコンピュータ・プログラムが演算制御部6を制御することで、図1に示す各手段などの要素(10,11,40など)を実現する。このうち、情報の記憶手段は、記憶装置7において各種のデータベース(「DB」とも表す)やファイル、配列等の変数、各種スタックやレジスタ、システム設定値など任意の形式で実現できる。
【0038】
このような記憶手段のうち、サーバ4の識別記憶手段4Dは、図2に例示するように、本来のURLのうち、変換による圧縮すなわち短縮の対象となる一部を除く部分(例えば、URLの末尾に位置する数字列などを除いたドメイン名、サブドメイン名、ディレクトリパスなど)であるURL文字列(例えば「http://chie.ya・・.jp/num」)と、そのURL文字列の内容に対応する所定の識別文字列(例えば「/c/」)と、を対応付けて記憶している手段である。なお、記憶手段以外の各手段は、以下のような情報処理の機能・作用を実現・実行する処理手段である。
【0039】
〔2.端末による変換の例〕
上記のように構成した本実施形態におけるURLの短縮及び復元について、まず、サーバ4に依存せず、端末T1やT2で行う処理手順の例を図3のフローチャートに示す。この例では、端末T3やT5、サーバ4は関わらないので省略可能である。また、この例において、端末T1やT2は、URLの短縮を行って短縮URLを得る変換手段11を有する点でURL短縮装置であるとともに、短縮URLを元のURLに復元する文字列復元手段12を有する点で短縮URL処理装置である。
【0040】
この短縮URL処理装置は、一般化して表現すれば、第一の基数とそれより大きな第二の基数とを用いて、本来のURLを変換した圧縮文字列からURLを復元する装置である。ここで、「位取り記数法」は、数を表す形式の一つで、1より大きい自然数N(「基数」や「底」と呼ぶ)を定め、アラビア数字などでN種類の数字や記号を並べ、隣り合う上位の桁に下位の桁のN倍の意味を与えて数を表現する。基数がNの位取り記数法を「N進法」、それによる表記を「N進表記」、N進表記された数字を「N進数」のように呼ぶ。2進数、10進数、16進数などが多く用いられる。
【0041】
このような基数変換を含む変換手段11や文字列復元手段12などの機能は、例えば、ブラウザBに組み合わせるツールバーなどのプラグイン・ソフトウェアや、その他の常駐プログラムなどで実現できる。
【0042】
〔2−1.端末でのURL短縮〕
上記のような端末T1において、URLを短縮する場合(ステップS11:「YES」)を図4の概念図に示す。この図に示すように、変換手段11は、まず、与えられた元のURL(U)すなわち本来のURLについて、その少なくとも一部(例えばアラビア数字が連続する下線部「1245415917」)を変換対象部分と、それ以外の部分(「URL文字列X」と呼ぶこととする。例えば「http://chie.ya・・.jp/num」)と、に分割する(ステップS12)。
【0043】
ここで、本来のURLのうち変換の対象とする前記一部を識別する識別手段15を設けることができる。識別手段15は、ウェブサイトのトップページのURLと所定の関係を有するウェブページのURLを複数収集し、それら複数のURLの共通部分と差分を特定し、差分を前記一部と識別する。このように変換対象部分である原文字列Gの部分と、URL文字列Xの部分とを識別するためのさらに具体的な手法の例としては、まず、URLを短縮しようとする対象とするウェブサイトのトップページのURLを取得し、そのトップページと関連(例えばURL同士の重複が長いなど)するページのURLを複数クロールするか、又はトップページに貼られたリンク先のURLを収集する。そして、収集したそれら複数のURLの共通部分と差分を特定し、共通部分はURL文字列X、差分は原文字列G、と識別する。
【0044】
例えば、

http://chie.ya・・jp/num12345
http://chie.ya・・jp/num12346
http://chie.ya・・jp/num002
http://chie.ya・・jp/num78999
http://chie.ya・・jp/num123
http://chie.ya・・jp/num1234
http://chie.ya・・jp/num123456
http://chie.ya・・jp/num1234567
http://chie.ya・・jp/num9099990
http://chie.ya・・jp/num1111111111

のような複数のURLから共通部分と差分を特定すれば、「num」より後の連続したアラビア数字が変換対象部分である原文字列Gと判別できる。
【0045】
そして、変換手段11は、変換対象部分である原文字列Gについて、第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列C(例えば「BKO4nt」)に基数変換する(ステップS13)。ここでは、10進数と64進数を例に取り、図4に示すように、変換対象部分の原文字列Gについて10進数とみなして、それを64進表記する文字列である圧縮文字列Cに変換するものとする。
【0046】
そのうえで、変換手段11は、分割しておいたURL文字列X(「http://chie.ya・・.jp/num」)と、上記のように変換した圧縮文字列C(「BKO4nt」)と、を結合して短縮URL(Y)を生成し(ステップS14)、生成した短縮URL(Y)を記憶、送信などに供する(ステップS15)。
【0047】
〔2−2.端末でのURL復元〕
上記のように生成された短縮URL(Y)は、同じ端末T1上でURL記憶手段10などにブラウザBのブックマークなどとして記憶しておき、元のURLへのアクセスに用いてもよいし、端末T1と同様に構成した他の端末T2に、電子メールやインスタントメッセンジャーなどで受け渡し、端末T2上で元のURLへのアクセスに用いてもよい。どちらも復元時の処理内容は同じであるが、ここでは端末T2上で元のURLを復元するものとする。
【0048】
この場合、端末T2で短縮URL(Y)を処理して元のURLを復元する場合(ステップS21:「YES」)の例を、図5の概念図に示す。この図に示すように、復元の場合、文字列復元手段12は、まず、与えられた短縮URL(Y)を、復元対象部分(例えば64進表記部分)である圧縮文字列C(例えば下線部の「BKO4nt」)と、それ以外の部分であるURL文字列X(例えば「http://chie.ya・・.jp/num」)と、に分割する(ステップS22)。
【0049】
復元の際に圧縮文字列Cと、それ以外の文字列とを識別容易にする手法としては、第二の基数による位取り記数法で数を圧縮文字列Cとして表記する際に、アラビア数字を含まない文字セットを用いることが考えられる。例えば、64進数の使用文字セットから「0」〜「9」を除いた54進数で短縮URLの圧縮文字列Cを表現しておく。すなわち、64進数で表現しても数値「0」〜「9」のみの文字列になることがあり、例えば10進数「128」は64進数では「20」になり、10進数の20と区別が付かない。
【0050】
そこで、上記のように54進表現を用いることにより、元のURL(U)の原文字列Gについては、日付、通し番号、JANコードなど10進表現しておくことで変換対象部分であることを識別できる。また、短縮URL(Y)のうちどの部分が圧縮文字列Cかについても、10進数を用いていないという特徴から容易に識別できる。
【0051】
54進数を用いれば、Base64に代表される64進数ベースの既存技術に基づく親和性や再利用性に優れる。なお、64進数の使用文字セットから「0」〜「9」に加え「−」も除いた53進数で短縮URLの圧縮文字列Cを表現しておいてもよく、53進数を用いれば上記に準じた作用効果に加え、アラビア数字とハイフンを用いたコード体系が多用されている現状に優れた適合が得られる。
【0052】
そして、文字列復元手段12は、復元対象部分として与えられた圧縮文字列Cを、前記第二の基数による位取り記数法で表記された数(この場合は64進数)とみなして、前記第一の基数による位取り記数法で数を表記する文字列(この場合は10進数)である原文字列G(例えば「1245415917」)に基数変換する(ステップS23)。そして、文字列復元手段12は、分割しておいたURL文字列X(例えば「http://chie.ya・・.jp/num」)と、上記のように圧縮文字列Cから変換により復元した原文字列G(「1245415917」)と、を結合して元のURL(U)を復元し(ステップS24)、復元した元のURL(U)について、ブラウザのブックマークなどとして記憶しておいたり、ウェブページへのアクセスなどの処理に供する(ステップS25)。
【0053】
〔3.サーバによる変換の例〕
次に、URLの短縮と復元を、端末T3やT5からサーバ4の機能を用いて行う処理手順の例を図6及び図8のフローチャートに示す。なお、図3から図5に示した例では、URL文字列の部分は圧縮しなかったが、図6からの例では、図7及び図9に示すように、URL文字列の部分(例えば「http://chie.ya・・.jp/num」)を、短縮URLを処理するための所定のURL(「処理用URL」と呼ぶこととする。例えば「http://yj.pn」)及び所定の識別文字列(例えば「/c/」)に変換し、短縮URLでウェブページにアクセスする際はこの処理用URLにアクセスして元のURLへのリダイレクトを受ける場合を示す。
【0054】
〔3−1.サーバによるURL短縮〕
このように短縮URLを作成する場合、端末T3は、図6のフローチャートに示すように、短縮しようとする元のURLを、URL短縮装置であるサーバ4へ送信する(ステップS31)。この送信については、例えば、URL短縮のための所定のウェブページにアクセスし、そのページ内の入力欄に元のURLを入力して変換を指示するボタンを操作するなどが考えられるが、APIの利用など具体的には自由である。
【0055】
短縮しようとする元のURLを受信したサーバ4では、変換受付手段40が、図4の例と同様、図7の概念図に示すように、受信した元のURL(U)について、変換対象部分(例えば「1245415917」)と、それ以外の部分であるURL文字列X(例えば「http://chie.ya・・.jp/num」)と、に分割する(ステップS40)。
【0056】
そして、変換手段41は、変換対象部分である原文字列G(「1245415917」)について第一の基数による位取り記数法(この場合は10進数)で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法(この場合は64進数)で数を表記する文字列である圧縮文字列C(例えば「BKO4nt」)に基数変換する(ステップS41)。また、識別変換手段42が、識別記憶手段4D(図2)を参照することにより、本来のURL(U)のうち変換に係る原文字列Gを除く部分であるURL文字列X(「http://chie.ya・・.jp/num」)を、そのURL文字列Xの内容に対応する所定の識別文字列F(ここでは「/c/」)に変換する(ステップS42)。
【0057】
そのうえで、生成手段44が、短縮URLを処理するための所定の処理用URL(E)と(ここでは「http://yj.pn」とする)、識別文字列F(上記の例では「/c/」)と、変換された前記圧縮文字列(「BKO4nt」)と、を結合することにより短縮URL(Z)を生成して(ステップS43)、生成した短縮URLを端末T3へ送信する(ステップS44)。すなわち、この例では、生成手段44は、変換された識別文字列F(「/c/」)を短縮URL(Z)に含める。このように生成された短縮URLは、端末T3が受信して(ステップS32)、ブラウザのブックマークなどとして記憶しておいたり、ウェブページへのアクセスなどの処理に供する。
【0058】
なお、上記の例(例えば「chie.ya・・.jp/num」→「/c/」のような個別のドメインやサブドメインに限らず、汎用性の高いURL文字列X(例えば、属性型すなわち組織種別型のJPドメイン名など)は、個別に識別記憶手段4DなどのDBに記憶しておくことができる。例えば、汎用性の高いURL文字列Xに対し短い識別文字列Fを、「.net」=「1」、「.com」=「2」、・・・「co.jp」=「7」のように記憶しておく。同様に、よく使う拡張子等も種類が限られているので「.html」=「1」、「.htm」=「2」、「.pdf」=「3」のように対応付けて記憶しておく。これにより、原文字列Gを対照DB無しで圧縮できるだけでなく、対応付けの最小限のデータを多くのURLに適用して効果的なURL圧縮が可能となる。
【0059】
上記に例示したいくつかの対応付けに基づき、例えば、元のURL

http://12354115917.net/123456.html

から、対応付けに係る部分を「.net」=「1」、「.html」=「1」のように置き換えれば

12354115917/1/123456/1

となる。これをさらに64進変換すれば

BK04nt/1/AJJ/1

となる。そのうえで、処理用URL(E)である例えば「http://yj.pn」とする)と結合すれば

http://yj.pn/BK04nt/1/AJJ/1

のように短縮URLが生成できる。
【0060】
〔3−2.サーバによるURL復元〕
また、上記のように生成した短縮URLを記憶しておいた端末T3や、その短縮URLを電子メール、ミニブログ、メッセンジャーサービスなどで受け取った端末T5などは、ブラウザBでその短縮URL(Z)へのアクセスを試みることにより、図8のフローチャート及び図9の概念図に示すように、短縮URLが復元できる。よい。この場合、短縮URL(Z)の冒頭部分は所定の処理用URL(E)であり(この例では「http://yj.pn」)、この処理用URL(E)には、短縮URL処理装置でもあるサーバ4の特にアクセス受付手段45を、DNS(ドメイン・ネーム・システム)により予め対応付けておく。
【0061】
この結果、短縮URL(Z)にアクセスしようとするブラウザBは、短縮URL(Z)内の処理用URL(E)によりサーバ4にアクセスすることとなる(図8のステップS33)。そして、図9に例示するように、サーバ4のアクセス受付手段45は、アクセスであるページリクエストとして短縮URL(Z)を受信すると、受信した短縮URL(Z)を分割することにより、復元対象部分としてアクセスに付随する文字列である圧縮文字列C(例えば64進表記部分である下線部の「BKO4nt」)を取得すると共に、短縮URL(Z)に含まれる識別文字列F(例えば「/c/」)を取得する(ステップS45)。
【0062】
そして、文字列復元手段47は、上記のような処理用URL(E)へのアクセスに付随する文字列である圧縮文字列C(「BKO4nt」)を、第二の基数による位取り記数法で表記された数(この場合は64進数)とみなして、第一の基数による位取り記数法で数を表記する文字列(この場合は10進数)である原文字列G(「1245415917」)に基数変換する(ステップS46)。また、識別復元手段46は、識別記憶手段4D(図2)を参照することにより、短縮URL(Z)に含まれる識別文字列F(「/c/」)を、URLを構成する所定の文字列であるURL文字列であってその識別文字列Fに対応付けられているURL文字列X(例えば「http://chie.yah・・.jp/num」)に変換する(ステップS47)。
【0063】
このURL文字列Xは、処理用URL(E)に対応する本来のURL(ここではURL文字列X)を構成する文字列であり、URL復元手段49は、識別記憶手段4Dを参照して変換したURL文字列X(「http://chie.yah・・.jp/num」)と、上記のように圧縮文字列Cから変換により復元した原文字列G(「1245415917」)と、を結合することにより本来のURLすなわち元のURLを復元し(ステップS48)、復元した元のURL(U)にアクセスをリダイレクトする応答を端末T5に対して行う(ステップS49)。
【0064】
この応答に応じて端末T5のブラウザBは、元のURLに対応するリダイレクト先のページを表示する(ステップS34)。なお、復元した元のURLは、リダイレクトに限らず、単に端末T5に返信するなどして、以降の活用態様を端末T5の側に一任してもよい。
【0065】
〔4.効果〕
以上のように、本実施形態では、与えられた本来のURLの少なくとも一部をn進数(例えば10進数)に見立て、そのn進数より基数の大きなn+x進数(例えば64進数)に変換することにより(例えば図4、図7)、URLを短縮できるとともに、変換が可逆圧縮であることから実際のアクセス時には、圧縮されていた部分を元のn進数に逆変換することで変換前の部分が復元できるので(例えば図5、図9)、変換前後を対照するデータベースが不要となる。
【0066】
特に、本実施形態では上記のように、ブログを始めとして日時などの数字連続部分を含むURLは多いので、そのようなURLに対して本発明はとりわけ有用であり、さらに、38進数など十分な基数に見立てれば、数字だけでなく、ローマ字やスラッシュ、ピリオドなども任意のN進数に変換可能であり、変換対象はURLの一部に限らず全部でもよく、URL短縮の利点や応用範囲が拡大できる。
【0067】
また、本実施形態では上記のように、同一ウェブサイト群を構成するウェブページ群のURL間の差分となる部分を変換の対象として識別することにより、変換対象を予め人手で識別し設定する負担無しで自動識別可能となる。
【0068】
さらに、本実施形態では上記のように、短縮URLを処理するためのリダイレクト・サーバなど(例えばサーバ4)で、そのサーバなどにアクセスする所定のURLに続く圧縮文字列を原文字列に変換し、本来のURLを構成するドメイン名などのURL文字列と結合して本来のURLを復元することにより(例えば図9)、アクセス元の端末(例えば端末T3、T5)側にウェブ・ブラウザのプラグイン・ソフトウェアといった特別な機能を予め導入しておくことは不要となるので、どのようなアクセス環境からでも、本発明で圧縮された短縮URLを円滑容易に活用することが可能となる。
【0069】
加えて、本実施形態では上記のように、ドメイン名や拡張子を対応する識別文字列に変換することにより、限られた対応付けのデータで効果的なURL短縮が可能となる。
【0070】
とりわけ、本実施形態では上記のように、変換に係る部分を除く例えばドメイン名などに応じたカテゴリーコード等の識別文字列を短縮URLに含めることにより(例えば図7)、従来よりも大幅にコンパクトなデータベースにより、位取り記数法を用いた変換以上の圧縮率で効果的にURLを短縮可能となる。
【0071】
また、本実施形態では上記のように、変換による圧縮文字列を、アラビア数字を含まない文字セットを用いて例えば54進数などで表現することにより、原文字列で10進表現された日付、通し番号などを変換対象部分として容易に識別できる。また、復元時も、短縮URLのうち圧縮文字列の部分を、アラビア数字を用いていないという特徴から容易に識別できる。
【0072】
〔5.他の実施形態〕
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、サーバ4で生成する短縮URLは、リダイレクト処理を受けるための処理用URLを含むタイプ(例えば図7)でも、含まないタイプ(例えば図4)でもよいが、少なくとも前者の処理用URLを含むタイプは、端末T3、T5、T1やT2に限らず従来同様の端末からのアクセスでもサーバ4のアクセス受付手段45に届いてURL復元やリダイレクトなどの処理を受けることができる。
【0073】
また、上記実施形態では、端末T1で生成した短縮URLは、同じ構成の端末T2で復元し、端末T3がサーバ4で生成させた短縮URLは復元も同様にサーバ4に行わせたが、端末T1やT2の構成や機能をサーバ4に組み込んだり、逆にサーバ4の構成や機能を個々の端末T1やT2に組み込んでもよい。これにより、例えば、端末T1やT2で生成した短縮URLからサーバ4において、URL中から64進数部分を判別するなどとして元のURLを復元したり、サーバ4によるリダイレクトを経ずに端末T1やT2で完結する処理によって、識別文字列を利用したURLの短縮や復元を行うなど、処理のバリエーションが拡大する。
【0074】
また、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路など他の情報処理機構で実現してもよい。また、各構成図、データの図、フローチャートの図などは例示に過ぎず、各要素の有無、その配置順序や各処理の実行順序、具体的内容などは適宜変更可能である。例えば、サーバは、構成要素となるサーバなどの装置を複数用いて実現してもよく、個々の記憶手段を別個独立のサーバ装置やシステムで実現する構成も一般的である。
【0075】
特に、上記実施形態では、URL短縮装置としての変換手段41などの機能と、短縮URL処理装置としての文字列復元手段47などの機能とを、サーバ4として一体に構成する例を示したが、URL短縮装置と短縮URL処理装置は相互に別個独立の装置として実現してもよい。また、機能によっては、外部のプラットフォーム等をAPI(アプリケーション・プログラム・インタフェース)やネットワークコンピューティング(いわゆるクラウドなど)で呼び出して実現するなど、構成は柔軟に変更できる。
【符号の説明】
【0076】
4 サーバ
4D 識別記憶手段
6 演算制御部
7 記憶装置
8 通信手段
9 入出力装置
11,41 変換手段
15 識別手段
12,47 文字列復元手段
40 変換受付手段
42 識別変換手段
44 生成手段
45 アクセス受付手段
46 識別復元手段
49 URL復元手段
B ウェブブラウザ(ブラウザ)
C 圧縮文字列
E 処理用URL
F 識別文字列
G 原文字列
N 通信ネットワーク
T(T1,T2,T3,T5) 端末
U 元のURL
X URL文字列
Y,Z 短縮URL

【特許請求の範囲】
【請求項1】
本来のURLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換する変換手段を有することを特徴とするURL短縮装置。
【請求項2】
前記本来のURLのうち前記変換の対象とする前記一部を識別する識別手段を有し、
前記識別手段は、ウェブサイトのトップページのURLと所定の関係を有するウェブページのURLを複数収集し、それら複数のURLの共通部分と差分を特定し、差分を前記一部と識別する
ことを特徴とする請求項1記載のURL短縮装置。
【請求項3】
短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成する生成手段
を有することを特徴とする請求項1又は2記載のURL短縮装置。
【請求項4】
前記本来のURLのうち変換に係る前記一部を除く部分であるURL文字列を、そのURL文字列の内容に対応する所定の識別文字列に変換する識別変換手段を有し、
前記生成手段は、変換された前記識別文字列を前記短縮URLに含める
ことを特徴とする請求項3記載のURL短縮装置。
【請求項5】
前記URL文字列は、トップレベルドメイン名もしくはセカンドレベルドメイン名の全体もしくは一部分、又はファイル拡張子であることを特徴とする請求項4記載のURL短縮装置。
【請求項6】
前記変換手段は、前記第二の基数による位取り記数法で数を表記する際に、アラビア数字を含まない文字セットを用いることを特徴とする請求項1から5のいずれか一項に記載のURL短縮装置。
【請求項7】
第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列から本来のURLを復元する短縮URL処理装置であって、
与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元手段を有することを特徴とする短縮URL処理装置。
【請求項8】
前記文字列復元手段は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、
前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元するURL復元手段を有することを特徴とする請求項7記載の短縮URL処理装置。
【請求項9】
前記短縮URLに含まれる所定の識別文字列を、URLを構成する所定の文字列であるURL文字列であって前記識別文字列に対応付けられているものに変換する識別復元手段を有し、
前記URL復元手段は、変換された前記URL文字列を、復元に係る前記本来のURLに含める
ことを特徴とする請求項8記載の短縮URL処理装置。
【請求項10】
コンピュータが、URLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換する変換処理を含むことを特徴とするURL短縮方法。
【請求項11】
コンピュータが、短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成する生成処理
を含むことを特徴とする請求項10記載のURL短縮方法。
【請求項12】
コンピュータが、第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列からURLを復元する短縮URL処理方法であって、
コンピュータが、与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元処理を含むことを特徴とする短縮URL処理方法。
【請求項13】
前記文字列復元処理は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、
コンピュータが、前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元するURL復元処理を含むことを特徴とする請求項12記載の短縮URL処理方法。
【請求項14】
コンピュータを制御することにより、URLの少なくとも一部について第一の基数による位取り記数法で表記された数とみなして、前記第一の基数より大きな第二の基数による位取り記数法で数を表記する文字列である圧縮文字列に変換させることを特徴とするURL短縮プログラム。
【請求項15】
コンピュータを制御することにより、短縮URLを処理するための所定のURLと、変換された前記圧縮文字列と、を結合することにより短縮URLを生成させる
ことを特徴とする請求項14記載のURL短縮プログラム。
【請求項16】
コンピュータを制御することにより、第一の基数とそれより大きな第二の基数とを用いて、URLを変換した圧縮文字列からURLを復元する短縮URL処理プログラムであって、
コンピュータに、与えられた圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換する文字列復元処理を行わせることを特徴とする短縮URL処理プログラム。
【請求項17】
前記文字列復元処理は、短縮URLを処理するための所定のURLへのアクセスに付随する文字列である圧縮文字列を、前記第二の基数による位取り記数法で表記された数とみなして、前記第一の基数による位取り記数法で数を表記する文字列である原文字列に変換し、
コンピュータを制御することにより、前記所定のURLに対応する本来のURLを構成する文字列であるURL文字列と、変換された前記原文字列と、を結合することにより本来のURLを復元させることを特徴とする請求項16記載の短縮URL処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−164184(P2012−164184A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【出願番号】特願2011−24774(P2011−24774)
【出願日】平成23年2月8日(2011.2.8)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】