Internet ArchiveのWayBack Machineは便利でありがたい存在すぎる。
あなたにとって、資料として、データベースとして、非常に有用なサイトがあるとする。
何か困ったことがあって調べたいとき、そのサイトにアクセスして答えを得ることがよくあるだろう。
そういった資料価値の高いサイトは大抵、ページ数も多いので、全ページをローカルに保存しておくというのも、ちょっと面倒で避けてしまうと思う。
ところが、そんなサイトが突然何らかの理由で閉鎖されてしまったり、アクセスできなくなってしまったら……。
そんな時に、とっても便利でありがたいのが、Internet Archive(インターネット・アーカイブ)のWayBack Machine(ウェイバック・マシン)です。
このWayBack Machine、なんと世界中のWebページを、時系列毎に保存してくれているという、とんでもなくありがたい存在なのです。
時系列毎、というのは、例えば http://xxx.yyy.com/zzz.html というページの2005年10月の状態、11月の状態、12月の状態を、それぞれ保存してくれている、という感じ。
なので、頻繁に内容が更新されるページでも、ある程度はその経緯を追うことが可能なわけです。
Google等の検索エンジンのキャッシュ機能だと、常に最新のページを保存しているので、こういった使い方はできにくいですよね。
消えちゃったページのキャッシュは、いずれ検索にヒットしなくなるので探せなくなってしまいますし。
ただ、このめちゃくちゃ便利なWayBack Machineも、立場によっては非常に厄介な存在にもなり得るわけです。
存在を抹消したい、所謂「黒歴史」的なページも延々とWeb上に存在し続けるわけですから。
僕自身、大昔にネット初心者だった頃に運営していた、とってもイタいサイトが今でもどこかに残っているのか、と思うと、恥ずかしくて時々真夜中に奇声を発したくなっちゃいます。
ビジネスとしてWebサイトを運営している場合なんかは、下手をすると真夜中の奇声どころでは済まされないデメリットになることもあるたろうということは、容易に想像できます。
一応、WayBack Machineからの削除方法(英語)もちゃんと掲載されているんですが、見ての通り、robots.txtを利用する方法です。
なので、既にドメインの契約を切った後だったり、レンタルサーバーの契約を解除した後に、ログを削除したくなった場合なんかには、どうしようもないわけですよね。
結局のところ、Webサイトを持つということは、全世界に情報を発信しているんだ、ということをしっかり自覚して、後から見ても恥ずかしくない言動を、ということになるわけですかねぇ。
まあ何にせよ、僕自身はこのWayBack Machineの存在は、とにかく非常にありがたく感じています。
以前このブログで書いたように、ちょうど前に趣味で運営していたサイトがサーバー会社から追い出された関係で、そのサイトに自分で掲載していたWeb系のTipsが消えてしまって、僕自身がとっても困っています。
もともと、自分が毎回検索とかして調べるのがめんどくさいから、自サイトでまとめていたTipsなだけに、自分へのダメージがデカいわけです。
というわけで、WayBack Machine様のお力を借りて、前のサイトで掲載していたTipsなんかを、ちょっとずつこちらに転載していこうと思います。
あくまで目的は有用な情報の保管ですからね。
決して、これでブログのネタに困った時に、適当に過去ログひっぱってくればいいから楽だー、なんて考えていませんので悪しからず。いやほんとに。まじで。うん。
ちなみに、WayBack Machineと似たようなので、ウェブ魚拓というものもありますね。
こっちは手動でページを保管するので、意図的にリアルタイムでその時のサイトの状態を保管しておきたい時用ですね。
最近だと、炎上したブログが閉鎖される前に、閉鎖後も情報の共有ができるように、とかの用途でよく使われている気がします。
「臭いものに蓋」的発想で「マズいことが起きたら削除」では駄目ってことですね。
何か問題を起こしちゃったら、ちゃんと向き合おう。誤魔化しは効きません。っていうわけですか。