WEBアーカイブの意味と使い方まとめ
WEBアーカイブとは、WEBサイト上の情報を保存しておくことをいいます。
WEBサイトは日々、情報が更新され削除されていきます。そのため、過去の情報がそのままの形で残っているということは少なく、削除されて過去の情報が無くなる前にWEBアーカイブをすることで情報を残すことができるのです。
過去の出来事を知るためには書籍や文書を参考にする必要があります。今までは紙に情報として残されてきました。ですが、インターネットが発展したためにデジタル化が進み、さまざまな情報は電子情報として残されるようになりました。
WEBアーカイブとは
WEBアーカイブとはWEBサイト上に情報を残すことを意味します。
WEBサイトを閲覧していると情報が削除されたり更新されたりします。いつの情報なのか分からないということもあります。ですが、WEBアーカイブがあれば元はどのような情報だったのか、いつの情報なのかを知ることができます。
そのため、インターネットから消えてしまった情報も閲覧することができるようになります。
WEBアーカイブを実施している事業
WEBアーカイブは、インターネットから削除される前に情報を保存しておくことが可能なため、世界中の国立図書館や公的な機関を中心におこなっています。
日本では国立国会図書館が2002年からWARP(インターネット資料収集保存事業)を行っています。そのため、国立国会図書館には今ではインターネット上から削除されてしまった歴史の情報も残っています。
WEBアーカイブでWARPをおこなう意味
WARPはWeb Archiving Prpjectの略でインターネット資料収集保存事業という意味です。
役割として、WEBアーカイブにより日本国内のWEBサイトの情報を保存していることが挙げられます。インターネット上の情報は更新、削除されることが頻繁にあり、WEBサイト自体が無くなってしまうこともあります。
現在では公的機関が発行する報告書や過去の重要な資料が紙媒体から電子情報に移り変わっています。
そこで、重要資料を将来にわたり利用できるよう、WEBサイトの情報を定期的に収集、保存をします。そうすることで、インターネット上から情報が無くなってしまっても公的機関の重要資料などを閲覧することができるようになります。
WARP(インターネット資料収集保存事業)には、このような意味があります。
WEBアーカイブの使い方
すでにインターネット上から削除されてしまったWEBサイトのような昔のサイト情報を確認するためにはどうしたらいいのか疑問に感じると思います。実際に使うためには、次のようななんらかのツールを用いなくてはなりません。
- WAYBACK MACHINE
- ウェブ魚拓
- Archive.today
- Heritrix
- Pagefreezer
WAYBACK MACHINEとは
WAYBACK MACHINEとは、無料で過去のWEBサイトの情報を閲覧することができる無料ツールです。WAYBACK MACHINEは、すでに削除されてしまったWEBサイトの情報を閲覧したい人には有効活用できます。
WAYBACK MACHINEの使い方
WAYBACK MACHINEでWEBアーカイブされた情報を閲覧するための手順は次のとおりです。
- WAYBACK MACHINEのWEBサイトにアクセスする
- 閲覧したいWEBサイトのURLを入力し、「BROWSE HISTORY」をクリックする
- 棒グラフに表示された年をクリックする
- 表示されたカレンダーの水色になっている日付をクリックする
- 表示された吹き出しの中の時間をクリックする
この手順で進めることで、閲覧したいWEBサイトの過去情報を知ることができます。
ウェブ魚拓とは
ウェブ魚拓はクローラによって自動でサイト情報を集めるのではなく、利用者が残したいものを自身でウェブ魚拓にWEBアーカイブするものです。
ウェブ魚拓は画像データやFLASHなどのデータも保存されるため、ほとんど同じようにページの内容を再現することができます。しかし、ウェブ魚拓によるアクセスを遮断するサイトも増えているため注意しなくてはなりません。
ウェブ魚拓の使い方
ウェブ魚拓でWEBアーカイブされた情報を閲覧するための手順は次のとおりです。
- ウェブ魚拓のWEBサイトにアクセスする
- ウェブ魚拓を取りたいWEBサイトのURLを入力し、「検索と確認」をクリックする
- 「取得」をクリックする
ウェブ魚拓にWEBアーカイブされていないときは、「このまま魚拓をとる」という欄から新規に取得することができます。
しかし、すでにWEBアーカイブされた情報の場合は、それを共有という形で閲覧することになります。
Archive.todayとは
アーカイブトゥデイは、JavaScriptを多く用いるWEBサイトにも対応してWEBアーカイブすることができるサービスです。
調べたいURLを入力すると、WEBアーカイブとして短縮URLが生成されます。また、過去に取得保存されたページの検索をすることもできます。
Archive.todayの使い方
Archive.todayでWEBアーカイブされた情報を閲覧するための手順は次のとおりです。
- Archive.todayのWEBサイトにアクセスする
- WEBアーカイブをしたいWEBサイトのURLを入力し、「submit url」をクリックする
Archive.todayは、WEBサイトのページ内容を他のサービスと同様にWEBアーカイブできます。加えて、ZIPでのダウンロードに対応し、画像としても保存することもできます。
Pagefreezerとは
PageFreezerは、規制コンプライアンスを満たすためにWEBアーカイブを行っているサービスです。SNSのコンテンツ、テキストメッセージ、WEBサイトの全体図、法人向けコラボレーションプラットフォームもWEBアーカイブできます。
WEBアーカイブで保存する方法
WEBアーカイブをしてWEBサイトの情報を保存する方法はいくつかパターンがあります。
例えば以下のようなものがあります。
- パソコンのブラウザ上で保存する方法
- iPhoneで保存する方法
パソコンのブラウザ上で保存する方法
パソコンのブラウザ上でWEBアーカイブをおこなうことでじょうほうをのこすこ
パソコンのブラウザの場合は、「別名で保存…」や「このページに名前を付けて保存…」をすることでWEBサイトの情報をWEBアーカイブすることができます。
このように、WEBアーカイブすることで保存された情報はインターネットブラウザで表示されるものと同じようにWEBサイトの情報を表示できるようになります。
iPhoneで保存する方法
WEBアーカイブをiPhoneでおこなう場合は、iPhoneのSafariというアプリを用いることになります。基本的にはパソコンのブラウザ上でのWEBアーカイブと同じようにWEBサイトの情報を保存することができます。
ですが、パソコンのブラウザ上でのWEBアーカイブと異なる点がいくつかあります。
- 埋め込み動画
- 貼り付け画像
- リンク
埋め込み動画と貼り付け画像は、設定された代替テキストのみが表示されます。
ただし、リンクはWEBアーカイブされません。リンクのアドレス情報のみがWEBアーカイブされていて、保存先で開くことはできずデフォルトのWEBブラウザアプリでリンク先が表示されることになります。
iPhoneでWEBアーカイブする場合、2パターンの方法があるのでそれぞれ紹介します。
- PDFで保存する
- WEBアーカイブで保存する
PDFで保存する
まず、iPhoneでWEBアーカイブをする方法のひとつはPDFで保存をすることです。
iPhoneでPDFを作成する手順は次のようになります。
- WEBアーカイブしたいWEBサイトを開く
- Safariの共有タブを開く
- 「オプション」画面を開く
- 「PDF」を選択する
- 共有タブで「ファイルに保存」を選ぶ
- 保存先を指定して保存する
PDFで保存をすることで、WEBサイトの情報を表示どおりに保存することができます。
しかし、PDFで保存をするとリンクが切れてしまうため、外部リンクや内部リンクにアクセスしたい場合は再度WEBサイトを確認しなくてはいけません。
そのため、閲覧したい情報がそのページだけで完結しているものの場合は、見やすくなるという利点がありますが、何度もリンクを踏んで深掘りしたい場合は手間が増えてしまうという欠点があります。
WEBアーカイブで保存する
iPhoneにWEBアーカイブを保存するもうひとつの方法はWEBアーカイブで保存をすることです。iPhoneでWEBアーカイブを保存する手順は次のようになります。
- WEBアーカイブしたいWEBサイトを開く
- Safariの共有タブを開く
- 「オプション」画面を開く
- 「WEBアーカイブ」を選択する
- 共有タブで「ファイルに保存」を選ぶ
- 保存先を指定して保存する
PDFで保存する場合とほとんど同じです。iPhoneにWEBアーカイブで保存すると、WEBサイトごと保存してくれるため閲覧したいときに、指定先のファイルからアクセスすることができます。
しかし、上記でも説明しましたが、埋め込み動画と貼り付け画像は設定された代替テキストで表示されるため、WEBサイトのように表示されません。
ですが、リンクをタップすることはできます。保存先ではリンク先情報を開くことはできませんが、リンクのアドレス情報がWEBアーカイブされているため、デフォルトWEBブラウザで開くことができます。