Archive.org Menyimpan Data 10 Petabyte dan Perpustakaan Digital Kebudayaan Bali

10 Petabyte Archive

The Internet Archive (archive.org) mengumumkan kalau mereka telah menyimpan 10 petabyte data dari berbagai website di internet. Selain itu, mereka juga mengumumkan kalau mereka memiliki 80 terabyte data website-website yang khusus ditujukan untuk riset, serta sebuah perpustakaan digital berisi kebudayaan Bali!

Mungkin di antara kita masih jarang yang pernah mendengar kata ‘petabyte’. 1 petabyte sama dengan 1 juta gigabyte, jadi 10 petabyte adalah 10 juta gigabyte, atau 1.000.000.000.000.000 byte. Angka yang besar sekali, ya?

Nah, tujuan dari archive.org sendiri, sesuai dengan nama website mereka ‘archive’ yang berarti arsip, adalah menyimpan data-data yang ada di internet dari zaman ke zaman. Dengan menggunakan layanan ini, Anda dapat melihat halaman website terkenal pada tahun tertentu. Contohnya, untuk melihat halaman depan Google.com pada tahun 1999, lihat di sini.


Internet Archive crawls and saves web pages and makes them available for viewing through the Wayback Machine because we believe in the importance of archiving digital artifacts for future generations to learn from.  In the process, of course, we accumulate a lot of data.

Internet Archive mengindeks dan menyimpan berbagai halaman web dan membuat mereka tersedia untuk dilihat dari Wayback Machine karena kami percaya akan pentingnya mengarsipkan artefak digital untuk dapat dipelajari oleh generasi yang akan datang. Di dalam prosesnya, tentu saja, kami menyimpan semakin banyak data.
10 petabyte mungkin tidak besar, mengingat facebook menggunakan 100 petabyte hanya untuk menyimpan foto, dan Microsoft Skydrive mendapatkan 2 petabyte data setiap bulannya. Tetapi mengingat Archive.org adalah sebuah layanan nirlaba, capaian ini adalah sebuah capaian yang sangat luar biasa.

Selain data 10 petabyte tersebut, Internet Archive juga mengumumkan bahwa mereka memiliki data 80 terabyte data halaman website dari satu juta website terpopuler versi Alexa. Mereka mulai mengindeks pada 9 maret 2011, dan berakhir pada 23 desember 2011. Jumlah halaman website yang diambil adalah 2.713.676.341, dan berisi 2.273.840.159 URL unik dari 29.032.069 server.

Seluruh data tersebut disediakan untuk keperluan riset, dan bagi Anda yang berminat bisa me-request-nya dengan mengirimkan email ke info at archive dot org, dengan menyertakan apa yang akan Anda lakukan dengan data-data tersebut. Mereka mungkin tidak akan mengizinkan semua orang mendapatkan hak akses, jadi coba saja, dan semoga disetujui!

Di hari yang sama, Internet Archive juga mengumumkan bahwa mereka menyediakan perpustakaan digital berisi kebudayaan Bali yang dapat diakses di archive.org/details/Bali.

 

Referensi: blog.archive.org

fold-left fold-right
About the author
Prayudi Satriyo Nugroho - Mahasiswa Sistem Informasi semester akhir yang terbiasa mengisi waktu luang dengan keluyuran di internet. Ia adalah founder dari Techrity yang dapat Anda hubungi melalui email maupun Twitter.