Pengarsipan web

Pengarsipan web adalah proses mengumpulkan bagian dari WWW dan memastikan koleksi tersebut diawetkan dalam suatu arsip, misalnya situs arsip, untuk diakses peneliti, sejarawan, dan masyarakat umum pada masa datang.[1][2] Besarnya ukuran Web membuat arsiparis web umumnya menggunakan perangkak web untuk pengumpulan secara otomatis.[3] Organisasi pengarsip web terbesar yang menggunakan ancangan perangkat web ini adalah Internet Archive yang berupaya memelihara arsip dari seluruh Web. Internet Archive adalah perpustakaan digital nirlaba Amerika Serikat yang didirikan pada tahun 1996 oleh Brewster Kahle.[4] Perpustakaan nasional, arsip nasional, dan berbagai konsorsium organisasi lain juga terlibat dalam upaya pengarsipan konten Web yang memiliki nilai penting bagi mereka.[5] Perangkat lunak dan layanan komersial juga tersedia bagi organisasi yang ingin mengarsipkan konten web mereka sendiri untuk berbagai keperluan.[6]

Sejarah dan perkembangan

Meskipun kegiatan kurasi dan pengorganisasian web telah berlangsung sejak pertengahan hingga akhir 1990-an, salah satu proyek pengarsipan web berskala besar yang paling awal adalah Internet Archive, sebuah organisasi nirlaba yang didirikan oleh Brewster Kahle pada tahun 1996.[7] Internet Archive meluncurkan mesin pencari untuk menelusuri konten web yang telah diarsipkan, yaitu Wayback Machine, pada tahun 2001.[8] Hingga 2018, lembaga ini menyimpan sekitar 40 petabyte data.[9] Selain itu, Internet Archive mengembangkan berbagai perangkat untuk pengumpulan dan penyimpanan data, termasuk PetaBox untuk penyimpanan data berskala besar serta Heritrix, sebuah peramban web (web crawler) yang dikembangkan bekerja sama dengan perpustakaan nasional di negara-negara Nordik.[7] Pada periode yang sama, sejumlah proyek pengarsipan web lain juga mulai berkembang, antara lain proyek oleh Perpustakaan Nasional Kanada, Pandora Archive di Australia, arsip web Tasmania, serta Kulturarw3 di Swedia.[10][11]

Pada tahun 2003, dibentuk International Internet Preservation Consortium (IIPC), sebuah konsorsium internasional yang bertujuan memfasilitasi kerja sama dalam pengembangan standar dan perangkat sumber terbuka untuk pengarsipan web.[12] Sebelumnya telah diselenggarakan pula International Web Archiving Workshop (IWAW) sebagai forum pertukaran pengalaman dan gagasan di bidang tersebut.[13][14]

Internet Memory Foundation didirikan pada tahun 2004 dengan dukungan Komisi Eropa untuk mengarsipkan konten web di kawasan Eropa. Lembaga ini mengembangkan berbagai perangkat lunak sumber terbuka, termasuk sistem untuk penangkapan media kaya, analisis koherensi temporal, penilaian spam, dan deteksi evolusi terminologi.[7] Data dari lembaga tersebut kini disimpan oleh Internet Archive, meskipun tidak seluruhnya tersedia untuk akses publik.[15]

Meskipun tidak terdapat otoritas terpusat dalam pelestarian konten web, materi daring semakin dipandang sebagai bagian dari arsip resmi. Sebagai contoh, pada tahun 2017 Departemen Kehakiman Amerika Serikat menyatakan bahwa kicauan (tweet) Presiden dapat diperlakukan sebagai pernyataan resmi pemerintah.[16]

Daftar pustaka

  1. ^ "WEB ARCHIVING". IIPC (dalam bahasa Inggris (Britania)). Diakses tanggal 2025-05-28.
  2. ^ Prestinary, Patrisia. "LibGuides: Web Archiving: What Is Web Archiving?". libraryguides.fullerton.edu (dalam bahasa Inggris). Diakses tanggal 2025-05-28.
  3. ^ Hester, Ryan (2018-05-25). Historical Research: Theory and Methods (dalam bahasa Inggris). Scientific e-Resources. ISBN 978-1-83947-418-7.
  4. ^ "Internet Archive: About the Archive". web.archive.org. 2000-04-08. Diakses tanggal 2024-05-16.
  5. ^ United Nations Educational, Scientific and Cultural Organization. (t.t.). Guidelines for the preservation of digital heritage. https://unesdoc.unesco.org/ark:/48223/pf0000130071
  6. ^ National Archives. (2011). Web archiving guidance.
  7. ^ a b c Toyoda, Masashi; Kitsuregawa, Masaru (2012-05). "The History of Web Archiving". Proceedings of the IEEE. 100 (Special Centennial Issue): 1441–1443. doi:10.1109/JPROC.2012.2189920. ISSN 1558-2256.
  8. ^ "The History of Web Archiving". ieeexplore.ieee.org (dalam bahasa American English). doi:10.1109/JPROC.2012.2189920. Diakses tanggal 2026-05-28.
  9. ^ "Inside Wayback Machine, the internet's time capsule". The Hustle (dalam bahasa American English). 2018-09-28. Diakses tanggal 2026-05-28.
  10. ^ Costa, Miguel; Gomes, Daniel; Silva, Mário J. (2017-09-01). "The evolution of web archiving". International Journal on Digital Libraries (dalam bahasa Inggris). 18 (3): 191–205. doi:10.1007/s00799-016-0171-9. ISSN 1432-1300.
  11. ^ Consalvo, Mia; Ess, Charles, ed. (2011-04). The Handbook of Internet Studies (dalam bahasa Inggris) (Edisi 1). Wiley. doi:10.1002/9781444314861. ISBN 978-1-4051-8588-2.
  12. ^ "ABOUT IIPC". IIPC (dalam bahasa Inggris (Britania)). Diakses tanggal 2026-05-28.
  13. ^ "IWAW - International Web Archiving Workshops". bibnum.bnf.fr (dalam bahasa Prancis). Diakses tanggal 2026-05-28.
  14. ^ "IWAW 2010 : The 10th Intl Web Archiving Workshop". www.wikicfp.com. Diakses tanggal 2026-05-28.
  15. ^ "Internet Archive: Digital Library of Free & Borrowable Texts, Movies, Music & Wayback Machine". archive.org. Diakses tanggal 2026-05-28.
  16. ^ "Web Archiving: Think the Web is Permanent? Think Again. | History Associates Inc". History Associates Inc. (dalam bahasa American English). 2019-06-04. Diakses tanggal 2026-05-28.

Pranala luar


Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.
Kembali kehalaman sebelumnya