Sidst opdateret den
Wayback Machine er den mest populære del af Internet Archive websted. Det gratis onlineværktøj blev først introduceret i 2001 og giver dig mulighed for at gå "tilbage i tiden" for at se, hvordan websteder verden over lignede på tidspunkter. Wayback-maskinen har 562 milliard websider på tidspunktet for denne skrivning, med mange flere tilføjet hvert år.
Her er et kig på Wayback Machine, og hvad der gør den speciel.
Introduktion til internetarkiv
Internet Archive er oprettet af Brewster Kahle og Bruce Gilliat og er en nonprofitorganisation med en erklæret mission om "universel adgang til al viden." Fra begyndelsen, organisationen har givet fri offentlig adgang til digitaliserede materialer, såsom websider, bøger, lydoptagelser, inklusive live koncerter, videoer, billeder og software programmer.
Til dato tager alt, der er indsamlet af internetarkivet, mere end 70 op Petabyte serverplads, inklusive to kopier af alt. Organisationen finansieres gennem donationer, tilskud og gebyrer fra bogdigitaliseringstjenester. For privatlivets fred holder internetarkivet ikke styr på læsernes IP-adresser og bruger HTTPS (sikker) protokol overalt.
Wayback-maskinen
Bare en del af internetarkivet, Wayback Machine, blev designet til at indfange webstedsindhold, der er ændret eller fjernet. Siden lanceringen er det blevet et af de mest populære og anerkendte steder på internettet. Kahle og Gilliat navngav stedet efter den fiktive tidsrejseenhed i 1960'ernes animerede serie The Rocky and Bullwinkle Show.
Selvom Internet Archive ikke lancerede webstedet for offentligheden før i oktober 2001, begyndte Wayback Machine at arkivere cachelagrede websider fra maj 1996. Indtil 2001 lagrede digitale bånd information, som kun var tilgængelig for udvalgte forskere og forskere. Da alt gik live til offentligheden fem år senere (som det var længe planlagt), havde det allerede indeholdt over 10 milliarder arkiverede sider.
Opbevaring og samlinger
I dag opbevarer webstedet historiske webdata i en klynge af Linux-noder. Wayback Machine downloader alle offentligt tilgængelige informationer og datafiler på websider gennem sin gennemgangsmekanisme. Dog er ikke alt, der er publiceret på et websted, inkluderet her, da noget indhold er begrænset eller gemt i databaser, som ikke er tilgængelige. På grund af dette gennemgås nogle websteder bedre end andre, afhængigt af hvordan udviklere oprettede et websted ad gangen.
Du vil også bemærke, at jo nyere arkivet er, jo mere tilgængeligt indhold til et givet websted. Et nyt værktøj, som internetarkivet introducerede i 2005, er en af grundene til, at nyere data er mere komplette. Archive-It.org hjælper med at overvinde uoverensstemmelser i delvist cachelagrede websteder ved at lade institutioner og indholdsskabere høste og bevare samlinger af digitalt indhold.
Om gennemsøgning
Webcrawlere, undertiden kaldet edderkop eller spiderbot, er lige så gamle som selve Internettet. Disse crawlere er internetbots, der kontinuerligt surfer på nettet til indekseringsformål, hvilket gør dem til en vigtig komponent i enhver moderne søgemaskine. Crawlerne, der blev brugt til Wayback Machine til at oprette digitale snapshots af websteder, kommer fra forskellige kilder, som har ændret sig over tid.
Som du hurtigt vil bemærke, varierer hyppigheden af øjebliksbilledeoptagelser meget efter webstedet. Jo større (og måske mere populær) et websted er, jo mere gennemsøgning sker der typisk. Plus afhænger meget af, hvor ofte et websted har sideskift. Selv de mindste websteder bliver til sidst gennemgået, medmindre der er en grund til, at de ikke er det. F.eks. Crawles ikke adgangskodebeskyttede websteder, og heller ikke websteder, hvis webstedsejere har anmodet om, at de ikke medtages.
Brug af Wayback-maskinen
Wayback Machine-webstedet er let for enhver at bruge. For at finde historiske snapshots af et websted skal du skrive dets navn i webstedets søgemaskine. På søgeresultatsiden angiver hyperlinks datoer og tidspunkter, hvor et websted blev arkiveret. Klik på linket for at se siden "tilbage i tiden."
I de følgende eksempler kan du se forsiden af Apples websted optaget i februar 2005 og november 2014 og CNN-hjemmesiden fra en dato i marts 2004 og september 2010.
Bemærk: Disse gennemgange inkluderer også links til andre sider som registreret på de givne datoer, ikke kun hjemmesiderne.
Avancerede værktøjer
Wayback Machine er skabt til både forskere og offentligheden og har et par indbyggede værktøjer, som afslappede brugere måske går glip af. For eksempel er søgeresultatsider let designede efter design. Som forklaret, “Hvis du finder en arkiveret side, som du gerne vil henvise til på din webside eller i en artikel, kan du kopiere URL'en. Du kan endda bruge fuzzy URL-matching og datospecifikation... men det er lidt mere avanceret. "
Wayback-maskinen giver også webstedsejere mulighed for at bruge en "Gem side nu" -funktion til at gemme en bestemt side. Og alligevel er det ikke perfekt. I øjeblikket føjer funktionen ikke websteds-URL til fremtidige gennemgange. Derudover gemmer anmodningen ikke mere end én side. Det er dog et godt første skridt til at arkivere dit websteds startside for den historiske rekord.
Du behøver ikke besøge Wayback-maskinen hver gang for at foretage en ny søgning. I stedet kan du finde indhold ved at skrive adressen i din webbrowser-værktøjslinje. Brug dette format til alle søgninger: http://web.archive.org/*/www.yoursite.com/*. Brug f.eks http://web.archive.org/*/www.groovypost.com/* for at finde arkiverede sider til GroovyPost!
Mobil- og udviklerværktøjer
Endelig findes Wayback-maskinen ikke kun via internettet. Du kan finde en Wayback Machine-app til iOS og Android. Der er også udvidelser til Chrome, Safari og Firefox. Udviklere vil også gerne tjekke Internet Archive Wayback Machine API'er. Disse gør det lettere for udviklere at hente oplysninger om Wayback-indfangningsdata.
Internet Archive Wayback Machine understøtter flere forskellige API'er. Ved at gøre det gør det det lettere for udviklere at hente oplysninger om Wayback-indfangningsdata.
At gå "tilbage i tiden" for dine yndlingswebsteder er den største grund til at besøge Wayback Machine. Det er også et godt værktøj til enhver, der undersøger webstedshistorik til skoleprojekter eller forretningsbrug. Uanset hvad du gør, skal du besøge Wayback Machine og se, hvad du kan opdage i et par enkle trin.
For mere information om Internet Archive's Archive-It abonnementstjeneste, besøg officiel hjemmeside og begynd at bidrage i dag!