Internet lijdt zwaar aan Korsakov

Internet verandert zo snel dat het medium soms bijna geen geheugen lijkt te hebben, ware het niet dat een aantal enthousiastelingen her en der archieven proberen bij te houden van alles wat er ooit op dit vergankelijke medium is verschenen. Het resultaat blijft helaas een geheugen met enorme gaten erin.

Google is dit jaar tien jaar jong en viert dit heuglijke feit met het live zetten van een zoekmachine die put uit de online content van het jaar 2001. Google zegt dat het helaas niet verder terug heeft kunnen gaan in de tijd en daarom een zoekmachine voor januari 2001 heeft gepubliceerd. Dat was achteraf natuurlijk een heel bijzonder jaar: toen op 11 september 2001 het eerste vliegtuig zich in de Twin Towers in New York boorde, verschenen niet lang daarna de eerste teksten en foto’s op de websites als CNN, USA Today en BBC, maar ook de Nederlandse sites bleven niet lang achter. De gehele journalistieke wereld werkte op meer dan volle toeren om deze terroristische aanslagen in de kranten en op televisie en websites te krijgen. Zeker in het begin van de aanslagen volgden de gebeurtenissen elkaar zo snel op dat bijvoorbeeld de website van CNN binnen tien minuten drie keer nieuwe teksten en foto’s liet zien.

Er werden in 2001 wereldwijd miljoenen webpagina’s over de aanslagen gemaakt. Wie nu echter op internet zoekt naar ‘11 september’ vindt weliswaar nog steeds een lawine aan verwijzingen, maar de originelen van het eerste uur zitten daar zeer waarschijnlijk niet bij. Eigenlijk is dat verschrikkelijk jammer, dacht ook Norbert Specker van het Zwitserse bedrijf Interactive Publishing. Het zou erg mooi zijn als mensen ook nu nog de vele varianten van de websites over ‘11 september’ konden bekijken. Hij heeft daarom onder de noemer ‘Digital Collection’ een groot aantal webpagina’s verzameld over dit onderwerp. Specker is blijkbaar tevens een groot voetbalfan, want het WK Voetbal van 2002 is ook in een digitale collectie opgenomen.

De Zwitserse ondernemer is niet de enige met verzamelwoede, ook Google zelf kan er natuurlijk wat van. De zoekmachine startte in 2001 met het archiveren van alle discussies die ooit hebben plaatsgevonden in de nieuwsgroepen van Usenet. Dit archief is inmiddels zo uitgebreid dat bij wijze van spreken geen vraag in deze ‘Google Groups’ onbeantwoord blijft, om de eenvoudige reden dat zo’n beetje alles wat mensen bezighoudt in nieuwsgroepen wordt besproken. Wie advies zoekt bij de aankoop van een computer, huis of grasmaaier, vindt ongetwijfeld antwoord, wie wil weten wanneer het oer-besturingssysteem MS-DOS voor pc’s voor het eerst opdook in nieuwsgroepen overigens ook. Ook de vraag hoe een fietsband moet worden geplakt levert verwijzingen op.

Helemaal grondig pakt Internet Archive het aan. Deze Amerikaanse non-profitorganisatie archiveert al sinds 1996 internetpagina’s en tracht deze in samenhangende collecties onder te brengen. Inmiddels bestaat de totale verzameling uit zo’n slordige tien miljard documenten, die honderd terrabyte aan data bevatten. Dat is evenveel informatie als op duizend pc’s met een harde schijf van 100 gigabyte. Om te kunnen zoeken in deze gigantische hoeveelheid aan informatie hebben de oprichters een zogenaamde ‘Wayback Machine’ gebouwd, die iedere twee maanden het complete internet archiveert. Deze digitale tijdmachine bestaat uit een groot aantal standaard pc’s met iedere een flinke hoeveelheid grote harde schijven die op ingenieuze wijze aan elkaar zijn gekoppeld. Hiermee is een betaalbare supercomputer ontstaan.

Werkelijk alles lijkt er te vinden, van de allereerste webpagina’s tot vermeldingen van de Meppeler Courant op internet van enkele jaren geleden. Alleen al over ‘11 september’ zijn ruim 500 miljoen pagina’s gearchiveerd! Via een geavanceerde zoekoptie kunnen de gevonden resultaten overigens sterk beperkt worden. De website is veel te uitgebreid om echt te bespreken, het is veel leuker om er heen te surfen en zelf op zoek te gaan naar het verloren gewaande verleden van een door Korsakov geplaagd internet. Wie overigens iets te verbergen heeft en er vanwege de enge ziekte van dit medium op vertrouwt dat zijn sporen uiteindelijk wel worden uitgewist door de tijd, kan zich nog lelijk vergissen. Een zoekopdracht naar “Robert Hertogs” in Google 2001 leverde nog negen hits op, waarvan het Internet Archive in de meeste gevallen ook nog de complete tekst weet te achterhalen. In dit geval waren het onschuldige artikelen, maar wat als ik nu een opkomend politicus zou zijn geweest met een radicaal actieverleden, dat in die tijd gestalte kreeg in opruiende artikelen op internet? Zeg niet dat u niet gewaarschuwd bent geweest…

Scroll Up

Pin It on Pinterest