Kulturarw3 är världens äldsta fullständiga nationella webbarkiv. Det har rullat sedan 1997. Det innehåller mer än 500 miljoner svenska webbsidor — drygt 5 miljarder enskilda filer, ungefär 350 terabyte svensk internethistoria. Och det kan inte spela Flash-filerna det har arkiverat. Det är paradoxen den här texten handlar om.
Vad Kulturarw3 är — och varför det är historiskt viktigt
Kulturarw3 är inte bara ett svenskt projekt. Det var det första systematiska nationella webbarkivet i världen — lanserat innan de flesta länder ens hade formulerat problemet.
Kungliga biblioteket — KB — grundades 1661. Sedan sjuttonhundratalet har KB samlat in pliktexemplar av svenska tryckta verk. Logiken är enkel och gammal: om det ges ut i Sverige hör ett exemplar hemma i nationalsamlingen. När webben kom tillämpade KB samma logik. Projektet heter Kulturarw3 — ett ordspel på det svenska kulturarv och HTML-entiteten för snabel-a, vilket speglar både det kulturella uppdraget och det digitala mediet.
Frans Lettenström, anställd som IT-koordinator vid KB 1995, var den som formulerade idén: att systematiskt bevara alla svenska webbsidor med samma arkivariska allvar som tryckta publikationer. De äldsta sidorna i samlingen är från 1997, då projektet tog fart på allvar. Sverige var det första landet i världen med heltäckande nationell webbarkivering — det kom före Internet Archives Wayback Machine-projekt som hade global och opportunistisk snarare än nationell och systematisk inriktning.
Det institutionella instinktet var rätt. Och det räckte inte.
Skalan — 500 miljoner sidor, 5 miljarder filer, 350 terabyte
Siffrorna från KB:s egna sidor är substantiella. Kulturarw3 innehåller mer än 500 miljoner svenska webbsidor. Det totala filantalet överstiger 5 miljarder. Lagringen uppgår till ungefär 350 TB. Det framgår av KB:s webbplats för Webbpublicerat-samlingen, som också bekräftar att den första insamlingen gjordes 1997.
Insamlingsmetoden är enkel men arbetsintensiv. KB kör en till två generella insamlingar per år, var och en pågår under flera månader och täcker alla domäner i .se-rymden. Selektiva insamlingar av nyhetsmedier och politiska partiers webbplatser görs oftare — en gång i veckan eller varje dag under valperioder. Robotens IP-intervall är offentligt dokumenterat: 193.10.72.192/27, det vill säga 193.10.72.193–193.10.72.222. KB anger öppet hur webbansvariga kan begränsa robotens hastighet via robots.txt.
Vad Kulturarw3 samlar in är inte den levande upplevelsen av en webbplats. Det är ögonblicksbilder — HTML-filer, länkade tillgångar, inbäddade medier. Roboten följer länkar, laddar ner filer och lagrar vad den hittar vid ett givet tillfälle. Det är ingen kritik. Det är precis vad webbrobotar gör. WARC-formatet (Web ARChive) är den tekniska standarden för att lagra dessa inspelningar, framtaget inom ramen för IIPC — International Internet Preservation Consortium — där KB är bekräftat medlem, liksom Nasjonalbiblioteket i Norge, Nationalbiblioteket i Finland, Det Kongelige Bibliotek i Danmark och Þjóðarbókhlutinn på Island. Samtliga fem nordiska nationalbibliotek är aktiva IIPC-medlemmar.
350 TB svensk webbhistoria. Det är skalan. Frågan är vad den innehåller — och vad den inte innehåller.
Paradoxen — URL:er bevarade, interaktivitet förlorad
Arkivet är imponerande i omfång. Det är också trasigt för interaktiv nätkonst. Dessa två påståenden är båda sanna, och spänningen mellan dem är inte ett misstag.
Mekanismen ser ut så här. Ett Flash-baserat nätkonstverk från 2003 består av flera komponenter: en HTML-sida, en SWF-fil (Shockwave Flash) som innehåller den interaktiva logiken och animationen, möjligen externa dataanrop — och en körningsmiljö, Flash Player, som exekverar SWF-filen. KB:s robot, som gör sitt jobb korrekt, har sannolikt samlat in HTML-sidan och SWF-filen. Båda ligger i Kulturarw3-arkivet. URL:en är bevarad. Filen är bevarad.
Men en SWF-fil är inte ett dokument. Det är ett program. För att uppleva vad verket faktiskt var måste du köra det. Och KB har, utifrån all offentligt tillgänglig dokumentation, inte byggt in något emuleringslager i Kulturarw3 som skulle låta en forskare vid terminalen i Stockholm köra den SWF-filen i en Flash Player-miljö. Arkivet har kroppen. Det saknar hjärtslaget.
Världens äldsta nationella webbarkiv kan inte spela upp sina egna Flash-filer. Det är inte ett tekniskt förbiseende. Det är ett filosofiskt — ett gap mellan vad “arkivering” ansågs innebära 1997 och vad nätkonst faktiskt krävde.
Det här är inte ett Flash-specifikt misslyckande. Det är ett strukturellt sådant. Webbrobotmodellen utformades för att bevara dokumentwebben — HTML-sidor, text, bilder, det läsbara, statiska lagret av internetpublicering. Interaktiva miljöer låg alltid utanför den ursprungliga designintentionen. VRML, Java Applets, Shockwave Director-verk, tidiga WebGL-experiment — roboten fångar deras containerfiler. De körningsmiljöer som ger dessa filer mening ingår inte i arkivet.
Under 2010 pausade Kulturarw3 sina insamlingar tillfälligt — delvis till följd av höga kostnader och frågor kring personuppgiftslagstiftning. KB samarbetade under denna period med Internet Archive för en enstaka bevarandeinsamling. Det berättar något om projektets villkor: ett nationellt arkiveringsuppdrag som är sårbart för just de institutionella och juridiska faktorer som nätkonsten också är beroende av att navigera.
[Forskarnotering: Huruvida KB har gjort interna åtgärder för Flash-emulering — om något arbete pågår för att adressera detta — är inte möjligt att besvara utifrån offentlig KB-dokumentation. KB:s Kulturarw3-sida nämner inte emulering, interaktivt innehåll eller Flash. Det är författarens direkta läsning av den offentliga källan. En direktförfrågan till [email protected] eller forskning på plats vid KB Stockholm krävs för att definitivt bekräfta om emuleringskapacitet finns eller planeras.]
E-plikt 2013 — det juridiska mandatet och dess luckor
E-plikten utvidgade principen om pliktexemplar till digitala publikationer 2013. Den löste inte körbarhetsproblemet — och var inte utformad för det.
E-plikt är den svenska termen för elektroniskt pliktexemplar. KB fick uppdraget att samla in och bevara svenskt material som ges ut i elektronisk form från och med 2012, och det formella systemen för att ta emot pliktexemplar trädde i kraft under 2013. Det är ett uppdrag som saknar direkt motsvarighet i de flesta länder — Sverige är bland de tidiga med ett lagstiftat digitalt bevarandemandat av den här bredden.
Distinktionen mellan Kulturarw3 och e-plikt är arkitektoniskt viktig. KB dokumenterar den tydligt: Kulturarw3 samlar in hela webbplatser som ögonblicksbilder. E-plikt samlar in enskilda delar — enskilda publicerade objekt snarare än kompletta sajter. De kompletterar varandra men överlappar inte. Ingen av dem utformades med interaktiva, körbara miljöer som primär kategori.
Täckningsgapet för nätkonst är strukturellt. Ett interaktivt Flash-verk från 2004 är inte en publikation i pliktexemplarlagens mening. Det har inget ISBN eller ISSN. Det går inte att klassificera som en e-bok eller en webbaserad artikel. Det fungerar som en körbar miljö, inte ett läsbart dokument. Under det nuvarande e-pliktsystemet faller det utanför det obligatoriska inlämningssystemet. Under Kulturarw3 kan dess filer ha samlats in — men inte dess körbarhet.
Norges situation följer en jämförbar logik. Nasjonalbiblioteket har crawlat .no-domänen sedan tidigt 2000-tal och är en aktiv IIPC-medlem. Alla fem nordiska nationalbibliotek är IIPC-medlemmar och deltar i gemensam metodutveckling. Men IIPC-medlemskap och WARC-insamling löser samma problem som KB:s insamlingar löser: de bevarar filer. De bevarar inte, som standard, de körningsmiljöer som dessa filer behöver för att fungera som konst.
Fallet för att revidera e-plikten och inkludera interaktiva digitala miljöer som en distinkt kategori är rakt på sak. Och i nuläget obehandlat.
Tillgång — endast på plats i Stockholm
Det finns ytterligare en dimension av paradoxen, och den verkar redan innan Flash-problemet ens uppstår. Tillgång till Kulturarw3 är fysiskt begränsad till KB:s läsesal i Stockholm. Det finns inget fjärråtkomst. Inget API. Inget webbgränssnitt tillgängligt för allmänheten.
För att söka i arkivet åker man till KB, sätter sig vid en dedikerad Kulturarw3-dator och anger en specifik URL. Inte ett sökord — en URL. Om du vill hitta gamla versioner av en viss svensk konstnärsorganisations webbplats måste du redan känna till adressen. Arkivet stöder inte fritextsökning. KB:s egen dokumentation är explicit: “För att titta på de insamlade webbsidorna krävs att du kommer till KB i Stockholm och använder vår Kulturarw3-dator.”
Åtkomstbegränsningen speglar upphovsrättslagstiftning, inte KB:s preferenser. Svensk upphovsrätt i arkiverade webbmaterial hindrar KB från att göra arkivet fritt tillgängligt online, eftersom det skulle utgöra offentligt framförande av upphovsrättsskyddat material utan rättighetsklarering. Nationalbiblioteket är fångat mellan sitt bevarandeuppdrag och det rättsliga ramverket kring det material det har bevarat. Den spänningen har inte lösts i något nordiskt land.
Vad skulle krävas för att fixa detta?
Rhizome fixade det. Internet Archive fixade det. Frågan är om KB kommer att göra det.
Den tekniska vägen finns. Rhizomes partnerskap med Emulation as a Service-ramverket (EaaS) — bwFLA, utvecklat vid Universitetet i Freiburg — erbjuder molnbaserad emulering av kompletta operativsystem. En forskare som öppnar ett Rhizome-hostat äldre konstverk får en fjärrbrowsersession som kör en äkta Flash Player i en emulerad Windows-miljö från den relevanta eran. Troheten är hög. Kostnaden är real: Rhizomes preservation-tjänster för institutionella kunder rör sig i spannet 500–1 500 dollar för en inledande bedömning, med löpande driftskostnader. Det är institutionell skala.
Internet Archive tog en lättare väg. Ruffle — ett öppen källkod-Flash-emuleringsprogram skrivet i programmeringsspråket Rust och kompilerat till WebAssembly — integreras direkt i webbläsaren. Ingen molninfrastruktur. Ingen serverbaserad emulering. SWF-filen körs nativt i en modern webbläsare via WebAssembly-körningsmiljön. Kompatibiliteten är inte hundraprocentig: verk som använder komplex ActionScript 3-skriptning, externa dataanrop eller äldre webbläsarintegrationer kanske inte spelas upp korrekt. Självständiga enstaka-fil-verk är de bästa kandidaterna. Men för en betydande andel av arkiverat Flash-innehåll gör Ruffle materialet tillgängligt utan specialinfrastruktur.
KB skulle i princip kunna integrera Ruffle i Kulturarw3-terminalen. Programvaran är fri och öppen källkod. Det tekniska hindret är inte det primära. Det primära hindret är institutionell prioritering — och upphovsrättsfrågan: utgör det att köra en Flash-emulator som exekverar arkiverade SWF-filer, i en sluten on-site-miljö för behöriga forskare, ett tillåtet nyttjande enligt svensk upphovsrätt? Den specifika rättsliga frågan har inte besvarats offentligt. Den behöver sannolikt ställas formellt innan någon teknisk lösning kan implementeras.
Rhizome-modellen och Internet Archive-modellen representerar två olika svar på samma problem: den ena institutionell och kostsam, den andra lättviktig och webbläsarnativ. KB behöver inte välja omedelbart. Det som krävs är ett beslut om att problemet är värt att adressera — att arkivera filerna inte är slutet på uppdraget, att körbarhet är en del av bevarandemandatet. Det beslutet har inte tagits offentligt.
Rhizome ArtBase dokumenterar mer än 2 200 nätkonstverk sedan 1999. Det är ett kuratoriellt arkiv med emuleringsfokus. Kulturarw3 dokumenterar en hel nations webbhistoria sedan 1997. Dessa är inte konkurrerande projekt — de löser olika problem med olika geografiska och institutionella ramar. Men på en punkt är jämförelsen talande: Rhizome har fattat beslutet att körbarhet ingår i bevarandemandatet. KB har ännu inte gjort det offentligt.
Konsekvenser för nordiskt digitalt kulturarv
Kulturarw3-paradoxen är ett svenskt fall. Men den speglar direkt situationen i varje nordiskt nationalbibliotek som har crawlat webbdomäner sedan slutet av 1990-talet eller tidigt 2000-tal.
Alla fem nordiska nationalbibliotek är IIPC-medlemmar. Alla fem har samlat in webbinnehåll i decennier. Inget av dem har, utifrån offentlig dokumentation, implementerat emuleringinfrastruktur för interaktivt äldre innehåll i Kulturarw3-skala. Den nordiska webbarkiveringsnfrastrukturen är bland den äldsta och mest heltäckande i världen — och delar samma strukturella gap.
Det spelar roll för nätkonst specifikt eftersom den nordiska regionen hade en aktiv webbläsarbaserad och Flash-era konstnärsscen under mediets toppår. Electrohype-biennalerna i Malmö — sex utgåvor 2000–2010, med explicit fokus på datorbaserad och webbbaserad konst — dokumenterade verk som var levande och webbläsarberoende under precis den period Kulturarw3 arkiverade .se-domänen. Om de verk som visades vid dessa evenemang överlever i körbar form är en öppen forskningsfråga. Filerna kanske finns i arkivet. Upplevelsen av verket gör det med stor sannolikhet inte.
Nordiska institutioner behöver interoperabel emuleringinfrastruktur — inte bara URL-insamlingar. IIPC tillhandahåller nätverket och den delade metodiken. De tekniska verktygen finns. Det som saknas är det institutionella beslutet att bevara webben innebär att bevara vad webben gör, inte bara vad den innehåller.
Vanliga frågor
Vad är Kulturarw3?
Kulturarw3 är Sveriges nationella webbarkiv, drivet av Kungliga biblioteket (KB) i Stockholm. Projektet påbörjades 1997 — de äldsta sidorna i samlingen är från det året — vilket gör det till världens äldsta fullständiga nationella webbarkiv. Namnet är ett ordspel på det svenska kulturarv och HTML-entiteten för snabel-a, vilket speglar både det kulturella uppdraget och det digitala mediet. Arkivet innehåller mer än 500 miljoner svenska webbsidor, drygt 5 miljarder filer och ungefär 350 TB data. Tillgången är begränsad till en datorstation på plats vid KB i Stockholm; det finns ingen fjärråtkomst för allmänheten.
Varför kan inte Kulturarw3 spela Flash-filer det har arkiverat?
Kulturarw3:s webbrobot samlar in HTML-filer och SWF-filer (Adobe Flash binärformat) — men varken fångar eller emulerar den körningsmiljö som krävs för att exekvera Flash-innehåll. En SWF-fil är ett program, inte ett dokument. Utan en Flash Player eller en Flash-emulator som körs vid sidan av den arkiverade filen är SWF:en inert data. KB har inte, utifrån offentligt tillgänglig dokumentation, byggt in något emuleringslager i Kulturarw3-terminalen som skulle tillåta arkiverade Flash-filer att köras. Det här är inte en Flash-specifik begränsning: samma sak gäller Java Applets, Shockwave Director-verk och andra interaktiva format från samma era som samlades in som filer men inte som körbara miljöer.
Hur får jag tillgång till Kulturarw3?
Du måste besöka Kungliga biblioteket i Stockholm personligen. Tillgång ges på plats vid den dedikerade Kulturarw3-datorn under KB:s öppettider. Du söker genom att ange en specifik URL — inte ett fritextsökord. Arkivet visar vilka ögonblicksbilder som finns för den adressen och från vilka datum. Det finns inget fjärr-API eller offentligt onlinegränssnitt. Åtkomstbegränsningen speglar svensk upphovsrättslagstiftning: att göra arkiverat webbinnehåll fritt tillgängligt online skulle utgöra offentligt framförande av upphovsrättsskyddat material utan rättighetsklarering.
Vad är e-plikt (svensk digital pliktlag)?
E-plikt är Sveriges system för obligatorisk inlämning av elektroniska publikationer. KB fick uppdraget 2012 och började ta emot pliktexemplar av elektronisk utgivning under 2013. Systemet täcker offentligt tillgängliga online-publikationer med svensk anknytning — webbaserade artiklar, e-böcker, filmer på webben, poddradio, myndighetspublikationer. Till skillnad från Kulturarw3, som samlar in hela webbplatser som ögonblicksbilder, samlar e-plikten in enskilda delar — enskilda publicerade objekt. Interaktiva nätkonstverk utan ISBN eller ISSN, eller sådana som fungerar som körbara miljöer snarare än läsbara publikationer, faller utanför den nuvarande e-plikten. Inget av systemen utformades för att hantera interaktiva digitala konstverks körbarhetsfordringar.
Hur jämförs Kulturarw3 med Internet Archive?
Båda använder WARC-formaterade insamlingar och bevarar HTML och länkade tillgångar. Kulturarw3 är nationellt avgränsat med heltäckande .se-domäntäckning; Internet Archive är globalt och opportunistiskt. Vad gäller Flash specifikt har Internet Archive integrerat Ruffle — en Flash-emulator i Rust och WebAssembly — i sin Flash-samling, vilket ger användare webbläsarnativ uppspelning av arkiverade SWF-filer. Kulturarw3 har inte gjort en motsvarande integrering. Internet Archive är dessutom tillgängligt på distans via Wayback Machine; Kulturarw3 är tillgängligt enbart på plats i Stockholm.