Bits og bytes i Babelstårnet

Fremtidens videnskabelige informationer burde være frit tilgængelige for alle gennem Internettet. Men foreløbig spænder gamle vaner og økonomiske interesser ben for udviklingen


Af PETER HYLDGÅRD og ROBIN ENGELHARDT





Siden den bibelske beretning om vores forfædres bygning af Babelstårnet for nå Gud, har menneskeheden stræbt efter at samle dets kundskaber og mangfoldigheder i blot et enkelt storværk af altomfattende viden, et Opus Magnus, som vi alle kan være fælles om at eje og bygge videre på. Og siden sprogets opståen, skriftens udvikling og trykkekunstens indmarch har man aldrig været tættere på målet, end det er tilfældet i dag. 

I nutidens hypermediale netværkssamfund er der nemlig ikke længere nogen principielle hindringer i vejen for at skabe den optimale situation: Alverdens encyklopædiske og videnskabelige viden, indbyrdes forbundet og gjort frit tilgængelig på Internettet. Alle videnskabelige publikationer, hvad enten det er foreløbige preprints eller kritisk bedømte (i fagjargon kaldt peer-review) og accepterede artikler, ville kunne nås med blot nogle få klik med musen.

Forlagenes modstand
Men det ser ud til, at det ikke kun er Gud, der modsætter sig dette menneskets ideal. Også forlagsbranchen har noget i klemme. For at betegne udviklingen med en anden bibelsk lignelse kunne man sige, at bogbranchen lige nu er i gang med at opbygge Jerikos mure på ny: Ved et møde i Frankfurt i oktober måned blev repræsentanter for en række store forlag enige om at opbygge en netstruktur af links til hinandens hjemmesider gennem referencelisterne på deres offentliggjorte artikler. På den måde vil man skabe et internt net af mere end tre millioner krydsrefererende artikler, der dog stadig ejes og forvaltes af forlagene. 

Indtægterne gennem online-abonnementer vil dermed stadig kunne bibeholdes i form af samlede pakkeløsninger, "pay per view" eller lignende arrangementer. De, som ikke har råd til at betale, spærres udenfor Jerikos mure. Blandt dem tæller typisk videnskabelige institutioner i u-landene, der ikke har midlerne til de dyre abonnementer (og slet ikke til egne biblioteker), små og halvstore private foretagender, medier, institutioner og lignende, som kun selektivt har brug for videnskabeligt baggrundsmateriale, samt alle fattige enkeltpersoner, der af private eller professionelle årsager måtte have brug for adgang til primærlitteraturen. Med det nye initiativ vil forlagene således udbygge det vidensgab, der allerede eksisterer mellem i- og u-lande.

Men også den almindelige danske forsker har problemer. Forskningsinstitutionerne må betale i dyre domme for abonnementer på både elektroniske og trykte tidsskrifter (se boks), og bibliotekerne har for længst givet tabt i en budgetundergravende urskov af tidsskrifter og blade. Af de over 20.000 internationale fagblade (peer-reviewed) er det kun et fåtal, bibliotekerne har fysisk adgang til. Ikke sjældent sker det, at forskeren derfor selv må ringe til forfatteren eller udgiveren i Langbortistan for at få tilsendt en vigtig artikel.

Frie initiativer
Forlagenes udspil er kommet i huj og hast for at modgå en række uafhængige initiativer, der i videnskabens interesse havde tænkt sig at gøre primærlitteraturen frit tilgængelig for alle. Blandt de største initiativer på nettet finder man PubMed Central (PMC), som styres af det amerikanske National Institute of Health (NIH).

Hvis tidsplanen holder, åbner PubMed Central til januar med gratis adgang til artikler fra et par håndfulde anerkendte videnskabelige tidsskrifter indenfor biologi, landbrugsvidenskab og medicin, deriblandt giganten Proceedings of the National Academy of Sciences (PNAS). NIH samarbejder blandt andet med European Molecular Biology Organization (EMBO) om at udvide antallet af tidsskrifter i databasen. Blandt andet står det ansete British Medical Journal (BMJ) klar til at blive indlemmet i PubMed Central. Ifølge redaktøren Richard Smith ligger der helt uselviske motiver bag: "PMC tvinger os til at spørge os selv: Er det vores mission at tjene en masse penge (...), eller er vi der for at drive videnskaben og medicinen fremad?" forklarede han i 'konkurrenten' Nature

De professionelle forlæggere svarer, at det er et naivt synspunkt, og at myndighederne (NIH) ikke bør blande sig på det videnskabelige udgiver-marked. De frygter, at det ikke længere vil være muligt at drive tidsskrifterne, når indholdet foræres væk. Modargumentet fra 'gratisterne' er, at der scores alt for store avancer i øjeblikket, og at delfunktioner som selve peer-review-processen udemærket i fremtiden kan foretages via andre kanaler, mens der ikke bør tjenes penge på selve udgivelsen og dermed tilgængeligheden af informationerne. 

Som en konsekvens deraf indrømmer man på PubMed Central da også, at det i fremtiden kan være nødvendigt at køre de udgifter, der trods alt er ved at udgive de elektroniske tidsskrifter over på forfatterne i stedet for læserne - en praksis der allerede finder sted hos en lang række trykte niche-tidsskrifter, der ikke kan finansieres udelukkende ved salget. Indtil videre bliver løsningen hos PMC, at tidsskrifter som PNAS venter en måned med at gøre deres artikler frit tilgængelige på nettet, og dermed bevarer noget af incitamentet for læserne til at abonnere på den trykte udgave.

Hvad med kvaliteten?
Et andet debatpunkt på den elektroniske dagsorden er kvaliteten af det materiale, som udbydes af de forskellige tjenester. I de første udkast til det halvfilantropiske projekt, PMC, var det planen, at der også skulle indgå preprints. Men for at få PNAS med på vognen har NIH været nødt til at skille dem fra i en selvstændig tjeneste, da man på det hæderkronede tidsskrift var bange for, at blive "smudset til" ved at optræde side om side med preprints - videnskabens grå litteratur.

Selvom ønskerne om at gøre de videnskabelige artikler frit tilgængelige på Internettet generelt har stor sympati blandt græsrødderne på universiteterne, deles denne bekymring af en lang række menige forskere: Hvad vil der ske med kvaliteten? Hvad med bevaringen? Vil de elektroniske artikler ikke være sårbare overfor pludselige katastrofer eller nye medier? Hvad med plagiater? 

Modargumentet blandt eksperter i den elektroniske informationsteknologi er, at kvalitetskontrollen er medie-uafhængig. Peer review-processen kan implementeres i luften lige så godt som på landjorden. Også spørgsmålet om krediteringen og copyrights er medieuafhængig, og angsten for plagiater mere end opvejes af evnen til at spore dem. Men af gammel vane foretrækker de fleste stadig papiret. Et medium, som er svært at producere, svært at distribuere, svært at arkivere og svært at kopiere.

De subversive
Men så længe omstruktureringen af publikationsprocessen afhænger af hele kollektivet af institutionelle og internationale initiativer, er der stadig en god bid vej til målet. Men ifølge Steven Hanard fra Southampton University i UK findes der allerede nu en ganske udbredt udvej for de progressive forfattere. Metoden er dog lettere subversiv, og mange fagblade truer da også deres bidragsyder med både stok og bål for at undgå dette: I al sin enkelthed går ideen ud på, at forskerne fortsætter med at offentliggøre deres arbejder i deres foretrukne blade, som de plejer. Men derudover arkiveres artiklerne elektronisk som preprints på deres egen hjemmeside, frit tilgængelige for alle. 

Læserne på Internettet vil hurtigt finde ud af at bruge informationerne på den rette måde. En centraliseret variant af den idé findes allerede siden august 1991 på http://arXiv. org, som er et gratis arkiv oprettet af Paul Ginsparg, der efterhånden har vokset sig så stor, at mange fysikere og matematikere efterhånden bruger den som primærkilde til nye artikler.

Fremtiden
Ifølge idealet er det, man i fremtiden sandsynligvis skal betales for, ikke den rå Corpus Magnus af data, men derimod den overlejrede strukturering og fortolkninger af hele denne viden. Symbolanalysen vil blive den centrale og bekostelige service til dem, som ikke gider eller kan gøre hele arbejdet selv - hvilket i praksis vil sige alle de almindelige brugere.

Som ideal kunne man ifølge Ginsparg forestille sig en datastruktur på Internettet, der lejrede flere niveauer af bearbejdning oven på hinanden, lidt ligesom man nu er begyndt på at gøre på f.eks. Danmarks Radios hjemmeside, hvor man både kan få de bearbejdede indslag, men også (hvis man graver lidt dybere) de bagvedliggende råbånd af interviews og baggrundsmateriale. Gennemsigtigheden af udvalgsprocessen vil dermed øges betragteligt. Med hensyn til de videnskabelige artikler, vil enhver form for information ifølge Ginsparg kunne lægges hen over rå-arkiverne og bestyres af en tredje part. For eksempel kunne arkiverne opdeles i sektorer, klassificeret ved hjælp af kriterier så som almen vigtighed, forskningskvalitet, specificitet, osv., og enhver artikel kunne løbende skifte klassificering alt efter yderligere informationer og forskning, siger Ginsparg. Læseren kunne udnytte et interface af et sæt anbefalede "essentielle læsninger" for et givent emne for en given tid. Man kunne også tilføje opfølgende informationer, som placerer artiklen X i forhold til artiklerne Y og Z (med hyperlinks), der førte til udviklingen af artikel A og B (nye hyperlinks), osv.

Litteraturen i Internettet behøver altså ikke at være lige så statisk som dets gamle papirbaserede forgænger. Bit-versionen kan forblive lige så flydende som forskningen selv. Uanset om det bliver de gratis initiativer som PubMed Central eller forlæggerne, der vinder kampen om de videnskabelige informationer på Internettet, så er det sikkert at "Babelstårnet" bliver bygget. For hvem gider betale for og vente på trykte udgaver af tidsskrifter, når de kan nås med et enkelt museklik eller to hjemme fra pc'en? Spørgsmålet bliver blot, om vi alle lukkes ind, eller om udsigten over menneskenes samlede viden bliver forbeholdt det mindretal, der har råd til at betale entreen.



Fakta - Parterne
*PubMed Central: Gratis og globalt frit tilgængeligt elektronisk arkiv for primærlitteratur indenfor medicin, biologi og landbrugsvidenskab. Basen vil indeholde både peer-review artikler og preprints med en tydelig skelnen mellem dem. Et halvt dusin anerkendte tidsskrifter, såsom Proceedings of the National Academy of Sciences (PNAS) og Molecular Biology of the Cell har valgt at bidrage med deres indhold. PubMed Central er etableret af det amerikanske National Institute of Health (NIH) og samarbejder med European Molecular Biology Organization (EMBO), og deres tilsvarende tjeneste, E-Biosci. Starter januar 2000. Foreløbig adresse for PubMed: http://www.ncbi.nlm.nih.gov/ PubMed/


*Forlæggerne: Forlagenes kommercielle alternativ har endnu ikke noget navn, men ideen går ud på at koble artikelreferencerne på hjemmesiderne hos de respektive publikationer, således at der opstår et enormt net af krydsreferencer (vha. hyperlinks). Sammenslutningen består af en lang række af de største videnskabelige forlæggere: American Association for the Advancement of Science (AAAS, med bl.a. Science), Academic Press, American Institute of Physics, Association for Computing Machinery, Blackwell Science, Elsevier Science, Inst. Of Electrical and Electronics Engineers, John Wiley & Sons, Kluwer Academic Publishers, Nature, Oxford University Press og Springer Verlag.

*HighWire: Tidsskriftbase fra biblioteket i Stanford, USA, som indeholder henvisninger til en masse (p.t. 162) mindre amerikanske biomedicinske tidsskrifter, der hver især er lagt ud på www, og hvor en del kan benyttes gratis. Adgang til over en halv million abstracts og over 100.000 artikler i fuld længde (full-text). Adresse: http://highwire.stanford.edu

*ArXiv.org: Gratis og globalt frit tilgængeligt elektronisk arkiv for primærlitteratur indenfor fysik og matematik. Artiklerne er preprints og peer-reviewed, og lagt ud primært af forfatterne selv. Over 100.000 full-text-artikler. Finansieret af det amerikanske National Science Foundation, NSF. Adresse: http://arXiv.org eller http://xxx.lanl.gov

*ADS: Abstract-databaser for astrofysik, finansieret af NASA. Over 1,5 millioner abstracts fra tidsskrifter og andre videnskabelige kilder som konferencer og ph.d.-afhandlinger. Desuden over 100.000 full-text-artikler. Adresse: http://adswww.harvard.edu

*Andre arkiver: En liste over de største full-text-arkiver med naturvidenskabeligt materiale på Internettet findes hos HighWire. Adresse: http://highwire.standford.edu/lists/ largest.dtl


Fakta - DADS
*På forskningsbibliotekerne rundt omkring i den vestlige verden er man godt i gang med at omstille sig til den snarlige revolution: Traditionelle funktioner som udlån og registrering beskæres, mens der oprustes inden for databearbejdning. Hovedopgaven for fremtidens bibliotek bliver således ikke at stille data til rådighed, men at sortere i dem for brugeren. I Danmark er mange forskningsbiblioteker gået sammen om at abonnere på de elektroniske versioner af en række fagblade for at minimere omkostningerne. Danmarks Tekniske Videnscenter og Bibliotek styrer det såkaldte DADS-system, der indeholder adgang til mange on-line-artikler (fra begge 'lejre' i det ovenstående). Fra de deltagende biblioteker er der adgang til abstracts eller full-text-artikler fra cirka 1.700 tidsskrifter fra forlagene Academic Press, Elsevier, Kluwer, Springer, MCB og SIAM. Selvom adgangen til artiklerne og dermed også administrationen er blevet nemmere, har det ikke betydet lavere priser. Selvom bibliotekerne allerede abonnerer på den trykte udgave af et tidsskrift, skal de betale ekstra for den elektroniske version. Samtidig følger der med mange af pakkerne tidsskrifter, som ligger langt uden for de enkelte bibliotekers fagområder, og som er uden værdi for lånerne.

0 comments:

There was an error in this gadget