Volgens Wikipedia is een infrastructuur het geheel van voorzieningen dat nodig is om iets (onderzoek, onderwijs, werk) goed te laten functioneren. Deze voorzieningen hebben de volgende basiskenmerken:
- ze zijn redelijk duurzaam (dwz ze zijn voor langere tijd beschikbaar)
- ze functioneren in belangrijke mate onafhankelijk van specifiek gebruik
- ze zijn bestemd voor algemeen en gemeenschappelijk gebruik (dwz ze zijn niet heel specifiek voor een mogelijke groep gebruikers).
In de Geesteswetenschappen bestond de infrastructuur tot voor kort (slechts) uit een goed werkend set (academische) bibliotheken, (peer reviewd) tijdschriften en workshops, symposia en conferenties waar GW-onderzoekers hun werk presenteerden en leerden van andere onderzoekers.
Computers, digitale opslag, gemeenschappelijke werkomgevingen en andere vruchten van de "conected-world", waren lang niet of nauwelijks aanwezig binnen de meer traditionele Geesteswetenschappen. Computers en internet deden wel vroeg hun intrede, maar dan vooral als een betere typemachine en een makkelijke manier om boeken te lenen/kopen en elkaar berichten te sturen.
Computationeel Linguisten
Als eerste begonnen de (computationeel) linguisten met het gebruik van data en algorithme voor hun eigen onderzoek. In eerste instantie was het niet veel meer dan woordjes tellen, maar al snel kwamen daar zaken bij die binnen de traditionele linguistiek niet gedaan konden worden.
En naarmate er meer data gedigitaliseerd werd (=tekst), data makkelijker beschikbaar kwam ( = internet), computers sneller en "slimmer" werden en steeds meer data en rekenkracht met elkaar verbonden werd (=cloud computing) nam het gebruik van IT een steeds grotere vlucht binnen de Geesteswetenschappen.
Eind jaren '90 leidde dat tot het samenwerken van onderzoekers uit met name Europa en Noord-Amerika (ADHO) en vervolgens de eerste Digital Humanities conferenties. Op deze, nog steeds bestaande conferenties staat het Geesteswetenschappelijk onderzoek mbv digitale middelen en het gebruik en de ontwikkeling van de hiervoor noodzakelijke digitale middelen, centraal.
Digital Humanities
De digitale geesteswetenschappen (DH) is een gebied van wetenschappelijke activiteit op het snijvlak van computer- of digitale technologieën en de disciplines van de geesteswetenschappen. Het omvat het systematische gebruik van digitale bronnen in de geesteswetenschappen, evenals de reflectie over de toepassing ervan.[1][2] DH kan worden gedefinieerd als nieuwe manieren van het doen van studiebeurzen die samenwerking, transdisciplinair en computationeel geëngageerd onderzoek, onderwijs en publicatie omvatten[3] Het brengt digitale instrumenten en methoden naar de studie van de geesteswetenschappen met de erkenning dat het gedrukte woord niet langer het belangrijkste medium is voor de productie en distributie van kennis[3].
Door nieuwe toepassingen en technieken te produceren en te gebruiken, maakt DH nieuwe vormen van onderwijs en onderzoek mogelijk en bestudeert en bekritiseert het tegelijkertijd hoe deze het cultureel erfgoed en de digitale cultuur beïnvloeden.[2] Een onderscheidend kenmerk van DH is dus het cultiveren van een tweerichtingsrelatie tussen de geesteswetenschappen en de digitale cultuur: het veld maakt gebruik van technologie bij het nastreven van onderzoek in de geesteswetenschappen en onderwerpt de technologie aan een humanistische bevraging en ondervraging, vaak tegelijkertijd.
Omdit goed te kunnen doen, is een goede infrastructuur noodzakelijk.
Standaarden
Met het toenemen van de hoeveelheid data en algorithmes, groeide ook de noodzaak een-en-ander te standaardiseren. In de eerste jaren van de DH waren de meeste DH-onderzoekers zeer wel in staat om zelf hun data te converteren en/of hun software aan de datastructuren aan te passen. Maar naarmate er steeds meer GW-onderzoekers gebruik wilden maken van zowel data als tools (=software), groeide de wens om een en ander op elkaar af te stemmen zodat een onderzoeker uit Bologna voor onderzoek met zijn data de in Oslo ontwikkelde tools makkelijk kon gebruiken.
De wens tot toenemende standaardisering zien we terug in TEI (Text Encoding Initiative) en de Europese organisaties als CLARIN en DARIAH. Naarmate de technologie beter in staat is om "talig onderzoek" te fasciliteren (en daarmee in de regel ook ingewikkelder wordt), neemt de afstand tussen gebruikers en ontwikkelaars toe waardoor de noodzaak van organisaties die deze kloof proberen te dichten, juist toeneemt.