Bouw mee aan het Limburgs Corpus!
Een corpus is een verzameling van tekstueel en audiovisueel materiaal in een bepaalde taal. Essentieel om de betreffende taal goed te kunnen onderzoeken én voor het ontwikkelen van taaltechnologie en AI. Bovendien is het een centrale, langdurige en duurzame vorm van het bewaren van Limburgstalig materiaal voor volgende generaties.
Super belangrijk dus. Daarom subsidieert ’t Hoes het bouwen van het Limburgs Corpus door onderzoeker Andreas Simons (foto) van de Universiteit Maastricht. Met de creatie van het corpus ondersteunen we de Limburgse taal en houden we haar levend. Het corpus is een dataset die door taalonderzoekers gebruikt kan worden om beter inzicht te krijgen in bijvoorbeeld de ontwikkeling, diversiteit en huidige status van het Limburgs. Daarnaast helpt het corpus het Limburgs toekomstbestendig te maken door te functioneren als input voor (digitale tools) zoals spraakherkenning, AI en cursusmaterialen.
Maar: het corpus valt of staat met input. En daarvoor hebben we ook jouw hulp nodig. Andreas verzamelt alle mogelijke digitale materialen die iets in een Limburgs dialect bevatten om de Limburgse taal in al haar varianten zo breed mogelijk te documenteren. Het maakt dus niets uit wát voor materiaal het precies is (zolang het maar geschreven of gesproken is), in welke vorm van het Limburgs het is, hoe oud het is, enzovoort. Hoe meer variatie, hoe beter!
Wil jij bijdragen? Je kunt hier je digitale materialen uploaden. Heb je een grote hoeveelheid materiaal óf fysieke materialen die je niet zelf kunt digitaliseren? Neem dan contact op met Andreas.
Eerst meer weten over het Limburgs Corpus en hoe er wordt omgegaan met de gedeelde materialen? Bezoek dan de website van het project.
