Norsk aviskorpus

Prosjekt Avdeling: Uni Research Computing (gruppe: Gruppe for språk og språkteknologi)

Om prosjektet

Ved CLU er det siden 1998 samlet inn et omfattende tekstmateriale bestående av tekster fra 24 nasjonale og regionale norske aviser. Vi har utviklet et system for daglig innhenting og bearbeiding av store mengder tekst fra avisenes nettsider. Korpuset oppdateres daglig, og i juni 2014 inneholdt korpuset mer enn 1,2 millioner ord. Nasjonalbiblioteket betaler i dag CLU for tilpassing av materialet for innlemmelse i Norsk språkbank.

Aviskorpuset er et stort og kontinuerlig oppdatert kontrollkorpus for moderne norsk språk på både bokmål og nynorsk. Slik blir korpuset en uvurderlig ressurs i studier av språklige endringer, nyord og andre språklige nydannelser, samt leksikalsk produksjon og kreativitet. Aviskorpuset brukes mye, blant annet av forskere som ønsker å finne ut mer om hvordan media påvirker samfunnets forståelse av store samfunnsspørsmål, som for eksempel klimaendringene. Det er utgitt en egen artikkelsamling om de ulike forskningsprosjektene som har kunnet realiseres takket være Aviskorpuset (Andersen, G. (red.): Exploring Newspaper Language: Using the web to create and investigate a large corpus of modern Norwegian. John Benjamins, 2012).

For mer informasjon, se avis.uib.no

cp: 2017-12-16 09:16:26