Søg

Islandske korpusser

Her kan du se et udvalg af de korpusser (altså tekstsamlinger) der findes for de nordiske sprog. På denne side finder du de islandske korpusser. For de sprog hvor der det er flere korpusser end vi har fundet det nødvendigt at linke til, har vi begrænset udvalget ved især at linke til korpusser der har en brugervenlig grænseflade med mulighed for forskellige former for søgninger. Desuden har vi forsøgt at få repræsenteret forskellige tekstgenrer, fx skønlitteratur, talesprog og journalistik.

 

 

MÍM – Det islandske ordklasseopmærkede korpus
Det islandske korpus MÍM indeholder ca. 25 millioner ord som stammer fra forskellige elektroniske eller digitaliserede tekster fra perioden 2000-2010. Teksterne repræsenterer forskellige genrer, f.eks. trykte bøger, aviser, blogs og offentlige tekster. Ordene er ordklasseopmærkede (e. tagged).og forsynet med bibliografiske oplysninger. Korpusset er oplagt til sprogforskning og tænkt som et sprogteknologisk værktøj. Oplysninger på engelsk findes på: http://www.malfong.is/index.php?pg=mim&lang=en

 


Íslenskt textasafn 
Korpusset indeholder 80 millioner ord fra ældre og nyere tekster på islandsk. Teksterne repræsenterer forskellige genrer, f.eks. islandske sagaer, skønlitteratur, avistekster og talt sprog. Man kan både søge efter genrerne hver for sig og flere genrer på en gang. Teksterne giver et overblik over det islanske sprog fra ca. 1200 til det 21. århundrede. Oplysninger på engelsk findes på: http://corpus.arnastofnun.is/leitallt.pl?info=4