The Uppsala Russian Corpus
Uppsalakorpusen består av runt 600 ryskspråkiga texter med sammanlagt en miljon ord (token), jämnt fördelade på informativ och skönlitterär prosa. De informativa texterna är skrivna 1985-1989 medan de skönlitterära texterna, vars vokabulär inte föråldras lika snabbt, hänför sig till en längre tidsperiod, från 1960-1988. Korpusen omfattar inte poesi eller drama.
Ett omfattande arbete har lagts på att säkerställa att korpusen blir så representativ och varierad som möjligt inom de givna ramarna. De informativa texterna är hämtade från 25 olika ämnesområden: ekonomi, utrikes nyheter/utrikespolitik, ideologi/inrikespolitik, partiangelägenheter, det sovjetiska samhället, sociala frågor, försvar, utbildning, lagstiftning, historia, kultur, lingvistik, medicin/hälsovård, psykologi, miljö/ekologi, jordbruk, ingenjörskonst, informationsteknologi, rymdforskning, energi, biologi, geologi/geografi, fysik, kemi och idrott. Vissa områden som ansågs vara viktigare representeras av en större textmängd.
Den skönlitterära hälften av korpusen omfattar verk av följande 40 författare: Abramov, Ajtmatov, Astaf'ev, Baklanov, Bek, Belov, Bitov, Bondarev, Dubov, Ganin, Gladyshev, Granin, Grekova, Goncharov, Iskander, Kaverin, Kazakov, Kochnev, Kozhevnikova, Nagibin, Lixanov, Lidin, Paustovskij, Pogodin, Pristavkin, Troepol'skij, Rasputin, Shcherbakova, Simonov, Solouxin, Shmelev, Tendrjakov, Tokareva, Tolstaja, Trifonov, Vasil'ev, Vorobl'ev, Zalygin och Zorin. Inte heller här är representationen jämn, utan de kändare författarna representeras av större textmängder.
För mer detaljerad information om korpusen se Lönngren, Lennart (ed.), 1993. Chastotnyj slovar' sovremennogo russkogo jazyka. (Modern rysk frekvensordbok. Med engelskspråkig sammanfattning.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 sidor Uppsala. ISBN 91-554-3134-8.
Syfte:
Syftet är att tillhandahålla en korpus med ryskspråkiga prosatexter.
Gå till källa för data
Öppnas i en ny tabbhttps://www.lingexp.uni-tuebingen.de/sfb441/b1/en/korpora.html
Citering och åtkomst
Citering och åtkomst
Tillgänglighetsnivå:
Skapare/primärforskare:
- Lennart Lönngren - Universitetet i Tromsö - Institutionen för språkvetenskap
- Uppsala universitet - Institutionen för moderna språk
Forskningshuvudman:
Data innehåller personuppgifter:
Nej
Citering:
Korpus
Korpus
Metod och utfall
Metod och utfall
Administrativ information
Administrativ information
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Relationer
Relationer
Publikationer
Publikationer
Metadata
Metadata
Version 1

Universitetet i Tromsö