Gå direkt till huvudinnehåll
Researchdata.se
ℹ️ Detta är en preview-version av Researchdata.se, innehåll och funktionalitet är under utveckling.

Svenska tidningar 1818-1870

Svenska tidningar 1818-1870
https://doi.org/10.23695/9BNQ-XC71
Svenska tidningar 1818–1870 innehåller ett urval av digitaliserade versioner av svenska tidningar från 1818 till 1870. Det är en del av den så kallad Kubhist corpus which was digitized at Kubhist-korpus som digitaliserades av Kungliga biblioteket (KB). En tidning valdes slumpmässigt from varje år. För varje tidning valdes två sidor, andra och fjärde. Sidorna bearbetades automatiskt med hjälp av avancerad dokumentlayoutanalys där varje segment i den digitaliserade sidan inramades och numrerades. Vidare har varje segment bearbetades med Abbyy FineReader version 11 och slutligen transkriberades manuellt av ett transkriptionsföretag som är specialiserat på så kallad double-keying. Denna datamängd innehåller 106 sidor, 5,059 segments och 186,013 ord totalt. Materialet producerades inom projektet Utvärdering och förfining av en förbättrad OCR-process för massdigitalisering som finansieras av RJ (dnr IN18-0940: 1) för perioden 2019-2020.
Gå till källa för data
Öppnas i en ny tabb
https://doi.org/10.23695/9BNQ-XC71

Citering och åtkomst

Administrativ information

Ämnesområde och nyckelord

Metadata

sprakbanken-textgu_sv