Eesti 19. sajandi vallakohtuprotokollid on tänu oma temaatikale, iseloomule ja süstemaatilisusele üheks olulisemaks eesti keele ja kultuuri ajaloo uurimise objektiks, peegeldades ühtviisi nii tollase talurahva eluolu, majanduslikku seisundit, kõikvõimalikke üleastumisi ja elukorralduse häireid, üldist mentaliteeti kui ka eesti kirjakeele kujunemise protsessi. 2019. a kevadel Rahvusarhiivis käivitatud ühisloomeprojekt, mille käigus on sisestamisel tuhandeid protokolle, avas võimaluse selle rikkaliku allikmaterjali mitmekesisemaks uurimiseks. Käesoleva projekti põhieesmärgiks on vallakohtuprotokollide kasutusvõimaluste oluline laiendamine. Selleks töötatakse välja ajalooliste tekstide automaattöötluse metodoloogia, rakendades tekstide normaliseerimist, morfoloogilist analüüsi, automaatse nimetuvastuse jm lahendusi.
Estonian communal court minute books from the 19th century form an important source for studying Estonian language and cultural history due to their systematic structure and topical contents. The books reflect the life, economic status, and the general mentality of the peasantry at that time, misconducts and disorders, as well as the development process of Estonian literary language. In spring 2019, a crowd-sourcing project was launched by the National Archives of Estonia for inserting the texts from thousands of minute books, thereby making this rich historical source more accessible. The aim of the current project is to enhance the usage possibilities of these communal court minute books by developing the methodology for the automatic processing of historical texts. This involves text normalization, automatic morphological analysis, named entity recognition, and other techniques.