Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità
Titolo del progetto
Il corpus del vocabolario italiano delle origini:
aggiornamento filologico e interoperabilità
Sigla del progetto
COVO
Descrizione breve
Il progetto risponde all'esigenza di potenziare e rendere
più efficace la ricerca in rete per lo studio dell'italiano antico e della
letteratura volgare dei primi secoli: un settore che è da tempo all'avanguardia
nelle digital humanities, ma che proprio per questo sente con urgenza la
necessità di un continuo aggiornamento.
Scopo principale del progetto è dotare il sistema-ricerca
italiano di un network di strumenti che sia in grado di modificare
sensibilmente le condizioni degli studi sulla letteratura e sulla lingua dei
primi secoli. Punto di partenza del progetto è il “Corpus OVI dell'italiano
antico” che, con i suoi oltre 23 milioni di occorrenze ad accesso libero in
rete, riveste ormai una indiscutibile centralità negli studi filologici,
storico- linguistici e lessicografici. Il progetto si propone perciò di
aggiornarlo, di ampliarlo nei testi e nella lemmatizzazione, e di connetterlo
ad altri archivi digitali complementari, rispondendo così a un'esigenza urgente
e non più rinviabile.
Responsabile del
progetto di ricerca
Lino Leonardi (Direttore Istituto Opera del Vocabolario
Italiano -CNR)
Responsabile del
progetto per Unistrasi
Giuseppe Marrani
Indirizzo email per
richiesta informazioni
marrani@unistrasi.it
Sito del progetto
http://www.ovi.cnr.it/index.php/it/
Contesto di
riferimento del progetto
PRIN 2015
Ente finanziatore
MIUR
Partner scientifici
Istituto Opera del Vocabolario Italiano - CNR, Università
"L'Orientale" di Napoli, Scuola Normale Superiore di Pisa, Università
di Pavia, Università degli Studi di Siena
Altri partner
-
Periodo di operatività
del progetto
05/02/2017 - 05/02/2020
Abstract del progetto
Il progetto mira a costruire, a partire dal Corpus OVI
dell'italiano antico, un network di interoperabilità che consenta ricerche
integrate con altri database in rete, testuali e/o lessicali e/o filologici. Si
mira a coinvolgere nel network innanzitutto gli altri corpora gestiti presso lo
stesso Istituto OVI dal sistema GATTO ma finora separati dal corpus principale,
in modo da poter interrogare unitariamente l'insieme dei dati testuali riuniti
in un “metacorpus”, e ad allargare i collegamenti al “Tesoro della lingua
italiana delle origini" (TLIO), in modo che da ogni parola di ogni testo
si possa accedere alla voce corrispondente nel vocabolario.
S'intende poi in seconda battuta ampliare il network e
coinvolgere i principali repertori filologici in rete relativi ai testi
medievali italiani, da quelli contenuti in “Mirabile” a quelli del sistema
“TLIon”, sì da rendere permeabile il confine fra la consultabilità dei testi e
la ricerca sulla loro tradizione manoscritta e editoriale.
Ci si propone inoltre di introdurre due ulteriori
integrazioni al sistema di corpora e strumenti che si verrà così a costituire:
il recupero del primo corpus della lingua poetica dell'italiano antico, e cioè
il “Corpus Avalle” preparato negli anni '70 del secolo scorso e lemmatizzato
nei successivi anni '90 ma poi congelato da un software divenuto obsoleto, e
quindi un nuovo “Atlante grammaticale della lingua italiana delle origini”,
allestito sui dati del corpus OVI e interrogato tramite un sistema di
georeferenziazione.
Abstract in inglese
-
Parole chiave
(keywords)
corpora,digital humanities,filologia