Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità

Titolo del progetto

Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità

Sigla del progetto

COVO

Descrizione breve

Il progetto risponde all'esigenza di potenziare e rendere più efficace la ricerca in rete per lo studio dell'italiano antico e della letteratura volgare dei primi secoli: un settore che è da tempo all'avanguardia nelle digital humanities, ma che proprio per questo sente con urgenza la necessità di un continuo aggiornamento.

Scopo principale del progetto è dotare il sistema-ricerca italiano di un network di strumenti che sia in grado di modificare sensibilmente le condizioni degli studi sulla letteratura e sulla lingua dei primi secoli. Punto di partenza del progetto è il “Corpus OVI dell'italiano antico” che, con i suoi oltre 23 milioni di occorrenze ad accesso libero in rete, riveste ormai una indiscutibile centralità negli studi filologici, storico- linguistici e lessicografici. Il progetto si propone perciò di aggiornarlo, di ampliarlo nei testi e nella lemmatizzazione, e di connetterlo ad altri archivi digitali complementari, rispondendo così a un'esigenza urgente e non più rinviabile.

Responsabile del progetto di ricerca

Lino Leonardi (Direttore Istituto Opera del Vocabolario Italiano -CNR)

Responsabile del progetto per Unistrasi

Giuseppe Marrani

Indirizzo email per richiesta informazioni

marrani@unistrasi.it

Sito del progetto

http://www.ovi.cnr.it/index.php/it/

Contesto di riferimento del progetto

PRIN 2015

Ente finanziatore

MIUR

Partner scientifici

Istituto Opera del Vocabolario Italiano - CNR, Università "L'Orientale" di Napoli, Scuola Normale Superiore di Pisa, Università di Pavia, Università degli Studi di Siena

Altri partner

-

Periodo di operatività del progetto

05/02/2017 - 05/02/2020

Abstract del progetto

Il progetto mira a costruire, a partire dal Corpus OVI dell'italiano antico, un network di interoperabilità che consenta ricerche integrate con altri database in rete, testuali e/o lessicali e/o filologici. Si mira a coinvolgere nel network innanzitutto gli altri corpora gestiti presso lo stesso Istituto OVI dal sistema GATTO ma finora separati dal corpus principale, in modo da poter interrogare unitariamente l'insieme dei dati testuali riuniti in un “metacorpus”, e ad allargare i collegamenti al “Tesoro della lingua italiana delle origini" (TLIO), in modo che da ogni parola di ogni testo si possa accedere alla voce corrispondente nel vocabolario.

S'intende poi in seconda battuta ampliare il network e coinvolgere i principali repertori filologici in rete relativi ai testi medievali italiani, da quelli contenuti in “Mirabile” a quelli del sistema “TLIon”, sì da rendere permeabile il confine fra la consultabilità dei testi e la ricerca sulla loro tradizione manoscritta e editoriale.

Ci si propone inoltre di introdurre due ulteriori integrazioni al sistema di corpora e strumenti che si verrà così a costituire: il recupero del primo corpus della lingua poetica dell'italiano antico, e cioè il “Corpus Avalle” preparato negli anni '70 del secolo scorso e lemmatizzato nei successivi anni '90 ma poi congelato da un software divenuto obsoleto, e quindi un nuovo “Atlante grammaticale della lingua italiana delle origini”, allestito sui dati del corpus OVI e interrogato tramite un sistema di georeferenziazione.

Abstract in inglese

-

Parole chiave (keywords)

corpora,digital humanities,filologia


Leggi anche