Titolo:     

Scoprire l’evoluzione del pensiero anglo-americano dalla prima opera edita al 1700 attraverso EEBO-TCP

Temi:     

EEBO-TCP (Early English Books Online – Text Creation Partnership) è un progetto che prevede principalmente la trascrizione e la creazione di edizioni full-text delle opere appartenenti al database Early English Books Online (EEBO), ma comprende anche la collezione Thomason Tracts (1640-1661) e la raccolta Early English Books Tract Supplement.

Autori:     

Il progetto è stato concepito nel 1999 ed è costituito da una collaborazione fra le principali università e biblioteche universitarie del mondo (al momento più di 150).

I principali collaboratori di EEBO-TCP sono: la University of Michigan Library, che si occupa della selezione dei testi e del controllo qualità delle trascrizioni; le Bodleian Libraries dell’University of Oxford, che si occupano anch’esse del controllo e, in caso di errori, della modifica delle trascrizioni (coadiuvate poi anche da altre biblioteche, come la National Library of Wales); la casa editrice americana ProQuest, che fornisce le immagini delle pagine dei testi selezionati; il Council of Library and Information Resources (CLIR).

In particolare la University of Michigan Library è il motore principale del progetto e ne è anche l’amministratore. Dal 2020 il team di questa biblioteca risulta essere l’unico attivo. A occuparsi di rendere disponibili i materiali in rete è lo staff del dipartimento Digital Content & Collections (DDC). Attualmente il manager è Paul Schaffner.

Il progetto TCP è quasi interamente autofinanziato, ma riceve anche una sovvenzione dall’agenzia statunitense NEH (National Endowment for the Humanities).

 Contenuti e fonti:     

Come detto sopra il progetto EEBO-TCP si basa sul database Early English Books Online (EEBO), è un catalogo di libri a stampa pubblicato dalla ProQuest e disponibile solo tramite acquisto o licenza. Di questo database fanno parte due collezioni, ovvero Pollard & Redgrave’s Short-Title Catalogue (che contiene testi editi dal 1475 al 1640) e Wing’s Short-Title Catalogue (che contiene quelli editi dal 1641 al 1700). Gli oltre 125.000 titoli presenti nel catalogo EEBO, quindi, ripercorrono lo sviluppo e l’evoluzione del pensiero e della cultura occidentali (in particolare anglo-americani) dal primo libro stampato in inglese nel 1475 fino al 1700, spaziando in varie tematiche e in tutti campi dell’attività umana: dalla letteratura alle scienze naturali, dalla politica alla religione, dalla storia alla geografia, dalla musica alle arti pratiche.

La TCP, invece di partire da zero, ha deciso di collaborare con questo fornitore di libri storici online, in modo da poter concentrare le risorse e i fondi sulla trascrizione dei testi.

La realizzazione del progetto TCP ha visto due fasi di sviluppo.

Nella Fase I (dal 2000 al 2009) sono stati trascritti oltre 25.000 testi selezionati dal corpus EEBO. Inizialmente il criterio adottato per la scelta dei testi da trasporre era il fatto che gli autori dovessero essere menzionati nella New Cambridge Bibliography of English Litirature, ma poi questa linea guida ha lasciato il posto a criteri di scelta più generici.

La Fase II (dal 2009 in poi) ha visto il lavoro concentrarsi sulle monografie in lingua inglese (anche gallese e gaelica) ed escludere dalla trascrizione i libri in altre lingue. Dal 2020 il numero dei libri resi fruibili dalla Fase II è di quasi 35.000 (su un obiettivo di circa 45.000 titoli).

La selezione in generale ha sempre seguito una serie di criteri generali, come dare la priorità alle prime edizioni, evitare opere in un alfabeto diverso da quello latino, evitare opere così mal stampate o rovinate da risultare illeggibili, evitare quelle frequentemente riedite (come i libri di preghiera) ed evitare quelle troppo limitate a livello tematico.

Ad oggi sono state prodotte oltre 70.000 trascrizioni complete, codificate e ricercabili. I testi trascritti originariamente venivano resi disponibili come file SGML, ora come file XML.

Nel 2005 i collaboratori hanno scelto di espandere il modello TCP anche ad altri database, in particolare Eighteenth-Century Collections Online (ECCO) e Evans Early American Imprints (Evans-TCP). Di questi database sono stati prodotte circa 8.000 digitalizzazioni (3.000 del database ECCO e 5.000 di Evans) e si possono trovare ai seguenti link:

-          Eighteenth-Century Collections Online – TCP (https://quod.lib.umich.edu/e/ecco/);

-          Evans Early American Imprints – TCP (https://quod.lib.umich.edu/e/evans/).

Inoltre è stato trascritto, nell’ambito della sovvenzione della NEH, un insieme di testi relativi alla navigazione e al viaggio, confluiti nella raccolta EEBO-TCP Collections: Navigations.
 Funzionalità:     

Attraverso la funzione “Browse” (divisa in Fase I e Fase II) i testi possono essere visualizzati in ordine alfabetico in base all’autore, al titolo o all’oggetto di trattazione.

Il progetto EEBO-TCP, poi, offre 4 possibilità di ricerca testuale.

-          Basic Search à è una ricerca per parole chiave, le quali vengono cercate all’interno dell’intero corpus di testi presenti nel sistema. Per restringere il campo di ricerca si possono scegliere le tipologie di testo o anche parti del testo in cui si vuole cercare, oppure si può direttamente limitare la ricerca a un solo testo o a un autore. Vi è la possibilità, inoltre, di ricercare una frase completa.

-          Boolean Search à mette in relazione le parole-chiave fra loro in base agli operatori booleani “and”, “or” e “not”. Possono essere ricercati assieme al massimo tre termini.

-          Proximity Search à permette di cercare due termini assieme e di scegliere la distanza massima che occorre fra questi: si può scegliere fra una distanza di 40, 80 o 120 parole.

-          Bibliographic Search à cerca soltanto nel record di catalogo di ogni libro. È utile quando si vuole cercare un autore, un titolo, una citazione o un argomento specifici.

Per ogni tipo di ricerca i risultati possono essere ordinati per autore, per titolo, alfabeticamente, cronologicamente (in modo ascendente o discendente) oppure in base alla frequenza con cui la parola-chiave appare nei vari testi. Per espandere le ricerche, ovvero cercare anche le variazioni della parola (ad esempio le coniugazioni verbali) basta aggiungere un asterisco alla fine della parola-chiave.

Tutte le ricerche possono essere divise in base alla Fase di appartenenza dei testi e si può decidere se cercare solo in una delle due Fasi o in entrambe.

I titoli di interesse possono essere aggiunti alla “Bookbag”, in modo da poterli ritrovare una volta completate le ricerche. L’utente, inoltre, può vedere la cronologia di ricerca cliccando su “History”.

I testi di età moderna prevedono diversi tipi di ortografia per la stessa parola, di conseguenza quando si immette la parola-chiave nella barra di ricerca i risultati potrebbero risultare sfalsati. Questo problema è ovviato dalla funzione “Word Index”, che ricerca nei testi le varie ortografie del termine-chiave e la frequenza con cui queste compaiono nei testi. Anche in questo caso non si può effettuare la ricerca in tutti i testi, ma bisogna effettuarla due volte, una nella Fase I e una nella Fase II.

Comprendere il funzionamento del progetto e le varie possibilità che mette a disposizione è abbastanza semplice, ma andando sulla sezione “About EEBO”, oltre a trovare molte informazioni riguardanti il progetto, il suo sviluppo e i partecipanti, si trovano dei video-tutorial molto chiari ed esplicativi per ogni tipologia di ricerca (menù a tendina “Using our content” à “Tutorials”). Nel caso l’utente abbia già cominciato la ricerca, invece di tornare indietro e andare ai video, può cliccare su “Help” (sempre presente sulla barra in alto) che rimanda a una spiegazione scritta delle funzionalità del progetto. Su questa stessa barra ci si può muovere fra le varie ricerche senza dover tornare alla Home Page. Per qualsiasi domanda, problema o informazione vi è sempre la possibilità di contattare chi gestisce il progetto attraverso la mail ufficiale; per segnalare eventuali errori c’è l’apposita voce “DLPS Help” (entrambi i link sono sempre presenti in basso durante la ricerca).

Per ogni testo è prevista una tavola dei contenuti (“Table of contents”), in cui vengono indicati autore, titolo, diritti, fonte di stampa, tema, l’URL e come citare il testo; sotto, nella sezione dei contenuti vi è un indice ipertestuale che dà all’utente interessato soltanto a un determinato capitolo del testo la possibilità di accedervi in modo rapido. Oltre alla tavola dei contenuti vi è anche la possibilità di vedere attraverso la voce “Result details” la lista delle frasi che contengono la parola-chiave e da lì, andare direttamente alla pagina interessata.

 Obiettivi e pubblico di riferimento:     

L’obiettivo del progetto è creare edizioni di testi standard e digitalmente codificati di tutte le prime edizioni dei testi in lingua inglese presenti nel database EEBO (in alcuni casi anche di edizioni successive, se queste contengono variazioni importanti). Invece di digitalizzare tramite riconoscimento ottico (OCR) le pagine dei testi (creando in questo modo soltanto immagini di pagine), i collaboratori del progetto hanno trascritto e contrassegnato il testo tramite la digitazione manuale di tutte le parole; così facendo hanno permesso di creare un modello di testo flessibile adatto al lavoro di ricerca.

Il progetto, quindi, si rivolge soprattutto ai ricercatori e agli studiosi dell’età moderna (in particolare a coloro che effettuano ricerche testuali), ma non solo. Dal 1° agosto 2020 tutti i testi trascritti sia nella Fase I sia nella Fase II sono gratuitamente fruibili dal pubblico (i testi della Fase I erano già stati resi pubblici dal 1° gennaio 2015). Di conseguenza, il progetto è rivolto a chiunque e il fatto che i collaboratori abbiano selezionato testi di varia natura in modo da includere il maggior numero di tematiche diverse, amplia sicuramente il pubblico che ha interesse a utilizzare questi materiali e gli strumenti di ricerca offerti da EEBO-TCP.

 Architettura web, chiarezza, navigabilità:         5
Accessibilità e ricercabilità dei dati:         5
Qualità grafica, impatto visivo:         4
 Rilevanza del tema:         5
Ricchezza dei contenuti:         5
 Qualità degli apparati descrittivi e delle guide:         5
Giudizio complessivo:     

EEBO-TCP è un progetto di vastissima portata perché prevede un lavoro di digitalizzazione di testi culturalmente e tematicamente rilevanti attraverso la digitazione manuale di ogni parola per creare edizioni full-text completamente ricercabili. Questa modalità di trascrizione offre molte possibilità di ricerca testuale che le semplici scannerizzazioni di pagine non possono offrire (il riconoscimento ottico dei caratteri non è molto affidabile a causa dell’irregolarità di stampa, della qualità variabile delle immagini digitalizzate e dell’ambiguità di alcuni tipi di caratteri).

Il sito è ben strutturato: i vari tipi di ricerche disponibili sono molto utili e diversificati e vi sono veramente molte possibilità di restringere o ampliare il campo di ricerca.

Il fatto che il corpus di testi sia diviso in Fase I e Fase II non è così limitante perché, oltre al fatto che i titoli aggiunti nella Bookbag vengono visualizzati senza questa suddivisione, si può scegliere di effettuare le ricerche in entrambe le Fasi contemporaneamente. Solo nel caso delle funzioni “Browse” e “World index” questa suddivisione è più rigida e si devono effettuare due ricerche diverse. Una pecca è che i titoli inseriti nella Bookbag restano in memoria soltanto durante la sessione di ricerca; se l’utente chiude la ricerca e poi vi ritorna, questi titoli vanno persi.

Entrando nell’edizione full text, invece, è facile muoversi fra le parole-chiave che, oltre a essere evidenziate in giallo, hanno accanto una freccia-link che fa passare l’utente direttamente alla parola-chiave successiva (o precedente) senza dover scrollare interamente il testo e cercarla (non serve cercare nemmeno la prima parola-chiave, basta cliccare su “Go to first matched term”). Ciò riduce di molto il tempo di ricerca.

L’edizione full-text dei testi, oltre a dividere i paragrafi in base a come sono suddivisi nel testo originale, li divide in base alle pagine, in modo da far sapere all’utente in che pagina si trova quando legge e per facilitarne la citazione (molto utile a questo proposito è la voce “How to cite” che rimanda a una spiegazione su come citare le fonti). Un problema riscontrato è che, diversamente da quanto fatto vedere in uno dei video-tutorial, non ci sono anche le immagini statiche delle pagine originali (che dovrebbero essere disponibili grazie ai link che segnano l’inizio di ogni pagina). Non è sicuramente un problema che limita le funzionalità del progetto, ma l’accesso alle immagini delle pagine originali lo avrebbe reso più completo.

Essendo un progetto volto alla ricerca testuale l’apparato grafico è poco sviluppato.  Nel complesso, però, il sito non ne viene penalizzato, anzi: mantenendo uno stile sobrio e privo di immagini e fronzoli l’impatto visivo della ricerca risulta molto chiaro (un apparato grafico sviluppato rischierebbe di distrarre l’utente).

La funzione “Word Index” è molto valevole e oltre a facilitare la ricerca può essere utile per notare come si evolve l’ortografia delle varie parole nel tempo. Anche in questo caso il fatto che sia diviso in Fase I e Fase II non comporta impedimenti.

I testi presenti nel catalogo sono quasi tutti in lingua inglese (soprattutto quelli della Fase II, come detto sopra) e questo potrebbe essere considerato un difetto. La mole del progetto, però, comportava per forza delle scelte di questo tipo, quindi non può essere visto come un limite; inoltre il progetto è tuttora in espansione e forse un giorno, dopo aver completato la trascrizione di tutti i testi in lingua inglese, verranno inseriti anche testi in altre lingue. Sono stati esclusi dalla trascrizione anche i periodici e i giornali, ma per questi è già previsto un progetto a parte da realizzarsi in futuro.

Il fatto che sia gratuitamente accessibile a tutti è sicuramente un ulteriore pregio.

Nel complesso, quindi, il progetto EEBO-TCP è un progetto molto valido sia per il tipo di contenuti che per le funzioni che mette a disposizione.

URL:      https://quod.lib.umich.edu/e/eebogroup/
Tipologia:      Pubblicazione di fonti primarie
Firma:      Lena Miriana
Immagine:      La copertina di EEBO-TCP, con l’immagine di Adamo ed Eva che colgono il frutto della conoscenza, è indicativa dell’obiettivo del progetto: rendere fruibile a chiunque il sapere racchiuso nel database di EEBO.
Data della recensione:      27 November 2021