Wiki glossary di Digital History: concetti e parole chiave
Lo strumento Wiki consente di creare ipertesti in modo collaborativo. In questa Wiki vi è richiesto di collaborare per creare insieme un glossario di concetti e parole chiave relativo alla Digital History. A ciascun* studente è richiesto di contribuire non meno di 100 parole entro le prime due settimane di corso.
Buon lavoro!
Digital History: concetti e parole chiave
Indice
1. Cosa si intende per Digital History? Definizioni, opinioni, fonti.%!1%! [modifica]
1.1. %!19%!Scientific Digital Divide
1.2. %!21%!Cenni storici
1.3. %!37%!Impatto del Digital Divide
2. name="toc-5">Un glossario collaborativo per la digital history%!6%! [modifica]
Indice
1. Cosa si intende per Digital History? Definizioni, opinioni, fonti.[modifica]
1.1. Scientific Digital Divide
1.2. Cenni storici
1.3. Impatto del Digital Divide
2. Un glossario collaborativo per la digital history[modifica]
2.1. Ricerca di fonti
2.2. Trasformazione e analisi delle informazioni
2.3. Presentazione dei risultati e comunicazione
Cosa si intende per Digital History? Definizioni, opinioni, fonti.[modifica] [modifica]
Proponete una (o più) definizioni di Digital History. Potete usare i materiali messi a disposizione nella pagina Moodle del corso e/o fare ulteriori ricerche. Per ogni informazione o opinione che riportate indicate tra parentesi la fonte.
Le definizioni di Digital History proposte dagli studi negli ultimi anni hanno in comune l'attenzione ai mutamenti che i media digitali hanno portato - e stanno portando - al modo in cui le discipline storiche svolgono ricerche, elaborano ed interpretano informazioni, e restituiscono le loro ricostruzioni del passato, rivolgendosi a un pubblico specialista e non. Di seguito raccogliamo e discutiamo alcuni esempi.
Nel curare un numero monografico della rivista Diacronie, Elisa Grandi e Émilien Ruiz hanno argomentato che, negli ultimi anni, parallelamente alle mutazioni storiche e sociologiche che hanno portato l'avvento della dimensione digitale anche all'interno del contesto degli studi storici, è correntemente utilizzato il termine "Digital History". Tale espressione fa riferimento all'insieme degli strumenti finalizzati alla ricerca storica, all'analisi delle fonti, alla trasmissione di contenuti e ricostruzioni di eventi a vario livello: scientifico, didattico presso scuole e Università e relativamente alla trasmissione e comunicazione presso il pubblico. (fonte: Digital History: la storia nell’era dell’accesso. Nota introduttiva n. 10 – giugno 2012, autori: Elisa Grandi e Émilien Ruiz, https://doi.org/10.4000/diacronie.2762 e appunti della lezione)
Secondo Enrica Salvatori, la Digital History usa gli strumenti digitali per affinare il metodo di ricerca storico e, per essere veramente efficace, deve essere pensata anche per il pubblico consentendo l'interazione e il coinvolgimento di fonti che riguardano gli utenti oppure chiedendo la collaborazione delle persone, ad esempio per interpretare una fonte antica. (fonte: Enrica Salvatori, articolo su raiscuola.rai.it)
Per Digital History s'intende non solo l'individuazione on line di risorse digitali per la conoscenza di argomenti storici, ma anche il modo di reperire e divulgare le risorse dal mondo digitale. Inoltre, è in grado di far accedere un certo pubblico a fonti autentiche provenienti da ambienti di esperti in ambito culturale e scientifico, facendo in modo che l'utente possa ricevere del materiale funzionale all'esigenza della sua ricerca. La Digital History può essere intesa anche come un utile strumento divulgativo grazie all'estrema facilità con cui è possibile accedere a queste risorse digitali.
Serge Noiret ha posto l'accento sull'uso professionale delle nuove tecnologie digitali da parte degli storici, in particolare sugli usi consapevoli e selettivi delle potenzialità informative offerte dalla rete. Secondo Noiret, gli storici usano il computer non solo come strumento per comunicare, ma anche per accedere alle fonti e alla storiografia e gestire le loro informazioni e la loro documentazione in formato digitale in funzione delle necessità scientifiche o pedagogiche. (Fonte: Serge Noiret, Quali sono le risorse in rete usate dagli storici?)
Secondo D. Seefeldt e W. G. Thomas, la Digital History è un nuovo approccio all'esaminare e rappresentare il passato attraverso le nuove tecnologie di comunicazione, la rete di internet ed i vari software per costruire, definire ed interrogare la storia e quindi digitalizzarla per poter elaborare una struttura che, supportata dalla tecnologia, permetta di leggere, studiare e poter seguire un dibattito in sede accademica attingendo a banche dati ed informazioni di alto livello. (vedi "What is Digital History? A Look at Some Exemplar Projects", https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1097&context=historyfacpub)
Secondo Silvia Bertelli, «quando parliamo di Digital History si fa riferimento alla dimensione più quantitativa e tecnica della nuova storiografia digitale, all'istituzionalizzazione di nuove prassi per la raccolta di dati, la stesura di opere scientifiche, l'accesso a biblioteche, l'utilizzo di software per l'analisi delle banche dati. Di conseguenza la formazione dello storico digitale, non può prescindere dall'acquisizione di capacità informatiche settoriali e non può più basarsi soltanto su percorsi formativi tradizionali». (fonte: La comunicazione digitale per la storia - Digital public history, musei e luoghi di memoria. url consultato in data 25/6/2021)
Secondo Giancarlo Monina, citato da Serge Noiret in Storia digitale o storia con il digitale? (url consultato in data 25/6/2021), la storia digitale si potrebbe definire come «tutto il complesso universo di produzioni e scambi sociali aventi come oggetto la conoscenza storica, trasferito e/o direttamente generato e sperimentato in ambienti digitali (ricerca, organizzazione, relazioni, diffusione, uso pubblico e privato, fonti, libri, didattica, performance e via dicendo)».
Scientific Digital Divide
Tra le questioni generali di cui è bene tenere conto quando ci si occupa di risorse digitali per la ricerca storica e la diffusione dei suoi risultati, c'è la differenza di accesso a queste risorse che può essere determinata da fattori tecnologici ed economici.
Guido Abbattista ha sottolineato come le asimmetrie generate da condizioni logistiche e geografiche si sommino alle disparità che possono essere causate da scelte politiche diverse in materia di ricerca scientifica. Ad un divario di natura economica, facilmente osservabile comparando l'accesso a risorse online offerto da istituzioni universitarie diverse, si somma così quello esemplificato da risorse e servizi offerti ad esempio dalle grandi biblioteche pubbliche in diversi paesi: "In presenza di un digital divide che genera un vero e proprio scientific divide, è chiaro che la radice dei problemi risieda in un clamoroso financial divide che, a sua volta, rimanda alle politiche nazionali di investimento per la ricerca e la cultura e alle priorità strategiche dei governi dei singoli paesi" (Abbattista, "Le risorse online per la storia moderna", in Il web e gli studi storici, a cura di Rolando Minuti, Roma: Carocci, 2015, p. 227; nello stesso volume vedi anche Carlo Spagnolo, "Le riviste digitali e la ricerca storica", specialmente p. 119 dove afferma «Il digital divide si ricrea continuamente in nuove forme sia per ragioni tecnologiche ed economiche sia perché le costanti novità creano circuiti nuovi di conoscenza da cui persino gli specialisti possono venire esclusi»).
A questo proposito, l’Enciclopedia Britannica classifica il
Digital Divide in:
Global Divide: tra paesi industrializzati e paesi in via di sviluppo;
Social Divide: tra diversi gruppi socioeconomici;
Democratic Divide: in cui la differenza è data dall’impegno
politico degli utenti di internet.
E, in seguito, cita diversi studi condotti negli Stati Uniti d’America che
fanno emergere sostanziali disparità dovute a etnia, reddito, grado d’istruzione,
alfabetizzazione digitale, numero di figli per famiglia e persino un “gender
gap” che vede gli uomini in vantaggio sulle donne.
Altri fattori interessanti sono quelli di luogo (nelle zone
rurali e scarsamente popolate non è economico investire per la copertura di rete
quanto lo sarebbe in una città ad alta densità di abitanti), o di tempo libero
(gli utenti meno impegnati infatti sono più portati a utilizzare la rete anche
per acculturamento e accrescimento personale, viceversa, chi ha meno tempo
libero, tende a farne un uso prevalentemente di svago). https://www.britannica.com/topic/digital-divide
Cenni storici
Le nuove prospettive avviate dai progressi tecnologici e comunicativi sono apparse nella loro dimensione di ampia portata, su un consistente spettro di discipline incluse quelle storiche, sin dal Secondo dopoguerra con i primi progetti di computer analogici integrati da elementi digitali.
Nel 1945 l'ingegnere e inventore Vannevar Bush, nel suo articolo seminale su The Atlantic As We May Think, ipotizzò un dispositivo – il memex – nel quale fosse possibile immagazzinare libri, documenti e comunicazioni, meccanizzato in modo da essere consultato con estrema velocità e flessibilità, una sorta di memoria potenziata del ricercatore. Di particolare interesse per l'intreccio tra sviluppo tecnologico e le discipline storiche è il fatto che Bush, nell'esemplificare l'ipotetico dispositivo, avesse immaginato il lavoro di un ricercatore interessato a comprendere la maggiore efficacia, nel contesto delle Crociate, dell'arco corto turco rispetto all'arco lungo inglese. L'uso del memex avrebbe consentito, nella sua ipotesi, di raccogliere e incrociare un gran numero di fonti, di fatto costruendo una pista di ricerca che oggi definiremmo «ipertestuale», disponibile per l'inserimento in altri memex con scopi collaborativi e di comunicazione.
Bisognerà attendere gli anni sessanta per vedere concretizzato il progetto di Bush, con la diffusione nelle aule universitarie, dei primi computer. Forse non casualmente, in questi anni si colloca anche parte del dibattito sull'uso di metodologie quantitative negli studi storici, connesse anche all'emergere del settore disciplinare della storia sociale e al fiorire degli studi storici in ambito demografico ed economico, dibattito che vede tuttora alcuni studiosi scettici sull'uso di attività computazionali nella ricerca storica, come riporta Serge Noiret nel suo articolo Digital History: the new craft of (Public) Historians (url consultato il 25/6/2021). È però importante notare che nel 1973 è proprio uno storico di formazione sociologica come Charles Tilly a discutere in maniera approfondita e non pregiudiziale molte delle critiche all'utilizzo di modelli statistici nello studio dei fenomeni sociali nel suo articolo Computers in Historical Analysis apparso sulla rivista Computers and the Humanities, Vol. 7, No. 6.
Come viene riportato alla voce «Storia digitale» della Wikipedia italiana (url consultato in data 25/6/2021), nel 1994 Roy Rosenzweig fonda in Virginia il più importante centro di storia digitale al mondo: il Roy Rosenzweig Center for History and New Media (CHNM). Nel corso degli anni il CHNM è stato responsabile di molte importanti iniziative di storia digitale e di informatica digitale:
- Liberty Equality Fraternity, un archivio e breve manuale alla storia della rivoluzione francese;
- September 11 Digital Archive, una raccolta di fonti fornite dagli utenti sugli attacchi terroristici a New York dell'11 settembre 2001;
- Zotero, un software open source per il reference management);
- Omeka, un content manager open source per la creazione di archivi ed esibizioni online che usa lo standard Dublin Core per l'attribuzione dei metadati);
- Tropy, un software open source per la gestione delle fotografie a scopo di ricerca.
Impatto del Digital Divide
La disuguaglianza digitale ha creato significative distinzioni tra le società di tutto il mondo. Alcuni dei risultati più vividi generati dal divario digitale includono:
1) Impatto del divario digitale sull'istruzione. Internet è una ricca libreria di informazioni. Più che mai ci sono numerose piattaforme educative dove puoi apprendere abilità avanzate. L'accesso alle TIC è stato collegato al successo accademico e all'eccellente ricerca scientifica. L'istruzione dà potere alla mente. È fondamentale stare al passo con questo settore dinamico per un notevole successo per un individuo e per la società. 2) Impatto del divario digitale sulle sfere sociali. L'accesso a Internet guida la comunicazione. Le piattaforme di social media come Facebook creano coinvolgimento, costruiscono relazioni e ci mettono in contatto con familiari e amici. Possiamo accedere alle informazioni più velocemente che affidarci ai giornali tradizionali.L'arte e la musica sono state radicalmente rivoluzionate dalla tecnologia. Questi sono vantaggi che mancano alle società private di Internet. L'eliminazione del divario digitale è essenziale per responsabilizzare i paesi in via di sviluppo. 3) Impatto del divario digitale sulla società. Il divario digitale ha contribuito alla segregazione degli individui nella società, inclusi etnia, età, razza e sesso. La tecnologia crea nuovi allineamenti tra le persone con accesso a Internet e quelle senza accesso. Quelli con accesso limitato continuano a essere in ritardo, ostacolando la loro crescita e sviluppo. (URL http://www.digitaldividecouncil.com/what-is-the-digital-divide/)
name="toc-5">Un glossario collaborativo per la digital history[modifica] [modifica]
Proponete una (o più) definizioni di concetti chiave elencati in questo glossario. Potete usare i materiali messi a disposizione nella pagina Moodle del corso e/o fare ulteriori ricerche. Per ogni informazione o opinione che riportate indicate tra parentesi la fonte. Per ogni concetto, oltre a una definizione/discussione generale, inserite almeno un esempio. Potete aggiungere nuove voci all'elenco. Ricordate che potete inserire anche link, immagini e video.
Ricerca di fonti
Banca dati: un insieme di dati omogenei per contenuto e formato (https://www.treccani.it/enciclopedia/banca-dati/). La Comunità Europea, nelle direttive volte a tutelare giuridicamente le banche dati, le definisce così: "una raccolta di opere, dati o altri elementi indipendenti sistematicamente o metodicamente disposti ed individualmente accessibili grazie a mezzi elettronici o in altro modo" (Direttiva del Parlamento Europeo del 11 marzo 1996. Per ciò che concerne la tutela giuridica delle banche dati si veda: https://www.altalex.com/documents/news/2013/07/02/banche-dati-la-tutela-giuridica-nella-giurisprudenza-della-corte-di-giustizia)
L'espressione "banca dati" è molto spesso (ma non sempre) utilizzata come sinonimo di database, ossia insieme di dati organizzati in una certa maniera. (definizione elaborata durante la lezione del 20/10). Questa accezione (banca dati come sinonimo di database) è oggi molto diffusa anche per via dell'influenza della lingua inglese (poiché "base di dati" e "banca dati" si traducono entrambe con database).
Un esempio concreto di banca dati è Rivisteweb (disponibile qui): un portale che presenta gli articoli di oltre 80 testate attive e un archivio di quasi 100 periodici del gruppo del Mulino (Società editrice il Mulino e Carocci editore). È una delle collezioni di riviste di scienze umane e sociali più complete: pensata per le Università, centri di ricerca, istituzioni pubbliche e private. L'archivio copre cronologicamente le riviste edite dal Mulino dal 1997 ad oggi, inoltre quelle pubblicate da Carocci dal 2008 ad oggi. Un altro esempio di banca dati bibliografica è Historical Abstract with Full Text che contiene metadati accompagnati da testi completi in formato pdf e che contiene riviste di carattere storico di un certo spessore e che fanno parte dell'universo Ebsco (https://www.ebsco.com/it-it/prodotti/banche-dati-per-la-ricerca/historical-abstracts-full-text).
(Fonte: Rivisteweb, la piattaforma italiana per le scienze umane e sociali. https://www.rivisteweb.it/doi/10.1409/9951)
Ulteriori esempi di banche dati posso essere: ESSPER, che contiene metadati bibliografici e alcuni articoli in full text derivati dallo spoglio di oltre 1000 periodici di economia, scienze sociali e storia (http://www.biblio.liuc.it/scripts/essper/default.asp); e Manifestipolitici.it, banca dati curata dalla Fondazione Gramsci Emilia Romagna e che raccoglie più di 14000 manifesti politici e sociali dal primo '900 ad oggi (http://www.manifestipolitici.it/.do#0).
Altre volte con "banca dati" si trova indicato l'insieme di un database (il cuore informativo del sistema), software (per la gestione del database e applicativi collegati) e tutte quelle strutture e meccanismi finalizzati all'uso del sistema. In questa seconda definizione il database è, in altre parole, solo una parte della banca dati (questa accezione è adottata ad esempio da Guido M. Rey nella voce "Banche dati e basi di dati", in Enciclopedia delle scienze sociali, 1991, accessibile sul portale Treccani).
Quando ci si imbatte nell'espressione banca dati è bene quindi fare attenzione per capire se in quel particolare contesto è usata come sinonimo di database o per intendere un sistema più ampio che include anche un database.
Database Management System (DBMS): software che
permette la gestione di un database (creazione, inserimento, estrazione,
aggiornamento, cancellazione dati) (fonte: appunti delle lezioni)Sistema per la ricerca rapida e il recupero
delle informazioni da un database. Il DBMS determina il modo in cui i dati
vengono archiviati e recuperati. Deve affrontare problemi quali sicurezza,
accuratezza, coerenza tra record diversi, tempo di risposta e requisiti di
memoria. I DBMS relazionali, in cui i dati sono organizzati in una serie di
tabelle ("relazioni") facilmente riorganizzabili per accedere ai dati
in modi diversi, sono i più usati oggi (fonte: “Database management system”, in
Encyclopedia Britannica, https://www.britannica.com/technology/database-management-system,
consultato il 14 febbraio 2021).
Structured Query Language (SQR): linguaggio usato
da un DBMS per la funzione di interrogazione dei dati, dunque il recupero delle
informazioni. (fonte: appunti delle lezioni)Data entry: Processo di inserimento di dati all'interno di un database. Il quale può essere sia manuale, che automatizzato (riconoscimento vocale), o semi-automatizzato. In questa fase i dati vengono organizzati e catalogati secondo specifici criteri. Ad esempio, nel caso dei libri di una biblioteca, essi vengono catalogati per autore, titolo, editore, anno, e poi inserite informazioni sulla collocazione e su soggetto/argomento. Questa fase della gestione dei dati riguarda sia i database elettronici, che quelli analogici, difatti, in entrambi i casi, è necessaria una continua alimentazione del sistema. Il processo data entry si fa attraverso una ricerca di fonti primarie, perciò può risultare un processo molto laborioso in termini di ricerca, reperimento ed elaborazione di quest'ultime.
In un database di tipo elettronico, l'organizzazione prevede un file che contiene diverse tabelle, ciascuna delle quali ospita dei record (che corrispondono alle "righe" della tabella stessa); ogni record contiene dei campi (o fields, unità di base in cui l'informazione è strutturata).
Lo schema è la struttura su
cui si costruisce il database. In una struttura relazionale, i dati sono
integrati, ovvero devono essere memorizzati una sola volta all’interno del database,
affinché non vi siano duplicazioni. (fonte: appunti delle lezioni)
Data modelling: Un data model consiste nel modello astratto della struttura di un database (nel marketing si usano diagrammi facilmente comprensibili per spiegare il flusso dei dati). Deve avere alcune caratteristiche, ad esempio la rilevanza, la chiarezza, la disponibilità, l'accuratezza, l'accessibilità.
Nel campo delle digital humanities, il data modelling è una fase cruciale del lavoro del ricercatore, il quale realizzerà una mediazione fra le conoscenze emerse dai progetti di studio e le potenzialità della tecnologia digitale.
Le risorse digitali nel loro formato originario (immagini, testi scannerizzati o trascrizioni) offrono limitate possibilità di analisi. I testi contengono ambiguità, differenti sfumature di significato e le informazioni riguardanti fatti, persone, date ecc. si trovano in varie parti del testo, non organizzate in modo chiaro. Al contrario, molte tipologie di analisi digitali richiedono dati strutturati, organizzati e archiviati secondo un formato predefinito (data model), applicando tecniche specifiche per tradurre fonti e concetti in elementi digitali. Esistono svariati data model, i seguenti sono prevalenti nella ricerca umanistica: database model, document-oriented data model e RDF model.
(Fonte: Digital Humanities WorkbenchVrije Universiteit Amsterdam in https://www2.fgw.vu.nl/werkbanken/dighum/source_data/data_modelling.php Consultato l’8/11/2020).="https:>
Il modello entità-relazione
(ER): permette di modellare graficamente il mondo reale utilizzando entità e relazioni.
Ogni entità rappresenta un’unità logica, che memorizza informazioni omogenee. Le entità possono essere collegate da relazioni. Consideriamo il sito dell'Università di Trieste: il database per la sua gestione identifica delle unità logiche (studenti, corsi di laurea, dipartimenti, docenti...). Essendo una struttura integrata, i dati saranno memorizzati una sola volta e nell'entità "corsi di laurea", inserirò solo le informazioni legate a tale entità, non creando duplicazione. (fonte: appunti delle lezioni).Database relazionale: trasformare un'informazione analogica, come per esempio un testo scritto stampato, in un'informazione discreta, ovvero digitale e pertanto ricercabile. Attraverso la segmentazione del dato si permette un tipo di ricerca diverso (fonte: appunti delle lezioni)
- Aggregatore: Si tratta di un software che cerca informazioni e contenuti nel web e li ripropone; alcuni sono creati per iOS o Android e altri solo per PC. Es.: http://www.rssowl.org/ funziona su Windows, Mac e Linux; si tratta di un software libero. La principale funzione di un aggregatore è quella di raggruppare dati in modo unitario e poterli rendere facilmente consultabili. In ambito di ricerca scientifica, l'aggregatore è uno strumento diverso. Si veda l'articolo Federico Nanni, "L’archiviazione delle pagine dei quotidiani online", in Diacronie, 15, 3, 2013 https://doi.org/10.4000/diacronie.418. Gli aggregatori per la ricerca storica sono dei database che contengono materiale proveniente da riviste accademiche; tramite un'interfaccia si ha così accesso a contenuti di provenienza accademica. Nella lezione del 26 ottobre 2020 abbiamo introdotto i più importanti aggregatori nell'ambito della ricerca scientifica:
- JSTOR (https://www.jstor.org/): È il più noto di questi aggregatori, nato per riviste anglofone ed è cresciuto comprendendo ora riviste di tutto il mondo. Si presenta come una biblioteca digitale contenente 1200 periodici accademici e monografie e gestito da una organizzazione no profit: Itaca. Jstor, sostenuto da migliaia di biblioteche e università, è in grado di riprodurre oltre 2.000 periodici accademici, in formato immagine o PDF.
- Persée (https://www.persee.fr/): Aggregatore promosso dal Ministero dell'istruzione superiore, della ricerca e dell'innovazione francese e quindi completamente gratuito. Contiene solo testi di ambito francofono.
- Project MUSE (https://muse.jhu.edu/): Contiene riviste dell'University Press americane. Tale progetto è definito come "complementare" a Jstor, offrendo periodici accademici delle ultime annate nell'ambito delle scienze umane e sociali.
- Torrossa (https://www.torrossa.com/it/): Contiene riviste italiane ed è stato creato dal distributore/editore di Firenze noto come Casalini.
- Periodicals Archive Online o PAO (https://www.proquest.com): offre il testo completo, in formato immagine, di centinaia di periodici accademici dal 1802 in poi.
- Moving wall: Conosciuto anche come Moving Wall Embargo, si tratta del lasso temporale nella disponibilità dei fascicoli di una certa rivista (quelli più datati saranno più semplici da ottenere, mentre quelli più recenti, comporteranno dei costi aggiuntivi); varia da 0 a 10 anni;JSTOR varia da 3 anni a 5 anni; https://support.jstor.org/hc/en-us/articles/115004879547-About-the-Moving-Wall. Le varie Istituzioni possono decidere anche di abbonarsi ad annate più recenti del Moving Wall previsto con pacchetti acquistabili che le biblioteche possono comprare singolarmente oppure per editore (ricordiamo che JSTOR aggrega contenuti provenienti da diversi editori) ma ciò dipende dagli interessi specifici su vari settori e soprattutto dalle singole disponibilità finanziarie.
- Biblioteca digitale: Stefania Manni la definisce così: un "Insieme di file o software dedicati al loro recupero, custode e creatrice di collezioni di documenti immateriali accessibili da qualunque luogo e immediatamente disponibili" (Fonte: Storia digitale, https://www.storiadigitale.it/).
Questa è una definizione non troppo chiara. Quando parliamo di "biblioteca digitale" di norma facciamo riferimento a una collezione di testi originariamente a stampa e raccolti in uno o più formati digitali. La raccolta può rispondere a diversi criteri ispiratori: può essere, per esempio, generalista (Google Books, Internet Archive, Hathi Trust), oppure a carattere nazionale (Gallica, Biblioteca digitale italiana, Biblioteca Digital Hispánica, Biblioteca virtual Cervantes, Canadiana, Biblioteca Digital del patrimonio cultural digital iberoamericano, Bibliothèque numérique du Nouveau Monde, Digital Public Library of America, Qatar Digital Library), o a carattere tematico (OLL. Online Library of Liberty; Bibliotheca Sinica, Chine ancienne, Les classiques des scienes sociales, South Seas, Voyaging and Cross-cultural Enounters in the Pacific, 1760-1800, Digital Library on American Slavery, Brill’s Digital Library of World War I), o, ancora, a carattere cronologico (Early European Books, Eighteenth Century Catalogue Online, Collezione Incunaboli di Biblioteca Italiana). Un saggio sulla nascita e l'evoluzione delle biblioteche digitali (non più recente) di tre studiosi italiani può essere letto qui. https://www.persee.fr/ biblioteca digitale con molte collezioni francofone in diversi settori umanistici https://www.persee.fr/disciplines.
La biblioteca digitale rappresenta uno strumento fondamentale per la società ma è bene sottolineare che può presentare dei limiti strutturali. Il primo riguarda il suo grado di funzionalità in quanto non è detto che sia accessibile a tutti. Per esempio può presentare dei limiti nella consultazione dei contenuti limitato esclusivamente agli abbonati. Il secondo, è legato all'aspetto del copyright poichè alcuni testi non possono essere riprodotti se protetti da diritti d'autore.
L’avvento delle biblioteche digitali può modificare profondamente il mondo della ricerca scientifica: grazie a questa innovazione quello delle biblioteche si può trasformare da un “resource-based information system” ad un “knowledge based service”. Ovvero, da un sistema di accumulo di informazioni, ad un servizio basato sulla conoscenza, incorporato nel processo di ricerca ed all’interno del quale i ricercatori collaborano al fine di dare vita ad un “ecosistema della conoscenza”. La produttività dell’attività di ricerca risiederà in futuro nello sviluppo di questa particolare infrastruttura digitale e sull’evoluzione del sistema bibliotecario in un “knowledge based service”. (Fonte: Candela, Castelli, Pagano, History, evolution and impact of digital lbraries).
La biblioteca digitale si presenta come un sistema complesso organizzato in cui si mettono a disposizione degli utenti, in modo strutturato, dei contenuti che, oltre ad essere derivati da una raccolta cartacea, possono essere disponibili in rete. Affinché i testi si possano digitalizzare innanzitutto è necessario che siano nel pubblico dominio, ovvero non protetti da diritti d'autore. È poi importante utilizzare dei programmi di OCR (Optical Character Recognition) avanzati, ovvero in grado di tradurre correttamente un'immagine tipografica rilevata con uno scanner in un testo in modo che quest'ultimo sia ricercabile. La descrizione di questi oggetti si effettua attraverso i metadati e la messa a disposizione avviene tramite le risorse di servizio quali la catalogazione, l'indicizzazione, il servizio di recupero documenti.
- Deposito Legale: gli editori ed i tipografi sono tenuti per legge a consegnare gratuitamente una o alcune copie di tutte le loro pubblicazioni a delle biblioteche speciali (definite, di norma, "nazionale") dei rispettivi paesi di appartenenza. Ciò viene fatto perché questi testi: "vengano elencati, conservati e resi pubblicamente accessibili" (Fonte: R. Niri, Biblioteche e bibliografie online, in Il web e gli studi storici, Carrocci Editore, Roma, 2015 p. 25). In Italia tali biblioteche sono a Roma e a Firenze. (Al riguardo si veda: L. Bellingeri, L'apporto del deposito legale nella formazione delle raccolte della Biblioteca Estense ed Universitaria dopo l'Unità d'Italia, in: Quaderni Estensi 2 (2010), pp. 214-225, disponibile al seguente indirizzo: http://www.quaderniestensi.beniculturali.it/QE2/contributi/bellingeri.pdf).
- Deposito istituzionale (repository): Insieme di strumenti per supportare - all'interno di archivi istituzionali di università - il deposito, la disseminazione, l'archiviazione e la conservazione a lungo termine della ricerca accademica prodotta in formato digitale. ( Fonte: Maria Cassella, "I depositi istituzionali tra politiche mandatarie e strategie a sostegno dell'auto-archiviazione, https://core.ac.uk/).
I depositi istituzionali devono considerarsi vere e proprie biblioteche digitali, che si basano su un intero assetto digitale (digital asset) costruite secondo il modello Open Access. Si tratta di uno spazio virtuale in cui collezioni digitali, comunità di utenti e servizi interagiscono, con la finalità di creare, condividere e usare la conoscenza, rappresentata da risorse digitali. Nei depositi istituzionali la centralità della risorsa digitale non sta nell'archiviazione di una collezione digitale ma si focalizza nella condivisione dell'informazione. La differenza è che nei depositi istituzionali l’utente, come autore o come lettore, è parte attiva del workflow (cioè le diverse procedure che avvengono sull'oggetto digitale) per la creazione del sistema. Lo scopo delle istituzioni che realizzano un deposito è quello di utilizzare al meglio le possibilità di condivisione e collaborazione offerte dal web, fornendo un’infrastruttura informativa e comunicativa che serve agli utenti per svolgere la propria attività di studio, di ricerca, di didattica, al meglio delle possibilità. (Fonte: Tamarro Anna Maria e De Gregori Teresa "Ruolo e funzionalità dei depositi istituzionali " consultato il 14/10/2020)
L'aggettivo "istituzionale" fa riferimento al fatto che possono essere mantenuti da una o più istituzioni, queste istituzioni solo solitamente scientifiche, ad esempio università e centri di ricerca.
I depositi istituzionali sono collezioni digitali che catturano e conservano le produzioni intellettuali di una singola o di più comunità accademiche. Non sono necessariamente limitati agli e-prints di letteratura di ricerca, in quanto potrebbero ospitare ed offrire un focus di tipo istituzionale completo per l'aggregazione e conservazione di collezioni diverse da quelle riferibili ai soli paper di ricerca, comprendendo anche dati scientifici, risorse didattiche, collezioni di immagini e molti altre tipologie materiali.
I depositi istituzionali possono essere considerati un'estensione naturale delle responsabilità dell'istituzione accademica in quanto generatori di ricerca primaria, e possono costituire di fatto la componente più importante nell'evoluzione della struttura dei nuovi modelli di comunicazione scientifica.
(Fonte: Antonella De Robbio, Auto-archiviazione per la ricerca: problemi aperti e sviluppi futuri.)- Metadati bibliografici: prima dell'avvento del web per accedere alla consultazione di un libro in biblioteca si interrogava il catalogo a schede, in genere un' enorme sala con mobili a cassetto nei quali il contenuto erano delle schede cartacee poste in ordine alfabetico. Oggi i cataloghi si trovano online e i metadati bibliografici sono proprio la carta d'identità di un libro ovvero l' autore/gli autori, il titolo, editore, luogo ecc. La sigla che identifica il catalogo online è l' OPAC.
- Un tipico esempio di metadati è la scheda del catalogo di una biblioteca, che può contenere posizione e contenuto di un determinato libro. Un altro esempio importante di metadato sono la fonte e l'autore dell'insieme di dati descritto. I metadati sono alla base della gestione delle informazioni all'interno delle biblioteche digitali, possono potenzialmente essere associati a qualsiasi cosa e possono contenere molteplici tipi di informazione.
- Opac: Acronimo di On-line public access catalogue, ovvero il catalogo delle biblioteche consultabile dal pubblico in rete. (Treccani, https://www.treccani.it/enciclopedia/opac/), un esempio è il sito "Biblioest" (https://www.biblioest.it/SebinaOpac/.do), ovvero un portale che presenta risorse e servizi delle biblioteche del Friuli Venezia Giulia coordinato dal Sistema bibliotecario di Ateneo dell'Università di Trieste. dal portale dell' Istituto Centrale per il Catalogo Unico delle Biblioteche (ICCU): https://www.iccu.sbn.it/export/sites/iccu/documenti/OPAC/OPAC_SBN_Informazioni.pdf
Considerando gli Opac italiani, possiamo annoverare fra i più importanti i cataloghi della Biblioteca Nazionale di Roma (http://www.bncrm.beniculturali.it/it/908/cataloghi) e della Biblioteca Nazionale di Firenze (https://www.bncf.firenze.sbn.it).
Il BinP - Biblioteche in Polo, il catalogo del Polo Regionale del Veneto, che permette di consultare l'intero catalogo delle province di Belluno, Padova, Rovigo, Treviso, Verona, Vicenza e Venezia.
In ambito estero è opportuno ricordare la Bibliothèque Nationale de France (https://www.bnf.fr), The British Library (https://www.bl.uk) e The Library of Congress (https://catalog.loc.gov), nonché la Biblioteca Nacional de España (http://www.bne.es/es/Inicio/) BNE, la principale biblioteca spagnola e deposito del patrimonio bibliografico spagnolo (http://catalogo.bne.es/uhtbin/webcat)
(Fonte: Curatolo P. Ricerche bibliografiche in internet, Italia Libri. http://www.italialibri.net/appendice/1001-1.html Consultato il 19.10.2020).
Il termine OPAC è l'acronimo di Online Public Access Catalogue, cioè catalogo in linea ad accesso pubblico.
Indica il catalogo elettronico di una o più biblioteche, consultabile liberamente anche a distanza attraverso la rete Internet. Consiste in un database in cui le informazioni sono state inserite in modo organizzato e strutturato per facilitare il recupero dei dati attraverso diversi punti di accesso (es. titolo, autore etc.) (vedi:http://www.biblioteche.unibo.it/portale/formazione/tutorial-acnp/tutorial/acnp-t/ ; Consultato il 27/10/2020).
Tra le informazioni che si possono reperire consultando un OPAC ci sono (oltre alle più ovvie autore, co-autori, anno di pubblicazione e luogo, casa editrice):
- Abstract
- Elenco biblioteche in cui è reperibile il libro
- Descrizione fisica prodotto (dimensioni, pagine, illustrato o no)
- Codici SBN e ISBN
- Se è testo d’esame e per quali insegnamenti, in quali corsi di studio.
- Commenti
- Tag relativi ad argomenti correlati
- Metaopac: Un Metaopac è una sorta di "motore di ricerca" in grado di consultare molti cataloghi informatizzati, ovvero uno strumento che consente la ricerca simultanea in numerosi Opac, permettendo una sola operazione di individuare, attraverso la rete, risorse di un insieme di biblioteche contemporaneamente ( Fonte: Gnoli C. Gli opac. Una guida per il pubblico all'utilizzo dei cataloghi in linea, AIB-WEB. https://www.aib.it). Esempi di Metaopac sono Biblioest (che permette di accedere ai database delle biblioteche del FVG offrendo servizi per la ricerca ed è coordinato dal Sistema Bibliotecario d'Ateneo dell'Università degli Studi di Trieste - https://opac.units.it/SebinaOpac/Opac.do), SBN (Servizio Bibliotecario Nazionale-tutte le acquisizioni delle biblioteche statali e private italiane - https://opac.sbn.it/opacsbn/opac/iccu/free.jsp), e, in campo Europeo, la Biblioteca di Stato della Baviera (https://www.bsb-muenchen.de/), la Biblioteca Nazionale dei Paesi Bassi (https://www.kb.nl/). ; WorldCat è un catalogo bibliografico di migliaia di biblioteche in tutto il mondo (https://www.worldcat.org/).(vedi:Guido Abbattista, corso LM Digital History 2020-2021, Units, lez.4, appunti)
- Motore di ricerca: In informatica, con particolare riferimento alla rete Internet, programma accessibile da opportuni siti che permette di individuare informazioni di particolare interesse per l’utente. ( Fonte: https://www.treccani.it). Con la nascita nel 1991 del Word Wide Web, sorge la necessità di mettere a punto nuovi metodi di archiviazione e di consultazione che siano all'altezza di un importante mole di dati. Vengono alla luce i primi motori di ricerca, in tecnichese "spider" o "crawler", in grado di leggere e catalogare i documenti all'interno del "world wide web" rendendoli disponibili agli utenti nelle cosiddette "SERP" (Search Engine Result Page): le pagine in cui sono visibili uno dopo l'altro i risultati forniti dai motori di ricerca in base alle "query" (domande) poste alla rete. . Nel 1994 nacque Yahoo!, uno dei più importanti motori di ricerca che, grazie alla grafica accattivante, in poco tempo s'imporrà sulla concorrenza. Nel 1998 nacque il PageRank, un algoritmo di analisi atto alla catalogazione dei siti attribuendovi importanza o meno sulla base del peso assegnato a ogni elemento di un collegamento ipertestuale. Con il PageRank nasce Google, destinato a diventare il sito e motore di ricerca più visitato. (Fonte: https://mapsgroup.it consultato il 14/10/2020).
Ad oggi, i motori di ricerca made in USA sono nettamente i più usati a livello mondiale. Google, Yahoo! e Bing controllano insieme il 98% delle ricerche realizzate a livello mondiale (soltanto Google ne è destinatario per il 92%). (Fonte: Statcounter)
- Open access: Accesso libero e senza barriere al sapere scientifico. (BerlinDeclaration_it.pdf, attraverso il sito dell'ateneo di Bologna). Si tratta di materiale digitale online libero da copyright. OpenStarTs è l'archivio istituzionale dell'Università degli Studi di Trieste che raccoglie migliaia di risorse digitali ad accesso libero. Nell'archivio si trovano i testi pubblicati dall'EUT, libri e ricerche di divulgazione scientifica, testi didattici, prove d'esame e tesi di dottorato sulla ricerca. Inoltre, è importante sottolineare la presenza della sottosezione "biblioteca digitale" che contiene libri digitalizzati provenienti da numerosi fondi triestini, tra i quali spiccano l'Archivio degli scrittori e della cultura regionale, la raccolta di Bruno Pincherle e dei fratelli Stuparich. Se si desidera ampliare la propria conoscenza sulla storia di Trieste, la Venezia Giulia, l'Istria e la Dalmazia, la sezione "Storia Locale" offre centinaia di libri. ( fonte: https://www.openstarts.units.it/ ) Altro esempio di piattaforma open access è l'Open Archive di Reti Medievali, che mette a disposizione in formato elettronico contenuti pubblicati in altre sedi (indicando l'originaria sede di pubblicazione) relativi agli studi medievistici. Vengono trattati temi di storia sociale, economica, politica, culturale e letteraria relativi all'Età di Mezzo, senza trascurare edizioni di fonti e studi di metodologia e didattica (http://www.rmoa.unina.it/).
- Reference Management Software: Gli RMS sono dei software che: "servono a raccogliere, organizzare, gestire e condividere i riferimenti bibliografici utili per la propria ricerca" (definizione data dalla pagina Bibliosan 2.0. All'interno della stessa pagina vi è anche una lista di caratteristiche e funzionalità di due dei maggiori RMS, ovvero Zotero e Mendeley). Secondo la definizione data dal Sistema Bibliotecario dell'Università di Bologna (link qui) gli RMS "agevolano la memorizzazione, la gestione e il riuso dei riferimenti bibliografici al fine di facilitare la generazione di bibliografie e l'inserimento delle citazioni in testi accademici come tesi, articoli e saggi."
Zotero è un software che permette la creazione e la gestione di bibliografie. Può essere usato come programma stand alone, o integrato nei principali browser. Permette la generazione automatica di citazioni, note e bibliografie, velocizzando le operazioni. (Gianluigi Bonanomi, Conent is King, 2019, Milano, Ledizioni)
Zotero è un software per la gestione di riferimenti bibliografici e dei materiali ad essi correlati (ad esempio file in formato PDF), libero e open source. Tra le sue principali caratteristiche vi sono l'integrazione all'interno dei più famosi web browser e editor di testo, la sincronizzazione on-line delle bibliografie, la generazione automatica di citazioni, note e bibliografie. È sviluppato dal Roy Rosenzweig Center for History and New Media (RRCHNM) della George Mason University. Il nome "Zotero" deriva dal verbo albanese zotëroj, che significa "padroneggiare". Fonte ( https://it.wikipedia.org/wiki/Zotero).
Oltre a Zotero, ci sono altri esempi di Reference Management Software come Mendeley e EndNote, ma non sono gli unici; questo sito https://www.g2.com/categories/reference-management ci offre una panoramica sui 10 migliori software scelti dalle preferenze degli utenti.
Trasformazione e analisi delle informazioni
- Database testuale: un insieme di dati testuali raccolti in un archivio digitale interrogabile dall'utente secondo determinati criteri. La creazione e la diffusione dei database testuali in lingua italiana è cresciuta esponenzialmente negli ultimi anni, complice lo sviluppo delle tecnologie informatiche e l’acquisizione dei fondamentali strumenti teorici atti a governarle.
I database testuali si sono rivelati particolarmente utili per la ricerca in campo linguistico, permettendo l’acquisizione e l’interrogazione simultanea – e automatizzata – di un’enorme mole di dati, impensabile fino a qualche decennio prima. (Fonte: Filologia risorse informatiche)
Secondo www.miniscript.it (la gestione dei database testuali), un database testuale è un documento di testo (.txt) in cui vengono salvati dei dati per poi essere letti tramite script php. Generalmente, un file .txt si articola in più righi ed ognuno di essi può rappresentare un set di dati con l'impossibilità però di instaurare una relazione fra i dati. In sostanza, ogni rigo contiene uno o più dati e all'interno del rigo i singoli dati sono separati da un carattere separatore. Nella fonte riportata all'inizio della definizione si possono trovare degli esempi pratici che non sono di carattere storico ma, una volta riconosciuta la grafica di un testo .txt, si pò comprendere che può essere stato utilizzato anche nei database usati recentemente per le nostre relazioni.- Corpus: Nel linguaggio comune la parola corpus indica una raccolta sistematica di testi, iscrizioni, leggi ecc. (Fonte: https://www.garzantilinguistica.it/). In ambito digitale si intende un archivio contenente testi registrati ed elaborati elettronicamente. Si può far riferimento a documenti scritti oppure orali, disponibili per mezzo di software o in alternativa, consultabili online. (Fonte: Grazib M. "Electronic Corpora: as powerful tools in computational linguistic analyses", Djillali Liabes University. http://ceur-ws.org/Vol-547/93.pdf Consultato il 19.10.2020) (Fonte: "What is digital corpus", IGI Global Publisher of timely knowledge https://www.igi-global.com/dictionary/massive-digital-libraries-mdls-and-the-impact-of-mass-digitized-book-collections/60484 Consultato il 19.10.2020) Ad esempio, Il Corpus Digitale delle Scritture scolastiche d'ambito Valdostano (CoDiSV), con sede presso il Dipartimento di Scienze Umane e Sociali dell'Università di Aosta, contiene riproduzioni digitali di quaderni scolastici datati dall'Unità d'Italia in avanti. Tale corpus é consultabile online ed è costituito da circa 1100 documenti. (Fonte: "CoDiSV - Corpus Digitale delle Scritture scolastiche d'ambito Valdostano, Università della Valle d'Aosta http://www.codisv.it Consultato il 19.10.2020). Come ulteriore esempio di corpus possiamo citare il TLG (Thesaurus Linguae Graecae), che mette a disposizione 13000 opere di quasi 4000 autori che spaziano dall' VIII secolo a.C. al 1453 (http://stephanus.tlg.uci.edu/).
- OCR: L'Optical character recognition, è una tecnologia che permette all'utente di convertire un testo cartaceo in un formato digitale, così che, attraverso un computer, lo si possa salvare e volendo modificare. Per farlo si ha bisogno sia di componenti hardware (scanner, fotocamere digitali), sia di software (programmi appositi per OCR: ne esistono sia gratuiti (ad esempio FreeOCR, oppure Free Online OCR, sotto forma di servizio gratuito online) sia a pagamento (come OCRKIt oppure Expert PDF Professional). Una funzione di OCR è incorporata anche all'interno di Adobe Acrobat Professional. Il vantaggio di digitalizzare un testo cartaceo tramite OCR sta soprattutto nel fatto che la digitalizzazione prodotta è ricercabile: tramite il comando "cerca" è infatti possibile cercare un determinato termine all'interno del documento. Questa funziona non è invece possibile se un documento è digitalizzato tramite scannerizzazione in formato immagine o semplice PDF. La qualità del file testuale ottenuto con un OCR (e quindi la necessità o meno di effettuare revisioni e correzioni) è influenzata dalla leggibilità del supporto materiale originario. Libri e giornali mal conservati, testi attaccati da muffe, umidità e insetti o stampati con caratteri tipografici usurati o non più di uso comune (emblematica in molti libri antichi la somiglianza del carattere f con il carattere s) possono indurre in errore il software OCR. Pertanto è necessario un confronto del file digitalizzato con la fonte primaria e, in caso di errore, una correzione.
- Crowdsourcing: Il termine crowdsourcing è un neologismo coniato da Howe (2006), a partire dalla combinazione delle parole CROWD intelligence (intelligenza della folla) e outSOURCING (letteralmente esternalizzazione, ovvero il caso in cui le imprese ricorrono ad altre imprese per lo svolgimento di alcune fasi del proprio processo produttivo o fasi dei processi di supporto). Il termine crowdsourcing si riferisce, in maniera generica, alla partecipazione e al contributo del pubblico all'interno di un progetto promosso da un'organizzazione di vario tipo. Nato soprattutto in ambito commerciale, si è però diffuso anche all'interno delle istituzioni culturali, dove il crowdsourcing ha trovato una nuova formulazione dei suoi principi fondanti.(fonte: http://www.labcd.unipi.it/wp-content/uploads/2016/05/Giulia-Rambelli-Crowdsourcing-una-produzione-collaborativa-di-conoscenza.pdf). In pratica l'analisi di un'opera quale un' enciclopedia o una raccolta di lettere/memorie può essere divisa tra vari partecipanti in modo da facilitare ed accelerare il lavoro scomponendolo in piccoli segmenti. (Un esempio per l'ambito storico è Pleiades, un "dizionario geografico costruito dalla comunità" (cit. Pleiades in data 20/02/2021), esso si basa sulla collaborazione dei propri membri per "inserire migliori coordinate geografiche dei siti; identificare i toponimi nelle fonti antiche; scrivere brevi saggi sui luoghi antichi; aggiunta di link a buoni siti web, libri e articoli; e persino scrivere voci completamente nuove" (cit. Pleiades/partecipate, in data 20/02/2021)). Altro esempio di crowdsourcing in ambito storico può essere considerato la digitalizzazione della Cambridge Public Library's Historic Cambridge Newspaper Collection, che si avvale dell'aiuto di qualunque utente interessato per la correzione dei file testuali generati a partire dagli originali cartacei per mezzo di software OCR (https://cambridge.dlconsulting.com/, sezione Help).
Anche l’ambiente scientifico sta traendo sempre più giovamento dall’uso del crowdsourcing. Foldit è stato uno dei primi videogiochi a convertire il lavoro necessario ad una ricerca scientifica in un puzzle in cui gli utenti, prendendo parte al gioco, contribuirono a identificare una grande serie di ripiegamenti proteici, aiutando i ricercatori a aprire nuove possibilità nella ricerca scientifica contro alcune malattie.
- Data mining: insieme di tecniche e metodi per estrarre dati significativi ancorché impliciti, rispetto a un particolare scopo, da un database o comunque da una qualunque fonte informativa. (Fonte: Treccani). Il Data mining si prefigura come un campo di ricerca nato attorno agli anni '90 attraverso l'integrazione di alcune aree come la statistica, il machine learning e l'intelligenza artificiale. Lorenzo Govoni ci fornisce la seguente definizione:" ll Data Mining è il processo di esplorazione ed analisi, per mezzo di sistemi automatici e semi-automatici, di grandi quantità di dati al fine di trovare modelli (o pattern) dai dati ed utilizzarli per un determinato scopo". Inoltre il termine "mining" fa riferimento all'estrazione proprio come accadeva nelle miniere vere e proprie, solo che invece dei dati, era il carbone a venir estratto. (Fonte: https://lorenzogovoni.com/processo-estrazione-dei-dati-data-mining/).
Il data mining costituisce una straordinaria opportunità di integrazione dell’informazione: la novità offerta dagli strumenti di data mining non sta nel rinnegare il tipo tradizionale di conoscenza, ma nell’integrare i processi decisionali con regole costruite sintetizzando estesi patrimoni informativi. Esempi: Intelligent Miner dell’IBM SPA, Clementine di SPSS INC., Enterprise Miner di SAS institute INC.) (Fonte: Susi Dulli, Il data mining)
- Distant reading: Espressione coniata in antitesi al close reading della tradizione americana, l’espressione distant reading indica una scelta critica che si “allontana” dal singolo testo – come nella raccolta La letteratura vista da lontano – per poter osservare un campo più vasto: uno stile, un intero genere letterario, o il campo di produzione intellettuale nel suo complesso. L’idea di “distant reading” ha condotto Moretti all’ipotesi di una quantificazione dei fenomeni letterari, che nel 2010 è a sua volta sfociata nella fondazione dello Stanford Literary Lab. Il Literary Lab ha sviluppato nel corso degli anni una metodologia che congiunge l’uso di larghi archivi digitali con varie forme di analisi computazionale, divenendo rapidamente uno dei maggiori centri di ricerca nel campo dell'Informatica umanistica. I risultati della ricerca del “Literary Lab” sono stati pubblicati come altrettanti pamphlets tradotti rapidamente in una ventina di lingue, e recentemente raccolti in un’antologia tradotta in tutte le maggiori lingue europee. (https://it.wikipedia.org/wiki/Franco_Moretti ) ; (https://www.nytimes.com/2011/06/26/books/review/the-mechanic-muse-what-is-distant-reading.html)
- GIS: acronimo inglese di sistema informativo geografico (geographic information system), è uno strumento software che permette di associare un database e un sistema di mappatura. Questa associazione permette di organizzare e integrare fonti diverse sulla base di collocazioni geografiche, di analizzare l'informazione su base geografica, e di produrre una restituzione visiva delle informazioni. Esistono oggi vari programmi che permettono di creare GIS; tra i programmi ad accesso aperto e open source QGIS è forse il più noto, tra i programmi proprietari il più diffuso è ArcGIS prodotto dall'azienda ESRI (fonte: Jack Dougherty and Kristen Nawrotzki, eds., Writing History In the Digital Age, Ann Arbor, MI: University of Michigan Press, 2013, in particolare vedi p. 187 e sgg.; https://doi.org/10.3998/dh.12230987.0001.001, disponibile gratuitamente online: https://www.fulcrum.org/concern/monographs/nz806057k; Tiago Luìs Gil. "GIS e cartografia narrativa nella ricerca storica", in Deborah Paci, ed., La storia in digitale, Milano: Unicopli, 2019, 117-141; disponibile nella biblioteca di Studi Umanistici). Nella voce "GIS" scritta per l'enciclopedia Britannica il geografo Michael N. DeMers sottolinea l'interattività dei GIS, e descrive quattro componenti interattive, corrispondenti alle fasi di utilizzo che vanno dall'inserimento delle informazioni (da parte del creatore del GIS), al loro immagazzinamento in un sistema che permette di richiamarle quando è interrogato (il database), alla possibilità di svolgere analisi delle informazioni così accumulate, e produrre un output (anche da parte di un utente finale, ad esempio via web, se il GIS viene reso pubblico):
- "an input subsystem for converting into digital form (digitizing) maps and other spatial data;
- a storage and retrieval subsystem;
- an analysis subsystem;
- and an output subsystem for producing maps, tables, and answers to geographic queries"
DeMers ricorda poi l'utilità dei GIS per studiosi e ricercatori nel campo dell'urbanistica, del marketing, della pianificazione territoriale e dell'analisi di risorse ("GIS is frequently used by environmental and urban planners, marketing researchers, retail site analysts, water resource specialists, and other professionals whose work relies on maps" (Fonte: Michael N. DeMers, "GIS", in Britannica ,https://www.britannica.com/technology/GIS). ( https://www.regione.fvg.it/rafvg/cms/RAFVG/ambiente-territorio/conoscere-ambiente-territorio/).
Il GIS è stato introdotto nel campo delle ricerche storiche a metà degli anni Novanta e negli anni seguenti, con il rapido sviluppo della tecnologia, è stato utilizzato sempre più frequentemente dando origine ad una rete di GIS storici ( HGIS-Historical GIS) che combinano mappe storiche, risorse statistiche e letterarie tra le quali il DARMC (Digital Atlas of Roman and Medieval Civilisations di Harvard - https://darmc.harvard.edu/team) che si occupa del mondo romano, medievale, siti archeologici corredati da una grande galleria di mappe, o il MoEML (The Map of early Modern London - https://mapoflondon.uvic.ca/) nato nel 1999 come atlante digitale di Londra nel Cinquecento e Seicento che ora include un' enciclopedia di persone e luoghi, una libreria digitale di testi con toponimi Londinesi, documenti inerenti alle pestilenze ecc., consentendo di fare proiezioni in uno spazio geotemporale e quindi di comprendere le relazioni tra fatti ("cosa") e luoghi ("dove").(vedi L.Da Silveira, in Geographic Information Systems and Historical Research: An Appraisal, http://atlas.fcsh.unl.pt/docs/LuisSilveira_Geographic_Information.pdf title="View this pdf file" href="https://docs.google.com/viewer?url=http%3A%2F%2Fatlas.fcsh.unl.pt%2Fdocs%2FLuisSilveira_Geographic_Information.pdf&embedded=true&chrome=false&dov=1">, pagg.29-30). Altri esempi di progetti di Digital History che si avvalgono di GIS sono: la London Medieval Murder Map, sviluppata dall'Università di Cambridge (link qui) e The Ages of Exploration, del The Mariners' Museum and Park (link qui).
La nascita dei GIS (che in Italia sono anche detti SIG, sistemi informativi geografici, o SIT, sistemi informativi territoriali) è dovuta alla necessità di migliorare la funzionalità delle carte e delle analisi spaziali di dati georeferenziati, cioè dei dati a cui è attribuita una precisa localizzazione sulla superficie terrestre. Essa può avvenire in modo indiretto o diretto: il primo fa riferimento alla latitudine e alla longitudine, mentre il secondo deriva le coordinate geografiche da altre informazioni di tipo spaziale, come un indirizzo, un codice postale, un distretto scolastico o elettorale. Tuttavia il GIS ha almeno due punti deboli: il primo è che per utilizzarlo è necessario possedere sia il software del programma, quasi sempre a pagamento, sia le apparecchiature hardware adeguate, che ovviamente coincidono con i modelli più recenti, potenti e costosi di computer (Alyson L., Greiner, Giuseppe Demmateis, Carla Lanza, Geografia umana. Un approccio visuale, Utet, Novara, 2016)
La funzione più importante svolta dai GIS è quella relativa alla produzione della conoscenza geografica per lo studio e per il governo del territorio (Scanu, 2008). Grazie a questo strumento si ha un'elaborazione atta ad illustrare le varie relazioni che intercorrono tra la società e il suo contesto in un dato momento storico, fornendo una raffigurazione digitale del reale (Favretto, 2005). I GIS possono consentire una visione "satellitare", che spazia da una visione di insieme a livello regionale o nazionale fino a ridursi al livello biografico individuale di sito (Detti, Pazzagli, 2000). Per capire il funzionamento dei GIS è utile studiare degli esempi pratici di progetti di Digital History, un valido elenco viene presentato in questo sito online (Fonte: https://anterotesis.com/wordpress/mapping-resources/dh-gis-projects/).
- Network analysis: studio delle reti complesse attraverso metodi e teorie provenienti da diversi ambiti di ricerca ( in matematica la teoria dei grafi; il data mining, l'inferenza statistica, lo studio delle strutture sociali in sociologia. Esempi di network analysis:
- (https://www.reddit.com/r/dataisbeautiful/comments/67e1m8/oc_social_network_analysis_the_worlds_political/)
- http://www.social-life.co/blog/post/social_network_analysis/
- https://oecd-development-matters.org/2015/08/03/how-can-social-network-analysis-help-tackle-west-africas-challenges/ ; L’analisi delle reti sociali (o Network Analysis) rappresenta un insieme di strumenti finalizzati a descrivere le principali caratteristiche di una struttura di nodi e connessioni. (Fonte: https://www.istat.it/it/files/2016/05/3-Network-analysis.pdf)
Le tipologie di reti a cui si può applicare con profitto la Network analysis sono innumerevoli: reti tecnologiche (internet, rete dei trasporti, rete telefonica), Network biologici, ecologici ed epidemici (le reti metaboliche; le reti alimentari preda-predatore; le reti di diffusione delle malattie), Network sociali (la rete di amicizie; le reti criminali; le reti di collaborazione tra scienziati, attori musicisti ecc,; le communities online ovvero i social network), I network economici (reti commerciali, reti produttive, reti d’imprese, reti creditizie) (Fonte: Raffaele Giammetti, Introduzione alla network analysis).
Alcune risorse per la network analysis nell'ambito delle digital humanities possono essere reperite a questo link: https://digitalhumanities.berkeley.edu/resources/network-analysis-resources.
Presentazione dei risultati e comunicazione
- Blog: un sito personale in cui l'autore propone e divulga temi con contenuti di ogni tipo in forma a volte diaristica.
Il termine blog è la contrazione del termine "Web Log", ovverossia "diario di bordo della rete" e fu coniato dal blogger americano John Barger. Il blog originariamente nacque come mezzo di espressione individuale, ma con il passare del tempo è diventato uno dei principali mezzi in rete per la circolazione di idee, grazie anche alla nascita di piattaforme specifiche per la creazione dei blog come WordPress.org, Ghost e Drupal. I blogger sono stati in grado di ottenere un grande seguito fino al punto di diventare opinion maker in diversi ambiti, e una fonte di informazione considerata al pari di quotidiani e riviste. (Fonte: www.treccani.it).
In che modo la tipologia espressiva del blog può essere di pertinenza per la/o storica/o digitale? In ambito scientifico-accademico la scrittura di blog - personali o collettivi (ad esempio legati a particolari gruppi di ricerca) può rispondere a diversi obiettivi:
- un blog può prestarsi a un'esposizione divulgativa delle proprie ricerche e al raggiungimento di un pubblico non specialistico;
- può offrire uno spazio di allenamento alla scrittura, particolarmente utile per studenti/esse ma anche per studiose/i già affermati che vogliano sperimentare con registri e formule diversi da quelli appropriati alla tipologia del saggio in volume o rivista;
- un post (articolo) in un blog può permettere alla ricercatrice/ore di formulare e ventilare delle ipotesi di ricerca in fase aurorale, di raccogliere le proprie idee su un certo argomento, senza la necessità di provvedere l'apparato argomentativo completo che sarebbe richiesto da una pubblicazione scientifica (ne dà un esempio interessante James Baker nel suo Cradle in Caricature, https://cradledincaricature.com, scrivendo in "About": "my blog is an outcome of various research (and research related) activities. And yet I would never claim the work on my blog to be of a standard fit for peer review. Rather I blog to test ideas, to reflect on recent experiences, and to share experiments I have been undertaking");
- con particolare frequenza i blog scritti da accademiche/i discutono le condizioni lavorative nelle università e negli enti di ricerca, e temi di policy e amministrazione;
- tramite possibilità come l'autorialità collettiva, il commento, il blog roll (lista di link a blog affini) i blog possono infine contribuire all'esistenza di una comunità di pratica, di un ambito di sociabilità di conversazione tra studiose/i.
Data la sua natura informale, la blogosfera è un ambito dove i confini tra studiosa/o specialista e giornalista e/o divulgatrice/ore o appasionata/o possono sfuocarsi. Discutendo questo aspetto Sherman Dorn ha citato ad esempio il lavoro di Phil Gyford’ su una fonte del diciassettesimo secolo presentata nel blog The Diary of Samuel Pepys, http://www.pepysdiary.com (Dorn, "Is (Digital) History More than an Argument about the Past?", in Wiriting History in the Digital Age, ed. Jack Dougherty and Kristen Nawrotzki, Ann Arbor, MI: University of Michigan Press, 2013, https://doi.org/10.3998/dh.12230987.0001.001, p. 32, nota 10).
Una lista di blog relativi alla storia americana è reperibile su questa pagina del sito della Organization of American Historians: https://www.oah.org/resources/scholarship/history-blogs/.
- Data visualization: insieme di tecniche per rappresentare i dati graficamente ed esporli in modo interattivo, comunicare informazioni grezze o numeri modificandoli in oggetti visivi come cartografie, curve, barre o forme di animazione e video. Essa rappresenta un grande passo avanti nella comunicazione dell'informazione in maniera creativa agevolando la fruibilità dei dati. Oggi la comunicazione visiva è diventata una vera e propria forma di linguaggio; le scelte adottate, ad esempio riguardo al colore della rappresentazione grafica hanno il potere di modificare la percezione dei dati che desideriamo comunicare. (Fonte: "Data visualization: linguaggi e tecnologie per la visualizzazione dei dati". Bitbang Blog https://www.digital-intelligence.it)
Palladio: è un software open source finalizzato
alla visualizzazione di network di relazioni nell’ambito della ricerca storica.
Permette di creare visualizzazioni di quattro tipi (geografico, relazionale,
tabulare, lista con immagini) a partire dai propri dati. Si lavora direttamente
online e al termine dell’inserimento, si può scaricare il progetto o scaricare
singole visualizzazioni. Tali visualizzazioni sono statiche, a differenza di
quelle che è possibile realizzare con Nodegoat, software tuttavia molto costoso
e che richiede inizialmente un po' più di attenzione al fine di comprenderne le
funzionalità. (fonte: introduzione al progetto di Digital History “Le Lettres
édifiantes et curieuses, écrites des Missions étrangères, par quelques
missionnaires de la Compagnie de Jésus”, disponibile su Moodle@UniTs - Digital History 2020 e appunti delle lezioni).
- Le cronomappe sono particolari modalità di visualizzazione dei dati che combinano dati quantitativi e di altro genere (es: geografici, demografici, della produzione agricola, etc…) in rapporto a una determinata linea del tempo, in modo da permettere l'osservazione di determinati fenomeni secondo un andamento cronologico. Possono essere rese sia in forma statica che dinamica permettendo nel secondo caso una consultazione interattiva. (fonte: appunti Lezione n. 08 del 27-10-2020 del corso in Digital History del prof. Abbattista, A.A. 2020-21)
- GIS: (Geographic information system) Attraverso questo sistema computerizzato si possono acquisire diversi tipi di dati derivanti da precise informazioni geografiche. Grazie al GIS, quindi, si è in grado di associare questi dati a una certa posizione geografica, elaborarli e così ricavare ulteriori risultati utili. Il GIS è, in sostanza, un programma informatico in grado di trattare e gestire dati associati a una base cartografica: le banche dati demografiche, per esempio, possono essere associate alle mappe dei quartieri delle città o dei singoli edifici residenziali, i dati censuari alle cartografie delle unità territoriali statistiche (sezioni di censimento, comuni, province, regioni). Si può dire che i GIS sono sistemi hardware-software finalizzati all'acquisizione, gestione, elaborazione, analisi, modellizzazione e rappresentazione di data-base (banche dati) i cui elementi possiedono una posizione geografica. Oltre al posizionamento geografico degli oggetti, il data-base contiene anche attributi e informazioni che, in relazione al tipo di utilizzazione, servono a distinguere tra loro gli oggetti e a metterne in evidenza le relazioni al fine di risolvere problemi di gestione e pianificazione territoriale. (Fonte: https://www.treccani.it/enciclopedia/gis/)
- Ipertesto: insieme di informazioni suddivise in più blocchi di testi, note, illustrazioni ecc., non collegati in modo sequenziale ma secondo gerarchie e connessioni logiche che l’utente può decidere come percorrere. (Fonte: https://www.garzantilinguistica.it/). ; Il più noto esempio di ipertesto è quello di un sito web, in cui a partire da una pagina iniziale è possibile saltare da una pagina all'altra senza un ordine preciso. (Fonte: https://www.treccani.it/enciclopedia). Insieme strutturato di informazioni, costituito da testi, note, illustrazioni, tabelle ecc., collegate tra loro da rimandi e collegamenti logici. (Fonte: https://www.dizionari.corriere.it/dizionario_italiano/l/ipertesto.shtml).
- Testi registrati su memoria magnetica in cui singole unità: capitoli, paragrafi, frasi, non sono disposte secondo un ordine sequenziale ma secondo un ordine reticolare. In tal modo, è possibile accedere da un'unità (o nodo) all'altra liberamente. I collegamenti tra i nodi ( e per nodo si intendono anche oggetti testuali come testi di brani musicali, immagini fisse o in movimento) sono gestiti tramite links che sono legami arbitrari che l'utente istituisce liberamente. Un ipertesto esiste in virtù del fatto che è prodotto per essere usufruito solo su supporto magnetico. La mancanza di linearità sequenziale offre la possibilità all'utente di "navigare" da un nodo all'altro, senza dover rispettare alcun ordine: ogni nodo può essere successivo di molti altri . Ancora, l'unico limite dato al lettore è determinato dal numero di links che l'autore ha inserito (Giulio Lughi, Ipertesti letterari e labirinti narrativi in Igitur, semestrale di lingue, letterature e culture moderne, anno V n.2 - Luglio - Dicembre 1993, pag. 35 e ss).
- Ipermedialità: in ambito informatico, si intende un sistema di risorse elettroniche, le quali interagiscono tra di loro grazie a collegamenti di tipo intertestuale. (Fonte: https://www.grandidizionari.it/Dizionario_Italiano). Fabio Donatantonio pone una differenza tra ipertesto e ipermedialità: se in origine l'ipertesto era composto esclusivamente da una serie di testi e conseguenti link di collegamento, dove ciascun testo era composto sia dal titolo che da riferimenti ad altri testi raggiungibili tramite l'uso delle parole evidenziate, l'ipermedialità non sarebbe altro che l'evoluzione naturale degli ipertesti verso il mondo web che attualmente ci circonda, nel quale troviamo numerosi oggetti multimediali, suoni, video, animazioni ecc. (Fonte: articolo di Fabio Donatantonio, 3 maggio 2011, http://www.donatantonio.net/blog/guide_tutorial/htmlcss/ipertesti-ipermedia).
- Social network: ambiente virtuale in cui gli utenti possono connettersi, comunicare tra loro e condividere informazioni personali, testi, immagini, video ecc. I social network sono uno dei fenomeni virali più rilevanti del XXI secolo. Grazie alla estrema semplicità dei loro meccanismi i social network sono arrivati ad avere impressionante numeri di iscritti. Basti pensare che Facebook, social network creato da Mark Zuckerberg nel 2004, è arrivato a contare 2.5 miliardi di account attivi in tutto il mondo. (Fonte: www.socialmediamarketing.it). Un esempio di social network pertinente alla ricerca storica è Academia.edu: si tratta di un sito web proprietario, su cui ciascun ricercatore/trice e studioso/a può registrasi gratuitamente, costruire una propria pagina personale su cui condividere i propri lavori (es. scritti editi o inediti in altre sedi, annunci di eventi, call for papers), e ricevere notifiche relative a ciò che pubblicano gli altri iscritti nei campi di suo interesse. Il fatto che Academia sia un'iniziativa privata a scopo di lucro determina la presenza di pubblicità sul sito, e la presenza di abbonamenti a pagamento che mettono a disposizione dell'utente funzionalità aggiuntive. Academia può essere utile per reperire materiali di interesse in molti campi degli studi umanistici; va però menzionato il fatto che chiunque può iscriversi e pubblicare su Academia ciò che vuole: la piattaforma non mette in atto nessun controllo sull'identità degli utilizzatori, sulla qualità di ciò che viene pubblicato e su eventuali violazioni di copyright. I social network, in virtù della loro pervasività nella vita quotidiana, possono facilitare l'opera di divulgazione al grande pubblico dei risultati della ricerca (ovviamente con livelli di approfondimento consoni ad un pubblico generalista e non esperto); possono altresì far conoscere ad una larga parte di popolazione enti, istituzioni e iniziative culturali, favorendone la frequentazione, la promozione e la fruizione. Un esempio di questa potenzialità divulgativa è la pagina facebook del Festival del Medioevo di Gubbio (link qui), che a cadenza regolare pubblica post, articoli e approfondimenti relativi all'Età Medievale.
- Wiki: è un software utilizzato per la creazione di contenuti ipertestuali in modo cooperativo. Il risultato è un documento redatto a più mani che è stato aggiornato dai suoi stessi utilizzatori e i cui contenuti sono stati sviluppati in collaborazione da tutti coloro che vi hanno accesso. La modifica dei contenuti è aperta, nel senso che il testo può essere modificato da tutti gli utenti (a volte soltanto se registrati, altre volte anche anonimi) contribuendo non solo per aggiunte ma anche cambiando e cancellando ciò che hanno scritto gli autori precedenti. Ogni modifica è registrata in una cronologia che permette in caso di necessità di riportare il testo alla versione precedente (rollback). Lo scopo è quello di condividere, scambiare, immagazzinare e ottimizzare le informazioni in modo collaborativo. Una curiosità sull'etimologia: "Wiki" è un termine di origine hawaiana che significa "veloce", ed è diventato di uso comune nella società contemporanea grazie anche a Wikipedia, una enciclopedia online, gratuita e collaborativa che conta 500 milioni di voci in più di 300 lingue.
- DRM:
Con la sigla DRM (Digital Rights Management) si indica la protezione di opere soggette a diritto d’autore tramite l’applicazione di misure che monitorino ed impediscano la diffusione di copie digitale tramite il trasferimento di dati, avvenga questo fra un computer e un altro o tramite altri mezzi di telecomunicazione.
La digitalizzazione di molteplici opere, con la conseguente possibilità di riprodurle gratuitamente e distribuirle su larga scala, ha reso necessario trovare metodi di protezione del diritto d’autore più efficaci tramite rimedi legali e tecnologici; le tattiche adottate per proteggere i file – non solo dalla diffusione non accreditata, ma anche dalla possibilità che vengano rimaneggiati – sono varie e vanno, ad esempio, dall’installazione di file nascosti, codificati o criptati quando si installa un programma tramite cd sul computer, alla possibilità per alcuni programmi del computer di contattare il creatore del software affinché avvenga una verifica periodica; se la verifica
fallisse, il programma semplicemente smetterebbe di funzionare. (Editors of Encylopaedia Britannica, Digital Rights Management, https://www.britannica.com/topic/digital-rights-management URL consultato il 26/10/2020)Altro metodo molto diffuso per proteggere il materiale digitale è l’applicazione sullo stesso di un watermark, ovvero delle informazioni che ne permettano l’identificazione. Questo può essere visibile, come una scritta semitrasparente o un logo, o occultato in modo da rendere più difficile l’individuazione e l’eventuale rimozione dello stesso. (Wikipedia, Digital Rights Management, https://it.wikipedia.org/wiki/Digital_rights_management#:~:text=La%20locuzione%20Digital%20Rights%20Management,tali%20diritti%20nell'ambiente%20digitale.
URL consultato il 26/10/2020)