Slec: Internet Archive

Visualizzazione post con etichetta Internet Archive. Mostra tutti i post

lunedì 5 giugno 2023

Internet Archive rischia di scomparire (e con lui un pezzo di Rete) - Laura Carrer

Nei mesi scorsi la biblioteca di internet – e con essa il futuro dell’accesso alla cultura online – è finita sul banco degli imputati. Nelle aule di un tribunale federale di New York si è svolto il primo round di un procedimento legale intentato da alcuni editori americani nei confronti di Internet Archive, la biblioteca digitale non profit fondata dall’informatico, attivista e archivista Brewster Kahle nel 1996 a San Francisco. Lo scontro è tra Davide e Golia, e rischia di definire per sempre il modo in cui la conoscenza è condivisa.

Cosa è e cosa vuole Internet Archive

“Accesso universale alla conoscenza” è da 27 anni lo slogan di Internet Archive. L’organizzazione raccoglie e mette a disposizione di chiunque, gratuitamente, 37 milioni di libri, 16 milioni di file audio e molti altri contenuti nonché servizi come la Wayback machine, il più noto archivio di pagine Web. Una delle maggiori e più evidenti eredità culturali e intellettuali che gli esseri umani possano vantare per raccontare la loro storia.

Internet Archive ha un programma, noto come Open Library, che permette agli utenti di “prendere in prestito” copie di libri fisici scansionate e digitalizzate dall’organizzazione. Copie digitali che non sono state acquistate in licenza come ebook, ma derivano appunto da scansioni di libri fisici acquistati o ricevuti come donazione.
A chi la accusava di violare il diritto d’autore, l’organizzazione ha più volte replicato che in realtà il suo programma di digitalizzazione di libri non è sinonimo di accesso indiscriminato per tutti. È fondamentale chiarire che il prestito di un volume digitale tramite Internet Archive, se è presente una sola copia, è consentito ad una sola persona alla volta. Si chiama prestito digitale controllato (CDL). Un sistema molto simile a quello operato da biblioteche tradizionali. Inoltre, prima di essere scansionato, il libro è stato comprato, con relativo pagamento dei diritti d’autore. Un servizio, quello della biblioteca digitale più grande al mondo, che ha lo scopo di favorire la conoscenza e di mantenere in circolazione libri o contenuti che per questioni editoriali, o di mercato, sono destinati a perdere visibilità.

“Si tratta di un sistema di prestito simile a quello dei libri stampati in cui la biblioteca presta una versione digitale di un libro di sua proprietà a un lettore alla volta, utilizzando le stesse protezioni tecniche che gli editori usano per impedire un’ulteriore ridistribuzione. La dottrina legale alla base di questo sistema è il fair use”, scriveva Internet Archive.

Come funziona in Italia il prestito digitale

Il Covid e il programma d’emergenza di Internet Archive

Ma poi ci si è messa di mezzo la pandemia. Nel marzo 2020, mentre si diffondevano paura, misure di isolamento e lockdown per il Covid, e mentre le scuole e le biblioteche chiudevano, Internet Archive lanciava la sua National Emergency Library – un programma d’emergenza con cui, in risposta a questo scenario, metteva a disposizione 1,4 milioni di libri digitalizzati senza però una lista d’attesa per gli utenti. Ciò significava che da quel momento più lettori potevano accedere a un libro digitale contemporaneamente, ma sempre prendendolo in prestito: il libro doveva essere restituito dopo 2 settimane e non poteva essere ridistribuito.

Scriveva l’Internet Archive nel 2020: “Ci è stato chiesto perché abbiamo sospeso le liste d’attesa. Il 17 marzo, il Consiglio direttivo dell’American Library Association ha preso una misura straordinaria, raccomandando la chiusura delle biblioteche nazionali in risposta all’epidemia di COVID-19. In questo modo, per la prima volta nella storia, l’intera collezione di libri stampati del Paese ospitata nelle biblioteche non è più disponibile, rinchiusa a tempo indeterminato dietro le porte chiuse. Si tratta di un’interruzione di servizio enorme e storica. (…) Per rispondere a questo bisogno senza precedenti, su una scala mai vista prima, abbiamo sospeso le liste d’attesa per la nostra collezione di libri in prestito”.

La causa intentata da alcuni editori

Ma queste parole non hanno intenerito alcuni grandi editori americani. Nel giugno 2020 Hachette, Penguin Random House, HarperCollins e John Wiley&Sons hanno intrapreso un’azione legale nei confronti della biblioteca digitale per violazione del copyright. Non solo: non hanno preso di mira solo l’iniziativa di emergenza legata al Covid, ma anche il principio del prestito digitale controllato (CDL).

E dunque arriviamo fino al 20 marzo scorso, quando Internet Archive si è presentata in tribunale per testimoniare e spiegare la sua posizione nel processo Hachette v. Internet Archive, accompagnata anche dai difensori di Electronic Frontier Foundation (EFF), storica Ong americana per i diritti digitali.
“Le librerie hanno pagato agli editori miliardi di dollari per avere libri stampati e stanno investendo enormi risorse nella digitalizzazione per preservare quei testi”, spiega EFF in un blogpost in cui lo scorso anno condivideva alcune memorie sul caso. “Alle biblioteche non è mai stato chiesto di ottenere permessi o pagare costi aggiuntivi per prestare libri”, continua EFF. Per questa organizzazione (e per Internet Archive), il prestito digitale controllato rientra nel fair use, cioè in quella dottrina che limita il copyright a certe condizioni, ad esempio il fatto che l’utilizzo specifico di un’opera serva scopi non commerciali; se sia trasformativo, cioè se ne espande l’utilità; se danneggi o meno i titolari di diritti.

La decisione del giudice

Ma il 25 marzo scorso è arrivata la prima decisione del tribunale: almeno per ora, ha dato ragione agli editori. Per il giudice infatti qualsiasi “presunto beneficio” derivante dalla biblioteca di Internet Archive “non può superare il danno di mercato per gli editori”. E sempre per il giudice sarebbe “irrilevante” il fatto che Internet Archive acquisti i libri prima di farne copie per il suo pubblico online. Secondo i dati ottenuti durante il processo, Internet Archive gestisce attualmente circa 70.000 prestiti di e-book al giorno, scrive The Verge.

Per arrivare a una decisione finale il giudice ha valutato se l’operato di Internet Archive fosse dunque considerabile sotto il cappello del fair use. Scondo questa interpretazione le opere protette da copyright possono essere rese accessibili se considerate un bene per il pubblico. Insieme a ciò il fair use prevede che l’editore non venga danneggiato dalla pubblicazione del contenuto protetto da copyright in accesso libero, e questo è direttamente proporzionale al numero di pagine rese accessibili. Infine, in questi casi si considera anche il potenziale “trasformativo” che il servizio di Internet Archive può apportare al contenuto protetto da copyright.

Come riporta The Verge, il giudice ha deciso che il danno al mercato degli editori sarebbe stato sicuramente maggiore rispetto ai vantaggi del servizio fornito da Internet Archive, citando un precedente caso che aveva coinvolto Google Libri e l’editore HathiTrust nel 2014. In quel caso Google Libri non ha violato il copyright poiché ha creato un database consultabile di libri (e dei loro contenuti), che però come sappiamo non fornisce il contenuto completo ma una panoramica. Il giudice ha anche aggiunto come non ci siano prove dirette che dimostrino un aumento delle vendite degli editori nel momento in cui i loro libri sono disponibili su Internet Archive.

“La decisione del tribunale è un duro colpo per tutte le biblioteche e la comunità. Ma non è finita: continueremo a lottare per il diritto a possedere, prestare e conservare libri”, ha dichiarato Internet Archive. L’appello nei confronti della decisione è scontato, e sarà depositato nei prossimi giorni dai legali dell’organizzazione.

“Le librerie e le biblioteche sono più di un catalogo di prodotti per una società. Affinché la democrazia prosperi su scala globale, devono essere in grado di sostenere il loro ruolo storico nella società: possedere, conservare e prestare libri”, ha aggiunto il fondatore dell’organizzazione Brewster Kahle.

Gli appelli e le iniziative a sostegno di Internet Archive

Intanto un altro gruppo in difesa di Internet e dei diritti digitali, Fight for the Future, ha lanciato una campagna online a sostegno di Internet Archive e del prestito digitale. Battle for Libraries è una petizione che ha raccolto già 25.000 firme e che si è trascinata al seguito anche Authors for Libraries, un’iniziativa sostenuta da più di 300 scrittori e scrittrici statunitensi e non solo. Dopo un primo momento di silenzio sul tema, autori del calibro di Neil Gaiman, Alok Menon e Naomi Klein hanno pubblicato una lettera aperta con la quale hanno chiesto di riconoscere il diritto delle biblioteche di possedere, conservare e prestare libri indipendentemente dal formato, nonché di porre fine alle cause intimidatorie e alle campagne diffamatorie contro queste ultime. Agli autori si sono affiancati nel tempo anche artisti e attivisti internazionali come Daniel Ellsberg, Tom Morello e Lilly Wachowski.

Cosa succede ora?

In appello un nuovo giudice potrebbe contribuire a scrivere una storia diversa, rendendo l’archivio digitale di Internet Archive ancora più grande e ancor più importante. Una considerazione non da poco soprattutto se pensiamo ai risvolti che può portare anche in altri Paesi del mondo, in cui attivisti e sostenitori dell’accesso libero sono sotto processo o agiscono clandestinamente per portare avanti progetti che riecheggiano l’eredità di Aaron Schwartz (di cui abbiamo scritto qua). La loro critica prende di mira l’idea che ricerca e conoscenza, spesso finanziate tramite fondi pubblici, debbano essere realizzate secondo standard di mercato imposti dagli editori. Col risultato – sostengono – di rendere la conoscenza un fatto elitario.

Va anche detto, nel caso specifico, che la causa legale, se portasse a un risarcimento danni, metterebbe a rischio l’esistenza stessa di Internet Archive e quindi anche il mantenimento di un altro servizio, la Wayback Machine: questa permette di vedere pagine web non più esistenti che il servizio ha archiviato effettuando una copia in date specifiche. Per capire l’importanza della macchina del tempo di Internet Archive, immaginate il sito web di un partito politico che ogni anno pubblica un documento programmatico: per chi svolge ricerca poter vedere come è cambiata la linea del partito e il modo in cui comunica ai suoi elettori è estremamente interessante.

La distruzione di 4 milioni di libri digitali

In alternativa invece il processo potrebbe costringere l’archivio digitale a distruggere 4 milioni di libri digitali disponibili sulla piattaforma ma coperti da copyright, o addirittura a chiudere l’intero catalogo popolato ormai da 37 milioni di testi.
“La decisione odierna del tribunale di primo grado nella causa Hachette contro Internet Archive è un duro colpo per tutte le biblioteche e le comunità che serviamo. Questa decisione ha un impatto sulle biblioteche di tutti gli Stati Uniti che si affidano al prestito digitale controllato per offrire ai loro clienti la possibilità di accedere ai libri online”, ha dichiarato, dopo la decisione del giudice, Chris Freeland, direttore del servizio Open Libraries di Internet Archive.

A fine aprile una risoluzione del Consiglio dei supervisori di San Francisco, ovvero l’ente legislativo che supervisiona la città e la contea, ha riconosciuto “il valore pubblico insostituibile delle biblioteche, comprese le biblioteche online come l’Internet Archive, e i diritti essenziali di tutte le biblioteche di possedere, preservare e prestare libri digitali e stampati ai residenti di San Francisco e al pubblico in generale”. Il Consiglio si auspica che l’archivio sia sostenuto, così come la sua missione di servizio pubblico. “Sollecitiamo la legislatura statale della California e il Congresso degli Stati Uniti a sostenere i diritti digitali per le biblioteche, compreso il prestito digitale controllato e l’opzione per le biblioteche di possedere le proprie collezioni digitali”.

L’organizzazione non profit collabora tra l’altro anche con molte biblioteche statunitensi che non riescono più a sostenere i costi, e sono costrette a chiudere i battenti. “Affidano i loro libri a noi, per portare avanti la loro missione. La maggior parte dei libri non è disponibile presso gli editori in formato digitale, e non lo sarà mai”, ha dichiarato Kahle.
Un aspetto importante soprattutto poiché “come abbiamo visto, studenti e ricercatori continuano a utilizzare questi libri per citazioni e per verificare i fatti. E penso che si possa essere tutti d’accordo sul fatto che si debba essere in grado di verificare i fatti”, ha concluso il fondatore di Internet Archive.

da qui

mercoledì 9 dicembre 2020

Nella memoria della rete - Massimo Gaggi

(Questo articolo è stato pubblicato su «la Lettura» #390 del 19 maggio 2019)

«Con la distruzione della biblioteca di Alessandria andò persa una parte della conoscenza del mondo. Non deve più accadere. Oggi abbiamo tante biblioteche con i volumi di carta, ma le loro versioni digitali — il formato che dovrebbe rendere questi tomi eterni — sono sul web: ciò che è in rete ci pare sia ovunque, ma, in realtà, il sistema è centralizzato e potenzialmente vulnerabile. Vanno evitate altre distruzioni. Per questo — racconta a “la Lettura” Brewster Kahle mentre entriamo nella sede della sua audace impresa tecnologica che ha l’aspetto di un candido tempio marmoreo —, stiamo costruendo l’Internet Archive e siamo impegnati nella battaglia per decentralizzare il web».

Kahle dimostra più dei suoi 58 anni ed è comprensibile: questo scienziato-umanista, che ha cominciato a studiare l’intelligenza artificiale negli anni Settanta con i precursori Marvin Minsky e Daniel Hillis, ha vissuto più vite contemporaneamente. Dapprima quella di computer scientist del Mit di Boston che, negli anni Ottanta, sviluppò i supercomputer di quel tempo da ingegnere capo della Thinking Machines, creando poi, con sue aziende, Wais, un sistema di pubblicazione precursore di quello oggi dominante con la sigla www, e Alexa Internet, un primitivo motore di ricerca acquistato da Amazon nel 1999. Poi quella dell’imprenditore della conoscenza che si trasforma in filantropo e, come dice lui, in bibliotecario digitale con il suo InternetArchive.org concepito come il luogo della conoscenza universale accessibile a tutti gratuitamente. Infine quella dell’attivista impegnato a proteggere il cittadino navigatore digitale dallo strapotere dei big tech cercando di creare le condizioni — tecnologiche e politiche — per una decentralizzazione del web. La sua cattedrale della memoria è un luogo strano. Costruito per essere chiesa della Christian Science, con la facciata sovrastata da un imponente colonnato, l’edificio venne acquistato da Kahle, alla ricerca di una sede più grande per il suo archivio, una decina d’anni fa, quando la comunità religiosa lo abbandonò. La struttura rispecchia la doppia missione di questo intellettuale della tecnologia: al piano inferiore, una sorta di enorme cripta, una settantina di tecnici — stipendiati e volontari — sono impegnati (insieme a quelli di una trentina di scanning center, sparsi in otto Paesi) nella digitalizzazioni di milioni di libri, video, brani musicali, pagine, videogiochi e programmi di software.

Al piano di sopra l’aspetto è ancora quello della chiesa, solo che ora qui non si radunano i fedeli di una religione ma quelli che credono nella necessità di superare i monopoli digitali democratizzando il web. Ai lati della navata due folle di statue di gesso colorate rappresentano non santi ma tutti coloro che, oggi e negli ultimi 22 anni, hanno contribuito a costruire l’Internet Archive. Al centro l’altare è sostituito dal podio delle conferenze per un nuovo internet. In fondo, davanti alle vetrate, gli enormi armadi lampeggianti e fruscianti delle power unit che gestiscono il traffico: «Ogni giorno — spiega Kahle — 4 milioni di utenti si rivolgono a noi. Gli elaboratori stanno lì perché il vento fresco della baia funziona da sistema di raffreddamento a basso costo».

Un po’ tutto è low cost in questa impresa filantropica che, racconta il suo fondatore, «ha un bilancio annuale di 18 milioni di dollari: un decimo di quello della Public Library di San Francisco». Soldi che vengono da benefattori e, in piccola parte, dallo stesso patrimonio di Kahle i cui sforzi sono comunque lontani dall’obiettivo di digitalizzare tutta la conoscenza. Che poi era il progetto — «tutta la conoscenza del mondo alla portata di un click» — perseguito da Google con ben altri mezzi. «Google — spiega ancora — ha digitalizzato 25 milioni di libri, ma non li dà a tutti e ha rallentato, anche per problemi di copyright: si può accedere a quei contenuti attraverso il motore di ricerca. Noi siamo molto più indietro come volumi: digitalizziamo ogni giorno mille libri e mezzo miliardo di pagine web, ma siamo ancora a tre milioni di libri archiviati. Funzioniamo, però, come una vera biblioteca: diamo in uso l’intero libro gratis per due settimane. Per quelli coperti da copyright, se qualcuno li sta già leggendo, ci si deve mettere in lista d’attesa e aspettare che la copia digitale venga restituita, proprio come avviene con quelle fisiche. Ma nei nostri archivi c’è anche molto altro: 4 milioni e mezzo di file audio, compresi 180 mila concerti live, e ora abbiamo cominciato a digitalizzare anche vecchi dischi a 78 giri, compresi quelli prima del 1905, con la registrazione da un solo lato. E, ancora, 4 milioni di video, 200 mila programmi di software, miliardi di pagine dei social media, comprese tutte quelle Twitter relative alle presidenziali Usa del 2016».

Cosa anima gli sforzi di Kahle? Voglia di rivincita? Alcune delle sue prime innovazioni finirono in Mosaic, il primo browser (il programma per navigare in internet), creato assemblando — come dice il nome stesso — componenti di provenienza diversa. Un sistema poi confluito in Netscape Navigator e, infine, soppiantato da Explorer di Microsoft. Le soluzioni erano geniali, ma il World Wide Web (www) creato nel 1989 da Tim Bernes Lee si impose per la sua semplicità e divenne lo standard universale. E Alexa Internet, tuttora usata da Amazon per certi tipi di ricerche aziendali, vide calare la sua rilevanza quando — come racconta lo stesso Kahle — Larry Page e Sergey Brin idearono «un motore di ricerca più potente ed efficiente».

Nella sua battaglia per l’archivio e contro i monopoli digitali, Kahle non è spinto da astio nei confronti dei giganti tecnologici: cerca di coinvolgere anche Google nel disegno di un web decentrato e si dice riconoscente nei confronti di Jeff Bezos che, tra l’altro, ha dato il nome della società acquistata da Kahle, Alexa, al popolarissimo assistente vocale di Amazon. «Quando, vent’anni fa, Bezos propose di acquistare la mia società ero incerto: volevo vendere, ma non potevo perdere l’accesso alle sue ricerche, molto utili per il digital archive che già stavo costruendo da un paio d’anni. Gli dissi di sì a un patto: ottenere gratuitamente, con un ritardo di sei mesi, tutti i risultati delle ricerche fatte su Alexa Internet. Era una richesta senza precedenti: mi aspettavo un rifiuto. Invece accettò e in questi vent’anni ha rispettato alla lettera l’impegno».

E allora? Torniamo alla suggestione della biblioteca di Alessandria, talmente forte per Kahle da averlo indotto a scegliere quel nome per la sua principale realizzazione tecnologica, Alexa. «Il mondo — dice — non può vivere un’altra devastazione culturale come quella che colpì quel luogo, distrutto non da un incendio ma dall’emergere, nei secoli, di forze sociali e politiche ostili al desiderio di conoscenza profonda e universale che aveva portato a quella straordinaria realizzazione dell’umanità. Oggi la civiltà digitale ci ha dato un senso di sicurezza del quale abbiamo cominciato a percepire la falsità: troppo potere concentrato in poche mani mentre la nostra presenza su internet, un sistema in teoria decentrato, passa attraverso poche porte d’accesso che possono essere facilmente controllate dai governi a fini di sorveglianza politica e censura. O possono essere chiuse senza preavviso dalle società che ne detengono le chiavi se i relativi business non sono più redditizi». Di recente gli utenti di MySpace hanno visto svanire dai loro archivi 50 milioni di brani musicali e molto altro materiale. Errore tecnico, dice la società: pochi ci credono. Intanto anche Google+, Tumblr e Flickr cominciano a svuotare gli scaffali digitali. Presto lo faranno anche altri, come YouTube. L’Internet Archive è una corsa contro il tempo per cercare di digitalizzare questo materiale prima che venga cancellato: la sua Wayback Machine registra e archivia mezzo miliardo di pagine al giorno.

«È importante mantenere la memoria di internet e anche dei social network», sostiene Kahle. «Non solo per soddisfare una schiera di nostalgici. Dopo l’elezione di Trump noi e le altre due organizzazioni del web etico, non profit, Wikipedia e la Electronic Frontier Foundation, ci riunimmo per discutere di come il nostro ruolo sarebbe cambiato. Wikipedia aveva le idee chiare già allora. D’ora in poi, dissero, sarà più difficile certificare la realtà: i resoconti dei fatti verranno sfidati in modo sempre più aperto. È andata proprio così. Il nostro archivio cerca di funzionare da baluardo della certificazione dei fatti, anche quando i contenuti vengono cancellati da internet». «Per questo — dice Mark Graham, direttore del team che gestisce la Wayback Machine — i giornalisti ci consultano ogni giorno. Ad esempio la stampa ha attinto da noi tutte le informazioni sulle tasse non pagate, le pesanti frasi sulle donne e altro ancora che hanno costretto il commentatore economico conservatore Stephen Moore a ritirarsi dopo che Donald Trump l’aveva designato per il board della Federal Reserve».

Kahle guarda avanti: decentrare la rete, l’ambizioso obiettivo di sottrarsi al controllo dei gatekeeper di internet, soprattutto Google e Facebook. Un’operazione complessa che richiede nuove infrastrutture tecniche e non priva di rischi, a cominciare dall’ulteriore diffusione del bullismo digitale e di nuovi usi criminali della rete, in assenza di una governance ben definita. Ma lui, che ha già organizzato conferenze su questo nelle ultime due estati ottenendo anche la collaborazione dei browser Chrome e Firefox, è convinto che si possa arrivare a una soluzione equilibrata. Lo appoggia anche Tim Bernes Lee, il creatore del World Wide Web, contrariato per come la sua creatura è stata strumentalizzata e impegnato con la sua nuova impresa, Solid, a sviluppare app per restituire autonomia agli utenti delle reti sociali e di internet, a partire dal controllo dei loro dati personali.

Prossima tappa, il DWeb Camp: un nuovo raduno convocato da Internet Archive per metà luglio, stavolta in una fattoria sulla riva dell’oceano, con i tecnologi ospitati in tenda. Forse il progetto di Kahle non arriverà in porto, ma lui lo porta avanti con lucidità e audacia, cercando alleati forti. Perché Chrome, che è di Google, dovrebbe aiutarvi in una battaglia antimonopoli? «Perché Google è, in parte, diversa: a differenza di Facebook o Amazon che possono prosperare anche nei loro vasti recinti privati, Google ha bisogno di un web aperto, davvero universale, per alimentare il suo motore di ricerca».

da qui