[Mostly Weekly ~122]

Complessificazione


A cura di Antonio Dini
Numero 122 ~ 4 luglio 2021

Buona domenica! Io sono Antonio Dini e voi vi siete davvero iscritti a Mostly Weekly, la newsletter settimanale che esce quando è pronta.

La presenza di alcuni miei articoli sul Post (opens new window) sta portando qui nuovi iscritti.

Per quelli di voi che vogliono restare, congratulazioni: avete superato la prima prova. Seguiranno altre istruzioni...

Mostly Weekly è aperta a tutti, senza pubblicità o affiliazioni: una donazione su (Liberapay (opens new window) o via PayPal (opens new window)) è però molto apprezzata.

Intanto, buona lettura!


My writing process involves writing 5 words, then switching to a different tab as a treat
– @ChappellTracker



~


Editorialogica

Imparare a suonare la chitarra
Non ci riuscirò mai probabilmente, ma non è questo il motivo. Invece, il punto vero per cui vale la pena di imparare a suonare la chitarra per me è la gioia di essere di nuovo un absolute beginner (opens new window). Come i bambini. Il cervello e il corpo dei bambini sono creati per fare, fallire e rifare. Applaudiamo praticamente tutto ciò che combinano semplicemente perché ci stanno provando. Con gli adulti è più complicato. La frase "principiante adulto" ha un'aria di gentile pietà. Puzza di seminari di riqualificazione obbligatori e sedie scomode. Implica l'apprendimento di qualcosa che forse dovremmo aver già imparato. Eppure, quando dico che sto provando a imparare a suonare la chitarra, in molti sorridono e vedo un lampo nei loro occhi. Qualcuno capisce o forse ricorda qualcosa. E genuinamente mi dice "bravo!". Poi però non vuole esserci quando suono qualcosa, sia ben intenso. Ma sono d'accordo: anche io non vorrei esserci.

~ ~ ~

zombie
zombie ~ Foto © Antonio Dini

Importantologica

Il grande riciclaggio del codice open
Avete presente il riciclaggio del denaro sporco? È la pratica con la quale denaro che non non avete diritto di possedere viene trasformato in denaro "buono", che potete legalmente usare. Non avviene in scala uno a uno: se ne perde buona parte nel processo. Però era denaro acquisito senza un corrispettivo (magari per un furto o un riscatto), quindi anche se si perde parte del valore nominale è sempre tutto guadagno. Ebbene, adesso sta succedendo con il codice open source. Mi spiego.

Copilot (opens new window) è la nuova funzionalità di Github realizzata assieme a OpenAI (opens new window). Viene definito "code synthesizer" e non un motore di ricerca per il codice. In pratica l'AI legge il codice che lo sviluppatore sta scrivendo e suggerisce pezzettoni di codice per andare avanti e risolvere un determinato problema. Una specie di autocompletamento sintattico (opens new window), simile a Gmail che cerca di finire le frasi per noi e magari scrivere anche la prossima. Però qui i suggerimenti sono ben più lunghi. Copilot può essere integrato dentro VS Code.

Il plagio e il riciclaggio
Bello. Solo che ogni tanto questi pezzettoni di codice si scopre che sono in realtà ricopiati pari pari dei dati usati per il training della rete neurale. E poi che il dataset per il training è composto da miliardi di righe di codice open source (tipicamente con licenza Gpl, Mit o Apache).

I casi in cui il riciclaggio accade più spesso sono quando non c'è sufficiente contesto (ad esempio, editando un file vuoto) oppure quando i problemi hanno sono soluzioni comuni, o meglio universali.

Questo, se effettivamente funziona così, è in buona sostanza un modo per riciclare il codice open source in applicativi commerciali. Anche dire semplicemente che "non riproduce pezzi di codice esattamente nella stessa forma" non basta. Non è plagio, è riciclaggio.

Cominciamo dai fondamentali. Il copyright (e il copyleft) non riguardano solo le pratiche di copia-e-incolla, ma copre anche il lavoro derivativo. Copilot è stato addestrato su una base di codice open source e la somma di tutto quel che conosce è un modello statistico presa letteralmente da quel codice. Non esiste una definizione di "lavoro derivativo" che non copra questo caso.

Il contesto culturale del riciclaggio
Come si fa a pensare che non sia plagio e riciclaggio? Il problema è l'attributo "magico" che continuiamo a dare alle reti neurali: una black box che sputa fuori romanzi perfettamente scritti e adesso magari anche del software. Non è così. Non funziona così. Questo è marketing, non è la realtà.

Il marketing, però, non "attacca" se non trova un contesto ricettivo. E questo contesto è nato negli ultimi quindici anni con le piattaforme social e i sistemi di produzione di startup (e quindi app e codice) ad altissima redditività che stanno in piedi grazie al codice open source.

Il problema, infatti, è che è cambiata l'idea di software open source: roba gratuita che diamo tutti per scontata, sponsorizzata dai big del tech perché si tratta delle fondamenta delle loro piattaforme. Roba che si usa quotidianamente e ciao.

Invece, i programmatori "veri", quelli che guadagnano 150mila euro all'anno, sono quelli che scrivono framework per succhiare dati agli utenti e piazzare pubblicità ovunque. O per fare improbabili app e pezzi di software nella speranza che la startup per cui lavorano si trasformi in un unicorno e loro vincano la lotteria e possano smettere di lavorare a 32 anni.

Secondo me queste sono le premesse culturali per cui un progetto come Copilot viene visto come innovativo. Non è "no-code", è "less-code". E chi se ne frega da dove viene il resto del codice? Tanto le app e i framework predatori da un punto di vista tecnico sono fatti pure male: quello dei tizi da 150K è brutto codice, ridondante, barocco e lento. Da oggi avrà anche pezzettoni di codice open dentro, che completano metodi e funzioni, chiudono classi, creano

L'apprendimento delle AI
Torniamo alle AI. La generazione di intelligenza artificiale precedente è stata addestrata usando fotografie e testi in pubblico dominio. O meglio: miliardi di fotografie succhiate dai programmi gratuiti di archiviazione online come quello di Google (che è stato chiuso quando le reti neurali sono state portate allo stato dell'arte su questo problema) e di digitalizzazione dei vecchi libri (per salvare la cultura! Sì, come no). È più difficile riuscire a vedere le violazioni di copyright in questo contesto, sia per la base legale "furba" usata, sia per il tipo di dati e l'utilizzo delle reti neurali su cui sono state addestrate. Con il codice tutto questo però cambia.

No, i programmatori non imparano "guardando il codice open"
Attenzione: non è la stessa cosa che fanno gli esseri umani quando imparano a programmare guardando il codice open source. Intanto, gli esseri umani non imparano leggendo milioni di righe di codice e riassumendole in modelli mentali statistici con dei pesi. Invece, imparano astraendo e studiando dei principi e utilizzando degli esempi didattici.

Oltre a questa conoscenza (che la rete neurale di OpenAI non ha perché non è in grado di fare astrazione) le persone in generale sono capaci di fare delle astrazioni ulteriori per capire e organizzare la conoscenza. I modelli statistici (come OpenAI) no, lo ripeto: non imparano perché non astraggono. Vengono "addestrati", non "educati". E se credete che invece le reti neurali "imparino", vuol dire che credete a quello che vi dice il marketing e il giornalismo ignorante.

Il riciclaggio
Questo di Copilot è riciclaggio. Fatto nel più grande contenitore in rete di software, utilizzato da milioni di sviluppatori per collaborare a decine di milioni di progetti, aperti o chiusi. Ed è un contenitore di proprietà di un'azienda (Github, cioè Microsoft) che lo usa come strumento per generare un profitto n maniera proprietaria.

L'idea stessa della licenza Gpl è "non mettete il codice aperto dentro software proprietario". Copilot è un modo per mettere il lavoro fatto con il codice aperto dentro del software proprietario. (Altre licenze, come quella Mit, prevedono invece l'attribuzione, che con il Copilot è impossibile per design del sistema).

Ah, tra l'altro. Tutto il lavoro di OpenAI è proprietario: non ci sono motori AI che vengano licenziati come open source, incluso Copilot. Eppure, leggendo la licenza del codice sulla base del quale è stato addestrato, dovrebbe essere sotto licenza Gpl esso stesso e quindi open source. No?

E intanto Ibm fa CodeNet
Il progetto CodeNet di Ibm vuole testare fino a che punto puoi spingere l'intelligenza artificiale per scrivere software. Come per Copilot di GitHub e OpenAI, Project CodeNet è un set di dati multiuso (opens new window) che può essere utilizzato per addestrare modelli di machine learning per varie attività. Contiene 14 milioni di campioni di codice con 500 milioni di righe di codice scritte in 55 diversi linguaggi di programmazione. Tutto open source? Probabilmente sì. Ibm dice però che è stato aggiunto ai campioni anche una grande quantità di annotazioni. CodeNet potrebbe essere utilizzato per sviluppare modelli di apprendimento automatico per attività di programmazione come la traduzione del codice da un linguaggio all'altro o la raccomandazione di possibili sviluppi di una riga o di un metodo. Nell'articolo è disponibile anche (opens new window) un collegamento al repository Project CodeNet,

E Microsoft si allarga con Power FX
Intanto Microsoft sta utilizzando il modello di linguaggio naturale GPT-3 di OpenAI nel suo servizio Power Apps per tradurre il testo parlato in codice (opens new window). Power Fx si concentra sulle formule di Power Apps, rendendo lo strumento simile alle funzioni di query in linguaggio naturale disponibili in Excel, PowerBI o Fogli Google. Gli utenti non è che possono dire cose generali: devono seguire un percorso abbastanza netto: devono infatti comprendere la logica dell'applicazione che stanno creando, ma Power Fx consentirà a più persone di accedere alla creazione avanzata di app e aiuterà anche a formare le persone a utilizzare strumenti low-code, che richiedono poco codice per essere programmati. Le nuove funzionalità sono state attivate per gli utenti Usa e Canada.


Yamatologica

Bentō (弁当)
Questa settimana per il nostro consueto appuntamento con il dizionario tematico di giapponese, dove si cerca di imparare la cultura dietro le parole più che la lingua per andarci in vacanza, si parla di bentō (弁当). Che è una parola simpaticissima e il cui concetto è entrato anche da noi. Lo sapete, a questo punto si fa la battuta "bentō vuol dire schiscetta" o meglio, "gavetta". E tutto ridacchiano. In realtà la parola bentō è molto antica, risale al tredicesimo secolo, e viene da un dialetto della Cina meridionale dell'epoca della dinastia Song: è scritta con i caratteri 便当 (biàndāng), che vuol dire "utile" o "conveniente". L'idea qui è la stessa dei "konbini" (コンビニ), i "convenience store" che in italiano (si fa per dire) si dicono "minimarket". Beh, il bentō è originariamente il contenuto e poi per estensione il contenitore del pranzo monoporzione fatto a casa (come da noi con la gavetta) o comprato già fatto nei negozi (e qui da noi c'è una certa differenza, perché nei supermercati le porzioni monodose già pronte per pranzo sono di solito squallide insalate preconfezionate molto tempo prima e no, il sushi preconfezionato e take-away non vale come bentō).

Nel sudest asiatico, in particolare però in Cina, a Taiwan (buonissimo) e in Corea del Sud (dove si chiama dosirak ed è ottimo, parola mia) il bentō è molto popolare e la base è sempre il riso. Posti ottimi dove comprare il bentō sono le stazioni ferroviarie, non solo in Giappone. Ad esempio, a Taiwan ho scoperto che fanno un "rail bentō" fantastico, che è una tradizione centenaria interrotta nei primi anni ottanta e reintrodotta a furor di popolo all'inizio del nuovo millennio; il "piān-tong", come viene chiamato, è venduto in una scatola di legno con un letto di riso, pezzetti di maiale speziato, un uovo bollito in agrodolce, un po' di verdure incluso l'immancabile sottaceto: è una delicatessen a cui i taiwanesi tengono molto.

In Giappone, nei meandri delle stazioni delle grandi città, ci sono i bentō-ya (弁当屋), i piccoli negozi (ya) che vendono bentō. Ma lo vendono anche in molti grandi magazzini e nei millemila konbini sparsi ovunque. La cosa fondamentale è che sia fresco, cioè preparato in giornata. Dentro si trova di tutto ed è cambiato sia lo stile che la presentazione: scatole di bambù, scatole di legno laccate, scatole di metallo, anche scatole di plastica da microonde. Le scuole preparano i pasti per gli studenti e la maggior parte degli uffici hanno mense o convenzioni, ma per i viaggi o per i lavori all'aria aperta il bentō è un classico e la perizia e minuzia con il quale viene preparato soprattutto quello fatto in casa dice molto di una persona. E c'è una certa pressione sociale dietro a questo, che è stata analizzata per capire chi sono i giapponesi.

Ann Allison, antropologa culturale americana, ritiene che il bentō sia un esempio di "apparato ideologico statale" che lega le madri, la scuola e appunto lo Stato. Una forma di patriarcato istituzionale. Invece, Roland Barthes, semiologo e filosofo francese che ha scritto un libro straordinario sul Giappone (L'impero dei segni) utilizza un approccio simbolico tipico della semiotica e legge nella moltitudine di frammenti e ornamenti del bentō la mancanza di una pietanza principale (i nostri "primo" e "secondo" che nel resto d'Europa è il "main course") e quindi una differenza antropologica profonda, che ottiene tramite l'accostamento un tipo di bellezza estetica differente da quella occidentale. Infine, Joseph Jay Tobin ha colto nella storia recente del bentō, che dal dopoguerra è cambiato rapidamente assorbendo idee e modi di interpretare e reinterpretare il cibo da parte degli chef giapponesi vicino alle modalità occidentali, come una manifestazione del processo di "domesticazione" (cioè il processo con cui viene addomesticato qualcosa di esterno e quindi selvaggio, alieno) tipico dei processi culturali giapponesi nella loro relazione con il resto del mondo.

Ora, io non voglio stare a mostrare o descrivere i millemila tipi di bentō, basta andare su Instagram e cercare la parola "bento" oppure (meglio) copiatevi

弁当

e incollatelo nel campo di ricerca di Instagram e vedrete che viene fuori una vera festa per gli occhi, inclusi i bentō da competizione, quelli ispirati ai cartoni animati (kyaraben, キャラ弁), quelli di lusso, quelli che vi danno in aereo o al ristorante, quelli della mamma o della nonna, quelli da fotografare assolutamente nella categoria foodporn e via dicendo. A me piace molto l'ekibentō (駅弁当, bentō da stazione ferroviaria, di solito abbreviato in "ekiben") soprattutto perché è il primo che ho mangiato vent'anni fa e mi ci sono affezionato.

Aggiungo, per quelli che sono più curiosi, qualcosa che mi hanno raccontato alcuni anni fa a New York gli ingegneri di Ibm passati a Lenovo. C'è tutto in rete e soprattutto nel libro aziendale How the ThinkPad Changed the World scritto dal creatore del portatile Ibm Arimasa Naltoh che mi sono letto sull'aereo di ritorno in Italia, ma la sostanza è questa: quando è stato inventato il ThinkPad, il design era stato affidato al centro di Ibm a Yokohama. La forma del primo computer portatile ad essere andato nello spazio venne disegnata partendo dalla scatola di legno laccato di nero e molto elegante chiamata shōkadō bentō (松花堂弁当).

Il bentō è qualcosa (molto) di più che non una schiscetta, insomma.


Variologica ed eventualogica

Starlink disponibile in tutto il mondo da agosto
Starlink, il sistema di connessione a internet via satellite che secondo me ha il potere di trasformare radicalmente il modo con il quale costruiamo e abitiamo nel territorio, sarà disponibile in tutto il mondo )tranne che al Polo Nord e al Polo Sud) a partire da agosto (opens new window). Il servizio è ora operativo in 12 paesi e ne vengono aggiunti altri ogni mese. Ora ci sono oltre 1.800 satelliti Starlink in orbita bassa che servono più di 69mila clienti. Per essere completato Starlink a consuntivo costerà a SpaceX una cifra compresa fra cinque e dieci miliardi di dollari. SpaceX ha già collaborato con operatori wireless di tutto il mondo per fornire connessioni Internet. La società attualmente vende il suo hardware in perdita, ma sta lavorando su terminali di nuova generazione che costeranno meno.

The Boring Company e Tesla a Las Vegas
The Boring Company, l'azienda di Elon Musk che fa tunnel per mandare le auto a guida automatica, ha iniziato (opens new window) i test sui tunnel del Las Vegas Convention Center (LVCC). Ci sono tre fermate nel sistema LVCC, due fuori terra e una al centro delle gallerie. Il sistema utilizza veicoli di Tesla per il trasporto di passeggeri. I passeggeri utilizzano un'app per chiamare l'auto per la corsa. Il sistema trasforma una passeggiata di 45 minuti in un percorso di due minuti. C'è stata un po' di confusione con i clienti durante i test. Far scalare il sistema attuale potrebbe essere un problema per l'azienda, che ha come obiettivo quello di costruire un enorme sistema di tunnel sotto tutta la città. I filmati di alcuni dei test ride sono disponibili nell'articolo (opens new window).

Assassino non telecomandato
Un drone killer "ha dato la caccia" a un bersaglio umano senza che gli fosse stato ordinato, afferma un rapporto delle Nazioni Unite (opens new window), e lo ha terminato, cioè ucciso. Nel marzo dello scorso anno, un quadricottero KARGU-2 ha preso di mira e ucciso un soldato senza istruzioni in tal senso. Il drone stava operando in modalità autonoma, e ha individuato da solo e dato la caccia senza bisogno di una autorizzazione umana a un bersaglio mentre questo cercava di ritirarsi. È probabile che sia la prima volta che i droni attaccano gli esseri umani senza avere un ordine diretto di farlo. L'incidente solleva preoccupazioni per il futuro dei droni autonomi. Scienziati e gruppi per i diritti umani hanno chiesto restrizioni sulla tecnologia.


Multimediologica

Nei lontani anni Novanta Ginger Baker, il batterista che ho conosciuto tramite i Cream, aveva un suo trio con Charlie Haden e Bill Frisell. Qui sono live nel 1995 (opens new window)

Intanto io segnalo che la trilogia “Mobile Suit Z Gundam (opens new window)” è su Amazon Prime Video. I tre film – intitolati A New Translation: Eredi delle stelle, A New Translation: Amanti e A New Translation: L’amore fa palpitare le stelle – sono stati realizzati tra il 2005 e il 2006, per la regia di Yoshiyuki Tomino e il character design di Yoshikazu Yasuhiko. Usciti in occasione del venticinquesimo anniversario della serie animata Mobile Suit Z Gundam, i film riassumono i 50 episodi dell’anime apportando alcuni cambiamenti alla trama. A chi interessa, qui una breve spiegazione (opens new window) sul perché Gundam ha cambiato la storia dell'animazione giapponese (e non solo) e perché nessuno ce la fa contro Gundam (opens new window).


Tsundokulogica

Noise: A Flaw in Human Judgment (opens new window) è il nuovo libro di Daniel Kahneman che spiega gli errori che si fanno quando si pensa e si giudica qualcosa. Segue l'ottimo Thinking Fast and Slow (opens new window) e l'altrettanto ottimo e utilissimo Superforecasters (opens new window) di Dan Gardner e Philip E. Tetlock. Questa trilogia è una specie di stato dell'arte su come si pensa razionalmente.

La guerra si può predire. Non sto parlando della Psicostoria di Hari Seldon, bensì dell'idea di analizzare un grande quantitativo di libri, saggi e romanzi, per trarne indicazioni operazionali capaci di dire dove scoppierà il prossimo conflitto e più o meno quando. L'idea ha un suo seguito ufficiale: si chiama Progetto Cassandra (opens new window) e la vera notizia è che non usa l'intelligenza artificiale. È più una cosa da analisi di "situazioni da cigno nero in un mondo sempre più interconnesso". E poi usano Watson di Ibm, ok, ok, lo so lo so, una volta si chiamavano modelli statistici e usavano dati e metadati, adesso sono sistemi di machine learning. Quello che è cambiato è che non licenzi più lo scienziato se la previsione è sbagliata, perché è "colpa" della macchina. Sigh.

Having and Being Had (opens new window) è un libro molto particolare perché l'autrice, la poetessa Eula Bliss, indaga il modo con il quale assegnamo il valore alle persone, ai posti e alle cose. È cioè un'esplorazione di come spendiamo, cosa compriamo e perché lavoriamo. «Avendo appena acquistato la sua prima casa, la poetessa e saggista intraprende un'esplorazione provocatoria del sistema di valori in cui è entrata. Attraverso una serie di scambi coinvolgenti – in biblioteche e lavanderie automatiche, su sgabelli da bar e recinzioni di cortile – esamina le nostre ipotesi su classe e proprietà e i modi in cui interiorizziamo le richieste del capitalismo».

I volontari del progetto Gutenberg (opens new window) sono tra i più grandi eroi mai celebrati di Internet: dal 1971 hanno digitalizzato oltre 60mila libri (in inglese) fuori copyright (negli Usa) per preservarli e per la comodità di tutti quelli che li vogliono leggere. Mentre il progetto Gutenberg resiste e continua a crescere, i suoi libri oggi sono solo parzialmente migliorati rispetto alle prime digitalizzazioni degli anni Novanta. Ci sono sempre errori di scansione, e la tipografia non è la migliore o la più elegante e coerente tra quelle possibili. Entra in scena il nuovo progetto che si appoggia a quello di Guntenberg: Standard Ebooks (opens new window). I volontari di questo progetto, che produce ahimè solo libri in inglese (per adesso) ha creato un rigoroso manuale di stile moderno per il montaggio dei libri (opens new window), fa una correzione delle bozze estremamente precisa e puntuale, arricchisce ogni volume con una tonnellata di metadati, aggiorna e segue lo standard di tutti gli ereader moderni (ci sono gli a-capo, le note come pop-up, le immagini e i grafici ad alta risoluzione e scalabili, gli indici e le tabelle dei contenuti che funzionano), ci sono copertine di alta qualità e infine markup e css di qualità, semplici e puliti, ben commentati per essere facili da mantenere e a prova di futuro. Il tutto ovviamente con libertà e senza Drm. Approfittatene tutti (opens new window).

Bisogna proteggere il sapere in rete anche in maniera più aggressiva che non aspettando che finisca il copyright per fare un ebook bellino. C'è chi utilizza la rete (opens new window) per salvare la conoscenza "offline" (libri e paper di ricerca). Sci-Hub è un sito che dà libero accesso a un enorme database di articoli scientifici che altrimenti sarebbero bloccati dietro dei paywall. Il sito è stato oggetto di molteplici azioni legali. I membri del subreddit DataHoarder si sono riuniti per archiviare i 77 TB di dati che si trovano sul sito. L'obiettivo è avere circa 8.500 persone che condividono i documenti tramite torrent e vogliono creare un nuovo sito web non censurabile. La comunità di subreddit ha precedentemente raggiunto un obiettivo simile, archiviando 33 TB di dati da Library Genesis. Gran parte della ricerca scientifica pubblicata in questi articoli è ottenuta tramite finanziamento pubblico.

Azeem Azhar sta per far uscire il suo libro che è atteso in rete da tempo. Si intitola Exponential (opens new window) ed affronta il "divario esponenziale", cioè il crescente divario tra il potere delle nuove tecnologie e la capacità umana di tenere il passo. «Azhar mostra come questo divario esponenziale possa spiegare i problemi più urgenti della nostra società. Il divario tra imprese consolidate e piattaforme digitali in rapida crescita. L'incapacità degli stati nazionali di affrontare nuove forme di guerra cibernetica. E la risposta sclerotica delle democrazie liberali ai problemi sociali in rapida evoluzione».


Algoritmologica

Internet sta marcendo
Che fine ha fatto il web dei primi anni Novanta? Quello che esisteva prima delle grandi piattaforme (opens new window), che monopolizzano gli utenti le cui comunicazioni (i "contenuti") a loro volta oggi possono così essere facilmente monitorate e controllate. Certo, ci sono ancora cose old style (opens new window), soprattutto sui livelli alternativi realmente decentralizzati (ad esempio ZeroNet (opens new window): dovreste provarlo) ma la rete di pagine web composte da geek e smanettoni è letteralmente scomparsa, nascosta da Google, irrilevante per Facebook, spesso uccisa dalla chiusura dei grandi contenitori della prima ora (Geocities (opens new window) e altri).

C'è un altro problema, però. L'Atlantic lo riassume con un titolone ad effetto: The Internet Is Rotting (opens new window) e l'idea è semplice: la colla che tiene assieme la conoscenza umana si sta sciogliendo, internet sta marcendo e perdiamo costantemente moltissima conoscenza.

La colla sono i link, non sono le pagine. Dopotutto il web è un ipertesto ed è costruito sull'idea di collegare la conoscenza: non soltanto la ricerca (Google) o il flusso (Facebook e Twitter) ma la possibilità di passare da una pagina all'altra grazie ai link. Ad esempio, come il link all'articolo dell'Atlantic (opens new window), che da questo testo che state leggendo si raggiunge con un deep link (un link a una specifica pagina, anziché alla home di un sito). Perché questo succeda, però, bisogna che quel link funzioni, cioè che la pagina sia disponibile nella forma vista da me a quell'indirizzo. E invece questo molto spesso non succede più.

La ricerca fatta da Zittrain, professore di informatica e diritto, nonché autore dell'articolo in questione, mostra che un quantitativo enorme di link usati dal 1996 in avanti, non funzionano più, sono rotti. Il 25% di quelli contenuti negli articoli del NYTimes (il giornale è online dal 1996), non funziona. Ma se si guardano gli articoli più vecchi del NYTimes (pubblicati prima del 2000) diventa il 72%.

I link falliscono non solo perché il contenuto viene tolto dalla rete. Invece, molto più spesso quel che succede è che cambia l'indirizzo perché il sito viene ristrutturato. Nel 2016 dei ricercatori dell'università di Priceton hanno visto che il 75% dei paper a cui faceva riferimento il corpus di 3,5 milioni di articoli raccolto, avevano cambiato indirizzo. Come se i libri di casa vostra finissero a casa di qualcun altro, oppure se la copertina rimanesse ma cambiasse (o non si trovasse più) il contenuto. È un titanico problema di permanenza della conoscenza, e al tempo stesso una sconfitta enorme per tutti noi.

Il motore della disgrazia
Il problema ha una parte tecnica complessa. Cominciamo da qui: quelle che noi percepiamo come "pagine web" sono quasi sempre composizioni costruite dinamicamente, il risultato di una aggregazione di elementi ma anche di una attività di calcolo basata su eseguibili Javascript interpretati in tempo reale: questo può accadere indifferentemente nel server web o nel browser. Il risultato può variare sostanzialmente anche in una stessa sessione.

Ad esempio: se aprite una pagina di Wikipedia nel browser, premete Mela-f e cercate una parola qualunque, la trovate solo nelle sezioni "aperte", perché quelle chiuse non sono ancora state renderizzate e probabilmente neanche scaricate. Se aprite le varie sezioni, la parola compare.

In generale, siamo ben oltre il punto in cui quello che viene mostrato a me da un URI (Uniform Resource Identifier, cioè l'indirizzo che identifica una risorsa per nome a uno specifico URL) è la stessa cosa che viene mostrata anche a ciascuno di voi. La targettizzazione effettuata tramite il tracciamento, oppure la geolocalizzazione degli IP di chi chiede l'accesso a una pagina ne sono l'esempio più lampante.

L'altro problema: le pagine web quasi sempre non sono dei singoli documenti informatici autonomi (file di testo html e immagini). Sono invece degli elementi in un database. Archiviare queste pagine richiede in realtà di archiviare tutto il database e i software necessari a farlo funzionare (nella versione corretta).

L'avidità, la pigrizia e in alcuni casi anche l'ignoranza di chi sviluppa molti dei siti web e compone le singole pagine è solo una componente tutto sommato secondaria, ma impatta anche quella.

Coffee break
Mostly Weekly è una newsletter libera e gratuita per tutti. Se volete supportare il tempo che passo a raccogliere e scrivere le notizie, potete farlo magari offrendomi un caffè alla settimana (opens new window) oppure mandandomi proprio dei soldi direttamente su PayPal (opens new window) (che detto così sembra quasi un "in alto le mani, questa è una rapina", però vabbè ci siamo capiti).

Cose utili: Appwrite
Appwrite (opens new window) è un set di microservizi Docker che funge da server backend end-to-end per app web, mobili, native o backend. Può essere utilizzato per integrare facilmente metodi di autenticazione utente, database, archiviazione e gestione dei file, funzioni cloud e altro ancora. Appwrite è multipiattaforma e agnostico dal punto di vista del linguaggio adoperato.

GitUI
Mi sa che ne avevo già parlato parecchio tempo fa ma, siccome continuo sporadicamente a usarlo, lo segnalo (di nuovo). GitUi (opens new window) è una interfaccia grafica per git che funziona nel terminale (con una grafica stile le interfacce testuali del Dos). GitUI offre un controllo rapido e intuitivo tramite tastiera, un aiuto basata sul contesto, un layout dell'interfaccia utente del terminale scalabile, un'API git asincrona e altro ancora. Una demo GIF è disponibile nel repository (opens new window).

Come fare a...
Costruire un team che lavori in modo corretto sempre da remoto (opens new window)? Moderare milioni di commenti usando migliaia di utenti come fa Reddit (opens new window)? A sapere quali sono le differenze principali tra TLS 1.2 e TLS 1.3 (opens new window)?


Una sottile ironia
Una sottile ironia ~ Foto © Antonio Dini

L'ultima bustina (di Minerva)

Rompere il cluster
Non mi sono fatto mai problemi ad avere amici di età diverse dalla mia, anche di parecchio. E ho sempre cercato di frequentare gruppi di persone e posti in cui l'entropia fosse molto alta. Cioè l'opposto di andare a giocare a bowling da solo (opens new window), per citare Robert Putnam. Questo alla nostra società non piace quasi per niente, e comunque lo scoraggia. Riduce i consumi prevedibili, presumo. Inoltre, rimanere sempre con gli stessi amici che abbiamo dai tempi della scuola o dall'università può spesso significare che veniamo "incasellati". È normale cambiare quando invecchiamo, ma restare con gli amici che abbiamo fin dalla gioventù può spesso significare che non riusciamo a comprendere sino in fondo come ci siamo evoluti nel passare del tempo. Secondo l'articolo, trovare nuovi amici di età diverse (opens new window) evita questo problema.




I link non hanno alcuna affiliazione, puntano orgogliosamente solo all'oggetto culturale citato. Un giorno riuscirò a renderli non tracciati.



“A man must love a thing very much if he practices it without any hope of fame or money, but even practice it without any hope of doing it well. Such a man must love the toils of the work more than any other man can love the rewards of it”

– G.K. Chesterton


END




Ti è piaciuta? Inoltrala a chi potrebbe essere interessato.
Se l'hai ricevuta, qui puoi iscriverti
Qui invece c'è l'archivio dei numeri passati
Se vuoi contribuire al futuro di Mostly Weekly, puoi pagare un piccolo contributo equivalente a un caffè alla settimana usando Liberapay (opens new window) o PayPal (opens new window)
Buona domenica!