Monthly Archives: September 2008

Vint Cerf, IPv6 e IDN

Nonostante le mie rassicurazioni, questo post arriva un po’ in ritardo, e forse anche fuori tempo massimo, dato che Punto Informatico ha già raccontato molto di quello che avrei scritto io. Dovete perdonarmi, ma è appena terminato un week-end di caldo e sole e io l’ho passato ovunque tranne che a casa: se viveste in Inghilterra sapreste cosa vuol dire! 😉

Vint Cerf è l’uomo più elegante dell’ICANN, così me lo avevano descritto e, martedì mattina, ho avuto una mezza conferma, quando, durante la breve visita a Nominet,  ha sfoggiato un abito grigio scuro impeccabile, con gilè e camicia con gemelli.

Segue breve riassunto dell’intervento.

Le maggiori sfide di Internet: IPv6

(PI ne parla in modo abbastanza chiaro qua) Lo spazio di indirizzamento associato a IPv4 si sta esaurendo. Sono 15 anni che si sta esaurendo, ma adesso si sta cominciando a vedere il fondo. Se non ci diamo una mossa, qualcuno potrebbe cominciare a comprare interi range di indirizzi IP al solo scopo di venderli, in un secondo tempo, a prezzi elevati. Se questo dovesse verificarsi, il problema diventerebbe ancor più grande.

Da un punto di vista tecnico non c’è nulla che freni il passaggio a IPv6, alcuni registry sono già pronti, altri lo saranno a breve. Il problema sono gli ISP. Molti non sono ancora pronti al passaggio e preferiscono rimandare il problema piuttosto che investire e risolvere.

La transizione sarà comunque lunga e solo se iniziata per tempo sarà indolore (o quasi). Immaginatevi questo scenario: gli indirizzi IPv4 terminano e nuovi siti (e nuovi ISP) sono costretti ad utilizzare solo IPv6. Si rischia la fragmentazione della rete (fragmentazione fisica).

Le maggiori sfide di Internet: Internationalised Domain Names and gTLD

IDN, cioè la possibilità di registrare un nome di dominio utilizzando caratteri non latini (questo post, in fondo). Nuovi gTLD, cioè la liberalizzazione (o quasi) nella registrazione di nuovi nomi di dominio di primo livello (.it, com, org, etc.). Questo problema ha due aspetti:

  • Sicurezza. Il rischio di phishing aumenta incredibilmente data la quantità di caratteri esistenti.
  • Tecnico. Il carico sui root server aumenterebbe notevolmente. Nella loro configurazione attuale, possono gestire fino a un migliaio di TLD, equivalente a circa tre volte il numero attuale. Se ci fosse un;impennata nel numero di nuovi TLD l’intera infrastruttura potrebbe risentirne.

Il problema più urgente, naturalmente, è quello della sicurezza. È interessante notare che, sebbene l’introduzione di IDN creerebbe diversi problemi, essa è necessaria. Esistono paesi che danno la possibilità agli utenti di utilizzare Internet nella propria lingua. Gli ISP di questi paesi hanno server dedicati alla traduzione delle query per garantire l’interoperabilità con il DNS dell’ICANN.

Sono realtà importanti che non possono essere ignorate e, se il problema non viene risolto, si rischia di andare verso una fragmentazione di Internet (fragmentazione logica).

DNSSEC

Lo sviluppo di DNSSEC è importante, soprattutto alla luce delle recenti vulnerabilità nel DNS. L’ICANN è fortemente influenzato dal governo degli Stati Uniti (volenti o nolenti, questa è la realtà) e difficilmente qualcosa si muoverà sul lato DNSSEC, finché il nuovo governo (indipendentemente da chi vincerà) non si sarà installato (quindi, non prima di Gennaio dell’anno prossimo).

NB: questo non implica un coinvolgimento diretto del Presidente, naturalmente, ma è tutta la macchina decisionale che ruota intorno a Washington che, di fatto, si ferma fino a nuovi ordini.

Censura in Cina

Qualcuno ha chiesto perché Google censura in Cina. Da politico navigato qual è, la sua risposta è stata impeccabile: “preferiamo censurare che noi che far censurare a loro, almeno abbiamo il controllo di quel che succede. Solo la versione .CN è censurata, non quella internazionale. Censuriamo solo l’1% dei siti (vabbé, questa se la poteva risparmiare. se mi censuri la parte alta dei risultati di ricerca è come censurarli tutti)”.

Ha poi concluso ricordando che nessuno dei loro servizi basati in Cina, così le autorità non possono chiedergli i log dei server o i dati personali degli utenti (come fanno i nostri competitor, ha aggiunto…).

Chrome e Google

Spinto da qualche domanda, Vint Cerf ha un po’ parlato di Google Chrome. Niente di particolarmente rilevante.

Non ha detto una parola a proposito del telefonino con Android. A parte che il lancio ufficiale non c’era ancora stato, credo non avesse voglia di imbarcarsi in una raffica di domande senza fine.

Informazione, comunicazione e networking: State of the Blogosphere 2008

Sto leggendo i commenti nel mio feed reeder stanno cominciando a fiorire a proposito tel report di Technorati State of the Blogosphere 2008.Ad esempio, qua, qua e anche qua.

Vado un po’ di fretta, ma voglio comunque buttare là qualche appunto.

Cos’è un blog

È una domanda che mi sto ponendo spesso ultimamente, più o meno da quando ho deciso di aprire questo blog. Io mi sono dato questa risposta: un blog è informazione, comunicazione e networking.

Un blog è informazione nel senso che deve avere dei contenuti. Non necessariamente “notizie” nel senso giornalistico del termine, ma nel senso di informazioni che qualcuno, là fuori, considera rilevanti.

Un blog è comunicazione, nel senso che le informazioni devono essere veicolate correttamente, con il giusto linguaggio, presentate in modo corretto e avendo chiaro in mente il target a cui esse sono rivolte. Oppure, non faranno presa nei lettori.

Infine, un blog è networking, nel senso che deve poggiarsi su una rete di conoscenze perché qualcuno lo segua e lo tenga in vita (un blog non letto da nessuno è un blog? Naturalmente sì se è agli inizi, ma poi?)

Il rapporto di Technorati

Questo è quello che stavo pensando da qualche tempo: non mi stupisco, quindi, se nel rapporto di Technorati (via Luca de Biase) alla domanda why do you blog? troviamo:

  1. In order to speak my mind on areas of interest (communication)
  2. To share my expertise and experiences with others (information)
  3. To meet and connect with like minded people (networking)

e a seguire altre ragioni legati all’auto-promozione o realizzazione personale.

Ripensando, quindi, alle recenti polemiche sulla BlogFest (che ho letto da esterno), e sul fatto che non sono nate nuove idee, io rispondo: qual è il problema? Quella è stata (credo) una splendida occasione (e ben riuscita, da quello che ho capito) per fare networking e si è annoiato solo chi non aveva bisogno di conoscere nuove persone o di rinsaldare i rapporti con quelle che conosceva già.

BlogBabel e qualche esempio

A sostegno di questa tesi ci sono le tante classifiche di blog famosi (esempio, BlogBabel). Se guardiamo i blog nelle prime posizioni scopriamo che sono tenuti quasi tutti da giornalisti o da gente che ruota attorno al mondo dell’informazione e/o della comunicazione (online o offline):

  1. Hanno tutti grandi capacità comunicative
  2. Hanno tutti qualcosa di interessante da dire, spesso per il grande pubblico
  3. Il loro networking è spesso (non sempre) determinato dalla notorietà che gli deriva da attività altre

Unicode, il giorno più lungo

Nel blog-fratello in inglese potete trovare il report del training course su Unicode di cui avevo parlato in questo post.

Vi risparmio il copia-incolla completo e riporto solo le frasi che penso siano le più significative:

Unicode is a “unified coding system” that contains more than 100,000 characters. It is dynamic, because new characters are continually added in order include “all” possible human characters. From a theoretical point of view, we could say that it tries to preserve cultural diversity while giving a universal interpretation of all human languages (it is arguable whether it is successful on this: for example, some Chinese characters are still not part of Unicode).

E poi, parlando di Internationalised Domain Names, rischio di typosquatting e phishing:

We discussed a bit about the problem of Internationalised Domain Names (IDNs), which open the doors to typosquatting and phishing. One policy might be to disallow mixing different scripts when registering IDNs. In certain languages it is common practice to use characters or words from the Latin alphabet as part of the sentence and such a solution would constitute a big limitation.

A partial solution, which might work for the most common cases, is to allow mixing any script with the “common” Latin script.

L’opinione che mi sono fatto in questo corso è che l’introduzione di Unicode e degli IDN creerà un grande caos e il rischio di attacchi basati su phishing subirà un’impennata incredibile.

E, fra parentesi, è anche l’opinione di Vint Cerf (entro stasera due righe anche su questo, promesso! 😉 )

A colazione con Vint Cerf

Martedì sono a colazione niente-po-po-di-meno che con Vint Cerf, il Papà di Internet, il Chief Executive Evangelist di Google (nonché vice-presidente), pezzo grosso dell’ICANN e, infine, colui che ha scritto, scrive e riscriverà il TCP/IP finché non sarà pronto per andare nello spazio!

Per farla breve, il tipo di cui sopra verrà in visita in azienda per un incontro informale prima di andare a parlare qua. Naturalmente, io e i miei colleghi accorreremo numerosi, se non altro per scroccare la colazione :-).

Fra un caffé e una salsiccia (scusateli, so’ inglesi) l’incontro consisterà in una Q&A session. Le domande non saranno preparate, anche se sicuramente non mancheranno le più importanti:

  • Che cos’è un “Chief Executive Evangelist”?
  • A quando i pcTLD (Planet Code Top-Level Domain) quali .mars, .earth e .sun?

🙂

Putroppo, causa scadenze che si accavallano, non potrò andare al talk che Vint darà subito dopo. In ogni caso, sono convinto che questo incontro sarà molto interessante, soprattutto se verranno fatte le domande giuste. Io, nel frattempo, sto già pensando a cosa chiedergli.

E voi, che cosa vorreste sapere da Vint Cerf? Le risposte sul blog subito dopo l’incontro!

Unicode, caratteri speciali sul Mac

Sto seguendo un training course su Unicode. In 40 minuti siamo riusciti a dire che: Unicode è importante, tutti lo supportano ma pochi lo abilitano.

Se continua cosí sarà dura arrivare fino a stasera.

Nel frattempo, ho trovato questo fantastico post che spiega come ottenere “caratteri speciali” (Unicode, direi ora) con una tastiera Mac.

liquidicity » Reference for EVERY Character Key on a Mac

A proposito, avete notato le lettere accentate in questo post?

🙂

L’impronta ecologica della scienza

Tornando a casa dal lavoro ascoltavo la radio in macchina e si parlava di questa cosa qua.

Si da il caso che dalle parti di Oxford ci sia il Rutherford Appleton Laboratory che, fra le tante meraviglie, contiene anche un grosso acceleratore di particelle (non paragonabile a quello del CERN, naturalmente). Si discute delle solite cose, quando, a un certo punto, telefona un ascoltatore e fa un commento tanto irritante quanto spiazzante:

Ogni giorno sento i nostri scienziati (che lavorano al RAL) che ci accusano di star consumando irresponsabilmente tutte le risorse energetiche. “Dovete spegnere le vostre TV, non sapete quanta energia si consuma a causa dei led rossi lasciati accesi”.

Ma loro, con il loro sbattere protoni ed elettroni dalla mattina alla sera, quanta energia consumano? Loro controllano noi, ma a loro, chi li controlla? Chi me lo dice, a me, che tutta quella energia sia spesa bene? A quanti led rossi corrisponde tutta l’energia che al RAL si consuma ogni giorno senza che nessuno, al di fuori di una ristretta cerchia di persone, ne capisca il motivo?

Il mio primo istinto, quando ho ascoltato questo intervento, e’ stato di profondo fastidio: ma come si fa a non comprendere, l’importanza, l’essenzialita’ della scienza, etc, etc, etc.

Eppure…

Infine, mi ha colpito la reazione del conduttore: un po’ di sano battibecco, un micro-secondo di riflessione e un “cercheremo di organizzare una visita al RAL per intervistare i fisici che ci lavorano. Non sono d’accordo con Steve (il nome del tipo, credo, NdA), ma la gente si fa queste domande e perche’ non tentare di dargli una risposta?”

Dataspace, web semantico e database

Dato che il mio precendente post su Google e i dataspace ha suscitato un certo interesse, ho deciso di approfondire l’argomento e di inquadrare meglio il problema (fatemi sapere se non sono stato abbastanza chiaro).

Il concetto di dataspace ha avuto origine nella comunita’ del Web Semantico (si veda Stalkk.ed, dal quale ho preso spunto, e Daniel’s blog per un approfondimento). Riferito ad uno specifico utente, ne descrive lo spazio concettuale che lo circonda, includendone i dati personali e i dati generati (documenti, foto, blog, etc.) e tutti gli altri dati legati all’utente da una qualche relazione (blog preferiti, amici, etc). Inoltre, il dataspace di un utente include anche tutte le relazioni che sussistono tra questi dati, che diventano esse stesse dato e potenziali sorgenti di nuove informazioni (es, da una lista di bookmark si puo’ dedurre la conoscenza linguistica dell’utente).

Data questa definizione in odore di ontologia ;-), lo studio dei dataspace, e in ultimo la loro realizzazione, puo’ avvenire seguendo due strade opposte.

Il web semantico

L’approccio adottato dalla comunita’ del Web Semantico e’ di tipo top-down (deduttivo). Dalla definizione astratta di dataspace si passa alla sua rappresentazione concreta attraverso un linguaggio formale che permette di lavorare con essi e di sfruttarne appieno le potenzialita’. Infine, si cerca un linguaggio che permetta di interrogare/navigare un dataspace e che sia in grado di estrarne tutte le informazioni di cui abbiamo bisogno. E, come si dice, implementation follows. Siamo in era RDF, OWL, SPARQL (e qui mi fermo, perche’ non e’ il mio campo e rischio di dire delle gran cavolate).

I database

L’approccio adottato nella comunita’ database, al contrario, e’ di tipo bottom-up (induttivo). Si parte dall’evidenza che il dataspace di un utente (cosi’ come il web, d’altronde) e’ un universo di sorgenti di dati eterogenee, poco integrate e che forniscono informazioni spesso ridondanti o in contraddizione tra loro (anni fa si parlava del database delle vendite non allineato con il database dei prodotti, con quello dei clienti, etc).

Innanzitutto, ci si chiede come estrarre i dati dai siti web e come elaborarli per presentarli all’utente in modo unificato. Quindi, ci si chiede come funziona il motore di ricerca che permette di individuare tutte le informazioni che, in un dato momento, sono rilevanti per l’utente, indipendentemente dal loro formato.

Due metodologie a confronto

WS: “Un dataspace contiene tutti i documenti, i video, le foto di un utente, gli amici, le relazioni che li legano e molto altro”.

D: “Ho fatto una ricerca con la parola Parigi, ma non e’ stato in grado di ritrovarmi nemmeno la foto della torre Eiffel. Ti sembra un dataspace?”

In genere, la comunita’ dei database predilige definizioni piu’ “operative”: il dataspace, cosi’ come e’ definito nella comunita’ del Web Semantico, non e’ pienamente realizzato, ma emerge mano a mano che gli strumenti che devono implementarlo si raffinano e permettono un’espressivita’ maggiore.

C’e’ pero’ anche un’altra differenza:

  • Nel primo caso, si definisce una rete (dovrei dire, ontologia) di dati, oggetti e relazioni che tende alla nozione vera e propria di web semantico a-la-Berners Lee. La rete “contiene” i dati, il cui accesso e’ subordinato alla navigazione della rete stessa.
  • Nel secondo caso, il namespace e’ piu’ vicino allo schema tipico del mondo dei database, che descrive i dati ma non li contiene. Il focus, in questo caso, deve essere sulle funzionalita’ di ricerca di questi dati, senza le quali lo schema rimane uno scheletro vuoto.

La logica con cui si muove Google, naturalmente, e’ legata al secondo approccio, piu’ pragmatico, efficiente e sicuramente piu’ scalabile: quelli di Google non possono permettersi di produrre niente che non sia in grado di funzionare su volumi di traffico e dati impressionanti!