esperimento tre

Voce marcata come ‘google’

Nuovi domini registrati a nome di Michael Jackson

2 Luglio 2009 · Lascia un Commento

A proposito, ho scritto un post sul blog di Nominet a proposito di un picco di registrazioni di nomi di domini “.uk” che sfruttano la morte del cantante. Ve lo riporto integralmente.

The day following the death of Michael Jackson, Google published a graph showing that their system were heavily hit by queries related to this news. Details can be found on the Google Official Blog.

Our experiments suggest that Nominet systems experienced an analogous, although orders of magnitude smaller, phenomenon. The following figures show the number of new registrations per hour of domain names that contain the name of Michael Jackson (or part of it) and the number of WHOIS queries that Nominet systems received in the same period.

Michael Jackson Graphs

The two graphs are highly correlated because it is common practice for domain name owners to make WHOIS lookups around the period of time they register new domains. The peak around the 27 of June in the second graph is probably related to news stories concerning suspicions about Michael’s death.  Apparently, it did not lead to an immediate rise in the number of domain name registrations.

We have conducted an informal analysis of the domain names that were registered in the last week. The majority of them belong to three categories: parking pages, commercial pages and commemorative sites such as blogs and forums. At the moment, we have no evidence of domain names used for scam or phishing.

In general, this episode confirms (again) that the dynamics of the Domain Name System follow those of the “real world”. A question that is still partially unanswered is at which degree these dynamics are followed by Internet users, i.e. how much their navigation behaviour depends on news stories. In the following months we plan to study the correlation between DNS data and other public events. Google has done something similar in the past, by correlating Google searches for flu-related terms with the spread of flu in North America. The results are very interesting and definitely merit extension to other data sources such as DNS traffic.

Categorie: Uncategorized
Messo il tag: , , , , , , ,

Il “Futuro del Social Networking”

5 Febbraio 2009 · 3 Commenti

Stavo scrivendo questo post e mi sono reso conto che capitava a fagiolo (che brutta espressione!) con il lancio di Google Latitude, il social network che promette di avere sempre sotto controllo la mappa (geografica) dei tuoi amici.

***

A Gennaio si è tenuto a Barcellona un Workshop sul Futuro del Social Networking sponsorizzato dal W3C e qualche giorno fa ne è uscito il report. È interessante leggere le considerazioni che sono state espresse a proposito della privacy nei social network (da notare che erano presenti molte aziende che operano nel settore):

forcing users to create accounts and record their data across many of these networks was counter-productive

A decentralized architecture… would allow the user to choose how many accounts and profiles she desires…

… social networking technologies needed to preserve the possibility for a user to fragment its identity across various profiles, and, in an increasingly context-sensitive setting, to hide, blur or lie about the user’s current context, as a minimal option to protect privacy

the difficulty of getting users to recognize the privacy-implications of their behavior on social networks… was found to stand as a great obstacle to the deployment of any technical solution…”

In pratica, i produttori di social network si stanno lentamente accorgendo che gli utenti non sono “sterminate praterie di dati personali che aspettano solo di essere raccolti”. E si sono anche accorti resi conto che se gli utenti non comprendono le implicazioni delle loro azioni sulla privacy, questo, in ultima analisi, rischia di danneggiare l’azienda stessa, perché gli utenti potrebbero decidere di rigettarne l’applicazione (questa, in realtà, è una considerazione mia).

Naturalmente, non è che adesso tutti cominceranno ad andare nella direzione opposta, sia chiaro: in fondo, partecipare a un social network, “fare rete”, vuol dire, per definizione, rinunciare a parte della propria privacy. Però fa piacere che anche “là fuori” qualcuno stia cominciando a interessarsi a questo problema.

Categorie: Uncategorized
Messo il tag: , , , , , , , , , , , , , ,

Google e StopBadware.org

31 Gennaio 2009 · 4 Commenti

UPDATE (18:55): dopo aver tentato di dare la colpa a StopBadware.org :-) , a Google si sono accorti che qualcuno ha inserito ‘/’ fra gli indirizzi pericolosi e che questa semplice stringa sia stata interprata, più o meno, come “tutto il web è pericoloso”. A me questa spiegazione sembra debole.

Nel frattempo, leggo, sempre dal blog di StopBadware.org, che l’enorme traffico generato dalle pagine di errore di Google ha effettivamente bloccato il loro sito.

Questo uno screenshot di oggi pomeriggio della pagina dei risultati di Google a seguito della query “Repubblica.it” (vedi anche qui cosa è successo):

repubblica-bad1

This site may harm your computer” Oibò!!! Che qualche spiritosone abbia infettato i server di Repubblica.it? In realtà, qualche problema nei server di Google ha fatto sì che qualsiasi sito internet fosse considerato potenzialmente dannoso, da qui la scritta sotto a ogni risultato di ricerca e l’impossibilità di connettersi alla relativa pagina web.

A quegli impavidi che, noncuranti del pericolo, tentavano di raggiugere il tanto agognato sito web appariva questo:

google-badware-page

Curiosando un po’ su Wikipedia si legge che:

StopBadware.org is a consumer-oriented nonprofit organization aimed at fighting malicious software, or “badware”. The organization is run by the Berkman Center for Internet and Society at Harvard Law School, and Oxford University’s Oxford Internet Institute. Support is being provided by Google, Mozilla, Lenovo, PayPal, VeriSign, and Sun Microsystems…

Per cui, molto probabilmente, quelli Google hanno fatto qualche esperimento, magari hanno provato qualche nuova funzionalità e la cosa gli è sfuggita di mano.

Per la cronaca, durante il “downtime” io ho utilizzato Yahoo. Mi chiedo quanti abbiano fatto la mia scelta e se Yahoo abbia sperimentato un picco delle richieste in questo periodo (così come deve essere successo a stopbadware.org, che al momento è raggiungibile a singhiozzo).

PS: sì, concordo con Luca de Biase, questi sono stati minuti di ansia.

Categorie: Uncategorized
Messo il tag: , , , , ,

Google e neutralità dei contenuti (2)

20 Dicembre 2008 · Lascia un Commento

Qualche giorno fa avevo scritto questo commento alla notizia di Google e del suo edge caching. Le certezze vacillano e gli osservatori cominciano a chiedersi se, forse, l’edge caching con la neutralità della rete qualcosa c’entri. Queste titubanze sono riportate dal pezzo a quattro mani firmato Zambardino-Russo qui.

Io continuo con la mia provocazione: neutralità della rete o dei contenuti? L’ISP o le telco potrebbero veramente permettersi di penalizzare Google Microsoft? Chi ci rimetterebbe?

Categorie: Uncategorized
Messo il tag: , , , , , , , , , , ,

Google e neutralità dei contenuti: quella della rete è acqua passata

16 Dicembre 2008 · 5 Commenti

Supponiamo che questo sia un falso allarme e che Google non stia intaccando la neutralità della rete. In fondo vuole fare un semplice “Edge Caching”: gli utenti di alcuni ISP accederebbero più velocemente ai contenuti di Google perché presenti già nella cache. Non si avrebbero contenuti più prioritari, solo contenuti oggettivamente più veloci.

Secondo David Isemberg (via Mantellini):

Net Neutrality only becomes an issue when a carrier picks and chooses which cache to supply pipes to.

The concern of Network Neutrality advocates is not with access but with delivery…Since the edge caching Google is proposing is about access, not delivery, there’s no problem.

e queste posizioni mi sembrano, più o meno, condivise da Luca de Biase nel suo post di ieri.

E se  il discorso sulla neutralità della rete fosse diventando obsoleto? (nota: non in termini assoluti, ma nel senso che ormai è stato sviscerato abbondamentemente)

E se fosse ora di cominciare ad interrogarsi sulla neutralità dei contenuti?

Cosa succederebbe a quei piccoli ISP con basso potere contrattuale (ie, numero di utenti) per invogliare i Google e i Microsoft del futuro a investire in edge caching (tanto per fare un esempio) presso di loro?

La rete di accesso sta diventando meno costosa e gli ISP, conseguentemente, stanno perdendo il loro potere. I fornitori di contenuti, dall’altra parte, stanno diventando i veri attori del futuro: fareste, voi, un contratto con il vostro ISP se non vi assicurasse un accesso veloce a, che so, i servizi di Google?

Il focus, ormai, è sui contenuti. Per ora sto fantasticando, ma non è tanto inverosimile che tra un po’ siano loro, i fornitori di contenuti, ad avere il coltello dalla parte del manico.

Categorie: Uncategorized
Messo il tag: , , , , , , , , , , , ,

Basket e influenza (o “de Google Flu Trends”)

13 Novembre 2008 · Lascia un Commento

È un po’ che non mi faccio sentire. Che vi devo dire? Che ho avuto i miei problemi, definitivamente risolti, oggi, quando il carro-attrezzi si è portato via la Punto. Io non c’ero, ero a lavoro, lontano, ho lasciato le chiavi di un auto senza futuro e senza più targa nelle mani di uno sconosciuto e me ne sono andato, con un po’ di rimpianto.

Ma passiamo ad altro.

Google Flu Trends mi accoglie a lavoro e mi inchioda in una discussione di venti minuti con un mio collega. Fra un caffè e l’altro abbiamo deciso che:

  • È un’idea tanto semplice quanto intelligente
  • Ci si aspettava una correlazione di questo tipo, forse non dei risultati così accurati
  • Il modello matematico è sorprendentemente semplice
  • La vera difficoltà sta nella scelta delle query rappresentative per un certo fenomeno (automatizzare il processo è assolutamente non banale)
  • In Inghilterra o in Italia si puo’ trovare, al limite, una correlazione con il calcio (football), di certo non con il basket

Le conclusioni sono che:

  • Non appena abbiamo tempo, proviamo ad analizzare le query del DNS
  • Questo “non appena abbiamo tempo” puo’ voler dire domani o fra cinque mesi
  • L’analisi, in questo caso, potrebbe rivelarsi “leggermente” più semplice perché, a differenza, di un motore di ricerca, una query DNS è formata da un unico termine (il nome di dominio di cui si richiede l’IP)
  • Per quanto riguarda l’ultimo punto, sembra che anche quelli di Google (vedi technical report) abbiano considerato query atomiche, cioé ogni query è considerata nella sua completezza e non come insieme di “parole” (“school basketball”, non “school” + “basketball”).

Categorie: Uncategorized
Messo il tag: , , , ,

A colazione con Vint Cerf

20 Settembre 2008 · 1 Commento

Martedì sono a colazione niente-po-po-di-meno che con Vint Cerf, il Papà di Internet, il Chief Executive Evangelist di Google (nonché vice-presidente), pezzo grosso dell’ICANN e, infine, colui che ha scritto, scrive e riscriverà il TCP/IP finché non sarà pronto per andare nello spazio!

Per farla breve, il tipo di cui sopra verrà in visita in azienda per un incontro informale prima di andare a parlare qua. Naturalmente, io e i miei colleghi accorreremo numerosi, se non altro per scroccare la colazione :-) .

Fra un caffé e una salsiccia (scusateli, so’ inglesi) l’incontro consisterà in una Q&A session. Le domande non saranno preparate, anche se sicuramente non mancheranno le più importanti:

  • Che cos’è un “Chief Executive Evangelist”?
  • A quando i pcTLD (Planet Code Top-Level Domain) quali .mars, .earth e .sun?

:-)

Putroppo, causa scadenze che si accavallano, non potrò andare al talk che Vint darà subito dopo. In ogni caso, sono convinto che questo incontro sarà molto interessante, soprattutto se verranno fatte le domande giuste. Io, nel frattempo, sto già pensando a cosa chiedergli.

E voi, che cosa vorreste sapere da Vint Cerf? Le risposte sul blog subito dopo l’incontro!

Categorie: Uncategorized
Messo il tag: , , , , , , , ,

Dataspace, web semantico e database

7 Settembre 2008 · 5 Commenti

Dato che il mio precendente post su Google e i dataspace ha suscitato un certo interesse, ho deciso di approfondire l’argomento e di inquadrare meglio il problema (fatemi sapere se non sono stato abbastanza chiaro).

Il concetto di dataspace ha avuto origine nella comunita’ del Web Semantico (si veda Stalkk.ed, dal quale ho preso spunto, e Daniel’s blog per un approfondimento). Riferito ad uno specifico utente, ne descrive lo spazio concettuale che lo circonda, includendone i dati personali e i dati generati (documenti, foto, blog, etc.) e tutti gli altri dati legati all’utente da una qualche relazione (blog preferiti, amici, etc). Inoltre, il dataspace di un utente include anche tutte le relazioni che sussistono tra questi dati, che diventano esse stesse dato e potenziali sorgenti di nuove informazioni (es, da una lista di bookmark si puo’ dedurre la conoscenza linguistica dell’utente).

Data questa definizione in odore di ontologia ;-) , lo studio dei dataspace, e in ultimo la loro realizzazione, puo’ avvenire seguendo due strade opposte.

Il web semantico

L’approccio adottato dalla comunita’ del Web Semantico e’ di tipo top-down (deduttivo). Dalla definizione astratta di dataspace si passa alla sua rappresentazione concreta attraverso un linguaggio formale che permette di lavorare con essi e di sfruttarne appieno le potenzialita’. Infine, si cerca un linguaggio che permetta di interrogare/navigare un dataspace e che sia in grado di estrarne tutte le informazioni di cui abbiamo bisogno. E, come si dice, implementation follows. Siamo in era RDF, OWL, SPARQL (e qui mi fermo, perche’ non e’ il mio campo e rischio di dire delle gran cavolate).

I database

L’approccio adottato nella comunita’ database, al contrario, e’ di tipo bottom-up (induttivo). Si parte dall’evidenza che il dataspace di un utente (cosi’ come il web, d’altronde) e’ un universo di sorgenti di dati eterogenee, poco integrate e che forniscono informazioni spesso ridondanti o in contraddizione tra loro (anni fa si parlava del database delle vendite non allineato con il database dei prodotti, con quello dei clienti, etc).

Innanzitutto, ci si chiede come estrarre i dati dai siti web e come elaborarli per presentarli all’utente in modo unificato. Quindi, ci si chiede come funziona il motore di ricerca che permette di individuare tutte le informazioni che, in un dato momento, sono rilevanti per l’utente, indipendentemente dal loro formato.

Due metodologie a confronto

WS: “Un dataspace contiene tutti i documenti, i video, le foto di un utente, gli amici, le relazioni che li legano e molto altro”.

D: “Ho fatto una ricerca con la parola Parigi, ma non e’ stato in grado di ritrovarmi nemmeno la foto della torre Eiffel. Ti sembra un dataspace?”

In genere, la comunita’ dei database predilige definizioni piu’ “operative”: il dataspace, cosi’ come e’ definito nella comunita’ del Web Semantico, non e’ pienamente realizzato, ma emerge mano a mano che gli strumenti che devono implementarlo si raffinano e permettono un’espressivita’ maggiore.

C’e’ pero’ anche un’altra differenza:

  • Nel primo caso, si definisce una rete (dovrei dire, ontologia) di dati, oggetti e relazioni che tende alla nozione vera e propria di web semantico a-la-Berners Lee. La rete “contiene” i dati, il cui accesso e’ subordinato alla navigazione della rete stessa.
  • Nel secondo caso, il namespace e’ piu’ vicino allo schema tipico del mondo dei database, che descrive i dati ma non li contiene. Il focus, in questo caso, deve essere sulle funzionalita’ di ricerca di questi dati, senza le quali lo schema rimane uno scheletro vuoto.

La logica con cui si muove Google, naturalmente, e’ legata al secondo approccio, piu’ pragmatico, efficiente e sicuramente piu’ scalabile: quelli di Google non possono permettersi di produrre niente che non sia in grado di funzionare su volumi di traffico e dati impressionanti!

Categorie: Uncategorized
Messo il tag: , , , , ,

Chrome e il Google dataspace

2 Settembre 2008 · 9 Commenti

UPDATE (7/09/2008 ): un approfondimento sui dataspace.

UPDATE (20:43): la beta di Chrome e’ ora liberamente scaricabile, a patto di avere Windows
***

A completamento del mio precedente post su Google Chrome, il nuovo browser, anzi no, sistema operativo, anzi no, contenitore di applicazioni, anzi no, tutti e tre insieme, vorrei aggiungere alcune considerazioni personali sul perche’ Google abbia deciso di percorrere questa nuova strada.

Quello che segue e’ una rielaborazione di un paio di commenti che ho lasciato ai post di Vittorio Zambardino e Luca de Biase, che mi hanno fatto ragionare sul perche’ di Chrome.

***

Alon Halevy e’ un brillante (ex-)professore di database dell’universita’ di Washington che, dopo aver passato anni a studiare gli infiniti problemi legati all’integrazione di dati da sorgenti eterogenee (schema mediation, schema reconciliation, etc, etc), comincia a lavorare ad un’idea che di li’ a poco (siamo nel 2005) chiama dataspace. Dal 2006 lavora per Google, il brevetto dell’idea di dataspace arriva poco dopo. Infine, arriva Chrome

***
Ma, in pratica, che cos’e’ un dataspace?
(qui una presentazione di Halevy del 2006)

Considerate l’insieme delle informazioni, personali e non, che ciascuno di noi dissemina in Internet. Tutti questi dati, siano essi email, chat, photo, “notizie” da quotidiani, documenti, etc. sono eterogenei, cioe’ hanno formati differenti, sono mantenuti su piattaforme indipendenti e possono avere interfacce d’accesso completamente diverse fra loro.

Il dataspace e’ quell’astrazione che ci permette di ignorare le differenze e di concentrarci sui dati veri e propri, con l’illusione che essi siano omogenei. In quest’ottica Internet smetterebbe di essere una costellazione di pagine web, di siti internet e applicazioni diverse, ma diventerebbe un continuum in cui possiamo muoversi senza sentire le barriere di una integrazione incompleta.

***
Nel frattempo Google che fa?

Google si e’ gia’ costruita, negli anni, uno “spazio di dati” bello corposo, ma l’integrazione fa ancora un po’ acqua (se escludiamo il fatto che tutti i servizi sono accessibili tramite un unico account).

Il prossimo passo e’ sviluppare gli strumenti che possano rendere reale questa integrazione e dare vita, in modo concreto, a questo fantomatico dataspace.

Secondo me, Chrome e’ un passo decisivo in questa direzione: come molti prima di me hanno notato, qui non si sta proponendo “solo” un nuovo browser, ma si cerca di far passare una “filosofia” completamente nuova”: si vuole rendere obsoleto il concetto di sistema operativo come lo conosciamo.

Quando tutti i nostri dati saranno online, dalle mail ai documenti di lavoro, alle presentazioni fino ad arrivare alle foto delle vacanze, sara’ il browser (se ancora si chiamera’ cosi’) a fare la differenza e il sistema operativo sara’ un simpatico accessorio al nostro accesso a Internet.

Zambardino dice che i dataspace non c’entrano, ma secondo me stiamo dicendo la stessa cosa:

…il punto di forza è che sullo zoccolo di Chrome, si costruirà col tempo uno strato di nuove applicazioni crearte da terzi, anche singoli, che vorranno mettere la loro “bancarella” nel mercato dei grandi. Google a sua volta potrà integrare nel browser l’ubiquità e fluidità dei suoi servizi, godibili anche su cellulare…

Ma alla fine, quale sara’ la “user experience” dell’utente comune che usera’ questo super-browser pieno di mini-applicazioni? Quella di essere di fronte a un sistema operativo omnicomprensivo che gli permette di interagire con il suo spazio-dati (e probabilmente anche con quello dei suoi “friends”) attraverso una serie di interfacce piu’ o meno standard. Che e’ la base del concetto di dataspace (della sua implementazione reale, naturalmente).

Categorie: Uncategorized
Messo il tag: , , , , ,

Google, Chrome e Android

2 Settembre 2008 · 1 Commento

(Qui alcune riflessioni in piu’ su Chrome)

***

Domani Oggi Google rendera pubblica la beta version del suo nuovo browser, Google Chrome:

We will be launching the beta version of Google Chrome tomorrow in more than 100 countries. (via Official Google Blog)

Per ora il link al sito web di Chrome cita un “Not Found, Error 404″, immagino sia solo questione di poche ore: la notizia e’ datata 1 Settembre ma probabilmente dovremo aspettare finche’ non diventera’ giorno negli Stati Uniti.

Google Android: ma voi ve la ricordate il concorso di Google Android, quello a cui si poteva partecipare da tutto il mondo civilizzato e anche piu’, tranne che dall’Italia? Pare che la prima parte sia terminata, i vincitori li trovate qui.

Da qui (in fondo alla pagina):

When Android was announced on 5 November, 2007, Google also announced a $10 million Android Developer Challenge, split into two separate $5 million events. The first Android Developer Challenge ran from January 2008 through August 2008, and was intended to give developers an opportunity to explore their ideas using the early look SDK and build prototype applications — to “get in on the ground floor.” The second Challenge will give developers a chance to build polished applications once hardware is available.

In pratica, ora ci sara’ una seconda fase in cui i finalisti (o forse e’ aperto a tutti? Questo non mi e’ chiaro) saranno chiamati a implementare le loro idee (solo quelle vincenti?) sui terminali reali.

Interessante no?

Categorie: Uncategorized
Messo il tag: , , ,