Basket e influenza (o “de Google Flu Trends”)


È un po’ che non mi faccio sentire. Che vi devo dire? Che ho avuto i miei problemi, definitivamente risolti, oggi, quando il carro-attrezzi si è portato via la Punto. Io non c’ero, ero a lavoro, lontano, ho lasciato le chiavi di un auto senza futuro e senza più targa nelle mani di uno sconosciuto e me ne sono andato, con un po’ di rimpianto.

Ma passiamo ad altro.

Google Flu Trends mi accoglie a lavoro e mi inchioda in una discussione di venti minuti con un mio collega. Fra un caffè e l’altro abbiamo deciso che:

  • È un’idea tanto semplice quanto intelligente
  • Ci si aspettava una correlazione di questo tipo, forse non dei risultati così accurati
  • Il modello matematico è sorprendentemente semplice
  • La vera difficoltà sta nella scelta delle query rappresentative per un certo fenomeno (automatizzare il processo è assolutamente non banale)
  • In Inghilterra o in Italia si puo’ trovare, al limite, una correlazione con il calcio (football), di certo non con il basket

Le conclusioni sono che:

  • Non appena abbiamo tempo, proviamo ad analizzare le query del DNS
  • Questo “non appena abbiamo tempo” puo’ voler dire domani o fra cinque mesi
  • L’analisi, in questo caso, potrebbe rivelarsi “leggermente” più semplice perché, a differenza, di un motore di ricerca, una query DNS è formata da un unico termine (il nome di dominio di cui si richiede l’IP)
  • Per quanto riguarda l’ultimo punto, sembra che anche quelli di Google (vedi technical report) abbiano considerato query atomiche, cioé ogni query è considerata nella sua completezza e non come insieme di “parole” (“school basketball”, non “school” + “basketball”).
Advertisements

Comments are closed.