A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.
The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.
So when a big news story happens, how can you best interpret this data?
What is Trends data?
Trends data is an unbiased sample of our Google search data. Sono resi anonimi (nessuno viene identificato personalmente), categorizzati (determinando l’argomento di una query di ricerca) e aggregati (raggruppati). Questo ci permette di misurare l’interesse per un particolare argomento attraverso la ricerca, da tutto il mondo, fino alla geografia a livello di città.
Puoi farlo anche tu – l’esploratore di dati gratuito su Google Trends ti permette di cercare un particolare argomento su Google o un insieme specifico di termini di ricerca. Usa lo strumento e puoi vedere l’interesse per un argomento o un termine di ricerca nel tempo, dove è più ricercato, o cos’altro la gente cerca in relazione ad esso.
Ci sono due modi per filtrare i dati di Trends: tempo reale e non tempo reale. Il tempo reale è un campione casuale di ricerche degli ultimi sette giorni, mentre il tempo non reale è un altro campione casuale dell’intero set di dati di Google che può andare indietro ovunque dal 2004 a ~36 ore fa. I grafici vi mostreranno uno o l’altro, ma non entrambi insieme, perché si tratta di due campioni casuali separati. Prendiamo un campione dei trilioni di ricerche di Google, perché altrimenti sarebbe troppo grande da elaborare rapidamente. Campionando i nostri dati, possiamo guardare un set di dati rappresentativo di tutte le ricerche di Google, trovando allo stesso tempo intuizioni che possono essere elaborate in pochi minuti di un evento che accade nel mondo reale.
È un set di dati unico e potente, che può integrare altri, come i dati demografici dal censimento, come mostrato qui nel Washington Post. Come campione, ci dà un modo per analizzare ciò che le persone stanno cercando in tempo reale mentre gli eventi si svolgono. Ma combinare i dati può essere difficile – per esempio, non ha senso confrontare Google Trends con altri set di dati di Google, che sono misurati in modi diversi. Ad esempio, AdWords è pensato per approfondimenti sui volumi di ricerca mensili e medi, in particolare per gli inserzionisti, mentre Google Trends è progettato per scavare ulteriormente nei dati più granulari in tempo reale.
Cosa significano i numeri?
Google Trends è uno strumento potente per lo storytelling perché può permetterci di esplorare la grandezza dei diversi momenti e come le persone reagiscono a quei momenti. Possiamo guardare indietro e confrontare diversi termini l’uno con l’altro, come i diversi sport si sono classificati dal 2004. Possiamo anche prendere le ricerche totali per un evento per aiutarci a capire la sua pura grandezza. Quando abbiamo pubblicato il nostro 2015 Year in Search, abbiamo scoperto che ci sono state sorprendentemente più di 439 milioni di ricerche su Google quando Adele è tornata con ‘Hello’.
Quello che è più utile per lo storytelling sono i nostri dati Trends normalizzati. Questo significa che quando guardiamo l’interesse di ricerca nel tempo per un argomento, stiamo guardando quell’interesse come una proporzione di tutte le ricerche su tutti gli argomenti su Google in quel momento e luogo. Quando guardiamo l’interesse di ricerca regionale per un argomento, stiamo guardando l’interesse di ricerca per quell’argomento in una data regione come una proporzione di tutte le ricerche su tutti gli argomenti su Google in quello stesso luogo e tempo.
Per esempio, se guardiamo le tendenze intorno a Bernie Sanders, possiamo vedere che il Vermont ha il più alto interesse di ricerca per l’attuale senatore. Questo perché di tutti gli stati, il Vermont ha la più alta percentuale di ricerche per Sanders su tutte le ricerche in quello stato. Se avessimo guardato i dati grezzi piuttosto che i valori normalizzati, avremmo visto gli stati più grandi con una popolazione più alta salire in cima alle classifiche.
Questa normalizzazione è davvero importante: il numero di persone che cercano su Google cambia costantemente – nel 2004 il volume di ricerca era molto più piccolo di oggi, quindi i numeri di ricerca grezzi non vi darebbero alcun modo per confrontare le ricerche di allora e di oggi. Normalizzando i nostri dati, possiamo fare approfondimenti: confrontando diverse date, diversi paesi o diverse città.
Anche il contesto dei nostri numeri è importante. Indicizziamo i nostri dati a 100, dove 100 è il massimo interesse di ricerca per il tempo e la località selezionati. Ciò significa che se guardiamo l’interesse di ricerca nelle elezioni del 2016 dall’inizio del 2012, vedremo che marzo 2016 ha avuto il massimo interesse di ricerca, con un valore di 100.
Se guardiamo l’interesse di ricerca nel solo marzo 2016, però, possiamo vedere che il 16 marzo ha il più alto interesse di ricerca, perché abbiamo reindicizzato i nostri valori solo per quel mese.
Come contestualizzare i numeri?
Perché i dati di Google Trends sono presentati come un indice, spesso riceviamo la domanda: “quanto è importante?”
Ci sono alcuni modi per valutarlo. Il primo è capire l’interesse relativo di ricerca nell’argomento rispetto a se stesso – o quello che chiameremmo un “picco”.
Quando sono arrivati i risultati del recente referendum sull’UE, Google Trends ha mostrato ciò che la gente era intrinsecamente curiosa. L’interesse di ricerca per la cravatta di David Dimbleby della BBC ha avuto un picco, e anche le persone che cercavano “ottenere un passaporto irlandese” sono aumentate del 100%. Comprendere l’aumento percentuale in un argomento di ricerca può essere un modo utile per capire quanto è aumentato l’interesse per un argomento. Questa percentuale di aumento si basa sulla crescita dell’interesse di ricerca di un argomento in un periodo di tempo distinto rispetto al periodo precedente.
Questi “picchi” sono un’improvvisa accelerazione dell’interesse di ricerca in un argomento, rispetto al normale volume di ricerca. Sappiamo che sono interessanti perché spesso riflettono ciò che sta accadendo nel mondo reale – c’è stato un aumento delle richieste di passaporti irlandesi nel Regno Unito dopo il voto, per esempio.
Per avere un senso della dimensione relativa, possiamo aggiungere ulteriori termini, che aiutano a mettere l’interesse di ricerca in prospettiva. Per esempio, dopo che i Cleveland Cavaliers hanno vinto il campionato NBA quest’anno, abbiamo visto i Cavaliers superare Taylor Swift, un argomento che ha un volume di ricerca costantemente alto su Google. Questo aiuta a contestualizzare quanto grande fosse il volume intorno alla query di ricerca “Cavaliers” quando ha raggiunto il picco.
We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.
Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.
Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.
I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.