What is Google Trends data – and what does it mean?

Simon Rogers

Follow

Jul 1, 2016 · 6 min read

A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.

The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.

So when a big news story happens, how can you best interpret this data?

What is Trends data?

Trends data is an unbiased sample of our Google search data. Det är anonymiserat (ingen identifieras personligen), kategoriserat (bestämmer ämnet för en sökfråga) och aggregerat (grupperat). Detta gör det möjligt för oss att mäta intresset för ett visst ämne över hela sökningen, från hela världen, ända ner till geografi på stadsnivå.

Du kan också göra det – den kostnadsfria datautforskaren på Google Trends gör det möjligt för dig att söka efter ett visst ämne på Google eller en specifik uppsättning söktermer. Om du använder verktyget kan du se sökintresset för ett ämne eller en sökterm över tid, var det är mest sökt eller vad andra människor söker efter i samband med det.

Det finns två sätt att filtrera Trends-data: realtid och icke-realtid. Realtid är ett slumpmässigt urval av sökningar från de senaste sju dagarna, medan icke-realtid är ett annat slumpmässigt urval av hela Googles dataset som kan gå tillbaka från 2004 till för ~36 timmar sedan. Diagrammen visar antingen det ena eller det andra, men inte båda tillsammans, eftersom det rör sig om två separata slumpmässiga urval. Vi tar ett urval av de triljoner Google-sökningarna, eftersom det annars skulle bli för stort för att bearbetas snabbt. Genom att ta stickprov på våra data kan vi titta på ett dataset som är representativt för alla Googlesökningar, samtidigt som vi hittar insikter som kan bearbetas inom några minuter efter det att en händelse har inträffat i den verkliga världen.

Det är ett unikt och kraftfullt dataset, som kan komplettera andra, som demografiska data från folkräkningen, vilket visas här i Washington Post. Som ett urval ger det oss ett sätt att analysera vad människor söker efter i realtid medan händelserna utspelar sig. Men det kan vara svårt att kombinera data – det är till exempel inte meningsfullt att jämföra Google Trends med andra datamängder från Google, som mäts på olika sätt. Till exempel är AdWords avsett för insikter om månatliga och genomsnittliga sökvolymer, specifikt för annonsörer, medan Google Trends är utformat för att gräva vidare i mer granulära data i realtid.

Vad betyder siffrorna?

Google Trends är ett kraftfullt verktyg för historieberättande eftersom det kan ge oss möjlighet att utforska omfattningen av olika ögonblick och hur människor reagerar på dessa ögonblick. Vi kan titta tillbaka och jämföra olika termer mot varandra, till exempel hur olika sporter har rankats sedan 2004. Vi kan också ta fram det totala antalet sökningar för en händelse för att förstå dess omfattning. När vi publicerade vårt 2015 års sökår fann vi att det fanns häpnadsväckande nog över 439 miljoner sökningar på Google när Adele kom tillbaka med ”Hello”.

Vad som är mest användbart för storytelling är våra normaliserade Trends-data. Det innebär att när vi tittar på sökintresset över tid för ett ämne, tittar vi på det intresset som en andel av alla sökningar på alla ämnen på Google vid den tiden och platsen. När vi tittar på det regionala sökintresset för ett ämne tittar vi på sökintresset för ämnet i en viss region som en andel av alla sökningar på alla ämnen på Google på samma plats och vid samma tidpunkt.

Om vi till exempel tittar på trenderna kring Bernie Sanders kan vi se att Vermont har det högsta sökintresset för den nuvarande senatorn. Detta beror på att Vermont av alla delstater har den högsta andelen sökningar på Sanders av alla sökningar i den delstaten. Om vi hade tittat på rådata i stället för normaliserade värden skulle vi ha sett större stater med högre befolkning stiga upp i toppen av rangordningen.

Den där normaliseringen är verkligen viktig: Antalet personer som söker på Google förändras ständigt – 2004 var sökvolymen mycket mindre än i dag, så obearbetade söksiffror skulle inte ge dig något sätt att jämföra sökningar då och nu. Genom att normalisera våra data kan vi få djupare insikter: jämföra olika datum, olika länder eller olika städer.

Kontexten för våra siffror spelar också roll. Vi indexerar våra data till 100, där 100 är det maximala sökintresset för den valda tiden och platsen. Det betyder att om vi tittar på sökintresset för valet 2016 sedan början av 2012, ser vi att mars 2016 hade det högsta sökintresset, med ett värde på 100.

Om vi tittar på sökintresset i endast mars 2016, kan vi dock se att den 16 mars har det högsta sökintresset, eftersom vi har indexerat om våra värden för just den månaden.

Hur sätter man siffrorna i sitt sammanhang?

Då data från Google Trends presenteras som ett index får vi ofta frågan: ”

Det finns några sätt att bedöma detta. Det första är att förstå det relativa sökintresset för ämnet jämfört med sig självt – eller vad vi skulle kalla en ”spik”.

När resultaten kom in för folkomröstningen om EU nyligen visade Google Trends vad folk var naturligt nyfikna på. Sökintresset för BBC:s David Dimblebys slips ökade kraftigt, och sökningarna på ”få ett irländskt pass” ökade också med 100 procent. Att förstå den procentuella ökningen av ett sökämne kan vara ett användbart sätt att förstå hur mycket intresset för ett ämne har ökat. Den procentuella ökningen baseras på ett ämnes ökning av sökintresset under en viss tidsperiod jämfört med föregående period.

Dessa ”toppar” är en plötslig ökning av sökintresset för ett ämne, jämfört med den vanliga sökvolymen. Vi vet att dessa är intressanta eftersom de ofta återspeglar vad som händer i den verkliga världen – det har till exempel skett en ökning av ansökningar om irländska pass i Storbritannien sedan omröstningen.

För att få en uppfattning om den relativa storleken kan vi lägga till ytterligare termer, vilket hjälper till att sätta sökintresset i perspektiv. Efter att Cleveland Cavaliers vann NBA-mästerskapet i år såg vi till exempel att Cavaliers spikade förbi Taylor Swift, ett ämne som har konstant hög sökvolym på Google. Detta hjälper oss att sätta in i ett sammanhang hur stor volymen kring sökfrågan ”Cavaliers” var när den ökade.

We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.

Huffington Post

Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.

Time

Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.

I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.

Lämna ett svar

Din e-postadress kommer inte publiceras.