What is Google Trends data – and what does it mean?

Simon Rogers

Follow

Jul 1, 2016 · 6 min read

A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.

The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.

So when a big news story happens, how can you best interpret this data?

What is Trends data?

Trends data is an unbiased sample of our Google search data. Het is geanonimiseerd (niemand wordt persoonlijk geïdentificeerd), gecategoriseerd (het bepalen van het onderwerp voor een zoekopdracht) en geaggregeerd (gegroepeerd). Dit stelt ons in staat de belangstelling voor een bepaald onderwerp te meten, wereldwijd en tot op stadsniveau.

U kunt het ook doen – met de gratis dataverkenner op Google Trends kunt u zoeken naar een bepaald onderwerp op Google of een specifieke set zoektermen. Gebruik de tool en je kunt zien interesse in een onderwerp of zoekterm in de tijd, waar het meest gezocht, of wat mensen zoeken nog meer in verband met het.

Er zijn twee manieren om de Trends gegevens te filteren: real time en niet-real time. Reële tijd is een willekeurige steekproef van zoekopdrachten van de laatste zeven dagen, terwijl niet-reële tijd een andere willekeurige steekproef is van de volledige Google-dataset die terug kan gaan van 2004 tot ~36 uur geleden. De grafieken tonen u het een of het ander, maar niet beide samen, omdat dit twee afzonderlijke willekeurige steekproeven zijn. Wij nemen een steekproef van de triljoenen Google-zoekopdrachten, omdat die anders te groot zou zijn om snel te verwerken. Door onze gegevens te samplen, kunnen we kijken naar een dataset die representatief is voor alle Google-zoekopdrachten, terwijl we inzichten vinden die kunnen worden verwerkt binnen enkele minuten nadat een gebeurtenis in de echte wereld heeft plaatsgevonden.

Het is een unieke en krachtige dataset, die een aanvulling kan vormen op andere, zoals demografische gegevens uit de volkstelling, zoals hier te zien is in de Washington Post. Als voorbeeld geeft het ons een manier om te analyseren waar mensen naar zoeken in real time terwijl de gebeurtenissen zich ontvouwen. Maar het combineren van gegevens kan lastig zijn – het heeft bijvoorbeeld geen zin Google Trends te vergelijken met andere datasets van Google, die op verschillende manieren worden gemeten. AdWords is bijvoorbeeld bedoeld voor inzicht in maandelijkse en gemiddelde zoekvolumes, specifiek voor adverteerders, terwijl Google Trends is ontworpen om verder te graven in meer granulaire gegevens in realtime.

Wat betekenen de cijfers?

Google Trends is een krachtig hulpmiddel voor storytelling omdat het ons in staat stelt de omvang van verschillende momenten te onderzoeken en hoe mensen op die momenten reageren. We kunnen terugkijken en verschillende termen met elkaar vergelijken, zoals de rangschikking van verschillende sporten sinds 2004. We kunnen ook het totale aantal zoekopdrachten voor een evenement bekijken om de enorme omvang ervan te begrijpen. Toen we ons Jaar in Search 2015 publiceerden, ontdekten we dat er meer dan 439 miljoen zoekopdrachten op Google waren toen Adele terugkwam met ‘Hello’.

Wat het handigst is voor storytelling, zijn onze genormaliseerde Trends-gegevens. Dit betekent dat wanneer we kijken naar de zoekinteresse in de tijd voor een onderwerp, we kijken naar die interesse als een deel van alle zoekopdrachten op alle onderwerpen op Google op dat moment en op die locatie. Als we kijken naar regionale zoekinteresse voor een onderwerp, kijken we naar de zoekinteresse voor dat onderwerp in een bepaalde regio als aandeel van alle zoekopdrachten op alle onderwerpen op Google in diezelfde plaats en tijd.

Als we bijvoorbeeld kijken naar de Trends rond Bernie Sanders, kunnen we zien dat Vermont de hoogste zoekinteresse heeft in de huidige senator. Dit komt omdat van alle staten, Vermont het hoogste percentage zoekopdrachten voor Sanders heeft van alle zoekopdrachten in die staat. Als we hadden gekeken naar ruwe gegevens in plaats van genormaliseerde waarden, zouden we hebben gezien grotere staten met een hogere bevolking stijgen naar de top van de gelederen.

Die normalisering is echt belangrijk: het aantal mensen dat op Google zoekt, verandert voortdurend – in 2004 was het zoekvolume veel kleiner dan nu, dus met ruwe zoekcijfers zou je de zoekopdrachten van toen en nu niet kunnen vergelijken. Door onze gegevens te normaliseren, kunnen we diepere inzichten krijgen: door verschillende data, verschillende landen of verschillende steden te vergelijken.

De context van onze cijfers is ook van belang. We indexeren onze gegevens op 100, waarbij 100 de maximale zoekinteresse is voor de geselecteerde tijd en locatie. Dat betekent dat als we kijken naar de zoekinteresse in de verkiezingen van 2016 sinds het begin van 2012, we zullen zien dat maart 2016 de hoogste zoekinteresse had, met een waarde van 100.

Als we kijken naar de zoekinteresse in alleen maart 2016, kunnen we echter zien dat 16 maart de hoogste zoekinteresse heeft, omdat we onze waarden voor alleen die maand opnieuw hebben geïndexeerd.

Hoe plaats je de getallen in de juiste context?

Omdat Google Trends-gegevens worden gepresenteerd als een index, krijgen we vaak de vraag: “hoe belangrijk is dit?”

Er zijn een paar manieren om dit te beoordelen. De eerste is inzicht in de relatieve zoekinteresse in het onderwerp in vergelijking met zichzelf – of wat wij een “piek” zouden noemen.

Toen de resultaten voor het recente EU-referendum binnenkwamen, liet Google Trends zien waar mensen van nature nieuwsgierig naar waren. De belangstelling voor de stropdas van David Dimbleby van de BBC piekte, en mensen die zochten naar “een Iers paspoort krijgen” stegen ook met 100%. Inzicht in de procentuele toename van een zoekonderwerp kan een nuttige manier zijn om te begrijpen hoe sterk de belangstelling voor een onderwerp is toegenomen. Deze procentuele toename is gebaseerd op de groei van de belangstelling voor een onderwerp gedurende een bepaalde periode ten opzichte van de voorgaande periode.

Deze “pieken” zijn een plotselinge versnelling van de belangstelling voor een onderwerp, vergeleken met het gebruikelijke zoekvolume. We weten dat deze interessant zijn, omdat ze vaak een afspiegeling zijn van wat er in de echte wereld gebeurt – er is bijvoorbeeld een stijging in het aantal aanvragen voor Ierse paspoorten in het Verenigd Koninkrijk sinds de stemming.

Om een gevoel van relatieve omvang te krijgen, kunnen we extra termen toevoegen, wat helpt om die zoekinteresse in perspectief te plaatsen. Bijvoorbeeld, nadat de Cleveland Cavaliers de NBA kampioenschappen wonnen dit jaar, zagen we de Cavaliers voorbij Taylor Swift komen, een onderwerp dat consequent een hoog zoekvolume heeft op Google. Dit helpt zet in de context hoe groot het volume rond de “Cavaliers” zoekopdracht was toen het piekte.

We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.

Huffington Post

Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.

Time

Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.

I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.