What is Google Trends data – and what does it mean?

Simon Rogers

Follow

Jul 1, 2016 · 6 min read

A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.

The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.

So when a big news story happens, how can you best interpret this data?

What is Trends data?

Trends data is an unbiased sample of our Google search data. Elles sont anonymes (personne n’est identifié personnellement), catégorisées (déterminant le sujet d’une requête de recherche) et agrégées (regroupées). Cela nous permet de mesurer l’intérêt pour un sujet particulier à travers les recherches, dans le monde entier, jusqu’à la géographie au niveau de la ville.

Vous pouvez le faire aussi – l’explorateur de données gratuit sur Google Trends vous permet de rechercher un sujet particulier sur Google ou un ensemble spécifique de termes de recherche. Utilisez l’outil et vous pourrez voir l’intérêt des recherches pour un sujet ou un terme de recherche au fil du temps, où il est le plus recherché, ou ce que les gens recherchent d’autre en rapport avec ce sujet.

Il existe deux façons de filtrer les données de Trends : en temps réel et en temps non réel. Le temps réel est un échantillon aléatoire de recherches des sept derniers jours, tandis que le temps non réel est un autre échantillon aléatoire de l’ensemble des données Google qui peut remonter n’importe où entre 2004 et ~36 heures auparavant. Les graphiques vous montreront l’un ou l’autre, mais pas les deux ensemble, car il s’agit de deux échantillons aléatoires distincts. Nous prenons un échantillon des milliers de milliards de recherches Google, car il serait autrement trop volumineux pour être traité rapidement. En échantillonnant nos données, nous pouvons examiner un ensemble de données représentatif de toutes les recherches Google, tout en trouvant des idées qui peuvent être traitées dans les minutes qui suivent un événement dans le monde réel.

C’est un ensemble de données unique et puissant, qui peut en compléter d’autres, comme les données démographiques du recensement, comme le montre ici le Washington Post. En tant qu’échantillon, il nous donne un moyen d’analyser ce que les gens recherchent en temps réel, à mesure que les événements se déroulent. Mais la combinaison des données peut s’avérer délicate. Par exemple, il n’est pas judicieux de comparer Google Trends à d’autres ensembles de données Google, qui sont mesurés de différentes manières. Par exemple, AdWords est destiné à donner un aperçu des volumes de recherche mensuels et moyens, spécifiquement pour les annonceurs, tandis que Google Trends est conçu pour creuser davantage dans des données plus granulaires en temps réel.

Que signifient les chiffres ?

Google Trends est un outil puissant pour le storytelling car il peut nous permettre d’explorer l’ampleur de différents moments et la façon dont les gens réagissent à ces moments. Nous pouvons regarder en arrière et comparer différents termes les uns par rapport aux autres, comme le classement de différents sports depuis 2004. Nous pouvons également prendre le nombre total de recherches pour un événement afin de mieux comprendre son ampleur. Lorsque nous avons publié notre 2015 Year in Search, nous avons constaté qu’il y avait étonnamment plus de 439 millions de recherches sur Google lorsque Adele est revenue avec ‘Hello’.

Ce qui est le plus utile pour le storytelling, ce sont nos données Trends normalisées. Cela signifie que lorsque nous examinons l’intérêt de recherche au fil du temps pour un sujet, nous examinons cet intérêt en tant que proportion de toutes les recherches sur tous les sujets sur Google à ce moment et à cet endroit. Lorsque nous examinons l’intérêt de recherche régional pour un sujet, nous examinons l’intérêt de recherche pour ce sujet dans une région donnée en tant que proportion de toutes les recherches sur tous les sujets sur Google à ce même endroit et à ce même moment.

Par exemple, si nous examinons les tendances autour de Bernie Sanders, nous pouvons voir que le Vermont a l’intérêt de recherche le plus élevé pour le sénateur actuel. Cela s’explique par le fait que, de tous les États, le Vermont a le pourcentage le plus élevé de recherches pour Sanders sur l’ensemble des recherches effectuées dans cet État. Si nous avions examiné les données brutes plutôt que les valeurs normalisées, nous aurions vu des États plus grands et plus peuplés se hisser au sommet des classements.

Cette normalisation est vraiment importante : Le nombre de personnes effectuant des recherches sur Google évolue constamment. En 2004, le volume de recherche était beaucoup plus faible qu’aujourd’hui, de sorte que les chiffres de recherche bruts ne vous permettraient pas de comparer les recherches d’hier et d’aujourd’hui. En normalisant nos données, nous pouvons faire des observations plus approfondies : comparer différentes dates, différents pays ou différentes villes.

Le contexte de nos chiffres a également son importance. Nous indexons nos données à 100, où 100 est l’intérêt de recherche maximum pour le moment et le lieu sélectionnés. Cela signifie que si nous examinons l’intérêt de recherche pour les élections de 2016 depuis le début de 2012, nous verrons que mars 2016 a eu l’intérêt de recherche le plus élevé, avec une valeur de 100.

Si nous examinons l’intérêt de recherche uniquement en mars 2016, cependant, nous pouvons voir que le 16 mars a l’intérêt de recherche le plus élevé, parce que nous avons réindexé nos valeurs pour ce mois seulement.

Comment remettre ces chiffres dans leur contexte ?

Parce que les données de Google Trends sont présentées sous forme d’index, on nous pose souvent la question :  » quelle est l’importance de ces données ? « 

Il y a plusieurs façons d’évaluer cela. La première consiste à comprendre l’intérêt relatif des recherches pour le sujet par rapport à lui-même – ou ce que nous appellerions un « pic ».

Alors que les résultats sont arrivés pour le récent référendum sur l’UE, Google Trends a montré ce pour quoi les gens étaient intrinsèquement curieux. L’intérêt des recherches pour la cravate de David Dimbleby de la BBC a connu un pic, et les personnes recherchant « obtenir un passeport irlandais » ont également bondi de 100 %. Comprendre le pourcentage d’augmentation d’un sujet de recherche peut être un moyen utile de comprendre l’augmentation de l’intérêt pour un sujet. Ce pourcentage d’augmentation est basé sur la croissance de l’intérêt de recherche d’un sujet sur une période de temps distincte par rapport à la période précédente.

Ces « pics » sont une accélération soudaine de l’intérêt de recherche pour un sujet, par rapport au volume de recherche habituel. Nous savons qu’ils sont intéressants car ils reflètent souvent ce qui se passe dans le monde réel – il y a eu une augmentation des demandes de passeports irlandais au Royaume-Uni depuis le vote, par exemple.

Pour avoir une idée de la taille relative, nous pouvons ajouter des termes supplémentaires, ce qui aide à mettre cet intérêt de recherche en perspective. Par exemple, après que les Cleveland Cavaliers ont remporté le championnat NBA cette année, nous avons vu les Cavaliers dépasser Taylor Swift, un sujet qui a constamment un volume de recherche élevé sur Google. Cela permet de mettre en contexte l’importance du volume autour de la requête de recherche « Cavaliers » au moment du pic.

We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.

Huffington Post

Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.

Time

Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.

I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.