What is Google Trends data – and what does it mean?

Simon Rogers

Follow

Jul 1, 2016 · 6 min read

A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.

The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.

So when a big news story happens, how can you best interpret this data?

What is Trends data?

Trends data is an unbiased sample of our Google search data. Są one anonimowe (nikt nie jest identyfikowany), skategoryzowane (określają temat zapytania) i zagregowane (łączą się w grupy). Dzięki temu możemy zmierzyć zainteresowanie konkretnym tematem w całym obszarze wyszukiwania, od całego świata po geografię na poziomie miasta.

Możesz to zrobić także Ty – darmowy eksplorator danych w Google Trends umożliwia wyszukiwanie konkretnego tematu w Google lub określonego zestawu wyszukiwanych haseł. Korzystając z tego narzędzia, można zobaczyć zainteresowanie tematem lub wyszukiwanym hasłem w czasie, gdzie jest ono najczęściej wyszukiwane lub czego jeszcze ludzie szukają w związku z nim.

Dane Trends można filtrować na dwa sposoby: w czasie rzeczywistym i nierzeczywistym. Czas rzeczywisty to losowa próbka wyszukiwań z ostatnich siedmiu dni, natomiast czas nierzeczywisty to kolejna losowa próbka pełnego zbioru danych Google, która może sięgać od 2004 do ~36 godzin wstecz. Wykresy będą pokazywać albo jedno albo drugie, ale nie oba razem, ponieważ są to dwie oddzielne próbki losowe. Bierzemy próbkę z trylionów wyszukiwań Google, ponieważ w przeciwnym razie byłoby to zbyt duże, aby szybko przetworzyć. Poprzez próbkowanie naszych danych, możemy spojrzeć na zbiór danych reprezentatywny dla wszystkich wyszukiwań Google, jednocześnie znajdując spostrzeżenia, które mogą być przetwarzane w ciągu kilku minut od zdarzenia w świecie rzeczywistym.

Jest to unikalny i potężny zbiór danych, który może uzupełniać inne, takie jak dane demograficzne ze spisu powszechnego, jak pokazano tutaj w Washington Post. Jako próbka, daje nam sposób na analizę tego, czego ludzie szukają w czasie rzeczywistym, w miarę rozwoju wydarzeń. Ale łączenie danych może być trudne – na przykład nie ma sensu porównywać Google Trends z innymi zbiorami danych Google, które są mierzone w różny sposób. Na przykład AdWords jest przeznaczony do wglądu w miesięczne i średnie wolumeny wyszukiwania, specjalnie dla reklamodawców, podczas gdy Google Trends ma na celu zgłębianie bardziej szczegółowych danych w czasie rzeczywistym.

Co oznaczają liczby?

Google Trends to potężne narzędzie do opowiadania historii, ponieważ pozwala nam zbadać znaczenie różnych momentów i to, jak ludzie na nie reagują. Możemy spojrzeć wstecz i porównać różne terminy ze sobą, na przykład jak różne dyscypliny sportowe uplasowały się w rankingu od 2004 roku. Możemy również wziąć pod uwagę całkowitą liczbę wyszukiwań dla danego wydarzenia, aby pomóc zrozumieć jego ogromną skalę. Kiedy opublikowaliśmy nasz 2015 Year in Search, okazało się, że było zdumiewająco ponad 439 milionów wyszukiwań w Google, kiedy Adele powróciła z utworem 'Hello’.

To, co jest najbardziej przydatne do opowiadania historii, to nasze znormalizowane dane Trends. Oznacza to, że kiedy patrzymy na zainteresowanie wyszukiwaniem w czasie dla danego tematu, patrzymy na to zainteresowanie jako odsetek wszystkich wyszukiwań na wszystkie tematy w Google w danym czasie i miejscu. Kiedy patrzymy na regionalne zainteresowanie wyszukiwaniem dla danego tematu, patrzymy na zainteresowanie wyszukiwaniem dla tego tematu w danym regionie jako odsetek wszystkich wyszukiwań na wszystkie tematy w Google w tym samym miejscu i czasie.

Na przykład, jeśli spojrzymy na trendy dotyczące Berniego Sandersa, możemy zobaczyć, że Vermont ma najwyższe zainteresowanie wyszukiwaniem obecnego senatora. Dzieje się tak dlatego, że spośród wszystkich stanów, Vermont ma najwyższy odsetek wyszukiwań dla Sandersa spośród wszystkich wyszukiwań w tym stanie. Gdybyśmy spojrzeli na surowe dane, a nie na znormalizowane wartości, zobaczylibyśmy większe stany z wyższą liczbą ludności na szczycie rankingu.

Ta normalizacja jest naprawdę ważna: liczba osób wyszukujących w Google zmienia się nieustannie – w 2004 roku wolumen wyszukiwania był znacznie mniejszy niż obecnie, więc surowe liczby wyszukiwań nie dałyby żadnego sposobu na porównanie wyszukiwań wtedy i teraz. Normalizując nasze dane, możemy dokonać głębszych spostrzeżeń: porównując różne daty, różne kraje lub różne miasta.

Kontekst naszych liczb również ma znaczenie. Indeksujemy nasze dane do 100, gdzie 100 to maksymalne zainteresowanie wyszukiwaniem dla wybranego czasu i lokalizacji. Oznacza to, że jeśli spojrzymy na zainteresowanie wyszukiwaniem wyborów w 2016 r. od początku 2012 r., zobaczymy, że marzec 2016 r. miał najwyższe zainteresowanie wyszukiwaniem, z wartością 100.

Jeśli spojrzymy na zainteresowanie wyszukiwaniami tylko w marcu 2016r, jednak, możemy zobaczyć, że 16 marca ma najwyższe zainteresowanie wyszukiwaniem, ponieważ przeindeksowaliśmy nasze wartości tylko dla tego miesiąca.

Jak umieścić liczby w kontekście?

Ponieważ dane Google Trends prezentowane są w formie indeksu, często otrzymujemy pytanie: „jak bardzo jest to ważne?”

Jest kilka sposobów, aby to ocenić. Pierwszym z nich jest zrozumienie względnego zainteresowania wyszukiwaniem danego tematu w porównaniu do niego samego – czyli tego, co nazywamy „spike”.

Podczas gdy pojawiły się wyniki ostatniego referendum w sprawie UE, Google Trends pokazało, co ludzi z natury ciekawiło. Zainteresowanie wyszukiwaniem krawata Davida Dimbleby’ego z BBC wzrosło, a osoby szukające „otrzymania irlandzkiego paszportu” również wzrosło o 100%. Zrozumienie procentowego wzrostu w wyszukiwanym temacie może być użytecznym sposobem zrozumienia, jak bardzo wzrosło zainteresowanie danym tematem. Ten procentowy wzrost jest oparty na wzroście zainteresowania tematem w określonym czasie w porównaniu do poprzedniego okresu.

Te „kolce” są nagłym przyspieszeniem zainteresowania tematem, w porównaniu do zwykłego wolumenu wyszukiwania. Wiemy, że są one interesujące, ponieważ często odzwierciedlają to, co dzieje się w świecie rzeczywistym – na przykład, od czasu głosowania w Wielkiej Brytanii wzrosła liczba wniosków o irlandzkie paszporty.

Aby uzyskać poczucie względnej wielkości, możemy dodać dodatkowe terminy, które pomagają umieścić zainteresowanie wyszukiwaniem w odpowiedniej perspektywie. Na przykład, po tym jak Cleveland Cavaliers zdobyli mistrzostwo NBA w tym roku, widzieliśmy jak Cavaliers wyprzedzili Taylor Swift, temat, który ma konsekwentnie wysoki wolumen wyszukiwania w Google. To pomaga umieścić w kontekście, jak duży wolumen wokół zapytania „Cavaliers” był, gdy spiked.

We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.

Huffington Post

Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.

Time

Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.

I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.