What is Google Trends data – and what does it mean?

Simon Rogers

Follow

Jul 1, 2016 · 6 min read

A little more than a year ago, we made Google Trends data available in real time; and increasingly, it’s helping people around the world explore the global reaction to major events.

The vast amount of searches — trillions take place every year — make Google Trends one of the world’s largest real time datasets. Examining what people search for provides a unique perspective on what they are currently interested in and curious about.

So when a big news story happens, how can you best interpret this data?

What is Trends data?

Trends data is an unbiased sample of our Google search data. Jsou anonymizovaná (nikdo není osobně identifikován), kategorizovaná (určují téma vyhledávacího dotazu) a agregovaná (seskupená). To nám umožňuje měřit zájem o určité téma napříč vyhledáváním, a to z celého světa až po geografickou úroveň města.

Můžete to udělat i vy – bezplatný průzkumník dat na Google Trends vám umožní vyhledat určité téma na Googlu nebo určitou sadu vyhledávacích výrazů. Pomocí tohoto nástroje si můžete prohlédnout zájem o dané téma nebo hledaný výraz v čase, kde je nejvyhledávanější nebo co dalšího lidé v souvislosti s ním hledají.

Data Trends lze filtrovat dvěma způsoby: v reálném čase a mimo reálný čas. V reálném čase jde o náhodný vzorek vyhledávání za posledních sedm dní, zatímco v nereálném čase jde o další náhodný vzorek z celého souboru dat Google, který může sahat od roku 2004 až po dobu ~36 hodin zpět. V grafech se zobrazí buď jedno, nebo druhé, ale ne obojí dohromady, protože se jedná o dva samostatné náhodné vzorky. Vybíráme vzorek z bilionů vyhledávání Google, protože jinak by byl příliš velký na rychlé zpracování. Díky vzorkování našich dat se můžeme podívat na soubor dat reprezentativní pro všechna vyhledávání v Googlu a zároveň najít poznatky, které lze zpracovat během několika minut poté, co se v reálném světě stane nějaká událost.

Jedná se o jedinečný a výkonný soubor dat, který může doplnit jiné, například demografické údaje ze sčítání lidu, jak ukazuje tento článek v deníku Washington Post. Jako ukázka nám dává možnost analyzovat, co lidé hledají v reálném čase, jak se události vyvíjejí. Kombinování dat však může být ošemetné – například nemá smysl porovnávat Google Trends s jinými soubory dat společnosti Google, které jsou měřeny různými způsoby. Například služba AdWords je určena k nahlédnutí do měsíčních a průměrných objemů vyhledávání, konkrétně pro inzerenty, zatímco služba Google Trends je určena k hlubšímu pronikání do podrobnějších dat v reálném čase.

Co čísla znamenají?

Trendy Google jsou mocným nástrojem pro vyprávění příběhů, protože nám mohou umožnit prozkoumat velikost různých okamžiků a to, jak lidé na tyto okamžiky reagují. Můžeme se podívat zpět a porovnávat různé pojmy mezi sebou, například jak se různé sporty umístily od roku 2004. Můžeme také vzít v úvahu celkový počet vyhledávání určité události, což nám pomůže pochopit její obrovský rozsah. Když jsme vydali naši publikaci Rok 2015 ve vyhledávání, zjistili jsme, že když se Adele vrátila s písní „Hello“, bylo na Googlu překvapivě více než 439 milionů vyhledávání.

Pro vyprávění příběhů jsou nejužitečnější naše normalizovaná data Trends. To znamená, že když se díváme na zájem o vyhledávání určitého tématu v průběhu času, sledujeme tento zájem jako podíl všech vyhledávání všech témat na Googlu v daném čase a místě. Když se díváme na regionální zájem o vyhledávání určitého tématu, díváme se na zájem o toto téma v daném regionu jako na podíl všech vyhledávání všech témat na Googlu ve stejném místě a čase.

Podíváme-li se například na Trendy kolem Bernieho Sanderse, vidíme, že největší zájem o současného senátora má Vermont. Je to proto, že ze všech států má Vermont nejvyšší procento vyhledávání Sanderse ze všech vyhledávání v tomto státě. Kdybychom se podívali na hrubá data, a ne na normalizované hodnoty, viděli bychom, že se na předních místech žebříčku objevují větší státy s vyšším počtem obyvatel.

Tato normalizace je opravdu důležitá: Počet lidí hledajících na Googlu se neustále mění – v roce 2004 byl objem vyhledávání mnohem menší než dnes, takže hrubá čísla vyhledávání by vám neposkytla žádný způsob, jak porovnat vyhledávání tehdy a dnes. Normalizací dat můžeme získat hlubší poznatky: porovnávat různá data, různé země nebo různá města.

Záleží také na kontextu našich čísel. Naše data indexujeme do 100, kde 100 je maximální zájem o vyhledávání ve zvoleném čase a místě. To znamená, že pokud se podíváme na zájem o vyhledávání ve volbách v roce 2016 od začátku roku 2012, zjistíme, že v březnu 2016 byl zájem o vyhledávání nejvyšší, a to s hodnotou 100.

Podíváme-li se na zájem o vyhledávání pouze v březnu 2016, však vidíme, že 16. březen má nejvyšší zájem o vyhledávání, protože jsme přeindexovali naše hodnoty pouze pro tento měsíc.

Jak tato čísla zasadit do kontextu?

Protože jsou data Google Trends prezentována jako index, často dostáváme otázku: „

Existuje několik způsobů, jak to posoudit. Prvním z nich je pochopení relativního zájmu o vyhledávání daného tématu ve srovnání se sebou samým – neboli to, co bychom nazvali „spike“.

Když přišly výsledky nedávného referenda o EU, Google Trends ukázal, na co byli lidé ve své podstatě zvědaví. Zájem o vyhledávání kravaty Davida Dimblebyho z BBC prudce vzrostl a o 100 % vzrostl také zájem lidí hledajících „získání irského pasu“. Pochopení procentuálního nárůstu vyhledávaného tématu může být užitečným způsobem, jak pochopit, jak velký je nárůst zájmu o dané téma. Tento procentuální nárůst vychází z nárůstu zájmu o téma ve vyhledávání za určité časové období ve srovnání s předchozím obdobím.

Tyto „špičky“ představují náhlé zrychlení zájmu o téma ve srovnání s obvyklým objemem vyhledávání. Víme, že jsou zajímavé, protože často odrážejí to, co se děje ve skutečném světě – například po hlasování došlo ve Spojeném království k nárůstu žádostí o irské pasy.

Abychom získali představu o relativní velikosti, můžeme přidat další výrazy, které pomohou tento zájem o vyhledávání uvést na pravou míru. Například poté, co Cleveland Cavaliers letos vyhráli mistrovství NBA, jsme viděli, že Cavaliers prudce překonali Taylor Swift, což je téma, které má na Googlu trvale vysoký objem vyhledávání. To pomáhá dát do souvislosti, jak velký byl objem kolem vyhledávacího dotazu „Cavaliers“, když došlo k jeho prudkému nárůstu.

We’ve seen lots of reporters use this approach. In the aftermath of the Oregon shooting, Huffington Post saw that search interest in gun control spiked above search interest in gun shop. By looking at this data in the year leading up to the tragedy, they found that this was a pattern for other recent shootings in America.

Huffington Post

Looking at related searches can also help to understand conditions that might be driving spikes in Google Trends. During its annual Person of the Year special, TIME looked back at search interest around each of the candidates. To understand the context around each spike, TIME highlighted the related searches to each topic when it spiked in search to gain a better sense of what drove people’s curiosity at that moment in time.

Time

Trends data can provide a powerful lens into what Google users are curious about and how people around the world react to important events. We’re committed to making Trends easier to use, understand and share. We look forward to continuing the conversation.

I am Data Editor at Google’s News Lab. To get the most recent updates from the team, follow our new Medium publication here.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.