Netflix: Binging on the Algorithm

More than 80 per cent of the TV shows and movies people watch on Netflix are discovered through the platform’s recommendation system. That means when you think you are choosing what to watch on Netflix you are basically choosing from a number of decisions made by an algorithm.

Aug 2, 2018 · 7 min read

Netflix offers thousands of TV shows available for streaming. It recommends titles for each user. If you use Netflix you may have noticed they create reeeally precises genres: Romantic Dramas Where The Main Character is Left Handed. How do they come up with those genres? How to they deal with giving great recommendations to their 100 million-plus subscribers who are already used to getting recommendations from pretty much every platform they use? Strojové učení, algoritmy a kreativita. To jsou jejich kouzelné triky, které jim pomáhají rozbít zažité představy diváků a najít pořady, které by je možná původně nenapadlo sledovat. Pro ty, kteří se stále snaží přijít na to, co je to algoritmus, je to v podstatě soubor instrukcí založených na databázi, který Netflixu říká, co má dělat.

Doporučovací systém funguje tak, že dává dohromady data shromážděná z různých míst. Doporučené řádky jsou přizpůsobeny vašim zvyklostem při sledování. Proto poznáte, když vaši malí bratranci a sestřenice používají váš účet ke sledování miliardy hodin seriálu Prasátko Peppa. V tomto případě se často používají algoritmy, které usnadňují strojové učení. Systémy jako Netflix založené na strojovém učení se samy přepisují, protože se učí od vlastních uživatelů. Pokaždé, když stisknete tlačítko play a strávíte nějaký čas sledováním televizního pořadu nebo filmu, Netflix shromažďuje data, která slouží jako informace pro algoritmus a obnovuje je. Čím více se díváte, tím je algoritmus aktuálnější.

Sbíraná data jsou mnohotvárná a komplexní, ale zahrnují mnohem více než jen zpracování žánru programu, který uživatel sleduje, a doporučují mu dramata, romance nebo komedie. Todd Yellin, viceprezident společnosti Netflix pro produktové inovace, řekl v roce 2017 časopisu Wired: „to, co z těchto profilů vidíme, jsou následující druhy údajů – co lidé sledují, co sledují po, co sledovali před, co sledovali před rokem, co sledovali nedávno a v jakou denní dobu“. Práci s Netflixem řídí řada algoritmů strojového učení: řazení, vyhledávání, podobnost, hodnocení a další. Nemohou nabídnout celý svůj katalog najednou, takže ho musí kurátorovat. Protože kvalita a vkus jsou málokdy totéž, nemůže Netflix fungovat jako Rotten Tomatoes, Pitchfork nebo IMDb, musí znát své uživatele a dostávat doporučení šitá na míru každému jednotlivci.

Vývoj našeho přístupu k personalizaci.

Netflix pracuje s vkusovými skupinami. Každý divák se vejde do několika skupin a ty ovlivňují, jaká doporučení se objeví v horní části každého rozhraní na obrazovce, které žánrové řady se zobrazí a jak jsou jednotlivé řady uspořádány. Pokud jsou vaše vzorce sledování podobné jako u jiného uživatele, Netflix vám bude servírovat doporučení na základě chování i tohoto jiného uživatele.

Tagy, které se používají pro algoritmy strojového učení, jsou na celém světě stejné. Netflix si najal skutečné lidi, kteří kategorizují každý kousek televizních pořadů a filmů a na každý z nich aplikují tagy, aby vytvořili hyperspecifické mikrožánry, jako například „Vizuálně působivá nostalgická dramata“ nebo „Nenápadné romantické roadtripy“.

Každý z těchto datových faktorů dohromady určí, do které vkusové skupiny patříte. Obrazovka každého uživatele se zaplní – zleva, zprava a shora dolů – podle toho, do které skupiny patří.

Návaznost navigačního modelování. Členové častěji skenují vertikálně než horizontálně.

Proč vlastně řádky?

Chris Alvino, inženýr strojového učení ve společnosti Netflix, vysvětluje, že řádky volí proto, aby členům usnadnili navigaci ve velké části katalogu. Díky prezentaci ucelených skupin videí v řadě, poskytnutí smysluplného názvu pro každou řadu a prezentaci řad v užitečném pořadí se členové mohou rychle rozhodnout, zda celá sada videí v řadě pravděpodobně obsahuje něco, co mají zájem sledovat právě v tomto okamžiku. To členům umožňuje buď se ponořit hlouběji a vyhledat další videa v tématu, nebo je přeskočit a podívat se na jinou řadu.

Každé zařízení má jiné hardwarové možnosti, které mohou omezit počet zobrazených řádků v daném okamžiku a velikost celé stránky to je důvod, proč si Netflix musí být vědom omezení každého zařízení.

Každý řádek může uživateli nabídnout jedinečný a personalizovaný výsek katalogu, kterým se může pohybovat. Součástí úkolu společnosti Netflix je vytvořit užitečná seskupení videí s cílem zdůraznit hloubku katalogu a pomoci členům nejen posílit oblasti jejich zájmu, ale také najít nové. Doporučení by měla být svěží a pohotová, ale také stabilní, aby lidé znali svou domovskou stránku a mohli snadno najít videa, která jim byla doporučena v nedávné minulosti.

Možná řada titulů, které by mohla sledovat některá z postav služby Netflix.

Obrázek je hoden tisíce slov

Netflix nedávno implementoval nový doporučovací algoritmus založený na uměleckých dílech. Svým předplatitelům servíruje jedinečné obrázky na míru. Tyto obrázky jsou speciálně navrženy tak, aby vás u Netflixu udržely. Bere v úvahu mnoho stejných datových faktorů, o kterých jsme se zmínili.

Gopal Krishnan vysvětlil vše o tomto novém algoritmu ve svém technickém příspěvku na blogu. Netflix pracuje na vytvoření rámce, který mu umožní efektivně propojit velká data s kreativitou a pomůže uživatelům rychleji objevit pořady a filmy, které se jim budou líbit, a zabrání tomu, aby byli zahlceni OBROVSKÝM katalogem Netflixu. Výsledkem tohoto zkoumání je nyní jedinečná schopnost pochopit, které snímky na každého uživatele nejlépe fungují.

Říkají, že pokud uživatele nezaujmou do 90 sekund, pravděpodobně ztratí zájem a přejde k jiné činnosti. Vzhledem k tak krátkému času na upoutání zájmu se obrázky stávají nejefektivnějším a nejpřesvědčivějším způsobem, jak uživatele co nejrychleji přimět k objevení dokonalého titulu.

Hlavní stránka Netflixu bez obrázků. Takto historicky viděly stránku naše doporučovací algoritmy.

Vytvořili systém, který testuje sadu obrázků pro mnoho titulů v jejich katalogu a pomáhá zobrazit přesvědčivý obrázek, který zvyšuje angažovanost. Prostřednictvím mnoha experimentů a testů dospěla společnost Netflix k závěru, že zobrazení určité škály emocí skutečně nutí lidi ke sledování televizního pořadu nebo filmu. Je to pravděpodobně způsobeno tím, že komplexní emoce zprostředkovávají uživatelům množství informací týkajících se tónu nebo pocitu z obsahu, ale je zajímavé sledovat, kolik členů skutečně takto při testování reaguje. Příklad je vidět na nedávném vítězném snímku („vítězný“ znamená, že vyvolal největší zapojení) pro druhou sezónu seriálu Unbreakable Kimmy Schmidtbelow:

That winning image is the one that would work best for a majority of Netflix users. But they have pushed even further and given the enormous diversity in taste and preferences, they decided to put together different artwork for each user to highlight the aspects of a show or movie that are relevant to them.

Artwork for Stranger Things. Different images cover a breadth of themes in the show to go beyond what any single image portrays.

In order to choose which image each user has on their feed, Netflix focuses on what other shows and movies users have been watching. For example, a member who watches many movies featuring Uma Thurman would likely respond positively to the artwork for Pulp Fiction that contains Uma. Meanwhile, a fan of John Travolta may be more interested in watching Pulp Fiction if the artwork features John.

Not all the scenarios for personalizing artwork are this clear and obvious but data does all the work in order to choose the artwork for each user and improve the Netflix experience (and keep users binging, of course).

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.