Netflix: Binging on the Algorithm

More than 80 per cent of the TV shows and movies people watch on Netflix are discovered through the platform’s recommendation system. That means when you think you are choosing what to watch on Netflix you are basically choosing from a number of decisions made by an algorithm.

Aug 2, 2018 · 7 min read

Netflix offers thousands of TV shows available for streaming. It recommends titles for each user. If you use Netflix you may have noticed they create reeeally precises genres: Romantic Dramas Where The Main Character is Left Handed. How do they come up with those genres? How to they deal with giving great recommendations to their 100 million-plus subscribers who are already used to getting recommendations from pretty much every platform they use? Uczenie maszynowe, algorytmy i kreatywność. To są ich magiczne sztuczki, które pomagają przełamać uprzedzenia widzów i znaleźć programy, o których oglądaniu mogliby nie pomyśleć. Dla tych, którzy wciąż próbują zrozumieć, czym jest algorytm, jest to zestaw instrukcji w bazie danych, który mówi Netflixowi, co ma robić.

System rekomendacji działa na zasadzie łączenia danych zebranych z różnych miejsc. Polecane wiersze są dopasowywane do Twoich nawyków oglądania. To dlatego jesteś w stanie rozpoznać, kiedy Twoi mali kuzyni używają Twojego konta do oglądania miliarda godzin Świnki Peppy. W tym przypadku algorytmy są często wykorzystywane do ułatwienia uczenia maszynowego. Systemy takie jak Netflix oparte na uczeniu maszynowym same się przepisują, ponieważ uczą się od swoich użytkowników. Za każdym razem, gdy wciskasz play i spędzasz trochę czasu na oglądaniu serialu lub filmu, Netflix zbiera dane, które informują algorytm i odświeżają go. Im więcej oglądasz, tym bardziej aktualny jest algorytm.

Zbierane dane są wieloaspektowe i złożone, ale obejmują o wiele więcej niż tylko przetwarzanie gatunku programu, który ogląda użytkownik i polecanie mu dramatów, romansów lub komedii. Todd Yellin, wiceprezes Netflixa ds. innowacji produktowych, powiedział Wired w 2017 roku: „to, co widzimy z tych profili, to następujące rodzaje danych – co ludzie oglądają, co oglądają po, co oglądają przed, co oglądali rok temu, co oglądali ostatnio i o jakiej porze dnia”. Doświadczenie Netflix jest napędzane przez szereg algorytmów uczenia maszynowego: ranking, wyszukiwanie, podobieństwo, oceny i inne. Netflix nie może zaoferować całego swojego katalogu na raz, więc musi go selekcjonować. Ponieważ jakość i gust rzadko są tym samym, Netflix nie może działać jak Rotten Tomatoes, Pitchfork czy IMDb, musi znać swoich użytkowników i otrzymywać rekomendacje dopasowane do każdego z nich.

Ewolucja naszego podejścia do personalizacji.

Netflix działa w oparciu o grupy gustów. Każdy widz należy do wielu grup, a te wpływają na to, jakie rekomendacje wyskakują na górze każdego interfejsu ekranowego, które rzędy gatunków są wyświetlane i jak każdy rząd jest zorganizowany. Jeśli Twoje wzorce oglądania są podobne do wzorców innego użytkownika, Netflix wyświetli rekomendacje oparte na zachowaniu tego innego użytkownika.

Znaczniki, które są używane w algorytmach uczenia maszynowego, są takie same na całym świecie. Netflix zatrudnił prawdziwych ludzi, którzy kategoryzują każdy program telewizyjny i film, a następnie oznaczają każdy z nich, aby stworzyć niespecyficzne mikro-gatunki, takie jak „Uderzające wizualnie nostalgiczne dramaty” lub „Podkreślone romantyczne filmy z podróży”.

Każdy z tych czynników danych łączy się, aby określić, do której grupy gustów pasuje użytkownik. Ekran każdego użytkownika jest zapełniany – z lewej, prawej i od góry do dołu – na podstawie tego, do której grupy należy.

Ważność emocjonalna modelowania nawigacji. Użytkownicy chętniej skanują w pionie niż w poziomie.

Why Rows Anyway?

Chris Alvino, Machine Learning Engineer w Netflixie, wyjaśnia, że wybrali rzędy, aby ułatwić użytkownikom poruszanie się po dużej części katalogu. Przedstawiając spójne grupy filmów w rzędzie, nadając każdemu rzędowi sensowną nazwę i prezentując rzędy w użytecznej kolejności, członkowie mogą szybko zdecydować, czy cały zestaw filmów w rzędzie może zawierać coś, co ich interesuje w danym momencie. Dzięki temu użytkownicy mogą albo zanurzyć się głębiej i poszukać więcej filmów w danym temacie, albo pominąć je i spojrzeć na inny wiersz.

Każde urządzenie ma inne możliwości sprzętowe, które mogą ograniczać liczbę wierszy wyświetlanych w danym momencie i wielkość całej strony, dlatego Netflix musi być świadomy ograniczeń każdego urządzenia.

Każdy wiersz może oferować unikalny i spersonalizowany wycinek katalogu, po którym użytkownik może się poruszać. Częścią wyzwania stojącego przed Netflixem jest stworzenie użytecznych grup filmów, aby podkreślić głębię katalogu i pomóc użytkownikom nie tylko wzmocnić swoje obszary zainteresowań, ale także znaleźć nowe. Rekomendacje powinny być świeże i responsywne, ale również stabilne, tak aby użytkownicy znali swoją stronę główną i mogli łatwo znaleźć filmy, które były im polecane w przeszłości.

Możliwy rząd tytułów, które mogą być oglądane przez jedną z postaci Netflixa.

Obraz jest wart tysiąca słów

Netflix wdrożył niedawno nowy algorytm rekomendacji oparty na dziełach sztuki. Serwuje on swoim abonentom unikalne obrazy dostosowane do ich potrzeb. Te obrazy są specjalnie zaprojektowane, aby zatrzymać Cię w Netflixie. Bierze on pod uwagę wiele z tych samych czynników danych, o których wspomnieliśmy.

Gopal Krishnan wyjaśnił wszystko na temat tego nowego algorytmu w swoim technicznym wpisie na blogu. Netflix pracuje nad stworzeniem ram, które pozwolą im skutecznie połączyć big data z kreatywnością, pomagając użytkownikom szybciej odkrywać programy i filmy, które im się spodobają i zapobiegać przytłoczeniu ich ogromnym katalogiem Netflixa. W wyniku tych badań mają teraz unikalną możliwość zrozumienia, które obrazy działają najlepiej dla każdego użytkownika.

Mówią, że jeśli nie uda im się przykuć uwagi użytkownika w ciągu 90 sekund, prawdopodobnie straci on zainteresowanie i przejdzie do innej czynności. Mając tak krótki czas na zdobycie zainteresowania, obrazy stają się najbardziej efektywnym i przekonującym sposobem, aby użytkownicy odkryli idealny tytuł tak szybko, jak to możliwe.

Strona główna Netflixa bez grafiki. Tak historycznie wyglądały strony naszych algorytmów rekomendacji.

Zbudowali system, który testuje zestaw obrazów dla wielu tytułów z ich katalogu, pomagając w wyświetlaniu atrakcyjnego obrazu, aby zwiększyć zaangażowanie. Dzięki wielu eksperymentom i testom, Netflix doszedł do wniosku, że zobaczenie pewnego zakresu emocji faktycznie zmusza ludzi do oglądania programu telewizyjnego lub filmu. Prawdopodobnie wynika to z faktu, że złożone emocje przekazują użytkownikom wiele informacji na temat tonu lub nastroju treści, ale interesujące jest, aby zobaczyć, jak wielu użytkowników rzeczywiście reaguje w ten sposób podczas testów. Przykładem tego jest ostatni zwycięski obraz („zwycięski” oznacza, że spowodował największe zaangażowanie) dla drugiego sezonu Unbreakable Kimmy Schmidtbelow:

That winning image is the one that would work best for a majority of Netflix users. But they have pushed even further and given the enormous diversity in taste and preferences, they decided to put together different artwork for each user to highlight the aspects of a show or movie that are relevant to them.

Artwork for Stranger Things. Different images cover a breadth of themes in the show to go beyond what any single image portrays.

In order to choose which image each user has on their feed, Netflix focuses on what other shows and movies users have been watching. For example, a member who watches many movies featuring Uma Thurman would likely respond positively to the artwork for Pulp Fiction that contains Uma. Meanwhile, a fan of John Travolta may be more interested in watching Pulp Fiction if the artwork features John.

Not all the scenarios for personalizing artwork are this clear and obvious but data does all the work in order to choose the artwork for each user and improve the Netflix experience (and keep users binging, of course).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.