Netflix: Binging on the Algorithm

More than 80 per cent of the TV shows and movies people watch on Netflix are discovered through the platform’s recommendation system. That means when you think you are choosing what to watch on Netflix you are basically choosing from a number of decisions made by an algorithm.

Aug 2, 2018 · 7 min read

Netflix offers thousands of TV shows available for streaming. It recommends titles for each user. If you use Netflix you may have noticed they create reeeally precises genres: Romantic Dramas Where The Main Character is Left Handed. How do they come up with those genres? How to they deal with giving great recommendations to their 100 million-plus subscribers who are already used to getting recommendations from pretty much every platform they use? Gépi tanulás, algoritmusok és kreativitás. Ezek azok a bűvésztrükkök, amelyek segítenek megtörni a nézők előítéleteit, és olyan műsorokat találni, amelyeket eredetileg talán nem is gondoltak volna megnézni. Azoknak, akik még mindig próbálják kitalálni, mi is az az algoritmus, alapvetően egy sor adatbázis-alapú utasítás, amely megmondja a Netflixnek, hogy mit tegyen.

Az ajánlórendszer különböző helyekről gyűjtött adatok összeállításával működik. Az ajánlott sorok az Ön nézési szokásaihoz igazodnak. Ezért tudod megmondani, ha a kis unokatestvéreid a fiókodat használják, hogy egymilliárd órányi Peppa Malacot nézzenek. Ebben az esetben gyakran algoritmusokat használnak a gépi tanulás megkönnyítésére. A Netflixhez hasonló, gépi tanuláson alapuló rendszerek újraírják magukat, ahogy tanulnak a saját felhasználóiktól. Minden alkalommal, amikor megnyomja a lejátszás gombot, és némi időt tölt egy tévéműsor vagy film megtekintésével, a Netflix adatokat gyűjt, amelyek tájékoztatják az algoritmust, és frissítik azt. Minél többet nézed, annál naprakészebb az algoritmus.

A begyűjtött adatok sokrétűek és összetettek, de sokkal többről van szó, mint arról, hogy feldolgozza a felhasználó által nézett műsor műfaját, és drámákat, románcokat vagy vígjátékokat ajánl neki. Todd Yellin, a Netflix termékinnovációért felelős alelnöke 2017-ben a Wirednek nyilatkozott: “amit ezekből a profilokból látunk, az a következő típusú adatok – mit néznek az emberek, mit néznek utána, mit néznek előtte, mit néztek egy évvel ezelőtt, mit néztek mostanában és milyen napszakban”. A Netflix-élményt számos gépi tanulási algoritmus vezérli: rangsorolás, keresés, hasonlóság, értékelés és így tovább. Nem tudják egyszerre kínálni a teljes katalógusukat, így azt kuratírozniuk kell. Mivel a minőség és az ízlés ritkán azonos, a Netflix nem működhet úgy, mint a Rotten Tomatoes, a Pitchfork vagy az IMDb, ismerniük kell a felhasználóikat, és egyénre szabott ajánlásokat kell kapniuk.

A személyre szabási megközelítésünk fejlődése.

ANetflix ízléscsoportokkal dolgozik. Minden néző több csoportba is belefér, és ezek befolyásolják, hogy milyen ajánlások bukkannak fel minden képernyőfelület tetején, milyen műfaji sorok jelennek meg, és hogyan szerveződnek az egyes sorok. Ha az Ön nézési szokásai hasonlóak egy másik felhasználóéhoz, akkor a Netflix a többi felhasználó viselkedése alapján is ajánlásokat tesz közzé.

A gépi tanulási algoritmusokhoz használt címkék világszerte azonosak. A Netflix valódi embereket bérelt fel, hogy kategorizáljanak minden egyes tévéműsort és filmet, és mindegyikhez címkéket alkalmazzanak, hogy olyan hiperspecifikus mikroműfajokat hozzanak létre, mint például a “Vizuálisan lenyűgöző nosztalgikus drámák” vagy a “Visszafogott romantikus road trip filmek”.

Ezek az adattényezők mindegyike együttesen határozza meg, hogy Ön melyik ízléscsoportba tartozik. Minden felhasználó képernyője aszerint töltődik fel – balra, jobbra és fentről lefelé -, hogy melyik csoportba tartozik.

A navigációs modellezés érzelmi jelentősége. A tagok nagyobb valószínűséggel szkennelnek függőlegesen, mint vízszintesen.

Miért egyáltalán sorok?

Chris Alvino, a Netflix gépi tanulási mérnöke elmagyarázza, hogy azért választják a sorokat, hogy a tagok könnyebben navigáljanak a katalógusuk nagy részén. Azzal, hogy a videók összefüggő csoportjait sorban mutatják be, minden egyes sornak értelmes nevet adnak, és a sorokat hasznos sorrendben mutatják be, a tagok gyorsan eldönthetik, hogy egy sorban lévő videók összessége valószínűleg tartalmaz-e olyasmit, amit éppen abban a pillanatban szeretnének megnézni. Ez lehetővé teszi a tagok számára, hogy vagy mélyebbre merüljenek és további videókat keressenek a témában, vagy átugorják azokat, és egy másik sort nézzenek meg.

Minden eszköz különböző hardveres képességekkel rendelkezik, amelyek korlátozhatják az egyszerre megjelenített sorok számát és azt, hogy mekkora lehet az egész oldal, ezért a Netflixnek tisztában kell lennie az egyes eszközök korlátaival.

Minden sor a katalógus egy egyedi és személyre szabott szeletét kínálhatja a tag számára a böngészéshez. A Netflix kihívásának része, hogy hasznos csoportosításokat hozzon létre a videók között, hogy kiemelje a katalógus mélységét, és segítse a tagokat abban, hogy ne csak megerősítsék az érdeklődési körüket, hanem újakat is találjanak. Az ajánlásoknak frissnek és érzékenyeknek kellene lenniük, ugyanakkor stabilnak is, hogy az emberek ismerjék a kezdőlapjukat, és könnyen megtalálják a közelmúltban ajánlott videókat.

A Netflix egyik szereplője által nézhető címek lehetséges sora.

Egy kép többet ér ezer szónál

A Netflix nemrég egy új, a műalkotásokon alapuló ajánló algoritmust vezetett be. Egyedi, személyre szabott képeket szolgál fel előfizetőinek. Ezeket a képeket kifejezetten arra tervezték, hogy a Netflixen ragadjon az ember. Sok olyan adattényezőt vesz figyelembe, amelyeket mi is említettünk.”

Gopal Krishnan technikai blogbejegyzésében mindent elmondott erről az új algoritmusról. A Netflix egy olyan keretrendszer létrehozásán dolgozik, amely lehetővé teszi számukra, hogy hatékonyan keresztezzék a nagy adatokat a kreativitással, segítve a felhasználókat abban, hogy gyorsabban felfedezzék azokat a műsorokat és filmeket, amelyeket élvezni fognak, és megakadályozzák, hogy elárassza őket a Netflix Hatalmas katalógusa. Ennek a vizsgálatnak az eredményeként most már egyedülálló módon képesek megérteni, hogy mely képek működnek a legjobban az egyes felhasználók számára.

Azt mondják, hogy ha 90 másodpercen belül nem tudják megragadni a felhasználó figyelmét, akkor valószínűleg elveszíti az érdeklődését, és továbblép egy másik tevékenységre. Mivel ilyen rövid idő áll rendelkezésre az érdeklődés felkeltésére, a képek válnak a leghatékonyabb és legmeggyőzőbb eszközzé, hogy a felhasználók a lehető leggyorsabban felfedezzék a tökéletes címet.

A Netflix honlapja grafika nélkül. Történelmileg így láttak egy oldalt az ajánló algoritmusaink.

Elkészítettek egy olyan rendszert, amely a katalógusuk számos címéhez tesztel egy sor képet, segítve egy meggyőző kép megjelenítését az elköteleződés fokozása érdekében. Számos kísérlet és teszt során a Netflix arra a következtetésre jutott, hogy az érzelmek egy bizonyos skálájának látványa valóban arra készteti az embereket, hogy megnézzenek egy tévéműsort vagy filmet. Ez valószínűleg annak köszönhető, hogy az összetett érzelmek rengeteg információt közvetítenek a felhasználók számára a tartalom hangvételét vagy hangulatát illetően, de érdekes látni, hogy a tesztelés során a tagok valójában mennyire reagálnak így. Erre példa az Unbreakable Kimmy Schmidt második évadának nemrégiben készült győztes képe (“győztes” azt jelenti, hogy a legnagyobb elkötelezettséget váltotta ki):

That winning image is the one that would work best for a majority of Netflix users. But they have pushed even further and given the enormous diversity in taste and preferences, they decided to put together different artwork for each user to highlight the aspects of a show or movie that are relevant to them.

Artwork for Stranger Things. Different images cover a breadth of themes in the show to go beyond what any single image portrays.

In order to choose which image each user has on their feed, Netflix focuses on what other shows and movies users have been watching. For example, a member who watches many movies featuring Uma Thurman would likely respond positively to the artwork for Pulp Fiction that contains Uma. Meanwhile, a fan of John Travolta may be more interested in watching Pulp Fiction if the artwork features John.

Not all the scenarios for personalizing artwork are this clear and obvious but data does all the work in order to choose the artwork for each user and improve the Netflix experience (and keep users binging, of course).

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.