Hokej v číslech: Predikce sezony pomocí modelu Game Score. Co potřebujete vědět

Foto: Lukáš Filipec, hcocelari.cz

Nová sezona už pomalu klepe na dveře a jistě bude velmi zajímavá. Na týmy totiž letos, kromě hry o titul, opět číhá hrozba sestupu, a to dokonce přímého pro poslední celek, a baráž pro předposlední tým.

Model Game Score

V minulé sezoně jsme vám v jejím průběhu představili model Game Score, díky kterému lze určitým způsobem odhadnout sílu týmů. Následně můžeme díky tomu predikovat jednotlivé zápasy a také průběh celé sezony a play off, jak jsme si vysvětlili v tomto článku.

Pro novou sezonu doznal náš model několika málo změn. Používané statistiky i jejich hodnoty zůstávají stejné, zásadní změnou ovšem je konečné hodnocení hráčů.

To se stále zakládá na predikovaném hodnocení jejich Game Score, které sestává z několik statistik zmíněných v původním článku a používá data z posledních dvou extraligových sezon u každého hráče, které jsou váženy podle stáří.

Hráči, kteří však nemají odehrané extraligové sezony v daném období, ze kterého model čerpá, jsou hodnoceny na základě tzv. modelu NHLe, který ukazuje, jak by si hráči z jiných soutěží vedli bodově právě v NHL. My zpětně z těchto koeficientů vypočítali ekvivalenty pro českou extraligu. Tím jsou však vyřešeny pouze body, přičemž model zahrnuje statistik mnohem více. Zbylé z nich tak tito hráči mají určené jako týmový průměr na dané pozici. Může se tedy lehce stát, že kvalitní hráči budou v modelu podhodnocení (David Krejčí), ti slabší pak mohou mít na startu soutěže naopak vyšší hodnotu.

Hlavní změnou pro letošní sezonu je pak konečné hodnocení hráčů. Každý z hráčů má na základě svých výsledků v minulosti predikované hodnocení Game Score. To zhruba vyjadřuje vztah ke gólům, ke kterým hráč svými výkony přispěje. Nyní je tato hodnota převedena na celkový počet výher, ke kterým hráč přispívá v průběhu celé sezony nad rámec herní úrovně náhradníka (tedy sedmého beka, či třináctého útočníka). Abychom měli srovnání i do dalších sezon, je i pro tuto stanovená hodnota tohoto náhradníka jako 168. hodnoceného útočníka (14 týmů krát 12 útočníků) a 84. obránce (14 týmů krát 6 obránců). Takový hráč tedy bude mít hodnotu, nyní nazvanou GSVA (Game Score Value Added – přidaná hodnota), rovnou nule.

Součet hodnot GSVA, neboli výher, jak to bude nejčastěji referováno v nadcházejících predikcích, všech hráčů týmu pak právě určuje sílu daného týmu a jeho šance v zápasech a sezoně.

Predikce sezony

Nicméně, odhadovat sport jakým je hokej je nesmírně obtížné a vždy dojde k určitým nepřesnostem. Například favorité v loňské sezoně vyhráli pouze 64 % utkání, je tedy jasné, že ne vždy budou naše odhady přesné, navíc ve sportu, kde náhoda hraje velkou roli.

Pro letošní ročník začínáme s predikcemi už nyní, a to představením jednotlivých týmů pomocí našeho modelu, jejich sestav, předností a nedostatků, a v neposlední řadě jejich šancemi před sezonou.

Jak již bylo zmíněno, naše predikce začínají na úrovni určení šancí na výhru jednotlivých zápasů v průběhu celé sezony. Od prvního zápasu základní části až po poslední finále play off. To se děje právě na základě síly týmů, které stojí proti sobě. Následně se pomocí náhody nasimuluje sezona na základě stanovených šancí na výhru – pokud tým má šance v daném utkání na výhru například 60 %, a náhodné číslo je menší než tato hodnota, jde o výhru pro daný tým. Takto proběhne jedna celá sezona. Která může dopadnout například takto:

Nebo takto:

Každá sezona může dopadnout úplně jinak, mnohdy až nepředvídatelně. Proto simulací takových sezon pomocí našeho modelu probíhá 50 000. Na základě toho se pak najde každému týmu bodový průměr, kterého dosahoval, stejně jako počet výher a proher, jak často postoupil do play off a kolikrát se stal mistrem.

Proto například žádný tým v našich preview nebude mít predikovaný bodový průměr nad 100 bodů, ale můžeme s poměrně velkou jistotou říct, že takový tým ve skutečně odehrané sezoně určitě bude. Stejně tak jako má nejslabší tým v průměru na kontě více než 60 bodů, ale že se nějaký tým objeví pod touto hranicí je také dost dobře možné. Model zkrátka pouze neví, který z týmů to v dané sezoně bude.

Pomocí našeho modelu a simulací tvoříme tedy hned několik možných dějových linek, skutečná sezona pak však bude pouze jediná. Pomocí 50 000 simulací se snažíme utvořit nejpravděpodobnější průběh sezony z pohledu každého týmu.

Proto je tedy dost možné, že některé z našich predikcí se ukážou jako liché, a některé naopak jako správné. Každý z týmů má totiž hned několik linek, kterými se v sezoně může vydat. Proto je cílem našeho modelu odhadnout nejpravděpodobnější scénář sezony, a mýlit se tak pokud co možná nejméně.

Ostatně, v každém z představení týmů bude právě graf s možnými scénáři jejich dosažených bodů, a námi predikované pořadí jednotlivých týmů rozhodně neznamená, že přesně takto sezona skončí, pouze se jedná o nejpravděpodobnější scénář každého celku.

Čísla rozhodně nejsou vše, a s tím určitě k hokeji musíme přistupovat. Jak už bylo několikrát v průběhu článku zmíněno, cílem je mýlit se co nejméně a, pokud možno, co nejpřesněji odhadnout průběh sezony, na kterou se jistě všichni těšíme.

RSS | Kontakt | Všeobecné obchodní podmínky a pravidla | Cookies | Nastavení soukromí | Ochrana osobních údajů | Sledování streamů | Reklama - Provozovatel BPA sport marketing a.s. ve spolupráci s eSports.cz, s.r.o.

ISSN 1214-5718 | dotazy na redakci: redakce@hokej.cz, obchod/reklama: obchod@hokej.cz, technický provoz: webmaster@hokej.cz