2021/09/13

SOBRE LA JUSTÍCIA EN EL FUTBOL (ON JUSTICE IN ASSOCIATION FOOTBALL)

DISGRESSIÓ ESTADÍSTICA SOBRE EL NOMBRE JUST (MERESCUT) DE PENALS I D’ALTRES INDICADORS DISCIPLINARIS[1] QUE PODEN INFLUIR EN EL RESULTAT DELS PARTITS (STATISTICAL DIGRESSION ON THE FAIR (DESERVED) NUMBER OF PENALTIES AND OTHER DISCIPLINARY INDICATORS[2]  THAT MAY CHANGE THE OUTCOME OF MATCHES)

ABSTRACT (Catalan & English):

Els àrbitres tenen la difícil tasca d’assegurar que els partits esportius acabin amb resultats justos, tot mantenint la competició dins del marc del reglament. Això implica que hauran d’interrompre el joc sempre que s’infringeixin les seves normes. Per tant, un equip pot ser castigat per les pròpies infraccions (Indicadors Disciplinaris Negatius: DI (-)) o recompensat per les de l’adversari (Indicadors Disciplinaris Positius: DI (+)), la qual cosa pot conduir a canvis en el resultat, siguin justos o injustos. En un partit determinat (A casa? A domicili? Estat del Camp? etc.) o durant un nombre reduït de temporades (Jugadors? Entrenadors? Normes? etc.), un munt de factors poden influir molt en la quantitat de DI (+/-) , però, què hauríem d’esperar a observar, a mesura que augmenta el nombre de temporades? Tots aquests efectes a curt termini, inclosos els errors involuntaris, haurien de compensar-se i desaparèixer com el soroll de fons? Què hauria de quedar finalment? En cas de sospita d’un biaix sistèmic, cas molt comú entre tota mena d’aficionats, es podria aïllar d’aquesta manera la seva influència per tal de poder avaluar la seva significació estadística?

Els esforços en la investigació relacionada es concentren en la predicció de variables en el futur (superant els algoritmes de les cases d'apostes, si és possible!). Però, a part d'algunes queixes poc estructurades d’alguns fanàtics sobre algun biaix disciplinari basat en simples mitjanes, ni la literatura ni la premsa contenen un enfocament sistemàtic per respondre a aquestes preguntes i predir la quantitat JUSTA (merescuda) de DI (+/-) en el passat. O almenys no he sabut trobar-ne cap, si n'hi hagués. Per la present, es proposa un tal model general, bàsicament una barreja d’atzar i habilitat, utilitzant les variables àmpliament disponibles: Partits o Temporades, per l’atzar, i Punts (Victòries, Empats, Derrotes) o Gols (+/-), per l’habilitat. Aquestes correlacions superen tot tipus d’escrutini estadístic a les cinc principals lligues europees (Premier, Bundesliga, Ligue 1, Serie A, Liga). Es proposen millors variables (com més gran sigui la mostra, millor), inclosos altres DI del mateix signe, però no estan disponibles. En cas que aquest enfocament resulti ser realment original, irònicament reivindico per ell el nom de “Llei d’AMSY”.

El principal problema trobat ha estat la manca de registres DI (+/-) disponibles públicament. Només he trobat dues fonts de valor:

  • Nombre de Penals (+/-) històric per a la Lliga espanyola (89 temporades): les principals conclusions són que es pot sospitar d'un biaix de Penals (+) en contra del Barcelona i que es pot demostrar un clar doble biaix de Penals (-), a favor del Reial Madrid i contra el Barcelona, mitjançant diverses proves que superen el llindar del 95%. És rellevant tenir en compte que la incidència potencial en punts dels Penals (-) és aproximadament el doble que la dels Penals (+), per a aquests equips de la part superior de la taula. A continuació s’entra en especulacions sobre com s’haurien d’haver distribuït els punts i les lligues, però, per molt importants que siguin els Penals (+/-), en comparació amb d’altres DI, un biaix general i sistèmic només es pot demostrar més enllà del dubte si la majoria, si no totes les DI, en lloc de cancel·lar-se mútuament les influències, mostressin una tendència coherent.
  • 14 anys de Penals (+/-), Targetes Grogues (-), Targetes Vermelles (-) per a les cinc lligues principals esmentades (28 anys per a la Premier League): les principals conclusions són que, malgrat que es detecten alguns biaixos sospitosos o clars, el nombre de temporades és massa baix per diluir-ne les possibles explicacions raonables a mitjà termini.

En aquest treball preliminar, es formula un model teòric (Llei d’AMSY) i es valida amb les dades disponibles, però es necessiten més dades de DI per confirmar si les desviacions observades concorren de fet en un biaix general o si només mostren les imprecisions del model. SI US PLAU: algú té accés a registres històrics dels indicadors disciplinaris rellevants (Faltes (+/-), Fores de Joc (+/-), Penals (+/-), Córners (+/-), Targetes Grogues (+/-), Targetes Vermelles (+/-)) de les 5 principals lligues europees?

Referees have the difficult duty to ensure fair outcomes of sports matches by keeping the contest within the rules, which implies interrupting the game whenever these rules are violated. Any squad may thus be punished for their own violations (Negative Disciplinary Indicators: DI (-)) or rewarded for the opponent’s (Positive Disciplinary Indicators: DI (+)), leading perhaps to changes in the outcome, fair or unfair. In a certain match (Home? Away? Pitch? etc.) or during a reduced number of seasons (Players? Trainers? Rules? etc.) a bunch of factors may have a strong influence on the amount of DI (+/-), but what should we expect to observe as the number of seasons increases? Should all these short-term effects, including unwilling mistakes, compensate themselves and vanish like ground noise? What should eventually remain? In case of a suspected systemic bias, which is not unusual among all kinds of supporters, could its influence be singled out in that way in order to evaluate its statistical significance?

The efforts in the related research are concentrated in predicting variables in the future (outperforming the betting algorithms, if possible!), but, apart from some simple complains by squad supporters about disciplinary bias based upon plain averages, neither the Literature nor the Press contain a systematic approach to answer these questions and predict the FAIR (deserved) amount of DI (+/-) in the past. Or at least I have failed to find one, should any exist. Such a general model is hereby proposed, basically a mixture from chance and skill, using the variables widely available: Matches or Seasons for chance and Points (Wins, Draws, Losses) or Goals (+/-) for skill. Such correlations stand all kinds of statistical scrutiny in the five major European leagues (Premier, Bundesliga, Ligue 1, Serie A, Liga). Better variables are proposed, the larger the sample, the better, including other DI of the same sign, but they are not available to be tested. In case this approach ends up to being truly original, I ironically claim for it the name of “AMSY’s Law”.

The main problem encountered has been the lack of publicly available DI (+/-) records. I only found two valuable sources:

  • All-time # of Penalties (+/-) for the Spanish Liga (89 Seasons): the main conclusions are that a Penalties (+) bias against Barcelona may be suspected and a clear Penalties (-) double bias (in favour of Real Madrid and against Barcelona) can be shown through several tests to be beyond the 95% threshold. It is relevant to note that the potential incidence in Points of the latter is roughly twice as much that of the former, for these top-table squads. Some speculations about how points and leagues should have been distributed accordingly do follow, but however important Penalties (+/-) are, compared to other DIs, a general, systemic bias can only be proven beyond doubt if the majority, if not all DIs, instead of cancelling each other’s influence, would show a consistent trend.
  • 14 years # of Penalties (+/-), Yellow Cards (-), Red Cards (-) for the 5 mentioned major Leagues (28 years for the Premier League): the main conclusions are that, despite the detection of a few suspected or clear biases, the number of seasons is too low to dilute possible medium-term reasonable explanations for them.

In this preliminary work, AMSY’s Law model is formulated and validated with the available data, but more data is needed to confirm whether the observed deviations indeed concur in a general bias or just show the random limits of the model. PLEASE: anybody has access to all-time records for all Disciplinary Indicators (Freekicks (+/-), Offsides (+/-), Penalties (+/-), Corner kicks (+/-), Yellow cards (+/-), Red cards (+/-)) of the 5 major European Leagues?

[1] Anomeno Indicadors Disciplinaris a totes les modalitats de penalització de l’equip infractor a disposició d’un àrbitre esportiu. Per al futbol: Tirs lliures, Fores de Joc, Fores de Banda, Córners, Penals, Targetes Grogues, Targetes Vermelles.
[2] I call Disciplinary Indicators to all kinds of punishment of a squad having violated the rules at the disposal of a sports referee. For football: Freekicks, Offsides, Throw-ins, Corner kicks, Penalties, Yellow Cards, Red Cards.

 

INTRODUCCIÓ:

  • Aquest treball va començar com un petit “divertimento”, però el cert és que se m’ha complicat força. Que me l’he complicat jo mateix amb diverses ramificacions fractals. Si teniu paciència i aneu més enllà dels titulars, ja ho veureu. Si no m’aturo, això acaba en la Bíblia en vers!
  • M’agraden els esports i n’he practicat una colla, alguns dels quals els procuro anar allargassant. Fa una colla d’anys que vaig deixar el futbol, però hi havia jugat molt, sempre a nivell d’aficionat, ja fos amb l’equip de la facultat, amb diversos grups d’amics o amb les empreses. En tota mena de camps, però sobretot futbol gran. El millor equip amb el que mai he jugat era el de Químiques, dues vegades seguides campió universitari de Catalunya. Dubto molt que m’hi hagués guanyat la vida, però crec que hi entenc prou. Pel que fa al reglament, dec ser dels poquets que se’l va llegir quan m’afectava. En coneixia la lletra i l’esperit i he procurat estar al dia dels canvis, amb els quals no sempre estic d’acord. En qualsevol cas, crec que tinc prou criteri per distingir quan és fora de joc, quan falta, quan penal, quan targeta groga, quan vermella.
  • Sempre he preferit la pràctica activa dels esports a la seva contemplació ociosa per TV. Com que sóc del Barça, però, procuro veure els seus partits. I no m’agraden els arbitratges que sol rebre. No veig mai els del Madrid, només quan s’enfronta amb el Barça. Si alguna vegada en veig algun, no deixa de sorprendre’m. Ho dic pel biaix arbitral, del qual n’he sigut testimoni tota la vida, amb alguns exemples clamorosos. Sé que sóc un fanàtic del meu equip, però em considero força objectiu. Ho sóc?
  • El Barça es queixa del àrbitres: aquesta temporada ho han fet Koeman i Piqué, sempre sota l’amenaça de sanció. El més intel·ligent en fer-ho: en Pep Guardiola[3] . Però tots els equips se’n queixen, en algun moment o altre. Fins i tot el mateix Real Madrid ho fa, quan li convé, emprant tota la rècula de mitjans que li són afins, que no són pocs, per no dir que són tots els estatals.
  • És, per tant, la nostra visió subjectiva, que ens anul·la la perspectiva i la imparcialitat? És tan senzill com que cadascú ho mira des dels seus colors? O bé hi ha quelcom de veritat en algun dels greuges reclamats? Té raó la gent quan coreja “así, así, así gana el Madrí”? O, com diuen molts, que es beneficia els equips grans? Hi hauria alguna manera de saber-ho del cert? Com sempre, hi ha dues possibilitats:
    • Documentar-ho amb proves sobre fets concrets: el cas Di Stefano, el comitè arbitral de José Plaza, el “Villarato” (per posar un exemple contrari), etc. Seria ideal, però no crec que passi.
    • Analitzar-ho amb l’ajuda de les matemàtiques, per veure si apareix un biaix estadístic que sigui significatiu. No sabia com posar-m’hi, però després de veure els enfrontaments directes entre Barça i Madrid d’aquesta Lliga, amb les consegüents discussions acalorades, vaig decidir d'intentar-ho[4] , esperonat per una inesperada remuntada[5].

[3] Com quan demanava als àrbitres que no volia més penals a favor, un any que no n’hi havien assenyalat cap, fins que la temporada no va estar decidida. A partir d’aquell moment en van caure uns quants de seguits.
[4] No podia posar-m’hi sense aprendre de nou l’estadística que vaig oblidar fa dècades i anar una mica més enllà. Ho he repassat tot, però convido els experts a notificar-me qualsevol error o inexactitud.
[5] Després del ridícul final de la qual, va anar de poc que no ho deixés córrer!

Veure ABSTRACT i INTRODUCCIÓ a: https://blocs.mesvilaweb.cat/capdret/on-justice-in-association-football/ 


OBJECTIUS, DISCUSSIÓ I CONCLUSIONS:

1. RESPOSTES EXISTENTS?

Estalviar-me la feina si trobés algú que ja s’hagués plantejat la pregunta i l’hagués resolt satisfactòriament. Sí que hi havia gent que intentava portar l’aigua al seu molí en temes de greuges comparatius, però no vaig ser capaç de trobar cap solució satisfactòria. Un exemple del que no volia fer era això: Las estadísticas del saldo arbitral (futbolgate.com) . Escull el marc temporal que li convé, pren nombres absoluts, no intenta valorar cap factor que ho pogués explicar i presenta les dades intentant dissimular la posició del RM[6].

[6] "¡Grasias! ¡No hase falta desir nada más!" (Bernd Schuster, 2009). 

2. DADES EXISTENTS?

Obtenir dades històriques de la Liga, incloses les disciplinàries rellevants (faltes, offsides, penals, targetes grogues i vermelles, sancions), no tan sols les rebudes pel propi equip (-), sinó també les assenyalades a l’oponent (+). Arran de l’eclosió de les apostes esportives, resulta difícil obtenir dades històriques i les actuals es mantenen privades. A banda de les dades de la taula de classificació, que es remunten als 89 campionats[7], només he pogut trobar dades sobre els penals a favor i en contra . I provenen d’una única font, que espero que sigui correcta.

[7] El 90è, que ja és història, no hi és, perquè vaig descarregar les dades quan es trobava a mitges. Si l’incorporés, hauria de repetir-ho tot: gràfics, càlculs, comparatives, anàlisis, etc.

3. MÈTODES EXISTENTS?

Anàlisi de la Literatura a la recerca de mètodes establerts de predicció dels indicadors disciplinaris, en tant que constitueixen influències externes amb un no menyspreable potencial d’influir en el resultat, ja sigui per acció, com per omissió. ¾ del mateix. Els articles consultats es dediquen a cercar algorismes de predicció de variables a curt termini, que superin els de les cases d’apostes, basats en els registres històrics. Un enfoc molt més crematístic que el meu, ben cert! Els més científics se centren en la predicció del rendiment esportiu. Tots ells empren dades actuals, molt abundants i directament relacionades amb la variable dependent. Per exemple, pels penals, potser escolliríem el nombre de faltes, el de passis dins l’àrea, el temps de possessió dins l’àrea, etc. No cal dir que tota aquesta informació, que probablement ens conduiria a una precisió millor, es registra des de fa molt poc temps. Considero que no tinc on aferrar-me i que m’hauré d’espavilar pel meu compte.

4. RECERCA DE MODELS:

Desenvolupar els dits models a partir de les dades extensives (quantitat) i intensives (qualitat) disponibles de la Liga. Proposo i analitzo les correlacions possibles entre els penals (a favor i en contra) i les variables extensives (partits) o intensives (punts, gols a favor, gols en contra) i de les seves combinacions. En particular, les  combinacions entre una de quantitat i una de qualitat resulten atractives des del punt de vista teòric. Com que no he sigut capaç de trobar precedents del seu enunciat ni de la seva aplicació, malgrat la seva simplicitat, les batejo modestament com Llei d’AMSY, la qual s’expressa en diverses equacions, derivades del seu enunciat general: “les intervencions d’un àrbitre en un dia concret depenen de molts factors difícilment quantificables (dels jugadors sobre el terreny, de la filosofia imperant en cada club, del factor camp-pressió del públic, de l’estat del terreny de joc, etc.). Amb una llarga perspectiva temporal, no obstant, i en absència de biaix, aquests factors incidentals es van diluint i per a cada indicador disciplinari al capdavall resten només dos components: la seva distribució a l’atzar, en funció del nombre de partits jugats, i la diferència de qualitat entre els oponents, en funció de variables com els punt assolits (en darrera instància: victòries/empats/derrotes), els gols a favor, els gols en contra o altres indicadors disciplinaris del mateix signe”. 

Segons aquesta Llei, no es tractaria de que els àrbitres beneficiïn els equips grans, sinó que és la major qualitat d’aquests la que desvia al seu favor una part dels indicadors disciplinaris respecte de la proporció estricta de l’atzar. Caldrà veure si això succeeix de forma coherent.

5. ANÀLISI ESTADÍSTICA:

Posar a prova els resultats amb les dades a l’abast i sotmetre’ls a un sistemàtic i rigorós escrutini estadístic sobre la seva significació. En el TRACTAMENT DE DADES especifico l’anàlisi estadística dels resultats, tota ella satisfactòria. Aquests models derivats de la Llei d’AMSY no només superen aquest escrutini amb els millors resultats, sinó que arriben a reproduir la realitat amb errors <10%. Concretament, el millor assoleix:

  • Penals a Favor: 7,8% d’error.
  • Penals en Contra: 9,5% d’error.
  • Diferència (A Favor-En Contra): 10,0% d’error.

6. CONTRAST EN ALTRES LLIGUES:

Donada la novetat dels models, exposar-los a les dades disponibles de les altres lligues importants, per tal de determinar si la seva validesa és general. He sigut incapaç de trobar dades històriques completes, ni que fossin només penals, de les altres Lligues. Sí he aconseguit, però, dades de penals i targetes (rebudes) dels darrers 28 anys de la Premier i 14 anys de la resta (Bundesliga, Ligue 1, Serie A, inclosa la Liga). És procedent aplicar-hi els mateixos models i després fer-hi comparacions, perquè es tracta del mateix esport, amb les mateixes regles. És a dir, la mateixa població estadística. Així ho corroboren tots els indicadors, tots ells força homogenis. Les petites desviacions s’expliquen per diferències culturals: “fair-play”, intervencionisme arbitral, estil de joc, etc. Només crida l’atenció el -0,078 TG/Punt de la Premier (poc dependent de la qualitat). Taula 1 (Comparativa Lligues Futbol):


 La capacitat d’aquests models de reproduir la realitat depèn, lògicament, de la dimensió de la mostra, però sempre incorpora la totalitat del seu ordre subjacent. El rang d’errors és:

  • Penals a Favor: 12,5% - 19,3% d’error.
  • Penals en Contra: 12,0% - 16,0% d’error.
  • Diferència (A Favor-En Contra): 14,3% - 19,9% d’error.
  • Targetes Grogues en Contra: 3,7% - 7,6% d’error.
  • Targetes Vermelles en Contra: 18,2% - 24,9% d’error.

Per tant, els models derivats de la Llei d’AMSY són validats en les 5 lligues principals per la seva aplicació general.

7. DIFERÈNCIES RM-FCB:

Molt bé! Ja tenim uns models que ens acosten a la realitat dels indicadors disciplinaris (penals, targetes)! No sabem si són els més acurats, però sí que son els únics que empren dades disponibles històricament. La pena és que només podem desplegar-los per als penals d’ambdós signes, perquè no tenim dades de la resta. Paga la pena de fer-ho? O esperem per si apareixen altres dades? En les 89 temporades, totes elles a 1a Divisió, el RM i el FCB han jugat 2787 partits. El còmput de punts és favorable al RM per 92 de diferència (2,0%). El de gols, tanmateix, ho és doblement al FCB per 1 gol més a favor (-0,0%) i 38 menys en contra (-1,2%). Pel que fa al còmput de penals, l’únic indicador disciplinari del qual he pogut obtenir dades històriques completes, però molt rellevant, resulta clarament favorable al RM també per partida doble: 31 més a favor (5,8%) i 60 menys en contra (21,1%). Un agregat de 91 penals (11,1%), doncs, separa ambdós equips. Algú pot objectar que són pocs penals, un per temporada, no? Cert, però deixeu-me exposar-ho d’una altra manera:

  • (Des)proporcions:
    • Per cada 100 punts del RM, el FCB n’ha fet 98 (i millors xifres pels gols)
    • Per cada 100 lligues del RM, el FCB n’obtindria 76.
    • Per cada 100 penals a favor del RM al FCB n’hi xiulen 94.
    • Per cada 100 penals en contra del RM, el FCB en rep 121.
  • Valors absoluts:
    • DeltaPenals: +31 a favor –(-60 en contra) = 91 penals, favorable al RM.
    • DeltaPunts: 92 punts, favorable al RM.
    • DeltaLligues: 8 títols, també favorable al RM.
  • Si la diferència en penals, amb un evident potencial de traduir-se en punts (0,5-0,6 punts/penal en aquest cas concret), és exactament igual que una diferència en punts, relativament molt menor, de la qual en surten 8 Lligues de més, aquesta diferència, petita o gran, mereix ser analitzada, no trobeu?

8. VALORACIÓ ESTADÍSTICA D’AQUESTES DIFERÈNCIES:

Escollir el/s millor/s model/s i emprar-los per extreure conclusions de la comparativa entre clubs. Per estudiar si aquesta diferència és rellevant, escullo el model basat en partits i punts i compto els punts a 2 per victòria (2/3 de les temporades a 2 punts i 1/3 a 3 punts). I ho faig perquè, comptat i debatut, crec que és la millor perspectiva[8]. Segons aquesta correlació, 12 a favor + 8 en contra = 20 penals seria la diferència previsible. En queden 71 per  analitzar:

  • 19 penals més a favor: la diferència, equivalent a 1,8*Sigma i a un 55% de la població (entre els percentils 7 i 62) no crida l’atenció. Però, malgrat els 63 equips, el pes ponderat de FCB i RM en la regressió és tan elevat, que si es recalcula sense el FCB, canvia tant, que el punt del FCB es quedaria gairebé fora del nivell de pronòstic del 95%. No seria un outlier clar (>95%), però sí un sospitós de ser-ho (>90%).
  • 52 penals menys en contra: aquesta diferència ja són figues d’un altre paner per les dues bandes. Signes de que els 2 equips amb més pes en la regressió resulten ser outliers en bandes oposades de la corba serien:
    • El FCB i el RM apareixen en els percentils 99,1 i 3,2, respectivament, separats per 4,3*Sigma i un 96% de la població.
    • El coeficient de regressió R2 millora quan s’elimina qualsevol dels dos.
    • Els paràmetres de la regressió sense el FCB són estadísticament diferents dels calculats sense el RM, i viceversa (queden mútuament fora dels respectius nivells de confiança del 95%).
    • Les dades del FCB quedarien fora del nivell de pronòstic del 95% de la regressió sense ell. Al RM li ocorre el mateix, en menor mesura (fora del 90%).

L’estadística no condueix a conclusions categòriques; sempre són relatives a una determinada probabilitat. En aquest sentit, la barrera del 95% és la que universalment s’ha escollit per establir que una diferència és significativa. Tot indica, doncs, no només que RM i FCB pertanyerien a poblacions diferents de penals en contra, sinó que cadascun d’ells tampoc pertanyeria a la població de tota la resta (“només” al 90% en el cas del RM). Pot parlar-se, en conseqüència, de l’existència perdurable en el temps d’un doble biaix de signe contrari en el nombre de penals en contra. Allò que l’estadística no ens pot dir és el perquè. Podria haver-hi alguna altra explicació, sempre present, que ho justifiqués. Si parléssim de l’Athletic de Bilbao, probablement pensaríem en l’estil de joc, basat en el “contacte físic”, entès com a segell d’identitat. Però per als dos equips que ens ocupen, a mi no se me n’acut cap de raonable. Si algú la té, que la proposi. Que la tendència que s’albira en els penals a favor es manifesti de forma significativa en els penals en contra pot semblar innocent. El següent apartat potser ens ajudarà a entendre-ho.

M’hagués agradat poder analitzar els altres indicadors disciplinaris rellevants (targetes grogues i vermelles, faltes, offsides, sancions, tant a favor com en contra), però no he sabut trobar aquestes dades. Si algú hi té accés, li agrairia que me les pogués facilitar. Fora molt interessant comprovar si el patró que es desprèn de l’anàlisi dels penals constitueix una excepció o segueix una norma.

[8] Per evitar suspicàcies, vull deixar clar que aquest model és el més favorable al RM de tots (lògic, donat que es basa en el nombre de punts, que també ho és), tot i que no és necessàriament això, allò que el fa millor 😉

9. ESPECULACIONS SOBRE LA REALITAT SENSE BIAIX (PUNTS?):

En cas d’existir un biaix significatiu, fer una estimació de quina influència hagi pogut tenir en el nombre de punts. Resulta lícit, vist l’apartat anterior, preguntar-se què hauria passat si a cada equip li haguessin assenyalat els penals que els correspondria segons el model, tant a favor, com en contra. Tot i que resulta innegable que un biaix injust necessàriament haurà tingut influència en el repartiment de punts i, eventualment, en l’assoliment de títols, en el mateix moment que ens posem a calcular la seva proporció, fent (ab)ús d’unes equacions que semblen deterministes, però no ho són, abandonem el sòlid terreny de l’estadística, per entrar en el de l’estimació qualitativa, en el millor dels casos, quan no el de la mera especulació. Per entendre-ho només cal recordar, com hem vist en l’apartat anterior, que bellugar de lloc un punt altera les pròpies equacions i sol conduir a incongruències (per exemple: que el nombre de penals totals acabi essent diferent del real). Amb aquestes prevencions per davant, decidim malgrat tot aventurar-nos-hi, perquè de l’estimació d’aquestes “reparacions”, se’n pot extreure important informació qualitativa:

  • Estimació de la valoració en punts de les diferències respecte als valors predits pel model: els 3 penals de més a favor + 25 de menys en contra = 28 del RM i els 16 de menys a favor + 27 de mes en contra = -43 del FCB.
  • Això deixaria el RM amb menys punts i el FCB amb més, amb la qual cosa el nombre de penals esperats a favor i en contra ja no seria el mateix. Les iteracions, en principi, són infinites, però en el cas que ens ocupa en faig només 1, que serveix per comprovar que una 2a ja tindria una incidència irrellevant, des d’un punt de vista semi-quantitatiu. Aquest exercici deixa el balanç de penals del RM en 31 i el del FCB en -49.
  • Com es tradueix això en punts? Comptant a 2 x victòria, elecció també conservadora, caldria restar 22 punts al RM i afegir-ne 29 al FCB, reduint la diferència de punts en 51, per deixar-la en 42, menys de la meitat. L’estimació es fa a partir de la proporció entre victòries, empats i derrotes de cada equip i de la probabilitat de transformar un penal a la Liga (no tinc dades més específiques).
  • Per a equips amb una clara majoria de victòries (60%/20%/20% el RM i 58%/20%/22% el FCB), més penals a favor poden millorar la diferència de gols, però rarament donen punts (35% pel RM, 37% pel FCB). A la recíproca, però, més penals en contra es tradueixen fàcilment en transvasament de punts cap a l’adversari (76% pel RM, 74% pel FCB). Per a aquests dos equips, doncs, la potencial incidència dels penals en contra és el doble o més que la dels penals a favor. Compte! Aquesta afirmació no té una validesa general; per als equips que solen perdre seria exactament a l’inrevés.
  • Segur que ni jugadors, ni públic, ni àrbitres són conscients d’aquesta clara diferència. El que sí tenen clar, davant d’una jugada dubtosa en qualsevol de les dues àrees, és si pot afectar al resultat o no. Aquí ja entrem en el camp de la psicologia, que sí que ens permet especular sobre els perquès: un àrbitre equànime xiularia allò que veiés, potser amb un biaix pel factor camp / pressió del públic, la qual cosa no generaria cap asimetria entre els penals a favor i en contra, de diferent signe, entre RM i FCB. Un àrbitre que rebés pressions d’alguna mena i que només volgués “quedar bé”, segurament reaccionaria preferint la visibilitat a la transcendència, generant asimetries contràries a les observades. Per generar-les, doncs, sembla que calgués tot el contrari: la intenció d’influir en el resultat, sense que es notés gaire . De generar un impacte, amb la mínima visibilitat[9]. Per tal com aquest mecanisme psicològic es correspondria millor amb el d’aquells que cometen un il·lícit dolós, la indiscutible existència d’aquestes asimetries de signe contrari per a cada equip vindria a ser una confirmació indirecta del propi biaix a l’hora de xiular o no xiular!

De nou, si tinguéssim dades sobre els altres indicadors disciplinaris, podríem qualitativament quedar-nos tranquils, perquè les “reparacions” tendissin a diluir-se per compensació, o a preocupar-nos encara més, perquè tendissin a reforçar-se.

Posats a especular en el camp de la psicologia, des del moment en que qualsevol biaix traspassés els respectius llindars de la percepció, no necessàriament conscients tots ells, de cadascun dels col·lectius implicats, es traduiria en un alleugeriment o en un reforç de la pressió disciplinària exercida sobre els jugadors, els entrenadors, el públic, els clubs, els àrbitres, els organismes esportius, etc., els quals, de manera conductista, tendirien a “adaptar-s’hi”. Per exemple, els jugadors acabarien modificant el seu capteniment en el camp, en un sentit (Patent de cors...) o un altre (Com la muller del Cèsar...). Això faria el greuge encara més gran. Creieu que hi ha hagut èpoques on això ha passat? Tot un meló!!!

[9] “...a cuyo fin dará las providencias más templadas y disimuladas para que se consiga el efecto, sin que se note el cuydado.” Instruccions secretes als corregidors del territori català, 1712.

10. ESPECULACIONS SOBRE LA REALITAT SENSE BIAIX (LLIGUES?):

I què podríem dir dels títols de Lliga obtinguts? Resulta estadísticament equitativa la seva distribució? Si estimem unes hipotètiques “reparacions”, de quants títols estaríem parlant? Pel que fa al nombre de Lligues obtingudes, sense coneixement de quin seria el criteri just de repartició, no es pot negar a simple vista que aquesta és asimètrica. Però, que hi diu l’estadística?

  • Amb millors registres de gols i a 92 punts de diferència del RM (34 títols), el FCB (26 títols) ha guanyat 8 títols menys, mentre que el següent classificat, Atlético de Madrid, a 857 punts, n’ha guanyat 10 (11 una temporada després).
  • La Llei d’AMSY no és d’aplicació en aquest cas, perquè el nombre de Lligues no depèn de l’atzar en cap proporció.
  • Com hauria de construir-se una bona correlació amb els títols de lliga? En l’apartat de TRACTAMENT DE DADES proposo una manera de fer-ho, però no puc contrastar-ho, perquè no tinc la informació desglossada per temporades.
  • He provat, doncs, diverses correlacions amb els indicadors de qualitat de que disposo (veure també l’apartat següent). La que millor descriu la realitat, malgrat una major incertesa (17% d’error) situa al RM de nou com outlier, per motius similars als d’abans:
    • El FCB i el RM, guanyadors de 2 de cada 3 Lligues, apareixen en els percentils 32,5 i 96,0, respectivament, separats per 2,2*sigma i un 63,5% de la població.
    • Els paràmetres de la regressió sense el RM són estadísticament diferents dels originals, i viceversa (queden mútuament fora dels respectius nivells de confiança del 95%).
    • Les dades del RM queden fora del nivell de pronòstic del 90% i quedarien molt més enllà del nivell de pronòstic del 95% de la regressió sense ell.
  • El RM, doncs, pertanyeria a una població diferent de títols que la resta. En aquest cas no es pot afirmar el mateix del FCB. Per bé que la parametrització emprada no té cap suport teòric al darrera i, per tant, podria ser una mala aproximació a la realitat, val a dir que totes les altres correlacions estudiades condueixen a desviacions similars o, fins i tot, més significatives. En el gruix de l’informe (TRACTAMENT DE DADES) proposo un tipus de correlació que no puc contrastar per manca de dades. Si algú les té o coneix una correlació millor, estaré encantat de fer-les servir.
  • Endinsant-nos de nou en el terreny especulatiu de les “reparacions”, segons aquesta correlació, el RM hauria d’haver guanyat 4 títols de Lliga menys (de 34 a 30) i el FCB 1 més (de 26 a 27). Si al damunt encara hi afegíssim els punts de les “reparacions” provinents dels penals, quedarien separats per 1 títol (28 el FCB i 29 el RM).

11. EXISTEIXEN BIAIXOS ARREU?

Estudiar si hi ha biaixos en les altres competicions de Lliga analitzades. Com he explicat en l’apartat 6, tinc exemples d’altres Lligues, les 4 principals. El problema és que només cobreixen els darrers 14 anys (28 en el cas de la Premier League). Això comporta errors més grans i, per tant, uns rangs molt més amples per als nivells de confiança i de pronòstic. Segueixo escollint el model Partits/Punts (ara a 3 x Victòria). El de Partits/Gols+/Gols- dona uns resultats molt similars fins i tot millors en algun cas, ja sigui pel marc temporal més curt o pel tema dels 3 punts, però presenta alguns inconvenients en l’escrutini estadístic. Tot i així, mirem a veure què en surt, sobre el tema dels penals (P+, P-) i les targetes rebudes (TG-, TV-). 

  • Els equips capdavanters no són els que mostren més biaixos. En particular els equips amb més lligues serien dels que millor s’adaptarien al model. Excepcions en les quals s’acumulen biaixos del mateix sentit, tot i que no tots ells estadísticament rellevants: Arsenal (-) i Liverpool (+) a la Premier, Bayer Leverkusen (-), a la Bundesliga, Olympique Marseille (-) a la Ligue 1, Roma (-) a la Sèrie A i València (-) a la Liga.
  • Penals: si prenem com a contrast l’única lliga de la qual tenim un registre més ampli, el cas és que no sembla la mateixa. Els outliers no són els mateixos i, fins i tot, alguns són de signe contrari. De fet, ens trobem en un cicle diferent.
  • Targetes: donat el seu elevat nombre, les grogues s’ajusten molt millor que les vermelles al model, amb errors petits. En aquest cas no podem comparar amb cap registre més ampli. Ni tan sols tenim les targetes grogues i vermelles mostrades als oponents (equivalents als penals a favor) per comprovar el balanç global.

En summa, malgrat que la Llei d’AMSY és aplicable a totes les Lligues investigades i la seva capacitat d’ajustar-se a la realitat depèn en primera instància de la dimensió de la mostra, també depèn del lapse temporal de les dades. Sembla, doncs que 14 anys serien pocs per a detectar biaixos de manera convincent, no només per uns nivells de confiança i de pronòstic més laxos, sinó també per la possible presència d’altres desviacions objectives temporals perfectament legítimes. Recordem que, per tal que la Llei d’AMSY anés emergint amb més i més claredat, l’enunciat insistia en que el soroll de fons causat pels altres efectes objectius de curta durada, havia d’anar diluint-se amb el temps. Donat que 10-15 anys representen una generació de futbolistes, és raonable pensar en la influència que això pot tenir. A tall d’exemple aventuro possibles explicacions de desviacions detectades en la Liga:

  • El Barça de Puyol, Piqué, Xavi, Iniesta, Messi feia poques faltes i rebia poques targetes, de les quals una colla per protestar.
  • El Madrid de Pepe i Sergio Ramos feia moltes faltes i rebia moltes targetes, sobretot vermelles (el darrer, encara en actiu, està en possessió dels rècords d’expulsions, tant a la Liga, com a la Champions).
  • L’Atlético Madrid actual està impregnat de la mentalitat del Cholo Simeone: baixa possessió, poca presència a l’àrea contrària, contraatac.

12. APM?

Comprovar si hi ha alguna altra sorpresa que cridi l’atenció. Efectivament, he trobat una “sorpresa”, però seré trapella i no l’anticiparé aquí. Me la reservaré pel gruix de l’informe (TRACTAMENT DE DADES) i l’haureu de buscar! Un cop vista, ja em direu què us en sembla.


TRACTAMENT DE DADES:

1. RESPOSTES EXISTENTS?

Esmento només uns exemples per deixar clar que, tot i les diferències de rigor entre ells, no considerava cap d’ells satisfactori:

  • Futbolgate (Las estadísticas del saldo arbitral. (futbolgate.com)): el meu favorit. S’accedeix a aquest futbolgate a través del menú “Investigación”, tota una premonició. Escull el marc temporal que li convé (el “Villarato”), pren nombres absoluts, a tot estirar els resta quan diu que fa estadístiques, presenta les dades intentant dissimular la posició del RM i, sobretot, no es pregunta si hi ha alguna explicació objectiva. El fet que, durant aquest període, el Barça hagi estat reconegut com el millor equip del món (arreu, menys a Espanya), no hi deu tenir res a veure. La filosofia del “fair play” adoptada pel Barça (a qui acusaven de “mear colònia”), confrontada a la filosofia de jugar més enllà del límit, per després queixar-se quan es quedaven amb 10 (quan potser els havien perdonat dues expulsions més), tampoc.
  • Positively Arsenal (Arsenal: Only a 40% Correlation between Penalties-For and Avg League Position | Positively Arsenal): els gooners, no mancats de raó, per cert, es lamenten dels penals a favor que els concedeixen. Es basen en una correlació directa amb la posició mitjana a la Premier, mesura únicament de qualitat.
  • The Tomkins Times (Why Are Liverpool Given Only One-Third Of Their “Deserved” Premier League Penalties? – The Tomkins Times): aquí, els reds es queixen del tracte en una temporada concreta, sense gens de raó a llarg termini, per cert. Com que estadísticament no hi ha res a pelar, es dediquen a revisar les jugades dubtoses.
  • James’ Blog (How repeatable is winning/giving away penalties? | James' Blog (wordpress.com)): té una interessant sèrie d’articles sobre penals, jugant amb dades del segle XXI. El vincle remet al darrer. És l’únic que jo hagi vist que parla d’un component d’atzar majoritari i d’un component de qualitat minoritari, que en surt infravalorat.


2. DADES EXISTENTS?

Fonts de les dades emprades. De tota la història de les lligues només he trobat informació (no actualitzada, que he hagut de completar fins al 2020), dels penals la Liga. I encara, d’una única font! Com més dades hi ha, més representativa és l’estadística. Si algú sap on aconseguir altres indicadors disciplinaris des dels inicis de qualsevol de les 5 lligues estudiades, li prego que me’n faciliti l’accés :


3. MÈTODES EXISTENTS?

Faig un petit tast de la literatura científica per veure que s’enfoca cap a altres temes, evidentment més interessants, com ara quines variables incideixen en el rendiment esportiu (per tal de poder-lo millorar i, eventualment, marcar més gols, guanyar més partits i més títols), la qualitat de les ocasions creades (per tal d’avaluar la potencial qualitat d’un equip o un jugador millor que amb els mateixos gols, més escassos i, per tant, més sotmesos a l’atzar) o quins models prediuen millor les probabilitats de que en un partit succeeixin determinades coses (per tal de poder apostar per elles amb avantatge i, eventualment, guanyar més calerons):

  • Moroney, M. (1951), Facts from figures. London, Pelican: article seminal sobre el tema, que proposa un Distribució de Poisson modificada (Binomial Negativa) per descriure la probabilitat de que un partit concret acabi amb un resultat de gols.
  • Reep, C. And B. Benjamin (1968), Skill and chance in association football. J. R. Statist. Soc. A., 134, 623-629: refermen l’anterior, amb independència de la qualitat respectiva dels oponents i n’extreuen la conclusió “chance does dominate the game”.
  • Hill, I.D. (1974), Association football and statistical inference, Appl. Statist. 23, No. 2, pp. 203-208: discuteix la conclusió, considerant-la vàlida només per a les jugades individuals i, en bona mesura, per a un partit concret, però en cap cas més enllà (“Certainly, over a whole season, skill rather than chance dominates the game”).
  • Maher, M. J. (1982), Modelling association football scores, Statistica Neerlandica 36, nr. 3, pp. 109-118: Perfecciona els models de predicció de resultats, retornant a la Distribució de Poisson i desdoblant els paràmetres de qualitat genèrics, introduïts per alguns predecessors, en ofensius i defensius. Amb això s’aconsegueix reflectir millor el grau d’independència entre el que succeeix en una porteria i en l’altra. És usual desdoblar-los de nou també entre casa-fora.
  • Green, Sam (2012), Assessing the performance of Premier League goalscorers (Assessing The Performance of Premier League Goalscorers - Stats Perform): perfecciona el model dels Expected Goals (xG), valorant no només les ocasions, sinó també la seva qualitat. El model s’ha anat complicant, però en aquell moment incloïa el nombre de xuts, la posició en el camp del xutador i qui era aquest.
  • Damour, Gabriel and Philip Lang (2015), Modelling football as a Markov Process, Degree Project, Royal Institute of Technology, Stockholm: Intent d’aplicar la Teoria de Markov sobre cadenes seqüencials als esdeveniments característics d’un partit de futbol (passis a l’àrea, centrades, tirs lliures, corners, gols). Aquesta aproximació és bona per a esports amb interrupcions constants, però no tan en el futbol, que flueix durant minuts.
  • Kharrat, Tarak (2016), A Journey across football modelling with application to algorithmic trading, PhD Thesis, University of Manchester: Exemple de modelització refinada, no només dels equips, sinó també dels jugadors individuals, dependent del temps de joc i del resultat imperant. Tot això per poder afirmar rotundament “Both models were tested in an algorithmic trading (eufemisme per “betting”) strategy, generating significant positive return to investment”. A guanyar calerons, doncs!


4. RECERCA DE MODELS PER ALS INDICADORS DISCIPLINARIS:

Aquí és on jo m’he divertit més, intentant entendre com eren aquetes dades, quina mena d’ordre subjacent amagaven. Vaig començar representant-les, en funció de les diverses dades disponibles:

  • Variable PARTITS:

Tant els penals(+) com els (-) guarden una bona correlació amb el nombre de Partits:

  1. P(+) = 0,1465*Partits (R2 = 0.9770). Coeficient real: 0,1388 penals/partit
  2. P(-) = 0,1325*Partits (R2 = 0,9805). Coeficient real: 0,1388 penals/partit

Això ve a dir que una bona proporció dels penals, tant si són a favor com en contra, tenen una probabilitat guiada per l’atzar i, per tant, dependrien només del temps transcorregut. Segons això, cada equip hauria de tenir el mateix nombre de Penals a favor que en contra. No obstant, si ens fixem més en detall, veurem que la correlació falla estrepitosament en la banda més important, la dels equips amb molts partits. Si hi afegim una línia de tendència polinòmica, s’observen clarament desviacions sistemàtiques de la linealitat, de signe contrari. Aquestes desviacions s’endevina que són les que depenen de la qualitat de l’equip, com veurem més tard. Els Gràfics 1 i 2 (Penals +/- vs. Partits) representen aquestes correlacions. El Real Madrid hi apareix com un quadrat i el Barça com un triangle, convenció que seguirem en tots els gràfics:

  

  • Variable GOLS(+)/GOLS(-):

Un avantatge important de la variable gols, és que els gols a favor mesuren la qualitat mitjana ofensiva de l’equip contra la qualitat mitjana defensiva de la lliga, mentre que els gols en contra mesuren l’equip com defensa vs. la lliga com atacant. No és forassenyat pensar que puguin estar respectivament relacionats amb els penals a favor i amb els penals en contra. Efectivament:

  1. P(+) = 0,0925*G(+) (R2 = 0.9884). Coeficient real: 0,0974 penals/gol.
  2. P(-) = 0,0972*G(-) (R2 = 0,9899). Coeficient real: 0,0974 penals/gol.

No només les respectives correlacions són bones, sinó que les divergències semblen més aleatòries. Comprovem, doncs, que els Penals rebuts es correlacionen amb indicadors positius de la qualitat com els Gols marcats (tot succeeix en la mateixa àrea), mentre que el Penals concedits ho fan amb els negatius, com els Gols encaixats. Tot  així, els equips amb més partits no són els que millor encaixen. Gràfics 3 i 4 (Penals +/- vs. Gols +/-):

 

  • Variable PUNTS:

Els punts són evidentment un indicador positiu de la qualitat. A priori, un de millor que els gols, ja que són l’objectiu final i els gols serien només un mitjà per aconseguir els punts en joc. Aquell que guanya la lliga no és el que ha marcat més gols, sinó aquell que ha assegurat més punts. Ara ve el problema de com s’adjudiquen els punts. En els 89 anys de Lliga, les victòries han puntuat de forma diferent; els primers 64 anys a 2 punts i els següents 25 anys a 3. Això complica les coses! Probablement caldria segregar la correlació en 2 parts, però no tenim aquesta informació. Només podem normalitzar el nombre total de punts al criteri majoritari, que és el de 2 punts/victòria:

  1. P(+) = 0,1360*Punts (R2 = 0.9950). Coeficient real: 0,1388 penals/punt
  2. P(-) = 0,1184*Punts (R2 = 0,9236). Coeficient real: 0,1388 penals/punt

La seva correlació amb els penals a favor és excel·lent, la millor fins ara. Tot al contrari que per als penals en contra, la qual cosa la línia de tendència afegida ens ajuda a visualitzar. La correlació entre un indicador positiu de la qualitat i un de negatiu no pot ser lineal. La pregunta següent seria: si els penals a favor es relacionen tan bé amb els partits (atzar) com amb els gols+ o els punts (qualitat+) i els penals en contra tan bé amb els partits (atzar) com amb els gols- (qualitat-), de què depenen en realitat? Completament de l’atzar o completament de la qualitat? La resposta és prou senzilla: les variables que utilitzem en cada cas no només no són independents entre sí, sinó que a més els coeficients no són gaire diferents. Per exemple, en una lliga a 2 punts per victòria la relació entre punts i partits d’un equip concret pot variar entre 0 i 2, però la mitjana de tots els equips és exactament 1,00 punts/partit. Ja hem vist com la correlació amb els partits d’ambdós tipus de penals falla molt en la banda alta, en la qual hi ha equips que presenten grans diferències, malgrat haver disputat el mateix nombre de partits. Per contra, la banda baixa de la correlació amb els punts sembla més bona del que és, donat que pels equips amb pocs partits el nombre de punts tendeix al de partits. Gràfics 5 i 6 (Penals +/- vs. Punts (x2)):

  • Variables WON, DRAWN i LOST:

En darrera instància, els punts són una forma d’avaluar les victòries, els empats i les derrotes. Cert que no és una mera convenció, sinó exactament aquella comptabilitat que serveix per a assolir els objectius. No obstant, com que, en comptes d’un indicador +, en tenim un de +, un de – i fins i tot un de neutre, anem a veure què dona de si:

  1. P(+) = 0,2809*W – 0,0020*D +0,0837*L (R2 = 0.9950)
  2. P(-) = 0,0914*W – 0,0325*D + 0,2930*L (R2 = 0,9919)

Les correlacions són molt bones. No les represento, perquè hi ha massa variables per a una gràfica 2D. Però els coeficients no tenen sempre un sentit en la realitat, com veurem més endavant. Tampoc tenim, en aquest moment, uns coeficients teòrics per confrontar-los. Ara bé, pel fet de tenir 3 variables, disminueixen els graus de llibertat i augmenten molt les incerteses. Això fa que els nivells de confiança del 95% siguin molt amples i que sempre hi hagi algun paràmetre sospitós de ser 0. Malgrat que no en podem  treure informació predictiva, perquè no respon a un model teòric, ens ho podem prendre tranquil·lament com una parametrització que ens expressa el màxim ordre subjacent en les dades. La resta seria atzar... o biaix. Ja veurem que després sí que ho acabarem lligant amb el nostre model teòric. 

  • LLEI d’AMSY - Justificació:
Taula 2 (Model - Equacions):

En la taula adjunta intento explicar pas a pas la gestació de la Llei d’AMSY, així com les seves diverses aplicacions, en funció de l’enunciat general, en formulo les equacions que faig servir en aquest estudi. Cal tenir en compte que solc representar 2 equacions en una, en funció de si es prenen els superíndexs + ò -. La versió v0 té 2 variants:

  • LLEI d’AMSY - Qualitat positiva o negativa, només:

onrepresenta un indicador disciplinari positiu (favorable als interessos de l‘equip) o negatiu (contrari als interessos de l’equip), una variable neutra, que expressi la part disciplinària que depèn exclusivament de l’atzar, del temps transcorregut (Partits? Temporades?), una variable d’un sol signe (positiu, en el cas dels punts), és el llindar que marca el canvi de sentit de la qualitat en la Liga (1,00 punts/partit, si les victòries compten 2 punts), és la contribució al pendent de l’atzar distribuït temporalment (Indicador/partit) i és la contribució al pendent de l’excés o defecte de la qualitat (Indicador/variable). Naturalment, resulta negativa.

  1. P(+) = 0,0236*Partits + 0,1146*Punts (R2 = 0.9948). Coeficients reals: 0,0257 penals/partit () i 0,1130 penals/punt ().
  2. P(-) = 0,2190*Partits – 0,0814*Punts (R2 = 0,9914). Coeficients reals: 0,2187 penals/partit () i -0,0799 penals/punt ().
  3. DeltaP = – 0,1961*Partits + 0,1959*Punts (R2 = 0,8770). Coeficients reals: – 0,1929 penals/partit () i 0,1929 penals/punt ().

En ulteriors apartats es faran les valoracions estadístiques pertinents. De moment, les correlacions són molt bones, en tant que capturen la pràctica totalitat de l’ordre subjacent. Pel fet de ser multivariable, no es poden representar aquestes correlacions en 2D. No obstant, em prenc la llicència de camuflar les 2 variables en les proporcions adequades en una única variable virtual, respectivament Punts(+) = 1,000*Partits + 4,854*Punts ò Punts(-) = 1,000*Partits – 0,370*Punts, per poder donar una idea visual de la qualitat de les correlacions. No es poden extreure conclusions quantitatives d’aquests gràfics, donat que el propi càlcul dels límits de confiança depèn del nombre de graus de llibertat, que ha quedat alterat pel subterfugi. Gràfics 7 i 8 (Penals +/- vs. Punts +/-):

  • LLEI d’AMSY - Qualitat + i -, de forma independent:

 on representa una variable de 2 signes (p. Ex.: Gols a favor o en contra) i la mitjana de la Liga (que és la mateixa, tant si la variable és + ò -, lògicament), és la contribució al pendent de l’atzar distribuït temporalment (Indicador/partit) i és la contribució al pendent de la variable positiva o la negativa (Indicador +/- / variable +/-). Naturalment, ambdues resulten positives.

  1. P(+) = 0,0544*Partits + 0,0590*Gols+ (R2 = 0.9941). Coeficients reals: 0,0503 penals/partit () i 0,0621 penals/Gol+ ().
  2. P(-) = 0,0159*Partits + 0,0857*Gols- (R2 = 0,9899). Coeficient real: 0,0428 penals/partit   () i 0,0673 penals/Gol- ().
  3. DeltaP = – 0,0074*Partits + 0,0724*Gols+ – 0,0672*Gols- (R2 = 0,8472). Coeficients reals: 0,0075 penals/partit (), 0,0621 penals/Gol+ () i – 0,0673 penals/Gol- ().

En ulteriors apartats es faran les valoracions estadístiques pertinents. De moment, les correlacions són molt bones, en tant que capturen la pràctica totalitat de l’ordre subjacent. Pel fet de ser multivariable, no es poden representar aquestes correlacions en 2D. No obstant, em prenc la llicència de camuflar les 2 variables, en les proporcions adequades, en una única variable virtual, en ambdós casos: Gols(+) = 1,000*Partits + 1,084*Gols+ ò Gols(-) = 1,000*Partits + 5,391*Gols-, per poder donar una idea visual de la qualitat de les correlacions. No es poden extreure conclusions quantitatives d’aquests gràfics, donat que el propi càlcul dels límits de confiança depèn del nombre de graus de llibertat, que ha quedat alterat pel subterfugi. Gràfics 9 i 10 (Penals +/- vs. Gols +/-):

  • LLEI d’AMSY – Conversió a les variables de resultats dels partits (Won, Drawn, Lost):

Tenint en compte que tant la variable de Partits com la de Punts es poden expressar en funció dels 3 possibles resultats d’un partit (i) on n pot ser 2, 3 ò el valor mitjà corresponent, aquest cas de la Llei d’AMSY es pot expressar d’aquesta altra forma:, de la qual podem derivar els 3 casos particulars següents:

  1. n=2,00, r0=1,0000, m’=0,1388, m+=0,1130, m-=-0,0799 => 0,2518/0,1388/0,0258 i 0,0589/0,1388/0,2187
  2. n=2,37 i r0=1,1416, m’=0,1388, m+=0,0906, m-=-0,0463 => 0,2503/0,1260/0,0353 i 0,0818/0,1454/0,1917
  3. n=3,00 i r0=1,3810, m’=0,1388, m+=0,0735, m-=-0,0639 => 0,2578/0,1108/0,0373 i 0,0353/0,1632/0,2271

Ara que tenim uns coeficients teòrics derivats del nostre model, podem contrastar-los amb els obtinguts anteriorment mitjançant la regressió multivariable WDL. Sense entrar encara en les valoracions estadístiques, només dir de nou que els Nivells de Confiança del 95% resulten ser tan amples, que engloben incongruències i resulten impracticables a l’hora de fer prediccions. Per exemple: en els Penals a Favor, els 3 casos són compatibles amb els Nivells de Confiança del 95%, però dels coeficients obtinguts no se’n deriven uns paràmetres congruents entre si. En els Penals en Contra hi ha una major congruència, però només el cas n=2 resulta compatible. Tot plegat, malgrat les boes correlacions, la capacitat de predicció d’aquestes equacions serà molt dolenta.

Pel fet de ser multivariable, no es poden representar aquestes correlacions en 2D. No obstant, em torno a prendre la llicència de camuflar les 3 variables, en les proporcions adequades per al cas N=2, l’únic que presenta coherència completa, en una única variable virtual, en ambdós casos: Punts WDL2(+) = 0,2518*Won + 0,1388*Drawn + 0,0258*Lost ò Punts WDL2(-) = 0,0589*Won + 0,1388*Drawn + 0,2187*Lost, per poder donar una idea visual de la qualitat de les correlacions. No es poden extreure conclusions quantitatives d’aquests gràfics, donat que el propi càlcul dels límits de confiança depèn del nombre de graus de llibertat, que ha quedat alterat pel subterfugi. Gràfics 11 i 12 (Penals +/- vs. Won-Drawn-Lost (x2) +/-):

  • LLEI d’AMSY – Regressió amb variables específiques ponderades:

Una alternativa per representar les equacions de la Llei d’AMSY en funció d’una sola variable és la d’emprar els valors específics de la variable de qualitat, respecte a la de quantitat:onseria l’única variable (punts/partit) oonseria l’única variable (gols/partit, a favor o en contra). Aquestes correlacions surten sempre més malament, donat que atribueixen el mateix pes a tothom que comparteix una proporció, quan hem vist que no és el mateix, per exemple, un equip que en 1 partit hagi fet 2 punts, que un altre que en 1000 partits n’hagi fet 2000, de punts. Per això, hi afegim una ponderació per a cada equip, en funció del nombre de partits. 

  1. P(+)/Partit = 0,0409 + 0,0857*Punts/Partit (R2 = 0.5898). Coeficients reals: 0,0353 penals/partit () i 0,0906 penals/punt ().
  2. P(-)/Partit = 0,2018 – 0,0552*Punts/Partit (R2 = 0,2613). Coeficients reals: 0,1917 penals/partit () i -0,0463 penals/punt ().
  3. DeltaP/Partit = – 0,1609 + 0,1409*Punts (R2 = 0,6332). Coeficients reals: – 0,1564 penals/partit () i 0,1370 penals/punt ().
  4. P(+)/Partit = 0,0585 + 0,0563*Gols+/Partit (R2 = 0.5726). Coeficients reals: 0,0503 penals/partit () i 0,0621 penals/Gol+ ().
  5. P(-)/Partit = 0,0531 + 0,0601*Gols-/Partit (R2 = 0,2485). Coeficient real: 0,0428 penals/partit () i 0,0673 penals/Gol- ().
  6. DeltaP/Partit = – 0,0239 + 0,0763*Gols+/Partit – 0,0595*Gols- (R2 = 0,7377). Coeficients reals: 0,0075 penals/partit (), 0,0621 penals/Gol+ () i – 0,0673 penals/Gol- ().

En ulteriors apartats es faran les valoracions estadístiques pertinents. De moment, tot i que els coeficients tenen força sentit, les incerteses són tan enormes que inhabiliten aquesta alternativa per la funció que ens proposem.

 

5. ANÀLISI ESTADÍSTICA:

Per validar un model teòric no n’hi ha prou amb una bona R2. Cal seguir els següents criteris (manllevats de “R Cookbook, J.D. Long & Paul Teetor”):

  • Is the model statistically significant? Check the F statistic. Veure la columna p-value de la taula: valors p de la funció F, que segons l’Anàlisi de les Variances han de ser el més baixos possible. Excepte les corresponents a variables específiques, que tenen valors diferents de zero, tot i que encara molt baixos (el més alt és 3,2E-0,5 que, tot i aparèixer en groc, encara és correcte), tota la resta són zero.
  • Are the coeficients significant? Check the coefficient’s t statistics and p-values, or check their confidence intervals. Veure la columna H0 (5%) de la taula: els valors p de la funció t ens permeten rebutjar la hipòtesi nul·la amb el 95% de confiança per a cadascun dels coeficients (Rejected, que significa que cap dels coeficients té probabilitat de ser 0), acceptar-la per a tots ells (Accepted, que significa que tots ells la tenen) o només per una part d’aquests coeficients, mentre que per l’altra no es podrà descartar que siguin 0 ò que no intervinguin en la relació (Partly). Excepte en algunes correlacions amb Partits i Gols, la H0 és amplament rebutjada.
  • Is the model useful? Check the R2. Veure Columna R2 dels diferents càlculs de regressió i la d’ Error (%) amb els respectius errors Standard associats. Amb l’excepció d’algunes correlacions emprant variables específiques, tots els valors són R2>0,85. En concret les 4 principals derivades de la Llei d’AMSY són R2 ≥0,9899, la qual cosa correspon a un Error Standard ≤10,1%.
  • Does the model fit the data well? Plot the residuals and check the regression diagnostics. Veure columna LCL-UCL (95%), en la qual es comparen els coeficients teòrics del model amb els rangs obtinguts de les regressions, per si tots ells són coherents (DINS), cap ho és (FORA) o ho són en part (PARCIAL). En el cas dels models derivats de la Llei d’AMSY, tots els coeficients són coherents amb els nivells de confiança respectius. Per contra, la majoria de les altres correlacions obtenen uns coeficients que no observen coherència amb els reals, la qual cosa constitueix un motiu de pes per a rebutjar-les com models.
  • Does the data satisfy the assumptions behind linear regression? Check whether the diagnostics confirm that a linear model is reasonable for your data. Crec que, en el tema sota estudi, la linealitat dels models teòrics que descriguin la distribució de qualsevol indicador disciplinari, per discernir si la seva incidència real és justa i equitativa o, per contra, existeix algun biaix, no és una hipòtesi per verificar, sinó una premissa exigible. En qualsevol model, una desviació de la linealitat no seria acceptable des del punt de vista de l’equitat i constituiria un biaix en si mateixa.

A continuació la Taula 3 (Resum Models & Valoració Estadística – La Liga_89 anys) amb el resum de totes les alternatives analitzades: DADES, MODELS DE CÀLCUL, COEFICIENTS TEÒRICS, COEFICIENTS CALCULATS, VALORACIÓ ESTADÍSTICA, OUTLIERS. Pròpiament en la Valoració Estadística, a banda de les columnes esmentades, s’hi inclouen les desviacions reals dels models, tant en absolut (# Penals), com en relatiu (%), tant pels Penals +/-, com per la diferència, per comprovar la coherència amb els Errors Standard calculats. També la contribució dels principals Outliers en aquestes desviacions, per comprovar si algun d’ells se n’enduu la major part. D’entre les diverses formulacions de la Llei d’AMSY, aquella que passa tots els filtres sense màcula és la de Partits & Punts (emmarcada en vermell), que és la que emprarem  partir d’ara per defecte. La de Partits & Gols +/- dona unes correlacions gairebé tan bones, només que algun paràmetre podria ser zero. No cal dir que les prediccions fetes en base al # de Gols+/- beneficiarien al Barça, però a banda d’obtenir la millor valoració estadística, el còmput de Punts també avantatja el dels Gols +/- en el judici de valor teòric: els bons equips marquen més gols i en reben menys, és clar; d’aquí la bona correlació, però només llueixen la seva  màxima qualitat fins que han assegurat els Punts. Per contra els equips febles serien capaços de marcar gols, però no tants com per protegir els Punts inicials. Els Punts són indiscutiblement l’objectiu i els Gols+/- serien “només” el mitjà per assolir-lo; per tant, aquells constitueixen per força un millor indicador de la qualitat d’un equip que aquests.

     



6. CONTRAST EN ALTRES LLIGUES:

Abans d’emprar la Llei d’AMSY per fer prediccions amb liberalitat, és preceptiu comprovar si es tracta d’un correlació local o, segons les pretensions de l’enunciat general, gaudeix d’un potencial d’aplicació universal per les competicions esportives. Per escometre aquesta validació, recorrem a les altres 4 lligues principals europees: la Premier League anglesa, la Bundesliga alemanya, la Serie A italiana i la Ligue 1 francesa. Com ha quedat dit, no hem trobat dades d’indicadors disciplinaris que cobrissin tota la història de les respectives Divisions d’Honor. Tan sols hem trobat el mateix indicador disciplinari (Penals +/-), però referit a un nombre de Temporades molt menys significatiu (28 anys per la Premier League i només 14 per les altres). Addicionalment s’han trobat les dades d’un altre indicador disciplinari, però només la meitat del model. Em refereixo a les targetes rebudes pels integrants de l’equip propi i que, per tant, es tractarien com un indicador disciplinari negatiu (TG-, TV-), variable per a cada equip i que no inclou les targetes rebudes pels equips oponents. Com que l’àmbit temporal és radicalment diferent (13 anys), eixamplarem la validació a la pròpia Liga española. Aquestes 5 validacions, doncs, de ser favorables, suposarien l’homologació provisional (a l’espera d’una revisió experta independent) de la Llei d’AMSY i dels models que se’n deriven. A continuació annexaré les dades, els resultats i la valoració estadística, feta en els mateixos termes que l’anterior.

  • Taula 4 (Resum Models & Valoració Estadística – Premier League_28)

  • Taula 5 (Resum Models & Valoració Estadística – Bundesliga_14):   

  • Taula 6 (Resum Models & Valoració Estadística – Serie A_14):
 

  • Taula 7 (Resum Models & Valoració Estadística – Ligue 1_14):   

  • Taula 8 (Resum Models & Valoració Estadística – Liga_14):


7. RESULTATS. DIFERÈNCIES RM-FCB:

  • Taula 9 (Dades i Resultats – Liga_89  anys_>1000 Punts):   


8. VALORACIÓ ESTADÍSTICA D’AQUESTES DIFERÈNCIES:

  • Taula 10 (Valoració diferències RM/B_89 anys):



9. ESPECULACIONS SOBRE LA REALITAT SENSE BIAIX (PUNTS?):

  • Incidència dels penals: com he valorat la probabilitat de guanyar o perdre punts a partir  de les “reparacions” del biaix en forma de Penals +/- afegits o eliminats?

  1. Penals a favor: DPunts = -DPenals(+) * Probabilitat de marcar (Lliga) * (Drawn * (Nombre punts x victòria – 1) + Lost * 1) / Partits.
  2. Penals en contra: DPunts = -DPenals(-) * Probabilitat de marcar (Lliga) * (Won * (Nombre punts x victòria – 1) + Drawn * 1) / Partits.

Assumeixo en ambdós casos que sempre s’està a 1 gol de la incidència en els punts, la qual cosa és una aproximació no exacta i que dona resultats per excés. Com que estem especulant, fora ja de l’àmbit rigorós, ho deixo així.

  • Taula 11 (Càlcul de les reparacions en penals i punts_1 iteració):


10. ESPECULACIONS SOBRE LA REALITAT SENSE BIAIX (LLIGUES?)

  • Tal com ha quedat dit, amb les dades a l’abast no es pot bastir cap model satisfactori per la predicció del nombre de títols obtinguts. Això no obstant, he fet servir 5 models que, empíricament, s’hi aproximen de forma raonable, en particular les dues primeres, que prenc com a referència. Cap d’ells resol bé el diferent nombre de lligues disputades, ni el diferent nombre de punts disputats en cadascuna de les lligues. Cal agafar, doncs aquestes prediccions amb pinces i només tindria algun valor qualitatiu allò que sortís de forma coherent en ambdues:

  1. Parametrització en funció del nombre de Victòries, Empats i Derrotes (expressats com Punts * per poder obtenir un Gràfic 2D).
  2. En funció de la diferència de Gols.
  3. En funció del nombre de Punts º (1 x Victòria / 0 x Empat / -1 x Derrota, model equivalent al conegut x2, però procurant eliminar l’ordenada a l’origen).
  4. En funció del nombre de Punts º/Partit, ponderat pel # de Partits.
  5. En funció del nombre de Punts x3

  • Proposta de model per a una millor predicció del nombre de lligues guanyades:

  1. Valoració dels punts, per absorbir les diferències en la valoració de les Victòries i per ajustar l’ordenada a l’origen a zero: Won = 1 / Drawn = 0 / Lost  = -1.
  2. Puntuació específica per temporada jugada per cada equip en 1a Divisió.
  3. Normalitzar-la en funció del màxim nombre de punts de cada temporada, per eliminar la influència del nombre d’equips contendents.
  4. Correlacionar el nombre de títols no només amb la mitjana dels valors obtinguts a c., sinó amb la seva desviació Standard, per reflectir el benefici addicional de ser molt constant, si estàs a dalt, o de fer esporàdicament una bona temporada, si estàs a baix.
  5. Ponderar els valors de cada equip en funció del nombre de temporades, per reflectir el nombre de títols als quals aspira.

  • Taula 12 (Intent de Modelització del nombre de títols_5). Sotmeto tots aquests models al mateix escrutini estadístic descrit, que no tots superen i els que ho fan arrosseguen encara errors importants. Es comparen els 5 majors Outliers de cada Lliga, segons els 2 millors Models, on s’observa alguna tendència concordant:



11. EXISTEIXEN BIAIXOS ARREU?

Adjunto taules de resum per lliga: els percentatges al capdavall de les columnes representen l’error en la descripció de la realitat per a cada indicador. Els valors amb fons verd són els específics per partit, mentre els de fons taronja són els coeficients de les equacions AMSY de punts i de gols per la predicció de penals:

  • Bundesliga: Veure Taula 13 (Bundesliga_14 anys) adjunta. Per als 5 equips amb més punts acumulats, guanyadors de les 14 lligues jugades (-8 jornades), només dues cel·les criden l’atenció: els penals del Bayer Leverkusen, que només es queda en “sospitós” (P-), i les TG- del Borussia Dortmund, que serien les d’un Outlier per dispersió, però en l’indicador més lleu. Allò que destaca poderosament és l’ajust exquisit al model del Bayern München, gran dominador de la Bundesliga, aparentment per mèrits propis.


  • Premier League: Veure Taula 14 (Premier League_28 anys) adjunta. Per als 7 equips amb més punts acumulats, guanyadors de 26 de les 28 lligues registrades (-9 jornades), unes quantes cel·les criden l’atenció: els penals de l’Arsenal (P-), del Chelsea (P-), del Liverpool (P+), possibles Outliers per dispersió, i del Tottenham Hotspur, només “sospitós” (P-). Les targetes del Liverpool, Outlier per dispersió+pronòstic, força clar i per duplicat (TG-, TV-) i les de l’Arsenal, per dispersió. En conjunt, el Liverpool i l’Arsenal serien els equips que en sortirien més ben i mal parats, respectivament, mentre que, de nou, els registres del ManU, dominador de la Premier, encaixen perfectament amb el model.

 

  • Ligue 1: Veure Taula 15 (Ligue 1_14 anys) adjunta. Per als 5 equips amb més punts acumulats, guanyadors de 12 de les 14 lligues registrades (-18 jornades), unes quantes cel·les criden l’atenció: els penals de l’Olympique Marseille (P+), de l’Olympique Lyonnais (P-), Outliers per dispersió + pronòstic, i del Paris Saint Germain, només “sospitós” (P-). Les targetes de l’Olympique Marseille, només “sospitós” (TV-). En conjunt, l’equip de Marseille en seria el més perjudicat. En aquest cas, el Paris Saint Germain, dominador de la Ligue 1, en surt ben parat, però no supera el nivell de “sospita”.

  

  • Serie A: Veure Taula 16 (Serie A_14 anys) adjunta. Per als 5 equips amb més punts acumulats, guanyadors de les 14 lligues registrades (-10 jornades), unes quantes cel·les criden l’atenció: els penals de l’AC Milan (P+), Outlier per dispersió + pronòstic, i del Napoli, només “sospitós” (P-). Les targetes de l’Internazionale (TG-), de la Roma (TV-) i del Napoli (TV-), només al nivell de “sospitosos”. En conjunt, hi ha poca incidència i en cap cas afectaria a la Juve, dominadora de la Serie A.

    

  • Liga: Veure Taula 17 (Liga_14 anys) adjunta. Per als 7 equips amb més punts acumulats, guanyadors de 14 lligues registrades (-10 jornades), unes quantes cel·les criden l’atenció: els penals de l’Atlético Madrid (P+), del València (P-), Outliers per dispersió + pronòstic, i del Real Madrid (P+), Outlier pel pronòstic sense ell. Les targetes del Barcelona (TG-) i de l’Atlético Madrid (TG-), Outliers per dispersió.


12. APM?

  • Taula 18 (Dades i Resultats – Liga_89 anys_PPCC + Euzkadi_>200 Punts):     

  • Si heu tingut la paciència d’arribar fins aquí o heu reaccionat al repte que us he llançat, heus aquí la sorpresa que us havia promès: si segreguem els clubs que es podrien assignar als Països Catalans i Euzkadi (hi estiguin d’acord els clubs o no. Allò que importa no és la pròpia percepció, sinó la d’aquells que apliquen la disciplina), resulta que un col·lectiu de clubs que, entre tots, sumen el 42% dels Punts i el 47% dels títols de Lliga, malgrat acreditar una qualitat per damunt de la mitjana (1,043 Punts/Partit, a 2 Punts/Victòria), arrossega un dèficit de 132 Penals +/-! La qual cosa implica, per suposat, que la resta d’equips, amb una qualitat per dessota de la mitjana (0,972 Punts/Partit) es beneficia d’un superàvit de 132 Penals. Excepcions amb superàvit clar: RCD Espanyol, Hèrcules d’Alacant, Elx i Eibar. De nou, seria interessant de veure si la resta d’indicadors disciplinaris confirmen el biaix o el dilueixen.


Cap comentari:

Publica un comentari a l'entrada

 SOBRE LA JUSTÍCIA EN EL FUTBOL (3B) - SUMMARY (ON JUSTICE IN ASSOCIATION FOOTBALL (3B)) ANNEX: ANÀLISI ESTADÍSTICA DEL PERÍODE QUE ENGLOBA ...