Cómo LaLiga defendió el big data para revolucionar el análisis de datos en el fútbol
Todos sabemos datos Es la nueva moneda, y sus aplicaciones análisis de datos Aparentemente interminable. Las industrias de toda la economía han estado dispuestas a adoptar big data y análisis, pero lo han hecho con diversos grados de éxito.
El fútbol es un campo donde los datos están en todas partes. De hecho, el uso de análisis de datos es generalizado, ya sea para identificar las diferentes etapas del juego durante un partido o medir el rendimiento de los jugadores, o incluso establecer objetivos de transferencia.
Hay innumerables puntos de datos disponibles para entrenadores, presentadores, comentaristas, expertos y ejecutivos de toda la industria que procesan números y los traducen en información.
Pero hay métricas fuera del campo que la industria del fútbol no tiene tanto éxito en traducir en información real. LaLiga, la primera división de España, busca capitalizar las oportunidades de los datos dentro y fuera del campo.
Aprovecha los ríos de datos
Para aprovechar al máximo los ríos de datos sin explotar que fluyen a través del fútbol, la liga creó LaLiga Tech como una filial que se esfuerza por capturar y procesar los datos generados en todos los aspectos de la competencia anual, y la organización brinda un análisis detallado de las equipaciones realizadas. en la liga
dice Fermin Martinez, Chief Data Engineer en Business Intelligence and Analytics en La Liga Tech.
Fermín Martínez
Martínez trabaja como ingeniero de datos sénior para Business Intelligence and Analytics en La Liga Tech. Se unió a la suborganización de la liga en 2018 y ha sido fundamental en sus esfuerzos por maximizar los grandes datos en el fútbol.
«Pero no se trata solo de obtener los datos, debe poder unir todos los datos. Para obtener información real, debe reunir muchas fuentes diferentes y mezclarlas.
«El verdadero impulsor es poder dar valor a los clubes y fanáticos. Para hacer algo con esos datos, necesitamos una plataforma. Necesitamos el lago de datos que usamos de Databricks, pero también necesitamos aplicar tecnologías de procesamiento de datos. ”
Colabore con datos fuera del campo
Antes de que se creara LaLiga Tech hace cinco años, los clubes procesaban sus propios datos y creaban análisis de forma aislada. Martínez dice que si bien esto ha sido útil para cada club individualmente, no puede proporcionar información de la que sería capaz un modelo de datos más grande.
Con 20 clubes proporcionando hasta 25 puntos de datos por segundo a lo largo de los partidos, este volumen de datos debe almacenarse y procesarse en algún lugar. En el caso de LaLiga Tech, esto se presentó en forma de un lago de ladrillos de datos donde, dice Martínez, los datos que se originan en diferentes fuentes se pueden «mezclar» y se pueden generar conocimientos.
«Antes de empezar con Databricks, la mayoría de los departamentos dentro de LaLiga trabajaban con diferentes proveedores, esos proveedores eran los únicos que tenían acceso a los datos. Como resultado, los datos estaban ahí pero no había comunicación entre una fuente y otra porque no había comunicación entre los equipos.
«Hablamos de datos y de cómo los datos importan. Obviamente, necesitamos reunir todos estos datos en algún lugar. Un lago de datos es donde van todos los datos. Con Databricks podemos separar los datos que recibimos en varios estados. Tenemos un área de ensayo dentro un lago Estos datos, es un área de procesamiento donde comenzamos a preparar los datos, y tenemos un área de consumidor final donde se sirven los datos».
Proporcionar datos al mundo del deporte
A través de estos análisis, LaLiga Tech puede proporcionar información a los jugadores y a la gerencia sobre la probabilidad de lesión de un jugador, el estilo de juego al marcar un gol y, durante una pandemia, la probabilidad de que los jugadores se transmitan COVID-19 entre sí durante un partido.
Para clubes y emisoras, los datos generados brindan el mejor momento para comenzar a promocionar los boletos de temporada del próximo año. Insights también revelará eventos que suceden durante un partido, como tarjetas amarillas y goles, que pueden hacer que las personas sintonicen el juego.
Según Martínez, estas ideas no son solo para el fútbol y se pueden aplicar a cualquier deporte, desde el rugby, el tenis y el baloncesto. «Tendremos que usar algunas fuentes de datos diferentes, pero el proceso será más o menos el mismo”, dice Martínez. «Ahora podemos usar lo que hemos construido para aplicarlo a diferentes ligas alrededor del mundo.
«نريد أن نجمع ما بنيناه وأن نكون قادرين على تطبيقه في مسابقة التنس ، أو الألعاب الأولمبية. إذا تحدثنا عن تتبع مركز لاعب 25 مرة في الثانية ، فهذا شيء يمكن للعديد من الرياضات الاستخدام. قد تكون الاستنتاجات التي نحصل عليها مختلفة ولكن معالجة المعلومات تبقى كما ella «.