Echtzeitanalyse und Visualisierung des Teamverhaltens in Fussballspielen auf der Basis von kontinuierlichen Sensordatenströmen (Bachelor Thesis, Finished)

Author

Frederik Brix

Description

In den letzten Jahren haben viele Profi-Fussballmannschaften und Nachwuchszentren damit begonnen, ihre Spieler und Trainingsgelände mit Positionssensoren, Antennen, Kameras und weiteren Messsystemkomponenten auszustatten. Ziel dieser Messsysteme ist es, in Echtzeit die aktuellen Positionsdaten der Spieler und des Balls zu erhalten. Die genauen Verfahren zur Erlangung der Positionsdaten unterscheiden sich in ihren technischen Details stark. So nutzen einige Systeme Hardwaresensoren, die, gemäss der „Internet der Dinge“-Vision, entweder direkt oder mit Hilfe einer Smartwatch ihre Messwerte kabellos weitersenden können. Andere Systeme extrahieren die Positionsdaten in Echtzeit aus Live-Kamerabildern. Wieder andere Systeme setzen auf ein Hybrid aus beiden Ansätzen. Alle Messsysteme haben jedoch gemeinsam, dass sie Positionsdatenströme erzeugen. Für diese Bachelorarbeit treffen wir deshalb die Annahme, dass für jeden Spieler und den Ball ein kontinuierlicher Datenstrom existiert, dessen Elemente jeweils einen Positionsmesswert enthalten.

Die vom Messsystem erzeugten Positionsdatenströme können empfangen und visualisiert werden. Obwohl das Trainerteam und die einzelnen Spieler bereits von diesen rohen Positionsdaten profitieren können, zeigt sich das ganze Potential der Positionsmessungen erst, wenn die Rohdaten zuvor von einem Echtzeit-Datenstrom-Analyse-System gefiltert, verarbeitet und analysiert werden.

Die Forschungsgruppe Datenbanken und Informationssysteme (DBIS) der Universität Basel hat PAN entwickelt. PAN ist ein solches Echtzeit-Datenstrom-Analyse-System. Genauer gesagt, ist PAN ein Complex Event Detection (CED) System, das die rohen Positionsdatenströme in einem Analyse-Workflow bestehend aus mehreren Workern analysiert um sogenannte Complex Events (wie zum Beispiel eine Ballberührung) zu detektieren und Aggregate (wie zum Beispiel Ballbesitzstatistiken oder Heat-Maps) zu erzeugen. Bisher wurden allerdings nur Worker und Analyse-Workflows implementiert, die vergleichsweise einfache Analysen durchführen, um PAN’s Eigenschaften zu evaluieren. So gibt es bisher lediglich einen Workflow, der Ballberührungen erkennt und Ballbesitzstatistiken (mit unterschiedliche Zeitfenster) berechnet, und einen weiteren Workflow, der Heat-Maps eines Spielers (mit unterschiedlichen Auflösungen und unterschiedlichen Zeitfenster) generiert.

Sowohl das Trainerteam als auch die Spieler würden jedoch noch viel mehr davon profitieren, wenn komplexe Analysen des Teamverhaltens durchgeführt werden würden, die es ermöglichen zu erkennen ob sich die Spieler an eine zuvor definierte Taktik halten (wie zum Beispiel ob die Mittelfeldspieler mit genügend Pressing reagieren, wenn in der gegnerischen Hälfte der Ball verloren wurde) und welche Taktik das gegnerische Team durchführt (wie zum Beispiel ob die gegnerische Abwehr Abseitsfallen stellt). Obwohl die Fussballverbände momentan noch etwas zögerlich bei der Zulassung der Messsysteme im Liga- und Wettbewerbsbetrieb sind, erwarten wir, anlässlich der aktuellen Entwicklungen (wie zum Beispiel der Einführung der Torlinientechnik), dass es in der Zukunft möglich sein wird die Positionsdaten auch während eines „richtigen“ Spiels zu erhalten. Um schon während solchen wichtigen Spielen direkt Analyseresultate zu erhalten, die dem Trainer sofort dabei unterstützen Taktiken umzustellen oder Spieler auszuwechseln, müssen die Analysen in Echtzeit durchgeführt werden.

Da es PAN ermöglicht beliebige Worker in Java zu implementieren und diese zu beliebigen Analyse-Workflows zu kombinieren, kann man mit PAN beliebig komplexe und damit auch Teamverhaltens-Analysen durchführen. Im Rahmen dieser Bachelorarbeit soll eine Demo-Anwendung realisiert werden, die mithilfe von PAN in Echtzeit komplexe Analysen des Teamverhaltens der Spieler in einem Fussballspiel durchführt, die Ergebnisse ansprechend visualisiert und so demonstriert welche Möglichkeiten Datenstromanalyse in Sportszenarien im Allgemeinen und PAN im Speziellen bietet.

Grundlage der Arbeit bilden aufgezeichnete Datenströme, die mit dem LPM-System erzeugt wurden.

Die Arbeit umfasst folgende Elemente:

  1. Ausarbeitung des Szenarios
    • Welche Annahmen haben wir an das Szenario / das System? (Latenz, Fehler, etc.)
    • Welche Analysen sind sinnvoll und sollen durchgeführt werden?
    • Wie können die Analyseresultate präsentiert werden?
  2. Beschreibung/Diskussion der Konzepte/Ideen, die in den Workern (bzw. in den Workflows) für die Analyse verwendet werden
  3. Implementierung der benötigten Worker und Definition der Workflows. Dabei sollte auf die Wiederverwendbarkeit und Erweiterbarkeit der Workflows geachtet werden.
  4. Verteiltes Deployment der Worker
  5. Falls nötig: Erweiterungen für / Änderungen an PAN
    • z.B.: Push-basierte statt pull-basierte Kommunikation zwischen den Workern
  6. Implementierung einer plattform-unabhängigen Visualisierung der Analyseresultate
  7. Evaluation der Demo-Anwendung
  8. Erstellung eines (kurzen) Demo-Videos
  9. Optional: Deployment auf der Basis von Raspberry Pis
    • Erstellen eines weniger rechenintensiven Workflows (inkl., wenn nötig, abgespeckter Worker)
    • Deployment der Worker auf Raspberry Pis
    • Evaluation
    • Diskussion welche Analysen auf den Raspberry Pis möglich sind, welche nicht und warum

Start / End Dates

2016/03/01 - 2016/06/30

Supervisors

Research Topics