Simulationstudie zur Schätzung von Teilnehmerzahlen bei Demozügen – Teil 1

In den letzten Monaten haben wir umfangreiches Bildmaterial von ganz verschiedenen Demonstrationen gesammelt, sodass wir nun in einer Reihe von Simulationsstudien verschiedenen Fragestellungen zur Problematik des Schätzens von Teilnehmerzahlen etwas näher nachgehen können.

An dieser Stelle soll nun versucht werden, ein paar wichtige Einsichten bzw. Beobachtungen zum Problem der Schätzung der Teilnehmerzahl aufgrund des teilweisen Auszählen eines Demozuges nachgegangen werden.

Dies ist in zweierlei Hinsicht von größerem Interesse:

  1. Es lassen sich so gewisse Rückschlüsse darüber ziehen, inwiefern eine unmittelbares und teilweises Auszählen von Demozügen vor Ort und Stelle zu validen Schätzergebnissen führen kann.
  2. Ähnlich lassen sich so verbesserte (Schätz-)Methoden der nachträglichen Auswertung von Videos ermitteln, sodass sich so der enorme Aufwand der vollständigen Auszählung eines Videos unter Umständen vermeiden lässt durch das Beschränken auf das Auszählen von Teilen des Videos.

Dazu sollen hier als Beispiele der jeweilige Demozug der 26. und 27. Pegida betrachtet werden, für welche wir zusammen mit der Studentengruppe Durchgezählt Teilnehmerschätzungen vorgenommen haben, siehe dazu unsere Artikel für die 26. Pegida am 11.05.2015 und die 27. Pegida am 18.05.2015, sowie die beiden  dazu korrespondierenden Artikel der Studengruppe für die 26. Pegida und 27. Pegida.

Für beide Pegidas zählten wir jeweils mittels des Markierens von einzelnen Personen, welche eine „Zielgerade“ überschritten, aus, wie viele Menschen am Demozug teilnahmen:

Zur besseren Unterscheidung der beiden Videos bzw. zur Berücksichtung des Aufnahmeortes, wird das Auswertevideo der 26. Pegida im nachfolgenden als „Terrassen-Video“ bezeichnet, da es von der Studentengruppe von den Brühlschen-Terrassen herab aufgenommen wurde bzw. der Demozug diese im Video passiert.

Im Gegensatz dazu, sei das andere Video als „Brücken-Video“ bezeichnet, da es das Betreten der Augustusbrücke durch den Demozuges der 27. Pegida zeigt.

Aus den beiden Videos bzw. den Markierungen im Video lässt sich jeweils eine Zeitreihe erstellen, wann in welchem Frame wie viele Personen durchliefen. Aus diesen Daten lässt sich jeweils eine erste Personenstrom-Analyse vornehmen:

flow_movavg_10sec_pegida26
Personenstrom des Demozuges im Terrassenvideo
flow_movavg_10sec_pegida27
Personenstrom des Demozuges im Brückenvideo

Vergleicht man die beiden Personenströme so fallen gleich mehrere Dinge auf:

  1. Auf der Brücke werden dauerhauft hohe Ströme erreicht – bei in etwa gleicher Anzahl an Personen, durchqueren auf der Brücke mehr Menschen pro Zeitintervall die Messlinie als an der Terrasse.
  2. Während im Terrassenvideo das Maximum am Beginn des Demozuges liegt, wird dieses in Brückenvideo eher in der Mitte des Zuges erreicht.
  3. Auch fluktuiert der Demozug im Terrassenvideo wesentlich stärker als im Brückenvideo.

 

Aufgrund dieser unterschiedlichen Charakteristika bei in etwa gleicher Personenanzahl eignen sich die Daten aus beiden Auswerte-Videos zur Untersuchung der folgenden Schätzmethode:

  1. Von einem bestimmten Startzeitpunkt t_0 an, werden für einen gewissen Zeitraum \Delta t alle Personen gezählt, sagen wir n Menschen, welche die blaue Linie überschreiten.
  2. Gleichzeitig wird der eigentliche Dauer \Delta T des Demozuges gemessen.
  3. Aus der Dauer des Zuges  \Delta T und der für das Messintervall gezählten Menschen n, lässt sich die tatsächliche Anzahl an Teilnehmer am Demozug  N  durch Hochrechnen schätzen, d.h. \hat{N}=n \times \frac{\Delta_T}{\Delta t}  .

Dieser Schätzmethode liegt offensichtlich die Annahme zugrunde, dass der für ein kleineres Zeitinverall bestimmte mittlere Personenstrom gleich dem mittleren Personenstrom für den gesamten Personenstrom ist, d.h. \frac{\hat{n}}{\Delta t}\approx\frac{N}{\Delta_T} . Wie sich aber schon aus den beiden obigen Personenstromdiagrammen andeutet, ist diese Annahme nur bestimmte Messzeitintervalle tatsächlich erfüllt.

Um nun diesen Sachverhalt ein wenig näher zu betrachten, werden in einem ersten Schritt zuerst Messintervalle mit einer der Dauer von 30 Sekunden betrachtet, wobei der Startzeitpunkt frei über den gesamten Zeitverlauf variiert wird.  Durch Simulation aus den Daten resultieren die beiden folgenden Diagramme.

slidingwindow_30sec_pegida_26
In Abhängigkeit vom Startzeitpunkt jeweils resultierende Schätzung für das „Terrassenvideo“ bei einem Messfenster von 30 Sekunden.

Aus dem Diagramm lässt sich deutlich erkennen, dass für viele Startzeitpunkte die resultierende Schätzungen weit außerhalb akzeptabler Fehlerschranken von 10% bzw. 20% befinden. Gerade eine Messung am Anfang des Demozuges würde zu Fehlschätzungen um den Faktor 2 bis 3 führen, während im mittleren Verlauf die Fehler eher um den den Faktor 0.5 bis 1.5 bewegen.

slidingwindow_30sec_pegida_27

In Abhängigkeit vom Startzeitpunkt jeweils resultierende Schätzung für das „Brückenvideo“ bei einem Messfenster von 30 Sekunden.

Deutlich verschieden dazu das zweite Diagramm. Hier würden im mittleren Verlauf des Demzuges deutliche Überschätzungen mit Faktor 1.5 bis 2 aufreten, während nur für sehr kurze Intervalle zu Beginn und Ende akzeptable Schätzungen resultieren würden.

Damit lässt sich schon hier feststellen, dass sowohl bei einem lockeren, fluktuierenden Demozug (Terrassenvideo) also auch einem dichten, weniger stark fluktuierenden Demozuges (Brückenvideo)  systematische Fehler auftreten.

Das selbst ein längeres Messintervall der Dauer von 120 Sekunden diese Fehler nicht vollständig beseitigt, zeigen die beiden folgenden Diagramme auf.
slidingwindow_120sec_pegida_26

Das längere Messintervall glättet zwar die Über- bzw. Unterschätzungen ein, aber auch hier drehten noch über verschiedene Intervalle starke Fehler auf.

slidingwindow_120sec_pegida_27

 

Auch für die Daten des Brückenvideo zeigt sich, dass ein längeres Messintervall erstmal nur zu eine Einglättung führt, aber immer noch nur für zwei kurze Intervalle vernünftige Schätzungen resultieren.

Diese Simulationen mit Dauer 30 und 120 lassen sich nur erweitern für beliebige zeitliche Dauern der Messung. Für die Dauern von 30 bis 240 resultieren die folgenden beiden heat maps, welche mittels Farbkodierung  in Abhängigkeit vom Startzeitpunkt und der Messdauer das das jeweilige Schätzresultat darstellt.

slidingwindow_heatmap_pegida_26

slidingwindow_heatmap_pegida_27

Da diese Darstellung in Form eine heat map immer ein wenig schwer zu interpretieren sind bzgl. der Differenz zwischen verschiedenen Werten, hier noch die beiden heatmaps in S/W-Kodierung, wobei alle Resultate welche innerhalb eines Fehlers von 10% um den wahren Wert liegen mit Weiss kodiert sind.slidingwindow_bw_10percent_pegida_26Wie man deutlich erkennt liegen hier die günstigen Startzeitpunkte eher in der Mitte, wobei paradoxe Effekt auftritt, dass ein zu breites Messintervall eher wieder zu Schätzfehlern führt.

 

slidingwindow_bw_10percent_pegida_27

Es lässt sich für die Daten des Brückenvideos deutlich erkennen, dass sich nur für sehr wenige Kombinationen aus Startzeitpunkt und Dauer der Messung Schätzungen mit einem Fehler kleiner als 10% ergeben würden.

Lässt man einen großzügigeren Fehler von 20% zu, so resultieren daraus die beiden folgenden Diagramme.

 

slidingwindow_bw_20percent_pegida_26

 

Es lässt sich sehr gut erkennen, dass bei dieser Fehlertoleranz eine Messung in der ersten Hälfte zu günstigen Schätzungen führt, wobei wenigsten eine Messdauer von etwa 160 Sekunden gewählt werden sollten.

slidingwindow_bw_20percent_pegida_27

Auch bei einer Fehlertoleranz von 20% würden noch immer nur zu wenigen günstigen Startzeitpunkten akzeptable Schätzungen resultieren.

Aus diesem ersten Teil unserer Simulationsstudie lässt sich tendenziell schließen, dass die betrachtete Methode des Schätzen durch Zählen eines Teils des Demozuges und anschließendem Hochrechnen scheinbar zu keinen allzu guten Resultaten führt.

In einem zweiten Teil unserer Simulationsstudie werden wir daher der Frage nachgehen, ob sich die Methode dadurch verbessern lässt, das man anstelle einer Zählung nur eines Teils des Demozuges eher mehrere kurze Messungen zu verschiedenen Zeitpunkten vornimmt.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s