Lade Inhalt...

Entwurf und Implementierung von Algorithmen zur Erfassung und Verfolgung von sich bewegenden Personen in Videosequenzen

©2001 Diplomarbeit 72 Seiten

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
Die Aufgabe, sich bewegende Personen in Videosequenzen zu verfolgen, ist geprägt von den Erscheinungsbildern der Personen, wie sie sich in der Szene ergeben. Diese Personen stellen sich innerhalb dieser Bilder als nicht-rigide Objekte dar. Das Erkennen von Personen in Einzelbildern beziehungsweise in einer Sequenz von aufeinanderfolgenden Bildern wird hier durch das in Kapitel 2.1 beschriebene Verfahren realisiert, welches nicht Gegenstand der Diplomarbeit ist, aber schon vorliegt.
Darauf aufbauend ist es Ziel der vorliegenden Arbeit, ein Trackingmodul zu schaffen. Aufgabe dieses Trackingmodules ist es, basierend auf der Erkennung von Bewegungen von Personen in aufeinanderfolgenden Bildern, deren Bewegung über die ganze Szene in einer entsprechenden Bildfolge zu erfassen. Die gesamte Aufgabe der Personenverfolgung erfordert im Wesentlichen drei Schritte: Im 1. Schritt werden die sensorischen Daten in Form von Grauwertbildern bereitgestellt. Der 2. Schritt umfasst die Bildverarbeitung und Bildanalyse und liefert aufbereitete Daten (Hypothesen) aus den Bildersequenzen zur Weiterverarbeitung, dem Tracking. Der 3. Schritt ist die Analyse durch das Trackingmodul. Hier werden die aus der Bildverarbeitung gewonnen Daten zu einer Bewegungsanalyse in der Szene verarbeitet. Dadurch lassen sich auch Zählergebnisse für Personenzählungen erstellen, die letztlich Ziel dieser Arbeit sind.

Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einführung1
1.1Einleitung1
1.2Erläuterung der Aufgabenstellung2
1.3Gliederung der Arbeit6
2.Der Weg vom Grauwertbild zur Hypothese7
2.1Bewegungsdetektion aus der Bildsequenz7
2.2Bildbasierte Vorselektion der Hypothesen13
3.Erfassung und Beschreibung der Bewegungsvorgänge15
3.1Situationsübersicht16
3.2Terminologie20
3.3Initialzustand22
3.4Auswahl eines Nachfolgezustands22
3.5Prädiktion23
3.5.1Wissensbasierte Verfahren24
3.5.2Kalmanfilter25
3.5.3lineare Prädiktion27
3.6Bestimmung eines adaptiven Suchraumes28
3.6.1Berechnung von r aus dem Prädiktionsfehler30
3.6.2Berechnung von r aus der Schrittweite31
3.7Zusammenführung und Auftrennung32
3.8Inaktivität bei Instanzen34
3.9Zählung der Personen und Konzepte gegen Fehlzählungen35
3.9.1Durchtrittsrichtung37
3.9.2Pendeln von Personen38
4.Entwurf und Implementierung39
4.1Terminologie39
4.2Sequentielle und verkettete (lineare) Listen40
4.3Dll-Programmierung41
4.4Beschreibung des Algorithmus41
4.5Parameter zur […]

Leseprobe

Inhaltsverzeichnis


ID 5465
Busch, Alexander: Entwurf und Implementierung von Algorithmen zur Erfassung und Verfolgung
von sich bewegenden Personen in Videosequenzen / Alexander Busch - Hamburg: Diplomica
GmbH, 2002
Zugl.: Berlin, Fachhochschule für Wirtschaft und Technik, Diplomarbeit, 2001
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die
der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen,
der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der
Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung,
vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im
Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der
Bundesrepublik Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche
Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten
wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können Fehler nicht
vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die Autoren oder
Übersetzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl.
verbliebene fehlerhafte Angaben und deren Folgen.
Diplomica GmbH
http://www.diplom.de, Hamburg 2002
Printed in Germany

I
Inhaltsverzeichnis
1
Einf¨
uhrung
1
1.1
Einleitung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Erl¨
auterung der Aufgabenstellung
. . . . . . . . . . . . . . . .
2
1.3
Gliederung der Arbeit
. . . . . . . . . . . . . . . . . . . . . .
6
2
Der Weg vom Grauwertbild zur Hypothese
7
2.1
Bewegungsdetektion aus der Bildsequenz
. . . . . . . . . . . .
7
2.2
Bildbasierte Vorselektion der Hypothesen
. . . . . . . . . . . .
13
3
Erfassung und Beschreibung der Bewegungsvorg¨
ange
15
3.1
Situations¨
ubersicht
. . . . . . . . . . . . . . . . . . . . . . . .
16
3.2
Terminologie
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.3
Initialzustand
. . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.4
Auswahl eines Nachfolgezustands
. . . . . . . . . . . . . . . .
22
3.5
Pr¨
adiktion
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.5.1
Wissensbasierte Verfahren
. . . . . . . . . . . . . . . .
24
3.5.2
Kalmanfilter
. . . . . . . . . . . . . . . . . . . . . . . .
25
3.5.3
lineare Pr¨
adiktion
. . . . . . . . . . . . . . . . . . . . .
27
3.6
Bestimmung eines adaptiven Suchraumes
. . . . . . . . . . . .
28
3.6.1
Berechnung von r aus dem Pr¨
adiktionsfehler
. . . . . .
30
3.6.2
Berechnung von r aus der Schrittweite
. . . . . . . . .
31
3.7
Zusammenf¨
uhrung und Auftrennung
. . . . . . . . . . . . . .
32
3.8
Inaktivit¨
at bei Instanzen
. . . . . . . . . . . . . . . . . . . . .
34
3.9
ahlung der Personen und Konzepte gegen Fehlz¨
ahlungen
. . .
35
3.9.1
Durchtrittsrichtung
. . . . . . . . . . . . . . . . . . . .
37

Inhaltsverzeichnis
II
3.9.2
Pendeln von Personen
. . . . . . . . . . . . . . . . . .
38
4
Entwurf und Implementierung
39
4.1
Terminologie
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
4.2
Sequentielle und verkettete (lineare) Listen
. . . . . . . . . . .
40
4.3
Dll-Programmierung
. . . . . . . . . . . . . . . . . . . . . . .
41
4.4
Beschreibung des Algorithmus
. . . . . . . . . . . . . . . . . .
41
4.5
Parameter zur Anpassung
. . . . . . . . . . . . . . . . . . . .
44
5
Ergebnisse und Interpretation
47
5.1
Darstellung und Pr¨
ufung definierter Situationen
. . . . . . . .
47
5.2
Test an praktischen Beispielsequenzen
. . . . . . . . . . . . . .
51
5.3
Komplexes Beispiel ¨
uber ca. 4 Minuten Beobachtungsdauer
. .
55
6
Zusammenfassung und Ausblick
56
A Dateiformat (Quelldaten)
61
Literaturverzeichnis
62
Verzeichnis von WWW-Seiten
64
Abbildungsverzeichnis
65
Tabellenverzeichnis
67

1
Kapitel 1
Einf¨
uhrung
1.1
Einleitung
Dank der großen Fortschritte im Bereich der Computerhardware in den letz-
ten Jahren stehen heute preisg¨
unstige Rechner mit vor einigen Jahren noch
unvorstellbarer Kapazit¨
at sowohl in Bezug auf Rechenleistung als auch Spei-
cherkapazit¨
aten bereit. Letztlich sind es diese Fortschritte, welche zu immer
neuen Anwendungen so auch im Bereich der Bildverarbeitung f¨
uhren. Das
Erfassen und Verfolgen von Personen zumindest in Echtzeit, ist nicht ohne
leistungsf¨
ahige Rechentechnik m¨
oglich, wenngleich die in dieser Arbeit be-
handelte Aufgabe lediglich die Grundlage f¨
ur einen sp¨
ateren Echtzeiteinsatz
darstellt. So stellt vor allem die inhaltliche Deutung von Bildern sehr hohe
Anspr¨
uche an die Rechenleistung.
Eine große Anzahl an interessanten und sinnvollen Anwendungsm¨
oglich-
keiten liefert die Motivation f¨
ur solche Systeme. So wurden und werden Sys-
teme zur Objektverfolgung sehr viel in milit¨
arischen Anwendungen verwen-
det. Jedoch auch in der zivilen Welt sind eine große Anzahl von Anwen-
dungsm¨
oglichkeiten zu finden. So wird in der Verhaltensforschung der Ein-
satz solcher Systeme sehr begr¨
ußt, da hier eine große Arbeitserleichterung
zu erreichen ist, indem Aufgaben wie Beobachtung von Bewegungen auto-

Einf¨
uhrung
2
matisiert und objektiviert werden k¨
onnen. Hierzu sind in [
ct200023
] einige
Ausf¨
uhrungen zu finden.
Ein weiterer Anwendungsfall ist die Z¨
ahlung von Personen. Dieser An-
wendungsfall findet sich in vielen Bereichen des t¨
aglichen Lebens. So besteht
großes Interesse daran, Personen zu z¨
ahlen und deren Wege zu erfassen, in
den Konsumbereichen, wie Kaufh¨
ausern und Superm¨
arkten.
Auch eine Anwendung im Bereich des ¨
offentlichen Nahverkehrs ist sinn-
voll. So k¨
onnten Personenstr¨
ome auf Bahnh¨
ofen und deren Zu- und Abstrom
automatisiert erfasst werden. Hierdurch k¨
onnten pr¨
azise Statistiken ¨
uber das
Verkehrsaufkommen erstellt werden, wodurch sicherlich eine Optimierung der
Wartezeit der Passagiere und der notwendigen Einsatzh¨
aufigkeit (Taktung)
des Transportmittels erreicht werden k¨
onnte. Die dazu n¨
otige Infrastruktur,
das sind insbesondere entsprechend positionierte Kameras, ist heute bereits
aus sicherheitsrelevanten Erw¨
agungen oft vorhanden. Somit ist die Umstel-
lung beziehungsweise Aufwertung vorhandener ¨
Uberwachungssysteme sicher-
lich nur eine Frage der Zeit, das heißt wann solche Systeme marktreif verf¨
ug-
bar sind und weniger eine Frage der Kosten, da entsprechende Infrastruktur
bereits vorhanden ist.
Vielleicht wird es in Zukunft auch Systeme in Verbindung mit Gesichtser-
kennung geben, so dass einzelne Pers¨
onlichkeiten differenziert werden k¨
onnen.
Mit diesem Schritt w¨
urde die Vision des ¨
Uberwachungsstaates von George
Orwell
1
, die 1949 in dem Roman
"
1984" erschienen ist und durch den welt-
bekannten Ausspruch
"
BIG BROTHER IS WATCHING YOU" gepr¨
agt ist,
sicherlich wesentlich realer werden.
1.2
Erl¨
auterung der Aufgabenstellung
Ziel dieser Arbeit ist die Z¨
ahlung von Personenbewegungen bezogen auf das
Durchschreiten von
"
ahlschranken" wie zum Beispiel das Betreten oder Ver-
lassen eines definierten Szenenbereiches.
1
George Orwell,englischer Schriftsteller.

Einf¨
uhrung
3
Diese Arbeit entstand als Diplomarbeit im Rahmen eines Projektes in
der Gesellschaft zur F¨
orderung angewandter Informatik e. V. (GFaI).
"
Die
GFaI wurde am 01.06.1990 in Berlin gegr¨
undet und verfolgt gemeinn¨
utzige
forschungsf¨
ordernde Zwecke. Mit ihren ca. 70 Mitarbeitern ist sie vor al-
lem in den Bereichen Bildverarbeitung und Multimedia t¨
atig. Die GFaI ist
Mitglied der Arbeitsgemeinschaft industrieller Forschungsvereinigungen e. V.
(AiF) und An-Institut der Technischen Fachhochschule Berlin (TFH) und der
Fachhochschule f¨
ur Technik und Wirtschaft Berlin (FHTW)." [
GFaI
]
Ausgangsbasis f¨
ur das Bildmaterial ist eine Beobachtungssituation, bei
welcher sich die Kamera senkrecht ¨
uber der zu betrachtenden Szene
2
befindet.
Wie in Abbildung
1.1
dargestellt, betr¨
agt der vertikale Abstand zwischen
Kamera und Boden zwischen 3 und 5 m und der Bildausschnitt bezogen auf
den Fußboden ist ca. 4 m * 5 m.
Abbildung 1.1: Position Kamera / Bildausschnitt
Das Bildmaterial liegt zur Zeit als Folge von Grauwert-Einzelbildern vor.
Die Beobachtungssituation stellt sich sehr flexibel dar, da Szenen sowohl im
Innenbereich als auch im Außenbereich verarbeitet werden sollen. St¨
orun-
gen sind dabei in allen Szenen zu erwarten. Im Innenbereich werden diese
2
Unter dem Begriff Szene wird hier ein feststehender Bildausschnitt mit feststehender
Kamera verstanden.

Einf¨
uhrung
4
zum Beispiel durch mitgef¨
uhrte Einkaufswagen oder bewegte Europaletten
hervorgerufen.
Ein Beispiel f¨
ur eine Szene im Innenbereich, dargestellt im oberen Teil
von Abbildung
1.2
, befindet sich in einem Einkaufszentrum. Im Außenbereich
sind St¨
orungen durch wechselnde Wetterverh¨
altnisse sowie durch hochgradig
unterschiedliche Beleuchtungsverh¨
altnisse (nat¨
urlichen und k¨
unstlichen Ur-
sprungs) zu erwarten.
Die Aufgabe, sich bewegende Personen in Videosequenzen zu verfolgen, ist
gepr¨
agt von den Erscheinungsbildern der Personen, wie sie sich in der Szene
ergeben. Diese Personen stellen sich innerhalb dieser Bilder als nicht-rigide
3
Objekte dar. Das Erkennen von Personen in Einzelbildern beziehungsweise
in einer Sequenz von aufeinanderfolgenden Bildern wird hier durch das in
Kapitel
2.1
beschriebene Verfahren realisiert, welches nicht Gegenstand der
Diplomarbeit ist, aber schon vorliegt.
Darauf aufbauend ist es Ziel der vorliegenden Arbeit, ein Trackingmodul
zu schaffen. Aufgabe dieses Trackingmodules ist es, basierend auf der Erken-
nung von Bewegungen von Personen in aufeinanderfolgenden Bildern, deren
Bewegung ¨
uber die ganze Szene in einer entsprechenden Bildfolge zu erfassen.
Das Datenmaterial welches dieser Arbeit zugrunde liegt zeigt einen Su-
permarkt, wie in Abbildung
1.2
oben dargestellt. Die Beobachtungssituati-
on ist so gew¨
ahlt, dass die Kamera senkrecht ¨
uber dem zu beobachtenden
Bildausschnitt steht. Daher liegen die Ergebnisse der Beobachtung als zwei-
dimensionale Bilder, in Form einer Draufsicht, vor.
Die gesamte Aufgabe der Personenverfolgung erfordert im Wesentlichen
drei Schritte, wie in Abbildung
1.2
dargestellt.
· Im 1. Schritt werden die sensorischen Daten in Form von Grauwert-
Bildern bereitgestellt.
3
Als nicht rigid werden Objekte bezeichnet, welche keine konstante Form besitzen.
Nicht-rigid kann also mit nicht-formfest umschrieben werden.

Einf¨
uhrung
5
Abbildung 1.2: Datenfluss
· Der 2. Schritt umfasst die Bildverarbeitung und Bildanalyse und liefert
aufbereitete Daten (Hypothesen) aus den Bildersequenzen zur Weiter-
verarbeitung, dem Tracking.
· Der 3. Schritt ist die Analyse durch das Trackingmodul. Hier werden die
aus der Bildverarbeitung gewonnen Daten zu einer Bewegungsanalyse
in der Szene verarbeitet. Dadurch lassen sich auch Z¨
ahlergebnisse f¨
ur
Personenz¨
ahlungen erstellen, die letztlich Ziel dieser Arbeit sind.
Diese Funktionalit¨
at soll mittels ANSI
4
C in einer Dynamic Link Library
(siehe dazu Kapitel
4.3
) implementiert werden.
4
American National Standards Institute

Einf¨
uhrung
6
1.3
Gliederung der Arbeit
Das erste Kapitel soll die Aufgabenstellung erl¨
autern und m¨
ogliche Anwen-
dungsbereiche f¨
ur dieses und ¨
ahnlich geartete Systeme aufzeigen.
In Kapitel zwei wird erl¨
autert, wie die per Kamera gewonnenen Bilder
verarbeitet werden. Wie werden ¨
uberhaupt interessierende Objekte erkannt
und identifiziert? Welche Daten werden aus den Bildern gewonnen?
Kapitel drei zeigt, wie die aus der Bildanalyse gewonnenen Daten verar-
beitet werden, so dass die Bewegung von Personen tats¨
achlich verfolgt wird.
Auch werden
"
Probleme" aufgezeigt, die es zu l¨
osen gibt, wenn ein Algorith-
mus nicht nur eine Person, sondern mehrere Personen gleichzeitig verfolgen
soll. Hierzu werden Konzepte entwickelt und vorgestellt.
In Kapitel vier wird auf die Implementierung des Algorithmus eingegan-
gen. Der Algorithmus wird graphisch veranschaulicht und erl¨
autert. Auch die
Parameter, die der Flexibilit¨
at des Algorithmus dienen werden erl¨
autert.
Kapitel f¨
unf veranschaulicht die Funktionsf¨
ahigkeit des Algorithmus.
Hierzu werden Testreihen an
"
synthetischen" Beispielen durchgef¨
uhrt. Wei-
terhin wird Bildmaterial aus praktischen Beispielsequenzen sowohl ¨
uber den
Algorithmus als auch visuell ausgewertet, wobei eventuell entstehende Un-
terschiede erl¨
autert werden.
Eine Zusammenfassung der Ergebnisse, die in Kapitel f¨
unf gewonnen wur-
den, wird in Kapitel sechs gegeben. Weiterhin werden m¨
ogliche Vorschl¨
age
zur Verbesserung und Weiterentwicklung gemacht.

7
Kapitel 2
Der Weg vom Grauwertbild zur
Hypothese
Dieses Kapitel soll einen ¨
Uberblick ¨
uber die Verfahren geben, die zur Gewin-
nung von Daten aus Bildern n¨
otig sind und damit die Voraussetzung f¨
ur eine
Auswertung und Analyse schaffen.
2.1
Bewegungsdetektion aus der Bildsequenz
Die Bilder beziehungsweise Bildsequenzen liegen in Videonorm vor. Die Auf-
osung betr¨
agt (Vollbild) 768x572 Pixel
2
mit 256 Grauwerten, der Abstand
zwischen zwei Bildern betr¨
agt 40ms.
Abbildung 2.1: 10 Bilder Squenz 40ms
Abbildung 2.2: 10 Bilder Squenz 200ms

Der Weg vom Grauwertbild zur Hypothese
8
Abbildung
2.1
zeigt eine typische 40ms-Sequenz von 10 Bildern mit einem
zeitlichen Abstand von 40ms zwischen den Einzelbildern. In Abbildung
2.2
sind aus der gleichen Sequenz 10 Bilder mit einem zeitlichen Abstand von je
200ms dargestellt.
Die Aufgabe der Bewegungsdetektion (oder wie hier definiert das Auffin-
den von Hypothesen f¨
ur eine Objektbewegung) l¨
asst sich in mehrere Teil-
schritte gliedern, die durch Verfahren der digitalen Bildverarbeitung und
Bildanalyse bestimmt werden (Abbildung
2.3
).
Abbildung 2.3: Teilschritte Bildverarbeitung und Bildanalyse
So steht zu Beginn die Wahl eines geeigneten (minimalen) Zeitintervalls
zwischen zwei Bildaufnahmen, bestimmt durch das Ziel der Erkennung re-

Der Weg vom Grauwertbild zur Hypothese
9
levanter Ereignisse und der auftretenden gesamten Verarbeitungszeit im Sy-
stem. Hier kommt das Problem der Datenmenge zum Tragen. Wird der zeit-
liche Abstand zwischen den zu verarbeitenden Bildern verringert, so ist mit
einer h¨
oheren Leistung in Bezug auf die Erkennung von relevanten Ereignis-
sen zu rechnen. Nachteil hierbei ist die hohe Datenmenge. Wird der Abstand
zwischen zwei Bildern hingegen relativ groß gew¨
ahlt, sinkt die Erkennungs-
leistung. Auch die zu verarbeitende Datenmenge sinkt mit zunehmendem
Bildabstand. Dieser Umstand erlaubt jedoch auch den Einsatz von leistungs-
schw¨
acheren Systemen. Ziel ist deshalb ein optimaler zeitlicher Abstand zwi-
schen den Bildern. Nach [
Schulz00
] sind 5 Bilder/s eine ¨
ubliche Gr¨
oße bei
dieser Art der Beobachtung.
Die eigentliche Aufgabe besteht in der Ermittlung der Hypothesen. Dabei
wird aus dem Vergleich von Grauwertbildern (unter Anwendung zus¨
atzlicher
Filter oder Methoden zur Beseitigung von Bildrauschen) der interessieren-
de Bildinhalt ermittelt und dann ¨
uber die Segmentierung (Binarisierung) die
signifikante Information (Fl¨
achenobjekte) bereitstellt. ¨
Uber eine entsprechen-
de Analyse entstehen daraus die Hypothesen, beschrieben durch Gr¨
oße und
Position. Hier finden im wesentlichen folgende Methoden zur Bewegungsde-
tektion in Bildsequenzen Anwendung:
· Differenzbildung zu einem Hintergrundbild (DiffHGB)
1
· Bildung der absoluten Differenz (AbsDiff)
2
zwischen zwei (gem¨
aß ge-
ahltem Zeitintervall) aufeinanderfolgenden Bildern
· Spezielle Methoden, zum Beispiel Motion Energy Method (MoEnMe)
3
In Abbildung
2.4
ist das Verfahren der Differenzbildung zu einem Hinter-
grundbild (DiffHGB) dargestellt. Links oben ist ein Hintergrundbild darge-
stellt, rechts oben ein Bild aus der aktuellen Szene. Die Differenz aus diesen
beiden Bildern ist im Bild in der linken unteren Ecke dargestellt. Nach der
1
vgl. [
Zedler01
]
2
vgl. [
Zedler01
]
3
vgl. [
Tse98
]

Der Weg vom Grauwertbild zur Hypothese
10
Abbildung 2.4: DiffHGB - Differenzbildung zu einem Hintergrundbild
darauf folgenden Segmentierung mit einem Schwellwert erh¨
alt man das Er-
gebnis, wie es rechts unten dargestellt ist. Zur Veranschaulichung ist dieses
Ergebnis noch mit dem Bild rechts oben ¨
uberlagert.
Die Methode DiffHGB liefert die eindeutigsten Bilder bez¨
uglich Objekt-
lage und Objektform, ist aber in den vorliegenden realen Szenen schwierig in
der Realisierung.
Ein Hintergrundbild
4
ist nicht immer ermittelbar und zweitens ist das
Hintergrundbild nicht station¨
ar, das heißt es sind Aktualisierungen notwendig
in bestimmten Zeitabschnitten beziehungsweise in Abh¨
angigkeit von l¨
anger
wirkenden St¨
orungen, die dann auch erst als solche detektiert werden m¨
us-
sen. Eine Variante dieser Methode bedient sich einer fortlaufenden adaptiven
Anpassung des Hintergrundbildes durch
"
Berechnung eines Hintergrundbil-
des" aus der laufenden Sequenz. Dazu existieren unterschiedliche Methoden,
die sich im Aufwand der Berechnung, dem Bedarf an Speicher und ihrer
Anpaßgeschwindigkeit zu Bildver¨
anderungen unterscheiden.
In Abbildung
2.5
ist das Verfahren der Bildung der absoluten Differenz
4
Unter einem Hintergrundbild ist die leere Szene zu verstehen. D.h. sich bewegende
Objekte wie zum Beispiel Personen sind darin nicht enthalten.

Der Weg vom Grauwertbild zur Hypothese
11
Abbildung 2.5: AbsDiff - Bildung der absoluten Differenz
(AbsDiff) dargestellt. Links und rechts oben befinden sich zwei Bilder, die zu
unterschiedlichen Zeitpunkten entstanden sind. Zwischen diese beiden Bil-
dern wird die absolute Differenz gebildet, wobei das Ergebnis entsteht, wie
es unten links abgebildet ist. Das Ergebnis wird binarisiert und darauf ein
Sobel-Filter
5
angewandt, wobei das Ergebnis entsteht, das unten rechts dar-
gestellt ist. Zur Veranschaulichung wurde eine ¨
Uberlagerung mit einem Bild
der Szene vorgenommen.
Die Methode AbsDiff liefert bez¨
uglich Objektlage und Objektform keine
eindeutigen Informationen ¨
uber die Bewegung im Bild, insbesondere dann,
wenn sich ein Objekt nicht ¨
uber seine vorherige r¨
aumliche Ausdehnung hinaus
bewegt hat.
Die Funktionsweise der Motion Energy Method (MoEnMe) ist in Abbil-
dung
2.6
dargestellt.
Die Motion Energy Method benutzt auch die absolute Differenz zwischen
zwei Bildern. Dies sind die beiden oberen Bilder. Dann erfolgt aber eine
5
Der Sobel-Filter geh¨
ort zur Klasse der sogenannten Kantendetektionsfilter beziehungs-
weise Kantenextraktionsfilter. Zweck der Anwendung ist die Erlangung eines Kantenbildes,
d.h. der Umriss eines Objektes wird dargestellt.

Der Weg vom Grauwertbild zur Hypothese
12
Abbildung 2.6: MoEnMe - Motion Energy Method
UND-Verkn¨
upfung der (binarisierten) absoluten Differenz und dem (binari-
sierten) Kantenbild des ersten der zwei oberen Bilder. Damit wird versucht,
den signifikanten Bereich gegen¨
uber der vorhergehenden Methode auf die
Ver¨
anderung aus einem Bild zu begrenzen. Als Ergebnis dieser Operationen
erh¨
alt man das Ergebnisbild, welches unten links dargestellt ist. Rechts unten
ist schließlich die Szene mit den eingezeichneten Hypothesen dargestellt.
Als Ergebnis liegt f¨
ur jedes Bild eine Textdatei als Schnittstelle
6
vor,
die neben der Bildnummer die f¨
ur das Bild erstellten Hypothesen mit ihrer
Pixelanzahl und den x- und y-Koordinaten des Schwerpunktes dieser Fl¨
achen
enth¨
alt.
Es sei darauf hingewiesen, dass die Ergebnisse keine Detailinformationen
¨
uber Personen liefern, das heißt die Trennung von Person/Einkaufswagen
oder die Ber¨
uhrung von mehreren Personen, ist mit diesen Verfahren so nicht
erreichbar.
6
Spezifikation siehe Anhang
A

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2001
ISBN (eBook)
9783832454654
ISBN (Paperback)
9783838654652
Dateigröße
4.1 MB
Sprache
Deutsch
Institution / Hochschule
Hochschule für Technik und Wirtschaft Berlin – Wirtschaftswissenschaften II
Erscheinungsdatum
2014 (April)
Note
2,0
Schlagworte
bildverarbeitung video tracking computer vision
Zurück

Titel: Entwurf und Implementierung von Algorithmen zur Erfassung und Verfolgung von sich bewegenden Personen in Videosequenzen
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
72 Seiten
Cookie-Einstellungen