Lade Inhalt...

Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine

©2005 Diplomarbeit 89 Seiten

Zusammenfassung

Inhaltsangabe:Einleitung:
Die Entwicklung von Software für Papierschneidemaschinen (PSM) begann bei der Firma MCS MICRONIC Computer Systeme schon vor über 15 Jahren. Die Technik verbesserte sich im Laufe der Zeit, ebenso die Visualisierung und Usability für den Benutzer. Eines hat sich jedoch nicht geändert: es wird immer noch ein kundiger Beschneider, also der Bediener der Maschine, benötigt, um die schnellste und wirtschaftlichste Schnittabfolge zu erstellen. Die Idee zu einer Software, die selbstständig sinnvolle Schnittfolgen generiert, entstand in Gesprächen mit meinem Erstbetreuer Professor Heßling und stieß sowohl bei MCS als auch bei Perfecta, einem Hersteller von PSM, auf reges Interesse.
Das Beschneiden von großformatigen Papierbögen aus Druckereien erfordert einen geeigneten Beschneider, der auf Grund seiner Erfahrung eine effektive und ressourcenschonende Schnittfolge gewährleistet. Ziel dieser Arbeit soll demnach sein, die Möglichkeiten zur Ermittlung eines sinnvollen Schnittes, abhängig von der jeweiligen Situation, zu untersuchen, die eine künstliche Intelligenz (KI) auf Basis eines neuronalen Netzes (NN) bietet. Außerdem soll das Schnittgut mit allen Nutzen und möglichen Schnitten visualisiert werden. Die Visualisierung und Bedienung der Benutzeroberfläche ist intuitiv zu gestalten, um das Arbeiten an der PSM auch ungelernten Kräften zu ermöglichen. Unter Umständen besteht die Chance, einen kundigen Beschneider durch einen weniger versierten Bediener zu ersetzen.
Die Abschlussarbeit wird von MCS MICRONIC Computer Systeme GmbH begleitet, da potentielles Interesse am zukünftigen Einsatz und der Vermarktung des erarbeiteten Prototyps besteht. Die vorliegende Diplomarbeit mit dem Titel „Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine“ untersucht, inwieweit sich eine KI auf Grundlage eines NN zur Generierung von sinnvollen Schnittvorschlägen bei einer Software für PSM eignet.
Dazu werden zunächst die Grundlagen in den Bereichen KI und NN erarbeitet, anschließend die Kriterien für den zu entwickelnden Prototyp aufgezeigt und die Aufgaben genauer spezifiziert. Danach folgt eine Beschreibung der Entwurfsphase. Erläuterungen der einzelnen Programmteile und -abläufe führen schließlich zu umfangreichen Tests über die Korrektheit, Leistungsfähigkeit und dem Innovationspotential der KI sowie der Qualität der Benutzeroberfläche. Abschließend werden die erarbeiteten Ergebnisse […]

Leseprobe

Inhaltsverzeichnis


Bastian Schindler
Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung
einer Papierschneidemaschine
ISBN-10: 3-8324-9549-5
ISBN-13: 978-3-8324-9549-7
Druck Diplomica® GmbH, Hamburg, 2006
Zugl. Fachhochschule für Technik und Wirtschaft Berlin, Berlin, Deutschland,
Diplomarbeit, 2005
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte,
insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von
Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der
Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen,
bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung
dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen
der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik
Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme,
dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei
zu betrachten wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können
Fehler nicht vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die
Autoren oder Übersetzer übernehmen keine juristische Verantwortung oder irgendeine
Haftung für evtl. verbliebene fehlerhafte Angaben und deren Folgen.
© Diplomica GmbH
http://www.diplom.de, Hamburg 2006
Printed in Germany


Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 2
1.
Einleitung... 5
2.
Grundlagen ... 6
2.1
Einführung künstliche Intelligenz...6
2.2
Künstliche neuronale Netze ...7
2.2.1
Einführung ...7
2.2.2
Natürliche und künstliche Neuronen ...8
2.2.3
Aufbau neuronaler Netze ... 13
2.2.4
Eigenschaften neuronaler Netze ...13
2.2.5
Netzarchitekturen ...15
2.2.6
Lernen...16
2.2.7
Netzgrößen und Generalisierungsfähigkeit ...18
2.2.8
Schematischer Überblick über neuronale Netze...19
3.
Analyse ... 21
3.1
Ausgangssituation und Problembeschreibung ...21
3.2
Papierschneidemaschinen in der Praxis ... 22
3.2.1
Schneiden mit Schnellschneidern oder Planschneidern...22
3.2.2
Profil der beteiligten Firmen Perfecta und MCS...25
3.2.3
Schnellschneider der Firma Perfecta ...26
3.3
Dateiformate und ­standards...28
3.3.1
JDF, CIP3 und CIP4 ...28
3.3.2
Schnittprogramme...28
3.3.3
SNNS Netzdateien und Trainingsmusterdateien ...29
4.
Anforderungsdefinition ... 30
4.1
Zielsetzung der Arbeit und Eingrenzung des Themas ...30
4.2
Pflichtenheft ...31
5.
Design... 37
5.1
Benutzerführung...37
5.2
Model View Controller...38
5.3
Prototyping ...39
5.4
Unified Modeling Language...40

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 3
6.
Implementierung... 43
6.1
Das Entwicklungsumfeld ...43
6.1.1
Stuttgarter Neuronale Netz Simulator...43
6.1.2
Entwicklungsumgebung Microsoft .net...44
6.2
Strukturierung und Workflow des Prototyps...44
6.2.1
Look 'n Feel und Workflow der GUI ...44
6.2.2
Workflow der Core ...48
6.2.3
Künstliche Intelligenz des Prototyps...49
6.2.4
Kommunikation des Programms mit dem Netz ...50
6.3
Beschreibung besonderer Codefragmente ...51
7.
Untersuchungen ... 53
7.1
Erfüllung der Randbedingungen...54
7.1.1
Kontrolle: Benutzerfreundlichkeit der GUI ...54
7.1.2
Kontrolle: Ausgabewerte des NN im Vergleich zum SNNS...54
7.1.3
Kontrolle: Koordinatenunabhängigkeit des Prototyps...55
7.1.4
Kontrolle: Wiedergabe einer erlernten Schnittabfolge...56
7.1.5
Kontrolle: Wiedergabe zweier erlernter Schnittabfolgen ...57
7.1.6
Kontrolle: Wiedergabe fünf erlernter Schnittabfolgen ...58
7.2
Denkbares Innovationspotential des Prototyps ...58
7.2.1
Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen I ...58
7.2.2
Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen II ...59
7.2.3
Untersuchung: notwendige Größe der Zwischenschicht...60
7.2.4
Untersuchung: Wiederholung 7.2.2 mit Zwischenschichtgröße aus 7.2.3 ...61
7.2.5
Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen III ...61
7.2.6
Untersuchung: Aussagekraft 7.2.5 ...62
8.
Ergebnis und Zusammenfassung ... 63
8.1
Zusammenfassung...63
8.2
Bewertung und Fazit ...64
8.3
Software anderer Hersteller im Vergleich zum Prototyp ...65
8.4
Ausblick und Ideen ...66

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 4
9.
Quellenverzeichnis ... 68
10.
Abbildungsverzeichnis ... 70
11.
Abkürzungsverzeichnis ... 71
12.
Glossar... 72
13.
Anhang ... 77

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 5
1.
1.
1.
1.
Einleitung
Einleitung
Einleitung
Einleitung
Die Entwicklung von Software für Papierschneidemaschinen (PSM) begann bei der Firma
MCS MICRONIC Computer Systeme schon vor über 15 Jahren. Die Technik verbesserte
sich im Laufe der Zeit, ebenso die Visualisierung und Usability für den Benutzer. Eines
hat sich jedoch nicht geändert: es wird immer noch ein kundiger Beschneider, also der
Bediener der Maschine, benötigt, um die schnellste und wirtschaftlichste Schnittabfolge
zu erstellen. Die Idee zu einer Software, die selbstständig sinnvolle Schnittfolgen gene-
riert, entstand in Gesprächen mit meinem Erstbetreuer Professor Heßling und stieß
sowohl bei MCS als auch bei Perfecta, einem Hersteller von PSM, auf reges Interesse.
Das Beschneiden von großformatigen Papierbögen aus Druckereien erfordert einen
geeigneten Beschneider, der auf Grund seiner Erfahrung eine effektive und ressourcen-
schonende Schnittfolge gewährleistet. Ziel dieser Arbeit soll demnach sein, die Mög-
lichkeiten zur Ermittlung eines sinnvollen Schnittes, abhängig von der jeweiligen Situa-
tion, zu untersuchen, die eine künstliche Intelligenz (KI) auf Basis eines neuronalen
Netzes (NN) bietet. Außerdem soll das Schnittgut mit allen Nutzen und möglichen
Schnitten visualisiert werden. Die Visualisierung und Bedienung der Benutzeroberfläche
ist intuitiv zu gestalten, um das Arbeiten an der PSM auch ungelernten Kräften zu er-
möglichen. Unter Umständen besteht die Chance, einen kundigen Beschneider durch
einen weniger versierten Bediener zu ersetzen.
Die Abschlussarbeit wird von MCS MICRONIC Computer Systeme GmbH begleitet, da
potentielles Interesse am zukünftigen Einsatz und der Vermarktung des erarbeiteten
Prototyps besteht.
Die vorliegende Diplomarbeit mit dem Titel ,,Entwurf und prototypische Realisierung
einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine" untersucht,
inwieweit sich eine KI auf Grundlage eines NN zur Generierung von sinnvollen Schnitt-
vorschlägen bei einer Software für PSM eignet.
Dazu werden zunächst die Grundlagen in den Bereichen KI und NN erarbeitet, an-
schließend die Kriterien für den zu entwickelnden Prototyp aufgezeigt und die Aufga-
ben genauer spezifiziert. Danach folgt eine Beschreibung der Entwurfsphase. Erläute-
rungen der einzelnen Programmteile und ­abläufe führen schließlich zu umfangreichen
Tests über die Korrektheit, Leistungsfähigkeit und dem Innovationspotential der KI
sowie der Qualität der Benutzeroberfläche. Abschließend werden die erarbeiteten Er-
gebnisse zusammengefasst, um mögliche Ausblicke für die Weiterentwicklung zu ge-
ben.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 6
2.
2.
2.
2.
Grundlagen
Grundlagen
Grundlagen
Grundlagen
2.1
Einführung künstliche Intelligenz
,,Künstliche Intelligenz (KI, beziehungsweise AI vom englischen Artificial Intelli-
gence) ist eine Fachdisziplin der Informatik mit interdisziplinärem Charakter. Ziel
der KI ist es, Maschinen zu entwickeln, die sich verhalten, als verfügten sie über
Intelligenz. (John McCarthy, 1955)" [Wikipedia 2005B]
Eine Definition für KI zu finden scheint einfach, scheitert jedoch an den unterschiedli-
chen Vorstellungen der Betrachter. Problemstellungen, die dem Menschen einen ge-
wissen Grad an Intelligenz abfordern, zum Beispiel die Lösung mathematischer Aufga-
ben, sind vom Computer innerhalb kürzester Zeit berechnet. Paradoxer Weise sind es
gerade Alltagssituationen, die jeder Mensch täglich meistert, wie beispielsweise das
Erkennen von Gesichtern, welche schwer durch Rechner automatisiert werden können.
KI beschäftigt sich sowohl mit diesen alltäglichen Folgerungsprozessen, als auch mit
komplexen Expertenaufgaben.
Die Forschung der KI wird hauptsächlich für zwei Wissenschaftsbereiche benötigt. Zum
einen, um klügere Programme und Maschinen zu erschaffen, zum anderen, um Theo-
rien zur menschlichen Intelligenz zu testen und Verhaltensweisen zu simulieren. Die
Schaffung intelligenter Maschinen, welche das menschliche Verhalten nachahmen, die
so genannte starke KI, ist bis heute weitgehend Utopie geblieben, nicht zuletzt auf-
grund des Scheiterns an ihrer philosophischen Fragestellung. Die Forschung an der
schwachen KI hingegen, die sich mit der Lösung mathematischer, planungstechnischer
und anderer Anwendungsprobleme beschäftigt, hat in den letzten Jahren einige Erfolge
verzeichnet und ist zu einem großen Forschungsgebiet herangewachsen.
[vgl. Cawsey 2003, S.13]
,,Letztlich geht es der schwachen KI somit um die Simulation intelligenten Ver-
haltens mit Mitteln der Mathematik und der Informatik; es geht ihr nicht um
Schaffung von Bewusstsein oder um ein tieferes Verständnis von Intelligenz."
[Wikipedia 2005B]
Der Terminus ,,künstliche Intelligenz" impliziert, dass es sich um etwas Künstliches, der
natürlichen Intelligenz nachempfundenen handelt. Um dies zu ermöglichen stellt sich
die Frage, wie natürliche Intelligenz funktioniert.
Bei eingehender Beschäftigung mit dieser Frage wird deutlich, dass vor allem hinter
dem menschlichen Verhalten viel mehr steckt, als eine Menge festgelegter Verhaltens-
regeln, die mehr oder weniger klar in algorithmischen Strukturen abgebildet werden
können.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 7
Um biologische Intelligenz nachzuahmen, muss das Zentrum dieser Intelligenz - das
Gehirn, ein Netz aus Milliarden von kleinen, hoch spezialisierten Zellen, den Neuronen
- verstanden und abzubilden versucht werden.
NN sind der Versuch, die Nervenzellen des Gehirns zu imitieren und für eine künstliche
Intelligenz zu nutzen.
[vgl. Thiel 2003]
2.2
Künstliche neuronale Netze
Warren McCulloch und Walter Pitts waren im Jahr 1943 die Pioniere, die sich mit ihrem
Formalmodell des Neurons mit dem Thema NN beschäftigten. Die Arbeiten dazu haben
seit Mitte der achtziger Jahre sehr stark zugenommen.
2.2.1
Einführung
Was sind neuronale Netze?
Künstliche NN sind informationsverarbeitende Systeme. Sie bestehen aus einer unter-
schiedlichen Anzahl von Neuronen, die sich über gerichtete Verbindungen Informatio-
nen zusenden. Die Art der Information ist auf zwei Zustände reduziert, einer aktivier-
ten und einer nicht aktivierten Zelle.
Diesem einfachen System dient die Natur, genauer das Studium des Gehirns der Säu-
getiere, als grobes Vorbild. Die Informationsweiterleitung funktioniert dort ebenfalls
über parallel geschaltete, einfache Nervenzellen.
Es gibt unterschiedliche Motivationen für die Forschung an NN. Die Nachahmung der
Informationsweiterleitung bei Säugetieren, also die Ähnlichkeit des Modells mit der
biologischen Realität, ist nur eine davon. Hierbei wird versucht, dem biologischen Vor-
bild so nah wie möglich zu kommen, um mittels Simulation an noch unentdeckte Er-
gebnisse zu gelangen. In der Naturwissenschaft sind NN von großem Interesse, da es
sich um massiv parallele, lernfähige Systeme handelt. Sie werden für Netzwerksimula-
tionen, neuronale Hardware oder den Einsatz in Programmen verwendet.
Ein NN muss nicht auf ein Problem hin programmiert werden, es erlernt die Problemlö-
sung aus einer Anzahl von Trainingsmustern (TM), wobei es sehr effizient sein kann.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 8
Abbildung
Abbildung
Abbildung
Abbildung 1
1
1
1: Konnektionism
: Konnektionism
: Konnektionism
: Konnektionismus n
us n
us n
us neuronaler Netze [
euronaler Netze [
euronaler Netze [
euronaler Netze [Zell
Zell
Zell
Zell 2003
2003
2003
2003, S.24]
, S.24]
, S.24]
, S.24]
An der Erforschung NN sind unter anderem naturwissenschaftliche Bereiche interes-
siert wie die Biologie/Neurobiologie, Medizin/Neurophysiologie, Psychologie, Bioin-
formatik, Informatik, künstliche Intelligenz, Mathematik, Physik und Elektrotechnik. Die
Anteile der einzelnen Fachrichtungen am Themengebiet der NN sind in Abb. 1 darge-
stellt. Dort wird ersichtlich, dass der größte Schwerpunkt in der Informatik zu finden
ist, gefolgt von der Elektrotechnik, der Biologie und der Medizin. Die Gründe differie-
ren jedoch, da zum Beispiel in der Informatik oft Problemlösungen mit NN generiert
werden, NN in der Biologie aber eher der Simulation von Organismen und Organen
dienen.
[vgl. Zell 2003, S.23]
2.2.2
Natürliche und künstliche Neuronen
Das Vorbild künstlicher Neuronen ist die Natur. In diesem Kapitel soll zunächst das
biologische und das künstliche Neuron dargestellt und erläutert werden. Künstliche NN
bestehen aus einem Verbund künstlicher Neuronen, welche in Schichten angeordnet
sind. Der Aufbau NN wird im Anschluss veranschaulicht.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 9
Biologische Neuronen
,,Grundbaustein eines jeden Organismus ist die Zelle. Die Grundzelle eines Ge-
hirns ist das Neuron." [Hs-Bremen 1998]
Ein Neuron, die wissenschaftliche Bezeichnung einer Nervenzelle und elementarer Bau-
stein von Nervennetzen, besteht im Wesentlichen, wie in Abb. 2 zu sehen ist, aus
Dendriten, Synapsen, dem Soma (Zellkörper) und einem sich verzweigenden Fortsatz,
dem Axon.
Abbildung
Abbildung
Abbildung
Abbildung 2
2
2
2: Schema ein
: Schema ein
: Schema ein
: Schema eines natürlichen Ne
es natürlichen Ne
es natürlichen Ne
es natürlichen Neu
u
u
urons [Hs
rons [Hs
rons [Hs
rons [Hs-
-
-
-B
B
B
Bremen
remen
remen
remen 1998
1998
1998
1998]]]]
Der Signalempfang eines Neurons erfolgt über die an den Dendriten befindlichen Sy-
napsen. Dendriten sind stark verzweigte Bereiche der Nervenzellen, deren Fortsätze
eine Art Antennenfunktion für die Aufnahme elektrischer Impulse von anderen Neuro-
nen haben. Innerhalb des Neurons wird das ankommende Signal umgeformt. Beim Er-
reichen eines bestimmten Schwellwerts leitet das Neuron diese Impulse, auch Aktions-
potentiale genannt, über das Axon an die am Ende des Axons befindlichen Synapsen
weiter. Diese wandeln das ankommende elektrische Signal zurück in ein chemisches
Signal, um es an Dendriten anderer Neuronen zu senden. Der Fluss von Informationen
in den Neuronen erfolgt gerichtet.
Es stellt sich die Frage, wie und wo die eigentliche Information gespeichert wird, wenn
Neuronen nur der Weiterleitung von Signalen dienen und selbst keine Daten speichern
können. Der Informationsspeicher ist in den Verbindungen der Neuronen und dem
Konstrukt des Gehirns selbst, also dem Zusammenschluss vieler Zellen, zu suchen.
Inzwischen ist bekannt, in welcher Weise Neuronen Signale erzeugen beziehungsweise
übertragen. Wie Sie jedoch komplexe und hochparallele Systeme wie das Gehirn bilden,
welches Informationen aufnimmt und verarbeitet, ist zum heutigen Zeitpunkt noch
weitgehend unklar.
Axon
Synapsen
Synapsen
Zellkörper / Soma
Dendriten
Axonhügel

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 10
Künstliche Neuronen
,,Ein Neuron ist eine Verarbeitungseinheit, die die über die gewichteten Verbin-
dungen eingehenden Werte geeignet zusammenfasst (Propagierungsfunktion)
und daraus mittels einer Aktivierungsfunktion unter Beachtung eines Schwellwer-
tes einen Aktivierungszustand ermittelt. Aus dieser Aktivierung bestimmt eine
Ausgabefunktion die Ausgabe des Neurons." [Lämmel u.a. 2004, S.174]
Aufbau eines künstlichen Neurons
Aufbau eines künstlichen Neurons
Aufbau eines künstlichen Neurons
Aufbau eines künstlichen Neurons
Ein künstliches Neuron setzt sich, wie in Abb. 3 zu sehen, aus mehreren Teilen zu-
sammen. Die Erregungen aus anderen Neuronen oder aus der Umwelt gelangen als
Eingangsmuster zum Neuron. Die Eingabe wird mit Hilfe einer Propagierungsfunktion
ermittelt, welche eine Aufsummierung aller Netzeingaben, multipliziert mit dem zuge-
hörigen Verbindungsgewicht, durchführt. Mit Hilfe der Transferfunktion wird dieser
errechnete Wert umgeformt. Dazu dienen meist sigmoide, lineare oder Schwellwert-
funktionen. Die Summierung und die Transferfunktion sind in Abb. 3 innerhalb des
Neurons dargestellt. Die Ausgabefunktion ist oft die Identität, welche den ermittelten
Wert der Transferfunktion weitergibt. Die Aktivierung entscheidet anschließend über
den Aktivierungszustand des Neurons und gibt entweder eine 0 oder 1 nach außen
beziehungsweise eine 1 oder -1. Der Schwellwert, auch als bias oder threshold be-
zeichnet, ist ein Parameter, der die Aktivierung des Neurons mit entscheidet, da er als
Wert in die Summierung der Netzeingabe, also in die Propagierungsfunktion, mit ein-
geht. Somit wird eine einfachere Anwendung der Transferfunktionen erzielt, die dann
meistens ein sigmoides Verhalten um den Wert 0 erreichen.
Abbildung
Abbildung
Abbildung
Abbildung 3
3
3
3: Künstliches Neuron [Z
: Künstliches Neuron [Z
: Künstliches Neuron [Z
: Künstliches Neuron [Zsw
sw
sw
sw-
-
-
-B
B
B
Bw
w
w
w 2005]
2005]
2005]
2005]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 11
Die Funktionen eines Neurons sind bewusst elementar gehalten, da die Leistungsfähig-
keit nicht durch komplexe Algorithmen, sondern durch das Zusammenschalten vieler
einfacher Elemente erreicht werden soll.
Aktivierungsfunktionen
Aktivierungsfunktionen
Aktivierungsfunktionen
Aktivierungsfunktionen / Tran
/ Tran
/ Tran
/ Trans
ss
sferfunktionen
ferfunktionen
ferfunktionen
ferfunktionen
Die Aktivierungsfunktion formt, wie im vorherigen Kapitel beschrieben, die eingegan-
genen und aufsummierten Signale mittels einer linearen, nichtlinearen oder sigmoiden
Funktion für eine anschließende Ausgangsfunktion um. Exemplarisch sollen im Fol-
genden die am häufigsten verwendeten Vertreter von Aktivierungsfunktionen kurz
dargestellt werden.
Die Identität
Die Identität
Die Identität
Die Identität
( )
f x
x
=
ist eine lineare Aktivierungsfunktion beziehungsweise eine einfache Weitergabe des
ankommenden Signals. Sie wird insbesondere bei der Eingabeschicht von NN verwen-
det, da eine Berechnung erst in der darauf folgenden Schicht stattfindet.
Abbildung
Abbildung
Abbildung
Abbildung 4
4
4
4: Identität [
: Identität [
: Identität [
: Identität [Uni
Uni
Uni
Uni-
-
-
-Mü
Münster
nster
nster
nster 2005B
2005B
2005B
2005B]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 12
Die
Die
Die
Die Schwellwertfunktion
Schwellwertfunktion
Schwellwertfunktion
Schwellwertfunktion
( )
1,
1,
Schwellwert
x
f
x
sonst
=
-
ist eine nichtlineare Aktivierungsfunktion. Alle Werte unter einem bestimmten Schwell-
wert (=0,5 in Abb. 5) werden beispielsweise als -1 weitergegeben, alle darüber oder
dem Schwellwert gleichen als 1. Somit ist immer klar, ob ein Neuron aktiviert ist oder
nicht. Eine häufig angewandte Alternative ist die binäre Schwellwertfunktion (0 oder 1
als Ergebnis).
Abbildung
Abbildung
Abbildung
Abbildung 5
5
5
5: Schwellwertfunktion [
: Schwellwertfunktion [
: Schwellwertfunktion [
: Schwellwertfunktion [Uni
Uni
Uni
Uni-
-
-
-Mü
Münster
nster
nster
nster 2005B
2005B
2005B
2005B]]]]
Die logistische Funktion
Die logistische Funktion
Die logistische Funktion
Die logistische Funktion
logistic
1
( )
1
c x
f
x
e
-
=
+
ist eine sigmoide Aktivierungsfunktion basierend auf der e-Funktion. Sie liefert stets
Werte zwischen 0 und 1, welche an die nächste Schicht zur Verarbeitung weitergeleitet
werden.
Abbildung
Abbildung
Abbildung
Abbildung 6
6
6
6:
:
:
: L
L
L
Logis
ogis
ogis
ogistische Funktion [Uni
tische Funktion [Uni
tische Funktion [Uni
tische Funktion [Uni-
-
-
-Mü
Münster
nster
nster
nster 2005B
2005B
2005B
2005B]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 13
2.2.3
Aufbau neuronaler Netze
,,Künstliche neuronale Netze [...] sind ein Zweig der künstlichen Intelligenz und
prinzipieller Forschungsgegenstand der Neuroinformatik." [Wikipedia 2005C]
Abbildung
Abbildung
Abbildung
Abbildung 7
7
7
7: Künstlich
: Künstlich
: Künstlich
: Künstliches
es
es
es n
n
n
neuronales Netz
euronales Netz
euronales Netz
euronales Netz [[[[Verfasser
Verfasser
Verfasser
Verfasser]]]]
Ein NN besteht aus vielen Neuronen, welche, wie in Abb. 7 dargestellt, in Schichten
angeordnet, untereinander verbunden sind. Neuronen sind einfache Prozessoren, wel-
che aus den Eingangssignalen, die entweder aus der Umwelt oder von anderen Neuro-
nen stammen, auf Grundlage bestimmter mathematischer Formeln, ein Ausgangssignal
errechnen. Die Verbindungen zu anderen Neuronen besitzen so genannte Gewichte,
welche je nach ihrer Wertigkeit das zu übertragende Signal hemmen oder erregen.
Neuronen verfügen aufgrund ihrer Simplizität nur über sehr eingeschränkte Datenver-
arbeitungsfähigkeiten.
2.2.4
Eigenschaften neuronaler Netze
NN sind massiv parallel und bieten sich daher für den Einsatz auf Parallelrechnern an.
Da NN nicht auf ein Problem hin fest programmiert werden, sondern durch ein Lern-
verfahren aus einer Anzahl von Trainingsdaten trainiert werden, sind sie eher in der
Lage ­ abhängig von der gewählten Implementation ­ ihr Verhalten auf veränderte Be-
dingungen hin anzupassen. In NN ist das erlernte ,,Wissen" in den Gewichten gespei-
chert, welche sich verteilt zwischen den Netzschichten befinden. Dies führt zum einen
zu einer höheren Fehlertoleranz und zum anderen ist so erst die hochgradig parallele
Verarbeitung gewährleistet. Zudem kann ein NN beim Ausfall einzelner Netzteile unter
Berücksichtigung bestimmter Implementationsansätze (Netzgröße, Lernverfahren etc.)
einsatzfähig bleiben, da durch die verteilte Wissensrepräsentation eine hohe Fehlerto-
leranz gegeben ist. Verrauschte oder gestörte Daten können bis zu einem gewissen

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 14
Grad erkannt werden. Statt adressbezogen werden Informationen in NN inhaltsbezo-
gen gespeichert. Nur so ist es möglich, ,,ähnliche" Muster erkennen zu lassen.
Ein NN muss im Normalfall mit einer Anzahl von Trainingsdaten angelernt werden. Die
Mitgabe von Basiswissen gestaltet sich sehr schwierig und macht das Netz daher ab-
hängig von Trainingsdaten. Außerdem ist es ist kaum möglich, das NN sein eigenes
Wissen oder seinen Lösungsweg analysieren zu lassen. Selbst die Analyse von außen ist
nur mit hohem Aufwand realisierbar. Alle bisher bekannten Lernverfahren sind verhält-
nismäßig langsam. Modifikationen des Backpropagation Verfahrens, wie zum Beispiel
Quickprop, konnten zwar Verbesserungen schaffen, das Grundproblem blieb aber bis-
her bestehen.
[vgl. Zell 2003, S.26]
Trainierbarkeit
NN sind genau betrachtet immer trainierbar, die Frage ist lediglich, ob das NN von au-
ßen mit Trainingsmustern trainiert werden kann oder ohne passende Beispiele lernt.
Typische Vertreter dieser Netztypen sind auf Seiten der von außen trainierbaren Netze
Perzeptron- und Backpropagationnetze. Bolzmann-Maschine und Hopfield-Netze ste-
hen auf Seiten der Netze, denen nicht natürliche NN als Vorbild dienen, sondern physi-
kalische Modelle, wie beispielsweise die Teilchenbewegung in Metallen. In diesem Fall
werden die Gewichte zur Berechnung einer Zielfunktion, sozusagen eines Energieni-
veaus, benutzt.
[vgl. Lämmel u.a. 2004, S.180]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 15
2.2.5
Netzarchitekturen
Vorwärts verkettet
Vorwärts verkettete beziehungsweise gerichtete NN, auch als feed forward Netze be-
zeichnet, bestehen aus einer Eingabe-, einer Ausgabeschicht und einer beliebigen An-
zahl an Zwischenschichten. Die Neuronen verschiedener Schichten dürfen nur in Rich-
tung der Ausgabeschicht miteinander verbunden sein.
[vgl. Lämmel u.a. 2004, S.183]
Vollvernetzt
In vollvernetzten NN, auch vollvermascht genannt, sind sämtliche Neuronen einer
Schicht mit jeweils allen der nachfolgenden Schicht in Richtung der Ausgabeschicht
verbunden (siehe Abb. 8). Es handelt es sich um eine Spezialform der vorwärts verket-
teten NN mit der maximal möglichen Anzahl an Verbindungen zwischen aufeinander
folgenden Schichten. Diese Konfiguration wird in der Praxis häufig verwendet verwen-
det.
Abbildung
Abbildung
Abbildung
Abbildung 8
8
8
8: Vollvernetztes
: Vollvernetztes
: Vollvernetztes
: Vollvernetztes n
n
n
neuronale
euronale
euronale
euronales
ss
s Netz
Netz
Netz
Netz [
[
[
[Heuler
Heuler
Heuler
Heuler 1997
1997
1997
1997]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 16
Rückkopplung
Rückgekoppelte NN, auch rekurrente NN genannt, haben die Eigenschaft, dass Neuro-
nen untereinander nicht nur in Richtung der Ausgabeschicht verbunden sind, sondern
die Aktivierung auch an Neuronen einer oder mehrerer zurückliegender Schichten ge-
leitet wird (siehe Abb. 9).
Abbildung
Abbildung
Abbildung
Abbildung 9
9
9
9: Rückgekoppeltes
: Rückgekoppeltes
: Rückgekoppeltes
: Rückgekoppeltes n
n
n
neuronales Netz
euronales Netz
euronales Netz
euronales Netz [
[
[
[Heuler
Heuler
Heuler
Heuler 1997
1997
1997
1997]]]]
Eine Rückkopplung innerhalb eines NN ist immer dann notwendig, wenn das Ergebnis
nicht nur von der aktuellen Netzeingabe abhängt, sondern zusätzlich von dessen zeit-
lichen Verlauf. Deutlich wird dies zum Beispiel bei der Vorhersage von Koordinaten
einer Sinuskurve mittels NN. Ein Netz ohne Rückkopplung kann nicht erkennen, ob sie
im Begriff ist zu fallen oder zu steigen, also die nächste y-Koordinate größer oder klei-
ner ist. In diesem Fall ist das Ergebnis des letzten Netzdurchlaufes wichtig, welches bei
der Rückkopplung aus der Ausgabeschicht wieder an eine oder mehrere Schichten zu-
rück geleitet wird.
Typische Beispiele dieses Verfahrens sind das Jordan- und das Elman-Netz.
[vgl. Heßling 2004]
2.2.6
Lernen
NN erhalten ihr Wissen im Allgemeinen durch das Erlernen von Trainingsmustern, dem
so genannten überwachten Lernen. Diese Methode lässt sich jedoch nur dann anwen-
den, wenn alle Daten für das überwachte Lernen zur Verfügung stehen.
Für das überwachte Lernen müssen Netzeingaben in Verbindung mit den dazugehöri-
gen Netzausgaben vorhanden sein. Ziel des überwachten Lernens ist es, die Ist-
Ausgabe mit der Soll-Ausgabe zu vergleichen und anhand der Differenz die Gewichte
der Verbindungen zu modifizieren.
Beim unüberwachten Lernen, dem so genannten self-organized learning oder auch
unsupervised learning, versucht das NN die Eingaben selbsttätig in Ähnlichkeitsklassen

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 17
aufzuteilen, ohne einen Zielwert zu kennen. Eine externe Kontrolle entfällt bei diesem
Verfahren.
Für die dritte Variante, das bestärkende Lernen, ist nicht die exakte Differenz zwischen
Ist-Ausgabe und Soll-Ausgabe interessant, sondern nur der Gegenstand der Überein-
stimmung. Der Netzfehler wird anschließend durch selbstständige Anpassung der
Lernregeln des NN minimiert.
Lernverfahren
Um NN zu trainieren bedarf es so genannter Lernverfahren oder ­regeln. Diese sind
mathematische Formeln zur Anpassung (Adaption) der Gewichte innerhalb des NN.
Die Delta-Regel (oder auch Widrow-Hoff-Regel) ist von der hebbschen Lernregel abge-
leitet und ein Spezialfall des Backpropagationverfahrens (siehe nächster Absatz). Sie
dient der Adaption von Gewichten der Verbindungen, indem der Wert der Gewichte,
ausgehend vom Anteil am Netzfehler, verändert wird. Dieser Fehler entspricht der Dif-
ferenz zwischen der erwarteten und der tatsächlichen Ausgabe des Netzes. Die Delta
Regel kann nur bei vorwärts verketteten Netzen mit einer Schicht von trainierbaren
Verbindungen angewendet werden, also nur bei NN ohne Zwischenschichten.
Backpropagation ist ein überwachtes Lernverfahren für NN. Es wird benötigt, wenn in
einem NN Zwischenschichten vorhanden sind, da es für die darin enthaltenen Neuro-
nen keine erwartete Ausgabe gibt, mit der die errechnete Ausgabe verglichen werden
kann. Die zuvor beschriebene Delta Regel kann nur für Netze ohne Zwischenschichten
eingesetzt werden.
Definiert sind zwei Netzdurchläufe, beginnend von der Eingabe- zur Ausgabeschicht
(Vorwärtsdurchlauf) und anschließend entgegengesetzt (Rückwärtsdurchlauf). Beim
Rückwärtsdurchlauf erfolgt eine Gewichtsveränderung der Netzgewichte ausgehend
von einem bestimmten Fehlersignal. Dieses Signal errechnet sich aus der Abweichung
der berechneten zu der erwarteten Ausgabe. Vorgenommen wird diese Gewichtsverän-
derung schichtweise, angefangen mit den Verbindungen zur Ausgabeschicht, über die
inmitten der Zwischenschichten, bis hin zu den Gewichten der Verbindungen der Ein-
gabeschicht zu den Zwischenschichten, also rückwärts.
Dem Backpropagation Verfahren liegt ein Gradientenabstiegsverfahren, das heißt eine
Methode des steilsten Abstiegs, zugrunde. Mit diesem Ansatz wird versucht, eine
Kombination von Gewichten zu finden, bei der die Aufrechnung der einzelnen Fehler
zu einer Fehlersumme minimal ist. Es kann also von einem globalen Minimum der Feh-
lerfunktion gesprochen werden, wenn der Netzfehler konvergiert, also der Fehler klei-
ner wird als ein vorher festgelegter Wert. Eine andere Möglichkeit, ein positives Ende
eines Backpropagation Durchlaufes zu finden, ist der Abbruch in dem Moment, in dem
die berechneten Ausgaben den erwarteten entsprechen.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz
zur Steuerung einer Papierschneidemaschine
Bastian Schindler | Matrikel Nr. s0501103
Seite 18
,,Backpropagation ist ein Gradientenabstiegsverfahren. Wenn man den Fehler ei-
nes neuronalen Netzes als Funktion der Gewichte des Netzwerks graphisch auf-
trägt, erhält man eine Fehlerfläche, die sich im zweidimensionalen Fall anschau-
lich graphisch darstellen lässt." [Zell 2003, S.105]
Abbildung
Abbildung
Abbildung
Abbildung 10
10
10
10: Fehler
: Fehler
: Fehler
: Fehlerfläche
fläche
fläche
fläche zweier Gewichte
zweier Gewichte
zweier Gewichte
zweier Gewichte [[[[Uni
Uni
Uni
Uni-
-
-
-Mü
Münster
nster
nster
nster 2005A
2005A
2005A
2005A]]]]
2.2.7
Netzgrößen und Generalisierungsfähigkeit
Ein großer Vorteil der NN liegt darin, dass sie nicht nur gelernte Situationen wiederer-
kennen, sondern anhand dieser unter bestimmten Bedingungen zur Generalisierung
fähig sein können. NN sind demnach potentiell in der Lage, Muster, die sie nicht ge-
lernt haben, richtig zu klassifizieren. Ein Kriterium für die Generalisierungsfähigkeit
eines NN ist die Netzgröße, abhängig von der Anzahl und der Art der TM (Trainings-
muster). Da sowohl Eingabe- als auch Ausgabeschicht mit ihren jeweiligen Gewichten
von der Problemstellung abhängen und somit meistens nicht variabel sind, ist die Ge-
neralisierungsfähigkeit des NN unter anderem von der Größe der Zwischenschicht(en)
abhängig.
Ein Ansatz, die passende Größe der Zwischenschicht(en) zu ermitteln ist, einen der
Faktoren ,,Netzgröße" oder ,,Anzahl der Trainingmuster" variabel zu lassen und durch
Verringerung derer Anzahl solange zu experimentieren, bis der Moment gefunden ist,
in dem das Netz die gegebenen TM noch erlernen kann, die Fehlerkurve also gegen
Null konvergiert. Ist das Netz zu groß, werden die gegebenen TM nur auswendig ge-

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2005
ISBN (eBook)
9783832495497
ISBN (Paperback)
9783838695495
DOI
10.3239/9783832495497
Dateigröße
4 MB
Sprache
Deutsch
Institution / Hochschule
Hochschule für Technik und Wirtschaft Berlin – 4 Wirtschaftswissenschaften II
Erscheinungsdatum
2006 (Mai)
Note
1,3
Schlagworte
generalisierung cip3 snns netz
Zurück

Titel: Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
89 Seiten
Cookie-Einstellungen