Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine

Schindler, Bastian

Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine

Zusammenfassung

Inhaltsangabe:Einleitung:
Die Entwicklung von Software für Papierschneidemaschinen (PSM) begann bei der Firma MCS MICRONIC Computer Systeme schon vor über 15 Jahren. Die Technik verbesserte sich im Laufe der Zeit, ebenso die Visualisierung und Usability für den Benutzer. Eines hat sich jedoch nicht geändert: es wird immer noch ein kundiger Beschneider, also der Bediener der Maschine, benötigt, um die schnellste und wirtschaftlichste Schnittabfolge zu erstellen. Die Idee zu einer Software, die selbstständig sinnvolle Schnittfolgen generiert, entstand in Gesprächen mit meinem Erstbetreuer Professor Heßling und stieß sowohl bei MCS als auch bei Perfecta, einem Hersteller von PSM, auf reges Interesse.
Das Beschneiden von großformatigen Papierbögen aus Druckereien erfordert einen geeigneten Beschneider, der auf Grund seiner Erfahrung eine effektive und ressourcenschonende Schnittfolge gewährleistet. Ziel dieser Arbeit soll demnach sein, die Möglichkeiten zur Ermittlung eines sinnvollen Schnittes, abhängig von der jeweiligen Situation, zu untersuchen, die eine künstliche Intelligenz (KI) auf Basis eines neuronalen Netzes (NN) bietet. Außerdem soll das Schnittgut mit allen Nutzen und möglichen Schnitten visualisiert werden. Die Visualisierung und Bedienung der Benutzeroberfläche ist intuitiv zu gestalten, um das Arbeiten an der PSM auch ungelernten Kräften zu ermöglichen. Unter Umständen besteht die Chance, einen kundigen Beschneider durch einen weniger versierten Bediener zu ersetzen.
Die Abschlussarbeit wird von MCS MICRONIC Computer Systeme GmbH begleitet, da potentielles Interesse am zukünftigen Einsatz und der Vermarktung des erarbeiteten Prototyps besteht. Die vorliegende Diplomarbeit mit dem Titel Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine untersucht, inwieweit sich eine KI auf Grundlage eines NN zur Generierung von sinnvollen Schnittvorschlägen bei einer Software für PSM eignet.
Dazu werden zunächst die Grundlagen in den Bereichen KI und NN erarbeitet, anschließend die Kriterien für den zu entwickelnden Prototyp aufgezeigt und die Aufgaben genauer spezifiziert. Danach folgt eine Beschreibung der Entwurfsphase. Erläuterungen der einzelnen Programmteile und -abläufe führen schließlich zu umfangreichen Tests über die Korrektheit, Leistungsfähigkeit und dem Innovationspotential der KI sowie der Qualität der Benutzeroberfläche. Abschließend werden die erarbeiteten Ergebnisse […]

Leseprobe

Inhaltsverzeichnis

Bastian Schindler

Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung

einer Papierschneidemaschine

ISBN-10: 3-8324-9549-5

ISBN-13: 978-3-8324-9549-7

Druck Diplomica® GmbH, Hamburg, 2006

Zugl. Fachhochschule für Technik und Wirtschaft Berlin, Berlin, Deutschland,

Diplomarbeit, 2005

Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte,

insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von

Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der

Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen,

bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung

dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen

der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik

Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich

vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des

Urheberrechtes.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in

diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme,

dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei

zu betrachten wären und daher von jedermann benutzt werden dürften.

Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können

Fehler nicht vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die

Autoren oder Übersetzer übernehmen keine juristische Verantwortung oder irgendeine

Haftung für evtl. verbliebene fehlerhafte Angaben und deren Folgen.

http://www.diplom.de, Hamburg 2006

Printed in Germany

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 2

Einleitung... 5

Grundlagen ... 6

2.1

Einführung künstliche Intelligenz...6

2.2

Künstliche neuronale Netze ...7

2.2.1

Einführung ...7

2.2.2

Natürliche und künstliche Neuronen ...8

2.2.3

Aufbau neuronaler Netze ... 13

2.2.4

Eigenschaften neuronaler Netze ...13

2.2.5

Netzarchitekturen ...15

2.2.6

Lernen...16

2.2.7

Netzgrößen und Generalisierungsfähigkeit ...18

2.2.8

Schematischer Überblick über neuronale Netze...19

Analyse ... 21

3.1

Ausgangssituation und Problembeschreibung ...21

3.2

Papierschneidemaschinen in der Praxis ... 22

3.2.1

Schneiden mit Schnellschneidern oder Planschneidern...22

3.2.2

Profil der beteiligten Firmen Perfecta und MCS...25

3.2.3

Schnellschneider der Firma Perfecta ...26

3.3

Dateiformate und standards...28

3.3.1

JDF, CIP3 und CIP4 ...28

3.3.2

Schnittprogramme...28

3.3.3

SNNS Netzdateien und Trainingsmusterdateien ...29

Anforderungsdefinition ... 30

4.1

Zielsetzung der Arbeit und Eingrenzung des Themas ...30

4.2

Pflichtenheft ...31

Design... 37

5.1

Benutzerführung...37

5.2

Model View Controller...38

5.3

Prototyping ...39

5.4

Unified Modeling Language...40

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 3

Implementierung... 43

6.1

Das Entwicklungsumfeld ...43

6.1.1

Stuttgarter Neuronale Netz Simulator...43

6.1.2

Entwicklungsumgebung Microsoft .net...44

6.2

Strukturierung und Workflow des Prototyps...44

6.2.1

Look 'n Feel und Workflow der GUI ...44

6.2.2

Workflow der Core ...48

6.2.3

Künstliche Intelligenz des Prototyps...49

6.2.4

Kommunikation des Programms mit dem Netz ...50

6.3

Beschreibung besonderer Codefragmente ...51

Untersuchungen ... 53

7.1

Erfüllung der Randbedingungen...54

7.1.1

Kontrolle: Benutzerfreundlichkeit der GUI ...54

7.1.2

Kontrolle: Ausgabewerte des NN im Vergleich zum SNNS...54

7.1.3

Kontrolle: Koordinatenunabhängigkeit des Prototyps...55

7.1.4

Kontrolle: Wiedergabe einer erlernten Schnittabfolge...56

7.1.5

Kontrolle: Wiedergabe zweier erlernter Schnittabfolgen ...57

7.1.6

Kontrolle: Wiedergabe fünf erlernter Schnittabfolgen ...58

7.2

Denkbares Innovationspotential des Prototyps ...58

7.2.1

Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen I ...58

7.2.2

Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen II ...59

7.2.3

Untersuchung: notwendige Größe der Zwischenschicht...60

7.2.4

Untersuchung: Wiederholung 7.2.2 mit Zwischenschichtgröße aus 7.2.3 ...61

7.2.5

Untersuchung: Übertragbarkeit von Wissen auf andere Konstellationen III ...61

7.2.6

Untersuchung: Aussagekraft 7.2.5 ...62

Ergebnis und Zusammenfassung ... 63

8.1

Zusammenfassung...63

8.2

Bewertung und Fazit ...64

8.3

Software anderer Hersteller im Vergleich zum Prototyp ...65

8.4

Ausblick und Ideen ...66

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 4

Quellenverzeichnis ... 68

10.

Abbildungsverzeichnis ... 70

11.

Abkürzungsverzeichnis ... 71

12.

Glossar... 72

13.

Anhang ... 77

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 5

Einleitung

Die Entwicklung von Software für Papierschneidemaschinen (PSM) begann bei der Firma

MCS MICRONIC Computer Systeme schon vor über 15 Jahren. Die Technik verbesserte

sich im Laufe der Zeit, ebenso die Visualisierung und Usability für den Benutzer. Eines

hat sich jedoch nicht geändert: es wird immer noch ein kundiger Beschneider, also der

Bediener der Maschine, benötigt, um die schnellste und wirtschaftlichste Schnittabfolge

zu erstellen. Die Idee zu einer Software, die selbstständig sinnvolle Schnittfolgen gene-

riert, entstand in Gesprächen mit meinem Erstbetreuer Professor Heßling und stieß

sowohl bei MCS als auch bei Perfecta, einem Hersteller von PSM, auf reges Interesse.

Das Beschneiden von großformatigen Papierbögen aus Druckereien erfordert einen

geeigneten Beschneider, der auf Grund seiner Erfahrung eine effektive und ressourcen-

schonende Schnittfolge gewährleistet. Ziel dieser Arbeit soll demnach sein, die Mög-

lichkeiten zur Ermittlung eines sinnvollen Schnittes, abhängig von der jeweiligen Situa-

tion, zu untersuchen, die eine künstliche Intelligenz (KI) auf Basis eines neuronalen

Netzes (NN) bietet. Außerdem soll das Schnittgut mit allen Nutzen und möglichen

Schnitten visualisiert werden. Die Visualisierung und Bedienung der Benutzeroberfläche

ist intuitiv zu gestalten, um das Arbeiten an der PSM auch ungelernten Kräften zu er-

möglichen. Unter Umständen besteht die Chance, einen kundigen Beschneider durch

einen weniger versierten Bediener zu ersetzen.

Die Abschlussarbeit wird von MCS MICRONIC Computer Systeme GmbH begleitet, da

potentielles Interesse am zukünftigen Einsatz und der Vermarktung des erarbeiteten

Prototyps besteht.

Die vorliegende Diplomarbeit mit dem Titel ,,Entwurf und prototypische Realisierung

einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine" untersucht,

inwieweit sich eine KI auf Grundlage eines NN zur Generierung von sinnvollen Schnitt-

vorschlägen bei einer Software für PSM eignet.

Dazu werden zunächst die Grundlagen in den Bereichen KI und NN erarbeitet, an-

schließend die Kriterien für den zu entwickelnden Prototyp aufgezeigt und die Aufga-

ben genauer spezifiziert. Danach folgt eine Beschreibung der Entwurfsphase. Erläute-

rungen der einzelnen Programmteile und abläufe führen schließlich zu umfangreichen

Tests über die Korrektheit, Leistungsfähigkeit und dem Innovationspotential der KI

sowie der Qualität der Benutzeroberfläche. Abschließend werden die erarbeiteten Er-

gebnisse zusammengefasst, um mögliche Ausblicke für die Weiterentwicklung zu ge-

ben.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 6

Grundlagen

2.1

Einführung künstliche Intelligenz

,,Künstliche Intelligenz (KI, beziehungsweise AI vom englischen Artificial Intelli-

gence) ist eine Fachdisziplin der Informatik mit interdisziplinärem Charakter. Ziel

der KI ist es, Maschinen zu entwickeln, die sich verhalten, als verfügten sie über

Intelligenz. (John McCarthy, 1955)" [Wikipedia 2005B]

Eine Definition für KI zu finden scheint einfach, scheitert jedoch an den unterschiedli-

chen Vorstellungen der Betrachter. Problemstellungen, die dem Menschen einen ge-

wissen Grad an Intelligenz abfordern, zum Beispiel die Lösung mathematischer Aufga-

ben, sind vom Computer innerhalb kürzester Zeit berechnet. Paradoxer Weise sind es

gerade Alltagssituationen, die jeder Mensch täglich meistert, wie beispielsweise das

Erkennen von Gesichtern, welche schwer durch Rechner automatisiert werden können.

KI beschäftigt sich sowohl mit diesen alltäglichen Folgerungsprozessen, als auch mit

komplexen Expertenaufgaben.

Die Forschung der KI wird hauptsächlich für zwei Wissenschaftsbereiche benötigt. Zum

einen, um klügere Programme und Maschinen zu erschaffen, zum anderen, um Theo-

rien zur menschlichen Intelligenz zu testen und Verhaltensweisen zu simulieren. Die

Schaffung intelligenter Maschinen, welche das menschliche Verhalten nachahmen, die

so genannte starke KI, ist bis heute weitgehend Utopie geblieben, nicht zuletzt auf-

grund des Scheiterns an ihrer philosophischen Fragestellung. Die Forschung an der

schwachen KI hingegen, die sich mit der Lösung mathematischer, planungstechnischer

und anderer Anwendungsprobleme beschäftigt, hat in den letzten Jahren einige Erfolge

verzeichnet und ist zu einem großen Forschungsgebiet herangewachsen.

[vgl. Cawsey 2003, S.13]

,,Letztlich geht es der schwachen KI somit um die Simulation intelligenten Ver-

haltens mit Mitteln der Mathematik und der Informatik; es geht ihr nicht um

Schaffung von Bewusstsein oder um ein tieferes Verständnis von Intelligenz."

[Wikipedia 2005B]

Der Terminus ,,künstliche Intelligenz" impliziert, dass es sich um etwas Künstliches, der

natürlichen Intelligenz nachempfundenen handelt. Um dies zu ermöglichen stellt sich

die Frage, wie natürliche Intelligenz funktioniert.

Bei eingehender Beschäftigung mit dieser Frage wird deutlich, dass vor allem hinter

dem menschlichen Verhalten viel mehr steckt, als eine Menge festgelegter Verhaltens-

regeln, die mehr oder weniger klar in algorithmischen Strukturen abgebildet werden

können.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 7

Um biologische Intelligenz nachzuahmen, muss das Zentrum dieser Intelligenz - das

Gehirn, ein Netz aus Milliarden von kleinen, hoch spezialisierten Zellen, den Neuronen

- verstanden und abzubilden versucht werden.

NN sind der Versuch, die Nervenzellen des Gehirns zu imitieren und für eine künstliche

Intelligenz zu nutzen.

[vgl. Thiel 2003]

2.2

Künstliche neuronale Netze

Warren McCulloch und Walter Pitts waren im Jahr 1943 die Pioniere, die sich mit ihrem

Formalmodell des Neurons mit dem Thema NN beschäftigten. Die Arbeiten dazu haben

seit Mitte der achtziger Jahre sehr stark zugenommen.

2.2.1

Einführung

Was sind neuronale Netze?

Künstliche NN sind informationsverarbeitende Systeme. Sie bestehen aus einer unter-

schiedlichen Anzahl von Neuronen, die sich über gerichtete Verbindungen Informatio-

nen zusenden. Die Art der Information ist auf zwei Zustände reduziert, einer aktivier-

ten und einer nicht aktivierten Zelle.

Diesem einfachen System dient die Natur, genauer das Studium des Gehirns der Säu-

getiere, als grobes Vorbild. Die Informationsweiterleitung funktioniert dort ebenfalls

über parallel geschaltete, einfache Nervenzellen.

Es gibt unterschiedliche Motivationen für die Forschung an NN. Die Nachahmung der

Informationsweiterleitung bei Säugetieren, also die Ähnlichkeit des Modells mit der

biologischen Realität, ist nur eine davon. Hierbei wird versucht, dem biologischen Vor-

bild so nah wie möglich zu kommen, um mittels Simulation an noch unentdeckte Er-

gebnisse zu gelangen. In der Naturwissenschaft sind NN von großem Interesse, da es

sich um massiv parallele, lernfähige Systeme handelt. Sie werden für Netzwerksimula-

tionen, neuronale Hardware oder den Einsatz in Programmen verwendet.

Ein NN muss nicht auf ein Problem hin programmiert werden, es erlernt die Problemlö-

sung aus einer Anzahl von Trainingsmustern (TM), wobei es sehr effizient sein kann.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 8

Abbildung

Abbildung 1

1: Konnektionism

: Konnektionism

: Konnektionismus n

us n

us neuronaler Netze [

euronaler Netze [

euronaler Netze [Zell

Zell

Zell 2003

2003

2003, S.24]

, S.24]

An der Erforschung NN sind unter anderem naturwissenschaftliche Bereiche interes-

siert wie die Biologie/Neurobiologie, Medizin/Neurophysiologie, Psychologie, Bioin-

formatik, Informatik, künstliche Intelligenz, Mathematik, Physik und Elektrotechnik. Die

Anteile der einzelnen Fachrichtungen am Themengebiet der NN sind in Abb. 1 darge-

stellt. Dort wird ersichtlich, dass der größte Schwerpunkt in der Informatik zu finden

ist, gefolgt von der Elektrotechnik, der Biologie und der Medizin. Die Gründe differie-

ren jedoch, da zum Beispiel in der Informatik oft Problemlösungen mit NN generiert

werden, NN in der Biologie aber eher der Simulation von Organismen und Organen

dienen.

[vgl. Zell 2003, S.23]

2.2.2

Natürliche und künstliche Neuronen

Das Vorbild künstlicher Neuronen ist die Natur. In diesem Kapitel soll zunächst das

biologische und das künstliche Neuron dargestellt und erläutert werden. Künstliche NN

bestehen aus einem Verbund künstlicher Neuronen, welche in Schichten angeordnet

sind. Der Aufbau NN wird im Anschluss veranschaulicht.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 9

Biologische Neuronen

,,Grundbaustein eines jeden Organismus ist die Zelle. Die Grundzelle eines Ge-

hirns ist das Neuron." [Hs-Bremen 1998]

Ein Neuron, die wissenschaftliche Bezeichnung einer Nervenzelle und elementarer Bau-

stein von Nervennetzen, besteht im Wesentlichen, wie in Abb. 2 zu sehen ist, aus

Dendriten, Synapsen, dem Soma (Zellkörper) und einem sich verzweigenden Fortsatz,

dem Axon.

Abbildung

Abbildung 2

2: Schema ein

: Schema ein

: Schema eines natürlichen Ne

es natürlichen Ne

es natürlichen Neu

urons [Hs

rons [Hs

rons [Hs-

-B

Bremen

remen

remen 1998

1998

1998]]]]

Der Signalempfang eines Neurons erfolgt über die an den Dendriten befindlichen Sy-

napsen. Dendriten sind stark verzweigte Bereiche der Nervenzellen, deren Fortsätze

eine Art Antennenfunktion für die Aufnahme elektrischer Impulse von anderen Neuro-

nen haben. Innerhalb des Neurons wird das ankommende Signal umgeformt. Beim Er-

reichen eines bestimmten Schwellwerts leitet das Neuron diese Impulse, auch Aktions-

potentiale genannt, über das Axon an die am Ende des Axons befindlichen Synapsen

weiter. Diese wandeln das ankommende elektrische Signal zurück in ein chemisches

Signal, um es an Dendriten anderer Neuronen zu senden. Der Fluss von Informationen

in den Neuronen erfolgt gerichtet.

Es stellt sich die Frage, wie und wo die eigentliche Information gespeichert wird, wenn

Neuronen nur der Weiterleitung von Signalen dienen und selbst keine Daten speichern

können. Der Informationsspeicher ist in den Verbindungen der Neuronen und dem

Konstrukt des Gehirns selbst, also dem Zusammenschluss vieler Zellen, zu suchen.

Inzwischen ist bekannt, in welcher Weise Neuronen Signale erzeugen beziehungsweise

übertragen. Wie Sie jedoch komplexe und hochparallele Systeme wie das Gehirn bilden,

welches Informationen aufnimmt und verarbeitet, ist zum heutigen Zeitpunkt noch

weitgehend unklar.

Axon

Synapsen

Zellkörper / Soma

Dendriten

Axonhügel

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 10

Künstliche Neuronen

,,Ein Neuron ist eine Verarbeitungseinheit, die die über die gewichteten Verbin-

dungen eingehenden Werte geeignet zusammenfasst (Propagierungsfunktion)

und daraus mittels einer Aktivierungsfunktion unter Beachtung eines Schwellwer-

tes einen Aktivierungszustand ermittelt. Aus dieser Aktivierung bestimmt eine

Ausgabefunktion die Ausgabe des Neurons." [Lämmel u.a. 2004, S.174]

Aufbau eines künstlichen Neurons

Ein künstliches Neuron setzt sich, wie in Abb. 3 zu sehen, aus mehreren Teilen zu-

sammen. Die Erregungen aus anderen Neuronen oder aus der Umwelt gelangen als

Eingangsmuster zum Neuron. Die Eingabe wird mit Hilfe einer Propagierungsfunktion

ermittelt, welche eine Aufsummierung aller Netzeingaben, multipliziert mit dem zuge-

hörigen Verbindungsgewicht, durchführt. Mit Hilfe der Transferfunktion wird dieser

errechnete Wert umgeformt. Dazu dienen meist sigmoide, lineare oder Schwellwert-

funktionen. Die Summierung und die Transferfunktion sind in Abb. 3 innerhalb des

Neurons dargestellt. Die Ausgabefunktion ist oft die Identität, welche den ermittelten

Wert der Transferfunktion weitergibt. Die Aktivierung entscheidet anschließend über

den Aktivierungszustand des Neurons und gibt entweder eine 0 oder 1 nach außen

beziehungsweise eine 1 oder -1. Der Schwellwert, auch als bias oder threshold be-

zeichnet, ist ein Parameter, der die Aktivierung des Neurons mit entscheidet, da er als

Wert in die Summierung der Netzeingabe, also in die Propagierungsfunktion, mit ein-

geht. Somit wird eine einfachere Anwendung der Transferfunktionen erzielt, die dann

meistens ein sigmoides Verhalten um den Wert 0 erreichen.

Abbildung

Abbildung 3

3: Künstliches Neuron [Z

: Künstliches Neuron [Z

: Künstliches Neuron [Zsw

sw-

-B

w 2005]

2005]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 11

Die Funktionen eines Neurons sind bewusst elementar gehalten, da die Leistungsfähig-

keit nicht durch komplexe Algorithmen, sondern durch das Zusammenschalten vieler

einfacher Elemente erreicht werden soll.

Aktivierungsfunktionen

Aktivierungsfunktionen / Tran

/ Tran

/ Trans

sferfunktionen

ferfunktionen

Die Aktivierungsfunktion formt, wie im vorherigen Kapitel beschrieben, die eingegan-

genen und aufsummierten Signale mittels einer linearen, nichtlinearen oder sigmoiden

Funktion für eine anschließende Ausgangsfunktion um. Exemplarisch sollen im Fol-

genden die am häufigsten verwendeten Vertreter von Aktivierungsfunktionen kurz

dargestellt werden.

Die Identität

( )

f x

ist eine lineare Aktivierungsfunktion beziehungsweise eine einfache Weitergabe des

ankommenden Signals. Sie wird insbesondere bei der Eingabeschicht von NN verwen-

det, da eine Berechnung erst in der darauf folgenden Schicht stattfindet.

Abbildung

Abbildung 4

4: Identität [

: Identität [

: Identität [Uni

Uni

Uni-

-Mü

Mü

Münster

nster

nster 2005B

2005B

2005B]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 12

Die

Die Schwellwertfunktion

Schwellwertfunktion

( )

Schwellwert

sonst

ist eine nichtlineare Aktivierungsfunktion. Alle Werte unter einem bestimmten Schwell-

wert (=0,5 in Abb. 5) werden beispielsweise als -1 weitergegeben, alle darüber oder

dem Schwellwert gleichen als 1. Somit ist immer klar, ob ein Neuron aktiviert ist oder

nicht. Eine häufig angewandte Alternative ist die binäre Schwellwertfunktion (0 oder 1

als Ergebnis).

Abbildung

Abbildung 5

5: Schwellwertfunktion [

: Schwellwertfunktion [

: Schwellwertfunktion [Uni

Uni

Uni-

-Mü

Mü

Münster

nster

nster 2005B

2005B

2005B]]]]

Die logistische Funktion

logistic

( )

c x

ist eine sigmoide Aktivierungsfunktion basierend auf der e-Funktion. Sie liefert stets

Werte zwischen 0 und 1, welche an die nächste Schicht zur Verarbeitung weitergeleitet

werden.

Abbildung

Abbildung 6

: L

Logis

ogis

ogistische Funktion [Uni

tische Funktion [Uni

tische Funktion [Uni-

-Mü

Mü

Münster

nster

nster 2005B

2005B

2005B]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 13

2.2.3

Aufbau neuronaler Netze

,,Künstliche neuronale Netze [...] sind ein Zweig der künstlichen Intelligenz und

prinzipieller Forschungsgegenstand der Neuroinformatik." [Wikipedia 2005C]

Abbildung

Abbildung 7

7: Künstlich

: Künstlich

: Künstliches

es n

neuronales Netz

euronales Netz

euronales Netz [[[[Verfasser

Verfasser

Verfasser]]]]

Ein NN besteht aus vielen Neuronen, welche, wie in Abb. 7 dargestellt, in Schichten

angeordnet, untereinander verbunden sind. Neuronen sind einfache Prozessoren, wel-

che aus den Eingangssignalen, die entweder aus der Umwelt oder von anderen Neuro-

nen stammen, auf Grundlage bestimmter mathematischer Formeln, ein Ausgangssignal

errechnen. Die Verbindungen zu anderen Neuronen besitzen so genannte Gewichte,

welche je nach ihrer Wertigkeit das zu übertragende Signal hemmen oder erregen.

Neuronen verfügen aufgrund ihrer Simplizität nur über sehr eingeschränkte Datenver-

arbeitungsfähigkeiten.

2.2.4

Eigenschaften neuronaler Netze

NN sind massiv parallel und bieten sich daher für den Einsatz auf Parallelrechnern an.

Da NN nicht auf ein Problem hin fest programmiert werden, sondern durch ein Lern-

verfahren aus einer Anzahl von Trainingsdaten trainiert werden, sind sie eher in der

Lage abhängig von der gewählten Implementation ihr Verhalten auf veränderte Be-

dingungen hin anzupassen. In NN ist das erlernte ,,Wissen" in den Gewichten gespei-

chert, welche sich verteilt zwischen den Netzschichten befinden. Dies führt zum einen

zu einer höheren Fehlertoleranz und zum anderen ist so erst die hochgradig parallele

Verarbeitung gewährleistet. Zudem kann ein NN beim Ausfall einzelner Netzteile unter

Berücksichtigung bestimmter Implementationsansätze (Netzgröße, Lernverfahren etc.)

einsatzfähig bleiben, da durch die verteilte Wissensrepräsentation eine hohe Fehlerto-

leranz gegeben ist. Verrauschte oder gestörte Daten können bis zu einem gewissen

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 14

Grad erkannt werden. Statt adressbezogen werden Informationen in NN inhaltsbezo-

gen gespeichert. Nur so ist es möglich, ,,ähnliche" Muster erkennen zu lassen.

Ein NN muss im Normalfall mit einer Anzahl von Trainingsdaten angelernt werden. Die

Mitgabe von Basiswissen gestaltet sich sehr schwierig und macht das Netz daher ab-

hängig von Trainingsdaten. Außerdem ist es ist kaum möglich, das NN sein eigenes

Wissen oder seinen Lösungsweg analysieren zu lassen. Selbst die Analyse von außen ist

nur mit hohem Aufwand realisierbar. Alle bisher bekannten Lernverfahren sind verhält-

nismäßig langsam. Modifikationen des Backpropagation Verfahrens, wie zum Beispiel

Quickprop, konnten zwar Verbesserungen schaffen, das Grundproblem blieb aber bis-

her bestehen.

[vgl. Zell 2003, S.26]

Trainierbarkeit

NN sind genau betrachtet immer trainierbar, die Frage ist lediglich, ob das NN von au-

ßen mit Trainingsmustern trainiert werden kann oder ohne passende Beispiele lernt.

Typische Vertreter dieser Netztypen sind auf Seiten der von außen trainierbaren Netze

Perzeptron- und Backpropagationnetze. Bolzmann-Maschine und Hopfield-Netze ste-

hen auf Seiten der Netze, denen nicht natürliche NN als Vorbild dienen, sondern physi-

kalische Modelle, wie beispielsweise die Teilchenbewegung in Metallen. In diesem Fall

werden die Gewichte zur Berechnung einer Zielfunktion, sozusagen eines Energieni-

veaus, benutzt.

[vgl. Lämmel u.a. 2004, S.180]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 15

2.2.5

Netzarchitekturen

Vorwärts verkettet

Vorwärts verkettete beziehungsweise gerichtete NN, auch als feed forward Netze be-

zeichnet, bestehen aus einer Eingabe-, einer Ausgabeschicht und einer beliebigen An-

zahl an Zwischenschichten. Die Neuronen verschiedener Schichten dürfen nur in Rich-

tung der Ausgabeschicht miteinander verbunden sein.

[vgl. Lämmel u.a. 2004, S.183]

Vollvernetzt

In vollvernetzten NN, auch vollvermascht genannt, sind sämtliche Neuronen einer

Schicht mit jeweils allen der nachfolgenden Schicht in Richtung der Ausgabeschicht

verbunden (siehe Abb. 8). Es handelt es sich um eine Spezialform der vorwärts verket-

teten NN mit der maximal möglichen Anzahl an Verbindungen zwischen aufeinander

folgenden Schichten. Diese Konfiguration wird in der Praxis häufig verwendet verwen-

det.

Abbildung

Abbildung 8

8: Vollvernetztes

: Vollvernetztes

: Vollvernetztes n

neuronale

euronale

euronales

s Netz

Netz

Netz [

[

[Heuler

Heuler

Heuler 1997

1997

1997]]]]

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 16

Rückkopplung

Rückgekoppelte NN, auch rekurrente NN genannt, haben die Eigenschaft, dass Neuro-

nen untereinander nicht nur in Richtung der Ausgabeschicht verbunden sind, sondern

die Aktivierung auch an Neuronen einer oder mehrerer zurückliegender Schichten ge-

leitet wird (siehe Abb. 9).

Abbildung

Abbildung 9

9: Rückgekoppeltes

: Rückgekoppeltes

: Rückgekoppeltes n

neuronales Netz

euronales Netz

euronales Netz [

[

[Heuler

Heuler

Heuler 1997

1997

1997]]]]

Eine Rückkopplung innerhalb eines NN ist immer dann notwendig, wenn das Ergebnis

nicht nur von der aktuellen Netzeingabe abhängt, sondern zusätzlich von dessen zeit-

lichen Verlauf. Deutlich wird dies zum Beispiel bei der Vorhersage von Koordinaten

einer Sinuskurve mittels NN. Ein Netz ohne Rückkopplung kann nicht erkennen, ob sie

im Begriff ist zu fallen oder zu steigen, also die nächste y-Koordinate größer oder klei-

ner ist. In diesem Fall ist das Ergebnis des letzten Netzdurchlaufes wichtig, welches bei

der Rückkopplung aus der Ausgabeschicht wieder an eine oder mehrere Schichten zu-

rück geleitet wird.

Typische Beispiele dieses Verfahrens sind das Jordan- und das Elman-Netz.

[vgl. Heßling 2004]

2.2.6

Lernen

NN erhalten ihr Wissen im Allgemeinen durch das Erlernen von Trainingsmustern, dem

so genannten überwachten Lernen. Diese Methode lässt sich jedoch nur dann anwen-

den, wenn alle Daten für das überwachte Lernen zur Verfügung stehen.

Für das überwachte Lernen müssen Netzeingaben in Verbindung mit den dazugehöri-

gen Netzausgaben vorhanden sein. Ziel des überwachten Lernens ist es, die Ist-

Ausgabe mit der Soll-Ausgabe zu vergleichen und anhand der Differenz die Gewichte

der Verbindungen zu modifizieren.

Beim unüberwachten Lernen, dem so genannten self-organized learning oder auch

unsupervised learning, versucht das NN die Eingaben selbsttätig in Ähnlichkeitsklassen

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 17

aufzuteilen, ohne einen Zielwert zu kennen. Eine externe Kontrolle entfällt bei diesem

Verfahren.

Für die dritte Variante, das bestärkende Lernen, ist nicht die exakte Differenz zwischen

Ist-Ausgabe und Soll-Ausgabe interessant, sondern nur der Gegenstand der Überein-

stimmung. Der Netzfehler wird anschließend durch selbstständige Anpassung der

Lernregeln des NN minimiert.

Lernverfahren

Um NN zu trainieren bedarf es so genannter Lernverfahren oder regeln. Diese sind

mathematische Formeln zur Anpassung (Adaption) der Gewichte innerhalb des NN.

Die Delta-Regel (oder auch Widrow-Hoff-Regel) ist von der hebbschen Lernregel abge-

leitet und ein Spezialfall des Backpropagationverfahrens (siehe nächster Absatz). Sie

dient der Adaption von Gewichten der Verbindungen, indem der Wert der Gewichte,

ausgehend vom Anteil am Netzfehler, verändert wird. Dieser Fehler entspricht der Dif-

ferenz zwischen der erwarteten und der tatsächlichen Ausgabe des Netzes. Die Delta

Regel kann nur bei vorwärts verketteten Netzen mit einer Schicht von trainierbaren

Verbindungen angewendet werden, also nur bei NN ohne Zwischenschichten.

Backpropagation ist ein überwachtes Lernverfahren für NN. Es wird benötigt, wenn in

einem NN Zwischenschichten vorhanden sind, da es für die darin enthaltenen Neuro-

nen keine erwartete Ausgabe gibt, mit der die errechnete Ausgabe verglichen werden

kann. Die zuvor beschriebene Delta Regel kann nur für Netze ohne Zwischenschichten

eingesetzt werden.

Definiert sind zwei Netzdurchläufe, beginnend von der Eingabe- zur Ausgabeschicht

(Vorwärtsdurchlauf) und anschließend entgegengesetzt (Rückwärtsdurchlauf). Beim

Rückwärtsdurchlauf erfolgt eine Gewichtsveränderung der Netzgewichte ausgehend

von einem bestimmten Fehlersignal. Dieses Signal errechnet sich aus der Abweichung

der berechneten zu der erwarteten Ausgabe. Vorgenommen wird diese Gewichtsverän-

derung schichtweise, angefangen mit den Verbindungen zur Ausgabeschicht, über die

inmitten der Zwischenschichten, bis hin zu den Gewichten der Verbindungen der Ein-

gabeschicht zu den Zwischenschichten, also rückwärts.

Dem Backpropagation Verfahren liegt ein Gradientenabstiegsverfahren, das heißt eine

Methode des steilsten Abstiegs, zugrunde. Mit diesem Ansatz wird versucht, eine

Kombination von Gewichten zu finden, bei der die Aufrechnung der einzelnen Fehler

zu einer Fehlersumme minimal ist. Es kann also von einem globalen Minimum der Feh-

lerfunktion gesprochen werden, wenn der Netzfehler konvergiert, also der Fehler klei-

ner wird als ein vorher festgelegter Wert. Eine andere Möglichkeit, ein positives Ende

eines Backpropagation Durchlaufes zu finden, ist der Abbruch in dem Moment, in dem

die berechneten Ausgaben den erwarteten entsprechen.

Entwurf und prototypische Realisierung einer künstlichen Intelligenz

zur Steuerung einer Papierschneidemaschine

Bastian Schindler | Matrikel Nr. s0501103

Seite 18

,,Backpropagation ist ein Gradientenabstiegsverfahren. Wenn man den Fehler ei-

nes neuronalen Netzes als Funktion der Gewichte des Netzwerks graphisch auf-

trägt, erhält man eine Fehlerfläche, die sich im zweidimensionalen Fall anschau-

lich graphisch darstellen lässt." [Zell 2003, S.105]

Abbildung

Abbildung 10

10: Fehler

: Fehler

: Fehlerfläche

fläche

fläche zweier Gewichte

zweier Gewichte

zweier Gewichte [[[[Uni

Uni

Uni-

-Mü

Mü

Münster

nster

nster 2005A

2005A

2005A]]]]

2.2.7

Netzgrößen und Generalisierungsfähigkeit

Ein großer Vorteil der NN liegt darin, dass sie nicht nur gelernte Situationen wiederer-

kennen, sondern anhand dieser unter bestimmten Bedingungen zur Generalisierung

fähig sein können. NN sind demnach potentiell in der Lage, Muster, die sie nicht ge-

lernt haben, richtig zu klassifizieren. Ein Kriterium für die Generalisierungsfähigkeit

eines NN ist die Netzgröße, abhängig von der Anzahl und der Art der TM (Trainings-

muster). Da sowohl Eingabe- als auch Ausgabeschicht mit ihren jeweiligen Gewichten

von der Problemstellung abhängen und somit meistens nicht variabel sind, ist die Ge-

neralisierungsfähigkeit des NN unter anderem von der Größe der Zwischenschicht(en)

abhängig.

Ein Ansatz, die passende Größe der Zwischenschicht(en) zu ermitteln ist, einen der

Faktoren ,,Netzgröße" oder ,,Anzahl der Trainingmuster" variabel zu lassen und durch

Verringerung derer Anzahl solange zu experimentieren, bis der Moment gefunden ist,

in dem das Netz die gegebenen TM noch erlernen kann, die Fehlerkurve also gegen

Null konvergiert. Ist das Netz zu groß, werden die gegebenen TM nur auswendig ge-

Details

Seiten
Erscheinungsform: Originalausgabe
Erscheinungsjahr: 2005
ISBN (eBook): 9783832495497
ISBN (Paperback): 9783838695495
DOI: 10.3239/9783832495497
Dateigröße: 4 MB
Sprache: Deutsch
Institution / Hochschule: Hochschule für Technik und Wirtschaft Berlin – 4 Wirtschaftswissenschaften II
Erscheinungsdatum: 2006 (Mai)
Note: 1,3
Schlagworte: generalisierung cip3 snns netz
Produktsicherheit: Diplom.de

Autor

Bastian Schindler (Autor:in)

Entwurf und prototypische Realisierung einer künstlichen Intelligenz zur Steuerung einer Papierschneidemaschine

Zusammenfassung

Leseprobe

Inhaltsverzeichnis

Details

Autor

Bastian Schindler (Autor:in)