Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen
Zusammenfassung
Das Internet ist in jedem Geschäftsbereich zu einem unverzichtbaren Informations- und Kommunikationsmedium geworden. Auch dem Marketing werden durch die zeitlich und global unbegrenzten, multimedialen und interaktiven Möglichkeiten, die insbesondere das World Wide Web bietet, neue Tore geöffnet.
Neben dem imagefördernden Effekt, den eine Website bei ihren Betrachtern und potentiellen Kunden eines Unternehmens hinterlassen kann, spielen gut besuchte Internetsites eine wichtige Rolle als Werbeträger. Trotz der Krise der Neuen Märkte verzeichnet die Online-Werbung in Deutschland steigende Zahlen. Laut Ergebnissen des Marktforschungsinstituts Prognos wurden im Jahr 2000 fast 450 Mio. DM für Internetwerbung ausgegeben. Für 2001 wird eine annähernde Verdopplung prognostiziert. Dabei stellt die Bannerwerbung die häufigste Form der Werbung dar. 1999 wurde durch den Verkauf von Werbefläche für Banner 56 Prozent des Gesamtumsatzes der Internetwerbung erzielt. Die Kosten der Werbefläche hängen unmittelbar von der Attraktivität der Site ab, denn potentielle Werbekunden sind an hohen Besucherzahlen interessiert. Diese wiederum sind linear abhängig vom Grad der zielgruppenadäquaten Ansprache der Besucher. Zur Steigerung und Erhaltung der Besucherfrequenz ist es daher zwingend erforderlich, die Besucher so gut wie möglich kennen zu lernen. Dazu müssen ihre speziellen Bedürfnisse und Nutzungsgewohnheiten beim Besuch der Internetsite analysiert werden.
Gang der Untersuchung:
Möglichkeiten, die das Internet bietet, um Daten (formatierte Informationen) über Besucher zu sammeln und auszuwerten, sollen in dieser Arbeit diskutiert werden. Grundlage hierfür bilden die vom Web Server erzeugten Logfiles. Nach einer groben Einordnung in den absatzpolitischen Rahmen (Kapitel 2) werden in Kapitel 3 die technologischen Grundlagen der Internetnutzung, insbesondere die Client/Server-Kommunikation, vorgestellt. Kapitel 4 befasst sich mit der Datengewinnung durch Logfiles und den daraus zu entnehmenden Informationen. Messkriterien, Probleme der Messung und Auswertungsverfahren sind Themen des Kapitels 5. Daran schließt sich in Kapitel 6 eine Betrachtung der Ergebnisse im Hinblick auf die Optimierung des Online-Marketings an, wobei auch auf Möglichkeiten einer detaillierteren Datengewinnung hingewiesen wird. In Kapitel 7 wird die Datenerhebung unter dem Aspekt des Datenschutzes beleuchtet. Abschließend erfolgt eine zusammenfassende Bewertung der […]
Leseprobe
Inhaltsverzeichnis
1 Einleitung und Überblick
Das Internet ist in jedem Geschäftsbereich zu einem unverzichtbaren Informations- und Kommunikationsmedium geworden. Auch dem Marketing werden durch die zeitlich und global unbegrenzten, multimedialen und interaktiven Möglichkeiten, die insbesondere das World Wide Web bietet, neue Tore geöffnet.
Neben dem imagefördernden Effekt, den eine Website bei ihren Betrachtern und potentiellen Kunden eines Unternehmens hinterlassen kann, spielen gut besuchte Internetsites eine wichtige Rolle als Werbeträger. Trotz der Krise der Neuen Märkte verzeichnet die Online-Werbung in Deutschland steigende Zahlen. Laut Ergebnissen des Marktforschungsinstituts Prognos wurden im Jahr 2000 fast 450 Mio. DM für Internetwerbung ausgegeben. Für 2001 wird eine annähernde Verdopplung prognostiziert [www.werbeformen.de 2001]. Dabei stellt die Bannerwerbung die häufigste Form der Werbung dar. 1999 wurde durch den Verkauf von Werbefläche für Banner 56 Prozent des Gesamtumsatzes der Internetwerbung erzielt [Benning 2000]. Die Kosten der Werbefläche hängen unmittelbar von der Attraktivität der Site ab, denn potentielle Werbekunden sind an hohen Besucherzahlen interessiert. Diese wiederum sind linear abhängig vom Grad der zielgruppenadäquaten Ansprache der Besucher. Zur Steigerung und Erhaltung der Besucherfrequenz ist es daher zwingend erforderlich, die Besucher so gut wie möglich kennen zu lernen. Dazu müssen ihre speziellen Bedürfnisse und Nutzungsgewohnheiten beim Besuch der Internetsite analysiert werden.
Möglichkeiten, die das Internet bietet, um Daten (formatierte Informationen) über Besucher zu sammeln und auszuwerten, sollen in dieser Arbeit diskutiert werden. Grundlage hierfür bilden die vom Web Server erzeugten Logfiles. Nach einer groben Einordnung in den absatzpolitischen Rahmen (Kapitel 2) werden in Kapitel 3 die technologischen Grundlagen der Internetnutzung, insbesondere die Client/Server-Kommunikation, vorgestellt. Kapitel 4 befasst sich mit der Datengewinnung durch Logfiles und den daraus zu entnehmenden Informationen. Messkriterien, Probleme der Messung und Auswertungsverfahren sind Themen des Kapitels 5. Daran schließt sich in Kapitel 6 eine Betrachtung der Ergebnisse im Hinblick auf die Optimierung des Online-Marketings an, wobei auch auf Möglichkeiten einer detaillierteren Datengewinnung hingewiesen wird. In Kapitel 7 wird die Datenerhebung unter dem Aspekt des Datenschutzes beleuchtet. Abschließend erfolgt eine zusammenfassende Bewertung der Möglichkeiten durch Logfile-Analysen (Kapitel 8).
2 Einordnung der Arbeit in die absatzpolitische Thematik
„Marketing als absatzmarktorientiertes Führungskonzept bezieht sich auf die Beeinflussung potentieller und tatsächlicher Marktteilnehmer (insbesondere Nachfrager, Konkurrenten und Distributionsmittler) zur Erreichung unternehmerischer Ziele“ [Hünerberg/Mann 1999]. Die klassische Marketingdefinition nach Meffert (1986, S. 31) versteht Marketing als Planung, Koordination und Kontrolle aller auf die aktuellen und potentiellen Märkte ausgerichteten Unternehmensaktivitäten, deren Ziele durch eine dauerhafte Befriedigung der Kundenbedürfnisse realisiert werden. Der Kunde stellt somit Ausgangspunkt und Ziel dar, dessen Verhalten durch die Koordination des Einsatzes absatzpolitischer Instrumente beeinflusst werden soll. In der vorliegenden Arbeit wird dabei das Hauptaugenmerk auf die Kommunikationspolitik gerichtet, die sich mit Planungen und Entscheidungen befasst, die für „die Übermittlung von Informationen und Bedeutungsinhalten zur Beeinflussung der am Absatz beteiligten Personen“ sorgen [Kuß 1991b, Kurs 0570, S. 1].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Kunde als Ausgangspunkt und Ziel [Kuß 1992]
Sättigung, Globalisierung und Probleme bei der Produktdifferenzierung kennzeichnen unsere heutige und voraussichtlich anhaltende Marktsituation und erfordern einen sorgfältigen Einsatz des Marketing- und Marktforschungsinstrumentariums [vgl. Steimer 2000, S. 83].
Auch im WWW zwingt die Konkurrenzsituation die Website-Anbieter um die Gunst der Besucher zu werben. Differenzierung gilt als unabdingbare Marketingstrategie zum Aufbau von Kundenpräferenzen. Die eigene Internetpräsenz muss dem Kunden etwas Außergewöhnliches, Einmaliges bieten, um sich von der Konkurrenz abzuheben. Denn gerade im Internet ist diese immer nur einen Mouseclick entfernt. Erfolg im World Wide Web machen Schneider und Gerbert (1999, S. 103ff) davon abhängig, inwieweit es gelingt,
1. den Besucher anzulocken,
2. den Besucher zu begeistern,
3. den Besucher als Kunden zu gewinnen und
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Erfolgsspirale des Online-Business [vgl. Schneider/Gerbert 1999]
2.1 Marketingziele einer Online-Präsenz
Ziele, die mit einer Internetpräsenz verfolgt werden, sind in erster Linie kommunikative Zielgrößen wie [vgl. Grimm 1990, Kurs 0578, S. 96]:
- Erhöhung des Bekanntheitsgrades
- positive Beeinflussung des Images
- Verbesserung des Informationsstandes
- Weckung von Bedürfnissen und Kaufinteresse
- Steigerung der Besuchsfrequenz und des Besuchsrhythmus
Dem Aufbau und der Erhaltung eines gewünschten Images kommt dabei als langfristige Positionierung im Bewusstsein der Konsumenten die wichtigste Bedeutung zu, da hierdurch positive Reaktionen ausgelöst werden, die sich später in ökonomischen Zielgrößen wie steigenden Umsätzen niederschlagen können. Zuverlässige Methoden zur Messung der Imageförderung sind jedoch noch kaum anzutreffen. Dagegen sind Änderungen der Abfragezahlen problemlos erfassbar.
2.2 Anforderungen der Effizienzanalyse im Online-Marketing
Die Effizienz eines Internetauftritts hängt vom Bekanntheitsgrad, der Contentattraktivität (Inhalt) und der Fähigkeit, auf nutzerindividuelle Bedürfnisse einzugehen, ab. Die abgebildete additive Verknüpfung dieser Erfolgsfaktoren dient lediglich der modellhaften Veranschaulichung. In der Realität existieren zwischen den drei Faktoren vielfältige Interdependenzen.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3: Erfolgsfaktoren von Online-Engagements [vgl. Dastani 2000]
Für Werbekunden ist die Auswahl einer geeigneten Website als Werbeträger (Mediaselektion) essentiell, um mit dem gegebenen Werbebudget „einen möglichst hohen Beitrag zur Erreichung der Werbeziele zu leisten“ [Grimm 1990, Kurs 0578, S. 100].
2.3 Marktforschung und Online Mining
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4: Systematische Einordnung der Logfile-Analysen in die Marktforschung [vgl. Lampe 1996, S. 120]
Absatzpolitische Entscheidungen sind zukunftsbezogen und bergen einen hohen Grad an Ungewissheit. Weder die Entwicklung der ökonomischen, staatlichen, technologischen, sozialen und rechtlichen Rahmenbedingungen, in die ein Unternehmen eingebunden ist, noch das Verhalten der Marktteilnehmer oder die Wirkung des Einsatzes der Marketinginstrumente sind bekannt. Dadurch wird eine systematische Erforschung und Analyse des Marktes und seiner Teilnehmer zwingend erforderlich. Grundlage erfolgreicher Marketingstrategien sind möglichst viele zweck-orientierte Informationen. Diese tragen nach Kuß (1990c, Kurs 0571, S. 6) zur Identifizierung von Marketingchancen und -problemen sowie zur Entwicklung, Anpassung und Überprüfung der Maßnahmen und des Marketingerfolges bei [vgl. Holbrook 1987, S. 214]. Der Rohstoff Information erlangt als knappes Gut in der Marktforschung eine zentrale Bedeutung. Diesem Gut muss in allen Phasen des Informationsverarbeitungsprozesses, der sich, wie Abb. 5 zeigt, von der Erfassung über die Aufbereitung bis hin zur Speicherung, Darstellung und Weitergabe der Informationen erstreckt, höchste Aufmerksamkeit und eine sorgfältige Bearbeitung gewidmet werden. „Die Qualität der Information ist von der Korrektheit, der Genauigkeit, der Vollständigkeit und vor allem von der Problemrelevanz und der rechtzeitigen Verfügbarkeit abhängig.“ [Gabriel/ Gluchowski 1998, Kurs 0821, S. 26]
Abbildung in dieser Leseprobe nicht enthalten
Abb. 5: Phasen der Informationsverarbeitung [Steimer 2000, S. 87]
Dem Internet-Marketing bietet das Online-Mining für die effiziente Informationsverarbeitung Verfahren zur Datengewinnung, strukturierten Datenanalyse und zur Optimierung des Marketings durch den Einsatz der gewonnenen Ergebnisse an (vgl. Abb. 6). Online-Mining stellt eine Untermenge des Data Minings dar und bezeichnet „die Gewinnung von entscheidungsrelevantem Wissen zur Steuerung und Optimierung von Internet-Aktivitäten” [Dastani 2000]. Ein bedeutendes Ziel der Werbeforschung ist die Messung der Wirkungszusammenhänge zwischen Werbeeinsatz und Werbeerfolg. Die Quantifizierung bestimmter Kenngrößen, wie Besucherfrequenz, Verweildauer etc. dienen der Festlegung von Marktpreisen für die Internetwerbeträger. Das Online-Mining nutzt neben traditionellen Statistikprogrammen tiefergehende Technologien, wie künstliche neuronale Netze, genetische Algorithmen, lineare Regression und regelbasierte Systeme.
Die vorliegende Arbeit beschränkt sich auf die Untersuchung des Informationsgehalts, der anhand von Logfile-Auswertungen gewonnen werden kann. Logfile-Analysen können als nicht-teilnehmende, verdeckte Beobachtungen zur Erhebung von Primärdaten charakterisiert werden (vgl. Abb. 4). Im Speziellen soll die Möglichkeit und Notwendigkeit zur Erstellung eines Nutzungsprofils und die Abgrenzung zum individuellen Nutzerprofil diskutiert werden.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 6 : Online-Mining als Prozess und Kapitelübersicht [vgl. Dastani 2000]
2.4 Relevanz der Zielgruppenanalyse
Die Effizienz einer Werbeaktion setzt sich zusammen aus der adäquaten Ansprache einer bestimmten Zielgruppe (Kreativleistung) und der tatsächlichen Erreichung dieser Gruppe (Medialeistung). Durch Beobachtung und Auswertung des Internetnutzungsverhaltens können diese beiden Determinanten im Online-Marketing erfasst und zur Messung der Werbeeffizienz herangezogen werden [Dastani 2000].
Eine sorgfältige Zielgruppenplanung ist für jeden unternehmerischen Erfolg ausschlaggebend, um eine bestmögliche Kundenorientierung zu gewährleisten. Für Schneider und Gerbert (1999, S. 215) ist aus Sicht der Unternehmung die Schaffung eines „gläsernen Kunden“ wünschenswert. Denn wie Abb. 7 zeigt, erreicht eine Werbebotschaft auch nur einen Teil der sorgfältig ausgewählten Zielgruppe. Bürlimann bezeichnet die eigentliche Zielgruppe hier als Werbegemeinte. Die Werbeberührten sind diejenigen, die die Botschaft tatsächlich erhalten. Die Differenz der beiden Werte wird als Streuverlust bezeichnet. Von den Werbeberührten sind wiederum nur einige Personen so von der Botschaft beeindruckt, dass sie sie aufnehmen und abspeichern. Nur wenige werden zu Werbeagierern, indem sie das beworbene Produkt kaufen, oder wie im vorliegenden Fall, eine beworbene Website aufrufen.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 7: Zielgruppendifferenzierung [Bürlimann 1999]
Eine differenzierte Marktbearbeitung erfordert eine Segmentierung des heterogenen Gesamtmarktes in relativ homogene Gruppen mit dem Ziel der differenzierten Ansprache dieser Gruppen [Kuß 1992, Kurs 0574, S. 12].
Die vorliegende Arbeit betrachtet ausschließlich das Segment der Internetnutzer. Da die Gesamtheit der Internetnutzer aber nicht homogen ist, ist hier eine weitere Differenzierung nötig. Ziel ist dabei, einen möglichst hohen Identitätsgrad zwischen Webangebot und einer bestimmten Zahl Besucher zu erreichen. „Die genaue Kenntnis der Zielgruppe, ihrer ganz spezifischen Situation und ihrer Bedürfnisse ist der Schlüssel zum Erfolg schlechthin.“ [Pollert 2000, S. 28]. Für das Internet gilt dies in verstärktem Maße, da hier der potentielle Kunde sehr direkt und unmittelbar angesprochen wird. Die Akzeptanz einer Internetpräsenz hängt entscheidend vom ersten Eindruck ab, den der User beim Aufruf der Site erfährt. Da dies aber zu erheblichen Unterschieden führen kann, je nachdem, welche Zielgruppe angesprochen werden soll, ist deren genaue Kenntnis zwingend erforderlich. Besteht die Zielgruppe beispielsweise aus informationssuchenden Geschäftsleuten, ist es sicherlich nicht sinnvoll, die Internetseiten mit auffälligen Grafiken, blinkenden Animationen und Sound zu überfrachten, während dies für eine junge Zielgruppe, die nur zum Spaß surft und unterhalten werden will, der richtige Weg sein kann. Das Beispiel zeigt auch, dass es nicht allein um die Kenntnis der Zielgruppe, sondern um deren Bedürfnisse in einer spezifischen Situation geht. Bedürfnisse können sowohl sachlicher als auch emotionaler Natur sein. Will der Besucher unterhalten werden? Braucht er Rat oder Service? Auch die Internetnutzungs-gewohnheiten werden in verschiedenen Zielgruppen sehr unterschiedlich sein [vgl. Bürlimann 1999, S. 107]. Im World Wide Web geht es nicht mehr nur um die zielgruppenaffine, sondern um eine individuengerechte Informationsversorgung. Nur wenn die Gewohnheiten und Bedürfnisse der (potentiellen) Seitenbesucher erkannt sind und das Internetangebot eine bestmögliche Entsprechung und Lösung für spezielle Situationen bietet, wird es gelingen, den Besucher dauerhaft an sich zu binden [vgl. Pollert 2000, S. 28ff].
2.5 Grundlagen der Internetwerbung: Platzierung und Gebühren
Die Auswertung von Logfiles ist besonders für kommerzielle Websites, die ihre Seiten als Werbeträger vermarkten, von Interesse. Aus der Beobachtung der Kundenströme lässt sich das Werbepotential der Site ableiten. Die Aufzeichnung der Nutzungsprofile ermöglicht den Werbeträgeranbietern, ihren Kunden ein relativ flexibles Preissystem zu offerieren. Für Werbeplatz auf häufig frequentierten Seiten werden höhere Preise veranschlagt als für weniger besuchte Seiten. Die Abrechnung erfolgt meist pro 1000 Besucher auf dem Web Server des Anbieters. Realistische Zahlen liegen bei ca. 10 bis 15 US-Dollar pro 1000 Besucher. Höhere Preise sind möglich, wenn die Zielgruppe der Website des Anbieters mit der des Werbekunden möglichst identisch ist [Lemay/Murphy 1997, S. 401ff].
Für die Preisberechnung ist aber nicht nur die Zahl der Besucher interessant. Zusätzlich kann die Platzierung innerhalb einer Seite zu unterschiedlichen Preisen führen. Bannerplatzierungen am oberen Seitenrand sind teurer als die Werbeeinblendung am unteren Rand, da letztere nicht immer im sichtbaren Bereich des Monitors liegt.
Ein anderes Abrechnungssystem nimmt nicht die Kundenfrequenz einer Site als Grundlage, sondern bestimmt die Preisfestsetzung anhand des tatsächlichen Anklickens eines Werbebanners. Da die Zahl der Klicks wesentlich geringer ist als die Besucherzahl, muss hier der Preis entsprechend höher angesetzt werden [Lemay/Murphy 1997, S. 404].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 8: Website www.freenet.de mit Bannerwerbung der Site www.regiopage.de [freenet 2001]
3 Technologische Grundlagen
Das vorliegende Kapitel erläutert die grundlegenden Mechanismen, die es einem Internetnutzer ermöglichen, eine Website zu besuchen. Einleitend erfolgt eine Abgrenzung zwischen Internet und World Wide Web sowie Definitionen zur Unterscheidung der Begriffe Internetsite / Website und Internetseite / Webseite und Homepage. Daran anschließend werden das TCP/IP (Transmission Control Protocol/Internet Protocol), die Adressierung von Rechnern und das HTTP (Hypertext Transfer Protocol) vorgestellt und die Kommunikation zwischen Browser und Web Server untersucht.
3.1 Internet und World Wide Web
Das World Wide Web (WWW) wird fälschlicherweise häufig als Synonym für das Internet verwendet. Dabei stellt es nur einen Dienst neben den hier nicht weiter zu erläuternden, traditionellen Internetservices E-Mail, Gopher, File Transfer Protocol (FTP), Newsgroups und Telnet dar.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 9: Internetdienste
Das WWW entstand 1989 aus der Aufgabe des schweizerischen Kernforschungszentrums CERN (Conseil Européen pour la Recherche Nucléaire), die auf weltweit verstreuten Computern lagernden Informationen zu verbinden und zugänglich zu machen, ohne dass ein Einloggen in den jeweiligen Computer nötig wäre. Möglich wurde dies durch Hypertext, der durch Links (Verweise) Verknüpfungen erstellt. Dementsprechend kann das WWW als „Bezeichnung für die Menge aller Server im Internet, die Informationen meist in Form von HTML-Seiten vorhalten und diese über das HTTP-Protokoll verfügbar machen“ betrachtet werden [Strobel 1997, S. 43]. Im Sommer 1991 startete das World Wide Web im Internet [Daum/Scheller 2000, S. 33].
Für die breite Öffentlichkeit wurde das WWW 1993 zugänglich als NCSA (National Center for Supercomputing Applications) die erste grafische Benutzeroberfläche für die Clients - den ersten Browser -, Mosaic, vorstellte, die Hypertext interpretieren konnte. Technologisch ausgedrückt ist das WWW also eine verteilte Client/Server-Applikation, deren Hauptbestandteile auf Softwareebene der Web Server zur Bereitstellung sowie der als Browser bezeichnete Client zur Präsentation der Dokumente und auf Protokollebene das Übertragungsprotokoll HTTP und die Dokumentenbeschreibungssprache HTML (Hypertext Markup Language) sind [vgl. Kaiser/ Vogler/Österle 1996, S. 140f].
3.2 Definitionen
Da die Bedeutung der in dieser Arbeit häufig verwendeten Begriffe Internetsite, Website und Internetseite, Webseite je nach Kontext differieren kann, soll eine kurze Definition zum besseren Verständnis beitragen. Zusätzlich erfolgt eine kontextbezogene Definition der Begriffe Homepage und Ressource.
3.2.1 Webseite / Internetseite
Webseite und Internetseite (oder kurz Seite) bezeichnen ein einzelnes Dokument, das auf einem Web Server gespeichert ist und mit dem Browser des Users angefordert und angezeigt werden kann. In den meisten Fällen ist dies eine Datei im HTML-Format, in die weitere Ressourcen eingebettet sein können.
3.2.2 Website / Internetsite
Eine Website oder Internetsite (oder Site) umfasst eine Menge zusammengehörender und untereinander verlinkter Internetseiten. Sie ist unter einer Internetadresse erreichbar und wird von derselben Person, Organisation oder Unternehmung publiziert.
3.2.3 Homepage
Als Homepage wird die Startseite einer Website bezeichnet. Sie kann den Besucher über den Inhalt der Site informieren und Links zu weiteren Unterseiten enthalten.
3.2.4 Ressource
Einzelne Elemente wie Fotos, Grafiken, Stylesheets, Sounds und Animationen werden als Ressourcen bezeichnet. Dabei ist es unrelevant, ob sie zu einer Internetseite gehören oder nicht.
3.3 TCP/IP
Die Datenübertragung wird im Internet durch das TCP/IP (Transmission Control Protocol/ Internet Protocol) ermöglicht, das für eine systemübergreifende, globale Kommunikation zwischen heterogenen Rechnern sorgt [Steimer 2000, S. 32]. Wie jede Netzsoftware wird TCP/IP als Teil des Betriebssystems auf dem Computer installiert und liegt somit unterhalb der AnwendungsSoftware. TCP/IP kann in mehrere Ebenen unterteilt werden. Dabei ist jedoch nur eine ungefähre Zuordnung zum ISO/OSI-Referenzmodell (International Standards Organization/Open Systems Interconnection) möglich, da dieses zum Zeitpunkt der TCP/IP-Entwicklung noch nicht existierte. Demnach umfasst TCP/IP hauptsächlich die Netzwerk- und die Transportschicht des ISO/OSI-Referenzmodells. Auf der untersten Ebene verwendet es die vorhandene Netzwerk-Hardware. Das IP (Internet Protocol) stellt für die höheren TCP/IP-Ebenen, die sämtliche Dienste der jeweils tieferen Ebenen in Anspruch nehmen können, eine einheitliche Schnittstelle zur Verfügung.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 10: ISO/OSI-Referenzmodell und TCP/IP-Ebenenmodell [vgl. Strobel 1997, Smith 1998]
Die Arbeitsweise des TCP/IP ist zweistufig. Das TCP auf der höheren Transportebene hat die Aufgabe, die zu versendenden Daten in kleinere Bestandteile, sogenannte Pakete, zu zerlegen, die in der Regel nicht größer als 1.500 Byte sind. Dazu stellt es für jeweils ein Paket eine virtuelle Verbindung zwischen Sender und Empfänger zur Verfügung und nutzt die Dienste der IP-Schicht. Für eine eindeutige Identifizierung einer Verbindung zwischen zwei Rechnern sind auf der TCP-Ebene neben Absender- und Zieladresse auch die Portnummern des Senders und des Empfängers nötig [Strobel 1997, S. 10ff]. Auf der Netzwerkebene sorgt das IP anschließend für die Übermittlung dieser Datenpakete an die angegebene Ziel-IP-Adresse, wo wiederum das TCP das Zusammensetzen der Datenpakete übernimmt. Dies ist wichtig, da durch das Dynamic Routing die Pakete nicht unbedingt in der richtigen Reihenfolge beim Empfänger ankommen. Eine weitere Aufgabe des TCP ist die Gewährleistung der kompletten Datenübertragung, da durch Leitungs- oder Übertragungsstörungen einzelne Pakete verloren gehen können. Hierzu versieht das TCP jedes Datenpaket mit einer Kontrollsumme. Weicht diese von der beim Datenempfang festgestellten Summe ab, so werden die unvollständigen Pakete nochmals beim Sender angefordert, ohne dass der Benutzer dies wahrnimmt [Daum/Scheller 2000, S. 31, vgl. Lamprecht 1996, S. 17f]. Der Benutzer muss sich um diese Details nicht kümmern. Für ihn stellt TCP einen Datenstrom dar, der alle Informationen sicher vom Sender zum Empfänger transportiert.
„TCP/IP bildet die Basis für höhere Protokolle wie das Hypertext Transfer Protocol (HTTP), das File Transfer Protocol (FTP), Telnet und das Simple Mail Transfer Protocol (SMTP).“ [Daum/ Scheller 2000, S. 31].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 11: TCP/IP-Ebenen, Protokolle und Dienste [vgl. Österle 1996, vgl. Lampe 1996]
Abbildung in dieser Leseprobe nicht enthalten
3.4 Adressierung
3.4.1 IP-Adresse
Jeder mit dem Internet verbundene Computer ist durch eine IP-Adresse, die ihn eindeutig kennzeichnet, erreichbar. Dabei besteht eine IP-Adresse aus einem Netz- und einem Rechner- bzw. Hostteil. Die Rechneradresse bezeichnet einen speziellen Computer, die Netzadresse das Netz, in dem sich dieser Computer befindet. Eine IP-Adresse ist ein 32-Bit-numerischer Wert und wird als vier durch Punkte voneinander getrennte Dezimalzahlen angegeben. Jede dieser vier Zahlen kann dabei einen Wert von 1 bis 254 annehmen und codiert ein Byte der IP-Nummer [Lamprecht 1996, S. 16].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 12: IP-Adresse
In Deutschland werden IP-Adressen über die Internet Service Provider (ISP) vergeben, die dazu mit dem Deutschen Network Information Center (DENIC) bzw. der europäischen Organisationsstelle für IP-Netze, dem RIPE, zusammenarbeiten [Strobel 1997, S. 11]. Dem RIPE entspricht in den USA das InterNIC, das zusätzlich für die Registrierung der .com-Domains zuständig ist.
3.4.2 Domain-Adresse
Das Domain Name System (DNS) ist eine spezielle verteilte Datenbank, die den numerischen IP-Adressen alpha-numerische Domain-Adressen zuweist. Domains sind hierarchisch aufgebaut. Dabei steht die Root Domain an erster Stelle und wird durch einen Punkt gekennzeichnet, der jedoch zur Vereinfachung weggelassen wird. Eine Ebene tiefer befindet sich die Top Level Domain (TLD), die in TLDs und gTLDs (Generic Top Level Domains) unterschieden werden kann.
Tabelle 1 zeigt die ursprünglich existierenden gTLDs.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 1: gTLDs [vgl. Haufe 1996, S. 16]
Neu auf dem Markt sind die gTLDs .info und .tv sowie die gTLD .biz, die erst seit Sommer 2001 vorbestellt werden kann. Die .biz-Registrierung ist nur für geschäftliche Internetauftritte zulässig und gilt, laut Newsletter des ISP 1&1 Puretec vom 14.07.2001, als inoffizieller Nachfolger der gTLD .com . Jedoch sollte man mit neuen TLDs vorsichtig sein, da User eher geneigt sind, bekannte Domains einzugeben und Webangebote unter ungewöhnlichen TLDs oft unentdeckt bleiben.
TLDs werden als Ländernamen durch den ISO-3166-Standard (International Standards Organization) als zweibuchstabige Codes definiert. Einige bekannte Beispiele sind:
Abbildung in dieser Leseprobe nicht enthalten
Tab. 2: TLDs
Dass für us-amerikanische Seiten die gTLD .com anstelle der TLD .us verwendet wird, hat historische Gründe.
Erst unterhalb der TLD ist die eigentliche Domain angeordnet. Optional ist eine weitere Aufgliederung in Sub-Domains, die beispielsweise Institute, Abteilungen oder Unterabteilungen der Domain bezeichnen, sowie eine Untergliederung in einzelne Rechnernamen möglich. Zu beachten ist, dass die Domainebenen bei der Adressierung in umgekehrter Reihenfolge aufgeführt werden [Lamprecht 1996, S. 17].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 13: Hierarchische Gliederung der Domain-Adresse
3.5 HTTP
Das WWW beruht auf dem Client/Server-Prinzip und verwendet das Hypertext Transfer Protocol (HTTP) zur Kommunikation zwischen Web Server und Browser. Das Protokoll sorgt für die Übermittlung der Website-Inhalte und stellt die Verbindung zwischen Browser und Server her. HTTP ist ein zustandsloses Protokoll, das jede Anfrage des Browsers an den Web Server unabhängig von der vorherigen Anfrage realisiert. Das heißt, dass für jede zu übertragende Datei eine separate Verbindung aufgebaut werden muss. Ab Version 1.1 erzeugt HTTP standardmäßig permanente Verbindungen und unterstützt Dienste wie Authentisierung und Caching. Das Caching reduziert den Netzwerk-Traffic, da häufig genutzte Inhalte lokal zwischengespeichert werden können [Daum/Scheller 2000, vgl. Klute 1996].
Zur Anforderung und Übermittlung von Dokumenten bedienen sich Client und Server verschiedener HTTP-Befehle, von denen die wichtigsten hier kurz näher dargestellt werden sollen:
Abbildung in dieser Leseprobe nicht enthalten
Tab. 3: HTTP-Befehle [Neuss/Vromanns 1996, S. 30, vgl. Kammerer 2001]
3.6 Client/Server-Kommunikation
Damit er auf die weltweit verteilten, auf unterschiedlichen Servern gehaltenen Datenbestände zugreifen kann, muss der Anwender einen WWW-Client, den Browser, starten, der mittels des HTTP eine Verbindung zum Web Server aufbaut. Das Anfordern einer Internetseite oder Ressource beginnt immer damit, dass der Browser einen URL erhält. Dies kann durch direkte Eingabe in die Adresszeile oder durch Anklicken eines Links geschehen. Ein URL enthält eine Protokollangabe, eine Domain-Adresse und eine Pfadangabe, die die Ressource eindeutig auf einem bestimmten Server identifiziert. Wird eine Internetseite angefordert, ist das Protokoll HTTP. Optional sind Portnummer und Dateiname mit Suffix. Die Portnummer entfällt, wenn der Standardport des jeweiligen Protokolls verwendet wird, ansonsten wird sie mit Doppelpunkt von der TLD abgetrennt [Daum/Scheller 2000, S. 32].
Abbildung in dieser Leseprobe nicht enthalten
Abb. 14: Format und Beispiel eines Uniform Ressource Locators (URL)
Um die weiter unten beschriebenen Logfile-Einträge des Servers besser verstehen zu können, soll hier ein Blick auf den Client/Server-Dialog geworfen werden, der bei der Anforderung und Übertragung von Daten erfolgt. Die Kommunikation zwischen Client und Server basiert auf einem simplen Request-Response-Schema. Die dabei auszutauschenden Kommunikationseinheiten heissen Messages, die eigentlichen Datenobjekte (wie HTML-Dokumente oder Ressourcen) sind Entities.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 15: Client/Server-Kommunikation [vgl. Smith 1998, vgl. Kaiser/Vogler/Österle 1996]
Die Kommunikation kann optional durch Header konkretisiert werden. Kennt der Empfänger einen angegebenen Header nicht, so kann er ihn ignorieren, so dass die Kommunikation flexibel bleibt. Header können vier Klassen zugeordnet werden:
a) Allgemeine Header
b) Request Header
c) Response Header
d) Entity Header
Betrachtet werden hier sowie unter 3.6.1 und 3.6.2 nur die jeweils für die Logfile-Auswertungen relevanten Header.
[...]
Details
- Seiten
- Erscheinungsform
- Originalausgabe
- Erscheinungsjahr
- 2001
- ISBN (eBook)
- 9783832447755
- ISBN (Paperback)
- 9783838647753
- DOI
- 10.3239/9783832447755
- Dateigröße
- 3.6 MB
- Sprache
- Deutsch
- Institution / Hochschule
- FernUniversität Hagen – Wirtschaftswissenschaften
- Erscheinungsdatum
- 2001 (November)
- Note
- 1,3
- Schlagworte
- logfiles zielgruppenanalyse webserver-analyse client/server-kommunikation internet-marketing
- Produktsicherheit
- Diplom.de