Protokolldateiauswertung: Unterschied zwischen den Versionen
Michi (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Michi (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 5: | Zeile 5: | ||
== Analyse von Webserver-Logdateien == | == Analyse von Webserver-Logdateien == | ||
Bei den meisten Webservern kann eingestellt werden, welche Daten sie protokollieren - im Standard verwenden die meisten ein recht ähnliches Format für ihre Logdateien. Die einfachste Variante dabei ist das "Common Log File Format / CLF", welches unter anderem die IP-Adresse des anfragenden REchners, die Anzahl übertragener Bytes sowie Datum und Uhrzeit des Zugriffs protokolliert. Um einige Einschränkungen von CLF zu umgehen, wurden weitere Formate wie das "Combined Log File Format" oder das "Extended Log File Format / ELFF" entwickelt, welche unter anderem zusätzlich die Webbrowserkennung (User-Agent) und die vom Benutzer zuvor besuchte Webseite (Referer) protokollieren. | |||
Beim [[Apache HTTP Server]] findet sich die Logdatei meist im Verzeichnis "/var/log" und heisst "access.log". Jede Zeile in dieser Logdatei berichtet unter anderem über | |||
* die [[IP-Adresse]] des Besuchers | * die [[IP-Adresse]] des Besuchers | ||
* welches [[Betriebssystem]] er benutzt | * welches [[Betriebssystem]] er benutzt | ||
Zeile 11: | Zeile 13: | ||
* den Befehl, den sein Webbrowser an den Webserver gerichtet hat | * den Befehl, den sein Webbrowser an den Webserver gerichtet hat | ||
Bekannte Programme zur Analyse von Webserver-Logdateien sind | Programme zur Analyse von Webserver-Logdateien liefern als Grunddaten üblicherweise die Gesamtzahl der Zugriffe, das Datenvolumen sowie eine Aufstellung der meistbesuchten Webseiten. Bei der Auswertung unterscheiden die Programme zwischen "Hits" und "Pageviews": Ein "Hit" bezieht sich auf die Anforderung eines einzelnen Elements, beispielsweise einer Grafikdatei. Besteht eine Webseite aus drei Grafikdateien und einer HTML-Datei, so führt der Abruf der Webseite (ein "Pageview" oder auch eine "Page Impression") also zu insgesamt vier Hits. Bei einem "Visit" (auch "Session" genannt) wird davon ausgegangen, dass alle Anfragen von eienr IP-Adresse in einem bestimmten Zeitraum (z. B. 30 Minuten) vom selben Benutzer stammen. Da Internetprovider IP-Adressen oft dynamisch vergeben, ist diese Zuordnung die beste Näherung, falls man nicht zu komplizierteren Mitteln wie [[Cookies]] greifen will. Wichtig, aber nicht mit allen Programmen möglich, ist die Auflösung von IP-Adressen in Rechner- und Domainnamen; die dabei gleichzeitig ermittelte Top-Level-Domain (z. B. ".ch") lässt Rückschlüsse auf das Land zu, aus dem die Anfrage kam. | ||
Bekannte Programme zur Analyse von Webserver-Logdateien sind die folgenden. | |||
{| class=wiki width=100% | |||
| <b>Name</b> || <b>[[Aclog]]</b> || <b>[[Analog]]</b> || <b>[[Awebvisit]]</b> || <b>[[Awstats]]</b> || <b>[[Lire]]</b> || <b>[[Relax]]</b> || <b>[[Sherlog]]</b> || <b>[[Webalizer]] | |||
|- | |||
| <b>Eingabeformate</b><br>Common Log File Format / CLF<br>Combined Log File Format<br>weitere || ja<br>ja<br>nein || ja<br>nein<br>frei definierbar || ja<br>nein<br>nein || || ja<br>ja<br>nein || nein<br>Varianten<br>RefererLog, NCSA, Webstar, eigene Definitionen || ja<br>ja<br>nein || ja<br>ja<br>nein | |||
|- | |||
| <b>Mit gzip gepackte Dateien</b> || || || || || || || || | |||
|- | |||
| <b>Umsetzung Ip-Adressen in Namen</b> || || || || || || || || | |||
|- | |||
| <b>Beliebteste Einstiegs-/Ausstiegsseiten</b> || || || || || || || || | |||
|- | |||
| <b>Liste der beliebtesten Seiten</b> || || || || || || || || | |||
|- | |||
| <b>Besucherpfade</b> || || || || || || || || | |||
|- | |||
| <b>Anzahl Aufrufe nach Stunden, Tagen, Monaten</b> || || || || || || || || | |||
|- | |||
| <b>Berücksichtigung von Suchmaschinen</b> || || || || || || || || | |||
|- | |||
| <b>Länderstatistik</b> || || || || || || || || | |||
|- | |||
| <b>Webbrowsertypen</b> || || || || || || || || | |||
|- | |||
| <b>Daomains/Ip-Adressen lassen sich von Analyse ausschliessen</b> || || || || || || || || | |||
|- | |||
| <b>Ausgabeformate</b> || || || || || || || || | |||
|- | |||
| <b>Sprachen der erzeugten Auswertungen</b> || || || || || || || || | |||
|- | |||
| <b>Sicherheitsfunktionen</b> || || || || || || || || | |||
|- | |||
| <b>Erläuterungen in der Auswertung</b> || || || || || || || || | |||
|} | |||
Vom Webalizer gibt es ausserdem die Forks [[Awffull]], Stone Step Webalizer und Webalizer Xtended. | |||
Pathalizer und [[Visitors]] stellen die Bewegungen der Besucher auf einer Website grafisch dar. | Pathalizer und [[Visitors]] stellen die Bewegungen der Besucher auf einer Website grafisch dar. |
Version vom 6. August 2009, 11:14 Uhr
Bei der Logdateianalyse wird die Logdatei eines bestimmten Zeitraums nach bestimmten Kriterien untersucht. Je nach Art und Umfang der Aufzeichnungen in der Logdatei lassen sich daraus verschiedene Schlüsse ziehen.
Am häufigsten ist die Analyse der Logdateien von Webservern und Firewalls.
Analyse von Webserver-Logdateien
Bei den meisten Webservern kann eingestellt werden, welche Daten sie protokollieren - im Standard verwenden die meisten ein recht ähnliches Format für ihre Logdateien. Die einfachste Variante dabei ist das "Common Log File Format / CLF", welches unter anderem die IP-Adresse des anfragenden REchners, die Anzahl übertragener Bytes sowie Datum und Uhrzeit des Zugriffs protokolliert. Um einige Einschränkungen von CLF zu umgehen, wurden weitere Formate wie das "Combined Log File Format" oder das "Extended Log File Format / ELFF" entwickelt, welche unter anderem zusätzlich die Webbrowserkennung (User-Agent) und die vom Benutzer zuvor besuchte Webseite (Referer) protokollieren.
Beim Apache HTTP Server findet sich die Logdatei meist im Verzeichnis "/var/log" und heisst "access.log". Jede Zeile in dieser Logdatei berichtet unter anderem über
- die IP-Adresse des Besuchers
- welches Betriebssystem er benutzt
- welchen Webbrowser er benutzt
- den Befehl, den sein Webbrowser an den Webserver gerichtet hat
Programme zur Analyse von Webserver-Logdateien liefern als Grunddaten üblicherweise die Gesamtzahl der Zugriffe, das Datenvolumen sowie eine Aufstellung der meistbesuchten Webseiten. Bei der Auswertung unterscheiden die Programme zwischen "Hits" und "Pageviews": Ein "Hit" bezieht sich auf die Anforderung eines einzelnen Elements, beispielsweise einer Grafikdatei. Besteht eine Webseite aus drei Grafikdateien und einer HTML-Datei, so führt der Abruf der Webseite (ein "Pageview" oder auch eine "Page Impression") also zu insgesamt vier Hits. Bei einem "Visit" (auch "Session" genannt) wird davon ausgegangen, dass alle Anfragen von eienr IP-Adresse in einem bestimmten Zeitraum (z. B. 30 Minuten) vom selben Benutzer stammen. Da Internetprovider IP-Adressen oft dynamisch vergeben, ist diese Zuordnung die beste Näherung, falls man nicht zu komplizierteren Mitteln wie Cookies greifen will. Wichtig, aber nicht mit allen Programmen möglich, ist die Auflösung von IP-Adressen in Rechner- und Domainnamen; die dabei gleichzeitig ermittelte Top-Level-Domain (z. B. ".ch") lässt Rückschlüsse auf das Land zu, aus dem die Anfrage kam.
Bekannte Programme zur Analyse von Webserver-Logdateien sind die folgenden.
Name | Aclog | Analog | Awebvisit | Awstats | Lire | Relax | Sherlog | Webalizer |
Eingabeformate Common Log File Format / CLF Combined Log File Format weitere |
ja ja nein |
ja nein frei definierbar |
ja nein nein |
ja ja nein |
nein Varianten RefererLog, NCSA, Webstar, eigene Definitionen |
ja ja nein |
ja ja nein | |
Mit gzip gepackte Dateien | ||||||||
Umsetzung Ip-Adressen in Namen | ||||||||
Beliebteste Einstiegs-/Ausstiegsseiten | ||||||||
Liste der beliebtesten Seiten | ||||||||
Besucherpfade | ||||||||
Anzahl Aufrufe nach Stunden, Tagen, Monaten | ||||||||
Berücksichtigung von Suchmaschinen | ||||||||
Länderstatistik | ||||||||
Webbrowsertypen | ||||||||
Daomains/Ip-Adressen lassen sich von Analyse ausschliessen | ||||||||
Ausgabeformate | ||||||||
Sprachen der erzeugten Auswertungen | ||||||||
Sicherheitsfunktionen | ||||||||
Erläuterungen in der Auswertung |
Vom Webalizer gibt es ausserdem die Forks Awffull, Stone Step Webalizer und Webalizer Xtended.
Pathalizer und Visitors stellen die Bewegungen der Besucher auf einer Website grafisch dar.