Hinweise zur Auswertung von Zugriffen und Seitenaufrufen

Die Speicherung und Verfügbarkeit von Zugriffsdaten auf Webseiten bspw. zum Zwecke statistischer Auswertungen sind durch aktuelle Rechtsprechung erheblich eingegrenzt worden. Es ist nicht mehr erlaubt, personenbezogene Daten im Rahmen einer Vorratsdatenspeicherung vorzuhalten. Den kompletten Text finden Sie hier: http://www.daten-speicherung.de/?p=197.

Sofern eine Organisationseinheit standardisierte statistische Auswertungen wünscht, ist eine Anfrage an den Keyuser zu stellen, der diese dann an die CeDiS weiterleitet. Diese Auswertungen basieren auf den Logfiles des Web-Servers für eine Domäne, in diesem Fall www.wiwiss.fu-berlin.de. Die Auswertungen werden grds. rollierend für die letzten 3 Monate erstellt. Die IP-Nummern in den Logfiles werden im Zuge der Auswertungen anonymisiert, indem die letzte IP-Stelle (pro Monat eineindeutig) auf Zufallsbasis (monatlich alternierend) verändert wird, um auch sog. Visits zu erkennen. Unter Visits werden wiederkehrende Zugriffe eines "Nutzers" innerhalb eines festgelegten Zeitraums (momentan 30 Minuten) verstanden.

Die Logfiles werden nach 3 Monaten gelöscht.

Bei jeder Anforderung einer Datei (Request) aus dem Angebot einer Site wird ausschliesslich zu statistischen Zwecken ein Datensatz gebildet, der grds. aus folgenden Teilen besteht:

  • der IP-Nummer des zugreifenden Rechners (anonymisiert)
  • der Seite, von der aus die Datei angefordert wurde
  • dem Namen der Datei (inkl. der Zugriffsmethode und der Versionsnummer des HTTP-Protokolls)
  • dem Datum und Uhrzeit der Anforderung
  • der übertragene Datenmenge
  • dem Zugriffsstatus (Datei übertragen, Datei nicht gefunden etc.)
  • einer Beschreibung des Typs des verwendeten Webbrowsers

Im Folgenden sind die Zuordnungen zu den Auswertungsrubriken Pages, Downloads, Images und Undefined aufgeführt, so wie sie in den Grafiken auftauchen.

Pages:
*.htm;*.html;*.xml;*.php

Downloads:
*.pdf;*.xls;*.doc;*.dot;*.rtf;*.ppt;*.pps;*.ini
*.txt;*.dat;*.odt;*.pot;*.frame
*.rar;*.tar;*.gz;*.zip;*.tgz;*.sit
*.swf;*.flv;*.mpg;*.mpeg;*.mov;*.asx;*.wmv;*.wma
*.wmx;*.mp3;*.mp4;*.exe;*.wml;*.uzr;*.xsl
*.ra;*.rm;*.rv;*.ram;*.rpm;*.rt;*.rp;*.smi;*.smil
*.zmpf;*.mpf;*.spf;*.ics;*.vcf

Images:
*.gif;*.jpg;*.jpeg;*.png;*.tif;*.tiff;*.ico;*.eps
*.ps;*.wmf;*.px;*.svg

Undefined:
*.css;*.js;*.jar;*.java;*.templ;*.properties
*.jsp;*.class;*.shtml

Diese Liste wird ggf. durch die Verarbeitung weiterer Dateitypen im CMS ergänzt. Zu den Page-Impressions werden auch Anfragen (Dateiaufrufe = Requests) des Dateityps xml gezählt, da darüber idR. die RSS-Feeds ausgeliefert werden, sofern innerhalb einer Site davon Gebrauch gemacht wird.