Alternative zu Google Analytics: Piwik - aktuell 2.3.0

Nexan

Pre Alpha Release Candidate Beta 0.0.0.0.0.0.1
Das mit dem Speicher konnte ich nun lösen. Die maximale Speichernutzung wird nun durch die Piwik Config gesteuert. Warum man das nun so regelt mag sich mir nicht erschließen aber sei drum. Der Crontab funktioniert jetzt wenigstens wieder.

Allerdings werden nun keine Nutzer mehr gezählt, die JS deaktiviert haben. Der NoScript Teil des Tracker-Codes hat scheinbar keine Funktion mehr.

Dafür habe ich nun testweise mal auf asynchrones Tracking umgestellt und bin bisher davon überzeugt. Der Geschwindigkeitsvorteil ist jedenfalls deutlich spürbar. :)
 

Sukram

Member
Wer Piwik einsetzt könnte sich zum Beispiel Ärger mit den deutschen Ermittlungsbehörden sparen. Wie in einem Artikel in der FAZ hervor geht, befindet sich Google Analytics nämlich weiterhin im Visier der deutschen Datenschützer. Demnach soll der Hamburger Datenschutzbeauftragte Johannes Casper nach eigenen Aussagen die Verhandlungen mit Google über die Anpassung von Analytics an die deutschen Datenschutzauflagen abgebrochen haben.

Konkret geht es hierbei um die Problematik der Speicherung von IP-Adressen, die nicht mehr erhoben werden dürfen, auf Google Servern in Nordamerika. Google bietet den Webmastern in Deutschland die Möglichkeit zwar an die IP-Adressen nicht komplett zu erheben. Außerdem kann sich auch der Internetznutzer mit Browserplugins dagegen wehren, Google seine Daten Preis zu geben. Laut Casper würden diese Plugins aber nicht für Safari und Opera verfügbar sein und somit zehn Prozent der Internetnutzer in Deutschland nicht zur Verfügung stehen.

Sollte hier keine Einigung erziehlt werden, müssen sich deutsche Websitebetreiber auf Verfahren mit empfindlichen Bußgeldern einstellen. Es wird sogar bereits ein Musterprozess gegen ein großes Unternehmen erwogen.

Google hingegen widerspricht der Darstellung in einem Blogeintrag: Ihnen sei nichts von einem Scheitern der Gespräche bekannt und man wolle weiter aktiv daran arbeiten die Bedenken der deutschen Behörden auszuräumen. Man verweist außerdem darauf, dass Google Analytics den Datenschutzbestimmungen der EU entspreche und auch sogar von europäischen Datenschutzbehörden genutz werde. Lediglich in Deutschland gäbe es Widerstand gegen das Analysetool von Google. Hierbei verweist Google auf die Möglichkeiten für den Websitebetreiber die IP-Adressen nicht komplett speichern zu lassen bzw. dass der Internetnutzer mit einem Plugin die Speicherung seiner Daten von Analytics verbieten könne.
 
Die Frage ist ob Piwik da soviel sicherer ist?
Immerhin gewähren wir unsereren Besuchern damit auch nicht automatisch das recht nicht gespeichert zu werden.
 

rellek

relativ sensationell
Teammitglied
Seit 1.1 oder 1.1.1 gibt es ein Opt-Out-Plugin. Allerdings gebe ich ehrlich zu, dass ich mir das noch gar nicht angesehen habe. Der deutlich grössere Vorteil ist aber, dass Piwik lokal gespeichert wird und nicht auf Servern im Ausland eines grossen Konzerns, wo keiner genau weiss, was mit den Daten am Ende gemacht wird.
 
Schon klar, aber genügt das den deutschen Gesetzen? Ich will hier nur ein bisschen Problembewusstsein wecken, damit man sich nicht in falscher Sicherheit wiegt nur weil man kein Google einsetzt.
 

rellek

relativ sensationell
Teammitglied
An der Stelle sollten vielleicht zuerst diese beiden Fragen geklärt werden:
- Ist eine IP-Adresse WIRKLICH personenbezogen?
- Wie sieht es aus, wenn die letzten n Blöcke genullt werden?

Zu ersterem könnte man sagen, dass dem eher nicht so ist; eine IP lässt sich nur mit genauem Datum und Uhrzeit einem Anschluss zuordnen. Das allerdings macht noch lange keine Person aus, denn man erhält in aller Regel die IP des Routers. Ist ein WLAN da mit drin, kann es sogar der Nachbar sein.
Zudem ist es bei den meisten Anschlüssen so, dass eine IP-Adresse nach spätestens 24h geändert wird durch die Zwangstrennung.

Kommen wir aber zum zweiten Punkt, wird die Geschichte deutlich interessanter. Je mehr Blöcke nämlich weggelassen werden, desto weniger hat die IP irgendwas mit einem konkreten Anschluss zu tun - genauer gesagt 255^n; lässt man einen Block weg (also wird aus dem letzten z.B. eine 0), kommen schon 255 Anschlüsse in Frage, denen diese IP mal gehört haben könnte.
Wenn das Anonymizer-Plugin aktiv ist, wird z.b. die letzte Stelle bei Piwik gestrichen.
Ohne die letzte Stelle kann man zwar, von einem gewissen Fehler abgesehen, trotzdem noch ziemlich eindeutig Besucher ausmachen, aber für Datenschutz-Belange ist das zu wohl wenig.

Und im Gegensatz zu externen Diensten kann man bei Piwik einfach mit phpMyAdmin in die Datenbank schauen, was wirklich gespeichert wird. Das ist wohl vor allem ein grosser Vorteil.
Andernfalls würden Apache-Logs auf gleiche Weise von Datenschutz-Sicht her kritisch sein - auf Hostern wie all-inkl z.B. kann man dies aber gar nicht ändern.

@ Titus
2,1 GB bei 12 Seiten nach knapp 3 Jahren
 

Titus

Goldmember
die Datenschutzhypochonder sehen IPs als Personenbezogen was bei festen IPs und Singlehaushalten wohl auch so gewertet werden könnte, wenn eine IP von Großkonzern XY stammt ist es eher unwahrscheinlich das man dort irgendwann den richtigen Rechner dazu finden wird
aber man geht halt immer vom schwächsten glied in der Kette aus

erschwerend kommt hinzu das sich der gemeine Paranoiker einreden lies das man anhand der restlichen Daten die man abfragen kann eben einen digitalen Fingerabdruck hinterlässt, flashcookies unlöschbar ins Knochenmark gebrannt werden und überhaupt Google === Teufel

daher erfasst man entweder garnichts, oder nur das nötigste und das ohne (bzw. möglichst wenig) Bezug zueinander - ich denke aber so wie Piwik das speichert hast du einen Logenplatz im Höllenfeuer mehr als sicher
da die Aktionisten wie das Kasperle, aber keine Ahnung von dem haben was sie tun und sich nur profilieren wollen in dem sie für die Bildleser gegen Google in den Krieg ziehen, wird das keinen Interessieren was du und dein Piwik alles aufzeichnest
 

Nexan

Pre Alpha Release Candidate Beta 0.0.0.0.0.0.1
Also ich weiß nicht. Ich finde beide Extreme amüsant. Jene, die Google verteufeln und am liebsten alles und jeden unter Datenschutz sehen würden, genauso wie jene, die meinen das wäre alles Paranoia und man müsste sich da überhaupt keine Gedanken machen.

Hat auf jeden Fall Unterhaltungswert. :)
 

Titus

Goldmember
ich sage nicht das man sich keine Gedanken machen sollte, ich finde es ja auch löblich das sich die Leute mit dem Dienstleistungskonzern anlegt

nur fühle ich mich angepisst wenn man mich verknacken will weil ich den Dienst einsetze, oder man als Plattformbetreiber für die Unfähigkeit des offensichtlich "normalen" Internetnutzers zuständig bin

an und für sich bin ich mir durchaus im klaren das meine Ausflüge im WWW nicht anonym sind, wenn mir das nicht gefällt muss ich mich halt entsprechend absichern
aber gerade die Clowns die am lautesten schreien schreiben jeden privaten Mist ins www und benutzen dann am besten noch einen möglichst einmaligen Nick. wenn ihnen dann klar wird was sie da eigentlich gemacht haben wird natürlich groß rumgetönt das sich da was bessern muss und Suchmaschinen Datenkraken sind (oh wunder - ein service der mit wissen handelt vergisst nichts, welch erkenntnis)

was ich nicht im Netz haben will sollte ich für mich behalten und wenn ich keine Werbung sehen will benutzt man eben werbe/contentblocker und heult nicht rum das der Dienstanbieter wenn er mich identifiziert gefälligst zu vergessen hat das ich da war

da hab ich doch lieber EINEN großen dienst den ich generell ausschließe als wenn ich das nun für jede website einzeln einstellen muss

wie gesagt loggt z.b. piwik auch alles und IMO sind die Auswertungen sogar noch genauer, da mir die besuchten Seiten eines Users gleich mit dargestellt werden
klar betrifft das nur die individuelle Seite, aber ich denke google wird eher schlüsselworte auswerten, die Neugierde eines Seitenbetreibers würde ich da hingegen nicht unterschätzen - bei GA hab ich so eine verknüpfte Darstellung gesammelter Daten bisher nicht gesehen
 

Titus

Goldmember
Markus' schrieb:
Und wer den Test machen will, wie einzigartig der Browser ist: https://panopticlick.eff.org/
interessanter weise ist man jedes mal einzigartig - wenn die jetzt sagen würden wie oft ich schon da war währe ich mehr beeindruckt :rolleyes:
der Punkt ist doch, möchte ich nicht mehr entdeckt werden nutze ich einen anderen Browser oder installiere mir eine neue Schriftart - die idee ist ganz nett, aber die Umsetzung lässt nun mal zu wünschen übrig wenn man drüber nachdenkt, denn je mehr Daten ich heranziehe umso problematischer wird es einen Rechner über einen längeren Zeitraum wieder zu finden, beschränke ich mich hingegen auf weniger wackelige Datenhab ich wieder sehr viele Doppel in meiner Trefferliste - das mit dem Fingerabdruck ist daher IMO ziemlicher mumpitz
 

Nexan

Pre Alpha Release Candidate Beta 0.0.0.0.0.0.1
Das Autoupdate ging zwar wieder nicht aber sonst keine weiteren Probleme. Dafür wurde aber die Oberfläche wieder deutlich beschleunigt und reagiert nun wieder ähnlich zackig wie die 1.0er Version.
 
Oben