Geolokalisierungsanbieter und ihre Herausforderungen
Dienste zur Standortermittlung (=Geolokalisierung) eines Anwenders einer Webseite oder einer App gibt es zahlreiche. Die Herausforderungen qualitative Ergebnisse zurückzuliefern, sind für alle Anbieter jedoch sehr umfangreich.
Entsprechend sollte, abgesehen von Faktoren wie Zielstellung der Geolokalisierung, Datenschutz und technischer Stabilität, genau geprüft werden, mit welchem Dienst ´gearbeitet wird und wer die besten Ergebnisse liefert.
Nachfolgender Artikel gibt einen Überblick zu Themen wie
- Herausforderungen anhand einer IP-Adresse den Standort zu ermitteln
- Ansätze mit denen die Ergebnisqualität bewertet werden kann
- Ergebnisse eines Selbst-Tests zur Geolokalisierung am Standort Berlin über 12 Wochen mit 14 Service-Angeboten
Herausforderungen für IP-Geolokalisierungsdienste
Geolokalisierungsdienste arbeiten meist mit der IP-Adresse, mit der ein Gerät mit dem Internet verbunden ist, um den Standort des Gerätes bzw. der damit arbeitenden Person zu ermitteln.
Zwar können manche Geolokalisierungsdienste wesentlich genauere Informationen, wie GPS-Daten, Mobilfunk-Zellenangaben oder W-LAN-Informationen verarbeiten, aber immer weniger Anwender stimmen Abfragen von Webseiten oder Apps diesbezüglich zu, so dass diese Daten nicht zur Verfügung stehen.
Die IP-Adresse, die zur Kommunikation im Internet stets benötigt wird, kann dagegen als Mechanismus zur Standortermittlung immer herangezogen werden (zur Einwilligungsthematik s.u.).
Die IP-Adresse wird vom Internet Service Provider an seine Kunden vergeben, in Deutschland bspw. von der Telekom, Vodafone und anderen. Geolokalisierungsdienste-Anbieter können auf die Standort-Zuordnung von IP-Adressen bei diesen Providern zugreifen. Aktualität und Genauigkeit dieser Daten entscheiden dann wie gut die Qualität eines Geolokalisierungsdienst ist.
Aktualität und Genauigkeit sind jedoch aufgrund der Netzwerk-Struktur des Internets eine komplexe Thematik, was ich nun näher erläutern möchte:
Aktualität der Daten
Zum einen können Geolokalisierungsdienste nicht „live“ weltweit alle möglichen Internet Service Provider abfragen, an welchem Standort sich die gerade angefragte IP-Adresse befindet. Das wäre zwar technisch theoretisch sicherlich möglich, aber meines Wissens nach wird es nicht praktiziert. Deswegen werden die Daten durch die Geolokalisierungsdienste in regelmäßigen Abständen mit den Providern synchronisiert und in eigenen Datenbanken vorgehalten, die dann wiederrum aus Performance-Gründen weltweit an wichtigen Internet-Knoten oder zum Download bereitgestellt werden. Bei guten Anbietern erfolgt die Aktualisierung mehrmals pro Woche.
IP-Adressen sind keine Längen- und Breitengrad-Angaben
Zum anderen ist die Vorstellung bzgl. der exakten, genauen Adresszugehörigkeit einer IP-Adresse falsch, was an der technischen Struktur des Internets liegt. Eine IP-Adresse entspricht nur in wenigen Fällen einem exakten Längen- und Breitengrad und selbst dann wäre es nur die Koordinate eines technischen Gerätes, wie beispielsweise eines Proxy-Servers, über den das Personal eines Unternehmens ins Internet geht.
Im Gegensatz zu solchen sogenannten statischen IP-Adressen, wie im Falle des Proxy-Server-Beispiels, sind in den meisten Fällen die IP-Adressen dynamisch.
Rotation dynamischer IP-Adressen
D.h. der Internet Service Provider entscheidet, welcher seiner Kunden wann an welchem Standort aus dem riesigen Pool seiner IP-Adressen welche exakt zugeordnet bekommt. In der Intensität dieser „Dynamik“, also wie sehr ein Provider die IP-Adressen bei seinen Kunden hin- und her rotiert, liegt ein großer Teil der Komplexität für Geolokalisierungsanbieter.
Mobile Endgeräte „sind mobil“
Eine weitere Komplexität bzgl. der Genauigkeitsermittlung stellen mobile Endgeräte dar, bei denen sich unter Umständen nicht die IP-Adresse ändert, jedoch der Anwender des Gerätes seinen Standort verändert oder zwischendurch nicht über seinen Mobilfunk-Anbieter, sondern über ein (öffentliches) W-LAN eines anderen Anbieters im Internet ist.
Anonymisierung und VPN
Und letztlich verhindern sogar manche Zugriffstechniken auf das Internet die Standortermittlung, und zwar wenn ein Server an einem ganz anderen Standort verwendet wird, um in das Internet zu gehen. Sei es aus Anonymisierungs- oder Datensicherheitsgründen (VPN) oder weil Unternehmen, Behörde, Hochschule dies so vorgeben und dann die IP-Adresse des Servers und nicht die des Endgerätes einer Person verwendet wird.
Lösungsansätze
Einzelne Anbieter von Geolokalisierungsdiensten sind deshalb dazu übergangen, einen zusätzlichen Vertrauenswert je IP-Adresse oder einen Umkreis-Radius (z.B. 50km, 100km, 250km) bezogen auf die Genauigkeit (accuracy radius) ermittelte Standortadresse einzuführen, um ihren Kunden zu helfen, wie sehr sie sich auf die ermittelten Standortangaben verlassen können. Auch werden Angaben bereitgestellt, ob es sich bei der IP-Adresse um einen VPN- oder Anonymisierungsdienst (bspw. TOR) handelt oder ob es sich um IP-Adressen handelt, die in der Vergangenheit für Betrug (prevent fraud services) genutzt wurde.
Testergebnisse Geolocation-Anbieter
Ein Selbst-Test mit 14 Geolocation-Angeboten (zwei Anbieter jeweils mit einer kostenlosen und einer kommerzieller Variante) für ein DSL- und ein Mobil-Gerät mit 10 Tests verteilt über 3 Monate am Standort Berlin ergab folgende kunterbunte Standortermittlungen, die ich in eine Karte einzeichnen habe lassen. Die Ergebnisse aller Anbieter zusammengenommen waren über ganz Deutschland verteilt. Immerhin war keine IP-Adresse außerhalb von Deutschland zugeordnet.
Die Unterschiede zwischen den Anbietern waren jedoch erheblich, wie untenstehende Tabelle zeigt. Für IP-Adressen, die mobilen Endgeräten zugewiesen wurden, waren die Standortermittlungen bestenfalls nur in jedem zweiten Fall korrekt.
Anbieter | DSL | Mobil |
Maxmind (komm.) | 9/10 | 4/10 |
Maxmind (lite, free) | 9/10 | 3/10 |
IPregistry.co | 9/10 | 4/10 |
Bigdatacloud | 8/10 | 5/10 |
IPdata.co | 5/10 | 5/10 |
IP-Api | 4/10 | 4/10 |
IPinfo.io | 3/10 | 4/10 |
ipwhois | 0/10 | 1/10 |
ipstack | 0/10 | 1/10 |
db-ip.com (komm.) | 0/10 | 1/10 |
dp-ip.com (lite, free) | 0/10 | 0/10 |
ip2location | 0/10 | 0/10 |
ipGeolocation | 0/10 | 0/10 |
ipapi.com | 0/10 | 0/10 |
Die Testergebnisse beziehen sich auf wechselnde IP-Adressen am Standort „Berlin“ . An 10 verschiedenen Tagen über einen Zeitraum von 12 Wochen wurde sowohl mit einem DSL-Anschluss (Vodafone) als auch Mobilfunk-LTE-Zugriff (Telekom) die Standortermittlung anhand der zugänglichen Test-Angebote auf den Webseiten der Anbieter bzw. einer in Matomo eingebundenen und aktuellen Datenbank (im Fall von Maxmind lite sowie db-ip.com lite) überprüft. Verwendet wurde eine volle IP-Adresse (4 Bytes) ohne Anonymisierung.
„9/10“ bedeutet beispielsweise, dass an 9 von 10 Test-Tagen als Standort „Berlin“ zurückgegeben wurde.
Ergänzend zu obiger Tabelle möchte ich noch erwähnen, wie „falsch“ die Ergebnisse bei den drei Anbietern (Maxmind, IPregistry, Bigdatacloud) waren, die am besten abgeschnitten hatten:
Wurde nicht „Berlin“ als Standort ermittelt, waren die Abweichungen innerhalb Deutschlands extrem falsch, sowohl bei DSL als auch Mobilfunk. Teilweise konnte kein Ort zurückgegeben werden, sondern nur ein Bundesland. Statt Berlin wurde als Ergebnis Baden-Württemberg, Hamburg, Niedersachsen, Sachsen, Sachsen-Anhalt zurückgeliefert, was bekanntermaßen geographisch deutlich falsch ist und nicht mal mehr im 200km Umkreis-Radius, abgesehen von Sachsen-Anhalt, lag. Nur in seltenen Fällen wurde ein Ort im näheren Umkreis von Berlin in Brandenburg zurückgegeben.
Tiefergehende Angaben zur erwartbaren Genauigkeit der Standortdaten können auf den verlinkten Seiten bei den Anbietern Maxmind und Bigdatacloud gefunden werden.
Screenshot vom Anbieter Bigdatacloud mit Wettbewerbern. Meine Testergebnissen sahen keinen Wettbewerbsvorteil von Bigdatacloud ggü. Maxmind.
Auswirkung Anonymisierung der IP-Adresse
Wird die Standortermittlung mit anonymisierter IP-Adresse durchgeführt, verschlechtert sich das Ergebnis je nach Anzahl anonymisierter Bytes erheblich.
Während eine Anonymisierung um ein Byte in den meisten Fällen sogar den Ort oder zumindestens das Bundesland richtig zurückgibt (vorausgesetzt die Daten sind für die volle IP-Adresse überhaupt korrekt), so ist bei einer Anonymisierung um zwei Byte bereits nicht mehr sichergestellt, überhaupt das Land (also den Staat) korrekt zu erhalten.
Beispielsweise liefert eine Anonymisierung um zwei Bytes von 188.172.x.x als Land Malta zurück. In dem 65.536 IP-Adressen umfassenden Bereich wurden jedoch bei Stichproben ohne Anonymisierung auch folgende Länder ermittelt: Albanien, Deutschland, Großbritannien, Malta, Österreich, Rumänien, Peru, USA, Vereinigte Arabische Emirate (getestet mit Maxmind GeoLite2.mmdb).
Nutzung in Matomo
Matomo kann out-of-the-box mit Maxmind, DB-IP und IP2Location genutzt werden (letzterer Anbieter durch Einsatz eines kostenlosen Plugins aus dem Marketplace von Matomo). Alle drei Anbieter stellen Datenbanken zum Download bereit, die Matomo auf den Matomo-Server downloaded und dort die Standortermittlungsabfrage „lokal“ vornimmt. In diesen Fällen wird die IP-Adresse des Webseiten- oder App-Users nicht an einen anderen Server gesendet.
Alle obigen Anbieter bieten (auch) Webservice-Schnittstellen an, die sowohl Server-seitig als auch in den meisten Fällen Client-seitig (mit JavaScript) „live“ abgefragt werden können. Es ist daher im Rahmen von individuellen Lösungen möglich, auch andere Anbieter zu verwenden und deren Ergebnisse in Matomo bspw. als benutzerdefinierte Dimension zu speichern. Dies bietet vor allem erhebliches Potenzial, wenn Umkreis-Parameter, Angaben über Mobilfunk, VPN oder Trustness ausgewertet werden sollen und erst ab einem bestimmten Level das Tracking erfolgen soll. Matomo kann mit seinen out-of-the-box-Methoden und den Datenbanken dies nicht auswerten bzw. trackt diese Angaben auch nicht.
Näheres zur Matomo-Standortermittlung habe ich in einem weiteren Artikel geschrieben.
Fazit
Die Geolokalisierung im Internet auf Basis der IP-Adressen ist verschiedenen Herausforderungen ausgesetzt. Die Dynamik in der Vergabe von IP-Adressen an Geräte oder Internet-Anschlüsse, aber auch die Flexibilität mobiler Geräte, die durch ihren Besitzer „beweglich“ sind, erschwert die Standortermittlung erheblich.
Ein Selbst-Test am Standort Berlin über einen längeren Zeitraum zeigte erhebliche Unterschiede zwischen bekannten Anbietern. Weit über die Hälfte der Anbieter lag in mehr als 50% der Fälle falsch.
Gute Anbieter liefern als zusätzliche Kriterieren zur Einordnung noch weitere Informationen über den Umkreis-Radius, die Vertrauenswürdigkeit in die Genauigkeit der gelieferten Angaben oder Informationen, ob es sich um ein Mobilnetz, um einen VPN-, Anonymisierungsdienst oder sogar um eine zuvor zu Betrugszwecken genutzte IP-Adresse handelt.
Vor Auswahl eines Anbieters sollten diese Kriterien zusammen mit den kommerziellen Rahmenbedingungen und den Datenschutzvorgaben geprüft werden.
Schreibe einen Kommentar