Anonymisierte Rohdaten zur Köln-Studie 2026
Die anonymisierten Roh-Aggregate der Studie sind unter Creative-Commons Namensnennung 4.0 (CC BY 4.0) frei nachnutzbar. Über OpenTimestamps sind die SHA-256-Hashes der Dateien in der Bitcoin-Blockchain verankert — jeder Dritte kann den unveränderten Inhalts-Stand zum Studien-Stichtag unabhängig nachweisen.
Anonymisierung in Kürze
Pro Location ist genau eine Identifizierung im Datensatz enthalten: id = first_16_hex_chars(SHA256(hostname)) — nicht reversibel ohne Kenntnis des ursprünglichen Hostnamens.
Bewusst entfernt: Hostname, vollständige URL, Site-Name / Brand, OSM-ID, Lat/Lon, Postleitzahl, vollständige Adresse, Issue-Texte mit eingebetteten URLs.
Bewusst erhalten (anonym, aggregat-tauglich): Bezirk + Stadtteil, Branche / OSM-Tag, alle Boolean-Befunde (Impressum, DSE, AGB, Cookie-Banner, Google Fonts, GA, FB-Pixel), Cookie- und Third-Party-Anzahl, strukturelle DSE-/AGB-Issue-Typen, Top-10-Drittanbieter-Domains je Location.
Vollständige Schema-Beschreibung + stadtteil_inferred-Flag für Border-Cases: README-anonymized-data.md.
Download
- anonymized-locations-koeln.jsonl Datei laden →
- anonymized-locations-koeln.csv Datei laden →
- aggregate-koeln.json Datei laden →
- clean-quotes.json Datei laden →
- README-anonymized-data.md Datei laden →
- VERIFIKATION.md Datei laden →
Bitcoin-Verifikation
Die Roh-Aggregate sind über den offenen Standard OpenTimestamps in der Bitcoin-Blockchain verankert. Die .ots-Proof-Dateien enthalten den Bitcoin-Block-Header direkt eingebettet — die Verifikation ist Calendar-Server-unabhängig.
- anonymized-locations-koeln.jsonl.ots OTS-Proof laden →
- aggregate-koeln.json.ots OTS-Proof laden →
- clean-quotes.json.ots OTS-Proof laden →
Kryptographische Fingerabdrücke (SHA-256)
58ae0096b838d384ada5a943e423e358aeafeae0928d9fe48d1b21be50355bfe7fea6f34e6822388d2821147d57e550889ee8b0616d3985ba6e4d2d42ad9052b287087467497f5a9923e292183f58710105c99d8264fbc497e18dfae50756a1cSo verifizieren Sie eine heruntergeladene Datei
Schritt 1 — SHA-256-Hash gegen die Tabelle oben prüfen:
sha256sum anonymized-locations-koeln.jsonlGet-FileHash anonymized-locations-koeln.jsonl -Algorithm SHA256Erwartetes Ergebnis: exakter Match mit dem Hash oben. Stimmt der Hash, ist der Inhalt der heruntergeladenen Datei bit-genau identisch mit dem Studien-Stand.
Schritt 2 (optional) — Bitcoin-Verankerung prüfen:
pip install opentimestamps-clientots verify anonymized-locations-koeln.jsonl.ots -f anonymized-locations-koeln.jsonlEine erfolgreiche Verifikation belegt: Die Datei existierte in genau diesem Inhalt bereits zum Zeitpunkt des Bitcoin-Blocks der Verankerung. Eine nachträgliche Manipulation ist nicht möglich, ohne die Verankerung zu invalidieren.
Lizenz & Kontakt
Lizenz: CC BY 4.0. Bedingung: Namensnennung (Thorsten Ahrens / Serahr) und Verlinkung der Originalquelle (https://serahr.de/studie/koeln/2026).
Bei wissenschaftlichen Zweitanalysen freut sich der Autor über einen Hinweis an studie@serahr.de.