Studien Köln 2026 Rohdaten
Open Data · Köln 2026

Anonymisierte Rohdaten zur Köln-Studie 2026

Die anonymisierten Roh-Aggregate der Studie sind unter Creative-Commons Namensnennung 4.0 (CC BY 4.0) frei nachnutzbar. Über OpenTimestamps sind die SHA-256-Hashes der Dateien in der Bitcoin-Blockchain verankert — jeder Dritte kann den unveränderten Inhalts-Stand zum Studien-Stichtag unabhängig nachweisen.

Anonymisierung in Kürze

Pro Location ist genau eine Identifizierung im Datensatz enthalten: id = first_16_hex_chars(SHA256(hostname)) — nicht reversibel ohne Kenntnis des ursprünglichen Hostnamens.

Bewusst entfernt: Hostname, vollständige URL, Site-Name / Brand, OSM-ID, Lat/Lon, Postleitzahl, vollständige Adresse, Issue-Texte mit eingebetteten URLs.

Bewusst erhalten (anonym, aggregat-tauglich): Bezirk + Stadtteil, Branche / OSM-Tag, alle Boolean-Befunde (Impressum, DSE, AGB, Cookie-Banner, Google Fonts, GA, FB-Pixel), Cookie- und Third-Party-Anzahl, strukturelle DSE-/AGB-Issue-Typen, Top-10-Drittanbieter-Domains je Location.

Vollständige Schema-Beschreibung + stadtteil_inferred-Flag für Border-Cases: README-anonymized-data.md.

Download

  • anonymized-locations-koeln.jsonl JSON Lines, eine Location pro Zeile · ca. 2,7 MBDatei laden →
  • anonymized-locations-koeln.csv CSV-Variante für Excel / R / pandas · ca. 548 KBDatei laden →
  • aggregate-koeln.json vorberechnete Aggregate je Bezirk / Stadtteil / Branche · ca. 1 MBDatei laden →
  • clean-quotes.json „Beanstandungs-frei“-Quoten weich + streng · ca. 18,6 KBDatei laden →
  • README-anonymized-data.md Schema-Beschreibung + LizenzinfoDatei laden →
  • VERIFIKATION.md Hash- und Bitcoin-Verifikations-AnleitungDatei laden →

Bitcoin-Verifikation

Die Roh-Aggregate sind über den offenen Standard OpenTimestamps in der Bitcoin-Blockchain verankert. Die .ots-Proof-Dateien enthalten den Bitcoin-Block-Header direkt eingebettet — die Verifikation ist Calendar-Server-unabhängig.

Kryptographische Fingerabdrücke (SHA-256)

anonymized-locations-koeln.jsonl
58ae0096b838d384ada5a943e423e358aeafeae0928d9fe48d1b21be50355bfe
aggregate-koeln.json
7fea6f34e6822388d2821147d57e550889ee8b0616d3985ba6e4d2d42ad9052b
clean-quotes.json
287087467497f5a9923e292183f58710105c99d8264fbc497e18dfae50756a1c

So verifizieren Sie eine heruntergeladene Datei

Schritt 1 — SHA-256-Hash gegen die Tabelle oben prüfen:

Linux / macOS: sha256sum anonymized-locations-koeln.jsonl
Windows (PowerShell): Get-FileHash anonymized-locations-koeln.jsonl -Algorithm SHA256

Erwartetes Ergebnis: exakter Match mit dem Hash oben. Stimmt der Hash, ist der Inhalt der heruntergeladenen Datei bit-genau identisch mit dem Studien-Stand.

Schritt 2 (optional) — Bitcoin-Verankerung prüfen:

pip install opentimestamps-client
ots verify anonymized-locations-koeln.jsonl.ots -f anonymized-locations-koeln.jsonl

Eine erfolgreiche Verifikation belegt: Die Datei existierte in genau diesem Inhalt bereits zum Zeitpunkt des Bitcoin-Blocks der Verankerung. Eine nachträgliche Manipulation ist nicht möglich, ohne die Verankerung zu invalidieren.

Lizenz & Kontakt

Lizenz: CC BY 4.0. Bedingung: Namensnennung (Thorsten Ahrens / Serahr) und Verlinkung der Originalquelle (https://serahr.de/studie/koeln/2026).

Bei wissenschaftlichen Zweitanalysen freut sich der Autor über einen Hinweis an studie@serahr.de.