Wie man Landtage scrapet

Jeder vierte Landtagsabgeordnete übt bezahlte Tätigkeiten oder Funktionen neben seinem Mandat aus. Das ist eines der Ergebnisse meiner Datenrecherche für Spiegel Online: In drei Artikeln widme ich mich den Top-Verdienern, unvollständigen Selbstauskünften und Lücken in den Transparenzregeln.

Alle ausgewerteten Angaben stammen von den Webseiten der Landtage. Auf ihrem jeweiligen Abgeordnetenprofil müssen die Parlamentarier ihre Nebeneinkünfte auflisten. Die insgesamt rund 1200 Abgeordneten machen mehr als 6000 Angaben.

An dieser Stelle möchte ich beschreiben, wie man solche Informationen von Webseiten auslesen und in eine Struktur überführen kann, in der dann die weitere Auswertung möglich ist. Wer, wie ich, kein Python beherrscht, kann sich hierfür mit einer überschaubaren Auswahl an Werkzeugen behelfen.

Weiterlesen →

Holtzbrinck-Preis und dpa-infografik award

Große Freude über zwei Auszeichnungen: Gestern Abend haben Lars-Marten Nagel und ich den Georg von Holtzbrinck-Preis für Wirtschaftspublizistik in der Kategorie Interaktive Multimedia-Speziale entgegen genommen. Die Jury hat unsere Datenrecherche „Wettlauf gegen den Verfall“ ausgezeichnet, in der wir zeigen konnten, dass Deutschlands Straßenbrücken schneller verfallen, als die Behörden damit hinterher kommen, sie reparieren zu lassen. An der Umsetzung waren insgesamt elf Journalisten, Programmierer und Infografiker der „Welt“ beteiligt.

Schon vor drei Wochen wurden acht Kollegen und ich beim dpa-infografik award mit dem ersten Platz in der Kategorie Nachrichtliche Infografiken bedacht. Wir erhielten die Auszeichnung für die Visualisierung der Abweichler im Bundestag.

250 Mal rechtsextreme Live-Musik

rechtsrockkonzerte

Neonazis treffen sich wieder häufiger zu Rechtsrock-Konzerten und anderen Musikveranstaltungen. Nach einem längeren Abwärtstrend stieg die Zahl der Veranstaltungen im vergangenen Jahr erstmals wieder, und auch 2016 scheint sich der Aufschwung fortzusetzen. Das zeigen Daten des Bundesinnenministeriums, die ich zusammen mit meinem Kollegen Florian Flade ausgewertet habe. In den vergangenen Monaten haben wir immer wieder über die Thematik berichtet. Mittlerweile ist ein Datensatz mit rund 250 rechtsextremen Musikveranstaltungen entstanden.

Konzerte dienen in der rechten Szene der Vernetzung und Rekrutierung von Nachwuchs. Ferner dienen die Einnahmen oft der Finanzierung von Gerichtsprozessen gegen gewalttätige Neonazis.

Besonders schockierte mich die Hilflosigkeit vor Ort: In Dörfern wie Staupitz in Sachsen oder Kirchheim bei Erfurt sind es einzelne Immobilienbesitzer, die regelmäßig ihre Räumlichkeiten den Rechtsextremen zur Verfügung stellen. Alle paar Wochen müssen die Anwohner miterleben, wie dutzende, manchmal sogar hunderte Neonazis in den Ort einfallen und gleich nebenan feiern. Die Veranstaltungen sind ordnungsgemäß angemeldet und die Räume oft so gut isoliert, dass selbst der Vorwurf der Ruhestörung ins Leere läuft.

Per IFG zu den Brückendaten

brueckendaten

Als ich im Februar 2015 bei der „Welt“-Gruppe anfing, führte mich einer meiner allerersten Termine ins Berliner Verwaltungsgericht. Mein Kollege Lars-Marten Nagel einigte sich nach einem siebenjährigen Streit mit dem Bundesverkehrsministerium auf einen Vergleich: Das Ministerium versprach, endlich Daten über den Zustand der deutschen Autobahn- und Bundesstraßenbrücken herauszugeben. Grundlage war das Informationsfreiheitsgesetz (IFG), das jedem Bürger den Zugang zu behördlichen Informationen zusichert.

Es sollte noch mehr als ein Jahr vergehen, bis wir tatsächlich alle notwendigen Daten beisammen und ausgewertet hatten. Jetzt können wir zeigen, wie ernst die Lage auf den deutschen Straßen ist: Die Brücken verschleißen schneller als Behörden sie reparieren lassen können.

#nr16

Bei der Jahrestagung von Netzwerk Recherche gab es auch in diesem Jahr wieder einen üppigen Daten-Track mit vielen spannenden Sessions. Ausdrücklich empfehlen möchte ich Giannina Segninis Talk über „Six ways to generate data journalism stories“ – nachzusehen auf YouTube.

Ich selbst habe das Podium zu investigativem Datenjournalismus moderiert. Mit dabei waren Sylke Gruhnwald (Beobachter), Vanessa Wormer (Süddeutsche Zeitung) und Daniel Drepper (Correctiv). Der Videomitschnitt ist oben eingebunden, die Folien stehen inzwischen auch online.

Und schließlich habe ich den Workshop „Die fiesesten Hürden der Datenauswertung“ organisiert. Immer wieder beobachte ich, dass Journalisten sich in die Grundlagen des Datenjournalismus einarbeiten, Excel lernen, Einsteiger-Seminare besuchen – doch in der Praxis hakt es hier und da noch. Zusammen mit Katharina Brunner (Süddeutsche Zeitung), Manuel Mohr (Bayerischer Rundfunk) und Patrick Stotz (Spiegel Online) habe ich mir häufige Probleme angesehen und Lösungswege aufgezeigt. Einen Mitschnitt gibt es von dieser Session zwar nicht, aber unsere Folien stehen online.

Den Abweichlern auf der Spur

abweichler

Fraktionen im Bundestag stimmen geschlossen ab – eigentlich. Manche Abgeordnete berufen sich aber gelegentlich bis regelmäßig auch auf ihr freies Mandat im Sinne des Grundgesetzes, wonach sie „nur ihrem Gewissen unterworfen“ sind. Auf der Suche nach den größten Abweichlern im Parlament haben wir die Stimmlisten von mehr als 300 namentlichen Abstimmungen ausgewertet. Im Interview haben die ausfindig gemachten Abgeordneten offenbart, welchen Preis sie für ihre Eigenwilligkeit zahlen müssen.

Nächste Woche werde ich beim Berliner DDJ-Meetup zusammen mit unserem Entwickler Viktor Mucha methodische und technische Details des Projekts näher erläutern.

Die Finanziers des Wahlkampfs 2013

parteispenden

Mehr als 90 Millionen Euro haben Unternehmen, Verbände und Privatpersonen den deutschen Parteien im Wahljahr 2013 gespendet. Zusammen mit den Mitgliedsbeiträgen und staatlichen Zuschüssen sind Spenden die wichtigste Einnahmequelle der Parteien. Die Überweisungen unterliegen gewissen Transparenzregeln – die allerdings weitaus strenger gefasst sein könnten. In den vergangenen Tagen haben wir die vorliegenden Daten aufwendig ausgewertet und interaktiv aufbereitet.

Zeig mir deine Schriftarten und ich sage dir, wer du bist

Einzigartig wie ein Fingerabdruck soll die Methode sein. Fast zumindest: Auch wer in seinem Browser die Cookies abschaltet, hinterlässt beim Surfen Spuren, die es Website-Betreibern ermöglichen, Nutzer nahezu eindeutig zu identifizieren, zu tracken und über verschiedene Websites hinweg zu verfolgen. Über dieses sogenannte Browser Fingerprinting schreibt Henning Tillmann gerade seine Diplomarbeit. Auf der re:publica hat er erste Ergebnisse präsentiert.

Weiterlesen →

Wege aus der Personalisierung

Warum zeigt mir Facebook die Status-Updates bestimmter Personen an, die anderer aber nicht? Warum liefert mir Google unter dem selben Suchbegriff andere Ergebnisse als meinem Kollegen? Online-Dienste haben immer seltener ein einheitliches, reproduzierbares Aussehen. Stattdessen unterscheiden sie sich von Anwender zu Anwender. Die Entscheidung, wie sich ein Dienst einem bestimmten Anwender präsentiert, treffen Algorithmen, die die Online-Inhalte auf unsere persönlichen Bedürfnisse zuschneiden sollen. Diese Algorithmen werten etwa aus, nach welchen Begriffen wir in der Vergangenheit gesucht haben oder wessen Status-Updates wir geliket und kommentiert haben.

Bei der Diskussion Algorithmen-Ethik auf der re:publica ging es um die Vorteile dieser Personalisierung, vor allem aber auch um die Probleme, die mit ihr einhergehen. Mercedes Bunz brachte den Status Quo auf den Punkt: „Es gibt kein Außerhalb der Personalisierung mehr.“ Online-Dienste böten keine Möglichkeit, ihre Personalisierungsalgorithmen zu verstehen und einzelne Parameter oder den gesamten Algorithmus auszuschalten.

Weiterlesen →

So nutzen Politiker Twitter

Zuweilen war es ja ganz schön amüsant, im zurückliegenden Superwahljahr 2009 Politikern dabei zuzusehen, wie sie ihre ersten, unsicheren Schritte im großen, weiten Internet machten. Aber es half ja alles nichts, schließlich hatte Obama es 2008 vorgemacht und nun musste man sich auch hierzulande den Anschein geben, im „neuen“ Medium der jungen Wähler zu Hause zu sein. Nicht nur in diversen Sozialen Netzwerken waren die Abgeordneten (und die, die es werden wollten) zahlreich vertreten, auch der Microblogging-Dienst Twitter wurde von den Politikern im Wahlkampf intensiv genutzt. Nach der Wahl verwaisten etliche Profile, überraschend viele Parlamentarier aber blieben dem Dienst treu: Auch über zwei Monate nach der Wahl twitterten weit über hundert Bundestagsabgeordnete regelmäßig. Und einige haben Twitter sogar wirklich verstanden. Ergebnisse einer Seminararbeit.

112 Bundestagsabgeordnete twittern. Das sind immerhin 18 Prozent der 622 MdB. In der Untersuchung wurden solche Profile berücksichtigt, die auch nach der Bundestagswahl 2009 regelmäßig Tweets absetzten und die von den Parlamentariern selbst oder ihren Mitarbeitern in deren Auftrag gepflegt wurden. Es wurden 1.074 Tweets untersucht, die von den 112 MdB-Profilen in der Woche von Montag, den 30. November bis Sonntag, den 6. Dezember 2009 (eine Sitzungswoche) veröffentlicht wurden.

Weiterlesen →