Datenjournalismus (1): Grundlagen

Don’t focus on tools, focus on storys“: Paul Bradshaw, britischer Online-Journalist und Blogger, hat mit dieser freundlichen Mahnung mich gemeint. Ganz bestimmt. Denn ich neige dazu, in meiner Begeisterung für neue Werkzeuge schnell mal die eigentliche Geschichte aus den Augen zu verlieren. Die aber steht auch im Datenjournalismus im Vordergrund und am Anfang eines Projekts.…

Datenjournalismus (2): Scraping

Daten finden ist das Thema des zweiten Moduls im Online-Kurs „Doing Journalism with Data“, über den ich hier in einer kleinen Serie berichte. Experte ist Paul Bradshaw (Twitter), der an der Birmingham City University Online-Journalismus lehrt und das Online Journalism Blog betreibt. Er zeigt mir, wie man Daten automatisiert auslesen kann, nennt mir eine Alternative für den Fall, dass eine Website keinen RSS-Feed oder eigenen Mail-Alert anbietet, und erinnert mich an Möglichkeiten, die ich im Arbeitsalltag oft vergesse.…

Datenjournalismus (4): Messy data – Daten säubern mit OpenRefine

Unterschiedliche Schreibweisen, Abkürzungen oder Zahlenformate, Doubletten, Rechtschreibfehler, überflüssige Leerzeichen, fröhliches Hin und Her zwischen Singular und Plural: „Messy data“ ist das täglich Brot des Datenjournalismus. Besonders beim Zusammenführen von Datensätzen aus mehreren Quellen ist das Ergebnis mitunter ein ziemliches Durcheinander. Das weiß der französische Journalist und Programmierer Nicolas Kayser-Bril (Web, Twitter) aus eigener Anschauung, er ist Mitgründer und CEO der Daten-Agentur Journalism++.