Notizblock von Patrik Tschudin, work in progress!




indirekte Evidenz


Journalism in the Age of Data

c/o stanford univeristy: Journalists are coping with the rising information flood by borrowing data visualization techniques from computer scientists, researchers and artists. Some newsrooms are already beginning to retool their staffs and systems to prepare for a future in which data becomes a medium. But how do we communicate with data, how can traditional narratives be fused with sophisticated, interactive information displays?

Der dazugehörende, sehr aufschlussreiche Dokfilm ist bei vimeo in voller Länge online (54 Min.)

How to be a Data Journalist

Data journalism trainer and writer Paul Bradshaw explains how to get started in data journalism, from getting to the data to visualising it

Computational Journalism

A Call to Arms to Database Researchers (.pdf)

In the summer of 2009, a group (including two authors of this paper) of journalists, civic hackers, and researchers in social science and computer science gathered for a workshop at Stanford on the nascent field of computational journalism, and discussed how computation can help lower cost, increase effectiveness, and encourage participation for investigative journalism. In this paper, we present a more focused perspective from database researchers by outlining a vision for a system to support mass collaboration of investigative journalists and concerned citizens. We discuss several features of the system as a sample of interesting database research challenges. We argue that computational journalism is a rich field worthy of attention from the database community, from both intellectual and social perspectives.


Ist Datenjournalismus mehr als nur alter Wein in neuen Schläuchen? Anthony DeBarros von USA Today hat seine grossen Zweifel, die er mit guten Argumenten unterlegen kann.


(Computerworld hat im April 2011 eine eigene Zusammenstellung von Tools publiziert. Merci für den Hinweis, Clemens!)

pdf konvertieren

pdf nach xls

  • pdfGrabber Windowssoftware - Erste Versuche mit pdfGrabber (kostenpflichtig, Windows) sehen vielversprechend aus!
  • cometdocs - Files uploaden und per Mail die konvertierte Datei erhalten. Erstaunlich hohe Präzision!


Maps: Adressen geocodieren und auf Karte anzeigen

  1. Adressdaten erfassen in Tabellenkalkulation. Z.B. Google Docs. Für Strasse und Stadt je eine separate Spalte
  2. Daten von dort exportieren als Text (Bei Google Docs: Datei → Herunterladen als → Text)
  3. Das Textfile öffnen, alles markieren und kopieren
  4. Bei in Textfenster in „Schritt 1“ einfügen
  5. „Bestätigen“ klicken
  6. Spalten den korrekten Adressteilen zuweisen
  7. „Run Geocoder“ klicken. Warten…
  8. „Speichern / Drucken / Veroeffentlichen“ klicken und Formular ausfüllen, auf „Karte speichern“ klicken
  9. Die Karte erscheint!
  10. Ganz runter scrollen auf der Seite
  11. Auf „Google Earth KML“ klicken, die KML-Datei herunterladen (ev. ihr einen eigenen Namen geben)
  12. Mit einem Text editor die Datei öffnen und die paar Zeilen am Anfang des Files löschen in denen Style id=„0“ und Style id=„1“ definiert sind.
  13. File unter neuem Namen abspeichern
  14. Zu gehen und mit Deinem Google-Account einloggen
  15. Auf „Meine Karten“ klicken
  16. Auf „Neue Karte erstellen“ klicken
  17. Auf „Importieren“ klicken und die vorhin unter neuem Namen gespeicherte Datei auswählen.
  18. Hochladen, warten und
  19. Fertig ist die Karte!
  20. So entstand zum Beispiel diese, verwendet u.a. hier.

Google Docs

Google Chart

What are Google Chart Tools? The Google Chart Tools enable adding live charts to any web page. The advantages of the Google Chart Tools are: A rch gallery of visualizations provided as:

  • Image charts - using a simple URL request to a Google chart server
  • Interactive charts - using a Google developed JavaScript library
  • Can read live data from a variety of data sources
  • Simple to use and free

Chart Vizard

Sometimes a table just isn’t enough to compare data. If you need to crank out a bar, line or pie chart, and your graphics guru is out, Google Chart Wizard can help in a pinch. It takes a little practice, but the editor is pretty easy to learn. Just remember a couple of basic guidelines about which kind of chart to use. In general, a bar chart compares quantities, a line chart shows a trend and a pie chart compares a part to a whole.

Google Visualization Code Playground

Google public data explorer

Selbstdeklaration: „The Google Public Data Explorer makes large datasets easy to explore, visualize and communicate. As the charts and maps animate over time, the changes in the world become easier to understand. You don't have to be a data expert to navigate between different views, make your own comparisons, and share your findings.“

Google Refine

Fusion Tables

This is another Exhibit-like application that will show and publish your data as maps, time lines and/or charts. Unlike Exhibit, you don’t have to get your hands dirty working under the hood with the html and JavaScript.

Mit Google Insights for Search können Sie Suchvolumenmuster über bestimmte Regionen, Kategorien, Zeiträume und Webdienste hinweg vergleichen.

tableau public software

Windows Software, um interaktive Grafiken für's Web zu erzeugen (not tested myself). Website.

1 - Upload your spreadsheet 2 - Get an interactive online map in seconds


History Flow

Offenes Tool, um Statistiken in Geographische Informationen umzuwandeln. Untested, aber vielversprechend. Daran mitgeteiligt:


Data Wrangler is an interactive tool designed to make it easier to manipulate data. Spend less time formatting and more time analyzing your data. Wrangler is the result of a collaborative project between researchers at Stanford and UC Berkeley. Demo Video.

IssueMap is a project byt the FCC and FortiusOne to make it easier for citizens to create their own maps and share them widely. The process is super simple. You just need a spreadsheet or table of data that references a commons geographic boundary and a set of values you would like to map to those boundaries. Follow the simple two step process and you’ll have a thematic map you can share across you social networks (Twitter, Facebook, email) and your audience can grab the map as an embed, download an image, grab the map as KML or get the raw data as a .csv.


This link goes to a page with a collection of links from MIT’s Simile project. Exhibit is a JavaScript program that will let you take data that is in tabular form (rows and columns) and see it in a variety of formats: sortable and filterable table, map, time line, etc. Look at the Examples to get an idea of what can be done. Note also the DataPress link, which goes to a WordPress add-in that will let you put Exhibit visualizations on your blog. Using Exhibit requires some knowledge of html, though it’s not hard to simply copy its code and tweak it. Dido is a prototype for a user-interface that will let you specify your Exhibit without having to get into the code.


This JavaScript program will take tables that have a time element and create interactive time lines that can be filtered and colored by multiple variables. It’s purely an analysis tool, not designed for Web presentation. I can see it as being useful for investigative projects.

Timeline JS

Beautifully crafted timelines that are easy, and intuitive to use.


This site lets you upload data and visualize it using a wide variety of interesting displays: maps, word trees, tag clouds, tree maps, bubble charts, matrix charts, network diagrams, etc. Check out the more than 84,000 such visualizations that people have created for ideas of what to do with your own data.


This downloadable program from Stanford’s visualization lab is like ManyEyes but with an even wider variety of charts and graphs that can be made; click on the Examples link to see. But using Protovis does require some heavy-lifting code-writing.


Another MIT tool, this one is designed to take a large volume of Twitter tweets in real time and show them as a graphical timeline with peaks of activity. It includes a sentiment algorithm that classifies tweets as negative or positive. The research paper describes how it could be used for news gathering, such as pinpointing earthquakes ahead of the geologists.


This is an Excel add-in that does graphical displays of social networks. These displays are designed to show how people are interconnected. An example would be connections among members of various corporate boards. Another example is one my son Matt created for the Sarasota Herald-Tribune last year involving groups of home buyers and sellers who were involved in massive mortgage-fraud schemes. These displays can get ungainly quickly; one name used by journalists for the complicated ones is “the hairball.”


Timeline Tool: If you have a complicated on-going story, Timetoast helps provide your readers with context. Add summaries, photos and links in the simple editor to create an interactive timeline in minutes. After you publish your timeline, Timetoast provides an embed code to add it to your blog or story, and you can continue to update it as the story develops.


Woher die Hinweise auf oben erwähnten Tools kommen? U.a. hier.


Wordle is a toy for generating “word clouds” from text that you provide. The clouds give greater prominence to words that appear more frequently in the source text. You can tweak your clouds with different fonts, layouts, and color schemes. The images you create with Wordle are yours to use however you like. You can print them out, or save them to the Wordle gallery to share with your friends.


Timetric aggregates statistics from the the world's leading sources of economic data.


Die Site erlaubt es, eigene thematische geographische Karten zu erstellen.


Originaldokumente aufbereiten, durchsuchen, annotieren und publizieren bei documentcloud.

SMILE Widgets

kleine Tools, um Daten(reihen) zu visualisieren. Laufen in eigenem Webspace, wie hier zum Beispiel die Timeline Werkzeuge...


france culture

Place de la Toile

14.11.2010: Que penser du "journalisme de données" ? On en parle sur France Culture…

Zeit Online Talk


Daten Journalismus bezeichnet eine neue Form der Recherche und Darstellung. Verändert sich dadurch der Journalismus?

Unter dem Motto „Free our Data“ - „Befreit unsere Daten“ - startete der Guardian eine Kampagne, öffentliche Datensätze frei zugänglich zu machen. Mit Erfolg: Seit Ende Januar 2010 gibt es das Datenportal der britischen Regierung, auf dem frei zugängliche Datenbanken gebündelt werden.

Die Transparenz, die jedem britischen Bürger offen steht, bietet auch Journalisten neue Möglichkeiten der Recherche. Data Driven Journalism (DDJ) geht aber darüber hinaus, der Recherche-Ansatz wird mit einer Veröffentlichungsform kombiniert. Ein oder mehrere Datensätze werden mit Hilfe einer Software miteinander verknüpft und analysiert, wodurch ein schlüssiger und aber vorher nicht ersichtlicher informativer Mehrwert gewonnen werden kann.

Diese neu gewonnen Informationen werden dann über interaktiven Plattformen Nutzern angeboten, die ihrerseits die Informationen durch Kommentare oder in Form von Crowdsourcing anreichern.

Im Zeit Online Talk sprechen der Journalist Matthias Spielkamp, der Managing Director von Uberblic Labs Georgi Kobilarov, und der ZEIT-Entwicklungsredakteur Sascha Venohr darüber, was sich genau hinter dem Begriff Daten Journalismus verbirgt, welche Ergebnisse DDJ bis jetzt hervorgebracht hat und ob durch DDJ ein völlig neues Berufsbild geschaffen wird.

Moderation: Markus Heidmeier (@netztreport)

La Gazette

(Magazin der öffentlichen Verwaltungen in Frankreich)


(Artikel) Peu de collectivités se sont à ce jour lancées dans l’open data. Pourtant, la réutilisation des données publiques, qui est un droit depuis 2005, est riche de potentiels pour l’enrichissement des services rendus aux usagers. Mais elle peut bousculer certaines pratiques des administrations. La réutilisation des données culturelles soulève ses propres questions.

Hans Rosling

on Open Data

Speech given at World Bank. Gleich zu Beginn gratuliert er der Weltbank dazu, dass sie die Krankheit „DbHd“ überwunden habe: „Database hugging desease“ :-)


5 Vorhersagen für 2011 zum Thema „online data“.

O'Reilly Radar

The growing importance of data journalism - Parsing the progress of open government data requires new tools and reliable information sources.





siehe hier drüben


approximatives Protokoll des informellen Treffens bei

eurostat hackday

What is Eurostat?

Eurostat is the largest source of statistical information about European member states. It contains detailed comparative information on everything from tonnes of fish caught per year to the length of our railway lines, from how much energy we consume to how happy we are.

What is the Eurostat Hackday?

On the 16th December 2010 a bunch of independent coders, designers and other interested parties in a number of different European cities will gather to brainstorm and build useful and interesting things using the Eurostat data.

How The Guardian Dealt With Wikileaks

11.3.2011 c/o NZZ

Die britische Tageszeitung The Guardian hat eine zentrale Rolle gespielt, als Wikileaks letzten Jahr mit drei grossen Veröffentlichungen (Afghanistan War Logs, Iraq War Logs und Cablegate) zum Gesprächsthema auf der ganzen Welt wurde. Der Guardian war nicht nur neben der New York Times und dem Spiegel das einzige Medium, dass exklusiven Vorabzugriff auf alle Informationen erhielt, es war schliesslich jenes Medium, das die von Wikileaks veröffentlichten Daten am konsequentesten und umfassendsten ausgewertet und journalistisch aufbereitet hat.

Der Weg dorthin war eine gigantische Herausforderung. Über 92.000 Berichte von militärischen Vorfällen in Afghanistan, 391.000 aus dem Irak und schliesslich über 250.000 Diplomatenkabel aus aller Welt hatten die Journalisten des Guardian zu bewältigen, mit der Aufgabe und Anspruch, die relevantesten Geschichten zu identifizieren und für die Leserschaft aufzubereiten. Medienschaffende, und nicht nur sie, können viel daraus lernen, wie der Guardian vorgegangen ist.

Der Journalist David Bauer und NZZ Online laden deshalb gemeinsam zu einer Abendveranstaltung ein mit Simon Rogers, dem Leiter des Data Ressorts beim Guardian. Am Freitag, 11. März gibt Rogers in einem Referat in Zürich Einblicke, wie er und sein Team die Herausforderung und Chance Wikileaks angegangen sind und zeigt, was sie mit den Abertausenden von Daten angestellt haben.

Workshop Data Journalism mit Simon Rogers (The Guardian)

12.3.2011 c/o NZZ

Spätestens mit den grossen Veröffentlichungen von Wikileaks im letzten Jahr ist deutlich geworden: Journalismus kommt heute nicht mehr ohne die Fähigkeit aus, riesige Datenberge sinnvoll zu verarbeiten. Data Journalism lautet der Begiff, der dieses nicht neue, aber stark an Bedeutung gewinnende Betätigungsfeld innerhalb des Journalismus beschreibt.

Alan Rusbridger, Chefredaktor des Guardian bringt die Entwicklung auf den Punkt: “The web has given us easy access to billions of statistics on every matter. And with it are tools to visualise that information, mashing it up with different datasets to tell stories that could never have been told before.”

Eine der zentralen Kompetenzen des Journalisten von heute besteht darin, grosse Datenberge so zu bearbeiten, dass damit journalistische Geschichten erzählt werden können.

Während in der Schweiz Data Journalism noch wenig entwickelt ist, nimmt der Guardian in diesem Bereich weltweit eine Vorreiterrolle ein und hat unlängst ein eigenes Ressort eingerichtet, das sich der Sammlung, Aufbereitung und Visualisierung von journalistisch relevanten Daten widmet.

Weil auch der Schweiz mehr Data Journalism gut tun würde und weil man am besten von den Besten lernt, bringen ich und «NZZ Online» den Leiter des Data-Ressorts beim Guardian, Simon Rogers, für einen eintägigen Workshop in die Schweiz. Der Kurs ist offen für alle, die in die faszinierende Welt des Data Journalism eintauchen und das Handwerk von einem der weltweit führenden Data Journalists lernen wollen.


mit dem tag datajournalism von allen usern, die von Patrik Tschudin


Parteispenden in Deutschland über 50.000 € Zeitraum: Juli 2002 bis August 2010

Tweets zum Castor Transport


Guardian Data Blog

Das Original

Interview mit Simon Rogers vom Data Blog open data blog


tag: datajournalism


Datenjournalismus konkret bei owni


Stadtentwicklung in Basel

to be continued

datenjournalismus.txt · Zuletzt geändert: 2014/09/23 18:46 (Externe Bearbeitung)