Commons:Coding da Vinci 2017/Prepare Your Data-Workshops for GLAM

Projektinformationen[edit]

Wenn die Daten in Kultur- und Gedächtnisinstitutionen (= GLAM, das englische Akronym für Kunstsammlungen, Bibliotheken, Archive und Museen) digitalisiert wurden, stellt sich in vielen GLAM die Frage: Was kommt jetzt? Wie kann die Sichtbarkeit des digitalisierten Kulturgutes im Netz verstärkt werden? Wie kann das digitalisierte Kulturgut Besuchern und Interessierten leichter zugänglich gemacht werden? Welche Voraussetzungen unterstützen die Verbreitung des kulturellen Erbes im Netz? Und schließlich wie kann das digitalisierte Kulturgut tatsächlich nachnutzbar gemacht werden, damit es zum Beispiel bei Wettbewerben wie dem Kultur-Hackathon Coding da Vinci in neuen spannenden Anwendungen und Webseiten eingesetzt werden kann? Antworten auf diese Fragen und mehr bietet die zweiteilige Workshopreihe “Prepare Your Data”.

Hinweis: Beide Workshops können auch unabhängig voneinander gebucht werden.  Eine Anmeldung ist erforderlich (siehe unten). Teilnahmegebühren werden nicht erhoben. Eine Basisverpflegung ist im Angebot enthalten.

Termin: Workshop Eins 13./14. Juli 2017 und Workshop Zwei 15./16. September 2017
Veranstaltungsort: Wikimedia Deutschland, Tempelhofer Ufer 23-24, 10963 Berlin; Raum: Mosaik
Ansprechpartnerin WMDE: Barbara Fischer (WMDE)
Förderpartner: Medienanstalt Berlin Brandenburg
Umsetzung und Dokumentation: Infoport

Hintergrund[edit]

Was passiert, wenn Kulturinstitutionen mit Software-Entwicklern zusammen kommen und ihre Daten bzw. Fähigkeiten in einen Topf werfen? Der Programmierwettbewerb und Kultur-Hackathon Coding da Vinci zeigt, dass mit frei nutzbaren Kulturdaten eine ganze Reihe von kreativen, neuen Anwendungen, mobilen Apps, Spielen und Visualisierungen umgesetzt werden können - das Event bringt Kulturinstitutionen mit der Entwickler-, Designer- und Gamercommunity in Berlin zusammen, um Kulturdaten im Internet auf kreative Weise nutzbar zu machen.

Coding da Vinci ist ein Hackathon der Freie Inhalte aus Museen, Bibliotheken und Archiven (GLAM) für die Kreation neuer Anwendungen anbietet. Er wird von Wikimedia Deutschland, Deutsche Digitale Bibliothek, Open Knowledge Foundation Deutschland und digiS ausgerichtet. Das Projekt "Coding da Vinci" begann in Berlin 2014 und hat bisher dreimal stattgefunden. Ziel des Hackathon ist es, sowohl Programmiererenden den Reiz von open culture data zu vermitteln, als auch GLAM Institutionen zu zeigen, was aus digitalisierten Inhalten entwickelt werden kann, wenn diese unter einer Freien Lizenz stehen. Mit Coding da Vinci 2015 wurden so über 600.000 Mediendateien unter einer Freien Lizenz nachnutzbar gemacht. Die Programmierenden haben bei dem speziellen Hackathon Coding da Vinci sechs Wochen Zeit, um mit den Daten neue Apps, Webseiten und andere Anwendungen zu entwickeln. Die Ergebnisse des Hackathons können hier eingesehen werden

Nach drei erfolgreichen Jahren Coding da Vinci haben wir gelernt, dass unsere beiden Hauptzielgruppen (Kulturinstitutionen und Entwickler) auf ihrem Gebiet zwar Spezialisten sind, aber ihnen oft spezifische Medienkompetenzen fehlen, um vorhandene Potenziale von existierenden Plattformen und Tools zu nutzen, um ihre Inhalte und Produkte optimal zu präsentieren. Die Potentiale des Internets ermöglichen heutzutage eine breite aktive Nutzung von Kulturdaten, aber sowohl Kulturinstitutionen als auch Entwicklern fehlen oft Fähigkeiten, um diese Potenziale voll ausschöpfen zu können.

Durchaus typisch ist eine bekannte Berliner Kulturinstitution, die zwar tausende ihrer Bilder digitalisiert hat, der aber die speziellen Fähigkeiten fehlen, ihre Daten mit entsprechenden Standards oder Normvokabularen so zu beschreiben, dass diese Daten über ihren eigenen “Usecase” hinaus kontextualisierbar d.h. "anschlussfähig" werden, um so mit anderen Projekten oder Daten verknüpft zu werden. Oder wie eine Institution ihre Bilder über das freie Medienarchiv Wikimedia Commons verfügbar und auffindbar machen kann. Ein anderes Beispiel ist eine Gruppe von Entwicklern, die im Rahmen von Coding da Vinci zwar eine App mit Vogelstimmen unter offener Lizenz programmiert hat, aber der das spezielle Know-how fehlt, um diese Vogelstimmendateien in die Mediendatenbank Wikimedia Commons hochzuladen, um sie derart mit weiteren Daten verknüpfen zu können, um die Anwendung noch attraktiver zu machen.

Workshop Eins : 13. & 14. Juli - Prepare Your Data: Ready for Download[edit]

Zielgruppe: EDV-Technisch versierte Mitarbeiter in Kultureinrichtungen
Inhalt: Der Workshop “Prepare Your Data - Ready for Download” vermittelt den Teilnehmern zentrale Medienkompetenzen, um die Kulturdaten ihrer Einrichtung auf den eigenen Servern zur möglichen einfachen Nachnutzung anbieten zu können.
Fragestellungen des Workshops:

Welche Herausforderungen bei der Bereitstellung von digitalen Kulturdaten gibt es?

Welche Lizenzen eignen sich?

Unter welchen technischen Voraussetzungen können die Daten über die eigene Website ausgespielt werden?

Welches sind die technischen Voraussetzungen, um Daten auf Plattformen wie Wikimedia Commons oder der Deutschen Digitalen Bibliothek hochzuladen?

Referenten: Dr. Ellen Euler (DDB) (angefragt); Christoph Jackel (Wikipedianer) Barbara Fischer (WMDE) und Anna-Lena Nowicki (digiS)

Hinweis: An beiden Workshop-Tagen wird zu Dokumentationszwecken gefilmt. Bilder aus der Veranstaltung und ggf. Kurzinterviews mit den Teilnehmern werden im Anschluss unter der freien Lizenz CC BY SA veröffentlicht. Der Wunsch von Menschen, die nicht gefilmt oder fotografiert werden möchten, wird selbst verständlich respektiert. Sie erhalten ein rotes Band zu dem Namensschild, um Ihrem Wunsch Ausdruck zu verleihen.

Programm

Tag 1 (13. Juli, 10:00 - 16:00): Freie Lizenzen

Zeit
10:00 - 10:30	Begrüßung, Vorstellungsrunde & Einführung in den Workshop Eins “Prepare Your Data - Ready for Download”
10:30 - 11:30	Einführender Vortrag zum Thema “©© Change Your Mind - Freie Lizenzen machen Nachnutzung einfach” von Dr. Ellen Euler (DDB) und Barbara Fischer (Wikimedia Deutschland)
11:30 - 11:45	Fragen
11:45 - 12:00	Start Aktivphase - Material & Regeln
12:00 - 13:00	Lizenzen vergeben - ein Rollenspiel
13:00 - 14:00	Mittagspause
14:00 - 14:45	Präsentation der Ergebnisse & Diskussion
14:45 - 15:30	Daten in der Deutschen Digitalen Bibliothek, Einführung durch Cosmina Berta (DDB) & offene Fragen klären
15:30 - 16:00	Fragen zum eigenen Datenset klären

Tag 2 (14. Juli, 10:00 - 15:00): Aufbereitung der Daten

Zeit
10:00 - 11:30	Grundlegendes (Formate, Datenkonsistenz, normierte Schreibweisen, Anreicherung mit Normdaten-URIs und kontrolliertem Vokabular) - angelehnt an das CdV-Infoblatt, Abschnitt Formatwahl
11:30 - 12:00	Einführung in OpenRefine
12:00 - 13:00	Mittagspause
13:00 - 15.00	praktische Beispiele mit OpenRefine (CSV) & Arbeiten an eigenen CSV-Datensätzen mit OpenRefine

Material: https://www.dropbox.com/s/ihndcfjce6ylfvt/PrepareYourData_Material.zip?dl=0

Hinweis: Bitte bringen Sie für die Teilnahme an Tag 2 einen eigenen internetfähigen Laptop mit. Die folgenden Programme sollten darauf bereits installiert sein: Web-Browser, z.B. Mozilla Firefox: <https://www.mozilla.org/de/firefox/new/> und OpenRefine: <http://openrefine.org/download.html> (Version: OpenRefine 2.6-rc2 Release Candidate 2 oder OpenRefine 2.7) <https://github.com/OpenRefine/OpenRefine/wiki/Installation-Instructions> ... und natürlich Ihre CSV-Daten, mit denen Sie im Abschlussteil arbeiten möchten.

Workshop Zwei : 15. & 16. September - Prepare Your Data: Ready for upload[edit]

Zielgruppe: Technisch versierte Mitarbeiter/innen in Kultureinrichtungen, Wikimedians aus dem Wikimedia Commons Umfeld & Softwareentwickler/innen aus der “Free and Open Software”-Szene
Inhalt: Der Workshop Zwei “Prepare the Data - Ready for upload” baut auf dem Workshop Eins “Prepare the Data - Ready for download” auf. Dazu laden Tandems aus beiden Zielgruppen Datensets aus den teilnehmenden Kulturinstitutionen mit den dazu gehörenden Metadaten auf Wikimedia Commons hoch. Dadurch werden weitere Kulturdaten einer breiteren Öffentlichkeit erschlossen.
Fragestellungen des Workshops:

Wie bereite ich meine Daten vor? (Hilfeseiten)

Wie lade ich meine Daten auf Wikimedia Commons hoch? (Zur Anwendung kommendes Tool: Pattypan )

For more information on the Pattypan workflow, see the various slideshows in c:Category:Pattypan

Welche Template kommt für mein Datenset in Frage?

Wie kategorisiere ich meine Daten auf Wikimedia Commons?

Referenten: Barbara Fischer (WMDE) und Arne Wossink (Wikimedia NL)

Vorbereitung[edit]

Um möglichst effektiv den Workshop gestalten zu können, sollten die Metadaten im Excel/ CSV Format (d.h. die vollständige Kopfzeile mit allen Spaltentiteln und dann in Zeilen zu den einzelnen Mediafiles) vorliegen. Idealerweise enthält die Tabelle eine Spalte mit dem Filenamen/Identifier, über die die einzelnen Mediendateien zuordenbar sind. XML Dateien müssen zuvor umgewandelt sein.

Wenn Ihr eigene Laptops mitbringen könnt, dann ladet schon im Vorfeld Pattypan (link: https://github.com/yarl/pattypan/releases) und openRefine (Link: https://github.com/OpenRefine/OpenRefine) auf den Rechner, damit im Workshop selbst die Programme schon nutzbar sind.

Bei dem Programm PattyPan, dass wir zum Upload einsetzen, müssen die Daten auf einer lokalen Festplatte vorliegen. Daher wäre es ideal, wenn Ihr die Mediafiles und Metadaten auf einer Festplatte mitbringen könnt.

Bitte meldet Euch, falls dies noch nicht der Fall sein sollte, als Benutzer auf Wikimedia Commons an. Wenn Ihr bereits ein Wikipedia Account habt, dann gilt dies auch für Wikimedia Commons.(Sich als Wikipedia Benutzer anmelden Tutorial)

Templates -Empfehlungen aus der Wikimedia Community

Institution template

Creator template

Template artwork Beispiel

Empfehlungen von Wikimedia Sverige André Costa

Template:Photograph for archival images

Template:Artwork for other types of museum objects. Using Artwork even for non-art since it has full support for Accession number and in general makes it easy to connect the image back to the GLAM database.

Depending on the collection I also add two custom fields to the Artwork template.

Depicted person for a list of the people being depicted in the image (useful for e.g. paintings)

Information field for the original caption of the image

This is useful if you want to ensure that it is kept unchanged but know that the contents will most likely need to be changed to fit on Commons (e.g. texts which are today politically incorrect. This is already built into the Photograph template.

An Institution template for the GLAM. e.g. Institution:Nationalmuseum_Stockholm

Creator templates for the most commonly featured creators. e.g. Creator:Giuseppe_Arcimboldo

A collaboration template for the Chapter-GLAM collaboration. e.g.Nationalmuseum_Stockholm_cooperation_project

A linking template for the accession number. (because sooner or later the GLAM will change all of their urls.) e.g. Nationalmuseum_Stockholm_link

Zum Thema Kategorisierung auf Wikimedia Commons siehe Hilfeseiten hier. Eine ergänzende Praxis ist es, ähnliche Objekte wie die eigenen in Commons zu suchen und sich an den dort vergebenen Kategorien zu orientieren.

   Hinweis 1: An beiden Workshop-Tagen wird zu Dokumentationszwecken gefilmt. Bilder aus der Veranstaltung und ggf. Kurzinterviews mit den Teilnehmern werden im Anschluss unter der freien Lizenz CC BY SA veröffentlicht. Der Wunsch von Menschen, die nicht gefilmt oder fotografiert werden möchten, wird selbst verständlich respektiert. Sie erhalten ein rotes Band zu dem Namensschild, um Ihrem Wunsch Ausdruck zu verleihen.

Hinweis 2: Der Workshop findet auf Deutsch und Englisch statt. Sprache sollte aber nicht das Problem sein.

Programm

Tag 1 (15. September, 10:00 - 16:00): Matching & Templates in Wikimedia Commons (Details siehe oben)

Zeit
10:00 - 13:00	Auswahl der geeigneter Wikimedia Commons Templates und Kategorien
13:00 - 14:00	Mittagspause
14:00 - 16:00	Matching mit Open Refine & Start des uploads von der Festplatte aus

Tag 2 (16. September, 10:00 - 16:00): Fortsetzung des Uploads und Optimierung

Zeit
10:00 - 12:00	Upload und Qualitätscheck auf Wikimedia Commons und ggf. Verknüpfung zu anderen Wikimedia Projekten anbahnen (Details werden noch ausgearbeitet)
12:00 - 13:00	Mittagspause
13:00 - 16:00	Fortsetzung

Anfahrt[edit]

Workshop Eins und Zwei finden jeweils im Raum Mosaik bei Wikimedia Deutschland statt.

Adresse: Tempelhofer Ufer 23 - 24 in Berlin Kreuzberg

ÖPNV: UBahn Linie 1 und 7 Ubhf Möckernbrücke

Koordinaten: 52° 29′ 54″ N, 13° 22′ 52″ O

Anmeldung / Teilnehmende[edit]

Verbindlich anmelden mit einer Email an: kultur@wikimedia.de

Bitte hier eintragen für den Workshop Eins:

#	Name (ggf. WP:Benutzername)	Kategorie (Institution; Entwickler; Wikimedian)	Workshop Eins: Prepare Your Data Ready for Download
1	Cornelia Siebert	Berlinsche Galerie	x
2	Clemens Neudecker	Staatsbibliothek Berlin	x
3	Lisa Pegelow	Forschungsdatenzentrum am Institut zur Qualitätsentwicklung im Bildungswesen (FDZ am IQB)	x
4	Thomas Hartmann	Stiftung Europa-Universität Viadrina, Frankfurt (Oder), Projekt FDMentor	X
5	Bettina Gries	Stiftung Deutsches Technikmuseum	X
6	Marcel Ruhl	Stiftung Deutsches Technikmuseum	X
7	Georg Schelbert	Humboldt-Universität zu Berlin, Mediathek	X (nur letzte Sektion Tag 1)
8	Sophie Perl	FHXB Museum	x
9	Jana Braun	FHXB Museum	x (nur 2. Tag)
10	Timur H Kiselev	Humboldt-Universität zu Berlin, Mediathek	x (nur 2. Tag)
11	Lars Müller	Bibliothek für Bildungsgeschichtliche Forschung, Informationsmanagement	x
12	Evelyn Pätzold	Universität Greifswald	X
13	Benjamin Fiechter	Berlin-Brandenburgische Akademie der Wissenschaften	X
14	Albrecht Sensch	Konzerthaus Berlin	X (erster Tag)
15	A. Thoma	Konzerthaus Berlin	X (erster Tag)
16	Gunnar Nath	Landesdenkmalamt Berlin	X
17	Juliane Stamm	Landesdenkmalamt Berlin	X (erster Tag)
18	Emanuela Gruber	Kupferstichkabinett Berlin	X (1.Tag und 2. Tag bis 12)
19	Anja Witte	Berlinsche Galerie	X
20	Esther Cleven	Bauhaus-Archiv / Museum für Gestaltung	X (1.Tag und 2. Tag bis 14)
21	Manfred Wichmann	Stiftung Berliner Mauermuseum	X (nur 2. Tag)

Bitte hier eintragen für den Workshop Zwei: Prepare Your Data Ready for Upload 15. & 16. September

#	Name (ggf. WP:Benutzername)	Kategorie (Institution; Entwickler; Wikimedian)	Workshop Zwei bitte eintragen :1 Tag / 2 Tage
1	Gunnar Nath	Landesdenkmalamt Berlin
2	Martin Rulsch	Wikimedia Commons	verm. nicht
3	Lisa Pegelow	Forschungsdatenzentrum am Institut zur Qualitätsentwicklung im Bildungswesen (FDZ am IQB)	leider verhindert
4	Bettina Gries	Deutsches Technikmuseum	x
5	Marcel Ruhl	Deutsches Technikmuseum	x
6	Arne Wossink	Wikimedia NL
7	Barbara Fischer	WMDE
8	Anja Müller	digis	vielleicht
9	Claudia Musekamp	infoport	mit ca 5 Pers
10	Hanna Burckhardt	WMDE
11	Marcus Cyron	Wikimedia Commons	wie benötigt
12	Anette Thoma	Konzerthaus Berlin	Tag 1
13	Albrecht Sensch	Konzerthaus Berlin	Tag 1 & 2

Ergebnisse[edit]

Dateien, die im Rahmen von Coding da Vinci unter freier Lizenz gestellt und über diesen Workshop auf Wikimedia Commons allgemein nachnutzbar gemacht wurden, werden hier aufgeführt:

29 Amateuerstummfilme des deutschen Apotheker Julius Neubronner. Bereitgestellt vom Deutschen Filminstitut für Coding da Vinci 2015. Jetzt mit Hilfe von Pattypan tool mit Metadaten hochgeladen.
110 Fotos aus der Sammlung "Blumenmoden von 1700 bis 1900". Bereitgestellt vom Museumsdorf Cloppenburg für Coding da Vinci 2015. Jetzt mit Hilfe von Pattypan tool mit Metadaten hochgeladen.
ca. 2500 Tableaus einer Sammlung von Fahrscheinen aus aller Welt von den Anfängen der Eisenbahn bis in die 1920 Jahre. Bereitgestellt vom Deutschen Technikmuseum für Coding da Vinci 2017. Jetzt mit Hilfe von Pattypan tool mit Metadaten hochgeladen.
ca 300 Aufnahmen von Münzfunden im Alten Berliner Rathaus. Bereitgestellt vom Landesdenkmalamt Berlin für Coding da Vinci 2017. Jetzt mit Hilfe von Pattypan tool mit Metadaten hochgeladen.