Commons:Coding da Vinci 2017/Prepare Your Data-Workshops for GLAM

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

Projektinformationen[edit]

Schon auf Commons: Bilder der Studentenrevolte 1967/68, für Coding da Vinci freigegeben vom Haus der Geschichte der Bundesrepublik Deutschland

Wenn die Daten in Kultur- und Gedächtnisinstitutionen (= GLAM, das englische Akronym für Kunstsammlungen, Bibliotheken, Archive und Museen) digitalisiert wurden, stellt sich in vielen GLAM die Frage: Was kommt jetzt? Wie kann die Sichtbarkeit des digitalisierten Kulturgutes im Netz verstärkt werden? Wie kann das digitalisierte Kulturgut Besuchern und Interessierten leichter zugänglich gemacht werden? Welche Voraussetzungen unterstützen die Verbreitung des kulturellen Erbes im Netz? Und schließlich wie kann das digitalisierte Kulturgut tatsächlich nachnutzbar gemacht werden, damit es zum Beispiel bei Wettbewerben wie dem Kultur-Hackathon Coding da Vinci in neuen spannenden Anwendungen und Webseiten eingesetzt werden kann? Antworten auf diese Fragen und mehr bietet die zweiteilige Workshopreihe “Prepare Your Data”.

Hinweis: Beide Workshops können auch unabhängig voneinander gebucht werden.  Eine Anmeldung ist erforderlich (siehe unten). Teilnahmegebühren werden nicht erhoben. Eine Basisverpflegung ist im Angebot enthalten.


Hintergrund[edit]

Was passiert, wenn Kulturinstitutionen mit Software-Entwicklern zusammen kommen und ihre Daten bzw. Fähigkeiten in einen Topf werfen? Der Programmierwettbewerb und Kultur-Hackathon Coding da Vinci zeigt, dass mit frei nutzbaren Kulturdaten eine ganze Reihe von kreativen, neuen Anwendungen, mobilen Apps, Spielen und Visualisierungen umgesetzt werden können - das Event bringt Kulturinstitutionen mit der Entwickler-, Designer- und Gamercommunity in Berlin zusammen, um Kulturdaten im Internet auf kreative Weise nutzbar zu machen.

Coding da Vinci ist ein Hackathon der Freie Inhalte aus Museen, Bibliotheken und Archiven (GLAM) für die Kreation neuer Anwendungen anbietet. Er wird von Wikimedia Deutschland, Deutsche Digitale Bibliothek, Open Knowledge Foundation Deutschland und digiS ausgerichtet. Das Projekt "Coding da Vinci" begann in Berlin 2014 und hat bisher dreimal stattgefunden. Ziel des Hackathon ist es, sowohl Programmiererenden den Reiz von open culture data zu vermitteln, als auch GLAM Institutionen zu zeigen, was aus digitalisierten Inhalten entwickelt werden kann, wenn diese unter einer Freien Lizenz stehen. Mit Coding da Vinci 2015 wurden so über 600.000 Mediendateien unter einer Freien Lizenz nachnutzbar gemacht. Die Programmierenden haben bei dem speziellen Hackathon Coding da Vinci sechs Wochen Zeit, um mit den Daten neue Apps, Webseiten und andere Anwendungen zu entwickeln. Die Ergebnisse des Hackathons können hier eingesehen werden

Nach drei erfolgreichen Jahren Coding da Vinci haben wir gelernt, dass unsere beiden Hauptzielgruppen (Kulturinstitutionen und Entwickler) auf ihrem Gebiet zwar Spezialisten sind, aber ihnen oft spezifische Medienkompetenzen fehlen, um vorhandene Potenziale von existierenden Plattformen und Tools zu nutzen, um ihre Inhalte und Produkte optimal zu präsentieren. Die Potentiale des Internets ermöglichen heutzutage eine breite aktive Nutzung von Kulturdaten, aber sowohl Kulturinstitutionen als auch Entwicklern fehlen oft Fähigkeiten, um diese Potenziale voll ausschöpfen zu können.

Durchaus typisch ist eine bekannte Berliner Kulturinstitution, die zwar tausende ihrer Bilder digitalisiert hat, der aber die speziellen Fähigkeiten fehlen, ihre Daten mit entsprechenden Standards oder Normvokabularen so zu beschreiben, dass diese Daten über ihren eigenen “Usecase” hinaus kontextualisierbar d.h. "anschlussfähig" werden, um so mit anderen Projekten oder Daten verknüpft zu werden. Oder wie eine Institution ihre Bilder über das freie Medienarchiv Wikimedia Commons verfügbar und auffindbar machen kann. Ein anderes Beispiel ist eine Gruppe von Entwicklern, die im Rahmen von Coding da Vinci zwar eine App mit Vogelstimmen unter offener Lizenz programmiert hat, aber der das spezielle Know-how fehlt, um diese Vogelstimmendateien in die Mediendatenbank Wikimedia Commons hochzuladen, um sie derart mit weiteren Daten verknüpfen zu können, um die Anwendung noch attraktiver zu machen.

Workshop Eins : 13. & 14. Juli - Prepare Your Data: Ready for Download[edit]

  • Zielgruppe: EDV-Technisch versierte Mitarbeiter in Kultureinrichtungen
  • Inhalt: Der Workshop “Prepare Your Data - Ready for Download” vermittelt den Teilnehmern zentrale Medienkompetenzen, um die Kulturdaten ihrer Einrichtung auf den eigenen Servern zur möglichen einfachen Nachnutzung anbieten zu können.
  • Fragestellungen des Workshops:
Welche Herausforderungen bei der Bereitstellung von digitalen Kulturdaten gibt es?
Welche Lizenzen eignen sich?
Unter welchen technischen Voraussetzungen können die Daten über die eigene Website ausgespielt werden?
Welches sind die technischen Voraussetzungen, um Daten auf Plattformen wie Wikimedia Commons oder der Deutschen Digitalen Bibliothek hochzuladen?
  • Referenten: Dr. Ellen Euler (DDB) (angefragt); Christoph Jackel (Wikipedianer) Barbara Fischer (WMDE) und Anna-Lena Nowicki (digiS)
Hinweis: An beiden Workshop-Tagen wird zu Dokumentationszwecken gefilmt. Bilder aus der Veranstaltung und ggf. Kurzinterviews mit den Teilnehmern werden im Anschluss unter der freien Lizenz CC BY SA veröffentlicht. Der Wunsch von Menschen, die nicht gefilmt oder fotografiert werden möchten, wird selbst verständlich respektiert. Sie erhalten ein rotes Band zu dem Namensschild, um Ihrem Wunsch Ausdruck zu verleihen.

Programm

Tag 1 (13. Juli, 10:00 - 16:00): Freie Lizenzen

Zeit
10:00 - 10:30 Begrüßung, Vorstellungsrunde & Einführung in den Workshop Eins “Prepare Your Data - Ready for Download”
10:30 - 11:30 Einführender Vortrag zum Thema “©© Change Your Mind - Freie Lizenzen machen Nachnutzung einfach” von Dr. Ellen Euler (DDB) und Barbara Fischer (Wikimedia Deutschland)
11:30 - 11:45 Fragen
11:45 - 12:00 Start Aktivphase - Material & Regeln
12:00 - 13:00 Lizenzen vergeben - ein Rollenspiel
13:00 - 14:00 Mittagspause
14:00 - 14:45 Präsentation der Ergebnisse & Diskussion
14:45 - 15:30 Daten in der Deutschen Digitalen Bibliothek, Einführung durch Cosmina Berta (DDB) & offene Fragen klären
15:30 - 16:00 Fragen zum eigenen Datenset klären


Tag 2 (14. Juli, 10:00 - 15:00): Aufbereitung der Daten

Zeit
10:00 - 11:30 Grundlegendes (Formate, Datenkonsistenz, normierte Schreibweisen, Anreicherung mit Normdaten-URIs und kontrolliertem Vokabular) - angelehnt an das CdV-Infoblatt, Abschnitt Formatwahl
11:30 - 12:00 Einführung in OpenRefine
12:00 - 13:00 Mittagspause
13:00 - 15.00 praktische Beispiele mit OpenRefine (CSV) & Arbeiten an eigenen CSV-Datensätzen mit OpenRefine

Material: https://www.dropbox.com/s/ihndcfjce6ylfvt/PrepareYourData_Material.zip?dl=0

Hinweis: Bitte bringen Sie für die Teilnahme an Tag 2 einen eigenen internetfähigen Laptop mit. Die folgenden Programme sollten darauf bereits installiert sein: Web-Browser, z.B. Mozilla Firefox: <https://www.mozilla.org/de/firefox/new/> und OpenRefine: <http://openrefine.org/download.html> (Version: OpenRefine 2.6-rc2 Release Candidate 2 oder OpenRefine 2.7) <https://github.com/OpenRefine/OpenRefine/wiki/Installation-Instructions> ... und natürlich Ihre CSV-Daten, mit denen Sie im Abschlussteil arbeiten möchten.

Workshop Zwei : 15. & 16. September - Prepare Your Data: Ready for upload[edit]

  • Zielgruppe: Technisch versierte Mitarbeiter/innen in Kultureinrichtungen, Wikimedians aus dem Wikimedia Commons Umfeld & Softwareentwickler/innen aus der “Free and Open Software”-Szene
  • Inhalt: Der Workshop Zwei “Prepare the Data - Ready for upload” baut auf dem Workshop Eins “Prepare the Data - Ready for download” auf. Dazu laden Tandems aus beiden Zielgruppen Datensets aus den teilnehmenden Kulturinstitutionen mit den dazu gehörenden Metadaten auf Wikimedia Commons hoch. Dadurch werden weitere Kulturdaten einer breiteren Öffentlichkeit erschlossen.
  • Fragestellungen des Workshops:
Wie bereite ich meine Daten vor? (Hilfeseiten)
Wie lade ich meine Daten auf Wikimedia Commons hoch? (Zur Anwendung kommendes Tool: Pattypan )
For more information on the Pattypan workflow, see the various slideshows in c:Category:Pattypan
Welche Template kommt für mein Datenset in Frage?
Wie kategorisiere ich meine Daten auf Wikimedia Commons?
  • Referenten: Barbara Fischer (WMDE) und Arne Wossink (Wikimedia NL)

Vorbereitung[edit]

Um möglichst effektiv den Workshop gestalten zu können, sollten die Metadaten im Excel/ CSV Format (d.h. die vollständige Kopfzeile mit allen Spaltentiteln und dann in Zeilen zu den einzelnen Mediafiles) vorliegen. Idealerweise enthält die Tabelle eine Spalte mit dem Filenamen/Identifier, über die die einzelnen Mediendateien zuordenbar sind. XML Dateien müssen zuvor umgewandelt sein.

Wenn Ihr eigene Laptops mitbringen könnt, dann ladet schon im Vorfeld Pattypan (link: https://github.com/yarl/pattypan/releases) und openRefine (Link: https://github.com/OpenRefine/OpenRefine) auf den Rechner, damit im Workshop selbst die Programme schon nutzbar sind.

Bei dem Programm PattyPan, dass wir zum Upload einsetzen, müssen die Daten auf einer lokalen Festplatte vorliegen. Daher wäre es ideal, wenn Ihr die Mediafiles und Metadaten auf einer Festplatte mitbringen könnt.

Bitte meldet Euch, falls dies noch nicht der Fall sein sollte, als Benutzer auf Wikimedia Commons an. Wenn Ihr bereits ein Wikipedia Account habt, dann gilt dies auch für Wikimedia Commons.(Sich als Wikipedia Benutzer anmelden Tutorial)


  • Templates -Empfehlungen aus der Wikimedia Community
Institution template
Creator template
Template artwork Beispiel
Template:Photograph for archival images
Template:Artwork for other types of museum objects. Using Artwork even for non-art since it has full support for Accession number and in general makes it easy to connect the image back to the GLAM database.
Depending on the collection I also add two custom fields to the Artwork template.
Depicted person for a list of the people being depicted in the image (useful for e.g. paintings)
Information field for the original caption of the image
This is useful if you want to ensure that it is kept unchanged but know that the contents will most likely need to be changed to fit on Commons (e.g. texts which are today politically incorrect. This is already built into the Photograph template.
An Institution template for the GLAM. e.g. Institution:Nationalmuseum_Stockholm
Creator templates for the most commonly featured creators. e.g. Creator:Giuseppe_Arcimboldo
A collaboration template for the Chapter-GLAM collaboration. e.g.Nationalmuseum_Stockholm_cooperation_project
A linking template for the accession number. (because sooner or later the GLAM will change all of their urls.) e.g. Nationalmuseum_Stockholm_link


Zum Thema Kategorisierung auf Wikimedia Commons siehe Hilfeseiten hier. Eine ergänzende Praxis ist es, ähnliche Objekte wie die eigenen in Commons zu suchen und sich an den dort vergebenen Kategorien zu orientieren.


   Hinweis 1: An beiden Workshop-Tagen wird zu Dokumentationszwecken gefilmt. Bilder aus der Veranstaltung und ggf. Kurzinterviews mit den Teilnehmern werden im Anschluss unter der freien Lizenz CC BY SA veröffentlicht. Der Wunsch von Menschen, die nicht gefilmt oder fotografiert werden möchten, wird selbst verständlich respektiert. Sie erhalten ein rotes Band zu dem Namensschild, um Ihrem Wunsch Ausdruck zu verleihen.


Hinweis 2: Der Workshop findet auf Deutsch und Englisch statt. Sprache sollte aber nicht das Problem sein.

Programm

Tag 1 (15. September, 10:00 - 16:00): Matching & Templates in Wikimedia Commons (Details siehe oben)

Zeit
10:00 - 13:00 Auswahl der geeigneter Wikimedia Commons Templates und Kategorien
13:00 - 14:00 Mittagspause
14:00 - 16:00 Matching mit Open Refine & Start des uploads von der Festplatte aus


Tag 2 (16. September, 10:00 - 16:00): Fortsetzung des Uploads und Optimierung

Zeit
10:00 - 12:00 Upload und Qualitätscheck auf Wikimedia Commons und ggf. Verknüpfung zu anderen Wikimedia Projekten anbahnen (Details werden noch ausgearbeitet)
12:00 - 13:00 Mittagspause
13:00 - 16:00 Fortsetzung

Anfahrt[edit]

Workshop Eins und Zwei finden jeweils im Raum Mosaik bei Wikimedia Deutschland statt.

Adresse: Tempelhofer Ufer 23 - 24 in Berlin Kreuzberg

ÖPNV: UBahn Linie 1 und 7 Ubhf Möckernbrücke

Koordinaten: 52° 29′ 54″ N, 13° 22′ 52″ O


Anmeldung / Teilnehmende[edit]

Verbindlich anmelden mit einer Email an: kultur@wikimedia.de

Bitte hier eintragen für den Workshop Eins:

# Name (ggf. WP:Benutzername) Kategorie (Institution; Entwickler; Wikimedian) Workshop Eins: Prepare Your Data Ready for Download
1 Cornelia Siebert Berlinsche Galerie x
2 Clemens Neudecker Staatsbibliothek Berlin x
3 Lisa Pegelow Forschungsdatenzentrum am Institut zur Qualitätsentwicklung im Bildungswesen (FDZ am IQB) x
4 Thomas Hartmann Stiftung Europa-Universität Viadrina, Frankfurt (Oder), Projekt FDMentor X
5 Bettina Gries Stiftung Deutsches Technikmuseum X
6 Marcel Ruhl Stiftung Deutsches Technikmuseum X
7 Georg Schelbert Humboldt-Universität zu Berlin, Mediathek X (nur letzte Sektion Tag 1)
8 Sophie Perl FHXB Museum x
9 Jana Braun FHXB Museum x (nur 2. Tag)
10 Timur H Kiselev Humboldt-Universität zu Berlin, Mediathek x (nur 2. Tag)
11 Lars Müller Bibliothek für Bildungsgeschichtliche Forschung, Informationsmanagement x
12 Evelyn Pätzold Universität Greifswald X
13 Benjamin Fiechter Berlin-Brandenburgische Akademie der Wissenschaften X
14 Albrecht Sensch Konzerthaus Berlin X (erster Tag)
15 A. Thoma Konzerthaus Berlin X (erster Tag)
16 Gunnar Nath Landesdenkmalamt Berlin X
17 Juliane Stamm Landesdenkmalamt Berlin X (erster Tag)
18 Emanuela Gruber Kupferstichkabinett Berlin X (1.Tag und 2. Tag bis 12)
19 Anja Witte Berlinsche Galerie X
20 Esther Cleven Bauhaus-Archiv / Museum für Gestaltung X (1.Tag und 2. Tag bis 14)
21 Manfred Wichmann Stiftung Berliner Mauermuseum X (nur 2. Tag)

Bitte hier eintragen für den Workshop Zwei: Prepare Your Data Ready for Upload 15. & 16. September

# Name (ggf. WP:Benutzername) Kategorie (Institution; Entwickler; Wikimedian) Workshop Zwei

bitte eintragen :1 Tag / 2 Tage

1 Gunnar Nath Landesdenkmalamt Berlin
2 Martin Rulsch Wikimedia Commons verm. nicht
3 Lisa Pegelow Forschungsdatenzentrum am Institut zur Qualitätsentwicklung im Bildungswesen (FDZ am IQB) leider verhindert
4 Bettina Gries Deutsches Technikmuseum x
5 Marcel Ruhl Deutsches Technikmuseum x
6 Arne Wossink Wikimedia NL
7 Barbara Fischer WMDE
8 Anja Müller digis vielleicht
9 Claudia Musekamp infoport mit ca 5 Pers
10 Hanna Burckhardt WMDE
11 Marcus Cyron Wikimedia Commons wie benötigt
12 Anette Thoma Konzerthaus Berlin Tag 1
13 Albrecht Sensch Konzerthaus Berlin Tag 1 & 2

Ergebnisse[edit]

Dateien, die im Rahmen von Coding da Vinci unter freier Lizenz gestellt und über diesen Workshop auf Wikimedia Commons allgemein nachnutzbar gemacht wurden, werden hier aufgeführt:

Siehe auch Aufruf zur Nachnutzung im Kurier.


Erfahrungsberichte von teilnehmenden Kultureinrichtungen:

Der Film zum Workshop:

Coding da Vinci – Prepare Your Data 2017