German subtitles for clip: File:WikiCon 2023 - Wikifunctions – Ein neues Wikimedia Projekt.webm
Jump to navigation
Jump to search
1 00:00:00,000 --> 00:00:11,000 [Untertitel wurden automatisch mit Whisper Medium erzeugt.] Vielen Dank, dass ihr hier seid. Ich hoffe, ihr könnt mich immer noch hören und ihr seht jetzt auch den Schirm. 2 00:00:11,000 --> 00:00:21,000 Ich kann euch leider nicht hören, deswegen gehe ich einfach davon aus, dass alles funktioniert. 3 00:00:21,000 --> 00:00:35,000 Vielen Dank, Martin, dem Hexer dafür, dass er diesen Vortrag vorgeschlagen hat. Danke für das Programmkomitee, dass er den Vortrag angenommen hat. 4 00:00:35,000 --> 00:00:40,000 Und danke euch allen, dass ihr hier seid. Das finde ich großartig für das Interesse. 5 00:00:40,000 --> 00:00:48,000 Ich fange immer gerne meinen Vortrag an mit unserer Vision. Kennt ihr alle. Eine Welt, in der jeder an der Summe allen Wissens teilnehmen kann. 6 00:00:48,000 --> 00:00:56,000 Wir kennen diese Vision. Ich finde sie großartig und wichtig. Deswegen fange ich gerne damit an, einfach zur Erinnerung, warum wir hier sind, woran wir eigentlich arbeiten. 7 00:00:56,000 --> 00:01:02,000 Es ist immer gut, uns das zu vergegenwärtigen und wie weit wir damit sind oder auch nicht. 8 00:01:02,000 --> 00:01:09,000 Wie ihr wisst, wir haben mehr als 300 Sprachen, 60 Millionen Artikel. Das klingt großartig, aber es ist alles sehr ungleich verteilt. 9 00:01:09,000 --> 00:01:15,000 Wir haben große Sprachen und große Wikipedien wie Englisch und Deutsch mit Millionen von Artikeln. 10 00:01:15,000 --> 00:01:19,000 Wir haben kleinere Sprachen wie Amharisch mit nicht so vielen Artikeln. 11 00:01:19,000 --> 00:01:23,000 Und kleinere Sprachen, das heißt wirklich nur auf die größte Wikipedia bezogen. 12 00:01:23,000 --> 00:01:28,000 Ich meine, draußen in der Welt gibt es über 20 Millionen Sprecher. Das ist eine ganze Menge. 13 00:01:28,000 --> 00:01:36,000 Aber es ist ja nicht nur die Zahl der Artikel, die uns helfen. Wir müssen uns anschauen, was denn eigentlich in den Artikeln drin steht. 14 00:01:36,000 --> 00:01:43,000 Das ist der Artikel zu Jupiter in der deutschen Wikipedia. Wesenswert, ausgezeichnet und es sind sieben lange Kapitel drin. 15 00:01:43,000 --> 00:01:49,000 Jedes Kapitel davon länger als die drei kurzen Absätze im Amharischen, teilweise deutlich länger. 16 00:01:49,000 --> 00:01:54,000 Da ist viel mehr Inhalt drin in der deutschen Wikipedia als in der Amharischen Wikipedia. 17 00:01:54,000 --> 00:02:03,000 Und es ist auch nicht so, dass nur die kleinen Wikipedia, die großen Wikipedia hinterher und haben alles so ein Subsept für der Inhalte oder so etwas. 18 00:02:03,000 --> 00:02:08,000 Wenn wir zum Beispiel Englisch anschauen und Deutsch. 19 00:02:08,000 --> 00:02:12,000 Englisch ist ja deutlich größer als jetzt die deutsche Wikipedia. 20 00:02:12,000 --> 00:02:17,000 Aber es ist nicht so, dass jetzt in dem Deutschen nur nur wiederholt wird, was in der Englischen drin steht. 21 00:02:17,000 --> 00:02:23,000 Ganz und gar nicht. Von den Themen der deutschen Wikipedia kennen die Englische etwa nur die Hälfte. 22 00:02:23,000 --> 00:02:29,000 Es gibt fast eineinhalb Millionen Artikel in der deutschen Wikipedia, die englischen Lesern überhaupt nicht zugänglich sind. 23 00:02:29,000 --> 00:02:35,000 Das ist eine große Menge Wissen, die nicht verfügbar ist. 24 00:02:35,000 --> 00:02:37,000 Und die sind wie gesagt nicht nur Artikel zahlen. 25 00:02:37,000 --> 00:02:43,000 Genauso wichtig, wenn nicht viel wichtiger, ist die Größe der Community, die Anzahl der aktiven Mitarbeitenden. 26 00:02:43,000 --> 00:02:50,000 Im Englischen haben wir über 120.000 Mitarbeitende, im Deutschen 17.000, ein Siebtel davon. 27 00:02:50,000 --> 00:02:53,000 Amharisch hatte im letzten Monat 56. 28 00:02:53,000 --> 00:02:57,000 Es wird schwierig, da mit einer aktuellen und vollständigen Sklopädie zu wucken. 29 00:02:57,000 --> 00:03:01,000 Wikimedia besteht halt aus vielen, vielen Communities. 30 00:03:01,000 --> 00:03:03,000 Manche davon groß, manche davon klein. 31 00:03:03,000 --> 00:03:07,000 Selbst innerhalb der deutschen Wikipedia haben wir zahlreiche kleine Communitys, 32 00:03:07,000 --> 00:03:13,000 die an bestimmten Projekten arbeiten, an bestimmten Teilen arbeiten, wo die Mitglieder alle überlappen sind und so weiter und so fort. 33 00:03:13,000 --> 00:03:18,000 Ein Teil davon sind zum Beispiel die Arbeiten an den Modulen. 34 00:03:18,000 --> 00:03:23,000 Und da sieht man halt, dass wir halt 800 und mehr Wikis sind, die alle unabhängig sind. 35 00:03:23,000 --> 00:03:27,000 Das ist das Modul Sports Table in der deutschen Wikipedia. 36 00:03:28,000 --> 00:03:38,000 Habt ihr vielleicht schon gesehen, das wird dann in verschiedenen Artikeln eingebunden, um diese Tabelle zu generieren, um Sportgruppen in ein Ranking zu bringen. 37 00:03:38,000 --> 00:03:42,000 Wie wir sehen, ist dieses Modul nicht besonders deutsch. 38 00:03:42,000 --> 00:03:47,000 Es ist auch keine Überraschung, weil es eigentlich aus der englischen Wikipedia rüber kopiert wurde und dann ein wenig übersetzt wurde. 39 00:03:47,000 --> 00:03:48,000 Und das war es auch schon. 40 00:03:48,000 --> 00:03:50,000 Das passierte so um 2017. 41 00:03:50,000 --> 00:03:54,000 Und seitdem ist auch nicht mehr viel passiert mit diesem Modul. 42 00:03:54,000 --> 00:03:59,000 Auf der englischen Wikipedia hingegen ist das ursprüngliche Modul munter weiterentwickelt worden. 43 00:03:59,000 --> 00:04:03,000 Und es ist eben der Vorteil, wenn man siebenmal so viele Leute ist. 44 00:04:03,000 --> 00:04:10,000 Das heißt, da ist sehr viel Arbeit eingeschränkt worden, die alles nicht in die deutsche Wikipedia übertragen wurden. 45 00:04:10,000 --> 00:04:13,000 Und geschweige das auch die Dokumentation nicht haben. 46 00:04:13,000 --> 00:04:17,000 Und das ist auch nicht ein Problem, dass jetzt die deutsche Wikipedia im Besonderen hat. 47 00:04:17,000 --> 00:04:20,000 Genau genommen ist die deutsche Wikipedia ziemlich vorteilig. 48 00:04:20,000 --> 00:04:23,000 Ich musste ein bisschen suchen, bis ich was gefunden habe, was hier ein Beispiel ist. 49 00:04:23,000 --> 00:04:26,000 In anderen Wikipediaen wäre das deutlich einfacher gewesen. 50 00:04:26,000 --> 00:04:32,000 Aber dieses Modul hier zum Beispiel wurde über 70 verschiedene Sprachen kopiert in verschiedensten Versionen. 51 00:04:32,000 --> 00:04:39,000 Und es ist halt dort in verschiedensten Ständen häufig in Kompatibilität zueinander vorhanden. 52 00:04:39,000 --> 00:04:44,000 Ein anderes Beispiel ist die Vorlage Alter. 53 00:04:44,000 --> 00:04:47,000 Wie gesagt, die deutsche Wikipedia ist richtig gut, was das eigentlich angeht. 54 00:04:47,000 --> 00:04:53,000 Die meisten Module und Vorlagen sind lokale Entwicklungen, werden lokal gepflegt. 55 00:04:53,000 --> 00:04:56,000 Wie hier eben die Vorlage Alter. 56 00:04:56,000 --> 00:05:05,000 Hier wird dann zum Beispiel verwendet in Sortikeln wie Franziska von Almsig, wo das Alter hier rechts in der Infobox berechnet wird und dargestellt wird. 57 00:05:05,000 --> 00:05:08,000 Und aktualisiert wird, wenn eben der Geburtstag passiert. 58 00:05:08,000 --> 00:05:10,000 Automatisch in dem Fall. 59 00:05:11,000 --> 00:05:18,000 Die Vorlage Alter oder entsprechend das Modul Age in anderen ist in sehr vielen Sprachen vorhanden. 60 00:05:18,000 --> 00:05:24,000 Wird oft einfach nur blind rüber kopiert, teilweise aus dem englischen, teilweise vielleicht aus einer anderen näher liegenden Sprache. 61 00:05:24,000 --> 00:05:27,000 Und Übersetzungen sind nicht mehr selbstverständlich. 62 00:05:27,000 --> 00:05:31,000 Es kann sein, dass teilweise Fehlermittlungen, soweit alle noch im Englisch sind. 63 00:05:31,000 --> 00:05:35,000 Auch ist es dann nicht besonders einfach, das zu übersetzen. 64 00:05:35,000 --> 00:05:47,000 Ganz schweigend davon, dass natürlich Änderungen daran nicht nachgeführt werden, dass das nicht mehr kompatibel ist, dass das Übersetzen von einer Sprache dann in die andere schwierig wird, auch für die Artikel. 65 00:05:47,000 --> 00:05:55,000 Eine Variante dieser Funktion wird wahrscheinlich auf Millionen von Wikipedia Artikeln verwendet in hunderten von Sprachen. 66 00:05:55,000 --> 00:05:59,000 Dieses Ding ist in mehr als 140 Sprachversionen verfügbar. 67 00:05:59,000 --> 00:06:04,000 Das aber auch bedeutet, dass es in genauso vielen Sprachversionen nicht vorhanden ist und nicht verfügbar ist. 68 00:06:04,000 --> 00:06:06,000 Dass man das eben da nicht überall verwenden kann. 69 00:06:06,000 --> 00:06:09,000 Es ist insgesamt ein ziemliches Wartungsdesaster. 70 00:06:11,000 --> 00:06:13,000 Und da will Wikifunctions ein bisschen helfen. 71 00:06:13,000 --> 00:06:18,000 So etwas wie das Alter zu berechnen, das können wir auch zentralisiert anbieten. 72 00:06:18,000 --> 00:06:26,000 Also eine Funktion in Wikifunctions, wo man dann zum Beispiel den Geburtstag eintritt und dann kriegt man das Alter zurück. 73 00:06:26,000 --> 00:06:29,000 Und das kann man dann uniform in den verschiedenen Wikipedia verwenden. 74 00:06:29,000 --> 00:06:32,000 Das ist grob die Idee, die wir für Wikifunctions haben. 75 00:06:32,000 --> 00:06:36,000 Es ist ein neues Projekt, welches vor ein paar Wochen an den Start gegangen ist. 76 00:06:36,000 --> 00:06:38,000 Wir sind sehr hoffnübergreifend. 77 00:06:38,000 --> 00:06:40,000 Ein bisschen holperig stattgehabt, wir sind noch nicht komplett offen. 78 00:06:40,000 --> 00:06:43,000 Das heißt, nicht jeder kann editieren, nicht jeder kann die Seiten benutzen. 79 00:06:43,000 --> 00:06:45,000 Wir arbeiten daran, beides zu ändern. 80 00:06:48,000 --> 00:06:52,000 Schauen wir uns eine super einfache Funktion in Wikifunctions an, wie das eigentlich dann aussieht. 81 00:06:52,000 --> 00:06:54,000 Das ist die logische Verneilung. 82 00:06:54,000 --> 00:07:00,000 Die logische Verneilung nimmt einen logischen Wahrheitswert, das ist entweder wahr oder falsch, und gibt das Gegenteil davon zurück. 83 00:07:00,000 --> 00:07:02,000 Das heißt, es gibt zwei Möglichkeiten, das zu verwenden. 84 00:07:02,000 --> 00:07:06,000 Auf der einen Seite sehen wir, wenn man wahr eingibt, kriegt man falsch zurück. 85 00:07:06,000 --> 00:07:08,000 Und wenn man falsch eingibt, kriegt man wahr zurück. 86 00:07:11,000 --> 00:07:18,000 Und hinter den Kulissen der Funktion sieht man jetzt ein bisschen, wie dann eine Funktion in Wikifunctions aufgebaut ist. 87 00:07:19,000 --> 00:07:25,000 Wir sehen auf der linken Seite, dass es einen Burschenwert, das Eingabe nimmt, und einen Burschenwert, das Ausgabe zurückgibt. 88 00:07:25,000 --> 00:07:30,000 Wir sehen auf der rechten Seite, dass wir insgesamt vier Implementierungen haben. 89 00:07:30,000 --> 00:07:34,000 Also vier Art und Weisen, wie die Verneilungsfunktion jetzt umgesetzt ist. 90 00:07:34,000 --> 00:07:36,000 Und drunter zwei Tests. 91 00:07:36,000 --> 00:07:38,000 Zwei Tests machen sehr viel Sinn. 92 00:07:38,000 --> 00:07:41,000 Es sind schließlich zwei mögliche Werte für die Funktion vorhanden. 93 00:07:41,000 --> 00:07:45,000 Wir sehen hier, dass alle diese Implementierungen, wir sehen, alle Tests bestehen. 94 00:07:45,000 --> 00:07:47,000 Schauen wir uns ein paar der Implementierungen an. 95 00:07:47,000 --> 00:07:49,000 Wie gesagt, das ist üblicherweise hinter den Kulissen. 96 00:07:49,000 --> 00:07:53,000 Das muss man nicht üblicherweise anschauen. 97 00:07:53,000 --> 00:07:56,000 Wir haben hier Implementierungen in verschiedenen Programmiersprachen. 98 00:07:56,000 --> 00:07:58,000 Einmal zum Beispiel in JavaScript. 99 00:07:58,000 --> 00:08:02,000 Das verwendet einen Ausrufezeichen-Operator, der in JavaScript-Verneilung bedeutet. 100 00:08:02,000 --> 00:08:04,000 Keine große Überraschung. 101 00:08:04,000 --> 00:08:05,000 Der Code ist nicht besonders lang. 102 00:08:05,000 --> 00:08:10,000 Das wird einfach nur dann quasi durch den Ausrufe-Operator ausgerechnet. 103 00:08:10,000 --> 00:08:14,000 In Python, das finde ich ein bisschen lesbarer, steht dann das englische Wort. 104 00:08:14,000 --> 00:08:16,000 Die Verneilung macht. 105 00:08:16,000 --> 00:08:22,000 Ist aber letztlich quasi, dass wir ein bisschen Code haben, der dann ausgeführt wird und die Verneilung ausführt. 106 00:08:22,000 --> 00:08:29,000 Was wir aber auch haben, und das finde ich viel spannender, ist das hier. 107 00:08:29,000 --> 00:08:35,000 Das ist jetzt keine Programmiersprache, sondern etwas, das wir Komposition oder Zusammenstellung nennen. 108 00:08:35,000 --> 00:08:38,000 Die deutsche WK-Functions-Community hat sich noch nicht auf den Begriff geeinigt. 109 00:08:38,000 --> 00:08:42,000 Einige Übersetzungen sind Komposition, andere Zusammenstellung. 110 00:08:42,000 --> 00:08:49,000 Was wir hier sehen, ist, dass die Verneilung aus anderen Funktionen in Mickey Functions zusammengefügt wird. 111 00:08:49,000 --> 00:08:52,000 In diesem Fall der Wenn-Funktion. 112 00:08:52,000 --> 00:08:54,000 Die Wenn-Funktion hat eine Bedingung. 113 00:08:54,000 --> 00:08:57,000 Dann und ein sonst. 114 00:08:57,000 --> 00:08:59,000 Ist die Bedingung wahr, gibt es das dann. 115 00:08:59,000 --> 00:09:00,000 In dem Fall falsch. 116 00:09:00,000 --> 00:09:02,000 Und sonst ist sonst. 117 00:09:02,000 --> 00:09:03,000 In dem Fall wahr. 118 00:09:03,000 --> 00:09:05,000 Das heißt, wenn es wahr ist, wird es falsch. 119 00:09:05,000 --> 00:09:09,000 Und ansonsten geht es rüber und gibt wahr zurück. 120 00:09:10,000 --> 00:09:18,000 Das interessante an dieser Komposition ist, dass sie komplett aus WK-Functions-Funktionen zusammengestöpselt ist. 121 00:09:18,000 --> 00:09:20,000 Und die können alle Übersetzungen haben. 122 00:09:20,000 --> 00:09:23,000 Dass wir das jetzt auf Deutsch sehen, ist, weil wir uns die deutsche Version anschauen. 123 00:09:23,000 --> 00:09:30,000 Ich kann das aber nicht nur auf Deutsch lesen und auch bearbeiten, sondern auch in anderen Sprachen wie zum Beispiel Englisch. 124 00:09:30,000 --> 00:09:32,000 Das heißt, ich kann das ganze Ding auch auf Englisch sein. 125 00:09:32,000 --> 00:09:36,000 Das ist so ein WK-Data, dass wir die Sicht einfach umschalten können in der anderen Sprache. 126 00:09:36,000 --> 00:09:38,000 Oder in Polnisch zum Beispiel. 127 00:09:38,000 --> 00:09:48,000 Das heißt, wir können hier zum ersten Mal für viele Menschen in ihrer Muttersprache Funktionen erstellen und verwenden. 128 00:09:50,000 --> 00:09:56,000 Hier ein paar weitere Beispiele von Funktionen, die wir bereits auf WK-Functions haben, die in den letzten paar Wochen erstellt wurden von der Community. 129 00:09:58,000 --> 00:10:01,000 Diese Funktion hier, Bustabiere mit dem Nato-Alphabet. 130 00:10:01,000 --> 00:10:05,000 Nimmt ein Wort und sagt mir, wie ich das im Nato-Alphabet bustabieren würde. 131 00:10:05,000 --> 00:10:09,000 Das heißt, ich gebe zum Beispiel Lins ein und es sagt mir Lima, India, November, Zulu. 132 00:10:09,000 --> 00:10:12,000 Und dann kann ich entsprechen mit anderen Worten und dann auch versuchen. 133 00:10:12,000 --> 00:10:16,000 Oder hier, das ist die Lieblingsfunktion von meiner Tochter. 134 00:10:16,000 --> 00:10:18,000 Sie ist 9 Jahre alt. 135 00:10:18,000 --> 00:10:22,000 Also das nimmt eine Zeichenkette und dreht diese um. 136 00:10:22,000 --> 00:10:32,000 Das heißt, sie kann hier eintragen, was sie möchte, drückt dann auf die Funktion berechnen und kriegt dann als Antwort zurück, was sie haben wollte. 137 00:10:32,000 --> 00:10:38,000 Meine Tochter ist sehr stolz darauf, den Computer dazu zu bringen, Sachen zu sagen, die sie nicht sagen darf. 138 00:10:40,000 --> 00:10:44,000 Hier ist ein anderes Beispiel, mehr in der linguistischen Ecke. 139 00:10:44,000 --> 00:10:52,000 Diese Funktion nimmt die infinite Form eines deutschen Verbs und erzeugt die regelmäßige erste Person im Singular Presence. 140 00:10:52,000 --> 00:10:57,000 Das kann eine Hilfe sein, zum Beispiel lexiografische Daten in Digidate zu verbessern und einzutragen, zu prüfen. 141 00:10:57,000 --> 00:11:01,000 Oder für Victionary, um die Beugung zu erzeugen und darzustellen. 142 00:11:01,000 --> 00:11:04,000 Oder eben als Beispiel für Generierung der Sprache. 143 00:11:04,000 --> 00:11:10,000 Wie genau wir das verwenden werden, ist ein längere Diskussion, das können wir dann auch später haben. 144 00:11:10,000 --> 00:11:14,000 Aber hier ist ein Beispiel dafür, dass wir solche linguistische Funktionen haben können. 145 00:11:14,000 --> 00:11:23,000 Und das Ziel von Wikifunction ist es dann auch, eine große Menge von solchen Funktionen anzubieten, mit denen wir Sprache generieren möchten. 146 00:11:23,000 --> 00:11:25,000 Dazu komme ich in einen Moment. 147 00:11:26,000 --> 00:11:34,000 Hier sehen wir da solche Funktionen, und das ist unsere Hoffnung, durchaus auch von linguistisch Interessierten, nicht Entwicklern entstellt werden können. 148 00:11:34,000 --> 00:11:41,000 Wir sehen hier, dass wir neben den Wortstamm, wir verbinden das dann mit dem Buchstaben E. 149 00:11:41,000 --> 00:11:43,000 Und das erzeugt dann auch die Funktion. 150 00:11:43,000 --> 00:11:47,000 Das heißt zum Beispiel aus dem Infiniti-V-Lesen wird auf Wortstamm genommen, was das Lese wird. 151 00:11:47,000 --> 00:11:51,000 Wir fügen das E hinzu und dann kann man Lese. Und das wäre dann Ich Lese. 152 00:11:51,000 --> 00:11:53,000 Das ist halt nur die richtige Form. 153 00:11:53,000 --> 00:11:58,000 Und die Idee ist halt, dass solche Sachen jetzt geschrieben werden können, ohne dass man jetzt ein Programmierer sein muss, 154 00:11:58,000 --> 00:12:05,000 sondern dass Leute, die sich für eine bestimmte Sprache interessieren, nicht müssen ja auch keine Linguisten sein, 155 00:12:05,000 --> 00:12:08,000 eben der Lage sind, das dann häufig auch zu programmieren. 156 00:12:08,000 --> 00:12:10,000 Oder zu erstellen. 157 00:12:10,000 --> 00:12:18,000 Wie gesagt, eines der Hauptziele für Wikifunction ist es dann, einen Katalog von Funktionen zu erstellen, natürlich Sprache und Texte anzubieten. 158 00:12:19,000 --> 00:12:26,000 Am letzten Endes ist das Ziel dann, Wikipedia-Artikel oder Teile von Wikipedia-Artikeln daraus erstellen zu können, 159 00:12:26,000 --> 00:12:30,000 um Lücken in den Wikipedien zu schließen, die jetzt da sind. 160 00:12:30,000 --> 00:12:36,000 Weil, wie wir gesehen haben, Wikipedien sind sehr, sehr ungleich, was Inhalte angeht. 161 00:12:36,000 --> 00:12:40,000 Das heißt, wir haben teilweise sehr viele Lücken in Sprache, die wir am haarisch entfüllen können. 162 00:12:40,000 --> 00:12:45,000 Und das grundlegende Problem, das Kernproblem der ganzen Sache ist, dass die Wikipedias Kosten 163 00:12:45,000 --> 00:12:52,000 durch die Anzahl der Themen, die wir abdecken, mal die Anzahl der Sprachen, die wir unterstützen möchten, gebildet werden. 164 00:12:52,000 --> 00:12:58,000 Das heißt, wir haben 20 Millionen Themen, zu denen wir Wikipediatikel haben, in 300 Sprachen erwilligen können, 165 00:12:58,000 --> 00:13:00,000 damit müssen wir eben 6 Milliarden Artikel haben. 166 00:13:00,000 --> 00:13:05,000 Das sind so 60 Millionen Artikel, auch nur ein Prozent dessen, was wir erreichen möchten. 167 00:13:05,000 --> 00:13:11,000 Wenn wir aber hingegen diese Multiplikation jetzt in eine Addition verwandeln können, 168 00:13:11,000 --> 00:13:18,000 dann haben wir eine Menge von Arbeit, die wir jetzt bereits abdecken können. 169 00:13:18,000 --> 00:13:25,000 Dann kommen wir runter zu den 20 Millionen Artikeln, die wir eigentlich schreiben möchten. 170 00:13:25,000 --> 00:13:32,000 Und die Behauptung ist, dass es eben das ist, was wir mit Wikidata und Wikifunction sammeln leisten können. 171 00:13:32,000 --> 00:13:35,000 Wikidata geht ja schon ein wenig in diese Richtung. 172 00:13:36,000 --> 00:13:42,000 Es ist immer dieselben Inhalte, egal in welcher Sprache man das jetzt anschaut oder bearbeitet. 173 00:13:42,000 --> 00:13:47,000 Ich kann auch hebräisch etwas in Wikidata ändern, ist sofort auf Deutsch sichtbar und verfügbar. 174 00:13:47,000 --> 00:13:56,000 Und nicht nur in Hebräisch und Deutsch, auch in fast 500 anderen Sprachen ist inzwischen Wikidata verfügbar und kann bearbeitet werden. 175 00:13:56,000 --> 00:14:01,000 Wir haben mehr als 100 Millionen Datenobjekte in Wikidata zusammengesammelt, 176 00:14:01,000 --> 00:14:07,000 die anderthalb Milliarden Beziehungen und Werte miteinander verknüpft sind. 177 00:14:07,000 --> 00:14:14,000 Wikidata hatte im letzten Monat über 23.000 aktive Freiwilligen, die daran mitgearbeitet haben. 178 00:14:14,000 --> 00:14:19,000 Vielen Dank dafür, vielen Dank auch für jeden hier im Raum, der daran mitarbeitet. 179 00:14:19,000 --> 00:14:25,000 Und hat fast zwei Milliarden Bearbeiter hier durchgeführt, was das meist bearbeitete Wikidewelt macht. 180 00:14:26,000 --> 00:14:31,000 In mehr und mehr Teilen der Wikipädias fließen Wikidata-Inhalte ein. 181 00:14:31,000 --> 00:14:37,000 Wir haben hier zum Beispiel ein Beispiel aus der Urdo-Wikipedia, das ist der Titel zu Jupiter. 182 00:14:37,000 --> 00:14:41,000 Die Infobox kommt fast ausschließlich aus Wikidata. 183 00:14:41,000 --> 00:14:44,000 Die Referenzen, die unten dran stehen, sind meistens aus Wikidata. 184 00:14:44,000 --> 00:14:46,000 Die Side-Links sind aus Wikidata. 185 00:14:46,000 --> 00:14:54,000 Mehr und mehr Daten kommen aus Wikidata und füllen Blüten, die wir zurzeit haben in den Wikipädias. 186 00:14:55,000 --> 00:14:59,000 Und das ist genau dieses Ziel, dass wir eben den Inhalte nur einmal verwalten, 187 00:14:59,000 --> 00:15:07,000 aber dann in verschiedenen Sprachen darstellen können und dadurch eben die Kosten für das Wikipedia-Projekt dramatisch senken können. 188 00:15:09,000 --> 00:15:15,000 Ist es jetzt alles, was wir machen müssen, alle Daten aus Wikipädias nach Wikidata schaufeln und wir sind fertig? 189 00:15:15,000 --> 00:15:17,000 Bei mir ist es natürlich für das, dass es nicht funktioniert. 190 00:15:17,000 --> 00:15:22,000 Wikidata ist ja deutlich weniger aussagekräftig als Wikipedia. 191 00:15:22,000 --> 00:15:26,000 In Wikipedia können wir ja alles sagen, was irgendwie in Sprache möglich ist. 192 00:15:26,000 --> 00:15:30,000 In Wikidata geht das nicht. Wir können Narrative nicht wirklich darstellen. 193 00:15:30,000 --> 00:15:34,000 Beschreibende Referenzen funktionieren nicht. Redundanz funktioniert nicht. 194 00:15:34,000 --> 00:15:37,000 Lass uns ein Beispiel anschauen, Redundanz. 195 00:15:37,000 --> 00:15:43,000 Wir müssen uns jetzt zum Beispiel den Jupiter-Artikel nochmal anschauen. 196 00:15:43,000 --> 00:15:45,000 Das ist der Artikel, wie im Deutsch. 197 00:15:45,000 --> 00:15:49,000 Da haben wir diesen Satz, dass Jupiter der größte Planet im Sonnensystem ist. 198 00:15:49,000 --> 00:15:53,000 Diese Information ist nicht explizit in Wikidata abgebildet. 199 00:15:53,000 --> 00:15:58,000 Es gibt keine Aussage in Wikidata, die sagt, das ist jetzt der größte Planet im Sonnensystem. 200 00:15:58,000 --> 00:16:02,000 Was wir haben, wir kennen die Masse aller Planeten-Sonnensystems. 201 00:16:02,000 --> 00:16:06,000 Wir können entsprechend eine Anfrage stellen und fragen, wie groß sind die? 202 00:16:06,000 --> 00:16:10,000 Wir kriegen dann Antwort zu, dass das Jupiter-Artikel groß ist, aber das ist implizit. 203 00:16:10,000 --> 00:16:15,000 Wir können nicht jedes Mal, wenn wir den Jupiter-Artikel schreiben möchten, das überprüfen, ob das immer noch der Fall ist. 204 00:16:15,000 --> 00:16:17,000 Wir sind zu weit. 205 00:16:17,000 --> 00:16:20,000 Und außerdem, wer entscheidet, was wir noch eintragen möchten? 206 00:16:20,000 --> 00:16:25,000 Möchten wir dann für Merko eintragen, ist er der neungrößte Planet oder so ein Achtgrößter? 207 00:16:25,000 --> 00:16:29,000 Wie tragen wir das Ganze ein? 208 00:16:32,000 --> 00:16:38,000 Wie gesagt, in Wikidata ist die Information, dass Jupiter der größte Planet ist, nicht explizit festgehalten. 209 00:16:38,000 --> 00:16:42,000 Wenn wir dieses Beispiel genau anschauen, wäre die Idee, 210 00:16:42,000 --> 00:16:48,000 dass wir das vielleicht in einer Art von Konstrukte, in einer Art Schablone oder Template einfangen können. 211 00:16:48,000 --> 00:16:54,000 Die Idee ist relativ einfach, wird aber schnell komplizierter, aber ich will sie kurz darstellen. 212 00:16:54,000 --> 00:16:58,000 Also stellen wir uns vor, dass so eine Aussage jetzt in einer Art Schablone wie hier eingefangen wird. 213 00:16:58,000 --> 00:17:00,000 Wir möchten ein Superlativ ausdrücken. 214 00:17:00,000 --> 00:17:02,000 Es geht über Jupiter, das ist Jupiter. 215 00:17:02,000 --> 00:17:04,000 Wir möchten über die Masse reden. 216 00:17:04,000 --> 00:17:08,000 Es geht davon, welche Arte ist Planet und im Sonnensystem. 217 00:17:08,000 --> 00:17:14,000 Es ist nicht so dramatisch wichtig, ob exakt dieser Satz generiert wird, Jupiter ist der größte Planet im Sonnensystem, 218 00:17:14,000 --> 00:17:18,000 oder vielleicht dieser Satz, der massereichste Planet im Sonnensystem ist Jupiter. 219 00:17:18,000 --> 00:17:26,000 Was viel wichtiger ist, ist, dass diese Schablone auch verwendet werden kann, um denselben Satz in einer anderen Sprache zu generieren. 220 00:17:26,000 --> 00:17:29,000 Wie zum Beispiel in meiner Muttersprache, Kroatisch. 221 00:17:29,000 --> 00:17:33,000 Jupiter, der Planet, ist eine Neibelsche Masse und so ein Schablonszustand. 222 00:17:34,000 --> 00:17:41,000 Die Idee ist dann, dass wir diese Inhalte hernehmen können, dieses gefüllten Schablons, 223 00:17:41,000 --> 00:17:47,000 und sie durch einen Renderer, durch etwas, was es in einen natürlichsprachigen Text rüberschieben kann. 224 00:17:47,000 --> 00:17:53,000 Das würde dann zum Beispiel in Deutsch so aussehen, wir nehmen das Subjekt im Nominativ, 225 00:17:53,000 --> 00:17:56,000 verfügen ein Ist hinzu, wir nehmen jetzt einen bestimmten Artikel und so weiter, 226 00:17:56,000 --> 00:18:03,000 und das baut dann diesen Satz auf Stück für Stück, um ihn dann aus diesem Schablone direkt rüber zu verwandeln. 227 00:18:03,000 --> 00:18:10,000 Ein Beispiel, wir können es dann anschauen, hier zum Beispiel möchten wir den bestimmten Artikel hinzufügen, 228 00:18:10,000 --> 00:18:15,000 in dem Geschlecht von dem Arsch, das heißt im Geschlecht vom Planet. 229 00:18:15,000 --> 00:18:19,000 Das heißt, wir können rüberspringen zur Vekidata, schauen uns das Planet mal an, 230 00:18:19,000 --> 00:18:24,000 was ist das Geschlecht vom Planet, das ist aha, ok, maskulinmännlich, gehen wir wieder zurück, 231 00:18:24,000 --> 00:18:28,000 und jetzt kann ich also der verwenden, und hier generiere ich jetzt das Wort der, das Jupiter ist der, 232 00:18:28,000 --> 00:18:31,000 und dann gehe ich zum nächsten Wort und so weiter und so fort. 233 00:18:31,000 --> 00:18:35,000 Wir sehen, wir brauchen hier eine zahlreiche Funktion, wir müssen alle zusammengestöpselt werden, 234 00:18:35,000 --> 00:18:40,000 alles muss zusammenspielen, und am Ende haben wir dann eine Architektur, 235 00:18:40,000 --> 00:18:44,000 die wir zum Beispiel die Daten und Konstrukturen in Vekidata speichern, 236 00:18:44,000 --> 00:18:48,000 ob das wirklich passiert, müssen wir noch ausdiskutieren, das finden wir in den nächsten paar Monaten heraus, 237 00:18:48,000 --> 00:18:53,000 haben dann die Funktionen in Veki Functions, die erstellen die Texte aus den Vekidata Daten, 238 00:18:53,000 --> 00:18:59,000 und die Texte können dann in den Wikipedia verwendet werden, um Lücken zu füllen. 239 00:18:59,000 --> 00:19:03,000 Es ist mir ganz wichtig, es geht nicht darum, die bestehenden Artikel in irgendeiner Weise zu ersetzen, 240 00:19:03,000 --> 00:19:07,000 sondern eben da, wo wir keine Inhalte haben, das anbieten zu können. 241 00:19:07,000 --> 00:19:14,000 Das ist nicht so dramatisch wichtig für viele deutsche Artikel, aber für viele andere Sprachen wird das unglaublich hilfreich sein. 242 00:19:14,000 --> 00:19:22,000 Was wir nun haben, ist eine Infrastruktur, in welche die Inhalte unabhängig von den Sprachen erstellt und gewartet werden. 243 00:19:22,000 --> 00:19:28,000 Das ist genau eine Architektur oder Infrastruktur, die wir haben möchten, um diese Formel zu erfüllen, 244 00:19:28,000 --> 00:19:34,000 dass wir die Kosten für Wikipedia aus den Anzahl der Themen plus die Anzahl der Sprachen erstellen. 245 00:19:34,000 --> 00:19:40,000 Das heißt, wir müssen für jede Sprache diese Funktionen erstellen, wir erstellen für jeden Thema diese Inhalte, 246 00:19:40,000 --> 00:19:45,000 und das war's, wir machen das nicht mehr als Multiplikation, sondern eben als Addition. 247 00:19:45,000 --> 00:19:47,000 Aber Wikifunctions wird sogar noch mehr als das. 248 00:19:47,000 --> 00:19:53,000 Ich meine, das ist schon ziemlich ambitioniert, was wir hier erreichen möchten. 249 00:19:53,000 --> 00:19:58,000 Aber das Erstellen von Texten für die Wikipedien ist ein wichtiges Ziel für Wikifunctions, 250 00:19:58,000 --> 00:20:01,000 aber es steckt noch ein bisschen mehr daran, was wir da erreichen möchten. 251 00:20:01,000 --> 00:20:11,000 Wir möchten ein Projekt erstellen, das quasi Wikipedia jetzt aber zum automatischen Berechnen von Antworten für bestimmte Fragen funktionieren kann. 252 00:20:11,000 --> 00:20:17,000 Es ist ein neues Wikimedia-Projekt, also auf derselben Ebene Wikidata, Commons oder Wikisos, 253 00:20:17,000 --> 00:20:23,000 und es ist unser erstes neues Wikimedia-Projekt seit 2012, das Wikidata loslegte. 254 00:20:23,000 --> 00:20:28,000 Wie wir gesehen haben, ist es vielsprachig, nicht nur in Bezug auf natürliche Sprachen, sondern auch auf programmierte Sprachen. 255 00:20:28,000 --> 00:20:33,000 Wir können zurzeit in JavaScript oder in Pythagore mehr Sprachen, mehr Sprachen sind geplant. 256 00:20:33,000 --> 00:20:38,000 Ein paar Funktionen haben wir gezeigt, da haben wir auch einiges von der Sprache, 257 00:20:38,000 --> 00:20:43,000 ein paar Funktionen haben wir gezeigt. Was genau meine mit Funktionen? 258 00:20:43,000 --> 00:20:51,000 Das ist eine Art Rezept, eine Folge von Anweisungen, die es dem Computer erlaubt, aus einer Eingabe, aus einer Frage, 259 00:20:51,000 --> 00:20:56,000 automatisch unmittelholbar eine Ausgabe, eine Antwort zu erstellen. 260 00:20:56,000 --> 00:21:03,000 Also Funktionen beantworten Fragen, und Funktionen können Fragen zuversichtlich beantworten, 261 00:21:03,000 --> 00:21:06,000 auch wenn diese Frage noch nie jemand gestellt hat. 262 00:21:06,000 --> 00:21:13,000 Das finde ich wirklich wichtig. Selbst wenn du die allererste Person in der Welt bist, diese Frage stellt, 263 00:21:13,000 --> 00:21:18,000 wenn du eine Funktion hast, der du vertraust, dann weißt du, dass die Antwort richtig sein wird. 264 00:21:18,000 --> 00:21:23,000 Und um ihr zu vertrauen, finde ich es ist wichtig, dass die Funktion eben offen verfügbar ist, 265 00:21:23,000 --> 00:21:28,000 dass du so reinschauen kannst, wie sie jetzt aufgebaut ist, dass du testest, dass es eine Community hinterstellt. 266 00:21:28,000 --> 00:21:33,000 Genauso mit den selben Gründen, womit du Wikipedia vertraust, wirst du dann hoffentlich auch Wikifangstens vertrauen können, 267 00:21:33,000 --> 00:21:36,000 dass die Funktionen auch korrekt berechnen können. 268 00:21:36,000 --> 00:21:41,000 Und was das auch bedeutet, ist, diese Funktionen sind Wissen, weil sie beantworten Fragen. 269 00:21:41,000 --> 00:21:45,000 Und sie können sogar neues Wissen generieren. 270 00:21:45,000 --> 00:21:51,000 Die großen Technologie-Giganten wissen das ja schon mal so lang und erlauben uns seit Jahren, 271 00:21:51,000 --> 00:21:53,000 bestimmte Funktionen zu beantworten. 272 00:21:53,000 --> 00:22:01,000 Wir können auf Serie gehen, fragen, wie viele Kilometer in einem KMH in Meilen pro Stunde, 273 00:22:01,000 --> 00:22:04,000 und prompt berechnet mir Serie eine Antwort. 274 00:22:04,000 --> 00:22:08,000 Ich kann rüber zu Bing gehen und fragen, wie alt ist Franziska von Almsack? 275 00:22:08,000 --> 00:22:14,000 Und genauso wie die deutsche Wikipedia-Forger berechnet mir hier Bing die Antwort und zeigt sie mir an. 276 00:22:14,000 --> 00:22:17,000 Ist nicht anders, als ob ich es mir auch mit der Vorlage altig hier mache. 277 00:22:17,000 --> 00:22:23,000 Ich kann zu DuckDuckGo gehen, eine Mathematik-Aufgabe eingeben und es in den Orte auch hinlassen. 278 00:22:23,000 --> 00:22:27,000 Wohlgemerkt, Bing, DuckDuckGo, Google, das sind alle Suchmaschinen. 279 00:22:27,000 --> 00:22:32,000 Was wir aber hier erhalten, sind keine Suchergebnisse, sondern Funktionen, die wir berechnen. 280 00:22:32,000 --> 00:22:37,000 Über den Knowledge Graphen, über Microsoft Satori, der In-House-Rasun von Wikidata. 281 00:22:37,000 --> 00:22:40,000 Und genau dasselbe möchten wir auch anbieten, möchten erweitern, 282 00:22:40,000 --> 00:22:43,000 dass wir nicht nur das expezifische Wissen der Wikipedia haben, 283 00:22:43,000 --> 00:22:48,000 sondern eben auch den Funktionsraum abdecken können und mehr Fragen beantworten können an zur Zeit. 284 00:22:48,000 --> 00:22:51,000 Mein lieblingsbeispiel für eine Funktion hier ist in Google. 285 00:22:51,000 --> 00:22:55,000 Wenn ich in Google auf Englisch nach dem Volumen einer Pyramide frage, 286 00:22:55,000 --> 00:23:01,000 erhalte ich dieses Formular mit der Skizze der Pyramide, den relevanten Variablen der Formel. 287 00:23:01,000 --> 00:23:03,000 Ich kann die Werte für die Variable eintragen. 288 00:23:03,000 --> 00:23:07,000 Es drückt diese Werte in die Formel ein und berechnet das Ergebnis. 289 00:23:07,000 --> 00:23:10,000 Das ist wunderschön. Das funktioniert wirklich toll. 290 00:23:10,000 --> 00:23:14,000 Wenn ich das auf Deutsch versuche, ist es nicht vorhanden. 291 00:23:14,000 --> 00:23:18,000 Und schlimmer, der Schnipsel, der es mir anzeigt, ist auch noch falsch. 292 00:23:18,000 --> 00:23:21,000 Das ist ja nicht 13-mal ABC, es ist ein Drittel mal ABC, 293 00:23:21,000 --> 00:23:27,000 aber der Bruchstrich fällt weg beim Scraping von Google und das Ergebnis ist komplett falsch. 294 00:23:27,000 --> 00:23:32,000 Aber es kann auch nicht angehen, dass die Technologiefirmen hier entscheiden, 295 00:23:32,000 --> 00:23:38,000 welche Funktion, welches Wissen ich zur Verfügung habe, welche Funktion ich verwenden kann, welche nicht, 296 00:23:38,000 --> 00:23:41,000 und was jetzt interessant ist und was nicht. 297 00:23:41,000 --> 00:23:46,000 Funktion sind Wissen und Wissen ist unsere Mission, ist unsere Aufgabe. 298 00:23:47,000 --> 00:23:52,000 Es geht ja schließlich darum, eine Welt zu machen, in der jeder an Wissen beitragen kann, 299 00:23:52,000 --> 00:23:57,000 in der jeder Wissen beitragen kann, Funktionen erstellen kann, Funktionen benutzen kann. 300 00:23:57,000 --> 00:24:00,000 Deswegen habe ich am Anfang an unsere Vision erinnert. 301 00:24:00,000 --> 00:24:05,000 Es ist eben nicht nur eine Encyclopädie gemeint hiermit, sondern auch andere Formen von Wissen. 302 00:24:05,000 --> 00:24:11,000 Wie eben ein Katalog von Funktion der Fragen beantworten kann. 303 00:24:11,000 --> 00:24:16,000 Wir möchten den Zugriff auf Funktionen und die Mitarbeit an Funktionen radikal demokratisieren. 304 00:24:16,000 --> 00:24:21,000 Wir möchten eine Standardbibliothek an Funktionen auf vielerlei Art und Weise zugänglich machen 305 00:24:21,000 --> 00:24:25,000 und allen Wikimedia-Projekten zur Verfügung stellen, damit man es auch von einer Sprache 306 00:24:25,000 --> 00:24:27,000 leicht in die nächste Sprache übertragen kann. 307 00:24:27,000 --> 00:24:33,000 Wir möchten zusammen eine Bibliothek zur Generierung von Texten über 300 Millionen Sprachen erstellen 308 00:24:33,000 --> 00:24:37,000 und dann mit deren Hilfe Lücken in den Wikibäen anschließen. 309 00:24:37,000 --> 00:24:39,000 Das ist die Mission von Wikifunctions. 310 00:24:39,000 --> 00:24:41,000 Besucht uns auf Wikifunctions. 311 00:24:41,000 --> 00:24:45,000 Wie gesagt, wir sind zurzeit noch nicht komplett offen, aber wir sind da, wir sind benutzbar. 312 00:24:45,000 --> 00:24:50,000 Wir arbeiten daran, mehr Leute Wikifunctions benutzen lassen zu können, bearbeiten lassen zu können. 313 00:24:50,000 --> 00:24:53,000 Wenn ihr Benutzerrechte haben wollt, fragt mich. 314 00:24:53,000 --> 00:24:55,000 Wir haben eine Seite, die ist von der Hauptseite anklickbar. 315 00:24:55,000 --> 00:24:58,000 Ich richte euch gerne den Account ein. 316 00:24:58,000 --> 00:25:02,000 In ein paar Wochen schalten wir das dann auch für alle frei, sodass alle benutzen können 317 00:25:02,000 --> 00:25:05,000 und dass mehr Leute editieren können, das ist ein Zeichen anderen. 318 00:25:05,000 --> 00:25:11,000 Wir arbeiten noch an einigen Hintergrundsachen, die uns das gerade nicht erlauben. 319 00:25:11,000 --> 00:25:14,000 Vielen Dank für eure Aufmerksamkeit. 320 00:25:14,000 --> 00:25:17,000 Ich würde mich über Fragen und Diskussionen freuen, 321 00:25:17,000 --> 00:25:22,000 wenn ich das richtig übersehe, haben wir noch genug Zeit, trotz der Verspäteten anfangs. 322 00:25:22,000 --> 00:25:28,000 Jetzt aber sollte ich die Leute sehen, wie sie hören können. 323 00:25:28,000 --> 00:25:31,000 Es wird hier nicht viel mit den Fragen beantworten. 324 00:25:35,000 --> 00:25:52,000 So, könntest du uns hören? 325 00:25:52,000 --> 00:25:54,000 Ich höre euch, danke. 326 00:25:54,000 --> 00:25:59,000 Okay, dann werde ich jetzt mal das Mikrofon rumreichen. 327 00:25:59,000 --> 00:26:01,000 Gibt es hier Fragen aus dem Raum? 328 00:26:06,000 --> 00:26:11,000 Falls es keine Fragen gibt, werde ich in Zukunft meine Vorträge schlechter machen, sodass mir Fragen übrig bleiben. 329 00:26:11,000 --> 00:26:19,000 Also, hallo, ich habe eine Frage zu Programmiersprachen. 330 00:26:19,000 --> 00:26:26,000 In welche Sprache denkst du, werden die Funktionen Biggie Functions übersetzt, 331 00:26:26,000 --> 00:26:32,000 in denen es aktuell keine Tabellenkalkulationsfunktionen der entsprechenden Sprache gibt? 332 00:26:33,000 --> 00:26:39,000 Als hast du zu Beginn erwähnt, dass es Menschen dadurch möglich sein wird, ihre eigene Sprache zu programmieren. 333 00:26:39,000 --> 00:26:48,000 Ich persönlich habe die Meinung, dass auch jetzt schon Tabellenkalkulationsfunktionen viele Sprachen übersetzt sind. 334 00:26:48,000 --> 00:26:53,000 Scheinst du davon überzeugt zu sein, dass es in eine weitere Sprache übersetzt wird? 335 00:26:53,000 --> 00:26:56,000 Da würde ich interessieren, welche ist das? 336 00:26:56,000 --> 00:26:58,000 Zum Beispiel Amharisch. 337 00:26:58,000 --> 00:27:03,000 Nach meinem besten Wissen und Gewissen gibt es keine Übersetzungen von Tabellenkalkulationssprachen, 338 00:27:03,000 --> 00:27:05,000 nämlich Amharische und andere. 339 00:27:05,000 --> 00:27:08,000 Es gibt auch zahlreiche Sprachen. 340 00:27:08,000 --> 00:27:11,000 Wir unterstützen ja von Haus aus 300 Sprachen. 341 00:27:11,000 --> 00:27:22,000 Und selbst in einer Umgebung wie Google Sheets oder Excel hat es Übersetzungen in 40, 30 Sprachen, wenn es hochkommt. 342 00:27:22,000 --> 00:27:25,000 Da möchte ich noch deutlich mehr unterstützen. 343 00:27:25,000 --> 00:27:29,000 Auch sind Tabellenkalkulationen... 344 00:27:29,000 --> 00:27:36,000 Das Culler an Tabellen ist tatsächlich, dass es die am weitesten verwendete Programmiersprache ist in der Welt, 345 00:27:36,000 --> 00:27:43,000 auch wenn sie von vielen Programmieren oft belächelt wird, weil sie innerhalb von Tabellenkalkulationen sind. 346 00:27:43,000 --> 00:27:47,000 Aber ich glaube, das ist tatsächlich ein fantastisches Modell dafür, 347 00:27:47,000 --> 00:27:56,000 wie weit wir erreichen, wie weit wir rausgehen möchten, wie weit wir erreichbar sein möchten, 348 00:27:56,000 --> 00:28:00,000 wie viele Leute wir erreichen können mit Solos und Wiki Functions. 349 00:28:08,000 --> 00:28:10,000 Das Projekt finde ich zunächst mal interessant. 350 00:28:10,000 --> 00:28:13,000 Mir ist nur der Use-Case nicht da. 351 00:28:13,000 --> 00:28:16,000 Soll es im Prinzip ein Projekt sein, 352 00:28:16,000 --> 00:28:22,000 dass es möglich sein sollte, effizienter Wikipedia-Artikel zu schreiben? 353 00:28:22,000 --> 00:28:25,000 Oder soll es im Prinzip so eine Art Schwesterprojekt sein, 354 00:28:25,000 --> 00:28:35,000 dass man von mir aus seinen Nettogehalt ausrechnen lassen kann oder Kilometerzahlen ausgeben lassen kann? 355 00:28:35,000 --> 00:28:38,000 Also etwas, was man auch schon über den Taschenrechner machen kann. 356 00:28:38,000 --> 00:28:40,000 Ja, beides. 357 00:28:40,000 --> 00:28:46,000 Beides. Wir sollen, genauso wie Wikidata ja auch beides ist, 358 00:28:46,000 --> 00:28:55,000 Wikidata ist sowohl dafür da, um effizienter zwischen den Wikipedia-strukturierten Daten zusammenhalten zu können, 359 00:28:55,000 --> 00:29:00,000 aber auch natürlich, dass man direkt zum Beispiel Spark-Lanfragen stellen kann, 360 00:29:00,000 --> 00:29:07,000 oder dass es andere Anwendungen, die Daten verwendbarkennbar können. 361 00:29:08,000 --> 00:29:14,000 Also ja, wir möchten sowohl den Nettogehalt ausrechnen können, wenn ein Prozentzeitzeit, 362 00:29:14,000 --> 00:29:22,000 aber im Gegensatz zu den Taschenrechnern glaube ich, dass Funktionen viel mehr können als nur Zahlen berechnen können. 363 00:29:22,000 --> 00:29:25,000 Und viele der Funktionen, die wir haben werden, werden auf Wörtern funktionieren. 364 00:29:25,000 --> 00:29:32,000 Wir haben jetzt schon Beispiele in der Gartnung auf Melodien Funktionen laufen lassen, 365 00:29:32,000 --> 00:29:40,000 um zum Beispiel Ziele in einer anderen Tonart zu übertragen und so weiter und so fort. 366 00:29:40,000 --> 00:29:45,000 Funktionen können ja viel mehr sein als nur Berechnungen auf Zahlen. 367 00:29:45,000 --> 00:29:52,000 Und innerhalb der Wikipedia sind Funktionen auch immer sehr hilfreich. 368 00:29:52,000 --> 00:29:58,000 Einerseits, um Sachen darzustellen wie eben das Alter in dem Artikel, das wir gesehen haben, 369 00:29:58,000 --> 00:30:05,000 aber auch vielmehr, um zu schauen, ob zum Beispiel die Inhalte in der Wikipedia Konsistenz sind, um zu prüfen. 370 00:30:05,000 --> 00:30:09,000 Zum Beispiel, wir haben hier die Einwohnerzahl, wir haben hier die Fläche, 371 00:30:09,000 --> 00:30:16,000 Stimmen, die Bevölkerungsdichte, die hier eingegeben ist, auch können wir da zum Beispiel ausrechnen und schauen, 372 00:30:16,000 --> 00:30:18,000 ist das nahe genug dran oder ähnliches. 373 00:30:18,000 --> 00:30:30,000 Oder auch interessant, wir haben zum Beispiel Geo-Koordinaten und Geo-Shapes, also so Geo, wie heißt das auf Deutsch, 374 00:30:30,000 --> 00:30:34,000 Grenzen quasi für Gebiete in Commons. 375 00:30:34,000 --> 00:30:40,000 Und da können wir auch zum Beispiel schauen, passt zum Beispiel dieses Geo-Shape, was wir jetzt in Commons haben, 376 00:30:40,000 --> 00:30:42,000 zu der Fläche, die wir angegeben haben und ähnliches. 377 00:30:42,000 --> 00:30:49,000 Das heißt, wir können viel mehr Sachen als besser ausrechnen und prüfen, ob das jetzt konsistent ist in der Wikipedia. 378 00:30:49,000 --> 00:30:55,000 Wir haben nicht einen einzigen Use-Case im Ziel mit Wikifunctions, sondern mehrere. 379 00:30:55,000 --> 00:30:59,000 Einerseits Wikifunctions als eigenständiges Projekt, zu beantworten von solchen Fragen. 380 00:30:59,000 --> 00:31:06,000 Andererseits, um den Wikipedien helfen, um Inhalte in Mehrsprachen anbieten zu können, 381 00:31:06,000 --> 00:31:09,000 aber auch die Konsistenz von Wikipedia prüfen zu können. 382 00:31:09,000 --> 00:31:15,000 Wir warten durchaus, dass wir zahlreiche verschiedene Use-Cases bedienen werden. 383 00:31:15,000 --> 00:31:19,000 Okay, wir haben noch zwei Fragen von hinten. 384 00:31:19,000 --> 00:31:32,000 Ich habe eine Frage, weil ich habe schon angeschaut und da sehe ich, da sind ja teilweise Informationen zum Eigen im Wikifunctions des Eigen. 385 00:31:32,000 --> 00:31:42,000 Aber es gibt ja Wikidata. Warum nimmt man die nicht gleich alle Daten, weil Sprachdaten und so von Wikidata, da ist ja schon drin, 386 00:31:42,000 --> 00:31:45,000 da sollen wir ja doppelt ausgefüllt werden. 387 00:31:45,000 --> 00:31:53,000 Sie haben vollkommen recht, die Daten sind in Wikidata und da sind sie auch gut aufgehoben. 388 00:31:53,000 --> 00:32:02,000 In Wikifunctions ist noch nicht da, aber wir arbeiten daran, dass man Daten aus Wikidata für Wikifunctions verwenden kann. 389 00:32:02,000 --> 00:32:07,000 Also Wikidata ist und bleibt die Wissensdatenbank, da kommen die Daten heraus. 390 00:32:07,000 --> 00:32:13,000 Wikifunctions macht dann Berechnungen auf diesen Daten darüber. 391 00:32:13,000 --> 00:32:23,000 Es geht nicht darum, die Arbeit zu verdoppeln, sondern dass wir wirklich die beiden Sachen zusammenarbeiten. 392 00:32:23,000 --> 00:32:33,000 Darauf aufbauend habe ich eine Frage. Würde grundsätzlich die Möglichkeit bestehen, auch externe Daten anzapfen zu können? 393 00:32:33,000 --> 00:32:41,000 Weil du hast zum Beispiel Bevölkerungszahlen angesprochen oder wenn man sieht, es gibt ja Städte oder Gemeinden, die tägliche Covid-Zahlen veröffentlichen. 394 00:32:41,000 --> 00:32:51,000 Sowas müsste man da ja nicht nach Wikidata importieren, weil das würde ja nur einen riesigen Datensatz geben, der da meiner Meinung nach auf Vorurl-Komm falsch aufgehoben ist. 395 00:32:51,000 --> 00:33:00,000 Ja, ich stimme vollkommen zu. Wir möchten ja auch den offiziellen Covid-Zahlen als eines der auch nicht editierbar unbedingt haben. 396 00:33:00,000 --> 00:33:05,000 Und wie gesagt, es wäre ein riesiger Datensatz, der in Wikidata auch gar nicht so richtig reinpasst. 397 00:33:05,000 --> 00:33:15,000 Ich habe das jedenfalls vor. Mein Chefentwickler kriegt jedes Mal ein ganz blasses Gesicht, wenn ich das vorschlage. 398 00:33:15,000 --> 00:33:26,000 Wir müssen uns dann natürlich über solche Fragen beantworten, wie wir das Ganze halt erstellen, ohne dass wir jetzt als Angriffsvektor herleiten können. 399 00:33:26,000 --> 00:33:29,000 Das ist einiges an technischer Arbeitsgruppe. Das kommt nicht ungehend. 400 00:33:29,000 --> 00:33:34,000 Das wird nicht so, dass wir Anfang nächsten Jahres beliebige Daten aus dem Netz anzapfen und so weiter. 401 00:33:34,000 --> 00:33:41,000 Aber langfristig ist es auf alle Fälle geplant, dass wir das machen können, dass wir also nicht nur Daten aus Wikidata anrufen können, 402 00:33:41,000 --> 00:33:47,000 sondern dass wir eben komplette Datensätze auch von Drittanbietern abrufen können, dass wir die dann einverwenden können, 403 00:33:47,000 --> 00:33:54,000 dass wir auch Bilder oder andere Sachen direkt aus dem Internet benutzen können und weiterhin bearbeiten können und so weiter und so fort. 404 00:33:55,000 --> 00:33:58,000 Dann haben wir noch eine Frage von online und noch eine aus dem Raum. 405 00:33:58,000 --> 00:34:07,000 Genau, es sind zwei kleine Fragen. Du meintest, dass da Verben oder Substantive gebeugt werden müssen. 406 00:34:07,000 --> 00:34:11,000 Und da ist nur die Frage, wie wird auf die Grammatik zurückgegriffen? 407 00:34:11,000 --> 00:34:18,000 Also für die Verbraucherschutz- und Verbraucherschutz-Fraktionen, die sich in der Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen 408 00:34:18,000 --> 00:34:48,000 die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die 409 00:34:48,000 --> 00:34:51,080 Verbraucherschutz-Fraktionen an iconischem die Außens additionally 410 00:34:51,080 --> 00:34:56,040 Außens additionally 411 00:34:56,040 --> 00:35:05,020 zu 412 00:35:05,020 --> 00:35:10,480 vermitteln 413 00:35:10,480 --> 00:35:15,400 halt 414 00:35:15,400 --> 00:35:18,640 Aber deswegen haben wir auch die lexicografischen Daten in Wikidata. 415 00:35:18,640 --> 00:35:26,280 Das heißt, die Beugungen sind eher für Fälle, wo wir aus irgendeinem Grund keine Beugung haben, 416 00:35:26,280 --> 00:35:29,800 oder um zum Beispiel um Daten leichter einzutragen ursprünglich, 417 00:35:29,800 --> 00:35:31,640 oder um die Daten überprüfen zu können. 418 00:35:31,640 --> 00:35:34,280 Tatsächlich werden wir die Daten einfach nachschlagen. 419 00:35:34,280 --> 00:35:38,440 Die grammatikalen Funktionen, die wirklich wichtig sein werden in Wikifunctions, 420 00:35:38,440 --> 00:35:45,000 sind dann die, die aus einzelnen Satzteilen ganze Sätze bilden. 421 00:35:45,000 --> 00:35:46,440 Und diese dann zusammenfügen. 422 00:35:46,440 --> 00:35:52,360 Aber das müssen wir dann zusammen als Community-Hower arbeiten, 423 00:35:52,360 --> 00:35:56,400 wie genau die Aufregung ist hier zwischen Wikifunctions, 424 00:35:56,400 --> 00:36:00,360 Wikidata, lexicografischen Daten und Wiktionary auf der dritten Seite. 425 00:36:00,360 --> 00:36:08,720 Was die Kritik angeht, ich finde sie gut, weil sie in vielen Punkten ja auch Recht hat. 426 00:36:08,720 --> 00:36:13,960 Es wäre natürlich besser, wenn wir es schaffen könnten, alle Artikel selber zu schreiben 427 00:36:13,960 --> 00:36:16,880 und aufrecht zu erhalten in den verschiedenen Sprachen. 428 00:36:16,880 --> 00:36:22,600 Das heißt, dass wir in 20 Jahren gesehen haben, dass wir immer noch viele Lücken haben. 429 00:36:22,600 --> 00:36:28,880 Die soautomatische Generierung entgegnet ja auch ein bisschen, um vorwegzunehmen, 430 00:36:28,880 --> 00:36:33,800 die Generierung durch zum Beispiel künstliche Intelligenzmethoden, 431 00:36:33,800 --> 00:36:35,920 die dann nicht mehr in unserer Kontrolle sind. 432 00:36:35,920 --> 00:36:38,400 Mit Wikifunctions ist alles, was wir hier schreiben, 433 00:36:38,400 --> 00:36:41,080 immer noch vollständig von der Community kontrolliert. 434 00:36:41,160 --> 00:36:45,800 Das heißt, wir finden hier nicht Daten, wir können sie nicht mehr bearbeiten, 435 00:36:45,800 --> 00:36:49,920 sondern alles bleibt editierbar, bleibt in unserer Kontrolle 436 00:36:49,920 --> 00:36:54,200 und bleibt entsprechend auch richtig, hoffe ich doch sehr, 437 00:36:54,200 --> 00:36:56,720 so richtig wie Wikipedia halt selber auch ist. 438 00:37:03,120 --> 00:37:05,320 Wir möchten, wie gesagt, wirklich nur für die Lücken generieren. 439 00:37:05,320 --> 00:37:08,120 Wenn es keine Lücken gibt, ist das auch großartig, dann bin ich auch froh. 440 00:37:09,080 --> 00:37:12,280 Aber für die Sprachen, die eben noch Lücken haben, 441 00:37:12,280 --> 00:37:16,600 wo wir dann dafür sorgen können, dass die Sprachen sich entsprechend konzentrieren können 442 00:37:16,600 --> 00:37:22,880 auf die Inhalte, die ihnen wichtig ist, anstatt nur auf die allgemeinen Inhalte, 443 00:37:22,880 --> 00:37:25,960 die wir dann zum Beispiel durch so ein System erstellen können. 444 00:37:25,960 --> 00:37:29,840 Ich glaube, dass wir hier sehr viel helfen können, um diese Lücken zu füllen 445 00:37:29,840 --> 00:37:32,920 und dann auch erlauben, den Community weiterhin organisch zu wachsen 446 00:37:32,920 --> 00:37:37,600 und dann auch wieder Teile selber einzunehmen, die sie einnehmen möchten. 447 00:37:37,640 --> 00:37:40,920 Wie gesagt, Wikifunctions, diese Generation, ist ja nicht dafür da, 448 00:37:40,920 --> 00:37:42,840 um irgendetwas zu ersetzen, was wir bisher haben, 449 00:37:42,840 --> 00:37:47,640 sondern um zu ergänzen, was wir nicht selber erreichen können. 450 00:37:47,640 --> 00:37:51,280 Und dann bleibt der Raum auch immer noch übrig, um das selber weiter zu arbeiten. 451 00:37:53,040 --> 00:37:55,000 So, eine letzte Meldung. 452 00:37:55,000 --> 00:38:03,280 Ja, meine Frage ist, ob du noch mal kurz was zum geplanten Paradigma der Sprache 453 00:38:03,280 --> 00:38:06,800 und zum Laufzeitverhalten sagen kannst. Reicht recht kurz. 454 00:38:07,600 --> 00:38:08,600 Danke. 455 00:38:08,960 --> 00:38:12,920 Paradigma ist, alles, was wir in Wikifunctions machen, ist eine funktionale Sprache. 456 00:38:12,920 --> 00:38:18,120 Wir können also nicht so was wie globale Module oder ähnliches haben, 457 00:38:18,120 --> 00:38:19,720 sondern es ist alles nur funktional. 458 00:38:21,280 --> 00:38:24,800 Wobei jede Sprache ja quasi funktional geschrieben werden kann, wenn man so möchte. 459 00:38:24,800 --> 00:38:27,800 Das heißt, dass auch Sprachen wie Python und JavaScript nicht funktional sind, 460 00:38:27,800 --> 00:38:30,920 können ja funktional schreiben und das nutzen wir dann auch aus. 461 00:38:32,720 --> 00:38:36,520 Und Laufzeitverhalten, das Laufzeitverhalten ist katastrophal 462 00:38:36,520 --> 00:38:38,080 und wir arbeiten daran, es zu verbessern. 463 00:38:39,280 --> 00:38:43,600 Da ist noch viel Raum zur Verbesserung da. 464 00:38:44,040 --> 00:38:50,880 Und wir haben einige Ideen, wie wir das Ganze dann auch besser machen. 465 00:38:51,600 --> 00:38:53,040 Wird aber jetzt den Rahmen füllen. 466 00:38:54,160 --> 00:38:55,840 Vielen Dank. Vielen Dank, Al. 467 00:38:56,280 --> 00:38:57,960 Wir sind jetzt am Zeitrahmen. 468 00:38:58,160 --> 00:39:01,320 Wenn ihr weiterfragen habt, ihr wisst, wie ihr mich erreichen könnt, hoffe ich. 469 00:39:02,080 --> 00:39:05,120 Meine User-Seite bin ich antwortlich üblicherweise. 470 00:39:05,600 --> 00:39:06,600 Vielen Dank, Al. 471 00:39:07,800 --> 00:39:08,800 Und viel Spaß. 472 00:39:14,320 --> 00:39:15,320 Danke dir, Dani.