German subtitles for clip: File:WikiCon 2023 - Wikifunctions – Ein neues Wikimedia Projekt.webm

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
1
00:00:00,000 --> 00:00:11,000
[Untertitel wurden automatisch mit Whisper Medium erzeugt.] Vielen Dank, dass ihr hier seid. Ich hoffe, ihr könnt mich immer noch hören und ihr seht jetzt auch den Schirm.

2
00:00:11,000 --> 00:00:21,000
Ich kann euch leider nicht hören, deswegen gehe ich einfach davon aus, dass alles funktioniert.

3
00:00:21,000 --> 00:00:35,000
Vielen Dank, Martin, dem Hexer dafür, dass er diesen Vortrag vorgeschlagen hat. Danke für das Programmkomitee, dass er den Vortrag angenommen hat.

4
00:00:35,000 --> 00:00:40,000
Und danke euch allen, dass ihr hier seid. Das finde ich großartig für das Interesse.

5
00:00:40,000 --> 00:00:48,000
Ich fange immer gerne meinen Vortrag an mit unserer Vision. Kennt ihr alle. Eine Welt, in der jeder an der Summe allen Wissens teilnehmen kann.

6
00:00:48,000 --> 00:00:56,000
Wir kennen diese Vision. Ich finde sie großartig und wichtig. Deswegen fange ich gerne damit an, einfach zur Erinnerung, warum wir hier sind, woran wir eigentlich arbeiten.

7
00:00:56,000 --> 00:01:02,000
Es ist immer gut, uns das zu vergegenwärtigen und wie weit wir damit sind oder auch nicht.

8
00:01:02,000 --> 00:01:09,000
Wie ihr wisst, wir haben mehr als 300 Sprachen, 60 Millionen Artikel. Das klingt großartig, aber es ist alles sehr ungleich verteilt.

9
00:01:09,000 --> 00:01:15,000
Wir haben große Sprachen und große Wikipedien wie Englisch und Deutsch mit Millionen von Artikeln.

10
00:01:15,000 --> 00:01:19,000
Wir haben kleinere Sprachen wie Amharisch mit nicht so vielen Artikeln.

11
00:01:19,000 --> 00:01:23,000
Und kleinere Sprachen, das heißt wirklich nur auf die größte Wikipedia bezogen.

12
00:01:23,000 --> 00:01:28,000
Ich meine, draußen in der Welt gibt es über 20 Millionen Sprecher. Das ist eine ganze Menge.

13
00:01:28,000 --> 00:01:36,000
Aber es ist ja nicht nur die Zahl der Artikel, die uns helfen. Wir müssen uns anschauen, was denn eigentlich in den Artikeln drin steht.

14
00:01:36,000 --> 00:01:43,000
Das ist der Artikel zu Jupiter in der deutschen Wikipedia. Wesenswert, ausgezeichnet und es sind sieben lange Kapitel drin.

15
00:01:43,000 --> 00:01:49,000
Jedes Kapitel davon länger als die drei kurzen Absätze im Amharischen, teilweise deutlich länger.

16
00:01:49,000 --> 00:01:54,000
Da ist viel mehr Inhalt drin in der deutschen Wikipedia als in der Amharischen Wikipedia.

17
00:01:54,000 --> 00:02:03,000
Und es ist auch nicht so, dass nur die kleinen Wikipedia, die großen Wikipedia hinterher und haben alles so ein Subsept für der Inhalte oder so etwas.

18
00:02:03,000 --> 00:02:08,000
Wenn wir zum Beispiel Englisch anschauen und Deutsch.

19
00:02:08,000 --> 00:02:12,000
Englisch ist ja deutlich größer als jetzt die deutsche Wikipedia.

20
00:02:12,000 --> 00:02:17,000
Aber es ist nicht so, dass jetzt in dem Deutschen nur nur wiederholt wird, was in der Englischen drin steht.

21
00:02:17,000 --> 00:02:23,000
Ganz und gar nicht. Von den Themen der deutschen Wikipedia kennen die Englische etwa nur die Hälfte.

22
00:02:23,000 --> 00:02:29,000
Es gibt fast eineinhalb Millionen Artikel in der deutschen Wikipedia, die englischen Lesern überhaupt nicht zugänglich sind.

23
00:02:29,000 --> 00:02:35,000
Das ist eine große Menge Wissen, die nicht verfügbar ist.

24
00:02:35,000 --> 00:02:37,000
Und die sind wie gesagt nicht nur Artikel zahlen.

25
00:02:37,000 --> 00:02:43,000
Genauso wichtig, wenn nicht viel wichtiger, ist die Größe der Community, die Anzahl der aktiven Mitarbeitenden.

26
00:02:43,000 --> 00:02:50,000
Im Englischen haben wir über 120.000 Mitarbeitende, im Deutschen 17.000, ein Siebtel davon.

27
00:02:50,000 --> 00:02:53,000
Amharisch hatte im letzten Monat 56.

28
00:02:53,000 --> 00:02:57,000
Es wird schwierig, da mit einer aktuellen und vollständigen Sklopädie zu wucken.

29
00:02:57,000 --> 00:03:01,000
Wikimedia besteht halt aus vielen, vielen Communities.

30
00:03:01,000 --> 00:03:03,000
Manche davon groß, manche davon klein.

31
00:03:03,000 --> 00:03:07,000
Selbst innerhalb der deutschen Wikipedia haben wir zahlreiche kleine Communitys,

32
00:03:07,000 --> 00:03:13,000
die an bestimmten Projekten arbeiten, an bestimmten Teilen arbeiten, wo die Mitglieder alle überlappen sind und so weiter und so fort.

33
00:03:13,000 --> 00:03:18,000
Ein Teil davon sind zum Beispiel die Arbeiten an den Modulen.

34
00:03:18,000 --> 00:03:23,000
Und da sieht man halt, dass wir halt 800 und mehr Wikis sind, die alle unabhängig sind.

35
00:03:23,000 --> 00:03:27,000
Das ist das Modul Sports Table in der deutschen Wikipedia.

36
00:03:28,000 --> 00:03:38,000
Habt ihr vielleicht schon gesehen, das wird dann in verschiedenen Artikeln eingebunden, um diese Tabelle zu generieren, um Sportgruppen in ein Ranking zu bringen.

37
00:03:38,000 --> 00:03:42,000
Wie wir sehen, ist dieses Modul nicht besonders deutsch.

38
00:03:42,000 --> 00:03:47,000
Es ist auch keine Überraschung, weil es eigentlich aus der englischen Wikipedia rüber kopiert wurde und dann ein wenig übersetzt wurde.

39
00:03:47,000 --> 00:03:48,000
Und das war es auch schon.

40
00:03:48,000 --> 00:03:50,000
Das passierte so um 2017.

41
00:03:50,000 --> 00:03:54,000
Und seitdem ist auch nicht mehr viel passiert mit diesem Modul.

42
00:03:54,000 --> 00:03:59,000
Auf der englischen Wikipedia hingegen ist das ursprüngliche Modul munter weiterentwickelt worden.

43
00:03:59,000 --> 00:04:03,000
Und es ist eben der Vorteil, wenn man siebenmal so viele Leute ist.

44
00:04:03,000 --> 00:04:10,000
Das heißt, da ist sehr viel Arbeit eingeschränkt worden, die alles nicht in die deutsche Wikipedia übertragen wurden.

45
00:04:10,000 --> 00:04:13,000
Und geschweige das auch die Dokumentation nicht haben.

46
00:04:13,000 --> 00:04:17,000
Und das ist auch nicht ein Problem, dass jetzt die deutsche Wikipedia im Besonderen hat.

47
00:04:17,000 --> 00:04:20,000
Genau genommen ist die deutsche Wikipedia ziemlich vorteilig.

48
00:04:20,000 --> 00:04:23,000
Ich musste ein bisschen suchen, bis ich was gefunden habe, was hier ein Beispiel ist.

49
00:04:23,000 --> 00:04:26,000
In anderen Wikipediaen wäre das deutlich einfacher gewesen.

50
00:04:26,000 --> 00:04:32,000
Aber dieses Modul hier zum Beispiel wurde über 70 verschiedene Sprachen kopiert in verschiedensten Versionen.

51
00:04:32,000 --> 00:04:39,000
Und es ist halt dort in verschiedensten Ständen häufig in Kompatibilität zueinander vorhanden.

52
00:04:39,000 --> 00:04:44,000
Ein anderes Beispiel ist die Vorlage Alter.

53
00:04:44,000 --> 00:04:47,000
Wie gesagt, die deutsche Wikipedia ist richtig gut, was das eigentlich angeht.

54
00:04:47,000 --> 00:04:53,000
Die meisten Module und Vorlagen sind lokale Entwicklungen, werden lokal gepflegt.

55
00:04:53,000 --> 00:04:56,000
Wie hier eben die Vorlage Alter.

56
00:04:56,000 --> 00:05:05,000
Hier wird dann zum Beispiel verwendet in Sortikeln wie Franziska von Almsig, wo das Alter hier rechts in der Infobox berechnet wird und dargestellt wird.

57
00:05:05,000 --> 00:05:08,000
Und aktualisiert wird, wenn eben der Geburtstag passiert.

58
00:05:08,000 --> 00:05:10,000
Automatisch in dem Fall.

59
00:05:11,000 --> 00:05:18,000
Die Vorlage Alter oder entsprechend das Modul Age in anderen ist in sehr vielen Sprachen vorhanden.

60
00:05:18,000 --> 00:05:24,000
Wird oft einfach nur blind rüber kopiert, teilweise aus dem englischen, teilweise vielleicht aus einer anderen näher liegenden Sprache.

61
00:05:24,000 --> 00:05:27,000
Und Übersetzungen sind nicht mehr selbstverständlich.

62
00:05:27,000 --> 00:05:31,000
Es kann sein, dass teilweise Fehlermittlungen, soweit alle noch im Englisch sind.

63
00:05:31,000 --> 00:05:35,000
Auch ist es dann nicht besonders einfach, das zu übersetzen.

64
00:05:35,000 --> 00:05:47,000
Ganz schweigend davon, dass natürlich Änderungen daran nicht nachgeführt werden, dass das nicht mehr kompatibel ist, dass das Übersetzen von einer Sprache dann in die andere schwierig wird, auch für die Artikel.

65
00:05:47,000 --> 00:05:55,000
Eine Variante dieser Funktion wird wahrscheinlich auf Millionen von Wikipedia Artikeln verwendet in hunderten von Sprachen.

66
00:05:55,000 --> 00:05:59,000
Dieses Ding ist in mehr als 140 Sprachversionen verfügbar.

67
00:05:59,000 --> 00:06:04,000
Das aber auch bedeutet, dass es in genauso vielen Sprachversionen nicht vorhanden ist und nicht verfügbar ist.

68
00:06:04,000 --> 00:06:06,000
Dass man das eben da nicht überall verwenden kann.

69
00:06:06,000 --> 00:06:09,000
Es ist insgesamt ein ziemliches Wartungsdesaster.

70
00:06:11,000 --> 00:06:13,000
Und da will Wikifunctions ein bisschen helfen.

71
00:06:13,000 --> 00:06:18,000
So etwas wie das Alter zu berechnen, das können wir auch zentralisiert anbieten.

72
00:06:18,000 --> 00:06:26,000
Also eine Funktion in Wikifunctions, wo man dann zum Beispiel den Geburtstag eintritt und dann kriegt man das Alter zurück.

73
00:06:26,000 --> 00:06:29,000
Und das kann man dann uniform in den verschiedenen Wikipedia verwenden.

74
00:06:29,000 --> 00:06:32,000
Das ist grob die Idee, die wir für Wikifunctions haben.

75
00:06:32,000 --> 00:06:36,000
Es ist ein neues Projekt, welches vor ein paar Wochen an den Start gegangen ist.

76
00:06:36,000 --> 00:06:38,000
Wir sind sehr hoffnübergreifend.

77
00:06:38,000 --> 00:06:40,000
Ein bisschen holperig stattgehabt, wir sind noch nicht komplett offen.

78
00:06:40,000 --> 00:06:43,000
Das heißt, nicht jeder kann editieren, nicht jeder kann die Seiten benutzen.

79
00:06:43,000 --> 00:06:45,000
Wir arbeiten daran, beides zu ändern.

80
00:06:48,000 --> 00:06:52,000
Schauen wir uns eine super einfache Funktion in Wikifunctions an, wie das eigentlich dann aussieht.

81
00:06:52,000 --> 00:06:54,000
Das ist die logische Verneilung.

82
00:06:54,000 --> 00:07:00,000
Die logische Verneilung nimmt einen logischen Wahrheitswert, das ist entweder wahr oder falsch, und gibt das Gegenteil davon zurück.

83
00:07:00,000 --> 00:07:02,000
Das heißt, es gibt zwei Möglichkeiten, das zu verwenden.

84
00:07:02,000 --> 00:07:06,000
Auf der einen Seite sehen wir, wenn man wahr eingibt, kriegt man falsch zurück.

85
00:07:06,000 --> 00:07:08,000
Und wenn man falsch eingibt, kriegt man wahr zurück.

86
00:07:11,000 --> 00:07:18,000
Und hinter den Kulissen der Funktion sieht man jetzt ein bisschen, wie dann eine Funktion in Wikifunctions aufgebaut ist.

87
00:07:19,000 --> 00:07:25,000
Wir sehen auf der linken Seite, dass es einen Burschenwert, das Eingabe nimmt, und einen Burschenwert, das Ausgabe zurückgibt.

88
00:07:25,000 --> 00:07:30,000
Wir sehen auf der rechten Seite, dass wir insgesamt vier Implementierungen haben.

89
00:07:30,000 --> 00:07:34,000
Also vier Art und Weisen, wie die Verneilungsfunktion jetzt umgesetzt ist.

90
00:07:34,000 --> 00:07:36,000
Und drunter zwei Tests.

91
00:07:36,000 --> 00:07:38,000
Zwei Tests machen sehr viel Sinn.

92
00:07:38,000 --> 00:07:41,000
Es sind schließlich zwei mögliche Werte für die Funktion vorhanden.

93
00:07:41,000 --> 00:07:45,000
Wir sehen hier, dass alle diese Implementierungen, wir sehen, alle Tests bestehen.

94
00:07:45,000 --> 00:07:47,000
Schauen wir uns ein paar der Implementierungen an.

95
00:07:47,000 --> 00:07:49,000
Wie gesagt, das ist üblicherweise hinter den Kulissen.

96
00:07:49,000 --> 00:07:53,000
Das muss man nicht üblicherweise anschauen.

97
00:07:53,000 --> 00:07:56,000
Wir haben hier Implementierungen in verschiedenen Programmiersprachen.

98
00:07:56,000 --> 00:07:58,000
Einmal zum Beispiel in JavaScript.

99
00:07:58,000 --> 00:08:02,000
Das verwendet einen Ausrufezeichen-Operator, der in JavaScript-Verneilung bedeutet.

100
00:08:02,000 --> 00:08:04,000
Keine große Überraschung.

101
00:08:04,000 --> 00:08:05,000
Der Code ist nicht besonders lang.

102
00:08:05,000 --> 00:08:10,000
Das wird einfach nur dann quasi durch den Ausrufe-Operator ausgerechnet.

103
00:08:10,000 --> 00:08:14,000
In Python, das finde ich ein bisschen lesbarer, steht dann das englische Wort.

104
00:08:14,000 --> 00:08:16,000
Die Verneilung macht.

105
00:08:16,000 --> 00:08:22,000
Ist aber letztlich quasi, dass wir ein bisschen Code haben, der dann ausgeführt wird und die Verneilung ausführt.

106
00:08:22,000 --> 00:08:29,000
Was wir aber auch haben, und das finde ich viel spannender, ist das hier.

107
00:08:29,000 --> 00:08:35,000
Das ist jetzt keine Programmiersprache, sondern etwas, das wir Komposition oder Zusammenstellung nennen.

108
00:08:35,000 --> 00:08:38,000
Die deutsche WK-Functions-Community hat sich noch nicht auf den Begriff geeinigt.

109
00:08:38,000 --> 00:08:42,000
Einige Übersetzungen sind Komposition, andere Zusammenstellung.

110
00:08:42,000 --> 00:08:49,000
Was wir hier sehen, ist, dass die Verneilung aus anderen Funktionen in Mickey Functions zusammengefügt wird.

111
00:08:49,000 --> 00:08:52,000
In diesem Fall der Wenn-Funktion.

112
00:08:52,000 --> 00:08:54,000
Die Wenn-Funktion hat eine Bedingung.

113
00:08:54,000 --> 00:08:57,000
Dann und ein sonst.

114
00:08:57,000 --> 00:08:59,000
Ist die Bedingung wahr, gibt es das dann.

115
00:08:59,000 --> 00:09:00,000
In dem Fall falsch.

116
00:09:00,000 --> 00:09:02,000
Und sonst ist sonst.

117
00:09:02,000 --> 00:09:03,000
In dem Fall wahr.

118
00:09:03,000 --> 00:09:05,000
Das heißt, wenn es wahr ist, wird es falsch.

119
00:09:05,000 --> 00:09:09,000
Und ansonsten geht es rüber und gibt wahr zurück.

120
00:09:10,000 --> 00:09:18,000
Das interessante an dieser Komposition ist, dass sie komplett aus WK-Functions-Funktionen zusammengestöpselt ist.

121
00:09:18,000 --> 00:09:20,000
Und die können alle Übersetzungen haben.

122
00:09:20,000 --> 00:09:23,000
Dass wir das jetzt auf Deutsch sehen, ist, weil wir uns die deutsche Version anschauen.

123
00:09:23,000 --> 00:09:30,000
Ich kann das aber nicht nur auf Deutsch lesen und auch bearbeiten, sondern auch in anderen Sprachen wie zum Beispiel Englisch.

124
00:09:30,000 --> 00:09:32,000
Das heißt, ich kann das ganze Ding auch auf Englisch sein.

125
00:09:32,000 --> 00:09:36,000
Das ist so ein WK-Data, dass wir die Sicht einfach umschalten können in der anderen Sprache.

126
00:09:36,000 --> 00:09:38,000
Oder in Polnisch zum Beispiel.

127
00:09:38,000 --> 00:09:48,000
Das heißt, wir können hier zum ersten Mal für viele Menschen in ihrer Muttersprache Funktionen erstellen und verwenden.

128
00:09:50,000 --> 00:09:56,000
Hier ein paar weitere Beispiele von Funktionen, die wir bereits auf WK-Functions haben, die in den letzten paar Wochen erstellt wurden von der Community.

129
00:09:58,000 --> 00:10:01,000
Diese Funktion hier, Bustabiere mit dem Nato-Alphabet.

130
00:10:01,000 --> 00:10:05,000
Nimmt ein Wort und sagt mir, wie ich das im Nato-Alphabet bustabieren würde.

131
00:10:05,000 --> 00:10:09,000
Das heißt, ich gebe zum Beispiel Lins ein und es sagt mir Lima, India, November, Zulu.

132
00:10:09,000 --> 00:10:12,000
Und dann kann ich entsprechen mit anderen Worten und dann auch versuchen.

133
00:10:12,000 --> 00:10:16,000
Oder hier, das ist die Lieblingsfunktion von meiner Tochter.

134
00:10:16,000 --> 00:10:18,000
Sie ist 9 Jahre alt.

135
00:10:18,000 --> 00:10:22,000
Also das nimmt eine Zeichenkette und dreht diese um.

136
00:10:22,000 --> 00:10:32,000
Das heißt, sie kann hier eintragen, was sie möchte, drückt dann auf die Funktion berechnen und kriegt dann als Antwort zurück, was sie haben wollte.

137
00:10:32,000 --> 00:10:38,000
Meine Tochter ist sehr stolz darauf, den Computer dazu zu bringen, Sachen zu sagen, die sie nicht sagen darf.

138
00:10:40,000 --> 00:10:44,000
Hier ist ein anderes Beispiel, mehr in der linguistischen Ecke.

139
00:10:44,000 --> 00:10:52,000
Diese Funktion nimmt die infinite Form eines deutschen Verbs und erzeugt die regelmäßige erste Person im Singular Presence.

140
00:10:52,000 --> 00:10:57,000
Das kann eine Hilfe sein, zum Beispiel lexiografische Daten in Digidate zu verbessern und einzutragen, zu prüfen.

141
00:10:57,000 --> 00:11:01,000
Oder für Victionary, um die Beugung zu erzeugen und darzustellen.

142
00:11:01,000 --> 00:11:04,000
Oder eben als Beispiel für Generierung der Sprache.

143
00:11:04,000 --> 00:11:10,000
Wie genau wir das verwenden werden, ist ein längere Diskussion, das können wir dann auch später haben.

144
00:11:10,000 --> 00:11:14,000
Aber hier ist ein Beispiel dafür, dass wir solche linguistische Funktionen haben können.

145
00:11:14,000 --> 00:11:23,000
Und das Ziel von Wikifunction ist es dann auch, eine große Menge von solchen Funktionen anzubieten, mit denen wir Sprache generieren möchten.

146
00:11:23,000 --> 00:11:25,000
Dazu komme ich in einen Moment.

147
00:11:26,000 --> 00:11:34,000
Hier sehen wir da solche Funktionen, und das ist unsere Hoffnung, durchaus auch von linguistisch Interessierten, nicht Entwicklern entstellt werden können.

148
00:11:34,000 --> 00:11:41,000
Wir sehen hier, dass wir neben den Wortstamm, wir verbinden das dann mit dem Buchstaben E.

149
00:11:41,000 --> 00:11:43,000
Und das erzeugt dann auch die Funktion.

150
00:11:43,000 --> 00:11:47,000
Das heißt zum Beispiel aus dem Infiniti-V-Lesen wird auf Wortstamm genommen, was das Lese wird.

151
00:11:47,000 --> 00:11:51,000
Wir fügen das E hinzu und dann kann man Lese. Und das wäre dann Ich Lese.

152
00:11:51,000 --> 00:11:53,000
Das ist halt nur die richtige Form.

153
00:11:53,000 --> 00:11:58,000
Und die Idee ist halt, dass solche Sachen jetzt geschrieben werden können, ohne dass man jetzt ein Programmierer sein muss,

154
00:11:58,000 --> 00:12:05,000
sondern dass Leute, die sich für eine bestimmte Sprache interessieren, nicht müssen ja auch keine Linguisten sein,

155
00:12:05,000 --> 00:12:08,000
eben der Lage sind, das dann häufig auch zu programmieren.

156
00:12:08,000 --> 00:12:10,000
Oder zu erstellen.

157
00:12:10,000 --> 00:12:18,000
Wie gesagt, eines der Hauptziele für Wikifunction ist es dann, einen Katalog von Funktionen zu erstellen, natürlich Sprache und Texte anzubieten.

158
00:12:19,000 --> 00:12:26,000
Am letzten Endes ist das Ziel dann, Wikipedia-Artikel oder Teile von Wikipedia-Artikeln daraus erstellen zu können,

159
00:12:26,000 --> 00:12:30,000
um Lücken in den Wikipedien zu schließen, die jetzt da sind.

160
00:12:30,000 --> 00:12:36,000
Weil, wie wir gesehen haben, Wikipedien sind sehr, sehr ungleich, was Inhalte angeht.

161
00:12:36,000 --> 00:12:40,000
Das heißt, wir haben teilweise sehr viele Lücken in Sprache, die wir am haarisch entfüllen können.

162
00:12:40,000 --> 00:12:45,000
Und das grundlegende Problem, das Kernproblem der ganzen Sache ist, dass die Wikipedias Kosten

163
00:12:45,000 --> 00:12:52,000
durch die Anzahl der Themen, die wir abdecken, mal die Anzahl der Sprachen, die wir unterstützen möchten, gebildet werden.

164
00:12:52,000 --> 00:12:58,000
Das heißt, wir haben 20 Millionen Themen, zu denen wir Wikipediatikel haben, in 300 Sprachen erwilligen können,

165
00:12:58,000 --> 00:13:00,000
damit müssen wir eben 6 Milliarden Artikel haben.

166
00:13:00,000 --> 00:13:05,000
Das sind so 60 Millionen Artikel, auch nur ein Prozent dessen, was wir erreichen möchten.

167
00:13:05,000 --> 00:13:11,000
Wenn wir aber hingegen diese Multiplikation jetzt in eine Addition verwandeln können,

168
00:13:11,000 --> 00:13:18,000
dann haben wir eine Menge von Arbeit, die wir jetzt bereits abdecken können.

169
00:13:18,000 --> 00:13:25,000
Dann kommen wir runter zu den 20 Millionen Artikeln, die wir eigentlich schreiben möchten.

170
00:13:25,000 --> 00:13:32,000
Und die Behauptung ist, dass es eben das ist, was wir mit Wikidata und Wikifunction sammeln leisten können.

171
00:13:32,000 --> 00:13:35,000
Wikidata geht ja schon ein wenig in diese Richtung.

172
00:13:36,000 --> 00:13:42,000
Es ist immer dieselben Inhalte, egal in welcher Sprache man das jetzt anschaut oder bearbeitet.

173
00:13:42,000 --> 00:13:47,000
Ich kann auch hebräisch etwas in Wikidata ändern, ist sofort auf Deutsch sichtbar und verfügbar.

174
00:13:47,000 --> 00:13:56,000
Und nicht nur in Hebräisch und Deutsch, auch in fast 500 anderen Sprachen ist inzwischen Wikidata verfügbar und kann bearbeitet werden.

175
00:13:56,000 --> 00:14:01,000
Wir haben mehr als 100 Millionen Datenobjekte in Wikidata zusammengesammelt,

176
00:14:01,000 --> 00:14:07,000
die anderthalb Milliarden Beziehungen und Werte miteinander verknüpft sind.

177
00:14:07,000 --> 00:14:14,000
Wikidata hatte im letzten Monat über 23.000 aktive Freiwilligen, die daran mitgearbeitet haben.

178
00:14:14,000 --> 00:14:19,000
Vielen Dank dafür, vielen Dank auch für jeden hier im Raum, der daran mitarbeitet.

179
00:14:19,000 --> 00:14:25,000
Und hat fast zwei Milliarden Bearbeiter hier durchgeführt, was das meist bearbeitete Wikidewelt macht.

180
00:14:26,000 --> 00:14:31,000
In mehr und mehr Teilen der Wikipädias fließen Wikidata-Inhalte ein.

181
00:14:31,000 --> 00:14:37,000
Wir haben hier zum Beispiel ein Beispiel aus der Urdo-Wikipedia, das ist der Titel zu Jupiter.

182
00:14:37,000 --> 00:14:41,000
Die Infobox kommt fast ausschließlich aus Wikidata.

183
00:14:41,000 --> 00:14:44,000
Die Referenzen, die unten dran stehen, sind meistens aus Wikidata.

184
00:14:44,000 --> 00:14:46,000
Die Side-Links sind aus Wikidata.

185
00:14:46,000 --> 00:14:54,000
Mehr und mehr Daten kommen aus Wikidata und füllen Blüten, die wir zurzeit haben in den Wikipädias.

186
00:14:55,000 --> 00:14:59,000
Und das ist genau dieses Ziel, dass wir eben den Inhalte nur einmal verwalten,

187
00:14:59,000 --> 00:15:07,000
aber dann in verschiedenen Sprachen darstellen können und dadurch eben die Kosten für das Wikipedia-Projekt dramatisch senken können.

188
00:15:09,000 --> 00:15:15,000
Ist es jetzt alles, was wir machen müssen, alle Daten aus Wikipädias nach Wikidata schaufeln und wir sind fertig?

189
00:15:15,000 --> 00:15:17,000
Bei mir ist es natürlich für das, dass es nicht funktioniert.

190
00:15:17,000 --> 00:15:22,000
Wikidata ist ja deutlich weniger aussagekräftig als Wikipedia.

191
00:15:22,000 --> 00:15:26,000
In Wikipedia können wir ja alles sagen, was irgendwie in Sprache möglich ist.

192
00:15:26,000 --> 00:15:30,000
In Wikidata geht das nicht. Wir können Narrative nicht wirklich darstellen.

193
00:15:30,000 --> 00:15:34,000
Beschreibende Referenzen funktionieren nicht. Redundanz funktioniert nicht.

194
00:15:34,000 --> 00:15:37,000
Lass uns ein Beispiel anschauen, Redundanz.

195
00:15:37,000 --> 00:15:43,000
Wir müssen uns jetzt zum Beispiel den Jupiter-Artikel nochmal anschauen.

196
00:15:43,000 --> 00:15:45,000
Das ist der Artikel, wie im Deutsch.

197
00:15:45,000 --> 00:15:49,000
Da haben wir diesen Satz, dass Jupiter der größte Planet im Sonnensystem ist.

198
00:15:49,000 --> 00:15:53,000
Diese Information ist nicht explizit in Wikidata abgebildet.

199
00:15:53,000 --> 00:15:58,000
Es gibt keine Aussage in Wikidata, die sagt, das ist jetzt der größte Planet im Sonnensystem.

200
00:15:58,000 --> 00:16:02,000
Was wir haben, wir kennen die Masse aller Planeten-Sonnensystems.

201
00:16:02,000 --> 00:16:06,000
Wir können entsprechend eine Anfrage stellen und fragen, wie groß sind die?

202
00:16:06,000 --> 00:16:10,000
Wir kriegen dann Antwort zu, dass das Jupiter-Artikel groß ist, aber das ist implizit.

203
00:16:10,000 --> 00:16:15,000
Wir können nicht jedes Mal, wenn wir den Jupiter-Artikel schreiben möchten, das überprüfen, ob das immer noch der Fall ist.

204
00:16:15,000 --> 00:16:17,000
Wir sind zu weit.

205
00:16:17,000 --> 00:16:20,000
Und außerdem, wer entscheidet, was wir noch eintragen möchten?

206
00:16:20,000 --> 00:16:25,000
Möchten wir dann für Merko eintragen, ist er der neungrößte Planet oder so ein Achtgrößter?

207
00:16:25,000 --> 00:16:29,000
Wie tragen wir das Ganze ein?

208
00:16:32,000 --> 00:16:38,000
Wie gesagt, in Wikidata ist die Information, dass Jupiter der größte Planet ist, nicht explizit festgehalten.

209
00:16:38,000 --> 00:16:42,000
Wenn wir dieses Beispiel genau anschauen, wäre die Idee,

210
00:16:42,000 --> 00:16:48,000
dass wir das vielleicht in einer Art von Konstrukte, in einer Art Schablone oder Template einfangen können.

211
00:16:48,000 --> 00:16:54,000
Die Idee ist relativ einfach, wird aber schnell komplizierter, aber ich will sie kurz darstellen.

212
00:16:54,000 --> 00:16:58,000
Also stellen wir uns vor, dass so eine Aussage jetzt in einer Art Schablone wie hier eingefangen wird.

213
00:16:58,000 --> 00:17:00,000
Wir möchten ein Superlativ ausdrücken.

214
00:17:00,000 --> 00:17:02,000
Es geht über Jupiter, das ist Jupiter.

215
00:17:02,000 --> 00:17:04,000
Wir möchten über die Masse reden.

216
00:17:04,000 --> 00:17:08,000
Es geht davon, welche Arte ist Planet und im Sonnensystem.

217
00:17:08,000 --> 00:17:14,000
Es ist nicht so dramatisch wichtig, ob exakt dieser Satz generiert wird, Jupiter ist der größte Planet im Sonnensystem,

218
00:17:14,000 --> 00:17:18,000
oder vielleicht dieser Satz, der massereichste Planet im Sonnensystem ist Jupiter.

219
00:17:18,000 --> 00:17:26,000
Was viel wichtiger ist, ist, dass diese Schablone auch verwendet werden kann, um denselben Satz in einer anderen Sprache zu generieren.

220
00:17:26,000 --> 00:17:29,000
Wie zum Beispiel in meiner Muttersprache, Kroatisch.

221
00:17:29,000 --> 00:17:33,000
Jupiter, der Planet, ist eine Neibelsche Masse und so ein Schablonszustand.

222
00:17:34,000 --> 00:17:41,000
Die Idee ist dann, dass wir diese Inhalte hernehmen können, dieses gefüllten Schablons,

223
00:17:41,000 --> 00:17:47,000
und sie durch einen Renderer, durch etwas, was es in einen natürlichsprachigen Text rüberschieben kann.

224
00:17:47,000 --> 00:17:53,000
Das würde dann zum Beispiel in Deutsch so aussehen, wir nehmen das Subjekt im Nominativ,

225
00:17:53,000 --> 00:17:56,000
verfügen ein Ist hinzu, wir nehmen jetzt einen bestimmten Artikel und so weiter,

226
00:17:56,000 --> 00:18:03,000
und das baut dann diesen Satz auf Stück für Stück, um ihn dann aus diesem Schablone direkt rüber zu verwandeln.

227
00:18:03,000 --> 00:18:10,000
Ein Beispiel, wir können es dann anschauen, hier zum Beispiel möchten wir den bestimmten Artikel hinzufügen,

228
00:18:10,000 --> 00:18:15,000
in dem Geschlecht von dem Arsch, das heißt im Geschlecht vom Planet.

229
00:18:15,000 --> 00:18:19,000
Das heißt, wir können rüberspringen zur Vekidata, schauen uns das Planet mal an,

230
00:18:19,000 --> 00:18:24,000
was ist das Geschlecht vom Planet, das ist aha, ok, maskulinmännlich, gehen wir wieder zurück,

231
00:18:24,000 --> 00:18:28,000
und jetzt kann ich also der verwenden, und hier generiere ich jetzt das Wort der, das Jupiter ist der,

232
00:18:28,000 --> 00:18:31,000
und dann gehe ich zum nächsten Wort und so weiter und so fort.

233
00:18:31,000 --> 00:18:35,000
Wir sehen, wir brauchen hier eine zahlreiche Funktion, wir müssen alle zusammengestöpselt werden,

234
00:18:35,000 --> 00:18:40,000
alles muss zusammenspielen, und am Ende haben wir dann eine Architektur,

235
00:18:40,000 --> 00:18:44,000
die wir zum Beispiel die Daten und Konstrukturen in Vekidata speichern,

236
00:18:44,000 --> 00:18:48,000
ob das wirklich passiert, müssen wir noch ausdiskutieren, das finden wir in den nächsten paar Monaten heraus,

237
00:18:48,000 --> 00:18:53,000
haben dann die Funktionen in Veki Functions, die erstellen die Texte aus den Vekidata Daten,

238
00:18:53,000 --> 00:18:59,000
und die Texte können dann in den Wikipedia verwendet werden, um Lücken zu füllen.

239
00:18:59,000 --> 00:19:03,000
Es ist mir ganz wichtig, es geht nicht darum, die bestehenden Artikel in irgendeiner Weise zu ersetzen,

240
00:19:03,000 --> 00:19:07,000
sondern eben da, wo wir keine Inhalte haben, das anbieten zu können.

241
00:19:07,000 --> 00:19:14,000
Das ist nicht so dramatisch wichtig für viele deutsche Artikel, aber für viele andere Sprachen wird das unglaublich hilfreich sein.

242
00:19:14,000 --> 00:19:22,000
Was wir nun haben, ist eine Infrastruktur, in welche die Inhalte unabhängig von den Sprachen erstellt und gewartet werden.

243
00:19:22,000 --> 00:19:28,000
Das ist genau eine Architektur oder Infrastruktur, die wir haben möchten, um diese Formel zu erfüllen,

244
00:19:28,000 --> 00:19:34,000
dass wir die Kosten für Wikipedia aus den Anzahl der Themen plus die Anzahl der Sprachen erstellen.

245
00:19:34,000 --> 00:19:40,000
Das heißt, wir müssen für jede Sprache diese Funktionen erstellen, wir erstellen für jeden Thema diese Inhalte,

246
00:19:40,000 --> 00:19:45,000
und das war's, wir machen das nicht mehr als Multiplikation, sondern eben als Addition.

247
00:19:45,000 --> 00:19:47,000
Aber Wikifunctions wird sogar noch mehr als das.

248
00:19:47,000 --> 00:19:53,000
Ich meine, das ist schon ziemlich ambitioniert, was wir hier erreichen möchten.

249
00:19:53,000 --> 00:19:58,000
Aber das Erstellen von Texten für die Wikipedien ist ein wichtiges Ziel für Wikifunctions,

250
00:19:58,000 --> 00:20:01,000
aber es steckt noch ein bisschen mehr daran, was wir da erreichen möchten.

251
00:20:01,000 --> 00:20:11,000
Wir möchten ein Projekt erstellen, das quasi Wikipedia jetzt aber zum automatischen Berechnen von Antworten für bestimmte Fragen funktionieren kann.

252
00:20:11,000 --> 00:20:17,000
Es ist ein neues Wikimedia-Projekt, also auf derselben Ebene Wikidata, Commons oder Wikisos,

253
00:20:17,000 --> 00:20:23,000
und es ist unser erstes neues Wikimedia-Projekt seit 2012, das Wikidata loslegte.

254
00:20:23,000 --> 00:20:28,000
Wie wir gesehen haben, ist es vielsprachig, nicht nur in Bezug auf natürliche Sprachen, sondern auch auf programmierte Sprachen.

255
00:20:28,000 --> 00:20:33,000
Wir können zurzeit in JavaScript oder in Pythagore mehr Sprachen, mehr Sprachen sind geplant.

256
00:20:33,000 --> 00:20:38,000
Ein paar Funktionen haben wir gezeigt, da haben wir auch einiges von der Sprache,

257
00:20:38,000 --> 00:20:43,000
ein paar Funktionen haben wir gezeigt. Was genau meine mit Funktionen?

258
00:20:43,000 --> 00:20:51,000
Das ist eine Art Rezept, eine Folge von Anweisungen, die es dem Computer erlaubt, aus einer Eingabe, aus einer Frage,

259
00:20:51,000 --> 00:20:56,000
automatisch unmittelholbar eine Ausgabe, eine Antwort zu erstellen.

260
00:20:56,000 --> 00:21:03,000
Also Funktionen beantworten Fragen, und Funktionen können Fragen zuversichtlich beantworten,

261
00:21:03,000 --> 00:21:06,000
auch wenn diese Frage noch nie jemand gestellt hat.

262
00:21:06,000 --> 00:21:13,000
Das finde ich wirklich wichtig. Selbst wenn du die allererste Person in der Welt bist, diese Frage stellt,

263
00:21:13,000 --> 00:21:18,000
wenn du eine Funktion hast, der du vertraust, dann weißt du, dass die Antwort richtig sein wird.

264
00:21:18,000 --> 00:21:23,000
Und um ihr zu vertrauen, finde ich es ist wichtig, dass die Funktion eben offen verfügbar ist,

265
00:21:23,000 --> 00:21:28,000
dass du so reinschauen kannst, wie sie jetzt aufgebaut ist, dass du testest, dass es eine Community hinterstellt.

266
00:21:28,000 --> 00:21:33,000
Genauso mit den selben Gründen, womit du Wikipedia vertraust, wirst du dann hoffentlich auch Wikifangstens vertrauen können,

267
00:21:33,000 --> 00:21:36,000
dass die Funktionen auch korrekt berechnen können.

268
00:21:36,000 --> 00:21:41,000
Und was das auch bedeutet, ist, diese Funktionen sind Wissen, weil sie beantworten Fragen.

269
00:21:41,000 --> 00:21:45,000
Und sie können sogar neues Wissen generieren.

270
00:21:45,000 --> 00:21:51,000
Die großen Technologie-Giganten wissen das ja schon mal so lang und erlauben uns seit Jahren,

271
00:21:51,000 --> 00:21:53,000
bestimmte Funktionen zu beantworten.

272
00:21:53,000 --> 00:22:01,000
Wir können auf Serie gehen, fragen, wie viele Kilometer in einem KMH in Meilen pro Stunde,

273
00:22:01,000 --> 00:22:04,000
und prompt berechnet mir Serie eine Antwort.

274
00:22:04,000 --> 00:22:08,000
Ich kann rüber zu Bing gehen und fragen, wie alt ist Franziska von Almsack?

275
00:22:08,000 --> 00:22:14,000
Und genauso wie die deutsche Wikipedia-Forger berechnet mir hier Bing die Antwort und zeigt sie mir an.

276
00:22:14,000 --> 00:22:17,000
Ist nicht anders, als ob ich es mir auch mit der Vorlage altig hier mache.

277
00:22:17,000 --> 00:22:23,000
Ich kann zu DuckDuckGo gehen, eine Mathematik-Aufgabe eingeben und es in den Orte auch hinlassen.

278
00:22:23,000 --> 00:22:27,000
Wohlgemerkt, Bing, DuckDuckGo, Google, das sind alle Suchmaschinen.

279
00:22:27,000 --> 00:22:32,000
Was wir aber hier erhalten, sind keine Suchergebnisse, sondern Funktionen, die wir berechnen.

280
00:22:32,000 --> 00:22:37,000
Über den Knowledge Graphen, über Microsoft Satori, der In-House-Rasun von Wikidata.

281
00:22:37,000 --> 00:22:40,000
Und genau dasselbe möchten wir auch anbieten, möchten erweitern,

282
00:22:40,000 --> 00:22:43,000
dass wir nicht nur das expezifische Wissen der Wikipedia haben,

283
00:22:43,000 --> 00:22:48,000
sondern eben auch den Funktionsraum abdecken können und mehr Fragen beantworten können an zur Zeit.

284
00:22:48,000 --> 00:22:51,000
Mein lieblingsbeispiel für eine Funktion hier ist in Google.

285
00:22:51,000 --> 00:22:55,000
Wenn ich in Google auf Englisch nach dem Volumen einer Pyramide frage,

286
00:22:55,000 --> 00:23:01,000
erhalte ich dieses Formular mit der Skizze der Pyramide, den relevanten Variablen der Formel.

287
00:23:01,000 --> 00:23:03,000
Ich kann die Werte für die Variable eintragen.

288
00:23:03,000 --> 00:23:07,000
Es drückt diese Werte in die Formel ein und berechnet das Ergebnis.

289
00:23:07,000 --> 00:23:10,000
Das ist wunderschön. Das funktioniert wirklich toll.

290
00:23:10,000 --> 00:23:14,000
Wenn ich das auf Deutsch versuche, ist es nicht vorhanden.

291
00:23:14,000 --> 00:23:18,000
Und schlimmer, der Schnipsel, der es mir anzeigt, ist auch noch falsch.

292
00:23:18,000 --> 00:23:21,000
Das ist ja nicht 13-mal ABC, es ist ein Drittel mal ABC,

293
00:23:21,000 --> 00:23:27,000
aber der Bruchstrich fällt weg beim Scraping von Google und das Ergebnis ist komplett falsch.

294
00:23:27,000 --> 00:23:32,000
Aber es kann auch nicht angehen, dass die Technologiefirmen hier entscheiden,

295
00:23:32,000 --> 00:23:38,000
welche Funktion, welches Wissen ich zur Verfügung habe, welche Funktion ich verwenden kann, welche nicht,

296
00:23:38,000 --> 00:23:41,000
und was jetzt interessant ist und was nicht.

297
00:23:41,000 --> 00:23:46,000
Funktion sind Wissen und Wissen ist unsere Mission, ist unsere Aufgabe.

298
00:23:47,000 --> 00:23:52,000
Es geht ja schließlich darum, eine Welt zu machen, in der jeder an Wissen beitragen kann,

299
00:23:52,000 --> 00:23:57,000
in der jeder Wissen beitragen kann, Funktionen erstellen kann, Funktionen benutzen kann.

300
00:23:57,000 --> 00:24:00,000
Deswegen habe ich am Anfang an unsere Vision erinnert.

301
00:24:00,000 --> 00:24:05,000
Es ist eben nicht nur eine Encyclopädie gemeint hiermit, sondern auch andere Formen von Wissen.

302
00:24:05,000 --> 00:24:11,000
Wie eben ein Katalog von Funktion der Fragen beantworten kann.

303
00:24:11,000 --> 00:24:16,000
Wir möchten den Zugriff auf Funktionen und die Mitarbeit an Funktionen radikal demokratisieren.

304
00:24:16,000 --> 00:24:21,000
Wir möchten eine Standardbibliothek an Funktionen auf vielerlei Art und Weise zugänglich machen

305
00:24:21,000 --> 00:24:25,000
und allen Wikimedia-Projekten zur Verfügung stellen, damit man es auch von einer Sprache

306
00:24:25,000 --> 00:24:27,000
leicht in die nächste Sprache übertragen kann.

307
00:24:27,000 --> 00:24:33,000
Wir möchten zusammen eine Bibliothek zur Generierung von Texten über 300 Millionen Sprachen erstellen

308
00:24:33,000 --> 00:24:37,000
und dann mit deren Hilfe Lücken in den Wikibäen anschließen.

309
00:24:37,000 --> 00:24:39,000
Das ist die Mission von Wikifunctions.

310
00:24:39,000 --> 00:24:41,000
Besucht uns auf Wikifunctions.

311
00:24:41,000 --> 00:24:45,000
Wie gesagt, wir sind zurzeit noch nicht komplett offen, aber wir sind da, wir sind benutzbar.

312
00:24:45,000 --> 00:24:50,000
Wir arbeiten daran, mehr Leute Wikifunctions benutzen lassen zu können, bearbeiten lassen zu können.

313
00:24:50,000 --> 00:24:53,000
Wenn ihr Benutzerrechte haben wollt, fragt mich.

314
00:24:53,000 --> 00:24:55,000
Wir haben eine Seite, die ist von der Hauptseite anklickbar.

315
00:24:55,000 --> 00:24:58,000
Ich richte euch gerne den Account ein.

316
00:24:58,000 --> 00:25:02,000
In ein paar Wochen schalten wir das dann auch für alle frei, sodass alle benutzen können

317
00:25:02,000 --> 00:25:05,000
und dass mehr Leute editieren können, das ist ein Zeichen anderen.

318
00:25:05,000 --> 00:25:11,000
Wir arbeiten noch an einigen Hintergrundsachen, die uns das gerade nicht erlauben.

319
00:25:11,000 --> 00:25:14,000
Vielen Dank für eure Aufmerksamkeit.

320
00:25:14,000 --> 00:25:17,000
Ich würde mich über Fragen und Diskussionen freuen,

321
00:25:17,000 --> 00:25:22,000
wenn ich das richtig übersehe, haben wir noch genug Zeit, trotz der Verspäteten anfangs.

322
00:25:22,000 --> 00:25:28,000
Jetzt aber sollte ich die Leute sehen, wie sie hören können.

323
00:25:28,000 --> 00:25:31,000
Es wird hier nicht viel mit den Fragen beantworten.

324
00:25:35,000 --> 00:25:52,000
So, könntest du uns hören?

325
00:25:52,000 --> 00:25:54,000
Ich höre euch, danke.

326
00:25:54,000 --> 00:25:59,000
Okay, dann werde ich jetzt mal das Mikrofon rumreichen.

327
00:25:59,000 --> 00:26:01,000
Gibt es hier Fragen aus dem Raum?

328
00:26:06,000 --> 00:26:11,000
Falls es keine Fragen gibt, werde ich in Zukunft meine Vorträge schlechter machen, sodass mir Fragen übrig bleiben.

329
00:26:11,000 --> 00:26:19,000
Also, hallo, ich habe eine Frage zu Programmiersprachen.

330
00:26:19,000 --> 00:26:26,000
In welche Sprache denkst du, werden die Funktionen Biggie Functions übersetzt,

331
00:26:26,000 --> 00:26:32,000
in denen es aktuell keine Tabellenkalkulationsfunktionen der entsprechenden Sprache gibt?

332
00:26:33,000 --> 00:26:39,000
Als hast du zu Beginn erwähnt, dass es Menschen dadurch möglich sein wird, ihre eigene Sprache zu programmieren.

333
00:26:39,000 --> 00:26:48,000
Ich persönlich habe die Meinung, dass auch jetzt schon Tabellenkalkulationsfunktionen viele Sprachen übersetzt sind.

334
00:26:48,000 --> 00:26:53,000
Scheinst du davon überzeugt zu sein, dass es in eine weitere Sprache übersetzt wird?

335
00:26:53,000 --> 00:26:56,000
Da würde ich interessieren, welche ist das?

336
00:26:56,000 --> 00:26:58,000
Zum Beispiel Amharisch.

337
00:26:58,000 --> 00:27:03,000
Nach meinem besten Wissen und Gewissen gibt es keine Übersetzungen von Tabellenkalkulationssprachen,

338
00:27:03,000 --> 00:27:05,000
nämlich Amharische und andere.

339
00:27:05,000 --> 00:27:08,000
Es gibt auch zahlreiche Sprachen.

340
00:27:08,000 --> 00:27:11,000
Wir unterstützen ja von Haus aus 300 Sprachen.

341
00:27:11,000 --> 00:27:22,000
Und selbst in einer Umgebung wie Google Sheets oder Excel hat es Übersetzungen in 40, 30 Sprachen, wenn es hochkommt.

342
00:27:22,000 --> 00:27:25,000
Da möchte ich noch deutlich mehr unterstützen.

343
00:27:25,000 --> 00:27:29,000
Auch sind Tabellenkalkulationen...

344
00:27:29,000 --> 00:27:36,000
Das Culler an Tabellen ist tatsächlich, dass es die am weitesten verwendete Programmiersprache ist in der Welt,

345
00:27:36,000 --> 00:27:43,000
auch wenn sie von vielen Programmieren oft belächelt wird, weil sie innerhalb von Tabellenkalkulationen sind.

346
00:27:43,000 --> 00:27:47,000
Aber ich glaube, das ist tatsächlich ein fantastisches Modell dafür,

347
00:27:47,000 --> 00:27:56,000
wie weit wir erreichen, wie weit wir rausgehen möchten, wie weit wir erreichbar sein möchten,

348
00:27:56,000 --> 00:28:00,000
wie viele Leute wir erreichen können mit Solos und Wiki Functions.

349
00:28:08,000 --> 00:28:10,000
Das Projekt finde ich zunächst mal interessant.

350
00:28:10,000 --> 00:28:13,000
Mir ist nur der Use-Case nicht da.

351
00:28:13,000 --> 00:28:16,000
Soll es im Prinzip ein Projekt sein,

352
00:28:16,000 --> 00:28:22,000
dass es möglich sein sollte, effizienter Wikipedia-Artikel zu schreiben?

353
00:28:22,000 --> 00:28:25,000
Oder soll es im Prinzip so eine Art Schwesterprojekt sein,

354
00:28:25,000 --> 00:28:35,000
dass man von mir aus seinen Nettogehalt ausrechnen lassen kann oder Kilometerzahlen ausgeben lassen kann?

355
00:28:35,000 --> 00:28:38,000
Also etwas, was man auch schon über den Taschenrechner machen kann.

356
00:28:38,000 --> 00:28:40,000
Ja, beides.

357
00:28:40,000 --> 00:28:46,000
Beides. Wir sollen, genauso wie Wikidata ja auch beides ist,

358
00:28:46,000 --> 00:28:55,000
Wikidata ist sowohl dafür da, um effizienter zwischen den Wikipedia-strukturierten Daten zusammenhalten zu können,

359
00:28:55,000 --> 00:29:00,000
aber auch natürlich, dass man direkt zum Beispiel Spark-Lanfragen stellen kann,

360
00:29:00,000 --> 00:29:07,000
oder dass es andere Anwendungen, die Daten verwendbarkennbar können.

361
00:29:08,000 --> 00:29:14,000
Also ja, wir möchten sowohl den Nettogehalt ausrechnen können, wenn ein Prozentzeitzeit,

362
00:29:14,000 --> 00:29:22,000
aber im Gegensatz zu den Taschenrechnern glaube ich, dass Funktionen viel mehr können als nur Zahlen berechnen können.

363
00:29:22,000 --> 00:29:25,000
Und viele der Funktionen, die wir haben werden, werden auf Wörtern funktionieren.

364
00:29:25,000 --> 00:29:32,000
Wir haben jetzt schon Beispiele in der Gartnung auf Melodien Funktionen laufen lassen,

365
00:29:32,000 --> 00:29:40,000
um zum Beispiel Ziele in einer anderen Tonart zu übertragen und so weiter und so fort.

366
00:29:40,000 --> 00:29:45,000
Funktionen können ja viel mehr sein als nur Berechnungen auf Zahlen.

367
00:29:45,000 --> 00:29:52,000
Und innerhalb der Wikipedia sind Funktionen auch immer sehr hilfreich.

368
00:29:52,000 --> 00:29:58,000
Einerseits, um Sachen darzustellen wie eben das Alter in dem Artikel, das wir gesehen haben,

369
00:29:58,000 --> 00:30:05,000
aber auch vielmehr, um zu schauen, ob zum Beispiel die Inhalte in der Wikipedia Konsistenz sind, um zu prüfen.

370
00:30:05,000 --> 00:30:09,000
Zum Beispiel, wir haben hier die Einwohnerzahl, wir haben hier die Fläche,

371
00:30:09,000 --> 00:30:16,000
Stimmen, die Bevölkerungsdichte, die hier eingegeben ist, auch können wir da zum Beispiel ausrechnen und schauen,

372
00:30:16,000 --> 00:30:18,000
ist das nahe genug dran oder ähnliches.

373
00:30:18,000 --> 00:30:30,000
Oder auch interessant, wir haben zum Beispiel Geo-Koordinaten und Geo-Shapes, also so Geo, wie heißt das auf Deutsch,

374
00:30:30,000 --> 00:30:34,000
Grenzen quasi für Gebiete in Commons.

375
00:30:34,000 --> 00:30:40,000
Und da können wir auch zum Beispiel schauen, passt zum Beispiel dieses Geo-Shape, was wir jetzt in Commons haben,

376
00:30:40,000 --> 00:30:42,000
zu der Fläche, die wir angegeben haben und ähnliches.

377
00:30:42,000 --> 00:30:49,000
Das heißt, wir können viel mehr Sachen als besser ausrechnen und prüfen, ob das jetzt konsistent ist in der Wikipedia.

378
00:30:49,000 --> 00:30:55,000
Wir haben nicht einen einzigen Use-Case im Ziel mit Wikifunctions, sondern mehrere.

379
00:30:55,000 --> 00:30:59,000
Einerseits Wikifunctions als eigenständiges Projekt, zu beantworten von solchen Fragen.

380
00:30:59,000 --> 00:31:06,000
Andererseits, um den Wikipedien helfen, um Inhalte in Mehrsprachen anbieten zu können,

381
00:31:06,000 --> 00:31:09,000
aber auch die Konsistenz von Wikipedia prüfen zu können.

382
00:31:09,000 --> 00:31:15,000
Wir warten durchaus, dass wir zahlreiche verschiedene Use-Cases bedienen werden.

383
00:31:15,000 --> 00:31:19,000
Okay, wir haben noch zwei Fragen von hinten.

384
00:31:19,000 --> 00:31:32,000
Ich habe eine Frage, weil ich habe schon angeschaut und da sehe ich, da sind ja teilweise Informationen zum Eigen im Wikifunctions des Eigen.

385
00:31:32,000 --> 00:31:42,000
Aber es gibt ja Wikidata. Warum nimmt man die nicht gleich alle Daten, weil Sprachdaten und so von Wikidata, da ist ja schon drin,

386
00:31:42,000 --> 00:31:45,000
da sollen wir ja doppelt ausgefüllt werden.

387
00:31:45,000 --> 00:31:53,000
Sie haben vollkommen recht, die Daten sind in Wikidata und da sind sie auch gut aufgehoben.

388
00:31:53,000 --> 00:32:02,000
In Wikifunctions ist noch nicht da, aber wir arbeiten daran, dass man Daten aus Wikidata für Wikifunctions verwenden kann.

389
00:32:02,000 --> 00:32:07,000
Also Wikidata ist und bleibt die Wissensdatenbank, da kommen die Daten heraus.

390
00:32:07,000 --> 00:32:13,000
Wikifunctions macht dann Berechnungen auf diesen Daten darüber.

391
00:32:13,000 --> 00:32:23,000
Es geht nicht darum, die Arbeit zu verdoppeln, sondern dass wir wirklich die beiden Sachen zusammenarbeiten.

392
00:32:23,000 --> 00:32:33,000
Darauf aufbauend habe ich eine Frage. Würde grundsätzlich die Möglichkeit bestehen, auch externe Daten anzapfen zu können?

393
00:32:33,000 --> 00:32:41,000
Weil du hast zum Beispiel Bevölkerungszahlen angesprochen oder wenn man sieht, es gibt ja Städte oder Gemeinden, die tägliche Covid-Zahlen veröffentlichen.

394
00:32:41,000 --> 00:32:51,000
Sowas müsste man da ja nicht nach Wikidata importieren, weil das würde ja nur einen riesigen Datensatz geben, der da meiner Meinung nach auf Vorurl-Komm falsch aufgehoben ist.

395
00:32:51,000 --> 00:33:00,000
Ja, ich stimme vollkommen zu. Wir möchten ja auch den offiziellen Covid-Zahlen als eines der auch nicht editierbar unbedingt haben.

396
00:33:00,000 --> 00:33:05,000
Und wie gesagt, es wäre ein riesiger Datensatz, der in Wikidata auch gar nicht so richtig reinpasst.

397
00:33:05,000 --> 00:33:15,000
Ich habe das jedenfalls vor. Mein Chefentwickler kriegt jedes Mal ein ganz blasses Gesicht, wenn ich das vorschlage.

398
00:33:15,000 --> 00:33:26,000
Wir müssen uns dann natürlich über solche Fragen beantworten, wie wir das Ganze halt erstellen, ohne dass wir jetzt als Angriffsvektor herleiten können.

399
00:33:26,000 --> 00:33:29,000
Das ist einiges an technischer Arbeitsgruppe. Das kommt nicht ungehend.

400
00:33:29,000 --> 00:33:34,000
Das wird nicht so, dass wir Anfang nächsten Jahres beliebige Daten aus dem Netz anzapfen und so weiter.

401
00:33:34,000 --> 00:33:41,000
Aber langfristig ist es auf alle Fälle geplant, dass wir das machen können, dass wir also nicht nur Daten aus Wikidata anrufen können,

402
00:33:41,000 --> 00:33:47,000
sondern dass wir eben komplette Datensätze auch von Drittanbietern abrufen können, dass wir die dann einverwenden können,

403
00:33:47,000 --> 00:33:54,000
dass wir auch Bilder oder andere Sachen direkt aus dem Internet benutzen können und weiterhin bearbeiten können und so weiter und so fort.

404
00:33:55,000 --> 00:33:58,000
Dann haben wir noch eine Frage von online und noch eine aus dem Raum.

405
00:33:58,000 --> 00:34:07,000
Genau, es sind zwei kleine Fragen. Du meintest, dass da Verben oder Substantive gebeugt werden müssen.

406
00:34:07,000 --> 00:34:11,000
Und da ist nur die Frage, wie wird auf die Grammatik zurückgegriffen?

407
00:34:11,000 --> 00:34:18,000
Also für die Verbraucherschutz- und Verbraucherschutz-Fraktionen, die sich in der Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen

408
00:34:18,000 --> 00:34:48,000
die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die Verbraucherschutz-Fraktionen an die

409
00:34:48,000 --> 00:34:51,080
Verbraucherschutz-Fraktionen an iconischem die Außens additionally

410
00:34:51,080 --> 00:34:56,040
Außens additionally

411
00:34:56,040 --> 00:35:05,020
zu

412
00:35:05,020 --> 00:35:10,480
vermitteln

413
00:35:10,480 --> 00:35:15,400
halt

414
00:35:15,400 --> 00:35:18,640
Aber deswegen haben wir auch die lexicografischen Daten in Wikidata.

415
00:35:18,640 --> 00:35:26,280
Das heißt, die Beugungen sind eher für Fälle, wo wir aus irgendeinem Grund keine Beugung haben,

416
00:35:26,280 --> 00:35:29,800
oder um zum Beispiel um Daten leichter einzutragen ursprünglich,

417
00:35:29,800 --> 00:35:31,640
oder um die Daten überprüfen zu können.

418
00:35:31,640 --> 00:35:34,280
Tatsächlich werden wir die Daten einfach nachschlagen.

419
00:35:34,280 --> 00:35:38,440
Die grammatikalen Funktionen, die wirklich wichtig sein werden in Wikifunctions,

420
00:35:38,440 --> 00:35:45,000
sind dann die, die aus einzelnen Satzteilen ganze Sätze bilden.

421
00:35:45,000 --> 00:35:46,440
Und diese dann zusammenfügen.

422
00:35:46,440 --> 00:35:52,360
Aber das müssen wir dann zusammen als Community-Hower arbeiten,

423
00:35:52,360 --> 00:35:56,400
wie genau die Aufregung ist hier zwischen Wikifunctions,

424
00:35:56,400 --> 00:36:00,360
Wikidata, lexicografischen Daten und Wiktionary auf der dritten Seite.

425
00:36:00,360 --> 00:36:08,720
Was die Kritik angeht, ich finde sie gut, weil sie in vielen Punkten ja auch Recht hat.

426
00:36:08,720 --> 00:36:13,960
Es wäre natürlich besser, wenn wir es schaffen könnten, alle Artikel selber zu schreiben

427
00:36:13,960 --> 00:36:16,880
und aufrecht zu erhalten in den verschiedenen Sprachen.

428
00:36:16,880 --> 00:36:22,600
Das heißt, dass wir in 20 Jahren gesehen haben, dass wir immer noch viele Lücken haben.

429
00:36:22,600 --> 00:36:28,880
Die soautomatische Generierung entgegnet ja auch ein bisschen, um vorwegzunehmen,

430
00:36:28,880 --> 00:36:33,800
die Generierung durch zum Beispiel künstliche Intelligenzmethoden,

431
00:36:33,800 --> 00:36:35,920
die dann nicht mehr in unserer Kontrolle sind.

432
00:36:35,920 --> 00:36:38,400
Mit Wikifunctions ist alles, was wir hier schreiben,

433
00:36:38,400 --> 00:36:41,080
immer noch vollständig von der Community kontrolliert.

434
00:36:41,160 --> 00:36:45,800
Das heißt, wir finden hier nicht Daten, wir können sie nicht mehr bearbeiten,

435
00:36:45,800 --> 00:36:49,920
sondern alles bleibt editierbar, bleibt in unserer Kontrolle

436
00:36:49,920 --> 00:36:54,200
und bleibt entsprechend auch richtig, hoffe ich doch sehr,

437
00:36:54,200 --> 00:36:56,720
so richtig wie Wikipedia halt selber auch ist.

438
00:37:03,120 --> 00:37:05,320
Wir möchten, wie gesagt, wirklich nur für die Lücken generieren.

439
00:37:05,320 --> 00:37:08,120
Wenn es keine Lücken gibt, ist das auch großartig, dann bin ich auch froh.

440
00:37:09,080 --> 00:37:12,280
Aber für die Sprachen, die eben noch Lücken haben,

441
00:37:12,280 --> 00:37:16,600
wo wir dann dafür sorgen können, dass die Sprachen sich entsprechend konzentrieren können

442
00:37:16,600 --> 00:37:22,880
auf die Inhalte, die ihnen wichtig ist, anstatt nur auf die allgemeinen Inhalte,

443
00:37:22,880 --> 00:37:25,960
die wir dann zum Beispiel durch so ein System erstellen können.

444
00:37:25,960 --> 00:37:29,840
Ich glaube, dass wir hier sehr viel helfen können, um diese Lücken zu füllen

445
00:37:29,840 --> 00:37:32,920
und dann auch erlauben, den Community weiterhin organisch zu wachsen

446
00:37:32,920 --> 00:37:37,600
und dann auch wieder Teile selber einzunehmen, die sie einnehmen möchten.

447
00:37:37,640 --> 00:37:40,920
Wie gesagt, Wikifunctions, diese Generation, ist ja nicht dafür da,

448
00:37:40,920 --> 00:37:42,840
um irgendetwas zu ersetzen, was wir bisher haben,

449
00:37:42,840 --> 00:37:47,640
sondern um zu ergänzen, was wir nicht selber erreichen können.

450
00:37:47,640 --> 00:37:51,280
Und dann bleibt der Raum auch immer noch übrig, um das selber weiter zu arbeiten.

451
00:37:53,040 --> 00:37:55,000
So, eine letzte Meldung.

452
00:37:55,000 --> 00:38:03,280
Ja, meine Frage ist, ob du noch mal kurz was zum geplanten Paradigma der Sprache

453
00:38:03,280 --> 00:38:06,800
und zum Laufzeitverhalten sagen kannst. Reicht recht kurz.

454
00:38:07,600 --> 00:38:08,600
Danke.

455
00:38:08,960 --> 00:38:12,920
Paradigma ist, alles, was wir in Wikifunctions machen, ist eine funktionale Sprache.

456
00:38:12,920 --> 00:38:18,120
Wir können also nicht so was wie globale Module oder ähnliches haben,

457
00:38:18,120 --> 00:38:19,720
sondern es ist alles nur funktional.

458
00:38:21,280 --> 00:38:24,800
Wobei jede Sprache ja quasi funktional geschrieben werden kann, wenn man so möchte.

459
00:38:24,800 --> 00:38:27,800
Das heißt, dass auch Sprachen wie Python und JavaScript nicht funktional sind,

460
00:38:27,800 --> 00:38:30,920
können ja funktional schreiben und das nutzen wir dann auch aus.

461
00:38:32,720 --> 00:38:36,520
Und Laufzeitverhalten, das Laufzeitverhalten ist katastrophal

462
00:38:36,520 --> 00:38:38,080
und wir arbeiten daran, es zu verbessern.

463
00:38:39,280 --> 00:38:43,600
Da ist noch viel Raum zur Verbesserung da.

464
00:38:44,040 --> 00:38:50,880
Und wir haben einige Ideen, wie wir das Ganze dann auch besser machen.

465
00:38:51,600 --> 00:38:53,040
Wird aber jetzt den Rahmen füllen.

466
00:38:54,160 --> 00:38:55,840
Vielen Dank. Vielen Dank, Al.

467
00:38:56,280 --> 00:38:57,960
Wir sind jetzt am Zeitrahmen.

468
00:38:58,160 --> 00:39:01,320
Wenn ihr weiterfragen habt, ihr wisst, wie ihr mich erreichen könnt, hoffe ich.

469
00:39:02,080 --> 00:39:05,120
Meine User-Seite bin ich antwortlich üblicherweise.

470
00:39:05,600 --> 00:39:06,600
Vielen Dank, Al.

471
00:39:07,800 --> 00:39:08,800
Und viel Spaß.

472
00:39:14,320 --> 00:39:15,320
Danke dir, Dani.