Spanish subtitles for clip: File:OpenRefine Commons - editing - extract values from template parameters.webm

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
1
00:00:07,640 --> 00:00:12,120
Tengo un proyecto de OpenRefine
con archivos de Wikimedia Commons

2
00:00:12,120 --> 00:00:16,360
Ya recuperé el wikitexto
de los archivos.

3
00:00:16,360 --> 00:00:19,040
Así que, tengo una
columna con wikitexto.

4
00:00:19,040 --> 00:00:23,080
En este wikitexto, siempre
hay una pequeña descripción

5
00:00:23,080 --> 00:00:26,720
que quiero reutilizar
como título de mi archivo.

6
00:00:26,720 --> 00:00:30,040
Así es que estoy interesada
en recuperar esta descripción,

7
00:00:30,040 --> 00:00:34,360
Ahora, podría hacer esto con
operaciones normales en OpenRefine:

8
00:00:34,360 --> 00:00:38,880
separar las columnas, por ejemplo,
o usando comandos genéricos de GREL,

9
00:00:38,880 --> 00:00:42,400
si es que tengo las
competencias para hacerlo.

10
00:00:42,400 --> 00:00:47,480
Pero tengo la extensión de Wikimedia
Commons instalada en OpenRefine,

11
00:00:47,480 --> 00:00:50,320
Y puedo utilizar la expresión
de GREL especialidada para esto

12
00:00:50,320 --> 00:00:52,040
que lo hace mucho más fácil.

13
00:00:52,040 --> 00:00:53,240
Hago lo siguiente:

14
00:00:53,240 --> 00:00:56,080
Voy a la columna de wikitexto.

15
00:00:56,080 --> 00:00:59,240
Y selecciono el menú de esa columna.

16
00:00:59,240 --> 00:01:04,480
Digo "Editar columna..."
- "Agregar columna basada en esta columna",

17
00:01:04,480 --> 00:01:09,120
y luego puedo ocupar
la expresión de GREL.

18
00:01:09,120 --> 00:01:11,200
Se ve así:

19
00:01:11,200 --> 00:01:13,400
extractFromTemplate

20
00:01:13,400 --> 00:01:17,840
y luego tiene una cierta sintaxis
en la que necesito especificar:

21
00:01:17,840 --> 00:01:21,320
En primer lugar, el
nombre de la plantilla

22
00:01:21,320 --> 00:01:24,400
de la que quiero
extraer los datos.

23
00:01:24,400 --> 00:01:29,360
En este caso, se trata
de la plantilla "Foto".

24
00:01:29,360 --> 00:01:31,960
Y luego, como segundo parámetro,

25
00:01:31,960 --> 00:01:38,000
Necesito indicar el parámetro

26
00:01:38,000 --> 00:01:41,680
de la cual quiero extraer la
información de la plantilla,

27
00:01:41,680 --> 00:01:43,080
en este caso "Descripción".

28
00:01:43,080 --> 00:01:45,240
Así que esto ya es correcto.

29
00:01:45,240 --> 00:01:47,280
Voy a previsualizar esto.

30
00:01:47,280 --> 00:01:50,640
Como puedes ver,
efectivamente produce,

31
00:01:50,640 --> 00:01:58,120
el valor que está dentro de ese
parámetro específico de la plantilla.

32
00:01:58,120 --> 00:01:59,960
Y le daré un nombre a la columna,

33
00:01:59,960 --> 00:02:05,200
"descripción". Aquí vamos.

34
00:02:05,200 --> 00:02:07,960
Hago en clic en "OK", y luego

35
00:02:07,960 --> 00:02:11,680
OpenRefine me entrega una
columna con la descripción.

36
00:02:11,680 --> 00:02:13,720
Como puedes ver en este caso,

37
00:02:13,720 --> 00:02:17,920
la descripción está rodeada
de etiquetas de idioma

38
00:02:17,920 --> 00:02:20,680
que son usualmente utilizadas
en Wikimedia Commons.

39
00:02:20,680 --> 00:02:22,960
Pero puedo fácilmente
remover estas

40
00:02:22,960 --> 00:02:26,120
con las funciones
generales de OpenRefine,

41
00:02:26,120 --> 00:02:29,120
como Buscar y Reemplazar.