Spanish subtitles for clip: File:OpenRefine Commons - editing - extract values from template parameters.webm
Jump to navigation
Jump to search
1 00:00:07,640 --> 00:00:12,120 Tengo un proyecto de OpenRefine con archivos de Wikimedia Commons 2 00:00:12,120 --> 00:00:16,360 Ya recuperé el wikitexto de los archivos. 3 00:00:16,360 --> 00:00:19,040 Así que, tengo una columna con wikitexto. 4 00:00:19,040 --> 00:00:23,080 En este wikitexto, siempre hay una pequeña descripción 5 00:00:23,080 --> 00:00:26,720 que quiero reutilizar como título de mi archivo. 6 00:00:26,720 --> 00:00:30,040 Así es que estoy interesada en recuperar esta descripción, 7 00:00:30,040 --> 00:00:34,360 Ahora, podría hacer esto con operaciones normales en OpenRefine: 8 00:00:34,360 --> 00:00:38,880 separar las columnas, por ejemplo, o usando comandos genéricos de GREL, 9 00:00:38,880 --> 00:00:42,400 si es que tengo las competencias para hacerlo. 10 00:00:42,400 --> 00:00:47,480 Pero tengo la extensión de Wikimedia Commons instalada en OpenRefine, 11 00:00:47,480 --> 00:00:50,320 Y puedo utilizar la expresión de GREL especialidada para esto 12 00:00:50,320 --> 00:00:52,040 que lo hace mucho más fácil. 13 00:00:52,040 --> 00:00:53,240 Hago lo siguiente: 14 00:00:53,240 --> 00:00:56,080 Voy a la columna de wikitexto. 15 00:00:56,080 --> 00:00:59,240 Y selecciono el menú de esa columna. 16 00:00:59,240 --> 00:01:04,480 Digo "Editar columna..." - "Agregar columna basada en esta columna", 17 00:01:04,480 --> 00:01:09,120 y luego puedo ocupar la expresión de GREL. 18 00:01:09,120 --> 00:01:11,200 Se ve así: 19 00:01:11,200 --> 00:01:13,400 extractFromTemplate 20 00:01:13,400 --> 00:01:17,840 y luego tiene una cierta sintaxis en la que necesito especificar: 21 00:01:17,840 --> 00:01:21,320 En primer lugar, el nombre de la plantilla 22 00:01:21,320 --> 00:01:24,400 de la que quiero extraer los datos. 23 00:01:24,400 --> 00:01:29,360 En este caso, se trata de la plantilla "Foto". 24 00:01:29,360 --> 00:01:31,960 Y luego, como segundo parámetro, 25 00:01:31,960 --> 00:01:38,000 Necesito indicar el parámetro 26 00:01:38,000 --> 00:01:41,680 de la cual quiero extraer la información de la plantilla, 27 00:01:41,680 --> 00:01:43,080 en este caso "Descripción". 28 00:01:43,080 --> 00:01:45,240 Así que esto ya es correcto. 29 00:01:45,240 --> 00:01:47,280 Voy a previsualizar esto. 30 00:01:47,280 --> 00:01:50,640 Como puedes ver, efectivamente produce, 31 00:01:50,640 --> 00:01:58,120 el valor que está dentro de ese parámetro específico de la plantilla. 32 00:01:58,120 --> 00:01:59,960 Y le daré un nombre a la columna, 33 00:01:59,960 --> 00:02:05,200 "descripción". Aquí vamos. 34 00:02:05,200 --> 00:02:07,960 Hago en clic en "OK", y luego 35 00:02:07,960 --> 00:02:11,680 OpenRefine me entrega una columna con la descripción. 36 00:02:11,680 --> 00:02:13,720 Como puedes ver en este caso, 37 00:02:13,720 --> 00:02:17,920 la descripción está rodeada de etiquetas de idioma 38 00:02:17,920 --> 00:02:20,680 que son usualmente utilizadas en Wikimedia Commons. 39 00:02:20,680 --> 00:02:22,960 Pero puedo fácilmente remover estas 40 00:02:22,960 --> 00:02:26,120 con las funciones generales de OpenRefine, 41 00:02:26,120 --> 00:02:29,120 como Buscar y Reemplazar.