Category talk:Arkivverket - Vårslipp 2021

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

Arkivverkets vårslipp 2021

[edit]

I vårslippene publiserer Arkivverket viktige dokumenter fra 2. verdenskrig på digitalarkivet.no. De er hentet fra arkiver de nylig har mottatt, nylig har ordnet eller der taushetsplikten nylig er falt bort. Siden for årets vårslipp er her. Bilder inkludert i dette vårslippet som enten er falt i det fri eller er sluppet med en CC-BY lisens, er lastet opp til Wikimedia Commons.

Jeg lastet ned bildene manuelt fra nettsidene til Arkivverket til hver sin mappe, deretter ble de filtrert med følgende script for å slette filer med en CC-BY-NC-lisens og gi de litt mer logiske navn:

#!/bin/bash

SOURCE_FOLDER=$1

# Delete images with a cc-by-nc license
for i in $(ls -1 $SOURCE_FOLDER)
do
  if [ "$(exiftool -Usageterms ${SOURCE_FOLDER}/$i | grep nc)" != "" ]
  then
    rm $SOURCE_FOLDER/$i
  fi
done

# Output a list of unique images by ID
ls -1 $SOURCE_FOLDER | sed -E "s/.(tif|jpg)//" | sort -u > ${SOURCE_FOLDER}/images.list

# Rename images
for i in $(ls -1 $SOURCE_FOLDER/*.jpg)
do
  FN=$(exiftool -S -ObjectName $i|cut -d':' -f2|xargs|sed "s/ /_/g")
  i2=$(echo $i|sed -E "s/${SOURCE_FOLDER}\/|.jpg//")
  mv $i "${SOURCE_FOLDER}/${FN}_(${i2}).jpg"
done
for i in $(ls -1 $SOURCE_FOLDER/*.tif)
do
  FN=$(exiftool -S -ObjectName $i|cut -d':' -f2|xargs|sed "s/ /_/g")
  i2=$(echo $i|sed -E "s/${SOURCE_FOLDER}\/|.tif//")
  mv $i "${SOURCE_FOLDER}/${FN}_(${i2}).tif"
done




# Output Usage terms for all remaining files for manual verification
for i in $(ls -1 $SOURCE_FOLDER)
do 
  exiftool -Usageterms $SOURCE_FOLDER/$i
done

Deretter ble de lastet opp til commons ved bruk av pywikibot:

#!/bin/bash
function process_folder() {
  SOURCE_FOLDER=$1
  for i in $(cat ../${SOURCE_FOLDER}/images.list)
  do
    LICENSE=$(exiftool -S -UsageTerms ../${SOURCE_FOLDER}/*$i*.tif|sed "s/UsageTerms: //")
    DESCRIPTION=$(exiftool -S -Description ../${SOURCE_FOLDER}/*$i*.tif|sed "s/Description: //"|sed "s/\"/\\\"/")
    AUTHOR=$(exiftool -S -Creator ../${SOURCE_FOLDER}/*$i*.tif|sed "s/Creator: //")
    FILEID=$i
    CATEGORY=$(cat ../${SOURCE_FOLDER}/category.txt)

    if [ "$LICENSE" == "CC BY" ]
    then
      LICENSE_TEMPLATE="Cc-by-4.0"
    fi
    if [ "$LICENSE" == "Falt i det fri" ]
    then
      LICENSE_TEMPLATE="PD-Norway50"
    fi

    sed "s/LICENSE/${LICENSE_TEMPLATE}/" filepage.txt | \
      sed "s/AUTHOR/${AUTHOR}/" | \
      sed "s/DESCRIPTION/${DESCRIPTION}/" | \
      sed "s/FILEID/${FILEID}/" | \
      sed "s/CATEGORY/${CATEGORY}/" > $i.txt
    FN=$(ls -1 ../${SOURCE_FOLDER}/*${i}* | sed "s/..\/${SOURCE_FOLDER}\///")
    FIRST=$(echo $FN | cut -d " " -f1)
    SECOND=$(echo $FN | cut -d " " -f2)
    sed "s/FILENAME/${FIRST}/" $i.txt > $i-2.txt
    sed "s/FILENAME/${SECOND}/" $i.txt > $i-1.txt

    python3 pwb.py upload -ignorewarn -noverify -keep -filename:"${FIRST}" -summary:"Riksarkivets Vårslipp 2021" -descfile:${i}-1.txt "../${SOURCE_FOLDER}/${FIRST}"
    python3 pwb.py upload -ignorewarn -noverify -keep -filename:"${SECOND}" -summary:"Riksarkivets Vårslipp 2021" -descfile:${i}-2.txt "../${SOURCE_FOLDER}/${SECOND}"
    LICENSE_TEMPLATE=""
    rm $i.txt $i-1.txt $i-2.txt
  done;
}

process_folder "Det_norske_samfunnet_i_Buckie_Skottland"
process_folder "Kong_Haakons_70_årsdag"
process_folder "kvinner_i_det_norske_forsvaret_i_storbritannia"
process_folder "MS-Montevideo"
process_folder "Norske_skoler_i_Storbritannia"

TommyG (talk) 14:02, 20 April 2021 (UTC)[reply]