El otro día buscando información sobre unas especies de aves llegué hasta una página del Min. de Medio Ambiente desde donde se puede descargar un mapa de las aves reproductoras en España (via SEO). Desde estas páginas se pueden descargar los PDF de cada especie, pero fuí incapaz de encontrar la manera de descargar todos los PDF disponibles en un solo volumen, así es que me hice rápidamente un script que en apenas 10 min me tenía descargados los 270 pdf correspondientes a otras tantas especies.
El siguiente script bash descarga todos los pdf a la carpeta en la que se encuentra:
#!/bin/bash
abecedario="a b c d e f g h i j l m n o p r s t u v"
let contador=1
for letra in $abecedario; do
urlPagina="http://www.mma.es/portal/secciones/biodiversidad/inventarios/inb/atlas_aves_reproductoras/nombres_latin_$letra.htm"
if [ -f "aves_$letra.html" }; then
wget "$urlPagina" -O "aves_$letra.html"
fi
PDFs=$(cat "aves_$letra.html" | grep ".pdf" | cut -d "=" -f4 | cut -d "\"" -f2)
for pdf in $PDFs; do
urlCompleta="http://www.mma.es$pdf"
urlDestino=$contador"_"`basename $urlCompleta`
wget "$urlCompleta" -O "$urlDestino"
let contador=$contador+1
done
done
A continuación unimos todos los pdf en un solo volumen completo.pdf
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=completo.pdf *.pdf
Si no quereis calentarse mucho la cabeza, la guia al completo aqui: completo.pdf (200 Mg)
Actualización
Idéntico proceso para descargar el Libro Rojo de las Aves de Portugal (Livro vermelho dos Vertebrados de Portugal) con el enlace provisto por Vanessa (ver comentarios)