[Solar-general] lista de provincias /ciudades para querido candidato, llamado a la solidaridad [challenge]

Pablo Manuel Rizzo info en pablorizzo.com
Vie Mayo 22 14:07:20 CEST 2009


Lo de los acentos es porque estás viendo el archivo con una codificación de
caracteres diferente a la que tiene el sitio, abrilo con Kate o cualquier
editor que te permita elegir la codificación de caracteres. Ese archivo lo
abro directamente en Icecat (Firefox) y se ven bien los acentos.

Fijate que al script le falta recorrer las páginas numeradas para que
extraiga todos los municipios, si no te faltan un montón en el archivo.



2009/5/22 Martín Olivera <martin.olivera en gmail.com>

> CAPO!
>
> me salio este archivo que adjunto!
>
> temitas con los acentos y eso que corregiremos facil seguro, que buena
> experiencia :)
>
> El 22 de mayo de 2009 1:30, Pablo Manuel Rizzo <info en pablorizzo.com>escribió:
>
>> 2009/5/22 Fernando Toledo <ftoledo en docksud.com.ar>
>>
>> El Thursday 21 May 2009 09:14:25 Pablo Manuel Rizzo escribió:
>>> > 2009/5/21 Martín Olivera <martin.olivera en gmail.com>
>>> >
>>> > > 2009/5/20 Diego Saravia <dsa en unsa.edu.ar>:
>>> > > > http://www.mininterior.gov.ar/municipales/busqueda/inicio.asp
>>> > >
>>> > > esta bueno, si no hay otra cosa se puede usar (requiere un trabajo
>>> > > manual de unas horas sacar un CSV con la data, pero sirve)
>>> > >
>>> > > si alguien tiene algo asi, pero en un formato de texto o algo asi,
>>> > > genial (me encanataria tirarle un query SQL a esa DB del Min Interior
>>> > > ;)
>>> >
>>> > Esa página acepta parámetros por GET además de POST, podés programar
>>> esa
>>> > consulta en bash.
>>> quiero ese script pegado aca eh!!
>>> =)
>>>
>>
>>
>> Bueno, un ejemplo simple hecho en diez minutos, se podría mejorar mucho,
>> pero sirve como base, lo pueden adaptar fácilmente para que extraiga más
>> datos si hace falta.
>>
>> __________________
>>
>>> #!/bin/bash
>>>
>>> rm -rf provincias.html
>>> wget -q -O provincias.html
>>> http://www.mininterior.gov.ar/municipales/busqueda/inicio.asp
>>>
>>> for prov in $(egrep -o '<option value="[A-Z]+">' provincias.html | egrep
>>> -o '[A-Z][A-Z][A-Z]');
>>> do
>>>
>>>         rm -rf ${prov}-municipios.html
>>>         wget -q -O ${prov}-municipios.html '
>>> http://www.mininterior.gov.ar/municipales/busqueda/busca_municipios.asp?PROVINCIA='$prov'&Submit22=Obtener<http://www.mininterior.gov.ar/municipales/busqueda/busca_municipios.asp?PROVINCIA=%27$prov%27&Submit22=Obtener>
>>> '
>>>         for linea in $(gawk '/class="lineabottom"><strong>/ {print
>>> NR+1}'  ${prov}-municipios.html);
>>>         do
>>>                 muni=$(gawk "NR==$linea { print \$0 }"
>>> ${prov}-municipios.html | sed -r -e 's@^ *@@g' -e 's@ *$@@g')
>>>                 echo $prov,$muni
>>>         done
>>>
>>> done
>>>
>> __________________
>>
>>
>>
>>
>> --
>> Pablo Manuel Rizzo
>> -------------------------------
>> http://pablorizzo.com
>> -------------------------------
>>
>>
>> _______________________________________________
>> Solar-general mailing list
>> Solar-general en lists.ourproject.org
>> https://lists.ourproject.org/cgi-bin/mailman/listinfo/solar-general
>>
>
>
>
> --
> opino en http://blog.martinolivera.com.ar
> skype: hablatincho
>
> _______________________________________________
> Solar-general mailing list
> Solar-general en lists.ourproject.org
> https://lists.ourproject.org/cgi-bin/mailman/listinfo/solar-general
>



-- 
Pablo Manuel Rizzo
-------------------------------
http://pablorizzo.com
-------------------------------
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: /pipermail/solar-general/attachments/20090522/6d2fbe9c/attachment.html


Más información sobre la lista de distribución Solar-general