[Solar-general] lenguaje universal
Marcos Guglielmetti
marcospcmusica en gmail.com
Mar Ago 7 14:26:31 CEST 2007
El Martes, 7 de Agosto de 2007 18:01, Pablo Manuel Rizzo escribió:
| On 8/7/07, Marcos Guglielmetti <marcospcmusica en gmail.com> wrote:
| > El Martes, 7 de Agosto de 2007 14:27, minombresbond escribió:
| > | no entendi el problema pero:
| > | necesitas que los ' ' sean '\ ' ?
| > | y si le das a
| > | PALABRA=$( echo "$PALABRA" | sed 's/ /\\ /g' )
| > | te reemplaza los ' ' por '\ '
| > | entonces en la base de datos ya no necesitas poner
| > | las '\' antes de los espacios
| >
| > Es casi la solución, como es lógico, me sirve ;-), había pensado en
| > hacer eso: reformar el diccionario cada vez que debe ser procesado (de
| > todos modos lo hago, lo filtro de comentarios y otras cosas), así que
| > gracias, me sirve, aunque lo implementaré de otra forma para que sea más
| > eficiente
|
| Se me ocurre que podrías optimizar mucho la velocidad utilizando
| scripts de sed,
¿velocidad a la hora de que sed reemplace palabras?
| son archivos donde pones una debajo de otra una serie
| de ER que querés que sed ejecute sobre un archivo. En tu caso cada
| término a traducir sería una ER, algo así:
|
| diccionario.sed
| --------------------------------------------
| s/esp01/port01/g
| s/esp02/port02/g
| s/esp03/port03/g
| --------------------------------------------
Si, pero, ojo que el diccionario es más complejo... no sé si eso es tenido en
cuenta en la propuesta:
* permite definir una cantidad infinita de idiomas (tengo pensado abordar
catalán, italiano y otras lenguas derivadas del latín en el futuro)
* permite agregar cualquier tipo de marcas para filtrar equivalencias que no
deben emplearse en determinados casos (ya lo estoy haciendo y funciona bien)
* permite definir marcas para cualquier cosa, por ejemplo, evitar usos no
normales de determinados términos (ya en uso)
* permite definir marcas para identificar las clases de palabras
(articulaciones, adjetivos, sustantivos, verbos, en plural, singular,
masculino, femenino,etc.) [esto aún no fue necesario implementarlo]
| Para simplificar eso al usuario que tiene que crear y/o modificar el
| diccionario, podrías primero procesar un diccionario simplificado para
| crear al archivo script anterio, por ejemplo en base a este
| diccionario y la expresión que está a continuación del archivo:
|
| diccionario.dic
| --------------------------------------------
| esp01=port01
| esp02=port02
| esp03=port03
| --------------------------------------------
|
| cat diccionario.dic | sed -r -e "s/^(.*)/s\/\1/g" -e
| "s/(.*)=(.*)/\1\/\2/g" -e "s/(.*)/\1\/g/g" > diccionario.sed
|
| Luego procesas el archivo todo de una así:
|
| sed -f diccionario.sed $ARCHIVO-temp > $ARCHIVO-traducido
|
Mmm.. a ver si comprendo, sed toma a diccionario.sed como un script que
interpreta sólo él mismo, que sólo sed conoce, y nadie más, ese script de sed
se utiliza para procesar el archivo de textos a ser traducido, creando un
nuevo archivo resultante con la traducción. ¿Es así?
Pero el script de sed (o el diccionario previo a convertirse en script de sed)
¿podría contener marcas? al estilo:
autocrata/autócrata/ : dudas
\ mãe\ /\ madre\ /
#arraigada/convencida?
tenía\ sido/había\ sido/ : dudas
\ tornou\ /\ tornó\ / : anormal
\ tornou\ /\ volvió\ /
\ sinais\ /\ signos\ / : dudas masc. fem.
# :Particularidades idiomáticas que se dan siempre?
ável\ /able\ / : dudas
ê/e/ : ptes
ss/s/ : ptes
qüe/cue/ : dudas : ptes
velmente/blemente/ : dudas : ptes
ô/ó/ : dudas : ptes
ípio/ipio/ : dudas : ptes
idade\ /idad\ / : dudas : ptes
anha/aña/ : dudas : ptes
\ çones/\ ciones/ : dudas : ptes
\ criaci/\ creaci/ : dudas : ptes
Por ejemplo, ": ptes" significa que esa equivalencia será tenida en cuenta
sólo si estamos traduciendo desde pt a es, no a la inversa
": dudas" no procesará esa equivalencia si lo ordenamos a nivel general
(podrían existir diferentes niveles de dudas,etc.)
": anormal": esa equivalencia será utilizada sólo si decidimos usar los usos
menos normales, a nivel global
|
| Guarda! Que todo esto no lo probé, lo estoy escribiendo de memoria así
| que primero quizá tenés que corregir algunos detalles, pero creo que
| funciona este mecanismo.
Ok, yo por ahora no lo entiendo casi nada, pero lo agregué a la sección de
ayuda:
http://www.musix.org.ar/wiki/index.php?title=Pt-es_ayudanos
Para incorporarlo eventualmente en algún momento, te agradezco mucho el
aporte!
--
`&'
# Marcos Guglielmetti, co-director de
# Musix GNU+Linux, 100% Software Libre para artistas
_#_ http://www.musix.org.ar
(#)
/ O \ + archivos: ftp://musix.ourproject.org/pub/musix
( === ) Ecología: http://autosus.wordpress.com
`---' Personal: http://marcospcmusica.wordpress.com
"¡Ta, ta, ta, taaaa... ta!"
http://es.wikiquote.org/wiki/El_Chavo_del_Ocho
Más información sobre la lista de distribución Solar-general