[Solar-general] [BeraLibre] Como montamos Meneame en Amazon EC2

Dom Ene 10 19:09:54 CET 2010

Muy interesante.
Sin duda alguna, buenismo !!!
Juan Cristobal Lopez
Celular +54911 33603161  Tel/Fax: +5411 53539426
skype: jclopezar  SIP: 2943741 en sip.megavox.com.ar

2010/1/10 Pablo Manuel Rizzo <info en pablorizzo.com>

> No recuerdo si esto circulÃ³ por aquÃ o no, yo lo leÃ ahora y estÃ¡ muy
> interesante.Esto es muy tÃ©cnico, asÃ que disculpen. Aunque tambiÃ©n tiene
> informaciÃ³n de costos que les puede interesar a quienes no sean tÃ©cnicos
> informÃ¡ticos. Saludos!
>
> ______________
> CÃ³mo montamos MenÃ©ame en Amazon EC2La primera vez que alquilamos
> servidores dedicados para MenÃ©ame fue en ThePlanet.com. Aunque funcionaba
> muy bien y no tuvimos problemas decidimos traerlos a EspaÃ±a para mejorar el
> ping y apostar por hosting espaÃ±ol. AsÃ nos fuimos a Ferca, que nos
> atendieron muy bien y no tuvimos problemas hasta que fueron absorbidos por
> Acens. AllÃ cambiÃ³, a peor, con caidas frecuentes de la red, problemas con
> sus firewalls que bloqueaban conexiones, desapariciÃ³n del servicio de
> emergencias, imposibilidad de ver nuestras estadÃsticasâ€¦ y lo que colmÃ³
> nuestra paciencia es que a pesar que nos cobraron religiosamente los meses
> de noviembre y diciembre no nos enviaron las facturas (aÃºn esperamos
> respuesta).
>
> El tema del hosting suele ser un dolor de cabeza, y si ademÃ¡s necesitas una
> arquitectura sofisticada, o escalable debes sacar el talonario y prepararte
> a gastar dinero que desde mi punto de vista no tiene justificaciÃ³n. Comollevaba probando y â€œjugandoâ€ con Amazon EC2 desde hace tiempo<http://gallir.wordpress.com/2008/01/09/probando-amazon-ec2-es-todo-gnulinux-con-xen/>decidÃ hacer pruebas. DespuÃ©s de horas de cÃ¡lculadora y viendo que nos
> costarÃa sÃ³lo un poco mÃ¡s que Acens (pero menos que otras ofertas que
> recibimos) pero nos darÃa mucha mÃ¡s flexibilidad y fiabilidad decidimos
> hacer la migraciÃ³n.
>
> La arquitectura bÃ¡sica es la que se muestra en la siguiente imagen (prohido
> reirse de mi dibujo a mano con la mejor voluntad y dedicaciÃ³n):
>
> <http://gallir.files.wordpress.com/2009/12/escanear0001a.jpg>
>
> *ActualizaciÃ³n*: *Britxardo* me enviÃ³ un par de *parches* con los
> esquemas:
>
> <http://gallir.files.wordpress.com/2009/12/meneame-in-ec2-before.png>
>
> *Tenemos dos servidores (instancias) permanentes, aws0 y aws1*, y un *nÃºmero
> variable de instancia*s que sÃ³lo atienden a las peticiones web. Todos los
> servidores ejecutan Ubuntu Karmic, de las imÃ¡genes (AMI) oficiales de Ubuntu
> para EC2.
>
> El kernel que se ejecuta en cada instancia debe ser compatible con el
> â€œanfitriÃ³nâ€ de Amazon, Canonical tiene un convenio con Amazon para validar
> su kernel, que son mucho mÃ¡s modernos que otras distribuciones (estas
> imÃ¡genes â€“AMIâ€“ se encuentran en â€œCommunity AMIsâ€ de EC2). TambiÃ©n nos
> interesaba Ubuntu Karmic porque en la migraciÃ³n cambiarÃamos el tipo de
> motor de la base de datos a MyISAM a InnoDB y la versiÃ³n de InnoDB del MySQL
> 5.1 estÃ¡ muy mejorada con respecto a la 5.0 de la Ãºltima Ubuntu LTS (08.04).
> Servidor principal: aws0
>
> Es el â€œservidor centralâ€, del tamaÃ±o *large* (m1.large) de 64 bits, cuesta
> $ 0.38 por hora, con 7.5GB de RAM y ademÃ¡s la imagen estÃ¡ montada y arranca
> de un EBS (*Elastic Block Service*, un â€œdisco persistenteâ€ con mejor
> rendimiento). AdemÃ¡s de las ventajas obvias de persistencia de datos permite
> que en cualquier momento detengamos la instancia y la volvamos a iniciar con
> otros parÃ¡metros, por ejemplo mÃ¡s CPU y memoria RAM.
>
> Los servicios que da este servidor son:
>
>    - Servidor MySQL: Aprovechando la migraciÃ³n hemos pasado a usar InnoDB
>    y usar las transacciones/commit donde mÃ¡s hacÃan falta.
>    - Servidor NIS y NFS: Todo el software del MenÃ©ame y las cuentas de
>    usuario estÃ¡n exportadas por NFS que son usadas por aws1 y las instancias
>    web. Para centralizar la gestiÃ³n de cuentas usamos el NIS.
>    - Servidor principal DNS: Es el primario de la zona meneame.net y
>    notame.net.
>    - Servidor memcache: Usado por todas las instancias web.
>    - Servidor SVN para la gestiÃ³n del software.
>    - Servidor SSH
>    - Servidor SMTP: Recibe todos los correos desde las otras instancias.
>    Debido a las restricciones de Amazon EC2 para el correo saliente, todos los
>    correos lo enviamos vÃa AuthSMTP (mÃ¡s adelante lo explicamos)
>
> TenÃamos muchas dudas de cÃ³mo se iba a comportar con carga real a la base
> de datos, y estamos gratamente sorprendidos, durante el funcionamiento
> normal no supera el 50% de uso de la CPU como se puede ver en la imagen (los
> picos de madrugadas son por el cÃ¡lculo del karma y otras tareas como
> generaciÃ³n de â€œsummariesâ€)
>
> <http://gallir.files.wordpress.com/2009/12/aws0-stats.png>
> Mysql
>
> Es fundamental la configuraciÃ³n mÃnimamente correcta del servidor MySQL, en
> caso de InnoDB es muy crÃtico el tamaÃ±o del buffer, como tenemos un total de
> 7.5 GB le asignamos 5 GB de RAM.
> [mysqld]
> default-character-set=utf8
> server-id=1
> set-variable=max_connections=1000
> set-variable=query_cache_wlock_invalidate=True
> table_cache=1024
>
> innodb_buffer_pool_size = 5G
> innodb_flush_method = O_DIRECT
> innodb_flush_log_at_trx_commit = 0
> innodb_additional_mem_pool_size = 16M
> innodb_log_buffer_size = 8M
> innodb_file_per_table = True
>
> join_buffer_size = 1M
> sort_buffer_size = 1M
> read_buffer_size = 1M
> read_rnd_buffer_size = 2M
> thread_cache_size = 64
> thread_concurrency = 8
> query_cache_size        = 96M
> query_cache_limit = 16K
> query_cache_type        = 2
> tmp_table_size = 64M
> max_heap_table_size = 64M
> wait_timeout = 60
> Servidor secundario y de backups: aws1
>
> Esta es una instancia *m1.small*, de 32 bits, cuesta $0.095 por hora, con
> 1.7 GB de RAM, un sistema raiz de 10 GB y otro adicional (en /mnt) de 150 GB
> (ninguno de los dos es persistente)
>
>    - Secundario DNS
>    - RÃ©plica en tiempo real de la base de datos (*slave*)
>    - Sphinx para las bÃºsquedas
>
> Esta instancia ya la tenÃamos funcionando desde noviembre como secundario
> DNS, ahora simplemente la reaprovechamos para hacer mÃ¡s cosas. Las
> fundamental es la rÃ©plica en tiempo real de la base de datos, que nos sirve
> para hacer backups a discreciÃ³n sin afectar al servicio web, tambiÃ©n lo
> usamos para muchos scripts de control que son â€œpesadosâ€ en consultas (en
> MyISAM era imprescindible hacerlo asÃ porque bloquea todos los updates, con
> el InnoDB ya no se nota, de todas formas seguimo usando el *slave* para
> estas tareas).
>
> TambiÃ©n estamos usando (no acabamos de configurar todo) el S3Sync<http://s3sync.net/>para hacer backups diarios a S3. El S3Sync emula de alguna forma el
> tradicional rsync, pero para trabajar sobre el sistema de S3.
>
> <http://gallir.files.wordpress.com/2009/12/aws1-stats.png>
> RÃ©plicas con balanceo de carga y escalado automÃ¡tico
>
> Decidimos poner todo el servicio web en un sistema que se autoescale
> automÃ¡ticamente, no sÃ³lo por la cuestiÃ³n de precios sino por la tranquilidad
> que en momentos de mucha carga no habrÃ¡ problemas de saturaciÃ³n (como nos
> ocurriÃ³ durante la Eurocopa, que tuvimos que montar un servidor adicional
> en EC<http://blog.meneame.net/2008/06/26/novedads-votos-a-comentarios-anotaciones-calculo-del-karma-promote-amazon-ec2-y-futbol/>2,
> pero al hacer rÃ©plica en EEUU de un servidor en EspaÃ±a no iba muy fino por
> las enormes latencias).
>
> La decisiÃ³n fue poner todos los servicios web en una misma imagen:
>
>    - Apache con PHP para HTTP y HTTPS (puerto 80 y 443)
>    - Lighttpd para los ficheros estÃ¡ticos (puerto 81)
>
> Desde hace tiempo usamos mnmstatic.net como dominio para los ficheros
> estÃ¡ticos, esto mejora la carga desde el navegador y evita que el navegador
> envÃe los cookies de meneame.net [*] cada vez que se baja una imagen, en
> las pruebas que habÃamos hecho *se ahorra hasta 14KB de trÃ¡fico de subida*en cada pÃ¡gina.
>
> [*] No son sÃ³lo los nuestros, que son sÃ³lo dos, sino tambiÃ©n todos los que
> definen vÃa javascript los medidores como Google Analytics, podÃ©is
> verificarlo en vuestros navegadores.
>
> Cada instancia al arrancarse monta por NFS el directorio donde tiene acceso
> a todo el software y las imÃ¡genes (estÃ¡ticas y dinÃ¡micas). Esto se hace el
> el fstab, pero hay que tener cuidado con las opciones, fundamentalmente la
> opciÃ³n *bg* para que que bloqueada al arranque, y otras para aumentar la
> eficiencia y tolerancia a errores.
> # /etc/fstab: static file system information.
> proc                       /proc  proc   defaults        0       0
> /dev/sda3                  None   swap   defaults        0       0
> /dev/sda1                  /      ext3   defaults        0       0
> /dev/sda2                  /mnt   ext3   defaults        0       0
> x.x.x.amazonaws.com:/home  /home  nfs
> rw,bg,noatime,soft,nolock,intr,async,nodev,nocto,ac,actimeo=15 0 0
> Balanceo (*Load Balancer*)
>
> Como tenemos que balancear del puerto 80 dos trÃ¡ficos diferentes (al Apache
> y al Lighttpd) tuvimos que definir  dos baleanceadores diferentes
> (web-balancer y static-balancer). Cada balanceador te da una direcciÃ³n IP y
> nombre DNS. Uno de los balanceadores â€“web-balancerâ€“ redirecciona a los
> puertos 80 y 443 y el otro â€“static-balancerâ€“ redirecciona del puerto 80 al
> 81 del lighttpd.
>
> <http://gallir.files.wordpress.com/2009/12/load-balancers.png>
>
> Para cada una de las rÃ©plicas elegimos primero el tamaÃ±o pequeÃ±o (*
> m1.small*), pero el primer dÃa de funcionamiento (el lunes) y a pesar que
> durante las fiestas el trÃ¡fico es bastante menor que lo habitual vimos que
> el *AutoScaler** creaba cinco  instancias para poder atender a la demanda,
> y durante las horas de menor trÃ¡fico no bajaba de dos*. Me soprendiÃ³
> bastante, no esperaba que el consumo del Apache fuese tan elevado.
>
> Me puse a estudiar y comparar con el vmstat, vÃ que las estadÃsticas del
> monitor de EC2 (*CloudWatch*) no se correspondÃan con estas. Investigando
> mÃ¡s me di cuenta del problema, el vmstat â€“al menos con el kernel de Ubuntuâ€“
> no toma en cuenta la â€œcapacidadâ€ real de CPU asignada sino la del
> procesador. La asignada es un 40%  de la total de la CPU (fÃ¡cil de
> comprobar, se pone un proceso que consuma el 100% de cpu â€“por ejemplo *yes
> > /dev/null*â€“ y se mira la columna idle del vmstat, en este caso el idle
> indicaba 60%).
>
> Entonces tenÃa que buscar una soluciÃ³n mÃ¡s barata, y encontrÃ© una soluciÃ³n
> muy buena, bonita, potente y barata, *usar una instancia orientada a CPU
> para el Apache.* EC2 ofrece este tipo de instancias, las *High-CPU
> Instances*. Con la *c1.medium* y por sÃ³lo el doble de precio ($0.19/hora)
> podÃa tener una mÃ¡quina con la misma memoria y algo menos de prioridad de
> E/S (que es muy poca, sÃ³lo los logs del Apache) pero con 5 veces la
> capacidad de CPU.
>
> AsÃ que reconfigurÃ© el *AutoScaler* para que cree las instancias del tipo
> *c1.medium* y problema solucionado: desde que lo pusimos en marcha no ha
> creado ninguna instancia adicional, nunca superÃ³ al 80% de CPU:
>
> <http://gallir.files.wordpress.com/2009/12/web-stats.png>
> *AutoScaler*
>
> La configuraciÃ³n del escalador automÃ¡tico es casi lo Ãºltimo que se hace,
> necesitas tener definido los balanceadores y la imagen (AMI) que se usarÃ¡
> para arrancar las rÃ©plicas. A diferencia de lo anterior, que se puede crear
> y modificar con la consola web del Amazon AWS, todavÃa no existe esa opciÃ³n
> para el *AutoScaler* (aunque seguro que la agregan en las prÃ³ximas
> semanas).
>
> Por ahora toca hacer con los scripts, se necesitan definir tres cosas que
> estÃ¡n mostradas en el cÃ³digo de abajo:
> # Crea la configuraciÃ³n para lanzar las instancias
> as-create-launch-config web01cpu --image-id ami-ami-d3fad1a7 --instance-
> type m1.small --group default,www
>
> # Define el grupo de autoscale llamado web-group
> # Se "conecta" a los dos balanceadores
> # DespuÃ©s de tomar una decisiÃ³n no hace nada durante 180 segundos
> as-create-auto-scaling-group web-group --launch-configuration web01cpu
> --availability-zones eu-west-1a  --min-size 1 --max-size 6 --load-balancers
> web-balancer,static-balancer --cooldown 180
>
> # Define los parÃ¡metros para crear o destruir
> # Crea cuando consume mÃ¡s del 80% de cpu durante dos minutos
> # Destruye cuando baja del 30%
> as-create-or-update-trigger web-trigger --auto-scaling-group web-group
> --namespace "AWS/EC2" --measure CPUUtilization --statistic Average
> --dimensions "AutoScalingGroupName=web-group" --period 60
> --lower-threshold 30 --upper-threshold 80 --lower-breach-increment=-1
> --upper-breach-increment 1 --breach-duration 120
>
> Con todo lo comentado anteriormente, esta es la situaciÃ³n habitual de
> funcionamiento del MenÃ©ame:
>
> <http://gallir.files.wordpress.com/2009/12/estado-normal-instancias.png>
>
> Para mostrar el funcionamiento del escalador puse la CPU de la instancia
> web al 100% (ejecutando dos *yes > /dev/null* para poner al 100% cada una
> de las CPU) para obligar a crear otra instancia.
>
> AquÃ se puede ver como el *trigger* indica *HighBreaching*, es decir que
> se superÃ³ el lÃmite superior
> $ as-describe-triggers web-group --headers
> TRIGGER  TRIGGER-NAME   GROUP      STATUS         NAMESPACE
> MEASURE         STATISTIC  PERIOD
> TRIGGER  web-trigger    web-group  HighBreaching  AWS/EC2
> CPUUtilization  Average    60
>
> AquÃ se oberva como la â€œcapacidad deseadaâ€ es de 2 y que iniciÃ³ la creaciÃ³n
> y arranque de una nueva instancia:
> $ as-describe-auto-scaling-groups web-group --headers
> AUTO-SCALING-GROUP  GROUP-NAME  LAUNCH-CONFIG  AVAILABILITY-ZONES
> LOAD-BALANCERS                MIN-SIZE  MAX-SIZE  DESIRED-CAPACITY
> AUTO-SCALING-GROUP  web-group   web01cpu       eu-west-1a
> static-balancer,web-balancer  1         6         2
> INSTANCE  INSTANCE-ID  AUTO-SCALING-GROUP  AVAILABILITY-ZONE  STATE
>  INSTANCE  i-04ef2c73   web-group           eu-west-1a         InService
> INSTANCE  i-4e7dbe39   web-group           eu-west-1a         Pending
>
> Finalmente las dos instancias ya estÃ¡n activas y accesibles:
> $ as-describe-auto-scaling-groups web-group --headers
> AUTO-SCALING-GROUP  GROUP-NAME  LAUNCH-CONFIG  AVAILABILITY-ZONES
> LOAD-BALANCERS                MIN-SIZE  MAX-SIZE  DESIRED-CAPACITY
> AUTO-SCALING-GROUP  web-group   web01cpu       eu-west-1a
> static-balancer,web-balancer  1         6         2
> INSTANCE  INSTANCE-ID  AUTO-SCALING-GROUP  AVAILABILITY-ZONE  STATE
>  INSTANCE  i-04ef2c73   web-group           eu-west-1a         InService
> INSTANCE  i-4e7dbe39   web-group           eu-west-1a         InService
>
> AsÃ es como se ve en la consola:
>
> <http://gallir.files.wordpress.com/2009/12/escalado.png>
> Problemas encontrados
>
> Tuvimos dos problemas fundamentales.
> HTTP SSL detrÃ¡s del balanceador
>
> El primero es que las instancias sÃ³lo â€œvenâ€ la IP privada del balanceador y
> envÃa una cabecera HTTP para indicar la original, esto no ocasionÃ³ gran
> problema porque el software del MenÃ©ame ya estaba preparado. Pero con el SSL
> (o HTTPS) la cosa es muy distinta, en estos caso la conexiÃ³n entre el
> balanceador y la instancia no es vÃa HTTP, sino TCP (por razones obvias, la
> comunicaciÃ³n va cifrada) por lo que no se recibe nada de informaciÃ³n de la
> IP del cliente.
>
> Esto obligÃ³ a modificaciones y agregar campos de control en los
> formularios de registro y login vÃa el servidor seguro<http://viewvc.meneame.net/index.cgi?view=rev&revision=2084>.
> No fue nada importante, pero me obligÃ³ a pensar bastante en una soluciÃ³n
> razonablemente segura (digo *razonable* porque seguro que se le pueden
> encontrar problemas si se le dedica tiempo).
> EnvÃo de correo por AuthSMTP
>
> El segundo problema fue inesperado y el que nos retrasÃ³ la migraciÃ³n del
> dÃa sÃ¡bado al domingo. El viernes recibimos un email de Amazon indicÃ¡ndones
> que estÃ¡bamos enviando correo saliente (nuestras pruebas de envÃo de
> validaciÃ³n de cuenta y recuperaciÃ³n de contraseÃ±a) y que nos iban a bloquear
> la salida. AdemÃ¡s vimos* que agregan automÃ¡ticamente nuestras **IPs al
> Spamhause* <http://www.spamhaus.org/pbl/query/PBL346296>.
>
> Aunque te envÃan el URL de un formulario para pedir la autorizaciÃ³n decÃan
> que hay que esperar por lo menos dos dÃas hÃ¡biles (hoy nos enviaron un email
> diciendo que ya estudiaron el caso y nos autorizan, pero las IPs siguen
> apareciendo en Spamhause). Fue un momento de *depresiÃ³n*, ademÃ¡s vÃ que es
> un problema en Amazon por las medidas que tomaron para evitar *spammers*en su servicio.
>
> Pero encontrÃ© una soluciÃ³n buena, bonita y barata: AuthSMTP<http://www.authsmtp.com/>
> .
>
> Por un precio muy razonable ellos se encargan de enviar el correo de tus
> usuarios o todo el dominio. Funciona muy bien y muy rÃ¡pido, te olvidas del
> problema que las IPs de tus servidores de correo aparezcas en esas
> demonÃacas bases de datos de spammers.
>
> En nuestro caso la configuraciÃ³n del Postfix de aws0 fue muy sencilla, sÃ³lo
> tuvimos que agregar las siguientes lÃneas al main.cf:
> relayhost = mail.authsmtp.com:2525
> smtp_connection_cache_destinations = mail.authsmtp.com
> smtp_sasl_auth_enable = yes
> smtp_sasl_password_maps = static:USUARIO:PASSWORD
> smtp_sasl_security_options = noanonymous
> default_destination_concurrency_limit = 4
> soft_bounce = yes
>
> Con esto se solucionÃ³ el problema mÃ¡s grave que encontramos y pudimos hacer
> la migraciÃ³n.
> Costes mensuales
>
>    - 1 m1.large: $ 273
>    - 1 m1.small: $ 64.8
>    - 1, 2 instancias c1.medium web de media (mÃ¡xima): $ 164.16
>    - 2 TB transferencia de datos: $ 340
>    - 1 EBS de 50GB almacenamiento + aproximadamente 50 Mops= $ 11
>    - 3 instancias medias medidas con Cloudwatch: $32.4
>    - 2 Balanceadores: $40.32 + $16 de 2 TB de trÃ¡fico, $56.32
>
> Coste total estimado: $ 941.68, al cambio actual del euro queda *en 649 â‚¬
> mensuales*
> Fin
>
> SÃ, se pueden encontrar ofertas mÃ¡s baratas, y es un poco mÃ¡s de lo que
> pagamos a Acens (pero mucho menos que otras ofertas que recibimos), pero te
> olvidas de estar atado por una arquitectura, de tener que hacer engorrosas y
> largas negociaciones si necesitas un nuevo servidor, de abrir averÃas por la
> red (en Amazon estÃ¡ todo monitorizado y es pÃºblico<http://status.aws.amazon.com/>,
>  una caÃda afecta a muchos servidores, asÃ que no tardan nada en resolver).
>
> Y lo mÃ¡s importante, es el futuro, mucho mÃ¡s sofisticado, pero tambiÃ©n mÃ¡s
> divertido (y creo que ademÃ¡s mÃ¡s ecolÃ³gico, el hardware estÃ¡ mucho mejor
> aprovechado) y como *administrador de sistemas/programador/CTO tienes una
> libertad y flexibilidad impensable hace pocos aÃ±os*.
>
> Como conclusiÃ³n, por ahora muy positivo. Ya veremos como evoluciona,
> conociendo la historia de EC2 no dudo que agregarÃ¡n cada vez mÃ¡s servicios y
> que bajarÃ¡n los precios una vez al aÃ±o.
>
> PS: Son las cinco de la maÃ±ana, lo publico como estÃ¡, disculpad los errores
> que haya, ya los corregirÃ© luego.
>
> http://gallir.wordpress.com/2009/12/30/como-montamos-meneame-en-amazon-ec2/
>
> --
> Pablo Manuel Rizzo
> -------------------------------
> http://pablorizzo.com
> -------------------------------
>
>
> _______________________________________________
> Lista abierta del Grupo de Usuarios de SL de Berazategui
> General en listas.berazateguilibre.org.ar
> Para modificar su suscripciÃ³n ingrese aquÃ:
> http://listas.berazateguilibre.org.ar/cgi-bin/mailman/listinfo/general
>
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: /pipermail/solar-general/attachments/20100110/f029846c/attachment.htm