Google requiere grandes recursos informáticos para prestar sus servicios. Este artículo describe la infraestructura tecnológica detrás de los sitios web de Google, como aparece en los anuncios públicos de la empresa.
En 2008, Google operó 34 centros de datos en todo el mundo, incluidos 19 en los Estados Unidos (incluidos 2 en construcción), 11 en Europa, 3 en Asia y 1 en Brasil. Aunque no se dan a conocer las cifras, algunos estiman que Google mantiene cerca de 2,5 millones de servidores, ubicados en varias ciudades del mundo, con centros importantes en Mountain View ( California ), Council Bluffs (Iowa), Herndon (Virginie), Lenoir ( Carolina del Norte). ), Condado de Mayes ( Oklahoma ), Atlanta (Georgia); Dublín , Irlanda ; Saint-Ghislain , Bélgica ; Groningen en los Países Bajos ; Zurich , Suiza ; São Paulo en Brasil ; Quilicura ( Chile ); Tokio , Japón ; Pekín , China .
Cuando se intenta conectarse a Google, los servidores DNS apuntan a www.google.com a varias direcciones IP , lo que actúa como un primer nivel para el equilibrio de carga al dirigir a los clientes a diferentes clústeres de Google. Cada paquete de Google tiene miles de servidores, y al conectarse al paquete, se realiza otro balanceo de carga para enviar solicitudes al servidor web más liviano . Esto convierte a Google en una de las redes más grandes y complejas.
Los racks se fabrican bajo pedido y contienen de 40 a 80 servidores de 1U (de 20 a 40 en cada lado), mientras que los servidores más nuevos son sistemas de montaje en rack de 2U. Cada soporte tiene un interruptor. Los servidores están conectados a través de un enlace Ethernet de 100 Mbit / s al conmutador local. Los conmutadores se conectan al conmutador gigabit central mediante uno o dos enlaces ascendentes gigabit.
Los centros de datos están ubicados principalmente donde la electricidad no es demasiado cara (por ejemplo, cerca de centrales hidroeléctricas), en particular en la costa noroeste de los Estados Unidos, siendo la factura energética uno de los factores principales. Centros de costos más importantes: los expertos estiman que el la electricidad consumida por un servidor durante su vida útil cuesta más que el hardware en sí.
Como las consultas se componen de palabras, es necesario un índice inverso de los documentos. Dicho índice permite obtener una lista de documentos para la misma palabra en una pregunta. El índice es muy grande debido a la cantidad de documentos almacenados en los servidores.
En octubre de 2008Aunque las cifras no se están haciendo públicas, según los informes, Google ha contado dos millones de servidores.
Por la cantidad de hardware utilizado y la naturaleza intensiva de las aplicaciones que ejecutan sus servidores, Google publica interesantes estadísticas sobre fallas de hardware: discos duros y memoria DRAM .
Google es conocido por usar PC simples modificadas específicamente para ejecutar sus algoritmos en lugar de servidores costosos diseñados específicamente para este trabajo, especialmente en términos de potencia informática y confiabilidad . Los detalles de las modificaciones realizadas a estas máquinas permanecieron en secreto durante mucho tiempo, hasta que1 st de abril de 2009. La principal peculiaridad de sus PC es la adición a cada uno de ellos de una batería de 12 voltios para proporcionar corriente en caso de un problema con la fuente principal de electricidad, que según Google cuesta menos que comprar un sistema de alimentación ininterrumpida que cubra las necesidades. de un centro de datos completo y permite una mejor eficiencia energética.
Otra característica interesante es que desde 2005 los centros de datos se componen de contenedores estándar que contienen 1160 PC servidor con un consumo de energía de hasta 250 kilovatios. También se sabe que Sun Microsystems y Windows Azure utilizan contenedores, pero por menos tiempo.
El uso de muchas PC poco fiables requirió la creación de algoritmos e implementaciones adecuados. Los algoritmos tenían que ser paralelos , distribuidos (o distribuidos ), tolerantes a fallas . Esto incluye: