Nuevo sistema de indexación de Google

Google presenta su nuevo índice de búsqueda: Caffeine (Cafeína)

Google ha anunciado que su nuevo sistema de indexado Web, conocido como Caffeine, está listo.

Caffeine proporciona un 50% de resultados más actualizados que el índice utilizado anteriormente y constituye la mayor colección de contenidos Web ofertada por Google hasta la fecha. Ya sea una noticia, un blog o un mensaje publicado en un foro, ahora es posible encontrar enlaces a contenidos relevantes en mucho menos tiempo que antes, contando a partir de la fecha de su publicación.

Para que se entienda: cuando realizamos una búsqueda en Google, no estamos buscando directamente en Internet, sino en el índice que Google ha elaborado de Internet y que, al igual que el índice que se suele encontrar en la parte posterior de un libro, nos ayuda a localizar exactamente la información que necesitamos.

Entonces, ¿por qué ha construido Google un nuevo sistema de indexado para búsquedas? El contenido Web está creciendo. Y no sólo crece en tamaño y número, sino que con la llegada de los vídeos, las imágenes, las noticias y las actualizaciones en tiempo real, la página web promedio es más rica y compleja. Las expectativas de búsqueda de la gente también son mayores de lo que solían ser. Los que realizan una búsqueda quieren encontrar los contenidos pertinentes más recientes y los editores esperan que sus contenidos se puedan encontrar tan pronto como los publican.

Ese es el motivo por el que Google ha construido Caffeine.

El antiguo índice tenía varias capas, algunas de las cuales se actualizaban con mayor rapidez que otras; la capa principal, por ejemplo, se actualizaba cada dos semanas. Para actualizar una capa del índice antiguo, Google analizaba toda la Web, lo que significaba que había un desfase significativo entre el momento en que el usuario podía encontrar una página y la fecha a partir de la cual dicha página estaba disponible en Internet.

Con Caffeine, se analiza Internet en pequeñas porciones y se actualiza el índice de búsqueda de forma continuada en todo el mundo. A medida que Google va encontrando páginas nuevas o nueva información en las páginas existentes, puede agregar estos contenidos al índice directamente. Eso significa que los usuarios pueden encontrar información más reciente que nunca, independientemente de cuándo o dónde se haya publicado.

Caffeine permite indexar las páginas Web a gran escala, procesando, cada segundo, cientos de miles de páginas en paralelo. Caffeine utiliza cerca de 100 millones de gigabytes de almacenamiento en una base de datos y añade nueva información a una velocidad de cientos de miles de gigabytes por día.

Google ha construido Caffeine pensando en el futuro. El nuevo índice sólo ofrece información más reciente, sino que constituye una base sólida sobre la cual construir un motor de búsqueda más rápido y exhaustivo que crezca paralelamente al incremento de la información en línea y ofrezca resultados de búsqueda aún más relevantes. Así que conviene estar atentos a las mejoras que se vayan produciendo en los próximos meses.

Fuente: Google Blog


Añadir Comentario