Cómo funciona el algoritmo de Google Panda

27 noviembre, 2019

ACTUALIZACIÓN 2019: Este artículo sigue siendo la mejor descripción disponible de cómo funciona el algoritmo de Google Panda.  No hay justificación para reunir comentarios aleatorios y sin fuente (y resumir en lugar de citar los videos y artículos originales) y llamar a eso una explicación de Panda.  Estos amateurs y mal informados intentos de documentar el panda sustituyen las especulaciones salvajes por lo que son esencialmente señales indocumentadas utilizadas por este algoritmo para calificar las páginas como de «calidad».  El error más común que la gente comete al tratar de analizar las degradaciones de Panda es asumir que el algoritmo realmente encuentra respuestas para las preguntas de ejemplo que comparte Google.  No funciona de esa manera.  El algoritmo tampoco puede utilizar «métricas de compromiso del usuario» porque no están disponibles para Google para la mayoría de los sitios (y los googlers han insistido repetidamente en que no utilicen los datos de Google Analytics).

La actualización de Google Panda supuso un cambio importante en la forma en que Google filtra sus resultados de búsqueda.  Lanzada a finales de febrero de 2011, la actualización fue originalmente llamada «Google Farmer Update» por los profesionales de marketing web.  Posteriormente se reclasificó como «Google Panda Update» después de que los profesionales de marketing se enteraron de que Google se refería internamente al algoritmo con este nombre como indica la experta en posicionamiento web barcelona

La actualización de Google Panda Update obligó a los profesionales de marketing web a replantearse cómo crear contenido para la web.  Desafortunadamente, más de seis años después, muchos profesionales del marketing siguen confundidos acerca de lo que Google Panda Update intenta conseguir.  El algoritmo Panda se utilizó para crear un «clasificador de documentos», un filtro que se ejecuta contra todos los documentos que Google considera incluir en su índice web buscable (que contiene más de 100.000 millones de documentos).  El algoritmo Panda se utiliza para puntuar dinámicamente cada documento de forma independiente sobre la base de «señales» que los sistemas de aprendizaje de Google han identificado como fuertemente correlacionadas con la calidad de un documento.  Estas «señales» nunca han sido reveladas públicamente por Google.

LÍNEA DE TIEMPO PARA EL ALGORITMO DE GOOGLE PANDA

En 2005 Google publicó su informe «Web Authoring Statistics», que proporcionó una visión única de cómo un gran motor de búsqueda ve la Web a un nivel HTML muy básico.

En agosto de 2009 Matt Cutts invitó a los webmasters a ayudar a probar una nueva tecnología de indexación que Google había llamado Cafeína. La comunidad SEO inmediatamente cayó en la especulación desenfrenada sobre cómo la cafeína afectaría las clasificaciones (de hecho, el único efecto fue involuntario).

En febrero de 2010, incluso yo había caído presa de la Especulación de la Cafeína. El 25 de febrero de 2010 Matt McGee confirmó que Google todavía no había implementado la tecnología de cafeína en más de 1 centro de datos (en este momento, en abril de 2013, sólo hay 13 centros de datos de Google en todo el mundo).

El 8 de junio de 2010, Google anunció la finalización del despliegue de su tecnología de indexación de cafeína. La cafeína le dio a Google la capacidad de indexar más de la Web a un ritmo más rápido que nunca. Esta tecnología de indexación más grande y rápida cambió invariablemente los resultados de la búsqueda porque todo el contenido recién descubierto estaba cambiando el marco de referencia del motor de búsqueda para millones de consultas.

El 11 de noviembre de 2010 Matt Cutts dijo que Google podría utilizar hasta 50 variaciones para algunas de sus más de 200 señales de clasificación, un punto que Danny Sullivan utilizó para extrapolar un potencial de 10.000 «señales» que Google podría utilizar en su algoritmo.

El 24 de febrero de 2011 Google anunció el lanzamiento de su primera iteración de algoritmos Panda en el índice.  Esto se conocía como Google Panda Update 1.0.  Desde entonces se han publicado muchas actualizaciones posteriores de Google Panda.

El 2 de marzo de 2011, Google pidió a los webmasters que compartieran las URL de los sitios que consideraban que Panda no debería haber degradado. La discusión duró muchos meses y el tema tiene más de 1000 mensajes. Los ingenieros de Google confirmaron ocasionalmente a lo largo de 2011 que todavía estaban observando la discusión y recopilando más información.

Al día siguiente, Wired publicó una entrevista con Amit Singhal y Matt Cutts (ver abajo).

El 6 de mayo de 2011 Amit Singhal publicó 23 preguntas que atrajeron muchas críticas de los vendedores web frustrados. Las turbas furiosas no entendían el contexto en el que se debían usar las preguntas.

El 21 de junio de 2011 Danny Sullivan sugirió que el algoritmo de Google Panda podría ser un factor de clasificación más que un simple filtro (un punto de vista que yo y otros también habíamos llegado a tener en ese momento, pero Danny fue el primero en sugerirlo públicamente).

A mediados de marzo de 2013, Google anunció que el algoritmo Panda había sido «incorporado a nuestro proceso de indexación», lo que significa que ahora se estaba ejecutando esencialmente en piloto automático. Entre el 24 de febrero de 2011 y el 15 de marzo de 2013 hubo más de 20 «iteraciones» confirmadas y sospechadas del algoritmo Panda que cambiaron los resultados de búsqueda de millones de consultas.

En junio de 2013 en SMX Advanced 2013 Matt Cutts dijo que desde marzo sólo había habido una actualización de Panda; también añadió

Entry Filed under: Empresas. .



Leave a comment

Required

Required, hidden


¡IMPORTANTE! Responde a la pregunta: ¿Cuál es el valor de 10 11 ?
 

Some HTML allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Subscribe to the comments via RSS Feed


Categorías

Archivos

Entradas recientes

Etiquetas