Teléfonos móviles y gadgets.

Teléfonos móviles y gadgets.

» Cómo saber la fecha de indexación de una página. Cómo averiguar la fecha de indexación de una página Cómo averiguar la fecha de indexación de una página en Yandex

Cómo saber la fecha de indexación de una página. Cómo averiguar la fecha de indexación de una página Cómo averiguar la fecha de indexación de una página en Yandex

Para una serie de tareas de análisis de SEO, es necesario determinar durante cuánto tiempo el motor de búsqueda "sabe" la existencia de una página específica en el sitio. Una de las formas más comunes de averiguar la antigüedad de un documento en Yandex es buscar la URL utilizando Yandex.Xml para obtener el parámetro modtime. Debido al desglose del parámetro “&how=tm”, el método ganó aún más popularidad.

Resulta conveniente y rápido, afortunadamente hay una interfaz visual en https://xml.yandex.ru/test/. Pero yo con gran duda Me identifico con este método.

¿Qué pasa con el tiempo mod?

En primer lugar, la documentación del servicio sólo dice esto:

Por lo tanto, la idea de que la etiqueta muestre la fecha de la primera indexación pertenece enteramente a la gente de SEO.

En segundo lugar, los usuarios de Yandex.Xml no son, por decirlo suavemente, los clientes más importantes del motor de búsqueda. El acceso se da de forma gratuita, no hay publicidad allí. ¿Por qué Yandex LLC estaría especialmente preocupado por la precisión, relevancia y confiabilidad de los parámetros xml? Aunque todavía puedes creerlo, bueno, los buenos programadores hacen todo bien. Pero no está del todo claro por qué proporcionar funciones no documentadas.

Sin embargo, todo esto son letras y especulaciones mías. Vayamos a los hechos.

¿Qué es la "antigüedad de los documentos desde el punto de vista de Yandex"?

Como me dice la lógica y Google, este es el tiempo que ha pasado desde la primera indexación. La mayoría de las veces, nos interesa exactamente esto: desde qué fecha la página comenzó a atraer tráfico, acumular edad, etc.

En realidad varía. No hace falta buscar muy lejos para ver un ejemplo.

Revisemos modtime para ver varias páginas de mi antiguo proyecto de pasatiempo smmup.ru.

DIRECCIÓN Fecha de la hora de modificación
/ 20140916T170528 2014-09-16
/actividad.php 20150422T103533 2015-04-22
/objetivo.php 20150208T173922 2015-02-08
/kogda.php 20141112T210047 2014-11-12

Ya escribí sobre el historial del recurso en el artículo. Durante mucho tiempo, Yandex no lo indexó correctamente. Conservo correspondencia con Platón del 20 de abril de 2015. En este momento, sólo había una página en la búsqueda: la página principal.

Es decir, la hora de modificación de al menos dos URL resultó no ser en absoluto la fecha de aparición en el índice. Para /kogda.php, la diferencia entre el valor de este parámetro y el tiempo de indexación final es casi seis meses! El documento no está en el índice, pero el modtime ya tiene experiencia (el soldado está durmiendo, el servicio está en curso).

¿Qué quiere decir esto? Para exagerar un poco: analizamos a los competidores para la solicitud, vimos un montón de páginas antiguas allí, nos asustamos y no avanzamos. Y la mitad de los competidores han estado bajo estrictos filtros durante mucho tiempo y no es tan difícil superarlos.

La situación es teórica, la describí simplemente como un ejemplo claro de por qué es necesario confiar en modtime con gran precaución.

Pero éstas siguen siendo flores.

Modtime puede contener una fecha MÁS TARDE que la indexación real

En el caso de smmup.ru, al menos podemos interpretar modtime como el momento de la primera visita del robot. Las fechas se correlacionan bien con la apariencia real de las páginas del sitio.

Aquí hay otro ejemplo. Aquí simplemente no me atrevo a plantear una hipótesis sobre de dónde viene todo.

  • Mi blog no tiene problemas con la indexación (especialmente porque ese artículo se volvió a publicar en varios grupos populares).
  • No hubo redirecciones, cambios de dirección ni nada parecido.

Para disipar las últimas dudas:

Es decir: modtime subestimó significativamente la antigüedad de la página.

Este ejemplo se encontró exactamente en 2 minutos (solo miré el parámetro de las páginas del blog, sin trucos adicionales), lo que indica la alta prevalencia de este tipo de resultados. Además, vi muchos casos similares en sitios que audité (no los muestro por razones obvias), a veces el error fue de años.

Resultados

  1. Modtime no siempre muestra la fecha de indexación correcta (de hecho, nadie de Yandex lo prometió).
  2. Confíe únicamente en este parámetro para determinar la antigüedad de las páginas. esta prohibido. Los resultados no son fiables.
  3. Por tanto, su uso para analizar los sitios web de la competencia es una gran cuestión. Puede utilizarlo cuando trabaje con sus propios proyectos, gracias a la disponibilidad de otros datos para el control. Sin embargo, la gama de problemas que pueden resolverse de esta manera es bastante reducida.

¡Estaré encantado de recibir interpretaciones adicionales y ejemplos interesantes!

PD. Hubo una discusión larga y no particularmente productiva sobre este tema en Facebook. Quizás no pude formular suficientemente bien el mensaje del artículo. La cuestión no es que haya algunos fallos con modtime. Está claro que Yandex puede, por una razón u otra, restablecer la "antigüedad" de una página. Lo principal es que estos ejemplos ilustran: a) no se puede confiar en modtime como la fecha de la primera indexación b) no hay certeza de que un "reinicio" de edad según modtime signifique una limpieza completa de la página de factores acumulados que están directamente o indirectamente relacionados con la edad.

La indexación de sitios web en los motores de búsqueda es importante para todo webmaster. Después de todo, para una promoción de alta calidad de un proyecto, conviene controlar su indexación. Describiré el proceso de verificación de la indexación en Yandex.

Indexación en Yandex

El robot Yandex escanea sitios día tras día en busca de algo "sabroso". Recoge en los primeros resultados aquellos sitios y páginas que, en su opinión, más lo merecen. Bueno, o Yandex simplemente lo quería así, quién sabe :)

Nosotros, como verdaderos webmasters, nos adheriremos a la teoría de que cuanto mejor esté hecho un sitio, mayor será su posición y más tráfico.

Hay varias formas de comprobar la indexación de sitios en Yandex:

  • utilizando Yandex Webmaster;
  • utilizando operadores de motores de búsqueda;
  • usando extensiones y complementos;
  • utilizando servicios en línea.

Indexación de páginas de sitios web en Yandex Webmaster

Para comprender lo que el motor de búsqueda encontró en nuestro sitio, debe dirigirse a nuestro querido Yandex Webmaster en la sección "Indexación".

Omitir estadísticas en Yandex Webmaster

Primero, vayamos al elemento "Omitir estadísticas". Esta sección le permite saber qué páginas de su sitio rastrea el robot. Puede identificar direcciones que el robot no pudo cargar debido a la indisponibilidad del servidor en el que se encuentra el sitio o debido a errores en el contenido de las propias páginas.

La sección contiene información sobre las páginas:

  • nuevo: páginas que aparecieron recientemente en el sitio o que el robot acaba de rastrear;
  • cambiado: páginas que el motor de búsqueda Yandex vio anteriormente, pero que han cambiado;
  • historial de rastreo: la cantidad de páginas que Yandex rastreó, teniendo en cuenta el código de respuesta del servidor (200, 301, 404 y otros).

El gráfico muestra páginas nuevas (verde) y modificadas (azul).

Y este es un gráfico del historial de rastreo.

Este elemento muestra las páginas que encontró Yandex.

N/a: el robot no conoce la URL, es decir. el robot nunca la había conocido antes.

Qué conclusiones se pueden sacar de la captura de pantalla:

  1. Yandex no encontró la dirección /xenforo/xenforostyles/, lo cual, de hecho, es lógico, porque esta pagina ya no existe.
  2. Yandex encontró la dirección /bystrye-ssylki-v-yandex-webmaster/, lo cual también es bastante lógico, porque la pagina es nueva.

Entonces, en mi caso, Yandex Webmaster refleja lo que esperaba ver: lo que no es necesario, Yandex lo eliminó y lo que se necesita, Yandex lo agregó. Esto significa que todo está bien con el bypass, no hay bloqueos.

Páginas en búsqueda

Los resultados de búsqueda cambian constantemente: se agregan nuevos sitios, se eliminan los antiguos, se ajustan las posiciones en los resultados de búsqueda, etc.

Puede utilizar la información en la sección "Páginas en búsqueda":

  • realizar un seguimiento de los cambios en el número de páginas en Yandex;
  • realizar un seguimiento de las páginas agregadas y excluidas;
  • averiguar los motivos por los que se excluye un sitio de los resultados de búsqueda;
  • obtener información sobre la fecha en que el motor de búsqueda visitó el sitio;
  • para recibir información sobre cambios en los resultados de búsqueda.

Esta sección es necesaria para comprobar la indexación de páginas. Aquí Yandex Webmaster muestra las páginas agregadas a los resultados de búsqueda. Si todas sus páginas se agregan a la sección (se agregará una nueva dentro de una semana), entonces todo está en orden con las páginas.

Verificar el número de páginas en el índice Yandex usando operadores

Además de Yandex Webmaster, puede comprobar la indexación de una página utilizando operadores directamente en la búsqueda.

Usaremos dos operadores:

  • “sitio”: busca en todos los subdominios y páginas del sitio especificado;
  • “host”: busca páginas alojadas en un host determinado.

Utilicemos el operador "sitio". Tenga en cuenta que no hay espacio entre el operador y el sitio. Hay 18 páginas en la búsqueda de Yandex.

Utilicemos el operador "host". 19 páginas indexadas por Yandex.

Comprobación de la indexación mediante complementos y extensiones

Verifique la indexación del sitio utilizando servicios

Hay muchos de estos servicios. Te mostraré dos.

caza de serpientes

Serphunt es un servicio en línea para análisis de sitios web. Tienen una herramienta útil para comprobar la indexación de páginas.

Puede consultar simultáneamente hasta 100 páginas de un sitio web utilizando dos motores de búsqueda: Yandex y Google.

Para comprobar la indexación de una página, agréguela a la lista:

Haga clic en "Iniciar escaneo" y después de unos segundos obtenemos el resultado:

Dos métodos para obtener la fecha en que se indexó una página por primera vez dejaron de funcionar:

  • el operador de fecha no funciona correctamente;
  • agregar el parámetro &how=tm a la cadena de consulta ya no muestra las fechas de indexación.

Pero esta información aún se puede obtener a través de Yandex XML. Para hacer esto, debe seguir el enlace https://xml.yandex.ru/test/ y en el campo "&query" ingresar una consulta como url:%page%, donde %page% es la dirección de la página. A continuación, hacemos clic en “Buscar” y en el resultado resultante buscamos una etiqueta que indicará la fecha en que se indexó la página por primera vez.


Fecha de rastreo por parte del robot de búsqueda y estado en la base de datos de búsqueda

Para averiguar la fecha del último rastreo de la página e información sobre qué versión se encuentra al crear los resultados de búsqueda, debe seleccionar "Verificar el estado de la URL" en el servicio Yandex.Webmaster en la sección "Indexación". A continuación, indique la dirección requerida y reciba los datos. Este método sólo funciona para un sitio verificado.


Fecha de creación de la copia guardada.

Para averiguar la fecha de creación de la copia guardada, debe hacer clic en el menú desplegable en los resultados de la búsqueda (al lado del nombre de la dirección de la página).






Ver copias guardadas en los motores de búsqueda Bing y Mail mostrará versiones anteriores de las páginas, ya que las reindexan más lentamente que los robots de búsqueda Yandex y Google.

Conclusión

  1. Como se muestra en el ejemplo anterior, la copia guardada de la página no siempre se utiliza para crear la base del índice. Pero, a menudo, esto es cierto.
  2. Además, si ha realizado algún cambio en la página y está esperando que se vuelvan a indexar, no debe concluir que los cambios se han tenido en cuenta en función de la fecha del último rastreo del robot de búsqueda.

Dos métodos para obtener la fecha en que se indexó una página por primera vez dejaron de funcionar:

  • el operador de fecha no funciona correctamente;
  • agregar el parámetro &how=tm a la cadena de consulta ya no muestra las fechas de indexación.

Pero esta información aún se puede obtener a través de Yandex XML. Para hacer esto, debe seguir el enlace https://xml.yandex.ru/test/ y en el campo "&query" ingresar una consulta como url:%page%, donde %page% es la dirección de la página. A continuación, hacemos clic en “Buscar” y en el resultado resultante buscamos una etiqueta que indicará la fecha en que se indexó la página por primera vez.


Fecha de rastreo por parte del robot de búsqueda y estado en la base de datos de búsqueda

Para averiguar la fecha del último rastreo de la página e información sobre qué versión se encuentra al crear los resultados de búsqueda, debe seleccionar "Verificar el estado de la URL" en el servicio Yandex.Webmaster en la sección "Indexación". A continuación, indique la dirección requerida y reciba los datos. Este método sólo funciona para un sitio verificado.


Fecha de creación de la copia guardada.

Para averiguar la fecha de creación de la copia guardada, debe hacer clic en el menú desplegable en los resultados de la búsqueda (al lado del nombre de la dirección de la página).






Ver copias guardadas en los motores de búsqueda Bing y Mail mostrará versiones anteriores de las páginas, ya que las reindexan más lentamente que los robots de búsqueda Yandex y Google.

Conclusión

  1. Como se muestra en el ejemplo anterior, la copia guardada de la página no siempre se utiliza para crear la base del índice. Pero, a menudo, esto es cierto.
  2. Además, si ha realizado algún cambio en la página y está esperando que se vuelvan a indexar, no debe concluir que los cambios se han tenido en cuenta en función de la fecha del último rastreo del robot de búsqueda.