Para una serie de tareas de análisis de SEO, es necesario determinar durante cuánto tiempo el motor de búsqueda "sabe" la existencia de una página específica en el sitio. Una de las formas más comunes de averiguar la antigüedad de un documento en Yandex es buscar la URL utilizando Yandex.Xml para obtener el parámetro modtime. Debido al desglose del parámetro “&how=tm”, el método ganó aún más popularidad.
Resulta conveniente y rápido, afortunadamente hay una interfaz visual en https://xml.yandex.ru/test/. Pero yo con gran duda Me identifico con este método.
En primer lugar, la documentación del servicio sólo dice esto:
Por lo tanto, la idea de que la etiqueta muestre la fecha de la primera indexación pertenece enteramente a la gente de SEO.
En segundo lugar, los usuarios de Yandex.Xml no son, por decirlo suavemente, los clientes más importantes del motor de búsqueda. El acceso se da de forma gratuita, no hay publicidad allí. ¿Por qué Yandex LLC estaría especialmente preocupado por la precisión, relevancia y confiabilidad de los parámetros xml? Aunque todavía puedes creerlo, bueno, los buenos programadores hacen todo bien. Pero no está del todo claro por qué proporcionar funciones no documentadas.
Sin embargo, todo esto son letras y especulaciones mías. Vayamos a los hechos.
Como me dice la lógica y Google, este es el tiempo que ha pasado desde la primera indexación. La mayoría de las veces, nos interesa exactamente esto: desde qué fecha la página comenzó a atraer tráfico, acumular edad, etc.
En realidad varía. No hace falta buscar muy lejos para ver un ejemplo.
Revisemos modtime para ver varias páginas de mi antiguo proyecto de pasatiempo smmup.ru.
DIRECCIÓN | Fecha de la hora de modificación | |
---|---|---|
/ | 20140916T170528 | 2014-09-16 |
/actividad.php | 20150422T103533 | 2015-04-22 |
/objetivo.php | 20150208T173922 | 2015-02-08 |
/kogda.php | 20141112T210047 | 2014-11-12 |
Ya escribí sobre el historial del recurso en el artículo. Durante mucho tiempo, Yandex no lo indexó correctamente. Conservo correspondencia con Platón del 20 de abril de 2015. En este momento, sólo había una página en la búsqueda: la página principal.
Es decir, la hora de modificación de al menos dos URL resultó no ser en absoluto la fecha de aparición en el índice. Para /kogda.php, la diferencia entre el valor de este parámetro y el tiempo de indexación final es casi seis meses! El documento no está en el índice, pero el modtime ya tiene experiencia (el soldado está durmiendo, el servicio está en curso).
¿Qué quiere decir esto? Para exagerar un poco: analizamos a los competidores para la solicitud, vimos un montón de páginas antiguas allí, nos asustamos y no avanzamos. Y la mitad de los competidores han estado bajo estrictos filtros durante mucho tiempo y no es tan difícil superarlos.
La situación es teórica, la describí simplemente como un ejemplo claro de por qué es necesario confiar en modtime con gran precaución.
Pero éstas siguen siendo flores.
En el caso de smmup.ru, al menos podemos interpretar modtime como el momento de la primera visita del robot. Las fechas se correlacionan bien con la apariencia real de las páginas del sitio.
Aquí hay otro ejemplo. Aquí simplemente no me atrevo a plantear una hipótesis sobre de dónde viene todo.
Para disipar las últimas dudas:
Es decir: modtime subestimó significativamente la antigüedad de la página.
Este ejemplo se encontró exactamente en 2 minutos (solo miré el parámetro de las páginas del blog, sin trucos adicionales), lo que indica la alta prevalencia de este tipo de resultados. Además, vi muchos casos similares en sitios que audité (no los muestro por razones obvias), a veces el error fue de años.
¡Estaré encantado de recibir interpretaciones adicionales y ejemplos interesantes!
PD. Hubo una discusión larga y no particularmente productiva sobre este tema en Facebook. Quizás no pude formular suficientemente bien el mensaje del artículo. La cuestión no es que haya algunos fallos con modtime. Está claro que Yandex puede, por una razón u otra, restablecer la "antigüedad" de una página. Lo principal es que estos ejemplos ilustran: a) no se puede confiar en modtime como la fecha de la primera indexación b) no hay certeza de que un "reinicio" de edad según modtime signifique una limpieza completa de la página de factores acumulados que están directamente o indirectamente relacionados con la edad.
La indexación de sitios web en los motores de búsqueda es importante para todo webmaster. Después de todo, para una promoción de alta calidad de un proyecto, conviene controlar su indexación. Describiré el proceso de verificación de la indexación en Yandex.
El robot Yandex escanea sitios día tras día en busca de algo "sabroso". Recoge en los primeros resultados aquellos sitios y páginas que, en su opinión, más lo merecen. Bueno, o Yandex simplemente lo quería así, quién sabe :)
Nosotros, como verdaderos webmasters, nos adheriremos a la teoría de que cuanto mejor esté hecho un sitio, mayor será su posición y más tráfico.
Hay varias formas de comprobar la indexación de sitios en Yandex:
Para comprender lo que el motor de búsqueda encontró en nuestro sitio, debe dirigirse a nuestro querido Yandex Webmaster en la sección "Indexación".
Primero, vayamos al elemento "Omitir estadísticas". Esta sección le permite saber qué páginas de su sitio rastrea el robot. Puede identificar direcciones que el robot no pudo cargar debido a la indisponibilidad del servidor en el que se encuentra el sitio o debido a errores en el contenido de las propias páginas.
La sección contiene información sobre las páginas:
El gráfico muestra páginas nuevas (verde) y modificadas (azul).
Y este es un gráfico del historial de rastreo.
Este elemento muestra las páginas que encontró Yandex.
N/a: el robot no conoce la URL, es decir. el robot nunca la había conocido antes.
Qué conclusiones se pueden sacar de la captura de pantalla:
Entonces, en mi caso, Yandex Webmaster refleja lo que esperaba ver: lo que no es necesario, Yandex lo eliminó y lo que se necesita, Yandex lo agregó. Esto significa que todo está bien con el bypass, no hay bloqueos.
Los resultados de búsqueda cambian constantemente: se agregan nuevos sitios, se eliminan los antiguos, se ajustan las posiciones en los resultados de búsqueda, etc.
Puede utilizar la información en la sección "Páginas en búsqueda":
Esta sección es necesaria para comprobar la indexación de páginas. Aquí Yandex Webmaster muestra las páginas agregadas a los resultados de búsqueda. Si todas sus páginas se agregan a la sección (se agregará una nueva dentro de una semana), entonces todo está en orden con las páginas.
Además de Yandex Webmaster, puede comprobar la indexación de una página utilizando operadores directamente en la búsqueda.
Usaremos dos operadores:
Utilicemos el operador "sitio". Tenga en cuenta que no hay espacio entre el operador y el sitio. Hay 18 páginas en la búsqueda de Yandex.
Utilicemos el operador "host". 19 páginas indexadas por Yandex.
Hay muchos de estos servicios. Te mostraré dos.
Serphunt es un servicio en línea para análisis de sitios web. Tienen una herramienta útil para comprobar la indexación de páginas.
Puede consultar simultáneamente hasta 100 páginas de un sitio web utilizando dos motores de búsqueda: Yandex y Google.
Para comprobar la indexación de una página, agréguela a la lista:
Haga clic en "Iniciar escaneo" y después de unos segundos obtenemos el resultado:
Dos métodos para obtener la fecha en que se indexó una página por primera vez dejaron de funcionar:
Pero esta información aún se puede obtener a través de Yandex XML. Para hacer esto, debe seguir el enlace https://xml.yandex.ru/test/ y en el campo "&query" ingresar una consulta como url:%page%, donde %page% es la dirección de la página. A continuación, hacemos clic en “Buscar” y en el resultado resultante buscamos una etiqueta que indicará la fecha en que se indexó la página por primera vez.
Para averiguar la fecha del último rastreo de la página e información sobre qué versión se encuentra al crear los resultados de búsqueda, debe seleccionar "Verificar el estado de la URL" en el servicio Yandex.Webmaster en la sección "Indexación". A continuación, indique la dirección requerida y reciba los datos. Este método sólo funciona para un sitio verificado.
Para averiguar la fecha de creación de la copia guardada, debe hacer clic en el menú desplegable en los resultados de la búsqueda (al lado del nombre de la dirección de la página).
Ver copias guardadas en los motores de búsqueda Bing y Mail mostrará versiones anteriores de las páginas, ya que las reindexan más lentamente que los robots de búsqueda Yandex y Google.
Dos métodos para obtener la fecha en que se indexó una página por primera vez dejaron de funcionar:
Pero esta información aún se puede obtener a través de Yandex XML. Para hacer esto, debe seguir el enlace https://xml.yandex.ru/test/ y en el campo "&query" ingresar una consulta como url:%page%, donde %page% es la dirección de la página. A continuación, hacemos clic en “Buscar” y en el resultado resultante buscamos una etiqueta que indicará la fecha en que se indexó la página por primera vez.
Para averiguar la fecha del último rastreo de la página e información sobre qué versión se encuentra al crear los resultados de búsqueda, debe seleccionar "Verificar el estado de la URL" en el servicio Yandex.Webmaster en la sección "Indexación". A continuación, indique la dirección requerida y reciba los datos. Este método sólo funciona para un sitio verificado.
Para averiguar la fecha de creación de la copia guardada, debe hacer clic en el menú desplegable en los resultados de la búsqueda (al lado del nombre de la dirección de la página).
Ver copias guardadas en los motores de búsqueda Bing y Mail mostrará versiones anteriores de las páginas, ya que las reindexan más lentamente que los robots de búsqueda Yandex y Google.