?Qué significa ara?a?
En el contexto de Internet, una ara?a es un software especializado dise?ado para rastrear y navegar sistemáticamente por la World Wide Web, normalmente con el fin de indexar páginas web para ofrecerlas como resultados de búsqueda para las consultas de búsqueda de los usuarios.
La más famosa de estas ara?as es Googlebot, el principal rastreador de Google, que ayuda a garantizar que se devuelvan resultados relevantes para las consultas de búsqueda.
Las ara?as también se conocen como rastreadores web, robots de búsqueda o, simplemente, bots.
Definición de ara?a
Una ara?a es esencialmente un programa utilizado para recopilar información de la World Wide Web. Recorre las páginas de los sitios web extrayendo información e indexándola para su uso posterior, normalmente en los resultados de los motores de búsqueda.
La ara?a visita los sitios web y sus páginas a través de los distintos enlaces hacia y desde las páginas, por lo que una página sin un solo enlace que vaya a ella será difÃcil de indexar y puede ser clasificada muy bajo en la página de resultados de búsqueda.
Y si hay muchos enlaces apuntando a una página, esto significarÃa que la página es popular y aparecerÃa más arriba en los resultados de búsqueda.
Pasos del rastreo web:
- La ara?a encuentra un sitio y empieza a rastrear sus páginas.
- La ara?a indexa las palabras y los contenidos del sitio.
- La ara?a visita los enlaces que se encuentran en el sitio.
Las ara?as o webcrawlers son sólo programas y, como tales, siguen reglas sistemáticas establecidas por los programadores. Los propietarios de sitios web también pueden participar indicando a la ara?a qué partes del sitio debe indexar y cuáles no.
Esto se hace creando un archivo ?robots.txt? que contiene instrucciones para la ara?a sobre qué partes debe indexar y qué enlaces debe seguir y cuáles debe ignorar.
Las ara?as más importantes que existen son las de los principales motores de búsqueda, como Google, Bing y Yahoo, y las destinadas a la extracción de datos y la investigación, pero también hay algunas ara?as maliciosas escritas para encontrar y recopilar correos electrónicos para que el usuario los venda a empresas de publicidad o para encontrar vulnerabilidades en la seguridad de la Web.