Fuente: El Heraldo, "Los niveles de la Internet Profunda"
Los buscadores convencionales solo muestran resultados de
una pequeña parte del contenido que existe en línea, a esto se le llama web
superficial. Existe contenido relevante almacenado en bancos de información y
sitios que demandan claves para acceder y que no aparecen en los resultados de
los buscadores tradicionales.
Los robots de los motores de búsqueda indexan el contenido y
recuperan la información libre de acceso al ser buscada por el usuario, estas
páginas son estáticas y tienen una URL fija.
Sin embargo, en la web profunda o invisible se puede
recuperar información que no se adquiere interrogando a los buscadores. En este
caso las páginas son dinámicas y se presentan bajo formatos: PHP, ASP, etc, además
no poseen una URL fija, ya que se construyen al momento de ser consultadas y se
eliminan al cerrarse.
Sherman y Price categorizan la web invisible según cuatro
tipo de contenidos:
1. La web opaca: posee contenidos que no se encuentran en los motores de búsqueda por diversos motivos como:
4. La web realmente invisible: Son páginas dinámicas, información almacenada en bases de datos relacionales o ingresada por usuarios que no puede ser accedida. Además son páginas que no pueden ser indizadas.
1. La web opaca: posee contenidos que no se encuentran en los motores de búsqueda por diversos motivos como:
· Debido a la extensión no todas las páginas son indizadas por los buscadores.
· Los buscadores no tienen la capacidad de indizar frecuentemente las páginas.
· Los buscadores limitan el número de resultados mostrados.
· Los buscadores presentan las páginas más referenciadas en otras páginas.
2. La web privada: Son los dueños de la información quienes no desean que el contenido esté disponible. Estas páginas podrían estar indizadas pero están excluidas por:
· Poseer una contraseña
· Tienen una archivo robot.txt para no ser indizadas.
· Tienen un campo “noindex” para no ser indizadas.
3. La web propietaria: Para acceder a la información hay que registrarse, algunas páginas son pagadas y otras gratuitas.4. La web realmente invisible: Son páginas dinámicas, información almacenada en bases de datos relacionales o ingresada por usuarios que no puede ser accedida. Además son páginas que no pueden ser indizadas.
Para buscar en la web profunda existen algunos recursos como:
- The WWW Virtual Library, el catálogo más antiguo
creado Tim Berners-Lee.
- Infoplease, un sitio de consulta con una gran
cantidad de artículos de enciclopedias, atlas y biografías.
- DeepWebTech, con cinco motores de búsqueda en
temas de ciencia, medicina y negocios.
- TechXtra: con información en materias de ingeniería,
matemáticas e informática.
Según Lluis Codina citado por la Universidad Tecnológica
Nacional (s.f.), Internet invisible es un término inadecuado para las páginas
web que no pueden ser indizadas, el
término más adecuado sería la web “no
indizable”.
Referencias:
Universidad Tecnológica Nacional. (s.f). Web superficial y
Web Profunda.
El Heraldo.co. (Diciembre, 2013). Los niveles de la Internet Profunda. Recuperado de http://www.elheraldo.co/infografias/los-niveles-de-la-internet-profunda-134361






