A Web Invisível

Também chamada de DeepWeb ou DeepNet ou UnderNet em inglês, a Web Invisível ou Web Oculta é o conteúdo da rede mundial que não é indexado pelos mecanismos de busca padrão.

Quem criou a expressão foi Mike Bergman, fundador da BrightPlanet e atual CEO da StructuredDynamics, empresas de Big Data,  inteligibilidade e semântica de dados. Em 2001, publicou um white paper intitulado: “The Deep Web: Surfacing Hidden Value“, hoje um clássico.

De certa forma, nada mais verdadeiro do que a expressão “surfar a web”. Jamais mergulhamos de verdade muito abaixo da linha d’água.

A busca padrão se compara a uma rede de arrastão que varre a superfície do oceano de informação que é a Internet. Pega muitos peixes, mas a maior quantidade e os maiores vivem no fundão.  Estão submersos nas profundezas, em páginas ou sites gerados dinamicamente, que não são alcançados pelos mecanismos normais de busca.

Nem Google nem Bing conseguem “enxergar” o conteúdo da DeepWeb, pois, a rigor, são páginas que não existem até serem criadas dinamicamente como resultado de uma busca específica.

Imagina-se que a Web Invisível corresponda a quase 90% do conteúdo da Internet. Existem ferramentas para pesquisar no fundo desse oceano. São mais complicadas que as buscas padrão, exigem um certo estudo e tempo para serem úteis ao usuário. E cuidado, há todo tipo de peixe nas profundezas, inclusive predadores.

Eis algumas dicas para se pesquisar a Web Oculta com mecanismos de busca diferenciados:




