Deep Web, a internet que o Google não vê

Deep Web, a internet que o Google não vê

Você sabia que apenas 4% da internet é acessível aos buscadores comuns? Google, Bing e o Yahoo não conseguem indexar 96% do conteúdo disponível. Então, cai por terra o ditado popular: se não tem no Google, não existe.

Muitos costumam abordar o tema como um iceberg, mas eu prefiro que você imagine como o sistema solar: escolha um dos quatro maiores planetas: Júpiter, Urano, Saturno ou Netuno. O resto, incluindo as estrelas e os satélites seriam o que os motores de busca não conseguem encontrar. Por que essa comparação? Os quatro maiores planetas também são os que concentram mais massa, ou seja, nós!

 

Mas, onde está todo esse conteúdo?

Essa parte da internet que não é visível a todos os navegadores é chamada de Deep Web. Ela é 500 vezes maior que a surface (sites acessados através do uso do Chrome, Mozilla, Internet Explorer, Safari). Estima-se que os dados presentes são de até 91 mil terabytes, enquanto os do Google somam 167. Chocante, eu sei.

Os motivos pelos quais esses sites não são indexados:

– Conteúdo que viole as regras dos buscadores. Dentro dos motores de busca, existem vários fatores que categorizam um site como impróprio, ocasionando a sua penalização. Entre elas estão: conteúdo ofensivo e/ou duplicado, uso de textos e imagens com direitos autorais, black hat, entre outros;

– Solicitação de privacidade pelo dono do site. Ao criar um site ou blog, o dono pode optar por não permitir que mecanismos de busca o encontrem. Os motivos são diversos: informações e dados pessoais, rede de arquivos de estudantes ou sites com conteúdo ilícito;

– Conteúdo dinâmico. As páginas são redirecionadas de acordo com um formulário, por isso não geram link público;

– Web privada. Páginas que são acessadas somente com senha e login;

– Internet contextualizada. De acordo com o IP, conteúdos diferentes são apresentados;

– Conteúdo com acesso limitado. É possível esconder conteúdos usando CAPTCHAs. Recorrendo a este recurso, o acesso ao robô dos buscadores fica restrito.

Quem deseja se aventurar neste universo, deve estar ciente de dois detalhes extremamente importantes: o primeiro, é que, definitivamente, não é recomendável acessar a deep web. Existem relatos de especialistas em informática que acessaram usando todo o seu conhecimento e, ao entrar, fizeram uma busca para métodos de segurança e descobriram que suas técnicas eram primitivas.

O segundo fator: o risco de ser infectado por vírus é 10 vezes maior. Por isso, navegadores comuns não irão ajudar. Boa parte do conteúdo está encriptado, sendo necessário um sistema para decodificá-lo. Deve-se utilizar uma máquina virtual, que é um programa que permite acessar dois sistemas operacionais através de um computador. Você pode instalar dois Windows com versões diferentes, ou um Linux e um Windows, e deve-se escolher um principal e outro auxiliar, no caso de contaminação, é só deletar o auxiliar.

Se mesmo com todas essas informações, você deseja acessar essa internet oculta, existem alguns programas e cuidados a serem tomados. O mais recomendado é o software e navegador Tor. Ele deve ser usado por alguns motivos:

  • Os hackers e vírus possuem um conhecimento avançado, por isso, suas técnicas para danificar computadores e fazer uso de informações pessoais são avançadas;
  • Para ter anonimato. Existem alguns arquivos que podem estar em investigação judicial. Mas, cuidado! Se você baixar um arquivo com mais de 10MB, seu ip fica gravado mesmo com o uso desses programas. Aliás, não baixe nenhum arquivo executável pelo Windows;
  • É comum o redirecionamento para sites com conteúdos criminosos ou qualquer outro tipo que possa ser desagradável;
  • Com esse navegador é possível acessar a plataforma onion, que seria a primeira entre 8 profundidades.

OBS: O navegador e sistema Tor garante seu anonimato e segurança. Para isso, ele possui vários recursos, tornando-o lento.

Além do software apresentado, é possível usar a versão Tails do GNU/LINUX. Ela é desenvolvida justamente para a navegação anônima. O usuário roda diretamente de um CD, por isso, seu firewall é considerado impenetrável. Mesmo que alguém consiga invadir, não haverá danos porque não há dados. Um antivírus pago também seria um bom aliado. Isso porque, ao contrário dos gratuitos, eles possuem mais informações em seu banco de dados e são atualizados com maior frequência.

A deep web, deep net, invisible web, under net, hidden web e free net não podem ser confundidas com a dark web. Nesse lado negro, é possível encontrar conteúdos como:

– redes criminosas envolvendo qualquer tipo de tema (por exemplo, pedofilia, terrorismo, nazismo, incentivo a violência por discriminação e qualquer outro tipo de atrocidade e com informações agressivas);

– sites de hackers, crackers e compartilhamento de todos os tipos de softwares mal intencionados;

– sociedades satânicas, zoofilia, necrofilia e snuff também são exemplos de bizarrices que compõem essa parte inacessível.

No entanto, não deve haver confusão: a dark web está dentro da deep web, mas não é a mesma coisa. Essa seria a parte mais obscura e sombria da internet oculta.

Vale lembrar ainda que, apesar de todos os riscos e brutalidades, sites da deep web possuem diversas vantagens. Por não existir a necessidade de respeitar direitos autorais, a reprodução de obras completas é livre. Esse é um dos motivos que leva o conteúdo de qualidade e relevante ser até 2 mil vezes maior que o da surface. Além disso, 95% do conteúdo está acessível ao público e existem sites bons com conteúdo inédito de literatura, programação e projetos científicos.

Como encontrar este conteúdo?

Quando estamos usando a internet, o Google lê as nossas preferências em redes sociais e e-mails. Assim, a busca é filtrada de acordo com o perfil do usuário, para que ele ache o que procura com maior facilidade. A deep web também possui sistemas de busca, mas alguns sites só podem ser acessados se você souber a URL exata. Vale lembrar que a maioria dos sites é, em outros idiomas, ou seja, é necessário um conhecimento fluente em outras línguas. Ao contrário dos mecanismos usados na surface, eles são específicos de acordo com o nicho. Existem alguns direcionados somente para conteúdos ilícitos. Os abaixo são os mais populares:

– InfoMine, que busca conteúdo de bibliotecas universitárias norte-americanas, entre elas está a University Of California;

– Intute, lista todas as universidades da Inglaterra. Sua busca pode ser por palavra chave e categoria;

– Complete Planet, com assuntos diversos: desde militares, comidas ou meteorologia para agricultores;

– IncyWincy, semelhante ao Google, possui busca por imagens;

– DeepWebTech é constituído por cinco motores de busca agrupados. Cada um possui um tema específico, como medicina, negócios e ciências;

– Scirus: somente para assuntos científicos. É possível encontrar jornais, homepages de cientistas, materiais didáticos e patentes.

– TechXtra, que é um buscador voltado para as áreas exatas como: matemática, engenharia e computação. Possui muitos dados e relatórios técnicos;

– Hidden Wiki. Este é o mais famoso. Separa os links por tema e é através dele que é encontrado o conteúdo mais agressivo. Recentemente, este buscador sofrer um ataque do grupo Anonymous devido ao compartilhamento de sites de pedofilia;

– The WWW Virtual Library. Assim como o IncyWincy, é semelhante ao Google. Foi criado por alunos de Tim BernersLee, o criador da web.

Depois de desvendado o mito, fica a dúvida: até que ponto vale a pena acessar essa gama de informações? Ao mesmo tempo em que podemos tirar nossas rédeas e possuir um conhecimento amplo sobre diversos assuntos, veremos como um lado do ser humano pode ser cruel e devastador. A maioria dos relatos (você pode conferir um aqui) afirmam que o acesso a deep web é uma experiencia assustadora, devido a imagens e conteúdo impactante. É claro que a internet não está livre de sites bizarros como o “Cabuloso”, ou que a pornografia não seja facilmente encontrada. Mas 91 mil terabytes mostram muito mais detalhes do que 167.

E você? Aventurar-se-ia?

Comments

comments