ANALISIS SOBRE LA INTERNET PROFUNDA O INVISIBLE
I.- REALIZAR UN BREVE ANÁLISIS SOBRE
LAS LECTURAS DE TARINGA SOBRE LA INTERNET PROFUNDA O INVISIBLE.
El concepto de
Internet invisible o Internet profunda, conocida en inglés también como
Deepweb, Darkweb o Hidden web, hace referencia, básicamente, a una serie de
contenidos que no son visibles para los motores de búsqueda tradicional, esto
es, que Google no puede encontrar.
La Internet Invisible o Profunda, es
básicamente el contenido de Internet no indexado por los motores de búsqueda.
Aunque ya se habló de la ‘la Web invisible’ en la década de los 90, se
considera generalmente aceptado que el término ‘Internet Profunda’ fue
introducido por Michael K. Bergman en un white
paper titulado “The
Deep Web: Surfacing Hidden Value”.
Más que de una red oculta
creada intencionalmente como nos pueda parecer en la actualidad, el documento hablaba
de contenidos no localizables por los motores de
búsqueda por
distintos motivos, desde páginas protegidas mediante contraseñas a formatos no
indexables con páginas sin contenido html.
Hay bastante controversia
con el tamaño que puede ocupar la Deep Web. Algunos autores calculan su tamaño hasta en 500 veces superior a la Internet superficial
aunque otros reducen bastante el dato tras la explosión de las redes sociales,
de los grandes servicios como Google y de los datos movidos por los
dispositivos móviles en la Internet usada por la mayoría de los mortales.
En todo caso, las cifras que
se manejan para este sub-mundo de Internet son espectaculares y estimaciones
basadas en un estudio
de la Universidad de Berkeley especulan que en la
actualidad el Internet Profundo podría ocupar hasta 91.000 terabytes. Algo
imposible de confirmar por su propia estructura pero
impresionante de igual forma, como el dato de los 300.000 sitios Deep Web
existentes en 2004
Como
todos sabemos la internet es un mar sin fin de información, pero se dice que
hay sitios que normalmente no salen en el buscador de gente común. Pero porque
se debe esto, como dice en el artículo que se está analizando esto se ya que
hay información clasificada de gobiernos que no son accesibles y que resultan
difíciles de ver, los cuales incluso si intentas hacerlo puede que tengas
serios problemas. Pero no solo existe información de gobiernos oculta n la red
sino también del narcotráfico y del terrorismo.
La
internet profunda representa el 95% de la internet que hay en el mundo, lo que
podemos saber es que la internet cotidiana almacena 197 Terabytes (un terabytes
Equivale a 1024 Gigabytes) contra 91000 de la deep weep casi quinientas veces
mayor, por lo tanto aquí podemos encontrar encontrar la puerta a base de datos
con directorios gigantescos de información sobre meteorología, astronomía o
cualquiera de las principales áreas en las que los gobiernos mantengan investigaciones
constantes hasta bibliotecas de millones de tomos, diccionarios, sitios de
noticias anónimos, datos financieros, hemerotecas, sitios de personas y
empresas, publicaciones digitales de libros, y una fauna de copias de leyes,
álbumes de fotografía histórica, directorios con información de personas y sus
correos electrónicos o números telefónicos, informes como los de Wikileaks, foros de agrupaciones anónimas, comentarios de redes sociales, marcadores
sociales, discusiones en foros, entre tantos otros contenidos que te estés
imaginando.
Pero como todo tiene sus contrastes, luego de leer
lo anterior seguramente has quedado pensando en que faltaba lo tal vez más
impactante de todo lo que queda afuera de los buscadores, y en este aspecto la ilegalidad
y lo prohibido toman un papel mucho más importante en las intenciones del
aprovechamiento de la Deep Web. Es así como en la misma podrás llegar a
encontrar sitios donde se comercian drogas, armas y hasta servicios delictivos.
Asimismo hay lugar para el intercambio de pedofilia y cualquier otro tipo de
actividad ilegal de las que tendrás que mantenerte muy atento, pues además de
contribuir pasivamente a que estas prácticas horrorosas se sigan nutriendo de
público, también estarás expuesto a todo tipo de amenazas cibernéticas. Sin
descontar la infiltración e investigación constante de organismos de seguridad
en estos sitios. Pero no todo es negativo, pues paralelamente a los aspectos
más reprobables que puede tener el Hacking en general (como se podrá
apreciar en sitios donde se ofrecen servicios para destruir servidores, hackear cuentas, crear virus en comunidad, etc.), también se
comparten conocimientos sobre sistemas, seguridad y mucho más que sin dudas es
muy interesante y no genera consecuencias para el usuario promedio.
Ahora que ya sabemos un poco sobre este tema
imaginemos la deep web como un océano donde cada que nademos hacia lo profundo
aumentara lo peligroso que puede ser, por lo tanto se divide en 6 niveles:
Nivel 0:
Web
común: la más fácil de todos, llamado asi por un pequeño número de páginas que
todos conocemos y que hoy en dia dominan el mundo internauta, tales son Google,
Youtube, el mundo Yahoo!, Wikipedia, Redes sociales y similares.
Nivel 1:
Web
Superficial: Aquí se encuentran web un poco menos conocidas pero de igual fácil
acceso. Son en su mayoría foros, páginas pornográficas y pequeñas páginas
independientes de interés no tan común como en el nivel anterior.(4chan, Reedit
y parecidos)
Nivel 2:
Bergie
Web: Está compuesto por dominios web aún menos conocidas y por los buscadores
independientes tales como lo son Ares y Emule. El material que se puede ver en
este nivel es de conducta dudosa y no apto para estómagos débiles. El morbo
suele ser por lo que los usuarios lo visitan. Hasta aquí hemos tocado solo la
parte superficial del ciber-mundo. Es a partir de aquí donde está lo realmente
“interesante”.
Es ahora
cuando se da el primer paso dentro de Deep Web. Lo interesante de los niveles
3, 4,5 y 6 es lo que pondré a continuación, en su mayoría estos niveles
contienen muchas bases de datos inmensas, además de toda la basura informática
que hay en Internet.
Nivel 3:
Deep Web
d’abord: A partir de aquí las todas las cosas cambian radicalmente las páginas
que se dominan en este oscuro mundo suelen estar compuestas por letras o signos
en su mayoria dejados caer de manera totalmente aleatoria. En ellas no hay
publicidad, ni color y lo más significativo es que no se relacionan entre ellas
como las paginas superficiales, de hecho, ni siquiera aparecen en buscadores
como Google, ni aunque copies el link de la página completa e intentes
buscarlo. Los URL no terminan con .com o .org, sino con la terminacion .onion.
Aquí hay
muchas más cosas raras, muchas cosas perturbadoras, muchas inútiles, tales como
las web abandonadas, algunas por más de 25 años, pero también muchas cosas
útiles. En este sector quizá encuentres ese libro que tanto buscabas y que no
encuentras por que cerraron Megaupload, o esa película de antaño que ya nadie
se molesta en subir, e incluso hay algunos foros interesantes. Pero la verdad
es que la mayoría de lo que hay aquí tiene fines mucho mas macabros y
desagradables, en su mayoría pornografía infantil, pequeños mercados de drogas
y armas, instructivos de cómo hacer bombas, o fotos de gente siendo torturada o
desmembrada, entre otros. En los foros se hablan temas bastante perturbadores,
a veces en broma y otras ni tanto. La verdad llega un punto en el que todo es
tan raro que te es difícil saber cuándo es una broma, de un verdadero homicida
contando como violó y mató a su víctima.
Nivel 4:
Charter
Web: Los niveles anteriores eran peligrosos, pero con un programa y un buen
antivirus era suficiente, pero aquí no. El cuarto nivel y lo que está por
delante están plagados de hackers. Y por hackers no me refiero a chiquillos
tontos cuyo único pasatiempo es infectar computadoras, me refiero a verdaderos
piratas informáticos, lo mejor de entre lo mejor cuando a robo y malversación
de datos se refiere.
En este
nivel, además de todo lo que hay en los otros niveles, se puede ver Snuff en
vivo o grabaciones y, además, se encuentra el “Mercado Negro”. Una página de
ventas online como mercadolibre, solo que aquí se venden cosas de los mas
macabros, además de drogas, armas, órganos, trata de blancas e incluso puedes
contratar sicarios. Todo pagado con una moneda llamada BitCoin. Pero los
hackers no están aquí de compras o para ver morbosidades varias, sino para
trabajar. En este nivel se encuentran paginas de numeroso gobiernos, donde se
puede encontrar información sobre a qué va realmente destinado el dinero de
esos países, leyes que piensan ser aprobadas en secreto y secretos de estado
tales como expedientes sobre experimentos con humanos que datan de las ultimas
4 décadas. Se dice mucho sobre estos experimentos, y por lo que se menciona,
debes tener la fortaleza mental suficiente como para ver un video de ellos.
Nivel 5:
Marianas
Web: Su nombre se debe a la Fosa de las Marianas en el océano Pacifico, el
lugar más profundo del mar en si. Hay muy poca información sobre este nivel. Se
dice que aquí se exponen los secretos militares y de estado más impactantes e
importantes de todos y donde se aprueban estos mismos y donde se controla su
progreso. También se cree que la entidad que realmente domina el mundo
intercambia información entre sus contra partes por aquí. En este nivel se
necesita algoritmos que no se sabe con certeza si existen, además de
computadoras que solo posee el gobierno.
Nivel 6:
The Fog:
No se sabe muy bien que se puede encontrar en este nivel, pero se caracteriza
por dos cosas: El nivel de maldad, o ilegalidad es la más alta de la internet,
y quienes puedan estar inmerso en este nivel son conocidos como usuarios
dioses, por lo extremadamente complicado de tener cosas ya inimaginables
ilegales y repugnantes, sin ser vistos ni localizados por absolutamente nadie.
Quizás, como referencia, una de las pocas páginas que se sabe que existía en
este nivel, traficaba cuerpos muertos y órganos de niños. El creador y mente
artificial de este página fue sentenciado a muerte en EE.UU.
En la
Internet Profunda es de 400 a 500 veces mayor que en lo que comúnmente llamamos
Internet, o sea la Internet Superficial.
Contiene
más de 550 billones de documentos individuales comparado con el billón que hay
en la Internet visible (para el año 2000).
Lo que
reside en los bancos de datos (Databases). Son las requieren membresía y pagar
por acceder (America Online, noticias archivadas de periódicos y revistas como
Time, Scientific American, Periódicos, y otros).
El 95% de
la Internet profunda es de acceso gratuito – sin ataduras de pagos ni
subscripciones.
En
febrero de 1999, un estudio de la prestigiosa revista Nature calculaba que
entre todos los buscadores no se cubría más que el 42% de la red.
Además de
textos “invisibles” hay música, videos y arte “invisible”.
Para qué
puede servir el texto “invisible”? – para comunicarse entre usuarios escogidos,
o de un grupo en particular.
Se
considera “invisible”, o sea, de calidad de Internet Profunda lo siguiente:
Las
páginas excluidas. No siempre se puede llegar a todas las partes de un Website.
El Webmaster puede tener varias razones para hacer que los WebBots no indicen
ni consigan ciertas secciones de un Website, lo que hace que esa información
aunque esté en la Internet los buscadores no la vean.
Las
páginas que no son compatibles con HTML. Recordemos que la Internet es
esencialmente de formato HTML, pero en la computadoras se bregan cientos de
formatos de archivos.
Las
páginas con gráficas sin texto. Los buscadores no pueden ver nada que no sea
texto. Las imágenes que se puedan conseguir es porque están acompañadas de una
breve descripción, pero si no la tienen, los buscadores no las ve y es como no
si no existieran.
Las
páginas con música o vídeo pero sin texto. Volvemos a repetir: lo que los
indizadores de Internet (los Webots) no pueden leer es como sin existiera. Al
igual que con las gráficas, la música no se puede leer, las películas no se
pueden leer, etc. Así que Google y los otros buscadores dependen de la
descripción adjunta que le haya puesto el Webmaster a sus recursos.
Las
páginas que son básicamente PDF, Word, WordPerfect, PostScript, PowerPoint,
etc. (Google y AltaVista comienzan manejarlas. Esos son parte de los formatos
que hablamos anteriormente.
En el
artículo: Encontrar lo que se busca, sumergiéndose en las profundidades
(http://www.redcom.org) se dice: “Técnicamente la mayoría de estos formatos
pueden ser indexados, pero los motores eligen no hacerlo por razones de
negocio. En primer lugar, hay mucha menos demanda de este tipo de formatos que
de textos HTML, y además estos formatos son más difíciles de archivar y
organizar, por lo que requieren mayores recursos del servidor”.
Las
páginas con URL con signos de pregunta (?) imbuidos (esto se hace a propósito).
Los URL son las direcciones para que los buscadores consigan una página, pero
eso es si el URL está correctamente escrito. El signo de pregunta se usa para
que el usuario sepa que esa página va a estar disponible, pero que por ahora
no. Otras veces, el signo de pregunta se refiere a que la página corresponde a
una búsqueda -usualmente dentro de un banco de datos. Cuando se trata de una
búsqueda así, la página no se clasifica como "invisible".
Las
páginas con contraseñas (Passwords). Se requiere una contraseña para llegar a
las bases de datos, para llegar a una membresía, para llegar a una cuenta
bancaria, etc. Obviamente, las páginas con contraseña de entrada son el mejor
ejemplo de Internet invisible. A veces la contraseña se pide para calificar el
usuario como miembro, cliente, participante, o simplemente para establecer una
jerarquía de usuario.
Las
páginas profundas (o sea, las páginas profundas más al interior de un Website
que pueden ser muy bien las primeras en haberse entrado) de los Websites
grandes.
Si un
Website contiene demasiadas páginas, los Webots (los indizadores de la
Internet) solamente incluyen las primeras de ellas. Esto hace que si lo que
buscamos está entre las últimas de las páginas, no lo vamos a ver. En estos
casos hay que entrar a los Intranets de esos lugares y utilizar buscadores
específicos que se especializan en la información de esa Intranet.
Es
verdad que el Internet invisible también sirve con propósitos poco asociados a
la gestión del conocimiento, pero como todo en la red, queda a discreción de
los usuarios saber qué contenidos aprovechar.
Aunque
su nombre resulte intimidante para algunos, la verdad es que la Internet
invisible ya no está tan oculta como antes y gracias a los metabuscadores
(buscadores de buscadores) es posible rastrear fuentes de bases de datos, que
permiten acceder a la información alojada en la web profunda.
Según he leído ahí podemos encontrar de todo, he de confesar que me da cierto temor entrar, sin embargo he tratado de informarme bien para tomar la mejor decisión.
ResponderEliminarQuisiera dejarles este aporte https://zarza.com/internet-profunda-deep-web/ es una muy buena lectura, espero les sea de utilidad a sus lectores.