Saltar al contenido
ᐅ HielosMendez – Información digital que te dejara helado 🧊🥶

La NASA y DARPA colaboran en la búsqueda en la Web profunda para analizar los datos de la nave espacial

Condiciones de uso.

A estas alturas, es posible que haya oído hablar de Deep Web, que es un término vago que describe la capa invisible u oculta de la Web que los motores de búsqueda como Google y Bing no indexan (de ahí la metáfora del iceberg, ilustrada arriba). A veces se combina con la Dark Web, que contiene redes oscuras que existen entre pares de confianza que utilizan protocolos y puertos no estándar. Las Darknets originalmente fueron designadas como aisladas de ARPANET de la década de 1970. Podía conectarse a ellos y enviarles datos, pero no respondieron a los pings de la red ni a otras consultas.

En cualquier caso, la Deep Web no es, por definición, fácil de buscar. A menudo contiene todo tipo de actividad ilegal como resultado: refugios para delincuentes, terroristas, tráfico sexual y otros grupos con propósitos nefastos. En noviembre, una redada criminal a gran escala por parte del FBI y la Asociación Nacional contra el Crimen del Reino Unido resultó en el cierre de más de dos docenas de sitios web de Tor, incluido Silk Road 2.0, una versión más reciente del mercado negro en línea original que puso a disposición drogas ilegales. armamento, electrónica y otros bienes.

La Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) ha desarrollado herramientas (denominadas Memex) que pueden acceder y categorizar este mundo con el propósito de rastrear a estas personas, y el mes pasado la agencia abrió las principales partes del código detrás de Memex para que otros grupos puede aprovechar las herramientas. Ahora, los investigadores del Laboratorio de Propulsión a Chorro de la NASA en Pasadena, California, se han unido y están buscando herramientas de búsqueda en la Deep Web por una razón completamente diferente: extraer grandes almacenes de datos de las naves espaciales de la NASA y otros objetivos relacionados con la ciencia.

La idea es tratar la Deep Web como Big Data, un término que generalmente se refiere a cualquier gran almacén de datos estructurados, semiestructurados o no estructurados que sea demasiado grande para procesar o extraer información utilizando técnicas tradicionales de búsqueda y bases de datos. En este caso, podría aplicarse fácilmente a los datos recuperados en misiones espaciales.

Esta captura de pantalla de las aplicaciones ImageSpace e ImageCat en Memex muestra cómo puede organizar una gran cantidad de información y buscar relaciones entre los datos ocultos en las imágenes.  Créditos: NASA / JPL-Caltech / Kitware / Continuum

Esta captura de pantalla de las aplicaciones ImageSpace e ImageCat en Memex muestra cómo puede organizar una gran cantidad de información y buscar relaciones entre los datos ocultos en las imágenes. Créditos: NASA / JPL-Caltech / Kitware / Continuum

«Estamos desarrollando tecnologías de búsqueda de próxima generación que comprenden a las personas, los lugares, las cosas y las conexiones entre ellos», dijo Chris Mattmann, investigador principal del trabajo de JPL en Memex, en un declaración. En este momento, en la Deep Web, Memex es lo suficientemente inteligente como para verificar tanto el contenido basado en texto como las imágenes, videos, anuncios emergentes, scripts y formularios en línea, y puede asociar contenido de una fuente con otra en un formato diferente. Ese tipo de tecnología de búsqueda podría ser de gran utilidad durante las misiones espaciales, donde las naves espaciales toman fotos, videos y otros tipos de datos con instrumentos científicos complejos.

Por ejemplo, un investigador podría buscar a través de información visual de un planeta o asteroide para aprender más sobre sus características geológicas, dijo Elizabeth Landau de JPL, o analizar automáticamente datos de misiones terrestres que monitorean el tiempo y el clima. Los científicos también podrían realizar búsquedas profundas en los resultados científicos publicados en los almacenes de datos de la NASA. Todo es con código de fuente abierta.

“Estamos aumentando los rastreadores web para que se comporten como navegadores, en otras palabras, ejecutando scripts y leyendo anuncios de la forma en que lo haría cuando normalmente se conecta a Internet. Normalmente, los motores de búsqueda no catalogan esta información ”, dijo Mattmann. «Estamos desarrollando productos maduros, gratuitos y de código abierto, y luego los mejoramos mediante la inversión de DARPA y los trasladamos fácilmente a través de nuestros roles a la comunidad científica». Será interesante ver qué hacen los ingenieros de la NASA, sin mencionar a otros investigadores, con el proyecto. La buena noticia es que, a diferencia de los proyectos típicos de DARPA, podremos ver y utilizar los resultados.