SkyPhrase, el buscador semántico que entiende lo que dices

Nick Cassimatis es un joven pionero, capaz de unir la investigación en inteligencia artificial e informática con los últimos avances en lingüística y psicología. Su sueño de mezclar el lenguaje natural con el procesamiento mediante algoritmos nació pronto, cuando Nick tenía sólo quince años. Así realizó la programación de un traductor de inglés a francés que le valió el ser reconocido dentro del Top 20 de estudiantes de institutos de Estados Unidos, de acuerdo con el diario USA Today.

Sus ideas se basan en lo que se conoce como «Hipótesis del Sustrato Cognitivo» («Cognitive Substrate Hypothesis«). Cassimatis tiene como objetivo profesional la mezcla de estructuras de datos bien integrados más algoritmos específicos, para así recrear la inteligencia artificial y el lenguaje. ¿Con qué fin? Años después de la invención de aquel primer traductor, este investigador, licenciado en matemáticas por el MIT y con un máster en psicología por Stanford, y actualmente profesor en el Rensselaer Polytechnic Institute, desarrollaría con dos alumnos una start-up, Skyphrase. El objetivo de la misma es aplicar la inteligencia artificial y sus conocimientos del lenguaje humano en nuevos buscadores semánticos que puedan realizar investigaciones personalizadas. Cassimatis concibe el lenguaje humano como una pieza extraordinaria en ese gran puzzle que es la inteligencia, y lo ve como una gran herramienta de aprendizaje, útil para avances tecnológicos:

Language is good piece of that problem to work on because human language can do so much more than any other animal language, and because humans can talk about almost anything, it must be a really general capacity

Los orígenes de Skyphrase

Con anterioridad a la invención de Cassimatis, algunas aplicaciones trataban de «enseñar» al software vocabulario y reglas gramaticales, así como el uso de la estadística en la realización de búsquedas. Pero para personalizarlas, necesitamos situar al lenguaje en su contexto. Por ejemplo, si queremos saber qué es «Obama», los resultados que obtengamos variarán entre «Presidente de los Estados Unidos» y «ciudad japonesa de la prefectura de Fukui». Entender cómo mediante el lenguaje natural somos capaces, a través de nuestro cerebro, de discernir dichos significados, es aún un rompecabezas para los programadores.

Sin embargo, existen herramientas como Wolfram Alpha, que trabaja de una forma diferente a como lo hace Google. En el primer caso, se procesa la respuesta a partir de una base de datos estructurada. En la segunda opción, se proporciona una lista de documentos o páginas web en las que puede estar situada la respuesta que necesitamos.

Otra aplicación interesante en el caso de Apple es Siri. Partiendo del lema «Tus deseos son órdenes», Siri nace como protocolo de reconocimiento junto con el iPhone 4S. Una aplicación similar, desarrollada por una compañía española y denominada Sherpa, permite además realizar transacciones mediante su uso. La gran desventaja que presentan tanto Siri como la herramienta española tiene que ver con posibles conflictos de privacidad, al trasladar a la red información confidencial.

Pero si algo caracteriza a ambas plataformas es que las dos pretenden resolver la misma interrogante: ¿cómo procesar el lenguaje natural para responder a preguntas o hacer recomendaciones a los usuarios que las utilicen?

Google

La búsqueda tradicional se transforma

Con la invención de Skyphrase, disponible en web, app para iPhone y extensión en el navegador Chrome, se inicia una nueva era en el desarrollo de la búsqueda personalizada por Internet. Cassimatis lo resume diciendo que «Siri pretende memorizar la biblioteca del Congreso, mientras que Skyphrase trata de asimilar el lenguaje para poder leer y entender dicha biblioteca».

La aplicación, novedosa en cuanto a las búsquedas semánticas, basa su desarrollo en cuatro consideraciones:

  1. Sólo busca palabras completas.
  2. Entiende conjunciones, oraciones coordinadas y frases nominales.
  3. No busca por sinónimos o palabras relacionadas.
  4. El despegue de esta herramienta busca establecer alianzas con posibles colectivos interesados (lingüistas, expertos en inteligencia artificial, etc.).
Skyphrase, al contrario que Siri, y debido a las mejoras implementadas en su creación, es capaz de detectar información de Gmail y Twitter, a partir de enunciados como «tweets from NASA with pictures» o «emails that Jane sent me during the holidays containing pictures». Frases en apariencia nada sencillas para los buscadores a los que estamos habituados.
Sin duda alguna, con la generación de estas nuevas herramientas que utilizan trucos semánticos, la utilización de Internet será cada día más parecida al funcionamiento de nuestra inteligencia y nuestro cerebro, en el desarrollo de algo tan complejo y apasionante como es el lenguaje humano.

Imágenes | Search Engine People Blog, Flickr

RELACIONADOS