BBVA Open4u - Plataformas de Inteligencia Artificial para desarrolladores: reconocimiento de voz

Plataformas de Inteligencia Artificial para desarrolladores: reconocimiento de voz

El mercado de la Inteligencia Artificial vinculado al procesamiento de lenguaje natural y el reconocimiento de voz es prometedor. Hoy existen numerosas plataformas para desarrolladores de este tipo de servicios para aplicaciones. 

BBVAOpen4U
|
19 Ene. 2016

Dos palabras. Inteligencia Artificial (IA). Fue uno de los campos de desarrollo más potentes durante 2015 y lo será también durante 2016. Lo cierto es que será uno de los sectores que mayores beneficios genere durante los próximos años o décadas. Imagínate un terreno de cientos de hectáreas de tierra cultivable, pero pocas semillas plantadas. Empresas como Google, Facebook o Microsoft llevan tiempo desarrollando productos de Inteligencia Artificial, generalmente ligados al procesamiento de lenguaje natural y al reconocimiento de voz

Algunas previsiones establecen que, solo el mercado de las aplicaciones relacionadas con la Inteligencia Artificial, alcanzará un valor de 11.100 millones de dólares en 2024. Otras, que el mercado global de la Inteligencia Artificial llegará hasta los 40.000 millones de dólares en 2022, con una tasa de crecimiento anual aproximada del 25% y en sectores tan dispares como el transporte o la salud. Acierten o no, el campo de la IA es un mercado de desarrollo de ideas, proyectos y empresas de una enorme proyección.

Hoy en día existen varias startups que han lanzado plataformas y soluciones de Inteligencia Artificial para que los desarrolladores sean capaces de crear sus proyectos. Este es un listado con algunas de las mejores opciones, sobre todo en el sector de las apps, el reconocimiento de voz y la Inteligencia Artificial: 

●      Jasper

Jasper es una plataforma de código abierto para desarrolladores de aplicaciones con control de voz. Con ella es posible controlar todo tipo de productos: usar la voz para pedir información a determinadas aplicaciones, manejar el hogar, actualizar redes sociales… El código está disponible para los desarrolladores que deseen programar sus propios módulos.

Esta plataforma está diseñada expresamente para el hardware Raspberry Pi, concretamente su placa Modelo B. También necesita un hardware adicional como adaptador WiFi que le permite tener conexión a internet y un micrófono USB (los creadores de Jasper han testeado la plataforma con el micrófono USB Akiro Kinobo). Además es recomendable disponer de una tarjeta de memoria de 4GB y un cable Ethernet. Aquí está el listado completo de hardware necesario para desarrollar con Jasper

Existen ya, en la documentación de la plataforma, algunos módulos escritos por otros desarrolladores para otras aplicaciones que muestran sus posibilidades. Hay creado un módulo de Google Calendar para la actualización de eventos. El código está disponible en Github. Otro para Twitter que permite lanzar tuits, comprobar cuáles son las tendencias más importantes, mensajes directos… Jasper trae además algunos módulos por defecto para las notificaciones de Facebook, los controles de Spotify. Requisito: saber Python.

●      Api.ai

Api.ai es una de las startups más prometederas en el procesamiento de lenguaje natural y el reconocimiento de voz. Facilita a los desarrolladores todo tipo de interfaces conversacionales al estilo de Siri para incorporar un asistente personal inteligente a las aplicaciones. A mediados de 2015 consiguió una ronda de financiación adicional de 3 millones de dólares de fondos como SAIC Capital. Previamente apostaron por ella empresas como Intel o Motorola. 

Esa ronda de financiación se debió al crecimiento del objeto de su negocio. A parte de disponer de interfaces para conectar dispositivos, ahora también apuesta por asistentes inteligentes que permitan conectar coches con plataformas o servicios. Es el coche inteligente que ya es una realidad.

Api.ai tiene Kits de Desarrollo de Software (SDK) para varias plataformas: sistemas operativos como Android, iOS o Windows Phone; el Apple Watch; el intérprete JavaScript por el lado del servidor Node.js; el marco de desarrollo de aplicaciones Cordova; el entorno de desarrollo de videojuegos 3D Unity; o los lenguajes de programación como C#, Python o JavaScript. También se puede conectar con otros asistentes como Amazon Echo o Microsoft Cortana.

Api.ai tiene una versión totalmente gratuita, pero también dispone de una de pago para empresas: facilita espacio privado en la nube, soporte de un equipo profesional durante las 24 horas del día, siete días a la semana, y modelos de reconocimiento de voz personalizables por parte del cliente.

●      Wit.ai

Se definen como “procesamiento de lenguaje natural para desarrolladores” que se dediquen al diseño de aplicaciones, la robótica, los wearables (dispositivos ponibles conectados) o las plataformas de mensajería automática. Es una startup realmente interesante. Tanto es así que Facebook se fijó en ella y la adquirió tan solo año y medio después de su lanzamiento al mercado. En ese momento, 6.000 desarrolladores confiaban en sus APIs para el desarrollo de servicios, hoy en día ese número alcanza ya los 10.000.  Wit.ai es una plataforma de código abierto y gratuita para los profesionales.

Wit.ai es capaz de procesar el lenguaje natural y transformar todo eso al formato de intercambio de datos JSON (JavaScript Object Notation), que es con lo que al final trabajan los desarrolladores para sus aplicaciones. Wit.ai no solo facilita ese reconocimiento del lenguaje sino que separa cada concepto en entidades (“entities”) y valores. Y un valor de confianza en su reconocimiento.

// get a response
{
  "_text": "Turn on the lights",
  "intent": "lights",
  "entities": {
    "on_off": "on"
  },
  "confidence": 0.83
}

Wit.ai tiene una API para desarrolladores disponible para numerosos sistemas operativos, hardware y lenguajes de programación: Android, iOS, Windows Phone, Node.js, Raspberry Pi, Ruby, Python o C. También dispone de un plugin JavaScript para el desarrollo de front-end para el diseño de aplicaciones.

●      Zypr

Zypr es un conjunto de Web APIs lanzado por Pioneer para el trabajo de los desarrolladores con el reconocimiento de voz, pero también con mapas, rutas o redes sociales. Entre algunos de los servicios que proporciona Zypr están el control Facebook o Twitter; la interacción con servicios de Google como Gmail (servicio de correo), Calendar (calendario) o Contacts (contactos); o el control de una aplicación de recomendaciones de restaurantes como Yelp.

Las APIs de Zypr funcionan con sistemas operativos iOS y Android.

Síguenos en @BBVAAPIMarket

11.100
millones de dólares es el valor que alcanzará el mercado de apps de Inteligencia Artificial en 2024

¡Suscríbete!

Recibe nuestro boletín semanal. No te pierdas nuestros trucos, consejos, artículos y los eventos más innovadores.