Alexa. Desarrollo de aplicaciones IoT para Arduino y ESP8266. Tomás Domínguez Mínguez
de interfaces de voz también tiene ventajas, ya que representan una oportunidad de negocio. Para 2021, se estima que las marcas que adopten este tipo de interfaces y rediseñen sus sitios web, disfrutarán de un crecimiento del 30 % en los ingresos.
1.2 SISTEMAS CONVERSACIONALES
Los sistemas conversacionales son aquellos capaces de comprender el lenguaje natural y entablar una conversación con una persona. Su objetivo principal es el de mejorar la experiencia del usuario, sustituyendo las formas tradicionales de interacción con las aplicaciones por otra basada en la voz. Se suelen utilizar para dar información sobre cuestiones que se le puedan plantear o ejecutar las órdenes que se le pida realizar.
Los sistemas conversacionales (también se les llama chatbots) nacieron mucho antes que las interfaces de voz, pero ha sido gracias a estas cuando han empezado a vivir una segunda juventud. Uno de los primeros (Eliza) se creó en el MIT (Massachusetts Institute of Technology) entre 1964 y 1966 por Joseph Weizenbaum. Realizaba un procesamiento de lenguaje natural para tratar de mantener una conversación de texto coherente entre un psicólogo (al que simulaba) y su cliente (el usuario).
Desde entonces, y hasta hace poco tiempo, los sistemas conversacionales eran únicamente materia de estudio por parte de expertos en el área de la inteligencia artificial. Sin embargo, los avances en procesamiento del lenguaje natural y el reconocimiento automático del habla han democratizado su uso, haciendo que esté cada vez más presente en un número mayor de dispositivos. Este tipo de técnicas hacen que los sistemas conversacionales no solo tengan la facultad que oír lo que se les diga, sino de llegar a entenderlo, aunque use palabras o frases diferentes. Además, son capaces de mantener una conversación coherente, utilizando información de contexto para que la interacción con ellos sea similar a la que tendría con cualquier otra persona.
Su uso es cada vez más frecuente en nuestra vida diaria. Por eso, Gartner ya identificó en 2017 los sistemas conversacionales como una de las diez principales tendencias tecnológicas estratégicas.
El ámbito de uso de los sistemas conversacionales es cada vez más amplio, incluyendo, desde los más sencillos, en los que se solicita información concreta, como la previsión meteorológica, hasta los más complejos, empleados por centros de atención al cliente de grandes compañías, pasando por aquellos que permitan el control de dispositivos de uso doméstico. Será precisamente en el ámbito IoT, especialmente el centrado en sistemas domóticos, al que se orientan las prácticas de este libro.
1.3 IoT
Internet de las cosas (IoT) es un concepto propuesto por Kevin Ashton en 1999 para referirse a la conexión de objetos cotidianos a través de Internet. Su implantación es cada vez mayor y abarca, entre otros, los sectores de la medicina, la industria, el transporte, la energía, la agricultura, las ciudades inteligentes o los hogares, que es en el que nos centraremos. Hoy en día es cada vez más frecuente encontrar dispositivos en casa capaces de ser utilizados de forma remota a través de Internet, bien sea para su control o para obtener información de los sensores que lleven incorporados.
El éxito de la tecnología IoT se debe, en gran parte, a su capacidad para introducir objetos de uso diario en el mundo digital, abriendo un amplio abanico de nuevas posibilidades que incrementan enormemente su utilidad, ya que permiten el control de los objetos a distancia (p. ej., encender o apagar una luz) o que estos informen de datos recogidos por sus sensores (p. ej., humedad o temperatura). Todo ello desde cualquier dispositivo en cualquier parte del mundo.
Para controlar o recoger datos de los dispositivos IoT se utilizan generalmente interfaces clásicas que se ejecutan en un ordenador y, cada vez con más frecuencia, en teléfonos móviles. Si en vez de estas se emplearan interfaces de voz, la interacción se volvería más natural, haciendo más sencillo el uso de las aplicaciones. Por este motivo, la unión de las tecnologías IoT y las relacionadas con el desarrollo de interfaces de voz están llamadas a formar un tándem que hará que este tipo de dispositivos tengan cada vez un uso más cotidiano.
Unidad 2
ALEXA
Alexa es el asistente virtual de Amazon. Nació en 2014 junto con el altavoz inteligente Amazon Echo, pero hasta 2018 no ha estado disponible en español. Su nombre fue elegido por varias razones, la primera de la cuales hace referencia a la Biblioteca de Alejandría (Alexandria), uno de los mayores centros de difusión del conocimiento de la Antigüedad. El otro motivo que favoreció su elección fue más práctico, ya que la letra “x” es una consonante poco común y fácil de reconocer. Puesto que el asistente se activa por voz, se quería minimizar el riesgo de confundirlo con otras palabras que pudieran despertarlo accidentalmente.
Aunque en un principio Alexa solo estaba vinculado a la gama de altavoces inteligentes Amazon Echo, posteriormente se permitió que otros fabricantes pudieran integrarlo en sus productos. Así, podemos encontrarlo hoy en día en teléfonos móviles (Android o iOS), pasando por televisores (LG, Sony, Hisense, Toshiba, etc.), interruptores, enchuches, bombillas o sensores (Osram, Philips, Belkin, Nest, etc.), hasta coches (Ford, Volkswagen, etc.).
Si abrir el asistente a dispositivos que no fueran productos de Amazon favoreció el uso de Alexa, lo que empujó definitivamente su expansión fue permitir que cualquier desarrollador pudiera ampliar sus capacidades. De esta forma, lo que se puede llegar a hacer con Alexa ya no depende únicamente de los comandos de voz que tiene integrados, sino de las habilidades (skills) que se instalen para ampliar su funcionalidad. Hay miles entre las que elegir, tanto gratuitas como de pago.
Esta estrategia de permitir integrar el asistente en dispositivos de otros fabricantes, así como el desarrollo de habilidades por parte de terceros, ha provocado que hoy en día Alexa sea uno de los asistentes virtuales de referencia en el mercado.
Unidad 3
HABILIDADES
Desde el momento en el que pueda hablar con Alexa, disfrutará de un compañero virtual al que podrá pedirle, por ejemplo, que suene una canción, ver su serie favorita o resumirle las últimas noticas del día. Para dar respuesta a estas solicitudes, el asistente debe disponer de las capacidades adecuadas, que serán las que ya tiene integradas o haya adquirido de habilidades (skills) desarrolladas por terceros.
A lo largo de los siguientes capítulos, aprenderá a desarrollar sus propias habilidades que, al ejecutarse en la nube, podrán usarse desde cualquier dispositivo Alexa al que esté conectado con su usuario de Amazon.
3.1 TIPOS DE HABILIDADES
El desarrollo de las habilidades se realizará con un conjunto de herramientas llamado ASK (Alexa Skills Kit), pudiendo ser de los siguientes tipos:
• Personalizada (custom). Permite atender cualquier tipo de solicitud. Para ello, deberá desarrollar, desde cero, el modelo de interacción (la conversación) que quiera que se establezca entre el usuario y Alexa. En dicho modelo, se determinará lo que se pueda llegar a pedir (intenciones), junto con las expresiones utilizadas para ello.
• Casa inteligente (smart home). Como su nombre indica, este tipo de habilidad controla dispositivos domésticos inteligentes, como luces, termostatos, televisiones, cerraduras, etc. Se basa en modelos de iteración preconstruidos, que incorporan las acciones que atienden las habilidades (a las que se llama directivas del dispositivo, como, por