Un asistente virtual es un agente de software que ayuda a usuarios de sistemas computacionales, automatizando y realizando tareas con la mínima interacción hombre-máquina.

La interacción que se da entre un asistente virtual y una persona debe ser natural: una persona se comunica usando la voz y el asistente virtual lo procesa, interpreta y responde de la misma manera.

A veces el término bot conversacional (en inglés: chatbot) se utiliza para referirse a los asistentes virtuales en general o específicamente a aquellos a los que se accede por chat en línea (o en algunos casos, programas de chat en línea que son para entretenimiento y no para propósitos útiles).

Hacia 2017, las capacidades y el uso de los asistentes virtuales se está expandiendo rápidamente, con nuevos productos entrando al mercado. Una encuesta en línea en mayo de 2017 encontró el más utilizado en los Estados Unidos fueron Siri de Apple (34%), Google Assistant (19%), Amazon Alexa (6%) y Microsoft Cortana (4%).

El uso de altavoces inteligentes alimentados por estos asistentes es radicalmente diferente; Apple ni siquiera anunció su altavoz inteligente hasta junio de 2017. El asistente virtual M de Facebook esperaba estar disponible para cientos de millones en Facebook Messenger en 2017. Apple y Google tienen grandes bases instaladas de usuarios en teléfonos inteligentes y Microsoft tiene una gran base instalada de computadoras personales basadas en Windows (donde trabaja Cortana, además de teléfonos y altavoces inteligentes); mientras que Alexa fue el primero en obtener la posibilidad de realizar pedidos de comercio electrónico en línea, desde Amazon.

El asistente personal inteligente

Un asistente personal inteligente es un agente tipo software que puede realizar tareas u ofrecer servicios a un individuo. Estas tareas o servicios están basados en datos de entrada de usuario, reconocimiento de ubicación y la habilidad de acceder a información de una variedad de recursos en línea (como al clima o al tráfico, noticias, precios de acciones, horario del usuario, precios al por menor, etc).

Algunos ejemplos de asistentes personales son Siri de Apple, Braina, Google Assistant, Google Now, Amazon Echo, Microsoft Cortana, S Voice de Samsung, Voice Mate, Silvia y Hidi de HTC y Bixby de Samsung. Uno de los aspectos clave de un asistente personal inteligente es su habilidad para organizar y mantener información. Esto incluye el manejo de correos electrónicos, eventos en el calendario, archivos, lista a seguir, etc.

De acuerdo con el inversor de capital de riesgo, Chi-Hua Chien, de la firma Kleiner Perkins Caufield & Byers, ejemplos de tareas que pueden ser ejecutadas por inteligentes automatizados agentes personales incluyen manejo de agenda (ejemplo: mandar una alerta a alguien que llegará tarde a su cena por un inconveniente de tráfico, actualización de horarios para ambas partes, y cambiar el horario de reserva del restaurante) y un gestor personal de salud (ejemplo: monitorizar la ingesta diaria de calorías, el ritmo cardiaco y el régimen de ejercicio, después hacer recomendaciones y dar opciones para mejorar la salud).

La tecnología del asistente personal inteligente es posible debido a la combinación de dispositivos móviles, interfaces de programación de aplicaciones (APIs) y la proliferación de aplicaciones móviles. Sin embargo, asistentes personales automatizados son diseñados para realizar tareas que solo son especificadas una vez a través de la voz del usuario mientras que los agentes personales inteligentes realizan tareas en curso (ejemplo: actualización en la agenda o calendario) de forma autónoma.

El asistente personal inteligente tiene sus orígenes en un proyecto de inteligencia militar artificial llamada CALO, por sus siglas en inglés «cognitive assistant that learns and organizes” que significa asistente cognitivo que aprende y organiza. Adam Cheyer, un manager del proyecto CALO, tomó a unas personas del SRI International del centro de inteligencia artificial y formó un equipo para empezar la creación de Siri. Este fue el primer conocido asistente personal inteligente.

Historia de los asistentes virtuales

La primera herramienta que permitió ejecutar reconocimiento digital de voz fue IBM Shoebox, presentado al público general durante la Feria Mundial de Seattle de 1962, tras su lanzamiento inicial al mercado en 1961. Esta computadora temprana, desarrollada casi 20 años antes de la introducción del primer IBM Personal Computer en 1981, fue capaz de reconocer dieciséis palabras habladas y los dígitos del 0 a 9. El siguiente hito en el desarrollo de la tecnología de reconocimiento de voz se logró en la década de 1970 en la Universidad Carnegie Mellon en Pittsburgh, Pensilvania, con el apoyo sustantivo del Departamento de Defensa de los Estados Unidos y su agencia DARPA. Su herramienta Harpy dominó un millar de palabras, similar al vocabulario de un niño de tres años. Alrededor de diez años más tarde, el mismo grupo de científicos desarrolló un sistema que no sólo podía analizar palabras individuales sino secuencias enteras de palabras habilitadas por el modelo oculto de Márkov.

Así, los primeros asistentes virtuales, los cuales aplicaron software de reconocimiento del habla fueron contestadores automáticos y softwares médicos de dictáfonos digitales. En la década de 1990, la tecnología de reconocimiento de voz digital se convirtió en una característica de las computadoras personales de Microsoft, IBM, Philips y Lernout & Hauspie luchando por los clientes. Mucho más tarde el lanzamiento al mercado del primer teléfono inteligente IBM Simon en 1994 sentó las bases para los asistentes virtuales inteligentes tal como se conocen hoy en día. El primer asistente virtual digital instalado en un teléfono inteligente fue Siri, que fue presentado como una característica del iPhone 4S el 14 de octubre de 2011. Apple Inc. desarrolló Siri tras su adquisición en 2010 de Siri Inc., un spin-off de SRI International, que es un instituto de investigación financiado por DARPA y el Departamento de Defensa de los Estados Unidos.

Cómo trabajan los asistentes virtuales

Los asistentes virtuales hacen el trabajo a través de:

  • Texto (chat en línea), especialmente en una aplicación de mensajería instantánea o en otra aplicación.
  • Voz, por ejemplo con Amazon Alexa en el dispositivo Amazon Echo, o Siri en un iPhone.
  • Tomando y/o subiendo imágenes, como en el caso de Bixby en el Samsung Galaxy S8.

Algunos asistentes virtuales son accesibles a través de múltiples métodos, tales como Google Assistant a través de chat en la aplicación Google Allo y vía voz en altavoces inteligentes de Google Home.

Los asistentes virtuales usan el procesamiento de lenguajes naturales (PLN) para combinar el texto del usuario o la entrada de voz con comandos ejecutables. Muchos aprenden continuamente usando técnicas de inteligencia artificial, incluyendo el aprendizaje automático.

Dispositivos y objetos con asistentes virtuales

Los asistentes virtuales pueden estar integrados en diversos tipos de plataformas o, en el caso de algunos como Amazon Alexa, a través de varios de ellos:

  • En objetos como altavoces inteligentes como Amazon Echo, Mycroft y Google Home.
  • En aplicaciones de mensajería instantánea tanto en teléfonos inteligentes como vía web, como el asistente virtual M tanto en Facebook como Facebook Messenger.
  • Construido como parte del sistema operativo móvil, como Siri de Apple en dispositivos con iOS, o en un sistema operativo estacionario como Cortana en Microsoft Windows.
  • Construido en un teléfono inteligente independiente del sistema operativo, como Bixby en el Samsung Galaxy S8, y Google Assistant en el Google Pixel.
  • En otras aplicaciones móviles como Google Allo.
  • Dentro de plataformas de mensajería instantánea, con asistentes de organizaciones específicas, como el Aerobot de Aeroméxico en Facebook Messenger o el Secretario de Wechat en WeChat.
  • Dentro de aplicaciones móviles de compañías específicas y otras organizaciones, como Dom de Domino’s Pizza.
  • En relojes inteligentes.
  • En electrodomésticos, automóviles, y tecnología weareable con Android Wear.
  • Antiguas generaciones de asistentes virtuales que usualmente funcionaban en sitios web, como Ask Jenn de Alaska Airlines, o en sistemas de respuesta de voz interactiva (RVI) como el RVI de American Airlines de Nuance.