Cumbre de la Voz: Hacia dónde va la voz


Por Ben Parkison

Hace poco asistí a la Cumbre de la Voz, y tengo algunas ideas sobre hacia dónde va la Voz.

Mi hija y Alexa nacieron el mismo año, por lo que ambas tienen cuatro años. Mi hija interactúa regularmente con Alexa, reproduciendo música, haciendo preguntas y, lo que es más importante, haciendo que Alexa emita sonidos de animales. Viendo esta interacción cada mañana, puedo decir que mi hija de cuatro años es más capaz de comunicarse que Alexa. Y eso no es ninguna crítica a Amazon: Es el caso de todas las plataformas de voz actuales.

Amazon-Alexa-Echo

Aunque hoy estamos creando valor real para los clientes empresariales con la voz, en Valence estamos más entusiasmados con lo que vemos venir en los próximos años:

Mejor tecnología:estos sistemas mejoran día a día en su capacidad de comprender las entradas y de ofrecer una respuesta de forma natural. A medida que esta evolución continúe, veremos una mayor adopción de interfaces de voz y soluciones más capaces.

Acceso a más datos- Las empresas siguen adoptando estrategias modernas de gestión de datos y diseños que dan prioridad a la nube. La marea creciente levanta todos los barcos, y esta progresión permitirá a las aplicaciones empresariales, incluidas las soluciones de voz, hacer más.

Sistemas que escuchan- La idea de invocar una interfaz de voz será un artefacto de nuestro tiempo. A medida que mejoren el reconocimiento de voz y la comprensión contextual, los asistentes de voz serán capaces de escuchar, saber quién habla, comprender cuándo es necesario actuar y responder de inmediato.

Nuevo hardware- El número y la variedad de formas en que podemos acceder a los asistentes digitales no hará sino aumentar. Los cascos de realidad aumentada, los wearables y otras tecnologías aún más sorprendentes harán que los asistentes de voz sean omnipresentes.

Interfaces de usuario conversacionales: hoy en día, el lenguaje no se limita a las palabras que salen de nuestra boca. A medida que la inteligencia artificial se integre más con las interfaces de voz, pasaremos realmente a interfaces de usuario conversacionales capaces de identificar visualmente al interlocutor, detectar su estado de ánimo, entender si está confuso, impaciente o interesado en la conversación, y mucho más. Todo esto permitirá que las interfaces de usuario conversacionales sean más conscientes de las emociones. ¿Quiero que el dispositivo Alexa de mi sala de conferencias lea mi estado de ánimo? Puede que no. Pero imagínate una sala de urgencias, una negociación en la que hay mucho en juego, un escenario de combate o cualquier otro entorno humano cargado de emociones. Entonces, ¿tiene sentido que mi interfaz sea más consciente de las emociones? Puede que sí.

A medida que estos avances continúen en los próximos meses y años, las interfaces conversacionales serán la punta de lanza de cómo definimos la IA y cómo reconfigura nuestra relación con los sistemas digitales.

Recursos adicionales

Chatbots: Mucho más que una novedad

Chatbots: Mucho más que una novedad

La promesa de la Inteligencia Artificial y los chatbots ya está aquí.

Es cierto que los robots humanoides aún no vagan por la Tierra, pero las aplicaciones y los servicios basados en la inteligencia artificial están transformando el mundo que nos rodea en un ámbito más inteligente, interactivo y capacitado. ¿Busca un buen ejemplo? Pregúntele a Siri, Alexa, Cortana o CleverBot. Ellos, colectivamente, son la respuesta.

Siri de Apple, Alexa de Amazon, Cortana de Microsoft y Cleverbot de Google son ejemplos de chatbots: "un programa informático que mantiene una conversación a través de métodos auditivos o textuales". Algunos chatbots utilizan la capacidad de procesamiento del lenguaje natural para entender tu habla y responder verbalmente. Siri, de Apple, es quizá el ejemplo más famoso de este tipo de chatbot, aunque Alexa y Cortana también son muy utilizados. Otros chatbots se basan en texto y responden a preguntas, órdenes u observaciones escritas. Xiaoice, de Microsoft, por ejemplo, se lanzó en China en 2014 y, tan solo un año después, ya había sido utilizado por más de 40 millones de propietarios de teléfonos inteligentes (el 25% de los cuales, al parecer, habían dicho "te quiero" a su "amigo virtual", que está disponible en las dos plataformas de medios sociales más importantes de China: Weibo y WeChat).

Los chatbots han sido objeto de controversia (véase Tay, de Microsoft) y de burlas cómicas frecuentes (véase, por ejemplo, Siri). En general, mucha gente los considera poco más que una novedad, una forma divertida de que los consumidores interactúen con la tecnología. Pero son mucho más que eso. En pocas palabras, los chatbots son un poderoso ejemplo de la proliferación de la Inteligencia Artificial en la sociedad. Y sólo estamos arañando la superficie de tus capacidades.

Hasta la fecha, el panorama de los chatbots disponibles para consumidores y empresas ha estado dominado en gran medida por los titanes tecnológicos antes mencionados. Sin embargo, se está diversificando y dinamizando considerablemente, un fenómeno impulsado por el lanzamiento de numerosos marcos de chatbot para desarrolladores.

Los marcos de chatbot son esencialmente kits de desarrollo de software (SDK) para el universo de la IA. Proporcionan una plataforma -la infraestructura tecnológica- para que los desarrolladores creen chatbots que se adapten a tus necesidades. El lanzamiento de marcos como el Bot Framework de Microsoft y el Bot Engine de Facebook (wit.ai) significa que cualquier desarrollador, ya sea un aficionado o un proveedor de servicios profesional, puede construir un chatbot para mejorar su vida o la de los que le rodean.

¿Quieres crear un chatbot que te hable en la jerga del Capitán Garfio a tiempo para el Día de Hablar como un Pirata (19 de septiembre)? ¡Adelante! ¿Crees que tu empresa puede beneficiarse de un chatbot diseñado para proporcionar una forma más intuitiva de acceder y organizar los datos que impulsan tu éxito? ¡Constrúyelo!

...¡o déjenos construirlo! Valence entiende que los chatbots son más que una novedad; son una tecnología que cambia el paradigma y que puede transformar digitalmente los negocios de cualquier sector. Por eso los ponemos al servicio de nuestros clientes de forma que apoyen tanto tus objetivos estratégicos como tus tácticas cotidianas. Y por eso estamos deseando saber cómo podemos ponerlas a su servicio.

Recursos adicionales

Comprensión del lenguaje natural: No es sólo chat

Comprensión del lenguaje natural: No es sólo chat

La reciente normalización de las tecnologías de reconocimiento de voz y comprensión del lenguaje natural (NLU) ha dado el primer paso para que las empresas adopten las nuevas capacidades habilitadas: El chatbot. A partir de 2016, las empresas empezaron a invertir seriamente en el chat como forma de replantearse las interfaces con los datos empresariales, agilizar el acceso de empleados y clientes a los servicios y permitir estrategias de ahorro de costos como el autoservicio. Sin embargo, los chatbots no son más que la primera incursión en las nuevas capacidades habilitadas por NLU, y la próxima ronda verá la aparición de sistemas que aprovechan NLU para optimizar la interfaz entre lo humano y lo digital para maximizar el valor.

Pronto, mientras toma su café a la mañana, una directora de ventas podrá hablar en voz alta sobre su día anterior. Su sistema integral habilitado para NLU responderá poniendo en cola automáticamente informes dinámicos en su pantalla, optimizando su lista de tareas para el nuevo día en función de su comportamiento anterior y sirviéndola automáticamente a su dispositivo, poniéndose en contacto con los miembros adecuados del equipo y programando tus reuniones para la semana, todo ello mientras mantiene una conversación con ella sobre su plan semanal recomendado a través de su asistente digital.

Todo esto será posible con sistemas optimizados en función de cómo se comunican mejor los seres humanos, cómo procesan la información los sistemas digitales y cómo funcionan ambos juntos.

Letting Humans be Human
La conversión de voz en texto, la NLU y la estandarización del modo en que los desarrolladores interactúan con estos algoritmos han cambiado, por primera vez en décadas, el modo en que los humanos pueden transmitir información a los sistemas digitales. Estas tecnologías están experimentando su propio renacimiento por el simple hecho de que permiten a los humanos comunicarse de la forma en que lo hemos hecho durante milenios: hablando. El habla permite a los usuarios confiar en su propia capacidad para comunicar flujos de información matizados y precisos de una forma tan natural que supera con creces el estándar de tacto y teclado en términos de eficacia y precisión.

Dejar que los sistemas digitales hagan lo suyo
Los chatbots han sido el primer paso porque son lo que conocemos. Desde las primeras aplicaciones de mensajería, llevamos décadas enviando y recibiendo información en formatos de lenguaje natural. Este paradigma es un primer paso natural para NLU. Pero ahora estamos a punto de asistir a una revolución en la forma en que los sistemas digitales procesan el habla humana y devuelven información al usuario en todas las formas en que los sistemas digitales son capaces (y en las formas en que los humanos no pueden): exploraciones dinámicas de datos, experiencias de realidad virtual, flujos de trabajo multidispositivo omnipresentes y mucho más.

Un equilibrio perfecto
Al combinar la comprensión del lenguaje natural con toda la gama de modelos de comunicación digital existentes y futuros, podemos optimizar la transmisión de cada información para adaptarla al estilo de comunicación específico y a las necesidades del emisor y el receptor. El resultado: sistemas empresariales que cambian radicalmente las tecnologías empresariales básicas, abriendo el camino a la eficiencia, el ahorro de costos y los nuevos modelos de negocio.

Recursos adicionales: