Revolucionando la Experiencia del Usuario a través de la Inteligencia Artificial (IA)
«Desde la aparición de los Modelos Base, diversas organizaciones han comenzado a aprovechar su potencial, empleando técnicas como la Ingeniería de Instrucciones, el Ajuste Fino, LoRA (Adaptación de Rango Bajo) y RLHF (Aprendizaje por Reforzamiento a partir de Retroalimentación Humana), ya sea individualmente o en combinación.
Desde la perspectiva de la experiencia de usuario (UX), es evidente que la introducción de ChatGPT está transformando las interfaces que debemos crear. ChatGPT ha demostrado un nivel de interacción de IA sin precedentes. A pesar de que ya existían interfaces conversacionales, el impacto de ChatGPT lo convierte en una aplicación revolucionaria que se recordará como el punto de partida de una revolución.
Otro aspecto fundamental de esta revolución es la disponibilidad de APIs de OpenAI para acceder de manera programática a los Modelos Base, lo que se asemeja a la forma en que Apple y Google permiten a los desarrolladores construir aplicaciones en sus sistemas operativos móviles. Esta exposición de API representa un logro de ingeniería quizás tan significativo como los propios modelos.
En este artículo, exploraremos cuatro patrones de interacción emergentes en la UX que aprovechan estas nuevas tecnologías.
Chat to Explore (Exploración de Contenido a través de Chat)
Problema:
Buscar y responder preguntas sobre grandes cantidades de información, como documentos, PDF y artículos, presenta desafíos significativos. Existe una creciente demanda de una interfaz similar a ChatGPT que pueda adaptarse a dominios de conocimiento específicos, ya sea que involucren información privada o pública. Sin embargo, es crucial desarrollar esta interfaz de manera que garantice la privacidad y permita controlar las respuestas del modelo de lenguaje, abordando especialmente cualquier problema potencial de respuestas incorrectas.
Solución:
Este enfoque ha sido rápidamente adoptado por líderes de búsqueda como Google (Bard) y Microsoft (Bing). El patrón «Chat to Explore» implica iniciar una búsqueda y luego refinarla utilizando un modelo de chat.
Esta estrategia estrecha la interacción con el modelo de chat al proporcionar contexto desde la búsqueda inicial. Tanto Google como Bing utilizan sus motores de búsqueda para contextualizar los modelos, lo que ayuda a controlar y mejorar la precisión de las respuestas.
En Globant, ya estamos aplicando este patrón en varios proyectos. Es sorprendente cómo este patrón se alinea con la forma en que la mayoría de los usuarios interactúan con la información.
Al combinar las heurísticas de experiencia de usuario (UX) de Jakob Nielsen con el patrón «Chat to Explore,» se obtienen beneficios adicionales:
Visibilidad del estado del sistema: La interfaz de chat proporciona a los usuarios comentarios en tiempo real mientras refinan sus búsquedas, manteniéndolos informados sobre el progreso del sistema directamente en el hilo de conversación.
Control y libertad del usuario: Los usuarios pueden alternar entre interacciones de búsqueda y chat según su preferencia, lo que les permite explorar información de manera intuitiva. En este patrón, el usuario puede chatear con el sistema mientras mantiene el control, ya que la interfaz le muestra las fuentes de las respuestas y le permite realizar preguntas adicionales para refinar las respuestas iniciales.
Consistencia y estándares: Al utilizar un diseño coherente tanto para los componentes de búsqueda como para los de chat, los usuarios pueden comprender y anticipar el comportamiento del sistema de manera efectiva. Con millones de usuarios utilizando interfaces similares a Bard, Bing y ChatGPT, podemos asegurar una cierta uniformidad en la interacción con la empresa mediante interfaces similares.
Flexibilidad y eficiencia: El patrón «Chat to Explore» permite a los usuarios acceder rápidamente a la información deseada, ya sea a través de la búsqueda o mediante conversaciones con el modelo de IA.
Chat para analizar
Problema:
Los usuarios se encuentran en una página o aplicación, visualizando una entidad, documento o hoja de cálculo, y tienen preguntas sobre lo que están viendo.
Solución:
Una heurística esencial en la interacción es que la representación visual del sistema coincida con la comprensión mental del usuario. Por ejemplo, simplemente enumerar las especificaciones técnicas de un producto no basta para ayudar a los usuarios a entender cómo se ajusta a sus necesidades. Con modelos más avanzados, podemos establecer conversaciones utilizando términos que el usuario pueda comprender.
Este patrón puede ser implementado en interfaces de productividad, como Office 365, que utilizan ventanas de herramientas para ofrecer un asistente de consultas contextual. También puede ser aplicado en sistemas ERP y otras interfaces web tradicionales.
Al incorporar las heurísticas de Nielsen en el patrón «Chat to Analyze,» se obtienen beneficios adicionales:
Coincidencia entre el sistema y el mundo real: La interfaz de chat permite a los usuarios interactuar con el sistema utilizando lenguaje natural, reduciendo la brecha entre la comprensión del usuario y la representación de la información del sistema.
Diseño estético y minimalista: Al integrar la interfaz de chat como una herramienta complementaria, la interfaz principal puede mantenerse sin desorden, enfocándose en el contenido esencial y reduciendo la carga cognitiva.
Ayudar a los usuarios a reconocer, diagnosticar y recuperarse de errores: La interfaz de chat puede ayudar a los usuarios a comprender los errores, proporcionar sugerencias y guiarlos en el proceso de recuperación.
Ayuda y documentación: El patrón «Chat to Analyze» permite proporcionar ayuda contextual, ofreciendo a los usuarios la información que necesitan sin salir de la interfaz actual.
Navegación de la interfaz de usuario basada en la intención
Problema:
Con frecuencia, los usuarios ingresan a sistemas empresariales con la intención de llevar a cabo tareas específicas o acceder a información concreta. Sin embargo, con el tiempo, estos sistemas tienden a crecer en funcionalidades, lo que resulta en una navegación compleja y una disminución en la eficiencia del usuario.
Solución:
Se aplicarán Modelos de Lenguaje de Aprendizaje (LLMs) para permitir un descubrimiento progresivo basado en las intenciones del usuario. Esto combinará la eficacia de las interfaces de manipulación directa con la conversación. En ciertos contextos, la navegación se volverá híbrida, lo que habilitará a los usuarios para explorar nuevas partes del sistema utilizando lenguaje natural, guiándolos hacia las áreas más productivas.
Mejorando las heurísticas de Nielsen con el patrón de Navegación Basada en la Intención:
Reconocimiento en lugar de recordar: Al utilizar el procesamiento de lenguaje natural para comprender las intenciones del usuario, este patrón disminuye la necesidad de que los usuarios recuerden rutas de navegación específicas o comandos.
Prevención de errores: Al comprender la intención del usuario, el sistema puede orientarlo hacia el destino deseado, reduciendo la probabilidad de cometer errores de navegación.
Flexibilidad y eficiencia: La Navegación Basada en la Intención proporciona una forma más personalizada y eficaz de explorar sistemas complejos, ya que se adapta a las necesidades y preferencias individuales de los usuarios.
Consistencia y estándares: Al implementar el mismo modelo de lenguaje en todo el sistema, los usuarios pueden esperar respuestas y guía consistentes, sin importar en qué parte de la aplicación se encuentren.
Auto-Completado Mágico
Problema:
Con frecuencia, el contenido generado por humanos requiere una considerable inversión de tiempo en tareas como resumir, editar y formatear.
Solución:
Los avances en inteligencia artificial están ampliando las capacidades de completar, resumir, formatear y comparar contenido en diversas interfaces. Esto va más allá de las simples funciones de autocompletado que se encuentran en entornos de programación.
Cuando diseñamos interfaces, es crucial cuestionarnos si es necesario completar o escribir algo. En caso afirmativo, debemos considerar la implementación de una interfaz de «Auto-Completado Mágico» que se adapte a la perfección a las necesidades del usuario.
Por ejemplo, en StarMeUp, hemos implementado este patrón en varias instancias, como la generación de contenido de imágenes y reseñas. En herramientas para desarrolladores, existen varias utilidades que aplican este patrón para autocompletar código y resumir documentación. Asimismo, en herramientas de productividad como Google Apps y Office 365, este patrón se utiliza de manera generalizada.
Integrando las heurísticas de Nielsen en el patrón de Auto-Completado Mágico:
Prevención de errores: El «Auto-Completado Mágico» ayuda a los usuarios a evitar errores al ofrecer sugerencias contextualmente relevantes, reduciendo así la probabilidad de errores de entrada.
Flexibilidad y eficiencia: Este patrón se adapta tanto a usuarios principiantes como a expertos, proporcionando sugerencias inteligentes para ahorrar tiempo sin comprometer el control del usuario sobre la creación de contenido.
Diseño estético y minimalista: Al incorporar de manera fluida el «Auto-Completado Mágico» en la interfaz existente, no se añaden elementos innecesarios, manteniendo un diseño limpio y centrado.
Reconocimiento en lugar de recordar: El «Auto-Completado Mágico» ayuda a los usuarios a recordar información relevante al ofrecer sugerencias y completar según su entrada y el conocimiento del sistema, disminuyendo así la necesidad de que los usuarios recuerden detalles específicos.
Conclusión:
En resumen, consideramos que la convergencia de los Modelos de Lenguaje de Aprendizaje (LLMs) y la disponibilidad de API para el acceso programático a estos modelos marca un punto de inflexión similar al lanzamiento del iPhone, que introdujo las interfaces táctiles de uso general y, más tarde, las herramientas de desarrollo para crear aplicaciones en esa plataforma. La experiencia de usuario en el software cambió drásticamente, y estamos presenciando un cambio similar en el actual escenario de la inteligencia artificial.
Los LLMs han propiciado el desarrollo de técnicas como el Ingenio de Prompt, el Ajuste Fino, LoRA y RLHF. Las API de OpenAI para acceder a estos modelos de manera programática representan un logro técnico igual de significativo que los propios modelos.
Creemos que los patrones emergentes de interacción de UX (Chat para Explorar, Chat para Analizar, Navegación Basada en la Intención y Auto-Completado Mágico) satisfacen las necesidades de los usuarios al proporcionar formas personalizadas y eficientes de navegar sistemas complejos, mejorar y completar contenido, así como nuevas formas de buscar información y respuestas. Al incorporar las heurísticas de Jakob Nielsen, los diseñadores pueden garantizar que estos patrones sean usables, eficientes y fáciles de aprender. Y lo que hemos discutido aquí es solo la punta del iceberg.
Conforme los modelos de base continúen evolucionando y fortaleciéndose, y aprendamos más sobre cómo aplicarlos de manera efectiva, es emocionante pensar en los nuevos patrones de interacción de UX que surgirán.
Trabajaremos incansablemente para forjar este nuevo futuro, ¡y te animamos a hacer lo mismo!
Contáctanos hoy mismo para obtener información detallada sobre nuestras soluciones y servicios.