¿Son los prompts una evolución del querying? – Tecnologías web para servicios de información

Tradicionalmente, en la teoría sobre recuperación de información, se habla de dos enfoques fundamentales para acceder y recuperar información. Autores clásicos como Marchionini (1) o Belkin (2) nos han contado que existen dos métodos diferentes: el querying (conocido como búsqueda analítica) y browsing (navegación). Ambos mecanismos responden a diferentes necesidades y comportamientos del usuario y, además, suelen complementarse en la mayoría de los sistemas de recuperación de información modernos.

Lo haces sin pensar, el browsing

El browsing se emplea en los sistemas de recuperación de información para facilitar a los usuarios la posibilidad de explorar información de manera semiestructura. La clave está en que no se necesita de una consulta explícita para empezar a buscar. Cuando consultas un directorio o, simplemente, navegas por una página, en realidad lo que estás haciendo es “buscar” información, pero sin que tengas que hacer nada más que seleccionar entre las opciones que el sistema te ofrece. Este mecanismo es muy flexible, ya que sirve tanto para situaciones donde tienes una necesidad de información muy clara o para justo lo contario, no tienes ni idea de lo que necesitas y quieres descubrir conocimiento nuevo de manera orgánica o natural.

Los sistemas que emplean este método se basan en el concepto de exploración libre. El usuario navega a través de una serie de enlaces, categorías o estructuras jerárquicas (nota mental: revisar bibliografía sobre la relación que existe entre la consolidación de la web, la usabilidad web y la búsqueda de información por browsing).

Ni que decir tiene que, en esta modalidad, la interfaz que se emplea es un elemento fundamental. Al apoyarse la búsqueda en mecanismos como menús, mapas, vínculos, nubes de etiquetas, etc. la usabilidad juega un papel fundamental en estos sistemas. No sólo a la hora de crearlos, sino también a la hora de evaluarlos y analizar su efectividad.

El hecho de no requerir de una consulta explícita inicial es una de las características fundamentales de estos sistemas. No es necesario que introduzcas términos para localizar lo que necesitas. Tan solo tienes que navegar y dejarte llevar. Esto confluye en una de las cosas que, particularmente, creo que es más interesante de este método: la serendipia. Es una palabra preciosa que descubrí cuando trabajaba en la revista El profesional de la información (gracias, Tomàs por enseñármela) y que me parece básica en este método. Hacer descubrimientos inesperados tras seguir una ruta no planificada es justo la forma que tienen nuestras neuronas de generar conocimiento nuevo. Y es, precisamente, la manera que tiene el browsing de enriquecer la navegación y la manera en la que se busca información. Aunque es algo problemática si eres una persona dispersa, eso sí 😊

Así que las ventajas que presenta este método se pueden agrupar en:

Es un método de búsqueda perfecto para usuarios que no saben cómo formular su necesidad de información.
Reduce la carga cognitiva, al guiar al usuario, mediante una estructura más o menos clara, hacia lo que responde a su necesidad de información.
Fomenta el “aprendizaje accidental”

De todo esto se pueden deducir sus inconvenientes. Básicamente hay dos y ya se han ido avanzado en las líneas anteriores. Por un lado, todo depende de que exista una organización de la información bien diseñada. Precisamente por eso son tan importantes lo arquitectos de la información web. Y, para los que somos dispersos, aumenta el riesgo de desorientarse, tanto en la estructura (muchas veces no tenemos claro qué camino seguir) como en el contenido (empiezas buscando una cosa y terminas viendo un vídeo de un gatito en YouTube).

Querying. Esto ya requiere pensar

También se conocen como consultas o como búsqueda analítica. Estos sistemas se basan en la formulación explícita de consultas. Estas consultas emplean una serie de palabras clave unidas entre sí con diferentes tipos de operadores que forman ecuaciones de búsqueda. El gran Lluís Codina tiene una entrada en su blog muy buena sobre el tema.

El párrafo anterior no sólo sirve para describirlas sino que, además, nos permite deducir muchos de los elementos que tienen implícitas este tipo de búsquedas.

El primero de ellos es muy evidente: se usan cuando se tiene una necesidad de información clara y precisa. ¿Y por qué clara y precisa? Porque, si te fijas, necesitas traducir tu necesidad de información a palabras que expresan los conceptos por los que estás buscando. En ese sentido, quiero comentar que hay muchos estudios que relacionan lo que necesitas con lo que realmente buscas o, mejor dicho, con los términos que empleas para la búsqueda. De hecho, dentro del entorno SEO hay toda una corriente de estudio que se centra en la relación que existe entre el “search intent” (lo que necesitas), tus “keyword search” (las palabras que usas para buscar) y el “keyword mapping” (establecer relaciones entre la intención de búsqueda de un usuario y las palabras que se emplean en un sitio web).

Pero claro, no todo son palabras. Para que una ecuación de búsqueda funcione es necesario unirlas con operadores. Realmente eso es lo que le aporta la semántica (significado) a tu búsqueda. Esto requiere que el usuario tenga conocimiento sobre cómo hacer las ecuaciones de búsqueda, qué operadores se usan en cada sistema de recuperación de información y cómo funciona la interfaz de búsqueda del sistema que está consultando para sacarle el máximo provecho.

Por lo que se puede ver hasta ahora, este tipo de búsquedas son mucho más complicadas que las del browsing, porque requieren de un nivel de formación por parte del usuario que, habitualmente, no se posee. Este tipo de cosas no suelen formar parte del currículum docente de ninguna disciplina, por lo que es fácil entender que la mayoría de la gente hace búsquedas muy pobres. Y, si no lo crees, piensa en las últimas búsquedas que has hecho en Google, que es un sistema de recuperación que emplea este método, y analiza la cantidad de operadores que has usado.

Aunque este sistema es el que ofrece mejores resultados en la búsqueda, tiene el gran inconveniente de la formación. Requiere que el usuario esté formado en las técnicas de recuperación de información para sacarle el máximo provecho, minimizar el ruido (cantidad de información no relevante que recueras) y que no se sienta frustrado. Pocos estudios existen sobre el nivel de frustración que siente el usuario a la hora de buscar en bases de datos que emplean este sistema.

Entre los muchos problemas que presenta este método hay uno que siempre me ha apasionado, y está relacionado con el nivel de formación del usuario, y es la aparición de índices. Antes mencioné que este sistema se basa en la combinación de palabras clave con operadores. Pues imagina que, para rizar el rizo, hay sistemas en los que no te puedes inventar esas palabras clave, sino que las tienes que sacar de un índice de palabras “aprobadas” para ser usadas en la búsqueda. Esto complica mucho más la cosa, ya que añade un escalón más de dificultad a su uso. Tengo pendiente un artículo sobre la Googlelización de los catálogos de bibliotecas debido a este problema y cómo esto ha generado un problema mayor: matar moscas a cañonazos. Pero eso es para otra entrada.

¿Y si mezclamos los dos sistemas?

Con el paso del tiempo ambos sistemas han evolucionado hasta fusionarse uno con el otro. Son los sistemas híbridos, me combinan ambos enfoques para aprovechar las ventajas que tiene cada uno de ellos y minimizar los inconvenientes.

Hoy en día es muy normal encontrarse con motores de búsqueda (que emplean el querying para hacer consultas) que ofrecen sugerencias automáticas o filtros facetados para refinar los resultados de una consulta concreta.

Youtube, Spotify o Amazon Music, por ejemplo, permiten buscar por un vídeo específico (querying) o explorar las diferentes recomendaciones que te ofrece (browsing).

O bibliotecas digitales, como Europeana, que cuentan con opciones de búsqueda avanzada junto a sistemas de navegación temática.

Y ahora aparecen los prompts

Un prompt es una instrucción que se envía a un sistema de inteligencia artificial para guiar su comportamiento y generar una respuesta o acción específica. Aunque suelen ser textuales, lo cierto es que la cosa avanza tan rápido que pueden ser también enviadas de viva voz o, como el último avance de ChatGPT, por medio de un vídeo.

El prompt actúa como una especie de guía donde se define la tarea que queremos que lleve a cabo la IA. Aunque lo ideal es acompañar esta guía con más elementos, como especificar el formato de salida esperado, el tono, ejemplos de lo que se busca, etc.

Si se hace una mezcla con los trabajos de Brown (3), Wei (4) y Reynolds (5) se pueden organizar los tipos de prompts según:

El contexto de uso. Que incluye los que se usan en IA generativa de texto, imágenes y código
La técnica de diseño. Que aglutina a los “zero-shot” (sin ejemplos previos), los “few-shot” (con ejemplos para guiar al modelo en el formato o estilo de salida deseado), los prompts de cadena de pensamiento (los que solicitan que se explique el razonamiento paso a paso), los de rol (que asignan un rol o perspectiva específica al modelo para contextualizar la respuesta) y, con delimitadores (usa símbolos o frases para estructura la instrucción y evitar ambigüedades).
La complejidad. Pueden ser simples (instrucciones directas o concisas), compuestos (combinan múltiples tarras o restricciones) o iterativos (parten de una conversación extendida donde el usuario refina la solicitud basándose en respuestas previas)
El control del formato. Pueden ser abiertos (dan libertar creativa al modelo) o estructurados (especifican restricciones claras).
La retroalimentación. Se trata de los prompts con ajuste por retroalimentación, usados en entrenamiento de modelos para alinear respuestas con preferencias humanas.

Y, a todos estos, habría que unirle un tipo de prompt que se ha puesto muy de moda últimamente, que son los que diseña el propio modelo de IA. Se ha extendido mucho el truco de decirle al modelo algo como: “actúa como si fueras un ingeniero de prompts y mejora el siguiente prompt” para, a continuación, copiar el prompt generado y lanzarlo de nuevo al sistema como si fuera propio.

Vale, pero entonces, ¿son los prompts una evolución del querying?

Pues, bajo mi punto de vista, sí y no.

Los prompts son una evolución del querying, una extensión natural, pero añadiendo características ampliadas gracias al uso del lenguaje natural y las ventajas que esta tiene. Hay cosas en las que se parecen, pero hay muchas más en las que difieren.

La mayor semejanza la encontramos en que ambos sistemas parten de una misma intención: la acción de recuperar información. Al igual que cuando se hace una ecuación en un motor de búsqueda, el prompt pretende obtener información para resolver una necesidad concreta. Y esa acción se lleva a cabo, además, por medio de soluciones simples (ecuaciones de búsqueda de pocas palabras, incluso sin operadores y prompts muy sencillos) o muy completas (justo lo contrario en ambos casos).

También se parecen en la complejidad. Hacer una ecuación de búsqueda simple es sencillo. Pon sólo un par de términos en Google y ya la tienes hecha. Del mismo modo, hacer un prompt sencillo también es muy fácil. Es más, creo que la mayoría de la gente los hace así. Sin embargo, hacer ambas cosas bien es complicado. A nadie se le escapa que hacer buenas ecuaciones de búsqueda para querying es muy complejo y requiere de amplios conocimientos técnicos por parte del usuario. Pues hacer un buen prompt también. De hecho, en los últimos años ha surgido la disciplina del prompt engineering, que tiene como objetivo la optimización de prompts para obtener resultados precisos. Sin embargo, aquí terminan las semejanzas.

En el querying las búsquedas tienen una estructura, una sintaxis, muy rígida. De hecho, si no se combinan las palabras clave con los operadores en un orden específico la respuesta puede ser desde un horror hasta un error. Sin embargo, los prompts permiten usar el lenguaje natural para expresar las necesidades de información, reduciendo el problema a algo mas sencillo: las capacidades expresivas que tenga el usuario. Habrá que analizar hasta qué punto afecta a la recuperación la capacidad que tenga un usuario de expresar correctamente lo que necesita.

A diferencia de lo que sucede en los sistemas de recuperación que emplean el querying para hacer consultad, los modelos de IA permiten que, por medio de una simple conversación, se puedan obtener refinamientos iterativos. Es decir, pedirle al sistema que te proporcione una respuesta más simple, que le aplique contexto, que le ponga ejemplos, que la cambie a otro idioma… Esto es algo que en los sistemas tradicionales es imposible. Incluso en aquellos que permitían la posibilidad de retroalimentación por relevancia (relevance feedback) tampoco se llegaba tan lejos (6).

Ya sabemos que una consulta en un sistema de recuperación de información clásico te ofrecerá, como resultado de tu búsqueda, información existente (generalmente los documentos que haya en la base de datos que contengan los términos por los que se ha buscado). Sin embargo, un prompt de un modelo de IA crea contenido nuevo (textual, imágenes, código o vídeo). Esto es algo que trasciende la mera recuperación, facilitando al usuario la tarea de obtener la respuesta de forma directa, y no de manera indirecta como hacen los sistemas tradicionales.

Como he mencionado antes, la elección de términos de búsqueda es un elemento clave en los sistemas de recuperación de información basados en querying. O se usa el término correcto o no se recupera lo que se quieren. Los sistemas basados en prompts son capaces de interpretar la intención implícita y el contexto, aportando una mayor precisión en las respuestas.

Pues parece claro que son un método aparte

Basándome en todo lo que he comentado aquí, entiendo que los prompts son un método aparte. Suponen un paradigma nuevo y diferenciado de los dos sistemas clásicos que ya existían.

Los prompts han cambiado la relación usuario sistema. Para ello establecen un diálogo colaborativo con el usuario. En lugar de que se lleve a cabo una consulta unidireccional (usuario -> sistema), los prompts establecen una conversación bidireccional con el usuario. Gracias a este conjunto de preguntas y respuestas se clarifica la necesidad de información y se proponen alternativas conforme va evolucionando el proceso de búsqueda.

Al contrario de lo que sucede con los historiales de búsqueda clásicos, los modelos de IA recuerdan el contexto de las interacciones previas en una misma sesión (que, además se puede recuperar en cualquier momento), facilitando retrotraerse a diferentes puntos del proceso de búsqueda y favoreciendo la aparición de forks (algo novedoso dentro del mundo de la recuperación de información).

Por si esto fuera poco, los modelos de IA, gracias al uso de prompts correctos, permiten la ejecución de tareas que van más allá de la simple recuperación de información. Pueden actuar, escribiendo código, traduciendo textos, generando imágenes e, incluso, interactuar con nuestros dispositivos gracias a los asistentes.

Si se hace una pregunta a un sistema de recuperación de información sobre el precio del oro en la actualidad, lo que vas a obtener es un dato objetivo. Sin embargo, esta pregunta hecha a un modelo de IA con un prompt adecuado, aportará creatividad y subjetividad, informándote de la evolución en un tiempo determinado, su proyección de futuro, recomendaciones de compra o venta, etc.

Aquí también hay métodos híbridos

Tampoco quisiera ser muy radical en mis comentarios. Al igual que hay sistemas híbridos que combinan querying con browsing, también existen muchos otros que mezclan lo mejor del querying con las bondades del prompt.

Sin ir muy lejos, la búsqueda conversacional que ofrece Bing combina las búsquedas web (querying, que incluso se puede ver como resultado de un prompt cualquiera) con diálogos tipo prompt para refinar resultados.

Es más, también hay asistente que sugieren rutas de exploración mediante browsing basadas en prompts iniciales. Si se hace una búsqueda en ChatGPT diciéndoles que quieres aprender inglés desde cero te ofrecerá diferentes caminos en función a, si lo que quieres, es aprender más gramática, conversación o escuchar.

A modo de conclusión

Este apartado me ha quedado muy típico de la IA, ya que todas ellas suelen hacer algo similar. Pero he de decir que para escribir esta entrada no he usado ningún modelo de IA, salvo para crear las imágenes. Son cosas que llevo pensando en el último año y que me he decidido a escribir ahora.

Los prompts son la evolución natural de querying. Lo que nos hubiera gustado poder hacer cuando empezamos a hacer búsquedas en bases de datos profesionales hace 20 ó 30 años. Su base, desde el punto de vista técnico (los índices y la relevancia, fundamentalmente) la han heredado de los sistemas de recuperación clásica. Pero la capacidad para gestionar el lenguaje natural, el contexto y la posibilidad de generar contenido nuevo los sitúan en una categoría nueva y mucho más amplia. Por eso mismo, y desde el curso pasado, cuando explico los fundamentos de recuperación de información a mis alumnos, le explico que existen 3 métodos para buscar información:

Browsing: para la exploración guiada
Querying, para acceder a datos estructurados
Prompts, para diálogos creativos

Referencias

1.- Marchionini, G. (1995). Information Seeking in Electronic Environments . Cambridge University Press.

2.- Belkin, N. J., Oddy, R. N., & Brooks, H. M. (1982). ASK for information retrieval: Part I. Background and theory. Journal of Documentation , 38(2), 61-71.

3.- Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … & Amodei, D. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.

4.- Wei, J., Wang, X., Schuurmans, D., Bosma, M., Xia, F., Chi, E., … & Zhou, D. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in neural information processing systems, 35, 24824-24837.

5.- Reynolds, L., & McDonell, K. (2021, May). Prompt programming for large language models: Beyond the few-shot paradigm. In Extended abstracts of the 2021 CHI conference on human factors in computing systems (pp. 1-7).

6.- Salton, G. (1989). Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer.

Lo haces sin pensar, el browsing

Querying. Esto ya requiere pensar

¿Y si mezclamos los dos sistemas?

Y ahora aparecen los prompts

Vale, pero entonces, ¿son los prompts una evolución del querying?

Pues parece claro que son un método aparte

Aquí también hay métodos híbridos

A modo de conclusión

Referencias

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta