Si no estás obteniendo las respuestas que deseas de los grandes modelos de lenguaje como GPT-3, puede que haya algo mal. Pero no te preocupes, aquí te explico qué puede estar fallando. La forma en que le das instrucciones a estos modelos es fundamental para obtener una buena respuesta. Permíteme mostrarte un ejemplo:
Índice
Promoción cero-shot
Supongamos que estás trabajando en una tarea de economía y necesitas ayuda para entender los diferentes tipos de bancos. Le haces una pregunta directa al modelo sin proporcionar más contexto:
Pregunta: «¿Explica los diferentes tipos de bancos?»
Bueno, el modelo podría interpretar «bancos» literalmente como los márgenes de un río y no como las instituciones financieras que deseas conocer. Esto se debe a que estás utilizando un tipo de promoción conocida como «cero-shot», donde proporcionas una única pregunta o instrucción sin ningún contexto adicional. El modelo se basa únicamente en su conocimiento preexistente para generar una respuesta relevante, pero puede conducir a respuestas inexactas o subóptimas.
Promoción few-shot
Por otro lado, existe un tipo de promoción llamada «few-shot» que puede mejorar la comprensión y calidad de las respuestas del modelo. En este caso, proporcionas uno o más ejemplos relacionados con el tema para guiar su comprensión. Veamos un ejemplo:
Pregunta: «¿Cuál es la función principal de un banco?»
Respuesta: «La función principal de un banco es aceptar depósitos, proporcionar préstamos y ofrecer otros servicios financieros a personas y empresas.»
Ahora, si utilizas la promoción few-shot para preguntar sobre los diferentes tipos de bancos en el contexto financiero, el modelo será más propenso a entender lo que estás buscando y brindarte una respuesta precisa.
Beneficios de la promoción few-shot
La promoción few-shot tiene varias ventajas adicionales. En primer lugar, ayuda al modelo a comprender el formato esperado de la respuesta. Por ejemplo, puedes solicitarle que cree un título para una página web o que enumere los tipos de bancos en notación HTML.
En segundo lugar, la promoción few-shot puede ayudar al razonamiento del modelo. Por ejemplo, si deseas resolver un problema matemático que involucra sumas y multiplicaciones, puedes proporcionar un ejemplo y una explicación paso a paso, guiando al modelo a través del proceso de razonamiento para obtener la respuesta correcta.
El papel de la promoción «Chain of Thought»
Además de la promoción few-shot, existe otra técnica llamada «Chain of Thought», que consiste en pedirle al modelo que documente su proceso de pensamiento. Esto ayuda a obtener respuestas más detalladas, transparentes y razonadas. También puede fomentar que el modelo considere otras perspectivas y enfoques, generando respuestas más completas y enriquecedoras.
En resumen, tanto la promoción few-shot como la promoción «Chain of Thought» son técnicas poderosas que pueden mejorar la calidad de las respuestas generadas por los modelos de lenguaje. Al proporcionar contexto adicional, ejemplos o guías, puedes ayudar al modelo a comprender mejor la tarea y generar respuestas más precisas, relevantes y razonadas.
Tabla de resumen:
Promoción | Descripción | Ventajas |
---|---|---|
Cero-shot | Promoción sin contexto adicional | Respuestas subóptimas o inexactas |
Few-shot | Promoción con ejemplos relacionados | Mejora la comprensión y la calidad de las respuestas |
Chain of Thought | Promoción que documenta el proceso de pensamiento | Respuestas detalladas y transparentes |
Preguntas frecuentes:
P: ¿Cómo puedo saber si debo usar promoción few-shot o cero-shot?
R: Si deseas obtener respuestas más precisas, utiliza la promoción few-shot y proporciona ejemplos relacionados.
P: ¿Qué otros beneficios tiene la promoción «Chain of Thought»?
R: Además de obtener respuestas más detalladas, transparentes y razonadas, esta técnica te permite evaluar la corrección y relevancia de la respuesta del modelo.
P: ¿Cuál es la diferencia entre un banco y un banco artificial?
R: Un banco natural se encuentra a lo largo de un río, mientras que un banco artificial es una institución financiera.
P: ¿Qué modelos de lenguaje son compatibles con estas técnicas de promoción?
R: La mayoría de los modelos de lenguaje, incluidos los más recientes como GPT-4, se benefician de las promociones few-shot y «Chain of Thought».
Muchas gracias por leer este artículo. Si tienes más preguntas, déjalas en los comentarios. Y no olvides suscribirte para recibir más contenido relacionado. ¡Hasta la próxima!
¿Te ha resultado útil??
0 / 0

Hola, somos Mila Jiménez y César Sánchez. Dos apasionados de la ciberseguridad con muchos años de experiencia. Hemos trabajado en muchas empresas del mundo TI y ahora nos apetece compartir nuestro conocimiento con cualquiera que lo necesite.
¡Si te gusta nuestro contenido puedes invitarnos a un café AQUÍ!