Alternar menú

Cómo escalar el uso de grandes modelos de lenguaje en marketing

Publicado: 2023-05-19

La IA generativa y los grandes modelos de lenguaje están configurados para cambiar la industria del marketing tal como la conocemos.

Para mantenerse competitivo, deberá comprender la tecnología y cómo afectará nuestros esfuerzos de marketing, dijo Christopher Penn, científico jefe de datos de TrustInsights.ai, hablando en la Conferencia MarTech.

Aprenda formas de escalar el uso de modelos de lenguaje extenso (LLM), el valor de la ingeniería rápida y cómo los especialistas en marketing pueden prepararse para lo que se avecina.

La premisa detrás de los grandes modelos de lenguaje

Desde su lanzamiento, ChatGPT ha sido un tema de moda en la mayoría de las industrias. No puedes conectarte a Internet sin ver la opinión de todos. Sin embargo, no mucha gente entiende la tecnología detrás de esto, dijo Penn.

ChatGPT es un chatbot de IA basado en los LLM GPT-3.5 y GPT-4 de OpenAI.

Los LLM se basan en una premisa de 1957 del lingüista inglés John Rupert Firth: "Conocerás una palabra por la compañía que tiene".

Esto significa que el significado de una palabra se puede entender en función de las palabras que normalmente aparecen junto a ella. En pocas palabras, las palabras se definen no solo por su definición de diccionario, sino también por el contexto en el que se usan.

Esta premisa es clave para comprender el procesamiento del lenguaje natural.

Por ejemplo, mira las siguientes oraciones:

  • "Estoy preparando el té".
  • "Estoy derramando el té".

El primero se refiere a una bebida caliente, mientras que el segundo es una jerga para chismear. “Té” en estos casos tiene significados muy diferentes.

El orden de las palabras también importa.

  • "Estoy preparando el té".
  • "El té que estoy preparando".

Las oraciones anteriores tienen diferentes sujetos de enfoque, aunque usan el mismo verbo, "preparar".

Cómo funcionan los modelos de lenguaje grande

A continuación se muestra un diagrama de sistema de transformadores, el modelo de arquitectura en el que se construyen grandes modelos de lenguaje.

The Transformer - Modelo de arquitectura
Dos características importantes aquí son las incrustaciones y la codificación posicional . Fuente: La atención es todo lo que necesita, Vaswani et al, 2017 .

En pocas palabras, un transformador toma una entrada y la convierte (es decir, la “transforma”) en otra cosa.

Los LLM se pueden usar para crear, pero son mejores para convertir una cosa en otra.

OpenAI y otras compañías de software comienzan con la ingesta de un enorme corpus de datos, incluidos millones de documentos, trabajos académicos, artículos de noticias, reseñas de productos, comentarios en foros y mucho más.

Reseñas de productos de té y comentarios en foros.

Considere la frecuencia con la que puede aparecer la frase "Estoy preparando el té" en todos estos textos ingeridos.

Las revisiones de productos de Amazon y los comentarios de Reddit anteriores son algunos ejemplos.

Fíjese en "la compañía" que mantiene esta frase, es decir, todas las palabras que aparecen cerca de "Estoy preparando el té".

"Sabor", "olor", "café", "aroma" y más, todos prestan contexto a estos LLM.

Las máquinas no pueden leer. Entonces, para procesar todo este texto, usan incrustaciones, el primer paso en la arquitectura del transformador.

La incrustación permite que los modelos asignen a cada palabra un valor numérico, y ese valor numérico aparece repetidamente en el corpus de texto.

incrustación

La posición de la palabra también es importante para estos modelos.

Codificación posicional

En el ejemplo anterior, los valores numéricos siguen siendo los mismos pero están en una secuencia diferente. Esta es la codificación posicional.

En términos simples, los modelos de lenguaje grande funcionan así:

  • Las máquinas toman datos de texto.
  • Asigne valores numéricos a todas las palabras.
  • Mira las frecuencias estadísticas y las distribuciones entre las diferentes palabras.
  • Trate de averiguar cuál será la siguiente palabra en la secuencia.

Todo esto requiere un poder de cómputo, tiempo y recursos significativos.



¡Consigue MarTech! A diario. Gratis. En tu bandeja de entrada.

Ver términos.



Ingeniería rápida: una habilidad imprescindible

Cuanto más contexto e instrucciones proporcionemos a los LLM, es más probable que arrojen mejores resultados. Este es el valor de la ingeniería rápida.

Penn piensa en las indicaciones como barandillas para lo que producirán las máquinas. Las máquinas captarán las palabras en nuestra entrada y se aferrarán a ellas para obtener contexto a medida que desarrollan la salida.

Por ejemplo, al escribir avisos de ChatGPT, notará que las instrucciones detalladas tienden a generar respuestas más satisfactorias.

De alguna manera, las indicaciones son como resúmenes creativos para los escritores. Si desea que su proyecto se realice correctamente, no le dará a su escritor una instrucción de una línea.

En su lugar, enviará un resumen de tamaño decente que cubra todo lo que quiere que escriban y cómo quiere que lo escriban.

Escalar el uso de LLM

Cuando piensa en chatbots de IA, puede pensar inmediatamente en una interfaz web donde los usuarios pueden ingresar indicaciones y luego esperar la respuesta de la herramienta. Esto es lo que todo el mundo está acostumbrado a ver.

Pantalla ChatGPT Plus

“Este no es el juego final para estas herramientas de ninguna manera. Este es el patio de recreo. Aquí es donde los humanos pueden jugar con la herramienta”, dijo Penn. “Así no es como las empresas van a llevar esto al mercado”.

Piense en la escritura rápida como programación. Eres un desarrollador que escribe instrucciones a una computadora para que haga algo.

Una vez que haya ajustado sus mensajes para casos de uso específicos, puede aprovechar las API y hacer que los desarrolladores reales envuelvan esos mensajes en código adicional para que pueda enviar y recibir datos a escala mediante programación.

Así es como los LLM escalarán y cambiarán los negocios para mejor.

Debido a que estas herramientas se implementan en todas partes, es fundamental recordar que todos son desarrolladores.

Esta tecnología estará en Microsoft Office (Word, Excel y PowerPoint) y muchas otras herramientas y servicios que usamos a diario.

“Debido a que está programando en lenguaje natural, no son necesariamente los programadores tradicionales los que tendrán las mejores ideas”, agregó Penn.

Dado que los LLM son impulsados ​​​​por profesionales de la escritura, el marketing o las relaciones públicas, no los programadores, pueden desarrollar formas innovadoras de usar las herramientas.

Un consejo adicional para los especialistas en marketing de búsqueda

Estamos empezando a ver el impacto de los grandes modelos de lenguaje en el marketing, específicamente en la búsqueda.

En febrero, Microsoft presentó el nuevo Bing, impulsado por ChatGPT. Los usuarios pueden conversar con el motor de búsqueda y obtener respuestas directas a sus consultas sin hacer clic en ningún enlace.

El nuevo motor de búsqueda de Bing

“Debe esperar que estas herramientas aprovechen su búsqueda sin marca porque están respondiendo preguntas de maneras que no necesitan clics”, dijo Penn.

"Ya nos hemos enfrentado a esto como profesionales de SEO, con fragmentos destacados y resultados de búsqueda sin clic... pero va a empeorar para nosotros".

Recomienda ir a Bing Webmaster Tools o Google Search Console y observar el porcentaje de tráfico que obtiene su sitio de búsquedas informativas sin marca, ya que es el área de mayor riesgo para el SEO.


Historias relacionadas

    Lo que los especialistas en marketing deben tener en cuenta al adoptar la IA
    Por qué la IA tendrá el mayor impacto en la percepción de la audiencia B2B, no en el contenido
    Navegue por el mundo de la IA antes que sus competidores
    ¿Qué hay detrás de la cortina de MarTechBot?
    Meta presenta herramienta de IA generativa para anunciantes de Facebook e Instagram

Nuevo en MarTech

    5 consejos para equilibrar 'push' y 'pull' en el marketing de contenidos
    El crecimiento de la inversión en publicidad digital cae al 7,8% este año
    IA en martech: novedades, productos y plataformas de esta semana
    Cómo elaborar una estrategia de evento ganadora: un marco de 7 pasos
    No deje el futuro de sus datos en manos de los proveedores