Come ridimensionare l'uso di modelli di linguaggio di grandi dimensioni nel marketing

Pubblicato: 2023-05-19

L'intelligenza artificiale generativa e i modelli di linguaggio di grandi dimensioni sono destinati a cambiare il settore del marketing così come lo conosciamo.

Per rimanere competitivi, è necessario comprendere la tecnologia e il modo in cui influirà sui nostri sforzi di marketing, ha dichiarato Christopher Penn, chief data scientist di TrustInsights.ai, intervenendo alla MarTech Conference.

Scopri i modi per ridimensionare l'uso di modelli linguistici di grandi dimensioni (LLM), il valore dell'ingegneria tempestiva e come i professionisti del marketing possono prepararsi per ciò che li attende.

La premessa alla base dei grandi modelli linguistici

Dal suo lancio, ChatGPT è stato un argomento di tendenza nella maggior parte dei settori. Non puoi andare online senza vedere l'opinione di tutti. Eppure, non molte persone capiscono la tecnologia che c'è dietro, ha detto Penn.

ChatGPT è un chatbot AI basato sugli LLM GPT-3.5 e GPT-4 di OpenAI.

Gli LLM sono costruiti su una premessa del 1957 dal linguista inglese John Rupert Firth: "Riconoscerai una parola dalla compagnia che tiene".

Ciò significa che il significato di una parola può essere compreso in base alle parole che in genere compaiono accanto ad essa. In poche parole, le parole sono definite non solo dalla definizione del dizionario, ma anche dal contesto in cui vengono utilizzate.

Questa premessa è la chiave per comprendere l'elaborazione del linguaggio naturale.

Ad esempio, guarda le seguenti frasi:

"Sto preparando il tè."
"Sto rovesciando il tè."

Il primo si riferisce a una bevanda calda, mentre il secondo è gergale per spettegolare. “Tè” in questi casi ha significati molto diversi.

Anche l'ordine delle parole è importante.

"Sto preparando il tè."
"Il tè che sto preparando."

Le frasi di cui sopra hanno diversi argomenti di messa a fuoco, anche se usano lo stesso verbo, "brewing".

Come funzionano i modelli linguistici di grandi dimensioni

Di seguito è riportato un diagramma di sistema dei trasformatori, il modello di architettura in cui sono costruiti modelli di linguaggio di grandi dimensioni.

Il trasformatore - Modello di architettura — *Due caratteristiche importanti qui sono **gli incorporamenti** e **la codifica posizionale** .* *Fonte: L'attenzione è tutto ciò di cui hai bisogno, Vaswani et al, 2017* .

In poche parole, un trasformatore prende un input e lo trasforma (cioè lo “trasforma”) in qualcos'altro.

Gli LLM possono essere usati per creare ma sono più bravi a trasformare una cosa in qualcos'altro.

OpenAI e altre società di software iniziano con l'ingestione di un enorme corpus di dati, inclusi milioni di documenti, articoli accademici, articoli di notizie, recensioni di prodotti, commenti di forum e molti altri.

Recensioni dei prodotti del tè e commenti sul forum

Considera la frequenza con cui la frase "Sto preparando il tè" può apparire in tutti questi testi ingeriti.

Le recensioni dei prodotti Amazon e i commenti di Reddit sopra sono alcuni esempi.

Nota la "compagnia" che questa frase mantiene, ovvero tutte le parole che compaiono vicino a "Sto preparando il tè".

"Gusto", "odore", "caffè", "aroma" e altro ancora danno un contesto a questi LLM.

Le macchine non possono leggere. Quindi, per elaborare tutto questo testo, usano gli incorporamenti, il primo passo nell'architettura del trasformatore.

L'incorporamento consente ai modelli di assegnare a ciascuna parola un valore numerico e tale valore numerico ricorre ripetutamente nel corpus di testo.

Anche la posizione delle parole è importante per questi modelli.

Nell'esempio precedente, i valori numerici rimangono gli stessi ma sono in una sequenza diversa. Questa è la codifica posizionale.

In termini semplici, i modelli di linguaggio di grandi dimensioni funzionano in questo modo:

Le macchine prendono i dati di testo.
Assegna valori numerici a tutte le parole.
Guarda le frequenze statistiche e le distribuzioni tra le diverse parole.
Cerca di capire quale sarà la parola successiva nella sequenza.

Tutto ciò richiede notevole potenza di calcolo, tempo e risorse.

Ottieni MarTech! Quotidiano. Gratuito. Nella tua casella di posta.

Vedi termini.

Ingegneria rapida: un'abilità da imparare

Più contesto e istruzioni forniamo agli LLM, più è probabile che restituiscano risultati migliori. Questo è il valore dell'ingegneria tempestiva.

Penn pensa ai prompt come guardrail per ciò che le macchine produrranno. Le macchine raccoglieranno le parole nel nostro input e le attaccheranno per il contesto mentre sviluppano l'output.

Ad esempio, quando scrivi i prompt di ChatGPT, noterai che le istruzioni dettagliate tendono a restituire risposte più soddisfacenti.

In un certo senso, i suggerimenti sono come brief creativi per gli scrittori. Se vuoi che il tuo progetto sia fatto correttamente, non darai al tuo scrittore un'istruzione di una riga.

Invece, invierai un brief di dimensioni decenti che copre tutto ciò di cui vuoi che scrivano e come vuoi che vengano scritti.

Scalare l'uso degli LLM

Quando pensi ai chatbot AI, potresti pensare immediatamente a un'interfaccia web in cui gli utenti possono inserire prompt e quindi attendere la risposta dello strumento. Questo è ciò che tutti sono abituati a vedere.

“Questo non è affatto il gioco finale per questi strumenti. Questo è il parco giochi. È qui che gli umani possono armeggiare con lo strumento ", ha detto Penn. "Non è così che le aziende lo porteranno sul mercato".

Pensa alla scrittura rapida come alla programmazione. Sei uno sviluppatore che scrive istruzioni a un computer per fargli fare qualcosa.

Dopo aver perfezionato i prompt per casi d'uso specifici, puoi sfruttare le API e convincere sviluppatori reali a racchiudere tali prompt in codice aggiuntivo in modo da poter inviare e ricevere dati a livello di programmazione su larga scala.

Questo è il modo in cui gli LLM scaleranno e cambieranno le aziende in meglio.

Poiché questi strumenti vengono implementati ovunque, è fondamentale ricordare che tutti sono sviluppatori.

Questa tecnologia sarà in Microsoft Office — Word, Excel e PowerPoint — e in molti altri strumenti e servizi che usiamo quotidianamente.

"Poiché stai programmando in linguaggio naturale, non sono necessariamente i programmatori tradizionali ad avere le idee migliori", ha aggiunto Penn.

Poiché gli LLM sono alimentati dalla scrittura, i professionisti del marketing o delle pubbliche relazioni, non i programmatori, possono sviluppare modi innovativi per utilizzare gli strumenti.

Un consiglio in più per i marketer di ricerca

Stiamo iniziando a vedere l'impatto dei grandi modelli linguistici sul marketing, in particolare sulla ricerca.

A febbraio, Microsoft ha presentato il nuovo Bing, alimentato da ChatGPT. Gli utenti possono conversare con il motore di ricerca e ottenere risposte dirette alle loro domande senza fare clic su alcun collegamento.

"Dovresti aspettarti che questi strumenti diano un morso alla tua ricerca senza marchio perché rispondono alle domande in modi che non richiedono clic", ha affermato Penn.

"Abbiamo già affrontato questo come professionisti SEO, con snippet in primo piano e risultati di ricerca a zero clic... ma per noi peggiorerà".

Consiglia di andare su Bing Webmaster Tools o Google Search Console e di esaminare la percentuale di traffico che il tuo sito riceve da ricerche informative senza marchio, poiché è l'area di rischio maggiore per la SEO.

Aggiungi MarTech al tuo feed di Google News.

Storie correlate

Novità su MarTech

5 consigli per bilanciare 'push' e 'pull' nel content marketing

La crescita della spesa pubblicitaria digitale scende al 7,8% quest'anno

AI in martech: nuove funzionalità, prodotti e piattaforme di questa settimana

Come creare una strategia per un evento vincente: un framework in 7 fasi

Non lasciare il futuro dei tuoi dati nelle mani dei fornitori