วิธีปรับขนาดการใช้โมเดลภาษาขนาดใหญ่ในการตลาด
เผยแพร่แล้ว: 2023-05-19AI เจเนอเรชันและโมเดลภาษาขนาดใหญ่ถูกกำหนดให้เปลี่ยนอุตสาหกรรมการตลาดอย่างที่เราทราบกันดี
เพื่อรักษาความสามารถในการแข่งขัน คุณจะต้องเข้าใจเทคโนโลยีและผลกระทบต่อการทำการตลาดของเราอย่างไร คริสโตเฟอร์ เพนน์ หัวหน้านักวิทยาศาสตร์ข้อมูลของ TrustInsights.ai กล่าวที่งาน The MarTech Conference
เรียนรู้วิธีปรับขนาดการใช้โมเดลภาษาขนาดใหญ่ (LLM) มูลค่าของวิศวกรรมที่รวดเร็ว และวิธีที่นักการตลาดสามารถเตรียมพร้อมสำหรับสิ่งที่อยู่ข้างหน้า
หลักฐานเบื้องหลังโมเดลภาษาขนาดใหญ่
นับตั้งแต่เปิดตัว ChatGPT เป็นหัวข้อที่กำลังมาแรงในอุตสาหกรรมส่วนใหญ่ คุณไม่สามารถออนไลน์ได้หากไม่เห็นทุกคนมีส่วนร่วม อย่างไรก็ตาม ไม่ค่อยมีใครเข้าใจเทคโนโลยีที่อยู่เบื้องหลังเทคโนโลยีนี้ เพนน์กล่าว
ChatGPT เป็นแชทบอท AI ที่ใช้ GPT-3.5 และ GPT-4 LLM ของ OpenAI
LLMs ถูกสร้างขึ้นจากหลักฐานในปี 1957 โดยนักภาษาศาสตร์ชาวอังกฤษ John Rupert Firth: "คุณจะรู้คำศัพท์โดยบริษัทที่ดูแล"
ซึ่งหมายความว่าสามารถเข้าใจความหมายของคำโดยพิจารณาจากคำที่มักจะปรากฏข้างๆ คำนั้น พูดง่ายๆ ก็คือ คำต่างๆ นั้นไม่ได้ถูกกำหนดโดยความหมายจากพจนานุกรมเท่านั้น แต่ยังรวมถึงบริบทที่ใช้ด้วย
หลักฐานนี้เป็นกุญแจสำคัญในการทำความเข้าใจการประมวลผลภาษาธรรมชาติ
ตัวอย่างเช่น ดูประโยคต่อไปนี้:
- “ฉันกำลังชงชาอยู่”
- “ฉันทำชาหก”
คำแรกหมายถึงเครื่องดื่มร้อน ส่วนคำหลังเป็นคำแสลงสำหรับการนินทา “ชา” ในกรณีนี้มีความหมายต่างกันมาก
ลำดับคำก็มีความสำคัญเช่นกัน
- “ฉันกำลังชงชาอยู่”
- “ชาที่ฉันกำลังชงอยู่”
ประโยคข้างต้นมีหัวเรื่องที่แตกต่างกัน แม้ว่าจะใช้คำกริยาเดียวกันคือ “การต้ม”
โมเดลภาษาขนาดใหญ่ทำงานอย่างไร
ด้านล่างคือไดอะแกรมระบบของทรานส์ฟอร์มเมอร์ ซึ่งเป็นโมเดลสถาปัตยกรรมที่สร้างโมเดลภาษาขนาดใหญ่
พูดง่ายๆ ก็คือ หม้อแปลงรับอินพุตและเปลี่ยน (เช่น "แปลง") ให้เป็นอย่างอื่น
สามารถใช้ LLMs ในการสร้าง แต่จะดีกว่าในการเปลี่ยนสิ่งหนึ่งให้เป็นอย่างอื่น
OpenAI และบริษัทซอฟต์แวร์อื่นๆ เริ่มต้นด้วยการกลืนกินคลังข้อมูลจำนวนมหาศาล รวมถึงเอกสารนับล้าน บทความวิชาการ บทความข่าว บทวิจารณ์ผลิตภัณฑ์ ความคิดเห็นในฟอรัม และอื่นๆ อีกมากมาย
พิจารณาว่าวลี “ฉันกำลังชงชา” อาจปรากฏในข้อความที่นำเข้ามาเหล่านี้บ่อยเพียงใด
บทวิจารณ์ผลิตภัณฑ์ของ Amazon และความคิดเห็น Reddit ข้างต้นเป็นตัวอย่างบางส่วน
สังเกตคำว่า “บริษัท” ที่วลีนี้เก็บไว้ นั่นคือคำทั้งหมดที่ปรากฏใกล้กับ “ฉันกำลังชงชา”
“รสชาติ” “กลิ่น” “กาแฟ” “กลิ่น” และอื่นๆ ล้วนให้บริบทแก่ LLM เหล่านี้
เครื่องอ่านไม่ได้ ดังนั้นในการประมวลผลข้อความทั้งหมดนี้ พวกเขาใช้การฝัง ซึ่งเป็นขั้นตอนแรกในสถาปัตยกรรมหม้อแปลง
การฝังทำให้โมเดลสามารถกำหนดค่าตัวเลขให้แต่ละคำได้ และค่าตัวเลขนั้นจะเกิดขึ้นซ้ำๆ ในคลังข้อความ
ตำแหน่งของ Word ก็มีความสำคัญกับโมเดลเหล่านี้เช่นกัน
ในตัวอย่างข้างต้น ค่าตัวเลขยังคงเหมือนเดิมแต่อยู่ในลำดับที่แตกต่างกัน นี่คือการเข้ารหัสตำแหน่ง
พูดง่ายๆ โมเดลภาษาขนาดใหญ่ทำงานดังนี้:
- เครื่องใช้ข้อมูลข้อความ
- กำหนดค่าตัวเลขให้กับทุกคำ
- ดูความถี่ทางสถิติและการแจกแจงระหว่างคำต่างๆ
- ลองคิดดูว่าคำถัดไปในลำดับจะเป็นอย่างไร
ทั้งหมดนี้ต้องใช้พลังในการคำนวณ เวลา และทรัพยากรอย่างมาก
รับ MarTech! รายวัน. ฟรี. ในกล่องจดหมายของคุณ
ดูข้อกำหนด
วิศวกรรมพร้อมท์: ทักษะที่ต้องเรียนรู้
ยิ่งเรานำเสนอ LLM บริบทและคำแนะนำมากเท่าไหร่ โอกาสที่สิ่งเหล่านั้นจะได้ผลลัพธ์ที่ดีขึ้นก็จะยิ่งมากขึ้นเท่านั้น นี่คือคุณค่าของงานวิศวกรรมที่รวดเร็ว
เพนน์คิดว่าการแจ้งเตือนเป็นเกราะป้องกันสำหรับสิ่งที่เครื่องจักรจะผลิต เครื่องจักรจะรับคำในอินพุตของเราและสลักเข้ากับบริบทในขณะที่พัฒนาเอาต์พุต
ตัวอย่างเช่น เมื่อเขียนข้อความแจ้ง ChatGPT คุณจะสังเกตเห็นว่าคำแนะนำโดยละเอียดมักจะให้คำตอบที่น่าพอใจมากกว่า
ในบางแง่ ข้อความเตือนก็เหมือนกับบทสรุปเชิงสร้างสรรค์สำหรับนักเขียน หากคุณต้องการให้โปรเจกต์ของคุณทำอย่างถูกต้อง คุณจะไม่ให้คำแนะนำแบบบรรทัดเดียวแก่ผู้เขียน
คุณจะส่งบรีฟขนาดพอเหมาะซึ่งครอบคลุมทุกสิ่งที่คุณต้องการให้พวกเขาเขียนถึงและวิธีการที่คุณต้องการให้พวกเขาเขียนแทน
ปรับขนาดการใช้ LLM
เมื่อคุณนึกถึงแชทบอท AI คุณอาจนึกถึงเว็บอินเทอร์เฟซที่ผู้ใช้สามารถป้อนข้อความแจ้งแล้วรอการตอบสนองของเครื่องมือได้ทันที นี่คือสิ่งที่ทุกคนเคยเห็น
“นี่ไม่ใช่เกมจบสำหรับเครื่องมือเหล่านี้ไม่ว่าด้วยวิธีใดก็ตาม นี่คือสนามเด็กเล่น นี่คือจุดที่มนุษย์สามารถปรับแต่งเครื่องมือได้” เพนน์กล่าว “นี่ไม่ใช่วิธีที่องค์กรจะนำสิ่งนี้ออกสู่ตลาด”
คิดว่าการเขียนพร้อมท์เป็นการเขียนโปรแกรม คุณเป็นนักพัฒนาที่เขียนคำแนะนำไปยังคอมพิวเตอร์เพื่อให้คอมพิวเตอร์ทำบางสิ่ง
เมื่อคุณปรับแต่งพรอมต์ของคุณอย่างละเอียดสำหรับกรณีการใช้งานเฉพาะแล้ว คุณสามารถใช้ประโยชน์จาก API และขอให้นักพัฒนาจริงรวมพรอมต์เหล่านั้นไว้ในโค้ดเพิ่มเติม เพื่อให้คุณสามารถส่งและรับข้อมูลตามสเกลทางโปรแกรมได้
นี่คือวิธีที่ LLM จะปรับขนาดและเปลี่ยนแปลงธุรกิจให้ดีขึ้น
เนื่องจากมีการเปิดตัวเครื่องมือเหล่านี้ทุกที่ จึงจำเป็นอย่างยิ่งที่จะต้องจำไว้ว่าทุกคนคือนักพัฒนา
เทคโนโลยีนี้จะอยู่ใน Microsoft Office — Word, Excel และ PowerPoint — และเครื่องมือและบริการอื่น ๆ อีกมากมายที่เราใช้ทุกวัน
“เนื่องจากคุณกำลังเขียนโปรแกรมด้วยภาษาธรรมชาติ จึงไม่จำเป็นต้องเป็นโปรแกรมเมอร์แบบดั้งเดิมที่จะมีไอเดียที่ดีที่สุด” เพนน์กล่าวเสริม
เนื่องจาก LLMs ขับเคลื่อนโดยการเขียน นักการตลาดหรือนักประชาสัมพันธ์ — ไม่ใช่โปรแกรมเมอร์ — อาจพัฒนาวิธีใหม่ๆ ในการใช้เครื่องมือ
เคล็ดลับเพิ่มเติมสำหรับนักการตลาดผ่านการค้นหา
เราเริ่มเห็นผลกระทบของรูปแบบภาษาขนาดใหญ่ต่อการตลาด โดยเฉพาะการค้นหา
ในเดือนกุมภาพันธ์ Microsoft ได้เปิดตัว Bing ใหม่ที่ขับเคลื่อนโดย ChatGPT ผู้ใช้สามารถสนทนากับเครื่องมือค้นหาและรับคำตอบโดยตรงสำหรับคำถามของตนโดยไม่ต้องคลิกลิงก์ใดๆ
“คุณควรคาดหวังว่าเครื่องมือเหล่านี้จะกัดการค้นหาที่ไม่มีแบรนด์ของคุณ เพราะพวกเขากำลังตอบคำถามในรูปแบบที่ไม่ต้องการการคลิก” เพนน์กล่าว
“เราเคยเผชิญกับสิ่งนี้มาแล้วในฐานะผู้เชี่ยวชาญด้าน SEO ด้วยตัวอย่างข้อมูลเด่นและผลการค้นหาแบบไม่ต้องคลิก… แต่มันจะยิ่งแย่ลงไปอีกสำหรับเรา”
เขาแนะนำให้ไปที่ Bing Webmaster Tools หรือ Google Search Console และดูเปอร์เซ็นต์การเข้าชมที่ไซต์ของคุณได้รับจากการค้นหาข้อมูลที่ไม่มีแบรนด์ เนื่องจากเป็นพื้นที่เสี่ยงที่ใหญ่ที่สุดสำหรับ SEO
เรื่องที่เกี่ยวข้อง
ใหม่บน MarTech