อะไรที่สามารถขัดขวางอนาคตของ generative AI ได้?
เผยแพร่แล้ว: 2023-09-22ปัจจุบันมีการพูดคุยกันมากมายเกี่ยวกับวิธีที่ AI สร้างสรรค์สามารถทำให้คนตกงานได้อย่างไร ไม่ค่อยมีใครคิดมากนักว่าผู้คนจะทำให้ AI สร้างสรรค์ไม่ทำงานได้อย่างไร แต่พวกเขาทำได้ - และอาจจะเป็นไปได้ด้วยซ้ำ
GenAI และโมเดลพื้นฐานที่ใช้อยู่นั้นกำลังอยู่ในช่วงจุดสูงสุดที่น่าเวียนหัวของวงจรกระแสเกินจริงของ Gartner หากแบบจำลองของ Gartner นั้นดี เครื่องมือเหล่านั้นก็อาจจะจมดิ่งลงสู่ "ความท้อแท้" ก่อนที่จะปรากฏขึ้นในอีกไม่กี่ปีข้างหน้าจนกลายเป็นผลผลิตที่มีประโยชน์
อย่างไรก็ตาม มีข้อโต้แย้งว่าความท้อแท้อาจกลืนผลิตภัณฑ์ genAI ไปตลอดกาล นอกเหนือจากความเสี่ยงที่แฝงอยู่ในการพึ่งพา "ความฉลาดทางศีลธรรม" ที่หมดสติและไร้ศีลธรรมแล้ว ผู้ใช้ยังเผชิญกับโอกาสที่แท้จริงว่าปัญหาด้านลิขสิทธิ์และความเป็นส่วนตัวอาจส่งผลกระทบร้ายแรงต่อโมเดลภาษาขนาดใหญ่ (LLM) เช่น ChatGPT
เรามาเรียงลำดับกันดีกว่า
ทะเบียน Do Not Scrape ระดับชาติ?
ผู้เผยแพร่โฆษณาสร้างรายได้จากเนื้อหา พวกเขาไม่ได้พยายามที่จะให้บุคคลที่สามสร้างรายได้จากเนื้อหานั้นโดยไม่ได้รับอนุญาต โดยเฉพาะอย่างยิ่งเมื่อผู้เผยแพร่มีแนวโน้มว่าจะจ่ายเงินสำหรับเนื้อหานั้นแล้ว นักเขียนมืออาชีพสร้างรายได้จากสิ่งที่พวกเขาเขียน พวกเขาก็ไม่แสวงหาผลกำไรจากบุคคลที่สามจากงานของพวกเขาเช่นกันโดยไม่ได้รับค่าตอบแทนจากผู้สร้าง ทุกสิ่งที่ฉันพูดที่นี่เกี่ยวกับเนื้อหาที่เป็นลายลักษณ์อักษรนั้นใช้ได้กับเนื้อหากราฟิก วิดีโอ และเนื้อหาเชิงสร้างสรรค์อื่นๆ อย่างเท่าเทียมกัน
แน่นอนว่าเรามีกฎหมายลิขสิทธิ์ที่คุ้มครองผู้จัดพิมพ์และผู้แต่งจากการโจรกรรมโดยตรง สิ่งเหล่านั้นไม่ได้ช่วยในเรื่อง genAI เพราะมันรวบรวมข้อมูลแหล่งที่มามากมายจนผลลัพธ์สุดท้ายอาจไม่เหมือนกับแหล่งที่มาแต่ละแห่งอย่างใกล้ชิด (แม้ว่าจะสามารถเกิดขึ้นได้ก็ตาม)
ขณะนี้ ผู้เผยแพร่โฆษณากำลังมองหาวิธีบล็อก LLM ไม่ให้คัดลอกเนื้อหาของตน มันเป็นความท้าทายทางเทคนิคที่ยากลำบาก
ในวิดีโอนี้ Greg Krehbiel ผู้สนับสนุน MarTech กล่าวถึงวิธีที่ผู้เผยแพร่โฆษณาอาจพยายามบล็อก LLM เขายังทำคดีเปลี่ยนแปลงข้อกำหนดและเงื่อนไขเพื่อเตรียมเหตุในการฟ้องร้องในอนาคต ดูเหมือนว่าเขาจะรับทราบ ไม่มีข้อเสนอแนะใดของเขาที่เป็นเรื่องสแลมดังค์ ตัวอย่างเช่น เป็นไปได้ไหมที่จะหยุด Google รวบรวมข้อมูลเว็บไซต์ของคุณเพื่อดึงเนื้อหาโดยไม่หยุดรวบรวมข้อมูลเว็บไซต์ของคุณเพื่อวางในผลการค้นหา อีกทั้งการฟ้องร้องก็มีค่าใช้จ่ายสูง
แต่แล้วการแก้ไขกฎระเบียบล่ะ? คุณจำความรำคาญไม่รู้จบของการโทรการตลาดทางโทรศัพท์ได้หรือไม่? การลงทะเบียน National Do Not Call ได้ยุติการดำเนินการดังกล่าว ทุกคนที่ใส่ใจสามารถลงทะเบียนหมายเลขของตนได้ และนักการตลาดทางโทรศัพท์สามารถโทรไปต่อได้ก็ต่อเมื่อมีความเสี่ยงที่ FTC จะต้องเสียค่าปรับจำนวนมาก
การจดทะเบียนโดเมนด้วยการลงทะเบียน National Do Not Scrape อาจเป็นการเพิ่มที่หนักกว่า แต่ก็สามารถเห็นได้ในแง่ทั่วไปว่ากลยุทธ์การกำกับดูแลดังกล่าวทำงานอย่างไร การละเมิดทุกครั้งจะถูกตรวจพบหรือไม่? ไม่แน่นอน แต่สำหรับ GDPR ก็เช่นเดียวกัน GDPR สั่งให้ปฏิบัติตามไม่ใช่เพราะตรวจพบการละเมิดทุกครั้ง แต่เนื่องจากการละเมิดเหล่านั้นที่ตรวจพบอาจส่งผลให้เกิดการลงโทษอย่างหนัก — “ค่าปรับที่สูงอย่างที่ไม่เคยมีมาก่อนมากถึง 4 เปอร์เซ็นต์ของรายได้ทั่วโลกทั้งหมดของบริษัท”
สายไปแล้ว. GenAI มีข้อมูลอยู่แล้ว
ไม่ว่าจะมีการแก้ไขด้านเทคนิคหรือกฎระเบียบเพื่อหยุดการขโมยเนื้อหา genAI ม้าตัวนั้นก็ออกจากคอกไปแล้วไม่ใช่หรือ? LLM ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่อย่างเหลือเชื่อแล้ว พวกเขาอาจมีแนวโน้มที่จะผิดพลาด แต่ก็มีความรู้สึกที่พวกเขารู้ทุกอย่าง
พวกเขารู้ทุกอย่างเมื่อสองสามปีก่อน ChatGPT-4 ได้รับการฝึกอบรมเกี่ยวกับข้อมูลล่วงหน้า โดยจะยุติการใช้งานในเดือนกันยายน 2021 ซึ่งหมายความว่ายังมีอีกหลายอย่างที่ยังไม่รู้ เรามาเตือนตัวเองว่าเรากำลังเผชิญกับอะไรที่นี่
เจาะลึก: ปัญญาประดิษฐ์: คู่มือสำหรับผู้เริ่มต้น
GenAI ใช้อัลกอริธึมในการทำนายข้อความที่ดีที่สุดถัดไปที่จะสร้าง โดยอิงจากข้อความนับล้านทั้งหมดที่ได้รับการฝึกฝน สิ่งที่ทำให้ "ฉลาด" ก็คือสามารถปรับปรุงอัลกอริทึมของตัวเองโดยอิงตามความคิดเห็นและการตอบสนอง (มนุษย์ไม่จำเป็นต้องแก้ไขอัลกอริทึม แม้ว่าแน่นอนว่าเธอทำได้ก็ตาม)
สิ่งที่ genAI ไม่ทำ (ทำไม่ได้) คือการค้นหาสิ่งต่างๆ เกี่ยวกับโลกที่อยู่นอกเหนือชุดการฝึกอบรมข้อมูล สิ่งนี้เน้นย้ำประเด็นที่นักปรัชญาอย่างโดนัลด์ เดวิดสันตั้งไว้ 1 ว่า AI ไม่มีการเชื่อมโยงเชิงสาเหตุกับโลก ถ้าฉันต้องการทราบว่าฝนตกหรือไม่ ฉันจะไม่พึ่งพาชุดข้อมูล ฉันมองออกไปนอกหน้าต่าง ในทางเทคนิคแล้ว genAI อาจมีไวยากรณ์ (ไวยากรณ์) ที่ดี แต่เป็นคนแปลกหน้าสำหรับความหมาย (ความหมาย)
ข้อสรุปที่ได้จากเรื่องนี้ก็คือ AI พึ่งพาสิ่งมีชีวิตเช่นเดียวกับเรา ที่ เชื่อมต่อกับโลกอย่างมีเหตุผล ใครจะบอกได้ว่าฝนกำลังตก ถ้ามีดวงจันทร์บนท้องฟ้า ถ้าเจฟเฟอร์สันเป็นผู้ร่างคำประกาศอิสรภาพ จนถึงตอนนี้ก็ขึ้นอยู่กับสิ่งที่ผู้คนทำในอดีต เพื่อให้คงความเกี่ยวข้องได้นั้นจะต้องขึ้นอยู่กับสิ่งที่ผู้คนสามารถทำได้เพียงอย่างเดียว
หากความสามารถของ LLM ในการคัดลอกเนื้อหาที่สร้างโดยมนุษย์ต่อไปนั้นมีความบกพร่องอย่างมาก พวกเขาจะไม่สามารถเพิ่ม อัปเดต แก้ไข และเพิ่มชุดข้อมูลของตนได้ในอนาคต การสูญเสียอรรถประโยชน์อาจเกิดขึ้นช้า แต่ก็รับประกันได้ไม่มากก็น้อย
ส่ง PII ของฉันออกไป!
นอกเหนือจากการกระตุ้นให้ผู้จัดพิมพ์ ผู้เขียน และผู้สร้างอื่นๆ หลีกเลี่ยง genAI จากเนื้อหาของพวกเขา ยังมีปัญหาที่แท้จริงอีกประการหนึ่งที่ต้องเผชิญกับในอนาคตอันใกล้นี้ ความจำเป็นในการรับประกันว่าในการคัดลอกข้อมูลหลายล้านกิกะไบต์จากเว็บ พวกเขาจะไม่ได้ยึดข้อมูลที่สามารถระบุตัวบุคคล (PII) หรือข้อมูลประเภทอื่น ๆ ที่ได้รับการคุ้มครองโดยกฎระเบียบที่มีอยู่โดยไม่ได้ตั้งใจ
- FTC เปิดการสอบสวน OpenAI เกี่ยวกับปัญหาการคุ้มครองผู้บริโภค
- ตามที่รายงานอย่างกว้างขวาง อิตาลีเพียงสั่งห้าม OpenAI และ ChatGPT ในเรื่องการจัดการข้อมูลส่วนบุคคล รวมถึงการไม่มีการควบคุมการตรวจสอบอายุ การดำเนินงานได้รับการฟื้นฟูหลังจากปฏิบัติตามข้อเรียกร้องของอิตาลี
- ความท้าทายของยุโรปยังไม่สิ้นสุด การร้องเรียนที่ครอบคลุมในโปแลนด์อ้างว่า OpenAI อยู่ใน “การละเมิดระบบ” ของ GDPR
พอจะกล่าวได้ว่าศาลยุโรปมีแนวโน้มที่จะเห็นใจต่อสิทธิของพลเมืองมากกว่าผลกำไรจากเทคโนโลยีขนาดใหญ่
เราไม่ได้กล่าวถึงความไว้วางใจและความปลอดภัยด้วยซ้ำ ข้อกังวลเหล่านี้ครอบคลุมอยู่ในการสนทนาล่าสุดของฉันกับ Afraz Jaffri ผู้เชี่ยวชาญด้านวงจร AI ของ Gartner ซึ่งกล่าวว่า:
ประเด็นแรกคือด้านความน่าเชื่อถือจริงๆ โดยไม่คำนึงถึงกฎระเบียบภายนอก ยังคงมีความรู้สึกพื้นฐานว่าการควบคุมเอาท์พุตของโมเดลเป็นเรื่องยากมาก และการรับประกันว่าเอาท์พุตนั้นถูกต้องจริงๆ นั่นเป็นอุปสรรคใหญ่
อนาคตของ genAI จะเป็นอย่างไร? วงจรการ์ตเนอร์ไฮป์
ทั้งหมดนี้จะทำให้สวิตช์ปิดทำงานหรือไม่
มันง่ายที่จะบอกว่า genAI อยู่ที่นี่เพื่ออยู่ต่อ มีคนกล่าวไว้มากมาย และแท้จริงแล้ว การพัฒนาเทคโนโลยีที่สำคัญ (หากไม่ใช่เรื่องใหม่ทั้งหมด) ไม่น่าจะถูกลืมหรือละทิ้งไปได้เลย อย่างน้อยที่สุด องค์กรต่างๆ จะยังคงใช้ความสามารถเหล่านี้บนชุดข้อมูลของตนเอง หรือชุดข้อมูลภายนอกที่กำหนดอย่างระมัดระวัง และจะตอบสนองกรณีการใช้งานที่สำคัญหลายๆ กรณี
อย่างไรก็ตาม โอกาสที่ genAI จะถูกขัดขวาง ถูกจำกัด และเปลี่ยนแปลงอย่างมากจากการบล็อกด้านกฎระเบียบ ความท้าทายทางกฎหมาย ปัญหาความไว้วางใจ และอุปสรรคอื่น ๆ ที่ยังไม่พบเห็น นั้นมีค่าเกินกว่าศูนย์
- โดนัลด์ เดวิสัน, “การทดสอบของทัวริง”, มายด์ 59 (1950) ↩︎
เรื่องราวที่เกี่ยวข้อง
ใหม่ใน MarTech