ما الذي يمكن أن يعطل مستقبل الذكاء الاصطناعي التوليدي؟
نشرت: 2023-09-22هناك الكثير من الحديث هذه الأيام حول كيف يمكن للذكاء الاصطناعي التوليدي أن يتسبب في توقف الناس عن العمل. لم يتم التفكير كثيرًا في كيفية قيام الناس بإيقاف الذكاء الاصطناعي التوليدي عن العمل. ولكنهم قادرون على ذلك، ومن المحتمل أن يفعلوا ذلك.
إن GenAI والنماذج الأساسية التي تعتمد عليها هي حاليًا في ذروة مذهلة لدورة الضجيج الخاصة بـ Gartner. إذا كان نموذج جارتنر سليماً، فإن هذه الأدوات ربما تكون على وشك الانزلاق إلى "قاع خيبة الأمل" قبل أن تصل بعد بضع سنوات إلى مستوى من الإنتاجية المفيدة.
ومع ذلك، هناك حجة مفادها أن خيبة الأمل يمكن أن تبتلع منتجات الذكاء الاصطناعي الجيني إلى الأبد. بالإضافة إلى المخاطر الكامنة في الاعتماد على ما هو في الأساس "ذكاء" فاقد للوعي وغير أخلاقي، يواجه المستخدمون أيضًا احتمالات حقيقية للغاية تتمثل في أن قضايا حقوق الطبع والنشر والخصوصية قد تؤدي إلى إلحاق ضرر مميت بنماذج اللغات الكبيرة (LLMs) مثل ChatGPT.
دعونا نأخذ تلك بالترتيب.
سجل وطني لا تتخلص منه؟
يقوم الناشرون بتحقيق الدخل من المحتوى. إنهم لا يسعون إلى جعل أطراف ثالثة تحقق الدخل من هذا المحتوى دون إذن، خاصة وأن الناشرين قد دفعوا ثمنه بالفعل. المؤلفون المحترفون يستثمرون ما يكتبونه. وهم أيضًا لا يسعون إلى الحصول على أرباح من عملهم من قبل أطراف ثالثة دون أي تعويض للمبدع. كل ما أقوله هنا عن المحتوى المكتوب ينطبق بالتساوي على الرسوم البيانية والفيديو وأي محتوى إبداعي آخر.
لدينا بالطبع قوانين حقوق الطبع والنشر التي تحمي الناشرين والمؤلفين من السرقة المباشرة. لا تساعد هذه العناصر في genAI لأنها تزحف إلى العديد من المصادر بحيث قد لا يشبه الناتج النهائي أحد المصادر الفردية (على الرغم من إمكانية حدوث ذلك).
في الوقت الحالي، يبحث الناشرون بنشاط عن طرق لمنع حاملي شهادة LLM من استخلاص محتواهم. إنه تحدٍ تقني صعب
في هذا الفيديو، يناقش جريج كريبيل، المساهم في MarTech، الطرق التي قد يحاول بها الناشرون منع حاملي شهادات LLM. كما أنه يدعو إلى تغيير الشروط والأحكام لإعداد أسس الدعاوى القضائية المستقبلية. وكما يبدو أنه يعترف، فإن أياً من اقتراحاته لم يكن ناجحاً. على سبيل المثال، هل من الممكن عمليًا إيقاف محرك بحث Google عن الزحف إلى موقعك للحصول على المحتوى دون إيقافه أيضًا عن الزحف إلى موقعك لوضعه في نتائج البحث؟ كما أن الدعاوى القضائية مكلفة.
ولكن ماذا عن الإصلاح التنظيمي؟ هل تتذكر الإزعاج الذي لا ينتهي من مكالمات التسويق عبر الهاتف؟ لقد وضع سجل عدم الاتصال الوطني حدًا لذلك. كان كل من يهتم قادرًا على تسجيل رقمه ويمكن للمسوقين عبر الهاتف الاستمرار في الاتصال به فقط تحت خطر فرض لجنة التجارة الفيدرالية غرامات باهظة.
قد يكون تسجيل النطاقات باستخدام سجل National Do Not Scrape بمثابة دفعة أكبر، ولكن يمكن للمرء أن يرى بشكل عام كيف يمكن أن تعمل مثل هذه الإستراتيجية التنظيمية. هل سيتم اكتشاف كل مخالفة؟ بالتأكيد لا. ولكن الشيء نفسه ينطبق، على سبيل المثال، على اللائحة العامة لحماية البيانات. يفرض القانون العام لحماية البيانات (GDPR) الامتثال ليس لأنه تم الكشف عن كل انتهاك، ولكن لأن تلك الانتهاكات التي يتم اكتشافها يمكن أن تؤدي إلى عقوبات شديدة ــ "غرامات باهظة غير مسبوقة تصل إلى 4% من إجمالي الإيرادات العالمية للشركة".
لقد فات الأوان. لدى GenAI البيانات بالفعل
سواء كان هناك حل تقني أو تنظيمي لوقف سرقة محتوى genAI، ألم يغادر هذا الحصان الإسطبل بالفعل؟ لقد تم بالفعل تدريب حاملي الماجستير في القانون على مجموعات بيانات كبيرة بشكل لا يمكن تصوره. قد يكونون عرضة للخطأ، ولكن هناك شعور أنهم يعرفون كل شيء.
حسنًا، إنهم يعرفون كل شيء منذ عامين مضت. تم تدريب ChatGPT-4 مسبقًا على البيانات بموعد نهائي في سبتمبر 2021. وهذا يعني أن هناك الكثير مما لا يعرفه. دعونا نذكر أنفسنا بما نتعامل معه هنا.
حفر أعمق: الذكاء الاصطناعي: دليل المبتدئين
يستخدم GenAI الخوارزميات للتنبؤ بالجزء التالي الأفضل من النص الذي سيتم إنشاؤه، بناءً على كل تلك الملايين من أجزاء النص التي تم تدريبه عليها. وما يجعله "ذكيًا" هو أنه يمكنه تحسين خوارزمياته الخاصة بناءً على ردود الفعل والاستجابة (لا يحتاج الإنسان إلى العبث بالخوارزميات، على الرغم من أنه يستطيع ذلك بالطبع).
ما لا يفعله genAI، أو لا يستطيع فعله، هو اكتشاف أشياء عن العالم تقع خارج مجموعة التدريب على البيانات الخاصة به. وهذا يؤكد النقطة التي أشار إليها فلاسفة مثل دونالد ديفيدسون، وهي أن الذكاء الاصطناعي ليس له علاقات سببية مع العالم. إذا أردت معرفة ما إذا كانت السماء تمطر، فلا أعتمد على مجموعة البيانات؛ أنا أنظر من النافذة. من الناحية الفنية، قد يكون لدى genAI بناء جملة (نحوي) رائع، لكنه غريب على علم الدلالات (المعنى).
الاستنتاج الذي يمكن استخلاصه من هذا هو أن الذكاء الاصطناعي يعتمد بشكل كامل على كائنات، مثلنا، مرتبطة سببيًا بالعالم؛ من يستطيع معرفة ما إذا كانت السماء تمطر، وما إذا كان هناك قمر في السماء، وما إذا كان جيفرسون هو من قام بصياغة إعلان الاستقلال. حتى الآن، كان الأمر يعتمد على ما فعله الناس في الماضي. ولكي تظل ذات صلة، يجب أن تستمر في الاعتماد على ما يستطيع الناس وحدهم القيام به.
إذا كانت قدرة LLMs على الاستمرار في استخراج المحتوى الذي أنشأه البشر متخلفة بشكل كبير، فلن يتمكنوا من إضافة مجموعات البيانات الخاصة بهم وتحديثها وتصحيحها وزيادةها في المستقبل. وقد يكون زوال فائدتها بطيئا، لكنه سيكون مضمونا إلى حد ما.
ارفعوا أيديكم عن معلومات تحديد الهوية الشخصية (PII) الخاصة بي!
بالإضافة إلى رغبة الناشرين والمؤلفين وغيرهم من المبدعين في إبعاد genAI عن محتواهم، هناك مشكلة حقيقية أخرى تواجهها في المستقبل القريب. الحاجة إلى ضمان بطريقة أو بأخرى أنه أثناء عملية استخراج ملايين الجيجابايت من البيانات من الويب، فإنهم لا يستولون عن غير قصد على معلومات التعريف الشخصية (PII) أو أنواع أخرى من البيانات المحمية بموجب اللوائح الحالية.
- فتحت لجنة التجارة الفيدرالية (FTC) تحقيقًا في OpenAI بشأن قضايا حماية المستهلك.
- كما أفادت التقارير على نطاق واسع، قامت إيطاليا ببساطة بحظر OpenAI وChatGPT بسبب التعامل مع البيانات الشخصية بالإضافة إلى غياب ضوابط التحقق من العمر. تمت استعادة العمليات بعد الامتثال للمطالب الإيطالية.
- إن التحديات الأوروبية لم تنته بأي حال من الأحوال. تزعم شكوى شاملة تم تقديمها في بولندا أن OpenAI تنتهك "انتهاكًا منهجيًا" للقانون العام لحماية البيانات.
ويكفي أن نقول إن المحاكم الأوروبية تميل إلى التعاطف مع حقوق المواطنين أكثر من تعاطفها مع أرباح شركات التكنولوجيا الكبرى.
لم نذكر حتى الثقة والأمان. تمت تغطية هذه المخاوف في محادثتي الأخيرة مع أفريز جافري، خبير دورة الضجيج في مجال الذكاء الاصطناعي لدى Gartner، والذي قال:
المسألة الأولى هي في الواقع جانب الثقة. بغض النظر عن اللوائح الخارجية، لا يزال هناك شعور أساسي بأنه من الصعب جدًا التحكم في مخرجات النماذج وضمان صحة المخرجات بالفعل. هذه عقبة كبيرة.
ماذا يخبئ المستقبل لـ genAI؟ دورة الضجيج جارتنر
هل سيؤدي كل هذا إلى إيقاف التشغيل؟
من السهل أن نقول أن genAI موجود لتبقى. لقد قالها الكثير من الناس. وفي الواقع، من غير المرجح أن يتم نسيان أو التخلي عن أي تطور مهم في مجال التكنولوجيا - إن لم يكن جديدا تماما. كحد أدنى، ستستمر المؤسسات في استخدام هذه الإمكانات في مجموعات البيانات الخاصة بها، أو مجموعات البيانات الخارجية المحددة بحذر، وهو ما سيلبي العديد من حالات الاستخدام المهمة.
ومع ذلك، فإن فرص تعطل الذكاء الاصطناعي الجيني، وتقييده، وتغييره إلى حد كبير من خلال مجموعة من الكتل التنظيمية، والتحديات القانونية، وقضايا الثقة - وغيرها من العوائق التي لم نشهدها بعد - هي أعلى بكثير من الصفر.
- دونالد دافيسون، “اختبار تورينج”، العقل 59 (1950) ↩︎
قصص ذات الصلة
جديد على مارتك