25 إحصائيات للتعرف على الصور للكشف عن وحدات البكسل خلف التقنية
نشرت: 2023-10-09تتعلم أجهزة الكمبيوتر الحديثة أن ترى إلى حد كبير ما يفعله البشر، كما أن تكنولوجيا التعرف على الصور تجعل ذلك ممكنًا.
تقع الشبكات العصبية في قلب هذه التكنولوجيا. يتعلم من البيانات ويتعرف على الأنماط. ومع قيامك بتغذية المزيد من البيانات حول الأشياء والوجوه وحتى العواطف، فإنها تتحسن في "رؤية" الصورة وفهمها.
التعرف على الصور هو مجموعة فرعية من رؤية الكمبيوتر والذكاء الاصطناعي (AI). ويتضمن تقنيات وخوارزميات تقوم بتسمية محتوى الصورة وتصنيفه.
في الأساس، بدأت التكنولوجيا في التطور، لكن العديد من المؤسسات بدأت بالفعل في استخدام برامج التعرف على الصور لتدريب النماذج وإضافة إمكانات للتعرف على الصورة في منصات برمجية أخرى. في الوقت الحاضر، يساعد التعرف على الصور في التشخيص الطبي، والعثور على الأشخاص المفقودين، وحتى جعل السيارات ذاتية القيادة حقيقة واقعة.
إمكانات السوق هائلة، وهي تتوسع باستمرار لاقتحام صناعات جديدة. دعنا نستكشف هذه الإحصائيات ونرى ما هو الجديد في التعرف على الصور.
إحصائيات سوق التعرف على الصور
ينمو سوق التعرف على الصور بسرعة ويحظى بشعبية كبيرة في قطاعات البيع بالتجزئة والرعاية الصحية والأمن. الذكاء الاصطناعي والتعلم الآلي هما المحركان الأساسيان لنمو السوق. بناءً على الإحصائيات الواردة أدناه، فإن أي فرصة في سوق التعرف على الصور يمكن أن تكون واعدة بين عامي 2023 و2030.
انظر كيف تبدو الإحصائيات.
- من المتوقع أن يُظهر سوق التعرف على الصور العالمي معدل نمو سنوي مركب (CAGR) يبلغ 10.42٪ من عام 2023 إلى عام 2030.
- ومن المتوقع أن يكون حجم سوق التعرف على الصور في الولايات المتحدة هو الأكبر، حيث تبلغ قيمته 3.94 مليار دولار في عام 2023.
10.53 مليار دولار
هي القيمة المتوقعة لسوق التعرف على الصور لعام 2023.
المصدر: ستاتيستا
- ارتفع حجم سوق التعرف على الصور في أمريكا الشمالية بنسبة 11.86% في عام 2023.
- من المتوقع أن يصل سوق التعرف على الصور في أستراليا إلى 280 مليون دولار في عام 2023.
- تظهر أمريكا الجنوبية زيادة كبيرة في حجم السوق بنسبة 20.26٪ في عام 2023.
- بلغت قيمة السوق العالمية للتعرف على الصور باستخدام الذكاء الاصطناعي 3330.67 مليون دولار أمريكي في عام 2022، ومن المتوقع أن تتوسع بمعدل نمو سنوي مركب قدره 24.91٪ لتصل إلى 12652.88 مليونًا في عام 2028.
- سوق التعرف على الصور في آسيا أصغر نسبيًا، حيث سيبلغ حجمه 2.57 مليار دولار في عام 2023.
- ويعد حجم سوق التعرف على الصور في أوروبا الوسطى والغربية أصغر من ذلك ليصل إلى 1.88 مليار دولار في عام 2023.
- يبلغ معدل النمو السنوي المركب المتوقع لسوق التعرف على الصور في الولايات المتحدة من 2023 إلى 2030 7.86%.
إحصائيات تقنية التعرف على الصور
للتعلم العميق دور البطولة في تكنولوجيا التعرف على الصور. تستخدم نماذج التعلم العميق المشهورة مثل You Only Look One (YOLO) وSingle-Shot Detector (SSD) طبقات الالتواء لتحليل الصور الرقمية أو الصور الفوتوغرافية. ستستمر تقنيات ونماذج التعلم العميق في التحسن في عام 2023، مما يجعل التعرف على الصور أكثر بساطة ودقة.
علاوة على ذلك، فإن الخوارزميات مثل تحويل الميزات الثابتة الحجم (SIFT)، والميزات القوية السريعة (SURF)، ونماذج التعرف على الصور لتحليل المكونات الرئيسية (PCA) تقرأ وتعالج وتقدم.
يتغير النظام البيئي التكنولوجي المحيط بالتعرف على الصور بسرعة. ستعمل إحصائيات Tese على تحديثك بأحدث ما يتعلق بالجانب التكنولوجي.
- قام مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) التابع لمعهد ماساتشوستس للتكنولوجيا (MIT) بتطوير جهاز التشفير التوليدي المقنع (MAGE) لاستنتاج الأجزاء المفقودة من الصورة. لقد حققت دقة بنسبة 80.9% في الفحص الخطي وتم تحديد الصور بشكل صحيح في 71.9% من الحالات عند إعطاء عشرة أمثلة مصنفة من كل فئة.
- تم تدريب Object365، وهي مجموعة بيانات واسعة النطاق للكشف عن الكائنات، بأكثر من 600000 صورة.
1000 صورة
هناك حاجة إلى كل فئة لتدريب الأنظمة على اكتشاف الصور والأشياء والتعرف عليها.
المصدر: آي بي إم
- تُعد الدقة من 1 إلى 2 ميجابكسل مثالية عندما لا تحتاج الصور إلى تفاصيل دقيقة لاكتشاف الكائنات. إذا كانت الصور تتطلب تفاصيل دقيقة، فسيتم تقسيمها إلى صور تبلغ دقة كل منها 1-2 ميجابكسل.
- يمكن لأنظمة التعرف على الصور الكبيرة والقوية التعامل مع 1000 إطار في الثانية (FPS). وعلى العكس من ذلك، تعالج أنظمة التعرف على الصور الشائعة بمعدل 100 إطارًا في الثانية.
- أكبر مجموعة بيانات متاحة للعامة لتدريب نماذج التعرف على الصور هي IMDB-Wiki، مع أكثر من 500000 صورة لوجوه بشرية.
- يعد Berkeley Deep Drive (BDD110K) أكبر مجموعة بيانات فيديو متنوعة للقيادة. يحتوي على أكثر من 100000 مقطع فيديو مشروح لمهام الإدراك في القيادة الذاتية.
- يتكون التعرف على الصور من ثلاث طبقات – الإدخال، والمخفية، والإخراج. تلتقط طبقة الإدخال الإشارة، وتعالجها الطبقة المخفية، وتقرر طبقة الإخراج ما هي.
- تحتوي الصورة الملونة على عمق بت يتراوح من 8 إلى 24 أو أعلى. في الصورة ذات 24 بت، توجد ثلاث مجموعات: 8 للأحمر، و8 للأخضر، و8 للأزرق. مزيج هذه البتات يمثل ألوانًا أخرى.
- 4 إحصائيات من الدرجة الأولى (المتوسط، والتباين، والانحراف، والتفرطح) و5 إحصائيات من الدرجة الثانية (العزم الثاني الزاوي، والتباين، والارتباط، والتجانس، والإنتروبيا) تمثل السمات النصية للصورة.
إحصائيات دقة نظام التعرف على الصور
مع الشبكات العصبية التلافيفية (CNN)، زاد مستوى دقة التعرف على الصور. ومع ذلك، فإن التحديات مثل التشوه، واختلاف الكائنات داخل نفس الفئة، والانسداد قد تؤثر على دقة النظام. (يحدث الانسداد عندما يقوم كائن بإخفاء جزء من كائن مختلف في الصورة.)
وعلى الرغم من هذه النكسات المحتملة، فإن أنظمة التعرف على الصور تعرض مستويات عالية بشكل لا يصدق من اليقين. استكشف هذه الإحصائيات لفهم الدقة التي يمكنك توقعها من برنامج التعرف على الصور ومدى اتساع مجال الخطأ.
- يبلغ متوسط معدل الخطأ في جميع مجموعات البيانات في التعرف على الصور 3.4%.
- يشير معدل الأخطاء الخمسة الأعلى في التعرف على الصور إلى النسبة المئوية للمرات التي لا تظهر فيها التسمية المستهدفة بين التوقعات الخمسة ذات الاحتمالية الأعلى. العديد من التقنيات لا يمكن أن تقل عن 25٪.
6%
هو متوسط معدل الخطأ لمجموعة بيانات ImageNet، والذي يستخدم على نطاق واسع في أنظمة التعرف على الصور التي طورتها Google وFacebook.
المصدر: معهد ماساتشوستس للتكنولوجيا
- يبلغ مستوى الدقة التقريبي لأدوات التعرف على الصور 95%. ويرجع ذلك إلى تطوير شبكة CNN وغيرها من الشبكات العصبية العميقة القائمة على الميزات.
- YOLOv7 هو النموذج الأكثر دقة للكشف عن الأشياء في الوقت الفعلي لمهام رؤية الكمبيوتر.
مصادر:
- ستاتيستا
- ياهو
- آي بي إم
- كل شيء عن الدوائر
- فيسو
- ألتكسوفت
- V7labs
- HackNoon
من البكسل إلى الأنماط
تظهر الإحصائيات أعلاه بوضوح أن سوق التعرف على الصور يسير على مسار النمو من عام 2023 إلى عام 2030. وتتطور التكنولوجيا وتزيد من دقتها مع التحديثات والتطورات الجديدة. لكن النمو لا يقتصر على التعرف على الصور. يتوسع مجال رؤية الكمبيوتر بالكامل من حيث حجم السوق واعتماده. ومع نمو القيمة السوقية، ستستفيد الشركات التي تجد مكانًا لها في قطاع التعرف على الصور.
تعرف على المزيد حول رؤية الكمبيوتر وفهم كيفية تفسير الآلات للعالم المرئي.