25 statystyk dotyczących rozpoznawania obrazów, które ukazują piksele stojące za technologią
Opublikowany: 2023-10-09Nowoczesne komputery uczą się widzieć podobnie jak ludzie, a technologia rozpoznawania obrazów umożliwia to.
Sieci neuronowe stanowią serce tej technologii. Uczy się na podstawie danych i rozpoznaje wzorce. W miarę dostarczania większej ilości danych o obiektach, twarzach, a nawet emocjach, „widzieć” i rozumieć obraz staje się coraz lepszy.
Rozpoznawanie obrazu jest podzbiorem widzenia komputerowego i sztucznej inteligencji (AI). Obejmuje techniki i algorytmy etykietujące i kategoryzujące zawartość obrazu.
U podstaw technologia ta dopiero zaczyna ewoluować, ale wiele organizacji zaczęło już używać oprogramowania do rozpoznawania obrazów do uczenia modeli i dodawania funkcji rozpoznawania obrazów na innych platformach oprogramowania. Obecnie rozpoznawanie obrazu pomaga w diagnostyce medycznej, odnajdywaniu zagubionych osób, a nawet urzeczywistnianiu samochodów autonomicznych.
Potencjał rynku jest ogromny i stale się rozwija, wkraczając na nowe branże. Przyjrzyjmy się tym statystykom i zobaczmy, co nowego w rozpoznawaniu obrazów.
Statystyki rynku rozpoznawania obrazów
Rynek rozpoznawania obrazu szybko rośnie i staje się popularny w sektorach handlu detalicznego, opieki zdrowotnej i bezpieczeństwa. Sztuczna inteligencja i uczenie maszynowe są głównymi motorami wzrostu rynku. Z poniższych statystyk wynika, że w latach 2023–2030 wszelkie możliwości na rynku rozpoznawania obrazów mogą być obiecujące.
Zobacz jak wyglądają statystyki.
- Oczekuje się, że globalny rynek rozpoznawania obrazów wykaże złożoną roczną stopę wzrostu (CAGR) na poziomie 10,42% w latach 2023–2030.
- Oczekuje się, że największy będzie rynek rozpoznawania obrazów w USA, którego wartość w 2023 r. wyniesie 3,94 miliarda dolarów.
10,53 miliarda dolarów
to prognozowana wartość rynku rozpoznawania obrazu na rok 2023.
źródło: Statista
- Wielkość rynku rozpoznawania obrazów w Ameryce Północnej wzrosła o 11,86% w 2023 r.
- Prognozuje się, że w 2023 r. australijski rynek rozpoznawania obrazów osiągnie wartość 280 mln dolarów.
- Ameryka Południowa wykazuje znaczny wzrost wielkości rynku o 20,26% w 2023 r.
- Wielkość globalnego rynku rozpoznawania obrazów AI wyceniono na 3330,67 mln USD w 2022 r. i oczekuje się, że wzrośnie w tempie CAGR wynoszącym 24,91%, aby osiągnąć 12652,88 mln w 2028 r.
- Rynek rozpoznawania obrazów w Azji jest stosunkowo mniejszy i w 2023 r. osiągnie wartość 2,57 miliarda dolarów.
- Wielkość rynku rozpoznawania obrazów w Europie Środkowej i Zachodniej jest jeszcze mniejsza i w 2023 r. wyniesie 1,88 miliarda dolarów.
- Oczekiwany CAGR amerykańskiego rynku rozpoznawania obrazów w latach 2023–2030 wynosi 7,86%.
Statystyki technologii rozpoznawania obrazu
Głębokie uczenie się odgrywa główną rolę w technologii rozpoznawania obrazów. Popularne modele głębokiego uczenia się, takie jak You Only Look Once (YOLO) i Single-Shot Detector (SSD), wykorzystują warstwy splotu do analizowania cyfrowych obrazów i fotografii. W 2023 r. techniki i modele głębokiego uczenia się będą nadal udoskonalane, dzięki czemu rozpoznawanie obrazów będzie prostsze i dokładniejsze.
Co więcej, algorytmy takie jak transformacja cech niezmiennych skali (SIFT), przyspieszone funkcje solidne (SURF) i modele rozpoznawania obrazów oparte na analizie głównych składowych (PCA) odczytują, przetwarzają i dostarczają.
Ekosystem technologiczny otaczający rozpoznawanie obrazów szybko się zmienia. Te statystyki będą informować Cię o nowościach technicznych.
- Laboratorium informatyki i sztucznej inteligencji (CSAIL) MIT opracowało maskowany koder generatywny (MAGE), który umożliwia wnioskowanie o brakujących częściach obrazu. Osiągnął dokładność na poziomie 80,9% w sondowaniu liniowym i poprawnie zidentyfikował obrazy w 71,9% przypadków, gdy podano dziesięć oznaczonych próbek z każdej klasy.
- Object365, wielkoskalowy zbiór danych do wykrywania obiektów, został przeszkolony na podstawie ponad 600 000 obrazów.
1000 obrazów
każdej klasy są potrzebne do szkolenia systemów w zakresie wykrywania i rozpoznawania obrazów i obiektów.
Źródło: IBM
- Rozdzielczość od 1 do 2 megapikseli jest idealna, gdy obrazy nie wymagają drobnych szczegółów do wykrywania obiektów. Jeśli obrazy wymagają drobnych szczegółów, są dzielone na obrazy o rozdzielczości 1–2 megapikseli każdy.
- Duże i wydajne systemy rozpoznawania obrazu mogą obsłużyć 1000 klatek na sekundę (FPS). I odwrotnie, popularne systemy rozpoznawania obrazu przetwarzają dane z szybkością 100 klatek na sekundę.
- Największym publicznie dostępnym zbiorem danych do szkolenia modeli rozpoznawania obrazów jest IMDB-Wiki, zawierający ponad 500 000 obrazów ludzkich twarzy.
- Berkeley Deep Drive (BDD110K) to największy zróżnicowany zbiór danych wideo dotyczących jazdy. Zawiera ponad 100 000 filmów z adnotacjami dotyczącymi zadań percepcji podczas jazdy autonomicznej.
- Rozpoznawanie obrazu składa się z trzech warstw – wejściowej, ukrytej i wyjściowej. Warstwa wejściowa wychwytuje sygnał, warstwa ukryta przetwarza go, a warstwa wyjściowa decyduje, co to jest.
- Obraz kolorowy ma głębię bitową w zakresie od 8 do 24 lub więcej. W obrazie 24-bitowym istnieją trzy grupy: 8 dla koloru czerwonego, 8 dla koloru zielonego i 8 dla koloru niebieskiego. Kombinacja tych bitów reprezentuje inne kolory.
- 4 statystyki pierwszego rzędu (średnia, wariancja, skośność i kurtoza) i 5 statystyk drugiego rzędu (drugi moment kątowy, kontrast, korelacja, jednorodność i entropia) reprezentują cechy tekstowe obrazu.
Statystyki dokładności systemu rozpoznawania obrazu
Dzięki splotowym sieciom neuronowym (CNN) wzrósł poziom dokładności rozpoznawania obrazu. Mimo to wyzwania takie jak deformacja, zróżnicowanie obiektów w tej samej klasie i okluzja mogą mieć wpływ na dokładność systemu. (Okluzja ma miejsce, gdy obiekt zakrywa część innego obiektu na obrazie.)
Pomimo tych potencjalnych niepowodzeń systemy rozpoznawania obrazu charakteryzują się niewiarygodnie wysokim poziomem pewności. Zapoznaj się z tymi statystykami, aby zrozumieć, jakiej dokładności można oczekiwać od oprogramowania do rozpoznawania obrazów i jak duże jest pole do błędów.
- Średni poziom błędów we wszystkich zbiorach danych w rozpoznawaniu obrazu wynosi 3,4%.
- Wskaźnik pięciu największych błędów w rozpoznawaniu obrazu odnosi się do odsetka przypadków, w których etykieta docelowa nie pojawia się wśród pięciu przewidywań o najwyższym prawdopodobieństwie. Wiele technik nie może spaść poniżej 25%.
6%
to średni poziom błędów dla zbioru danych ImageNet, który jest szeroko stosowany w systemach rozpoznawania obrazów opracowanych przez Google i Facebook.
Źródło: MIT
- Przybliżony poziom dokładności narzędzi do rozpoznawania obrazu wynosi 95%. Wynika to z rozwoju CNN i innych głębokich sieci neuronowych opartych na funkcjach.
- YOLOv7 to najbardziej wydajny i dokładny model wykrywania obiektów w czasie rzeczywistym do zadań związanych z wizją komputerową.
Źródła:
- Statysta
- Wieśniak
- IBM-a
- Wszystko o obwodach
- Wizja
- Altexsoft
- V7labs
- HakerPołudnie
Od pikseli po wzory
Powyższe statystyki wyraźnie pokazują, że rynek rozpoznawania obrazów znajduje się na ścieżce wzrostu od 2023 do 2030 roku. Technologia ewoluuje i zwiększa swoją dokładność dzięki nowym aktualizacjom i udoskonaleniom. Ale rozwój nie dotyczy wyłącznie rozpoznawania obrazów. Cały obszar widzenia komputerowego rozwija się pod względem wielkości rynkowej i zastosowania. Wraz ze wzrostem wartości rynku zyskają firmy, które znajdą miejsce w sektorze rozpoznawania wizerunku.
Dowiedz się więcej o widzeniu komputerowym i zrozum, w jaki sposób maszyny interpretują świat wizualny.