czym jest Convolutional Neural Network Architecture?

0 Comments

artykuł został opublikowany w ramach Data Science Blogathon.

wprowadzenie

pracujesz nad projektem dotyczącym rozpoznawania obrazów lub wykrywania obiektów, ale nie masz podstaw do budowania architektury?,

w tym artykule zobaczymy, jakie są konwolutacyjne architektury sieci neuronowych od podstaw i weźmiemy podstawową architekturę jako studium przypadku, aby zastosować nasze nauki, jedynym warunkiem wstępnym jest to, że musisz tylko wiedzieć, jak działa splot, ale nie martw się, że jest to bardzo proste !!

weźmy prostą Konwolutalną sieć neuronową,

pójdziemy warstwowo, aby uzyskać głęboki wgląd w ten CNN.,

Po pierwsze, jest kilka rzeczy do nauczenia się z warstwy 1, która jest striding i padding, zobaczymy każdy z nich w skrócie z przykładami

Załóżmy, że w matrycy wejściowej 5×5 i filtrze matrycy 3×3, dla tych, którzy nie wiedzą, co filtr jest zestaw wag w matrycy zastosowanej na obrazie lub matrycy, aby uzyskać wymagane funkcje, proszę szukać na splot, jeśli jest to twój pierwszy raz!

Uwaga: zawsze bierzemy sumę lub średnią wszystkich wartości podczas wykonywania splotu.,

filtr może mieć dowolną głębokość, jeśli filtr ma głębokość d, może przejść do głębokości warstw d i splotu i.,”f4a6da248a”>

tutaj wejście ma rozmiar 5×5 Po zastosowaniu jądra 3×3 lub filtrów otrzymasz mapę funkcji wyjściowej 3×3, więc spróbujmy sformułować to

tak więc wysokość wyjściowa jest sformułowana i taka sama z szerokością o/p również…

padding

podczas stosowania splotów nie uzyskamy wymiarów wyjściowych takich samych jak wejściowych stracimy dane ponad granicami, więc dodamy obramowanie zer i ponownie obliczymy splot obejmujący wszystkie wartości wejściowe.,R szerokość również

Striding

czasami nie chcemy przechwytywać wszystkich dostępnych danych lub informacji, więc pomijamy niektóre sąsiednie komórki, wizualizujemy Je,

tutaj matryca wejściowa lub obraz ma wymiary 5×5 z filtrem 3×3 i krokiem 2, więc za każdym razem pomijamy dwie kolumny i zawiłe, sformułujmy to

jeśli wymiary są w float, możesz użyć ceil() na wyjściu i.,e (next close integer)

tutaj H odnosi się do wysokości, więc wysokość wyjściowa jest sformułowana i taka sama jest również z szerokością o/p, a tutaj 2 jest wartością kroku, więc możesz zrobić to jako s we wzorach.

Pooling

w Ogólnych Warunkach pooling odnosi się do niewielkiej części, więc tutaj bierzemy niewielką część danych wejściowych i staramy się wziąć średnią wartość określaną jako średnia pooling lub wziąć maksymalną wartość określaną jako max pooling, więc robiąc pooling na obrazie nie bierzemy wszystkich wartości, bierzemy wartość podsumowaną nad wszystkimi wartościami obecnymi !!!,

tutaj jest to przykład maksymalnego łączenia, więc tutaj biorąc krok po kroku dwa bierzemy maksymalną wartość obecną w macierzy

funkcja aktywacji

funkcja aktywacji jest węzłem umieszczanym na końcu lub pomiędzy sieciami neuronowymi. Pomagają zdecydować, czy neuron odpali czy nie., Mamy różne rodzaje funkcji aktywacji, tak jak na rysunku powyżej, ale w tym poście, skupiam się na Prostowanej jednostce liniowej (ReLU)

nie upuść szczęk, to nie jest to, że Complex ta funkcja po prostu zwraca 0 jeśli twoja wartość jest ujemna, w przeciwnym razie zwraca tę samą wartość, którą podałeś, nic, ale eliminuje ujemne wyjścia i utrzymuje wartości od 0 do +nieskończoności

teraz, gdy nauczyliśmy się wszystkich niezbędnych podstaw, zbadajmy podstawową sieć neuronową o nazwie lenet.,

LeNet-5

przed uruchomieniem zobaczymy jakie są dotychczas zaprojektowane architektury.,ures

Jakie są wejścia i wyjścia (warstwa 0 i warstwa N) :

tutaj przewidujemy cyfry na podstawie podanego obrazu wejściowego, zauważ, że tutaj obraz ma wymiary wysokość = 32 piksele, szerokość = 32 piksele i głębokość 1, więc możemy założyć, że jest to obraz w skali szarości lub czarno-biały, pamiętając, że wyjście jest SoftMax wszystkich 10 wartości, tutaj SoftMax daje Prawdopodobieństwo lub współczynniki dla wszystkich 10 cyfr, możemy przyjąć liczbę jako wyjście z największym prawdopodobieństwem lub współczynnikiem.,ef5″>

tutaj bierzemy wejście i convoluting z filtrami o rozmiarze 5 x 5 produkując w ten sposób Wyjście o rozmiarze 28 x 28 sprawdź powyższy wzór, aby obliczyć wymiary wyjściowe, chodzi o to, że wzięliśmy 6 takich filtrów i dlatego głębokość conv1 wynosi 6, stąd jego wymiary były, 28 x 28 x 6 teraz przekazać to do warstwy puli

Pooling 1 (Warstwa 2) :

tutaj bierzemy 28 x 28 x 6 jako wejście i stosujemy średnie łączenie matrycy 2×2 i kroku 2 i.,e unosząc matrycę 2 x 2 na wejściu i biorąc średnią wszystkich tych czterech pikseli i skacząc z pominięciem 2 kolumn za każdym razem, dając 14 x 14 x 6 jako wyjście obliczamy pooling dla każdej warstwy, więc tutaj głębokość wyjściowa wynosi 6

tutaj bierzemy 14 x 14 x 6 czyli poprzedni O/P i convoluting z filtrem o rozmiarze 5 x5, z krokiem 1 i.,e (bez pominięcia), a przy zerowych paddingach otrzymujemy wyjście 10 x 10, Teraz tutaj bierzemy 16 takich filtrów głębokości 6 i convoluting uzyskując w ten sposób wyjście 10 x 10 x 16

Pooling 2 (warstwa 4):

tutaj bierzemy wyjście poprzedniej warstwy i wykonujemy średnie pooling z krokiem 2 i.,yer (N-1) :

w końcu spłaszczamy wszystkie 5 x 5 x 16 do pojedynczej warstwy o rozmiarze 400 wartości i wprowadzamy je do sieci neuronowej

div>

te neurony o/p finalizują przewidywaną liczbę przez softmaxing .,

jak właściwie działa Konwolucyjna sieć neuronowa?,

działa poprzez podział wagi i nieliczne połączenia,

więc tutaj, jak widać splot ma pewne wagi te wagi są wspólne dla wszystkich neuronów wejściowych, nie każde wejście ma oddzielną wagę zwaną dzieleniem wagi i nie wszystkie neurony wejściowe są podłączone do neuronu wyjściowego a ' o tylko niektóre, które są zawiłe, są odpalane, znane jako nieliczna łączność, CNN nie różni się od sieci neuronowych feed-forward te dwie właściwości czynią je wyjątkowymi !!!,

punkty do obejrzenia

1. Po każdym splocie wyjście jest wysyłane do funkcji aktywacyjnej w celu uzyskania lepszych cech i utrzymania pozytywności np.: ReLu

2. Słaba łączność i podział wagi są głównym powodem działania konwolucyjnej sieci neuronowej

3. Koncepcja wyboru wielu filtrów pomiędzy warstwami i wyściółką oraz wymiarami kroków i filtrów jest podejmowana podczas wykonywania wielu eksperymentów, nie martw się o to, skup się na budowaniu fundamentów, pewnego dnia zrobisz te eksperymenty i zbudujesz bardziej produktywny!!!,

Możesz również przeczytać ten artykuł w naszej aplikacji mobilnej


Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *