Uczenie maszynowe #3 Ten o bias ścięciu

callmejoe (47)in #polish • 6 years ago (edited)

Czym jest bias przesunięcie i po co nam ono? Skąd się wzięło? Dlaczego warto używać? Czy ktoś tu mówił o funkcji liniowej?

źródło grafiki

Ten artykuł będzie nieco krótszy od dwóch pozostałych - będąc jednak z natury optymistą i szukając jasnych stron życia - mogę stwierdzić, że pozwoli to zaoszczędzić oczy do czytania, i palec do scrollowania :-)

Pewnie wszyscy pamiętamy jedną z pierwszych funkcji matematycznych jakie przyszło nam poznać w trakcie edukacji szkolnej. Mowa oczywiście o funkcji liniowej. Przypomnijmy sobie jak można ją zapisać.

`y = ax + b`

gdzie:

a - to współczynnik kierunkowy, który decyduje o kącie nachylenia funkcji

b - wyraz wolny określający przecięcie funkcji z osią Y (bias)

x - argument podawany funkcji (wejście funkcji)

y - wartość funkcji (jej wynik, wyjście)

Graficzna reprezentacja funkcji liniowej; źródło grafiki

Jaki to ma związek z klasyfikacją z użyciem neuronów? Spójrzmy jeszcze raz na to co dzieje się w bloku sumacyjnym pojedynczego neuronu:

`SUMA_SYGNAŁÓW = Σ_{i = 0} x_iw_i = Σ_{i = 0} w_ix_i`

Zamiana kolejności mnożenia w_i z x_i nie zmienia wyniku funkcji (bo oczywiście mnożenie jest przemienne), teraz jednak jeszcze łatwiej można zauważyć, że wynik podawany przez blok sumacyjny składa się tak naprawdę ze złożeń funkcji liniowej. Widzimy, że w_ix_i już w samym zapisie wygląda podobnie jak ax, i w gruncie rzeczy jest tym samym - czyli wagę w naszej synapsy traktujemy jako współczynnik liniowy a. Ale chwila, a gdzie nasz wyraz wolny b? No w pewnym sensie on tu jest tylko trzeba go “wyłuskać” (jak fasolę).

If you know what I mean; źródło grafiki

Nasza suma sygnałów sama w sobie jest funkcją liniową, i składa się z innych funkcji liniowych (tzw. złożenie funkcji, np. biorąc dwie garście śniegu i “sklejając” je ze sobą dalej otrzymalibyśmy śnieżkę tylko większą “o innych parametrach”), gdzie wyraz w₀x₀, możemy potraktować jako b w momencie gdyby wartość x₀ na stałe wynosiła 1, a wtedy dowolna wartość w₀ określiłaby przesunięcie b. Innymi słowy wyraz w₀x₀ = w₀ * 1 = w₀ = b, co aktualizując ogólny przypadek bloku sumacyjnego z #1, możemy zapisać jako:

`SUMA_SYGNAŁÓW = b + Σ_{i = 1} x_iw_i`

No dobra, “wyłuskaliśmy” ten współczynnik b, ale co nam z niego? Jak przed chwilą pisaliśmy, pozwala on na ustalenie punktu przecięcia funkcji z osią Y, czyli na właśnie przesunięcie całej funkcji w jedną lub drugą stronę w układzie współrzędnych. Co daje nam możliwość przesuwania funkcji w kontekście sieci neuronowych? Polepsza klasyfikację, a raczej należałoby powiedzieć że może polepszyć klasyfikację. W dalszych częściach będziemy zakładać, że wyraz wolny b istnieje i może przyjąć pewną wartość, która przesunie naszą funkcję sumy sygnałów w układzie współrzędnych, albo liczbą 0 - czyli wtedy wyłączymy jakiekolwiek przesunięcie.

Graficzna reprezentacja działania bias'u; źródło grafiki: Mistrz Paint'a, czyli ja :-)

Bias przesunięcie jest również czasem nazywany “obcięciem” (samo "bias" oznacza "ścięcie ukośne"), bo faktycznie w pewnym luźnym kontekście rozumienia, przesunięcie funkcji sumy sygnałów sprawia że część danych o podobnej wartości do danych “prawdziwych” (ale takich danych których w gruncie rzeczy nie chcielibyśmy klasyfikować jako “prawda”), czyli te najbliżej “granicy” klasyfikacji - zostaną obcięte - będąc od teraz klasyfikowane jako “fałsz”. Gdybyśmy nie dodali bias’u, sprawa granicznych wartości dla neuronu mogłaby być niejednoznaczna. Dlatego chcemy je odsunąć i oglądać tam gdzie powinno być ich miejsce - czyli za kratami :-) Myślę, że w najbliższym czasie pokażę to na mobilnym przykładzie, który każdy będzie mógł odpalić bezpośrednio w swojej przeglądarce i przetestować.

Niektóre dane graniczne umieścimy za kratami; źródło grafiki

Dziękuję za uwagę!

Grafika

Potwierdzam że użyłem Zaawansowanego szukania grafik Google z zaznaczoną opcją prawa użytkowania treści: "Do swobodnego użytku, udostępniania lub modyfikowania, również komercyjnego"

Bibliografia

R. Tadeusiewicz "Sieci neuronowe" Akademicka Oficyna Wydaw. RM, Warszawa 1993. Seria: Problemy Współczesnej Nauki i Techniki. Informatyka.

#pl-artykuly #pl-technologia #pl-nauka #pl-siecineuronowe

6 years ago in #polish by callmejoe (47)

$2.79

Sort:

Trending

[-]

jacekw (64) 6 years ago (edited)

Na samym początku swojej przygody z sieciami neuronowymi nie doczytałem dokładnie po co ten bias i potem jak postanowiłem sam zaimplementować jakąś sieć to go pominąłem, bo mi utrudniał obliczenia. Dopiero jak się zorientowałem, że ta literka b ma analogiczną funkcję jak b przy równaniu liniowym, to się zreflektowałem, że bez biasu to może mi ta sieć nie działać poprawnie :D

$0.00

[-]

callmejoe (47) 6 years ago

Miałem dokładnie tak samo :D

$0.00

STEEM 0.19

TRX 0.24

JST 0.037

BTC 99591.56

ETH 3097.25

SBD 3.71

Uczenie maszynowe #3 Ten o bias ścięciu

y = ax + b

SUMA_SYGNAŁÓW = Σi = 0 xiwi = Σi = 0 wixi

SUMA_SYGNAŁÓW = b + Σi = 1 xiwi

Grafika

Bibliografia

Coin Marketplace

`y = ax + b`

`SUMA_SYGNAŁÓW = Σ_{i = 0} x_iw_i = Σ_{i = 0} w_ix_i`

`SUMA_SYGNAŁÓW = b + Σ_{i = 1} x_iw_i`