Sieci nieliniowe

Opisana wcześniej prawidłowość wskazuje, że zasadniczą cechą sieci nieliniowych jest ich (potencjalnie nieograniczona) wielowarstwowość. Z tego powodu sieci te często oznaczane są symbolem MLP (Multi-Layer Perceptron). Przyjrzyjmy się ich działaniu ze szczególnym uwzględnieniem wzmiankowanego efektu wielowarstwowości. Każdy neuron w nieliniowej sieci wprowadza do struktury modelu element, który może być określony ze względu na kształt odpowiedniego wykresu jako "urwisko sigmoidalne". Element taki może być utożsamiany (w zadaniach związanych z rozpoznawaniem) z liniową funkcją dyskryminującą. Punkty położone po jednej stronie urwiska zostają zaklasyfikowane jako należące do jednej klasy, a punkty położone po drugiej stronie jako nie należące do tej klasy. Na podstawie powyższych uwag można sformułować następujące wnioski:

W praktyce większość problemów wymaga użycia najwyżej pojedynczej warstwy ukrytej, a tylko w pewnych bardzo szczególnych przypadkach należy zastosować sieć posiadającą dwie warstwy ukryte. Większość specjalistów sądzi, że potrzeba zastosowania trzech warstw ukrytych nie pojawia się praktycznie nigdy, a ci, którzy stosują sieci zawierające trzy lub więcej warstw ukrytych postępują bardzo nieroztropnie — zwłaszcza, gdy uwzględni się złożoność procesu uczenia zdecydowanie rosnącą z każdą warstwą sieci.

Copyright © 1997-2024 Wydawnictwo Naukowe PWN SA
infolinia: 0 801 33 33 88