Charakterystyka stosowania modeli neuropodobnych

Wiedząc już, czym są sieci neuropodobne zajmijmy się obszarem ich zastosowań. Zgodziliśmy się z tezą, że istota używania sieci neuropodobnych polega na stosowaniu neuropodobnych modeli rozważanych problemów, warto więc teraz zwrócić uwagę na specyficzne cechy modeli neuropodobnych, odróżniające te modele od innych technik modelowania. W tradycyjnym podejściu do modelowania matematycznego różnych złożonych systemów (np. w modelowaniu wykorzystującym podejście statystyczne) są stosowane różne algorytmy określające taką konfigurację parametrów modelu, która zapewnia osiągnięcie minimum globalnego przez funkcję błędu. Oznacza to, że stworzony (np. z pomocą metody regresji) model matematyczny (najczęściej liniowy) jest najlepszym możliwym odwzorowaniem posiadanego zbioru danych, uzyskanym z pomocą modelu założonego typu. Czy jest więc celowe budowanie modeli neuropodobnych, o których z góry wiadomo, że na skutek wrażliwości metod ich uczenia na minima lokalne funkcji błędu (co będzie jeszcze dokładniej przedyskutowane) mogą modelować rozważany proces lub badane zjawisko w sposób suboptymalny? Odpowiedź brzmi — tak, ponieważ typowe metody modelowania matematycznego dostarczają rozwiązań najlepszych, ale tylko w a priori określonej (arbitralnie!) klasie modeli. Model regresji liniowej jest modelem najlepszym — ale najlepszym wyłącznie w klasie modeli liniowych. Nie da się zbudować modelu liniowego, który lepiej pasowałby do posiadanych danych niż model uzyskany za pomocą metod regresji — jednak nie jest wykluczone, że istnieje model nieliniowy, który będzie opisywał te same dane nieporównanie lepiej! Problem liniowości lub nieliniowości modelu wydaje się na pierwszy rzut oka problemem wyłącznie matematycznym, jednakże jest to kwestia o dużym znaczeniu praktycznym — prawie wszystkie złożone systemy, których modele chcemy budować, są w rzeczywistości w mniejszym albo większym stopniu nieliniowe. Decydujemy się jednak często na opisywanie ich przy pomocy formuł (modeli) liniowych, ponieważ zarówno statystyczne wyznaczenie modelu liniowego (opisane wyżej), jak i jego wykorzystywanie jest szczególnie łatwe, a przez to szczególnie wygodne. Czasem jednak niedokładność wnoszona przez model liniowy, nawet taki, którego parametry zostały wyznaczone optymalnie, jest niedopuszczalnie duża. Wówczas musimy próbować stworzyć dla modelowanego obiektu lub dla rozważanego procesu model nieliniowy i tu się zaczynają problemy.

wybór modelu Pojęcie "model liniowy" jest jednoznaczne; dla danego zbioru danych istnieje tylko jeden optymalny model liniowy i dlatego zadanie wyznaczenia jego parametrów (poprzez minimalizację błędu) jest zadaniem dobrze określonym. Stąd m.in. wynika, że zadanie to można zawsze łatwo rozwiązać. Natomiast pojęcie modelu nieliniowego jest wysoce wieloznaczne. "Nieliniowy" to w istocie oznacza "każdy, który nie jest liniowy" — a takich modeli jest nieskończenie dużo. W związku z tym znalezienie modelu nieliniowego oznacza w istocie wykonanie dwóch czynności: wyboru kształtu modelu (lub jego ogólnego wzoru matematycznego) oraz doboru takich parametrów tego modelu, żeby odwzorowywał on posiadane dane w optymalny sposób. Druga część zadania daje się łatwo zautomatyzować, tzn. można zastosować odpowiednie metody (np. statystyczne — technikę regresji nieliniowej) do wyznaczenia optymalnych parametrów modelu nieliniowego. Jednak dotyczy to zawsze modelu o uprzednio wybranym kształcie. Zatem przed uruchomieniem wygodnego i szybkiego procesu doboru parametrów modelu użytkownik musi zgadnąć poprawny kształt tworzących go równań, co zwykle nie jest łatwe. Przeciwnie, we wszystkich "niebanalnych" przypadkach okazuje się, że najtrudniejszą częścią zadania jest dokonanie wyboru struktury modelu (czyli wymyślenie kształtu formuły matematycznej, która będzie mogła pełnić rolę modelu). Nawet przy stosunkowo dobrej znajomości określonego zjawiska (lub przy dokładnym rozumieniu określonego procesu) zwykle trzeba się bardzo natrudzić, zanim znajdzie się ten najbardziej stosowny model — nie ma żadnych ułatwień ani żadnych ogólnych reguł, twórca modelu musi po prostu, powtórzmy to raz jeszcze, odgadnąć jego kształt. Jeśli odgadnie dobrze uzyska dobre działanie modelu, a jeśli odgadnie źle, to nie pomoże żadna, nawet najbardziej wyrafinowana optymalizacja parametrów modelu — jego działanie będzie stale niezadowalające. Sieci neuropodobne wnoszą do procesu modelowania nową jakość: sieć w trakcie procesu uczenia może całkiem sama znaleźć nieliniowy model rozważanego systemu, przy czym twórca sieci nie musi jej podawać żadnych założeń dotyczących kształtu modelu. Stosowanie modeli opartych na sieciach neuropodobnych, a zwłaszcza stosowanie modeli opartych na tej technice do opisu zjawisk i procesów silnie nieliniowych, zwiększa zatem istotnie możliwości ich modelowania.

Jednak nie należy sądzić, że sieci neuropodobne mogą być traktowanej jako panaceum na wszystkie problemy. Przeciwnie, biorąc pod uwagę opisane dalej fakty dotyczące procesu uczenia sieci przyznać trzeba, że ceną płaconą za tę wygodę jest brak pewności, że w ogóle uda się zbudować jakiś sensowny model. Omówimy to nieco dokładniej, bo jest to ważna okoliczność, mająca często zasadniczy wpływ na ocenę przydatności (lub nieprzydatności) sieci neuropodobnych do określonych zadań.

Teraz do 20% taniej w Księgarni PWN

Podstawy ekonomii
Podstawy ekonomiicena juz od 47,90zamów
Podstawy fizyki. T. 1-5
Podstawy fizyki. T. 1-5cena juz od 219,60zamów
Półwiecze
Półwieczecena juz od 47,90zamów
Copyright © 1997-2024 Wydawnictwo Naukowe PWN SA
infolinia: 0 801 33 33 88