Uczenie sieci jako alternatywa poszukiwania algorytmu rozwiązania problemu

Jak wspomniano sieć neuropodobna samodzielnie nabywa umiejętności rozwiązywania dowolnych zadań. Odbywa się to w trakcie procesu uczenia, czyli pokazywania jej przykładów zadań poprawnie rozwiązanych i jest bardzo wygodne, ponieważ zwykle pozwala zbudować potrzebny model w miarę prosto i bez kłopotu. Co więcej, dzięki temu sposobowi samodzielnego nabywania wiedzy przez sieci można je obarczać także takimi zadaniami, dla których twórca sieci nie zna poprawnej metody ich rozwiązywania. Typowym przykładem są tu zadania klasyfikacji i rozpoznawania. Zadania te z pomocą naszych zmysłów realizujemy z łatwością dla dowolnych konkretnych obiektów (np. obrazów), natomiast skonfrontowani z koniecznością dokładnego określenia ciągu przesłanek i wniosków, prowadzących do finalnej (zwykle poprawnej!) klasyfikacji — uświadamiamy sobie, że w istocie nie potrafimy takiego algorytmu podać, gdyż odpowiednie procesy analizy danych (np. obrazów) toczyły się w naszym mózgu poniżej poziomu świadomości. Podobna możliwość skutecznego działania w sprawach szczegółowych, pomimo braku możliwości podania ogólnej reguły postępowania, pojawia się w związku z innymi zadaniami. Odwołajmy się do "klasycznego" przykładu zadań związanych z prognozowaniem. Często jesteśmy przekonani, że przeszłe wydarzenia determinują (w jakimś stopniu) przyszłość — jednak nie mamy jawnego modelu tej zależności, gdyż brakuje nam danych (nawet w formie roboczych hipotez) pozwalających stwierdzić, jakie zależności przyczynowe wchodzą tu w grę. Zastosowanie sieci neuronowych z ich niezwykłą zdolnością naśladowania poznanych wcześniej na przykładach (w trakcie procesu uczenia) współzależności sygnałów wejściowych (reprezentujących przeszłe wydarzenia) oraz sygnałów wyjściowych (reprezentujących prognozę przyszłości) może stanowić w takim przypadku bardzo ciekawą propozycję. Istotnie, w oparciu o proces uczenia połączony z uogólnianiem zdobytej wiedzy możemy próbować nauczyć sieć procesu prognozowania, co powinno się udać, jeśli tylko rozważany proces uzależnia przyszłe wartości od przeszłych zdarzeń i jeśli dysponujemy dostatecznie dużą liczbą przykładów pochodzących z wcześniejszych obserwacji, dla których znane są zarówno zespoły przyczyn, jak i obserwacje ich skutków. Jeśli w rozważanym przypadku zachodzi związek przyczynowy między przyszłością a przeszłością, to sieć neuronowa zazwyczaj go wykryje, a to pozwoli na używanie modelu neuronowego jako podstawy do procesu prognozowania.

stochastyczność uczenia sieci Za wygodę braku konieczności myślenia przy wykorzystywaniu neuropodobnych modeli przychodzi jednak zapłacić dosyć wysoką cenę, gdyż proces nabywania wiedzy przez sieć neuronową jest zdecydowanie procesem stochastycznym. Dalszy opis niektórych (spośród bardzo wielu znanych) metod uczenia sieci pozwoli poznać przyczyny tego indeterminizmu, ważny jest jednak głównie skutek: wątpliwość, z jaką stale mamy do czynienia w przypadku używania sieci: nigdy tak naprawdę nie wiemy, czy w trakcie uczenia sieci poziom błędu osiągnął swój poziom minimalny, czy nie. Oznacza to, że przy niewłaściwie prowadzonym uczeniu sieci uzyskany model może być ostatecznie bardzo odległy od modelu optymalnego i co gorsza wcale nie będziemy o tym poinformowani! Użytkownik sieci nigdy tak naprawdę nie wie, jak bardzo uzyskany przez niego model "odstaje" od modelu optymalnego.

optymalny model neuronowy W celu konkretyzacji dalszych rozważań ustalmy, że przez model optymalny będziemy (tutaj i potem dalej) rozumieć model, jaki mógłby być uzyskany w tych samych warunkach, gdyby użytkownik wiedział, jaki jest najodpowiedniejszy kształt nieliniowej formuły poszukiwanego modelu, a potem stosowną procedurą optymalizacyjną (np. regresyjną) dobrał najlepsze wartości odpowiednich parametrów na podstawie wszystkich posiadanych danych. Dążąc do stworzenia neuronowego modelu optymalnego musimy pokonać dwie bariery: znaleźć optymalną strukturę sieci i maksymalnie skutecznie przeprowadzić proces uczenia. Te dwa zadania są ze sobą związane, gdyż dla każdej struktury sieci trzeba dobrać algorytm uczenia pozwalający na maksymalne wykorzystanie atutów tej wybranej struktury. Przedstawimy przegląd niektórych możliwości, jakie są obecnie dostępne w zakresie doboru struktury sieci i znajdowania dla niej najskuteczniejszej metody uczenia. Należy podkreślić, że oba zasygnalizowane problemy nie będą przedstawione w sposób wyczerpujący. Przeciwnie — dokonano tu pewnego wyboru, prezentując najbardziej użyteczne (jak się wydaje) struktury sieci i najbardziej popularne (na skutek ich sprawdzonej dobrej jakości) metody uczenia. Warto sięgnąć do książek opisujących szczegółowo technikę sieci neuropodobnych.

Copyright © 1997-2024 Wydawnictwo Naukowe PWN SA
infolinia: 0 801 33 33 88