Badanie wartości bodźców jako przynęty metodą wyuczania cz. III

Przed sprawdzeniem tej hipotezy na rzeczywistych danych sprowadźmy nasze rozumowanie do równania. Niech litera U oznacza ułamek, o jaki zmniejsza się w jednej próbie odległość, którą jakakolwiek prosta krzywa uczenia się musi jeszcze pokonać, aby osiągnąć poziom stabilizacji wprawy. Mamy więc:

Wzór ten jest równaniem czystej funkcji uczenia się, a zarazem jest on równaniem teoretycznym dla prostej krzywej uczenia się, jeżeli uznamy wynik wyjściowy za zero, a wynik końcowy za 1.

Oznaczmy w jakiejkolwiek konkretnej krzywej uczenia się, której zgodność z tym równaniem chcemy sprawdzić, wynik wyjściowy (kiedy n=0) przez A, a poziom stabilizacji wprawy przez Z, tak że całkowity zysk od startu do końca nauki będzie wyrażało Z-A. Niech y oznacza wynik w n-tej próbie, tak że pozostała odległość do poziomu stabilizacji wprawy będzie Z-y. Wówczas równanie przybierze postać:

Z.-y = (1-U)n(Z-A) (2) albo postać logarytmiczną: log (Z-y) = n log (1-U) + lop (Z-A). Z, poziom stabilizacji wprawy, możemy określić na podstawie krzywej. Jako wyniku wyjściowego A nie musimy koniecznie przyjmować faktycznego wyniku pierwszej próby, który jest często wielkością wątpliwą. A możemy ustalić razem z wyrażeniem 1-V tak, żeby uzyskać linię prostą najlepiej pasującą do naszych danych, jak to zrobiono na rysunku 2-6, str. 50, t. I, Nanieśmy dane te na papier logarytmiczny, oznaczając wartości n na osi arytmetycznej, a odpowiadające im wartości Z-y jako logarytmiczne rządne. Do tych punktów dostosujmy najlepiej, jak to tylko możliwe, linią prostą. Jeżeli zgodność tej prostej z da- nymi jest zadowalająca, oznacza to, że nasze dane spełniają podane wyżej równanie i wtedy wartości Z-A i 1-U można znaleźć z odległości na osi Y i z nachylenia linii prostej.

Czy prędkości uczenia się można użyć jako miary wartości przynęty?

Trzeba sobie zdawać sprawę, że poziom stabilizacji wprawy w tym równaniu teoretycznym jest asymptotą, czyli granicą matematyczną, do której krzywa dąży, ale której nigdy nie osiąga. Co za tym idzie, na podstawie naszego równania nie można dać odpowiedzi na takie pytania. „Jaka jest wartość U, jeżeli poziom stabilizacji wprawy został osiągnięty w 20 próbach?”. Można jednak za jego pomocą rozwiązać takie zagadnienie: „Jaka jest wartość U, jeżeli połowa (albo 0,75, albo 0,90) odległości od A do Z została pokonana w pewnej liczbie prób?” Podstawiając w równaniu odpowiednie liczby otrzymujemy następujące wyniki: jeśli połowa odległości od A do Z zostaje pokonana w 1 próbie U = 0,500: w 5 próbach U = 0,130: w 2 próbach U = 0,293: w 10 próbach U = 0,067: w 4 próbach U = 0,159: w 15 próbach U = 0,047: w 20 próbach U = 0,034.

Pytaniem, od którego wyszła cała ta dyskusja, jest, czy prędkości uczenia się można użyć jako miary wartości przynęty. Do sprawdzenia pod tym względem krzywych i równań teoretycznych potrzebne nam są dane rzeczywiste. Otóż w dwu niezależnych od siebie badaniach, Cres- piego (1942, 1944) i Zeamana (1949) okazało się, że o ile nasze Z, poziom stabilizacji wprawy, zależy od wielkości przynęty (im silniejsza przynęta, tym lepiej zwierzęta wykonują dobrze wyuczoną czynność), o tyle prędkość uczenia się U jest taka sama przy przynętach różnej wielkości. W takich eksperymentach wszystkie inne czynniki motywacyjne, w szczególności popęd (D) i hamowanie (I), muszą być stałe, tak żeby czynnik przynęty mógł się ujawnić w sposób czysty. Stosownie do tego badacze ci przeprowadzali na szczurach tylko po jednej próbie dziennie, tak że każda próba następowała po 22-23 godzinach pozbawienia pokarmu. Długie przerwy pomiędzy próbami powinny sprowadzić do minimum wpływ hamowania. Crespi używał 6-metrowej ‚bieżni i jako miarę przyjmował szybkość biegu, podczas gdy Zeaman używał 1-metrowej bieżni i jako miarą posługiwał się okresem utajonym reakcji biegania, czyli czasem startu. Crespi stwierdził, że prędkość polepszania się wyników, oceniana na podstawie zbliżania się do poziomu stabilizacji wprawy, była w przybliżeniu taka sama przy przynętach o różnej wielkości. Trzy krzywe na rysunku 22-7 dochodzą do omawianego poziomu po mniej więcej tej samej liczbie prób. Zeaman otrzymał dla wszystkich krzywych ułamek U równy prawie 0,30 (rys. 22-8), to znaczy, że każda próba zmniejszała o 30 procent odległość pozostałą jeszcze do przebycia, by osiągnąć granicę, jednakowo przy każdej stosowanej wielkości przynęty.

Czy prędkości uczenia się można użyć jako miary wartości przynęty? cz. II

Takie same wyniki uzyskał w innych zadaniach na uczenie się Reynolds (1949, 1950). W eksperymentalnym badaniu nad odróżnianiem barwy czarnej od białej (bodźcem dodatnim był kolor biały) szczury osią- gały kryterium prawie bezbłędnego odróżniania przeciętnie po stale takiej samej liczbie prób, niezależnie od tego, czy przynętę stanowiła bardzo mała czy o wiele większa kulka pokarmu. A zatem prędkość uczenia się była taka sama dla obu przynęt. Ale przy przynęcie większej szczury uzyskiwały lepsze wyniki, tzn. prędzej dokonywały wyboru. W prostym labiryncie T (1950) szczury otrzymujące większe kulki pokarmu biegały szybciej i robiły mniej błędów niż szczury otrzymujące mniejszą przynętę, ale poziom stabilizacji wprawy osiągały po mniej więcej takiej samej liczbie prób.

Co stanowi przynętę w doświadczeniach z odruchami warunkowymi typu pawłowowskiego? Nie może nią być nic innego, jak tylko bodziec bezwarunkowy. Dmuchnięcie na rogówkę oka stanowi przynętę (negatywną) do wykonania warunkowej reakcji mrugania, która antycypacyjnie przymyka powiekę (str. 42): a im silniejszy jest podmuch, tym większa przynęta do chronienia oka przez mrugnięcie antycypujące bodziec bezwarunkowy. Passey (1948) przeprowadził badania nad tym od- ruchem na czterech różnych grupach studentów, stosując w każdej grupie dmuchnięcia o innej intensywności. Okazało się, że kiedy stosowano silniejsze dmuchnięcia, to warunkowa reakcja mrugania od samego początku była silniejsza i częściej występowała, ale poziom stabilizacji wprawy pod oboma tymi względami został osiągnięty we wszystkich grupach po takiej samej liczbie prób (około 35). A więc ostateczny poziom wprawy zmieniał się wraz ze zmianą wielkości przynęty, nato-. miast prędkość uczenia się była od wielkości przynęty niezależna. Z analogicznymi wynikami spotkaliśmy się także w eksperymentach z bieżnią, labiryntem T i przy badaniu odróżniania.

Przynęty mogą się różnić od siebie nie tylko wielkością, ale i jakością

Jak wpływa zmiana wielkości przynęty już po osiągnięciu poziomu stabilizacji wprawy? Sprawdzali to zarówno Crespi, jak i Zeaman. Kiedy zwiększono wielkość przynęty, wyniki bardzo prędko zaczęły się polepszać, aż ustaliły się na nowym, wyższym poziomie: odwrotny efekt uzyskano, przy zmniejszeniu ilości przynęty {rys. 22-9). Te zmiany wyników na pewno nie są skutkiem jakiegoś nagłego wzrostu czy obniżenia samej sprawności. Odzwierciedlają one zmiany w motywacji: wprawdzie popęd, w ścisłym tego słowa znaczeniu, nie uległ zmianie, ale zmienił się drugi czynnik motywacyjny, a mianowicie przynęta.

Przynęty mogą się różnić od siebie nie tylko wielkością, ale i jakością. Pokarmy, na przykład, różnią się pod względem pewnej cechy, wyróżnionej przez Younga (1948), którą można by w odróżnieniu od smaku nazwać apetycznością (palatability) b Stwierdziwszy, jak to już powiedziano (str. 207), że szczury o wiele bardziej wolą cukier niż kazeinę, badacz ten użył swego aparatu jako bieżni z jedną miseczką pokarmową, zawierającą dla jednej grupy cukier, a dla drugiej – kazeinę. Szczury, które otrzymywały cukier, biegały do pobudki o wiele szybciej niż szczury z grupy, która dostawała kazeinę. Kiedy potem obu grupom zamieniono przynęty, grupa „cukier-kazeina” zaczęła biegać wolniej, podczas gdy grupa „kazeina-cukier” zwiększyła szybkość. Wynik ten pozostaje w pełnej zgodności z wynikami otrzymanymi przy zmianach wielkości przynęty.

W jednym z eksperymentów nad uczeniem się utajonym (str. 169) po tym samym labiryncie biegały dwie grupy szczurów: jedna do pokarmu, a druga do pustej skrzynki docelowej. O wiele lepsze wyniki osiągały szczury, które miały przynętę pokarmową. Ale kiedy obu grupom przynęty wzajemnie wymieniono, okazało się, że jedna grupa wyuczyła się labiryntu dokładnie tak samo prędko jak i druga. Różnica przynęt wpłynęła na aktualnie uzyskiwane wyniki, ale nie na prędkość uczenia się.

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>