Monthly Archives Maj 2015

Metoda bodźców pojedynczych przy uczeniu się odróżniania

Zainteresowanie teoriami odróżniania, które uwzględniały porównywanie bodźców, i tymi, które nie brały go pod uwagę, sprawiało, że kilku badaczy spróbowało w swych eksperymentach eksponować dodatnie i ujemne wskaźniki sukcesywnie, tzn. pokazywać na raz tylko jedne drzwiczki, z tym, że pokarm był ukryty wyłącznie za drzwiczkami dodatnimi. ‚

Zobacz

Wpływ podstawowej jednostki pomiarowej

Niestety, wszystkie te rozważania opierają się na założeniu, że do zmierzenia postępów w uczeniu się mamy zawsze skale o równych po- działkach. Tymczasem wybór zadowalającej skali jest jednym z najtrudniejszych problemów w psychologii, jak na to niejednokrotnie już zwracaliśmy uwagę na przestrzeni całej książki. Przyjęcie takiej czy innej jednostki pomiarowej ma zasadnicze znaczenie, bowiem z tego samego zbioru danych można otrzymać bardzo różne krzywe, zależnie od tego, jakich jednostek użyje się na osi rzędnych. Na przykład krzywą nabywania wprawy w pisaniu na maszynie można wykreślić według liczby napisanych słów na minutę, co da w efekcie krzywą esowatą, albo według czasu potrzebnego na napisanie 100 słów, co powinno dać krzywą odwróconą, wykazującą bardzo silne nachylenie na początku. Weźmy na przykład strzelanie z karabinu. Jeżeli cel będzie bardzo mały, to początkujący strzelec prawdopodobnie w ogóle do niego nie trafi w ciągu pierwszych 20 prób. Tym samym jego krzywa uczenia się będzie przez dłuższy czas biegła zupełnie płasko na poziomie zerowym, a następnie – w miarę stopniowego „odnajdywania” przez Strzelca celu – wykaże siłą rzeczy przyspieszenie dodatnie. Natomiast cel bardzo duży może być tak łatwy do trafienia, że strzelec od razu zacznie od stosunkowo dobrego wyniku i szybko zbliży się do maksimum, czyli do 100 procent trafień.

Zobacz

Czy istnieje jakaś typowa krzywa uczenia się? – kontynuacja

Wiele krzywych ma odcinki poziome na długo przed osiągnięciem poziomu ostatecznego. Okresy braku postępów {a nawet lekkiego spadk-u wprawy), nazywają się p 1 a t e a u. Bardzo łatwo mogą one zniechęcić uczącego się, bo może on je mylnie wziąć za ostateczną granicę. Być może ten właśnie praktyczny aspekt był głównym powodem tego, że zjawisko plateau bardzo silnie przyciągało uwagę psychologów w ciągu pierwszych trzech dziesiątków lat tego stulecia (patrz Hunter, 1934, i pierwsze wydanie tej książki). Stopniowo stało się jasne, że nie ma jakiegoś jednego wspólnego wytłumaczenia dla wszystkich przypadków plateau, jako że wiele zależy od specyficznych warunków każdego eksperymentu. Często plateau można uważać za kres wprawy przy jednym sposobie wykonywania zadania: jeżeli badany udoskonali swą metodę wykonywania zadania albo jeżeli eksperymentator zastosuje silniejszą przynętę, od dawnego poziomu stabilizacji wprawy zaczyna się wznosić nowa krzywa uczenia się. Może się też zdarzyć, że w zadaniu tkwi jakiś trudny element, który hamuje postęp i dopiero opanowanie go umożliwia badanemu przejście na wyższy poziom. Radzimy, aby czytelnik sam spróbował znaleźć odpowiednie wytłumaczenie rozmaitych przykładów plateau, z jakimi spotka się jeszcze w dalszych partiach tej pracy.

Zobacz

Popęd i potrzeba

Typowe popędy zwierzęce, takie jak głód i pragnienie, zależą od potrzeb organicznych. Żywy organizm nieustannie zużywa pokarm i wodę, a jednocześnie wytwarza produkty rozpadu, które nagromadzają się stopniowo i których nadmiar może zagrażać zdrowiu osobnika. Potrzeba jest właśnie takim stanem niedostatku lub nadmiaru w organizmie. Pewne potrzeby można zaspokoić za pomocą odpowiedniego zachowania, takiego jak jedzenie i picie. W przypadkach najprostszych popęd stanowi tendencję do wykonywania takich czynności, które zaspokajają potrzebę organiczną. Tak więc potrzeba aktywizuje popęd, a popęd aktywizuje zachowanie. Ale czy jest jakikolwiek sens w takim mnożeniu czynników? Dlaczego nie odrzucić pojęcia popędu i nie powiedzieć po prostu, że zachowanie jest motywowane przez potrzebę? Trudność tkwi w tym, że istnieją pewne potrzeby, które nie prowadzą do żadnych określonych form zachowania i, odwrotnie, istnieją takie formy zachowania, które nie wywodzą się z żadnych znanych aktualnie działających potrzeb.

Zobacz

Tendencje związane z celem

Kiedy zwierzę znalazło już cel i otrzymało nagrodę, pojawiają się nowe tendencje, zależne od tego, gdzie w labiryncie znajduje się punkt docelowy. Gradient celu. Najskuteczniej działa nagroda szybka. Twierdzenie to – zgodne zresztą ze zdrowym rozsądkiem – można poprzeć faktami zaczerpniętymi z rozmaitych dziedzin uczenia się. Jeśli nagroda nie następuje bezpośrednio po dobrze wykonanej czynności, uczenie się przebiega tym wolniej, im zwierzę dłużej musi na nią czekać. W labiryncie najbliższą chwilą otrzymania nagrody (tj. znalezienia pokarmu) jest ostatni punkt wyboru, dlatego też w tym punkcie zwierzę powinno szybciej nauczyć się poprawnego sposobu reagowania niż w punktach wcześniejszych. Można więc przyjąć hipotetyczny gradient celu, mianowicie przewidywać, że – przy takich samych pozostałych warunkach – ślepe uliczki będą eliminowane do końca, tj. poczynając od uliczki położonej najbliżej celu (Hull, 1932). W rzeczywistości jednak w większości labiryntów pozostałe warunki nie są takie same i gradient celu rzadko tylko przejawia się w zupełnie czystej postaci. Maskują go rozmaite „tendencje”, z których pewne już omówiliśmy, a inne omówimy poniżej.

Zobacz

Kryteria popędu – kontynuacja

U szczurów spragnionych obserwowano gromadzenie wody. Kulki były zrobione z waty hygroskopijnej nasyconej wodą. Szczur z pomieszczenia, w którym przechowywano kulki, zabierał jedną, zanosił ją do domu i wysysał trochę wody: następnie biegł do pomieszczenia z kulkami po drugą i tak dalej, aż nagromadził ich o wiele więcej, niż mu aktualnie było potrzeba (Bindra, 1947). Chociaż kulek z drzewa szczur raczej nie gromadzi, będzie jednak gromadził kulki owinięte w folię aluminiową, a jeżeli połowa kulek pokarmu znajdujących się w pomieszczeniu jest owinięta w folię, to niektóre szczury będą gromadziły właśnie te kulki, wyraźnie je przekładając nad zwykłe kulki pokarmu (Licklider i Licklider, 1950). Możliwe, że szczur znosi do domu wszystko, co wygląda dlań atrakcyjnie w danym momencie. W każdym razie popęd gromadzenia jest ściśle związany z popędem „powracania do gniazda” (homing drive).

Zobacz

UCZENIE SIĘ WSKAŹNIKÓW U LUDZI CZ. II

Jeden z nielicznych eksperymentów, za pomocą których zamierzano zbadać proces uczenia się odróżniania u ludzi dorosłych, przeprowadził Prentice (1949). Starał się on wprowadzić badanych w błąd eksponując wskaźniki fałszywe, bardziej rzucające się w oczy niż wskaźniki właściwe. Był to eksperyment typu „dwudrzwiczkowego”, mianowicie badany widział przed sobą dwa okienka w ekranie, jedno oznaczone kwadratem, a drugie kółkiem. Gdy kwadrat miał rozmiary duże, kółko było małe i na odwrót, a gdy kwadrat był biały, kółko miało barwę czarną. Przed badanym znajdowały się dwa klucze do reagowania, po jednym pod każdym okienkiem, jeden klucz był oznaczony kwadratem, a drugi kołem. Instrukcja kazała wybrać kwadrat lub koło i zakomunikować swój wybór naciśnięciem odpowiedniego klucza. Za reakcje poprawne przewidziano „nagrodę”, mianowicie zapalenie się sygnału świetlnego, za niepoprawne „karę” – dźwięk brzęczka. Kierując się jednym ze wskaźników rzucających się najpierw w oczy, czyli kształtem i wielkością figur, badany zareagowałby poprawnie tylko w połowie wszystkich prób, ponieważ kształt i wielkość figur nie miały żadnego znaczenia, a właściwym wskaźnikiem, było tylko położenie białej figury. Rozwiązanie zadania brzmiało: „Naciskać zawsze klucz pod okienkiem z białą figurą”. Było to bardzo proste rozwiązanie, ale całe urządzenie eksperymentu i instrukcja do niego tak dalece wprowadzały w błąd, że w 100 skomasowanych próbach 40 procent studentów uniwersytetu, którzy byli osobami badanymi w tym eksperymencie, nie umiało dać sobie rady z zadaniem. Eksperymentator zbierał zeznania introspekcyjne i chciał stwierdzić, czy w pierwszych lub ostatnich fazach procesu uczenia się badani stawiają sobie jakieś „hipotezy”. Mieli oni po każdej próbie odpowiedzieć na pytanie, dlaczego dokonali takiego właśnie wyboru. Zeznania te wykazały, że w pierwszych próbach występują hipotezy fałszywe, a hipotezy poprawne lub zbliżone do poprawnych pojawiają się często, zanim jeszcze badany zacznie systematycznie kierować się właściwymi wskaźnikami.

Zobacz

Warunkowanie wsteczne

W badaniu tym wyszły na jaw pewne interesujące momenty. Najpierw, dlaczego w wypadkach, w których dźwięk wyprzedzał uderzenie prądem o jedną sekundę lub więcej, warunkowanie dawało tak słabe wyniki? Wyjaśnienia trzeba szukać prawdopodobnie w tym, że cofnięcie ręki ulegało tu woluntarnemu zahamowaniu. Przy tak długim odstępie między bodźcami badany nie mógł się zdecydować na cofnięcie ręki aż do chwili, w której już dostawał uderzenie. Sprawą tą, mianowicie wpływem nastawień na warunkowanie, zajmiemy się jeszcze w dalszym ciągu tego rozdziału.

Zobacz

Metody: „z poprawką”, „bez poprawki” i „bieg po biegu”

Zastanówmy się najpierw nad labiryntem z jednym punktem wyboru, takim jak często ostatnio używany jednoelementowy labirynt T. Oznaczmy punkt startowy, czyli wejście, przez S, a dwie skrzynki pokarmowe – przez Pl i P2, tak jak na rysunku 21-10. Niech pokarm znajduje się tylko w Pj. W tym wypadku bieg prawidłowy będzie reprezentowało SPt. Jeżeli nie pozwalamy na poprawkę, biegiem błędnym będzie tylko SP2: zwierzę wyjmuje się z P2 i umieszcza w klatce aż do następnej próby. Jeżeli dopuszczamy poprawkę, bieg błędny przedstawia SP2Pi, ponieważ zwierzę nie znalazłszy nic w P2, później trafia do Pj i dostaje się do pokarmu. i

Zobacz

Hull i zasada generalizacji bodźca

Używamy tutaj terminu „wzmocnienie”, zgodnie ze zwyczajem przyjętym przez najnowszych przedstawicieli teorii uczenia się, w znaczeniu ograniczonym: nagrody, czy też „redukcji popędu”. Jednakże pierwotnie (por. str. 24, 25) termin ten był używany w szerszym znaczeniu. (Przyp. autorów). skrzynki docelowej w labiryncie T i znajduje tam pokarm. Według teorii Hulla jego zachowanie nie ulega w tej sytuacji dodatniemu wzmocnieniu i tendencja (nawyk) do ponownego wyboru tej drogi nie utrwala się. Zgodnie zaś z teorią Tolmana, szczur uczy się pewnej sekwencji ruchów i zdarzeń, której ostatnim ogniwem jest znalezienie czegoś, co nie nadaje się do jedzenia (w danym momencie). Poznanie ta- takiego stanu rzeczy może doprowadzić raczej do unikania tego miejsca niż do poszukiwania go. Wydaje się, że przewidywania co do zachowania zwierzęcia w określonych warunkach, wysnute na podstawie obu teorii, byłyby jednakowe – przynajmniej dla tak ograniczonej sytuacji, jaką jest prosty labirynt T.

Zobacz

Częściowe wygasanie odruchu przy skomasowanym uczeniu się

Hamowanie wewnętrzne, czyli reaktywne, powinno zachodzić, zgodnie z ogólną definicją tego terminu, nawet wtedy, gdy wzmacniamy OW. Jeśli poszczególne próby przedzielimy dość długimi pauzami, w czasie których hamowanie będzie mogło rozproszyć się, sprawność reagowania powinna się szybko zwiększać, ale przy próbach skomasowanych hamowanie nagromadziłoby się i nie wystąpiłoby polepszenie reagowania. Po odpoczynku mogłaby wystąpić duża poprawa w wyuczonym zachowaniu się, wywołana brakiem hamowania wewnętrznego, całkiem podobnie jak w krzywej uczenia się na str. 9 i przy zjawisku reminiscencji, omówionym na str. 416. Pawłów zauważył (1927, str, 234), że „hamowanie może powstać także wtedy, gdy odruchy warunkowe są wzmacniane”. Inne przykłady podali Hilgard i Marquis (1935) oraz Hilgard i Campbell (1936), którzy przeprowadzili skomasowane doświadczenia ze wzmacnianiem nad warunkowym odruchem mrugania u psów, małp i ludzi. Połowę prób wykonywano w ciągu jednego dnia, a drugą połowę po 24 godzinach. Autorzy stwierdzili, że w pierwszej próbie drugiego dnia OW był silniejszy niż w ostatniej próbie pierwszego dnia. Wynik ten jest zrozumiały, skoro weźmiemy pod uwagę, że pod koniec doświadczenia ze skomasowanymi próbami nagromadzające się stopniowo hamowanie wewnętrzne obniżało siłę OW. Odpoczynek trwający dobę wysarczał aż nadto do rozproszenia się hamowania, tak że OW mógł okazać swoją pełną siłę b

Zobacz

Spontaniczna restytucja

Chyba słusznie większe znaczenie możemy przypisać rezultatom uzyskanym w doświadczeniach ze stosunkowo prostym warunkowaniem, gdyż bieżnie typu alei są skomplikowane przez wprowadzenie zasłon, skrzynek pokarmowych itd. Biorąc nawet pod uwagę wszystkie wspomniane eksperymenty trzeba jedynie stwierdzić, że trzy lub cztery z nich przemawiają wyraźnie za większą skutecznością wygaszania skomasowanego, a tylko jeden – i to wątpliwy – wypadek świadczyłby na korzyść przeciwnego rozwiązania problemu. Wynika stąd, że teoria hamowania umożliwia na ogół trafniejsze przewidywanie niż teoria otamowania.

Zobacz

Wskaźniki kombinowane i izolowane

Wzrokowe wskaźniki muszą z konieczności mieć jakąś wielkość, jakiś kształt, barwę, określone położenie i może jeszcze inne właściwości, które potrafimy modyfikować i eksponować w różnych kombinacjach. Przypuśćmy, że dużymi literami A i B oznaczymy dwie właściwości ipełniące rolę wskaźników dodatnich, np. białą barwę i kształt koła, a małymi literami a oraz b odpowiednie wskaźniki ujemne, barwę czarną i kształt trójkątny. Wówczas AB będzie symbolem dodatniego wskaźnika kombinowanego, tj. białego koła, zaś ab symbolem odpowiedniego wskaźnika ujemnego, czyli czarnego trójkąta. Gdy badany nauczy się już ‚systematycznie wybierać AB, zaś omijać ab, eksponujemy mu do wyboru Ab oraz aB. Co wybierze – czy biały trójkąt, czy czarne koło? Gdyby wskaźniki A i B, które obecnie przeciwstawiamy sobie nawzajem, były równie silnie skojarzone z reakcją dodatnią, badany nie powinien jednego z nich wybierać częściej niż drugiego, zwykle jednak wykazuje on silną skłonność do kierowania się jednym z tych wskaźników, choć jedne osobniki wybierają raczej jeden, a inne drugi z nich.

Zobacz