Filozofia jest sztuką życia. Cyceron

Od podstaw statystyki do modeli ...

Od podstaw statystyki do modeli liniowych (by gtnh), Modele liniowe

[ Pobierz całość w formacie PDF ]
//-->Od podstaw statystyki do modeli liniowychJAK CHCESZ ZDAĆ CAŁY TEN INTERES, TO WEŹ LEPIEJ KUP SOBIE OPRACOWANIE DO RZECZYWISTOŚCI PLUS ŚCIĄGA DOWYCINANIA GRATIS I WTEDY MOŻEMY GADAĆ.~D.MASŁOWSKA1.”Why, Leo, why?”Odpowiedź jest prosta – „For money”. Głównym celem większości doświadczeńjest sprawdzenie wpływu jakiegoś czynnika na jakieś wyniki. Nie wiadomo co, niewiadomo gdzie, ale wiadomo, że chcielibyśmy jak najtaniej. Można oczywiście, dlatakiego doświadczenia jak brakarze i snopki siana z pierwszych ćwiczeń sprawdzićwszystkich brakarzy, przetestować ich przez rok i mieć odpowiednie wyniki,niemalże pozbawione błędu. Zgodnie z intuicją matematyka – jeżeli mamy cośoszacować, to im więcej danych dostaniemy, tym lepiej, bo oszacowanie będziedokładniejsze. Jednak byłoby to wysoce nieefektywne, no i drogie. Osoba zlecającawykonanie badania, która chciałaby dostać w miarę dobre wyniki, jest w staniepoświęcić parę procent pewności, w zamian za kilku(nasto)-krotne obniżenie cenydoświadczenia. Tym jak zaplanować doświadczenie, aby uzyskać pożądane wynikizajmuje się planowanie doświadczeń.Jest to dziedzina dość obszerna i (miejmy nadzieję) nie będzie ściśle związana zprzedmiotem naszego opracowania. Jedyną potrzebną nam na tę chwilęinformacją jest fakt, że od zaplanowania doświadczenia, zależy co będziemy wstanie uzyskać z wyników doświadczenia. Może się zdarzyć tak, że źle wykonanedoświadczenie nie pozwoli nam uzyskać wyników, jakie byśmy oczekiwali ibędziemy zmuszeni próbować innych metod (przykład - nieestymowalnośćefektów brakarzy na pierwszych ćwiczeniach – konieczność liczenia macierzyuogólnionej).Odpowiednio zaplanowane doświadczenie pozwala nam przy stosunkowo małejliczbie obserwacji wnioskować o wpływie pewnego czynnika (lub braku wpływu)na obserwowane wartości. Do tego celu należy skonstruować model. Oczywistymjest, że przedmiotem opracowania będzie dążenie do wytłumaczenia modeliliniowych. Warto jednak zanotować fakt, że istnieją także modele nieliniowe,które mogą być użyteczne w przypadku, gdy nie jesteśmy w stanie użyć modeluliniowego.Konstrukcja modelu liniowego polega na skonstruowaniu takiego równanialiniowego, w którym będziemy mieli z jednej strony obserwowane wyniki (y), a zdrugiej strony liniową zależność jakiś czynników wpływających na te wyniki, którechcemy poddać analizie (zazwyczaj kolejne litery greckie), a także nieodzowny dladoświadczeń czynnik losowy (nazywany też błędem – e).Niebo samo nie spadnie – trzeba je osiągnąć.~A. Mickiewicz2. Model? A na co to komu? Komu to potrzebne?Mając model i pewne obserwacje z dobrze zaplanowanego doświadczenia jesteśmyw stanie uzyskać ciekawe informacje. Jeżeli uda nam się oszacować, na podstawiewyników tych obserwacji, które czynniki rzeczywiście wpływają na wynik i w jakimstopniu - otrzymamy pewnego rodzaju wzór, który pozwoli nam oszacować wynikprzy nowych obserwacjach z ustalonymi wartościami czynników.Przykład:Pewna roślina z rodzaju wolfii posiadała cenny składnik używany przy produkcjileków. Jednak był on przydatny tylko w formie, którą przyjmował w okresiekwitnienia wolfii. Problemem był fakt, że okres ten trwał zaledwie 1 dzień, aotrzymanie ilości składnika potrzebnej do jednej dawki leku wymagał zebrania good 50 kwiatów. Ustalono jednak, że średnica i ilość liści w tydzień po zasadzeniujest zdecydowanie różna. Postanowiono sprawdzić, czy da się na tej podstawieokreślić dzień kwitnięcia wolfii. Dane na temat 500 losowych kwiatów zebrano wtabelę wraz z dokładną datą kwitnięcia danego kwiatu. Na tej podstawie udało sięustalić, że:DK ~ 73,6*IL + 2,27*ŚL, gdzie:DK – dzień kwitnięciaIL – ilość liściŚL – średnica liści (średnia) w milimetrachW ten sposób badano kwiaty tydzień po zasadzeniu i szeregowano jeprzypuszczalnymi datami kwitnienia. Pozwoliło to ograniczyć codziennesprawdzanie całej plantacji do kilku poletek na dzień.Jest to tak zwana predykcja (prognozowanie) i pewnego rodzaju modyfikację tegopomysłu stosuje się przy klasyfikacji (jest to zagadnienie statystycznych systemówuczących). Klasyfikacja polega na ustaleniu wzorca, który pozwoliłby namdecydować na podstawie pewnych cech, do jakiej klasy zaklasyfikować nowopoznany obiekt. Zauważmy, że podobnie działamy w życiu codziennym np.odróżniając od siebie kwiaty. Mamy wykształcony pewien wzorzec (kolor, rodzajpłatków, wysokość, rodzaj liści), który stosujemy do znalezionego kwiatu, abyzdecydować, czym on jest.Przykład klasyfikacji:Ustalono, że pierwszymi objawami pewnej choroby jest znaczne pogorszenie sięwyników prac manualnych jak np. nawlekanie nitki na igłę.Podejrzewamy, że długość palców i szerokość źrenicy są czynnikami decydującymiBłądzić jest rzeczą ludzką.~Seneka Starszyo szybkości nawlekania nitki na igłę u zdrowej osoby.Losowo wybrane zdrowe osoby poproszono o nawleczenie nitki na igłę 20-krotniei zmierzono czas w sekundach. Następnie zebrano od nich dane dotyczącedługości palców i szerokości źrenicy i zebrano w tabeli. Po wykonaniu analizyokazało się, że z otrzymanych rezultatów udało się otrzymać wzór:SN ~ 0,58*DP + 0,17*SŹ, gdzie:SN - szybkość nawlekania w sekundach,DP – długość palców (kciuka i wskazującego) w centymetrach,SŹ – szerokość źrenicy w milimetrachW ten sposób można było w prosty sposób decydować, czy osoby, u którychpodejrzewano chorobę wysłać na szczegółowe badania. Jeżeli czas notorycznie byłzdecydowanie wyższy niż wynikałoby z wyliczonego wzoru – pacjenta posyłano nabadanie. W ten sposób klasyfikowano pacjentów do dwóch klas – zdrowy iprzypuszczalnie chory.Wiemy, co możemy zrobić z gotowym wzorem, jednak nadal nie wiemy, w jakisposób zdecydować czy dany czynnik rzeczywiście jest istotny, bo może okazaćsię, że nie ma on żadnego wpływu na wynik, lub jest na tyle nieistotny, że niewarto go wplatać w model.Przykład:W pewnej szkole sportowej postanowiono przygotować wzorzec, który pozwalałbywyłapywać przyszłych sprinterów. Do tego celu wydobyto z archiwum wynikibadań absolwentów szkoły, którzy zostali sprinterami, a także tych, którzy niminie zostali. Badania dotyczyły: objętości płuc, obwodu uda, masy ciała,współczynnika BMI, wzrostu i procent tkanki tłuszczowej.Okazało się, że współczynnik BMI nie był istotny, gdyż w posiadaniu były wzrost imasa ciała, a współczynnik BMI był od nich zależny. Ponadto okazało się, żeobwód uda w momencie przyjmowania uczniów był mało istotny, gdyż różnicebyły niezwykle małe dla osób o podobnych wynikach wzrostu, masy ciała iprocencie tkanki tłuszczowej.Ustalono więc wzór, który klasyfikował uczniów do grupy sprinterów na podstawieobjętości płuc, masy ciała, wzrostu i procentu tkanki tłuszczowej.Błądzić jest rzeczą ludzką.~Seneka Starszy3. Błądzić jest rzeczą ludzką, ale czemu ciągle ten błąd?Stwierdziliśmy, że w modelu mamy nieodzowny składnik – czynnik losowy, zwanybłędem. Można traktować to, jako ogół czynników, których nie włączamy dodoświadczenia oraz tzw. błędy mechaniczne wynikające ze sposobów pomiaru.Wiadomo, że w powyższych przykładach można dodawać ogrom czynników, jak np.dla sprinterów obwód łydki, długość stopy, itp. Wszystko to traktujemy, jakozmienne, które nie mają wpływu na wynik doświadczenia i chcemy, żeby w ogólnymrozrachunku wynosiły po prostu zero. Ponadto należy wspomnieć, że miara, którąmierzono uczniów była dość nieprecyzyjna i przybliżała wynik do jednego milimetra.Wydaje się, że takie zaokrąglenie na nic nie wpływa, lecz należy zdawać sobie sprawę,że takie różnice występują. Będziemy zatem mówić, że błędy mają zerową wartośćoczekiwaną. Rozumieć to można tak, że błędy się zdarzają, tutaj będzie troszkęwyższy wynik, tutaj troszkę niższy, ale tak globalnie nie wpływają na wyniki.Podobnie jak z rzucaniem rzutkami do tarczy – można ciągle trafiać w „dziesiątkę”,ale jednak rzutki nie są wbite jedna w drugą, lecz nieznacznie obok siebie, ale nadalw pożądanym polu.Jeżeli jesteśmy już przy tarczy – wyobraźmy sobie taką grę: dwie osoby stają przytablicy z rzutkami i jedna wybiera sobie jakiś punkt na tarczy, a następnie zapisujewynik na kartce nie pokazując jej drugiemu. Gracz pierwszy rzuca rzutkami w tenpunkt. Zadaniem drugiego gracza jest stwierdzenie, w jaki punkt trafia pierwszy.Punkt, który jest nieznany dla gracza drugiego jest wartością oczekiwaną zmiennejlosowej, którą jest rzucanie rzutkami przez gracza pierwszego. Natomiast rozrzut,który zależy od umiejętności gracza pierwszego, jest wariancją tej zmiennej losowej.Miejsca, w które trafia gracz pierwszy są naszymi obserwacjami, a próba oszacowaniamiejsca, w które trafia jest estymacją wartości oczekiwanej.Można by więc zapisać, że mamy obserwacje, których wyniki są równe punktowi, wktóry trafia gracz pierwszy (nieznany) + wartości losowe o zerowej wartościoczekiwanej i pewnej wariancji. Zauważmy, że otrzymujemy najprostszy z modeliliniowych, który możemy zapisać: y = Xµ + e, gdzie y jest wektorem obserwacji, µ jestposzukiwanym punktem, a e jest wektorem błędów losowych, tzn. ma on zerowąwartość oczekiwaną i pewną wariancję. X jest nazywana macierzą planu i jej ustaleniei analiza to podstawy planowania doświadczeń. Nam wystarczy, że przy każdymrzucie mieliśmy, jako cel ten punkt, więc musi się on znaleźć ze współczynnikiemjeden i błąd losowy o zadanych wcześniej własnościach, tzn. yi= 1* µ + eiWynika z tego, że macierz X musi być wektorem jedynek, aby do każdego yi„wchodziło” jedno µ.Naszym celem jest oczywiście estymacja (oszacowanie) µ za pomocą poznanychwartości y. Przykład ten bardzo dobrze obrazuje ideę estymacji nieznanegoparametru.Właściwością człowieka jest błądzić, głupiego – w błędzie trwać.~Cyceron [ Pobierz całość w formacie PDF ]

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • happyhour.opx.pl
  • Tematy

    Cytat


    Facil(e) omnes, cum valemus, recta consili(a) aegrotis damus - my wszyscy, kiedy jesteśmy zdrowi, łatwo dajemy dobre rady chorym.
    A miłość daje to czego nie daje więcej niż myślisz bo cała jest Stamtąd a śmierć to ciekawostka że trzeba iść dalej. Ks. Jan Twardowski
    Ad leones - lwom (na pożarcie). (na pożarcie). (na pożarcie)
    Egzorcyzmy pomagają tylko tym, którzy wierzą w złego ducha.
    Gdy tylko coś się nie udaje, to mówi się, że był to eksperyment. Robert Penn Warren