7: Korreláció és egyszerű lineáris regresszió
- 7.1: Összefüggés
- Sok tanulmányban egynél több változót mérünk minden egyes személyre. Adatpárokat gyűjtünk, és ahelyett, hogy minden változót külön vizsgálnánk (egyváltozós adatok), meg akarjuk találni a kétváltozós adatok leírásának módjait, amelyekben a mintánk minden alanyán két változót mérünk. Ilyen adatok alapján kezdjük annak meghatározásával, hogy van-e kapcsolat e két változó között. Ahogy az egyik változó értékei változnak, látunk-e megfelelő változásokat a másik változóban?
- 7.2: Egyszerű lineáris regresszió
- Miután azonosítottunk két korrelált változót, szeretnénk modellezni ezt a kapcsolatot. Az egyik változót előrejelzőként vagy magyarázó változóként szeretnénk használni a másik változó, a válasz vagy a függő változó magyarázatához. Ehhez jó kapcsolatra van szükségünk a két változó között. A modell ezután felhasználható a válaszváltozónk változásainak előrejelzésére. A prediktor változó és a válaszváltozó közötti szoros kapcsolat jó modellhez vezet.
- 7.3: Népességi modell
- Mintaadataink átlagait és szórásait használjuk a meredekség kiszámításához (b1) és y-metszés (b0) egy közönséges legkisebb négyzetek regressziós vonalának létrehozásához. De le akarjuk írni az y és x közötti kapcsolatot a populációban, nem csak a mintaadatainkon belül. Egy populációs modellt akarunk felépíteni. Most a mintából kiszámított legkisebb négyzetek vonalára gondolunk, mint a populáció valódi regressziós vonalának becslésére.