Mikor kell lépésenkénti lineáris regressziót alkalmazni?

Pontszám: 4,6/5 ( 71 szavazat )

Mikor megfelelő a fokozatos regresszió? A lépcsőzetes regresszió megfelelő elemzés , ha sok változója van, és a prediktorok egy hasznos részhalmazát szeretné azonosítani . A Minitabban a szabványos lépésenkénti regressziós eljárás egyesével hozzáadja és eltávolítja a prediktorokat.

Milyen konkrét alkalmazásban alkalmazzák manapság a lépcsőzetes regressziót?

Lépésenkénti regressziós eljárásokat használnak az adatbányászatban, de ezek ellentmondásosak. Számos kritika hangzott el. Maguk a tesztek elfogultak, mivel ugyanazon az adatokon alapulnak.

Előre vagy hátra lépésenkénti regressziót használjak?

A visszafelé irányuló módszer általában az előnyben részesített módszer , mivel az előremutató módszer úgynevezett elnyomó hatásokat eredményez. Ezek az elnyomó hatások akkor jelentkeznek, ha a prediktorok csak akkor szignifikánsak, ha egy másik prediktor állandó értéken van.

Mit használjak lépésenkénti regresszió helyett?

Bár semmilyen módszer nem helyettesítheti az érdemi és statisztikai szakértelmet, a LASSO és a LAR sokkal jobb alternatívákat kínál, mint a lépésenkénti kiindulópont a további elemzésekhez.

Mi a különbség az enter és a stepwise regresszió között?

Enter (Regresszió). Változókiválasztási eljárás, amelyben a blokk összes változója egy lépésben kerül bevitelre. Lépésenként (Regresszió). Minden lépésben az egyenletben nem szereplő független változót kell beírni, amelynek F legkisebb valószínűsége van, ha ez a valószínűség elég kicsi.

lépésenkénti többszörös regressziós példa

17 kapcsolódó kérdés található

Hogyan magyarázza a lépcsőzetes regressziót?

A lépésenkénti regresszió egy regressziós modell lépésről lépésre iteratív felépítése, amely magában foglalja a végső modellben felhasználandó független változók kiválasztását. Ez magában foglalja a lehetséges magyarázó változók egymás utáni hozzáadását vagy eltávolítását, valamint a statisztikai szignifikancia tesztelését minden iteráció után .

Mit kell beírni F?

F-to-Enter: Egy független változó F-to-enter statisztikája az F-statisztika annak a regressziós együtthatónak a szignifikanciájának tesztelésére, amely akkor lenne, ha a regressziós egyenletben lenne . Ha ez a számított érték meghaladja a felhasználó által megadott értéket, akkor a változó beléphet az egyenletbe.

Miért nem szabad lépésenkénti regressziót alkalmazni?

A lépésenkénti többszörös regresszió fő hátrányai közé tartozik a paraméterbecslés torzítása , a modellkiválasztási algoritmusok közötti következetlenségek, a többszörös hipotézis tesztelésének velejáró (de gyakran figyelmen kívül hagyott) problémája, valamint a nem megfelelő összpontosítás vagy egyetlen legjobb modellre való hagyatkozás.

A lasszó jobb, mint a stepwise?

A LASSO sokkal gyorsabb, mint az előre lépésenkénti regresszió . Nyilvánvalóan nagy az átfedés a jellemzők kiválasztása és az előrejelzés között, de soha nem mondom el, hogy a csavarkulcs milyen jól használható kalapácsként.

Hogyan működik a visszafelé lépésenkénti regresszió?

A BACKWARD STEPWISE REGRESSION egy lépcsőzetes regressziós megközelítés, amely egy teljes (telített) modellel kezdődik, és minden lépésben fokozatosan kiküszöböli a regressziós modell változóit, hogy megtalálja az adatokat legjobban magyarázó redukált modellt . Más néven Backward Elimination regresszió.

Mi a különbség az előre lépésenkénti és a hátrafelé lépésenkénti regresszió között?

A továbbítási módszerben a szoftver megvizsgálja az összes kiválasztott előrejelző változót, és kiválasztja azt, amelyik a leginkább megjósolja a függő mértéket. Ez a változó hozzáadódik a modellhez. ... A visszamenőleges módszerben az összes kiválasztott előrejelző változó hozzáadódik a modellhez.

Az alábbiak közül mi a különbség a forward szelekció és a standard lépésenkénti regresszió között?

C) Az előre kiválasztás azzal kezdődik, hogy kiválasztja azt a változót, amely a legnagyobb korrelációt mutat a függő változóval, majd folytatja a következő változók kiválasztását F-belépési értékük sorrendjében, míg a standard lépésenként választja ki a változókat a döntéshozó által meghatározott sorrendben és majd eltávolítja őket a...

Mi a különbség az előre és a hátrafelé történő kiválasztási algoritmus között?

Az előre kijelölés egy (általában üres) változókészlettel kezdődik, és változókat ad hozzá mindaddig, amíg bizonyos leállítási feltétel teljesül. Hasonlóképpen, a visszafelé történő kijelölés egy (általában teljes) változókészlettel kezdődik, majd ismét kizárja a változókat abból a halmazból, amíg nem teljesül valamilyen leállítási feltétel.

Mi a probléma a fokozatos regresszióval?

A fokozatos regresszió alapvető problémája, hogy egyes valós magyarázó változók, amelyek ok-okozati hatással vannak a függő változóra, előfordulhat, hogy nem statisztikailag szignifikánsak , míg a zavaró változók véletlenszerűen szignifikánsak lehetnek.

Mi a legfontosabb különbség a lépcsőzetes és a hierarchikus többszörös regresszió között?

A hierarchikus regresszió során Ön dönti el, hogy mely kifejezéseket melyik szakaszban adja meg, döntését érdemi ismeretekre és statisztikai szakértelemre alapozva. Lépésről lépésre hagyja, hogy a számítógép eldöntse, melyik szakaszban melyik kifejezést adja meg, és megmondja neki, hogy döntését valamilyen kritériumra alapozza, például az R2, AIC, BIC és így tovább.

Mi a p érték a regresszióban?

A P-érték egy statisztikai teszt, amely meghatározza a statisztikai hipotézis teszt szélsőséges eredményeinek valószínűségét, a nullhipotézist helyesnek tekintve. Leginkább az elutasítási pontok alternatívájaként használják, amelyek a legkisebb szignifikanciaszintet biztosítják, amelynél a null-hipotézis elutasításra kerül.

Melyik a jobb lasszó vagy ridge?

Ezért a lasszó modell jobban jósol, mint a lineáris és a gerincmodell . ... Ezért a lasszó az egyetlen jellemzőt választja ki, míg a többiek együtthatóit nullára csökkenti. Ezt a tulajdonságot jellemzőkiválasztásnak nevezik, és ez a gerinc esetében hiányzik.

A legjobb részhalmaz jobb, mint a lasszó?

Bertsimas, King és Mazumder (2016) szimulációs tanulmányai kimutatták, hogy a legjobb részhalmaz általában jobb előrejelzési pontosságot ad a lépésenkénti előrejelzéshez és a lasszóhoz képest , különféle problémabeállításoknál.

Melyik funkcióválasztási módszer a legjobb?

Kimerítő funkcióválasztás Ez az eddig tárgyalt legrobusztusabb jellemzőválasztási módszer. Ez az egyes jellemzők részhalmazainak brute-force értékelése. Ez azt jelenti, hogy a változók minden lehetséges kombinációját kipróbálja, és a legjobban teljesítő részhalmazt adja vissza.

Mi a többszörös regresszió három típusa?

Többféle többszörös regressziós elemzés létezik (pl . standard, hierarchikus, setwise, stepwise ), amelyek közül itt csak kettő kerül bemutatásra (standard és stepwise). Az, hogy milyen típusú elemzést végeznek, a kutatót érdeklő kérdéstől függ.

Mit jelent az R-négyzet a regresszióban?

Az R-négyzet (R 2 ) egy statisztikai mérőszám, amely a regressziós modellben egy független változóval vagy változókkal magyarázott függő változó varianciájának arányát jelenti .

Mit jelent a beállított R2?

A Korrigált R-négyzet az R-négyzet módosított változata, amelyet a modellben lévő előrejelzők számához igazítottak . A korrigált R-négyzet akkor növekszik, ha az új tag jobban javítja a modellt, mint az véletlenül várható lenne. Csökken, ha egy előrejelző a vártnál kisebb mértékben javítja a modellt.

Mit kell eltávolítani az F-ről?

F -eltávolítani n. a modellépítési eljárásokban, mint például a visszafelé történő elimináció vagy a lépcsőzetes regresszió, a szórások specifikus aránya, amely szükséges ahhoz, hogy igazolja egy változó prediktorként való megtartását . Általában egy 4,0 körüli F-to-remove érték elegendő ahhoz, hogy egy változót meg lehessen tartani az elemzésben.

Hány regressziós modell lehetséges?

20 regresszorral 1 048 576 modell létezik. Nyilvánvaló, hogy a lehetséges modellek száma exponenciálisan növekszik a regresszorok számával. Azonban akár 15 regresszorral a probléma kezelhetőnek tűnik. Ezt az eljárást úgy programozták, hogy hatékonyan vizsgálja meg akár 32 768 modellt akár 15 regresszorhoz.

Melyek a lehetséges regressziós modellek?

A lineáris regresszió és a logisztikus regresszió kétféle regresszióelemzési technika, amelyet a regressziós probléma gépi tanulással történő megoldására használnak. Ezek a regresszió legkiemelkedőbb technikái.