Mennyi a kollinearitás túl sok?

Pontszám: 4,4/5 ( 11 szavazat )

A multikollinearitásra vonatkozó hüvelykujjszabály az, hogy túl sok van, ha a VIF nagyobb 10-nél (ez valószínűleg azért van, mert 10 ujjunk van, tehát tekintsd az ilyen hüvelykujjszabályokat annak, amit érnek). Ennek az lenne a következménye, hogy túl sok kollinearitás van két változó között, ha r≥. 95.

Mit tekintünk magas kollinearitásnak?

A független változók közötti páronkénti korrelációk magasak lehetnek (abszolút értékben). Ökölszabály: Ha a korreláció > 0,8, akkor súlyos multikollinearitás lehet jelen. Lehetséges, hogy az egyes regressziós együtthatók jelentéktelenek, de az egyenlet általános illeszkedése magas.

Mi az elfogadható kollinearitás?

A VIF-értékeknek 5-nél kisebbnek kell lenniük, hogy garantáljuk, hogy a kollinearitás nem jelent problémát a modellben. Egyes kutatók azonban azt javasolják, hogy ez < 3,3 legyen a PLS-SEM alkalmazásakor. ... Az 5-nél vagy 10-nél kisebb VIF elfogadása az érintett magyarázó változók számától függ.

Mikor kell aggódnom a kollinearitás miatt?

A multikollinearitás gyakori probléma a lineáris vagy általánosított lineáris modellek becslésekor , beleértve a logisztikus regressziót és a Cox-regressziót. Ez akkor fordul elő, ha a prediktor változók között magas a korreláció, ami a regressziós együtthatók megbízhatatlan és instabil becsléséhez vezet.

Mit tekintünk magas multikollinearitásnak?

Magas: Ha a feltáró változók közötti kapcsolat magas, vagy tökéletes korreláció van közöttük , akkor nagy multikollinearitásról beszélünk.

Multikollinearitás – Egyszerűen megmagyarázva (1. rész)

20 kapcsolódó kérdés található

Milyen magas a túl magas a kollinearitáshoz?

A multikollinearitásra vonatkozó hüvelykujjszabály az, hogy túl sok van, ha a VIF nagyobb, mint 10 (ez valószínűleg azért van, mert 10 ujjunk van, ezért tekintsd az ilyen hüvelykujjszabályokat úgy, hogy mennyit érnek). Ennek az lenne a következménye, hogy túl sok kollinearitás van két változó között, ha r≥. 95.

Milyen magas a túl magas VIF?

Általában a 10 feletti VIF magas korrelációt jelez, és aggodalomra ad okot. Egyes szerzők konzervatívabb, 2,5-ös vagy magasabb szintet javasolnak. Néha a magas VIF egyáltalán nem ad okot aggodalomra. Például magas VIF-értéket érhet el, ha más változókból származó termékeket vagy hatványokat vesz fel a regresszióba, például x és x 2 .

Mi a probléma a kollinearitással?

A multikollinearitás azért jelent problémát, mert aláássa egy független változó statisztikai szignifikanciáját . Ha a többi tényező egyenlő, minél nagyobb egy regressziós együttható standard hibája, annál kisebb a valószínűsége annak, hogy ez az együttható statisztikailag szignifikáns lesz.

Hogyan kezeli a kollinearitást?

Hogyan kezeljük a multikollinearitást
  1. Távolítson el néhány erősen korrelált független változót.
  2. Lineárisan kombinálja a független változókat, például összeadja őket.
  3. Végezzen olyan elemzést, amelyet erősen korrelált változókra terveztek, például főkomponens-elemzést vagy részleges legkisebb négyzetek regresszióját.

Hogyan teszteli a kollinearitást?

Multikollinearitás észlelése
  1. 1. lépés: Tekintse át a szórásdiagramot és a korrelációs mátrixokat. ...
  2. 2. lépés: Keresse meg a helytelen együtthatójeleket. ...
  3. 3. lépés: Keresse meg az együtthatók instabilitását. ...
  4. 4. lépés: Tekintse át a varianciainflációs tényezőt.

Mik legyenek a VIF értékek?

A gyakorlatban általánosan használt hüvelykujjszabály, hogy ha a VIF > 10 , akkor nagy a multikollinearitás. Esetünkben 1 körüli értékekkel jó formában vagyunk, és folytathatjuk a regressziót.

Hogyan kezeli a magas VIF-et?

Próbálja ki az alábbiak egyikét:
  1. Távolítsa el a szorosan korrelált előrejelzőket a modellből. Ha két vagy több tényezője magas VIF-értékkel rendelkezik, távolítsa el az egyiket a modellből. ...
  2. Használja a részleges legkisebb négyzetek regresszióját (PLS) vagy a főkomponens-elemzést, olyan regressziós módszereket, amelyek a prediktorok számát a nem korrelált komponensek kisebb halmazára csökkentik.

Hogyan értelmezed a VIF toleranciát?

Általában a 4 feletti VIF vagy a 0,25 alatti tolerancia azt jelzi, hogy multikollinearitás létezhet, és további vizsgálatra van szükség. Ha a VIF nagyobb, mint 10, vagy a tolerancia kisebb, mint 0,1, akkor jelentős multikollinearitás van, amelyet korrigálni kell.

Mi a kollinearitási példa?

A multikollinearitás általában akkor fordul elő, ha két vagy több prediktorváltozó között magas a korreláció. ... Példák a korrelált előrejelző változókra (más néven multikollineáris prediktorok) a következők: egy személy magassága és súlya, életkora és egy autó eladási ára, vagy iskolai végzettsége és éves jövedelme .

Mi a különbség a multikollinearitás és a kollinearitás között?

A kollinearitás egy lineáris összefüggés két prediktor között . A multikollinearitás olyan helyzet, amikor két vagy több prediktor erősen lineárisan összefügg.

Mi okozza a kollinearitást?

A multikollinearitás okai – Elemzés Különböző típusú változók pontatlan használata . Rossz kérdésválasztás vagy nullhipotézis . Egy függő változó kiválasztása. ... Magas korreláció a változók között – az egyik változó egy másik, a regresszióban használt változón keresztül fejleszthető.

Hogyan lehet felismerni a multikollinearitást?

Egy egyszerű módszer a multikollinearitás kimutatására egy modellben az úgynevezett varianciainflációs tényező vagy VIF használata minden egyes előrejelző változóhoz .

Mik a multikollinearitás következményei?

A multikollinearitás statisztikai következményei közé tartoznak az egyedi regressziós együtthatók tesztelésének nehézségei a felfújt standard hibák miatt . Így előfordulhat, hogy nem tud szignifikánsnak nyilvánítani egy X változót, bár (önmagában) erős kapcsolata van Y-val.

Miért végtelen a VIF?

Ha van tökéletes korreláció , akkor VIF = végtelen. A VIF nagy értéke azt jelzi, hogy a változók között korreláció van. Ha a VIF 4, ez azt jelenti, hogy a modell együtthatójának varianciája 4-szeresére nő a multikollinearitás jelenléte miatt.

Befolyásolja-e a multikollinearitás az előrejelzés pontosságát?

A multikollinearitás aláássa egy független változó statisztikai szignifikanciáját. Itt fontos kiemelni, hogy a multikollinearitás nem befolyásolja a modell prediktív pontosságát . A modellnek továbbra is viszonylag tisztességes munkát kell végeznie a célváltozó előrejelzésében, ha multikollinearitás van jelen.

Mi történik, ha a független változók korrelálnak?

Ha a független változók erősen korrelálnak, az egyik változó változása változást okoz egy másikban , így a modell eredményei jelentősen ingadoznak. A modelleredmények instabilok lesznek, és nagymértékben változhatnak az adatok vagy a modell kis változásai miatt.

Mit jelent a homoszcedaszticitás a regresszióban?

Homoskedasztikus (más néven "homoscedasztikus") olyan állapotra utal, amelyben a reziduális vagy hibatag szórása egy regressziós modellben állandó . Vagyis a hibatag nem változik sokat a prediktor változó értékének változásával.

Miért magas a VIF?

A varianciainflációs tényező (VIF) a multikollinearitás mértéke több regressziós változó halmazában. ... A magas VIF azt jelzi , hogy a társított független változó erősen kollineáris a modell többi változójával .

Mi a VIF határértéke?

Néha 4-es vagy 10 -es határértéket adnak, ha a VIF-et magasnak tekintik. Fontos azonban, hogy a VIF következményeit a standard hiba egyéb elemeivel összefüggésben értékeljük, amelyek ellensúlyozhatják azt (mint például a minta mérete...)

Mi az a normál VIF?

A legtöbb kutatási cikk a VIF (Variance Inflation Factor) > 10 értéket a multikollinearitás mutatójának tekinti, de vannak, akik konzervatívabb 5-ös vagy akár 2,5-ös küszöböt választanak.