A logisztikus regresszió ad-e valószínűséget?

Pontszám: 4,9/5 ( 72 szavazat )

A logisztikai regresszió egy könnyen értelmezhető osztályozási technika, amely megadja egy esemény bekövetkezésének valószínűségét , nem csak a megjósolt osztályozást. Ezenkívül méri az egyes bemeneti változók hatásának jelentőségét, valamint a változó hatásának bizonyosságát.

Visszaadhatja-e a logisztikus regresszió az osztályvalószínűséget?

A logisztikus regresszió nem adja vissza közvetlenül a megfigyelések osztályát . Lehetővé teszi az osztálytagság valószínűségének (p) becslését. A valószínűség 0 és 1 között van. ... Alapértelmezés szerint ez p = 0,5, de a valóságban az elemzési cél alapján kell rendezni.

Mit mond neked a logisztikai regresszió?

Mint minden regressziós elemzés, a logisztikus regresszió is egy prediktív elemzés. A logisztikus regressziót adatok leírására és egy függő bináris változó és egy vagy több nominális, ordinális, intervallum- vagy arányszintű független változó közötti kapcsolat magyarázatára használják.

Melyek a logisztikai regresszió hátrányai?

A logisztikai regresszió fő korlátja a függő változó és a független változók közötti linearitás feltételezése . Nemcsak azt méri, hogy egy előrejelző (együttható mérete) mennyire megfelelő, hanem az asszociáció irányát is (pozitív vagy negatív).

Mikor kell alkalmazni a logisztikus regressziót?

A logisztikai regressziót akkor használjuk , ha a függő változó(cél) kategorikus . Például annak előrejelzése, hogy egy e-mail spam-e (1) vagy (0) hogy a daganat rosszindulatú-e (1) vagy sem (0)

Statisztika 101: Logisztikai regresszió, a valószínűség becslése

20 kapcsolódó kérdés található

Mi a megjósolt valószínűség a logisztikus regresszióban?

Az egyik módja annak, hogy kiszámítsuk az ilyen bináris események előre jelzett valószínűségét (kiesik vagy nem esik ki), a logisztikus regresszió. ... Ez azt jelenti, hogy az együtthatók hatással vannak a valószínűségre . A valószínűségre gyakorolt ​​hatásként az együtthatók esélyeket jelentenek egyszerű numerikus összefüggések helyett.

Milyen veszteségfüggvényt használunk a logisztikus regresszióban a legjobb illeszkedési vonal megtalálásához?

A Log Loss a logisztikus regresszió veszteségfüggvénye. A logisztikus regressziót sok gyakorló széles körben alkalmazza.

Miért nem használják az MSE-t a logisztikus regresszióban?

Az egyik fő oka annak, hogy az MSE nem működik logisztikus regresszióval, ha az MSE veszteségfüggvényét a logisztikus regressziós modell súlyaihoz viszonyítva ábrázoljuk , a kapott görbe nem konvex görbe, ami nagyon megnehezíti a globális minimum megtalálását.

Hogyan jósolod meg a valószínűséget?

Az elméleti valószínűség számítása a matematikát használja az eredmények előrejelzésére. Csak ossza el a kedvező eredményeket a lehetséges kimenetelekkel . A kísérleti valószínűség egy próba vagy kísérlet megfigyelésén alapul, megszámolja a kedvező eredményeket, és elosztja a kísérlet elvégzésének teljes számával.

Mi a logisztikus regressziós függvény képlete?

log(p/1-p) a link függvény. Az eredményváltozón végzett logaritmikus transzformáció lehetővé teszi egy nemlineáris asszociáció lineáris modellezését. Ez a logisztikai regresszióban használt egyenlet. Itt (p/1-p) a páratlan arány.

Hogyan becsüli meg a logisztikai regressziót?

A logisztikus regresszió becsléséhez szükségünk van egy bináris válaszváltozóra és egy vagy több magyarázó változóra . Azt is meg kell adnunk a válaszváltozó szintjét, amelyet sikeresnek számítunk (azaz a Select level: legördülő menüben). A titanic példaadatfájlban a fennmaradt változó sikere az Igen szint lenne.

Miért rossz az MSE?

Két oka van annak, hogy a Mean Squared Error (MSE) rossz választás bináris osztályozási problémák esetén : ... Ha a maximum likelihood becslést (MLE) használjuk, feltételezve, hogy az adatok normál eloszlásból származnak (egyébként téves feltevés ), megkapjuk az MSE-t költségfüggvényként a modellünk optimalizálásához.

Az RMSE jobb, mint az MSE?

Minél kisebb az átlagos négyzetes hiba, annál jobban illeszkedik az adatokhoz. Az MSE egységei négyzetesek a függőleges tengelyen ábrázolt értékek négyzetével. ... Az RMSE közvetlenül értelmezhető mértékegységekkel, és így az illeszkedés jóságának jobb mérőszáma, mint a korrelációs együttható .

Miért jobb a MAE, mint az RMSE?

Következtetés. Az RMSE előnye, hogy a nagy hibákat jobban megbünteti, ezért bizonyos esetekben megfelelőbb lehet, például ha 10-zel több mint kétszer olyan rossz, mint 5-tel. De ha 10-cel kevesebb, akkor csak kétszer olyan rossz, mint 5-re kikapcsolva, akkor a MAE megfelelőbb.

Mi a logisztikus regresszió költségfüggvénye?

A logisztikai regresszióban használt költségfüggvény a Log Loss .

Hogyan történik a logisztikai regresszió képzése?

A logisztikus regressziónak két fázisa van: edzés: a rendszert (különösen a w és b súlyokat) edzzük a sztochasztikus gradiens süllyedés és a keresztentrópia veszteség segítségével . teszt: Adott egy x tesztpélda, kiszámoljuk a p(y|x) értéket, és a nagyobb valószínűségű y = 1 vagy y = 0 címkét adjuk vissza.

Mi a különbség a logisztikus regresszió költségfüggvénye és veszteségfüggvénye között?

A költség- és veszteségfüggvények kifejezések szinte ugyanarra a jelentésre utalnak. ... A költségfüggvény a veszteségfüggvények átlagaként kerül kiszámításra . A veszteségfüggvény egy olyan érték, amely minden esetben kiszámításra kerül. Tehát egyetlen edzésciklusra a veszteséget többször is kiszámolják, de a költségfüggvényt csak egyszer számítják ki.

Mik azok a logisztikus regressziós feltételezések?

A logisztikus regresszióhoz teljesítendő alapvető feltevések közé tartozik a hibák függetlensége, a folytonos változók logitjának linearitása, a multikollinearitás hiánya és az erősen befolyásoló kiugró értékek hiánya .

Hogyan konvertálja az esélyhányadost valószínűségre?

Az oddsok valószínűségére való konvertálásához oszd el az oddsot eggyel plusz a szorzóval . Tehát az 1/9-es esélyek valószínűségre való konvertálásához ossza el az 1/9-et 10/9-cel, hogy megkapja a 0,10 valószínűséget.

Hogyan találja meg a vágási valószínűséget a logisztikus regresszióban?

Kiválaszt néhány valószínűségi határértéket, mondjuk 0,5-től 0,9 -ig, némi növekedéssel, például 0,05-tel, és kiszámítja az egyes valószínűségi értékeknek megfelelő TPR-t és FPR-t. El kell döntenie, hogy mennyi TPR-t és FPR-t szeretne. A tpr és az fpr között kompromisszum van. Ha növelni szeretné a TPR-t, az FPR-je is növekedni fog.

Mire jó a logisztikai regresszió?

A statisztikai szoftverekben a függő változó és egy vagy több független változó közötti kapcsolat megértésére használják a valószínűségek logisztikus regressziós egyenlet segítségével történő becslésével . Ez a fajta elemzés segíthet megjósolni egy esemény bekövetkezésének valószínűségét vagy a döntés meghozatalát.

Mi az elfogadható MSE?

Nincsenek elfogadható határértékek az MSE-re vonatkozóan, kivéve, hogy minél alacsonyabb az MSE, annál nagyobb az előrejelzés pontossága, mivel kiváló egyezés lenne a tényleges és az előre jelzett adatkészlet között. Ezt jól példázza a korreláció javulása, ahogy az MSE nullához közelít. A túl alacsony MSE azonban túlzott finomítást eredményezhet.

Miért jobb a keresztentrópia, mint az MSE?

Először is, a Cross-entropy (vagy softmax loss, de a keresztentrópia jobban működik) jobb mérőszám az osztályozáshoz, mint az MSE, mivel az osztályozási feladatban a döntési határ nagy (a regresszióhoz képest). ... Regressziós problémák esetén szinte mindig az MSE-t kell használni.

Miért az RMSE a legrosszabb?

Az RMSE kevésbé intuitív megértése, de rendkívül gyakori. Ez bünteti a nagyon rossz előrejelzéseket . Ez egy nagy veszteségmutató is egy modell optimalizálásához, mivel gyorsan kiszámítható.