Följande artikel hjälper dig: @Bayes’ sats för Bae – Mot AI
Ursprungligen publicerad på Mot AI.
Introduktion till sannolikhet och statistik | Mot AI
Introducera någon för sannolikhetsteori och statistik utan att skrämma bort dem
Bayes sats är något som förvirrar och frustrerar många, men som inte är så hemskt som många gör det till. Det skrivs ut som:
P(Aˋ) = P(Bˊ)*P(A)/P(B),
där P(A) betyder sannolikheten att händelse A inträffar, och P(Ao) betyder sannolikheten att händelse A inträffar givet att händelse B inträffar (med andra ord, att veta att B inträffar, sannolikheten att A inträffar).
Även om formeln för “Bae’s Theorem” som ges i bilden ovan är dum, inte är matematisk meningsfull och gränsar till att vara NSFW, men gör hjälpa till att illustrera vad problemformuleringen är (något som kastar många, eftersom det intuitivt verkar lite bakåt). Med tanke på att Netflix förekommer, skulle man vilja veta sannolikheten för “chill”, INTE tvärtom. Visst är den högra sidan av ekvationen fullständigt nonsens, men den vänstra är det faktiskt ett bra minnesminne, särskilt med tanke på att en del av anledningen till att så många elever stämmer av medan de lär sig matematik beror på presentationens torra sterilitet.
Satsen säger i huvudsak att: sannolikheten för händelse En given händelse B är lika med sannolikheten för B given händelse A gånger sannolikheten för händelse A dividerat med sannolikheten för B. Vilket verkar mycket komplext utan att bryta ner det bit för bit. Det bästa sättet att förklara (och se användningen av detta) är att titta på ett exempel (som jag har tagit direkt från en labbuppgift från DSI-programmet som är värd för General Assembly):
Du arbetar på ett finansiellt tjänsteföretag som erbjuder individuella pensionskonton (IRA). För att rikta in dig på kunder med hög potential, vill du ta reda på om personer med barn är mer benägna att investera i IRA.
Hittills har du hittat:
- 30% av alla amerikaner har IRA.
- hälften av amerikanerna har barn.
- två tredjedelar av dem med IRA har barn.
Baserat på denna information, vad är sannolikheten att någon med barn har en IRA?
Du kanske (eller kanske inte) har märkt att frågan är inramad som den vänstra sidan av ekvationen för Bayes sats: sannolikheten för händelse A (att ha en IRA) given händelse B (att få barn). Observera att en “händelse” inte behöver vara ett aktivt faktum; ibland kan det bara representera att ha en kvalitet. Om vi ramar in den här frågan så att den passar ekvationen för Bayes sats och fyller i höger sida med lämpliga värden, har vi något sånt här:
P(IRA-barn) = P(Barn|IRA)*P(IRA)/P(Barn).
Gå sedan tillbaka till inställningen av frågan:
30% av alla amerikaner har IRA är detsamma som att säga att sannolikheten för att ha en IRA är 30 %, eller P(IRA) = 0,3
Hälften av amerikanerna har barn är detsamma som att säga att sannolikheten att få barn är 1/2, eller P(Child) = 0,5
två tredjedelar av dem med IRA har barn är detsamma som att säga att sannolikheten att få barn, givet att personen har en IRA, är 2/3, eller att P(Child|IRA) = 0,666
Så i slutändan, efter något avancerad logisk tolkning, är det matematiska slutet av saker ganska okomplicerat algebraisk plug n’ chug:
P(IRA-barn) = (0,666 * 0,3) / 0,5 = 0,4
Det är alltså 40 % sannolikhet att någon med barn har en IRA.
Följde du med? Grattis! Du förstår nu ett begrepp inom statistik som slår upp en stor majoritet av dataforskare. Matematik kan vara en skrämmande och obehaglig upplevelse för människor som inte naturligt tar till sig det, men när du avmystifierar det och bryter ner det i dess komponenter kan de flesta förstå till och med avancerade koncept.
Publicerad via Mot AI