1. EducationMathStatisticsStatistics and Histograms
Štatistický zošit pre figuríny s online praxou, 2. vydanie

Autor: Deborah J. Rumsey

Histogram je stĺpcový graf pre kvantitatívne údaje. Pretože údaje sú číselné, rozdelíte ich do skupín bez toho, aby medzi nimi zostali medzery (takže stĺpce sú spojené). Os Y zobrazuje buď frekvencie (počty) alebo relatívne frekvencie (percentá) údajov, ktoré patria do každej skupiny.

Ako vytvoriť histogram

Ak chcete vytvoriť histogram, najskôr rozdeľte svoje údaje do primeraného počtu skupín rovnakej dĺžky. Vyrovnajte počet hodnôt v súbore údajov, ktoré patria do každej skupiny (inými slovami vytvorte tabuľku frekvencií). Ak dátový bod spadne na hranicu, urobte rozhodnutie o tom, do ktorej skupiny ho zaradiť, uistite sa, že zostanete konzistentní (vždy ho vložte do vyššej z dvoch alebo vždy do spodnej z nich). Vytvorte stĺpcový graf pomocou skupín a ich frekvencií - frekvenčný histogram.

Ak rozdelíte frekvencie celkovou veľkosťou vzorky, získate percento, ktoré patrí do každej skupiny. Tabuľka, ktorá zobrazuje skupiny a ich percentá, je tabuľka relatívnych frekvencií. Zodpovedajúci histogram je relatívny frekvenčný histogram.

Na vytváranie histogramov môžete použiť Minitab alebo iný softvérový balík, alebo si môžete histogramy vytvoriť ručne. V každom prípade sa váš výber intervalových šíriek (nazývaných zásobníky počítačovými balíčkami) môže líšiť od tých, ktoré sú zobrazené na obrázkoch, čo je v poriadku, pokiaľ budú vyzerať podobne. A budú sa používať, pokiaľ nepoužívate nezvyčajne nízky alebo vysoký počet tyčí a vaše tyče sú rovnako široké.

Môžete si tiež zvoliť rôzne začiatočné / koncové body pre každý interval, a to je tiež v poriadku. Nezabudnite všetko jasne označiť, aby inštruktor videl, čo sa snažíte urobiť. A buďte dôslední o hodnotách, ktoré skončia priamo na hranici; vždy ich vložte do dolného zoskupenia alebo vždy do horného zoskupenia. Ak však máte na výber, urobte si histogramy pomocou počítačového balíka ako Minitab. To vám uľahčí prácu.

V nasledujúcom texte je uvedený príklad výroby týchto dvoch typov histogramov.

Skóre testu pre triedu 30 študentov je uvedené v nasledujúcej tabuľke.

Frekvenčné histogramy a relatívne frekvenčné histogramy vyzerajú rovnako; robia to len pomocou rôznych mierok na osi Y.

Frekvenčný histogram pre skóre skóre je uvedený na nasledujúcom obrázku.

frekvenčný histogram

Relatívne frekvencie nájdete tak, že zoberiete každú frekvenciu a vydelíte 30 (celková veľkosť vzorky). Relatívne frekvencie pre tieto tri skupiny sú 8/30 = 0,27 alebo 27%; 16/30 = 0,53 alebo 53%; a 6/30 = 0,20 alebo 20%.

Histogram založený na relatívnych frekvenciách vyzerá rovnako ako histogram (rovnakých údajov). Jediným rozdielom je štítok na osi Y.

Vytváranie histogramov

Histogram vám poskytuje všeobecné informácie o troch hlavných črtách vašich kvantitatívnych (numerických) údajov: tvar, stred a šírenie.

Tvar histogramu je znázornený jeho všeobecným vzorom. Je možných veľa vzorov a niektoré sú bežné, vrátane nasledujúcich:

  • V tvare zvončeka: Vyzerá ako zvon - veľká hrčka v strede a chvosty, ktoré klesajú na každej strane približne rovnakou rýchlosťou. (Obrázok a) Šikmo doprava: Veľká časť údajov je odložená doľava, s niekoľkými väčšími pozorovaniami vpravo. (Obrázok b) Šikmo vľavo: Veľká časť údajov je odčítaná doprava, s niekoľkými menšími pozorovaniami končiacimi vľavo. (Obrázok c) Rovnomerné: Všetky tyče majú podobnú výšku. (Obrázok d) Bimodal: Dva vrcholy alebo (obrázok e) Tvar v tvare U: Bimodal s dvoma vrcholmi na dolnom a vysokom konci, s menším počtom údajov v strede. (Pozri obrázok 4-1 (obrázok f) Symetrický: Na oboch stranách vyzerá rovnako, keď ho rozdelíte na stred; zvonkové, jednotné a histogramy tvaru U sú príkladmi symetrických údajov. (Obrázky a, d a f)
bežné histogramové vzorce

Stred histogramu môžete zobraziť dvoma spôsobmi. Jedným z nich je bod na osi x, kde sa graf vyrovnáva, pričom sa zohľadňujú skutočné hodnoty údajov. Tento bod sa nazýva priemer a môžete ho nájsť tak, že vyhľadáte vyrovnávací bod (predstavte si, že údaje sú na počítadle teeter). Ďalším spôsobom, ako zobraziť stred, je nájsť čiaru v histograme, kde 50 percent údajov leží na oboch stranách. Čiara sa nazýva stredná hodnota a predstavuje fyzický stred množiny údajov. Predstavte si, že sa histogram delí na polovicu tak, aby polovica oblasti ležala na oboch stranách čiary.

Šírenie sa týka vzdialenosti medzi údajmi, buď vo vzťahu k sebe, alebo vo vzťahu k niektorému strednému bodu. Jeden hrubý spôsob merania šírenia je nájsť rozsah alebo vzdialenosť medzi najväčšou hodnotou a najmenšou hodnotou. Ďalším spôsobom je hľadanie priemernej vzdialenosti od stredu, inak známej ako štandardná odchýlka. Štandardnú odchýlku je ťažké zistiť iba pri pohľade na histogram, ale môžete získať hrubý nápad, ak vezmete rozsah delený 6. Ak sa výšky stĺpcov blízko stredu javia ako veľmi vysoké, to znamená, že väčšina hodnoty sú blízko priemeru, čo naznačuje malú štandardnú odchýlku. Ak sa stĺpce javia krátke, môžete mať väčšiu štandardnú odchýlku.

Na výpočet kvantitatívnych údajov môžete urobiť skutočnú súhrnnú štatistiku, ale histogram vám môže poskytnúť všeobecný smer na nájdenie týchto míľnikov. A rovnako ako koláčové grafy a stĺpcové grafy, nie všetky histogramy sú spravodlivé, úplné a presné. Musíte vedieť, čo hľadať, aby ste ich vyhodnotili.

Ako narovnať skosené údaje pomocou histogramov

Osobitné úvahy musíte vziať do úvahy pre skosené súbory údajov, pokiaľ ide o to, ktoré štatistiky sú najvhodnejšie použiť a kedy. Mali by ste si byť vedomí aj toho, ako môže použitie nesprávnych štatistík poskytnúť zavádzajúce odpovede.

Môžete spojiť priemer a medián, aby ste sa dozvedeli o tvare vašich údajov. Mať strednú hodnotu a strednú hodnotu, ktorá je takmer rovnaká, vytvorí zhruba symetrický tvar

Priemer je v údajoch ovplyvnený odľahlými hodnotami, medián však nie je. Ak je priemer a medián blízko seba, údaje nie sú zošikmené a pravdepodobne neobsahujú odľahlé hodnoty na jednej alebo druhej strane. To znamená, že údaje vyzerajú približne rovnako na každej strane stredu, čo je definícia symetrických údajov (pozri a, d alebo f na predchádzajúcom obrázku).

Skutočnosť, že stredná hodnota a stredná blízkosť vám hovorí, že údaje sú zhruba symetrické, sa môže použiť v inom type testovacej otázky. Predpokladajme, že sa vás niekto opýta, či sú údaje symetrické a nemáte histogram, ale máte strednú hodnotu a strednú hodnotu. Porovnajte dve hodnoty priemeru a mediánu a ak sú blízko, údaje sú symetrické. Ak nie, údaje nie sú symetrické.

Ako spozorovať zavádzajúci histogram

Čitatelia môžu byť zavádzaní histogramom spôsobmi, ktoré nie sú možné pomocou stĺpcového grafu. Pamätajte, že histogram sa zaoberá číselnými údajmi, nie kategorickými údajmi, čo znamená, že musíte určiť, ako sa majú číselné údaje rozdelené do skupín zobrazovať na vodorovnej osi. A ako určíte tieto zoskupenia, môže graf vyzerať veľmi odlišne. Sledujte histogramy, ktoré používajú mierku na zavádzanie čitateľov. Rovnako ako v prípade stĺpcových grafov môžete rozdiely zveličovať pomocou menšej mierky na zvislej osi histogramu a rozdiely môžete zmenšiť pomocou väčšej mierky.

Pozri tiež

Výber najlepšieho poskytovateľa služieb cloudu, funkcií a nástrojov pre DevOpsPrečo DevOps záleží: 11 spôsobov, ako DevOps prospieva vašej organizáciiVyužite viac vašich cloudových nástrojov: Automatizácia devOps v cloudTipsoch na zlepšenie inžinierskeho výkonu pomocou DevOpsAko tvoriť tímy DevOps vo vašej organizáciiZmena pre vývojové procesy DevOps: Z línie na techniku ​​sledovania obvodu na zostavenie tímu DevOps: Získanie správnych technických zručností Nepretržitá integrácia a nepretržité dodávanie: Implementácia a ťažba z úskalí CI / CDTop 10 DevOps: Prečo vaše softvérové ​​projekty zlyhajúČo je to DevOps? DevOps For Dummies Cheat SheetBase Transfer Price on Plná cenaAko nájsť svoje kontakty na InstagramVýber najlepšieho poskytovateľa cloudových služieb, funkcií a nástrojov pre vývojárovAko si vybrať najlepší odšťavovač pre vás: Sprievodca nákupomVyužívať Instagram HashtagsČo je CISO?Objavte funkcie iPhone 11 a iOS 13Ako sa prihlásiť na odber podcastov na vašom iPhonePoužívajte aplikácie odporúčané pre váš iPhoneiPhone pre seniorov pre figuríny Cheat SheetAko vytvoriť na vašom iPhone filmový trailerAko funguje Amazon Fire TV Stick? Ako získať prístup k VPN na vašom telefóne? iPhone Ako prepojiť pripojenie k internetu pomocou telefónu so systémom AndroidAko uskutočniť konferenčný hovor na telefóne s Androidom Ako na telefóne s Androidom svieti nabielo, ako na telefóne AndroidZapnúť a odomknúť iPhone