Disperze / Opatření Rozptyl: Definice

0 Comments

Statistiky Definice > Rozptyl

Co je to Rozptyl?

rozptyl ve statistice je způsob, jak popsat, jak je rozložena sada dat. Když má datová sada velkou hodnotu, hodnoty v sadě jsou široce rozptýleny; když je malá, položky v sadě jsou pevně seskupeny., Velmi v podstatě, tento soubor dat má malou hodnotu:
1, 2, 2, 3, 3, 4
…a tento set má širší jeden:
0, 1, 20, 30, 40, 100

šíření údajů může být popsán rozsah popisné statistiky včetně rozptyl, směrodatná odchylka a mezikvartilové rozpětí. Šíření může být také zobrazeny v grafech: dot pozemky, boxplots, a stonek a list pozemků mají větší vzdálenost se vzorky, které mají větší rozptyl a naopak.

čím větší je box, tím větší je rozptyl v sadě dat., Obrázek: Seton Hall University

míry disperze.

  • koeficient disperze: termín „catch-all“ pro různé vzorce, včetně vzdálenosti mezi kvartily.
  • směrodatná odchylka: pravděpodobně nejčastější opatření. To vám řekne, jak rozprostřené čísla jsou od průměru,
  • Index disperze: míra disperze běžně používané s nominálními proměnnými.
  • mezikvartilní rozsah (IQR): popisuje, kde leží většina dat („střední padesát“ procent).,
  • interdecilní rozsah: rozdíl mezi prvním decilem (10%) a posledním decilem (90%).rozsah
  • : rozdíl mezi nejmenším a největším počtem v sadě dat.
  • Střední rozdíl nebo rozdíl v prostředcích: měří absolutní rozdíl mezi průměrnou hodnotou ve dvou různých skupinách v klinických studiích.
  • střední absolutní odchylka (MAD): medián absolutních odchylek od mediánu datového souboru.
  • Kvartil: Čísla, která rozdělí data do čtyř čtvrtletí (první, druhý, třetí a čtvrtý kvartil).,

v některých procesech, jako je výroba nebo měření, je nízká disperze spojena s vysokou přesností. Vysoká disperze je spojena s nízkou přesností.

disperzní opatření: příklad

řekněme, že jste byli požádáni o porovnání disperzních opatření pro dvě datové sady. Datová sada a obsahuje položky 97,98,99,100,101,102,103 a datová sada B obsahuje položky 70,80,90,100,110,120,130. Při pohledu na datové sady, můžete pravděpodobně říci, že prostředky a mediány jsou stejné (100), který se technicky říká „opatření centrální tendence“ v oblasti statistiky.,

Nicméně, rozsah (což vám dává představu o tom, jak se rozprostíral celý soubor dat je), je mnohem větší pro data set B (60), když ve srovnání s souboru dat (6). Ve skutečnosti by téměř všechna opatření rozptylu byla desetkrát větší pro datový soubor B, což dává smysl, protože rozsah je desetkrát větší. Podívejte se například na standardní odchylky pro dvě datové sady:
směrodatná odchylka pro a: 2.160246899469287.
směrodatná odchylka pro B: 21.602468994692867.
údaj pro datovou sadu B je přesně desetinásobek hodnoty a.,

upozornění: při použití kalkulačky (nebo vzorce) zkontrolujte, zda používáte správné nastavení (nebo vzorec) pro vaše data. Mnoho opatření disperze (jako rozptyl) má dva různé vzorce, jeden pro populaci a jeden pro vzorek. Pokud si nejste jisti, zda máte vzorek nebo populaci, přečtěte si tyto články:
jaká je populace ve statistikách?
ukázka ve statistice: co to je, jak to najít.


Podívejte se na naše statistiky YouTube kanálu., Stovky základních videí pro řadu základních statistik témat.

——————————————————————————

potřebujete pomoc s domácími úkoly nebo testovací otázkou? S Chegg studie, můžete získat krok za krokem řešení vašich otázek od odborníka v oboru. Vaše první 30 minut s Chegg tutor je zdarma!


Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *