分散/分散の尺度:定義
統計定義>分散
分散とは何ですか?
統計における分散は、データのセットがどのように広がっているかを記述する方法です。 データセットの値が大きい場合、セット内の値は広く分散され、小さい場合、セット内のアイテムは緊密にクラスタ化されます。, 非常に基本的に、このデータのセットは小さな値を持っています:
1, 2, 2, 3, 3, 4
…そして、このセットはより広いものを持っています:
0, 1, 20, 30, 40, 100
データセットの広がりは、分散、標準偏差、および四分位範囲を含む記述統計量の範囲によって記述することができる。 ドットプロット、箱ひげ図、および茎および葉プロットは、分散が大きいサンプルとの距離が大きく、その逆もまた同様です。
ボックスが大きいほど、データセットの分散が大きくなります。, 画像:シートンホール大学
分散の尺度。
- 分散係数:四分位数間の距離を含むさまざまな式の”キャッチオール”項。
- 標準偏差:おそらく最も一般的な尺度。 これは、公称変数で一般的に使用される分散の尺度である平均、
- 分散指数からどのように広がった数値があるかを示しています。
- 四分位範囲(IQR):データの大部分がどこにあるかを説明します(”中間五十”パーセント)。,
- インターデシル範囲:最初のデシル(10%)と最後のデシル(90%)の差。
- 範囲:データのセット内の最小数と最大数の差。
- 平均差または平均差:臨床試験における二つの異なるグループの平均値の間の絶対差を測定します。
- Median absolute deviation(MAD):データセットの中央値からの絶対偏差の中央値。
- 四分位数:データを四つの四分の一(第一、第二、第三、および第四四分位数)に分割する数値。,製造または測定のようないくつかのプロセスでは、低分散は高精度に関連している。 高い分散は低い精密と関連付けられる。
分散の尺度:例
二つのデータセットの分散の尺度を比較するように求められたとしましょう。 データセットAには項目97,98,99,100,101,102,103があり、データセットBには項目70,80,90,100,110,120,130があります。 データセットを見ると、平均と中央値が同じ(100)であり、技術的には統計では”中心傾向の尺度”と呼ばれていることがわかります。,
ただし、範囲(データセット全体がどのように広がっているかを知ることができます)は、データセットB(60)と比較して、データセットA(6) 実際には、分散のほぼすべての尺度は、範囲が十倍大きいので理にかなっているデータセットBのために十倍大きくなります。 たとえば、二つのデータセットの標準偏差を見てみましょう:
Aの標準偏差:2.160246899469287。
Bの標準偏差:21.602468994692867。
データセットBの図は、Aの十倍です。,警告:電卓(または数式)を使用する場合は、データに正しい設定(または数式)を使用していることを確認してください。 分散の多くの尺度(分散のような)には、母集団と標本の二つの異なる公式があります。 サンプルまたは母集団があるかどうかわからない場合は、次の記事を読んでください。
統計における母集団とは何ですか?
統計のサンプル:それが何であるか、それを見つける方法。私たちの統計YouTubeチャンネルをチェックしてください。, 基本的な統計のトピックの配列のための基本的なビデオの何百もの。
——————————————————————————
宿題やテストの質問に助けが必要ですか? Chegg Studyを使用すると、その分野の専門家からあなたの質問に対するステップバイステップの解決策を得ることができます。 Cheggの家庭教師とのあなたの最初の30分は無料です!