質問:
四分位範囲が中央値を超えています
SilvanD
2017-03-07 00:31:00 UTC
view on stackexchange narkive permalink

四分位範囲が中央値を超えた場合、データセットの分散について何を推測できますか?これは常に大きな変動性を示していますか?中央値に対するIQRのサイズから推測できるこのデータセットの他の要約ステートメントはありますか?

@MichaelChernick-OPは、第1四分位値と第3四分位値の*差*を*実際の*中央値(第2四分位値)と比較しています。
二 答え:
Glen_b
2017-03-07 01:23:05 UTC
view on stackexchange narkive permalink

IQRが負になることはありませんが、中央値は確かに負になる可能性があることに注意してください。 1つは位置の測定値であり、もう1つは広がりの測定値であるため、通常2つを比較することが理にかなっていることは明らかではありません。

常に正になるように制限されたデータがある場合(ただし、そのような制限については言及されていません)、変動係数に似たものを計算できます(IQR /中央値の比率を計算することにより)

これは相対的な変動性の尺度であり、変動係数のように単位がありません。その場合、少なくとも「1を超えるそのような比率は、相対的な変動が大きいことを示しているのか」と尋ねるのは理にかなっているかもしれません。

しかし、答えは、私たちは本当に言うことはできません。それはあなたにとって「大きい」と見なされるものに依存します。明確な絶対基準はありません。 (CVの絶対的な基準もありません-特定の値を「大」または「小」としてカウントするものですが、一部のアプリケーション領域では経験則を見つけることができます-いくつかの仮定された分布があり、 CVの経験則のしきい値では、IQR /中央値にほぼ対応するルールを見つけることができる場合があります。少なくともいくつかの条件下では。)

IQR /中央値は中央値がゼロの場合は未定義であり、中央値がゼロに近い場合は不安定であると付け加えることができます。これらの制限は、変動係数の制限と類似しています。
この場合、データは常に正です。私のデータは正規分布に従わないため、「従来の」変動係数を使用することには消極的でしたが、あなたが提示したノンパラメトリックな類似物は興味深い選択のようです。いくつかのデータセットの分散を非正規データセットと比較するためのより強力な手段を提供すると思われる他の手段はありますか?
@SilvanDCVが正規分布に特に適していると考える理由はまったくありません。実際、CVは、平均がゼロの標準正規分布ではまったく役に立たず、平均が負の場合は疑わしい使用になります。全体として、CVは、対数正規分布やガンマ分布などの(一般的に)右に歪んだ分布に最も適しています。IQR /中央値がノンパラメトリックであると考える理由はありません。中央値と四分位数は分布のパラメーターであるため。
@SilvanDニックのコメントに同意します。中央値が非常に小さい場合(状況によっては簡単に発生する可能性があります)、IQR /中央値は不安定になります。CVは一般に通常には適切ではないという点で、おそらく少し強くなります-変数が正である必要があるだけではありません、私は主に平均と標準偏差が一緒に移動する傾向がある状況でそれを考慮する傾向があります(そして私はIQR /中央値と同等だと思います)、IQR /中央値が非パラメトリックではないことにも同意します(しかしそれは極端な外れ値に対してロバストである/分布の多くがいくつかの値に集中しているという問題がある)
@NickCoxとGlen_b、あなたのコメント/回答は両方とも私の考えを導くのに非常に役に立ちました。要約すると、CVは、正規分布と非正規分布のデータセット間の相対変動を比較するためにiqr / medianと同じくらい便利です。平均がゼロまたはゼロに非常に近い場合(CVおよびIQR /中央値が無限大に近づく場合)、または負の場合、両方とも同様に適切ではありません。
私の(私たちの)回答が役に立ったことをうれしく思います。原則として、さまざまな法線の場合、SD /平均:= CVはほぼ一定である可能性があると思いますが、実際にはまれに思われます。すでに述べたように、ほぼ一定のCVは、右に歪んだ分布に沿っているようです。
user20160
2017-03-07 01:24:30 UTC
view on stackexchange narkive permalink

一般に、IQRを中央値と比較しても、分散についての追加の洞察は得られません。たとえば、次の分布について考えてみます。

enter image description here

それらは同じIQRを持っています。実際、それらは同一のコピーであり、x軸に沿ってシフトされています。ただし、IQRは分布1の中央値よりも大きく、分布2の場合は小さくなります。また、中央値が0未満の分布では、IQRが中央値よりも大きくなることを考慮してください。

私は厳密に正のデータセットを扱っており、この可能性についても考えていませんでした。参考になった点に感謝します。
一般的なポイントは、積極的なサポートのあるディストリビューションにも当てはまります。たとえば、$ \ mu = 0、\ sigma = 1 $の対数正規分布の中央値は1、IQRは約1.45です。右にシフトすると、IQRや分散を変更せずに中央値を任意に大きくすることができます。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...