外れ値 outlier
データが極端に大きいまたは小さいデータであり,かつ少数のデータのことを外れ値と呼びます.外れ値は統計解析を行う上で大きく影響することもあり,解析から除外した方が良いという考えがありました.
外れ値を除外する代表的な検定として,グラブス・スミルノフ(Grubbs Smirnov)の検定があります.しかし,これは正規分布を仮定したときに異常と思われるものを外す検定であるため,多くの場合非対称な分布に従う医学的データにとって,正規分布に従うことを証明しない限りは,その測定値自体を異常と判断し,棄却してよいわけではありません.よって現状では,検定によって機械的に外れ値を外すということは推奨されません.
外れ値を検出した場合は,計測上のミスがないかを確認し,可能であれば再計測を行う,外れ値を含めた考察と除外したことによる影響を検討する,正規分布を前提としないノンパラメトリックな手法(ノンパラメトリック検定)を用いて解析を行うなどの対応をとることが妥当です.また,報告の際には,外れ値を含む結果である,または外れ値を除外した結果である,というように,いずれの場合も明記する必要があります.
外れ値を除外する代表的な検定として,グラブス・スミルノフ(Grubbs Smirnov)の検定があります.しかし,これは正規分布を仮定したときに異常と思われるものを外す検定であるため,多くの場合非対称な分布に従う医学的データにとって,正規分布に従うことを証明しない限りは,その測定値自体を異常と判断し,棄却してよいわけではありません.よって現状では,検定によって機械的に外れ値を外すということは推奨されません.
外れ値を検出した場合は,計測上のミスがないかを確認し,可能であれば再計測を行う,外れ値を含めた考察と除外したことによる影響を検討する,正規分布を前提としないノンパラメトリックな手法(ノンパラメトリック検定)を用いて解析を行うなどの対応をとることが妥当です.また,報告の際には,外れ値を含む結果である,または外れ値を除外した結果である,というように,いずれの場合も明記する必要があります.
- EBPT用語集の参考文献はこちらのページ下段に掲載しています。ご参照ください。