Contents
「外れ値」という言葉の意味を解説!
「外れ値」とは、統計学やデータ解析の分野で使われる言葉です。
データの集合の中で、他のデータと比べて極端に値が大きいまたは小さいデータを指します。
つまり、そのデータが他のデータから外れているために「外れ値」と呼ばれるのです。
外れ値は、データ解析の際に注意が必要であり、正確な結果を得るために除外することもあります。
「外れ値」という言葉の読み方はなんと読む?
「外れ値」という言葉は、「はずれち」「げれち」「がいれち」と読みます。
読み方は多少の違いがありますが、一般的には「はずれち」が最も一般的な読み方です。
ですが、専門的な文脈では「げれち」または「がいれち」という読み方も使われることがあります。
「外れ値」という言葉の使い方や例文を解説!
「外れ値」という言葉は、データ解析や統計学の文脈でよく使われます。
「集団の身長の平均値を求める際に、極端に背の高い人や低い人がいると、その人たちを外れ値として除外することがあります」といったように使われます。
また、「このデータセットは外れ値を含んでいるため、統計的な分析結果が歪んでしまいます」といったように、外れ値がデータ解析の結果に与える影響について説明する場合にも使われます。
「外れ値」という言葉の成り立ちや由来について解説
「外れ値」という言葉は、日本語に由来する言葉ではありません。
英語では「outlier」といい、そのまま訳したものです。
「out」という接頭辞は「外部の」という意味を持ち、「lier」という接尾辞は「ある特定の属性を持つもの」という意味を持ちます。
つまり、「外部の特異な値」という意味となり、集団の中で他と異なる値を持つことを指す言葉として使われています。
「外れ値」という言葉の歴史
「外れ値」という言葉は、統計学やデータ解析の分野で長い歴史があります。
具体的な起源は定かではありませんが、確率論や統計学の発展とともに使われるようになったと考えられています。
19世紀の統計学者カール・フリードリッヒ・ガウスが提唱した正規分布(ガウス分布)の概念に関連して、「外れた値」としての考え方が広まりました。
これを受けて、「外れ値」という言葉が一般的に使われるようになったのです。
「外れ値」という言葉についてまとめ
「外れ値」とは、データ解析や統計学の分野で使われる言葉で、他のデータと比べて極端な値を持つデータを指します。
その読み方は「はずれち」が一般的ですが、「げれち」や「がいれち」という読み方もあります。
使い方や例文では、データの除外や統計解析の結果の歪みなどについて説明します。
この言葉の由来は英語の「outlier」であり、日本語に由来するものではありません。
19世紀から統計学の発展とともに広まり、現在でもデータ解析の際に重要な概念として使われています。