① outlier數學中是什麼意思
數學中,outlier表示離群點,
離群點(outlier)是指數值中,遠離數值的一般水平的極端大值和極端小值。因此,也稱之為歧異值,有時也稱其為野值。
形成離群點的主要原因有:首先可能是采樣中的誤差,如記錄的偏誤,工作人員出現筆誤,計算錯誤等,都有可能產生極端大值或者極端小值。其次可能是被研究現象本身由於受各種偶然非正常的因素影響而引起的。例如:在人口死亡序列中,由於某年發生了地震,使該年度死亡人數劇增,形成離群點;在股票價格序列中,由於受某項政策出台或某種謠傳的刺激,都會出現極增,極減現象,變現為離群點。
不論是何種原因引起的離群點對以後的分析都會造成一定的影響。從造成分析的困難來看,統計分析人員說不希望序列中出現離群點,離群點會直接影響模型的擬合精度,甚至會得到一些虛偽的信息。因此,離群點往往被分析人員看作是一個「壞值」。但是,從獲得信息來看,離群點提供了很重要的信息,它不僅提示我們認真檢查采樣中是否存在差錯,在進行分析前,認真確認,而且,當確認離群點是由於系統受外部突發因素刺激而引起的時候,他會提供相關的系統穩定性,靈敏性等重要信息。