2021-05-12 14:32:11
MATLAB計算正態分布特徵的方法
本文首先介紹了正態分布N(u,d2)的表示式及其特徵,然後通過範例繪製了正態分佈曲線,最後計算了正態分佈曲線在區間(u+-1d),(u+-1.96d),(u+-2.58d)內包圍的面積。
1
正態分布的表示式如下圖。其含義是,如果隨機變數遵從正態分布,即X~N(u,d),其中u為該變數的均值(期望),d為該變數的標準差,那麼該隨機變數的正態分佈具有如下特點:
(1)該正態分佈曲線以x=u為對稱軸,遠離u向兩側變小。
(2)標準差d(或方差d2)越巨量資料約分散,越小越集中。
(3)正態分佈曲線與橫軸包圍的面積為1,在(u+-1d)區間內,包圍面積約為68.27%,在(u+-1.96d)區間內,包圍面積約為95.45%,在(u+-2.58d)區間內,包圍面積約為99.73%。
2
下面通過舉例,演示MATLAB計算正態分布特徵的方法。比如抽取某高校100名18歲男性大學生的身高,結果顯示其平均身高為172.7cm,標準差為4.01cm。據此利用MATLAB演示該高校18歲男性大學生身高分布特徵(理論上為正態分布)。
3
啟動MATLAB,輸入如下程式碼:
close all; clear all; clc
% MATLAB演示正態分布特徵的方法
% 正態分布(Normal Distribution):X~N(u,d2)
u = 172.70; d = 4.01; n = 200;
f = zeros(1,length(1:1:n));
for x = 1:1:n;
f(x) = 1/(sqrt(2*pi)*d)*exp(-(x-u)^2/(2*d^2));
end
x=150:1:190;
bar(x,f(x));hold on
plot(x,f(x),'y-','LineWidth',3);hold off
4
儲存和執行上述程式碼,得到某高校18歲男性大學生身高的正態分布特徵圖形。可以看出172cm占比最多,然後向兩側減少。
5
下面計算該高校18歲男性大學生身高在(u+-1d),(u+-1.96d),(u+-2.58d)內的占比,即身高在(169,177),(165,181),(162,183)的占比(這裡身高區間的上下限做了四捨五入),在MATLAB中四捨五入用round( )函數命令。接著輸入如下程式碼:
% (1)正態曲線下,橫軸區間(u-1d,u+1d)內的面積
x1=round(u-d):1:round(u+d); s1=sum(f(x1))
% (2)正態曲線下,橫軸區間(u-1.96d,u+1.96d)內的面積
x2=round(u-1.96*d):1:round(u+1.96*d); s2=sum(f(x2))
% (3)正態曲線下,橫軸區間(u-2.58d,u+2.58d)內的面積
x3=round(u-2.58*d):1:round(u+2.58*d); s3=sum(f(x3))
6
儲存和執行上述程式碼,即得到了該高校18歲男性大學生身高在(169,177),(165,181),(162,183)的占比分別為:
s1 =0.7381;
s2 =0.9659;
s3 =0.9940.
這與理論值(u+-1d)區間內占比約為68.27%,(u+-1.96d)區間內占比約為95.45%,(u+-2.58d)區間內占比約為99.73%差不多。
相關文章