首頁 > 軟體

MATLAB計算正態分布特徵的方法

2019-12-24 15:02:36

本文首先介紹了正態分布N(u,d2)的表示式及其特徵,然後通過範例繪製了正態分佈曲線,最後計算了正態分佈曲線在區間(u+-1d),(u+-1.96d),(u+-2.58d)內包圍的面積。


1

正態分布的表示式如下圖。其含義是,如果隨機變數遵從正態分布,即X~N(u,d),其中u為該變數的均值(期望),d為該變數的標準差,那麼該隨機變數的正態分佈具有如下特點:

(1)該正態分佈曲線以x=u為對稱軸,遠離u向兩側變小。

(2)標準差d(或方差d2)越巨量資料約分散,越小越集中。

(3)正態分佈曲線與橫軸包圍的面積為1,在(u+-1d)區間內,包圍面積約為68.27%,在(u+-1.96d)區間內,包圍面積約為95.45%,在(u+-2.58d)區間內,包圍面積約為99.73%。


2

下面通過舉例,演示MATLAB計算正態分布特徵的方法。比如抽取某高校100名18歲男性大學生的身高,結果顯示其平均身高為172.7cm,標準差為4.01cm。據此利用MATLAB演示該高校18歲男性大學生身高分布特徵(理論上為正態分布)。


3

啟動MATLAB,輸入如下程式碼:

close all; clear all; clc

% MATLAB演示正態分布特徵的方法

% 正態分布(Normal Distribution):X~N(u,d2)

u = 172.70; d = 4.01; n = 200;

f = zeros(1,length(1:1:n));

for x = 1:1:n;

    f(x) = 1/(sqrt(2*pi)*d)*exp(-(x-u)^2/(2*d^2));

end

x=150:1:190;

bar(x,f(x));hold on

plot(x,f(x),'y-','LineWidth',3);hold off


4

儲存和執行上述程式碼,得到某高校18歲男性大學生身高的正態分布特徵圖形。可以看出172cm占比最多,然後向兩側減少。


5

下面計算該高校18歲男性大學生身高在(u+-1d),(u+-1.96d),(u+-2.58d)內的占比,即身高在(169,177),(165,181),(162,183)的占比(這裡身高區間的上下限做了四捨五入),在MATLAB中四捨五入用round( )函數命令。接著輸入如下程式碼:

% (1)正態曲線下,橫軸區間(u-1d,u+1d)內的面積

x1=round(u-d):1:round(u+d);            s1=sum(f(x1))

% (2)正態曲線下,橫軸區間(u-1.96d,u+1.96d)內的面積

x2=round(u-1.96*d):1:round(u+1.96*d);  s2=sum(f(x2))

% (3)正態曲線下,橫軸區間(u-2.58d,u+2.58d)內的面積

x3=round(u-2.58*d):1:round(u+2.58*d);  s3=sum(f(x3))


6

儲存和執行上述程式碼,即得到了該高校18歲男性大學生身高在(169,177),(165,181),(162,183)的占比分別為:

s1 =0.7381;

s2 =0.9659;

s3 =0.9940.

這與理論值(u+-1d)區間內占比約為68.27%,(u+-1.96d)區間內占比約為95.45%,(u+-2.58d)區間內占比約為99.73%差不多。



IT145.com E-mail:sddin#qq.com