براي تعيين توزيعهاي آماري لازم است دو نوع فضاي احتمال تعريف شود:
1- فضاي نمونهاي را که تعداد عنالصر آن متناهي يا بطور شمارش پذير نامتناهي باشد، فضاي نمونه گسسته گوييم.
2- وقتي فضاي نمونه شامل تمام اعداد متعلق به يک فاصله باشد، آن را فضاي نمونه پيوسته گوييم.
انواع توزيعهاي احتمال
1- توزيع احتمال يک متغير تصادفي گسته ، يا بطور خلاصه ، توزيع يک متغر تصادفي عبارت است از فهرست مقادير Xi از متغير تصادفي X همراه با احتمال منسوب به هر يک از اين مقادير ، f(xi) = P(X=Xi). اغلب مي توان به جاي استفاده از يک فهرست مفصل، از يک فرمول استفاده کرد.
2- تابع چگالي احتمال f(x) ، توزيع احتمال يک متغير تصادفي پيوسته را توصيف ميکند و داراي خواص زير است.
الف) مساحت کل زير منحني چگالي برابر با يک است.
ب) مساحت زير منحني چگالي بين b,a مساوي است با P(a?x?b)
ج f(x) مثبت يا صفر است.
انواع توزيعهاي احتمال گسسته
امتحان برنولي (موفقيت شکست)
در اينجا تکرارهاي متوالي يک آزمايش يا مشاهده را مورد بررسي قرار ميدهيم و هر تکرار را يک امتحان ميناميم.
به علاوه فرض ميکنيم که براي هر امتحان فقط دو برآمد ممکن وجود دارد. که يکي از آنها را موفقيت و ديگري را شکست مينامند بر اين تاکيد شده باشد که آنها تنها برآمدهاي ممکناند.
ويژگيهاي امتحان برنولي
الف) هر امتحان به يکي از دو برآمد ممکن ميانجامد که در اصطلاح فني موقعيت و شکسيت ناميده ميشوند.
ب) براي تمام امتحانها ، احتمال موفقيت p ، يکي است. بنابراين احتمال شکست براي هر امتحان q=1-p است که آن را با q نشان ميدهيد، بطوري که p+q=1
ج) امتحانها مستقل از يکديگرند. احتمال موفقيت در يک احتمال با داشتن هر مقدار اطلاعات از برآمدهاي ساير احتمالها ، تغيير نميکند.
د) احتمالهاي برنولي به صورت P(X=x) = pxq1-x تعريف مي شود. داراي ميانگين) p احتمال موفقيت) و واريانس pq )احتمال موفقيت در احتمال شکست( ميباشد.
توزيع دو جملهاي
در حالتي که n امتحان مرکدر برنولي)n عدد ثابت( انجام ميشوند و احتمال موفقيت در هر امتحان p است. توزيع دو جملهاي عبارت است از تعداد موفقيتهاي در n امتحان.
توزيع دو جملهاي را به صورت px(1-p)1-x ترکيب x شيء از n شيء (P(X=x) = b(x;n;p) براي تمايز n,…,2,1,0 تعريف ميشود. اصطلاح توزيع دو جملهاي از قضيه مهمي در جبر به نام قضيه بسط دو جملهاي ، که مربوط است به فرمول بسط a+b)n )گرفته شده است توزيع دو جملهاي داراي ميانگين np تعداد موفقيتهاي در n امتحان و واريانس npq )تعداد موفقيتها در n امتحان ضرب در احتمال شکستها) ميباشد.
توزيع فوق هندسي
فرض کنيد ميخواهيم نمونه گيري را از يک جامعه N عنصري انجام دهيم که خود ميتواند به دو گروه تقسيم شود، گروهي که مشخصه معيني دارند و بقيه که داراي چنين مشخصهاي نيستند. اين دو گروه ميتوانند مثلا ، نر به ماده ، شاغل- بيکار ، سالم- معيوب و نظاير اينها باشند. با پذيرش اصطلاحات سالم و معيوب براي توصيف اين دو گروه ، تعداد معيوبها در جامعه را با D نشان ميدهيم، بنابراين تعداد عناصر سالم N-D خواهد بود. سپس فرض ميکنيم X ، نشاندهنده تعداد معيوبها در نمونه تصادفي n عنصري باشد. توزيع فوق هندسي به صورت x=0,1,…,n و
)ترکيبn از N شي)/(ترکيب n-x از N-D شي) (ترکيب x از D شي) = P(X=x) تعريف ميشود. داراي ميانگين np ، که در آن P=D/N (نسبت معيوبهاي جامعه) ، و واريانس (ndq(N-n)/N-1) ميباشد.
توزيع هندسي يا زمان انتظار
توزيع هندسي ، توزيع گسسته ديگري است که در مبحث امتحانهاي برنولي پيش ميآيد. وقتي تعداد امتحانها معين باشد، تعداد موفقيتها متغيري با توزيع دو جملهاي (b(n,p است. اگر به جاي اينکه تعداد امتحانها از قبل معين باشد، بخواهيم امتحانهاي برنولي را تا به دست آوردن اولين موفقيت تکرار کنيم، تعداد موفقيتهاي عدد معين 1 است ولي تعداد احتمالها متغير تصادفي است. X عبارت است از تعداد امتحان هاي برنولي تا به دست آوردن اولين موفقيت. توزيع هندسي به صورت p(X=x)=q1-xp , X=0,1,…,nتعريف ميشود. داراي ميانگين p-1 و واريانس q/p2 ميباشد.
توزيع هندسي را گاهي توزيع زمان انتظار گسسته ميگويند. اين امر ناشي از اين واقعيت است که اگر انجام يک امتحان برنولي يک واحد زمان طول بکشد، زمان انتظار براي به دست آوردن اولين موفقيت ، دقيقا عبارت است از متغير تصادفي x که داراي توزيع هندسي است. توزيع هندسي اغلب براي مطالعه يک مشخصه کمياب جامعه ، نظير وجود نوعي بيماري خوني کمياب ، مفيد است.
پيامدهاي کمياب و توزيع پواسن
توزيع پواسن براي ساختن مدل بسياري از پديدههاي شانسي مفيد است. همچنين تقريبي از احتمالهاي دو جملهاي را به دست ميدهد. توزيع پواسن علاوه بر نقشي که به عنوان يک توزيع تقريب کننده دارد، مدل احتمال مفيدي است براي پيشامدهايي که بطور تصادفي در زمان يا مکان رخ ميدهند، هنگامي که دانستهها منحصر به متوسط تعداد رخدادهاي آنها در واحد زمان يک مکان باشد. براي پيشامدي که در زمان اتفاق ميافتد، هر لحظه از زمان را ميتوان احتمال بالقوهاي دانست که در آن ، پيشامد ممکن است رخ بدهد يا رخ ندهد. در يک واحد زمان، بطور بالقوه تعداد متناهي احتمال وجود دارد، ولي معمولا پيشامدها به دفعات اندکي اتفاق ميافتد.
توزيع پواسن به صورت x=0,1,…,n و !P(X=x) = e-mmx/x تعريف ميشود که e عدد نمايي و برابر 71828/2 است.
توزيعهاي احتمال پيوسته
توزيع نرمال يا توزيع گوس
توزيع نرمال ، که ممکن است بعضي از خوانندگان نمودار آن را به عنوان منحني زنگديس بشناسند، گاهي با نامهاي پير لاپلا س و کارل گاوس که در تاريخ پيدايش آن نقش چشمگيري داشتهاند، همراه است. گاوس توزيع نرمال را با روش رياضي به عنوان توزيع احتمال خطاي اندازهگيريها به دست آورد و آن را "قانون نرمال خطاها" ناميد. توزيع نرمال نقشي اساسي در آمار بازي ميکند، و روشهاي استنباطي که از آن به دست ميآيند، داراي قلمرو کاربرد وسيعي هستند و ستون فقرات روشهاي جاري تجزيه و تحليل آماري را تشکيل ميدهند.
توزيع نرمال داراي چگالي e-(x-µ)2/2?2/??2? ميباشد. که در آن µ ميانگين و ? انحراف معيار است به صورت (N(µ,?2 ))نشان داده ميشود. اگر انحراف معيار با ميانگين 0 و انحراف معيار 1 باشد آن را توزيع نرمال استاندارد ميگويند و به صورت (N(0,1 نشان ميدهند، داراي توزيع Z = (x-µ)/? ميباشد.
قضيه حد مرکزي: براي توزيع ميانگين نمونه مبتني بر نمونهاي تصادفي به حجم n ، ميانگين (X) برابر µ ، واريانس (X) براي ?2/n يا (n/ واريانس جامعه) ، انحراف معيار (X) برابر ?/?n يا (n?/انحراف معيار جامعه) ميباشد. طبق قضيه حد مرکزي توزيع نرمال به صورت Z = (X- µ) / ?/?n تقريبا (N(0,1 است.
منبع:http://daneshnameh.roshd.ir/س