ديد کلي
شايد مهمترين نکته در مطالعه توزيع يک نمونه از اندازهها ، تعيين يک مقدار مرکزي باشد، يعني ، يک مقدار نماينده که اندازهها در اطراف آن توزيع شدهاند. هر معيار عددي را که معرف مرکز مجموعه دادهها باشد، معيار گرايش به مرکز مينامند. دو تا از متداولترين معيارهاي گرايش به مرکز عبارتند از : ميانگين و ميانه.
تعريف ميانگين
ميانگين يا متوسط نمونه اي مرکب از n اندازه x1، x2 ، ... ، xn ، عبارت است از خارج قسمت مجموع اين اندازه ها بر n، ميانگين را با نشان مي دهند که در عمليات، به صورت زير نوشته مي شود:
x´ = ? xi/n (به ازاي i=0 تا n)
همان طوريکه از مفهوم "متوسط" بر ميآيد، ميانگين ، مرکز مجموعه دادهها را نمايش ميدهد. اگر نمودار نقطهاي مجموعه دادهها را اين طور تجسم کنيم که روي ميلاه افقي نازکي ، گويهاي هم اندازهاي در محل دادهها قرار دارند، آنگاه ، ميانگين نشان دهنده نقطهاي است که اين ميله در آن نقطه به حال تعادل در ميآيد.
تعريف ميانه نمونهاي
ميانه نمونهاي مرکب از n اندازه x1، x2 ، ... ، xn ، عبارت است از اندازه وسطي ، در صورتي که اندازهها را به ترتيب از کوچکترين به بزرگترين مقدار مرتب کرده باشيم. اگر n فردي باشد، يک مقدار وسطي منحصر به فرد وجود دارد که ميانه است. اگر n زوج باشد در مقدار وسطي وجود دارند که متوسط آنها به عنوان ميانه تعريف ميشود. اجمالا ميتوان گفت که ، ميانه مقداري است که دسته دادهها را به دو نيمه مساوي تقسيم ميکند. به عبارت ديگر ، 50% دادهها در زير ميانه و 50% در بالاي ميانه قرار ميگيرند.
موارد استفاده از ميانه و ميانگين
وجود معدودي مشاهده خيلي برزرگ يا خيلي کوچک ، در ميانه تاثير ندارد، در حالي که وجود اينگونه مقادير فرين در ميانگين اثر قابل ملاحظهاي دارد. به نظر ميرسد براي توزيعهايي که خيلي نامتقارن هستند، ميانه معيار معقولتري از گرايش به مرکز است تا ميانگين. به اين دليل در گزارشهاي دولتي راجع به توزيع درآمد، به جاي ميانگين ، ميانه درآمدها را ذکر ميکنند. وقتي توزيع خيلي نامتقارن نيست، ميانگين به ميانه ترجيح داده ميشود و خيلي بيشتر از ميانه بکار ميرود، زيرا در روشهاي استنباطي ، ميانگين از لحاظ نظري داراي امتيازاتي است که ميانه فاقد آنهاست.
مفهوم چارک و صدک
اگر تعداد مشاهدات خيلي زياد باشد (مثلا بيشتر از 25 يا 30) ، گاهي مفيد است که مفهوم ميانه را تعميم دهيم و مجموعه دادههاي مرتب شده را به چهار قسمت تقسيم کنيم. درست همان طور که نقطه تقسيم دادهها به دو نيمه ، ميانه خوانده شده نقاط تقسيم دادهها ، به چهار قسمت را چارک مينامند. بنابراين به جاي اين که بحث را محدود به تقسيم چهار قسمتي کنيم، دادهها را به قسمتهاي زيادتري تقسيم ، و صدک را تعريف ميکنيم.
صدک
صدک (100P) ام نمونه، مقداري است که وقتي داده ها از کوچکتذرين تا بزرگترين مقدار مرتب شدند، حداقل 100P% از مشاهدات منطبق بر اين مقدار يا در سمت چپ (زير) آن و حداقل 100P% از مشاهدات منطبق بر اين مقدار يا در سمت راست (بالاي) آن باشند.
چارکهاي نمونه
• چارک (اول) کوچکتر صدک 25 ام = Q1
• چارک (دوم) ميانه صدک 50 ام = Q2
• چارک (سوم) بالايي صدک 75 ام = Q3
منبع:
http://daneshnameh.roshd.ir/الف