جمعیت و نمونه جمعیت عمومی و نمونه روش نمونه گیری

100 RURجایزه برای سفارش اول

نوع کار را انتخاب کنید کار فارغ التحصیل کار دورهچکیده پایان نامه کارشناسی ارشد گزارش عملی مقاله بررسی گزارش تستمونوگراف حل مسئله طرح کسب و کار پاسخ به سوالات کار خلاقانهطراحی انشا ترکیبات ترجمه ارائه تایپ دیگر افزایش منحصر به فرد بودن متن رساله دکتری کار آزمایشگاهیکمک آنلاین

قیمت را دریابید

جامعه عمومی - کل جامعه آماری اشیاء و/یا پدیده های مورد مطالعه با روش نمونه گیری زندگی عمومیداشتن ویژگی های کیفی یا متغیرهای کمی مشترک.

تعداد کل اشیاء مشاهده (افراد، خانوارها، شرکت ها، شهرک هاو غیره)، دارای مجموعه مشخصی از ویژگی ها (جنس، سن، درآمد، تعداد، گردش مالی و غیره)، محدود در مکان و زمان. نمونه هایی از جمعیت:
- همه ساکنان مسکو (10.6 میلیون نفر طبق سرشماری سال 2002)
- مسکوویان مرد (4.9 میلیون نفر طبق سرشماری سال 2002)
- اشخاص حقوقیروسیه (2.2 میلیون در ابتدای سال 2005)
- مراکز خرده فروشی فروش محصولات غذایی (20 هزار در ابتدای سال 2008) و غیره.

تعریف صحیح G.S. و ویژگی های آن برای انتخاب یک طرح تحقیق بسیار مهم است - استراتژی برای ساختن یک نمونه نماینده ( سانتی متر.). مهمترین خصوصیات G.S. حجم آن و در دسترس بودن عناصر برای تعیین است.

از نظر حجم مرسوم است که بین G.S متناهی و نامتناهی تشخیص داده شود. این تقسیم بندی صرفاً فنی است؛ با ویژگی های روش های تخمین حجم و خطاهای یک نمونه احتمال نماینده (تصادفی) تعیین می شود. آخرین ها G.S در نظر گرفته می شوند که تعداد آنها با حجم نمونه قابل مقایسه است. اگر حجم نمونه از چند درصد جمعیت G.S بیشتر شود، خطای نمونه‌گیری باید برای اندازه G.S تنظیم شود.

G.S را بی نهایت می نامند که حجم آن در مقایسه با حجم نمونه تصادفی نماینده، به طور نامتناسبی زیاد است. به طور دقیق، همه G.S. در علوم اجتماعی متناهی هستند (حتی اگر تعداد آنها چندین میلیارد باشد)، اما در عمل G.S. در صورتی که حجم نمونه با ارائه سطح خطای قابل قبول، از 1-2 درصد اندازه آن تجاوز نکند، می تواند بی نهایت در نظر گرفته شود. گاهی اوقات مفهوم بی نهایت به طور مستقیم با حجم G.S مرتبط است، به عنوان مثال، بیش از صد هزار جسم.

G.S که متعلق به آنها مشهود است یا به راحتی ثابت می شود، خاص نامیده می شوند. برای G.S خاص تعیین حجم و به دست آوردن نسبتا آسان است لیست کاملعناصر آنها - قاب نمونه برداری (نگاه کنید به مبنای نمونه گیری). به عنوان مثال، لیستی از ساکنان بزرگسال شهر را می توان از دفتر آدرس و لیست دانش آموزان دریافت کرد شهر بزرگ- در دانشگاه ها اگر یک G.S. بسیار زیاد است (مثلاً جمعیت یک کشور)، لیست هایی را می توان برای همه آن به دست آورد قطعات ساختاری. ساخت نمونه تصادفی نماینده ( سانتی متر.) برای G.S خاص از نظر فنی همیشه امکان پذیر است. مشکلات ممکن است به دلیل کمبود زمان، پرسنل واجد شرایط یا منابع مادی ایجاد شود.

G.S. که متعلق به آن فقط در نتیجه رویه های هدفمند یا مطالعات خاص قابل اثبات است، فرضی نامیده می شوند. به چنین G.S. برای مثال شامل مخاطبان QMS (نمی توان فهمید که آیا یک شخص تبلیغات خاصی را دیده است مگر اینکه از او در مورد آن بپرسید)، طرفداران انواع خاصی از ماهی آکواریومی، کارشناسان یک مشکل محدود و غیره برای تعیین حجم برخی از G.S. مطالعات خاصی نیز مورد نیاز است. امکان ساخت نمونه تصادفی نماینده ( سانتی متر.) برای G.S. حجم زیاد در بسیاری از موارد مشکل ساز به نظر می رسد.

پارامتر جمعیت- یک اصطلاح آماری که برای تعیین هر ویژگی کمی از یک جمعیت عمومی استفاده می شود ( سانتی متر.). مقدار مورد انتظار ( سانتی متر.، واریانس ( سانتی متر.)، احتمال ( سانتی متر.) پاسخ مثبت، ضریب همبستگی بین دو متغیر تصادفی ( سانتی متر.) G.S.P هستند. مشخصات نمونه مشابه ( سانتی متر.) آماردانان نمونه نامیده می شوند ( سانتی متر.).

نمونه (جمعیت نمونه) -مجموعه ای از موارد (موضوع، اشیاء، رویدادها، نمونه ها)، با استفاده از یک روش خاص، انتخاب شده از جمعیت عمومی برای شرکت در مطالعه.
بخشی از یک جامعه برای مطالعه به منظور نتیجه گیری در مورد کل جمعیت انتخاب شدند. برای اینکه نتیجه به دست آمده از مطالعه نمونه به کل جامعه تعمیم یابد، نمونه باید دارای خاصیت نمایندگی باشد.

مشخصات نمونه:

ویژگی های کیفی نمونه - دقیقا چه کسی را انتخاب می کنیم و از چه روش های نمونه گیری برای این کار استفاده می کنیم.

ویژگی های کمی نمونه - چند مورد را انتخاب می کنیم، به عبارت دیگر، حجم نمونه.

اندازهی نمونه- تعداد موارد موجود در جامعه نمونه. به دلایل آماری توصیه می شود که تعداد موارد حداقل 30-35 باشد.

مجموعه ای از اشیاء همگن اغلب در رابطه با برخی از ویژگی هایی که آنها را مشخص می کند، به صورت کمی یا کیفی اندازه گیری می شود.

به عنوان مثال، اگر دسته ای از قطعات وجود داشته باشد، مشخصه کمی ممکن است اندازه قطعه مطابق با GOST باشد و مشخصه کیفی ممکن است استاندارد قطعه باشد.

در صورت لزوم بررسی آنها از نظر مطابقت با استانداردها، آنها گاهی اوقات به معاینه کامل متوسل می شوند، اما در عمل از این بسیار به ندرت استفاده می شود. به عنوان مثال، اگر جمعیت عمومی دارای تعداد زیادی از اشیاء مورد مطالعه باشد، انجام یک بررسی مداوم تقریبا غیرممکن است. در این حالت تعداد معینی از اشیا (عناصر) از کل جمعیت انتخاب شده و مورد بررسی قرار می گیرند. بنابراین، یک جامعه عمومی و یک جامعه نمونه وجود دارد.

کلی عبارت است از مجموع تمام اشیایی که در معرض بازرسی یا مطالعه قرار می گیرند. جمعیت عمومی، به عنوان یک قاعده، شامل تعداد محدودی از عناصر است، اما اگر بیش از حد بزرگ باشد، به منظور ساده کردن محاسبات ریاضی، فرض می شود که کل جمعیت از تعداد نامتناهی شی تشکیل شده است.

نمونه یا چارچوب نمونه گیری بخشی از عناصر انتخاب شده از کل جامعه است. نمونه می تواند تکراری یا غیر تکراری باشد. در مورد اول، به جمعیت عمومی بازگردانده می شود، در مورد دوم - نه. در عمل، انتخاب تصادفی غیر تکراری بیشتر مورد استفاده قرار می گیرد.

جامعه و نمونه باید از نظر نمایندگی با یکدیگر مرتبط باشند. به عبارت دیگر، برای تعیین با اطمینان ویژگی‌های کل جامعه بر اساس ویژگی‌های جامعه نمونه، لازم است که عناصر نمونه آن‌ها را تا حد امکان دقیق نشان دهند. به عبارت دیگر نمونه باید نماینده (نماینده) باشد.

اگر نمونه ای به صورت تصادفی از یک خیلی گرفته شود کم و بیش نماینده خواهد بود تعداد زیادیکل مجموعه این را می توان بر اساس قانون به اصطلاح اعداد بزرگ بیان کرد. در این حالت، همه عناصر دارای احتمال یکسانی برای قرار گرفتن در نمونه هستند.

در دسترس گزینه های مختلفانتخاب. همه این روش ها اساساً به دو گزینه تقسیم می شوند:

  • گزینه 1. عناصر زمانی انتخاب می شوند که جمعیت به بخش ها تقسیم نشده باشد. این گزینه شامل انتخاب های تصادفی تکراری و غیر تکراری ساده است.
  • گزینه 2. جمعیت عمومی به بخش ها تقسیم شده و عناصر انتخاب می شوند. این موارد شامل نمونه برداری معمولی، مکانیکی و سریال می باشد.

تصادفی ساده - انتخابی که در آن عناصر یکی یکی از کل جمعیت به طور تصادفی انتخاب می شوند.

Typical انتخابی است که در آن عناصر نه از کل جمعیت، بلکه از تمام بخش‌های «معمولی» آن انتخاب می‌شوند.

انتخاب مکانیکی زمانی است که کل جمعیت به تعدادی گروه تقسیم شود برابر عددعناصری که باید در نمونه باشند و بر این اساس از هر گروه یک عنصر انتخاب می شود. به عنوان مثال، اگر شما نیاز به انتخاب 25 درصد از قطعات تولید شده توسط یک دستگاه دارید، هر چهارم قطعه انتخاب می شود و اگر نیاز به انتخاب 4 درصد از قطعات دارید، هر قسمت بیست و پنجم انتخاب می شود و به همین ترتیب. باید گفت که گاهی اوقات انتخاب مکانیکی ممکن است کافی نباشد

سریال انتخابی است که در آن عناصر از کل جمعیت در «سری» انتخاب می‌شوند که تحت تحقیق مستمر قرار می‌گیرند و نه یکی در یک زمان. به عنوان مثال، هنگامی که قطعات توسط تعداد زیادی ماشین اتوماتیک تولید می شود، یک بررسی جامع فقط در رابطه با محصولات چندین ماشین انجام می شود. در صورتی که صفت مورد مطالعه دارای تنوع ناچیز در سری های مختلف باشد از انتخاب سریال استفاده می شود.

به منظور کاهش خطا، از برآوردهای جامعه عمومی با استفاده از نمونه استفاده می شود. علاوه بر این، کنترل نمونه‌گیری می‌تواند تک مرحله‌ای یا چند مرحله‌ای باشد که پایایی نظرسنجی را افزایش می‌دهد.

جامعه آماری


جامعه آماری شامل اشیاء مادی موجود (کارکنان، شرکت ها، کشورها، مناطق)، یک شی است.
تحقیق آماری جامعه آماری
- مجموعه ای از واحدها که دارای خصوصیات توده ای، نوع بودن، همگنی کیفی و وجود تنوع هستند.

واحد جمعیت- هر واحد خاص از جامعه آماری.

جامعه آماری یکسان می تواند در یک مشخصه همگن و در ویژگی دیگر ناهمگن باشد.

یکنواختی کیفی- شباهت همه واحدهای جمعیت بر اساس برخی و عدم تشابه در همه واحدهای دیگر.

در یک جامعه آماری، تفاوت بین یک واحد جمعیتی و دیگری اغلب ماهیتی کمی دارد. تغییرات کمی در مقادیر یک مشخصه واحدهای مختلف یک جمعیت را تنوع می نامند.

تنوع یک صفت- تغییر کمی در یک ویژگی (برای یک ویژگی کمی) در طول انتقال از یک واحد جمعیت به واحد دیگر.

امضا کردن- این یک ویژگی، ویژگی یا ویژگی دیگر واحدها، اشیاء و پدیده هایی است که قابل مشاهده یا اندازه گیری است. نشانه ها به کمی و کیفی تقسیم می شوند. تنوع و تنوع مقدار یک مشخصه در واحدهای فردی یک جمعیت نامیده می شود تغییر.

ویژگی های اسنادی (کیفی) را نمی توان به صورت عددی بیان کرد (ترکیب جمعیت بر اساس جنسیت). ویژگی های کمی بیان عددی دارند (ترکیب جمعیت بر اساس سن).

فهرست مطالب- این یک ویژگی کمی و کیفی تعمیم دهنده هر خاصیت واحدها یا مجموعات به عنوان یک کل در شرایط خاص زمانی و مکانی است.

کارت امتیازیمجموعه‌ای از شاخص‌ها است که به طور جامع پدیده مورد مطالعه را منعکس می‌کند.

به عنوان مثال، حقوق مورد مطالعه قرار می گیرد:
  • علامت - دستمزد
  • جامعه آماری - کلیه کارکنان
  • واحد جمعیت - هر کارمند
  • همگنی کیفی - دستمزد تعلق گرفته
  • تنوع یک علامت - یک سری اعداد

جمعیت و نمونه برداری از آن

اساس تحقیق آماری مجموعه ای از داده هایی است که در نتیجه اندازه گیری یک یا چند ویژگی به دست می آید. مجموعه ای واقعی از اشیاء مشاهده شده که از نظر آماری با تعدادی از مشاهدات نشان داده می شود متغیر تصادفی، است نمونه برداریو موجود فرضی (حدیثی) - جمعیت عمومی. جمعیت ممکن است محدود باشد (تعداد مشاهدات N = ثابت) یا بی نهایت ( N = ∞، و یک نمونه از یک جامعه همیشه نتیجه تعداد محدودی از مشاهدات است. تعداد مشاهدات تشکیل دهنده یک نمونه نامیده می شود اندازهی نمونه. اگر حجم نمونه به اندازه کافی بزرگ باشد ( n → ∞) نمونه در نظر گرفته می شود بزرگ، در غیر این صورت نمونه گیری نامیده می شود حجم محدود. نمونه در نظر گرفته شده است کم اهمیت، اگر هنگام اندازه گیری یک متغیر تصادفی یک بعدی، حجم نمونه از 30 تجاوز نکند ( n<= 30 ، و هنگام اندازه گیری همزمان چندین ( ک) ویژگی ها در فضای روابط چند بعدی nبه کتجاوز نمی کند 10 (n/k< 10) . فرم های نمونه سری تغییرات، اگر اعضای آن باشند آمار ترتیبی، یعنی مقادیر نمونه متغیر تصادفی ایکسبه ترتیب صعودی (رتبه بندی شده) مرتب می شوند، مقادیر مشخصه نامیده می شوند گزینه ها.

مثال. تقریباً همان مجموعه ای از اشیاء به طور تصادفی انتخاب شده - بانک های تجاری یک منطقه اداری مسکو را می توان به عنوان نمونه ای از جمعیت عمومی همه بانک های تجاری در این منطقه و به عنوان نمونه ای از جمعیت عمومی همه بانک های تجاری در مسکو در نظر گرفت. و همچنین نمونه ای از بانک های تجاری کشور و ...

روشهای اساسی سازماندهی نمونه گیری

پایایی نتایج آماری و تفسیر معنادار نتایج به آن بستگی دارد نمایندگینمونه ها، یعنی کامل بودن و کفایت نمایش خواص عمومی جمعیت که در رابطه با آن می توان این نمونه را نماینده در نظر گرفت. مطالعه ویژگی های آماری یک جامعه را می توان به دو صورت سازماندهی کرد: استفاده مداومو مشاهده مداوم مشاهده مستمربرای بررسی همه فراهم می کند واحدهامطالعه کرد کلیت، آ مشاهده جزئی (انتخابی).- فقط بخش هایی از آن

پنج روش اصلی برای سازماندهی مشاهده نمونه وجود دارد:

1. انتخاب تصادفی ساده، که در آن اشیاء به طور تصادفی از جمعیتی از اشیاء انتخاب می شوند (مثلاً با استفاده از جدول یا مولد اعداد تصادفی)، با احتمال مساوی هر یک از نمونه های ممکن. چنین نمونه هایی نامیده می شوند در واقع تصادفی;

2. انتخاب ساده با استفاده از یک روش منظمبا استفاده از یک جزء مکانیکی (به عنوان مثال، تاریخ، روز هفته، شماره آپارتمان، حروف الفبا و غیره) انجام می شود و نمونه های به دست آمده از این طریق نامیده می شوند. مکانیکی;

3. طبقه بندی شدهانتخاب شامل این واقعیت است که جمعیت عمومی حجم به زیر جمعیت ها یا لایه ها (قشرهای) حجم تقسیم می شود به طوری که . طبقات از نظر ویژگی های آماری اشیاء همگنی هستند (برای مثال، جمعیت بر اساس گروه های سنی یا طبقه اجتماعی به اقشار تقسیم می شود؛ شرکت ها بر اساس صنعت). در این حالت نمونه ها نامیده می شوند طبقه بندی شده(در غیر این صورت، طبقه بندی شده، معمولی، منطقه ای);

4. روش ها سریالانتخاب برای تشکیل استفاده می شود سریالیا نمونه های لانه. اگر لازم است یک "بلوک" یا یک سری اشیاء را به طور همزمان بررسی کنید (به عنوان مثال، دسته ای از کالاها، محصولات یک سری خاص یا جمعیت در تقسیمات ارضی و اداری کشور) راحت هستند. انتخاب سری ها می تواند به صورت کاملا تصادفی یا مکانیکی انجام شود. در این مورد، بازرسی کامل از یک دسته خاص از کالا، یا کل واحد سرزمینی (یک ساختمان مسکونی یا بلوک) انجام می شود.

5. ترکیب شدهانتخاب (پله ای) می تواند چندین روش انتخاب را به طور همزمان ترکیب کند (مثلاً طبقه بندی شده و تصادفی یا تصادفی و مکانیکی). چنین نمونه ای نامیده می شود ترکیب شده.

انواع انتخاب

توسط ذهنانتخاب فردی، گروهی و ترکیبی متمایز می شود. در انتخاب فردیواحدهای فردی از جمعیت عمومی در جامعه نمونه انتخاب می شوند، با انتخاب گروه- گروه ها (سری) واحدها از نظر کیفی همگن و انتخاب ترکیبیشامل ترکیبی از نوع اول و دوم است.

توسط روشانتخاب متمایز است تکراری و غیر تکرارینمونه.

بی تکرارانتخاب نامیده می شود که در آن واحد موجود در نمونه به جمعیت اصلی باز نمی گردد و در انتخاب بعدی شرکت نمی کند. در حالی که تعداد واحدها در جمعیت عمومی ندر طول فرآیند انتخاب کاهش می یابد. در تکرار کردانتخاب گرفتاردر نمونه، یک واحد پس از ثبت نام به جمعیت عمومی بازگردانده می‌شود و در نتیجه فرصتی برابر همراه با سایر واحدها برای استفاده در فرآیند انتخاب بعدی حفظ می‌شود. در حالی که تعداد واحدها در جمعیت عمومی نبدون تغییر باقی می ماند (روش به ندرت در تحقیقات اجتماعی-اقتصادی استفاده می شود). با این حال، با بزرگ N (N → ∞)فرمول هایی برای قابل تکرارانتخاب به کسانی که برای تکرار کردانتخاب و دومی عملاً بیشتر مورد استفاده قرار می گیرند ( N = ثابت).

ویژگی های اساسی پارامترهای جامعه عمومی و نمونه

نتیجه گیری آماری تحقیق بر اساس توزیع متغیر تصادفی و مقادیر مشاهده شده است. (x 1، x 2، ...، x n)تحقق متغیر تصادفی نامیده می شوند ایکس(n - حجم نمونه). توزیع یک متغیر تصادفی در جامعه عمومی ماهیتی نظری و ایده آل دارد و نمونه آنالوگ آن است. تجربیتوزیع برخی از توزیع های نظری به صورت تحلیلی مشخص می شوند، به عنوان مثال. آنها گزینه هامقدار تابع توزیع را در هر نقطه در فضای مقادیر ممکن متغیر تصادفی تعیین کنید. برای یک نمونه، تعیین تابع توزیع دشوار و گاهی غیرممکن است، بنابراین گزینه هااز داده‌های تجربی تخمین زده می‌شوند، و سپس به یک عبارت تحلیلی که توزیع نظری را توصیف می‌کند، جایگزین می‌شوند. در این مورد، فرض (یا فرضیه) در مورد نوع توزیع می تواند از نظر آماری صحیح یا اشتباه باشد. اما در هر صورت، توزیع تجربی بازسازی شده از نمونه، تنها به طور تقریبی توزیع واقعی را مشخص می کند. مهمترین پارامترهای توزیع عبارتند از ارزش مورد انتظارو واریانس

طبق ماهیت آنها، توزیع ها هستند مداومو گسسته. شناخته شده ترین توزیع پیوسته است طبیعی. نمونه آنالوگ پارامترها و برای آن عبارتند از: مقدار میانگین و واریانس تجربی. در میان موارد گسسته در تحقیقات اجتماعی-اقتصادی، بیشترین استفاده از آنهاست جایگزین (دوگانگی)توزیع پارامتر انتظار ریاضی این توزیع مقدار نسبی (یا اشتراک گذاری) واحدهای جمعیتی که ویژگی مورد مطالعه را دارند (با حرف مشخص می شود). نسبت جمعیتی که این ویژگی را ندارند با حرف نشان داده می شود q (q = 1 - p). واریانس توزیع جایگزین نیز یک آنالوگ تجربی دارد.

بسته به نوع توزیع و روش انتخاب واحدهای جمعیتی، ویژگی های پارامترهای توزیع متفاوت محاسبه می شود. موارد اصلی برای توزیع های نظری و تجربی در جدول آورده شده است. 9.1.

کسر نمونه k nنسبت تعداد واحدهای جامعه نمونه به تعداد واحدهای جامعه عمومی را می گویند:

kn = n/N.

کسر نمونه w- این نسبت واحدهای دارای ویژگی مورد مطالعه است ایکسبه اندازه نمونه n:

w = n n / n.

مثال.در دسته ای از کالاهای حاوی 1000 واحد با نمونه 5 درصد سهم نمونه k nدر قدر مطلق 50 واحد است. (n = N*0.05)؛ اگر 2 محصول معیوب در این نمونه یافت شود، آنگاه نرخ عیب نمونه w 0.04 (w = 2/50 = 0.04 یا 4٪) خواهد بود.

از آنجایی که جامعه نمونه با جامعه عمومی متفاوت است، وجود دارد خطاهای نمونه گیری.

جدول 9.1 پارامترهای اصلی جمعیت عمومی و نمونه

جامعه آماری- مجموعه ای از واحدها که دارای خصوصیات توده ای، نوع بودن، همگنی کیفی و وجود تنوع هستند.

جامعه آماری شامل اشیاء مادی موجود (کارکنان، شرکتها، کشورها، مناطق)، یک شی است.

واحد جمعیت- هر واحد خاص از یک جامعه آماری.

جامعه آماری یکسان می تواند در یک مشخصه همگن و در ویژگی دیگر ناهمگن باشد.

یکنواختی کیفی- شباهت همه واحدهای جمعیت بر اساس برخی و عدم تشابه در همه واحدهای دیگر.

در یک جامعه آماری، تفاوت بین یک واحد جمعیتی و دیگری اغلب ماهیتی کمی دارد. تغییرات کمی در مقادیر یک مشخصه واحدهای مختلف یک جمعیت را تنوع می نامند.

تنوع یک صفت- تغییر کمی در یک ویژگی (برای یک ویژگی کمی) در طول انتقال از یک واحد جمعیت به واحد دیگر.

امضا کردن- این یک ویژگی، ویژگی یا ویژگی دیگر واحدها، اشیاء و پدیده هایی است که قابل مشاهده یا اندازه گیری است. نشانه ها به کمی و کیفی تقسیم می شوند. تنوع و تنوع مقدار یک مشخصه در واحدهای فردی یک جمعیت نامیده می شود تغییر.

ویژگی های اسنادی (کیفی) را نمی توان به صورت عددی بیان کرد (ترکیب جمعیت بر اساس جنسیت). ویژگی های کمی بیان عددی دارند (ترکیب جمعیت بر اساس سن).

فهرست مطالب- این یک ویژگی کمی و کیفی تعمیم دهنده هر خاصیت واحدها یا مجموعات به عنوان یک کل تحت شرایط خاص زمانی و مکانی است.

کارت امتیازیمجموعه‌ای از شاخص‌ها است که به طور جامع پدیده مورد مطالعه را منعکس می‌کند.

به عنوان مثال، حقوق مورد مطالعه قرار می گیرد:
  • علامت - دستمزد
  • جامعه آماری - کلیه کارکنان
  • واحد جمعیت هر کارمند است
  • همگنی کیفی - دستمزد تعلق گرفته
  • تنوع یک علامت - یک سری اعداد

جمعیت و نمونه برداری از آن

مبنا مجموعه ای از داده های به دست آمده در نتیجه اندازه گیری یک یا چند ویژگی است. مجموعه ای از اشیاء واقعی مشاهده شده که از نظر آماری با تعدادی از مشاهدات یک متغیر تصادفی نشان داده می شود. نمونه برداریو موجود فرضی (حدیثی) - جمعیت عمومی. جمعیت ممکن است محدود باشد (تعداد مشاهدات N = ثابت) یا بی نهایت ( N = ∞، و یک نمونه از یک جامعه همیشه نتیجه تعداد محدودی از مشاهدات است. تعداد مشاهدات تشکیل دهنده یک نمونه نامیده می شود اندازهی نمونه. اگر حجم نمونه به اندازه کافی بزرگ باشد ( n → ∞) نمونه در نظر گرفته می شود بزرگ، در غیر این صورت نمونه گیری نامیده می شود حجم محدود. نمونه در نظر گرفته شده است کم اهمیت، اگر هنگام اندازه گیری یک متغیر تصادفی یک بعدی، حجم نمونه از 30 تجاوز نکند ( n<= 30 ، و هنگام اندازه گیری همزمان چندین ( ک) ویژگی ها در فضای روابط چند بعدی nبه کتجاوز نمی کند 10 (n/k< 10) . فرم های نمونه سری تغییرات، اگر اعضای آن باشند آمار ترتیبی، یعنی مقادیر نمونه متغیر تصادفی ایکسبه ترتیب صعودی (رتبه بندی شده) مرتب می شوند، مقادیر مشخصه نامیده می شوند گزینه ها.

مثال. تقریباً همان مجموعه ای از اشیاء به طور تصادفی انتخاب شده - بانک های تجاری یک منطقه اداری مسکو را می توان به عنوان نمونه ای از جمعیت عمومی همه بانک های تجاری در این منطقه و به عنوان نمونه ای از جمعیت عمومی همه بانک های تجاری در مسکو در نظر گرفت. و همچنین نمونه ای از بانک های تجاری کشور و ...

روشهای اساسی سازماندهی نمونه گیری

پایایی نتایج آماری و تفسیر معنادار نتایج به آن بستگی دارد نمایندگینمونه ها، یعنی کامل بودن و کفایت نمایش خواص عمومی جمعیت که در رابطه با آن می توان این نمونه را نماینده در نظر گرفت. مطالعه ویژگی های آماری یک جامعه را می توان به دو صورت سازماندهی کرد: استفاده مداومو مستمر نیست مشاهده مستمربرای بررسی همه فراهم می کند واحدهامطالعه کرد کلیت، آ مشاهده جزئی (انتخابی).- فقط بخش هایی از آن

پنج روش اصلی برای سازماندهی مشاهده نمونه وجود دارد:

1. انتخاب تصادفی ساده، که در آن اشیاء به طور تصادفی از جمعیتی از اشیاء انتخاب می شوند (مثلاً با استفاده از جدول یا مولد اعداد تصادفی)، با احتمال مساوی هر یک از نمونه های ممکن. چنین نمونه هایی نامیده می شوند در واقع تصادفی;

2. انتخاب ساده با استفاده از یک روش منظمبا استفاده از یک جزء مکانیکی (به عنوان مثال، تاریخ، روز هفته، شماره آپارتمان، حروف الفبا و غیره) انجام می شود و نمونه های به دست آمده از این طریق نامیده می شوند. مکانیکی;

3. طبقه بندی شدهانتخاب شامل این واقعیت است که جمعیت عمومی حجم به زیر جمعیت ها یا لایه ها (قشرهای) حجم تقسیم می شود به طوری که . طبقات از نظر ویژگی های آماری اشیاء همگنی هستند (برای مثال، جمعیت بر اساس گروه های سنی یا طبقه اجتماعی به اقشار تقسیم می شود؛ شرکت ها بر اساس صنعت). در این حالت نمونه ها نامیده می شوند طبقه بندی شده(در غیر این صورت، طبقه بندی شده، معمولی، منطقه ای);

4. روش ها سریالانتخاب برای تشکیل استفاده می شود سریالیا نمونه های لانه. اگر لازم است یک "بلوک" یا یک سری اشیاء را به طور همزمان بررسی کنید (به عنوان مثال، دسته ای از کالاها، محصولات یک سری خاص یا جمعیت در تقسیمات ارضی و اداری کشور) راحت هستند. انتخاب سری ها می تواند به صورت کاملا تصادفی یا مکانیکی انجام شود. در این مورد، بازرسی کامل از یک دسته خاص از کالا، یا کل واحد سرزمینی (یک ساختمان مسکونی یا بلوک) انجام می شود.

5. ترکیب شدهانتخاب (پله ای) می تواند چندین روش انتخاب را به طور همزمان ترکیب کند (مثلاً طبقه بندی شده و تصادفی یا تصادفی و مکانیکی). چنین نمونه ای نامیده می شود ترکیب شده.

انواع انتخاب

توسط ذهنانتخاب فردی، گروهی و ترکیبی متمایز می شود. در انتخاب فردیواحدهای فردی از جمعیت عمومی در جامعه نمونه انتخاب می شوند، با انتخاب گروه- گروه ها (سری) واحدها از نظر کیفی همگن و انتخاب ترکیبیشامل ترکیبی از نوع اول و دوم است.

توسط روشانتخاب متمایز است تکراری و غیر تکرارینمونه.

بی تکرارانتخاب نامیده می شود که در آن واحد موجود در نمونه به جمعیت اصلی باز نمی گردد و در انتخاب بعدی شرکت نمی کند. در حالی که تعداد واحدها در جمعیت عمومی ندر طول فرآیند انتخاب کاهش می یابد. در تکرار کردانتخاب گرفتاردر نمونه، یک واحد پس از ثبت نام به جمعیت عمومی بازگردانده می‌شود و در نتیجه فرصتی برابر همراه با سایر واحدها برای استفاده در فرآیند انتخاب بعدی حفظ می‌شود. در حالی که تعداد واحدها در جمعیت عمومی نبدون تغییر باقی می ماند (روش به ندرت در تحقیقات اجتماعی-اقتصادی استفاده می شود). با این حال، با بزرگ N (N → ∞)فرمول هایی برای قابل تکرارانتخاب به کسانی که برای تکرار کردانتخاب و دومی عملاً بیشتر مورد استفاده قرار می گیرند ( N = ثابت).

ویژگی های اساسی پارامترهای جامعه عمومی و نمونه

نتیجه گیری آماری تحقیق بر اساس توزیع متغیر تصادفی و مقادیر مشاهده شده است. (x 1، x 2، ...، x n)تحقق متغیر تصادفی نامیده می شوند ایکس(n حجم نمونه است). توزیع یک متغیر تصادفی در جامعه عمومی ماهیتی نظری و ایده آل دارد و نمونه آنالوگ آن است. تجربیتوزیع برخی از توزیع های نظری به صورت تحلیلی مشخص می شوند، به عنوان مثال. آنها گزینه هامقدار تابع توزیع را در هر نقطه در فضای مقادیر ممکن متغیر تصادفی تعیین کنید. برای یک نمونه، تعیین تابع توزیع دشوار و گاهی غیرممکن است، بنابراین گزینه هااز داده‌های تجربی تخمین زده می‌شوند، و سپس به یک عبارت تحلیلی که توزیع نظری را توصیف می‌کند، جایگزین می‌شوند. در این مورد، فرض (یا فرضیه) در مورد نوع توزیع می تواند از نظر آماری صحیح یا اشتباه باشد. اما در هر صورت، توزیع تجربی بازسازی شده از نمونه، تنها به طور تقریبی توزیع واقعی را مشخص می کند. مهمترین پارامترهای توزیع عبارتند از ارزش مورد انتظارو واریانس

طبق ماهیت آنها، توزیع ها هستند مداومو گسسته. شناخته شده ترین توزیع پیوسته است طبیعی. نمونه آنالوگ پارامترها و برای آن عبارتند از: مقدار میانگین و واریانس تجربی. در میان موارد گسسته در تحقیقات اجتماعی-اقتصادی، بیشترین استفاده از آنهاست جایگزین (دوگانگی)توزیع پارامتر انتظار ریاضی این توزیع مقدار نسبی (یا اشتراک گذاری) واحدهای جمعیتی که ویژگی مورد مطالعه را دارند (با حرف مشخص می شود). نسبت جمعیتی که این ویژگی را ندارند با حرف نشان داده می شود q (q = 1 - p). واریانس توزیع جایگزین نیز یک آنالوگ تجربی دارد.

بسته به نوع توزیع و روش انتخاب واحدهای جمعیتی، ویژگی های پارامترهای توزیع متفاوت محاسبه می شود. موارد اصلی برای توزیع های نظری و تجربی در جدول آورده شده است. 9.1.

کسر نمونه k nنسبت تعداد واحدهای جامعه نمونه به تعداد واحدهای جامعه عمومی را می گویند:

kn = n/N.

کسر نمونه wنسبت واحدهای دارای ویژگی مورد مطالعه است ایکسبه اندازه نمونه n:

w = n n / n.

مثال.در دسته ای از کالاهای حاوی 1000 واحد با نمونه 5 درصد سهم نمونه k nدر قدر مطلق 50 واحد است. (n = N*0.05)؛ اگر 2 محصول معیوب در این نمونه یافت شود، آنگاه نرخ عیب نمونه w 0.04 (w = 2/50 = 0.04 یا 4٪) خواهد بود.

از آنجایی که جامعه نمونه با جامعه عمومی متفاوت است، وجود دارد خطاهای نمونه گیری.

جدول 9.1 پارامترهای اصلی جمعیت عمومی و نمونه

خطاهای نمونه گیری

در هر صورت (مستمر و انتخابی) ممکن است دو نوع خطا رخ دهد: ثبت و نمایندگی. خطاها ثبتمی تواند داشته باشد تصادفیو نظامشخصیت. تصادفیخطاها از دلایل غیرقابل کنترل مختلف تشکیل شده اند، غیرعمدی هستند و معمولاً یکدیگر را متعادل می کنند (به عنوان مثال، تغییر در عملکرد دستگاه به دلیل نوسانات دما در اتاق).

نظامخطاها مغرضانه هستند زیرا قوانین انتخاب اشیاء برای نمونه را نقض می کنند (به عنوان مثال، انحراف در اندازه گیری ها هنگام تغییر تنظیمات دستگاه اندازه گیری).

مثال.برای ارزیابی وضعیت اجتماعی جمعیت شهر، نظرسنجی از 25 درصد خانواده ها در نظر گرفته شده است. اگر انتخاب هر چهارمین آپارتمان بر اساس تعداد آن باشد، خطر انتخاب تمام آپارتمان‌ها از یک نوع (مثلاً آپارتمان‌های یک اتاقه) وجود دارد که یک خطای سیستماتیک ایجاد می‌کند و نتایج را مخدوش می‌کند. انتخاب شماره آپارتمان به قید قرعه ارجح تر است، زیرا خطا تصادفی خواهد بود.

خطاهای نمایندگیفقط در مشاهده نمونه ذاتی هستند، نمی توان از آنها اجتناب کرد و در نتیجه این واقعیت ایجاد می شوند که جامعه نمونه به طور کامل جمعیت عمومی را بازتولید نمی کند. مقادیر شاخص های به دست آمده از نمونه با شاخص های همان مقادیر در جمعیت عمومی (یا از طریق مشاهده مداوم به دست آمده) متفاوت است.

سوگیری نمونه گیریتفاوت بین مقدار پارامتر در جامعه و مقدار نمونه آن است. برای مقدار متوسط ​​یک مشخصه کمی برابر است با: و برای سهم (ویژگی جایگزین) - .

خطاهای نمونه گیری فقط برای مشاهدات نمونه ذاتی هستند. هر چه این خطاها بزرگتر باشند، توزیع تجربی با توزیع نظری بیشتر متفاوت است. پارامترهای توزیع تجربی متغیرهای تصادفی هستند، بنابراین خطاهای نمونه گیری نیز متغیرهای تصادفی هستند، آنها می توانند مقادیر مختلفی را برای نمونه های مختلف بگیرند و بنابراین معمول است که محاسبه شود. خطای متوسط.

میانگین خطای نمونه گیریکمیتی است که انحراف معیار میانگین نمونه را از انتظارات ریاضی بیان می کند. این مقدار، با توجه به اصل انتخاب تصادفی، در درجه اول به حجم نمونه و به درجه تنوع مشخصه بستگی دارد: هر چه تغییرات مشخصه (و بنابراین مقدار) بیشتر و کوچکتر باشد، میانگین خطای نمونه برداری کوچکتر است. . رابطه بین واریانس های جمعیت عمومی و نمونه با فرمول بیان می شود:

آن ها وقتی به اندازه کافی بزرگ باشد، می توانیم فرض کنیم که . میانگین خطای نمونه گیری انحرافات احتمالی پارامتر جمعیت نمونه از پارامتر جمعیت عمومی را نشان می دهد. روی میز جدول 9.2 عباراتی را برای محاسبه میانگین خطای نمونه گیری برای روش های مختلف سازماندهی مشاهده نشان می دهد.

جدول 9.2 میانگین خطای (m) میانگین و نسبت نمونه برای انواع مختلف نمونه

میانگین واریانس های نمونه درون گروهی برای یک ویژگی پیوسته کجاست.

میانگین واریانس های درون گروهی نسبت.

- تعداد سری های انتخاب شده، - تعداد کل سری ها.

,

میانگین سری هفتم کجاست.

- میانگین کلی برای کل جامعه نمونه برای یک مشخصه پیوسته؛

,

سهم مشخصه در سری هفتم کجاست.

- سهم کل مشخصه در کل جامعه نمونه.

با این حال، بزرگی خطای متوسط ​​را فقط می توان با یک احتمال خاص P (P ≤ 1) قضاوت کرد. لیاپانوف A.M. ثابت کرد که توزیع میانگین‌های نمونه، و در نتیجه انحراف آنها از میانگین کلی، برای تعداد به اندازه کافی زیاد تقریباً از قانون توزیع نرمال پیروی می‌کند، مشروط بر اینکه جمعیت عمومی دارای میانگین محدود و واریانس محدود باشد.

از نظر ریاضی، این عبارت برای میانگین به صورت زیر بیان می شود:

و برای سهم، عبارت (1) به شکل زیر خواهد بود:

جایی که - وجود دارد خطای نمونه برداری حاشیه ای، که مضربی از میانگین خطای نمونه گیری است , و ضریب تعدد آزمون دانشجو («ضریب اطمینان») است که توسط W.S. Gosset (نام مستعار "دانشجو")؛ مقادیر برای اندازه های مختلف نمونه در یک جدول خاص ذخیره می شود.

مقادیر تابع Ф(t) برای برخی از مقادیر t برابر است با:

بنابراین عبارت (3) را می توان به صورت زیر خواند: با احتمال P = 0.683 (68.3٪)می توان استدلال کرد که تفاوت بین نمونه و میانگین عمومی بیش از یک مقدار خطای میانگین نخواهد بود m(t=1)، با احتمال P = 0.954 (95.4%)- اینکه از مقدار دو خطای متوسط ​​تجاوز نکند m (t = 2) ،با احتمال P = 0.997 (99.7%)- از سه مقدار تجاوز نخواهد کرد m (t = 3) .بنابراین، احتمال اینکه این اختلاف از سه برابر خطای متوسط ​​بیشتر شود، با تعیین می شود سطح خطاو بیشتر نمی شود 0,3% .

روی میز 9.3 فرمول هایی را برای محاسبه حداکثر خطای نمونه گیری نشان می دهد.

جدول 9.3 خطای نهایی (D) نمونه برای میانگین و نسبت (p) برای انواع مختلف مشاهده نمونه

تعمیم نتایج نمونه به جامعه

هدف نهایی مشاهده نمونه، مشخص کردن جمعیت عمومی است. با حجم نمونه کوچک، تخمین های تجربی پارامترهای (و) ممکن است به طور قابل توجهی از مقادیر واقعی آنها (و) منحرف شود. بنابراین، نیاز به ایجاد مرزهایی وجود دارد که در آن مقادیر واقعی (و) برای مقادیر نمونه پارامترهای (و) قرار دارند.

فاصله اطمیناناز هر پارامتر θ از جمعیت عمومی، محدوده تصادفی مقادیر این پارامتر است که با احتمال نزدیک به 1 ( قابلیت اطمینان) حاوی مقدار واقعی این پارامتر است.

خطای حاشیه اینمونه ها Δ به شما امکان می دهد مقادیر محدود کننده ویژگی های جمعیت عمومی و آنها را تعیین کنید فاصله اطمینان، که برابر هستند:

خط پایین فاصله اطمینانبا تفریق به دست می آید حداکثر خطااز میانگین نمونه (سهم)، و بالا با اضافه کردن آن.

فاصله اطمینانبرای میانگین از حداکثر خطای نمونه گیری استفاده می کند و برای یک سطح اطمینان معین با فرمول تعیین می شود:

این بدان معنی است که با یک احتمال معین آر، که سطح اطمینان نامیده می شود و به طور منحصر به فرد توسط مقدار تعیین می شود تی، می توان استدلال کرد که مقدار واقعی میانگین در محدوده از قرار دارد ، و ارزش واقعی سهم در محدوده از

هنگام محاسبه فاصله اطمینان برای سه سطح اطمینان استاندارد P = 95٪، P = 99٪ و P = 99.9٪مقدار توسط انتخاب می شود. برنامه های کاربردی بسته به تعداد درجات آزادی. اگر حجم نمونه به اندازه کافی بزرگ باشد، مقادیر مربوط به این احتمالات است تیبرابر هستند: 1,96, 2,58 و 3,29 . بنابراین، خطای نمونه گیری حاشیه ای به ما اجازه می دهد تا مقادیر محدود کننده ویژگی های جامعه و فواصل اطمینان آنها را تعیین کنیم:

توزیع نتایج مشاهده نمونه بین جمعیت عمومی در تحقیقات اجتماعی-اقتصادی ویژگی های خاص خود را دارد، زیرا مستلزم نمایش کامل همه انواع و گروه های آن است. مبنای امکان چنین توزیعی محاسبه است خطای مربوطه:

جایی که Δ % - حداکثر خطای نمونه گیری نسبی. ، .

دو روش اصلی برای گسترش یک مشاهده نمونه به یک جامعه وجود دارد: محاسبه مجدد مستقیم و روش ضریب.

ذات تبدیل مستقیمشامل ضرب میانگین نمونه!!\overline(x) در اندازه جامعه است.

مثال. بگذارید میانگین تعداد کودکان نوپا در شهر به روش نمونه گیری برآورد شود و به یک نفر برسد. اگر 1000 خانواده جوان در شهر وجود داشته باشد، تعداد مکان های مورد نیاز در مهدکودک های شهرداری از ضرب این میانگین در تعداد جمعیت عمومی N = 1000 به دست می آید. 1200 صندلی خواهد داشت.

روش شانستوصیه می شود در مواردی که مشاهده انتخابی انجام می شود به منظور شفاف سازی داده های مشاهده مداوم استفاده شود.

فرمول زیر استفاده می شود:

که در آن همه متغیرها اندازه جمعیت هستند:

حجم نمونه مورد نیاز

جدول 9.4 حجم نمونه مورد نیاز (n) برای انواع مختلف سازمان مشاهده نمونه

هنگام برنامه ریزی یک مشاهده نمونه با مقدار از پیش تعیین شده خطای نمونه گیری مجاز، لازم است به درستی برآورد مورد نیاز انجام شود. اندازهی نمونه. این حجم را می توان بر اساس خطای مجاز در حین مشاهده نمونه بر اساس یک احتمال مشخص که مقدار مجاز سطح خطا را تضمین می کند (با در نظر گرفتن روش سازماندهی مشاهده) تعیین می شود. فرمول های تعیین اندازه نمونه مورد نیاز n را می توان به راحتی مستقیماً از فرمول های حداکثر خطای نمونه گیری به دست آورد. بنابراین، از عبارت برای خطای حاشیه ای:

اندازه نمونه به طور مستقیم تعیین می شود n:

این فرمول نشان می دهد که با کاهش حداکثر خطای نمونه گیری Δ حجم نمونه مورد نیاز به طور قابل توجهی افزایش می یابد که متناسب با واریانس و مجذور آزمون t Student است.

برای یک روش خاص سازماندهی مشاهده، حجم نمونه مورد نیاز طبق فرمول های ارائه شده در جدول محاسبه می شود. 9.4.

مثال های عملی محاسبه

مثال 1. محاسبه مقدار میانگین و فاصله اطمینان برای یک مشخصه کمی پیوسته.

برای ارزیابی سرعت تسویه با طلبکاران، نمونه‌ای تصادفی شامل 10 سند پرداخت در بانک انجام شد. مقادیر آنها برابر بود (در روز): 10؛ 3; 15; 15; 22; 7; 8; 1 19; 20.

با احتمال لازم P = 0.954خطای حاشیه ای را تعیین کنید Δ میانگین نمونه و حدود اطمینان میانگین زمان محاسبه.

راه حل.مقدار متوسط ​​با استفاده از فرمول جدول محاسبه می شود. 9.1 برای جامعه نمونه

واریانس با استفاده از فرمول جدول محاسبه می شود. 9.1.

میانگین مربعات خطای روز

میانگین خطا با استفاده از فرمول محاسبه می شود:

آن ها میانگین است x ± m = 12.0 ± 2.3 روز.

پایایی میانگین بود

حداکثر خطا را با استفاده از فرمول جدول محاسبه می کنیم. 9.3 برای نمونه گیری مکرر، از آنجایی که اندازه جمعیت ناشناخته است، و برای P = 0.954سطح اعتماد به نفس

بنابراین، مقدار متوسط ​​'x ± D = `x ± 2m = 12.0 ± 4.6 است، یعنی. مقدار واقعی آن در محدوده 7.4 تا 16.6 روز قرار دارد.

استفاده از جدول t Student. این برنامه به ما امکان می دهد نتیجه بگیریم که برای n = 10 - 1 = 9 درجه آزادی، مقدار به دست آمده با سطح معناداری 0.001 پوند قابل اعتماد است، یعنی. مقدار میانگین حاصل با 0 تفاوت معناداری دارد.

مثال 2. برآورد احتمال (سهم عمومی) ص.

روش نمونه گیری مکانیکی بررسی وضعیت اجتماعی 1000 خانواده نشان داد که نسبت خانواده های کم درآمد w = 0.3 (30%)(نمونه بود 2% ، یعنی n/N = 0.02). با سطح اطمینان مورد نیاز است p = 0.997شاخص را تعیین کنید آرخانواده های کم درآمد در سراسر منطقه

راه حل.بر اساس مقادیر تابع ارائه شده Ф(t)برای یک سطح اطمینان مشخص پیدا کنید P = 0.997معنی t = 3(به فرمول 3 مراجعه کنید). خطای حاشیه ای کسری wبا فرمول جدول تعیین کنید. 9.3 برای نمونه برداری غیر تکراری (نمونه برداری مکانیکی همیشه غیر تکراری است):

حداکثر خطای نمونه گیری نسبی در % خواهد بود:

احتمال (سهم عمومی) خانواده های کم درآمد منطقه خواهد بود р=w±Δw، و حد اطمینان p بر اساس نابرابری مضاعف محاسبه می شود:

w — Δ w ≤ p ≤ w — Δ w، یعنی مقدار واقعی p در زیر قرار دارد:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

بنابراین با احتمال 0.997 می توان عنوان کرد که سهم خانواده های کم درآمد در بین تمام خانواده های منطقه از 28.6 درصد تا 31.4 درصد متغیر است.

مثال 3.محاسبه مقدار میانگین و فاصله اطمینان برای یک مشخصه گسسته مشخص شده توسط یک سری فاصله.

روی میز 9.5. توزیع برنامه های کاربردی برای تولید سفارشات با توجه به زمان اجرای آنها توسط شرکت مشخص شده است.

جدول 9.5 توزیع مشاهدات بر اساس زمان ظهور

راه حل. میانگین زمان برای تکمیل سفارشات با استفاده از فرمول محاسبه می شود:

میانگین دوره خواهد بود:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 ماه.

اگر از داده های p i از ستون ماقبل آخر جدول استفاده کنیم، همین پاسخ را می گیریم. 9.5 با استفاده از فرمول:

توجه داشته باشید که وسط فاصله برای آخرین درجه بندی با تکمیل مصنوعی آن با عرض فاصله درجه بندی قبلی برابر با 60 - 36 = 24 ماه به دست می آید.

واریانس با استفاده از فرمول محاسبه می شود

جایی که x i- وسط سری فاصله.

بنابراین!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) و میانگین مربعات خطا .

میانگین خطا با استفاده از فرمول ماهانه محاسبه می شود. مقدار متوسط ​​!!\overline(x) ± m = 23.1 ± 13.4 است.

حداکثر خطا را با استفاده از فرمول جدول محاسبه می کنیم. 9.3 برای انتخاب مکرر، از آنجایی که اندازه جمعیت ناشناخته است، برای سطح اطمینان 0.954:

بنابراین میانگین این است:

آن ها مقدار واقعی آن در محدوده 0 تا 50 ماه قرار دارد.

مثال 4.برای تعیین سرعت تسویه با طلبکاران N = 500 شرکت سهامی در یک بانک تجاری، لازم است یک مطالعه نمونه با استفاده از روش انتخاب تصادفی غیر تکراری انجام شود. اندازه نمونه مورد نیاز n را تعیین کنید تا با احتمال 0.954 = P خطای میانگین نمونه از 3 روز تجاوز نکند اگر برآوردهای آزمایشی نشان داد که انحراف استاندارد s 10 روز است.

راه حل. برای تعیین تعداد مطالعات مورد نیاز n، از فرمول انتخاب غیر تکراری از جدول استفاده می کنیم. 9.4:

در آن، مقدار t از سطح اطمینان 0.954 = P تعیین می شود. برابر 2 است. مقدار میانگین مربع s = 10، اندازه جمعیت N = 500 و حداکثر خطای میانگین است. Δ x = 3. با جایگزینی این مقادیر در فرمول، دریافت می کنیم:

آن ها برای برآورد پارامتر مورد نیاز - سرعت تسویه حساب با طلبکاران، کافی است نمونه ای از 41 شرکت جمع آوری کنید.

نیاز به انجام مطالعات نمونه ممکن است به دلایل مختلفی ایجاد شود:

    اغلب مطالعه کامل پدیده مورد مطالعه بسیار پرهزینه و وقت گیر است.

    گاهی اوقات فرصت استفاده از اطلاعات دریافتی در یک مطالعه کامل ممکن است قبل از تکمیل فرآیند آماده سازی آن تمام شود.

    در برخی موارد، در نتیجه بررسی کیفیت محصول، شی مورد مطالعه از بین می رود.

مثال:

    فرض کنید جمعیت همه دانش آموزان مدرسه باشد (600 نفر از 20 کلاس، 30 نفر در هر کلاس). موضوع مطالعه نگرش نسبت به سیگار است.

جمعیتمجموعه ای از اشیاء است که شما نیاز به کسب اطلاعات در مورد آنها دارید.

جامعه عمومی شامل تمام اشیایی است که دارای کیفیات و خصوصیاتی هستند که مورد علاقه محقق است. گاهی اوقات جمعیت عمومی کل جمعیت بزرگسال یک منطقه خاص است (به عنوان مثال، هنگام مطالعه نگرش رای دهندگان بالقوه نسبت به یک نامزد)، اغلب معیارهای متعددی مشخص می شود که اهداف مطالعه را تعیین می کند. به عنوان مثال، زنان 10 تا 89 ساله که حداقل یک بار در هفته از مارک خاصی از کرم دست استفاده می کنند و درآمد حداقل 5 هزار روبل برای هر عضو خانواده دارند.

نمونهمجموعه کوچکی از اشیاء استخراج شده از جمعیت است.

جامعه نمونه حداقل مورد نیاز برای مطالعه نتایج (موارد، موضوعات، اشیاء، رویدادها، نمونه ها) است که با استفاده از یک روش خاص از جامعه عمومی انتخاب شده است.

مثال ها:

    شناسایی واکنش مشتریان شرکت به نوآوری ها؛ همه مشتریان شرکت نماینده عموم مردم هستند. آن دسته از مشتریانی که فراخوانده شدند، نمونه ای را تشکیل می دهند.

    هنگام حسابرسی موسسات با تعداد معاملات زیاد، باید به مطالعه تعداد منتخب معاملات بسنده کرد. تمام معاملات شرکت جامعه عمومی را تشکیل می دهند، آنهایی که انتخاب شدند نمونه را تشکیل می دهند.

    جمعیت عمومی شامل تمام سربازان وظیفه یک سال خاص است.

    تمام لامپ هایی که در یک دوره زمانی معین در یک شرکت خاص تولید می شوند یک جمعیت عمومی را تشکیل می دهند. آن لامپ هایی که برای کنترل انتخاب می شوند انتخاب می شوند.

نمونه ممکن است نماینده یا غیرنماینده در نظر گرفته شود. نمونه در هنگام بررسی گروه بزرگی از افراد نماینده خواهد بود، اگر در این گروه نمایندگانی از زیر گروه های مختلف وجود داشته باشد، این تنها راه برای نتیجه گیری صحیح است. .

نمایندگی، مطابقت ویژگی های نمونه با ویژگی های جامعه یا کل جمعیت است.نماینده بودن تعیین می کند که تا چه حد امکان تعمیم نتایج یک مطالعه با استفاده از یک نمونه خاص به کل جمعیتی که از آن جمع آوری شده است، وجود دارد.

نماینده بودن را می توان به عنوان ویژگی یک جامعه نمونه برای نشان دادن پارامترهای جامعه عمومی که از نقطه نظر اهداف تحقیق مهم هستند، تعریف کرد.

مثال:نمونه ای متشکل از 60 دانش آموز دبیرستانی نسبت به نمونه ای از همان 60 نفر که شامل 3 دانش آموز از هر پایه است، جامعه را بسیار کمتر نشان می دهد. دلیل اصلی این امر توزیع نابرابر سنی در طبقات است. در نتیجه، در حالت اول، بازنمایی نمونه کم و در حالت دوم، بازنمایی زیاد است (همه موارد دیگر برابر هستند). .

وظیفه 1.در شهری با 253000 رأی دهنده واجد شرایط، در مورد تمایلات سیاسی رأی دهندگان آینده تحقیق کنید.

راه حل

    نمونه را می توان با مصاحبه با هر پانزدهمین خریدار که از یک مرکز خرید بزرگ خارج می شود، ساخت. چنین نمونه ای دیدگاه بازدیدکنندگان مرکز خرید را منعکس می کند، اما بعید است که نمایانگر دیدگاه همه ساکنان شهر باشد.

    روش دیگر ساخت نمونه، بررسی تلفنی از هر 100 ساکن شهر با گرفتن شماره از دفترچه تلفن است. این نمونه گیری سیستماتیک اطلاعاتی در مورد نظرات گروهی از افرادی که تلفن دارند، در خانه هستند و به تلفن پاسخ می دهند، ارائه می دهد. اما منعکس کننده نظرات همه ساکنان شهر نیست.

    روش دیگر برای ساختن نمونه ممکن است مصاحبه با شرکت کنندگان در یک گردهمایی سازماندهی شده توسط چندین حزب سیاسی باشد. چنین نمونه ای اطلاعاتی را در مورد ساکنینی که فعالانه در زندگی سیاسی شهر شرکت می کنند ارائه می دهد.

بنابراین، ما به روش هایی برای تشکیل نمونه ای نیاز داریم که نمایانگر کل جامعه باشد، یعنی نمونه باید نماینده (نماینده) باشد.

وظیفه 2.معرف بودن نمونه را مشخص کنید:

1) تعداد تصادفات رانندگی در خرداد ماه در صورت نیاز به تهیه گزارش آماری تصادفات در شهر برای سال.

2) ساکنان شهری هنگام محاسبه تعداد خودروهای سرانه در کشور.

3) افراد 40 تا 50 ساله هنگام تعیین رتبه یک برنامه تلویزیونی جوانان.

راه حل

1) نمونه نماینده نیست. در تابستان هیچ برف و یخبندان در جاده ها وجود ندارد و این یکی از عوامل اصلی تصادفات است.

2) نمونه نماینده نیست. واضح است که تعداد خودروها در شهر بسیار بیشتر از مناطق روستایی است. این باید در نظر گرفته شود.

3) نمونه نماینده نیست. بعید است که افراد بین 40 تا 50 سال به برنامه ای با هدف مخاطبان جوان علاقه نشان دهند. هنگام استفاده از چنین نمونه ای، رتبه ممکن است به طور قابل توجهی کاهش یابد، اما این وضعیت واقعی امور را منعکس نمی کند. برای تشکیل جامعه نمونه از روش های مختلف انتخاب استفاده می شود. آمار باید به گونه ای ارائه شود که بتوان از آنها استفاده کرد.

جمعیت و پارامترهای نمونه

N جمعیت عمومی است که به اقشار N 1، N 2 و غیره تقسیم می شود.

اقشاراز نظر ویژگی های آماری اشیاء همگن را نشان می دهد (به عنوان مثال، جمعیت بر اساس گروه های سنی یا طبقه اجتماعی به اقشار تقسیم می شود؛ شرکت ها - بر اساس صنعت). در این حالت به نمونه ها طبقه بندی می گویند.

N - حجم نمونه

نتیجه‌گیری آماری پژوهش بر اساس توزیع متغیر تصادفی X است، در حالی که مقادیر مشاهده‌شده x 1، x 2، x 3 تحقق متغیر تصادفی x نامیده می‌شوند.

توزیع یک متغیر تصادفی X در جمعیت عمومی ماهیتی نظری و ایده آل دارد و نمونه آنالوگ آن یک توزیع تجربی است.

برای یک نمونه، تعیین تابع توزیع دشوار و گاهی غیرممکن است، بنابراین پارامترها از داده‌های تجربی تخمین زده می‌شوند و سپس به یک عبارت تحلیلی که توزیع نظری را توصیف می‌کند، جایگزین می‌شوند. در این مورد، فرض در مورد نوع توزیع می تواند از نظر آماری صحیح یا اشتباه باشد.

اما در هر صورت، توزیع تجربی بازسازی شده از نمونه، تنها به طور تقریبی توزیع واقعی را مشخص می کند.

مهمترین پارامترهای توزیع، انتظارات ریاضی استآو واریانس σ 2- اندازه گیری پراکندگی داده ها

انحراف معیارσ - درجه انحراف داده ها یا مجموعه های مشاهده ای از مقدار متوسط.

وظیفه 3.میخائیل و دوستانش تصمیم گرفتند قد سگ های خود را (در قسمت جثه) اندازه گیری کنند. یافتن: مقدار متوسط; انحراف رشد

راه حل

    انتظارات ریاضی یا مقدار میانگین را می توان با استفاده از فرمول پیدا کرد:


    حالا بیایید انحراف قد هر سگ را از میانگین یا انتظار ریاضی محاسبه کنیم، یعنی پراکندگی را محاسبه می کنیم.


انحراف معیار فقط جذر واریانس است.

σ \ = 147,32

بنابراین، با دانستن انحراف معیار می دانیم که "قد نرمال" به چه معناست، و سگ بسیار بلند و بسیار کوچک چیست.

پاسخ: 394، 21704; 147.32.

وظیفه 4.مشاهده در یک آزمایشگاه کنترل از عمر مفید 50 لامپ الکتریکی با همان قدرت، که به طور تصادفی از یک دسته بزرگ لامپ با همان قدرت تولید شده توسط کارخانه گرفته شده است، منجر به داده های زیر در مورد نقض ضمانت نامه شد.زمان سوختن:

انحراف در اچ

10 توزیع کوچک، که منعکس کننده انحراف واقعی است هفتمدوره سوختن لامپ از گارانتی.

راه حل.

انحراف متوسط

بنابراین، توزیع نرمال مورد نظر با مقادیر پارامتر زیر مشخص می شود: a = 0.4;σ 2 = 318; σ = 17.8.

بنابراین چگالی احتمال:

تابع توزیع مربوط به این چگالی به صورت زیر خواهد بود: