عامة السكان والعينة. السكان عامة وعينة. طريقة أخذ العينات

100 صمكافأة من الدرجة الأولى

اختر نوع العمل عمل التخرج عمل الدورةملخص أطروحة الماجستير تقرير عن ممارسة مراجعة تقرير المادة امتحانمونوغراف حل المشكلات خطة الأعمال إجابات على الأسئلة عمل ابداعيمقال رسم مقالات عروض ترجمة كتابة أخرى زيادة تفرد النص أطروحة دكتوراه العمل المخبريمساعدة عبر الإنترنت

اسأل عن السعر

عموم السكان هو المجموعة الإحصائية الكاملة للأشياء و / أو الظواهر التي تمت دراستها بواسطة طريقة أخذ العينات الحياة العامةوجود سمات نوعية مشتركة أو متغيرات كمية.

العدد الإجمالي لأشياء المراقبة (الأشخاص ، والأسر ، والمؤسسات ، المستوطناتإلخ) ، والتي لها مجموعة معينة من الخصائص (الجنس ، والعمر ، والدخل ، والعدد ، والدوران ، وما إلى ذلك) ، ومحدودة في المكان والزمان. أمثلة على السكان:
- جميع سكان موسكو (10.6 مليون نسمة حسب تعداد عام 2002)
- سكان موسكو (4.9 مليون نسمة حسب تعداد عام 2002)
- الكيانات القانونيةروسيا (2.2 مليون في بداية 2005)
- منافذ البيع بالتجزئة التي تبيع المنتجات الغذائية (20 ألف في بداية عام 2008) ، إلخ.

التعريف الصحيح لـ G.S. وخصائصه مهمة للغاية لاختيار تصميم البحث - استراتيجية لبناء عينة تمثيلية ( سم.). أهم الخصائصج. هي نطاقها وتوافر العناصر التي يجب تحديدها.

من وجهة نظر الحجم ، من المعتاد تحديد G.S. المحدود واللانهائي. هذا التقسيم تقني بحت ، ويرجع ذلك إلى خصائص إجراءات تقدير حجم وأخطاء عينة تمثيلية احتمالية (عشوائية). تعتبر GS نهائية ، وعددها مماثل لحجم العينة. إذا تجاوز حجم العينة نسبة مئوية قليلة من سكان FS ، فيجب تقدير خطأ أخذ العينات عن طريق ضبط حجم F.S.

يُطلق على Infinite GS ، حجمها ، مقارنة بحجم عينة عشوائية تمثيلية ، كبير بشكل غير متناسب. بالمعنى الدقيق للكلمة ، كل ج. في العلوم الاجتماعية محدودة (حتى لو كان عددهم عدة مليارات) ، ولكن في الممارسة العملية جي. يمكن اعتباره غير محدود إذا كان حجم العينة ، الذي يوفر مستوى مقبولًا من الخطأ ، لا يتجاوز 1-2٪ من عددها. في بعض الأحيان يرتبط مفهوم اللانهاية مباشرة بحجم GS ، على سبيل المثال ، أكثر من مائة ألف كائن.

يُطلق على G.S. ، الانتماء الواضح أو الثابت ، محددًا. بالنسبة لـ G.S. من السهل تحديد الحجم والحصول عليه نسبيًا القائمة الكاملةمن عناصرها - إطار أخذ العينات (انظر. أساس أخذ العينات). على سبيل المثال ، يمكن الحصول على قائمة بالمقيمين البالغين في المدينة في جدول العناوين وقوائم الطلاب مدينة كبيرة- في الجامعات. إذا كان G.S. كبير جدًا (على سبيل المثال ، عدد سكان بلد ما) ، يمكن الحصول على قوائم لجميع دوله الأجزاء الهيكلية. بناء عينة تمثيلية من العشوائية ( سم.) لـ G.S. ممكن دائما من الناحية الفنية ؛ قد تنشأ مشاكل بسبب ضيق الوقت أو الموظفين المؤهلين أو الموارد المادية.

G.S. ، التي لا يمكن تأسيسها إلا نتيجة لإجراءات مستهدفة أو دراسات خاصة ، تسمى افتراضية. إلى مثل G.S. تشمل ، على سبيل المثال ، جمهور QMS (لا يمكنك معرفة ما إذا كان شخص ما قد شاهد إعلانًا تجاريًا معينًا ما لم تسأله عن ذلك) ، والمعجبين من أنواع معينة أسماك الزينة، خبراء في مشكلة ضيقة ، إلخ. لتحديد حجم بعض G.S. هناك حاجة أيضًا إلى دراسات خاصة. امكانية تكوين عينة تمثيلية عشوائية ( سم.) لـ G.S. الحجم الكبير يمثل مشكلة في كثير من الحالات.

المعلمة السكان- مصطلح إحصائي يستخدم لتحديد أي خاصية كمية لعامة السكان ( سم.). القيمة المتوقعة ( سم.)، التباين ( سم.)، احتمالا ( سم.) استجابة إيجابية ، معامل الارتباط بين متغيرين عشوائيين ( سم.) هي G.S.P. خصائص عينة مماثلة ( سم.) تسمى إحصائيات أخذ العينات ( سم.).

عينة (عينة من السكان) -مجموعة من الحالات (الموضوعات ، الأشياء ، الأحداث ، العينات) ، باستخدام إجراء معين ، يتم اختيارها من عامة السكان للمشاركة في الدراسة.
تم اختيار جزء من الكائنات من السكان للدراسة من أجل استخلاص استنتاج حول السكان بالكامل. من أجل توسيع الاستنتاج الذي تم الحصول عليه من خلال دراسة العينة ليشمل جميع السكان ، يجب أن يكون للعينة خاصية كونها تمثيلية.

خصائص العينة:

الخصائص النوعية للعينة - من نختار بالضبط وما هي طرق بناء العينة التي نستخدمها لهذا الغرض.

السمة الكمية للعينة هي عدد الحالات التي نختارها ، بمعنى آخر ، حجم العينة.

حجم العينة- عدد الحالات المشمولة في العينة. لأسباب إحصائية ، يوصى بأن يكون عدد الحالات 30-35 على الأقل.

غالبًا ما يتم فحص مجموعة من الكائنات المتجانسة فيما يتعلق ببعض الميزات التي تميزها ، ويتم قياسها كميًا أو نوعيًا.

على سبيل المثال ، إذا كانت هناك مجموعة من الأجزاء ، فيمكن أن يكون حجم الجزء وفقًا لـ GOST علامة كمية ، ويمكن أن تكون مواصفة الجزء علامة جودة.

إذا لزم الأمر ، يتم فحصهم للتأكد من امتثالهم للمعايير ، وأحيانًا يلجأون إلى مسح كامل ، ولكن نادرًا ما يتم استخدام هذا في الممارسة. على سبيل المثال ، إذا كان عامة السكان يحتويون على عدد كبير من الكائنات قيد الدراسة ، فمن المستحيل عمليا إجراء مسح مستمر. في هذه الحالة ، يتم تحديد عدد معين من العناصر (العناصر) من جميع السكان ويتم فحصها. وبالتالي ، هناك مجتمع عام وعينة.

الاسم العام هو مجموع كل الأشياء التي تخضع للفحص أو الدراسة. يحتوي عموم السكان ، كقاعدة عامة ، على عدد محدود من العناصر ، ولكن إذا كان كبيرًا جدًا ، فمن أجل تبسيط الحسابات الرياضية ، يُفترض أن السكان بأكمله يتكون من عدد لا يحصى من العناصر.

عينة أو عينة من السكان هي جزء من العناصر المحددة من المجتمع بأكمله. يمكن تكرار أخذ العينات أو عدم تكرارها. في الحالة الأولى ، يتم إرجاعها إلى عامة السكان ، وفي الحالة الثانية ، لا يتم إرجاعها. في الممارسة العملية ، يتم استخدام الاختيار العشوائي غير المتكرر في كثير من الأحيان.

يجب أن يكون السكان والعينة مرتبطين ببعضهما البعض من خلال التمثيل. بمعنى آخر ، من أجل أن تكون خصائص عينة السكان قادرة على تحديد خصائص المجتمع بأكمله بثقة ، من الضروري أن تمثلها عناصر العينة بأكبر قدر ممكن من الدقة. بمعنى آخر ، يجب أن تكون العينة تمثيلية (تمثيلية).

ستكون العينة أكثر أو أقل تمثيلية إذا تم سحبها بشكل عشوائي من جدًا عدد كبيرالمجموع الكلي. يمكن مناقشة هذا على أساس ما يسمى بقانون الأعداد الكبيرة. في هذه الحالة ، يكون لجميع العناصر احتمالية متساوية لتضمينها في العينة.

متاح خيارات مختلفةاختيار. يمكن تقسيم كل هذه الطرق ، من حيث المبدأ ، إلى خيارين:

  • الخيار 1. يتم تحديد العناصر عندما لا يتم تقسيم السكان إلى أجزاء. يتضمن هذا المتغير اختيارات عشوائية بسيطة متكررة وغير متكررة.
  • الخيار 2. ينقسم السكان عامة إلى أجزاء ويتم اختيار العناصر. وتشمل هذه التحديدات النموذجية والميكانيكية والمتسلسلة.

عشوائي بسيط - اختيار يتم فيه استخراج العناصر واحدًا تلو الآخر من جميع السكان بشكل عشوائي.

نموذجي هو التحديد الذي يتم فيه اختيار العناصر ليس من المجتمع بأكمله ، ولكن من جميع أجزائه "النموذجية".

ميكانيكي - هذا هو الاختيار ، عندما يتم تقسيم السكان بالكامل إلى عدد المجموعات ، يساوي الرقمالعناصر التي يجب أن تكون في العينة ، وبالتالي ، يتم اختيار عنصر واحد من كل مجموعة. على سبيل المثال ، إذا كان من الضروري تحديد 25٪ من الأجزاء التي تصنعها الآلة ، فسيتم تحديد كل جزء رابع ، وإذا كانت هناك حاجة إلى 4٪ من الأجزاء ، فسيتم تحديد كل جزء خامس وعشرين ، وهكذا. في الوقت نفسه ، يجب القول أن الانتقاء الميكانيكي في بعض الأحيان قد لا يوفر ما يكفي

المسلسل - هذا اختيار يتم فيه اختيار العناصر من جميع السكان في "سلسلة" تخضع للبحث المستمر ، وليس واحدًا تلو الآخر. على سبيل المثال ، عندما يتم تصنيع الأجزاء بواسطة عدد كبير من الآلات الأوتوماتيكية ، يتم إجراء مسح كامل فقط فيما يتعلق بمنتجات العديد من الآلات. يستخدم الاختيار التسلسلي إذا كانت السمة قيد الدراسة بها القليل من التباين في السلاسل المختلفة.

لتقليل الخطأ ، يتم استخدام تقديرات عامة السكان بمساعدة عينة. علاوة على ذلك ، يمكن أن يكون التحكم الانتقائي أحادي المرحلة ومتعدد المراحل ، مما يزيد من موثوقية المسح.

سكان


يتكون المجتمع الإحصائي من كائنات موجودة فعليًا (موظفون ، مؤسسات ، دول ، مناطق) ، هو كائن
البحث الإحصائي. سكان
- مجموعة من الوحدات ذات الطابع الكتلي والنموذجي والتوحيد النوعي ووجود التباين.

وحدة السكان- كل وحدة محددة من المجتمع الإحصائي.

يمكن أن تكون نفس المجموعة الإحصائية متجانسة في ميزة واحدة وغير متجانسة في أخرى.

التوحيد النوعي- تشابه جميع وحدات السكان على أي أساس واختلاف على جميع البقية.

في مجتمع إحصائي ، تكون الاختلافات بين وحدة من السكان وأخرى ذات طبيعة كمية في كثير من الأحيان. التغييرات الكمية في قيم السمة للوحدات المختلفة من السكان تسمى التباين.

ميزة الاختلاف- التغيير الكمي للعلامة (للعلامة الكمية) أثناء الانتقال من وحدة من السكان إلى أخرى.

لافتة- هذه خاصية أو خاصية أو سمة أخرى للوحدات والأشياء والظواهر التي يمكن ملاحظتها أو قياسها. تنقسم العلامات إلى كمية ونوعية. يسمى التنوع والتنوع في قيمة الميزة في الوحدات الفردية للسكان تفاوت.

السمات (النوعية) غير قابلة للقياس الكمي (تكوين السكان حسب الجنس). الخصائص الكمية لها تعبير رقمي (تكوين السكان حسب العمر).

فِهرِس- هذه خاصية كمية ونوعية معممة لأي خاصية من وحدات أو مجاميع للغرض في ظروف محددة من الزمان والمكان.

بطاقة الأداء- عبارة عن مجموعة من المؤشرات تعكس بشكل شامل الظاهرة قيد الدراسة.

على سبيل المثال ، ضع في اعتبارك الراتب:
  • تسجيل - الأجور
  • الإحصاء السكاني - جميع العاملين
  • وحدة التجميع - كل عامل
  • التجانس النوعي - الراتب المستحق
  • اختلاف الميزة - سلسلة من الأرقام

عامة السكان وعينة منه

أساس البحث الإحصائي هو مجموعة من البيانات التي تم الحصول عليها نتيجة قياس واحدة أو أكثر من الخصائص. مجموعة من الأشياء المرصودة حقًا ، ممثلة إحصائيًا بسلسلة من الملاحظات متغير عشوائي، يكون أخذ العينات، والموجودة افتراضيًا (مدروسة) - عامه السكان. يمكن أن يكون عامة السكان محددين (عدد الملاحظات N = const) أو لانهائي ( N = ∞) ، وعينة من عامة السكان تكون دائمًا نتيجة لعدد محدود من الملاحظات. يتم استدعاء عدد الملاحظات التي تتكون منها العينة حجم العينة. إذا كان حجم العينة كبيرًا بدرجة كافية ن → ∞) تعتبر العينة كبير، وإلا فإنه يسمى عينة حجم محدود. تعتبر العينة صغير، إذا ، عند قياس متغير عشوائي أحادي البعد ، لا يتجاوز حجم العينة 30 ( ن<= 30 ) ، وعند قياس عدة ( ك) في علاقة فضاء متعددة الأبعاد نل كلا يتجاوز 10 (ن / ك< 10) . نماذج النماذج سلسلة الاختلافإذا كان أعضائها إحصائيات الطلب، أي قيم عينة للمتغير العشوائي Xيتم فرزها بترتيب تصاعدي (مرتبة) ، يتم استدعاء قيم السمة خيارات.

مثال. تقريبًا نفس مجموعة الكائنات المختارة عشوائيًا - البنوك التجارية لمنطقة إدارية واحدة في موسكو ، يمكن اعتبارها عينة من عموم السكان لجميع البنوك التجارية في هذه المنطقة ، وكعينة من عموم السكان في جميع البنوك التجارية في موسكو وكذلك عينة من البنوك التجارية في الدولة وغيرها.

طرق أخذ العينات الأساسية

تعتمد موثوقية الاستنتاجات الإحصائية والتفسير الهادف للنتائج على التمثيليةالعينات ، أي اكتمال وكفاية عرض خصائص عامة السكان ، والتي يمكن اعتبار هذه العينة ممثلة لها. يمكن تنظيم دراسة الخصائص الإحصائية للسكان بطريقتين: استخدام مستمرو ملاحظة غير متسقة. المراقبة المستمرةيشمل فحص الجميع الوحداتدرس تجمعات، أ المراقبة غير المستمرة (الانتقائية)- أجزاء منه فقط.

هناك خمس طرق رئيسية لتنظيم أخذ العينات:

1. اختيار عشوائي بسيط، حيث يتم اختيار الكائنات عشوائيًا من المجموعة العامة للكائنات (على سبيل المثال ، باستخدام جدول أو مولد أرقام عشوائي) ، ولكل من العينات الممكنة احتمالية متساوية. تسمى هذه العينات في الواقع عشوائي;

2. اختيار بسيط من خلال إجراء منتظميتم تنفيذها باستخدام مكون ميكانيكي (على سبيل المثال ، التواريخ ، أيام الأسبوع ، أرقام الشقق ، أحرف الأبجدية ، إلخ) ويتم استدعاء العينات التي تم الحصول عليها بهذه الطريقة ميكانيكي;

3. طبقيةيتكون الاختيار من حقيقة أن السكان العامين للحجم ينقسمون إلى مجموعات فرعية أو طبقات (طبقات) من الحجم بحيث. الطبقات هي كائنات متجانسة من حيث الخصائص الإحصائية (على سبيل المثال ، ينقسم السكان إلى طبقات حسب الفئة العمرية أو الطبقة الاجتماعية ؛ الشركات - حسب الصناعة). في هذه الحالة ، يتم استدعاء العينات طبقية(خلاف ذلك، طبقية ، نموذجية ، مقسمة إلى مناطق);

4. الأساليب مسلسلاختيار تستخدم لتشكيل مسلسلأو عينات متداخلة. إنها مناسبة إذا كان من الضروري فحص "كتلة" أو سلسلة من الأشياء في وقت واحد (على سبيل المثال ، شحنة من السلع ، أو منتجات سلسلة معينة ، أو مجموعة من السكان في التقسيم الإقليمي-الإداري للبلد). يمكن اختيار السلاسل بطريقة عشوائية أو ميكانيكية. في الوقت نفسه ، يتم إجراء مسح مستمر لمجموعة معينة من السلع ، أو وحدة إقليمية كاملة (مبنى سكني أو ربع) ؛

5. مجموعيمكن أن يجمع الاختيار (المتدرج) عدة طرق اختيار في وقت واحد (على سبيل المثال ، الطبقي والعشوائي أو العشوائي والميكانيكي) ؛ تسمى هذه العينة مجموع.

أنواع التحديد

بواسطة عقلهناك اختيار فردي وجماعي ومشترك. في الاختيار الفردييتم اختيار الوحدات الفردية من عامة السكان في مجموعة العينة ، مع اختيار المجموعة- المجموعات المتجانسة نوعيا (سلسلة) من الوحدات ، و الاختيار المشتركيتضمن مزيجًا من النوعين الأول والثاني.

بواسطة طريقةاختيار يميز متكرر وغير متكررعينة.

لا يتكرريسمى بالاختيار ، حيث لا تعود الوحدة التي تندرج في العينة إلى السكان الأصليين ولا تشارك في الاختيار الإضافي ؛ بينما عدد الوحدات من عامة السكان نخفضت خلال عملية الاختيار. في معاداختيار أمسكفي العينة ، يتم إرجاع الوحدة بعد التسجيل إلى عامة السكان وبالتالي تحتفظ بفرصة متساوية ، إلى جانب الوحدات الأخرى ، لاستخدامها في إجراءات الاختيار الإضافية ؛ بينما عدد الوحدات من عامة السكان نيبقى دون تغيير (الطريقة نادرا ما تستخدم في الدراسات الاجتماعية والاقتصادية). ومع ذلك ، مع كبير N (N → ∞)الصيغ الخاصة بـ غير متكررالاختيار قريبة من تلك الخاصة بـ معادالاختيار وهذا الأخير يستخدم في كثير من الأحيان ( N = const).

الخصائص الرئيسية لمعايير المجتمع العام وعينة السكان

أساس الاستنتاجات الإحصائية للدراسة هو توزيع متغير عشوائي مع القيم المرصودة (× 1 ، × 2 ، ... ، × ن)تسمى تحقيق المتغير العشوائي X(ن - حجم العينة). يعتبر توزيع المتغير العشوائي في عموم السكان نظريًا ، ومثاليًا بطبيعته ، وعينته التماثلية تجريبيتوزيع. يتم إعطاء بعض التوزيعات النظرية بشكل تحليلي ، أي هُم خياراتتحديد قيمة دالة التوزيع في كل نقطة في فضاء القيم الممكنة للمتغير العشوائي. بالنسبة لعينة ، من الصعب ، وأحيانًا المستحيل ، تحديد دالة التوزيع ، لذلك خياراتيتم تقديرها من البيانات التجريبية ، ثم يتم استبدالها في تعبير تحليلي يصف التوزيع النظري. في هذه الحالة ، فإن الافتراض (أو فرضية) حول نوع التوزيع يمكن أن يكون صحيحًا وخاطئًا من الناحية الإحصائية. ولكن على أي حال ، فإن التوزيع التجريبي الذي أعيد بناؤه من العينة يميز فقط التوزيع الحقيقي تقريبًا. أهم معلمات التوزيع هي القيمة المتوقعةوالتشتت.

بطبيعتها ، التوزيعات مستمرو منفصلة. أشهر توزيع مستمر هو طبيعي. نظائرها الانتقائية للمعلمات ومن أجلها هي: القيمة المتوسطة والتباين التجريبي. من بين الدراسات المنفصلة في الدراسات الاجتماعية والاقتصادية ، الأكثر استخدامًا بديل (ثنائي التفرع)توزيع. تعبر معلمة توقع هذا التوزيع عن القيمة النسبية (أو يشارك) وحدات السكان التي لها الخاصية قيد الدراسة (يشار إليها بالحرف) ؛ يتم الإشارة إلى نسبة السكان الذين لا يمتلكون هذه الميزة بالحرف ف (ف = 1 - ع). تباين التوزيع البديل له أيضًا نظير تجريبي.

اعتمادًا على نوع التوزيع وطريقة اختيار الوحدات السكانية ، يتم حساب خصائص معلمات التوزيع بشكل مختلف. ويرد في الجدول أهم التوزيعات النظرية والتجريبية. 9.1

عينة حصة k nهي نسبة عدد وحدات عينة السكان إلى عدد الوحدات من عامة السكان:

ك ن = ن / ن.

عينة حصة ثهي نسبة الوحدات التي لها الخاصية قيد الدراسة xلحجم العينة ن:

ث = ن ن / ن.

مثال.في دفعة من البضائع تحتوي على 1000 وحدة ، بعينة 5٪ جزء العينة k nفي القيمة المطلقة 50 وحدة. (ن = N * 0.05) ؛ إذا تم العثور على منتجين معيبين في هذه العينة ، إذن جزء العينة ثسيكون 0.04 (ث = 2/50 = 0.04 أو 4٪).

نظرًا لأن عينة السكان تختلف عن عامة السكان ، فهناك أخطاء أخذ العينات.

الجدول 9.1 المعلمات الرئيسية لعامة السكان وعينة السكان

سكان- مجموعة من الوحدات ذات الطابع الكتلي والنموذجي والتوحيد النوعي ووجود التباين.

يتكون المجتمع الإحصائي من كائنات موجودة فعليًا (موظفون ، مؤسسات ، دول ، مناطق) ، هو كائن.

وحدة السكان- كل وحدة محددة من المجتمع الإحصائي.

يمكن أن تكون نفس المجموعة الإحصائية متجانسة في ميزة واحدة وغير متجانسة في أخرى.

التوحيد النوعي- تشابه جميع وحدات السكان مع أي خاصية واختلاف لكل البقية.

في مجتمع إحصائي ، تكون الاختلافات بين وحدة من السكان وأخرى ذات طبيعة كمية في كثير من الأحيان. التغييرات الكمية في قيم السمة للوحدات المختلفة من السكان تسمى التباين.

ميزة الاختلاف- التغيير الكمي للعلامة (للعلامة الكمية) أثناء الانتقال من وحدة من السكان إلى أخرى.

لافتة- هذه خاصية أو خاصية أو سمة أخرى للوحدات والأشياء والظواهر التي يمكن ملاحظتها أو قياسها. تنقسم العلامات إلى كمية ونوعية. يسمى التنوع والتنوع في قيمة الميزة في الوحدات الفردية للسكان تفاوت.

السمات (النوعية) غير قابلة للقياس الكمي (تكوين السكان حسب الجنس). الخصائص الكمية لها تعبير رقمي (تكوين السكان حسب العمر).

فِهرِس- هذه خاصية كمية ونوعية معممة لأي خاصية من وحدات أو مجاميع للغرض في ظروف محددة من الزمان والمكان.

بطاقة الأداءهي مجموعة من المؤشرات التي تعكس بشكل شامل الظاهرة قيد الدراسة.

على سبيل المثال ، ضع في اعتبارك الراتب:
  • تسجيل - الأجور
  • الإحصاء السكاني - جميع العاملين
  • وحدة السكان هي كل عامل
  • التجانس النوعي - الراتب المستحق
  • اختلاف الميزة - سلسلة من الأرقام

عامة السكان وعينة منه

الأساس هو مجموعة من البيانات التي تم الحصول عليها نتيجة قياس واحد أو أكثر من السمات. مجموعة الكائنات التي تمت ملاحظتها بالفعل ، ممثلة إحصائيًا بسلسلة من الملاحظات لمتغير عشوائي ، هي أخذ العينات، والموجود افتراضيًا (مدروس) - عامه السكان. يمكن أن يكون عامة السكان محددين (عدد الملاحظات N = const) أو لانهائي ( N = ∞) ، وعينة من عامة السكان تكون دائمًا نتيجة لعدد محدود من الملاحظات. يتم استدعاء عدد الملاحظات التي تتكون منها العينة حجم العينة. إذا كان حجم العينة كبيرًا بدرجة كافية ن → ∞) تعتبر العينة كبير، وإلا فإنه يسمى عينة حجم محدود. تعتبر العينة صغير، إذا ، عند قياس متغير عشوائي أحادي البعد ، لا يتجاوز حجم العينة 30 ( ن<= 30 ) ، وعند قياس عدة ( ك) في علاقة فضاء متعددة الأبعاد نل كلا يتجاوز 10 (ن / ك< 10) . نماذج النماذج سلسلة الاختلافإذا كان أعضائها إحصائيات الطلب، أي قيم عينة للمتغير العشوائي Xيتم فرزها بترتيب تصاعدي (مرتبة) ، يتم استدعاء قيم السمة خيارات.

مثال. تقريبًا نفس مجموعة الكائنات المختارة عشوائيًا - البنوك التجارية لمنطقة إدارية واحدة في موسكو ، يمكن اعتبارها عينة من عموم السكان لجميع البنوك التجارية في هذه المنطقة ، وكعينة من عموم السكان في جميع البنوك التجارية في موسكو وكذلك عينة من البنوك التجارية في الدولة وغيرها.

طرق أخذ العينات الأساسية

تعتمد موثوقية الاستنتاجات الإحصائية والتفسير الهادف للنتائج على التمثيليةالعينات ، أي اكتمال وكفاية عرض خصائص عامة السكان ، والتي يمكن اعتبار هذه العينة ممثلة لها. يمكن تنظيم دراسة الخصائص الإحصائية للسكان بطريقتين: استخدام مستمرو متقطع. المراقبة المستمرةيشمل فحص الجميع الوحداتدرس تجمعات، أ المراقبة غير المستمرة (الانتقائية)- أجزاء منه فقط.

هناك خمس طرق رئيسية لتنظيم أخذ العينات:

1. اختيار عشوائي بسيط، حيث يتم اختيار الكائنات عشوائيًا من المجموعة العامة للكائنات (على سبيل المثال ، باستخدام جدول أو مولد أرقام عشوائي) ، ولكل من العينات الممكنة احتمالية متساوية. تسمى هذه العينات في الواقع عشوائي;

2. اختيار بسيط من خلال إجراء منتظميتم تنفيذها باستخدام مكون ميكانيكي (على سبيل المثال ، التواريخ ، أيام الأسبوع ، أرقام الشقق ، أحرف الأبجدية ، إلخ) ويتم استدعاء العينات التي تم الحصول عليها بهذه الطريقة ميكانيكي;

3. طبقيةيتكون الاختيار من حقيقة أن السكان العامين للحجم ينقسمون إلى مجموعات فرعية أو طبقات (طبقات) من الحجم بحيث. ستراتا هي كائنات متجانسة من حيث الخصائص الإحصائية (على سبيل المثال ، ينقسم السكان إلى طبقات حسب الفئة العمرية أو الطبقة الاجتماعية ؛ الشركات حسب الصناعة). في هذه الحالة ، يتم استدعاء العينات طبقية(خلاف ذلك، طبقية ، نموذجية ، مقسمة إلى مناطق);

4. الأساليب مسلسلاختيار تستخدم لتشكيل مسلسلأو عينات متداخلة. إنها مناسبة إذا كان من الضروري فحص "كتلة" أو سلسلة من الأشياء في وقت واحد (على سبيل المثال ، شحنة من السلع ، أو منتجات سلسلة معينة ، أو مجموعة من السكان في التقسيم الإقليمي-الإداري للبلد). يمكن اختيار السلاسل بطريقة عشوائية أو ميكانيكية. في الوقت نفسه ، يتم إجراء مسح مستمر لمجموعة معينة من السلع ، أو وحدة إقليمية كاملة (مبنى سكني أو ربع) ؛

5. مجموعيمكن أن يجمع الاختيار (المتدرج) عدة طرق اختيار في وقت واحد (على سبيل المثال ، الطبقي والعشوائي أو العشوائي والميكانيكي) ؛ تسمى هذه العينة مجموع.

أنواع التحديد

بواسطة عقلهناك اختيار فردي وجماعي ومشترك. في الاختيار الفردييتم اختيار الوحدات الفردية من عامة السكان في مجموعة العينة ، مع اختيار المجموعةهي مجموعات متجانسة نوعياً (سلسلة) من الوحدات ، و الاختيار المشتركيتضمن مزيجًا من النوعين الأول والثاني.

بواسطة طريقةاختيار يميز متكرر وغير متكررعينة.

لا يتكرريسمى بالاختيار ، حيث لا تعود الوحدة التي تندرج في العينة إلى السكان الأصليين ولا تشارك في الاختيار الإضافي ؛ بينما عدد الوحدات من عامة السكان نخفضت خلال عملية الاختيار. في معاداختيار أمسكفي العينة ، يتم إرجاع الوحدة بعد التسجيل إلى عامة السكان وبالتالي تحتفظ بفرصة متساوية ، إلى جانب الوحدات الأخرى ، لاستخدامها في إجراءات الاختيار الإضافية ؛ بينما عدد الوحدات من عامة السكان نيبقى دون تغيير (الطريقة نادرا ما تستخدم في الدراسات الاجتماعية والاقتصادية). ومع ذلك ، مع كبير N (N → ∞)الصيغ الخاصة بـ غير متكررالاختيار قريبة من تلك الخاصة بـ معادالاختيار وهذا الأخير يستخدم في كثير من الأحيان ( N = const).

الخصائص الرئيسية لمعايير المجتمع العام وعينة السكان

أساس الاستنتاجات الإحصائية للدراسة هو توزيع متغير عشوائي مع القيم المرصودة (× 1 ، × 2 ، ... ، × ن)تسمى تحقيق المتغير العشوائي X(ن هو حجم العينة). يعتبر توزيع المتغير العشوائي في عموم السكان نظريًا ، ومثاليًا بطبيعته ، وعينته التماثلية تجريبيتوزيع. يتم إعطاء بعض التوزيعات النظرية بشكل تحليلي ، أي هُم خياراتتحديد قيمة دالة التوزيع في كل نقطة في فضاء القيم الممكنة للمتغير العشوائي. بالنسبة لعينة ، من الصعب ، وأحيانًا المستحيل ، تحديد دالة التوزيع ، لذلك خياراتيتم تقديرها من البيانات التجريبية ، ثم يتم استبدالها في تعبير تحليلي يصف التوزيع النظري. في هذه الحالة ، فإن الافتراض (أو فرضية) حول نوع التوزيع يمكن أن يكون صحيحًا وخاطئًا من الناحية الإحصائية. ولكن على أي حال ، فإن التوزيع التجريبي الذي أعيد بناؤه من العينة يميز فقط التوزيع الحقيقي تقريبًا. أهم معلمات التوزيع هي القيمة المتوقعةوالتشتت.

بطبيعتها ، التوزيعات مستمرو منفصلة. أشهر توزيع مستمر هو طبيعي. نظائرها الانتقائية للمعلمات ومن أجلها هي: القيمة المتوسطة والتباين التجريبي. من بين الدراسات المنفصلة في الدراسات الاجتماعية والاقتصادية ، الأكثر استخدامًا بديل (ثنائي التفرع)توزيع. تعبر معلمة توقع هذا التوزيع عن القيمة النسبية (أو يشارك) وحدات السكان التي لها الخاصية قيد الدراسة (يشار إليها بالحرف) ؛ يتم الإشارة إلى نسبة السكان الذين لا يمتلكون هذه الميزة بالحرف ف (ف = 1 - ع). تباين التوزيع البديل له أيضًا نظير تجريبي.

اعتمادًا على نوع التوزيع وطريقة اختيار الوحدات السكانية ، يتم حساب خصائص معلمات التوزيع بشكل مختلف. ويرد في الجدول أهم التوزيعات النظرية والتجريبية. 9.1

عينة حصة k nهي نسبة عدد وحدات عينة السكان إلى عدد الوحدات من عامة السكان:

ك ن = ن / ن.

عينة حصة ثهي نسبة الوحدات التي تحتوي على السمة قيد الدراسة xلحجم العينة ن:

ث = ن ن / ن.

مثال.في دفعة من البضائع تحتوي على 1000 وحدة ، بعينة 5٪ جزء العينة k nفي القيمة المطلقة 50 وحدة. (ن = N * 0.05) ؛ إذا تم العثور على منتجين معيبين في هذه العينة ، إذن جزء العينة ثسيكون 0.04 (ث = 2/50 = 0.04 أو 4٪).

نظرًا لأن عينة السكان تختلف عن عامة السكان ، فهناك أخطاء أخذ العينات.

الجدول 9.1 المعلمات الرئيسية لعامة السكان وعينة السكان

أخطاء أخذ العينات

مع أي أخطاء (صلبة وانتقائية) يمكن أن تحدث من نوعين: التسجيل والتمثيل. اخطاء تسجيلقد يمتلك عشوائيو منهجيشخصية. عشوائيتتكون الأخطاء من العديد من الأسباب المختلفة التي لا يمكن السيطرة عليها ، وهي غير مقصودة بطبيعتها ، وعادة ما توازن بعضها البعض معًا (على سبيل المثال ، التغييرات في قراءات الأجهزة بسبب تقلبات درجة الحرارة في الغرفة).

منهجيالأخطاء متحيزة ، لأنها تنتهك قواعد اختيار الكائنات في العينة (على سبيل المثال ، الانحرافات في القياسات عند تغيير إعدادات جهاز القياس).

مثال.لتقييم الوضع الاجتماعي للسكان في المدينة ، من المخطط فحص 25 ٪ من العائلات. ومع ذلك ، إذا كان اختيار كل شقة رابعة يعتمد على عددها ، فهناك خطر اختيار جميع الشقق من نوع واحد فقط (على سبيل المثال ، شقق من غرفة واحدة) ، مما سيؤدي إلى حدوث خطأ منهجي وتشويه النتائج ؛ يفضل اختيار رقم الشقة بالقرعة ، لأن الخطأ سيكون عشوائيًا.

أخطاء التمثيلمتأصلة فقط في الملاحظة الانتقائية ، لا يمكن تجنبها وهي تنشأ نتيجة لحقيقة أن العينة لا تعيد إنتاج العينة العامة بشكل كامل. تختلف قيم المؤشرات التي تم الحصول عليها من العينة عن مؤشرات نفس القيم في عموم السكان (أو تم الحصول عليها أثناء الملاحظة المستمرة).

خطأ المعاينههو الفرق بين قيمة المعلمة في عموم السكان وقيمة العينة الخاصة بها. بالنسبة لمتوسط ​​قيمة السمة الكمية ، فهي تساوي: ، وللحصة (السمة البديلة) -.

أخطاء أخذ العينات متأصلة فقط في عينة الملاحظات. كلما كبرت هذه الأخطاء ، زاد اختلاف التوزيع التجريبي عن التوزيع النظري. معلمات التوزيع التجريبي وهي متغيرات عشوائية ، وبالتالي ، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ، ويمكن أن تأخذ قيمًا مختلفة لعينات مختلفة ، وبالتالي فمن المعتاد حسابها متوسط ​​الخطأ.

متوسط ​​خطأ أخذ العيناتهي قيمة تعبر عن الانحراف المعياري لمتوسط ​​العينة عن التوقع الرياضي. تعتمد هذه القيمة ، التي تخضع لمبدأ الاختيار العشوائي ، بشكل أساسي على حجم العينة وعلى درجة تباين السمة: كلما كان تباين السمة أكبر وأصغر (وبالتالي ، قيمة) ، كانت قيمة أصغر متوسط ​​خطأ أخذ العينات. يتم التعبير عن النسبة بين تباينات السكان العام وعينة من خلال الصيغة:

أولئك. لكبيرة بما فيه الكفاية ، يمكننا أن نفترض ذلك. يُظهر متوسط ​​خطأ أخذ العينات الانحرافات المحتملة لمعلمة عينة السكان عن معلمة عموم السكان. في الجدول. يوضح الشكل 9.2 عبارات لحساب متوسط ​​خطأ أخذ العينات للطرق المختلفة لتنظيم الملاحظة.

الجدول 9.2 متوسط ​​الخطأ (م) لمتوسط ​​العينة والنسبة لأنواع العينات المختلفة

أين هو متوسط ​​تباينات العينة داخل المجموعة لميزة مستمرة ؛

متوسط ​​توزيع الحصة داخل المجموعة ؛

- عدد السلاسل المختارة ، - العدد الإجمالي للسلسلة ؛

,

أين هو متوسط ​​السلسلة ال ؛

- العوارية العامة على العينة بأكملها لميزة مستمرة ؛

,

أين هي نسبة السمة في السلسلة ال ؛

- الحصة الإجمالية للسمة على العينة بأكملها.

ومع ذلك ، لا يمكن الحكم على حجم متوسط ​​الخطأ إلا باحتمالية معينة Р (Р ≤ 1). ليابونوف أ. أثبت أن توزيع العينة ، وبالتالي انحرافها عن المتوسط ​​العام ، مع وجود عدد كبير بما فيه الكفاية ، يخضع تقريبًا لقانون التوزيع العادي ، بشرط أن يكون للجمهور العام متوسط ​​محدود وتباين محدود.

رياضيا ، يتم التعبير عن هذا البيان للمتوسط ​​على النحو التالي:

وبالنسبة للكسر ، فإن التعبير (1) سيأخذ الشكل:

أين - هنالك خطأ هامشي في أخذ العينات، وهو أحد مضاعفات متوسط ​​خطأ أخذ العينات , وعامل التعددية هو معيار الطالب ("عامل الثقة") الذي اقترحه و. جوسيت (الاسم المستعار "الطالب") ؛ يتم تخزين قيم أحجام العينات المختلفة في جدول خاص.

قيم الدالة Ф (t) لبعض قيم t هي:

لذلك ، يمكن قراءة التعبير (3) على النحو التالي: مع الاحتمال P = 0.683 (68.3٪)يمكن القول أن الفرق بين العينة والمتوسط ​​العام لن يتجاوز قيمة واحدة للخطأ المتوسط م (ر = 1)مع الاحتمال P = 0.954 (95.4٪)- ألا تتجاوز قيمة الخطأين المتوسطين م (ر = 2) ،مع الاحتمال الاحتمال = 0.997 (99.7٪)- لن تتجاوز ثلاث قيم م (ر = 3).وبالتالي ، فإن احتمال أن يتجاوز هذا الاختلاف ثلاثة أضعاف قيمة متوسط ​​الخطأ الذي تحدده مستوى الخطأوليس أكثر من 0,3% .

في الجدول. 9.3 معادلات لحساب الخطأ الهامشي لأخذ العينات معطاة.

الجدول 9.3 خطأ أخذ العينات الهامشي (D) للمتوسط ​​والنسبة (ع) لأنواع مختلفة من أخذ العينات

توسيع نتائج العينة إلى السكان

الهدف النهائي لملاحظة العينة هو وصف عامة السكان. بالنسبة لأحجام العينات الصغيرة ، قد تنحرف التقديرات التجريبية للمعلمات (و) بشكل كبير عن قيمها الحقيقية (و). لذلك ، يصبح من الضروري تحديد الحدود التي تكمن فيها القيم الحقيقية (و) لقيم عينة المعلمات (و).

فاصل الثقةمن بعض المعلمات θ لعامة السكان تسمى نطاقًا عشوائيًا لقيم هذه المعلمة ، والتي لها احتمالية قريبة من 1 ( مصداقية) يحتوي على القيمة الحقيقية لهذه المعلمة.

خطأ هامشيعينات Δ يسمح لك بتحديد القيم الحدية لخصائص عامة السكان و فترات الثقة، والتي تساوي:

الحد الأدنى فاصل الثقةتم الحصول عليها عن طريق طرح خطأ هامشيمن العينة يعني (حصة) ، والأولى بإضافتها.

فاصل الثقةبالنسبة للمتوسط ​​، فإنه يستخدم خطأ أخذ العينات الهامشي ويتم تحديد مستوى ثقة معين بواسطة الصيغة:

هذا يعني أنه مع وجود احتمال معين ص، والذي يسمى مستوى الثقة ويتم تحديده بشكل فريد من خلال القيمة ر، يمكن القول أن القيمة الحقيقية للمتوسط ​​تقع في النطاق من ، والقيمة الحقيقية للحصة تقع في النطاق من

عند حساب فاصل الثقة لمستويات الثقة القياسية الثلاثة P = 95٪ ، P = 99٪ و P = 99.9٪القيمة المحددة بواسطة. التطبيقات حسب عدد درجات الحرية. إذا كان حجم العينة كبيرًا بدرجة كافية ، فإن القيم المقابلة لهذه الاحتمالات رمتساوية: 1,96, 2,58 و 3,29 . وبالتالي ، فإن الخطأ الهامشي في أخذ العينات يسمح لنا بتحديد القيم الهامشية لخصائص عامة السكان وفترات الثقة الخاصة بهم:

توزيع نتائج الملاحظة الانتقائية على عموم السكان في الدراسات الاجتماعية والاقتصادية له خصائصه الخاصة ، لأنه يتطلب اكتمال التمثيل بجميع أنواعه ومجموعاته. أساس إمكانية مثل هذا التوزيع هو الحساب خطأ نسبي:

أين Δ ٪ - الخطأ النسبي الهامشي في أخذ العينات ؛ و.

هناك طريقتان رئيسيتان لتوسيع نطاق ملاحظة العينة إلى السكان: التحويل المباشر وطريقة المعاملات.

جوهر التحويل المباشرهو ضرب متوسط ​​العينة !! \ overline (x) بحجم السكان.

مثال. دع متوسط ​​عدد الأطفال الصغار في المدينة يتم تقديره من خلال طريقة أخذ العينات ومقدار الشخص. إذا كان هناك 1000 أسرة شابة في المدينة ، فسيتم الحصول على عدد الأماكن المطلوبة في الحضانة البلدية بضرب هذا المتوسط ​​في حجم عموم السكان N = 1000 ، أي سيكون 1200 مقعد.

طريقة المعاملاتيُنصح باستخدامه في حالة إجراء المراقبة الانتقائية من أجل توضيح بيانات المراقبة المستمرة.

عند القيام بذلك ، يتم استخدام الصيغة:

حيث تمثل جميع المتغيرات حجم السكان:

حجم العينة المطلوب

الجدول 9.4 حجم العينة المطلوب (ن) لأنواع مختلفة من منظمة أخذ العينات

عند التخطيط لمسح أخذ العينات بقيمة محددة مسبقًا لخطأ أخذ العينات المسموح به ، من الضروري تقدير القيمة المطلوبة بشكل صحيح حجم العينة. يمكن تحديد هذا المبلغ على أساس الخطأ المسموح به أثناء الملاحظة الانتقائية بناءً على احتمال معين يضمن مستوى خطأ مقبول (مع مراعاة طريقة تنظيم الملاحظة). يمكن الحصول بسهولة على الصيغ الخاصة بتحديد حجم العينة المطلوب n مباشرة من الصيغ الخاصة بخطأ أخذ العينات الهامشي. إذن ، من التعبير عن الخطأ الهامشي:

يتم تحديد حجم العينة مباشرة ن:

توضح هذه الصيغة أنه مع تناقص خطأ أخذ العينات الهامشي Δ يزيد بشكل كبير من حجم العينة المطلوب ، والذي يتناسب مع التباين ومربع اختبار الطالب.

بالنسبة لطريقة معينة لتنظيم المراقبة ، يتم حساب حجم العينة المطلوب وفقًا للصيغ الواردة في الجدول. 9.4

أمثلة عملية حسابية

مثال 1. حساب متوسط ​​القيمة وفترة الثقة لخاصية كمية مستمرة.

لتقييم سرعة التسوية مع الدائنين في البنك ، تم إجراء عينة عشوائية من 10 مستندات دفع. تبين أن قيمهم متساوية (بالأيام): 10 ؛ 3 ؛ 15؛ 15؛ 22 ؛ 7 ؛ 8 ؛ 1 ؛ 19 ؛ 20.

مطلوب مع الاحتمال ف = 0.954تحديد الخطأ الهامشي Δ متوسط ​​العينة وحدود الثقة لمتوسط ​​زمن الحساب.

حل.يتم حساب متوسط ​​القيمة بواسطة الصيغة من الجدول. 9.1 لعينة المجتمع

يتم حساب التشتت وفقًا للصيغة الواردة في الجدول. 9.1

متوسط ​​الخطأ المربع لليوم.

يتم حساب خطأ المتوسط ​​بالصيغة:

أولئك. يعني القيمة س ± م = 12.0 ± 2.3 يوم.

موثوقية المتوسط ​​كان

يتم حساب الخطأ المحدد بواسطة الصيغة من الجدول. 9.3 لإعادة الانتخاب ، لأن حجم السكان غير معروف ، ول ف = 0.954مستوى الثقة.

وبالتالي ، فإن القيمة المتوسطة هي `` x ± D = 'x ± 2m = 12.0 ± 4.6 ، أي تكمن قيمته الحقيقية في النطاق من 7.4 إلى 16.6 يومًا.

استخدام طاولة الطالب. يسمح لنا التطبيق باستنتاج أنه بالنسبة لـ n = 10-1 = 9 درجات من الحرية ، فإن القيمة التي تم الحصول عليها يمكن الاعتماد عليها بمستوى أهمية بقيمة 0.001 جنيه إسترليني ، أي تختلف القيمة المتوسطة الناتجة اختلافًا كبيرًا عن 0.

مثال 2. تقدير الاحتمال (الحصة العامة) r.

باستخدام طريقة أخذ العينات الميكانيكية لمسح الحالة الاجتماعية لـ 1000 أسرة ، تم الكشف عن أن نسبة الأسر ذات الدخل المنخفض كانت ث = 0.3 (30٪)(كانت العينة 2% ، أي. ن / ن = 0.02). مطلوب بمستوى ثقة ع = 0.997تحديد مؤشر صالأسر ذات الدخل المنخفض في جميع أنحاء المنطقة.

حل.وفقًا لقيم الوظيفة المعروضة Ф (ر)ابحث عن مستوى ثقة معين الاحتمال = 0.997معنى ر = 3(انظر الصيغة 3). خطأ هامشي في المشاركة ثتحدد بالصيغة من الجدول. 9.3 لأخذ العينات غير المتكرر (أخذ العينات الميكانيكية دائمًا غير متكرر):

الحد من الخطأ النسبي لأخذ العينات في % سوف يكون:

سيكون احتمال (الحصة العامة) من الأسر ذات الدخل المنخفض في المنطقة ع = ث ± Δw، ويتم حساب حدود الثقة p بناءً على عدم المساواة المزدوجة:

ث - Δw ≤ p ≤ w - Δw، أي. تكمن القيمة الحقيقية لـ p في:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

وبالتالي ، مع احتمال 0.997 ، يمكن القول بأن نسبة الأسر ذات الدخل المنخفض بين جميع العائلات في المنطقة تتراوح من 28.6٪ إلى 31.4٪.

مثال 3حساب متوسط ​​القيمة وفترة الثقة لميزة منفصلة محددة بواسطة سلسلة فاصلة.

في الجدول. 9.5 يتم تحديد توزيع الطلبات الخاصة بإنتاج الطلبات وفقًا لتوقيت تنفيذها من قبل المؤسسة.

الجدول 9.5 توزيع الملاحظات حسب وقت حدوثها

حل. يتم حساب متوسط ​​وقت إتمام الطلب بواسطة الصيغة:

متوسط ​​الوقت سيكون:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23.1 شهر

نحصل على نفس الإجابة إذا استخدمنا البيانات الموجودة على p i من العمود قبل الأخير من الجدول. 9.5 باستخدام الصيغة:

لاحظ أنه تم العثور على منتصف الفترة الزمنية للتدرج الأخير من خلال تكميله بشكل مصطنع بعرض الفاصل الزمني للتدرج السابق الذي يساوي 60 - 36 = 24 شهرًا.

يتم حساب التشتت بواسطة الصيغة

أين س ط- منتصف سلسلة الفترات.

لذلك !! \ sigma = \ frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4) والخطأ القياسي هو.

يتم حساب خطأ المتوسط ​​بواسطة صيغة الأشهر ، أي المتوسط ​​هو !! \ overline (x) ± m = 23.1 ± 13.4.

يتم حساب الخطأ المحدد بواسطة الصيغة من الجدول. 9.3 لإعادة الاختيار لأن حجم المجتمع غير معروف ، لمستوى ثقة 0.954:

فالمعنى هو:

أولئك. تكمن قيمته الحقيقية في النطاق من 0 إلى 50 شهرًا.

مثال 4لتحديد سرعة التسويات مع دائني N = 500 مؤسسة للشركة في بنك تجاري ، من الضروري إجراء دراسة انتقائية باستخدام طريقة الاختيار العشوائي غير المتكرر. حدد حجم العينة المطلوب n بحيث لا يتجاوز خطأ متوسط ​​العينة 3 أيام مع وجود احتمال P = 0.954 ، إذا أظهرت التقديرات التجريبية أن الانحراف المعياري كان 10 أيام.

حل. لتحديد عدد الدراسات اللازمة n ، نستخدم صيغة الاختيار غير المتكرر من الجدول. 9.4:

في ذلك ، يتم تحديد قيمة t لمستوى الثقة P = 0.954. وهي تساوي 2. متوسط ​​القيمة التربيعية s = 10 ، وحجم السكان N = 500 ، والخطأ الهامشي للمتوسط Δ س = 3. بالتعويض عن هذه القيم في الصيغة ، نحصل على:

أولئك. يكفي عمل عينة من 41 مؤسسة لتقدير المعلمة المطلوبة - سرعة التسويات مع الدائنين.

يمكن أن تكون الحاجة إلى إجراء بحث انتقائي ناتجة عن أسباب مختلفة:

    غالبًا ما تكون الدراسة الكاملة للظاهرة قيد الدراسة باهظة الثمن وطويلة ؛

    في بعض الأحيان ، قد يتم استنفاد فرصة استخدام المعلومات الواردة في دراسة كاملة قبل اكتمال عملية إعدادها ؛

    في بعض الحالات ، نتيجة للتحقق من جودة المنتج ، يتم إتلاف الكائن قيد الدراسة.

مثال:

    لنفترض أن السكان هم جميع الطلاب في المدرسة (600 شخص من 20 فصلًا ، 30 شخصًا في كل فصل). موضوع الدراسة هو الموقف من التدخين.

سكانهي مجموعة من الأشياء التي تحتاج للحصول على معلومات عنها.

يتكون المجتمع العام من جميع الكائنات التي لها صفات وخصائص تهم الباحث. في بعض الأحيان ، يكون عموم السكان هو مجموع السكان البالغين في منطقة معينة (على سبيل المثال ، عند دراسة موقف الناخبين المحتملين من مرشح ما) ، يتم في أغلب الأحيان وضع عدة معايير تحدد أهداف الدراسة. على سبيل المثال ، النساء اللائي تتراوح أعمارهن بين 10 و 89 عامًا اللائي يستخدمن نوعًا معينًا من كريم اليد مرة واحدة على الأقل في الأسبوع ولديهن دخل لا يقل عن 5000 روبل لكل فرد من أفراد الأسرة.

عينةهي مجموعة صغيرة من الكائنات المستخرجة من عامة السكان.

مجموعة العينات هي الحد الأدنى من النتائج (الحالات ، الموضوعات ، الأشياء ، الأحداث ، العينات) التي يتم اختيارها بواسطة إجراء معين من عامة السكان ، والضرورية للدراسة.

أمثلة:

    تحديد رد فعل عملاء الشركة على الابتكارات ، يمثل جميع عملاء الشركة عموم السكان. هؤلاء العملاء الذين تم استدعاؤهم يشكلون عينة.

    عند مراجعة الشركات التي لديها عدد كبير من المعاملات ، يجب أن يكون المرء راضياً عن فحص عدد محدد من المعاملات. جميع معاملات الشركة من عامة السكان المختارين - العينة.

    يتكون عامة السكان من جميع المجندين في سنة معينة.

    جميع المصابيح المصنوعة في وقت معين في مؤسسة معينة تشكل عامة السكان. المصابيح التي تم اختيارها للتحكم اختيارية.

يمكن اعتبار العينة تمثيلية أو غير تمثيلية. ستكون العينة تمثيلية عند فحص مجموعة كبيرة من الأشخاص ، إذا كان ضمن هذه المجموعة ممثلين عن مجموعات فرعية مختلفة ، بهذه الطريقة فقط يمكن استخلاص النتائج الصحيحة. .

التمثيلية - تطابق خصائص العينة مع خصائص السكان أو عامة السكان ككل.يحدد التمثيل إلى أي مدى يمكن تعميم نتائج الدراسة بإشراك عينة معينة على جميع السكان الذين تم جمعها منهم.

يمكن أيضًا تعريف التمثيل على أنه خاصية لعينة لتمثيل معلمات عامة السكان التي تعتبر مهمة من وجهة نظر أهداف الدراسة.

مثال:تمثل عينة من 60 طالبًا في المدرسة الثانوية السكان أسوأ بكثير من عينة من نفس 60 شخصًا ، والتي ستشمل 3 طلاب من كل فصل. السبب الرئيسي لذلك هو التوزيع العمري غير المتكافئ في الفصول الدراسية. لذلك ، في الحالة الأولى ، يكون تمثيل العينة منخفضًا ، وفي الحالة الثانية ، يكون التمثيل مرتفعًا (مع ثبات العوامل الأخرى) .

مهمة 1.في مدينة يبلغ عدد سكانها 253000 مواطن مؤهل ، ابحث عن التعاطف السياسي للناخبين المستقبليين.

حل

    يمكن بناء العينة عن طريق إجراء مقابلات مع كل 15 عميلاً يغادرون مركز تسوق كبير. ستعكس هذه العينة رأي زوار مركز التسوق ، ولكن من غير المرجح أن تمثل وجهة نظر جميع سكان المدينة.

    طريقة أخرى لأخذ العينات هي إجراء مسح هاتفي لكل 100 من سكان المدينة ، مع أخذ الأرقام من دليل الهاتف. ستوفر مثل هذه العينات المنهجية معلومات حول وجهة نظر مجموعة من الأشخاص الذين لديهم هاتف ، وهم في المنزل ويردون على المكالمات الهاتفية. لكنها لا تعكس آراء جميع سكان المدينة.

    قد تكون طريقة أخرى لأخذ العينات هي مقابلة المشاركين في اجتماع حاشد نظمته عدة أحزاب سياسية. ستوفر هذه العينة معلومات حول السكان الذين يشاركون بنشاط في الحياة السياسية للمدينة.

لذلك ، نحتاج إلى طرق أخذ العينات التي من شأنها أن تمثل جميع السكان ، أي يجب أن تكون العينة تمثيلية (تمثيلية).

المهمة 2.حدد ما إذا كانت العينة تمثيلية:

1) عدد حوادث السيارات في شهر يونيو ، إذا كان من الضروري إعداد تقرير إحصائي عن الحوادث في المدينة للعام ؛

2) سكان الحضر عند حساب عدد السيارات للفرد في الدولة ؛

3) الأشخاص الذين تتراوح أعمارهم بين 40 إلى 50 عامًا عند تحديد تصنيف برنامج تلفزيوني للشباب.

حل

1) العينة غير تمثيلية. في الصيف لا يوجد ثلوج ولا جليد على الطرقات ، وهذا من الأسباب الرئيسية للحوادث.

2) العينة غير تمثيلية. من الواضح أن عدد السيارات في المدينة يفوق عدد السيارات الموجودة في المناطق الريفية. يجب أن يؤخذ هذا في الاعتبار.

3) العينة غير تمثيلية. من غير المرجح أن يبدي الأشخاص الذين تتراوح أعمارهم بين 40 و 50 عامًا اهتمامًا ببرنامج يستهدف جمهورًا من الشباب. عند استخدام مثل هذه العينة ، يمكن أن ينخفض ​​التصنيف بشكل كبير ، لكن هذا لا يعكس الحالة الحقيقية للأمور. لتشكيل عينة من السكان ، يتم استخدام طرق مختلفة للاختيار. يجب تقديم البيانات الإحصائية بطريقة يمكن استخدامها.

معلمات السكان والعينة

N هو عموم السكان ، والذي ينقسم إلى طبقات N 1 و N 2 وما إلى ذلك.

طبقاتتمثل كائنات متجانسة من حيث الخصائص الإحصائية (على سبيل المثال ، ينقسم السكان إلى طبقات حسب الفئات العمرية أو الطبقة الاجتماعية ؛ الشركات حسب الصناعة). في هذه الحالة ، تسمى العينات طبقية.

N - حجم العينة.

أساس الاستنتاجات الإحصائية للدراسة هو توزيع المتغير العشوائي X ، بينما تسمى القيم المرصودة x 1 ، x 2 ، x 3 تحقيق المتغير العشوائي x.

توزيع المتغير العشوائي X في عموم السكان نظري ، ومثالي بطبيعته ، ونظره في العينة هو التوزيع التجريبي

بالنسبة للعينة ، من الصعب ، وأحيانًا المستحيل ، تحديد دالة التوزيع ، لذلك يتم تقدير المعلمات من البيانات التجريبية ، ثم يتم استبدالها في تعبير تحليلي يصف التوزيع النظري. في هذه الحالة ، يمكن أن يكون الافتراض حول نوع التوزيع صحيحًا وخاطئًا من الناحية الإحصائية.

ولكن على أي حال ، فإن التوزيع التجريبي الذي أعيد بناؤه من العينة يميز فقط التوزيع الحقيقي تقريبًا.

أهم معلمات التوزيعات هي التوقع الرياضيأوالتباين σ2هو مقياس لتشتت البيانات.

الانحراف المعياريσ - درجة انحراف بيانات أو مجموعات الملاحظة عن القيمة المتوسطة.

المهمة 3.قرر ميخائيل مع أصدقائه قياس ارتفاع كلابهم (من خلال الذبول). البحث: متوسط ​​القيمة ؛ انحراف النمو.

حل

    يمكن العثور على التوقع الرياضي أو متوسط ​​القيمة من خلال الصيغة:


    الآن نحسب انحراف ارتفاع كل كلب عن المتوسط ​​أو التوقع الرياضي ، أي نحسب التباين.


الانحراف المعياري هو فقط الجذر التربيعي للتباين.

σ \ = 147,32

لذلك من خلال معرفة الانحراف المعياري ، نعرف ما هو "الارتفاع الطبيعي" وما هو كلب طويل جدًا وصغير جدًا.

الجواب: 394 ، 21.704 ؛ 147.32.

المهمة 4.أدت الملاحظة في معمل التحكم لتاريخ انتهاء صلاحية 50 مصباحًا كهربائيًا من نفس الطاقة ، مأخوذة عشوائيًا من مجموعة كبيرة من المصابيح بنفس الطاقة التي ينتجها المصنع ، إلى البيانات التالية حول انتهاك الضمان المقرروقت الاحتراق:

الانحراف في ح

10 ـ التوزيع الصغير الذي يعكس الانحراف الفعلي ذفترة احتراق المصابيح من الضمان.

حل.

متوسط ​​الانحراف

وبالتالي ، فإن التوزيع الطبيعي المطلوب يتميز بقيم المعلمات التالية: أ = 0.4 ؛σ2 = 318 ؛ σ = 17.8.

ومن هنا كثافة الاحتمال:

ستبدو دالة التوزيع المقابلة لهذه الكثافة كما يلي: