يعد اختبار جودة المطابقة Kolmogorov-Smirnov طريقة لتقييم توزيع السكان. SPSS في علم النفس والعلوم الاجتماعية معيار كولموجوروف للانتماء للعينة العامة

الغرض من المعيار. يهدف معيار π إلى مقارنة توزيعين: أ). التجريبية مع النظرية، على سبيل المثال، موحدة أو عادية؛ ب). توزيع تجريبي مع توزيع تجريبي آخر.

حدود المعيار.ويتطلب المعيار أن تكون العينة كبيرة بما يكفي، ≥50.

الفرضيات:

: الفروق بين التوزيعتين ليست كبيرة.

: الاختلافات بين التوزيعتين كبيرة.

خوارزمية لحساب π - المعيار.

لنقم بإنشاء جدول لإجراء العمليات الحسابية السهلة:

1. يحتوي العمود الأول على القيم التجريبية للخاصية مرتبة ترتيبًا تصاعديًا.

2. يحتوي العمود الثاني على التكرارات التجريبية لكل قيمة، وفي العمود الثالث التكرارات التجريبية النسبية لكل قيمة، محسوبة بالمعادلة: f* emp j = f emp j / n، حيث f emp j هو التكرار التجريبي من العمود الثاني، ن - حجم العينة.

3. نحسب التكرارات التجريبية "المتراكمة" باستخدام الصيغة:

∑ f* emp j = ∑ f* emp j -1 + f* emp j ,

حيث ∑ f* emp j -1 - التردد المتراكم على القيم السابقة للسمة؛

ي - الرقم التسلسلي لقيمة السمة؛ f* emp j – التردد التجريبي لتفريغ j معين. يتم وضع النتائج في العمود 4.

4. يحتوي العمود 5 على التكرارات النظرية المتراكمة إذا ما قورنت بالتوزيع النظري المعروف. إذا تمت مقارنة توزيعين تجريبيين، فسيتم وضع التكرارات التجريبية المتراكمة للعينة 2 في العمود 5.

5. يتم حساب الفروق بين التكرارات المتراكمة وتوضع قيمها المطلقة في العمود رقم 6. دعونا نشير إليهم d j .

6. حدد القيمة القصوى d j → d max باستخدام العمود 6.

7. احسب Φ emp باستخدام الصيغة:

,

حيث n 1 - حجم العينة 1، n 2 - حجم العينة 2، إذا = = n، إذن .

8. استناداً إلى مستوى الأهمية المعين، تم العثور على النقطة الحدودية  cr من الجدول السابع من الملحق.

9. إذا χ م< λ кр, то различия между распределениями признака незначимы; если λ эмп >α cr، فإن الاختلافات بين توزيعات الخاصية تكون كبيرة.

مثال. قام محل البقالة بمراقبة وزن النقانق المباعة. حجم العينة n = 100. البيانات التي تم الحصول عليها موضحة في الجدول.

نقص الوزن، ز
تكرار

حدد باستخدام اختبار α - Kolmogorov-Smirnov عند مستوى الأهمية α = 0.05 ما إذا كانت بيانات العينة متوافقة مع التوزيع الموحد على القطعة.

حل.: الاختلافات بين التوزيعات النظرية التجريبية والمقدرة ليست كبيرة.

: الاختلافات بين التوزيعات النظرية التجريبية والمقدرة كبيرة.

دالة التوزيع لمتغير عشوائي موزع بشكل موحد على قطعة لها الشكل التالي:

لنملأ الجدول:

س ي ف م ي و م ي / ن ∑ و* إم بي ي ∑ نظرية f* ي دي جي
0,10 0,10 0,1
0,11 0,21 0,2 0,01
0,08 0,29 0,3 0,01
0,09 0,38 0,4 0,02
0,12 0,50 0,5
0,10 0,60 0,6
0,13 0,73 0,7 0,03
0,15 0,88 0,8 0,08
0,12 1,00 0,9 0,1

دعونا نشرح كيفية ملء الجدول. يتم أخذ قيم العمودين الأولين من الشرط. نقسم كل رقم في العمود الثاني على n = 100 ونكتب النتيجة في العمود الثالث. كل رقم في العمود 4 يساوي مجموع الرقم من نفس الصف في العمود 3 والرقم السابق في العمود 4. نعوض بكل رقم في العمود 1 في الصيغة f * theor = x j /10 ونكتب النتيجة في العمود 5. العمود 6 - وحدة الفرق بين 4 و 5 أعمدة. أكبر رقم في العمود 6 د ماكس =0.1؛ lect م =0.1 = 1.

وباستخدام مستوى الأهمية α = 0.05 من الجدول الملحق السادس، نجد نقطة الحدود α cr = 1.358. منذ ẫ م< λ кр (1 < 1,358), то принимаем гипотезу на уровне значимости α = 0,05. Данные выборки согласуются с равномерным распределением на отрезке .

في السابق، تم النظر في الفرضيات التي يفترض فيها أن قانون توزيع السكان معروف. والآن سنبدأ باختبار الفرضيات حول قانون التوزيع المجهول المفترض، أي أننا سنختبر الفرضية الصفرية القائلة بأن السكان يتوزعون وفق قانون معروف. عادة ما تسمى الاختبارات الإحصائية لاختبار مثل هذه الفرضيات معايير الموافقة.

معيار الاتفاقيسمى معيارا لاختبار فرضية حول القانون المفترض للتوزيع المجهول. وهو مقياس عددي للتناقض بين التوزيع التجريبي والنظري.

المهمة الرئيسية.يتم إعطاء التوزيع التجريبي (العينة). قم بوضع افتراض (طرح فرضية) حول نوع التوزيع النظري واختبر الفرضية عند مستوى أهمية معين α.

يتكون حل المشكلة الرئيسية من جزأين:

1. اقتراح فرضية.

2. اختبار الفرضية عند مستوى دلالة معين.

دعونا ننظر إلى هذه الأجزاء بالتفصيل.

1. اختيار الفرضيةمن الملائم تحديد نوع التوزيع النظري باستخدام المضلعات أو الرسوم البيانية للتردد. قارن المضلع التجريبي (أو الرسم البياني) بقوانين التوزيع المعروفة واختر القانون الأنسب.

وفيما يلي رسوم بيانية لأهم قوانين التوزيع:

تظهر أمثلة قوانين التوزيع التجريبية في الأشكال:



في الحالة (أ) يتم طرح فرضية التوزيع الطبيعي، في الحالة (ب) - فرضية التوزيع الموحد، في الحالة (ج) - فرضية توزيع بواسون.

يمكن أن يكون أساس طرح فرضية حول التوزيع النظري هو الفرضيات النظرية حول طبيعة التغيير في الخاصية. على سبيل المثال، استيفاء شروط نظرية لابونوف يسمح لنا بوضع فرضية حول التوزيع الطبيعي. تشير مساواة المتوسط ​​والتباين إلى توزيع بواسون.

من الناحية العملية، غالبًا ما نواجه توزيعًا طبيعيًا، لذلك في مهامنا نحتاج فقط إلى اختبار فرضية التوزيع الطبيعي.

اختبار الفرضياتحول التوزيع النظري يجيب على السؤال التالي: هل يمكن اعتبار التناقض بين التوزيعات النظرية والتجريبية المفترضة عشوائيا، غير مهم، ويفسر ذلك بعشوائية كائنات معينة مدرجة في العينة، أم أن هذا التناقض يشير إلى تباين كبير بين التوزيعات. هناك طرق مختلفة للتحقق (معايير جودة المطابقة) - ج 2 (مربع تشي)، كولموجوروف، رومانوفسكي، إلخ.

معيار بيرسون.

تتمثل ميزة معيار بيرسون في عالميته: حيث يمكن استخدامه لاختبار الفرضيات حول قوانين التوزيع المختلفة.

1. اختبار فرضية التوزيع الطبيعي.دعونا الحصول على عينة كبيرة بما فيه الكفاية صمع الكثير من خيار المعاني المختلفة. لسهولة معالجته، نقوم بتقسيم الفاصل الزمني من أصغر قيمة إلى أكبر قيمة للخيار إلى سأجزاء متساوية وسنفترض أن قيم الخيارات التي تقع ضمن كل فاصل زمني تساوي تقريبًا الرقم الذي يحدد منتصف الفاصل الزمني. من خلال حساب عدد الخيارات التي تقع في كل فاصل زمني، سنقوم بإنشاء ما يسمى بالعينة المجمعة:

خيارات……….. X 1 X 2 … س س

الترددات …………. ص 1 ص 2 … ن ق ,

أين × طهي قيم منتصف الفواصل الزمنية، و ن ط- عدد الخيارات المضمنة أنا-الفاصل الزمني (الترددات التجريبية). من البيانات التي تم الحصول عليها، يمكنك حساب متوسط ​​العينة والانحراف المعياري للعينة σ ب. دعونا نتحقق من افتراض أن السكان يتم توزيعهم وفقًا لقانون عادي مع المعلمات م(X) = , د(X) = . ثم يمكنك العثور على عدد الأرقام من حجم العينة ص، والتي يجب أن تظهر في كل فترة في ظل هذا الافتراض (أي الترددات النظرية). للقيام بذلك، باستخدام جدول قيم دالة لابلاس، نجد احتمال الدخول أناالفاصل الزمني:

,

أين و اناو ب ط- حدود أنا-الفاصل الزمني. وبضرب الاحتمالات التي تم الحصول عليها في حجم العينة n نجد التكرارات النظرية: ص أنا =ن·ص طهدفنا هو مقارنة التكرارات التجريبية والنظرية والتي تختلف بالطبع عن بعضها البعض، ومعرفة ما إذا كانت هذه الاختلافات ضئيلة ولا تنفي فرضية التوزيع الطبيعي للمتغير العشوائي قيد الدراسة، أو ما إذا كانت كبيرة جدًا لدرجة أنها تتعارض مع هذه الفرضية. ولهذا الغرض يتم استخدام معيار على شكل متغير عشوائي

. (7)

معناه واضح: يتم تلخيص الأجزاء التي تتكون منها مربعات انحرافات التكرارات التجريبية عن التكرارات النظرية من التكرارات النظرية المقابلة. ويمكن إثبات أنه بغض النظر عن قانون التوزيع الحقيقي لعموم السكان فإن قانون توزيع المتغير العشوائي (7) يميل إلى قانون التوزيع مع عدد درجات الحرية ك = ق – 1 – ص، أين ص- عدد معلمات التوزيع المتوقع المقدر من بيانات العينة. وبالتالي فإن التوزيع الطبيعي يتميز بمعلمتين ك = ق – 3. بالنسبة للمعيار المحدد، يتم إنشاء منطقة حرجة على الجانب الأيمن، تحددها الحالة

(8)

أين α - مستوى الأهمية. ونتيجة لذلك، يتم إعطاء المنطقة الحرجة من عدم المساواة ومجال قبول الفرضية هو .

لذلك، لاختبار الفرضية الصفرية ن 0: يتم توزيع السكان بشكل طبيعي - تحتاج إلى حساب القيمة المرصودة للمعيار من العينة:

, (7`)

وباستخدام جدول النقاط الحرجة للتوزيع χ 2، ابحث عن النقطة الحرجة باستخدام القيم المعروفة لـ α و ك = ق – 3. إذا - يتم قبول الفرضية الصفرية، إذا تم رفضها.

مثال.ويعرض الجدول نتائج دراسة الطلب على المنتج:

طرح فرضية حول نوع التوزيع واختبارها عند مستوى دلالة a=0.01.

I. اقتراح فرضية.

للإشارة إلى نوع التوزيع التجريبي، سنقوم ببناء رسم بياني


120 160 180 200 220 280

بناءً على مظهر الرسم البياني، يمكن للمرء أن يضع افتراضًا حول التوزيع الطبيعي للخاصية التي تتم دراستها في عموم السكان.

ثانيا. دعونا نتحقق من فرضية التوزيع الطبيعي باستخدام اختبار بيرسون لجودة المطابقة.

1. احسب، s B. كخيار، خذ الوسط الحسابي لنهايات الفترات:

2. أوجد الفواصل الزمنية (Z i ; Z i+1): ; .

لنأخذ (-¥) باعتباره الطرف الأيسر للفترة الأولى، و(+¥) باعتباره الطرف الأيمن للفترة الأخيرة. النتائج معروضة في الجدول. 4.

3. دعونا نجد الاحتمالات النظرية Р i والترددات النظرية (انظر الجدول 4).

الجدول 4

أنا الحدود الفاصلة Ф(زي) ه(ض ط+1) P i = Ф(Z i+1)-Ф(Z i)
× ط س ط+1 ض ط ض ط+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. دعونا نقارن بين التكرارات التجريبية والنظرية. لهذا:

أ) حساب القيمة المرصودة لمعيار بيرسون.

وترد الحسابات في الجدول 5.

الجدول 5

أنا
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
س

ب) باستخدام جدول النقاط الحرجة للتوزيع c 2 عند مستوى دلالة معين a=0.01 وعدد درجات الحرية k=m–3=5–3=2، نجد النقطة الحرجة؛ لدينا .

قارن ج. . وبالتالي لا يوجد سبب لرفض الفرضية الخاصة بقانون التوزيع الطبيعي للخاصية المدروسة لعموم السكان. أولئك. التناقض بين الترددات التجريبية والنظرية غير مهم (عشوائي). ◄

تعليق.فترات تحتوي على ترددات تجريبية صغيرة (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

2. اختبار فرضية التوزيع الموحد. عند استخدام اختبار بيرسون لاختبار الفرضية القائلة بأن المجتمع موزع بشكل موحد مع الكثافة الاحتمالية المقدرة

ومن الضروري، بعد حساب القيمة من العينة المتاحة، تقدير المعلمات أو بوفقا للصيغ:

أين أ*و ب*- التقييمات أو ب. في الواقع، لتوزيع موحد م(X) = , ، حيث يمكنك الحصول على نظام لتحديد أ*و ب*: ، وحلها هو العبارات (9).

ثم بافتراض ذلك يمكنك العثور على الترددات النظرية باستخدام الصيغ

هنا س– عدد الفترات التي تم تقسيم العينة إليها.

يتم حساب القيمة المرصودة لمعيار بيرسون باستخدام الصيغة (7`)، ويتم حساب القيمة الحرجة باستخدام الجدول مع الأخذ في الاعتبار أن عدد درجات الحرية ك = ق – 3. بعد ذلك يتم تحديد حدود المنطقة الحرجة بنفس طريقة اختبار فرضية التوزيع الطبيعي.

3. اختبار فرضية التوزيع الأسي.في هذه الحالة، بعد تقسيم العينة الموجودة إلى فترات متساوية الطول، نأخذ في الاعتبار تسلسل الخيارات، متباعدة بشكل متساو عن بعضها البعض (نفترض أن جميع الخيارات التي تقع في أنا- الفترة الرابعة، خذ قيمة تتطابق مع وسطها)، والترددات المقابلة لها ن ط(عدد خيارات العينة المضمنة في أنا- الفاصل الزمني). دعونا نحسب من هذه البيانات ونأخذها كتقدير للمعلمة λ مقاس. ثم يتم حساب التكرارات النظرية باستخدام الصيغة

ومن ثم تتم مقارنة القيمة الملحوظة والحاسمة لمعيار بيرسون مع الأخذ بعين الاعتبار أن عدد درجات الحرية ك = ق – 2.

مثال. بالنسبة للعينة التي تحتوي السلسلة الإحصائية الفاصلة فيها على النموذج

تحقق على مستوى الأهمية α = 0.05 فرضية س.

معيار كولموجوروف.

من الناحية العملية، بالإضافة إلى المعيار، غالبا ما يستخدم معيار كولموجوروف، حيث تعتبر القيمة المطلقة القصوى للفرق بين دالة التوزيع التجريبية كمقياس للتناقض بين التوزيعات النظرية والتجريبية
ووظيفة التوزيع النظرية المقابلة

, (1)

مُسَمًّى إحصائيات اختبار كولموجوروف .

وقد ثبت أنه مهما كانت وظيفة التوزيع
متغير عشوائي مستمر
، مع زيادة غير محدودة في عدد الملاحظات، واحتمال عدم المساواة
يميل إلى الحد

تحديد مستوى الأهمية
، من العلاقة

(3)

يمكن للمرء العثور على القيمة الحرجة المقابلة .

مخطط تطبيق معيار كولموغوروف هو كما يلي:

. (4)

تعليق

وتجدر الإشارة إلى أنه يمكن إيجاد حل لمثل هذه المشاكل باستخدام المعيار. الميزة المحتملة لمعيار كولموغوروف هي أنه لا يتطلب تجميع البيانات (مع فقدان المعلومات الحتمي)، بل يجعل من الممكن النظر في القيم الفردية المرصودة. ويمكن تطبيق هذا المعيار بنجاح على العينات الصغيرة. ويعتقد أن قوتها، بشكل عام، أعلى من قوة المعيار.

مثال: تم الحصول على عينة عشوائية من الحجم
. لنقم ببناء سلسلة تباين ووظيفة توزيع تجريبية:

دعونا نختبر الفرضية القائلة بأن هذه الملاحظات تشكل عينة عشوائية من التوزيع
مع مستوى الأهمية
. وبعد ذلك يمكننا تحديد
بيانياً أو تحليلياً، ويجب أن تظهر هذه القيم عند هذه النقطة ، المقابلة لإحدى الكميات المرصودة. ولهذا الغرض، من الضروري حساب أزواج الكميات و (انظر الشكل 1) لكل قيمة عينة.

للحساب، تذكر: أين توجد دالة التوزيع الطبيعي القياسية. نقدم نتائج جميع الحسابات في شكل جدول:

ومن جدول النتائج ما يلي: . من الجداول الإحصائية التي نحصل عليها
. بسبب ال
، ومن ثم يتم قبول الفرضية
، أي. يمكن اعتبار البيانات تتبع التوزيع.

اختبار الفرضيات حول تجانس العينة

فرضيات تجانس العينة هي فرضيات مفادها أن العينات المعنية مأخوذة من نفس المجتمع.

يجب أن تكون هناك عينتان مستقلتان مأخوذتان من مجموعات سكانية ذات وظائف توزيع نظرية غير معروفة
و
.

الفرضية الصفرية التي يتم اختبارها لها الشكل
ضد منافس
. سنفترض أن الوظائف مستمرة.

معيار كولموجوروف-سميرنوفيستخدم نفس فكرة اختبار كولموجوروف، ولكن اختبار كولموجوروف فقط يقارن دالة التوزيع التجريبية بوظيفة نظرية، ويقارن اختبار كولموجوروف-سميرنوف بين وظيفتين للتوزيع التجريبيين.

إحصائيات اختبار Kolmogorov-Smirnov لها الشكل:

,

أين
و
- دوال التوزيع التجريبية المبنية من عينتين بحجمين و . يتم رفضه على مستوى الأهمية إذا كانت القيمة المرصودة الفعلية أكثر أهمية، أي.
، ويقبل غير ذلك.

معيار كولموجوروف-سميرنوف في البرنامجإحصائيات في البيئةشبابيك

يعتمد المثال على دراسة عدوانية الأولاد والبنات في سن الرابعة (Siegel, S. (1956) الإحصاءات اللامعلمية للعلوم السلوكية (الثانية.) نيويورك: ماكجرو هيل). البيانات موجودة في ملف Aggressn.sta.

تمت ملاحظة اثني عشر فتى واثنتي عشرة فتاة خلال مباراة استمرت 15 دقيقة. تم تسجيل عدوانية كل طفل (من حيث التكرار ودرجة العدوان) وتم جمعها في مؤشر عدوان واحد تم حسابه لكل طفل.

يمارستحليل. يختار غير المعلماتمن القائمة إحصائيات.ثم اختر مقارنة عينتين مستقلتين (مجموعات).سيظهر مربع الحوار مقارنة مجموعتين. انقر على الزر المتغيرات. هنا حدد المتغير المتغير العدوانالخامس متكل عامل قائمةومتغير جنسالخامس إنديب. (تجميع) عامل. سيتم اختيار رموز تعيين كل ملاحظة بشكل لا لبس فيه لجنس معين تلقائيًا بواسطة البرنامج.

وكما يتبين من جدول النتائج، فإن الفرق بين عدوانية الأولاد والبنات في هذه الدراسة كبير للغاية.

من الناحية العملية، بالإضافة إلى معيار χ 2، غالبًا ما يتم استخدام معيار كولموجوروف، حيث تعتبر القيمة المطلقة القصوى للفرق بين دالة التوزيع التجريبية ووظيفة التوزيع النظرية المقابلة لها بمثابة مقياس للتناقض بين النظرية و التوزيعات التجريبية

تسمى إحصائية اختبار كولموجوروف.

من خلال تحديد مستوى الأهمية α، يمكنك العثور على القيمة الحرجة المقابلة

يوضح الجدول القيم الحرجة لمعيار كولموجوروف لبعض α.

الجدول 4.2.

مخطط لتطبيق معيار كولموغوروف

1. تم إنشاء دالة التوزيع التجريبية ودالة التوزيع النظرية المقدرة و(خ).

2. يتم تحديد إحصائية Kolmogorov D - يتم حساب مقياس التناقض بين التوزيع النظري والتجريبي والقيمة

3. إذا كانت القيمة المحسوبة lect أكبر من القيمة الحرجة، فإن الفرضية الصفرية H 0 القائلة بأن المتغير العشوائي X له قانون توزيع معين يتم رفضه.

إذا كانوا يعتقدون أن الفرضية H0 لا تتعارض مع البيانات التجريبية.

مثال.باستخدام اختبار كولموجوروف عند مستوى الدلالة α = 0.05، اختبر الفرضية H 0 القائلة بأن المتغير العشوائي X - ناتج العاملين في المؤسسة - له قانون توزيع طبيعي.

حل. 1. دعونا نبني وظائف التوزيع التجريبية والنظرية.

يتم إنشاء دالة التوزيع التجريبية باستخدام الترددات المتراكمة النسبية.

سنقوم ببناء دالة التوزيع النظرية وفقا للصيغة

أين

دعونا نلخص نتائج الحساب في جدول:

الجدول 4.3.

معيار كولموجوروف-سميرنوف. اختبار فرضية تجانس العينة

فرضيات تجانس العينة هي فرضيات مفادها أن العينات المعنية مأخوذة من نفس المجتمع.

يجب أن تكون هناك عينتان مستقلتان مأخوذتان من مجموعات سكانية ذات وظائف توزيع نظرية غير معروفة و.

الفرضية الصفرية التي يتم اختبارها تتعارض مع الفرضية المنافسة. سنفترض أن الوظائف مستمرة ونستخدم الإحصائيات لتقديرها كولموجوروف - سميرنوفا.

معيار كولموجوروف-سميرنوفيستخدم نفس فكرة معيار كولموجوروف. ومع ذلك، فإن الفرق هو أن اختبار كولموجوروف يقارن دالة التوزيع التجريبية مع دالة نظرية، في حين أن اختبار كولموجوروف-سميرنوف يقارن بين دالتين للتوزيع التجريبي.

إحصائيات اختبار Kolmogorov-Smirnov لها الشكل:

, (9.1)

أين و هي وظائف التوزيع التجريبية المبنية من عينتين مع مجلدات و .

يتم رفض الفرضية إذا كانت القيمة الفعلية المرصودة للإحصاء أكبر من القيمة الحرجة، أي. ، ويقبل غير ذلك.

بالنسبة لأحجام العينات الصغيرة، يمكن العثور على القيم الحرجة لمستويات أهمية الاختبار المحددة في جداول خاصة. متى (وعمليا متى) يتم تقليل توزيع الإحصائيات إلى توزيع كولموجوروف للإحصائيات. في هذه الحالة، يتم رفض الفرضية عند مستوى الأهمية إذا كانت القيمة الفعلية المرصودة أكبر من القيمة الحرجة، أي. ، ويقبل غير ذلك.

مثال 1.^ التحقق من تجانس عينتين

تم إجراء عمليتي تفتيش لمنافذ البيع بالتجزئة لتحديد الوزن المنخفض. النتائج التي تم الحصول عليها ملخصة في الجدول:


^ رقم الفاصل

فترات نقص الوزن، ز

الترددات

عينة 1

العينة 2

1

0 – 10

3

5

2

10 – 20

10

12

3

20 – 30

15

8

4

30 – 40

20

25

5

40 – 50

12

10

6

50 – 60

5

8

7

60 – 70

25

20

8

70 – 80

15

7

9

80 – 90

5

5

وكان حجم العينة الأولى مساوياً والثانية - .

حل:

دعونا نشير إلى و – الترددات المتراكمة للعينتين 1 و 2؛
, هي قيم وظائف التوزيع التجريبية، على التوالي. نلخص النتائج المعالجة في جدول:














10

3

5

0.027

0.050

0.023

20

13

17

0.118

0.170

0.052

30

28

25

0.254

0.250

0.004

40

48

50

0.436

0.500

0.064

50

60

60

0.545

0.600

0.055

60

65

68

0.591

0.680

0.089

70

90

88

0.818

0.880

0.072

80

105

95

0.955

0.950

0.005

90

110

100

1.000

1.000

0.000

ومن العمود الأخير في الجدول يتضح أن . باستخدام الصيغة (9.1) نحصل عليها . ومن المعروف من الجداول الإحصائية أن. وبما أنه يتم قبول الفرضية الصفرية، أي. يتم وصف الأوزان المنخفضة للمشترين بنفس وظيفة التوزيع.

^

الاستقلال الإحصائي وكشف الاتجاه


عند تحليل البيانات العشوائية، غالبًا ما تنشأ مواقف عندما تريد تحديد ما إذا كانت الملاحظات أو تقديرات المعلمات مستقلة إحصائيًا أو تخضع لاتجاه ما. وهذا مهم بشكل خاص عند التحليل بيانات غير ثابتة

وعادة ما يتم إجراء مثل هذه الدراسات على الأساس خالية من التوزيعاتأو الأساليب غير البارامترية، حيث لم يتم وضع أي افتراضات بشأن وظيفة توزيع البيانات قيد الدراسة.
^

معيار السلسلة


ضع في اعتبارك سلسلة من القيم المرصودة لمتغير عشوائي، مع تعيين كل ملاحظة لواحدة من فئتين متنافيتين، والتي يمكن الإشارة إليها ببساطة (+) أو
(-). دعونا نلقي نظرة على عدد من الأمثلة:

في كل من هذه الأمثلة، يتم تشكيل تسلسل من النموذج:

^ السلسلة عبارة عن سلسلة من الملاحظات من نفس النوع، تسبقها وتليها ملاحظات من النوع المعاكس، أو لا توجد ملاحظات على الإطلاق.

في التسلسل المحدد، عدد الملاحظات يساوي ; وعدد الحلقات يساوي .

إذا كانت سلسلة من الملاحظات تتكون من نتائج مستقلة لنفس المتغير العشوائي، أي. إذا لم يتغير احتمال النتائج الفردية [(+) أو (-)] من ملاحظة إلى أخرى، فإن توزيع العينات لعدد السلاسل في التسلسل هو متغير عشوائي بمتوسط ​​وتباين:

(9.2)

(9.3)

عدد النواتج هنا هو (+)، وعدد النواتج هو (-)، بطبيعة الحال. في حالة خاصة إذا، ثم:

. (9.4)

لنفترض أن هناك سببًا للشك في وجود اتجاه في تسلسل الملاحظات، أي: هناك سبب للاعتقاد بأن احتمال حدوث (+) أو (-) يختلف من ملاحظة إلى أخرى. ويمكن التحقق من وجود الاتجاه على النحو التالي. دعونا نقبل الفرضية الصفرية، حيث لا يوجد اتجاه، أي. لنفترض أن الملاحظات هي نتائج مستقلة لنفس المتغير العشوائي. بعد ذلك، لاختبار الفرضية بأي مستوى مطلوب من الأهمية، من الضروري مقارنة عدد السلاسل المرصودة مع حدود منطقة قبول الفرضية التي تساوي و أين.

إذا كان عدد مرات التشغيل المرصودة خارج نطاق قبول الفرضية، فيجب رفض الفرضية الصفرية بمستوى دلالة . وبخلاف ذلك يمكن قبول الفرضية الصفرية.

مثال 2.^ تطبيق معايير السلسلة

هناك سلسلة من الملاحظات المستقلة:


5.5

5.1

5.7

5.2

4.8

5.7

5.0

6.5

5.4

5.8

6.8

6.6

4.9

5.4

5.9

5.4

6.8

5.8

6.9

5.5

دعونا نتحقق من استقلالية الملاحظات عن طريق حساب عدد السلاسل في التسلسل الذي تم الحصول عليه من خلال مقارنة الملاحظات مع الوسيط. دعونا نطبق معيارًا بمستوى الأهمية.

ومن تحليل البيانات نجد أن القيمة هي الوسيط. ثم ندخل الرمز (+) لـ , (-) لـ . إذن نحصل على:

وفي مثالنا، ومجال قبول الفرضية يكون بالشكل:

.

نجد من الجداول الإحصائية. لأن