آزمون نیکویی تناسب کولموگروف-اسمیرنوف روشی برای ارزیابی توزیع یک جمعیت است. SPSS در روانشناسی و علوم اجتماعی معیار کلموگروف برای تعلق به نمونه عمومی

هدف از معیار. معیار λ برای مقایسه دو توزیع در نظر گرفته شده است: a). تجربی با نظری، برای مثال، یکنواخت یا عادی. ب). یک توزیع تجربی با توزیع تجربی دیگر.

محدودیت های معیار.این معیار مستلزم آن است که نمونه به اندازه کافی بزرگ باشد، ≥50.

فرضیه ها:

: تفاوت بین دو توزیع معنی دار نیست.

: تفاوت بین دو توزیع قابل توجه است.

الگوریتم محاسبه λ - معیار.

بیایید یک جدول برای محاسبات آسان ایجاد کنیم:

1. ستون اول حاوی مقادیر تجربی مشخصه است که به ترتیب صعودی مرتب شده اند.

2. ستون دوم شامل فرکانس های تجربی برای هر مقدار، و در ستون سوم فرکانس های تجربی نسبی برای هر مقدار، محاسبه شده با فرمول: f* emp j = f emp j / n، که در آن f emp j فرکانس تجربی از ستون دوم، n - اندازه نمونه.

3. فرکانس های تجربی "انباشته شده" را با استفاده از فرمول محاسبه می کنیم:

∑ f* emp j = ∑ f* emp j -1 + f* emp j ,

که در آن ∑ f* emp j -1 - فرکانس انباشته شده بر روی مقادیر قبلی ویژگی.

j - شماره سریال مقدار مشخصه. f* emp j – فرکانس تجربی یک تخلیه j معین. نتایج در ستون 4 قرار داده شده است.

4. اگر با توزیع نظری شناخته شده مقایسه شود، ستون 5 حاوی فرکانس های نظری انباشته شده است. اگر 2 توزیع تجربی مقایسه شوند، فرکانس های تجربی انباشته شده برای نمونه 2 در ستون 5 قرار می گیرند.

5. تفاوت بین فرکانس های انباشته محاسبه شده و مقادیر مطلق آنها در ستون 6 قرار می گیرد. بیایید آنها را d j نشان دهیم.

6. حداکثر مقدار d j → d max را با استفاده از ستون 6 تعیین کنید.

7. λ emp را با استفاده از فرمول محاسبه کنید:

,

که در آن n 1 - اندازه نمونه 1، n 2 - اندازه نمونه 2، اگر = = n، سپس .

8. بر اساس سطح اهمیت داده شده، نقطه مرزی λ cr از جدول VII پیوست یافت می شود.

9. اگر λ em< λ кр, то различия между распределениями признака незначимы; если λ эмп >λ cr، سپس تفاوت بین توزیع های مشخصه قابل توجه است.

مثال. خواربارفروشی وزن‌های کنترلی سوسیس‌های فروخته شده را انجام داد. حجم نمونه n = 100. داده های به دست آمده در جدول نشان داده شده است.

کمبود وزن، گرم
فرکانس

با استفاده از آزمون λ - کولموگروف - اسمیرنوف در سطح معنی داری α = 0.05 تعیین کنید که آیا داده های نمونه با توزیع یکنواخت در بخش مطابقت دارند یا خیر.

راه حل.: تفاوت بین توزیع نظری تجربی و تخمینی معنی دار نیست.

: تفاوت بین توزیع نظری تجربی و تخمینی قابل توجه است.

تابع توزیع یک متغیر تصادفی که به طور یکنواخت روی یک قطعه توزیع شده است به شکل زیر است:

بیایید جدول را پر کنیم:

x j f em j f em j /n ∑ f* emp j ∑ نظریه f* j دی جی
0,10 0,10 0,1
0,11 0,21 0,2 0,01
0,08 0,29 0,3 0,01
0,09 0,38 0,4 0,02
0,12 0,50 0,5
0,10 0,60 0,6
0,13 0,73 0,7 0,03
0,15 0,88 0,8 0,08
0,12 1,00 0,9 0,1

اجازه دهید نحوه پر شدن جدول را توضیح دهیم. مقادیر دو ستون اول از شرط گرفته شده است. هر عدد در ستون دوم را بر n=100 تقسیم می کنیم و نتیجه را در ستون 3 می نویسیم. هر عدد در ستون 4 برابر است با مجموع عدد همان ردیف در ستون 3 و عدد قبلی در ستون 4. هر عدد در ستون 1 را با فرمول f * theor = x j /10 جایگزین می کنیم و نتیجه را در ستون 5 می نویسیم. ستون 6 - ماژول تفاوت بین 4 و 5 ستون. بیشترین عدد در ستون 6 d max =0.1; λ em = 0.1 = 1.

با استفاده از سطح معناداری α = 0.05 از جدول ضمیمه VI، ما نقطه مرزی λ cr = 1.358 را پیدا می کنیم. از آنجایی که λ em< λ кр (1 < 1,358), то принимаем гипотезу на уровне значимости α = 0,05. Данные выборки согласуются с равномерным распределением на отрезке .

پیش از این فرضیه هایی در نظر گرفته شد که در آنها قانون توزیع جمعیت مشخص بود. اکنون ما شروع به آزمایش فرضیه هایی در مورد قانون فرضی توزیع مجهول می کنیم، یعنی فرضیه صفر را آزمایش می کنیم که جمعیت طبق قانون شناخته شده توزیع شده است. به طور معمول، آزمون های آماری برای آزمون چنین فرضیه هایی نامیده می شود معیارهای رضایت

معیار توافقمعیاری برای آزمایش یک فرضیه در مورد قانون فرضی یک توزیع مجهول نامیده می شود. این یک معیار عددی برای اختلاف بین توزیع تجربی و نظری است.

وظیفه اصلی.توزیع تجربی (نمونه) داده شده است. در مورد نوع توزیع نظری یک فرضیه بسازید (فرضیه ای ارائه کنید) و فرضیه را در سطح اهمیت معین α آزمایش کنید.

راه حل مشکل اصلی شامل دو بخش است:

1. ارائه یک فرضیه.

2. آزمون فرضیه در سطح معناداری معین.

بیایید به جزئیات این بخش ها نگاه کنیم.

1. انتخاب فرضیهتعیین نوع توزیع نظری با استفاده از چند ضلعی یا هیستوگرام فرکانس راحت است. چند ضلعی (یا هیستوگرام) تجربی را با قوانین توزیع شناخته شده مقایسه کنید و مناسب ترین آنها را انتخاب کنید.

در اینجا نمودارهایی از مهمترین قوانین توزیع آورده شده است:

نمونه هایی از قوانین توزیع تجربی در شکل ها نشان داده شده است:



در مورد (الف) فرضیه توزیع نرمال، در مورد (ب) - فرضیه توزیع یکنواخت، در مورد (ج) - فرضیه توزیع پواسون مطرح شده است.

مبنای ارائه یک فرضیه در مورد توزیع نظری می تواند مقدمات نظری در مورد ماهیت تغییر در ویژگی باشد. به عنوان مثال، تحقق شرایط قضیه لیاپانوف به ما اجازه می دهد تا فرضیه ای در مورد توزیع نرمال بسازیم. برابری میانگین و واریانس توزیع پواسون را نشان می دهد.

در عمل، ما اغلب با یک توزیع نرمال مواجه می شویم، بنابراین در وظایف خود فقط باید فرضیه توزیع نرمال را آزمایش کنیم.

آزمایش فرضیهدر مورد توزیع نظری به این سوال پاسخ می دهد: آیا می توان اختلاف بین توزیع های نظری و تجربی فرضی را تصادفی، ناچیز در نظر گرفت، یا با تصادفی بودن اشیاء خاصی که در نمونه گنجانده شده اند توضیح داده شود، یا این اختلاف نشان دهنده اختلاف معنی داری بین توزیع ها است. روشهای مختلفی برای تأیید وجود دارد (معیارهای مناسب بودن) - ج 2 (chi-square)، کولموگروف، رومانوفسکی و غیره.

معیار پیرسون

مزیت معیار پیرسون جهانی بودن آن است: می توان از آن برای آزمایش فرضیه های مربوط به قوانین توزیع مختلف استفاده کرد.

1. آزمون فرضیه توزیع نرمال.بگذارید یک نمونه به اندازه کافی بزرگ به دست آید پبا بسیاری از گزینه های معانی مختلف. برای راحتی پردازش آن، فاصله را از کوچکترین تا بزرگ ترین مقدار گزینه به سقسمت های مساوی و فرض می کنیم که مقادیر گزینه هایی که در هر بازه قرار می گیرند تقریباً برابر با عددی است که وسط فاصله را مشخص می کند. با شمارش تعداد گزینه هایی که در هر بازه قرار می گیرند، یک نمونه به اصطلاح گروه بندی شده ایجاد می کنیم:

گزینه ها……….. ایکس 1 ایکس 2 … x s

فرکانس ها…………. پ 1 پ 2 … n s ,

جایی که x iمقادیر نقاط میانی فواصل هستند و n من- تعداد گزینه های موجود در من-فاصله (فرکانس های تجربی). از داده های به دست آمده می توانید میانگین نمونه و انحراف معیار نمونه را محاسبه کنید σ B. بیایید این فرض را بررسی کنیم که جمعیت بر اساس یک قانون عادی با پارامترها توزیع شده است م(ایکس) = , D(ایکس) = . سپس می توانید تعداد اعداد را از حجم نمونه پیدا کنید پ، که باید در هر بازه تحت این فرض ظاهر شود (یعنی فرکانس های نظری). برای انجام این کار، با استفاده از جدول مقادیر تابع لاپلاس، احتمال ورود به آن را پیدا می کنیم منفاصله ام:

,

جایی که و منو b i- مرزها من-مین فاصله با ضرب احتمالات به دست آمده در حجم نمونه n، بسامدهای نظری را پیدا می کنیم: p i =n·p iهدف ما این است که بسامدهای تجربی و نظری را که البته با یکدیگر متفاوت هستند، مقایسه کنیم و دریابیم که آیا این تفاوت ها ناچیز هستند و فرضیه توزیع نرمال متغیر تصادفی مورد مطالعه را رد نمی کنند یا خیر. آنقدر بزرگ که با این فرضیه در تناقض هستند. برای این منظور از معیاری در قالب متغیر تصادفی استفاده می شود

. (7)

معنای آن واضح است: قسمت هایی که مجذور انحراف فرکانس های تجربی از فرکانس های نظری تشکیل می دهند از فرکانس های نظری مربوطه خلاصه می شوند. می توان ثابت کرد که بدون توجه به قانون توزیع واقعی جمعیت عمومی، قانون توزیع متغیر تصادفی (7) با تعداد درجات آزادی به قانون توزیع گرایش دارد. k = s - 1 – r، جایی که r- تعداد پارامترهای توزیع مورد انتظار برآورد شده از داده های نمونه. بنابراین توزیع نرمال با دو پارامتر مشخص می شود k = s - 3. برای معیار انتخاب شده، یک منطقه بحرانی سمت راست ساخته می شود که با شرط تعیین می شود

(8)

جایی که α - سطح اهمیت در نتیجه، منطقه بحرانی توسط نابرابری داده می شود و حوزه پذیرش فرضیه است .

بنابراین، برای آزمایش فرضیه صفر ن 0: جامعه به طور معمول توزیع شده است - شما باید مقدار مشاهده شده معیار را از نمونه محاسبه کنید:

, (7`)

و با استفاده از جدول نقاط بحرانی توزیع χ2، نقطه بحرانی را با استفاده از مقادیر شناخته شده α و k = s - 3. اگر - فرض صفر پذیرفته شود، در صورتی که رد شود.

مثال.نتایج مطالعه تقاضا برای محصول در جدول ارائه شده است:

فرضیه ای در مورد نوع توزیع مطرح کنید و آن را در سطح معناداری 01/0 a=آزمایش کنید.

I. ارائه یک فرضیه.

برای نشان دادن نوع توزیع تجربی، یک هیستوگرام می سازیم


120 160 180 200 220 280

بر اساس شکل ظاهری هیستوگرام، می توان در مورد توزیع نرمال مشخصه مورد مطالعه در جمعیت عمومی فرضی داشت.

II. بیایید فرضیه توزیع نرمال را با استفاده از آزمون نیکویی برازت پیرسون بررسی کنیم.

1. s B را محاسبه کنید. به عنوان یک گزینه، میانگین حسابی انتهای فواصل را در نظر بگیرید:

2. فواصل (Z i ؛ Z i+1) را بیابید: ; .

اجازه دهید (¥) را به عنوان انتهای چپ اولین بازه، و (+¥) را به عنوان انتهای سمت راست آخرین بازه در نظر بگیریم. نتایج در جدول ارائه شده است. 4.

3. بیایید احتمالات نظری Р i و فرکانس های نظری را پیدا کنیم (جدول 4 را ببینید).

جدول 4

من مرز فاصله Ф(Zi) Ф(Z i+1) P i = Ф(Z i+1)-Ф(Z i)
x i x i+1 Z i Z i+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. بیایید بسامدهای تجربی و نظری را با هم مقایسه کنیم. برای این:

الف) مقدار مشاهده شده معیار پیرسون را محاسبه کنید.

محاسبات در جدول 5 ارائه شده است.

جدول 5

من
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
اس

ب) با استفاده از جدول نقاط بحرانی توزیع c 2 در سطح معنی داری a=0.01 و تعداد درجات آزادی k=m–3=5–3=2، نقطه بحرانی را پیدا می کنیم. ما داریم .

ج را مقایسه کنید . در نتیجه، دلیلی برای رد فرضیه قانون توزیع نرمال ویژگی مورد مطالعه در جمعیت عمومی وجود ندارد. آن ها اختلاف بین فرکانس های تجربی و نظری ناچیز است (تصادفی). ◄

اظهار نظر.فواصل حاوی فرکانس های تجربی کوچک (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

2. آزمون فرضیه توزیع یکنواخت. هنگام استفاده از آزمون پیرسون برای آزمایش این فرضیه که جمعیت به طور یکنواخت با چگالی احتمال تخمین زده شده توزیع شده است.

لازم است با محاسبه مقدار از نمونه موجود، پارامترها برآورد شوند آو بطبق فرمول های:

جایی که آ*و ب*- ارزیابی ها آو ب. در واقع، برای توزیع یکنواخت م(ایکس) = , ، جایی که می توانید یک سیستم برای تعیین دریافت کنید آ*و ب*: که راه حل آن عبارات (9) است.

سپس با این فرض ، می توانید فرکانس های نظری را با استفاده از فرمول ها پیدا کنید

اینجا س- تعداد فواصل زمانی که نمونه به آنها تقسیم می شود.

مقدار مشاهده شده از معیار پیرسون با استفاده از فرمول (7`) و مقدار بحرانی با در نظر گرفتن تعداد درجه آزادی با استفاده از جدول محاسبه می شود. k = s - 3. پس از این، مرزهای منطقه بحرانی به همان روشی که برای آزمایش فرضیه توزیع نرمال تعیین می شود.

3. آزمون فرضیه در مورد توزیع نمایی.در این حالت، پس از تقسیم نمونه موجود به فواصل با طول مساوی، دنباله ای از گزینه ها را با فاصله مساوی از یکدیگر در نظر می گیریم (فرض می کنیم که همه گزینه هایی که در من- امین بازه، یک مقدار منطبق بر وسط آن و فرکانس های مربوط به آنها را بگیرید n من(تعداد گزینه های نمونه موجود در من- فاصله بین). اجازه دهید از این داده ها محاسبه کنیم و به عنوان تخمینی از پارامتر در نظر بگیریم λ اندازه. سپس فرکانس های نظری با استفاده از فرمول محاسبه می شوند

سپس ارزش مشاهده شده و بحرانی معیار پیرسون با در نظر گرفتن این واقعیت که تعداد درجات آزادی مقایسه می شود. k = s - 2.

مثال. برای نمونه ای که سری آماری بازه ای آن دارای فرم است

بررسی در سطح معناداری α = 0.05 فرضیه o.

معیار کولموگروف

در عمل، علاوه بر معیار، اغلب از معیار کولموگروف استفاده می شود که در آن حداکثر قدر مطلق تفاوت بین تابع توزیع تجربی به عنوان معیاری از اختلاف بین توزیع های نظری و تجربی در نظر گرفته می شود.
و تابع توزیع نظری مربوطه

, (1)

تماس گرفت آمار آزمون کولموگروف .

ثابت شده است که تابع توزیع هر چه باشد
متغیر تصادفی پیوسته
، با افزایش نامحدود در تعداد مشاهدات، احتمال نابرابری وجود دارد
به سمت حد میل می کند

تنظیم سطح اهمیت
، از رابطه

(3)

می توان مقدار بحرانی مربوطه را پیدا کرد .

طرح استفاده از معیار کولموگروف به شرح زیر است:

. (4)

اظهار نظر

می توان اشاره کرد که راه حل چنین مشکلاتی را می توان با استفاده از معیار یافت. یک مزیت بالقوه معیار کولموگروف این است که نیازی به گروه بندی داده ها ندارد (با از دست دادن اجتناب ناپذیر اطلاعات)، بلکه امکان در نظر گرفتن مقادیر مشاهده شده فردی را فراهم می کند. این معیار را می توان با موفقیت برای نمونه های کوچک به کار برد. اعتقاد بر این است که قدرت آن، به طور کلی، بالاتر از معیار است.

مثال یک نمونه تصادفی از حجم به دست می آید
. بیایید یک سری تغییرات و یک تابع توزیع تجربی بسازیم:

بیایید این فرضیه را آزمایش کنیم که این مشاهدات یک نمونه تصادفی از توزیع را تشکیل می دهند
با سطح معنی داری
. سپس می توانیم تعیین کنیم
به صورت گرافیکی یا تحلیلی، و این مقادیر باید در نقطه ظاهر شوند ، مربوط به یکی از کمیت های مشاهده شده است. برای این منظور لازم است جفت کمیت ها محاسبه شود و (شکل 1 را ببینید) برای هر مقدار نمونه.

برای محاسبه، به یاد داشته باشید:، تابع توزیع نرمال استاندارد کجاست. ما نتایج تمام محاسبات را در قالب یک جدول ارائه می دهیم:

از جدول نتایج به شرح زیر است: . از جداول آماری بدست می آوریم
. زیرا
، سپس فرضیه پذیرفته می شود
، یعنی داده ها را می توان به دنبال یک توزیع در نظر گرفت.

آزمون فرضیه های مربوط به همگنی نمونه

فرضیه های همگنی نمونه، فرضیه هایی هستند که نمونه های مورد نظر از یک جامعه گرفته شده اند.

اجازه دهید دو نمونه مستقل از جمعیت هایی با توابع توزیع نظری ناشناخته گرفته شود
و
.

فرضیه صفر در حال آزمایش دارای فرم است
در برابر یک رقیب
. فرض می کنیم که توابع و پیوسته هستند.

معیار کولموگروف-اسمیرنوفاز همان ایده آزمون کولموگروف استفاده می کند، اما فقط آزمون کولموگروف یک تابع توزیع تجربی را با یک تابع نظری مقایسه می کند و آزمون کولموگروف-اسمیرنوف دو تابع توزیع تجربی را با هم مقایسه می کند.

آمار آزمون کولموگروف-اسمیرنوف به شکل زیر است:

,

جایی که
و
- توابع توزیع تجربی از دو نمونه با حجم ساخته شده است و . اگر مقدار واقعی مشاهده شده باشد، در سطح معنی داری رد می شود انتقادی تر، یعنی
، و در غیر این صورت پذیرفته می شود.

معیار کولموگروف-اسمیرنوف در برنامهآمار در محیط زیستپنجره ها

مثال بر اساس مطالعه پرخاشگری پسران و دختران چهار ساله است (Siegel, S. (1956) آمار ناپارامتریک برای علوم رفتاری (2nd.) New York: McGraw-Hill). داده ها در فایل Aggressn.sta موجود است.

در طول یک بازی 15 دقیقه ای 12 پسر و 12 دختر مشاهده شدند. پرخاشگری هر کودک نمره گذاری شد (از نظر فراوانی و درجه پرخاشگری) و در یک شاخص پرخاشگری مجزا که برای هر کودک محاسبه شد، خلاصه شد.

ورزشتحلیل و بررسی. انتخاب کنید ناپارامتری هااز منو آمار.سپس انتخاب کنید مقایسه دو نمونه (گروه) مستقل.یک جعبه گفتگو ظاهر خواهد شد مقایسه دو گروه. روی دکمه کلیک کنید متغیرها. در اینجا متغیر متغیر را انتخاب کنید پرخاشگر V وابسته متغیر فهرستو یک متغیر جنسیت V Indep. (گروه بندی) متغیر. کدهایی برای تخصیص بدون ابهام هر مشاهده به یک جنسیت خاص به طور خودکار توسط برنامه انتخاب می شود.

همانطور که از جدول نتایج مشخص است، تفاوت بین پرخاشگری دختران و پسران در این مطالعه بسیار معنادار است.

در عمل، علاوه بر معیار χ 2، معمولاً از معیار کولموگروف استفاده می شود که در آن حداکثر مقدار مطلق تفاوت بین تابع توزیع تجربی و تابع توزیع نظری مربوطه به عنوان معیاری برای اختلاف بین نظری و نظری در نظر گرفته می شود. توزیع های تجربی

به نام آماره آزمون کولموگروف.

با تنظیم سطح اهمیت α، می توانید مقدار بحرانی مربوطه را پیدا کنید

جدول مقادیر بحرانی معیار کولموگروف را برای برخی α نشان می دهد.

جدول 4.2.

طرحی برای استفاده از معیار کولموگروف

1. یک تابع توزیع تجربی و یک تابع توزیع نظری برآورد شده ساخته شده است F(x).

2. آمار کلموگروف D تعیین می شود - اندازه گیری اختلاف بین توزیع نظری و تجربی و مقدار محاسبه می شود.

3. اگر مقدار محاسبه شده λ بزرگتر از مقدار بحرانی باشد، آنگاه فرض صفر H 0 مبنی بر اینکه متغیر تصادفی X قانون توزیع معینی دارد رد می شود.

اگر، پس آنها معتقدند که فرضیه H 0 با داده های تجربی مغایرتی ندارد.

مثال.با استفاده از آزمون کولموگروف در سطح معناداری α = 0.05، فرضیه H 0 را آزمایش کنید که متغیر تصادفی X - خروجی کارگران شرکت - دارای قانون توزیع نرمال است.

راه حل. 1. بیایید توابع توزیع تجربی و نظری بسازیم.

تابع توزیع تجربی با استفاده از فرکانس های انباشته شده نسبی ساخته شده است.

تابع توزیع نظری را طبق فرمول می سازیم

جایی که

بیایید نتایج محاسبات را در یک جدول خلاصه کنیم:

جدول 4.3.

معیار کولموگروف-اسمیرنوف. آزمون فرضیه همگنی نمونه

فرضیه های همگنی نمونه، فرضیه هایی هستند که نمونه های مورد نظر از یک جامعه گرفته شده اند.

اجازه دهید دو نمونه مستقل از جمعیت هایی با توابع توزیع نظری ناشناخته و .

فرضیه صفر در حال آزمایش در برابر فرضیه رقیب است. فرض می کنیم که توابع و پیوسته هستند و از آمار برای تخمین استفاده می کنیم کولموگروف – اسمیرنوا.

معیار کولموگروف-اسمیرنوفاز همان ایده معیار کولموگروف استفاده می کند. با این حال، تفاوت این است که آزمون کولموگروف یک تابع توزیع تجربی را با یک تابع نظری مقایسه می کند، در حالی که آزمون کولموگروف-اسمیرنوف دو تابع توزیع تجربی را مقایسه می کند.

آمار آزمون کولموگروف-اسمیرنوف به شکل زیر است:

, (9.1)

توابع توزیع تجربی که از دو نمونه با حجم و .

اگر مقدار واقعی مشاهده شده آماره از مقدار بحرانی بیشتر باشد، فرضیه رد می شود. ، و در غیر این صورت پذیرفته می شود.

برای اندازه های نمونه کوچک، مقادیر بحرانی برای سطوح اهمیت آزمون داده شده را می توان در جداول ویژه یافت. چه زمانی (و عملاً چه زمانی) توزیع آمار به توزیع کلموگروف برای آمار کاهش می یابد. در این مورد، اگر مقدار واقعی مشاهده شده از مقدار بحرانی بیشتر باشد، در سطح معنی داری رد می شود. ، و در غیر این صورت پذیرفته می شود.

مثال 1.^ بررسی همگنی دو نمونه

دو بازرسی از فروشگاه های خرده فروشی برای شناسایی وزن کم انجام شد. نتایج به دست آمده در جدول خلاصه شده است:


^ شماره فاصله

فواصل کم وزنی، g

فرکانس ها

نمونه 1

نمونه 2

1

0 – 10

3

5

2

10 – 20

10

12

3

20 – 30

15

8

4

30 – 40

20

25

5

40 – 50

12

10

6

50 – 60

5

8

7

60 – 70

25

20

8

70 – 80

15

7

9

80 – 90

5

5

حجم نمونه اول برابر بود و دومی - .

راه حل:

فرکانس‌های انباشته‌شده نمونه‌های 1 و 2 را نشان می‌دهیم.
, به ترتیب مقادیر توابع توزیع تجربی آنها هستند. ما نتایج پردازش شده را در یک جدول خلاصه می کنیم:














10

3

5

0.027

0.050

0.023

20

13

17

0.118

0.170

0.052

30

28

25

0.254

0.250

0.004

40

48

50

0.436

0.500

0.064

50

60

60

0.545

0.600

0.055

60

65

68

0.591

0.680

0.089

70

90

88

0.818

0.880

0.072

80

105

95

0.955

0.950

0.005

90

110

100

1.000

1.000

0.000

از ستون آخر جدول مشخص است که . با استفاده از فرمول (9.1) بدست می آوریم . از جداول آماری مشخص می شود که. از آنجا که، پس فرضیه صفر پذیرفته می شود، یعنی. وزن کم برای خریداران با همان تابع توزیع توصیف می شود.

^

استقلال آماری و تشخیص روند


هنگام تجزیه و تحلیل داده‌های تصادفی، اغلب موقعیت‌هایی پیش می‌آید که می‌خواهید تعیین کنید که آیا مشاهدات یا برآورد پارامترها از نظر آماری مستقل هستند یا تابع یک روند هستند. این امر به ویژه هنگام تجزیه و تحلیل بسیار مهم است داده های غیر ثابت

چنین مطالعاتی معمولا بر اساس انجام می شود عاری از توزیعیا روش های ناپارامتریک، که در آن هیچ فرضی در رابطه با تابع توزیع داده های مورد مطالعه وجود ندارد.
^

معیار سری


دنباله ای از مقادیر مشاهده شده از یک متغیر تصادفی را در نظر بگیرید، با هر مشاهده به یکی از دو کلاس منحصر به فرد، که می تواند به سادگی (+) یا نشان داده شود.
(–). بیایید به چند نمونه نگاه کنیم:

در هر یک از این مثال ها، دنباله ای از فرم تشکیل می شود:

^ یک سری دنباله ای از مشاهدات از یک نوع است که قبل و بعد از آن مشاهداتی از نوع مخالف یا اصلاً مشاهده نشده است.

در دنباله داده شده، تعداد مشاهدات برابر است با ; و تعداد قسمت ها برابر است با .

اگر دنباله ای از مشاهدات متشکل از نتایج مستقل از همان متغیر تصادفی باشد، به عنوان مثال. اگر احتمال نتایج فردی [(+) یا (-)] از مشاهده به مشاهده تغییر نکند، توزیع نمونه از تعداد سری ها در دنباله یک متغیر تصادفی با میانگین و واریانس است:

(9.2)

(9.3)

در اینجا تعداد پیامدها (+) و تعداد پیامدها (-) است. در مورد خاص اگر، پس:

. (9.4)

اجازه دهید فرض کنیم که دلیلی برای مشکوک بودن وجود یک روند در توالی مشاهدات وجود دارد، یعنی. دلیلی وجود دارد که باور کنیم احتمال وقوع (+) یا (-) از مشاهده ای به مشاهده دیگر متفاوت است. وجود روند را می توان به شرح زیر تأیید کرد. اجازه دهید به عنوان فرضیه صفر بپذیریم که هیچ روندی وجود ندارد، یعنی. اجازه دهید فرض کنیم که مشاهدات نتایج مستقل از همان متغیر تصادفی هستند. سپس برای آزمون فرضیه با هر سطح از اهمیت مورد نیاز، لازم است تعداد سری‌های مشاهده‌شده را با مرزهای ناحیه پذیرش فرضیه برابر و، که در آن، مقایسه کنیم.

اگر تعداد اجراهای مشاهده شده خارج از محدوده پذیرش فرضیه باشد، فرضیه صفر باید با سطح معناداری رد شود. در غیر این صورت فرضیه صفر قابل قبول است.

مثال 2.^ بکارگیری معیارهای سری

دنباله ای از مشاهدات مستقل وجود دارد:


5.5

5.1

5.7

5.2

4.8

5.7

5.0

6.5

5.4

5.8

6.8

6.6

4.9

5.4

5.9

5.4

6.8

5.8

6.9

5.5

بیایید استقلال مشاهدات را با شمارش تعداد سری ها در دنباله به دست آمده از مقایسه مشاهدات با میانه بررسی کنیم. بیایید یک معیار با سطح معناداری را اعمال کنیم.

از تجزیه و تحلیل داده ها متوجه می شویم که مقدار میانه است. سپس علامت (+) را برای , (–) برای . بنابراین، دریافت می کنیم:

در مثال ما، و حوزه پذیرش فرضیه به شکل زیر است:

.

ما از جداول آماری پیدا می کنیم. زیرا