معلومة

حدود الانحراف والتفرطح في معدل الذكاء

حدود الانحراف والتفرطح في معدل الذكاء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

مسألة ما إذا كان معدل الذكاء يتم توزيعه بشكل طبيعي ، أم أنه يتبع على سبيل المثال تمت مناقشة توزيع بيرسون من النوع الرابع منذ عام 1910 على الأقل. التعاريف القائمة على الحاصل والانحراف تؤدي بالطبع إلى عصور مختلفة للغاية في هذا النقاش. (ومع ذلك ، فإن توزيع معدل الذكاء ذي القيمة الصحيحة لا يمكن أن يكون طبيعيًا تمامًا ، حتى على التعريف المستند إلى الانحراف.) يتميز التوزيع الطبيعي بمتوسطه بشكل فريد $ mu $ والانحراف المعياري $ سيغما $. اللحظتان التاليتان هما الانحراف $ gamma_1 = 0 دولار والتفرطح الزائد $ kappa_ text {extra} = 0 $. لإزالة الغموض ، لقد حددت

$$ gamma_1 = mathbb {E} bigg ( tfrac {X- mu} { sigma} bigg) ^ 3، ، kappa_ text {extra}: = mathbb {E} bigg ( tfrac {X- mu} { sigma} bigg) ^ 4-3. $$

على النقيض من ذلك ، يتطلب توزيع بيرسون من النوع الرابع تحديد جميع اللحظات الأربع.

بينما لا يمكننا إثبات ذلك حرفيًا $ gamma_1 = kappa_ text {extra} = 0 $ من الناحية التجريبية ، يمكننا تقييد مثل هذه الكميات. هل قدمت أي دراسات تجريبية إما الحدود العليا أو السفلية لهذه اللحظات لتوزيع معدل الذكاء (أو شيء مشابه مثل تقدير كمي آخر لقياس السيكومتري ز $) ، على أي من حاصل القسمة أو تعريف الانحراف؟ من أجل إبقاء هذا السؤال مناسبًا للموقع ، لا يهمني ما هي طريقة تحديد أو قياس معدل الذكاء الذي تم افتراضه في دراسة معينة ، لذلك ليس هناك حاجة لاتخاذ موقف بشأن ذلك.


هناك دراسات يتم فيها تحليل لحظات الترتيب الأعلى. من أعلى رأسي ، انظر (Johnson، Carothers، Deary، 2008). كانت النقطة الفعلية لهذه الدراسة هي فحص فرضية التباين الذكوري الأكبر (التي وُجدت البيانات متسقة معها بشدة) ، لكنهم قاموا أيضًا بتحليل توزيعات القدرة بشكل عام. قاموا بتحليل بيانات المسح الذهني الاسكتلندي ، الذي اختبر بشكل أساسي جميع أطفال اسكتلندا في عمر معين. وجدوا أن التوزيع غير متماثل بالتأكيد مع وجود المزيد من الأشخاص تحت الوضع. هذا هو الجزء ذي الصلة من الملخص:

... من النادر إجراء تحليل واضح للتوزيع الفعلي للذكاء العام على أساس عينات كبيرة وممثلة للسكان بشكل مناسب. باستخدام مسحين على مستوى السكان للذكاء العام لدى الأطفال في سن 11 عامًا في اسكتلندا ، أظهرنا أن هناك انحرافات كبيرة عن الوضع الطبيعي في التوزيع ، مع تباين أقل في النطاق الأعلى منه في النطاق الأدنى. على الرغم من متوسط ​​درجات مقياس الذكاء البالغ 100 ، كانت الدرجات النموذجية حوالي 105 ... وهذا يتوافق مع نموذج التوزيع السكاني للذكاء العام كمزيج من توزيعين عاديين بشكل أساسي ، يعكس أحدهما التباين الطبيعي في الذكاء العام والآخر يعكس التباين الطبيعي في آثار الظروف الوراثية والبيئية التي تنطوي على التخلف العقلي.

انظر الدراسة لمزيد من المناقشة حول التفرطح والانحراف. كما أنها تشير إلى دراسات أخرى قد تجدها ذات قيمة.


إجابة واحدة هي أنه منذ ذلك الحين ز $ لا يوجد حقًا ككيان بيولوجي أحادي البعد (بدلاً من ذلك ، فهو عبارة عن حساء شبه لانهائي الأبعاد من الحمض النووي الموروث وتجارب الحياة المتراكمة) ، ومسألة التوزيع أحادي المتغير هي محل نقاش.


& # 8216s & # 8217 حيازة و & # 8216 من & # 8217 حيازة

تُستخدم أسماء الملكية بطرق مختلفة للتعبير عن معاني مختلفة. الاستخدامات الأكثر شيوعًا هي التعبير

  1. الحيازة أو الملكية: كلب العائلة.
  2. الرابطة: مكتب آرتشر ،
  3. الإجراء: تصميم لانا على إطلاق النار على آرتشر.
  4. القياس: تأخر القطار ،
  5. خصائص شيء ما: شعر لانا الأسود.

غالبًا ما يكون حرف الجر "من" بمثابة بديل لمقتنيات "s". كما قلت في مقالاتي السابقة ، فإن صيغة الجملة المتكررة تجعل كتابتك مملة. لذا من الجيد التبديل بين "الملكية" و "من' ملكية. للقيام بذلك ، نحتاج في البداية إلى معرفة متى يمكننا استخدام "من" الملكيات بالطريقة الصحيحة.

  1. ملكية: للتعبير عن الملكية ، من الأفضل دائمًا استخدام الملكية. على سبيل المثال ، يُفضل استخدام "بندقية رامي" على "مسدس رامي السهام ،
  2. ذات الصلة: عندما يكون اسم الملكية متحركًا دائمًا. على سبيل المثال والدة آرتشر ، Lana’s Baby ، صديقة Kriger ثلاثية الأبعاد. ولكن عندما يكون اسم الملكية غير مألوف ، يمكن استخدام كل من أصحاب الملكية والملكية. على سبيل المثال منطقة الجامعة منطقة الجامعة.
  3. الإسناد: كما هو الحال في حالة الارتباط ، استخدم هنا أيضًا أسماء الملكية فقط لأسماء الكائنات الحية. بالنسبة للأسماء غير الحية ، يمكن استخدام كل من "المقتدين" و "من" الملكيين.

على سبيل المثال: Danny’s White Hair. (تحريك اسم ملكية) مرآب الجامعة. (جماد اسم ملكية) مرآب الجامعة. (اسم ملكية جماد)

  • 4. العمل والقياس: يمكنك استخدام كل من "ممتلكات" و "ممتلكات" لتوضيح تصرف شخص ما.

"انتقام آرتشر من أجل خادمه الشخصي" أو "الانتقام الثأري لآرتشر لخادمه الشخصي"
وبالمثل للتعبير عن القياس يمكن استخدام كلا النوعين من الممتلكات.
& # 8220 أدى معدل البصل المتزايد إلى استياء الناس بشدة. & # 8221 (ممتلكات ")

& # 8221 أدى معدل البصل المتزايد إلى استياء الناس بشدة. & # 8221 ("من" الممتلكات.)

المرجع: Lester، M. (2011). قواعد اللغة الإنجليزية المتقدمة لمتعلمي اللغة الإنجليزية كلغة ثانية. نيويورك: ماكجرو هيل.


التناظر والانحراف والتفرطح

نحن نعتبر متغير عشوائي x ومجموعة البيانات S = <x1، س2، ... ، xن> الحجم ن الذي يحتوي على القيم المحتملة لـ x. يمكن أن تمثل مجموعة البيانات إما المجتمع محل الدراسة أو عينة مأخوذة من السكان.

انظر الى س كممثل للتوزيع ، فإن انحراف من س هو مقياس للتماثل في حين التفرطح هو مقياس ذروة البيانات في س.

التماثل والانحراف

التعريف 1: نحن نستخدم انحراف كمقياس للتماثل. إذا كان انحراف س يساوي صفرًا ، ثم يمثل التوزيع س متماثل تمامًا. إذا كان الانحراف سالبًا ، يكون التوزيع منحرفًا إلى اليسار ، بينما إذا كان الانحراف موجبًا ، يكون التوزيع منحرفًا إلى اليمين (انظر الشكل 1 أدناه للحصول على مثال).

يقوم Excel بحساب الانحراف في العينة س على النحو التالي:

أين هو يعني و س هو الانحراف المعياري لـ س. لتجنب القسمة على الصفر ، تتطلب هذه الصيغة ذلك ن & GT 2.

الملاحظة: عندما يكون التوزيع متماثلًا ، يكون المتوسط ​​= الوسيط ، وعندما يكون التوزيع منحرفًا بشكل إيجابي ، المتوسط ​​& gt وعندما يكون التوزيع منحرفًا سلبًا ، يكون المتوسط ​​& lt الوسيط.

وظيفة Excel: يوفر Excel ملف SKEW تعمل كطريقة لحساب الانحراف س، على سبيل المثال ، إذا كان R نطاقًا في Excel يحتوي على عناصر البيانات بتنسيق س ثم SKEW (R) = انحراف س.

وظيفة Excel 2013: هناك أيضًا نسخة سكانية من الانحراف المعطى بواسطة الصيغة

تم تنفيذ هذا الإصدار في Excel 2013 باستخدام الوظيفة ، SKEW.P.

اتضح أن النطاق R يتكون من البيانات بتنسيق س = <x1, …, xن>، SKEW.P (R) = SKEW (R) * (ن-2) / SQRT (ن(ن-1)) أين ن = COUNT (R).

وظيفة الإحصاء الحقيقي: بدلاً من ذلك ، يمكنك حساب الانحراف السكاني باستخدام SKEWP(R) ، الموجودة في حزمة موارد الإحصائيات الحقيقية.

مثال 1: افترض س = <2، 5، -1، 3، 4، 5، 0، 2>. انحراف س = -0.43 ، أي SKEW (R) = -0.43 حيث R هو نطاق في ورقة عمل Excel تحتوي على البيانات في س. نظرًا لأن هذه القيمة سالبة ، فإن المنحنى الذي يمثل التوزيع ينحرف إلى اليسار (أي الجزء الأكثر بدانة من المنحنى على اليمين). أيضًا SKEW.P (R) = -0.34. انظر الشكل 1.

الشكل 1 - أمثلة على الانحراف والتفرطح

الملاحظة: يتجاهل SKEW (R) و SKEW.P (R) أي خلايا فارغة أو خلايا ذات قيم غير رقمية.

التعريف 2: التفرطح يوفر قياسًا حول الأطراف (أي ذيول) لتوزيع البيانات ، وبالتالي يوفر مؤشراً على وجود القيم المتطرفة.

يحسب Excel تفرطح عينة س على النحو التالي:

أين هو يعني و س هو الانحراف المعياري لـ س. لتجنب القسمة على الصفر ، تتطلب هذه الصيغة ذلك ن & GT 3.

الملاحظة: من الشائع أن التفرطح يوفر مقياسًا للذروة (أو التسطيح) ، لكن هذا ليس صحيحًا. يتعلق التفرطح بالأطراف وليس بمركز التوزيع.

وظيفة Excel: يوفر Excel ملف كورت تعمل كطريقة لحساب تفرطح س، على سبيل المثال ، إذا كان R نطاقًا في Excel يحتوي على عناصر البيانات بتنسيق س ثم KURT (R) = تفرطح س.

الملاحظة: يتم حساب التفرطح السكاني من خلال الصيغة

والتي يمكن حسابها في Excel عبر الصيغة

وظيفة الإحصاء الحقيقي: لا يوفر Excel وظيفة التفرطح السكاني ، ولكن يمكنك استخدام وظيفة "الإحصاء الحقيقي" التالية لهذا الغرض:

KURTP(ص ، إفراط) = تفرطح التوزيع للسكان في النطاق R1. لو إفراط = TRUE (افتراضيًا) ثم يتم طرح 3 من النتيجة (الطريقة المعتادة بحيث يكون للتوزيع الطبيعي تفرطح صفري).

مثال 2: افترض س = <2، 5، -1، 3، 4، 5، 0، 2>. تفرطح س = -0.94 ، أي KURT (R) = -0.94 حيث R عبارة عن نطاق في ورقة عمل Excel تحتوي على البيانات الموجودة في س. يبلغ التفرطح السكاني -1.114. انظر الشكل 1.

الملاحظة: يتجاهل KURT (R) أي خلايا فارغة أو خلايا ذات قيم غير رقمية.

توضيح رسومي

ننظر الآن إلى مثال على هذه المفاهيم باستخدام توزيع مربع كاي.

الشكل 2 - مثال على الانحراف والتفرطح

يحتوي الشكل 2 على الرسوم البيانية لاثنين من توزيعات مربع كاي (بدرجات مختلفة من الحرية مدافع). ندرس توزيع مربع كاي في مكان آخر ، لكننا نلاحظ في الوقت الحالي القيم التالية للتفرطح والانحراف:


3 إجابات 3

سمع [. ] أن التفرطح الإيجابي العالي للبقايا يمكن أن يكون مشكلة بالنسبة لاختبارات الفرضيات الدقيقة وفترات الثقة (وبالتالي مشاكل الاستدلال الإحصائي). هل هذا صحيح، وإذا كان الأمر كذلك، لماذا؟

بالنسبة لبعض أنواع اختبار الفرضيات ، هذا صحيح.

ألا يشير التفرطح الإيجابي العالي للبقايا إلى أن غالبية البقايا قريبة من المتوسط ​​المتبقي للصفر وبالتالي توجد بقايا كبيرة أقل؟

يبدو أنك تخلط بين مفهوم التباين ومفهوم التفرطح. إذا كان التباين أصغر ، فإن الميل إلى المزيد من المخلفات الصغيرة وعدد أقل من المخلفات الكبيرة ستجتمع معًا. تخيل أننا نحتفظ بثابت الانحراف المعياري أثناء تغيير التفرطح (لذلك نتحدث بالتأكيد عن التغييرات في التفرطح بدلاً من التباين).

قارن الفروق المختلفة (لكن نفس التفرطح):

مع تفرطح مختلف ولكن نفس التباين:

يرتبط التفرطح المرتفع في كثير من الحالات بمزيد من الانحرافات الصغيرة عن المتوسط ​​$ ^ ddagger $ - مخلفات صغيرة أكثر مما تجده مع التوزيع الطبيعي .. ولكن للحفاظ على الانحراف المعياري عند نفس القيمة ، يجب علينا أيضًا عندك مزيد كبير المخلفات (لأن وجود المزيد من المخلفات الصغيرة سيجعل المسافة النموذجية من المتوسط ​​أصغر). للحصول على المزيد من المخلفات الكبيرة والمخلفات الصغيرة ، سيكون لديك عدد أقل من المخلفات "ذات الحجم النموذجي" - تلك الموجودة حول انحراف معياري واحد بعيدًا عن المتوسط.

$ ddagger $ يعتمد ذلك على كيفية تعريفك لـ "الصغر" لا يمكنك ببساطة إضافة الكثير من المخلفات الكبيرة والحفاظ على التباين ثابتًا ، فأنت بحاجة إلى شيء للتعويض عنه - ولكن بالنسبة للبعض منح قياس "صغير" يمكنك إيجاد طرق لزيادة التفرطح دون زيادة هذا القياس المعين. (على سبيل المثال ، لا يشير التفرطح الأعلى تلقائيًا إلى قمة أعلى على هذا النحو)

يميل التفرطح الأعلى إلى الانتقال مع المزيد من المخلفات الكبيرة ، حتى عندما تحافظ على التباين ثابتًا.

[علاوة على ذلك ، في بعض الحالات ، قد يؤدي تركيز المخلفات الصغيرة في الواقع إلى مشكلة أكثر من الجزء الإضافي من أكبر المخلفات - اعتمادًا على الأشياء التي تبحث عنها.]

على أي حال ، دعونا نلقي نظرة على مثال. ضع في اعتبارك اختبار T لعينة واحدة وحجم عينة من 10.

إذا رفضنا الفرضية الصفرية عندما تكون القيمة المطلقة لإحصاء t أكبر من 2.262 ، فعندما تكون الملاحظات مستقلة وموزعة بشكل مماثل من التوزيع الطبيعي ، والوسيط المفترض هو متوسط ​​المحتوى الحقيقي ، سنرفض القيمة الصفرية الفرضية 5٪ من الوقت.

ضع في اعتبارك توزيعًا معينًا به تفرطح أعلى بكثير من المعتاد: 75٪ من السكان لدينا قيمهم مستمدة من التوزيع الطبيعي والـ 25٪ الباقية تستمد قيمها من التوزيع الطبيعي مع الانحراف المعياري أكبر بـ 50 مرة.

إذا حسبت بشكل صحيح ، فهذا يتوافق مع تفرطح 12 (تفرطح زائد 9). يكون التوزيع الناتج أعلى بكثير من التوزيع الطبيعي وله ذيول ثقيلة. تتم مقارنة الكثافة بالكثافة الطبيعية أدناه - يمكنك رؤية القمة الأعلى ، لكن لا يمكنك حقًا رؤية الذيل الأثقل في الصورة اليسرى ، لذلك قمت أيضًا برسم لوغاريتم الكثافات ، والذي يمتد إلى الجزء السفلي من الصورة وضغط الجزء العلوي ، مما يسهل رؤية كل من الذروة والذيل.

ال فعلي مستوى الأهمية لهذا التوزيع إذا أجريت اختبار t لعينة واحدة "5٪" مع $ n = 10 $ يكون أقل من 0.9٪. هذا مثير للغاية ، ويسحب منحنى القوة إلى أسفل بشكل كبير.

(ستلاحظ أيضًا تأثيرًا جوهريًا على تغطية فترات الثقة.)

لاحظ أن التوزيع المختلف بنفس التفرطح سيكون له تأثير مختلف على مستوى الأهمية.

فلماذا ينخفض ​​معدل الرفض؟ ذلك لأن الذيل الأثقل يؤدي إلى عدد قليل من القيم المتطرفة الكبيرة ، والتي يكون لها تأثير أكبر قليلاً على الانحراف المعياري مما يؤثر على المتوسط ​​، وهذا يؤثر على إحصاء t لأنه يؤدي إلى المزيد من قيم t بين -1 و 1 ، في هذه العملية تقليل نسبة القيم في المنطقة الحرجة.

إذا أخذت عينة تبدو متسقة إلى حد كبير مع أنها تأتي من توزيع طبيعي متوسطه أعلى بكثير من الافتراض يعني أنها مهمة ، ثم تأخذ الملاحظة إلى أبعد من المتوسط ​​وتجذبها بعيدًا (أي ، تجعل المتوسط ​​أكبر حتى من أقل من $ H_0 $) ، فأنت تقوم بالفعل بعمل إحصاء t الأصغر.

دعني اريك. إليك عينة بحجم 10:

تخيل أننا نريد اختباره مقابل $ H_0: mu = 2 $ (اختبار t لعينة واحدة). اتضح أن متوسط ​​العينة هنا هو 2.68 وأن الانحراف المعياري للعينة هو 0.9424. تحصل على إحصاء t يبلغ 2.282 - فقط في منطقة الرفض لاختبار 5٪ (القيمة الاحتمالية 0.0484).

اجعل هذه القيمة الأكبر الآن 50:

من الواضح أننا نرفع المتوسط ​​، لذا يجب أن يشير إلى اختلاف أكبر مما كان عليه من قبل ، أليس كذلك؟ حسنًا ، لا ، ليس كذلك. يذهب الإحصاء t تحت. هو الآن 1.106 ، والقيمة الاحتمالية كبيرة جدًا (قريبة من 30٪). ماذا حدث؟ حسنًا ، لقد سحبنا المتوسط ​​لأعلى (إلى 7.257) ، لكن الانحراف المعياري ارتفع إلى أكثر من 15.

الانحرافات المعيارية أكثر حساسية للقيم المتطرفة من الوسائل - عندما تضع في قيمة شاذة ، فإنك تميل إلى دفع إحصاء t لعينة واحدة نحو 1 أو -1.

إذا كانت هناك فرصة لوجود العديد من القيم المتطرفة ، يحدث الشيء نفسه إلى حد كبير فقط في بعض الأحيان يمكن أن يكونوا على جوانب متقابلة (في هذه الحالة يكون الانحراف المعياري أكثر تضخمًا بينما يتم تقليل التأثير على المتوسط ​​مقارنةً بأحد القيم المتطرفة) ، لذا فإن إحصاء t يميل إلى الاقتراب من الصفر.

تستمر الأشياء المماثلة مع عدد من الاختبارات الشائعة الأخرى التي تفترض الحالة الطبيعية - يميل التفرطح العالي إلى الارتباط بذيول أثقل ، مما يعني المزيد من القيم المتطرفة ، مما يعني أن الانحرافات المعيارية تتضخم بالنسبة للوسائل وبالتالي تميل الاختلافات التي تريد التقاطها "لتغرق" بتأثير القيم المتطرفة في الاختبار. هذا هو ، طاقة منخفضة.


مناقشة

الأخطاء المعيارية التقليدية للالتواء والتفرطح المطبوع بواسطة العديد من حزم الإحصائيات سيئة للغاية. في حين أنها مناسبة للتوزيعات العادية ، فإن الانحرافات عن الحالة الطبيعية ، مثل a ر التوزيع مع مدافع = 5 أو مزيج من منحنيين عاديين مع انحرافات معيارية مختلفة ، ينتج عنه أخطاء قياسية يمكن أن تكون 5 مرات صغيرة جدًا. نظرًا لندرة التوزيعات العادية في علم النفس (Micceri ، 1989) ، يجب إيقاف ممارسة التشجيع على استخدام الأخطاء المعيارية التي تقع في خطأ فادح مع الانحرافات عن الوضع الطبيعي من خلال طباعتها في حزم إحصائية. تنتج الوظيفة ، المكتوبة لهذه المقالة ، الأخطاء المعيارية للتمهيد ، وفترات الثقة في BCa ، والأخطاء المعيارية ، التي تأخذ في الاعتبار خصائص التوزيعات.

أحد الأسئلة هو ما إذا كان يمكن استخدام الأخطاء المعيارية التقليدية إذا كنت تستخدم هذا فقط لاختبار ما إذا كان التوزيع طبيعيًا. لا ينصح بهذا النهج لسببين على الأقل. أولاً ، هناك العديد من الاختبارات الأفضل التي تم تصميمها لاختبار الحالة الطبيعية ، مثل اختبار شابيرو وويلك (1965) ، وهي متوفرة في العديد من حزم الإحصائيات. يعد اختبار الانحراف والتفرطح ، بشكل فردي ، مشكلة لأنهما يعتمدان على بعضهما البعض ، لذلك بدلاً من مجرد اتباع نهج الكتاب المدرسي ، يمكن استخدام اختبارات مثل اختبار D'Agostino (D'Agostino ، Belanger ، & amp D'Agostino ، 1990). ثانيًا ، نظرًا لأن الأخطاء المعيارية التقليدية تبالغ في تقدير الأخطاء المعيارية الحقيقية وتقلل من شأنها ، فلن تعرف ما إذا كان الاختبار الإحصائي ليبراليًا أم متحفظًا دون التخمين بشأن التوزيع. تتمثل إحدى طرق التخمين حول التوزيع في أخذ آلاف العينات من التوزيع المرصود ، وهو ما يفعله bootstrapping.

ترجع مشاكل الأخطاء القياسية الموضحة في هذه المقالة إلى استخدام اللحظتين الثالثة والرابعة لحساب الانحراف والتفرطح. هذه حساسة للغاية للانحرافات في ذيول التوزيعات وليست حساسة للانحرافات في قمم التوزيعات (Lindsay & amp Basak، 2000). ناقش Seier and Bonett (2003) الصيغ التي تسمح للمستخدم بتغيير التأثير النسبي للانحرافات في الذيل وذروة التوزيع ، ولكن هذه ليست شائعة الاستخدام. يمكن أيضًا استخدام التحويل الذي وصفه Anscombe and Glynn (1983). تم وصف الوظيفة في الملحق الذي يستخدمها ، ولكنها أيضًا غير مستخدمة على نطاق واسع. إذا تم تفعيل الانحراف والتفرطح بطرق أخرى ، يمكن تقليل تأثير النقاط المتطرفة. ناقش Balanda و MacGillivray (1988) عدة طرق يمكن من خلالها استخدام الرباعيات لتفعيل هذه الإحصائيات التي ستكون أقل تأثراً بالنقاط المتطرفة. واحد من أكثر الواعدة إل- لحظات (هوسكينج ، 1992). يوضح Hosking كيف أن مقاييس الانحراف والتفرطح المستندة إلى هذه أكثر اتساقًا مع اختبار شابيرو-ويلك للحالة الطبيعية. يمكن تعديلها ، على سبيل المثال ، عن طريق التشذيب ، مما يزيد من متانتها (Elamir & amp Seheult ، 2003). بمرور الوقت ، قد تصبح هذه الطرق البديلة أكثر شيوعًا ، ولكن تغيير الإحصائيات بشكل كبير لقياسها سيغير أيضًا معنى الانحراف والتفرطح. لذلك ، من غير المحتمل أن تنتشر هذه البدائل في المستقبل القريب.

التوصيات الرئيسية من هذه المقالة هي أنه يجب على الباحثين توخي الحذر عند استخدام المقاييس التقليدية للخطأ القياسي للالتواء والتفرطح. يمكن استخدام فترات الثقة في Bootstrap ، ولكن يجب أن يدرك الباحثون أن هذه قد لا تزال على خطأ. لاختبار ما إذا كان التوزيع له شكل معين ، يجب استخدام الاختبارات المصممة خصيصًا لهذا الغرض. طرق تقوم على تحولات اللحظات و إل- يجب مراعاة اللحظات.


حدود الانحراف والتفرطح في معدل الذكاء - علم النفس

الانحراف هو مقياس للتماثل ، أو بشكل أدق ، عدم وجود تناظر. يكون التوزيع ، أو مجموعة البيانات ، متماثلًا إذا كان يبدو متماثلًا على يسار ويمين النقطة المركزية.

التفرطح هو قياس ما إذا كانت البيانات ثقيلة الذيل أو خفيفة الذيل بالنسبة للتوزيع الطبيعي. وهذا يعني أن مجموعات البيانات ذات التفرطح العالي تميل إلى أن يكون لها ذيول ثقيلة أو قيم متطرفة. تميل مجموعات البيانات ذات التفرطح المنخفض إلى أن يكون لها ذيول خفيفة ، أو تفتقر إلى القيم المتطرفة. سيكون التوزيع المنتظم هو الحالة القصوى.

الانحراف للتوزيع الطبيعي هو صفر ، وأي بيانات متماثلة يجب أن يكون لها انحراف بالقرب من الصفر. تشير القيم السالبة للالتواء إلى البيانات التي تميل إلى اليسار والقيم الإيجابية للالتواء تشير إلى البيانات المنحرفة جهة اليمين. نعني بالميل اليسار أن الذيل الأيسر طويل بالنسبة للذيل الأيمن. وبالمثل ، فإن الانحراف إلى اليمين يعني أن الذيل الأيمن طويل بالنسبة إلى الذيل الأيسر. إذا كانت البيانات متعددة الوسائط ، فقد يؤثر ذلك على علامة الانحراف.

بعض القياسات لها حد أدنى ومنحرف لليمين. على سبيل المثال ، في دراسات الموثوقية ، لا يمكن أن تكون أوقات الفشل سلبية.

يعد تعريف التفرطح المستخدم مسألة تقليدية (يستخدم هذا الكتيب التعريف الأصلي). عند استخدام برنامج لحساب عينة التفرطح ، يجب أن تكون على دراية بالاتفاقية التي يتم اتباعها. تستخدم العديد من المصادر مصطلح التفرطح عندما يقومون بالفعل بحساب "التفرطح الزائد" ، لذلك قد لا يكون واضحًا دائمًا. أمثلة يوضح المثال التالي الرسوم البيانية لـ 10000 رقم عشوائي تم إنشاؤها من توزيع عادي ، وأسي مزدوج ، وكوشي ، وتوزيع وايبول.

التوزيع الطبيعي الرسم البياني الأول هو عينة من التوزيع الطبيعي. التوزيع الطبيعي هو توزيع متماثل مع ذيول حسنة التصرف. يشار إلى ذلك من خلال الانحراف 0.03. يقترب تفرطح 2.96 من القيمة المتوقعة 3. يتحقق المدرج التكراري من التماثل. التوزيع الأسي المزدوج المدرج التكراري الثاني هو عينة من التوزيع الأسي المزدوج. الأسي المزدوج هو توزيع متماثل. بالمقارنة مع الطبيعي ، لديها ذروة أقوى ، واضمحلال أسرع ، وذيول أثقل. أي أننا نتوقع حدوث انحراف بالقرب من الصفر وتفرطح أعلى من 3. الانحراف 0.06 والتفرطح هو 5.9. توزيع كوشي الرسم البياني الثالث هو عينة من توزيع كوشي.

للحصول على مقارنة بصرية أفضل مع مجموعات البيانات الأخرى ، قمنا بتقييد الرسم البياني لتوزيع Cauchy إلى القيم بين -10 و 10. مجموعة البيانات الكاملة لبيانات Cauchy في الواقع لها حد أدنى يبلغ 29000 تقريبًا وحد أقصى 89000 تقريبًا.

توزيع كوشي هو توزيع متماثل مع ذيول ثقيلة وقمة واحدة في مركز التوزيع. نظرًا لأنه متماثل ، نتوقع حدوث انحراف بالقرب من الصفر. نظرًا للذيول الأثقل ، قد نتوقع أن يكون التفرطح أكبر من التفرطح الطبيعي. في الواقع ، يكون الانحراف 69.99 والتفرطح 6693. يمكن تفسير هذه القيم العالية للغاية من خلال ذيول ثقيلة. مثلما يمكن أن يتشوه الانحراف المتوسط ​​والانحراف المعياري بالقيم المتطرفة في الذيول ، كذلك يمكن قياس الانحراف والتفرطح. توزيع ويبل الرسم البياني الرابع هو عينة من توزيع Weibull بمعامل الشكل 1.5. توزيع Weibull هو توزيع منحرف مع مقدار الانحراف اعتمادًا على قيمة معلمة الشكل. درجة الانحلال عندما نبتعد عن المركز تعتمد أيضًا على قيمة معلمة الشكل. بالنسبة لمجموعة البيانات هذه ، يكون الانحراف 1.08 والتفرطح 4.46 ، مما يشير إلى انحراف معتدل وتفرطح. التعامل مع الانحراف والتفرطح تعتمد العديد من الاختبارات والفترات الإحصائية الكلاسيكية على افتراضات الحالة الطبيعية. يشير الانحراف والتفرطح الكبيران بوضوح إلى أن البيانات ليست طبيعية. إذا أظهرت مجموعة البيانات انحرافًا أو تفرطحًا كبيرًا (كما يتضح من الرسم البياني أو المقاييس العددية) ، فماذا يمكننا أن نفعل حيال ذلك؟

يتمثل أحد الأساليب في تطبيق نوع من التحويل لمحاولة جعل البيانات طبيعية أو شبه طبيعية. يعد تحويل Box-Cox أسلوبًا مفيدًا لمحاولة تطبيع مجموعة البيانات. على وجه الخصوص ، غالبًا ما يكون أخذ السجل أو الجذر التربيعي لمجموعة البيانات مفيدًا للبيانات التي تظهر الانحراف الصحيح المعتدل.


لماذا يعتبر المنحنى الطبيعي مهمًا جدًا في الاختبار النفسي

في الاختبار ، يتم استخدام نموذج المنحنى العادي بطرق موازية للتمييز بين الإحصاء الوصفي والاستنتاجي:

1. يستخدم نموذج المنحنى العادي بشكل وصفي لتحديد موضع الدرجات التي تأتي من التوزيعات الطبيعية. في عملية تُعرف بالتطبيع ، موصوفة في الفصل 3 ، يتم استخدام المنحنى الطبيعي أيضًا لعمل توزيعات غير طبيعية - لكنها تقترب من الطبيعي - تتوافق مع النموذج ، من حيث المواضع النسبية للدرجات.

2. يتم تطبيق نموذج المنحنى العادي بشكل استنتاجي في مجالات (أ) الموثوقية ، لاشتقاق فترات الثقة لتقييم الدرجات التي تم الحصول عليها والاختلافات بين الدرجات التي تم الحصول عليها (انظر الفصل 4) ، و (ب) الصلاحية ، لاشتقاق فترات الثقة للتنبؤات أو تقديرات تستند إلى درجات الاختبار (انظر الفصل 5).

نموذج. إن الطريقة والمدى الذي تنحرف به عنه له آثار فيما يتعلق بكمية المعلومات التي تنقلها التوزيعات. يمكن توضيح الحالة القصوى من خلال التوزيع الذي سينتج إذا حدثت جميع القيم في مجموعة من البيانات بنفس التردد. مثل هذا التوزيع ، الذي سيكون مستطيل الشكل ، لا يعني ضمنيًا أي اختلاف في احتمال حدوث أي قيمة معينة ، وبالتالي لن يكون مفيدًا في اتخاذ القرارات على أساس أي شيء يتم قياسه.

يحدث نوع مختلف وأكثر منطقية من الانحراف عن نموذج المنحنى العادي عندما يكون للتوزيعات وضعان أو أكثر. إذا كان التوزيع ثنائي النسق أو متعدد الوسائط ، يحتاج المرء إلى النظر في إمكانية حدوث مشكلات في أخذ العينات أو السمات الخاصة للعينة. على سبيل المثال ، قد يعني توزيع درجات الفصل حيث تحدث ذروة الترددات في الدرجات A و D ، مع عدد قليل جدًا من الدرجات B أو C ، أن الطلاب في الفصل غير نمطيون بطريقة ما أو أنهم ينتمون إلى مجموعات تختلف اختلافًا كبيرًا في الإعداد أو التحفيز أو مستوى القدرة. بطبيعة الحال ، فإن المعلومات من هذا النوع سيكون لها دائمًا آثار مهمة في حالة هذا المثال ، فقد تقود المدرس إلى تقسيم الفصل إلى أقسام واستخدام مناهج تربوية مختلفة مع كل منها.

هناك طريقتان أخريان قد تنحرف فيهما التوزيعات عن نموذج المنحنى العادي يحملان آثارًا كبيرة ذات صلة ببيانات الاختبار. تتعلق هذه الانحرافات بخصائص التفرطح والتواء توزيعات التردد.

التفرطح

هذا المصطلح الغريب نوعًا ما ، والذي ينبع من الكلمة اليونانية للتحدب ، يشير ببساطة إلى تسطيح أو ذروة التوزيع. يرتبط التفرطح ارتباطًا مباشرًا بكمية التشتت في التوزيع. توزيعات Platykurtic لها أكبر قدر من التشتت ، يتجلى في ذيول أكثر اتساعًا ، ويكون توزيعات lep-tokurtic أقل. التوزيع الطبيعي هو mesokurtic ، مما يعني أن لديه درجة متوسطة من التشتت.


قد يعجبك ايضا

لا يقيس التفرطح أي شيء عن & quotpeak & quot كما تم الإبلاغ عنه تاريخيًا. بل هو مقياس لمعرفة ما إذا كانت هناك قيم متطرفة (أي قيم متطرفة نادرة) في البيانات. تظهر هذه في الرسوم البيانية كنقطة واحدة أو بضع نقاط بعيدة جدًا عن الجسم الرئيسي للبيانات. anon342994 26 يوليو 2013

هل يمكن لأي شخص مساعدتي في فهم التوزيع المنحرف لعرضي التقديمي. لا أستطيع فهم الرسوم البيانية.

في صفي الإحصائي اليوم ، ذكر المعلم أن المنحنيات يمكن أن تحتوي على مستويات مختلفة من الانحراف والتفرطح. لم تدخل في أي تفاصيل حقيقية تشرح ماهية هذا ، خاصة التفرطح.

هل يمكن أن يعطيني أحدهم شرحًا موجزًا ​​للمساعدة في توجيهي في الاتجاه الصحيح فيما يتعلق بما يعنيه التفرطح؟ جبابرة 14 يوليو 2011

@ Cardsfan27 - أمثلة رائعة. لست متأكدًا من سبب عدم تمكني من التفكير في هؤلاء. عندما كنت أفكر في شيء مثل السكان سيكون له توزيع منحرف صحيح. عدد الشباب أكبر بكثير من كبار السن. أعتقد أن شيئًا آخر يمكن أن يكون بحجم الأشجار في الغابة. هناك المئات من الشتلات والشتلات لكل شجرة نمت بشكل كامل.

لقد أجريت المزيد من الأبحاث حول المنحنيات بنقطتين مرتفعتين. يطلق عليهم توزيعات ثنائية النسق. كل الأمثلة التي وجدتها كانت مشابهة لأمثلة لك وتتضمن الطول أو الوزن. سأكون مهتمًا بسماع المزيد منهم ، على الرغم من ذلك. cardfan27 13 يوليو 2011

@ titans62 - أواجه مشكلة معاكسة! كل ما يمكنني التفكير فيه هو الأشياء التي لها توزيع طبيعي ، ولكنها ليست منحرفة. بعض الأشياء التي أفكر في أنها ستكون شكل الجرس الطبيعي هي طول ووزن السكان. درجات الاختبار هي أيضًا مثال منحنى الجرس النمطي.

كان سؤالك الثاني في حيرة من أمري لبضع دقائق ، لكني أعتقد أن لدي مثالاً. قد يكون هذا بعيد المنال بعض الشيء ، ولكن ربما يكون لدى شخص آخر أفضل. إذا أخذت 25 رجلاً و 25 امرأة ثم أخذت أوزانهم. يمكنك أن تفترض أن الرجال سوف يزنون في المتوسط ​​أكثر من النساء ، لذلك إذا قمت برسم الأوزان بالرسم البياني ، فقد تجد أن النساء يصنعن ذروة أقل على الميزان ، والرجال يصنعون ذروة أعلى. آمل أن يكون ذلك منطقيًا. جبابرة 13 يوليو 2011

هل يمكن لأي شخص مساعدتي - أنا أفهم كيف يبدو منحنى الجرس ، لكن لأي سبب من الأسباب ، لا يمكنني التفكير في أي شيء من شأنه أن يكون بهذا الشكل. كل ما أفكر فيه سيكون له توزيع منحرف حيث يكون أحد الذيل أطول من الآخر.

سؤال آخر ذو صلة - هل من الممكن أن يحتوي المنحنى على نقطتين مرتفعتين مقارنة بالمنحنى صعودًا وهبوطًا في منحنى جرس عادي؟ Emilski 12 يوليو 2011

يبدو من غير البديهي أن التوزيع المنحرف بشكل إيجابي سيكون له ذيل يذهب إلى اليمين. كنت أعتقد أن الموجب والسالب يتحددان من خلال أعلى نقطة في المنحنى.


حدود الانحراف والتفرطح في معدل الذكاء - علم النفس

يتم توفير جميع المقالات المنشورة بواسطة MDPI على الفور في جميع أنحاء العالم بموجب ترخيص وصول مفتوح. لا يلزم الحصول على إذن خاص لإعادة استخدام كل أو جزء من المقالة المنشورة بواسطة MDPI ، بما في ذلك الأشكال والجداول. بالنسبة للمقالات المنشورة بموجب ترخيص Creative Common CC BY ذي الوصول المفتوح ، يجوز إعادة استخدام أي جزء من المقالة دون إذن بشرط الاستشهاد بالمقال الأصلي بوضوح.

تمثل الأوراق الرئيسية أكثر الأبحاث تقدمًا مع إمكانات كبيرة للتأثير الكبير في هذا المجال. يتم تقديم الأوراق الرئيسية بناءً على دعوة فردية أو توصية من قبل المحررين العلميين وتخضع لمراجعة الأقران قبل النشر.

يمكن أن تكون ورقة الميزات إما مقالة بحثية أصلية ، أو دراسة بحثية جديدة جوهرية غالبًا ما تتضمن العديد من التقنيات أو المناهج ، أو ورقة مراجعة شاملة مع تحديثات موجزة ودقيقة عن آخر التقدم في المجال الذي يراجع بشكل منهجي التطورات الأكثر إثارة في العلم. المؤلفات. يوفر هذا النوع من الأوراق نظرة عامة على الاتجاهات المستقبلية للبحث أو التطبيقات الممكنة.

تستند مقالات اختيار المحرر على توصيات المحررين العلميين لمجلات MDPI من جميع أنحاء العالم. يختار المحررون عددًا صغيرًا من المقالات المنشورة مؤخرًا في المجلة والتي يعتقدون أنها ستكون مثيرة للاهتمام بشكل خاص للمؤلفين أو مهمة في هذا المجال. الهدف هو تقديم لمحة سريعة عن بعض الأعمال الأكثر إثارة المنشورة في مجالات البحث المختلفة بالمجلة.


استخدام مجموعات البيانات الثانوية لفهم الأشخاص ذوي الإعاقات النمائية وعائلاتهم

4.1 التفرطح والانحراف

تُستخدم مقاييس التفرطح والانحراف لتحديد ما إذا كانت المؤشرات تفي بافتراضات الحالة الطبيعية (Kline ، 2005). تساعد مقاييس التفرطح في تحديد ما إذا كان المنحنى طبيعيًا أو غير طبيعي الشكل. إذا كان المنحنى الطبيعي هو leptokurtic ، فإن المنحنى يتقوس بدرجة عالية عند المتوسط ​​مع ذيول قصيرة. من ناحية أخرى ، فإن منحنيات Platykurtic تكون أكثر انبساطًا من المعتاد وذات قمة منخفضة وذيول أطول. يكون المنحنى المنحرف إما موجبًا أو سالبًا. تظهر المنحنيات المنحرفة بشكل إيجابي غالبية الدرجات تحت المتوسط ​​، والمنحنيات المنحرفة سلبيًا هي عكس ذلك تمامًا. ينتج عن كلا المنحنيين منحنى عادي غير متماثل. يمكن تحليل كل من الانحراف والتفرطح من خلال الإحصاء الوصفي. تقع قيم الانحراف المقبولة بين - 3 و + 3 ، ويكون التفرطح مناسبًا من نطاق - 10 إلى + 10 عند استخدام SEM (براون ، 2006). القيم التي تقع أعلى أو أقل من هذه النطاقات مشكوك فيها ، ولكن SEM هي طريقة تحليلية قوية إلى حد ما ، لذلك قد لا تمثل الانحرافات الصغيرة انتهاكات كبيرة للافتراضات. قد تحتوي الأنواع الأخرى من التحليلات على قيم انحراف أو تفرطح أقل مقبولة ، لذا يجب على الباحثين التحقيق في تحليلهم المخطط لتحديد إرشادات فحص البيانات.


التناظر والانحراف والتفرطح

نحن نعتبر متغير عشوائي x ومجموعة البيانات S = <x1، س2، ... ، xن> الحجم ن الذي يحتوي على القيم المحتملة لـ x. يمكن أن تمثل مجموعة البيانات إما المجتمع محل الدراسة أو عينة مأخوذة من السكان.

انظر الى س كممثل للتوزيع ، فإن انحراف من س هو مقياس للتماثل في حين التفرطح هو مقياس ذروة البيانات في س.

التماثل والانحراف

التعريف 1: نحن نستخدم انحراف كمقياس للتماثل. إذا كان انحراف س يساوي صفرًا ، ثم يمثل التوزيع س متماثل تمامًا. إذا كان الانحراف سالبًا ، يكون التوزيع منحرفًا إلى اليسار ، بينما إذا كان الانحراف موجبًا ، يكون التوزيع منحرفًا إلى اليمين (انظر الشكل 1 أدناه للحصول على مثال).

يقوم Excel بحساب الانحراف في العينة س على النحو التالي:

أين هو يعني و س هو الانحراف المعياري لـ س. لتجنب القسمة على الصفر ، تتطلب هذه الصيغة ذلك ن & GT 2.

الملاحظة: When a distribution is symmetric, the mean = median, when the distribution is positively skewed the mean > median and when the distribution is negatively skewed the mean < median.

Excel Function: Excel provides the SKEW function as a way to calculate the skewness of س, i.e. if R is a range in Excel containing the data elements in س then SKEW(R) = the skewness of س.

Excel 2013 Function: There is also a population version of the skewness given by the formula

This version has been implemented in Excel 2013 using the function, SKEW.P.

It turns out that for range R consisting of the data in س = <x1, …, xن>, SKEW.P(R) = SKEW(R)*(n–2)/SQRT(ن(n–1)) where ن = COUNT(R).

Real Statistics Function: Alternatively, you can calculate the population skewness using the SKEWP(R) function, which is contained in the Real Statistics Resource Pack.

مثال 1: Suppose س = <2, 5, -1, 3, 4, 5, 0, 2>. The skewness of س = -0.43, i.e. SKEW(R) = -0.43 where R is a range in an Excel worksheet containing the data in س. Since this value is negative, the curve representing the distribution is skewed to the left (i.e. the fatter part of the curve is on the right). Also SKEW.P(R) = -0.34. See Figure 1.

Figure 1 – Examples of skewness and kurtosis

الملاحظة: SKEW(R) and SKEW.P(R) ignore any empty cells or cells with non-numeric values.

Definition 2: Kurtosis provides a measurement about the extremities (i.e. tails) of the distribution of data, and therefore provides an indication of the presence of outliers.

Excel calculates the kurtosis of a sample س على النحو التالي:

أين is the mean and س is the standard deviation of س. To avoid division by zero, this formula requires that ن > 3.

الملاحظة: It is commonly thought that kurtosis provides a measure of peakedness (or flatness), but this is not true. Kurtosis pertains to the extremities and not to the center of a distribution.

Excel Function: Excel provides the KURT function as a way to calculate the kurtosis of س, i.e. if R is a range in Excel containing the data elements in س then KURT(R) = the kurtosis of س.

الملاحظة: The population kurtosis is calculated via the formula

which can be calculated in Excel via the formula

Real Statistics Function: Excel does not provide a population kurtosis function, but you can use the following Real Statistics function for this purpose:

KURTP(R, excess) = kurtosis of the distribution for the population in range R1. لو excess = TRUE (default) then 3 is subtracted from the result (the usual approach so that a normal distribution has kurtosis of zero).

مثال 2: Suppose س = <2, 5, -1, 3, 4, 5, 0, 2>. The kurtosis of س = -0.94, i.e. KURT(R) = -0.94 where R is a range in an Excel worksheet containing the data in س. The population kurtosis is -1.114. See Figure 1.

الملاحظة: KURT(R) ignores any empty cells or cells with non-numeric values.

Graphical Illustration

We now look at an example of these concepts using the chi-square distribution.

Figure 2 – Example of skewness and kurtosis

Figure 2 contains the graphs of two chi-square distributions (with different degrees of freedom مدافع). We study the chi-square distribution elsewhere, but for now note the following values for the kurtosis and skewness:


Why Is the Normal Curve So Important in Psychological Testing

In testing, the normal curve model is used in ways that parallel the distinction between descriptive and inferential statistics:

1. The normal curve model is used descriptively to locate the position of scores that come from distributions that are normal. In a process known as normalization, described in Chapter 3, the normal curve is also used to make distributions that are not normal—but approximate the normal—conform to the model, in terms of the relative positions of scores.

2. The normal curve model is applied inferentially in the areas of (a) reliability, to derive confidence intervals to evaluate obtained scores and differences between obtained scores (see Chapter 4), and (b) validity, to derive confidence intervals for predictions or estimates based on test scores (see Chapter 5).

نموذج. The manner and extent to which they deviate from it has implications with regard to the amount of information the distributions convey. An extreme case can be illustrated by the distribution that would result if all values in a set of data occurred with the same frequency. Such a distribution, which would be rectangular in shape, would imply no difference in the likelihood of occurrence of any given value and thus would not be useful in making decisions on the basis of whatever is being measured.

A different, and more plausible, type of deviation from the normal curve model happens when distributions have two or more modes. If a distribution is bimodal, or multimodal, one needs to consider the possibility of sampling problems or special features of the sample. For example, a distribution of class grades in which the peak frequencies occur in the grades of A and D, with very few B or C grades, could mean that the students in the class are atypical in some way or that they belong to groups that differ significantly in preparation, motivation, or ability level. Naturally, information of this nature would almost invariably have important implications in the case of this example, it might lead a teacher to divide the class into sections and use different pedagogical approaches with each.

Two other ways in which distributions may deviate from the normal curve model carry significant implications that are relevant to test data. These deviations pertain to the properties of the kurtosis and skewness of frequency distributions.

Kurtosis

This rather odd term, which stems from the Greek word for convexity, simply refers to the flatness or peakedness of a distribution. Kurtosis is directly related to the amount of dispersion in a distribution. Platykurtic distributions have the greatest amount of dispersion, manifested in tails that are more extended, and lep-tokurtic distributions have the least. The normal distribution is mesokurtic, meaning that it has an intermediate degree of dispersion.


Bounds on skew and kurtosis of IQ - Psychology

Skewness is a measure of symmetry, or more precisely, the lack of symmetry. A distribution, or data set, is symmetric if it looks the same to the left and right of the center point.

Kurtosis is a measure of whether the data are heavy-tailed or light-tailed relative to a normal distribution. That is, data sets with high kurtosis tend to have heavy tails, or outliers. Data sets with low kurtosis tend to have light tails, or lack of outliers. A uniform distribution would be the extreme case.

The skewness for a normal distribution is zero, and any symmetric data should have a skewness near zero. Negative values for the skewness indicate data that are skewed left and positive values for the skewness indicate data that are skewed right. By skewed left, we mean that the left tail is long relative to the right tail. Similarly, skewed right means that the right tail is long relative to the left tail. If the data are multi-modal, then this may affect the sign of the skewness.

Some measurements have a lower bound and are skewed right. For example, in reliability studies, failure times cannot be negative.

Which definition of kurtosis is used is a matter of convention (this handbook uses the original definition). When using software to compute the sample kurtosis, you need to be aware of which convention is being followed. Many sources use the term kurtosis when they are actually computing "excess kurtosis", so it may not always be clear. أمثلة The following example shows histograms for 10,000 random numbers generated from a normal, a double exponential, a Cauchy, and a Weibull distribution.

Normal Distribution The first histogram is a sample from a normal distribution. The normal distribution is a symmetric distribution with well-behaved tails. This is indicated by the skewness of 0.03. The kurtosis of 2.96 is near the expected value of 3. The histogram verifies the symmetry. Double Exponential Distribution The second histogram is a sample from a double exponential distribution. The double exponential is a symmetric distribution. Compared to the normal, it has a stronger peak, more rapid decay, and heavier tails. That is, we would expect a skewness near zero and a kurtosis higher than 3. The skewness is 0.06 and the kurtosis is 5.9. Cauchy Distribution The third histogram is a sample from a Cauchy distribution.

For better visual comparison with the other data sets, we restricted the histogram of the Cauchy distribution to values between -10 and 10. The full data set for the Cauchy data in fact has a minimum of approximately -29,000 and a maximum of approximately 89,000.

The Cauchy distribution is a symmetric distribution with heavy tails and a single peak at the center of the distribution. Since it is symmetric, we would expect a skewness near zero. Due to the heavier tails, we might expect the kurtosis to be larger than for a normal distribution. In fact the skewness is 69.99 and the kurtosis is 6,693. These extremely high values can be explained by the heavy tails. Just as the mean and standard deviation can be distorted by extreme values in the tails, so too can the skewness and kurtosis measures. Weibull Distribution The fourth histogram is a sample from a Weibull distribution with shape parameter 1.5. The Weibull distribution is a skewed distribution with the amount of skewness depending on the value of the shape parameter. The degree of decay as we move away from the center also depends on the value of the shape parameter. For this data set, the skewness is 1.08 and the kurtosis is 4.46, which indicates moderate skewness and kurtosis. Dealing with Skewness and Kurtosis Many classical statistical tests and intervals depend on normality assumptions. Significant skewness and kurtosis clearly indicate that data are not normal. If a data set exhibits significant skewness or kurtosis (as indicated by a histogram or the numerical measures), what can we do about it?

One approach is to apply some type of transformation to try to make the data normal, or more nearly normal. The Box-Cox transformation is a useful technique for trying to normalize a data set. In particular, taking the log or square root of a data set is often useful for data that exhibit moderate right skewness.


3 إجابات 3

heard [. ] that a high positive kurtosis of residuals can be problematic for accurate hypothesis tests and confidence intervals (and therefore problems with statistical inference). Is this true and, if so, why?

For some kinds of hypothesis test, it's true.

Would a high positive kurtosis of residuals not indicate that the majority of the residuals are near the residual mean of 0 and therefore less large residuals are present?

It looks like you're conflating the concept of variance with that of kurtosis. If the variance were smaller, then a tendency to more small residuals and fewer large residuals would come together. Imagine we hold the standard deviation constant while we change the kurtosis (so we're definitely talking about changes to kurtosis rather than to variance).

Compare different variances (but the same kurtosis):

with different kurtosis but the same variance:

A high kurtosis is in many cases associated with more small deviations from the mean $^ddagger$ -- more small residuals than you'd find with a normal distribution .. but to keep the standard deviation at the same value, we must also have more كبير residuals (because having more small residuals would make the typical distance from the mean smaller). To get more of both the big residuals and small residuals, you will have fewer "typical sized" residuals -- those about one standard deviation away from the mean.

$ddagger$ it depends on how you define "smallness" you can't simply add lots of large residuals and hold variance constant, you need something to compensate for it -- but for some منح measure of "small" you can find ways to increase the kurtosis without increasing that particular measure. (For example, higher kurtosis doesn't automatically imply a higher peak as such)

A higher kurtosis tends to go with more large residuals, even when you hold the variance constant.

[Further, in some cases, the concentration of small residuals may actually lead to more of a problem than the additional fraction of the largest residuals -- depending on what things you're looking at.]

Anyway, let's look at an example. Consider a one-sample t-test and a sample size of 10.

If we reject the null hypothesis when the absolute value of the t-statistic is bigger than 2.262, then when the observations are independent, identically distributed from a normal distribution, and the hypothesized mean is the true population mean, we'll reject the null hypothesis 5% of the time.

Consider a particular distribution with substantially higher kurtosis than the normal: 75% of our population have their values drawn from a normal distribution and the remaining 25% have their values drawn from a normal distribution with standard deviation 50 times as large.

If I calculated correctly, this corresponds to a kurtosis of 12 (an excess kurtosis of 9). The resulting distribution is much more peaked than the normal and has heavy tails. The density is compared with the normal density below -- you can see the higher peak, but you can't really see the heavier tail in the left image, so I also plotted the logarithm of the densities, which stretches out the lower part of the image and compresses the top, making it easier to see both the peak and the tails.

ال فعلي significance level for this distribution if you carry out a "5%" one-sample t-test with $n=10$ is below 0.9%. This is pretty dramatic, and pulls down the power curve quite substantially.

(You'll also see a substantive effect on the coverage of confidence intervals.)

Note that a different distribution with the same kurtosis as that will have a different impact on the significance level.

So why does the rejection rate go down? It's because the heavier tail leads to a few large outliers, which has slightly larger impact on the standard deviation than it does on the mean this impacts the t-statistic because it leads to more t-values between -1 and 1, in the process reducing the proportion of values in the critical region.

If you take a sample that looks pretty consistent with having come from a normal distribution whose mean is just far enough above the hypothesized mean that it's significant, and then you take the observation furthest above the mean and pull it even further away (that is, make the mean even larger than under $H_0$ ), you actually make the t-statistic الأصغر.

Let me show you. Here's a sample of size 10:

Imagine we want to test it against $H_0: mu=2$ (a one-sample t-test). It turns out that the sample mean here is 2.68 and the sample standard deviation is 0.9424. You get a t-statistic of 2.282 -- just in the rejection region for a 5% test (p-value of 0.0484).

Now make that largest value 50:

Clearly we pull the mean up, so it should indicate a difference even more than it did before, right? Well, no, it doesn't. The t-statistic goes down. It is now 1.106, and the p-value is quite large (close to 30%). ماذا حدث؟ Well, we did pull the mean up (to 7.257), but the standard deviation shot up over 15.

Standard deviations are a bit more sensitive to outliers than means are -- when you put in an outlier, you tend to push the one-sample t-statistic toward 1 or -1.

If there's a chance of several outliers, much the same happens only they can sometimes be on opposite sides (in which case the standard deviation is even more inflated while the impact on the mean is reduced compared to one outlier), so the t-statistic tends to move closer to 0.

Similar stuff goes on with a number of other common tests that assume normality -- higher kurtosis tends to be associated with heavier tails, which means more outliers, which means that standard deviations get inflated relative to means and so differences you want to pick up tend to get "swamped" by the impact of the outliers on the test. That is, low power.


‘s’ Possession and ‘of’ Possession

Possessive nouns are used in different ways to express different meanings. The most common uses are expressing

  1. Possession or ownership: The family’s dog.
  2. Association: Archer’s office,
  3. Action: Lana’s determination to shoot Archer.
  4. Measurement: The train’s delay,
  5. Characteristics of something: Lana’s Black Hair.

Often the preposition ‘of’ may serve an alternative to ‘s’ possessives. As I have said in my previous articles, repetitive sentence formate makes your writing dull. So it’s a good idea to switch between ‘s’ possessive and ‘of’ possessives. To do that, at first we need to know when we can use ‘of’ possessives in the right manner.

  1. Possession: To express ownership it’s always preferable to use the s possessive. For example, ‘Archer’s gun’ is preferred to ‘The gun of Archer,
  2. Associations: When the possessive noun is animate always s possessives. على سبيل المثال Archer’s Mother, Lana’s Baby, Kriger’s holographic girlfriend. But when the possessive noun is inanimate both s possessives and of possessives can be used. على سبيل المثال The university’s area, Area of the university.
  3. Attribution: Like the case of the association, here also use only s possessives for animate nouns. For inanimate nouns, both ‘s’ possessives and ‘of’ possessives can be used.

For Example: Danny’s White Hair. (Animate Possessive Noun) The university’s garage. (Inanimate Possessive Noun) The garage of the university. (Inanimate Possessive Noun)

  • 4. Action & Measurement: You can use both ‘s’ possessions and ‘of’ possessions to state somebody’s action.

“Archer’s revenge rampage for his butler” or “The revenge rampage of Archer for his butler”
Similarly for expressing measurement both types of possessions can be used.
“The Onion’s Increasing rate has made the people very upset.” (‘s’ possessions)

” The increasing rate of the onion has made the people very upset.” ( ‘of’ Possessions.)

Reference:Lester, M. (2011). Advanced English grammar for ESL learners. نيويورك: ماكجرو هيل.


مناقشة

The traditional standard errors for skewness and kurtosis printed by many statistics packages are very poor. While they are appropriate for normal distributions, deviations from normality, like a ر distribution with مدافع = 5 or a mixture of two normal curves with different standard deviations, produce standard errors that can be 5 times too small. Because normal distributions are rare in psychology (Micceri, 1989), the practice of encouraging the use of standard errors that are grossly in error with deviations from normality by printing them in statistics packages should be stopped. The function , written for this article, produces the bootstrap standard errors, BCa confidence intervals, and standard errors, which take into account characteristics of the distributions.

One question is whether the traditional standard errors can be used if you are using this only to test whether the distribution is normal. This approach is not recommended for at least two reasons. First, there are several better tests that are designed to test normality, such as the Shapiro and Wilk test (1965), and are available in many statistics packages. Testing skewness and kurtosis, individually, is problematic because they are dependent on each other, so rather than simply following the textbook approach, tests like D'Agostino's test (D'Agostino, Belanger, & D'Agostino, 1990) could be used. Second, because the traditional standard errors both under- and overestimate the true standard errors, you would not know whether the statistical test was liberal or conservative without guessing about the distribution. One method for guessing about the distribution is to take thousands of resamples of the observed distribution, which is what bootstrapping does.

The problems with the standard errors shown in this article are due to the use of the third and fourth moments to calculate skewness and kurtosis. These are very sensitive to deviations in the tails of the distributions and are not sensitive to deviations in the peaks of the distributions (Lindsay & Basak, 2000). Seier and Bonett (2003) discussed formulae that allow the user to vary the relative influence of deviations in the tails and the peak of a distribution, but these are not commonly used. The transformation described by Anscombe and Glynn (1983) can also be used. A function is described in the Appendix that uses this, but it is also not widely used. If skewness and kurtosis are operationalized in other ways, the impact of extreme points can be lessened. Balanda and MacGillivray (1988) discussed several ways in which quartiles could be used for operationalizing these statistics that would be less influenced by extreme points. One of the most promising is إل-moments (Hosking, 1992). Hosking shows how skewness and kurtosis measures based on these are more consistent with the Shapiro–Wilk test of normality. These can be adjusted, for example, by trimming, which further increases their robustness (Elamir & Seheult, 2003). In time, these alternative methods may become more popular, but dramatically changing the statistics for measuring them would also change the meaning of skewness and kurtosis. Therefore, it is unlikely that these alternatives will become widespread in the near future.

The main recommendations from this article are that researchers should be careful when using traditional measures of standard error for skewness and kurtosis. Bootstrap confidence intervals can be used, but researchers should be aware that these may still be in error. For testing whether a distribution is of a certain shape, tests designed specifically for this purpose should be used. Methods based on transformations of the moments and إل-moments should be considered.


Using Secondary Datasets to Understand Persons with Developmental Disabilities and their Families

4.1 Kurtosis and Skew

Measures of kurtosis and skew are used to determine if indicators met normality assumptions ( Kline, 2005 ). Measures of kurtosis help identify if a curve is normal or abnormally shaped. If a normal curve is leptokurtic, the curve is highly arched at the mean with short tails. Platykurtic curves, on the other hand, are flatter than normal with a lower peak and longer tails. A skewed curve is either positively or negatively skewed. Positively skewed curves show the majority of scores below the mean, and negatively skewed curves are just the opposite. Both curves result in an asymmetrical normal curve. Both skew and kurtosis can be analyzed through descriptive statistics. Acceptable values of skewness fall between − 3 and + 3, and kurtosis is appropriate from a range of − 10 to + 10 when utilizing SEM ( Brown, 2006 ). Values that fall above or below these ranges are suspect, but SEM is a fairly robust analytical method, so small deviations may not represent major violations of assumptions. Other types of analyses may have lower acceptable skew or kurtosis values so researchers should investigate their planned analysis to determine data screening guidelines.


Bounds on skew and kurtosis of IQ - Psychology

يتم توفير جميع المقالات المنشورة بواسطة MDPI على الفور في جميع أنحاء العالم بموجب ترخيص وصول مفتوح. لا يلزم الحصول على إذن خاص لإعادة استخدام كل أو جزء من المقالة المنشورة بواسطة MDPI ، بما في ذلك الأشكال والجداول. بالنسبة للمقالات المنشورة بموجب ترخيص Creative Common CC BY ذي الوصول المفتوح ، يجوز إعادة استخدام أي جزء من المقالة دون إذن بشرط الاستشهاد بالمقال الأصلي بوضوح.

تمثل الأوراق الرئيسية أكثر الأبحاث تقدمًا مع إمكانات كبيرة للتأثير الكبير في هذا المجال. يتم تقديم الأوراق الرئيسية بناءً على دعوة فردية أو توصية من قبل المحررين العلميين وتخضع لمراجعة الأقران قبل النشر.

يمكن أن تكون ورقة الميزات إما مقالة بحثية أصلية ، أو دراسة بحثية جديدة جوهرية غالبًا ما تتضمن العديد من التقنيات أو المناهج ، أو ورقة مراجعة شاملة مع تحديثات موجزة ودقيقة عن آخر التقدم في المجال الذي يراجع بشكل منهجي التطورات الأكثر إثارة في العلم. المؤلفات. يوفر هذا النوع من الأوراق نظرة عامة على الاتجاهات المستقبلية للبحث أو التطبيقات الممكنة.

تستند مقالات اختيار المحرر على توصيات المحررين العلميين لمجلات MDPI من جميع أنحاء العالم. يختار المحررون عددًا صغيرًا من المقالات المنشورة مؤخرًا في المجلة والتي يعتقدون أنها ستكون مثيرة للاهتمام بشكل خاص للمؤلفين أو مهمة في هذا المجال. الهدف هو تقديم لمحة سريعة عن بعض الأعمال الأكثر إثارة المنشورة في مجالات البحث المختلفة بالمجلة.


قد يعجبك ايضا

Kurtosis does not measure anything about the "peak" as was historically reported. Rather, it is a measure of whether there are outliers (ie, rare extreme values) in the data. These show up in graphs as one or a very few points that are very far from the main body of the data. anon342994 July 26, 2013

Can anyone help me understand skewed distribution for my presentation. I can't seem to understand about graphs.

In my stats class today, the teacher mentioned that curves can have different levels of skewness and kurtosis. She didn't go into any real detail explaining what this is, especially kurtosis.

Could someone give me a brief explanation to help point me in the right direction as to what kurtosis means? titans62 July 14, 2011

@cardsfan27 - Great examples. I'm not sure why I couldn't think of those. When I was thinking of something like population that would have a right skewed distribution. There are many more young people than there are old people. I guess something else could be the size of trees in a forest. There are hundreds of seedlings and saplings for every tree that is fully grown.

I did some more research on the curves with two high points. They are called bimodal distributions. All of the examples I found were similar to yours and involved height or weight. I would be interested to hear more of them, though. cardsfan27 July 13, 2011

@titans62 - I'm having the opposite problem! All I can think of are things that have a normal distribution, but are not skewed. Some of the things I'm thinking of that would be a normal bell shape are height and weight of the population. Test scores are also a stereotypical bell curve example.

Your second question had me stumped for a few minutes, but I think I've got an example. This might be a little far fetched, but maybe someone else has a better one. If you took 25 men and 25 women, and then took their weights. You could assume that the men are going to weigh more on average than the women, so if you graphed the weights, you might find that the women make a peak lower on the scale, and men make a peak farther up. I hope that made sense. titans62 July 13, 2011

Can someone help me -- I understand what a bell curve looks like, but for whatever reason, I can't think of anything that would have that shape. Everything I am thinking of would have a skewed distribution where one tail was longer than the other.

Another related question - would it ever be possible for a curve to have two high spots compared to the curve going up and coming back down in a normal bell curve? Emilski July 12, 2011

It seems counter intuitive that a positively skewed distribution would have a tail going to the right. I would have guessed that the positive and negative was determined by where the highest point of the curve was.


شاهد الفيديو: 10 علامات تدل على مدى ذكائك. اختبار ذكاء (يونيو 2022).


تعليقات:

  1. Kagara

    أنا محدود ، أعتذر ، لكن في رأيي هذا الموضوع قديم بالفعل.

  2. Fidel

    أعتقد أنك خدعت.

  3. Zuzuru

    يؤسفني أنني لا أستطيع فعل أي شيء. أتمنى أن تجد الحل الصحيح.

  4. Kilabar

    هذا رأيك بشكل استثنائي

  5. Camey

    آسف للتدخل ... أفهم هذه القضية. أدعوك إلى مناقشة.



اكتب رسالة