قائمة المصطلحات
- Page ID
- 199175
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)
بدأ
- متوسط
- يُطلق عليه أيضًا المتوسط أو المتوسط الحسابي؛ رقم يصف الاتجاه المركزي للبيانات
- تعمية
- عدم إخبار المشاركين بالعلاج الذي يتلقاه الشخص
- متغير فئوي
- المتغيرات التي تأخذ القيم التي هي أسماء أو تسميات
- أخذ العينات العنقودية
- طريقة لاختيار عينة عشوائية وتقسيم السكان إلى مجموعات (مجموعات)؛ استخدم أخذ عينات عشوائية بسيطة لتحديد مجموعة من المجموعات. يتم تضمين كل فرد في المجموعات المختارة في العينة.
- متغير عشوائي مستمر
- متغير عشوائي (RV) يتم قياس نتائجه؛ ارتفاع الأشجار في الغابة هو RV مستمر.
- مجموعة التحكم
- مجموعة في تجربة عشوائية تتلقى علاجًا غير نشط ولكن تتم إدارتها تمامًا مثل المجموعات الأخرى
- أخذ العينات بطريقة ملائمة
- طريقة غير عشوائية لاختيار عينة؛ تختار هذه الطريقة الأفراد الذين يمكن الوصول إليهم بسهولة وقد تؤدي إلى بيانات متحيزة.
- التردد النسبي التراكمي
- ينطبق المصطلح على مجموعة مرتبة من الملاحظات من الأصغر إلى الأكبر. التردد النسبي التراكمي هو مجموع الترددات النسبية لجميع القيم التي تقل عن أو تساوي القيمة المعطاة.
- البيانات
- مجموعة من الملاحظات (مجموعة من النتائج المحتملة)؛ يمكن وضع معظم البيانات في مجموعتين: النوعية (السمة التي يشار إلى قيمتها بواسطة تسمية) أو الكمية (سمة يشار إلى قيمتها برقم). يمكن فصل البيانات الكمية إلى مجموعتين فرعيتين: منفصلة ومستمرة. تكون البيانات منفصلة إذا كانت نتيجة العد (مثل عدد الطلاب من مجموعة عرقية معينة في الفصل أو عدد الكتب الموجودة على الرف). تكون البيانات مستمرة إذا كانت نتيجة القياس (مثل المسافة المقطوعة أو وزن الأمتعة)
- متغير عشوائي منفصل
- متغير عشوائي (RV) يتم حساب نتائجه
- التعمية المزدوجة
- فعل تعمية كل من موضوعات التجربة والباحثين الذين يعملون مع الموضوعات
- وحدة تجريبية
- أي فرد أو كائن يتم قياسه
- متغير توضيحي
- المتغير المستقل في التجربة؛ القيمة التي يتحكم فيها الباحثون
- التردد
- عدد المرات التي تحدث فيها قيمة البيانات
- الموافقة المستنيرة
- يجب أن يكون أي موضوع بشري في دراسة بحثية على دراية بأي مخاطر أو تكاليف مرتبطة بالدراسة. يحق للموضوع معرفة طبيعة العلاجات المدرجة في الدراسة ومخاطرها المحتملة وفوائدها المحتملة. يجب إعطاء الموافقة بحرية من قبل مشارك مستنير ومناسب.
- مجلس المراجعة المؤسسية
- لجنة مكلفة بالإشراف على البرامج البحثية التي تشمل مواضيع بشرية
- متغير كامن
- متغير له تأثير على الدراسة على الرغم من أنه ليس متغيرًا توضيحيًا ولا متغير استجابة
- نماذج رياضية
- وصف ظاهرة باستخدام المفاهيم الرياضية، مثل المعادلات، وعدم المساواة، والتوزيعات، وما إلى ذلك.
- خطأ عدم أخذ العينات
- مشكلة تؤثر على موثوقية بيانات أخذ العينات بخلاف التباين الطبيعي؛ فهي تتضمن مجموعة متنوعة من الأخطاء البشرية بما في ذلك تصميم الدراسة السيئ وطرق أخذ العينات المتحيزة والمعلومات غير الدقيقة المقدمة من المشاركين في الدراسة وأخطاء إدخال البيانات والتحليل السيئ.
- متغير عددي
- المتغيرات التي تأخذ القيم المشار إليها بالأرقام
- دراسة قائمة على الملاحظة
- دراسة لا يتم فيها التلاعب بالمتغير المستقل من قبل الباحث
- المعلمة
- رقم يستخدم لتمثيل خاصية سكانية ولا يمكن تحديده بسهولة بشكل عام
- دواء وهمي
- علاج غير نشط ليس له تأثير حقيقي على المتغير التوضيحي
- تعداد السكان
- جميع الأفراد أو الأشياء أو القياسات التي تتم دراسة خصائصها
- الاحتمالية
- رقم بين صفر وواحد، بشكل شامل، يعطي احتمالية وقوع حدث معين
- نسبة
- عدد النجاحات مقسومًا على العدد الإجمالي في العينة
- البيانات النوعية
- راجع البيانات.
- البيانات الكمية
- راجع البيانات.
- التعيين العشوائي
- عملية تنظيم الوحدات التجريبية في مجموعات معالجة باستخدام طرق عشوائية
- أخذ العينات العشوائية
- طريقة لاختيار عينة تمنح كل فرد من السكان فرصة متساوية للاختيار.
- التردد النسبي
- نسبة عدد المرات التي تحدث فيها قيمة البيانات في مجموعة جميع النتائج إلى عدد جميع النتائج إلى العدد الإجمالي للنتائج
- عينة تمثيلية
- مجموعة فرعية من السكان لها نفس خصائص السكان
- متغير الاستجابة
- المتغير التابع في التجربة؛ القيمة التي يتم قياسها للتغيير في نهاية التجربة
- عينة
- مجموعة فرعية من السكان الذين تمت دراستهم
- تحيز أخذ العينات
- ليس من المرجح أن يتم اختيار جميع أفراد السكان بالتساوي
- خطأ في أخذ العينات
- الاختلاف الطبيعي الناتج عن اختيار عينة لتمثيل عدد أكبر من السكان؛ يتناقص هذا الاختلاف مع زيادة حجم العينة، لذا فإن اختيار عينات أكبر يقلل من خطأ أخذ العينات.
- أخذ العينات مع الاستبدال
- بمجرد اختيار عضو من السكان لإدراجه في عينة، يتم إرجاع هذا العضو إلى السكان لاختيار الفرد التالي.
- أخذ العينات بدون استبدال
- يمكن اختيار أحد أفراد السكان لإدراجه في عينة مرة واحدة فقط. في حالة الاختيار، لا يتم إرجاع العضو إلى السكان قبل الاختيار التالي.
- أخذ عينات عشوائية بسيطة
- طريقة مباشرة لاختيار عينة عشوائية؛ أعط كل فرد من السكان رقمًا. استخدم مولد الأرقام العشوائية لتحديد مجموعة من التسميات. تحدد هذه التسميات المختارة عشوائيًا أعضاء عينتك.
- إحصائية
- خاصية عددية للعينة؛ تقوم إحصائية بتقدير المعلمة السكانية المقابلة.
- نماذج إحصائية
- وصف للظاهرة باستخدام التوزيعات الاحتمالية التي تصف السلوك المتوقع للظاهرة والتنوع في الملاحظات المتوقعة.
- أخذ العينات الطبقية
- طريقة لاختيار عينة عشوائية تستخدم لضمان تمثيل المجموعات الفرعية من السكان بشكل مناسب؛ تقسيم السكان إلى مجموعات (طبقات). استخدم أخذ عينات عشوائية بسيطة لتحديد عدد متناسب من الأفراد من كل طبقة.
- الاحتمال الشرطي
- احتمالية وقوع حدث نظرًا لحدوث حدث آخر بالفعل
- جدول الطوارئ
- طريقة عرض توزيع التردد كجدول يحتوي على صفوف وأعمدة لإظهار كيفية اعتماد متغيرين (مشروطين) على بعضهما البعض؛ يوفر الجدول طريقة سهلة لحساب الاحتمالات الشرطية.
- أحداث تابعة
- إذا لم يكن هناك حدثان مستقلان، فإننا نقول إنهما يعتمدان على الآخر.
- من المحتمل بنفس القدر
- كل نتيجة من نتائج التجربة لها نفس الاحتمال.
- حدث
- مجموعة فرعية من مجموعة جميع نتائج التجربة؛ تسمى مجموعة جميع نتائج التجربة مساحة العينة وعادة ما يتم الإشارة إليها بواسطة S. الحدث هو مجموعة فرعية عشوائية في S. يمكن أن تحتوي على نتيجة واحدة، ونتيجتين، ولا نتائج (مجموعة فرعية فارغة)، ومساحة العينة بأكملها، وما شابه ذلك. الرموز القياسية للأحداث هي أحرف كبيرة مثل A و B و C وما إلى ذلك.
- تجربة
- نشاط مخطط يتم تنفيذه في ظل ظروف خاضعة للرقابة\(P(A|B) = P(A)\)
\(P(B|A) = P(B)\)
\(P(A \cap B) = P(A)P(B)\)
- أحداث مستقلة
- إن حدوث حدث واحد ليس له أي تأثير على احتمال حدوث حدث آخر. يكون الحدثان A و B مستقلان إذا كان أي مما يلي صحيحًا:
- حصري بشكل متبادل
- هناك حدثان متنافيان إذا كان احتمال حدوثهما في نفس الوقت صفرًا. إذا كان الحدثان A و B متنافيان، إذن\(P(A \cap B) = 0\).
- النتيجة
- نتيجة معينة للتجربة\(0 ≤ P(A) ≤ 1\)
إذا كان A و B هما حدثان متنافيان، إذن\(P(A \cup B) = P(A) + P(B)\).
\(P(S) = 1\)
- الاحتمالية
- رقم بين صفر وواحد، بما في ذلك، يعطي احتمالية وقوع حدث معين؛ يتم تحديد أساس الإحصاءات من خلال البديهيات الثلاث التالية (بقلم A.N. Kolmogorov، 1930): دعونا نشير إلى مساحة العينة و A و B هما حدثان في S. ثم: (1) هناك نتيجتان محتملتان فقط تسمى» النجاح» و «الفشل» لكل تجربة و (2) احتمال\(p\) النجاح هو نفسه لأي تجربة (لذا فإن\(q = 1 − p\) احتمال الفشل هو نفسه لأي تجربة).
- تجارب بيرنولي
- تجربة بالخصائص التالية: هناك عدد ثابت من التجارب،\(n\). هناك نتيجتان محتملتان فقط، تسمى «النجاح» و «الفشل»، لكل تجربة. \(p\)تشير الرسالة إلى احتمال النجاح في تجربة واحدة،\(q\) وتشير إلى احتمال الفشل في تجربة واحدة. \(n\)التجارب مستقلة ويتم تكرارها باستخدام شروط متطابقة.
- تجربة ذات حدين
- تجربة إحصائية تستوفي الشروط الثلاثة التالية:
- التوزيع الاحتمالي ذو الحدين
- متغير عشوائي منفصل (RV) ينشأ من تجارب برنولي؛ هناك عدد ثابت من التجارب المستقلة.\(n\) تعني كلمة «المستقلة» أن نتيجة أي تجربة (على سبيل المثال، التجربة الأولى) لا تؤثر على نتائج التجارب التالية، ويتم إجراء جميع التجارب في ظل نفس الظروف. في ظل هذه الظروف،\(X\) يتم تعريف RV ثنائي الحدود على أنه عدد النجاحات في التجارب. المتوسط هو\(\mu=n p\) والانحراف المعياري هو\(\sigma=\sqrt{n p q}\). احتمال نجاح x بالضبط في\(n\) التجارب هو\(P(X=x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\).
- توزيع هندسي
- متغير عشوائي منفصل (RV) ينشأ من تجارب Bernoulli؛ تتكرر التجارب حتى النجاح الأول. يتم تعريف المتغير الهندسي X على أنه عدد التجارب حتى النجاح الأول. المتوسط هو\(\mu=\frac{1}{p}\) والانحراف المعياري هو\(\sigma = \sqrt{\frac{1}{p}\left(\frac{1}{p}-1\right)}\). يتم إعطاء احتمال الفشل x بالضبط قبل النجاح الأول من خلال الصيغة:\(P(X=x)=p(1-p)^{x-1}\) حيث يريد المرء معرفة احتمالية عدد التجارب حتى النجاح الأول: المسار\(x\) العاشر هو النجاح الأول. تطرح الصيغة البديلة للتوزيع الهندسي السؤال التالي: ما هو احتمال\(x\) الفشل حتى النجاح الأول؟ في هذه الصيغة، لا يتم احتساب التجربة التي أدت إلى النجاح الأول. صيغة هذا العرض الهندسي هي:\(P(X=x)=p(1-p)^{x}\). القيمة المتوقعة في هذا الشكل من التوزيع الهندسي هي\(\mu=\frac{1-p}{p}\). أسهل طريقة للحفاظ على هذين الشكلين من التوزيع الهندسي مستقيمين هي تذكر أن p\((1−p)\) هو احتمال النجاح وهو احتمال الفشل. في الصيغة، تحسب الأسس ببساطة عدد النجاحات وعدد حالات الفشل في النتيجة المرجوة من التجربة. بالطبع يجب إضافة مجموع هذين الرقمين إلى عدد التجارب في التجربة.
- هناك تجربة واحدة أو أكثر من تجارب برنولي مع جميع حالات الفشل باستثناء التجربة الأخيرة، وهي تجربة ناجحة.
- من الناحية النظرية، يمكن أن يستمر عدد التجارب إلى الأبد. يجب أن تكون هناك تجربة واحدة على الأقل.
- إن احتمال النجاح واحتمال الفشل لا\(q\) يتغيران من محاكمة إلى أخرى.\(p\)
- تجربة هندسية
- تجربة إحصائية بالخصائص التالية:
- تجربة هندسية فائقة
- تجربة إحصائية بالخصائص التالية:
- يمكنك أخذ عينات من مجموعتين.
- أنت مهتم بمجموعة من الاهتمامات تسمى المجموعة الأولى.
- يمكنك أخذ عينات بدون استبدال من المجموعات المدمجة.
- كل اختيار ليس مستقلاً، لأن أخذ العينات بدون استبدال.
- توزيع عادي
- متغير عشوائي مستمر\((RV)\) مع pdf\(f(x) =\)\[\frac{1}{\sigma \sqrt{2 \pi}} \mathrm{e}^{\frac{-(x-\mu)^{2}}{2 \sigma^{2}}}\nonumber\]، أين\(\mu\) هو متوسط التوزيع\(\sigma\) وهو الانحراف المعياري؛ الترميز:\(X \sim N(\mu, \sigma)\). إذا كان\(\mu = 0\) و\(\sigma = 1\)\(RV\)، فإن\(Z\)،، يسمى بالتوزيع العادي القياسي. التوزيع العادي القياسي متغير عشوائي مستمر\((RV) X \sim N(0, 1)\)؛ عندما\(X\) يتبع التوزيع العادي القياسي، غالبًا ما يُشار إليه على أنه\(Z \sim N(0, 1)\). z-score هو التحويل الخطي للنموذج\(z=\frac{x-\mu}{\sigma}\) أو كتابته كـ\(z=\frac{|x-\mu|}{\sigma}\)؛ إذا تم تطبيق هذا التحويل على أي توزيع عادي \(X \sim N(\mu, \sigma)\)والنتيجة هي التوزيع العادي القياسي\(Z \sim N(0,1)\). إذا تم تطبيق هذا التحويل على أي قيمة محددة\(x\) للمتوسط\(RV\)\(\mu\) مع والانحراف المعياري\(\sigma\)، فإن النتيجة تسمى z-score of\(x\). تسمح لنا z-score بمقارنة البيانات التي يتم توزيعها عادةً ولكن يتم تحجيمها بشكل مختلف. درجة z-score هي عدد الانحرافات المعيارية التي\(x\) تكون بعيدة عن قيمتها المتوسطة.
- توزيع ذو حدين
- متغير عشوائي منفصل (RV) ينشأ من تجارب برنولي؛ هناك عدد ثابت من التجارب المستقلة.\(n\) تعني كلمة «المستقلة» أن نتيجة أي تجربة (على سبيل المثال، التجربة 1) لا تؤثر على نتائج التجارب التالية، ويتم إجراء جميع التجارب في ظل نفس الظروف. في ظل هذه الظروف،\(RV\)\(X\) يتم تعريف الحدين على أنه عدد النجاحات في التجارب. الترميز هو:\(X \sim B(\bf{n,p})\). المتوسط هو\(\mu = np\) والانحراف المعياري هو\(\sigma=\sqrt{n p q}\). احتمال\(x\) النجاح بالضبط في\(n\) التجارب هو\(P(X=x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\).
- فترة الثقة (CI)
- تقدير فاصل زمني لمعلمة سكانية غير معروفة. هذا يعتمد على:
- مستوى الثقة المطلوب،
- المعلومات المعروفة عن التوزيع (على سبيل المثال، الانحراف المعياري المعروف)،
- العينة وحجمها.
- مستوى الثقة (CL)
- تعبير النسبة المئوية لاحتمالية احتواء فاصل الثقة على المعلمة السكانية الحقيقية؛ على سبيل المثال، إذا كان CL = 90٪، فإن تقدير الفاصل الزمني سيتضمن المعلمة السكانية الحقيقية في 90 عينة من أصل 100 عينة.
- درجات الحرية (df)
- عدد الكائنات في العينة التي يمكن تغييرها مجانًا
- حد الخطأ لمتوسط السكان (EBM)
- هامش الخطأ؛ يعتمد على مستوى الثقة وحجم العينة والانحراف المعياري السكاني المعروف أو المقدر.
- حد الخطأ لنسبة السكان (EBP)
- هامش الخطأ؛ يعتمد على مستوى الثقة وحجم العينة ونسبة النجاح المقدرة (من العينة).
- الإحصاء الاستنتاجي
- يُطلق عليه أيضًا الاستدلال الإحصائي أو الإحصاء الاستقرائي؛ يتعامل هذا الجانب من الإحصاء مع تقدير المعلمة السكانية بناءً على إحصائية العينة. على سبيل المثال، إذا كانت أربعة من بين 100 آلة حاسبة تم أخذ عينات منها معيبة، فقد نستنتج أن أربعة بالمائة من الإنتاج معيب.
- توزيع عادي
- متغير عشوائي مستمر (RV) مع pdf\(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-(x-\mu)^{2} / 2 \sigma^{2}}\)، أين\(\mu\) هو متوسط التوزيع\(\sigma\) وهو الانحراف المعياري، الترميز:\(X \sim N(\mu,\sigma)\). إذا كان\(\mu = 0\)\(\sigma = 1\) الأمر كذلك، فإن عربة سكن متنقلة تسمى التوزيع العادي القياسي.
- توزيع ذو حدين
- متغير عشوائي منفصل (RV) ينشأ من تجارب Bernoulli. هناك عدد ثابت، n، من التجارب المستقلة. تعني كلمة «المستقلة» أن نتيجة أي تجربة (على سبيل المثال، التجربة 1) لا تؤثر على نتائج التجارب التالية، ويتم إجراء جميع التجارب في ظل نفس الظروف. في ظل هذه الظروف، يتم تعريف RV ذات الحدين على أنه عدد النجاحات في\(n\) التجارب. الترميز هو:\(X \sim B(n, p) \mu = np\) والانحراف المعياري هو\(\sigma=\sqrt{n p q}\). احتمال\(x\) النجاح بالضبط في\(n\) التجارب هو\(P(X=x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\).
- نظرية الحد المركزي
- مع إعطاء متغير عشوائي (RV) مع المتوسط المعروف والانحراف المعياري المعروف\(\sigma\).\(\mu\) نقوم بأخذ العينات بالحجم n ونحن مهتمون بعرضين جديدين - متوسط العينة،\(\overline X\). إذا كان حجم n من العينة كبيرًا بما فيه الكفاية، إذن\(\overline{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\). إذا كان حجم n من العينة كبيرًا بما فيه الكفاية، فإن توزيع وسائل العينة سيقارب التوزيع الطبيعي بغض النظر عن شكل السكان. وستعادل القيمة المتوقعة لمتوسط العينة المتوسط السكاني. الانحراف المعياري لتوزيع العينة يعني،\(\frac{\sigma}{\sqrt{n}}\)، الخطأ المعياري للمتوسط.
- مستوى الثقة المطلوب.
- المعلومات المعروفة عن التوزيع (على سبيل المثال، الانحراف المعياري المعروف).
- العينة وحجمها.
- فترة الثقة (CI)
- تقدير فاصل زمني لمعلمة سكانية غير معروفة. هذا يعتمد على:
- القيمة الحرجة
- \(Z\)القيمة\(t\) أو التي حددها الباحث والتي تقيس احتمال حدوث خطأ من النوع الأول,\(\sigma\).
- الفرضية
- بيان حول قيمة المعلمة السكانية، في حالة وجود فرضيتين، يُطلق على العبارة التي يُفترض أنها صحيحة اسم الفرضية الصفرية (الترميز\(H_0\)) وتسمى العبارة المتناقضة الفرضية البديلة (الترميز\(H_a\)).
- اختبار الفرضيات
- بناءً على عينة من الأدلة، إجراء لتحديد ما إذا كانت الفرضية المذكورة عبارة عن بيان معقول ولا ينبغي رفضها، أو أنها غير معقولة ويجب رفضها.
- د كوهين
- مقياس لحجم التأثير بناءً على الاختلافات بين وسيلتين. \(d\)إذا كان بين 0 و 0.2، فسيكون التأثير صغيرًا. إذا كان\(d\) النهج هو 0.5، فسيكون التأثير متوسطًا، وإذا\(d\) اقترب من 0.8، فسيكون التأثير كبيرًا.
- a هو رمز التقاطع Y
- يُكتب أحيانًا باسم\(b_0\)، لأنه عند كتابة النموذج الخطي النظري\(\beta_0\) يستخدم لتمثيل معامل للسكان.
- b هو رمز المنحدر
- سيتم استخدام معامل الكلمة بانتظام للمنحدر، لأنه رقم سيكون دائمًا بجوار الحرف «»\(x\). سيتم كتابتها كما هو الحال\(b_1\) عند استخدام عينة،\(\beta_1\) وسيتم استخدامها مع السكان أو عند كتابة النموذج الخطي النظري.
- ثنائي المتغير
- يوجد متغيران في النموذج حيث يكون أحدهما هو «السبب» أو المتغير المستقل والآخر هو «تأثير» المتغير التابع.
- خطي
- نموذج يأخذ البيانات ويرجعها إلى معادلة الخط المستقيم.
- متعدد المتغيرات
- نظام أو نموذج يتم فيه استخدام أكثر من متغير مستقل للتنبؤ بالنتيجة. يمكن أن يكون هناك متغير تابع واحد فقط، ولكن لا يوجد حد لعدد المتغيرات المستقلة.
- R2R2 - معامل التحديد
- هذا هو الرقم بين 0 و 1 الذي يمثل التباين في النسبة المئوية للمتغير التابع الذي يمكن تفسيره من خلال الاختلاف في المتغير المستقل. يتم حسابه أحيانًا بالمعادلة\(R^{2}=\frac{S S R}{S S T}\) حيث\(SSR\) يكون «مجموع مربعات الانحدار»\(SST\) وهو «مجموع مجموع المربعات». يجب دائمًا تعديل معامل التحديد المناسب الذي سيتم الإبلاغ عنه لدرجات الحرية أولاً.
- المتبقي أو «الخطأ»
- القيمة المحسوبة من الطرح\(y_{0}-\hat{y}_{0}=e_{0}\). تقيس القيمة المطلقة للمتبقي المسافة الرأسية بين القيمة الفعلية لـ y والقيمة المقدرة لـ y التي تظهر على الخط الأكثر ملاءمة.
- RR - معامل الارتباط
- رقم بين −1 و1 يمثل قوة واتجاه العلاقة بين «\(X\)» و «»\(Y\). ستساوي قيمة «\(r\)» 1 أو −1 فقط إذا كانت جميع النقاط المرسومة تشكل خطًا مستقيمًا تمامًا.
- مجموع الأخطاء المربعة (SSE)
- القيمة المحسوبة من جمع جميع المصطلحات المتبقية المربعة. الأمل هو أن تكون هذه القيمة صغيرة جدًا عند إنشاء نموذج.
- X - المتغير المستقل
- وسيشار إلى هذا أحيانًا باسم متغير «المتنبئ»، لأنه تم قياس هذه القيم من أجل تحديد النتائج المحتملة التي يمكن التنبؤ بها.
- Y - المتغير التابع
- كما أن استخدام الحرف «\(y\)» يمثل القيم الفعلية بينما\(\hat{y}\) يمثل القيم المتوقعة أو المقدرة. ستأتي القيم المتوقعة من إدخال القيم «\(x\)» المرصودة في نموذج خطي.
- عادة ما يتم توزيع جميع الفئات السكانية ذات الاهتمام.
- لدى السكان انحرافات معيارية متساوية.
- يتم اختيار العينات (ليس بالضرورة من نفس الحجم) بشكل عشوائي ومستقل من كل مجموعة سكانية.
- هناك متغير مستقل واحد ومتغير تابع واحد.
إحصائية الاختبار لتحليل التباين هي\(F\) نسبة -.
- تحليل التباين
- يشار إليها أيضًا باسم ANOVA، وهي طريقة لاختبار ما إذا كانت وسائل ثلاثة أو أكثر من السكان متساوية أم لا. هذه الطريقة قابلة للتطبيق في الحالات التالية:
- أنوفا أحادية الاتجاه
- طريقة لاختبار ما إذا كانت وسائل ثلاثة أو أكثر من السكان متساوية أم لا؛ الطريقة قابلة للتطبيق في الحالات التالية:
- عادة ما يتم توزيع جميع الفئات السكانية ذات الاهتمام.
- لدى السكان انحرافات معيارية متساوية.
- يتم اختيار العينات (ليس بالضرورة من نفس الحجم) بشكل عشوائي ومستقل من كل مجموعة سكانية.
إحصائية الاختبار لتحليل التباين هي\(F\) نسبة -.
- التباين
- متوسط الانحرافات المربعة عن المتوسط؛ مربع الانحراف المعياري. بالنسبة لمجموعة من البيانات، يمكن تمثيل الانحراف على\(x\) أنه\(x – \overline{x}\) مكان قيمة البيانات\(\overline{x}\) وهو متوسط العينة. تباين العينة يساوي مجموع مربعات الانحرافات مقسومًا على اختلاف حجم العينة وواحد.
- جدول الطوارئ
- جدول يعرض قيم العينة لعاملين مختلفين قد يعتمدان أو يتوقفان على بعضهما البعض؛ ويسهل تحديد الاحتمالات الشرطية.
- جودة اللياقة
- اختبار فرضية يقارن القيم المتوقعة والملاحظة من أجل البحث عن اختلافات كبيرة داخل متغير واحد غير بارامتري. درجات الحرية المستخدمة تساوي (عدد الفئات - 1).
- اختبار التجانس
- اختبار يستخدم لاستخلاص استنتاج حول ما إذا كان هناك مجموعتان من السكان لهما نفس التوزيع. درجات الحرية المستخدمة تساوي (عدد الأعمدة - 1).
- اختبار الاستقلال
- اختبار فرضية يقارن القيم المتوقعة والملاحظة لجداول الطوارئ من أجل اختبار الاستقلال بين متغيرين. درجات الحرية المستخدمة تساوي (عدد الأعمدة - 1) مضروبًا في (عدد الصفوف - 1).
- مجموعات مستقلة
- عينتان يتم اختيارهما من مجموعتين من السكان، والقيم من مجموعة سكانية واحدة لا ترتبط بأي شكل من الأشكال بالقيم من السكان الآخرين.
- أزواج متطابقة
- عينتان معتمدتان. يتم اختبار الاختلافات بين سيناريو ما قبل وبعد عن طريق اختبار متوسط الاختلافات بين السكان.
- التباين المجمّع
- متوسط مرجح لنوعين مختلفين يمكن استخدامهما بعد ذلك عند حساب الخطأ القياسي.
- توزيع عادي
- متغير عشوائي مستمر (RV) مع pdf\(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{\frac{-(x-\mu)^{2}}{2 \sigma^{2}}}\)، أين\(\mu\) هو متوسط التوزيع،\(\sigma\) وهو الانحراف المعياري، الترميز:\(X \sim N(\mu, \sigma)\). إذا كان\(\mu = 0\)\(\sigma = 1\) الأمر كذلك، فإن عربة سكن متنقلة تسمى التوزيع العادي القياسي.
- الإنحراف المعياري
- رقم يساوي الجذر التربيعي للتباين ويقيس مدى بُعد قيم البيانات عن متوسطها؛ الترميز: s للانحراف المعياري للعينة و للانحراف المعياري للسكان.
- توزيع T للطلاب
- تم التحقيق فيها والإبلاغ عنها من قبل ويليام إس جوسيت في عام 1908 ونشرت تحت الاسم المستعار Student. الخصائص الرئيسية للمتغير العشوائي (RV) هي:
- إنها مستمرة وتفترض أي قيم حقيقية.
- ملف pdf متماثل حول متوسط الصفر. ومع ذلك، فهي أكثر انتشارًا وتسطحًا في القمة من التوزيع العادي.
- إنه يقترب من التوزيع العادي القياسي حيث يزداد n.
- هناك «عائلة» لتوزيعات t: يتم تعريف كل ممثل للعائلة تمامًا من خلال عدد درجات الحرية التي تقل بمقدار واحد عن عدد عناصر البيانات.
- إحصائية الاختبار
- الصيغة التي تحسب عدد الانحرافات المعيارية في التوزيع ذي الصلة تكون المعلمة المقدرة بعيدة عن القيمة المفترضة.
- خطأ من النوع الأول
- القرار هو رفض فرضية اللاغية عندما تكون فرضية العدم صحيحة في الواقع.
- خطأ من النوع الثاني
- القرار هو عدم رفض فرضية اللاغية عندما تكون فرضية اللاغية خاطئة في الواقع.
- المعلمة
- سمة عددية للسكان
- تقدير النقاط
- رقم واحد محسوب من عينة ويستخدم لتقدير معامل السكان
- الإنحراف المعياري
- رقم يساوي الجذر التربيعي للتباين ويقيس مدى بُعد قيم البيانات عن متوسطها؛ الترميز: للانحراف المعياري\(s\) للعينة و\ سيغما للانحراف المعياري للسكان
- توزيع الطلاب
- تم التحقيق فيها والإبلاغ عنها بواسطة William S. Gossett في عام 1908 ونشرها تحت اسم مستعار Student؛ الخصائص الرئيسية لهذا المتغير العشوائي (\(RV\)) هي:
- إنها مستمرة وتفترض أي قيم حقيقية.
- ملف pdf متماثل حول متوسط الصفر.
- إنه يقترب من التوزيع العادي القياسي\(n\) كلما زاد حجمه.
- هناك «عائلة» من التوزيعات t: يتم تعريف كل ممثل للعائلة تمامًا من خلال عدد درجات الحرية، والتي تعتمد على التطبيق الذي يتم استخدام t من أجله.
- متوسط
- رقم يصف الاتجاه المركزي للبيانات؛ هناك عدد من المتوسطات المتخصصة، بما في ذلك المتوسط الحسابي والمتوسط المرجح والوسيط والنمط والمتوسط الهندسي.
- نظرية الحد المركزي
- بالنظر إلى متغير عشوائي له متوسط μمعروف وانحراف معياري معروف،، نقوم بأخذ العينات بالحجم n، ونحن مهتمون باثنين من المركبات الترفيهية الجديدة: متوسط العينة،\(\overline X\). إذا كان حجم (\(n\)) العينة كبيرًا بما فيه الكفاية، إذن\(\overline{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\). إذا كان حجم (\(n\)) العينة كبيرًا بما فيه الكفاية، فإن توزيع وسائل العينة سيقارب التوزيعات العادية بغض النظر عن شكل المجموعة السكانية. وسيعادل متوسط العينة متوسط عدد السكان. الانحراف المعياري لتوزيع العينة يعني،\(\frac{\sigma}{\sqrt{n}}\)، الخطأ المعياري للمتوسط.
- عامل تصحيح السكان المحدود
- يضبط التباين في توزيع العينات إذا كان السكان معروفين وتم أخذ عينات لأكثر من 5٪ من السكان.
- يعني
- رقم يقيس الاتجاه المركزي؛ الاسم الشائع للمتوسط هو «متوسط». مصطلح «المتوسط» هو شكل مختصر من «المتوسط الحسابي». وبحسب التعريف، فإن متوسط العينة (المشار إليها بـ\(\overline x\)) هو\(\overline x =\overline{x}=\frac{\text { Sum of all values in the sample }}{\text { Number of values in the sample }}\)، والمتوسط بالنسبة للسكان (المشار إليه بـ\(\mu\)) هو\(\mu=\frac{\text { Sum of all values in the population }}{\text { Number of values in the population }}\).
- توزيع عادي
- متغير عشوائي مستمر مع pdf\(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{\frac{-(x-\mu)^{2}}{2 \sigma^{2}}}\)، أين\(\mu\) هو متوسط التوزيع\(\sigma\) وهو الانحراف المعياري.؛ الترميز:\(X \sim N(\mu, \sigma)\). إذا كان المتغير العشوائي\(\mu = 0\)\(Z\) و\(\sigma = 1\) يسمى التوزيع العادي القياسي.
- توزيع العينات
- بالنظر إلى عينات عشوائية بسيطة\(n\) من حجم مجموعة سكانية معينة ذات خاصية مقاسة مثل المتوسط أو النسبة أو الانحراف المعياري لكل عينة، فإن التوزيع الاحتمالي لجميع الخصائص المقاسة يسمى توزيع العينات.
- الخطأ القياسي للمتوسط
- الانحراف المعياري لتوزيع العينة يعني، أو\(\frac{\sigma}{\sqrt{n}}\).
- الخطأ القياسي للنسبة
- الانحراف المعياري لتوزيع العينات للنسب
- الاحتمال الشرطي
- احتمالية وقوع حدث نظرًا لحدوث حدث آخر بالفعل.
- معلمة الاضمحلال
- تصف معلمة الاضمحلال المعدل الذي تتحلل عنده الاحتمالات إلى الصفر لزيادة قيم\(x\). إنها القيمة m في دالة الكثافة الاحتمالية\(f(x)=m e^{(-m x)}\) لمتغير عشوائي أسي. وهو يساوي أيضًا\(m = \frac{1}{\mu}\)، أين\(\mu\) هو متوسط المتغير العشوائي.
- توزيع أسي
- متغير عشوائي مستمر (RV) يظهر عندما نكون مهتمين بالفترات الزمنية بين بعض الأحداث العشوائية، على سبيل المثال، طول الفترة الزمنية بين وصول الطوارئ إلى المستشفى. المتوسط هو\(\mu = \frac{1}{m}\) والانحراف المعياري هو\(\sigma = \frac{1}{m}\). دالة الكثافة الاحتمالية هي\(f(x)=m e^{-m x} \text { or } f(x)=\frac{1}{\mu} e^{-\frac{1}{\mu} x}, x \geq 0\) ووظيفة التوزيع التراكمي هي\(P(X \leq x)=1-e^{-m x} \text { or } P(X \leq x)=1-e^{-\frac{1}{\mu} x}\).
- خاصية لا ذاكرة لها
- بالنسبة للمتغير العشوائي الأسي\(X\)، فإن الخاصية عديمة الذاكرة هي العبارة التي تفيد بأن معرفة ما حدث في الماضي ليس لها أي تأثير على الاحتمالات المستقبلية. هذا يعني أن الاحتمال الذي\(X\) يتجاوز\(x + t\)، بالنظر إلى تجاوزه\(x\)، هو نفس الاحتمال الذي\(X\) سيتجاوز t إذا لم تكن لدينا معرفة به. في الرموز نقول ذلك\(P(X > x + t|X > x) = P(X > t)\).
- توزيع بواسون
- إذا كان هناك متوسط معروف لأحداث\ mu التي تحدث لكل وحدة زمنية، وكانت هذه الأحداث مستقلة عن بعضها البعض، فإن عدد الأحداث X التي تحدث في وحدة زمنية واحدة له توزيع Poisson. إن احتمال حدوث أحداث x في وحدة زمنية واحدة يساوي\(P(X=x)=\frac{\mu^{x} e^{-\mu}}{x !}\).
- توزيع موحد
- متغير عشوائي مستمر (RV) له نتائج متساوية على المجال\(a < x < b\)؛ غالبًا ما يشار إليه بالتوزيع المستطيل لأن الرسم البياني لـ pdf يحتوي على شكل مستطيل. المتوسط هو\(\mu=\frac{a+b}{2}\) والانحراف المعياري هو\(\sigma=\sqrt{\frac{(b-a)^{2}}{12}}\). دالة كثافة الاحتمال هي\ (f (x) =\ frac {1} {b-a}\ text {for} a
- الاحتمال الهندسي الفائق
- متغير عشوائي منفصل (RV) يتميز بما يلي:
- عدد ثابت من التجارب.
- احتمال النجاح ليس هو نفسه من التجربة إلى المحاكمة.
- توزيع بواسون الاحتمالي
- متغير عشوائي منفصل (RV) يحسب عدد المرات التي سيحدث فيها حدث معين في فترة زمنية محددة؛ خصائص المتغير:
- احتمال حدوث الحدث في فترة زمنية معينة هو نفسه لجميع الفواصل الزمنية.
- تحدث الأحداث بمتوسط معروف وبشكل مستقل عن الوقت منذ الحدث الأخير.
- دالة توزيع الاحتمالات (PDF)
- وصف رياضي لمتغير عشوائي منفصل (RV)، يتم تقديمه إما في شكل معادلة (صيغة) أو في شكل جدول يسرد جميع النتائج المحتملة للتجربة والاحتمال المرتبط بكل نتيجة.
- متغير عشوائي (RV)
- سمة من سمات الاهتمام بالسكان الذين تتم دراستهم؛ الترميز الشائع للمتغيرات هو الأحرف اللاتينية الكبيرة\(X, Y, Z\)،...؛ الترميز الشائع لقيمة معينة من المجال (مجموعة من جميع القيم الممكنة للمتغير) هي الأحرف اللاتينية الصغيرة\(x, y\)، و\(z\). على سبيل المثال،\(X\) إذا كان عدد الأطفال في الأسرة، فإنه\(x\) يمثل عددًا صحيحًا محددًا 0، 1، 2، 3،... تختلف المتغيرات في الإحصاء عن المتغيرات في الجبر المتوسط بالطريقتين التاليتين.
- مجال المتغير العشوائي (RV) ليس بالضرورة مجموعة رقمية؛ يمكن التعبير عن المجال بالكلمات؛ على سبيل المثال، إذا كان لون\(X =\) الشعر فإن المجال هو {أسود، أشقر، رمادي، أخضر، برتقالي}.
- لا يمكننا معرفة القيمة المحددة x التي\(X\) يستغرقها المتغير العشوائي إلا بعد إجراء التجربة.
- مساحة العينة
- مجموعة من جميع النتائج المحتملة للتجربة
- أخذ العينات مع الاستبدال
- إذا تم استبدال كل عضو من السكان بعد اختياره، فيمكن لهذا العضو أن يتم اختياره أكثر من مرة.
- أخذ العينات بدون استبدال
- عندما يتم أخذ العينات دون استبدال، يمكن اختيار كل فرد من السكان مرة واحدة فقط.
- الحدث المكمل
- يتكون مكمل الحدث A من جميع النتائج التي ليست في A.
- الاحتمال الشرطي لـ\(A | B\)
- P (A|| B) هو احتمال حدوث الحدث A نظرًا لأن الحدث B قد حدث بالفعل.
- التقاطع:\(\cap \) الحدث
- تكون النتيجة في الحدث | (A\ cap B\) إذا كانت النتيجة في كليهما\(A \cap B\) في نفس الوقت.
- الاتحاد:\(\cup\) الحدث
- تكون النتيجة في الحالة\(A \cup B\) إذا كانت النتيجة في A أو في B أو في كل من A و B.
- مخطط الشجرة
- التمثيل المرئي المفيد لمساحة العينة والأحداث في شكل «شجرة» بفروع تتميز بالنتائج المحتملة جنبًا إلى جنب مع الاحتمالات المرتبطة (الترددات والترددات النسبية)
- مخطط فين
- التمثيل المرئي لمساحة العينة والأحداث في شكل دوائر أو أشكال بيضاوية توضح تقاطعاتها
- دراسة استقصائية
- دراسة يتم فيها جمع البيانات كما أبلغ عنها الأفراد.
- أخذ العينات بشكل منهجي
- طريقة لاختيار عينة عشوائية؛ قائمة بأعضاء السكان. استخدم أخذ عينات عشوائية بسيطة لتحديد نقطة البداية في المجموعة السكانية. Let k = (عدد الأفراد في السكان)/(عدد الأفراد المطلوبين في العينة). اختر كل فرد kth في القائمة بدءًا من الشخص الذي تم اختياره عشوائيًا. إذا لزم الأمر، ارجع إلى بداية قائمة السكان لإكمال العينة.
- العلاجات
- قيم أو مكونات مختلفة للمتغير التوضيحي المطبق في التجربة
- متغير
- سمة من سمات الاهتمام لكل شخص أو كائن في مجموعة سكانية
- التردد
- عدد المرات التي تحدث فيها قيمة البيانات
- جدول التردد
- تمثيل البيانات الذي يتم فيه عرض البيانات المجمعة جنبًا إلى جنب مع الترددات المقابلة
- الرسم البياني
- تمثيل رسومي في شكل x - y لتوزيع البيانات في مجموعة بيانات؛ يمثل x البيانات ويمثل y التردد أو التردد النسبي. يتكون الرسم البياني من مستطيلات متجاورة.
- النطاق بين الربعي
- أو IQR، هو نطاق الخمسين بالمائة الوسطى من قيم البيانات؛ يتم العثور على IQR بطرح الربع الأول من الربع الثالث.
- المتوسط (الحساب)
- رقم يقيس الاتجاه المركزي للبيانات؛ الاسم الشائع للمتوسط هو «متوسط». مصطلح «المتوسط» هو شكل مختصر من «المتوسط الحسابي». بحكم التعريف، يكون متوسط العينة (المشار إليه بـ\(\overline{x}\)) هو\(\overline{x}=\frac{\text { Sum of all values in the sample }}{\text { Number of values in the sample }}\)، والمتوسط بالنسبة للسكان (يُشار إليه بـ μs) هو\(\boldsymbol{\mu}=\frac{\text { Sum of all values in the population }}{\text { Number of values in the population }}\)
- المتوسط (الهندسي)
- مقياس للنزعة المركزية يوفر مقياسًا لمتوسط النمو الهندسي على مدى فترات زمنية متعددة.
- الوسيط
- رقم يفصل البيانات المرتبة إلى نصفين؛ نصف القيم هي نفس الرقم أو أصغر من المتوسط ونصف القيم هي نفس الرقم أو أكبر من الوسيط. قد يكون الوسيط أو لا يكون جزءًا من البيانات.
- منتصف
- متوسط الفاصل الزمني في جدول التردد
- الوضع
- القيمة التي تظهر بشكل متكرر في مجموعة من البيانات
- القيم المتطرفة
- ملاحظة لا تناسب بقية البيانات
- المئوي
- رقم يقسم البيانات المرتبة إلى المئات؛ قد تكون النسب المئوية جزءًا من البيانات أو لا تكون. متوسط البيانات هو الربع الثاني والنسبة المئوية الخمسين. الربعان الأول والثالث هما المئويان 25 و 75 على التوالي.
- كوارتيلز
- الأرقام التي تفصل البيانات إلى أرباع؛ قد تكون الأرباع جزءًا من البيانات أو لا تكون. الربع الثاني هو متوسط البيانات.
- التردد النسبي
- نسبة عدد المرات التي تحدث فيها قيمة البيانات في مجموعة جميع النتائج إلى عدد جميع النتائج
- الإنحراف المعياري
- رقم يساوي الجذر التربيعي للتباين ويقيس مدى بُعد قيم البيانات عن متوسطها؛ الترميز: s للانحراف المعياري للعينة و للانحراف المعياري للسكان.
- التباين
- متوسط الانحرافات المربعة عن المتوسط، أو مربع الانحراف المعياري؛ بالنسبة لمجموعة من البيانات، يمكن تمثيل الانحراف بـ x -\(\overline{x}\) حيث x هي قيمة البيانات\(\overline{x}\) وهي متوسط العينة. تباين العينة يساوي مجموع مربعات الانحرافات مقسومًا على اختلاف حجم العينة وواحد.