טבלת שכיחות
טבלת שכיחויות היא טבלה שמציגה את השכיחויות של התוצאות השונות במדגם[1].
כל רשומה בטבלה מכילה את השכיחות או המנייה של הופעתם של ערכים בתוך קבוצה או מרווח מסוימים. בדרך זו הטבלה מסכמת את ההתפלגות של הערכים במדגם.
טבלת שכיחויות של משתנה יחיד
דוגמה של טבלת שכיחויות עבור משתנה יחיד. טבלה זו מציגה את השכיחות של כל תגובה לשאלות של סקר.
דירוג | מידת ההסכמה | מספר |
---|---|---|
1 | מסכים במידה רבה | 20 |
2 | מסכים | 30 |
3 | לא בטוח | 20 |
4 | לא מסכים | 15 |
5 | מתנגד | 15 |
דרך נוספת להציג את הנתונים בטבלה היא ארגון הערכים של המשתנה לתת קבוצות כך שכל אחת מהן תתייחס לטווח של ערכים. למשל, ניתן להציג את הגובה של תלמידים בכיתה בדרך זו
טווח גובה | מספר התלמידים | מספר מצטבר |
---|---|---|
עד 150 ס"מ | 25 | 25 |
151 - 160 ס"מ | 35 | 60 |
161 - 170 ס"מ | 20 | 80 |
171 - 180 ס"מ | 20 | 100 |
טבלת השכיחויות מציגה את הסיכום של מידע המקובץ למחלקות שונות יחד עם מספר המקרים בכל מחלקה. זוהי דרך להציג מידע לא מאורגן כמו תוצאות של בחירות, הכנסה של אנשים מאזור מסוים, מכירות של מוצר בחודש נתון ועוד.
דרך נוספת להצגת הערכים הכלולים בכל מחלקה היא שימוש בסימנים המתמטיים המייצגים קטע פתוח וסגור. למשל:
- (נקרא "קטע פתוח")
- (נקרא "קטע סגור")
בנייה של טבלת שכיחויות
שלבים לבנייה של טבלת שכיחויות
- החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: או כאשר n הוא מספר התצפיות הכולל במדגם.
- חישוב הטווח של הנתונים - הטווח מחושב על ידי ההפרש בין הערך המקסימלי למינימלי (Range = Max – Min). הטווח ישמש לקביעת גודל המחלקות.
- קביעת גודל המחלקות על ידי הנוסחה - .
באופן כללי הגודל של המחלקות צריך להיות אחיד, כאשר מכלול המחלקות צריך לתת ביטוי לכל הטווח. בעוד שישנה העדפה למחלקות אחידות בגודלן, ישנם מקרים בהם יהיה צורך למחלקות בעלות גודל שונה. למשל כדי להימנע מתאים ריקים או כמעט ריקים.
- קביעת גבולות המחלקות ובחירת נקודת התחלה מתאימה של המחלקה הראשונה שהיא שרירותית, הוא עשויה להיות קטנה או שווה לערך המינימלי. בדרך כלל היא תתחיל לפני הערך המינימלי באופן כזה שנקודת האמצע (הממוצע של הגבולות הנמוכים והגבוהים של המחלקה הראשונה) ממוקמת כראוי.
- סימון של קו אנכי (|) עבור כל תצפית במקום המתאים בטבלה.
- מציאת התדירויות הנדרשות.
תצוגה גרפית של טבלת שכיחויות
חלק מהגרפים שבהם ניתן לעשות שימוש באמצעות טבלת השכיחויות הם:
- דיאגרמת עוגה - גרף המראה את היחס בין החלקים לבין השלם ובינם לבין עצמם, כלומר את התפלגות השלם לחלקים היחסיים.
- גרף עמודות - צורת הצגה גרפית של נתונים מספריים.
- היסטוגרמה - נתונים בהיסטוגרמה מוצגים כמלבנים המייצגים מחלקות שונות (הקרויות גם קטגוריות), שאין ביניהן חפיפה, באוכלוסיית הנתונים לפי שכיחותן היחסית.
טבלת שכיחויות משותפת
טבלת שכיחות משותפת לשני משתנים מוצגת כטבלת אפשרויות (Contingency table) דו כיוונית
ריקוד | ספורט | טלוויזיה | סה"כ | |
---|---|---|---|---|
גברים | 2 | 10 | 8 | 20 |
נשים | 16 | 6 | 8 | 30 |
סה"כ | 18 | 16 | 16 | 50 |
טור הסכום ושורת הסכום מייצגים את התדירויות השוליות (marginal frequencies or marginal distribution) בעוד שגוף הטבלה מציג את התדירויות המשולבות[2].
יישומים
ניהול ועיבוד של מידע בטבלת שכיחויות פשוט יותר מהעבודה עם מידע גולמי. ישנם אלגוריתמים פשוטים לחישוב של ממוצע, חציון וסטיית תקן מטבלאות אלו.
בדיקת השערות מתבססת על הבדלים ונקודות דמיון בין טבלאות שכיחויות. הערכה זו מתבססת על מדידה של נטייה מרכזית או ממוצע ומדידה של שונות כמו סטיית תקן.
טבלת השכיחויות נחשבת למצודדת כאשר קיים הפרש בין החציון ולבין הממוצע שלה.
הגבנוניות של הטבלה מתייחסת למידת הריכוז של הנתונים סביב הממוצע, או על פי השיא של התצוגה הגרפית שלה.
קישורים חיצוניים
- טבלת שכיחות, באתר אנציקלופדיה בריטניקה (באנגלית)
- טבלת שכיחות, באתר MathWorld (באנגלית)
- Learn 7 ways to make frequency distribution table in Excel
- בניית טבלת שכיחויות - סרטון הסבר
- תיאור נתונים באמצעות טבלת שכיחויות
- טבלת שכיחויות
הערות שוליים
- ^ Australian Bureau of Statistics
- ^ Stat Trek, Statistics and Probability Glossary, s.v. Joint frequency