ஈருறுப்புப் பரவல்

Probability mass function
ஈருறுப்புப் பரவலின் நிகழ்தகவு நிறைச் சார்பு
Cumulative distribution function
In நிகழ்தகவுக் கோட்பாடு and புள்ளியியல், the binomial distribution with parameters n and p is the நிகழ்தகவுப் பரவல் of the number of successes in a sequence of n independent experiments, each asking a yes–no question, and each with its own Boolean-valued outcome: success (with probability p) or failure (with probability '"`UNIQ--postMath-00000001-QINU`"'). A single success/failure experiment is also called a Bernoulli trial or Bernoulli experiment, and a sequence of outcomes is called a Bernoulli process; for a single trial, i.e., n = 1, the binomial distribution is a Bernoulli distribution. The binomial distribution is the basis for the popular binomial test of statistical significance.[1] for the binomial distribution
Colors match the image above
குறியீடு  : B(n, p)
பண்பளவைகள்: nN0 — முயற்சிகளின் எண்ணிக்கை
p ∈ [0,1] — வெற்றியின் நிகழ்தவு
தாங்கி: k ∈ { 0, …, n }
pmf:
cdf:
சராசரி: np
இடைநிலையளவு: np⌋ or ⌈np
முகடு: ⌊(n + 1)p⌋ or ⌊(n + 1)p⌋ − 1
variance: np(1 − p)
கோணல்:
தட்டையளவு:
சிதறம்(என்ட்ரோப்பி):
mgf:
cf:

நிகழ்தகவுக் கோட்பாடு, புள்ளியியல் இரண்டிலும் n, p பண்பளவைகளைக் கொண்ட ஈருறுப்பு பரவல் (binomial distribution) ஒரு தனிநிலை நிகழ்தகவுப் பரவலாகும். n - ஆனது சார்பற்ற, "வெற்றி" அல்லது "தோல்வி" என்ற இரு விளைவுகளை மட்டுமே கொண்ட, சார்பற்ற, தொடர்ச்சியான பெர்னௌலி முயற்சிகளின் எண்ணிக்கையையும், p ஆனது ஒவ்வொரு முயற்சியிலும் வெற்றியின் நிகழ்தகவையும் குறிக்கும் (தோல்வியின் நிகழ்தகவு ()). n = 1, எனில் ஈருறுப்புப் பரவல் பெர்னௌலியின் பரவல் எனப்படும். புள்ளியியல் பொருளுண்மையின் ஈருறுப்புச் சோதனைக்கு ஈருறுப்புப் பரவலே அடிப்படையானதாகும்[2] இந்தப் பரவல் கணிதவியலாளர் ஜேக்கப் பெர்னெளலியால் கண்டறியப்பட்டது. பெர்னௌலி p = r/(r + s) (p - வெற்றியின் நிகழ்தகவு; r , s இரண்டும் நேர்ம முழுஎண்கள்) எனவும் பிலைசு பாஸ்கல் p = 1/2 எனவும் எடுத்துக்கொண்டனர்.

எடுத்துக்காட்டுகள்

  • ஒரு சீரான பகடையை பத்து முறை உருட்டிவிட்டு, "ஆறு" எத்தனை முறை விழுகிறது என்பதை எண்ணிக்கொள்க. சமவாய்ப்புள்ள இந்த எண்ணின் பரவல், n = 10 மற்றும்p = 1/6 உள்ள ஒரு ஈருறுப்பு பரவலாகும்.
  • ஒரு நாணயத்தை மூன்று முறை சுண்டிவிட்டு எத்தனை முறை "தலை" விழுகிறது என எண்ணுதல். சமவாய்ப்புள்ள இந்த எண்ணின் பரவல், n = 3 மற்றும் p = 1/2 உள்ள ஒரு ஈருறுப்பு பரவலாகும்.

வரையறைகள்

நிகழ்தகவு நிறைச் சார்பு

சமவாய்ப்பு மாறி K இன் n மற்றும் p பண்பளவைகளைக் கொண்ட ஈருறுப்பு பரவலைப் பின்பற்றுகிறது என்பதைக் குறிக்கும் குறியீடு:

K ~ B(n , p)

ஈருறுப்புப் பரவலில், n சார்பற்ற முயற்சிகளில் சரியாக k வெற்றிகள் கிடைக்கும் நிகழ்தகவு பின்வரும் நிகழ்தகவு நிறைச் சார்பால் (நிகழ்தகவுப் பொருண்மச் சார்பு) தரப்படுகிறது:

k = 0, 1, 2, ..., n

இதிலுள்ள

என்பது ஈருறுப்புக் குணகமாதலால் இப்பரவல் ஈருறுப்புப் பரவலெனப்படுகிறது.

ஈருறுப்பு பரவல் நிகழ்தகவின் குறிப்பு அட்டவணைகளை தயாரிக்கும்போது, பொதுவாக அட்டவணை n /2 மதிப்புகள் வரை நிரப்பப்படுகிறது. ஏனெனில் k > n /2 ஆக இருக்கும்போது, நிகழ்தகவுகள் முன்னவற்றின் நிரப்பிகளாக இருக்கும்.

எடுத்துக்காட்டு

சுண்டப்பட்ட நாணயம் சமச்சீரானதாக இல்லமால், தலை விழுவதற்கான (வெற்றி) நிகழ்தகவு 0.3 எனில், 6 நாணயச் சுண்டல்களில் சரியாக 4 தலைகள் விழுவதற்கான நிகழ்தகவு:

குவிப் பரவல் சார்பு

குவிப் பரவல் சார்பு பின்வருமாறு வரையறுக்கப்படுகிறது:

என்பது x க்கு சமமான அல்லது குறைவான மிகப் பெரிய முழு எண்.

பண்புகள்

சராசரியும் பரவற்படியும்

X ~ B(n, p); அதாவது சமவாய்ப்பு மாறி X ஆனது, n முயற்சிகளையும் ஒவ்வொரு முயற்சியிலும் வெற்றியின் நிகழ்தகவு p ஆகவும் கொண்ட ஈருறுப்புப் பரவலைப் பின்பற்றுகிறது எனில்,
பரவலின் சாராசரியின் மதிப்பு (எதிர்பார்ப்பு மதிப்பு)
[3]

ஒவ்வொரு சமவாய்ப்பு மாறியும் p ஐ எதிர்பார்ப்பு மதிப்பாகக் கொண்ட, n முற்றொத்த பெர்னௌலியின் சமவாய்ப்பு மாறிகளின் கூட்டுத்தொகையாக சமவாய்ப்பு மாறி X இருக்கும். அதாவது, என்பவை முற்றொத்த, சாராத பெர்னௌலி சமவாய்ப்பு மாறிகள்; அவை ஒவ்வொன்றின் எதிர்பார்ப்பு மதிப்பும் p எனில்:

பரவற்படி

விலக்கப் பெருக்குத் தொகை

சமவாய்ப்பு மாறியின் விலக்கப் பெருக்குத்தொகைகள் இருவகைப்படும்.

  • ஆதியைப் பொறுத்த விலக்கப் பெருக்குத் தொகைகள்
  • சராசரியைப் பொறுத்த விலக்கப் பெருக்குத் தொகை அல்லது மைய விலக்கப் பெருக்குத்தொகைகள்

ஆதியைப் பொறுத்த முதல் இரு விலக்கப் பெருக்குத்தொகைகள்:

பொதுவான வரையறை:

[4][5]

இதில், இசுடர்லிங் உட்கண எண்கள்; என்பது இன் ஆவது வீழும் தொடர்பெருக்கம்.


மைய விலக்கப் பெருக்குத் தொகைகள்:

வரையறை
முதல் 6 மைய விலக்கப் பெருக்குத் தொகைகள்:

முகடு

B(n, p) என்ற ஈருறுப்புப் பரவலின் முகடு ஆகும். இதில் ஆனது மீப்பெரு முழுஎண் சார்பு.

  • (n + 1)p ஒரு முழுஎண்ணாகவும், p இன் மதிப்பு, 0 அல்லது 1 ஆகவும் இல்லாமல் இருந்தால் ஈருறுப்புப் பரவலுக்கு (n + 1)p, (n + 1)p − 1 என்ற இரு முகடுகள் இருக்கும்.
  • p இன் மதிப்பு 0 அல்லது 1 ஆக இருந்தால் முகடு முறையே 0 அல்லது n ஆக இருக்கும்.

இவற்றைப் பின்னுள்ளவாறு ஒன்றுபடுத்தி எழுதலாம்:

நிறுவல்
எனக் கொள்க.

வகை 1

அல்லது :
  • ஆக இருக்கும்போது மட்டுமே க்கு சுழியமற்ற மதிப்பாக ஆக இருக்கும்.
  • எனில் மற்றும் () எனக் கண்டுபிடிக்கலாம்.

மேற்கண்ட இரு முடிவுகளிலுமிருந்து

எனில் முகடு = 0; எனில் முகடு = 1 எனப் பெறப்படுகிறது.

வகை 2

எனில்:

. இதிலிருந்து பின்வரும் முடிவுகளைப் பெறலாம்:

எனவே ஒரு முழுஎண்ணாக இருந்தால், இரண்டும் முகடுகள். (முழுஎண் இல்லையெனில்) மட்டுமே முகடு.[6]

இடைநிலையளவு

பொதுவாக ஈருறுப்புப் பரவலின் இடைநிலையளவைக் காண்பதற்கான தனித்த வாய்பாடு எதுமில்லை. எனினும் இடைநிலையளவு குறித்து பல முடிவுகள் எட்டப்பட்டுள்ளன.

  • np ஒரு முழு எண் எனில் சராசரி, இடைநிலையளவு, முகடு ஆகிய மூன்றும் np க்குச் சமமாக இருக்கும்.[7][8]
  • இடைநிலையளவு m எனில், ⌊np⌋ ≤ m ≤ ⌈np⌉.[9]
  • இடைநிலையளவு m, சராசரியிலிருந்து அதிகத் தொலைவில் இருக்க முடியாது:
|mnp| ≤ min{ ln 2, max{p, 1 − p} }.[10]
  • |m − np| ≤ min{p, 1 − p} (p = 1/2 மற்றும் n ஒற்றையெண் என்ற நிலை தவிர) எனில், இடைநிலையளவு தனித்த மதிப்புடையது; m = முழுமை(np)[9]
  • p ஒரு விகிதமுறு எண் (p = 1/2 மற்றும் n ஒற்றையெண் என்ற நிலை தவிர) எனில் இடைநிலையளவு தனித்த மதிப்புடையது.[11]
  • p = 1/2 மற்றும் n ஒற்றையெண் எனில், 1/2(n − 1) ≤ m ≤ 1/2(n + 1) என்ற இடைவெளியிலமைந்த எந்தவொரு எண் m உம் இடைநிலையளவாக இருக்கும்.
  • p = 1/2 மற்றும் n இரட்டையெண் எனில், m = n/2 என்பது முகட்டின் தனித்த மதிப்பாகும்.

தொடர்புள்ள பிற பரவல்கள்

ஈருறுப்புப் பரவல்களின் கூட்டுத்தொகை

X ~ B(np), Y ~ B(mp) இரண்டும் சார்பற்ற ஆனால் சம நிகழ்தகவு p உடைய இரு ஈருறுப்புப் பரவல்கள் எனில், X + Y என்ற சமவாய்ப்பு மாறியும் அதே நிகழ்தகவுடன் ஈருறுப்புப் பரவலைப் பின்பற்றும்: Z=X+Y ~ B(n+mp):[12]

ஈருறுப்புப் பரவலைப் பின்பற்றும் X ~ B(np) என்ற சமவாய்ப்பு மாறியை, n பெர்னௌலி சமவாய்ப்பு மாறிகளின் கூடுதலாகக் கொள்ளமுடியும். X ~ B(np), Y ~ B(mp) என்ற சமவாய்ப்பு மாறிகளின் கூடுதல் n + m பெர்னௌலி சமவாய்ப்பு மாறிகளின் கூடுதலுக்குச் சமமாகும். அதாவது Z=X+Y ~ B(n+mp).

X , Y இரண்டும் ஒரே நிகழ்தகவைக் (p) கொண்டிருக்காவிட்டால், அவற்றின் கூட்டுத்தொகைப் பரவலின் பரவற்படியானது, இன் பரவற்படியைவிடச் சிறியதாக இருக்கும்.

பெர்னௌலி பரவல்

பெர்னௌலி பரவல் என்பது n = 1 என உள்ள ஈருறுப்பு பரவலின் சிறப்புத் தன்மை ஆகும். குறியீடாக, X ~ B(1, p) என எழுதப்படுகிறது

பாய்ஸான் பரவல்

ஈருறுப்பு பரவலின் எல்லையாகப் பாய்சான் பரவல் பெறப்படுகிறது. np பெருக்குத்தொகை நிலையாக இருந்து நிகழ்வுகளின் எண்ணிக்கை n முடிவிலியை நோக்கியும் ஒவ்வொரு முயற்சியின் வெற்றியின் நிகழ்தகவு p இன் மதிப்பு பூச்சியத்தை நோக்கியும் செல்லும்போது ஈருறுப்புப் பரவலின் எல்லையாகப் பாய்சான் பரவல் அமைகிறது.

மேற்குறிப்புகள்

  1. Westland, J. Christopher (2020). Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer. p. 53. பன்னாட்டுத் தரப்புத்தக எண் 978-3-030-49091-1.
  2. Westland, J. Christopher (2020). Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer. p. 53. பன்னாட்டுத் தரப்புத்தக எண் 978-3-030-49091-1.
  3. See Proof Wiki
  4. Knoblauch, Andreas (2008), "Closed-Form Expressions for the Moments of the Binomial Probability Distribution", SIAM Journal on Applied Mathematics, 69 (1): 197–204, எண்ணிம ஆவணச் சுட்டி:10.1137/070700024, JSTOR 40233780
  5. Nguyen, Duy (2021), "A probabilistic approach to the moments of binomial random variables and application", The American Statistician, 75 (1): 101–103, எண்ணிம ஆவணச் சுட்டி:10.1080/00031305.2019.1679257, S2CID 209923008
  6. See also Nicolas, André (January 7, 2019). "Finding mode in Binomial distribution". Stack Exchange.
  7. Neumann, P. (1966). "Über den Median der Binomial- and Poissonverteilung" (in de). Wissenschaftliche Zeitschrift der Technischen Universität Dresden 19: 29–33. 
  8. Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.
  9. 9.0 9.1 Kaas, R.; Buhrman, J.M. (1980). "Mean, Median and Mode in Binomial Distributions". Statistica Neerlandica 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x. 
  10. Hamza, K. (1995). "The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions". Statistics & Probability Letters 23: 21–25. doi:10.1016/0167-7152(94)00090-U. 
  11. Nowakowski, Sz. (2021). "Uniqueness of a Median of a Binomial Distribution with Rational Probability". Advances in Mathematics: Scientific Journal 10 (4): 1951–1958. doi:10.37418/amsj.10.4.9. பன்னாட்டுத் தர தொடர் எண்:1857-8365. 
  12. Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P.; Meester, L.E. (2005). A Modern Introduction of Probability and Statistics (1 ed.). Springer-Verlag London. பன்னாட்டுத் தரப்புத்தக எண் 978-1-84628-168-6.

புற இணைப்புகள்