0% found this document useful (0 votes)

40 views7 pages

Probability Distributions in Data Science

Uploaded by

Om Bachhav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views7 pages

Probability Distributions in Data Science

Uploaded by

Om Bachhav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

4/22/24, 11:02 AM Practical 2

MGV's Loknete Vyankatrao Hiray Arts, Science

and Commerce College Nashik

Department of Mathematics

M. Sc. 1 Data Science

Practical 2 Probability Distributions of Discrete

Random Variables

a. Binomial Random Variable

1. Example. Given 10 trials for coin toss generate 10

data points:n - number of trials.p - probability of
occurence of each trial (e.g. for toss of a coin 0.5
each). size - The shape of the returned array
In [1]: from numpy import random
x = random.binomial(n=10, p=0.5, size=10)
print(x)

[3 3 3 6 3 3 5 6 7 6]

In [5]: # Visualization of Binomial Distribution

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist= True)
plt.show()

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 1/7

4/22/24, 11:02 AM Practical 2

2. Example Consider a random experiment of tossing a

biased coin 6 times where the probability of getting a
head is 0.6. If ‘getting a head’ is considered as
‘success’ then, the binomial distribution table will
contain the probability of x successes for each
possible value of x.
In [6]: from scipy.stats import binom
# setting the values
# of n and p
n = 6
p = 0.6
# defining the list of r values
r_values = list(range(n + 1))
# obtaining the mean and variance
mean, var = binom.stats(n, p)
# list of pmf values
dist = [binom.pmf(r, n, p) for r in r_values ]
# printing the table
print("r\tp(r)")
for i in range(n + 1):
print(str(r_values[i]) + "\t" + str(dist[i]))
# printing mean and variance
print("mean = "+str(mean))
print("variance = "+str(var))

r p(r)
0 0.0040960000000000015
1 0.03686400000000002
2 0.1382400000000001
3 0.2764800000000001
4 0.3110400000000001
5 0.1866240000000001
6 0.04665599999999999
mean = 3.5999999999999996
variance = 1.44

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 2/7

4/22/24, 11:02 AM Practical 2

In [7]: from scipy.stats import binom

import matplotlib.pyplot as plt
# setting the values
# of n and p
n = 6
p = 0.6
# defining list of r values
r_values = list(range(n + 1))
# list of pmf values
dist = [binom.pmf(r, n, p) for r in r_values ]
# plotting the graph
plt.bar(r_values, dist)
plt.show()

b. Poisson Random Variable

1. Example If someone eats twice a day what is the

probability he will eat thrice? It has two parameters:
lam - rate or known number of occurrences e.g. 2 for
above problem. size - The shape of the returned
array.Generate a random 1x10 distribution for
occurrence 2
In [8]: from numpy import random
x = random.poisson(lam=2, size=10)
print(x)

[4 2 1 0 2 2 2 1 4 1]

In [10]: # Visualization of Poisson Distribution

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 3/7

4/22/24, 11:02 AM Practical 2

In [11]: sns.distplot(random.poisson(lam=2, size=1000), kde=False)

plt.show()

2. Example of frequencies of hurricanes. Assume that

when we have data on observing hurricanes over a
period of 20 years. We find that the average number of
hurricanes per year is 7 ¶
In [1]: import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson
k = np.arange(0, 21)
print(k)

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20]

In [16]: # Poisson PMF (Probability mass function)

In [2]: pmf = poisson.pmf(k, mu=7)

pmf = np.round(pmf, 5)
print(pmf)

[9.1000e-04 6.3800e-03 2.2340e-02 5.2130e-02 9.1230e-02 1.2772e-01

1.4900e-01 1.4900e-01 1.3038e-01 1.0140e-01 7.0980e-02 4.5170e-02
2.6350e-02 1.4190e-02 7.0900e-03 3.3100e-03 1.4500e-03 6.0000e-04
2.3000e-04 9.0000e-05 3.0000e-05]

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 4/7

4/22/24, 11:02 AM Practical 2

In [3]: for val, prob in zip(k,pmf):

print(f"k-value {val} has probability = {prob}")

k-value 0 has probability = 0.00091

k-value 1 has probability = 0.00638
k-value 2 has probability = 0.02234
k-value 3 has probability = 0.05213
k-value 4 has probability = 0.09123
k-value 5 has probability = 0.12772
k-value 6 has probability = 0.149
k-value 7 has probability = 0.149
k-value 8 has probability = 0.13038
k-value 9 has probability = 0.1014
k-value 10 has probability = 0.07098
k-value 11 has probability = 0.04517
k-value 12 has probability = 0.02635
k-value 13 has probability = 0.01419
k-value 14 has probability = 0.00709
k-value 15 has probability = 0.00331
k-value 16 has probability = 0.00145
k-value 17 has probability = 0.0006
k-value 18 has probability = 0.00023
k-value 19 has probability = 9e-05
k-value 20 has probability = 3e-05

In [15]: plt.plot(k, pmf, marker='o')

plt.xlabel('k')
plt.ylabel('Probability')
plt.show()

In [17]: # Poisson CDF (Cumulative Distribution function)

In [4]: cdf = poisson.cdf(k, mu=7)

cdf = np.round(cdf, 3)
print(cdf)

[0.001 0.007 0.03 0.082 0.173 0.301 0.45 0.599 0.729 0.83 0.901 0.947
0.973 0.987 0.994 0.998 0.999 1. 1. 1. 1. ]

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 5/7

4/22/24, 11:02 AM Practical 2

In [19]: for val, prob in zip(k,cdf):

print(f"k-value {val} has probability = {prob}")

k-value 0 has probability = 0.001

k-value 1 has probability = 0.007
k-value 2 has probability = 0.03
k-value 3 has probability = 0.082
k-value 4 has probability = 0.173
k-value 5 has probability = 0.301
k-value 6 has probability = 0.45
k-value 7 has probability = 0.599
k-value 8 has probability = 0.729
k-value 9 has probability = 0.83
k-value 10 has probability = 0.901
k-value 11 has probability = 0.947
k-value 12 has probability = 0.973
k-value 13 has probability = 0.987
k-value 14 has probability = 0.994
k-value 15 has probability = 0.998
k-value 16 has probability = 0.999

In [20]: plt.plot(k, cdf, marker='o')

plt.xlabel('k')
plt.ylabel('Cumulative Probability')
plt.show()

c. Hypergeometric Random Variable

1. Example Aces in a Five-Card Poker Hand. The

number of aces in a five-card poker hand has the
hypergeometric distribution with population size 52,
four good elements in the population, and a simple
random sample size of 5
In [22]: import scipy.stats as stats

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 6/7

4/22/24, 11:02 AM Practical 2

In [23]: k = np.arange(5)
N = 52 # population size
G = 4 # number of good elements in population
n = 5 # simple random sample size
stats.hypergeom.pmf(k, N, G, n)

Out[23]: array([6.58841998e-01, 2.99473636e-01, 3.99298181e-02, 1.73607905e-03,

1.84689260e-05])

In [25]: a = np.round(stats.hypergeom.pmf(k, N, G, n), 3)

In [27]: a

Out[27]: array([0.659, 0.299, 0.04 , 0.002, 0. ])

In [26]: plt.plot(k, a, marker='o')

plt.show()

In [ ]:

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 7/7

Exp 4 Statistical Data Analysis With Python SDK Ok
No ratings yet
Exp 4 Statistical Data Analysis With Python SDK Ok
18 pages
DS4 1
No ratings yet
DS4 1
5 pages
PDF Sampling and Statistics Workshop
No ratings yet
PDF Sampling and Statistics Workshop
10 pages
Python Data Visualization Techniques
No ratings yet
Python Data Visualization Techniques
32 pages
Python Coin Flip Probability Guide
No ratings yet
Python Coin Flip Probability Guide
44 pages
Python Factorial Methods Explained
No ratings yet
Python Factorial Methods Explained
32 pages
Maths Assignment
No ratings yet
Maths Assignment
8 pages
Coin Flipping and Probability in Python
No ratings yet
Coin Flipping and Probability in Python
44 pages
Statistics Probability Reviewer 3rd Quarter 240322 111901
No ratings yet
Statistics Probability Reviewer 3rd Quarter 240322 111901
8 pages
Probability Distributions
No ratings yet
Probability Distributions
9 pages
Computational Methods in Materials Science
No ratings yet
Computational Methods in Materials Science
24 pages
C Programming: Statistical Functions
No ratings yet
C Programming: Statistical Functions
37 pages
Conditional PMF and Random Variables Guide
No ratings yet
Conditional PMF and Random Variables Guide
18 pages
Probability Distributions and MLE Analysis
No ratings yet
Probability Distributions and MLE Analysis
11 pages
Introduction To Random Processes Project 2: Problem 1
No ratings yet
Introduction To Random Processes Project 2: Problem 1
15 pages
5 Random Variables
No ratings yet
5 Random Variables
116 pages
Discrete Probability Distributions Explained
No ratings yet
Discrete Probability Distributions Explained
44 pages
Probability Distributions in R Explained
No ratings yet
Probability Distributions in R Explained
42 pages
Probability Distributions in Modeling
No ratings yet
Probability Distributions in Modeling
9 pages
Discrete Random Variable Analysis
No ratings yet
Discrete Random Variable Analysis
128 pages
Chapter 2 - Lec 3-4
No ratings yet
Chapter 2 - Lec 3-4
57 pages
Bernoulli and Binomial Distributions Explained
No ratings yet
Bernoulli and Binomial Distributions Explained
36 pages
Distributions
No ratings yet
Distributions
43 pages
Discrete Distributions Guide
No ratings yet
Discrete Distributions Guide
27 pages
Probability Theory Practical Exercises
No ratings yet
Probability Theory Practical Exercises
6 pages
Chapter 0 Introduction
No ratings yet
Chapter 0 Introduction
14 pages
Discrete Probability Distributions Explained
No ratings yet
Discrete Probability Distributions Explained
20 pages
Projectpdf
No ratings yet
Projectpdf
12 pages
Understanding Populations and Samples
No ratings yet
Understanding Populations and Samples
9 pages
Understanding Discrete Random Variables
No ratings yet
Understanding Discrete Random Variables
28 pages
Review Statistics
No ratings yet
Review Statistics
24 pages
Probability & Statistics Solutions
No ratings yet
Probability & Statistics Solutions
56 pages
R Programming 1
No ratings yet
R Programming 1
21 pages
Chapter 2
No ratings yet
Chapter 2
40 pages
TUT3
No ratings yet
TUT3
4 pages
Sta 2110 Lectures Notes
No ratings yet
Sta 2110 Lectures Notes
21 pages
Understanding Random Variables and Distributions
No ratings yet
Understanding Random Variables and Distributions
9 pages
Week 3 - Discrete & Continuous R.V
No ratings yet
Week 3 - Discrete & Continuous R.V
30 pages
Important PMFs and PDFs
No ratings yet
Important PMFs and PDFs
7 pages
MATLAB Functions for Probability Analysis
No ratings yet
MATLAB Functions for Probability Analysis
22 pages
Sem-6 Statistical-Analysis 26089
No ratings yet
Sem-6 Statistical-Analysis 26089
11 pages
Random Variables and Distributions in R
No ratings yet
Random Variables and Distributions in R
31 pages
Binomial Distribution in R Analysis
No ratings yet
Binomial Distribution in R Analysis
4 pages
Python Statistical Modeling Lab
No ratings yet
Python Statistical Modeling Lab
33 pages
Fitting Binomial and Poisson Distributions
100% (1)
Fitting Binomial and Poisson Distributions
13 pages
7probability Distributions (Binomial, Poisson and Normal)
No ratings yet
7probability Distributions (Binomial, Poisson and Normal)
33 pages
Scilab Programming for Probability & Statistics
No ratings yet
Scilab Programming for Probability & Statistics
30 pages
Understanding Probability Concepts and Calculations
No ratings yet
Understanding Probability Concepts and Calculations
6 pages
Central Tendency & Dispersion in Python
No ratings yet
Central Tendency & Dispersion in Python
7 pages
Expected Value of Discrete Random Variables
No ratings yet
Expected Value of Discrete Random Variables
22 pages
EE230 Homework 2: Probability Problems
No ratings yet
EE230 Homework 2: Probability Problems
2 pages
Sem 6 Notes Maths
No ratings yet
Sem 6 Notes Maths
7 pages
Water Resources Engineering Notes
No ratings yet
Water Resources Engineering Notes
7 pages
Juan Miguel Severo's Inspiring Poetry
100% (1)
Juan Miguel Severo's Inspiring Poetry
8 pages
ITEC 3210-C: Applied Data Communications & Networks (Fall 2022) (Coordinated With ITEC 3210-A and ITEC 3210-B)
No ratings yet
ITEC 3210-C: Applied Data Communications & Networks (Fall 2022) (Coordinated With ITEC 3210-A and ITEC 3210-B)
4 pages
Begae 182
No ratings yet
Begae 182
2 pages
SCADA-Data-Based Static Yaw Misalignment
No ratings yet
SCADA-Data-Based Static Yaw Misalignment
3 pages
E PMP Force 190: Features
No ratings yet
E PMP Force 190: Features
3 pages
Case Analysis Pilgrim Bank
No ratings yet
Case Analysis Pilgrim Bank
3 pages
Specification Perimeter
100% (3)
Specification Perimeter
2 pages
Spellbound (Sample)
No ratings yet
Spellbound (Sample)
20 pages
Millionare Secret
50% (2)
Millionare Secret
83 pages
The Essential Guide To Aiops
No ratings yet
The Essential Guide To Aiops
14 pages
Ruby Hub V2.00 Free Dirt
No ratings yet
Ruby Hub V2.00 Free Dirt
522 pages
Nike Sustainability Report
No ratings yet
Nike Sustainability Report
3 pages
Mobile Wireless Propagation Models Report
No ratings yet
Mobile Wireless Propagation Models Report
17 pages
FW Online Version With Inner
75% (4)
FW Online Version With Inner
30 pages
8 Gbps LVDS Transmitter Design Thesis
No ratings yet
8 Gbps LVDS Transmitter Design Thesis
75 pages
Internet Leased Line RFP for IIA
No ratings yet
Internet Leased Line RFP for IIA
5 pages
A2 UNIT 4 Test Answer Key Higher
No ratings yet
A2 UNIT 4 Test Answer Key Higher
2 pages
Airtorque Installation Operation Maintenance Manual
No ratings yet
Airtorque Installation Operation Maintenance Manual
12 pages
Chapter 1-3 Group3
No ratings yet
Chapter 1-3 Group3
18 pages
Resource - Hideous Things, Not Mentioned in Print
100% (2)
Resource - Hideous Things, Not Mentioned in Print
6 pages
COVID-19 Vaccination Certificate India
No ratings yet
COVID-19 Vaccination Certificate India
1 page
Reply To Obs No 09
No ratings yet
Reply To Obs No 09
4 pages
Approaches: Artificial
No ratings yet
Approaches: Artificial
25 pages
Brosur & Spesifikasi DP-3R + In-Da 10 HP (2019-2022)
No ratings yet
Brosur & Spesifikasi DP-3R + In-Da 10 HP (2019-2022)
2 pages
Synthesis Properties Characterization Techniques and Applications 1st Edition Rajendra Kumar Goyal
100% (1)
Synthesis Properties Characterization Techniques and Applications 1st Edition Rajendra Kumar Goyal
307 pages
Photoshop Tools Guide for Beginners
No ratings yet
Photoshop Tools Guide for Beginners
7 pages
Zeroth Review Mental Health
No ratings yet
Zeroth Review Mental Health
15 pages
Apparel Costing for Denim Jeans
100% (2)
Apparel Costing for Denim Jeans
30 pages
Heavy Metals' Impact on Plant Growth
No ratings yet
Heavy Metals' Impact on Plant Growth
12 pages

Probability Distributions in Data Science

Uploaded by

Probability Distributions in Data Science

Uploaded by

4/22/24, 11:02 AM Practical 2

MGV's Loknete Vyankatrao Hiray Arts, Science

M. Sc. 1 Data Science

Practical 2 Probability Distributions of Discrete

a. Binomial Random Variable

1. Example. Given 10 trials for coin toss generate 10

In [5]: # Visualization of Binomial Distribution

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 1/7

2. Example Consider a random experiment of tossing a

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 2/7

In [7]: from scipy.stats import binom

b. Poisson Random Variable

1. Example If someone eats twice a day what is the

In [10]: # Visualization of Poisson Distribution

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 3/7

In [11]: sns.distplot(random.poisson(lam=2, size=1000), kde=False)

2. Example of frequencies of hurricanes. Assume that

In [16]: # Poisson PMF (Probability mass function)

In [2]: pmf = poisson.pmf(k, mu=7)

[9.1000e-04 6.3800e-03 2.2340e-02 5.2130e-02 9.1230e-02 1.2772e-01

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 4/7

In [3]: for val, prob in zip(k,pmf):

k-value 0 has probability = 0.00091

In [15]: plt.plot(k, pmf, marker='o')

In [17]: # Poisson CDF (Cumulative Distribution function)

In [4]: cdf = poisson.cdf(k, mu=7)

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 5/7

In [19]: for val, prob in zip(k,cdf):

k-value 0 has probability = 0.001

In [20]: plt.plot(k, cdf, marker='o')

c. Hypergeometric Random Variable

1. Example Aces in a Five-Card Poker Hand. The

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 6/7

Out[23]: array([6.58841998e-01, 2.99473636e-01, 3.99298181e-02, 1.73607905e-03,

In [25]: a = np.round(stats.hypergeom.pmf(k, N, G, n), 3)

Out[27]: array([0.659, 0.299, 0.04 , 0.002, 0. ])

In [26]: plt.plot(k, a, marker='o')

localhost:8888/notebooks/Desktop/LVH Academic/Data Science/practical exercis/Practical 2.ipynb 7/7

You might also like