Mlprogram 1

The document outlines a program to analyze the California Housing dataset by creating histograms and box plots for all numerical features to assess their distributions and identify outliers. It utilizes libraries such as pandas, seaborn, and matplotlib for data visualization and employs the IQR method to detect outliers. Additionally, it provides a summary of the dataset's statistics.

Uploaded by

Rana Manal

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

72 views3 pages

Mlprogram 1

Uploaded by

Rana Manal

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

ML Program1

1. Develop a program to create histograms for all numerical features and analyse the distribution
of each feature. Generate box plots for all numerical features and identify any outliers. Use
California Housing dataset.

import pandas as pd
import numpy as np
import seaborn as sns
import [Link] as plt
from [Link] import fetch_california_housing

# Step 1: Load the California Housing dataset

data = fetch_california_housing(as_frame=True)
housing_df = [Link]
# Step 2: Create histograms for numerical features
numerical_features = housing_df.select_dtypes(include=[[Link]]).columns
# Plot histograms
[Link](figsize=(15, 10))
for i, feature in enumerate(numerical_features):
[Link](3, 3, i + 1) # Correct indentation
[Link](housing_df[feature], kde=True, bins=30, color='blue')
[Link](f'Distribution of {feature}')
plt.tight_layout() # Properly place this outside the loop
[Link]()
# Step 3: Generate box plots for numerical features
# Plot box plots
[Link](figsize=(15, 10))
for i, feature in enumerate(numerical_features):
[Link](3, 3, i + 1)
[Link](x=housing_df[feature], color='orange')
[Link](f'Box Plot of {feature}')
plt.tight_layout()
[Link]()
# Step 4: Identify outliers using the IQR method
print("Outliers Detection:")
outliers_summary = {}
for feature in numerical_features:
Q1 = housing_df[feature].quantile(0.25)
Q3 = housing_df[feature].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
outliers = housing_df[(housing_df[feature] < lower_bound) | (housing_df[feature] >
upper_bound)]
outliers_summary[feature] = len(outliers)
print(f"{feature}: {len(outliers)} outliers")
# Optional: Print a summary of the dataset
print("\nDataset Summary:")
print(housing_df.describe())

output:

Lab Prog1
No ratings yet
Lab Prog1
2 pages
PrOGRAM1.Ipynb - Colab
No ratings yet
PrOGRAM1.Ipynb - Colab
2 pages
Prog 1
No ratings yet
Prog 1
3 pages
Program 01
No ratings yet
Program 01
1 page
California Housing Data Analysis EDA
No ratings yet
California Housing Data Analysis EDA
117 pages
ML Program No.1
No ratings yet
ML Program No.1
3 pages
ML Lab - Exp1-10
No ratings yet
ML Lab - Exp1-10
4 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
33 pages
PGM 1
No ratings yet
PGM 1
5 pages
Machine Learning Laboratory
No ratings yet
Machine Learning Laboratory
23 pages
Exp 1 A
No ratings yet
Exp 1 A
5 pages
For ML Lab Observation - Ex No 1-10
No ratings yet
For ML Lab Observation - Ex No 1-10
48 pages
ML Lab Program 1& 2
No ratings yet
ML Lab Program 1& 2
6 pages
Machine Learning Labnem
No ratings yet
Machine Learning Labnem
5 pages
ML Lab Manual
No ratings yet
ML Lab Manual
60 pages
ML Observation
No ratings yet
ML Observation
29 pages
Machine Learning (BCSL606) Lab Manual
No ratings yet
Machine Learning (BCSL606) Lab Manual
117 pages
ML - Datascience Manual
No ratings yet
ML - Datascience Manual
64 pages
Machine Learning All Lab Experiments VTU 6th Sem
No ratings yet
Machine Learning All Lab Experiments VTU 6th Sem
27 pages
California Housing Analysis Flashcards
No ratings yet
California Housing Analysis Flashcards
2 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Ass 1 ML
No ratings yet
Ass 1 ML
21 pages
ML Lab Manual
No ratings yet
ML Lab Manual
110 pages
Data Cleaning EDA
No ratings yet
Data Cleaning EDA
5 pages
ML Labmanual
No ratings yet
ML Labmanual
33 pages
ML Lab Mannual1
No ratings yet
ML Lab Mannual1
37 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
Auto MPG Dataset Analysis
No ratings yet
Auto MPG Dataset Analysis
25 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
ML 1st Program
No ratings yet
ML 1st Program
3 pages
Machine Learning (BCSL606) Lab Manual
No ratings yet
Machine Learning (BCSL606) Lab Manual
117 pages
Machine Learning Lab Manaul BCSL606
No ratings yet
Machine Learning Lab Manaul BCSL606
27 pages
ML Lab Manual
No ratings yet
ML Lab Manual
43 pages
ML Lab
No ratings yet
ML Lab
9 pages
ML 3
No ratings yet
ML 3
24 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
1 Program
No ratings yet
1 Program
20 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
ML Spy Programs
No ratings yet
ML Spy Programs
16 pages
Program 1
No ratings yet
Program 1
1 page
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
Updated 1,2,3, Programs
No ratings yet
Updated 1,2,3, Programs
3 pages
ML Lab Manual
No ratings yet
ML Lab Manual
36 pages
Linear Regression Analysis - Polynomial Regression
No ratings yet
Linear Regression Analysis - Polynomial Regression
25 pages
ML Manual
No ratings yet
ML Manual
30 pages
M PDF
No ratings yet
M PDF
13 pages
Data Visualization III: # Loading Libraries
No ratings yet
Data Visualization III: # Loading Libraries
12 pages
Titanic Shuffle Analysis in ML Lab
No ratings yet
Titanic Shuffle Analysis in ML Lab
24 pages
Regression Analysis - Lasso and Ridge Regularization
No ratings yet
Regression Analysis - Lasso and Ridge Regularization
17 pages
Lab Manual ML
No ratings yet
Lab Manual ML
26 pages
Experiment No 11
No ratings yet
Experiment No 11
19 pages
The Boston Housing Dataset
100% (2)
The Boston Housing Dataset
4 pages
Linear Reg
No ratings yet
Linear Reg
25 pages
ML Lab Manual Bcsl602
No ratings yet
ML Lab Manual Bcsl602
108 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
AAAAAAAAAAAAAAAAAAAAAAAAA
No ratings yet
AAAAAAAAAAAAAAAAAAAAAAAAA
41 pages
Neural Network Housing Price Prediction
No ratings yet
Neural Network Housing Price Prediction
30 pages
V
No ratings yet
V
8 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
64 pages
Mechanical Final
No ratings yet
Mechanical Final
69 pages
2022-23 First Year Syllabus
No ratings yet
2022-23 First Year Syllabus
218 pages
CFG Grammar Analysis
No ratings yet
CFG Grammar Analysis
2 pages
OS Security Notes
No ratings yet
OS Security Notes
2 pages
Devops Lab Manual
No ratings yet
Devops Lab Manual
96 pages
EVS Question Bank - 3 (With Ans)
No ratings yet
EVS Question Bank - 3 (With Ans)
33 pages
List of Open Elective Courses - VI Semester B.E. 2022 Scheme
No ratings yet
List of Open Elective Courses - VI Semester B.E. 2022 Scheme
85 pages
ECS 1st IA Q-Bank
No ratings yet
ECS 1st IA Q-Bank
2 pages
Patent Risks in Research Methodology
No ratings yet
Patent Risks in Research Methodology
2 pages
22PLC15B/25B: Python Basics Flow Control
No ratings yet
22PLC15B/25B: Python Basics Flow Control
5 pages
CS, Is - Vtu QP Aug - Sep 2022
No ratings yet
CS, Is - Vtu QP Aug - Sep 2022
97 pages
OS Qns
No ratings yet
OS Qns
6 pages
VTU Question Paper of 18CS45 Object Oriented Concepts Jan-2021
No ratings yet
VTU Question Paper of 18CS45 Object Oriented Concepts Jan-2021
2 pages
B.E. CS Math Exam Model Paper
No ratings yet
B.E. CS Math Exam Model Paper
5 pages

Mlprogram 1

Uploaded by

Mlprogram 1

Uploaded by

ML Program1

# Step 1: Load the California Housing dataset

You might also like