0% found this document useful (0 votes)

29 views4 pages

Machine Learning Classifiers for Diabetes Prediction

asdasdadas

Uploaded by

zohaibsoomro100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

29 views4 pages

Machine Learning Classifiers for Diabetes Prediction

asdasdadas

Uploaded by

zohaibsoomro100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

DEPARTMENT: ____Computer

Science________________________________________________
Session: Sprint-2024 Course Instructor: ___Shoukat
Ali____________________
Subject: __Machine Learning__ Course Code: __________ Max. Marks:
___5__
Class/Sec.: 8-C Submission Date: 06/15/24 Time Duration: () From: ____ to ______

Student Name: Muhammad Zohaib_ ID: _CSC-20F-132_

Assignment 02
Apply following machine learning classifier/algorithm on PIMA Indian diabetic database to predict whether
patients in datasets have diabetes or not.

Moreover, perform a comparative study of the mentioned algorithm.

1. Logistics regression
2. Decision tree
3. Random forest
4. Naive Byes
5. KNN
6. SVM

import pandas as pd

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression

from [Link] import DecisionTreeClassifier

from [Link] import RandomForestClassifier

from sklearn.naive_bayes import GaussianNB

from [Link] import KNeighborsClassifier

from [Link] import SVC

from [Link] import accuracy_score, classification_report

from [Link] import StandardScaler, RobustScaler

from [Link] import Pipeline

# Load the dataset

data = pd.read_csv('[Link]')

X = [Link]('Outcome', axis=1)

y = data['Outcome']

# Split data

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

# Define pipelines for each model

pipelines = {

'Logistic Regression': Pipeline([('scaler', RobustScaler()),('logreg',

LogisticRegression(max_iter=1000, solver='liblinear'))]),

'Decision Tree': Pipeline([('scaler', StandardScaler()),('tree',

DecisionTreeClassifier())]),

'Random Forest': Pipeline([('scaler', StandardScaler()),('forest',

RandomForestClassifier())]),

'Naive Bayes': Pipeline([('scaler', StandardScaler()),('nb',

GaussianNB())]),

'KNN': Pipeline([('scaler', StandardScaler()),('knn',

KNeighborsClassifier())]),

'SVM': Pipeline([('scaler', StandardScaler()),('svm', SVC())])

# Train and evaluate models

for name, pipeline in [Link]():

[Link](X_train, y_train)

y_pred = [Link](X_test)

print(f'\n{name}:')

print(f'Accuracy: {accuracy_score(y_test, y_pred):.4f}') # Format

accuracy to 4 decimal places

print('Classification Report:\n', classification_report(y_test,

y_pred))

Study:

Support
Characteristi Logistic Decision Random K-Nearest Vector
c Regression Tree Forest Naive Bayes Neighbors Machine
Simple,
interpretable, Powerful,
handles accurate, less Non-
linearly Interpretable, prone to parametric, Effective in
separable visualizes overfitting, simple, can high-
data, efficient decision handles non- learn complex dimensional
with large rules, handles linear Simple, fast, decision spaces,
datasets, non-linear relationships, handles high- boundaries, flexible kernel
benefits from relationships, works well dimensional works well choice, works
feature useful for with data, good for with well with
Winning scaling/outlier feature standardized categorical standardized standardized
Qualities handling selection features features features features
Computationa
lly expensive Sensitive to
Assumes Prone to for large hyperparamet
linear overfitting, Assumes datasets, ers, less
relationships, sensitive to feature requires interpretable,
less accurate small data Less independenc careful tuning computationall
with complex changes, may interpretable, e, sensitive to of k, sensitive y demanding
Areas for decision not generalize computational data to irrelevant with large
Improvement boundaries well ly demanding distribution features datasets
Performance
on Pima
Indians 75-80% 70-75% 75-82% 70-75% 72-78% 75-82%
_____________________________________________________________________________________
BEST OF LUCK

Compare Machine Learning Algorithms
No ratings yet
Compare Machine Learning Algorithms
5 pages
Heart Disease Prediction with ML Models
No ratings yet
Heart Disease Prediction with ML Models
16 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
Decision Tree Classifier in Python
No ratings yet
Decision Tree Classifier in Python
25 pages
Naïve Bayes and Random Forest Implementation
No ratings yet
Naïve Bayes and Random Forest Implementation
32 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
20 pages
Meds Can
No ratings yet
Meds Can
34 pages
Basic ML Algo
No ratings yet
Basic ML Algo
10 pages
DM Final
No ratings yet
DM Final
79 pages
Heart Disease Prediction with UCI ML Data
No ratings yet
Heart Disease Prediction with UCI ML Data
19 pages
Machine Learning Lab with Python
No ratings yet
Machine Learning Lab with Python
22 pages
ML File
No ratings yet
ML File
7 pages
Naive Bayes
No ratings yet
Naive Bayes
5 pages
Diabetes Prediction Model Comparison
No ratings yet
Diabetes Prediction Model Comparison
8 pages
Breast Cancer Classification Analysis
No ratings yet
Breast Cancer Classification Analysis
8 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Logistic Regression Analysis in Python
No ratings yet
Logistic Regression Analysis in Python
17 pages
ML Practicals
No ratings yet
ML Practicals
21 pages
Machine Learning Lab Manual for B.Tech
No ratings yet
Machine Learning Lab Manual for B.Tech
19 pages
Python Machine Learning Data Preparation
No ratings yet
Python Machine Learning Data Preparation
21 pages
Logistic Regression and Classifier Models
No ratings yet
Logistic Regression and Classifier Models
4 pages
Machine Learning Classification Techniques
No ratings yet
Machine Learning Classification Techniques
22 pages
Machine Learning Practical Exercises
No ratings yet
Machine Learning Practical Exercises
34 pages
AI Code Generation for Developers
No ratings yet
AI Code Generation for Developers
12 pages
Heart Disease Classification with ML
No ratings yet
Heart Disease Classification with ML
10 pages
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
No ratings yet
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
24 pages
ML Cheatsheet
No ratings yet
ML Cheatsheet
4 pages
Machine Learning Algorithm Guide
No ratings yet
Machine Learning Algorithm Guide
4 pages
Naïve Bayes & Decision Tree Classifiers
No ratings yet
Naïve Bayes & Decision Tree Classifiers
4 pages
Naïve Bayes & Decision Tree Classifiers
No ratings yet
Naïve Bayes & Decision Tree Classifiers
4 pages
Disease Prediction with Machine Learning
No ratings yet
Disease Prediction with Machine Learning
573 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
Stroke Prediction with Machine Learning
No ratings yet
Stroke Prediction with Machine Learning
5 pages
Decision Tree Analysis on Diabetes Data
No ratings yet
Decision Tree Analysis on Diabetes Data
8 pages
Earthquake Prediction Using Machine Learning
No ratings yet
Earthquake Prediction Using Machine Learning
21 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Machine Learning Classifiers Comparison
No ratings yet
Machine Learning Classifiers Comparison
9 pages
Machine Learning Course Lab Guide
No ratings yet
Machine Learning Course Lab Guide
9 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
AIML Project
No ratings yet
AIML Project
4 pages
ML Lab 146
No ratings yet
ML Lab 146
50 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
AAM PR QB
No ratings yet
AAM PR QB
13 pages
Exp 3 121a1047 Lavanya Kurup ML
No ratings yet
Exp 3 121a1047 Lavanya Kurup ML
4 pages
Liver Patient Analysis with Machine Learning
No ratings yet
Liver Patient Analysis with Machine Learning
12 pages
ML Lab-1
No ratings yet
ML Lab-1
32 pages
ML Surya
No ratings yet
ML Surya
19 pages
Enthought Python Machine Learning SciKit Learn Cheat Sheets 1 3 v1.0
No ratings yet
Enthought Python Machine Learning SciKit Learn Cheat Sheets 1 3 v1.0
3 pages
P 7
No ratings yet
P 7
5 pages
PyCaret Machine Learning Setup Guide
No ratings yet
PyCaret Machine Learning Setup Guide
12 pages
Ds Assign 33
No ratings yet
Ds Assign 33
7 pages
Machine Learning Practical Journal 2023
No ratings yet
Machine Learning Practical Journal 2023
25 pages
Data Mining Decision Tree Analysis
No ratings yet
Data Mining Decision Tree Analysis
7 pages
Decision Trees for Data Scientists
No ratings yet
Decision Trees for Data Scientists
28 pages
Machine Learning Cheat Sheet
No ratings yet
Machine Learning Cheat Sheet
15 pages
Decision Tree Classifier on Diabetes Data
No ratings yet
Decision Tree Classifier on Diabetes Data
2 pages
Back Injury Classification in Hospitals
No ratings yet
Back Injury Classification in Hospitals
12 pages
Naïve Bayes Classifier Implementation
No ratings yet
Naïve Bayes Classifier Implementation
8 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Column Strengthening Method Statement
No ratings yet
Column Strengthening Method Statement
3 pages
Grade 9 TLE: Hand Tools Safety & Maintenance
No ratings yet
Grade 9 TLE: Hand Tools Safety & Maintenance
15 pages
Individual Questionnaire for PCF Applications
No ratings yet
Individual Questionnaire for PCF Applications
41 pages
Understanding Marcotting Techniques
No ratings yet
Understanding Marcotting Techniques
4 pages
MRL Elevator PCB: Index
No ratings yet
MRL Elevator PCB: Index
47 pages
Planning and Organizing Technical Activities Draft
No ratings yet
Planning and Organizing Technical Activities Draft
29 pages
Lecture 2 - Digital Marketing - Semester 1
No ratings yet
Lecture 2 - Digital Marketing - Semester 1
29 pages
Altor Smart Helmet: Innovation in Cycling Safety
No ratings yet
Altor Smart Helmet: Innovation in Cycling Safety
35 pages
Antiarrhythmics With Answer
No ratings yet
Antiarrhythmics With Answer
8 pages
Reproductive System of Fish
No ratings yet
Reproductive System of Fish
23 pages
Spesifikasi - Hamilton-G5 With PV Tool PDF
No ratings yet
Spesifikasi - Hamilton-G5 With PV Tool PDF
2 pages
Onco Final - 250709 - 095820
No ratings yet
Onco Final - 250709 - 095820
3 pages
AquaFast Couplings Datasheet 355-450mm
No ratings yet
AquaFast Couplings Datasheet 355-450mm
2 pages
GITA & GIFT: Top Odisha Tech Institutes
No ratings yet
GITA & GIFT: Top Odisha Tech Institutes
16 pages
ProSacco: The Best Sacco Management System
No ratings yet
ProSacco: The Best Sacco Management System
7 pages
Armstrong 1996 Sharing One Skin
No ratings yet
Armstrong 1996 Sharing One Skin
6 pages
Covalent Bonding & Giant Structures
No ratings yet
Covalent Bonding & Giant Structures
19 pages
‎⁨تلخيص تاريخ مع حل اسئلة بجروت - PDF⁩
No ratings yet
‎⁨تلخيص تاريخ مع حل اسئلة بجروت - PDF⁩
217 pages
Recitation 02
No ratings yet
Recitation 02
3 pages
Action Research National Anthem Memorization
No ratings yet
Action Research National Anthem Memorization
15 pages
GTU Chemical Engineering Thermodynamics II Question Bank
No ratings yet
GTU Chemical Engineering Thermodynamics II Question Bank
3 pages
AUVON US AS1080 24mode Sms v1.0 220726 75x130mm
No ratings yet
AUVON US AS1080 24mode Sms v1.0 220726 75x130mm
32 pages
Grade 7 Science: Material Properties Quiz
No ratings yet
Grade 7 Science: Material Properties Quiz
3 pages
Statement of Purpose
No ratings yet
Statement of Purpose
3 pages
WelChem SieveTray 2020-1
No ratings yet
WelChem SieveTray 2020-1
6 pages
Contributions of Thomas Edison Dela Cruz
No ratings yet
Contributions of Thomas Edison Dela Cruz
2 pages
Working Memory Chunking Attention
No ratings yet
Working Memory Chunking Attention
6 pages
PDF Factory Pro Trial Version
No ratings yet
PDF Factory Pro Trial Version
110 pages
Introduction to UML and Its Benefits
No ratings yet
Introduction to UML and Its Benefits
55 pages
MNC
No ratings yet
MNC
4 pages

Machine Learning Classifiers for Diabetes Prediction

Uploaded by

Machine Learning Classifiers for Diabetes Prediction

Uploaded by

DEPARTMENT: ____Computer

Student Name: __Muhammad Zohaib___ ID: _CSC-20F-132_

Moreover, perform a comparative study of the mentioned algorithm.

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression

from [Link] import DecisionTreeClassifier

from [Link] import RandomForestClassifier

from sklearn.naive_bayes import GaussianNB

from [Link] import KNeighborsClassifier

from [Link] import SVC

from [Link] import accuracy_score, classification_report

from [Link] import StandardScaler, RobustScaler

from [Link] import Pipeline

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

# Define pipelines for each model

'Logistic Regression': Pipeline([('scaler', RobustScaler()),('logreg',

'Decision Tree': Pipeline([('scaler', StandardScaler()),('tree',

'Random Forest': Pipeline([('scaler', StandardScaler()),('forest',

'Naive Bayes': Pipeline([('scaler', StandardScaler()),('nb',

'KNN': Pipeline([('scaler', StandardScaler()),('knn',

'SVM': Pipeline([('scaler', StandardScaler()),('svm', SVC())])

# Train and evaluate models

for name, pipeline in [Link]():

print(f'Accuracy: {accuracy_score(y_test, y_pred):.4f}') # Format

print('Classification Report:\n', classification_report(y_test,

You might also like

Student Name: Muhammad Zohaib_ ID: _CSC-20F-132_