100% found this document useful (1 vote)

119 views19 pages

Linear Classifiers in Python: Chapter3

The document discusses linear classifiers in Python, including logistic regression and regularization. It covers how regularization affects training and test accuracy, the differences between L1 and L2 regularization, and how to perform multi-class classification with logistic regression using one-vs-rest and multinomial approaches. Code examples are provided to fit logistic regression models and examine coefficients and predictions.

Uploaded by

Nishant

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

100% found this document useful (1 vote)

119 views19 pages

Linear Classifiers in Python: Chapter3

Uploaded by

Nishant

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

You are on page 1/ 19

DataCamp Linear

Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

regularization

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Regularized logistic regression

DataCamp Linear Classifiers in Python

Regularized logistic regression

DataCamp Linear Classifiers in Python

How does regularization affect training accuracy?

In [1]: lr_weak_reg = LogisticRegression(C=100)

In [2]: lr_strong_reg = LogisticRegression(C=0.01)

In [3]: lr_weak_reg.fit(X_train, y_train)

In [4]: lr_strong_reg.fit(X_train, y_train)

In [3]: lr_weak_reg.score(X_train, y_train)
Out[3]: 1.0

In [4]: lr_strong_reg.score(X_train, y_train)

Out[4]: 0.92
regularized loss = original loss + large coefficient penalty
more regularization: lower training accuracy
DataCamp Linear Classifiers in Python

How does regularization affect test accuracy?

In [5]: lr_weak_reg.score(X_test, y_test)
Out[5]: 0.86

In [6]: lr_strong_reg.score(X_test, y_test)

Out[6]: 0.88
regularized loss = original loss + large coefficient penalty
more regularization: lower training accuracy
more regularization: (almost always) higher test accuracy
DataCamp Linear Classifiers in Python

L1 vs. L2 regularization
Lasso = linear regression with L1 regularization
Ridge = linear regression with L2 regularization
For other models like logistic regression we just say L1, L2, etc.
In [1]: lr_L1 = LogisticRegression(penalty='l1')

In [2]: lr_L2 = LogisticRegression() # penalty='l2' by default

In [3]: lr_L1.fit(X_train, y_train)

In [4]: lr_L2.fit(X_train, y_train)

In [5]: plt.plot(lr_L1.coef_.flatten())

In [6]: plt.plot(lr_L2.coef_.flatten())
DataCamp Linear Classifiers in Python

L2 vs. L1 regularization
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

probabilities

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ):

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ):

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ): With regularization (C = 1):

model coefficients: [[1.55 1.57]] model coefficients: [[0.45 0.64]]

model intercept: [-0.64] model intercept: [-0.26]

DataCamp Linear Classifiers in Python

How are these probabilities computed?

logistic regression predictions: sign of raw model output
logistic regression probabilities: "squashed" raw model output
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Multi-class logistic
regression

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Combining binary classifiers with one-vs-rest

In [1]: lr0.fit(X, y==0)

In [2]: lr1.fit(X, y==1)

In [3]: lr2.fit(X, y==2)

In [4]: lr0.decision_function(X)[0] # get raw model output
Out[4]: 6.124

In [5]: lr1.decision_function(X)[0]
Out[5]: -5.429

In [6]: lr2.decision_function(X)[0]
Out[6]: -7.532
In [7]: lr.fit(X, y)
In [8]: lr.predict(X)[0]
Out[8]: 0
DataCamp Linear Classifiers in Python

One-vs-rest vs. multinomial/softmax

One-vs-rest: "Multinomial" or "softmax":

fit a binary classifier for each fit a single classifier for all
class classes
predict with all, take largest prediction directly outputs best
output class
pro: simple, modular con: more complicated, new
con: not directly optimizing code
accuracy pro: tackle the problem directly
common for SVMs as well possible for SVMs, but less
can produce probabilities common
DataCamp Linear Classifiers in Python

Model coefficients for multi-class

In [1]: lr_ovr = LogisticRegression() # one-vs-rest by default

In [2]: lr_ovr.fit(X,y)

In [3]: lr_ovr.coef_.shape
Out[3]: (3,13)

In [4]: lr_ovr.intercept_.shape
Out[4]: (3,)
In [5]: lr_mn = LogisticRegression(multi_class="multinomial",solver="lbfgs")

In [6]: lr_mn.fit(X,y)

In [7]: lr_mn.coef_.shape
Out[7]: (3,13)

In [8]: lr_mn.intercept_.shape
Out[8]: (3,)
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!

Deep Learning Nanodegree Program
No ratings yet
Deep Learning Nanodegree Program
9 pages
Practical Social Network Analysis With Python PDFDrive
No ratings yet
Practical Social Network Analysis With Python PDFDrive
424 pages
Advanced Time Series and Forecasting Lecture 5
No ratings yet
Advanced Time Series and Forecasting Lecture 5
100 pages
Hands-On Deep Learning For Images With T PDF
No ratings yet
Hands-On Deep Learning For Images With T PDF
3 pages
Generative AI For Pentesting The Good The Bad The
No ratings yet
Generative AI For Pentesting The Good The Bad The
24 pages
BI KPI For Telecom
No ratings yet
BI KPI For Telecom
11 pages
According To Kanthaswamy Balasubramaniam
No ratings yet
According To Kanthaswamy Balasubramaniam
8 pages
Deep Learning Nanodegree Syllabus
No ratings yet
Deep Learning Nanodegree Syllabus
15 pages
ABIBA Telecom Solutions
No ratings yet
ABIBA Telecom Solutions
21 pages
Python Neural Network
No ratings yet
Python Neural Network
5 pages
Learning Cypher Sample Chapter
No ratings yet
Learning Cypher Sample Chapter
26 pages
215 - P G Diploma in Silambam Fencing
No ratings yet
215 - P G Diploma in Silambam Fencing
4 pages
ABIBA Systems Overview
100% (1)
ABIBA Systems Overview
17 pages
Getting Started With Building Microservices
No ratings yet
Getting Started With Building Microservices
17 pages
Certificate: Gayatri Vidya Parishad College of Engineering Madhurawada, Visakhapatnam-530 041
No ratings yet
Certificate: Gayatri Vidya Parishad College of Engineering Madhurawada, Visakhapatnam-530 041
73 pages
5 Must-Know Distributed Systems Design Patterns For Event-Driven Architectures - by Arslan Ahmad - Level Up Coding
No ratings yet
5 Must-Know Distributed Systems Design Patterns For Event-Driven Architectures - by Arslan Ahmad - Level Up Coding
16 pages
Cassandra
No ratings yet
Cassandra
31 pages
Getting Started C++ API
No ratings yet
Getting Started C++ API
142 pages
Recommendation Letter
No ratings yet
Recommendation Letter
1 page
Siamese Neural Networks For One-Shot Image Recognition
No ratings yet
Siamese Neural Networks For One-Shot Image Recognition
8 pages
Expert Systems Tutorial
No ratings yet
Expert Systems Tutorial
8 pages
Vision-Face Recognition Attendance Monitoring System For Surveillance Using Deep Learning Technology and Computer Vision
No ratings yet
Vision-Face Recognition Attendance Monitoring System For Surveillance Using Deep Learning Technology and Computer Vision
5 pages
Spring Framework Reference
No ratings yet
Spring Framework Reference
843 pages
Design Pattern
No ratings yet
Design Pattern
28 pages
Algorithms Wikipedia PDF
100% (1)
Algorithms Wikipedia PDF
2,118 pages
Yahya Thesis - Draft
100% (1)
Yahya Thesis - Draft
58 pages
CPP Notes - Object Oriented Programming Using CPP
No ratings yet
CPP Notes - Object Oriented Programming Using CPP
22 pages
Sample CoreJava For The Imaptient
No ratings yet
Sample CoreJava For The Imaptient
120 pages
Neo4j in Action
No ratings yet
Neo4j in Action
2 pages
Backend API Assignment
No ratings yet
Backend API Assignment
2 pages
07 Kamil Sarac Secure Coding C CPlusPlus
No ratings yet
07 Kamil Sarac Secure Coding C CPlusPlus
35 pages
Neo4j-Manual-2 0 1
No ratings yet
Neo4j-Manual-2 0 1
593 pages
Applied Cryptography Syllabus
No ratings yet
Applied Cryptography Syllabus
3 pages
Object Oriented Analysis and Design
0% (1)
Object Oriented Analysis and Design
16 pages
An Accurate Prediction of Price of Stock Using Linear Regression Model of Machine Learning
No ratings yet
An Accurate Prediction of Price of Stock Using Linear Regression Model of Machine Learning
6 pages
Framework Design Guidelines
No ratings yet
Framework Design Guidelines
90 pages
Roadmap To Learn Dsa Step by Step
No ratings yet
Roadmap To Learn Dsa Step by Step
12 pages
100 Days of Data Engineering - Make A Copy and Use As You Need
No ratings yet
100 Days of Data Engineering - Make A Copy and Use As You Need
7 pages
Understanding Machine Learning Theory Algorithms
No ratings yet
Understanding Machine Learning Theory Algorithms
449 pages
NGINX Playbook - Secure API Connectivity CP 011223
No ratings yet
NGINX Playbook - Secure API Connectivity CP 011223
9 pages
Flask Restplus
No ratings yet
Flask Restplus
86 pages
Introduction To Data Visualization With Python
No ratings yet
Introduction To Data Visualization With Python
47 pages
Essential Python Libraries and Functions For Data Science 1706295212
No ratings yet
Essential Python Libraries and Functions For Data Science 1706295212
12 pages
AHDAdv Cust Guide
No ratings yet
AHDAdv Cust Guide
361 pages
What Is LINQ PDF
No ratings yet
What Is LINQ PDF
145 pages
Oops Through Java by Vikram Dunga
No ratings yet
Oops Through Java by Vikram Dunga
165 pages
Dl4j in Action
No ratings yet
Dl4j in Action
26 pages
IJERT Data Analysis Using Python
No ratings yet
IJERT Data Analysis Using Python
6 pages
Download ebooks file Algorithm Design: A Methodological Approach 150 Problems and Detailed Solutions 1st Edition Patrick Bosc all chapters
100% (2)
Download ebooks file Algorithm Design: A Methodological Approach 150 Problems and Detailed Solutions 1st Edition Patrick Bosc all chapters
40 pages
State Oriented Programming
No ratings yet
State Oriented Programming
32 pages
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
From Everand
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
Robert Johnson
No ratings yet
Feature engineering Complete Self-Assessment Guide
From Everand
Feature engineering Complete Self-Assessment Guide
Gerardus Blokdyk
No ratings yet
ColdFusion Interview Questions, Answers, and Explanations: ColdFusion Certification Review
From Everand
ColdFusion Interview Questions, Answers, and Explanations: ColdFusion Certification Review
equitypress
No ratings yet
Linear Classifiers in Python: Chapter2
No ratings yet
Linear Classifiers in Python: Chapter2
21 pages
Linear Classifiers in Python: Chapter1
No ratings yet
Linear Classifiers in Python: Chapter1
16 pages
Linear Classifiers in Python: Chapter4
No ratings yet
Linear Classifiers in Python: Chapter4
24 pages
Logistic Regression and Regularization: Michael (Mike) Gelbart
No ratings yet
Logistic Regression and Regularization: Michael (Mike) Gelbart
19 pages
Multi Class Logistic Regression Training and Testing
No ratings yet
Multi Class Logistic Regression Training and Testing
9 pages
Regression Analysis
No ratings yet
Regression Analysis
16 pages
Preprocessing ch.2
No ratings yet
Preprocessing ch.2
19 pages
08 - FGD by Ammonia Scrubbing in CFB Power Plant
No ratings yet
08 - FGD by Ammonia Scrubbing in CFB Power Plant
4 pages
16 Chinese CFB FGD PDF
No ratings yet
16 Chinese CFB FGD PDF
22 pages
03 - Reactions Between CaO and SO2 in Carbonating and No Carbonating Conditions
No ratings yet
03 - Reactions Between CaO and SO2 in Carbonating and No Carbonating Conditions
9 pages
10 - Ultralow SO2 Emission For CFB Boilers Combination of Limestone and Actibated Carbon Adsorption
No ratings yet
10 - Ultralow SO2 Emission For CFB Boilers Combination of Limestone and Actibated Carbon Adsorption
8 pages
PGDBA by ISI, IIT-kgp, IIM C Paper 2018
No ratings yet
PGDBA by ISI, IIT-kgp, IIM C Paper 2018
15 pages
PGDBA by ISI, IIT-kgp, IIM C Paper 2017
No ratings yet
PGDBA by ISI, IIT-kgp, IIM C Paper 2017
25 pages
Artificial Neural Networks Max Marks 25M: 1 T, T 3 T 1 2 3 1 2 3 1 T
No ratings yet
Artificial Neural Networks Max Marks 25M: 1 T, T 3 T 1 2 3 1 2 3 1 T
1 page
Staner - ToP500
No ratings yet
Staner - ToP500
1 page
Bapan Database Management-Pages-Deleted
No ratings yet
Bapan Database Management-Pages-Deleted
7 pages
Foundations of Machine Learning: Module 6: Neural Network
No ratings yet
Foundations of Machine Learning: Module 6: Neural Network
22 pages
Power Off Reset Reason Backup
No ratings yet
Power Off Reset Reason Backup
5 pages
2
No ratings yet
2
4 pages
Teamdl at Semeval-2018 Task 8: Cybersecurity Text Analysis Using Convolutional Neural Network and Conditional Random Fields
No ratings yet
Teamdl at Semeval-2018 Task 8: Cybersecurity Text Analysis Using Convolutional Neural Network and Conditional Random Fields
6 pages
Neural Networks and Fuzzy Logic Question Paper
100% (1)
Neural Networks and Fuzzy Logic Question Paper
1 page
Terms CH
No ratings yet
Terms CH
2 pages
Semantic Web &web Services-UNIT-1
No ratings yet
Semantic Web &web Services-UNIT-1
23 pages
Yozo Log
No ratings yet
Yozo Log
6 pages
Au CC 2548527 Identity Mindmap Differentiated Activity Sheet English - Ver - 2
100% (1)
Au CC 2548527 Identity Mindmap Differentiated Activity Sheet English - Ver - 2
3 pages
L - Unbalanced Credit Card Fraud Detection
No ratings yet
L - Unbalanced Credit Card Fraud Detection
8 pages
Slide Semweb 7 Sparql
No ratings yet
Slide Semweb 7 Sparql
43 pages
Pemeriksaan Barang
100% (1)
Pemeriksaan Barang
9 pages
Linear and Nolinear PDF
No ratings yet
Linear and Nolinear PDF
1 page
Teme Pentru Referate La Cursul "Retele Neuronale"
No ratings yet
Teme Pentru Referate La Cursul "Retele Neuronale"
3 pages
11 - Vietnamese Text Classification and Sentiment Based
No ratings yet
11 - Vietnamese Text Classification and Sentiment Based
3 pages
Prime - Composite Numbers To 100000
No ratings yet
Prime - Composite Numbers To 100000
1,835 pages
Linked Data Vocabularies
No ratings yet
Linked Data Vocabularies
11 pages
Introduction To The Semantic Web
No ratings yet
Introduction To The Semantic Web
11 pages
Power Off Reset Reason
No ratings yet
Power Off Reset Reason
3 pages
%enterprise Architecture Modeling With SoaML Using BMM and BPMN - %
No ratings yet
%enterprise Architecture Modeling With SoaML Using BMM and BPMN - %
7 pages
Semantic Web 2
No ratings yet
Semantic Web 2
24 pages
Ik-Prw Power Distribution Single Line Diagram, Nov. 2006: F808 F802 F801 F804 F803 F805 F807 F806
No ratings yet
Ik-Prw Power Distribution Single Line Diagram, Nov. 2006: F808 F802 F801 F804 F803 F805 F807 F806
1 page
Table B.2 (Continued) Existing A5.29/A5.29M Classifications and Equivalent A5.36/A5.36M Classifications Utilizing The Open Classification System
No ratings yet
Table B.2 (Continued) Existing A5.29/A5.29M Classifications and Equivalent A5.36/A5.36M Classifications Utilizing The Open Classification System
1 page
Kuis - 017 - HARRY IS - Kom B
No ratings yet
Kuis - 017 - HARRY IS - Kom B
3 pages
Natual Language Processing
No ratings yet
Natual Language Processing
33 pages
Cheat Sheet
No ratings yet
Cheat Sheet
25 pages
Programming Language and Paradigms
No ratings yet
Programming Language and Paradigms
28 pages