Stochastic Gradient Descent With LocalMinima

Uploaded by

happy225020

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views10 pages

Stochastic Gradient Descent With LocalMinima

Uploaded by

happy225020

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

Stochastic Gradient Descent

(SGD)

Jaskaran Singh
12591001
[Link](C.S.E)1 Sem.
st
Introduction to Gradient Descent
• • Gradient Descent is an optimization
algorithm used to minimize the cost function
in machine learning.
• • It works by iteratively adjusting parameters
in the opposite direction of the gradient of the
cost function.
• • Used in training linear regression, logistic
regression, neural networks, and more.
What is Stochastic Gradient Descent (SGD)?

• • Instead of using the entire dataset, SGD

updates parameters using only one sample at
a time.
• • This makes updates faster and introduces
randomness, helping to escape local minima.
• • Often used in training large-scale machine
learning models and deep learning networks.
Why Escape Local Minima?
• • Local minimum = small valley (not the best
solution).
• • Global minimum = deepest valley (lowest
error, best solution).
• • If stuck in a local minimum → model accuracy
is not the best.
• • SGD’s randomness acts like a “shake,” helping
the model escape small valleys and move closer
to the best valley.
How SGD Works?
• 1. Initialize model parameters.
• 2. Select a random sample from the training
data.
• 3. Compute the gradient of the loss function
for that sample.
• 4. Update parameters using the gradient.
• 5. Repeat until convergence.
Visual Representation
SGD vs Gradient Descent: Comparison
Advantages & Disadvantages of SGD
• Advantages:
• • Faster updates with large datasets.
• • Helps escape local minima.
• • Suitable for real-time/online learning.

• Disadvantages:
• • Noisy convergence.
• • Requires careful tuning of learning rate.
• • May oscillate around the minimum.
Applications of SGD
• • Training deep learning models (CNNs, RNNs,
Transformers).
• • Online recommendation systems.
• • Natural Language Processing (NLP).
• • Large-scale optimization problems.

Stochastic Gradient Descent
No ratings yet
Stochastic Gradient Descent
5 pages
2,5 Stochastic Gradient Descent
No ratings yet
2,5 Stochastic Gradient Descent
11 pages
2.stochastic Gradient Descent (SGD)
No ratings yet
2.stochastic Gradient Descent (SGD)
11 pages
Why Stochastic Gradient Descent Works
No ratings yet
Why Stochastic Gradient Descent Works
6 pages
Paper 2
No ratings yet
Paper 2
27 pages
Lecture05 Descent
No ratings yet
Lecture05 Descent
31 pages
Stochastic Gradient Descent - Math and Python Code
No ratings yet
Stochastic Gradient Descent - Math and Python Code
28 pages
Gradient Descent
No ratings yet
Gradient Descent
7 pages
ML - Stochastic Gradient Descent (SGD) - GeeksforGeeks
No ratings yet
ML - Stochastic Gradient Descent (SGD) - GeeksforGeeks
9 pages
Gradient-Based Optimizers
No ratings yet
Gradient-Based Optimizers
54 pages
SGD
No ratings yet
SGD
3 pages
ANN Explanation Request Updated
No ratings yet
ANN Explanation Request Updated
44 pages
Gradient Decent
No ratings yet
Gradient Decent
15 pages
Machine Learning Optimization Techniques
No ratings yet
Machine Learning Optimization Techniques
37 pages
Gradient Descent Method
No ratings yet
Gradient Descent Method
12 pages
Assignment 4
No ratings yet
Assignment 4
8 pages
05.stochastic Gradient Descent
No ratings yet
05.stochastic Gradient Descent
2 pages
Advanced Stochastic Gradient Descent
No ratings yet
Advanced Stochastic Gradient Descent
23 pages
SGD Explained for Data Scientists
No ratings yet
SGD Explained for Data Scientists
23 pages
Stochastic Gradient Descent Tuning
No ratings yet
Stochastic Gradient Descent Tuning
8 pages
Optimization Gradient Descent
No ratings yet
Optimization Gradient Descent
13 pages
Assignment No 3
No ratings yet
Assignment No 3
7 pages
Op Tim Ization
No ratings yet
Op Tim Ization
37 pages
Understanding Gradient Descent in ML
No ratings yet
Understanding Gradient Descent in ML
4 pages
Stochastic Gradient Descent Overview
No ratings yet
Stochastic Gradient Descent Overview
24 pages
INT255 Unit-4
No ratings yet
INT255 Unit-4
40 pages
04 Batch SGD Mini Batch Gradient Descent Algorithms
No ratings yet
04 Batch SGD Mini Batch Gradient Descent Algorithms
3 pages
Gradient Descent Presentation
No ratings yet
Gradient Descent Presentation
26 pages
SGD 2
No ratings yet
SGD 2
18 pages
Gradient Descent for Deep Learning
No ratings yet
Gradient Descent for Deep Learning
21 pages
Unit 4 - GRADIENT LEARNING
No ratings yet
Unit 4 - GRADIENT LEARNING
3 pages
Gradient Descent and Cost Function
No ratings yet
Gradient Descent and Cost Function
14 pages
Stochastic Gradient Descent
No ratings yet
Stochastic Gradient Descent
4 pages
Dla-Cat 1
No ratings yet
Dla-Cat 1
37 pages
Lecture 5
No ratings yet
Lecture 5
4 pages
Gradient Descent - PR
No ratings yet
Gradient Descent - PR
31 pages
Gradient Descent 5 Part 2
No ratings yet
Gradient Descent 5 Part 2
15 pages
Stochastic Gradient Descent Basics
No ratings yet
Stochastic Gradient Descent Basics
22 pages
UNIT2
No ratings yet
UNIT2
25 pages
QB Unit 3
No ratings yet
QB Unit 3
14 pages
Gradient Descent A Fundamental Optimization Algorithm
No ratings yet
Gradient Descent A Fundamental Optimization Algorithm
30 pages
Tut04 - One Algorithm To Optimize Them All
No ratings yet
Tut04 - One Algorithm To Optimize Them All
19 pages
OTBI Presentation
No ratings yet
OTBI Presentation
17 pages
Stochastic Search Methods
No ratings yet
Stochastic Search Methods
2 pages
Gradient Descent Methods Explained
No ratings yet
Gradient Descent Methods Explained
4 pages
AI33
No ratings yet
AI33
6 pages
UNIT3
No ratings yet
UNIT3
37 pages
Gradient Descent and Optimization in Machine Learning
No ratings yet
Gradient Descent and Optimization in Machine Learning
9 pages
Understanding Gradient Descent Methods
No ratings yet
Understanding Gradient Descent Methods
4 pages
Gradient Descent Algorithm Is A First
No ratings yet
Gradient Descent Algorithm Is A First
5 pages
Understanding Gradient Descent in ML
No ratings yet
Understanding Gradient Descent in ML
20 pages
Gradient Descent DS Rohit Sharma Fench Knjs
No ratings yet
Gradient Descent DS Rohit Sharma Fench Knjs
15 pages
ML Lec 08 Gradient Descent
No ratings yet
ML Lec 08 Gradient Descent
37 pages
UNIT III Part-2
No ratings yet
UNIT III Part-2
39 pages
Gradient Descent in Machine Learning
No ratings yet
Gradient Descent in Machine Learning
8 pages
Non-Convex Optimization For Deep Networks and Stochastic
No ratings yet
Non-Convex Optimization For Deep Networks and Stochastic
9 pages
Gradient Descent & Stochastic Optimization
No ratings yet
Gradient Descent & Stochastic Optimization
4 pages
Optimization Techniques (SGD Alternatives)
No ratings yet
Optimization Techniques (SGD Alternatives)
34 pages
Understanding Stochastic Gradient Descent
No ratings yet
Understanding Stochastic Gradient Descent
1 page

Stochastic Gradient Descent With LocalMinima

Uploaded by

Stochastic Gradient Descent With LocalMinima

Uploaded by

Stochastic Gradient Descent

• • Instead of using the entire dataset, SGD

You might also like