CSE511 CourseBrief

This course covers data processing at scale using parallel and distributed algorithms. It focuses on designing, deploying, and using state-of-the-art data processing systems that provide scalable access to large datasets. Specific topics include efficient query processing, indexing structures, distributed database design, parallel query execution, concurrency control, data management in cloud and MapReduce environments, and NoSQL database systems. The course aims to help learners differentiate data models, perform queries and analytics in modern databases, and utilize cluster computing systems like Hadoop/Spark for scalable data operations in cloud environments. It is estimated to require 15-20 hours per week and may require using technologies like Amazon AWS, Hadoop/Spark, GitHub, PostgreSQL and

Uploaded by

Maddy

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

0% found this document useful (0 votes)

239 views2 pages

CSE511 CourseBrief

Uploaded by

Maddy

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

You are on page 1/ 2

CSE 511: Data Processing at Scale

About this course

Database systems are used to provide convenient access to disk-resident data through efficient query
processing, indexing structures, concurrency control, and recovery. This course delves into new frameworks
for processing and generating large-scale datasets with parallel and distributed algorithms, covering the
design, deployment and use of state-of-the-art data processing systems, which provide scalable access to
data.

Specific topics covered include:

● Efficient query processing
● Indexing structures
● Distributed database design
● Parallel query execution
● Concurrency control in distributed parallel database systems
● Data management in cloud computing environments
● Data management in Map/Reduce-based
● NoSQL database systems

Required prior knowledge and skills

● Basic statistics and computer science knowledge including computer organization and architecture,
discrete mathematics, data structures, and algorithms
● Knowledge of high-level programming languages (e.g., C++, Java) and scripting language (e.g., Python)

Learning Outcomes
Learners completing this course will be able to:
● Differentiate among major data models such as relational, spatial, and NoSQL
● Perform queries (e.g., SQL) and analytics tasks in state-of-the-art database systems
● Apply leading-edge techniques to design/tune distributed and parallel database systems
● Utilize existing NoSQL database systems as appropriate for specified cases
● Perform database operations (e.g., selection, projection, join, and groupby) in state-of-the-art cluster
computing systems such as Hadoop/Spark
● Perform scalable data processing operations (e.g., selection, projection, join, and groupby) in cloud
computing environments, including Amazon AWS

Estimated Workload/Time Commitment Per Week

15 - 20 hours per week

Technology Requirements
Hardware - Standard hardware with major OSSoftware and Other (programs, platforms, services, etc.) - To
complete course projects, some of the following may be required: Amazon AWS, Cloud, Hadoop/Spark,
GitHub, PostgreSQL, MongoDB, Neo4j.

Page 1

Creators

Dr. Mohamed Sarwat

Mohamed Sarwat is an Assistant Professor of Computer Science and the director of the Data Systems
(DataSys) lab at Arizona State University (ASU). He is also an affiliate member of the Center for Assured and
Scalable Data Engineering (CASCADE). Before joining ASU, Mohamed obtained his MSc and PhD degrees in
computer science from the University of Minnesota. His research interest lies in the broad area of data
management systems.

Dr. Ming Zhao
Ming Zhao is an associate professor of the ASU School of Computing, Informatics, and Decision Systems
Engineering. Before joining ASU, he was an associate professor of the School of Computing and Information
Sciences (SCIS) at Florida International University. He directs the Research Laboratory for Virtualized
Infrastructure, Systems, and Applications (VISA). His research interests are in distributed/cloud computing, big
data, high-performance computing, autonomic computing, virtualization, storage systems and operating
systems.

Page 2

Course 572
No ratings yet
Course 572
8 pages
John Smith Skills-Report
No ratings yet
John Smith Skills-Report
12 pages
Algorithms and Data Structures
No ratings yet
Algorithms and Data Structures
37 pages
Database Management System Thesis PDF
100% (4)
Database Management System Thesis PDF
7 pages
Unit 1
No ratings yet
Unit 1
30 pages
Applied Computation 263 Data and Computation On The Internet
No ratings yet
Applied Computation 263 Data and Computation On The Internet
5 pages
Statement of Purpose
No ratings yet
Statement of Purpose
2 pages
Thesis On Distributed Database System
100% (3)
Thesis On Distributed Database System
8 pages
Assignment Session 14
No ratings yet
Assignment Session 14
2 pages
DE Gen AI JD
No ratings yet
DE Gen AI JD
2 pages
Advanced Applications of Python Data Structures and Algorithms
No ratings yet
Advanced Applications of Python Data Structures and Algorithms
318 pages
Database Applications Cy S 125242: DR - Layla Abdour
No ratings yet
Database Applications Cy S 125242: DR - Layla Abdour
32 pages
SNR Data Engineer #24-00017 in India
No ratings yet
SNR Data Engineer #24-00017 in India
1 page
DBMS Unit-II-The Relational Model
No ratings yet
DBMS Unit-II-The Relational Model
133 pages
Acm Sigmod Jim Gray Doctoral Dissertation Award
100% (1)
Acm Sigmod Jim Gray Doctoral Dissertation Award
4 pages
JD - Graph Database Architect
No ratings yet
JD - Graph Database Architect
4 pages
Course Pack
No ratings yet
Course Pack
1 page
Thesis in System Analysis and Design
100% (3)
Thesis in System Analysis and Design
7 pages
Term Paper On Distributed Database
100% (1)
Term Paper On Distributed Database
5 pages
PO Master Final III3 2009
No ratings yet
PO Master Final III3 2009
21 pages
Instant Download Advances in Machine Learning for Big Data Analysis Satchidananda Dehuri (Editor) PDF All Chapters
100% (3)
Instant Download Advances in Machine Learning for Big Data Analysis Satchidananda Dehuri (Editor) PDF All Chapters
37 pages
Thesis Database Management System
100% (2)
Thesis Database Management System
7 pages
(Ebook) Algorithm Design. Foundations, Analysis, and Internet Examples by Michael T. Goodrich, Roberto Tamassia ISBN 9780471383659, 0471383651 - Read the ebook online or download it to own the full content
100% (1)
(Ebook) Algorithm Design. Foundations, Analysis, and Internet Examples by Michael T. Goodrich, Roberto Tamassia ISBN 9780471383659, 0471383651 - Read the ebook online or download it to own the full content
50 pages
Data Science - Fundamentals and Components
No ratings yet
Data Science - Fundamentals and Components
21 pages
Veritabanı Yönetim Sistemleri YZM508: Dr. Osman GÖKALP
No ratings yet
Veritabanı Yönetim Sistemleri YZM508: Dr. Osman GÖKALP
49 pages
VTU Exam Question Paper With Solution of 18CS72 Big Data and Analytics Feb-2022-Dr. v. Vijayalakshmi
No ratings yet
VTU Exam Question Paper With Solution of 18CS72 Big Data and Analytics Feb-2022-Dr. v. Vijayalakshmi
25 pages
UNIT1
No ratings yet
UNIT1
58 pages
Analysis of Distributed Systems
No ratings yet
Analysis of Distributed Systems
6 pages
contFinal
No ratings yet
contFinal
22 pages
Data Structures and Algorithms in Java: Third Edition
No ratings yet
Data Structures and Algorithms in Java: Third Edition
14 pages
Urmi Sen Updated CV
No ratings yet
Urmi Sen Updated CV
2 pages
A Survey On Software Suites For Data Mining, Analytics and Knowledge Discovery
No ratings yet
A Survey On Software Suites For Data Mining, Analytics and Knowledge Discovery
6 pages
Sample 2
No ratings yet
Sample 2
6 pages
Hostel Management System Literature Review PDF
No ratings yet
Hostel Management System Literature Review PDF
5 pages
Practical Connection
No ratings yet
Practical Connection
5 pages
Module 1 Data Science
No ratings yet
Module 1 Data Science
8 pages
Reading - Data Warehousing Specialist
No ratings yet
Reading - Data Warehousing Specialist
4 pages
Da Unit-1
No ratings yet
Da Unit-1
23 pages
Data Analytics III-i
No ratings yet
Data Analytics III-i
85 pages
Resource management of mobile cloud computing networks and environments 1st Edition Mastorakis - Explore the complete ebook content with the fastest download
100% (1)
Resource management of mobile cloud computing networks and environments 1st Edition Mastorakis - Explore the complete ebook content with the fastest download
62 pages
ak_as2
No ratings yet
ak_as2
15 pages
DSF - Unit V Notes
No ratings yet
DSF - Unit V Notes
7 pages
Manj Data 1
No ratings yet
Manj Data 1
30 pages
Analyzing Data through Probabilistic Modeling in Statistics 1st Edition Dariusz Jakóbczak - The ebook is available for instant download, no waiting required
No ratings yet
Analyzing Data through Probabilistic Modeling in Statistics 1st Edition Dariusz Jakóbczak - The ebook is available for instant download, no waiting required
67 pages
Management Information System Thesis Sample
100% (2)
Management Information System Thesis Sample
7 pages
Task Scheduling For Multi Core and Parallel Architectures Challenges Solutions and Perspectives 1st Edition Quan Chen
100% (5)
Task Scheduling For Multi Core and Parallel Architectures Challenges Solutions and Perspectives 1st Edition Quan Chen
52 pages
A data engineer is a professional responsible for designing
No ratings yet
A data engineer is a professional responsible for designing
2 pages
Dataverse and Research Data For ICRAF
No ratings yet
Dataverse and Research Data For ICRAF
24 pages
Background of The Study
No ratings yet
Background of The Study
20 pages
Santos13CERA
No ratings yet
Santos13CERA
7 pages
Assuming The Roles Of: Systems Analyst
No ratings yet
Assuming The Roles Of: Systems Analyst
40 pages
BIG DATA Notes
No ratings yet
BIG DATA Notes
11 pages
[FREE PDF sample] Business Models and Strategies for Open Source Projects 1st Edition Francisco José Monaco ebooks
100% (7)
[FREE PDF sample] Business Models and Strategies for Open Source Projects 1st Edition Francisco José Monaco ebooks
85 pages
DS Lecture 01
No ratings yet
DS Lecture 01
24 pages
IT-243 Assignment 2nd Semester
No ratings yet
IT-243 Assignment 2nd Semester
8 pages
Selected topic D4444oc
No ratings yet
Selected topic D4444oc
11 pages
8633148
No ratings yet
8633148
76 pages
Lecture 01.1
No ratings yet
Lecture 01.1
21 pages
Software Engineer - Distributed Database
No ratings yet
Software Engineer - Distributed Database
3 pages
DBA Administrator - Presight
No ratings yet
DBA Administrator - Presight
3 pages
Instant ebooks textbook Resource management of mobile cloud computing networks and environments 1st Edition Mastorakis download all chapters
100% (4)
Instant ebooks textbook Resource management of mobile cloud computing networks and environments 1st Edition Mastorakis download all chapters
81 pages
Learning Advanced Programming
From Everand
Learning Advanced Programming
IT Campus Academy
No ratings yet
CSE598 Advancedsoftwareanalysisdesign Coursebrief PDF
No ratings yet
CSE598 Advancedsoftwareanalysisdesign Coursebrief PDF
2 pages
Terms and Conditions For Jio - Double Data Offer Definitions
No ratings yet
Terms and Conditions For Jio - Double Data Offer Definitions
3 pages
Modala Maleyanthe
No ratings yet
Modala Maleyanthe
1 page
Removable Media Policy
No ratings yet
Removable Media Policy
2 pages
Abhimanyu Kumar: : +91-6361925933 : Thakurabhi
No ratings yet
Abhimanyu Kumar: : +91-6361925933 : Thakurabhi
4 pages
Slide-3 (Cloud Computing Models)
No ratings yet
Slide-3 (Cloud Computing Models)
43 pages
CS3451-OS Syllabus 2021
No ratings yet
CS3451-OS Syllabus 2021
1 page
Feedback Srs
0% (2)
Feedback Srs
8 pages
Module 2 Creating A Task-Based Schedule
No ratings yet
Module 2 Creating A Task-Based Schedule
51 pages
Creation and Installation of SSL Certificate For Key Tool Completed
No ratings yet
Creation and Installation of SSL Certificate For Key Tool Completed
22 pages
Unit I: An Introduction To Operating System
No ratings yet
Unit I: An Introduction To Operating System
12 pages
R
No ratings yet
R
15 pages
Getting Started With Apache Nifi
No ratings yet
Getting Started With Apache Nifi
10 pages
(2+ Experience) Java Resume-5
No ratings yet
(2+ Experience) Java Resume-5
4 pages
Azure IoT Developer AZ-220 Dumps
No ratings yet
Azure IoT Developer AZ-220 Dumps
11 pages
Ghost Usb Honeypot Master
No ratings yet
Ghost Usb Honeypot Master
15 pages
Abstract Data Types (Arrays and Queues)
No ratings yet
Abstract Data Types (Arrays and Queues)
18 pages
Lowell Fryman USGS 2017 Final
No ratings yet
Lowell Fryman USGS 2017 Final
18 pages
DBMS Assignment 2 Bahria University Lahore Campus 2024
No ratings yet
DBMS Assignment 2 Bahria University Lahore Campus 2024
7 pages
Time Table
No ratings yet
Time Table
1 page
Dbu Hiwot Cinema
No ratings yet
Dbu Hiwot Cinema
30 pages
Unit Iii DBMS 20221109121906598 16082024 094454
No ratings yet
Unit Iii DBMS 20221109121906598 16082024 094454
10 pages
Module 6 - Normalization-1
No ratings yet
Module 6 - Normalization-1
30 pages
Merge PDF
No ratings yet
Merge PDF
4 pages
Resume of Shalini
No ratings yet
Resume of Shalini
6 pages
Automation Testing - 42 - SCM - IM.517
No ratings yet
Automation Testing - 42 - SCM - IM.517
15 pages
Abhishek Jindal Resume Data Scientist
No ratings yet
Abhishek Jindal Resume Data Scientist
3 pages
CIM-2022-0136 Proof Hi
No ratings yet
CIM-2022-0136 Proof Hi
14 pages
1.quality Concepts
No ratings yet
1.quality Concepts
12 pages
Hiding The Header of An SSRS Report From Excel
No ratings yet
Hiding The Header of An SSRS Report From Excel
3 pages
Jax WS
100% (1)
Jax WS
34 pages

CSE511 CourseBrief

Uploaded by

CSE511 CourseBrief

Uploaded by

CSE 511: Data Processing at Scale

About this course

Specific topics covered include:

Required prior knowledge and skills

Estimated Workload/Time Commitment Per Week

Dr. Mohamed Sarwat

You might also like