Dev Unit I

The document is a question bank for the course AD3301 – Data Exploration and Visualization at Anna University, focusing on exploratory data analysis (EDA). It covers fundamental concepts, significance, software tools, and various techniques related to EDA, including data transformation, aggregation, and visualization aids. The question bank includes both short answer and essay-type questions to assess understanding of EDA principles and practices.

Uploaded by

Divya Priya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

68 views5 pages

Dev Unit I

Uploaded by

Divya Priya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

2332 ACET

DEPARTMENT OF ARTIFICIAL INTELLIGENCE AND DATA

SCIENCE

[Link]. – Artificial Intelligence and Data

Science Anna University Regulation:

2021

AD3301 – Data Exploration and

Visualization

II Year / III

Semester

QUESTION

BANK

AD3301_DEV
QUESTION BANK
AD3301 – DATA EXPLORATION AND VISUALIZATION

UNIT I EXPLORATORY DATA ANALYSIS

EDA fundamentals – Understanding data science – Significance of EDA – Making sense of
data – Comparing EDA with classical and Bayesian analysis – Software tools for EDA -
Visual Aids for EDA- Data transformation techniques-merging database, reshaping and
pivoting, Transformation techniques - Grouping Datasets - data aggregation – Pivot tables
and cross-tabulations.

PART – A

1. Define Exploratory Data Analysis (EDA)?

EDA is the process of examining and visualizing data to uncover patterns, trends, and
insights before more advanced analyses.
2. What is the significance of EDA in data science?
EDA is crucial in data science as it helps identify patterns, outliers, and data quality issues,
providing a foundation for further analysis.
3. Differentiate EDA from classical statistical analysis?
EDA focuses on visual exploration, while classical statistical analysis involves hypothesis
testing and parameter estimation.
4. Why is making sense of data important in EDA?
Making sense of data involves extracting meaningful information, enabling informed
decisions and insights.
5. Compare EDA with Bayesian analysis?

AD3301_DEV
EDA is non-parametric and exploratory, while Bayesian analysis incorporates prior
knowledge and updates probabilities based on new data.
6. Name two software tools commonly used for EDA?
Pandas and Matplotlib are commonly used tools for EDA in Python.
7. Define data transformation techniques in EDA?
Data transformation techniques include normalization, scaling, and handling missing values
to prepare data for analysis.

AD3301_DEV
8. What is the purpose of merging databases in EDA?
Merging databases combines datasets based on common identifiers to create a unified dataset
for analysis.
9. Differentiate between reshaping and pivoting in EDA?
Reshaping transforms data between wide and long formats, while pivoting reorganizes data to
create a new structure.
10. Define data aggregation in EDA?
Data aggregation involves summarizing grouped data using functions like sum, mean, or
count.
11. How do pivot tables aid in EDA?
Pivot tables facilitate multidimensional analysis and summarization of data in a tabular
format.
12. What visual aids are commonly used in EDA?
Histograms, box plots, scatter plots, and heatmaps are common visual aids in EDA for
understanding data distributions and relationships.
13. Define the concept of grouping datasets in EDA?
Grouping datasets involves creating subsets based on certain criteria, enabling focused
analysis on specific segments.
14. Why is cross-tabulation useful in EDA?
Cross-tabulation is useful in EDA for displaying the frequency distribution of variables in a
contingency table.
15. Name a transformation technique in EDA for handling outliers?
Winsorizing is a transformation technique that involves replacing extreme values with less
extreme values to handle outliers.
16. Define the term "data normalization" in EDA?
Data normalization in EDA is the process of rescaling variables to a standard range, typically
between 0 and 1.
17. What is the role of visual aids like violin plots in EDA?
Violin plots display the distribution of data, providing insights into both central tendency and
spread.
18. Define the concept of data scaling in EDA?
Data scaling in EDA involves transforming variables to have a similar scale, preventing
dominance by certain features.

AD3301_DEV
19. How does EDA contribute to data science projects?
EDA contributes by providing an initial understanding of data, guiding subsequent modeling
and analysis decisions.
20. Why are pivot tables and cross-tabulations useful in summarizing data?
Pivot tables and cross-tabulations provide a concise summary of data, making it easier to
identify patterns and trends across different dimensions.

PART – B

1. Explain the Purpose of EDA

2. Differentiate EDA from Classical Analysis
3. Illustrate Visual Aids in EDA
4. Describe Data Transformation in EDA
5. Explore the Significance of Grouping Datasets and how it aids in focused analysis.
6. Explain the Role of Data Aggregation
7. Illustrate the Application of Pivot Tables
8. Compare EDA with Bayesian Analysis:

AD3301_DEV

AI & Data Science Question Bank
No ratings yet
AI & Data Science Question Bank
20 pages
Understanding Exploratory Data Analysis
0% (1)
Understanding Exploratory Data Analysis
17 pages
DEV Question Bank
No ratings yet
DEV Question Bank
15 pages
AD3301 DEV Clean Full
No ratings yet
AD3301 DEV Clean Full
245 pages
Question Bank DEV
No ratings yet
Question Bank DEV
16 pages
Unit 1 Eda Qa (2marks)
No ratings yet
Unit 1 Eda Qa (2marks)
4 pages
Ad3301 - Dev - 5 Units Question Bank
No ratings yet
Ad3301 - Dev - 5 Units Question Bank
16 pages
FDS Unit 2
No ratings yet
FDS Unit 2
15 pages
Unit 1
No ratings yet
Unit 1
15 pages
Dev Int 1
No ratings yet
Dev Int 1
1 page
Dev Notes-1
No ratings yet
Dev Notes-1
249 pages
(AD3301-DeV) Unit-Wise (Important Question)
No ratings yet
(AD3301-DeV) Unit-Wise (Important Question)
7 pages
Q2 Ans
No ratings yet
Q2 Ans
5 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
23 pages
Assignment 1
No ratings yet
Assignment 1
2 pages
Unit - 1 EDA
No ratings yet
Unit - 1 EDA
123 pages
Group 7
No ratings yet
Group 7
19 pages
Unit 1
No ratings yet
Unit 1
19 pages
Dev Answer Key
No ratings yet
Dev Answer Key
21 pages
Data Science Is A Deep Study of The Massive Amount of Data
No ratings yet
Data Science Is A Deep Study of The Massive Amount of Data
2 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
17 pages
EDA Insights for Data Analysts
No ratings yet
EDA Insights for Data Analysts
26 pages
Unit 3
No ratings yet
Unit 3
222 pages
Unit 1
No ratings yet
Unit 1
23 pages
P23MBA547 Predictive Analytics
No ratings yet
P23MBA547 Predictive Analytics
133 pages
Data Exploration and Visualization
100% (1)
Data Exploration and Visualization
281 pages
EDA Approaches for Analysts
No ratings yet
EDA Approaches for Analysts
37 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
62 pages
Wa0000.
No ratings yet
Wa0000.
15 pages
Ad3301-Data Exploration and Visualization Important Questions For Ciat-1
No ratings yet
Ad3301-Data Exploration and Visualization Important Questions For Ciat-1
3 pages
Unit I Exploratory Data Analysis
No ratings yet
Unit I Exploratory Data Analysis
38 pages
EDA Lecture Notes
No ratings yet
EDA Lecture Notes
205 pages
Ccs346 Eda Unit 1
No ratings yet
Ccs346 Eda Unit 1
129 pages
Unit 3
No ratings yet
Unit 3
47 pages
Exploratory Data Analysis (EDA) Guide
No ratings yet
Exploratory Data Analysis (EDA) Guide
16 pages
Unit 1
No ratings yet
Unit 1
50 pages
FDS Key Answers
No ratings yet
FDS Key Answers
24 pages
Unit-I QB
No ratings yet
Unit-I QB
3 pages
Eda Unit 1
No ratings yet
Eda Unit 1
57 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
13 pages
Eda 1
No ratings yet
Eda 1
25 pages
07 Eda
No ratings yet
07 Eda
5 pages
Unit 1
No ratings yet
Unit 1
64 pages
Unit 1 Dev
No ratings yet
Unit 1 Dev
26 pages
Q1 Dev Ans
No ratings yet
Q1 Dev Ans
2 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
17 pages
Dev Use Environment Soci QB 25-26 - Word-1
No ratings yet
Dev Use Environment Soci QB 25-26 - Word-1
12 pages
Unit I - Part I Notes
100% (7)
Unit I - Part I Notes
33 pages
Unit I
No ratings yet
Unit I
85 pages
Exploratory Data Analysis Guide
No ratings yet
Exploratory Data Analysis Guide
38 pages
22amh32 - Data Analytics and Data Science Unit I & Exploratory Data Analysis (Eda) 1. Exploratory Data Analysis (Eda)
No ratings yet
22amh32 - Data Analytics and Data Science Unit I & Exploratory Data Analysis (Eda) 1. Exploratory Data Analysis (Eda)
9 pages
Data Science Process
No ratings yet
Data Science Process
30 pages
Lecture 21
No ratings yet
Lecture 21
16 pages
De&v Two Marks Questions With Answers
No ratings yet
De&v Two Marks Questions With Answers
19 pages
Dev (Ia 1)
No ratings yet
Dev (Ia 1)
1 page
Exploratory Data Analysis - Komorowski PDF
No ratings yet
Exploratory Data Analysis - Komorowski PDF
20 pages
Incred PL LXCHE30325 267477052 10 10 2025 - Repayment - Schedule - 235821
No ratings yet
Incred PL LXCHE30325 267477052 10 10 2025 - Repayment - Schedule - 235821
2 pages
Test Project
No ratings yet
Test Project
25 pages
AD3351
No ratings yet
AD3351
50 pages
C Program I
No ratings yet
C Program I
5 pages
AD3511
No ratings yet
AD3511
86 pages
ERP - Production Planning and Scheduling - Dataset
No ratings yet
ERP - Production Planning and Scheduling - Dataset
9 pages
Laboratory Experiments Even Sem
No ratings yet
Laboratory Experiments Even Sem
15 pages
Employee Management System - A Simplified ERP Tool For HR
No ratings yet
Employee Management System - A Simplified ERP Tool For HR
20 pages
Ad3461 ML
No ratings yet
Ad3461 ML
39 pages
Ccs356 Oose Lab Manual - Compressed
No ratings yet
Ccs356 Oose Lab Manual - Compressed
133 pages
SUMS
No ratings yet
SUMS
25 pages
Ee8711 4
No ratings yet
Ee8711 4
7 pages
Minor Equipment
No ratings yet
Minor Equipment
1 page
CS3481 DBMS
No ratings yet
CS3481 DBMS
48 pages
CS3691 Es and Iot
No ratings yet
CS3691 Es and Iot
52 pages
Fourth Semester Food Technology: B.E / B.Tech Practical End Semester Examinations, April/May 2019
No ratings yet
Fourth Semester Food Technology: B.E / B.Tech Practical End Semester Examinations, April/May 2019
2 pages
CCS346 Eda
No ratings yet
CCS346 Eda
71 pages
QP Control Systems
No ratings yet
QP Control Systems
3 pages
Embedded Systems & IoT Lab Manual
No ratings yet
Embedded Systems & IoT Lab Manual
91 pages
B.E / B.Tech./B.Arch. Practical End Semester Examinations, April / May 2019
No ratings yet
B.E / B.Tech./B.Arch. Practical End Semester Examinations, April / May 2019
2 pages
CCS334 Practical Record Notebook
No ratings yet
CCS334 Practical Record Notebook
37 pages
9.me3681 Cad - Cam Lab Question 1
No ratings yet
9.me3681 Cad - Cam Lab Question 1
22 pages
Digital Principles Exam Questions 2022
No ratings yet
Digital Principles Exam Questions 2022
2 pages
EC3492 Digital Signal Processing Lab Manual
100% (1)
EC3492 Digital Signal Processing Lab Manual
80 pages
Business Statistics: Dr. Basheer Ahmad Samim
No ratings yet
Business Statistics: Dr. Basheer Ahmad Samim
70 pages
Practice Questions
No ratings yet
Practice Questions
3 pages
Uas Ekonometrika-1
No ratings yet
Uas Ekonometrika-1
13 pages
Educational Leadership Styles Scale (ELSS) : Construction, Validation and Reliability Analysis
No ratings yet
Educational Leadership Styles Scale (ELSS) : Construction, Validation and Reliability Analysis
1 page
APStatisticsSummerWork2024Chapter1practicequestions 1112and13 Solutions
No ratings yet
APStatisticsSummerWork2024Chapter1practicequestions 1112and13 Solutions
2 pages
Ken Black QA All Odd No Chapter Solution
83% (6)
Ken Black QA All Odd No Chapter Solution
919 pages
2024 Y12 Apps Task 1 Test 1
No ratings yet
2024 Y12 Apps Task 1 Test 1
13 pages
2024 MA6131 Notes Chapter 6 Non-Parametric Tests (Student)
No ratings yet
2024 MA6131 Notes Chapter 6 Non-Parametric Tests (Student)
8 pages
Median Polish Methodology Overview
No ratings yet
Median Polish Methodology Overview
6 pages
Copenhagen Burnout Inventory - Student Version Ada
No ratings yet
Copenhagen Burnout Inventory - Student Version Ada
12 pages
Analysis of Covarience
No ratings yet
Analysis of Covarience
24 pages
Learning Objectives: 3 Introduction To Statistical Quality Control, 6 Edition by Douglas C. Montgomery
No ratings yet
Learning Objectives: 3 Introduction To Statistical Quality Control, 6 Edition by Douglas C. Montgomery
24 pages
Solution Manual For Practicing Statistics Guided Investigations For The Second Course by Kuiper
100% (1)
Solution Manual For Practicing Statistics Guided Investigations For The Second Course by Kuiper
18 pages
Evidence Based Ophthalmology: Noel D. Atienza, MD, MSC
No ratings yet
Evidence Based Ophthalmology: Noel D. Atienza, MD, MSC
59 pages
3 Statistical Concepts
No ratings yet
3 Statistical Concepts
34 pages
Review Questions
No ratings yet
Review Questions
3 pages
Chapter 8 All
No ratings yet
Chapter 8 All
74 pages
MCQ M-IV Unit 6 Mechanical
No ratings yet
MCQ M-IV Unit 6 Mechanical
7 pages
Understanding Principal Component Analysis
No ratings yet
Understanding Principal Component Analysis
30 pages
Brand Loyalty in Green Cosmetics
No ratings yet
Brand Loyalty in Green Cosmetics
16 pages
Measurement of Central Tendency
No ratings yet
Measurement of Central Tendency
27 pages
Understanding Alpha and Beta Risks
No ratings yet
Understanding Alpha and Beta Risks
6 pages
MATH 7 - Q4 - SummativeTest1 - WK1-2
No ratings yet
MATH 7 - Q4 - SummativeTest1 - WK1-2
4 pages
Holt D and Smith TMF, 1979 - Post Stratification. Journal of The Royal Statistical Society. Series A (General)
No ratings yet
Holt D and Smith TMF, 1979 - Post Stratification. Journal of The Royal Statistical Society. Series A (General)
15 pages
Statistical Significance Versus Clinical Importance
No ratings yet
Statistical Significance Versus Clinical Importance
5 pages
The Acceptability of Sweet Potato - Advance Statistics
No ratings yet
The Acceptability of Sweet Potato - Advance Statistics
13 pages
The Statistics
No ratings yet
The Statistics
4 pages
Module 11 (C)
No ratings yet
Module 11 (C)
4 pages
Probability Distribution Analysis
No ratings yet
Probability Distribution Analysis
9 pages
STROBE Statement-Checklist of Items That Should Be Included in Reports of Observational Studies
No ratings yet
STROBE Statement-Checklist of Items That Should Be Included in Reports of Observational Studies
3 pages

Dev Unit I

Uploaded by

Dev Unit I

Uploaded by

2332 ACET

DEPARTMENT OF ARTIFICIAL INTELLIGENCE AND DATA

[Link]. – Artificial Intelligence and Data

Science Anna University Regulation:

AD3301 – Data Exploration and

UNIT I EXPLORATORY DATA ANALYSIS

1. Define Exploratory Data Analysis (EDA)?

1. Explain the Purpose of EDA

You might also like