0% found this document useful (0 votes)

284 views6 pages

Multi Level Association Rules

The document discusses different types of association rule mining including: 1) Multi-level association rule mining which generates rules at different levels of abstraction to provide both common sense and low-level rules. 2) Multi-dimensional association rule mining which involves rules with more than one dimension or predicate, such as rules involving both customer attributes and purchases. 3) Techniques for mining quantitative association rules including static and dynamic discretization of numeric attributes as well as clustering-based approaches. The goal is to generate meaningful rules involving both categorical and quantitative attributes.

Uploaded by

Uttam Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

284 views6 pages

Multi Level Association Rules

Uploaded by

Uttam Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Support for an itemset X in a transactional database D is defined as count(X) / |D|.

For an association rule X Þ Y, we can calculate

support(X Þ Y) = support(X U Y) = support(X union Y).

confidence(X Þ Y) = support(X U Y) / support(X).

Support (S) and Confidence (C) can also be related to joint probabilities and conditional
probabilities as follows.

support(X Þ Y) = P(X U Y).

confidence(X Þ Y) = P(Y/X).

The number of association rules that can be derived from a dataset D are exponentially
large. Interesting association rules are those whose support and confidence are greater than
minSupp and minConf.

Frequent itemsets (also called as large itemsets), are those itemsets whose support is greater
than minSupp. The apriori property (downward closure property) says that any subsets of an
frequent itemset are also frequent itemsets.

Multi Level Association Rules – Concepts:

o Rules Generated from mining data at different levels of abstraction

o Essential to mine at different levels, in supporting business decision making

o Massive amount of data highly sparse at the primitive level

o Rules at high concept level adds to common sense

o Rules at low concept level may not be interesting always

Example:

o Items in task relevant data will be primitive

o Primitive data items occurs least frequently

buys (hp-laptop computer)  buys (canon-inkjet printer)

buys (laptop computer)  buys (inkjet printer)

buys (computer)  buys (printer)

o Support- Confidence Framework

o Top down Strategy, in accumulating counts

o Algorithms – Apriori & it’s variations

o Variations includes

o Uniform support for all levels

o Reduced Support at lower levels

Mining (UNIFORM SUPPORT):

o Same support for all levels of abstraction

o Subsets of ancestors not satisfying minimum support are not examined

o Higher support threshold  lose interesting associations at lower abstractions

o Lower support threshold  Many uninteresting associations at higher abstractions

o Alternate Search Strategies

o Level by level independent

 Full breadth search

 No back Ground knowledge in pruning

 Leads to examining lot of infrequent items

o Level-cross filtering by single item

 Examine nodes at level i, only if node at level i-1 is frequent

 Misses frequent items at lower level abstractions (due to reduced support)

o Level-cross filtering by k-itemset

 Examine k-itemsets at level i, only if k-itemset at level i-1 is frequent

 Misses frequent k-itemsets at lower level abstractions (due to reduced

support)

o Controlled level-cross filtering by singe item

o A modified level-cross filtering by singe item

o Sets a level passage threshold for every levels

o Allows the inspection of lower abstractions, even if its ancestor fails to satisfy
min_sup threshold

Computer  Printer

(At same Abstraction level)

Computer  InkJet Printer (Cross level Association rules)

(At Different Abstraction level)

Redundancy:

Laptop computer  InkJet Printer

(Support = 10 % , confidence = 70%)

HP Laptop Computer  InkJet Printer

(Support = 5 % , confidence = 68%)

o Second one is redundant due to the existing ancestor relationship

Multi Dimensional Association Rules – Concepts:

=>Rules involving more than one dimensions or predicates

• buys (X, “IBM Laptop Computer”)  buys (X, “HP Inkjet Printer”)

(Single dimensional)

• age (X, “20 ..25” ) and occupation (X, “student”)  buys (X, “HP Inkjet
Printer”)

(Multi Dimensional- Inter dimension Association Rule)

• age (X, “20 ..25” ) and buys (X, “IBM Laptop Computer”) buys (X, “HP Inkjet
Printer”)

(Multi Dimensional- Hybrid dimension Association Rule)

• Attributes can be categorical or quantitative

• Quantitative attributes are numeric and incorporates hierarchy (age, income..)

• Numeric attributes must be discretized

• 3 different approaches in mining multi dimensional association rules

o Using static discretization of quantitative attributes

o Using dynamic discretization of quantitative attributes

o Using Distance based discretization with clustering

Mining using Static Discretization:

• Discretization is static and occurs prior to mining

• Discretized attributes are treated as categorical

• Use apriori algorithm to find all k-frequent predicate sets

• Every subset of frequent predicate set must be frequent

• If in a data cube the 3D cuboid (age, income, buys) is frequent implies (age, income),
(age,buys), (income, buys)

Mining using Dynamic Discretization:

• Known as Mining Quantitative Association Rules

• Numeric attributes are dynamically discretized

• Consider rules of type

Aquan1 Λ Aquan2  Acat

(2D Quantitative Association Rules)

age(X,”20…25”) Λ income(X,”30K…40K”)  buys (X, ”Laptop Computer”)

• ARCS (Association Rule Clustering System)An Approach for mining quantitative

association rules.

• 2 step mining process

o Perform clustering to find the interval of attributes involved

o Obtain association rules by searching for groups of clusters that occur together
• The resultant rules must satisfy

o Clusters in the rule antecedent are strongly associated with clusters of rules in
the consequent

o Clusters in the antecedent occur together

o Clusters in the consequent occur together

Mining Multilevel Association Rules
No ratings yet
Mining Multilevel Association Rules
11 pages
UNIT 5 Frequent Pattern Mining
No ratings yet
UNIT 5 Frequent Pattern Mining
42 pages
Unit3mining Association Rules
No ratings yet
Unit3mining Association Rules
21 pages
Topic6 - Pattern Mining Advanced Methods
No ratings yet
Topic6 - Pattern Mining Advanced Methods
21 pages
Patterning in Multilevel and Multidimensional Space
No ratings yet
Patterning in Multilevel and Multidimensional Space
14 pages
DM Unit-2
No ratings yet
DM Unit-2
22 pages
Frequent Pattern Mining Techniques
No ratings yet
Frequent Pattern Mining Techniques
31 pages
Mining Frequent Itemset-Association Analysis
No ratings yet
Mining Frequent Itemset-Association Analysis
59 pages
Mining Various Kinds of Association Rules
No ratings yet
Mining Various Kinds of Association Rules
11 pages
Mining Frequent Patterns, Association and Correlations
No ratings yet
Mining Frequent Patterns, Association and Correlations
42 pages
Mining Association Rules Overview
No ratings yet
Mining Association Rules Overview
81 pages
Feature Extraction and Reduction by Using ModifiedApriori Algorithm
No ratings yet
Feature Extraction and Reduction by Using ModifiedApriori Algorithm
9 pages
New Association Rule
No ratings yet
New Association Rule
37 pages
Association Rule Mining Explained
No ratings yet
Association Rule Mining Explained
16 pages
Lecture 2.3.7
No ratings yet
Lecture 2.3.7
17 pages
Multi-Level Association Rule Mining
No ratings yet
Multi-Level Association Rule Mining
32 pages
Multilevel and Multidimensional Data Mining
No ratings yet
Multilevel and Multidimensional Data Mining
7 pages
DM - Unit II
No ratings yet
DM - Unit II
65 pages
Mining Multilevel Association Rules From Transactional Databases
No ratings yet
Mining Multilevel Association Rules From Transactional Databases
46 pages
Inbound 5799672056943946753
No ratings yet
Inbound 5799672056943946753
47 pages
Market Basket Analysis and Patterns
No ratings yet
Market Basket Analysis and Patterns
43 pages
Mining Frequent Patterns Ubnit 3
No ratings yet
Mining Frequent Patterns Ubnit 3
25 pages
Fast Multilevel Association Rule Mining
No ratings yet
Fast Multilevel Association Rule Mining
7 pages
Data Mining: Concept Descriptions & Rules
No ratings yet
Data Mining: Concept Descriptions & Rules
9 pages
Rani 2
No ratings yet
Rani 2
98 pages
Understanding Association Rule Mining
No ratings yet
Understanding Association Rule Mining
12 pages
Association Rule Mining Techniques
No ratings yet
Association Rule Mining Techniques
41 pages
Dmbi
No ratings yet
Dmbi
9 pages
Market Basket Analysis and Itemsets Explained
No ratings yet
Market Basket Analysis and Itemsets Explained
11 pages
DMDW U3
No ratings yet
DMDW U3
16 pages
FP-tree Multilevel Association Mining
No ratings yet
FP-tree Multilevel Association Mining
7 pages
6 Asso
No ratings yet
6 Asso
37 pages
Association Rule Mining Techniques
No ratings yet
Association Rule Mining Techniques
86 pages
Association Analysis and Frequent Sequential Pattern Mining-Apriori Algorithm
No ratings yet
Association Analysis and Frequent Sequential Pattern Mining-Apriori Algorithm
13 pages
Understanding the Apriori Algorithm
No ratings yet
Understanding the Apriori Algorithm
59 pages
Data Mining For Supermarket Sale Analysis Using Association Rule
No ratings yet
Data Mining For Supermarket Sale Analysis Using Association Rule
5 pages
Overview of Association Rule Mining Techniques
No ratings yet
Overview of Association Rule Mining Techniques
82 pages
Lecture 8-9 Association Rule Mining
No ratings yet
Lecture 8-9 Association Rule Mining
21 pages
Lecture 2.3.1 2.3.2
No ratings yet
Lecture 2.3.1 2.3.2
23 pages
DMKD Module4 Part-B
No ratings yet
DMKD Module4 Part-B
17 pages
Probability and Statistics Mansoura Day3
No ratings yet
Probability and Statistics Mansoura Day3
31 pages
Association Rule Mining Fundamentals
No ratings yet
Association Rule Mining Fundamentals
4 pages
DM C6 AssociationRule Apriori
No ratings yet
DM C6 AssociationRule Apriori
33 pages
Association Rule Mining Techniques
No ratings yet
Association Rule Mining Techniques
45 pages
Association Rule Mining
No ratings yet
Association Rule Mining
72 pages
Overview of the Apriori Algorithm
No ratings yet
Overview of the Apriori Algorithm
27 pages
Understanding Association Rules in Data Mining
No ratings yet
Understanding Association Rules in Data Mining
12 pages
Concept Description & Rule Mining
No ratings yet
Concept Description & Rule Mining
58 pages
RST Approach For Efficient CARs Mining
No ratings yet
RST Approach For Efficient CARs Mining
7 pages
Data Mining Question Bank
100% (1)
Data Mining Question Bank
3 pages
Association Rule Mining and Market Basket Analysis
No ratings yet
Association Rule Mining and Market Basket Analysis
15 pages
CIS664-Knowledge Discovery and Data Mining
No ratings yet
CIS664-Knowledge Discovery and Data Mining
74 pages
Mining Association Rules in Databases
No ratings yet
Mining Association Rules in Databases
77 pages
Data Generalization and Characterization Techniques
No ratings yet
Data Generalization and Characterization Techniques
9 pages
Association Rule Mining Overview
No ratings yet
Association Rule Mining Overview
13 pages
Advanced Frequent Pattern Mining Guide
No ratings yet
Advanced Frequent Pattern Mining Guide
59 pages
Market Basket Analysis
No ratings yet
Market Basket Analysis
86 pages
Market Basket Analysis Insights
No ratings yet
Market Basket Analysis Insights
7 pages
Data Mining Course Overview and Outline
No ratings yet
Data Mining Course Overview and Outline
71 pages
ML & DA Unit3
No ratings yet
ML & DA Unit3
25 pages
Data Mining Concepts and Techniques
No ratings yet
Data Mining Concepts and Techniques
2 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
33 pages
Multi-Class Imbalanced Data Mining Method
No ratings yet
Multi-Class Imbalanced Data Mining Method
79 pages
DM
No ratings yet
DM
7 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
413 pages
DMA Question Bank
No ratings yet
DMA Question Bank
4 pages
Bca ML I
No ratings yet
Bca ML I
26 pages
"Fast Algorithms For Mining Association Rules" by Rakesh Agarwal Ramakrishnan Srikant
No ratings yet
"Fast Algorithms For Mining Association Rules" by Rakesh Agarwal Ramakrishnan Srikant
5 pages
Apriori Algorithm for Association Rule Mining
No ratings yet
Apriori Algorithm for Association Rule Mining
17 pages
Is 702 A ML Notes
No ratings yet
Is 702 A ML Notes
100 pages
Introduction to Data Mining Concepts
No ratings yet
Introduction to Data Mining Concepts
28 pages
List Data Warehouse Models With Example
No ratings yet
List Data Warehouse Models With Example
19 pages
Overview of Temporal Data Mining Techniques
No ratings yet
Overview of Temporal Data Mining Techniques
4 pages
Web Data Analytics Practical Journal
No ratings yet
Web Data Analytics Practical Journal
55 pages
Café Chain Data Analysis Project
0% (1)
Café Chain Data Analysis Project
2 pages
Data Mining Course Overview
No ratings yet
Data Mining Course Overview
38 pages
Analyzing Internet Traffic with Benford's Law
No ratings yet
Analyzing Internet Traffic with Benford's Law
21 pages
Sem 4 Important Question
No ratings yet
Sem 4 Important Question
13 pages
R Programming in Fashion Analytics
No ratings yet
R Programming in Fashion Analytics
34 pages
MACHINE LEARNING BE 7th SEM PDF
No ratings yet
MACHINE LEARNING BE 7th SEM PDF
10 pages
Groceries Dataset Analysis Guide
No ratings yet
Groceries Dataset Analysis Guide
2 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
8 pages
DMDW Question Bank
No ratings yet
DMDW Question Bank
17 pages
ECLAT Algorithm For Frequent Item Sets Generation: January 2014
No ratings yet
ECLAT Algorithm For Frequent Item Sets Generation: January 2014
4 pages
Truncated Doc 4
No ratings yet
Truncated Doc 4
3 pages
FP Growth Algorithm Example Explained
No ratings yet
FP Growth Algorithm Example Explained
21 pages

Multi Level Association Rules

Uploaded by

Multi Level Association Rules

Uploaded by

Support for an itemset X in a transactional database D is defined as count(X) / |D|.

For an association rule X Þ Y, we can calculate

support(X Þ Y) = support(X U Y) = support(X union Y).

support(X Þ Y) = P(X U Y).

Multi Level Association Rules – Concepts:

o Rules Generated from mining data at different levels of abstraction

o Essential to mine at different levels, in supporting business decision making

o Massive amount of data highly sparse at the primitive level

o Rules at high concept level adds to common sense

o Rules at low concept level may not be interesting always

o Items in task relevant data will be primitive

o Primitive data items occurs least frequently

buys (laptop computer)  buys (inkjet printer)

buys (computer)  buys (printer)

o Support- Confidence Framework

o Top down Strategy, in accumulating counts

o Algorithms – Apriori & it’s variations

o Uniform support for all levels

o Reduced Support at lower levels

Mining (UNIFORM SUPPORT):

o Same support for all levels of abstraction

o Subsets of ancestors not satisfying minimum support are not examined

o Higher support threshold  lose interesting associations at lower abstractions

o Lower support threshold  Many uninteresting associations at higher abstractions

o Level by level independent

 Full breadth search

 No back Ground knowledge in pruning

 Leads to examining lot of infrequent items

o Level-cross filtering by single item

 Examine nodes at level i, only if node at level i-1 is frequent

 Misses frequent items at lower level abstractions (due to reduced support)

o Level-cross filtering by k-itemset

 Examine k-itemsets at level i, only if k-itemset at level i-1 is frequent

 Misses frequent k-itemsets at lower level abstractions (due to reduced

o Controlled level-cross filtering by singe item

o A modified level-cross filtering by singe item

o Sets a level passage threshold for every levels

(At same Abstraction level)

(At Different Abstraction level)

Laptop computer  InkJet Printer

(Support = 10 % , confidence = 70%)

HP Laptop Computer  InkJet Printer

(Support = 5 % , confidence = 68%)

o Second one is redundant due to the existing ancestor relationship

Multi Dimensional Association Rules – Concepts:

(Multi Dimensional- Inter dimension Association Rule)

(Multi Dimensional- Hybrid dimension Association Rule)

• Attributes can be categorical or quantitative

• Quantitative attributes are numeric and incorporates hierarchy (age, income..)

• Numeric attributes must be discretized

• 3 different approaches in mining multi dimensional association rules

o Using static discretization of quantitative attributes

o Using dynamic discretization of quantitative attributes

o Using Distance based discretization with clustering

Mining using Static Discretization:

• Discretization is static and occurs prior to mining

• Discretized attributes are treated as categorical

• Every subset of frequent predicate set must be frequent

Mining using Dynamic Discretization:

• Known as Mining Quantitative Association Rules

• Numeric attributes are dynamically discretized

• Consider rules of type

Aquan1 Λ Aquan2  Acat

(2D Quantitative Association Rules)

age(X,”20…25”) Λ income(X,”30K…40K”)  buys (X, ”Laptop Computer”)

• ARCS (Association Rule Clustering System)An Approach for mining quantitative

• 2 step mining process

o Perform clustering to find the interval of attributes involved

o Clusters in the antecedent occur together

o Clusters in the consequent occur together

You might also like