Data Mining Intro 1

Uploaded by

Neeru Redhu

0% found this document useful (0 votes)

15 views13 pages

Basic introduction to data mining algorithms

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Basic introduction to data mining algorithms

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

15 views13 pages

Data Mining Intro 1

Uploaded by

Neeru Redhu

Basic introduction to data mining algorithms

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 13

Search inside document

Data Mining: Introduction

BIF 515
Neeru Redhu
CCS HAU
Data mining : finding hidden information in a
database
Also called as exploratory data analysis, data driven
discovery and deductive learning

SQL is used for traditional database queries

Datamining access vs Traditional access

Query: might not be well formed or precisely stated

Data: have been cleansed and modified to better
support the mining process
Output: output might not be a subset of the
database.
Algorithms attempt to fit a model to the data
o Examine the data
o Determine a model that is closest to the characteristics of the data

Data mining algorithms

o Model
o Preference
o Search

E.g. Credit card companies

Data Mining
Datamining

Predictive Descriptive

Time
Classificati Regressio
series Prediction
on n
analysis
Summariz Association Sequence
Clustering
ation rules Discovery
Predictive model
o Makes prediction about values of data using known
results found from the data

o E.g use of credit card history

Descriptive Model
o Identifies pattern and relationships in data

o Serves as a way to explore the properties of data

examined not to predict new properties
Basic Data Mining Task
Classification
Maps data into predefined classes
Pattern recognition
Regression
Map a data item to real valued prediction variable
Time Series analysis
Value of attribute is examined as it varies over time
Prediction
Clustering
Unsupervised learning
Summarization
Association Rules
Affinity analysis
Sequence Discovery
Used to determine sequential patterns in data
Knowledge Discovery Database
KDD is process of finding useful information and patterns in
data
Datamining is the use of algorithms to extract the information
and patterns derived by the KDD process

Steps of KDD process

Selection
Preprocessing
Transformation
Data mining
Interpretation / evaluation
Development of Data mining
Induction: used to proceed from very specific knowledge to
general information (AI)
Compression
Querying
Approximation
Search
History of data mining development

Time Contribution
Late 1700s Bayes Theorem of probability
Early 1900s Regression analysis
Early 1920s Maximum likelihood estimate
Early 1940 1950s Neural networks and nearest neighbor, perceptron, jack knife
estimator
1960s ML started, decision trees, clustering, relational data model
1970s SMART IR systems, genetic algorithms, K-means clustering
1980s Kohonen self-organizing maps
1990s Association rules, data warehousing, (Online Analytic
Processing) OLAP
Data Mining Issues
Human Interaction
Overfitting
Outliers
Interpretations of results
Visualization of results
Large Datasets
High Dimensionalty
Multimedia data
Missing data
Irrelevant data
Noisy data
Integration
Application
Implementation issues
Scalablity
Real world data
Update
Ease of use
END
Questions?

3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
Document37 pages
3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
ANIRUDH B K 19BIT0348
No ratings yet
3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
Document37 pages
3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
ANIRUDH B K 19BIT0348
No ratings yet
Fundamentals of Data Mining: Dr. Jasim Saeed Jasim - Saeed@riphah - Edu.pk
Document15 pages
Fundamentals of Data Mining: Dr. Jasim Saeed Jasim - Saeed@riphah - Edu.pk
Noman Saleem
No ratings yet
DM 1 PDF
Document67 pages
DM 1 PDF
Rahul Pawar
No ratings yet
Introduction To Data Mining
Document44 pages
Introduction To Data Mining
Muhammad Ramzan
No ratings yet
Slide01 PDF DataMining - S
Document103 pages
Slide01 PDF DataMining - S
Jarir Ahmed
No ratings yet
ICS 2408 Lecture 1 Introduction
Document32 pages
ICS 2408 Lecture 1 Introduction
petergitagia9781
No ratings yet
Data Mining Week 1: Introduction, Association Rules
Document79 pages
Data Mining Week 1: Introduction, Association Rules
Babita rajput
No ratings yet
Data Mining and Warehousing: An Overview
Document15 pages
Data Mining and Warehousing: An Overview
kdeepanraj
No ratings yet
DM 1
Document78 pages
DM 1
Aditya Srivastava
No ratings yet
Lec 1
Document48 pages
Lec 1
sayantikaroy217
No ratings yet
Internal
Document267 pages
Internal
fdknkndf
No ratings yet
DataMining S
Document103 pages
DataMining S
Barsha Roy
No ratings yet
COMP6140 Data Mining Course Introduction
Document24 pages
COMP6140 Data Mining Course Introduction
destinatt
No ratings yet
DM Introduction
Document32 pages
DM Introduction
That was Epic
No ratings yet
Lecture 1
Document17 pages
Lecture 1
Subhashini Reddy
No ratings yet
Data Science Course with Python, R, ML & AI
Document10 pages
Data Science Course with Python, R, ML & AI
Saikumar Reddy
No ratings yet
Grading and Exams in Intro to Data Mining
Document11 pages
Grading and Exams in Intro to Data Mining
Shruti Sharma
No ratings yet
Data Mining Key Concepts and Applications
Document20 pages
Data Mining Key Concepts and Applications
Hardik Dangiya
No ratings yet
ADBMS Chapter No. 6
Document24 pages
ADBMS Chapter No. 6
Notes
No ratings yet
Unit 1: Data Warehousing & Data Mining
Document54 pages
Unit 1: Data Warehousing & Data Mining
Kunal Ranjan
No ratings yet
Data Warehousing & Data Mining: An Introduction
Document54 pages
Data Warehousing & Data Mining: An Introduction
artemis
No ratings yet
DM Chap1 Introduction
Document36 pages
DM Chap1 Introduction
Engin Öner
No ratings yet
Unit1 Part1 Class
Document23 pages
Unit1 Part1 Class
Cheapnbest outlet
No ratings yet
Data Mining and Warehousing Course Outline
Document40 pages
Data Mining and Warehousing Course Outline
Harsha Gangwani
No ratings yet
Chapter-1 - Introduction To Data Mining
Document10 pages
Chapter-1 - Introduction To Data Mining
Mustefa Mohammed
No ratings yet
1712060004 (1)
Document25 pages
1712060004 (1)
Rishabh Jain
No ratings yet
Lecture1 IntroductionDataMining
Document28 pages
Lecture1 IntroductionDataMining
insaan
No ratings yet
CS699 Introduction to Data Mining
Document50 pages
CS699 Introduction to Data Mining
t na
No ratings yet
Data Mining
Document29 pages
Data Mining
Miel9226
No ratings yet
1intro - Data Mining
Document61 pages
1intro - Data Mining
Ansh Surti
No ratings yet
Lec1 Introduction
Document20 pages
Lec1 Introduction
Shanti Grover
No ratings yet
Data Mining Overview: Techniques and Applications
Document30 pages
Data Mining Overview: Techniques and Applications
Ashish Sakpal
No ratings yet
p144 Data Mining
Document11 pages
p144 Data Mining
jnanesh582
100% (3)
Data Mining Introductiondifferent
Document83 pages
Data Mining Introductiondifferent
gilloteen
No ratings yet
ALL PH.D - CourseSyllabus
Document27 pages
ALL PH.D - CourseSyllabus
VIPIN KUMAR MAURYA
No ratings yet
Introduction To Data Mining: Dr. Dipti Chauhan Assistant Professor SCSIT, SUAS Indore
Document16 pages
Introduction To Data Mining: Dr. Dipti Chauhan Assistant Professor SCSIT, SUAS Indore
roochin
No ratings yet
Data Mining:: Concepts and Techniques
Document32 pages
Data Mining:: Concepts and Techniques
Zarnab sarfraz
No ratings yet
ITS 3233 Business Intelligent: Data Mining
Document12 pages
ITS 3233 Business Intelligent: Data Mining
yanani
No ratings yet
Unit 4 Intro DM
Document30 pages
Unit 4 Intro DM
Juee Jamsandekar
No ratings yet
Dataminig
Document21 pages
Dataminig
mba20238
No ratings yet
Data Mining: Confluence of Multiple Disciplines
Document4 pages
Data Mining: Confluence of Multiple Disciplines
Rohan Aggarwal
0% (1)
Unit 1 - Big Data Technologies
Document89 pages
Unit 1 - Big Data Technologies
prakash N
No ratings yet
Introduction to Data Mining Concepts and Techniques
Document323 pages
Introduction to Data Mining Concepts and Techniques
Sruthy Rajendhren
No ratings yet
Data Mining & Data Warehousing Course
Document22 pages
Data Mining & Data Warehousing Course
فخامة مبرمج
No ratings yet
Data Science: Key Concepts and Algorithms
Document11 pages
Data Science: Key Concepts and Algorithms
Fahmida Akter
No ratings yet
Chap 1
Document32 pages
Chap 1
api-27259648
No ratings yet
Data Mining Overview
Document14 pages
Data Mining Overview
Anjana Udhayakumar
No ratings yet
Data Mining
Document27 pages
Data Mining
TestingAcc
No ratings yet
Unit I DM
Document27 pages
Unit I DM
Suganthi D PSGRKCW
No ratings yet
Data Mining Mod1
Document128 pages
Data Mining Mod1
asnaparveen414
No ratings yet
Data Mining Models and Tasks
Document6 pages
Data Mining Models and Tasks
navaneethangceb
No ratings yet
Lec2 3
Document16 pages
Lec2 3
Eslam Sayed Galal
No ratings yet
Business Intelligence Data Mining: (John Naisbett)
Document60 pages
Business Intelligence Data Mining: (John Naisbett)
Alexandra Rotaru
No ratings yet
Challan Form
Document72 pages
Challan Form
so fd
No ratings yet
Introduction To Data Mining: Masagung P. Hadi
Document12 pages
Introduction To Data Mining: Masagung P. Hadi
Eka Dewi Fitriani
No ratings yet
DM BS Lec1 Intro
Document20 pages
DM BS Lec1 Intro
Ejaz Ahmed
No ratings yet
Data Mining by Worapoj Kreesuradej
Document43 pages
Data Mining by Worapoj Kreesuradej
Vijayalakshmi Vengattaramane
No ratings yet
Lecture 1
Document31 pages
Lecture 1
khatri81
No ratings yet
Data Mining for the Social Sciences: An Introduction
From Everand
Data Mining for the Social Sciences: An Introduction
Paul Attewell
No ratings yet
Microarray Technology: Applications and Analysis
Document55 pages
Microarray Technology: Applications and Analysis
Neeru Redhu
No ratings yet
5 - Arrays
Document20 pages
5 - Arrays
Neeru Redhu
No ratings yet
Genome Functional Annotation
Document24 pages
Genome Functional Annotation
Neeru Redhu
No ratings yet
Trancriptome and Proteome Analysis
Document68 pages
Trancriptome and Proteome Analysis
Neeru Redhu
No ratings yet
Protein Secondary Structure Prediction
Document65 pages
Protein Secondary Structure Prediction
Neeru Redhu
No ratings yet
2 - Constant - Variables and Data Types
Document20 pages
2 - Constant - Variables and Data Types
Neeru Redhu
No ratings yet
Data Preprocessing and Exploring
Document9 pages
Data Preprocessing and Exploring
Neeru Redhu
No ratings yet
4 - Decision Making - Branching and Looping
Document26 pages
4 - Decision Making - Branching and Looping
Neeru Redhu
No ratings yet
Genomic Tools For Crop Improvement
Document41 pages
Genomic Tools For Crop Improvement
Neeru Redhu
No ratings yet
03 - BIF 506 (Storage and Memory Devices)
Document37 pages
03 - BIF 506 (Storage and Memory Devices)
Neeru Redhu
No ratings yet
3 - Operators and Expressions
Document27 pages
3 - Operators and Expressions
Neeru Redhu
No ratings yet
Algorithms in Bioinformatics
Document315 pages
Algorithms in Bioinformatics
Neeru Redhu
No ratings yet
What Is String Theory
Document154 pages
What Is String Theory
yana_b
No ratings yet
02 - BIF 506 (I O Devices)
Document36 pages
02 - BIF 506 (I O Devices)
Neeru Redhu
No ratings yet
01 - BIF 506 (Fundamentals of Computing)
Document36 pages
01 - BIF 506 (Fundamentals of Computing)
Neeru Redhu
No ratings yet
A Primer To Phylogenetic Analysis Using The PHYLIP Package: Jarno Tuimala Fifth Edition
Document55 pages
A Primer To Phylogenetic Analysis Using The PHYLIP Package: Jarno Tuimala Fifth Edition
Susana Santos
No ratings yet
04 - BIF 506 (Computer Software)
Document32 pages
04 - BIF 506 (Computer Software)
Neeru Redhu
No ratings yet
Consequences of Biodiversity
Document16 pages
Consequences of Biodiversity
Neeru Redhu
No ratings yet
Abstracts Book Part II
Document148 pages
Abstracts Book Part II
Neeru Redhu
No ratings yet
Zinc Finger Ras Mol Exercisewithanswers
Document1 page
Zinc Finger Ras Mol Exercisewithanswers
Neeru Redhu
No ratings yet
Algorithms, Flowcharts, Data Types and Pseudo Code
Document22 pages
Algorithms, Flowcharts, Data Types and Pseudo Code
Lim Jun Xin
100% (2)
Exercises For Phylogeny: Exercise 1. Parsimony and Rooted Versus Unrooted Trees
Document11 pages
Exercises For Phylogeny: Exercise 1. Parsimony and Rooted Versus Unrooted Trees
Neeru Redhu
No ratings yet
Rusinko
Document10 pages
Rusinko
Neeru Redhu
No ratings yet
Ownership Structure
Document31 pages
Ownership Structure
Zain Naqvi
No ratings yet
Sources of Information: Targeted Selection The Art of Behavioral Interviewing
Document2 pages
Sources of Information: Targeted Selection The Art of Behavioral Interviewing
Estefania Orellana Taibo
No ratings yet
Measures of Central Tendency & Range
Document1 page
Measures of Central Tendency & Range
Amit Kumar
No ratings yet
Técnicas Histoquímicas
Document202 pages
Técnicas Histoquímicas
Laura B.
No ratings yet
A Case Study On Parking Demand and Supply
Document21 pages
A Case Study On Parking Demand and Supply
Janak Parmar
100% (1)
Generic Letter of Rec - Natalia Lopez Medrano 1
Document2 pages
Generic Letter of Rec - Natalia Lopez Medrano 1
api-460367917
No ratings yet
CSO Olympiad Book For Class 1
Document13 pages
CSO Olympiad Book For Class 1
sakshi
No ratings yet
Introducting Perforce - Helix
Document30 pages
Introducting Perforce - Helix
pankaj@23
No ratings yet
Introduction to Leadership: Defining Leadership
Document59 pages
Introduction to Leadership: Defining Leadership
Hermela Milion
No ratings yet
Unit 9 Daily Agenda
Document51 pages
Unit 9 Daily Agenda
api-309578782
No ratings yet
Behavioural Safety Application Guide
Document52 pages
Behavioural Safety Application Guide
Bobby IM Sibarani
No ratings yet
Red Black Tree Material
Document5 pages
Red Black Tree Material
Avinash Alla
No ratings yet
File
Document141 pages
File
Aero Haroon
No ratings yet
Carandang Federico Pascual Booboo
Document24 pages
Carandang Federico Pascual Booboo
Jing Villareal
No ratings yet
Curtis Hays Whitson NTH PHD Thesis
Document360 pages
Curtis Hays Whitson NTH PHD Thesis
Luis Alberto Izarra
100% (1)
Ashish Nandy
Document304 pages
Ashish Nandy
chaitalide
No ratings yet
AD Validation Guide Vol2 2019 EN PDF
Document576 pages
AD Validation Guide Vol2 2019 EN PDF
keffy_bfk
No ratings yet
Strategic Analysis Report
Document4 pages
Strategic Analysis Report
AXA2000
No ratings yet
A90H BR2013EngLightSteelwork
Document4 pages
A90H BR2013EngLightSteelwork
Kristaps Puļķis
No ratings yet
TF3080 Ref
Document7 pages
TF3080 Ref
Javier
No ratings yet
Topic 1 - Introduction To M&E Systems PDF
Document49 pages
Topic 1 - Introduction To M&E Systems PDF
Syamimi Fsa
No ratings yet
Data Flow Diagram (Music)
Document12 pages
Data Flow Diagram (Music)
Brenda Cox
50% (2)
Descriptive Statistics - Xlstat
Document34 pages
Descriptive Statistics - Xlstat
Emill Rivera Asuncion
No ratings yet
Mathematics Upper Secondary4
Document5 pages
Mathematics Upper Secondary4
fvictor1
No ratings yet
List of Disqualified Candidates
Document4 pages
List of Disqualified Candidates
Muhammad Bilal
No ratings yet
Essays About Hamlet
Document5 pages
Essays About Hamlet
aaqvuknbf
100% (2)
Planning Scheduling Using Primavera
Document10 pages
Planning Scheduling Using Primavera
Mohammed
No ratings yet
PreCalc graph transformations and trigonometry
Document6 pages
PreCalc graph transformations and trigonometry
green286
No ratings yet
Earthing Design Calculations For Solar Power Plant Subsbations
Document8 pages
Earthing Design Calculations For Solar Power Plant Subsbations
Vamsi
100% (1)
Primary & Secondary Data
Document9 pages
Primary & Secondary Data
Maan Usman
No ratings yet