You are on page 1of 16

L/O/G/O

www.themegallery.com
Clustering
Algoritmos de agrupamiento
Clasificar
Clasificar
consiste en hacer una particin
de un conjunto de objetos
en categoras
Clasificar
un objeto en un grupo es similar
a cualquier otro del mismo grupo,
y objetos en distintos grupos
tienden a ser diferentes
Clasificar
Caractersticas
Cada objeto es observado mediante
un conjunto de variables
cuantitativas que reflejan las
cualidades fundamentales del
mismo.
Clasificacin supervisada
Clasificacin no supervisada
1
2
Tipos de Clasificacin
Tipos de Clasificacin
Supervisada
No supervisada
se dispone de un conjunto de objetos, donde se desconoce tanto el
nmero de clases en que es razonable particionarlo as como a qu clase
pertenece cada objeto.
Ya existe un conjunto de objetos clasificados en un conjunto de clases
dado, y se conoce la clase a la que cada objeto pertenece.
Clasificacin no
supervisada
Significativamente
ms complejo que el
de la supervisada
ya que se
desconocen las
clases naturales, y
depender de la
habilidad para
seleccionar:
No supervisada
2.
La metodologa
de clasificacin
1.
las caractersticas
que representan al
objeto
Clasificacin no
supervisada
Agrupar un conjunto de n objetos, definidos por p
variables (caractersticas), en c clases, donde en cada
clase los elementos posean caractersticas afines y sean
ms similares entre s que respecto a elementos
pertenecientes a otras clases.
Clasificacin no
supervisada
La similitud entre observaciones se establece en
trminos de distancias.
El nmero c, de clases puede estar preestablecido
o no, y depende del mtodo elegido.
Algoritmos de
agrupamiento (Clustering)
La definicion de Clustering difiere segn el punto
de vista filosfico.
Top-down: es la segmentacin de una poblacin heterognea,
en un nmero de grupos ms homogneos.
Bottom-up: consiste en encontrar grupos en un conjunto de
datos, segn un criterio natural de similitud.
Algoritmos de
agrupamiento (Clustering)
Los objetos son agrupados basados en el
principio de maximizar la similitud interna
de la clase, y minimizar la similitud entre
clases.
Lo algoritmos jerrquicos introducen el principio
de jerarquias entre custers, mientras que en los
planos, todos los cluster son iguales.
Jerrquico o
Plano
Iterativo
Duros o
Suaves
El algoritmo parte de clusters iniciales y los
va mejorando mediante la reasignacin de
instancias a los clusters
Los duros asignan cada instancia a un
cluster. Los suaves asignan a cada instancia
la probabilidad de pertenercer a un cluster
Los algoritmos de agrupamiento pueden tener varias propiedades:
Propiedades
Disyuntivo
Las instancias pueden ser parte de mas de
un cluster
Clasificacin
Exclusivos Solapados
Jerrquicos
Probabilsticos
Basado en la unin de
clusters por su cercania.
Ejemplo: Single-Linkage
Clustering
Cada objeto pertenece a un
nico cluster
Ejemplo: k-means
Cada objeto pertenece a dos o
ms clusters, con diferente
grado de pertenencia.
Ejemplo: Fuzzy c-means
Presenta un enfoque
probabilstico
Ejemplo: Mixture of Gaussians
K-means
Iterar hasta que
los centros de
los clusters no
cambien.
Paso 2
Seleccionar de manera aleatoria k puntos como
los centros (centroides) de los clusters.
Paso 3
Asignar cada instancia al cluster cuyo centro es
ms cercano usando distancia euclidiana.
Paso 4
Recalcular los centroides (media) para cada
cluster, y usarlos como los nuevos centroides.
Paso 5
Reasignar todas las instancias al cluster cuyo
centro es ms cercano. Iterar hasta que los
centros de los clusters no cambien.
Paso 1
Seleccionar de manera aleatoria k puntos como
los centros (centroides) de los clusters.
L/O/G/O
www.themegallery.com
Gr aci as
G r a c i a s

You might also like