You are on page 1of 3

Visin Artificial

Nombre: Byron Montero


Tema: Base de datos MNIST
Introduccin:
La base de datos MNIST constituye un estndar a la hora de testear y comparar mtodos
de reconocimiento de dgitos manuscritos. La misma contiene 7000 imgenes de
nmeros escritos a mano que incluyen diferentes estilos de escritura, extrados de un
conjunto mucho mayor de patrones manuscritos provistos por NIST, National Institute
of Standars and Technology, organismo que depende del Departamento de Comercio de
los Estados Unidos. El nombre de la base proviene de Modified NIST.
MNIST presenta dos conjuntos de patrones rotulados, uno de entrenamiento constituido
por 60000 imgenes, y otro de testeo, de 1000 imgenes. Cada imagen presenta un
tamao de 28x28 pixeles y est representada en escala de grises de 256 valores. Esta
base de datos es de acceso libre. Para obtener las imgenes, los patrones originales en
blanco y negro fueron normalizados en tamao a 20X20 pixeles, preservando su forma.
Se obtienen imgenes en escala de grises que luego son centradas en patrones de tamao
28x28.
Desarrollo:
La MNIST es una gran base de datos de dgitos escritos a mano que se utiliza
comnmente para el procesamiento de imgenes de sistemas. La base de datos tambin
es ampliamente utilizado para el entrenamiento y las pruebas en el campo
de aprendizaje automtico . Fue hereda por "re-mezclar" las muestras de conjuntos de
datos originales del NIST. Los creadores sintieron que la formacin de datos del NIST
fue tomada de American Bureau de Censos de los empleados, mientras que el conjunto
de datos de prueba se tom de los estudiantes estadounidenses de secundaria, el
conjunto completo de datos del NIST era demasiado duro. Por otra parte, las imgenes
en blanco y negro de NIST se normalizaron a caber en un cuadro de lmite de pxeles
20x20 y suavizado , que introdujo los niveles de escala de grises.
La base de datos contiene 60.000 imgenes de entrenamiento y 10.000 imgenes de
prueba. La mitad del conjunto de entrenamiento y la mitad de la prueba establecidos se
tomaron de la formacin de datos del NIST, mientras que la otra mitad del conjunto de
entrenamiento y la otra mitad de la prueba establecido se tomaron conjunto de datos de
las pruebas de NIST.
Ha habido un nmero de trabajos cientficos sobre los intentos de lograr la tasa de error
ms baja, utilizando un sistema jerrquico de las redes neuronales convolucionales , se
las arregla para conseguir una tasa de error en la base de datos MNIST de 0,23 por
ciento. Los creadores originales de la base de datos mantienen una lista de algunos de
los mtodos probados en l.
Conjunto de datos:

El conjunto de imgenes en la base de datos MNIST es una combinacin de dos de las


bases de datos del NIST: Base Especial 1 y base de datos especial 3. Base de datos
especial 1 y base de datos especial 3 consisten de dgitos escritos por estudiantes de
secundaria y empleados de la Oficina del Censo de Estados Unidos , respectivamente.
Rendimiento:
Algunos investigadores han logrado "un rendimiento casi humano" en la base de datos
MNIST, utilizando un conjunto de las redes neuronales; en el mismo artculo, los
autores logran un rendimiento del doble que la de los seres humanos en otras tareas de
reconocimiento. La tasa de error ms alto enumerado en el sitio web original de la base
de datos es de 12%, lo que se consigue sin procesamiento previo mediante un SVM con
una red neuronal 1-capa.
Una tasa de error mejor de los casos de 0,42% se logr sobre la base de datos por los
investigadores utilizando un nuevo clasificador llamado la lira, que es un clasificador
neural con tres capas de neuronas basadas en principios perceptrn de Rosenblatt.
Algunos investigadores han probado sistemas de inteligencia artificial utilizando la base
de datos sometidos a distorsiones aleatorias. Los sistemas en estos casos son por lo
general redes neuronales y las distorsiones tienden a ser utilizados ya sea distorsiones
afines o distorsiones elsticas . A veces, estos sistemas pueden ser muy exitoso; Uno de
tales sistemas alcanz una tasa de error en la base de datos de 0,39%.
En 2011, una tasa de error del 0,27%, mejorando el mejor resultado, fue informado por
los investigadores que utilizan un sistema similar de las redes neuronales. En 2013, un
enfoque basado en la regularizacin de las redes neuronales utilizando DropConnect ha
sido reclamado para lograr una tasa de error de 0,21%.
Clasificadores:
Esta es una tabla de algunos de los mtodos de aprendizaje de mquina utilizados en la
base de datos y sus tasas de error, por tipo de clasificador:

Tipo

Clasificador

Preprocesamient
o

Clasificador
lineal

Clasificador lineal por parejas

Restablecimiento

K-vecinos
cercanos

ms K-NN con deformacin no


Bordes desplazables
lineal (P2DHMDM)

Tasa de
error
(%)

7,6 [ 9 ]

0,52 [ 14 ]

Preprocesamient
o

Tipo

Clasificador

Tocones
Impulsado

Producto de tocones en cuenta


Haar cuenta
Haar

No
lineal 40 PCA
clasificador
cuadrtico

Soporte
mquinas
vectores

Red neuronal

clasificador

Ninguno

de
Virtual SVM , deg-9 poli, 2
de
Restablecimiento
pxeles jittered

6 capas NN 784-2500-20001500-1000-500-10 (en GPU ), Ninguno


con distorsiones elsticas

Comit de 35 conv. red, 1-20Red


neural
Normalizaciones
P-40-P-150-10,
con
convolucional
Ancho
distorsiones elsticas

Tasa de
error
(%)

0.87 [ 15 ]

3,3 [ 9 ]

0,56 [ 16 ]

0,35 [ 17 ]

0,23 [ 8 ]

Conclusin:

La base de datos MNIST es una herramienta poderosa en el rea de visin


artificial ya que permite realizar mltiples aplicaciones de entrenamiento y
reconocimiento, para obtener un menor error es necesario usar diferentes tipos
de clasificadores los cuales facilitaran el aprendizaje de la mquina.

Bibliografa:

http://itzamna.bnct.ipn.mx:8080/dspace/bitstream/123456789/5586/1/APLICAC
IONMODELOS.pdf
http://www.kurims.kyotou.ac.jp/EMIS/journals/RCE/body/v31n1a02SanchezOsorioSuarez.pdf
http://dc.uba.ar/inv/tesis/doctorado/TesisDocLSeijas2011.pdf/at_download/file

You might also like