You are on page 1of 112

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERA DE SISTEMAS E INFORMTICA

UNIDAD DE POST GRADO

Sistema inteligente para calificar alpacas en funcin a


su fibra fina

TESIS
para optar el Grado de Magster en Ingenieria de Sistemas con la mencin
de Gestin de la Tecnologa de la Informacin y Comunicaciones.

AUTOR
Sergio Paulo Valcarcel Ascencios

Lima Per
2011
Sistema inteligente para calificar alpacas en
funcin a su fibra fina

Tesis presentada a la Universidad Nacional Mayor


de San Marcos, (Lima - Per), para obtener el Grado
de Magster en Ingeniera de Sistemas, con la
mencin de Gestin de la Tecnologa de la
Informacin y Comunicaciones.

Orientador: Dr. David Mauricio Snchez


Co-orientador: Dr. Jos Espinoza Babiln

UNMSM LIMA
2011

- iv -
Sergio Paulo ValcarcelAscencios, 2011.
Todos los derechos reservados. - v -
FICHA CATALOGRFICA
11/04/2011

SISTEMA INTELIGENTE PARA CALIFICAR ALPACAS EN


FUNCIN DE LA FIBRA

Sergio Paulo Valcarcel Ascencios


Lima Per, 2011.
Orientador: Dr. David Mauricio Snchez.
Co-Orientador: Dr. Jos Espinoza Babiln
Disertacin: Magster en Ingeniera de Sistemas e Informtica.

Universidad Nacional Mayor de San Marcos


Escuela de Posgrado
Facultad de Ingeniera de Sistemas e Informtica, 2011.
Unidad de Posgrado
Pginas: 95 pginas.

- vi -
DEDICATORIA

A mis hermosas hijas: Fiorela y Francesca, que


fueron en todo momento mi fuente de inspiracin y mi
fuerza para resolver este desafo.

A Vania, mi esposa, por su gran amor y por


compartir conmigo un sueo hecho realidad, lleno de
esperanza y crecimiento familiar.

A mi padre (+) Oscar y a mi madre Estilita,


por el ejemplo de vida que me ensearon y por la labor
sacrificada hacia sus hijos en dar lo mejor y guiarnos en
esta vida hacia el camino de la felicidad y el xito.

A Violeta, mi hermana adorada y a mi cuados


Jess, Vicky y Santiago, Alberto. A mis sobrinos(as):
Luca, Alejandro, Valeria, Sebastin y Matas, Katrina y
Gustavo, Margarita, Jerika y Carol, Danitza y Diego,
Alexandra y Juan, Estrellita, y especialmente a todos que
no menciono aqu por razones de espacio, por sus deseos
de xito y cario personal.

A mi suegra: Regina, mi segunda madre. Y a la ta


Teresa, quienes siempre se preocuparon por la realizacin
de este trabajo.

A todos mis queridos tos(as):Pepe y Alicia,


Alfredo & Irene, Guillermo(+), Abelardo y Lucha,
Esteban y Peta, Lucio y Yola, Elas y Blanca(+), Esther,
Ricardo(+), Jos(+)

- vii -
AGRADECIMIENTOS

Al profesor Dr. David Mauricio Snchez, por su orientacin, dedicacin y


esfuerzo desinteresado a este trabajo de investigacin.

Al profesor Dr. Jos Espinoza Babiln, quien me dio la oportunidad y el


apoyo permanente en el camino de la investigacin cientfica.

Al Dr. Zuo Burstein Alva, Profesor Emrito de la UNMSM,por su


importante aporte en este trabajo. Y, sobre todo, por el cario especial que une a
nuestras familias.

A los profesores de la Unidad de Posgrado del FISI de la UNMSM, por la


calidad profesional y la gran experiencia demostrada.

Al grupo humano de la Unidad de Biologa Molecular de la Universidad


Particular Cayetano Heredia, especialmente al MSc. Jorge Rodrguez Bailn y
alMd. Vet. Giancarlo Alvarez, por compartir sus experiencias y conocimientos.

Alos colegas de la UNMSM, Mg. Erick Vicentede Toms, por enriquecer el


conocimiento en ciencias de la computacin. Mg. Hugo Vega Huertas, por su ojo
crtico. Al Mg. Cayo Len Fernndez, por todo el apoyo recibido.

Al profesorMg. Samuel Oporto Daz, un gran amigo, quien me dio los


conocimientos en las tcnicas de inteligencia artificial. AlIng. Csar Mauro Osorio
Zavala, por apoyarme enla realizacin de los experimentos para este trabajo.

A todas aquellas personas que de alguna y otra manera colaboraron con la


realizacin de este trabajo de investigacin.

Y, por encima de todo, doy gracias a nuestro seor Jesucristo y a Dios.

Gracias por todo!

- viii -
Sistema inteligente para calificar alpacas en funcin
a su fibra fina

RESUMEN

En la secuencia de la cadena de valor de la fibra de alpaca,la medicin es


realizada por observacin basada en el conocimiento tradicional. La valorizacin
depende en muchos casos de la experiencia emprica, lo cual dificulta entender la
riqueza intrnseca del hato.Dando como consecuencia vellonespoco sostenibles en el
tiempo.La contribucin principal, pretende comprender el potencial de las alpacas,
no slo por el dimetro de la fibra, sino por sus otras caractersticas, estandarizando
criteriosa travs de los estereotipos.

Este trabajo est sustentado sobre publicaciones relacionadas a las


caractersticas de la fibra en sus diferentes dimensiones, proponiendo unasolucin
que permita asignar un valor caracterstico en los individuos, que resulte equiparable
entre su morfologa y gentica. Diseando un modelo de redes neuronales artificiales
y reglas de asociacin, quehizo posible transformar la percepcin de los expertos en
un valor caracterstico definida por una escala de calificacin.

Se realizaron diferentes ensayos experimentales en Cusco, Puno y Huancayo.


Aplicando la prueba de Friedman, como mtodo de comparacin entre tres
tratamientos. Se utiliz el estadstico (H0, <0.05), como parmetro de decisin.

Finalmente, el artefactorespondi en forma similar a los otros tratamientos,


manteniendo el estndar de la NTP 231.300:2004 y elOFDA-100. Con cierto grado
de madurez, este artefacto puede convertirse en referente nacional y ayudar a la toma
de decisiones en estrategias de mejoramiento de la especie.

Palabras clave: Redes Neuronales Artificiales, Reglas de Asociacin, Fibra Fina,


OFDA.

- ix -
Intelligent system to qualify alpacas in
function his fine fiber

ABSTRACT

In the sequence of the value chain the alpaca fiber, the measurement its made
by observation and supported on classic knowledge. The quality depends in many
cases of empirical experience, difficult to understand the herd intrinsic richness.
Giving due fleece unsustainable in the time. The main contribution aims understand
his alpaca potential. Dont only for fiber diameter, but for his other characteristics
been to standard criteria through of the sterotypes.

This job to be supported of publish relational with fiber characteristics in his


dimensions different, proposing a solve how allow to assign a characteristic value
individuals, resulting comparable between his genetic and morphologic. Designing a
model artificial neural network and rules of association, it made possible to transform
the perception of the experts on characteristics value defined for a scale of qualify.

Were different tests experimental in Cusco, Puno and Huancayo, applying the
test of Friedmann, as method of comparison between three treatments. So used the
statistical (H0, <0.05), as parameter of decision.

Finally, the artifact responded in form similar from others treatments, keeping
the standard NTP 231.300:2004 y el OFDA-100.With true grade of maduraty, this
artifact can become in a national framework and to help to making decision in
strategies of improvement of the species.
.

Keywords: Artificial Neural Network, Rules Association, Fine Fiber, OFDA.

- x -
NDICE

Tabla de Figuras xv
Tabla de Cuadros xvi
Tabla de Acrnimos xvii

Captulo 1: INTRODUCCIN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Antecedentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Declaracin del problema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Objetivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4. Justificacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5. Alcances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.6. Propuesta de la solucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.7. Organizacin de la tesis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Captulo 2: MARCO TERICO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11


2.1. Gentica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2. Fuerzas que afectan las Frecuencias Gnicas . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3. Marcadores Moleculares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4. La Red Neuronal Artificial Back-Propagation (Perceptrn Multicapa). . . . . . 15
2.5. La Regla de Asociacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.6. Mtodo de Minera de Datos: CRISP-DM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.7. Mtodo del Diseo Centrado al Usuario. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

Captulo 3: ESTADO DEL ARTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24


3.1. Morfologa de la Alpaca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2. Mtodos Cuantitativos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3. Modelos Computacionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4. Legislacin Vigente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Captulo 4: INGENIERA DEL ARTEFACTO. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38


4.1. Modelo Conceptual del Artefacto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

- xi -
4.2. Comprensin del Negocio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3. Entendimiento de los Datos......................................................................... 43
4.3.1. Modelos del Sistema: Modelo Alfa..................................................... 45
4.3.1.1. Definicin de las variables de entrada...................................... 45
4.3.1.2. Definicin de las variables de salida......................................... 46
4.3.2. Modelo Beta.............................................................................. 47
4.3.2.1. Definicin de las variables de entrada....................................... 47
4.3.3. Modelo Landa....................................................................................... 49
4.3.3.1. Definicin de las variables de entrada...................................... 49
4.3.3.2. Definicin de las variables de salida......................................... 50
4.4. Preparacin de los Datos............................................................................. 52
4.5. Modelado..................................................................................................... 53
4.5.1. Modelo Alfa.......................................................................................... 54
4.5.1.1. Descripcin y alcance del modelo alfa..................................... 54
4.5.1.2. Topologa de la red................................................................... 54
4.5.1.3. Pruebas..................................................................................... 55
4.5.2. Modelo Beta.......................................................................................... 56
4.5.2.1. Descripcin y alcance del Modelo Beta................................... 56
4.5.2.2. Formacin de las Reglas de Asociacin................................... 56
4.5.3. Modelo Landa....................................................................................... 57
4.5.3.1. Descripcin y alcance del Modelo Landa................................ 57
4.5.3.2. Topologa de la red................................................................... 57
4.5.3.3. Pruebas...................................................................................... 58
4.6. Evaluacin.................................................................................................... 59
4.7. Despliegue................................................................................................... 59
4.8. Especificaciones de Hardware y Software................................................... 60

Captulo 5: CASO DE ESTUDIO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61


5.1. Preparacin de los Datos. . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.1.1. Patrones de Datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.2. Modelado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.2.1. Modelo Alfa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.2.1.1. Ciclo de Aprendizaje. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.2.1.2. Tabla de Contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

- xii -
5.2.1.3. Instancias de Pruebas de Entrenamiento y Validacin. . . . . . . . 64
5.2.2. Modelo Beta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2.2.1. Criterios de Asociacin Vinculante. . . . . . . . . . . . . . . . . . . . . . 65
5.2.2.2. Criterios de Asociacin al Gen de Inters. . . . . . . . . . . . . . . . . . 65
5.2.3. Modelo Landa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.3.1. Ciclo de Aprendizaje. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.3.2. Tabla de Contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2.3.3. Instancias de Pruebas de Entrenamiento y Validacin. . . . . . . . 68
5.3. Evaluacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.3.1. Descripcin del Caso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.3.2. Ejecucin del Caso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.3.3. Anlisis de los Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.3.4. Descripcin de la experimentacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.3.5. Tcnica de Muestreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.3.6. Procedimiento del Experimento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.3.6.1. Objetivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.3.6.2. Mtodo Estadstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.6.3. Elementos de Comparacin. . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.6.4. Mecnica Operativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.7. Prueba de Friedman. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.3.8. Anlisis e Interpretacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

Captulo 6: CONCLUSIONES Y TRABAJOS FUTUROS. . . . . . . . . . . . . . . . . 81


6.1. Conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2. Trabajos Futuros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

REFERENCIA BIBLIOGRAFCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

ANEXOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
A - Glosario de Trminos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
B Oficio N. 0861-2010-INIA-DIA/J del 10 de noviembre. Que autoriza. . . . 90
el uso de las instalaciones para realizar el proceso de experimentacin en campo.

- xiii -
C- Constancia de participacin en el proyecto de investigacin. . . . . . . . . . . . 91
Generacin de ncleos de alpacas reproductores de alta productividad
basados en la seleccin asistida con marcadores genticos de ADN,
financiado por el programa de ciencia y tecnologa FYNCIT PIBAT
2007, en calidad de tesista.
D- Participacin en el II Congreso Peruano de Investigacin de. . . . . . . . . . . . 92
Operaciones y de Sistemas del 4-6 noviembre de 2010, en la
UNSA-Arequipa. En calidad de ponente del trabajo titulado:
Sistema Inteligente para expresar un nivel de calificacin en
poblaciones de alpacas.
E- Consolidado de Lista de Preguntas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
F- Tabla Extendida de Contingencia del Modelo Alfa. . . . . . . . . . . . . . . . . . . . 95
G- Tabla Extendida de Contingencia del Modelo Landa. . . . . . . . . . . . . . . . . . . 96

- xiv -
TABLA DE FIGURAS

Figura 1.1. Distribucin de Camlidos en Sudamrica................................ 02


Figura 1.2. Esquema General del Trabajo de Investigacin......................... 10
Figura 2.1. Muestra de un marcador molecular de microsatlite.. 15
Figura 2.2: Esquema de una Perceptron Multicapa...................................... 16
Figura 2.3. Ciclo de Vida del Modelo Crisp-DM......................................... 19
Figura 2.4. Esquema Metodolgico del desarrollo del Artefacto.... 21
Figura 2.5. Ciclo de Vida del Diseo Centrado al Usuario.......................... 22
Figura 3.1. Grilla de la Muestra que Segmenta a una Alpaca...................... 26
Figura 3.2. Escala del Grosor de la Fibra en Alpacas.................................. 28
Figura 4.1. Esquema del Modelo Conceptual del Artefacto....................... 39
Figura 4.2. Cadena de Valor de la Fibra de Alpaca................ 40
Figura 4.3. Modelo de Stakeholders en la Produccin de Alpaca 42
Figura 4.4. Arquitectura del Motor Algortmico del Artefacto... 44
Figura 4.5. Matriz del Nivel de Calificacin............................................... 51
Figura 4.6. Progreso del Anlisis de Datos................................................. 53
Figura 4.7. Topologa del Modelo Alfa...................................................... 55
Figura 4.8. Matriz de definicin de la topologa de la red.......................... 56
Figura 4.9. Topologa del Modelo Landa.................................................... 58
Figura 4.10. Matriz de la topologa de la red landa..................................... 59
Figura 5.1. Evolucin del aprendizaje del modelo alfa............................. 63
Figura 5.2. Evolucin del aprendizaje en el modelo landa........................ 67
Figura 5.3. Resultados del modelo beta primera parte.............................. 71
Figura 5.4. Resultados del modelo beta segunda parte............................. 71
Figura 5.5. Mapeo de la puntuacin de la poblacin................................ 73
Figura 5.6. Vista del distrito de Marangan, provincia de Canchis 74
Figura 5.7. Vista del distrito de Santa Rosa, provincia de Melgar. 74
Figura 5.8. Vista del distrito de Paccha, provincia de Huancayo 75
Figura 5.9. Ejemplos mostrado desde un cobertizo 75

- xv -
TABLA DE CUADROS

Cuadro 1.1. Produccin de Fibra de Camlidos Sudamericanos................ 02


Cuadro 3.1. Clasificacin de la Fibra de Alpaca........................................ 37
Cuadro 4.1. Registro de Datos del Modelo Alfa........................................ 46
Cuadro 4.2. Matriz del modelo de datos de beta........................................ 49
Cuadro 4.3. Matriz del modelo de datos en landa...................................... 50
Cuadro 4.4. Matriz de la definicin de la topologa de la red.................... 55
Cuadro 4.5. Matriz de la topologa en el modelo landa.............................. 59
Cuadro 5.1. Ciclo de aprendizaje del modelo alfa...................................... 62
Cuadro 5.2. Tabla de Contingencia del modelo alfa.................................. 64
Cuadro 5.3. Ciclo de aprendizaje del modelo landa.................................... 66
Cuadro 5.4. Tabla de Contingencia del modelo landa................................. 68
Cuadro 5.5. Reconocimiento de patrones del modelo alfa........................... 69
Cuadro 5.6. Presentacin del modelo de datos de beta............................... 70
Cuadro 5.7.Reconocimiento de patrones del modelo landa........................ 72

- xvi -
TABLA DE ACRNIMOS

AAA - AustralianAsociation Alpaca


ABO - Grupo de sangre A, B y O
ADN - cidoDesoxirribonucleico
ASMT - American Society of Testing Materials
CRISP-DM - CRISP- Data Miningoriginado por Michael Douglas Crisp
CONACS - Consejo Nacional de Camlidos Sudamericanos
CWY - Clean WashingYield (Rendimiento de Fibra Lavado)
D.S. - Decreto Supremo
E(NK) - Poblacin de N objetos y K clster
EM - Esperanza-Maximizacin
GFW - GreasyFleeceWeight (Peso del Velln con Grasa)
INDECOPI - Instituto Nacional de Defensa de la Competencia y de la Propiedad
LMT - Peso Vivo
MCR-1 - Melanocortin-1
MFD - Mean FiberDiameter (Dimetro Promedio de Fibra)
MS - MiddleSample (Muestreo Medio)
mSat - Micro-satlite
NTP - Norma Tcnica Peruana
NCBI - National Center for Biotechnology Information
OFDA - OpticalFiberDiameterAnalyzer (Analizador Dimetro de Fibra
ptico)
PCR - Reaccin en cadena de la Polimerasa
PE - Probabilidad de Exclusin
PIC - PolymorphicInformation Content (Contenido de Informacin
Polimrfica)
PROMPEX - Comisin para la Promocin de Exportaciones
QTL - QuantitativeTrait Locus (Caracterstica Cuantitativa del Locus)
RAPD - ADN Polimrfico Amplificado al Azar
RFLP - Polimorfismo de Longitud de Fragmentos de Restriccin
SGS - Sociedad General de Supervisin y Certificacin

- xvii -
SNP - Single NucleotidePolymorphic (Nuclotido Simple Polimrfico)
SSRT - Short SequenceRepeatTandem(Grupo de Secuencia Repetida Corta)
UCD - User Center Design (Diseo Centrado al Usuario)
UK - United Kingdom (ReinoUnido)
USA - UnitedState American (Estados Unidos de Norteamrica)

- xviii -
CAPTULO I
INTRODUCCIN

1.1. Antecedentes
La fibra de alpaca es un producto altamente cotizado en el mercado nacional
y extranjero. Su uso se remonta desde los antiguos peruanos, quienes hicieron de este
material todo un arte en su vida diaria; as se utiliz en la confeccin de prendas y
artculos decorativos usados para actividades ceremoniales debido a sus propiedades
textiles como son: la resilencia, la retencin del calor, el brillo, entre otros.

Actualmente, la fibra de alpaca es el medio de sustento econmico en los


pueblos de la sierra del Per, prueba de ello essu comercializacin
permanente.Tambin resulta muy atractivo en los negocios del sector textil, ya sea
por la apreciacin del velln en muchos pases del mundoo, primordialmente, por sus
caractersticas como son: la finura, el color y el peso.

Segn el fomento agrcola (FAO, 2009), la poblacin de alpacas se concentra


en las regiones centro-sur del alto andino peruano,inicindose aproximadamente
desde el departamento de Huancavelica con direccin al sur, pasando por Arequipa,
Cusco, Ayacucho, Puno y extendindose hasta los pases de Bolivia y Chile, tal
como lo muestra la Figura 1.1.

- 1 -
Figura 1.1.Distribucin de Camlidos en Sudamrica (FAO, 2009).

Segn datos dela Organizacin de Fomento Agrcola(FAO, 2009), en el Per


la produccin de fibra a nivel sudamericano ocupa el primer lugar, obteniendo una
produccin anual de hasta 4 millones de kilogramos de peso en fibra, disponibles
para su comercializacin. De este modo, se evidencia la importancia de este producto
en esta parte del hemisferio. (Ver Cuadro 1.1)

Cuadro 1.1.Produccin de Fibra de Camlidos Sudamericanos (FAO, 2009).

El departamento de Puno, seguido por el de Cusco, encabezan la produccin


total de la fibra de alpaca en el 20051.

[1] Datos consignados en informe por PROMPEX en el 2005.

- 2 -
Segn el lder, el seor Dereck Mitchell, el pas de China concentr el 59%
de las exportaciones peruanas de pelo fino y cardado de alpaca por un monto de 3.5
millones de dlares americanos. Tambin resalt que el pas de Italia se convirti en
el segundo destino de comercio, seguido de Australia, Japn, Reino Unido y Estados
Unidos. Menciona, adems, que se ha dado apertura a nuevos destinos como los
siguientes: Repblica Checa, Noruega, Estonia y Mxico(Mitchell, 2010).

Las estadsticas indicadas arriba, apuntan a una vertiente prometedora en la


venta del pelo fino de la alpaca. En la sociedad andina, la actividad de esquila, para
colectar el pelo de la alpaca representa una ceremonia ancestral que es festejado en
diversas regiones del pas. Los individuos son muy bien explotados, sin tomar en
cuenta su valorizacin gentica durante su ciclo de vida, apenas son apreciadas
subjetivamente. Cabe resaltar que el mtodo tradicional para obtener el velln es
hecho por personas del campo, preferentemente de gnero femenino.

Segn el Gobierno Regional de Huancavelica (Huancavelica, 2010), las


mujeres que realizan la esquilason conocidas popularmente como las Maestras, En
el proceso de seleccin y categorizacin de fibra, ellasdestacan por su habilidad en
discriminar la fibra por su tamao y espesor, valindose de la observacin y del
conocimiento heredado por generaciones. Aunque el proceso es realizado con
efectividad, a largo plazo ocasiona una merma, debido al margen de errorque trae el
proceso.

En la actualidad, la tecnologa es una alternativa para aquellas empresas que


puedan sostenerlas.Efecta una categorizacin ms precisa, a travs de equipos
electrnicos llamados Lser-Scan. Estos equipos aparecen desde la dcada del
noventa, principalmente en universidades del pas, luego se extienden en algunas
empresas privadas, como herramienta de apoyo. Lamentablemente, no existe
regulacin en el uso de los estndares que manejan estos equipos Algunas empresas
de nuestro Per, utilizan estndares internacionales como son: el OFDA-100,
IWTO-30:1998, ASMT D584: 2003, Australian Standard 3535:1998, entre otros.

- 3 -
Ya seapor observacin o usando tecnologa, la categorizacin de la fibra gira
alrededor de su espesor, regulada por la Norma Tcnica Peruana 231.300:2004. Otras
variables complementarias son el tamao de la fibra, color y dimetro, que son pocas
utilizadas debido a la dificultad de introducirlas al proceso de categorizacin. No es
comn en esta actividad apreciar su potencial gentico, ni valorizar los individuos de
la poblacin, lo cual genera acumulacin de merma en el acopio del velln que se
traduce en prdidas de utilidades.

De persistir esta problemtica, la tendencia, a corto plazo, ser que los


criadores empezarn a comercializar vellones de fibra cada vez ms degradada,
debido a la deficiencia en la seleccin de la fibra por individuo en relacin a su
fenotipo y condicin gentica. Dando como consecuencia quelas
estrategiasempleadas por el criador para la mejora y la preservacin de la especie no
sean las ms ptimas, afectando su ventaja competitiva en el negocio y la
disminucin del valor al cliente(Amit, y otros, 2001).

La propuesta de solucin es proporcionar una herramienta (artefacto) basada


enmodelos de reconocimiento de patrones (Chesbrough, y otros, 2007)(Frank, 2010)
y con el empleo de los marcadores moleculares, para que los involucrados puedan
dimensionar el valor de los individuos de la poblacin, desde su aspecto morfolgico
y gentico, de tal manera que sea ms eficiente medirlas entre s, utilizando una
escala como parte de la propuesta. Dejando abierta la posibilidad de unificar criterios
con la comunidad y estandarizar la comercializacin de alpacas bajo un marco de
referencia, que complemente a la Norma Tcnica Peruana 201.300:2004.

El resultado obtenido en la prueba de Friedmannindic que el artefacto


responde positivamente en la metrizacin ycalificacin en los individuos de alpacas,
obteniendo similitud con los otros mtodos actuales. Esto no quiere decir que el
artefacto vaya a reemplazar los mtodos actuales, por lo contrario, los complementa,
dado que ahora es posible caracterizar no solo por su fenotipo, sino tambin por su
genotipo.

- 4 -
El artefacto fue evaluado mediante los ensayos experimentales que se
realizaron en Cusco, Puno y Huancayo, utilizando la prueba de Friedmann.
Obteniendo un valor del sigmoide asinttico que interpreta la existencia de relacin
entre los tratamientos relacionados que participaron en los experimentos. Estos
tratamientos utilizaron como mnimo la variable del espesor de la fibra y fueron
bsicamente: 1) El uso del mtodo de observacin en fibra de alpaca para calificar el
hato, basado en la NTP 231.300:2004, 2) El mtodo de medicin de fibra mediante
tecnologa, usando el Lser-Scan en el estndar OFDA-100 como criterio en
valorizar la poblacin y 3) El uso del artefacto que aparece con esta investigacin, el
cual se sustent mediante el reconocimiento de patrones y los marcadores
moleculares para medir la poblacin.

En la bsqueda de la informacin, no se encontraron trabajos de investigacin


anteriores que califiquen individuos en poblaciones de alpacas para su
comercializacin. Lo que s se hall fueron trabajos similares que destacan en la
seleccin de sus reproductores, mediante correlaciones en la variabilidad gentica,
as como tambin, el empleo de tcnicas de redes neuronales artificiales para el
ligamiento de los genes.

1.2. Declaracin del Problema


El principal problema es la deficienciaenmetrizar y medir las caractersticas
morfolgicas y genticas entre los individuos de lapoblacin de alpacas en relacin a
su fibra.

1.3. Objetivos
1.3.1. Principal
Disear un sistema inteligente (artefacto), que permita calificar los individuos
y metrizarlo por tipos segn sus caractersticas fsicas y genticas para su
diferenciacin en el mercado.

1.3.2. Secundario
- Determinar la utilidad de las salidas del sistema inteligente.
- Describir que tan eficiente resulto el trabajo.

- 5 -
- Identificar si el artefacto origina una nueva ventaja competitiva y generaun
valor estratgico de la informacin a la comunidad.
- Comprender si el artefacto puede usarse como marco de referencia
nacional.

1.4. Justificacin
1.4.1. Terica
La contribucin de este trabajo de investigacin radica en el uso de una
herramienta que haga la metrizacin y medicin de los individuos, con la finalidad
de asignar un valor de calificacin de uso universal para la comunidad. Haciendo que
los contenidos morfolgicosy genticosse sumen a la calificacin, de tal modo, sea
viable la diferenciacin en el mercado nacional.

1.4.2. Prctica
El beneficio principal del artefacto es el de contar con una herramienta que
complementa a la Norma Tcnica Peruana, la misma que pueda ser usada en la
comunidad de alpaquerosy, de este modo,homologar los criterios de transaccin de la
oferta y la demandadel mercado desde el enfoque de la calidad de la fibra. De tal
maneraque conduzca a la liberacin de un marco de referencia en las empresas del
pas y en la regulacin del comercio.

Otro beneficio es que la herramienta va a permitir tomar decisiones en las


estrategias de mejoramiento gentico y en el manejo del animal, fortaleciendo los
individuos de la poblacin para una produccin sostenible en el tiempo.

1.5. Alcances
La arquitectura del artefacto requiere de un constante mantenimiento en el
aprendizaje evolutivo, en el reconocimiento de los patrones, al menos hasta que las
evidencias en el mundo real sugieran un grado de estabilidad. Pero a su vez, es
necesario formar los patrones con mucho cuidado, debido que el conocimiento que
posee cada experto tienen perspectivas diferentes y puede generarse ambigedad en
dicha formacin. La manera como se super esta situacin fue consultando y
haciendo discusin con los protagonistas para consensuar el conocimiento implcito.

- 6 -
La representacin de la caracterizacin gentica del animal mediante los
marcadores moleculares queda limitada al descubrimiento que haga la ciencia en
cuanto al ligamiento de atributos fsicos. El factor humano y el equipamiento dan
paso a la calidad de los resultados de dichos marcadores. Por otro lado, el tamao de
muestra, el nmero de marcadores, el ndice de heterocigocidad, PIC y la exclusin
afectan al modelo y son crticos para lograr un resultado certero.

La regla de asociacin solo sugiere particularidades entre los alelos, la finura


y el color de la fibra, como parte de la bsqueda asociativa que ayude a formar un
posible criterio de relacin. No busca ligamiento de los genes.

El artefacto, en su forma natural, est preparado para un crecimiento eventual


en el nmero de individuos de la poblacin e introducirlos al modelo. Pero, la
capacidad de almacenamiento y eficiencia depender del hardware que se emplee.

Por otro lado, si el artefacto se ingresar datos aleatorios, el comportamiento


de los datos resultantes depender de la interpretacin que origine el modelo en
relacin al conjunto de patrones entrenados. Es probable encontrar un falso positivo
pero el descarte ser inevitable ya que el experto, en el proceso de supervisin debe
de tomar en cuenta el contexto de la evaluacin.

Eventualmente, el modelo puede sufrir modificaciones en la estructura de las


variables de entrada, pero eso implica una reingeniera al modelo, debiendo aplicar
nuevamente el ciclo del proceso CRISP-DM para redefinir suinterpretacinsiempre
en funcin a la escala de calificacin, con los nuevos juegos de patrones existentes.

Finalmente, es importante mencionar que este artefacto requiere de ajustes en


la introduccin de los datos (limpieza de datos), particularmente, cuando se inicializa
el modelo. Asimismo, el conocimiento requiere de la intervencin del juicio de
expertos para decidir una correcta salida en los modelos.

- 7 -
1.6. Propuesta de la Solucin
La presente propuesta es un desarrollo basado en el reconocimiento de los
patrones, utilizando tcnicas de redes neuronales artificiales. La primera, con el
empleo de redes de Perceptrn Multicapa, y la segunda, aplicando reglas de
asociacin.

El objetivo del artefacto est en descubrir primero la caracterstica de inters


en los individuos. Luego, la vinculacin entre la presencia de un genotipo importante
y el fenotipo del color blanco. Por ltimo, generar un valor en el rango de escala de
los tipos de calificacin en la poblacin de alpacas.

En el desarrollo de las herramientas informticas, utilizadas para implementar


el artefacto, se instalel AnalysesServices de SQL 2008, con sus complementos Add-
inDatamingdel Excel 2007 de Microsoft. Esto permiti efectuar el proceso de
entrenamiento. Tambin se agreg el software de cdigo abierto Weka en la versin
3.6.x proporcionado por la Universidad de Waikato de Nueva Zelanda, para la parte
de pre-procesamiento y reconocimiento de los patrones.

1.7. Organizacin de la Tesis


En el captulo I, se explica ampliamente las circunstancias que originan el
problema. Se da una explicacin bsica de la propuesta de solucin y, adems, la
contribucin e impacto de la investigacin en la comunidad.

En el captulo II, se desarrolla el marco terico, el cual hace mencin a todos


los conocimientos relacionados a la gentica poblacional, como son los efectos de las
fuerzas que ejercen en el individuo. Tambin se desarrolla la tecnologa de
informacin utilizada, como son las tcnicas de inteligencia artificial.

En el captulo III, se expone el estado del artey, de manera muy concreta, se


demuestra el cmulo de experiencias que darn luces para elaborar la estrategia de
solucin y que a su vez la sustenta. Los componentes usados en este captulo se

- 8 -
basan en los conceptos fundamentales de la gentica poblacional y en los modelos
computacionales, matemticos y de legislacin.

En el captulo IV, se explica todo el desarrollo del artefacto, que parte desde
el modelo conceptual hasta la explicacin de una arquitectura de redes neuronales
artificiales, las que concluyen con el despliegue de la calificacin poblacional en el
objeto del estudio.

En el captulo V, se usa un caso de prueba en donde se explica el proceso de


de entrenamiento, utilizando para algunos casos la regla de aprendizaje hebbiano. Se
explica la prueba experimental, realizada en el departamento de Puno, localidad de
Huatauas, con el objeto de medir el comportamiento del artefacto y realizar ajustes
al mismo. As, a partir de una serie de ensayos experimentales, se comprobar el
grado de eficiencia y aceptacin del artefacto entre los stakeholders. Los ensayos
fueron realizados en Cusco, Puno y Huancayo. Como parte de la evaluacin se
utiliz el mtodo de Friedman para realizar la demostracin, sumando hasta 3
bloques experimentales de muestras dependientes.

En el captuloVI, se menciona una serie de conclusiones y los trabajos


futurosde los resultados obtenidos en esta propuesta de trabajo de investigacin.

La Figura 1.4 refleja la estrategia usada en organizar la tesis, donde los


captulos II y III se convierten en insumos para construir el captulo IV: Ingeniera
del Artefacto,posteriormente, transformado en un caso de estudio, para terminar en
las conclusiones y trabajos futuros.

- 9 -
Captulo II:
Marco Terico

Captulo IV:
Ingeniera del
Artefacto

Captulo I:
Introduccin

Captulo V: Captulo III:


Caso de Estudio Estado del Arte

Captulo VI:
Conclusiones y
Trabajos Futuros

Figura 1.4.Esquema General del Trabajo de Investigacin.

- 10 -
CAPTULO II
MARCO TERICO

La primera parte del captulo explica concretamente los aspectos generales de


gentica, fuerzas que impactan, caracterizacin de los genes y marcadores
moleculares. La intencin es dar a conocer la forma de tratar los datos que aparecen a
partir de los marcadores genticos como de los fenmenos de la genmica
poblacional que afectan en su caracterizacin.

La segunda partedefine las diferentes redes neuronales artificiales utilizadas


en este trabajo; as tambin, el marco de metodolgico en el uso del CRISP-DM y el
Diseo Centrado al Usuario.

2.1.Gentica
La gentica de poblaciones permite observar cmo esa materia de
ADN2determina un conjunto de caractersticas que definen a la misma(Aldridge,
1996). En general, el trmino gen se refiere a la entidad fsica que se transmite de
los progenitores a la descendencia durante el proceso reproductivo que influye en los
caracteres hereditarios.

El estudio del comportamiento de los genes de poblaciones implica la


investigacin de la adaptacin de los organismos a ambientes estables y, por
consiguiente, el estudio del camino a la evolucin. La evolucin puede estudiarse a
muchos niveles distintos y mediante diferentes aproximaciones, pero, reducido a sus
trminos ms sencillos, es un proceso de la dinmica del cambio en la frecuencia de
genes (Cook, 1979).

Los cambios en las frecuencias gnicas se relacionan estrechamente con la


gentica evolutiva porque la evolucin depende, en gran medida, de los cambios en
las frecuencias gnicas.

[2] Es la materia de la que estn hechos los genes. Los genes transportan informacin biolgica que
luego se traducen en caractersticas de los seres vivos, que se transmiten de generacin en generacin,
fue descubierto por Watson y Crick, en 1953.

- 11 -
Asimismo, el estudio de la gentica poblacional corresponde al fenotipo y al
genotipo, que forman parte de cualquier organismo.

El fenotipo es la descripcin de todos los caracteres de un individuo respecto


a su morfologa, fisiologa, relaciones ecolgicas y comportamiento.

Las diferencias fenotpicas pueden ser cualitativas (presentes o ausentes) o


cuantitativas. Los caracteres cualitativos pueden ser clasificados y los caracteres
cuantitativos son medidos. Si los individuos se parecen entre s, comparten el mismo
fenotipo. Algunos genotipos pueden tener el mismo fenotipo.

El genotipo de un individuo es la suma de todos los genes heredados de sus


progenitores. Los genes determinan la composicin de las protenas e influyen en los
caracteres externos y en el comportamiento.

Los genes pueden tener dos alelos o ms. En realidad, un gen puede tener
tantos alelos como para dar origen a una serie allica para ese gen. Los alelos que
pertenecen a una serie pueden mostrar diferentes patrones de dominancia entre s.
Por ejemplo, un alelo puede mostrar un efecto dominante, lo que significa que
expresa su fenotipo aunque est acompaado de un alelo recesivo. Un alelo recesivo
es aquel cuyo fenotipo no se expresa en un individuo heterocigoto. Si un alelo es
codominante, su efecto fenotpico ser intermedio en el heterocigoto en relacin con
el efecto de un homocigoto dominante y el de un homocigoto recesivo.

La variacin gentica puede detectarse mediante tecnologas moleculares que


evidencian polimorfismos, los cuales resultan tiles como marcadores genticos.

2.2. Fuerzas que afectan las Frecuencias Gnicas


Las fuerzas evolutivas que influyen en las frecuencias gnicas en una
poblacin son: la mutacin, la migracin, la seleccin natural y la deriva gentica. La
endogamia representa otro factor importante.

- 12 -
La mutacin es una fuerza direccional que origina cambios a las frecuencias
gnicas. Su importancia reside en la variabilidad gentica que hace posible la
evolucin. Mediante la mutacin, unos elementos genticos (alelos o cromosomas)
se transforman en otros similares con funciones alternativas; estas variantes podrn
reunirse mediante procesos de recombinacin y, si suponen una alternativa
interesante, sern seleccionadas por la seleccin natural(Barahona, y otros, 1994).

El proceso de migracin consiste en el intercambio de individuos


reproductores entre poblaciones distintas que, en principio, tendrn distintas
frecuencias gnicas. El nombre que se da al proceso concreto de intercambio de
individuos depende de la poblacin de referencia. Cuando esta misma poblacin
pierde individuos, porque pasan a otra poblacin cercana, el proceso se llama
emigracin, y cuando esta misma poblacin recibe reproductores de alguna
poblacin vecina el proceso se llama inmigracin.

La seleccin natural es un proceso por el que un individuo est mejor


adaptado a un medio determinado y se reproduce con mejor capacidad, dejando ms
descendientes. Este parmetro se mide por el aumento de la cantidad de
descendientes que una pareja de individuos es capaz de dejar a la siguiente
generacin.

La deriva gentica o deriva gnica es una fuerza evolutiva que acta junto con
la seleccin natural cambiando las caractersticas de las especies en el tiempo. Es un
efecto estocstico en la reproduccin, tratndose de un cambio aleatorio en la
frecuencia de alelos de una generacin a otra, resultando una disminucin en la
diversidad gentica de la poblacin.

Mediante el equilibrio de Hardy-Weinberg, existe una situacin de equilibrio


gentico y, por tanto, de estabilidad biolgica, solo se rompe en situaciones de
endogamia o como consecuencia de la intervencin de factores que consignan
modificar las frecuencias gnicas y genotpicas de una poblacin, como son: las
mutaciones, las migraciones, la deriva gentica y la seleccin natural (Garca Alonso,
2008).

- 13 -
2.3. Marcadores Moleculares
Son sustancias qumicas detectoras que se mezclan con el ADN de un animal,
con el propsito de poder ubicar la misma similitud a otros ADN marcados, de tal
manera que ese tipo de marcacin pueda ser capaz de identificar una familia,
filiacin, raza, especie, etc.

Los marcadores moleculares son usados como una manera de identificar a un


individuo y comprobar su linaje familiar, de acuerdo a sus registros genealgicos.
Esto es posible realizarlo extrayendo una pequea muestra de sangre, fibra, piel o
cualquier tejido de un animal como la alpaca, para someterlo a estas sustancias
marcadoras.

En la actualidad, muchos de estos estudios sobre conservacin de razas se


basan en los anlisis genticos, a travs del uso marcadores moleculares de ADN.
Entre estos marcadores se cita el uso del micro-satlite(mSat) de secuencia repetida
(SSRT).

Los marcadores micro-satlites (Aranguren, y otros, 2001) son segmentos


cortos de ADN, cuya longitud se mide en pares de bases. En los micro-satlites,
pueden llegar de 1 a 6 pares de bases (pb), los cuales se repiten en tndem y de forma
aleatoria en el genoma de los seres en vivos; estn compuestos de nucletidos, los
cuales forman 4 monmeros, unidos por la base: la adenina (A), tiamina (T), guanina
(G) y citosina (C), estos hacen la secuencia de un fragmento del ADN y que se
aprovecha para analizar la informacin resultante. En laFigura2.1 se observa un
segmento de ADN y la composicin de los nucletidos que forman una cadena de
frecuencia de sus bases, develando de esta manera una secuencia repetida.

- 14 -
Figura 2.1.Muestra de un marcador molecular de micro-satlite(Aranguren, y otros, 2001).

Un buen marcador molecular debe reunir una serie de caractersticas para


maximizar su utilidad: buena distribucin a lo largo del genoma, alto grado de
polimorfismo, la tcnica para analizar el marcador debe ser rpida y prctica, y debe
poder repetirse con fiabilidad en otros laboratorios.

Si lo que se pretende es analizar las diferencias existentes dentro de las


poblaciones, la variabilidad detectada por medio de micro-satlites se convierte en un
instrumento eficaz de estudio e informacin. Esto puede hacerse de diversas formas,
pero se utiliza generalmente la tasa o ndice de contenido polimrfico (PIC), nmero
medio de alelos por locus, el grado de heterocigoto, la probabilidad de exclusin
(PE), etc.

2.4. La Red Neuronal Artificial Back-Propagation (Perceptrn


Multicapa)
Es una regla de aprendizaje que se puede aplicar en modelos de redes con
ms de dos capas. Una caracterstica importante es la representacin interna del
conocimiento que es capaz de organizar las capas intermedias para conseguir una
correspondencia entre las entradas y salidas de la red.

El funcionamiento consiste en un aprendizaje de un conjunto predefinido de


entradas y salidas. Primero se aplica un patrn de entrada como estmulo en la
primera capa de la red y se va propagando a travs de todas las capas superiores

- 15 -
hasta generar una salida, se compara el resultado con la salida que se desea obtener y
se calcula un valor del error para cada neurona de salida. Este proceso se repite, capa
por capa, hasta que todas las neuronas de la red hayan recibido un error que describa
su aportacin relativa al error total. Sobre el valor del error recibido se reajustan los
pesos de conexin de cada neurona, de manera que la siguiente vez que se presente el
mismo patrn, la salida est ms cercana a la deseada y, de esta manera, disminuya el
error. (Martn del Brio, y otros, 2002)

En la Figura 3.1 se explica la dinmica de la red Back-Propagation, donde se


muestra cmo el patrn de entrada va desplegando internamente en relacin al valor
de sus pesos y es comparado con el resultado, si no es lo buscado, el error
recalculado es internalizado y el valor es recalculado para posteriormente obtener
una nueva salida.

1 2

3 4

5 6
Figura 2.2. Esquema de una Red Back-Propagation(Bernacki, y otros, 2004).

El procedimiento para aplicar el algoritmo de entrenamiento es como sigue a


continuacin: (Hilera, y otros, 2000)

Paso 1: Inicializar los pesos de la red con valores pequeos aleatorios.


Paso 2: Presentar un patrn de entrada:Xp, xp1, xp2.xpn.

- 16 -
Paso 3: Calcular la salida de la red, para ello se presentan las entradas a la red
y se va calculando la salida de cada capa, hasta llegar a la capa de salida que
ser: y1, y2.yn.
Se calculan las entradas netas para las neuronas ocultas, que provienen
de las neuronas de entrada.
Paso 4: Calcularlos trminos de error para todas las neuronas.Si la neurona k
es una neurona de la capa de salida, el valor de la delta es:

= ( )
La funcin , debe ser derivable, lo que impide la funcin escaln.

Disponemos de dos formas de funcin de salida:


a) Funcin lineal:

( = )

b) Funcin Sigmoidal:

=
Paso 5: Actualizacin de los pesos.
Paso 6: El proceso se repite hasta el trmino del error.

2.5. La Regla de Asociacin


Los algoritmos de asociacin (Vila Miranda, 2001) surgen de la necesidad de
analizar grandes cantidades de datos colectados en grandes repositorios. La idea
principal es asociar un elemento de la base de datos con otra, bajo un criterio. Para
crear un algoritmo de asociacin, un objeto de inters debe pasar a construir un
conjunto de datos de n elementos que pueden parecerse a ella. Despus, para cada
elemento se va contando los objetos de inters, cuantas veces aparece la combinacin
de subconjuntos de todos los subconjuntos. La combinacin de subconjuntos que
tenga la cuenta mayor ser la regla de asociacin de mayor nivel de confianza. El
problema principal es que el algoritmo aplicado a una enorme cantidad de
transacciones (objetos) se desempear con un rendimiento ineficaz, dejando de ser
ptima. Ya que el nmero de asociaciones que se genere ser amplio.

- 17 -
El algoritmo a priori, para generar reglas de asociacin, realiza al menos
dos pasos fundamentales:

Paso 1.Generar el conjunto de elementos con un nmero de cobertura x


definida por el usuario.

Paso 2. A partir de cada conjunto de elementos, determina las reglas que


tenga la precisin mnima.

Estructura del algoritmo a priori:

L[k] es el conjunto de itemsets relevantes que contienen k items.


C[k] es el conjunto de k-itemsets candidatos.

L[1] = { large 1-itemsets }


k=2
Mientras L[k-1]
C[k] = CandidatosAPRIORI( L[k-1] )
Para cada transaccin t
Ct = Conjunto de candidatos de C[k] contenidos en t
Para cada candidato c Ct
c.contador ++
L[k] = { c C[k] | c.contador Z MinSupport }
k++
Solucin: [ L[k]

- 18 -
2.6.Mtodo de Minera de Datos: CRISP-DM
Los actuales modelos de procesos de minera de datos (Chapman, y otros,
2000)en sus marcos de trabajo se sustentan haciendo uso de un ciclo de vida, las
mismas que van modelando el comportamiento de los datos y de los conocimientos,
y as determinar un resultado que tenga significado en el mundo real.

El ciclo de vida de un proyecto de minera de datos consta de seis fases (ver


Figura 2.3). En la prctica, se observa que la ejecucin de las fases no son
necesariamente secuenciales, solo marca el camino. Las flechas indican el sentido
que debe ejecutarse, como el giro indefinido de iteraciones que sern necesarias para
conseguir un resultado.

En cada interaccin se espera alcanzar mayor madurez, reforzando las


lecciones aprendidaspara identificar y mitigar riesgos. Tambin, ayuda a identificar
nuevos disparadores enfocados al modelo del negocio.

CRISP - DM
Fase II
Fase I Entendimiento
Comprensin
de los Datos
del Negocio

Fase III
DATOS Preparacin
de los Datos

Fase VI
Despliegue
Fase IV
Modelacin

Fase V
Evaluacin

Figura 2.3.Ciclo de Vida del Modelo Crisp-DM (Chapman, y otros, 2000).

- Fase I: Entendimiento del Negocio


Establecimiento de los objetivos del proyecto y requerimientos; se define el
problema de la minera de datos.

- 19 -
- Fase II: Entendimiento de los Datos
Se colecciona la data inicial y la familiarizacin de la misma, se identifica los
problemas en la calidad de datos.

- Fase III: Preparacin de los Datos


Se identifican las tablas, registros y se realiza la seleccin de atributos para la
transformacin y limpieza de los datos.

- Fase IV: Modelacin


Se selecciona las tcnicas de modelacin y su aplicacin, para lo cual se
realiza la calibracin de sus parmetros. Es en esta parte donde, se construye
los modelos de redes neuronales de Perceptrn Multicapa y las reglas de
asociacin.

- Fase V: Evaluacin
Se comprueba la alineacin de los objetivos del negocio con los resultados
obtenidos, validando su aplicacin en el negocio.

- Fase VI: Despliegue de Resultado


Se procede a la implementacin del proceso de minera de datos en la
organizacin.

El mtodo CRISP-DM es comnmente usado en el desarrollo de la minera de


datos, y se aplica como gua metodolgica para el desarrollo de las redes neuronales
artificiales en esta investigacin.

Lamentablemente, CRISP-DM no se centra en los detalles del artefacto, ni


profundiza la captura las particularidades del artefacto entre los stakeholders. Por
tanto, esta metodologa no cubre las expectativas de los actores.

Es por esa razn que se integra la fase de modelado del CRISP con las etapas
del UCD, principalmente, en la etapa de simulacin y evaluacin. Con esta accin se
obtuvo mejores resultados en la concepcin y entrenamiento de los modelos para la
explotacin de datos.

- 20 -
En la Figura2.4 se observa que desde los Stakeholders existen diferentes
seales que llegan primero al mtodo del UCD, donde se analiza la solucin con
requerimientos basados en la experiencia. Estos requerimientos son trasladados a la
fase de modelado del CRISP, en donde se construye una arquitectura ptima desde la
experiencia y expectativa de los stakeholders, con la intencin de responder mejor a
las necesidades. Ayuda, adems, a dar la forma que deberan de contar las interfaces
y mensajes del sistema, pero estas no estn contempladas en este trabajo de
investigacin.

Figura 2.4. Esquema Metodolgico del desarrollo del Artefacto.

Con la aplicacin de esta sinergia se ha comprobado que existen muchos


beneficios, los cuales se citan a continuacin:

- Mayor fluidez en el diseo del artefacto.


- Aumento de la comunicacin con los stakeholders en el descubrimiento de
los requisitos y evaluacin del artefacto.

- 21 -
- Rapidez y simplicidad en la gestin de comprensin del negocio como del
modelo de datos a utilizar.
- Incorporacin de nuevos elementos para la toma de decisin en el desarrollo
del artefacto.

Es importante resaltar que ambas metodologas no compiten, ni tampoco se


suprimen fases. Simplemente se complementan en puntos comunes para asegurar la
aceptacin del artefacto.

2.7. El Mtodo del Diseo Centrado al Usuario


La interaccin producto-humano se puede hacer por un diseo centrado al
usuario; seenvuelve al usuario en el ciclo del diseo. Las fases del diseo son:
Anlisis, Sntesis, Simulacin, Evaluacin y Decisin (Weber, y otros, 2008).

No en todos los problemas de diseo est presente el usuario. Las


expectativas de los usuarios, representados por el feeling o caractersticas del
artefacto, son tomados en cuenta en cada fase.

El proceso de diseo (ver Figura 2.5) es explorado por interacciones en la


fase de simulacin, aprendiendo del posible comportamiento hasta conseguir un
grado de satisfaccin y aceptacin por parte del usuario.

Figura 2.5.Ciclo de Vida del Diseo Centrado al Usuario (Weber, y otros, 2008).

- 22 -
Las siguientes son las etapas del UCD:

Etapa 1: Anlisis
Son los anlisis de los requerimientos que se realiza a los stakeholders para
conocer sus necesidades, la manera como la tecnologa puede ayudar y
establecer objetivos de usabilidad. Hay que averiguar tambin cules son las
barreras que aparecen y determinar los niveles de eficiencia y efectividad.

Etapa2: Sntesis
Es la creacin del diseo conceptual, se apoya de las personas involucradas al
proyecto. Estos diseos son revisados y aprobados por el equipo de trabajo que
incluye a los usuarios. Los diseos pasan por dos fases, el nivel general y
detallado, hasta definir el artefacto.

Etapa 3: Simulacin
El artefacto es probado en diferentes escenarios con participacin del usuario,
aqu se mide las mtricas de usabilidad, realizadas en la etapa anterior. Se
necesita simular todos los procesos que implica el artefacto. Aqu pueden
generarse iteraciones hasta conseguir la satisfaccin con el usuario.

Etapa 4: Evaluacin
Se evala el impacto del artefacto que se origina con el usuario, hasta conseguir
el look and feeling. Los objetivos de usabilidad y los requerimientos son usados
en esta parte para conseguir la aceptacin final.

Etapa 5: Decisin
La implementacin y despliegue se realiza progresivamente, el artefacto es
analizado para encontrar nuevas debilidades en su uso, y experimenta con el
usuario hasta que se considere finalmente apto.

- 23 -
CAPTULO III
ESTADO DEL ARTE

Este captulo tiene el propsito de divulgar diferentes temas de investigacin


que tienen relacin con la propuesta antes descrita, haciendo notar en qu medida se
puede colaborar en lo que respecta a la medicin de las poblaciones de alpaca. Estos
temas de investigacin se descompone en tres dimensiones: conceptos
fundamentales, modelos existentes y legislacin.

3.1. Morfologa de la alpaca


(Lupton, y otros, 2006)
Algunas investigaciones orientadas a las expresiones morfolgicas se centran
en descubrir el rendimiento y la calidad en la produccin del velln, como es el caso
de (Lupton, y otros, 2006), en cuyo trabajo se estudian las caractersticas de la fibra
de alpaca tipo Huacaya en USA, las cuales fueron medidas y calculadas sobre
estndares internacionalesteniendo en cuenta los efectos de la edad y el sexo en 23
variables. Estas muestras fueron tomadas en 6 regiones en USA, todos con un peso
similar en 585 animales.

El mtodo empleado sugiere medir y evaluar la fibra sobre cuatro tipos de


pruebas. El primero para conocer las longitudes de estas, usando el IWTO-30,1998.
El segundo, evala la fortaleza y resistencia de la fibra empleando IWTO-30,1998, el
ASTM D 584, 2003, y el AustralianStandar 3535, 1998. El tercero, despus de un
tratamiento de lavado, se procedi a medir el dimetro de la fibra, utilizando el
OFDA en los estndares: IWTO-47,2000, IWTO-57,1998.

Como resultado de las pruebas se concluyeron que los machos producen una
fibra ms resistente que las hembras y, mientras ms joven sea el animal, la
produccin del velln resulta ms fina y resistente. Por otro lado, se pudo notar que
el color blanco respecto a los otros, mostr mejor brillo y presentacin lo cual es
muy bien recogido en las empresas textiles.

- 24 -
(McGregor, 2005)
Otra investigacin, efectuada por (McGregor, 2005), estudia variables de la
fibra de alpaca en el enfoque comercial, cuyo inters es descubrir el valor econmico
asociado a los datos del precio en el mercado.

El mtodo usado fue a travs de un ensayo experimental, tomando 1100


vellones de fibra de alpaca en 5 granjas al sur de Australia, sobre dos especies
alpacas: Huacayasp.y Suri sp, para la cual se realiz un muestreo en diferentes zonas
del animal en el primer ao, para medir el grosor de la fibra, la desviacin estndar y
el coeficiente de variabilidad para distinguir la distribucin relativa de la fibra. Se
utiliz el OFDA-100 como herramienta de medicin. En el segundo ao, se adicion
100 muestras ms en el lado medio del animal, aqu se midieron la resistencia de los
vellones.

(Frank, y otros, 2005)


Otro autor, (Frank, y otros, 2005), explicalos factores que afectan
comercialmente el valor de la fibra del camlido.

En el mtodo se describe los requerimientos textiles en relacin a la sensacin


de picazn, que est relacionada con la distribucin del dimetro de la fibra. Otro de
los factores son las seales en el mercado con respecto a la calidad de la fibra y el
color de la misma, particularmente el asociado al color blanco. Otro factor es el
dimetro de la fibra que determina potencialmente la longitud del hilo,que a su vez
est fuertemente relacionada con la picazn de la fibra de alpaca.

Por el lado gentico, las caractersticas de la produccin de la fibra, tienen


relacin con las caractersticas cuantitativas, caractersticas factoriales y/o
mendilianas. Adems, el fenotipo del color no depende de su aspecto visual, sino que
debe estar sustentada por pruebas bioqumicas para determinar la concentracin de
eumelaninas y pheomelaninas.

Concluye que la calidad de la alpaca y de las llamas est relacionada


directamente a la fibra y, a su vez, est sujeta a un conjunto de atributos como: el
color, el tipo del velln, la longitud de la fibra y el rendimiento. Explica, adems, que

- 25 -
el color blanco en el velln es una caracterstica, altamente probable que sugiere la
dominancia en el individuo. Los factores no genticos que influyen en la produccin
de la fibrade alpacas son: sexo (2.4%), localidad (32.6%) y edad (6.5%).

(Aylan-Parker, y otros, 2001)


Segn (Aylan-Parker, y otros, 2001), se realiz una comparacin entre los
atributos de la fibra de alpaca, provenientes de Per, para lo cual se busc efectuar
mediciones para su optimizacin entre 120 alpacas de especie Huacaya y Suri, en
granjas del sur de Australia.

El mtodo empleado fue, primeramente, distinguir 3 formas de muestreo: el


primero en relacin al lado medio del animal (MS), el segundo, al muestreo simple
de la silla de montar (SGS) y, por ltimo, en funcin a la grilla simple del velln.

Para cada muestreo se realizaron mediciones caractersticas que,


posteriormente, son comparadas. En todos los casos se utilizaron los estndares
OFDA, IWTO-47, 1995, definiendo las variables MFD, la desviacin estndar de la
misma y su coeficiente de variacin como elementos para el anlisis estadstico. Para
ello se usaron como parmetros de comparacin: el peso vivo (LWT) de hembras y
machos, el dimetro promedio de la fibra (MFD) y el rendimiento limpio y lavado de
la fibra (CWY), valindose para ello de la tcnica de grilla del muestreo (ver Figura
3.1).

Figura 3.1.Grilla de la Muestra que segmenta a una Alpaca (Aylan-Parker, y otros, 2001).

- 26 -
(Iiguez, y otros, 1997)
Otro autor, (Iiguez, y otros, 1997), estudia el sistema de produccin, segn
tipo de velln y la distribucin de las caractersticas de la fibra en una poblacin de
llamas al sur de la ciudad de Potos en Bolivia. Para ello se usaron variables del
medio ambiente como son: el pastoreo mixto, el tipo de pasto, la rotacin en
pantanos y las superficies planas y montaosas.

Como primer paso en el mtodo usado, se agruparon individuos segn dos


razas de llamas. Para aquellas que forman parte de la clase de llamas con pelo
compacto y cado se le reconoce como Kjarkas (K). De igual forma, para aquellos
individuos que muestran notoria cada de la fibra se entienden por la raza Thampullis
(T). Una tercera clase se origina a partir de las variaciones de fibra intermedia (I),
tomando en cuenta que los extremos corresponden a cada tipo de raza mencionada.

Como segundo paso, se realiz el anlisis estadstico del muestreo de acuerdo


a las caractersticas principales, como son: el promedio del dimetro de la fibra, su
longitud y la fuerza de la misma,regidos en el estndar del AFD, IWTO y ASTM. Se
estudiaron tambin los efectos del sexo, el color de la fibra y el tipo de velln
utilizando un modelo lineal.

(Montes, y otros, 2008; 2007)


Otros autores, (Montes, y otros, 2008; 2007), estudiaron la calidad en la
produccin de fibra en alpacas para la regin de Huancavelica, realizada en una
muestra de 203 individuos, ubicada entre 4 100 y 4 750 m.s.n.m., obteniendo un
dimetro de 22.7 considerando el sexo, edad y origen de la comunidad, deduciendo
que los machos arrojan mejores resultados en la finura de la fibra respecto a las
hembras, siendo la edad un factor importante ya que a medida que el animal era ms
viejo su finura perda valor. Adems, se observ que la longitud de la fibra fue un
atributo que contribuy en la relacin de la fibra fina.

- 27 -
(Rios, 2009)
En una entrevista realizada, (Rios, 2009) asegur que la medicin de la fibra
y su valorizacin econmica se realiza a travs de la NTP 231.300, como proceso de
normalizacin de la fibra de alpaca y que, en relacin directa con el peso del velln,
se determina un porcentaje por calidades o categoras para hallar una diferenciacin
en el individuo. Este proceso se hace en forma manual, tal como lo valida (Mueller,
2007)al realizar el anlisis de muestras de fibra en ovinos, as se vale de la medicin
visual para estimar el mrito gentico (fenotipo), como es el caso del peso del velln,
peso corporal y finura de la fibra.

(Holt, 2006)
En el Handbook de la AAA, (Holt, 2006) da el marco de referencia para tratar
a las alpacas en su esquila y muestreo en Australia; por ejemplo, demarca las
regiones del animal para su diferenciacin, estas regiones son: neck (cuello),
backline (lnea oscura), saddle (silla de montar), apron (delantal), belly (vientre),
middleleg (pierna media), lowerleg (debajo de la pierna). Por otro lado, el documento
explica la tcnica de muestreo de la grilla, cuyo objetivo es tomar una de las regiones
y dividir las reas en cuadrculas para identificar las pequeas zonas que lo
conforman. Pero tambin sugiere escala en el grosor de la fibra y su distribucin de
varianza (ver Figura 3.2).

Figura 3.2. Escala del Grosor de la Fibra en Alpacas, (Holt, 2006).

- 28 -
(Baxter, 2002)
Otro autor, (Baxter, 2002), sostiene que el papel de la metrologa en lana o
vellones en animales no es una situacin esttica, ya que depende de la evolucin de
la tecnologa que determina la profundidad de la precisin y confiabilidad, pudiendo
generar reduccin de costos y cambios en una organizacin. Asimismo, el manejo de
la tcnica permite la prediccin de rendimiento de productos, as en su estudio se
experiment un caso por 5 aos, obteniendo mejoras en la tecnologa de las mtricas.

No menciona un mtodo en particular, sino describe los actuales, que son: el


grosor, el peso, la longitud, y el color de la fibra con el OFDA-100, la grasa que
contiene con el IWTO-57 DTM 43. Actualmente, estas tecnologas han
evolucionado, pudiendo en algunos casos hasta hacer doble mediciones a la vez,
como es el caso del OFDA-4000, que puede medir el grosor y longitud de la fibra al
mismo tiempo.

3.2. Mtodos Cuantitativos


(Garcia V., y otros, 2007)
En investigacin realizada en llamas, (Garcia V., y otros, 2007) estimque la
herencia, la repeticin y la correlacin gentica entre el peso corporal era evidente al
nacimiento, el destete,la primera y segunda esquila considerando la edad de la madre
y el sexo de la cra, sobre un perodo de 6 aos en la regin de Huancavelica.

El mtodo empleado fue del empadre controlado para el apareamiento de los


individuos, registrando eventos entre la madre y la cra, como son: los datos del
parto, del destete y luego de la primera y segunda esquila, que se realiza cada 2 aos.
Para el anlisis estadstico se hizo ajuste de fechas para los perodos 1995-2001. Se
utiliz la frmula de Warwick y Legate.

As se obtiene una heredabilidad promedio y con tendencia a valores


altos.Asimismo, el ndice de repeticin para el peso vivo de las llamas arrojaron
resultados bajos, mientras que con la aplicacin de regresiones y las correlaciones
genticas entre peso vivo al nacimiento con el peso vivo al destete y primera esquila
los resultados fueron altos.

- 29 -
(Bustamante, y otros, 2006)
Otro autor(Bustamante, y otros, 2006) realiz un trabajo de investigacin, en
cuanto a la produccin de fibra, que se hizo sobre 3 poblaciones de llamas (Lama
glama) ubicadas al noreste de Argentina.

El mtodo utilizado para la diversidad gentica fue el clculo del nmero


medio de alelos por locus (NMA), los alelos privados de la poblacin (APP), el
nmero de alelos detectados por poblacin (A), el nmero total de alelos detectados
y el nivel de proporcin de los diferentes genotipos dentro de las poblaciones,
mediante la heterocigosidad por locus en cada poblacin y utilizando los algoritmos
incluidos en el programa Exel Micro-satlite Tools. La estructura y diferenciacin
gentica entre las poblaciones se calcul mediante los parmetros F y Rho. El ndice
Rho se basa en el modelo de mutaciones por pasos o StepWiseModel (SMM) y tiene
en cuenta, adems,las frecuencias allicasy el tamao de los alelos.

En un estudio realizado sobre 77 alpacas subdividas desde 10 aos atrs por


una nica poblacin, se tomaron muestras de ADN mediante la amplificacin de 12
loci en microsatlites, se hizo un hallazgo de 140 alelos diferentes y se comprob
realizando 19 de 30 pruebas del equilibrio de Hardy-Weinberg, los cuales
demostraron desvos significativos debido a la escasa presencia de alelos
heterocigotos. Asimismo, la diferenciacin gentica se estima del ingreso progresivo
de especies a la poblacin provenientes de otras regiones al descubrir 44 alelos
privados. Estos resultados concluyen en la facilidad de identificar las fortalezas
genticas y realizar una seleccin dirigida de las especies para futuras estrategias
como la reproduccin y la comercializacin de estas.

(Julio Sastre, 2003)


Otro autor (Julio Sastre, 2003) en su tesis doctoral relacionada con bovinos,
explica cmo los micro-satlites SSRs se caracterizan por las repeticiones que se
presentan en forma general como pequeos nucletidos entre 1 a 6 y tambin por el
nmero de repeticiones.Estas repeticiones, a su vez, se encuentran distribuidas al
azar en todo el genoma, estn muy conservadas para utilizarse en especies prximas

- 30 -
y tienen un alto polimorfismo inclusive en poblaciones en donde no hay mucha
variacin.

El mtodo usado fue, en primer lugar, identificar los genotipos a travs de 14


marcadores moleculares recomendados por la FAO (2003), para estudios de
variabilidad gentica en bovinos de conservacin. Sobre los cuales se usaron en 7
sub-poblaciones con caractersticas fenotpicas similares. Para el anlisis de gentica
de poblaciones se utiliz el GenePop versin 3.3, que ayud a calcular los valores de
heterocigosidad observada y esperada, el ndice de fijacin, el equilibrio de Hardy-
Weinberg y las frecuencias allicas. Finalmente, para el anlisis de correspondencia
se utiliz el software Genetix. Como resultado se pudo identificar y seleccionar
animalespor sus atributos.

(Feeley, y otros, 2009)


Este autor (Feeley, y otros, 2009), recientemente ha descubierto la correlacin
entre el gen melanocortin-1 (MCR-1) y el color de la fibra de alpaca.Estos
experimentos fueron llevados a cabo en granjas de Australia sobre 41 individuos,
secuenciados por productos PCR. En el experimento se not que 21 nucletidos
fueron polimrficos, es decir, altamente cercanos a los genes de inters (A82G y
C901T) que tienen el potencial de reducir la eumelanina, elemento responsable de la
pigmentacin en la fibra. Otros alelos como el G82/T901 y G82/Y901 se mostraron
homocigotos y recesivos al gen de inters, por lo tanto no son capaces de producir la
eumelanina. Esta situacin indica la viabilidad de seleccionar un individuo con
caractersticas especficas, como por ejemplo una poblacin dominante con vellones
de color blanco para su mejoramiento gentico y comercial.

(Calvet, y otros, 1990)


El autor (Calvet, y otros, 1990), en una investigacin realizada en la provincia
de Cantabria (Espaa), utiliza los marcadores eritrocitarios de membrana, que
histricamente corresponden a los caracteres humanos en su transmisin mendeliana.
La informacin obtenida se proces aplicando las frecuencias gnicas en fenotipos
esperados. Basado en la genmica de poblaciones, se observ que se encuentra en
equilibrio de Hardy-Weinberg, el clculo de la misma fuerealizado mediante
mtodos bioestadstica siguiendo las indicaciones de Hummel y Cols.

- 31 -
Particularmente, se observ en el sistema ABO materia del estudio -, que alcanz
valores bajos en el alelo B para la regin de Cantabria, en cambio el alelo O fue alta
y se extendi desde el norte, disminuyendo hacia el sur.Los resultados fueron
validados con el estudio del sistema Rh en la sangre encontrando resultados similares
y en algunos casos muy altos. En el estudio se toma en cuenta que los valores de la
probabilidad de exclusin son muy semejantes. Este estudio es utilizado para ver el
comportamiento de las expresiones genticas a travs de las frecuencias y llegar a
una conclusin en cuanto al impacto que tiene en la diferenciacin de sus
caractersticas fsicas presentadas.

(White, y otros, 2007)


Segn el autor (White, y otros, 2007),el QTL (QuantitativeTraitsLoci)aparece
como un mtodo estadstico y computacional complejo que gestiona las expresiones
genticas para determinar un gen de inters en relacin a una caracterstica fsica, en
especialde un individuo. Por ejemplo, un factor simpleen la evaluacin de diferencias
entre caractersticas cuantitativas en los valores por clase de marcadores genticos es
la aplicacin directa del anlisis de regresin de varianza. La mayor limitacin en la
estimacin es que no se puede encontrar con exactitud la posicin del marcador en
relacin al fenotipo a relacionar. Utilizando tcnicas conocidas como el RFLP,
RAPDs, SNPs, o los micro-satlites SSRs, para el secuenciamiento en laboratorio
del ADN, se consigue suficiente data que despus es utilizada por estadstica para
predecir una posible caracterstica a descubrir. Este es el caso de nuestra
investigacin, en el cual se utilizan los micro-satlites de secuencia repetida (SSRs)
que forma el mapa para luego, mediante apoyo computacional, determinar la
presencia o no de estados homocigotos dominantes en la muestra.

(Hui Lui, 1998)


El anlisis de los QTLs(Hui Lui, 1998) identifica agrupaciones de genes para
determinar funciones biolgicas especficas, de tal modo que reflejen la estructura
molecular del genoma mediante un orden, conseguido por marcadores polimrficos
(mltiples caractersticas fsicas). La formacin del mapa est formada por
fragmentos de ADN, cuya limitacin est dada por el tamao y el nmero de
replicaciones endichos fragmentos. Por consecuencia, los mapas genticos son

- 32 -
hechos por segmentos largos, pero que son interpretados a travs de una tcnica por
secuencia repetida, el cual tiene la informacin para el anlisis de complejas
caractersticas.A su vez, los mapas fsicos estn relacionados con los mapas
genticos para determinar una expresin en particular, lo que en adelante sirven de
soporte para secuenciar y conseguir un gen de inters.

En el desarrollo del anlisis se utiliza laestadstica genmica que permite,


mediante distribuciones conocidas como la normal, binomial, poisson, chi cuadrado,
producir evaluaciones hipotticas contrastadas con el anlisis de la probabilidad del
falso positivo y negativo, para contar con la certeza de un posible grado de
polimorfismo (relacin entre el gen de inters y una caracterstica deseada). Muchas
veces los mapas son procesados por mtodos numricos debido a la complejidad de
la funcin estimada, por tanto, utilizando iteraciones de newton raphson, es posible
encontrar valores esperados en modelos ms complejos dondese utilizan otras
tcnicas como el EM Algoritmo, anlisis de varianza y predicciones.

(Iniesta, y otros, 2005)


En autores como (Iniesta, y otros, 2005), el anlisis de los polimorfismos
genticos permite identificar genes que confieren susceptibilidad a presentar
enfermedades. En este trabajo, se presenta el anlisis descriptivo de un nico
polimorfismo y la evaluacin del equilibrio Hardy-Weinberg. Para ello se emplean
modelos de regresin logstica y se estudian los posibles modelos de herencia. Por
ltimo, se presentan mtodos para el anlisis multivariado de polimorfismos:
estimacin de las frecuencias de haplotipos y anlisis de asociacin con la
enfermedad.

(Renieri, y otros, 2007)


En trabajo realizado por (Renieri, y otros, 2007), efecta una seleccin
gentica en poblaciones de alpaca de la especie Suri spp. yHuacayaspp. en la
provincia de Caylloma(Per), cuyo objetivo es evaluar y comparar para la seleccin
de un mejoramiento gentico, utilizando diferentes criterios de evaluacin, como
son: el tipo del velln, el color del velln, cantidad de fibra, la finura de la fibra y la
variabilidad del dimetro de la fibra.

- 33 -
Se utiliz el mtodo de seleccin para reproductores, para lo cual se
evaluaron las caractersticas cuantitativas con el mtodo del test performance, sobre
la base de los parmetros genticos considerados. El clculo se hace mediante el
modelo del MultipleTraits utilizando el software MTDFREML, ponderando el
dimetro de la fibra, el coeficiente de varianza y el peso.

Tambin se aplic el mtodo de las frecuencias gnicas para determinar el


grado de correlacin que existe entre las variables, explica, adems, que para
conseguir un buen programa de mejoramiento gentico requiere que la poblacin se
defina con certeza, ya que afectar los resultados.En la investigacin se observ una
alta variabilidad fenotpica en los caracteres cualitativos y cuantitativos, a efecto de
una deriva gentica provocada por el golpe de la conquista entre la poblacin de
individuos. Recomend, adems, de la existencia de un registro para evitar la
contaminacin gentica indiscriminada, producto de las fuerzas naturales que
impactan a una poblacin.

3.3. Modelos Computacionales


(Cooper, y otros, 2002)
De acuerdo al autor (Cooper, y otros, 2002), se ha realizado una investigacin
en relacin a la caracterizacin del cultivo vegetal Sorghumspp., basado en un
modelo E(NK) de Kaufmman utilizando estadstica cuantitativa que relaciona e
interacta entre las dimensiones del genotipo y fenotipo, en una interaccin evolutiva
para predecir valores de la secuencia del genoma en organismos procariticos y
eucariticos. El modelo se sustenta en un marco de trabajo con base de datos
experimentales y en la creacin de estructuras de conocimiento de los sistemas de
ambientes genotpicos, definiendo prioridades e integrando con las caractersticas
fsicas.

(Len-Velarde, y otros, 2000)


Otro autor (Len-Velarde, y otros, 2000), formula una investigacin
desarrollada sobre alpacas (Lama pacus) en relacin a la calidad y cantidad de fibra
de alpaca desde el enfoque genotpico y fenotpico, para ello proponen un modelo de
simulacin denominado ALPAGEN, basado en la variabilidad gentica en

- 34 -
variables bio-econmicas como: el peso, la longitud y el dimetro de la fibra,
utilizando las correlaciones para determinar un ndice de seleccin. El modelo
funciona sobre una lgica que representa los momentos de la evolucin de la
poblacin y que es tratado en 5 tipos de escenarios. Los resultados que arrojaron
sobre datos de 10 aos, apoyado en la estadstica, es que existe en aquellas variables
de nacimiento que presentaron ratios bajos en mortalidad, afectando en menor
magnitud el tamao poblacional a 1000 cabezas en la simulacin. Estos resultados se
pusieron a discusin.

(Souza, y otros, 2007)


Otro autor (Souza, y otros, 2007) propone un algoritmo Phenomic, cuyo
propsito es integrar los resultados del anlisis de expresin de genes con las
caractersticas fsicas de un individuo. Basado en sistemas evolutivos en clustering,
sugiere construir una red de expresiones de genes que orienten un perfil fenotpico
que se conserva y que se acumula entre las interacciones. Utiliza un modelo similar a
un K-means, regida por la distancia euclidiana, la cual, con cierta modificacin
propia del autor, determina una bsqueda de informacin gentica emulando el
proceso natural de evolucin. Finalmente, simula las agrupaciones que estn
involucradas entre genes y caractersticas particulares en individuos.

(Portela de Carvalho, y otros, 2002)


Otro autor (Portela de Carvalho, y otros, 2002)realiza una investigacin que
utiliza dos mtodosen base a la relacin del ideotipo o caractersticas principales de
la berenjena, uno de ellos es el ndice de seleccin y el otro, sus principales
componentes. Para el primero, toma en consideracin la existencia de un rango
ptimo por cada caracterstica evaluada en el modelo y cuya diferencia se estima
entre una escala frente a la caracterstica principal, posteriormente, para el segundo,
se procesa el ndice para obtener la distancia euclidiana y se ejecute ambos mtodos
para predecir la misma ganancia en genes. Como resultado, ambas curvas que
produce el modelo, el ndice de seleccin obtuvo un valor ptimo en el intervalo,
para el caso del algoritmo de la distancia euclidiana los valores se mantuvieron entre
el promedio. En el anlisis se pudo notar que 4 caracteres de la berenjena tuvieron el
35% como porcentaje de seleccin, evidenciando coincidencias entre ambas como
estrategia de seleccin.

- 35 -
3.4. Legislacin Vigente
Segn el D.S. 23-95-AG, se habilita y obliga a los productores a cumplir el
reglamento de los registros genealgicos de alpacas de las razas huacaya y suri, muy
importante en esa fecha debido a que no se tena la certeza de un inventario, as esta
iniciativa permite consolidar la informacin a nivel nacional. En el 2004, se publica
la ley 28041 que aparece como medida de proteccin y control del patrimonio
nacional de camlidos sudamericanos en apoyo a la exportacin de los productos y
sub-productos, a fin que promueva y asegure el mejoramiento gentico, indicando la
tica del uso de la biotecnologa, as como de la administracin del empadre respecto
a los registros genealgicos. Aparece, posteriormente, la modificacin de la ley
28041, en que faculta al CONACS a realizar supervisin y control bajo su
responsabilidad a fin de lograr un registro con informacin de alta confiabilidad. En
el 2005, sale publicado la ley de promocin a favor a los camlidos sudamericanos,
que propone la mejora gentica en las organizaciones y comunidades vinculadas a
nivel nacional. Se establece una reformulacin en el registro genealgico. Es tambin
importante aadir que el registro es el instrumento que permite a los productores a
defenderse y al estado a controlar los efectos de la contaminacin gentica y de las
fuerzas que afectan las frecuencias gnicas en una poblacin.

El INDECOPI (Indecopi, 2004), a travs del Comit Tcnico de


Normalizacin de Fibra de Alpaca, entre los aos 2002 y 2003, reuni a diferentes
instituciones y empresas lderes en materia de produccin de fibra de alpaca, las
mismas que en forma consensuada, y tomando como antecedente la informacin
proporcionada por el Instituto Peruano de la Alpaca y Camlidos, llegaron a acuerdos
significativos para categorizar los grosores de la fibra para el comercio. El Cuadro
3.1 explica los valores que definen los grosores y otros atributos identificados
mediante diferentes pruebas y en consenso nacional.

- 36 -
FINURA Largo - mm Humedad Slidos Grasa
CLASIFICACIN (micrones) % Mx. Minerales % Mx.
% Mx.
Extra Fina Hasta 23 65 8 6 4
Fina 23.1 a 70 8 6 4
26.5
Semi Fina 26.6 a 70 8 6 4
29
Gruesa Mayores 70 a 8 6 4
a 29 menos

Cuadro 3.1. Clasificacin de la Fibra de Alpaca (Indecopi, 2004).

- 37 -
CAPTULO IV
INGENIERA DEL ARTEFACTO

Este captulo trata del diseo fundamental del artefacto, que para esta
investigacin corresponde al Motor Algortmico, donde se hace una descripcin
detallada de sus partes y modelo de datos. Adems, se da las pautas de integracin
entre los diferentes modelos y las especificaciones de hardware y software en el cual
ser desarrollado.

4.1. Modelo Conceptual del Artefacto


En el Per existen diferentes estudios sobre la mejora y manejo de animales,
en relacin a la fibra de alpaca, muchos de estos estudios comparten la esencia de
este enunciado emitido por la Unidad de Biologa Molecular de la Universidad
Particular Cayetano Heredia, que dice: En el Per los registros en alpacas se basan
en observacin y empadre controlado lo cual no asegura el 100% de confiabilidad en
la identidad y parentesco de los animales que ingresan a los libros de registro. El uso
de marcadores moleculares para la identidad del animal y la seleccin dirigida
ayudar a mejorar la productividad como parte de la estrategia usada en la intensa
seleccin para la mejora de las caractersticas productivas en otras especies
domsticas3.

Bajo este contexto, los marcadores moleculares se convierten en la piedra


angular en el esbozo del modelo conceptual (ver Figura 4.1), porque hasta ahora no
es considerado metdicamente su contenido gentico en la seleccin y categorizacin
de la fibra.

Por otro lado, tambin se requiere ampliar la comprensin del potencial


fsico, la seleccin y categorizacin de la fibra, ya que hasta la fecha solo utiliza el
espesor de la fibra, como nico elemento de referencia. El estado del arte demuestra
la existenciade otros descriptores fsicos del fenotipo del animal y que estn
presentes en los libros de los registros genealgicos.

[3] Proyecto de Generacin de Ncleos de Alpacas Reproductoras de alta productividad basados en la


seleccin asistida con marcadores genticos de ADN. Financiamiento Concytec FINCyT-PIBAP-2007

- 38 -
En la descripcin del modelo conceptual se empiezaagregando los datos de
los marcadores moleculares y los registros genealgicos. Estos datos son
transformados en patrones para quedar aptos en la ejecucindel motor algortmico.

El motor algortmico est compuesto por un sistema de redes neuronales


artificiales, cuyo objetivo es lanzar un resultado que exprese un nivel de calificacin.
Este motor es alimentado, adems, por los conocimientos de seleccin y
categorizacin de la fibra, recogidos desde los expertos, as como tambin de la
discusin de esos resultados como parte del proceso de aprendizaje evolutivo en el
entrenamiento y reconocimiento con la ayuda de la experimentacin.

Figura 4.1. Esquema del Modelo Conceptual del Artefacto.

La calificacin se determina entre la convergencia de las variables:calidad de


la fibra, valor comercial y la pureza de la raza del animal.Esta convergencia forma un
conjunto de estereotipos excluyentes en seis niveles de calificacin, que representan
el perfil comercial de la alpaca en el mercado.

- 39 -
Cabe resaltar que para la elaboracin de este trabajo de investigacin se
utiliz la metodologa del CRISP-DM, como gua para el desarrollo del artefacto. La
razn de utilizar este modelo de referencia, y segn (Chapman, y otros, 2000), es
porque ayud a construir el motor algortmico, el cual necesita de la minera de datos
para alcanzar sus objetivos.

4.2. Comprensin del Negocio


En el estudio realizado por (Sarah, 2006), acerca de la cadena de valor,
evidencia cmo los pequeos y medianos productores acopian el material hacia sus
centros de produccin, donde se clasifica y prepara para su posterior hilado o venta
de vellones pre-tratados. En este punto, el insumo puede ser exportado o vendido a
intermediarios para su distribucin. Las empresas grandes absorben el total de la
produccin para producir el hilado o confeccionar prendas, que a su vez son
extendidas por los intermediarios para colocar los productos terminados hacia los
mercados extranjeros (ver Figura 4.2).

Figura 4.2. Cadena de Valor de la Fibra de Alpaca (Sarah, 2006).


Se aprecia, adems, que en el circuito de la cadena de valor, los Rescatistas
son las personas que se encargan de las actividades de colecta, tratado y preparado de
- 40 -
la fibra para ofertar a las empresas. Es aqu donde se clasifican y categorizan la
produccin de fibra a travs del personal de campo, que por observacin y
experiencia tienen el conocimiento de discriminar las calidades de la fibra, inclusive
aproximndose a la Norma Tcnica Peruana 231.300 de INDECOPI.

En este escenario, los principales actores (Sarah, 2006) que forman el modelo
de stakeholders son los Alpaqueros, conocidos tambin como criadores, que van
desde campesinos en condiciones precarias hasta aquellas empresas perfectamente
constituidas y acreditadas (ver Figura. 4.3).

Todos ellos acopian cantidades de vellones. El material es lavado, peinado e


hilado por empresas textiles; el otro caso, es que los artesanos hagan la misma tarea.
El gobierno apoya bsicamente en el recorrido de la cadena de valor, como son el
Ministerio de Agricultura, de la Produccin, PROMPEX, entre otros. Finalmente, las
ONGs tienen un papel importante, ya que se encargan de apoyar cuando surgen los
problemas sociales y culturales, a favor de que se lleve a cabo un circuito menos
complicado.

En la Figura 4.3, las flechas de mayor espesor indican una fuerte vinculacin
entre los nodos, las flechas con menor espesor denotan una dbil cercana,
finalmente, las lneas punteadas explican la presencia de otras unidades estratgicas
de negocio dedicadas a la explotacin de otro sub-producto de este animal.

- 41 -
Figura 4.3. Modelo de Stakeholders en la Produccin de Alpaca (Sarah, 2006).

Como se ha apreciado arriba, la crianza de alpacas nace en las comunidades


rurales. La manera como se lleva a cabo las crianzasresponde a las formas
tradicionales. En algunos lugares todava existe mucha desconfianza en los
organismos privados y estatales para aplicar los mtodos en mejora de la especie
(Mueller, 2007), esto debido a que se argumenta que no son eficientes y encarecen
los costos para su mantenimiento, optando por las enseanzas ancestrales en el
manejo de los animales. Todo ello provoca mutaciones inesperadas, migraciones y
deriva gentica en las poblaciones, haciendo ms probable una contaminacin
gentica y, por consecuencia, una reduccin del potencial gentico, sin que el criador
pueda apreciarlo y entenderlo. Estas fuerzas evolutivas hacen que los individuos
expresen fenotipos de la fibra no deseados, poniendo en riesgo la sostenibilidad de la
produccin en el tiempo.

Las empresas de hoy, sujetas a este marco de negocio, cuentan con


infraestructuras tecnolgicas con aplicativos ms o menos preparados para explotar
los datos y alcanzar una mejora en la gestin de conocimientos; pero poco se ha
dicho y hecho por descubrir el verdadero valor estratgico de la tecnologa de
informacin (Mohammad, 2007). Requieren de innovacin tecnolgica para relanzar
su ventaja competitiva (W. Chan, y otros, 2005).

- 42 -
Segn el Programa de Camlidos del SYNACIT (PROCAM, 2007), sugiere
que este problema forma parte de otros, los que son citados a continuacin:

a) No hay suficiente capacidad de innovacin para encontrar procesos para


reducir la enorme cantidad de fibra gruesa de descarte de alpaca que se ha
acumulado.

b) Falta de innovacin en la comercializacin ms moderna para la organizacin


de la oferta y para la articulacin comercial con la industria.

c) No se ha logrado una tecnificacin e innovacin productiva-comercial que


permita mantener una calidad estndar de mejor finura y volumen.

d) Existe un bagaje de conocimientos tradicionales, muchos de ellos validados


con mtodos modernos, que se vienen perdiendo, lo que deriva en prdidas de
calidad en la crianza y cruzamiento, ello a su vez ha conllevado, entre otros
problemas, a una escasa disponibilidad de fibras de colores naturales en
alpaca. Se estima que existen 22 colores naturales de fibra.

En el desarrollo del trabajo, se obtuvieron expertos multidisciplinarios, tanto


a nivel del reconocimiento de la fibra, la caracterizacin gentica y, aquel que tiene
experiencia en generar un valor econmico al individuo. Se utiliz el mtodo Delphi,
para elegir y generar la encuesta que sirvi en el diseo y construccin del artefacto.

4.3. Entendimiento de los Datos


El motor algortmico es un sistema que consta de tres componentes: modelo
alfa, beta y landa (ver Figura 4.4). El primero, explora la informacin para confirmar
la presencia de rasgos fsicos de inters entre los individuos, de tal manera que
cumplan un perfil en el mercado. El segundo, pretende encontrar relaciones entre el
patrn de la diversidad gentica del animal con el color blanco del animal. De
acuerdo a lo encontrado en el estado del arte, muchos de los autores precisan que es
altamente probable la presencia de fibra fina cuando el velln tiende al color blanco.
Por ltimo, el tercer componenteintegra las respuestas de los componentes anteriores.
Este componente tiene como objetivo generar las conexiones entre las caractersticas

- 43 -
de inters descubiertas en el fenotipo del animal contra la relacin entre su diversidad
gentica. Esto da por resultado una votacin en el modelo que calcula un nivel de
calificacin para estimar una posicin que explica su perfil en el mercado.

Figura 4.4. Arquitectura del Motor Algortmico del Artefacto.

La idea del motor algortmico es porque se necesita atender el requerimiento


para evaluar los contenidos fenotpicos y genotpicos de la alpaca,asignando una
calificacin, tal como en la realidad lo hace el experto en el proceso de seleccin y
categorizacin de la fibra. Y en lugar de obtener una percepcin sesgada de la
calidad de la fibra, ahora el motor podr ampliar esa percepcin y orientar la
calificacin hacia un perfil comercial. Se basaron de los resultados de la encuesta
realizada a los stakeholders (Ver Anexo D).

El modelo alfa () corresponde al descubrimiento de un fenotipo con


caracterstica de inters, utiliza una red de Perceptrn Multicapa. El modelo beta ()
analiza las relaciones entre el genotipo y el color blanco, utiliza una regla de
asociacin. Y, finalmente, el modelo landa ()determina el nivel de calificacin,
tambin utiliza una red Perceptrn Multicapa.

Durante ese proceso es necesario contar con algunas consideraciones para


usar los marcadores moleculares, as se deben cumplir estos requisitos: contar con

- 44 -
una probabilidad de exclusin 0.989989 y un PIC de 0.968, adems de tener alta
presencia de heterocigocidad y el equilibrio de Hardy-Weinbeirg4. (Aranguren, y
otros, 2001) (White, y otros, 2007).Estos requisitos aseguran que la caracterizacin
de los marcadores moleculares expresen valores independientes a los fenmenos de
las fuerzas evolutivas.

Cabe recordar que la calificacin hallada representa un score entre los


individuos de una poblaciny trabaja a manera de un snapshot o fotografa del
individuo.

4.3.1. Modelos del Sistema: Modelo Alfa


4.3.1.1. Definicin de las variables de entrada
Considerando las referencias bibliogrficas de las investigaciones
encontradas desde el estado del arte, en relacin a la fibra fina de la alpaca,
las instancias que se usarn en el modelo son:densidad, rizo, uniformidad,
color, factor de confort, pureza, edad y sexo(ver Cuadro 4.1).

Cuadro 4.1. Registro de Datos del Modelo Alfa.

[4] Es un principio basado en gentica de poblaciones, donde para entrar en equilibrio es como tomar
a un individuo de la poblacin, es tomar dos alelos al azar. En el caso de los marcadores moleculares
se requiere que se encuentre en equilibrio (Oliva, y otros, 2004).

- 45 -
4.3.1.2. Definicin de las variables de salida
Para la salida, en este modelo, la instancia denominada caracterstica
de inters se define como el conjunto de caractersticas afines que forman
un perfil comercial en una escala del 1 al 5. Fue construida en
coordinacin y consultas por diferentes expertos en la comercializacin de
la fibra. Estas son:

(1) Individuo para la exportacin:


exportacin: domina como atributos principales, el
color blanco de la fibra, la fibra extrafina y las hembras. Expresan un
probable valor comercial y atractivo para el mercado.

- 46 -
(2) Individuo para la reproduccin: domina la fibra en sus diversos
colores y tonalidades, con tendencia a la fibra fina. Un factor de confort
debajo del 95% adjudica a un valor sostenible del fenotipo en la poblacin.

(3) Individuo para venta local de fibra y carne: domina la pureza, el rizo
y la densidad folicular, sin destacar la calidad de la fibra. Simboliza un
valor conservador del fenotipo en la poblacin.

(4) Individuo no apto para la reproduccin: domina sus caractersticas


intrnsecas en valores no significativos para la produccin de fibra fina en
alpacas.

(5) Individuo propuesta al sacrificio: domina incertidumbre en su


caracterizacin fenotpica que expresan valores no significativos y
conflictos en la produccin de fibra fina de alpaca.

4.3.2. Modelo Beta


4.3.2.1. Definicin de las variables de entrada
En este modelo se usaron los valores del genotipo, es decir, del
marcador molecular. Los valores se obtienen de un proceso en laboratorio
llamado secuenciamiento de micros-satlites de secuencia repetida. Para el
efecto, se toman muestras de ADN por cada animal y se van colocando en
forma aleatoria marcadores moleculares. El total de marcadores
moleculares que se emplearon fueron de diez unidades por cada individuo.

Estos marcadores pasan por un proceso de electroforesis y luego es


ampliada la secuencia para formar la caracterizacin gentica que explica
la presencia o ausencia del gen del color blanco de la fibra. De esta
manera, una propiedad homocigoto es cuando los genes son recesivos y
heterocigoto cuando estos son dominantes.

El CONACS fue un organismo pblico descentralizado que existi


desde 1992-2006 por D.S. N. 026-92-AG del Ministerio de Agricultura,
cuya funcin principal fue de proteger y conservar las especies de

- 47 -
camlidos sudamericanos en el Per; tena entre sus actividades la
certificacin de caractersticas heredadas del progenitor, demostrando la
pureza de sangre del animal, llamndolos Pedigrs cuando estos animales
cumplan diversos requisitos hechos en laboratorio.Es altamente probable
que un animal homocigoto tiende a ser no pedigr, debido que poseen
genes recesivos y, por tanto, no pertenecen a la lnea directa de
descendencia respecto a su progenitor(Gomez, y otros, 2000).

Tambin el color blanco de la fibra es sinnimo de la presencia de


finura en su espesor. Un escenario ideal es que los individuos sean
heterocigotos y pedigrs, con presencia del color blanco en la fibra y
relacionados con los marcadores moleculares y que, a su vez, estn
contenidos con los genes de inters publicados en la NCBI.

En el Cuadro 4.2se observa la coleccin de objetos que participan en el


modelo beta y se fundamenta en la regla de asociacin, la cual se describe
a continuacin:

- 48 -
Cuadro 4.2. Matriz del modelo de datos de beta.

4.3.3. Modelo Landa


4.3.3.1. Definicin de las variables de entrada
El modelo de datos se origina de las variables de los otros modelos del motor
algortmico,, pero adems se agregaron la edad del animal y la apreciacin comercial
para entender la percepcin del experto al momento de pretender una calificacin al
animal. En ell Cuadro 4.3
4. se explica estas variables de entradas:

- 49 -
Cuadro 4.3. Matriz del modelo de datos en landa.

4.3.3.2. Definicin de las variables de salida


La variable de salida para este modelo es el nivel de calificacin, expresada
en una escala de seis tipos (ver Figura 4.5).
4.5) Cada tipo dibuja un perfil comercial del
individuo, sugiriendo una accin. Para construir la escala, primeramente se analiz la
literatura, no encontrando alguna metodologa comn que permita evaluar los
individuos segn su fenotipo y genotipo, por tanto, se cruzaron opiniones como
discusiones entre los expertos y personas que toman decisin, de tal forma, que se
concluy la convergencia de tres variables claves: pureza de la raza, valor econmico
y calidad
alidad de la fibra. La intensidad de estas variables dan como origen a un nivel de
calificacin, es decir de un estereotipo o tipo que perfila al animal de acuerdo a sus
caractersticas y oportunidad en el mercado, se consideraron hasta seis niveles, donde
el nivel uno es menos importante y el seis ms. La descripcin de estos tipos es como
sigue:

- 50 -
Figura 4.5. Matriz del Nivel de Calificacin.

El tipo I, no tiene ningn aporte al valor estratgico del animal. No es un


individuo que sea recomendable para exportacin de fibra fina de alpaca, se
recomienda efectuar nuevas estrategias en el manejo y seleccin de alpacas por
varias generaciones.

El tipo II, no siempre demuestra valor en la calidad de la fibra. No es un


individuo para la exportacin de fibra fina de alpaca. Su fenotipo no demuestra
suficiencia en el cumplimiento de las caractersticas que se exigen en el mercado
internacional.

El tipo III, demuestra una buena calidad de fibra pero sus individuos no estn
certificados adecuadamente. Por tanto, su contribucin no es la esperada. Esta
poblacin necesita de nuevas estrategias en el manejo y la inseminacin artificial
para mejorar las especies, adems de mejorar el control del empadre y realizar un
anlisis de parentesco masivo para su certificacin mientras sea posible.

El tipo IV, el individuo presenta una raza pura sangre, pero su potencial
gentico probablemente no sea lo esperado o simplemente no se han expresado

- 51 -
genticamente por el ambiente. No califica para la venta al exterior, pero resulta muy
atractivo al mercado nacional. Tambin puede usarse como ejemplares para
exposiciones de primera.

El tipo V, el individuo en este escenario, por lo general, se caracteriza por su


resaltante calidad de fibra fina y est muy bien certificado, conociendo as su origen.
La poblacin presenta excelentes oportunidades para apuntalar en el mercado
internacional. Esta casta puede ser controlada en generaciones futuras.

El tipo VI, el individuo est perfectamente controlado, est certificado como


pura sangre y la calidad de fibra fina es casi segura en una siguiente generacin. Los
efectos de los fenmenos ocurridos en la genmica poblacional no son frecuentes y
de menor impacto. El ejemplar es ideal para ventas estratgicas en el mercado
internacional y para una reproduccin selectiva.

4.4. Preparacin de los Datos


Una vez estructurado los datos que participan en el modelo, estas variables
pasaron por un proceso de limpiezapara descubrir comportamientos inadecuados y
cualquier otro ruido, como son: entropa, outliers, redundancia, nulos. Mediante el
uso de las herramientas se logr liberar las variables de estos problemas, limpiando y
balanceando los datos. Tambin se homolog la informacin, discreteando algunas
veces y otras numerando.

Por ejemplo, para el modelo Alfa, se analiz el comportamiento de las


variables que participan, respecto al ruido existente, encontrndose desviaciones en
los datos como son los outliers y los registros nulos. Tambin se discretearon las
variables nominales en las entradas y se numer para las variables de salida. Este
procedimiento evita cualquier sesgo en la interpretacin de los datos.

Un aspecto importante es el anlisis de la entropa de los datos, esto quiere


decir, qu tanta informacin aporta la variable en el modelo, encontrndose niveles
aceptables en los datos para encaminar un proceso de clasificacin.

- 52 -
En la Figura 4.6, se puede notar histogramas de las variables utilizadas en el
modelo Alfa. Ah se aprecia la diferencia de la moda de los elementos, es as que el
tamao de la distribucin de datos entre los valores de la variable determina un
discriminante, haciendo posible diferenciarlos. Se observa con cuidado que la
variable Sexo, la barra con el valor hembras, se distingue entre la barradel valor
machos, lo cual permite tomar una decisin rpida y justifica su utilidad para su
clasificacin en el modelo. Sin embargo, en el grfico no se han balanceado los
datos, esto significa que es necesario homologar los tamaos de las frecuencias para
ganar comprensin en el anlisis.

Finura

Uniformidad

Sexo Color

Factor de Confort

Rizo Densidad

Figura 4.6. Progreso del Anlisis de Datos.

4.5. Modelado
Para alcanzar un mejor rendimiento, se consider la informacin de la fase de
sntesis del UCD para rescatar los requerimientos y estilos de los stakeholders y
agregarlo en los lineamientos del diseo del artefacto, as como para alcanzar un
mejor nivel de detalle en cuanto al uso del modelo algortmico, haciendo del look
and feeling del artefacto un modo de concepcin.

En la estrategia del diseo se utiliz las redes neuronales artificiales y las


reglas de asociacin como tcnicas para articular los modelos alfa, beta y landa. A
continuacin se pasa a describir su topologa como elemento de diseo:

- 53 -
4.5.1. Modelo Alfa
4.5.1.1. Descripcin y alcance del modelo alfa
El modelo alfa tiene como objetivo descubrir las propiedades fsicas de las
alpacas a partir de un perfil comercial que se refleja en cinco posibles estados. En la
prctica, es como descubrir los patrones fenotpicos y clasificarlos segn la
perspectiva del vendedor. Al determinar una clasificacin, se puede entender qu
tanto aporta el animal en trminos de rentabilidad, debido a la presencia de la fibra
fina en su fenotipo. La arquitectura utilizada es una red neuronal del tipo perceptrn
multicapa supervisada. El modelo no busca patrones socio-econmicos que se
encuentren ligados a la produccin o rentabilidad.

4.5.1.2. Topologa de la red


Para definir la topologa es una red de Perceptrn Multicapa fue necesario
investigar cmo se comporta sta frente a diferentes configuraciones, tales como:
nmero de capas ocultas, error cuadrtico y tipo de funcin de activacin.

Se realizaron diferentes ensayos para crear la topologa, para ello se


analizaron corridas utilizando diferentes niveles de capas ocultas, as como de un
nmero de neuronas para encontrar el mejor desempeo.

En el estudio se pudo notarque al trabajar con cinco neuronas en una capa


ocultase consigui un mejor rendimientofrente a otros ensayos con configuraciones
distintas. Se pudo apreciar que la evolucin del aprendizaje dejaba de ser eficaz
cuando se incrementaba niveles en las capas ocultas, obteniendo puntos de saturacin
(off-set) que impidieron mejorar los ptimos locales.

Por lo contrario, cuando se us una sola capa oculta, la variacin de los


resultados alcanzun error cuadrtico menor.

En consecuencia, la topologa final y que fue aceptada por los expertos


corresponde a una red de 9 neuronas de entradas, una capa intermedia con cinco
neuronas y, finalmente, una neurona de salida. Se tom en cuenta la funcin
sigmoide como elemento de activacin en la red neuronal (ver Figura 4.7).

- 54 -
Figura 4.7. Topologa del Modelo Alfa.

4.5.1.3. Pruebas

Se realizaron pruebas para medir el rendimiento en funcin a su error


cuadrtico que devuelve cada topologa. En la fase de entrenamiento se trabaj con
una muestra del 30% de los datos, consiguiendo un error menor en la configuracin
de una capa intermedia y cinco neuronas. Para otras configuraciones que implican
mayor nmero de capas intermedias el valor del error era creciente, por lo que se
descart en la presentacin de los datos. En la fase de test para el reconocimiento se
utiliz el 70% de los datos, obteniendo resultados tal como se indica en el cuadro
(ver Figura 4.8 y Cuadro 4.4):

Cuadro 4.4 Matriz de la definicin de la topologa de la red.

- 55 -
Figura 4.8. Matriz de definicin de la topologa de la red.

4.5.2. Modelo Beta


4.5.2.1. Descripcin y alcance del Modelo Beta
El objetivo del modelo beta es obtener informacin relacionada entre la
gentica del animal y el color blanco de la fibra. De tal manera, que se pueda
dimensionar la validez de la expresin del fenotipo y decidir la presencia o ausencia
de la fibra fina. Su principal limitacin es que se trabaj con un grupo reducido de
reglas de asociacin debido a que no existen ms trabajos sobre ello y, por tanto, la
experiencia recibida apunt a un nmero finito de reglas.

4.5.2.2. Formacin de las Reglas de Asociacin


Los expertos fueron consultados sobre las diferentes reglas que se hallaron
viables para descubrir vinculaciones que contribuyan en determinar el objeto color
blanco como uno de los elementos de la coleccin. De ser as, se considera altamente
probable que el contenido gentico corresponda al fenotipo presente en el animal y
que, por tanto, su descendencia herede las caractersticas de fibra fina en
generaciones posteriores.

Todos los supuestos fueron consultados y revisados en la realidad a travs de


ensayo-error con los expertos en gentica, y as definir sus posibles relaciones. No
existen experiencias anteriores, por lo que fue necesario la participacin de los
conocimientos y experiencia de los expertos para sostener un segmento de reglas que
se consideran tiles, aunque en la prctica se contabiliz un nmero exponencial.

- 56 -
Se utiliz la regla de asociacin con el algoritmo A priori. En las corridas
se estabiliz cuando su soporte mnimo era igual a 0.01, la mtrica de 0.09 y un delta
de 0.05. La configuracin de sus parmetros dependi de las pruebas de ensayo-
error.

Las reglas de asociacin, que fueron definidas en el Cuadro 4.3, ahora se


presentan siguiendo la estructura lgica como sigue a continuacin:

Regla 1: Homocigoto |y| Pedigr |Entonces| No Color Blanco


Regla 2: Homocigoto |y| No Pedigr |Entonces| No Color Blanco
Regla 3: Homocigoto |y| Pedigr |Entonces| Color Indefinido
Regla 4: Heterocigoto |y| Pedigr |Entonces| Color Blanco
Regla 5: Heterocigoto |y| No Pedigr |Entonces| Color Blanco
Regla 6: Color Blanco |y| Alelo A=X |y| Alelo B=X |Entonces| Heterocigoto

Entre este conjunto, se destaca la regla 4, como aquella que esta relacionada
directamente con la relacin fenotipo-genotipo y por ende del valor comercial que es
reflejado mediante los patrones en la escala de calificacin.

4.5.3. Modelo Landa


4.5.3.1. Descripcin y alcance del Modelo Landa
El objetivo principal del modelo landa es conseguir la calificacin individual
de la alpaca, la cual se basa en tipos. Con esta parte se concluye el trabajo del motor
algortmico que, finalmente, tiene como expectativa asignar un valor a la alpaca en
relacin a su contenido fsico y gentico. La mayor limitacin es la transferencia del
error de la red.

4.5.3.2. Topologa de la red


Se utiliz una red de Perceptrn Multicapa como herramienta para el
manejo de los patrones de datos. Se apreci que la funcin de la red se comport
mejor cuando se logr una configuracin de 6 neuronas de entradas, una capa
intermedia de cinco neuronas y una neurona de salida (ver Figura 4.9), alcanzando

- 57 -
resultados ms atractivos. Se pudo observar que cuando se increment el nmero de
capas intermedias, el error cuadrtico tambin aument, haciendo menos probable su
uso.

La funcin de activacin utilizada fue la sigmoidea, al igual que en el


modelo alfa, lo cual contribuy al logro de una curva de aprendizaje ms corta.

Figura 4.9. Topologa del Modelo Landa.

4.5.3.3. Pruebas
Para la fase de entrenamiento, se muestre el 30% de los datos, el error
cuadrticoconseguido se considera aceptable, llegando hasta al 4% para una
configuracin de una capa intermedio y cinco neuronas. En la fase de
test(reconocimiento) se utiliz una muestra del 70% de los datos, obteniendo un error

- 58 -
del 4%. Estos resultados fueron analizados en la realidad, observando un
reconocimiento positivo entre los expertos (ver Figura 4.10 y Cuadro 4.5).

Otras configuraciones en el test se utilizaron sin mayor inters, debido a la


brecha de los errores cuadrticos que se iban develando.

Cuadro 4.5 Matriz de la topologa en el modelo landa.

Figura 4.10. Matriz de la topologa de la red landa.

4.6. Evaluacin
Se realizaron pruebas unitarias por separado en cada modelo, observando que
se obtuvo un promedio de 0.346 de error. Estas pruebas no solo midieron el error
sino la consistencia de los patrones, los cuales se confirmaron con expertos distintos.

Finalmente, se realizaron pruebas integrales, utilizando al modelo landa,


como elemento integrador. Estas pruebas miden bsicamente la integridad del uso de
las herramientas informticas para la aplicacin en el modelo.

- 59 -
4.7. Despliegue
El artefacto y los modelos ya entrenados fueron implementados en computadores,
inmediatamente, en campo, se desarroll los primeros ensayos experimentales.En el
captulo del caso de estudio se describe el proceso de la implementacin de este
artefacto, mediante la aplicacin del experimento.

4.8. Especificaciones de Hardware y Software


Este trabajo de investigacin necesit correr en un sistema de Windows
Server 2003, en donde se instal la base de datos MS-SQL 2008 (versin demo) y su
componente AnalysisServices.

Tanto para el entrenamiento como para el reconocimiento se utiliz el plug-


in, que est publicado en el portal de Microsoft, los complementos para Excel 2007
(versin demo), llamado DataMining.

Tambin se descarg del portal de la Universidad de Waikato de Nueva


Zelanda, la versin libre del Weka versin 3.7.0, aadiendo el JVM de Java.

Para las corridas de las pruebas se utiliz una computadora core 2 duo, marca
Intel con 2 Gb. de memoria RAM y un espacio potencial de uso de aproximadamente
3 Gb. entre almacenamiento por instalacin y carga de datos.

- 60 -
CAPTULO V
CASO DE ESTUDIO

Este captulo trata del proceso de entrenamiento en los diferentes modelos, se


explica la evolucin del aprendizaje y la eficiencia del reconocimiento utilizando la
matriz de confusin. Finalmente, se determina los mecanismos en la gestin de
errores que produce el motor algortmico.

5.1. Preparacin de los Datos


Los diferentes modelos fueron tratados,en primer lugar, con un riguroso pre-
procesamientoque busceliminar cualquier ruido en el modelo de datos, teniendo
cuidado de la presencia de registros hurfanos.

Fue importante prestar atencin a los outliers, para lo cual se redujeron


valores extremos, que en este estudio es posible aplicar estabilizando con ello el
modelo de datos, los cuales fueron excluidos en el peor de los casos.

Otro aspecto importante es que se balancearon los datospara evitar un sesgo


que pueda impactar en los resultados y, adems, se haga viable la corrida en el
software que aplican estos modelos de clasificacin, agregando a ello la
normalizacin de los datos.

5.1.1. Patrones de Datos


En la informacin encontrada se observ diferentes estructuras del mundo
realque revela ciertas conductas en la expresin de los caracteres fsicos, como
consecuencia del medio ambiente y la evidencia encontrada en el fenotipo del
animal, con respecto a la fibrade alpaca.Posteriormente,corroborados con la literatura
encontrada,se manifest un patrn de datos que fue apropiadamente representado.

Este fenmeno, imita la manera como el experto adquiere el conocimiento


para estos fines y que gracias a la experiencia de quienes realizan la actividad de
clasificacin de la fibra en los cobertizosse pudo capitalizar la riquezadel
conocimiento que se agrega tras-generacionalmente, que finalmente fue utilizado en

- 61 -
los modelos de la arquitectura del motor algortmico. Adems, se agregaron otros
conocimientos en los patrones que son persistentes en la poblacin, como son las
mutaciones y migraciones, que se suman de las diversas experiencias en el tiempo.

5.2. Modelado
5.2.1. Modelo Alfa
5.2.1.1. Ciclo de Aprendizaje
Se agregaron un nmero considerable de ejemplos que explican la
formacin de los patrones a reconocer. Cada ejemplo tena
correspondencia biunvoca con uno de los estados de salida a reconocer,
basados en el comportamiento del fenotipo.

El reto mayor es hacer que el modelo aprenda, para ello se entren a la


red con ciclos variados para encontrar el punto de evolucin del
aprendizaje, donde fue complicado determinar los constructos adecuados,
sin embargo,por ensayo-error se hizo posible afinar los parmetros para
conseguir resultados que vayan acorde con la realidad, tal como se ve en el
Cuadro 5.1.

Cuadro 5.1. Ciclo de aprendizaje del modelo alfa.

Sise observa en la matriz con detenimiento, se puede confirmar que la


red neuronal artificial aprende discretamente entre tramos de pocas

- 62 -
relativamente amplias, consiguiendo estabilizarla desde el ciclo 1100,
donde senota que a partir de este puntoel aporte de aprendizaje es mnimo
hasta la poca 2100, en donde deja de aprender(ver el grfico 5.1).

Figura 5.1. Evolucin del aprendizaje en el modelo alfa.

5.2.1.2. Tabla de Contingencia.


El error cuadrtico es un indicador que ayuda a entender el grado de
optimizacin logrado, pero no garantiza que exista una ocurrencia de
aciertos entre los ejemplos entregados al modelo.

Cuando se ejecut la matriz de confusin sobre el modelo de datos del


entrenamiento, se pudo notar que la diagonal resultante tiende al 100%, eso
explica que los aciertos del modelo son altamente probables, por tanto,
existe gran confiabilidad en la salida de los datos(ver Cuadro 5.2)(mayor
detalle vea Anexo F).

La diferencia del porcentaje est repetida en el resto de la matriz, lo


que significa que existen valores que muestran un falso positivo o falso
negativo, descartando esta posibilidad.

- 63 -
Cuadro 5.2. Tabla de Contingencia del Modelo Alfa.

5.2.1.3. Instancias de Pruebas de Entrenamiento y Validacin


Durante el entrenamiento se pudo apreciar que la red neuronal
artificial pudo aprender los valores expresados segn las categoras de la
clase predictiva.

La matriz de confusin pudo confirmar que los eventos de la clase


predictiva, como Individuo de Exportacin (1) y Individuo propuesto a
sacrificio (5), no llegan a aprender completamente. Para el primer caso,
existe un 90% de aciertos lo cual existe un margen mnimo pero probable
de que no lo reconozca. Para el segundo caso, el porcentaje de aciertos
asciende a 30%, lo que es ms probable no reconozca al mismo.
Posiblemente, la estructuracin de los ejemplos se asemeja a otros patrones,
por tanto, no son muy reconocidos. Cuando se alter la estructura de los
ejemplos para alinear a un porcentaje viable, estos tuvieron impacto en el
resto de los elementos reconocidos, haciendo la matriz poco deseable, ya
que en su forma general no satisfaca a los requerimientos buscados.

Esta situacin fue compensadaen el proceso de juicio de expertos, en


donde cada valor publicado era analizado para ratificar o desvirtuar el
mismo.

- 64 -
5.2.2. Modelo Beta
5.2.2.1. Criterios de Asociacin Vinculante
Es importante conocer, en primer lugar, si los resultados del
geneotipeado se asocian a una poblacin homocigota o heterocigota. Esto
nos explica, en cierto modo, la relacin de la diversidad gentica frente a
los atributos claves de color y pureza del animal. En este trabajo de
investigacin se busca validar los caracteres dominantes del fenotipoy
evidenciar las relaciones que involucren la informacin del genotipo,
utilizada desde aqu. Sin embargo, existen casos, en algunas comunidades
andinas, donde sus animales recibieron una certificacin de pureza, pero su
fenotipo no revelms de lo esperado. A ello se suma los efectos de las
fuerzas genmicas, que probablemente sean crticas en el desarrollo para
conservar la sostenibilidad en la poblacin.

Esta situacin fue corregidatomando en cuenta una mayor atencin en


la calidad de los datos, lo cual se puso mayor rigurosidad para evitar
ingresos no coherentes o con falsos positivos.

La regla principal es que si el individuo es heterocigoto, pedigr y de


color de fibra blanca,entonces se infiere que su contribucin a la fibra fina
es importante y que posiblemente puede expresarse en el tiempo. Pero esta
lgica puede cambiar, debido a que la regla de asociacin puede establecer
un nuevo giro, distinto al propuesto arriba.

5.2.2.2. Criterios de Asociacin al Gen de Inters


Se sabe, segn la NCBI, que el gen melacortin-1 est asociado al color
de la fibra; para constatar que existe alguna afinidad con este gen, no se
aplic un algoritmo o modelo adicionalporque es comparado segn los
resultados lanzados en funcin a los pares de bases,haciendo que el campo
Evaluacin del gen de inters se convierta en 1 si los tamaos de los
pares de bases se acercan al mismo.

- 65 -
5.2.3. Modelo Landa
5.2.3.1. Ciclo de Aprendizaje
En este modelo el aprendizaje fue complicado al definir la salida
deseable, frente a los hallazgos concretos para determinar un
reconocimiento de calidad. Los ejemplos tuvieron que modificarse en
repetidas oportunidades para conseguir la optimizacin. Sin embargo,
basado en el estado del arte y por la experiencia de los expertos, se form
la matriz del modelo de datos para el entrenamiento.

En el entrenamiento se pudo notar que los valores empeoraban por


algn punto del ciclo de aprendizaje, luego se reduca hasta conseguir un
valor estable, tal como se observa en la poca 1700, que despus poco a
poco dejaron de aprender, hacindolo ciertamente viable(verCuadro 5.3).

Cuadro 5.3. Ciclo de aprendizaje del modelo landa.

En el Figura5.2 se observa lo indicado, lo cual fue importante, luego


de comparar con los resultados obtenidos en la matriz de confusin.

- 66 -
Figura 5.2. Evolucin del aprendizaje en el modelo landa.

5.2.3.2. Tabla de Contingencia.


En la evaluacin del modelo se apreci que, a pesar de contar un error
cuadrtico alrededor del 3%, la ocurrencia de aciertos no fue lo mejor. La
matriz de confusin no puede resolver con certeza el estado 3 y 6.
Probablemente, se deba a que los ejemplos no traducen adecuadamente
ciertos fenmenos de la realidad, dejando un margen de ineficiencia que fue
absuelta por los dictmenes de los expertos.La continuidad de la
retroalimentacin y la profundidad del anlisis ayudaron a obtener un
consenso en los resultados. Aunque no es un modelo con optimizacin
mxima, pues demostr que se alcanz con la expectativa final en el
reconocimiento(ver Cuadro 5.4)(mayor detalle vea Anexo G).

- 67 -
Cuadro5.4. Tabla de Contingencia del Modelo Landa.

5.2.3.3. Instancias de Pruebas de Entrenamiento y Validacin


En el entrenamiento, segn matriz de confusin, se puede evidenciar
que el tercer y sexto estado de la variable predictiva Tipo no son muy
asertivos. El primero tiene un aproximado del 67% de aciertos, lo que se
tiene un margen conservador de error, que en trminos generales tiene un
reconocimiento con ruido pero aceptable. En el segundo caso es ms
crtico, ya que no reconoce por qu, al igual que en el modelo alfa, la
estructura de los ejemplos no es suficiente para reflejar el patrn de datos.
Para suplir este problema se evala los resultados en funcin al juicio de
expertos.

5.3. Evaluacin
5.3.1. Descripcin del Caso
Sobre una muestra de 52 individuos de alpacas, tomados en un valle de Puno,
en el distrito de Huatasani,se tomaron muestras de piel de la alpaca y extraccin del
velln para su posterior medicin.

Asimismo, se recogieron los datos del registro genealgico de la poblacin de


alpaca en estudio, que fueron reutilizados para completar el llenado de los registros
del modelo de datos del fenotipo de los individuos. Se pudo constatar que existe
documentacin certificada sobre los animales que son identificados como pedigr.

- 68 -
Adems, se observ que existe empadre controlado, disminuyendo el riesgo de sesgo
en el procesamiento.

Las muestras de piel fueron llevadas al laboratorio de la Unidad de Biologa


Molecular de la UPCH, para su amplificacin, secuenciamiento y geneotipeado de la
mencionada muestra.

Sobre la misma, se coloc alrededor de 10 marcadores genticos, ubicados


estratgicamente en posiciones del cromosoma, a fin de encontrar relacin con los
valores publicados en el gen de inters.

El objetivo del caso es ejecutar el artefacto para determinar el nivel de


calificacin que corresponde. Previo a esta corrida, no hay antecedentes
documentados que mencionen algn alcance o restriccin del mismo.

5.3.2. Ejecucin del Caso


En primer lugar, se procede a utilizar los datos entrenados para ser ejecutados
en el modelo alfa. Lo que se busca es encontrar resultados que expresan el fenotipo
dominante de la alpaca(ver Cuadro 5.5).

Cuadro 5.5. Reconocimiento de patrones del modelo alfa.

- 69 -
Cada individuo tiene referenciado un valor de acuerdo a la escala de estados
que maneja el atributo. Es en este momento en donde se puede apreciar qu
caracterstica dominante se ha interpretado en razn a los patrones de datos que fue
usado en el entrenamiento.

Seguidamente, se analiza la informacin que se expidi en el laboratorio para


el genotipo del animal. Esta informacin pasa por un proceso de transformacin la
convierte a informacin til para su uso en el modelo beta.

Utilizando el Weka se realizan los ajustes necesarios para identificar los


atributos que se asocian al animal, que pueden o no estar relacionados con la fibra
fina de alpaca. En las Figuras 5.3 y 5.4 se observa los resultados que se obtuvieron
para este caso. No obstante, se relacionan los atributos que persisten en la muestra y
luego los alelos y locus comprometidos que tienen asociados en la muestra. Esta
asociacin es comparada con los valores publicados en la NCBI, aadiendo un valor
a la columna, si hay o no presencia.

Mediante un proceso de transformacin, que implica la valoracin de pesos


de acuerdo a la escala definida para este modelo beta, se lograron encontrar los
valores de las variables de atributos asociados y la evaluacin del gen de inters (ver
Cuadro 5.6).

Cuadro 5.6. Presentacin del modelo de datos de beta.

- 70 -
Figura5.3. Resultados del modelo beta primera parte.

Figura5.4. Resultados del modelo beta segunda parte.

Para el efecto, en la corrida del modelo se obtuvo un soporte mnimo igual a


0.098, la mtrica de 0.089 y un delta de 0.05

- 71 -
Tanto los resultados del modelo alfa como los del beta son trasladados a la
base de datos del modelo landa. Hasta el momento se ha podido identificar, en forma
separada, qu caracterstica es dominante y si el gen del color juega un papel
importante en el contenido gentico del estudio.

En esta nueva iteracin lo que se busca es reconocer, ya con los


atributos descubiertos, qu nivel de calificacin debe ponderarse individualmente,
segn los patrones de datos registrados. En la Cuadro5.7 se observa cmo utilizando
el AnalysisServices, el modelo previamente entrenado, se ha sugerido puntuaciones
individuales, cuyo significado fue descrito en una seccin anterior.

Cuadro 5.7. Reconocimiento de patrones del modelo landa.

Para concluir con un resultado global desde el modelo de datos, ya procesado,


se requiere mapear la informacin sobre un plano grfico que ayude a visualizar con
rapidez en qu valor de la escala corresponde la poblacin de alpacas en trminos de
puntuacin (ver Figura 5.5).

- 72 -
Figura 5.5. Mapeo de la puntuacin de la poblacin.

5.3.3.. Anlisis de los Resultados


Como resultado de este proceso se puede notar que la poblacin de alpaca
para este cobertizo corresponde al del Tipo I, lo que sugiere una poblacin con pocas
posibilidadess de exportacin. Probablemente,el genotipo no ha expresado su
verdadero valor debido a la influencia del ambiente.
ambiente. Como ya se haba mencionado
antes, esta puntuacin es un snapshot
snaps de la situacin actual,, lo cual puede ir variando
en el tiempo. Este ejercicio se puede repetir muchas veces, calificando de esta
manera la poblacin en sucesivas generaciones. El registro
egistro de estas calificaciones
debe ayudar a establecer nuevas estrategias
estrategias en el manejo de los individuos.

5.3.4.Descripcin
scripcin de la experimentacin
La experimentacin se realiz en los cobertizos de 3 departamentos del Per:
Cusco, Puno y Huancayo.

En el departamento de Cusco, provincia de Canchis,, distrito de Marangan


Marangan, se
encuentra la localidad de Chaupihuasi (ver Figura 5.6), abarcando una superficie de
3,999.27 Km2. Su posicin geogrfica est comprendida a partir de las coordenadas
1430 y 1456 de latitud Sur y 7124 y 7139 de longitud Oeste. A una altitud

- 73 -
promedio de 3,548 m.s.n.m. En este lugar se desarroll el segundo experimento del
trabajo de investigacin.

Figura 5.6. Vista del distrito deMarangan, provincia de Canchis.

En el departamento de Puno, provincia de Melgar, distrito de Santa Rosa (ver


Figura 5.7), se encuentra la localidad de Huaycuyo, que est situado a 134 Km. de
Juliaca y a 177 Km. de Puno, est ubicado a 3,993 m.s.n.m. Aqu se trabaj el primer
experimento para validar el artefacto.

Figura 5.7. Vista del distrito de Santa Rosa, provincia de Melgar.

- 74 -
El tercer experimento fue hecho en el departamento de Junn, provincia de
Huancayo (ver
er Figura 5.8),
5.8) en el distrito de Paccha, que see ubica aproximadamente
3750 m.s.n.m., caracterizado de un ecosistema muy cerca a la Puna. El ro ms
importante es el Mantaro.

Figura 5.8. Vista del distrito


istrito de Paccha, provincia de Huancayo.

En estos lugares se experiment con alpacas de la raza huacaya y suri (ver


Figura 5.9),, en sus diferentes variedades, con la colaboracin de la Universi
Universidad
Particular Cayetano Heredia y el Instituto Nacional de Innovacin Agraria.

Figura 5.9. Ejemplares mostrado desde un cobertizo.

- 75 -
5.3.5. Tcnica de Muestreo
La tcnica de muestreo utilizada fue el muestreo aleatorio al azar sin
reposicin, para cada experimento tratado. La seleccin de los individuos de la
muestra no mostr sesgo, de tal manera que cada uno tuvo la misma probabilidad de
ser elegido. En los tres experimentos la poblacin de alpacas es finita y conocida, por
tanto, el tamao de muestra se calcul de la siguiente manera:

(N* Z2 * p * q)

n = ____________________
(i2 * (N 1) + z2 * p * q)

Donde:
N: Tamao de la poblacin
n: Tamao necesario de la muestra
z: Valor asociado al nivel de confianza estimado
i: Error que se prev cometer
p: Prevalencia esperada
q: Valor complementario de 1-p

Para cada cobertizo se utiliz esta tcnica para obtener el tamao de la muestra,
considerando un escenario pesimista en el valor de prevalencia, en el cual se asigna
0.5. El procesamiento de la misma queda expresado en los siguientes resultados:

a) Experimento I, el tamao de la muestra equivale a 78 individuos.


b) Experimento II, el tamao de la muestra equivale a 71 individuos.
c) Experimento III, el tamao de la muestra equivale a 52 individuos.

5.3.6.Procedimiento del Experimento


5.3.6.1. Objetivo
El objeto de la experimentacin es demostrar que el artefacto es eficaz
en sus resultados, comparndolos a otros mtodos actuales, de tal forma
que deben ser similares.

- 76 -
5.3.6.2. Mtodo Estadstico
En este experimento se observa la existencia de informacin de ms
de dos diferentes mtodos. Cada uno de ellos con escalas distintas pero
relacionadas entre s. Estas caractersticas sugieren la utilizacin de la
prueba de Friedman, el cual, a travs de un proceso de sumatorias,
establece una probabilidad estadstica de que la hiptesis sea cierta (X2r =
Sigmoideo Asinttico), que es comparado con el valor del nivel de
significancia (). El mismo que es rechazado la hiptesis si > X2r. Es
decir, los tratamientos confrontados no son similares.

5.3.6.3. Elementos de Comparacin


A partir de la bsqueda de la informacin con el desarrollo de otros
trabajos, no se evidencia un artefacto con caractersticas similares para
efectuar la comparacin. As, se ha considerado como criterio tcnico el
espesor de la fibra como punto de convergencia entre las observaciones
realizadas por los expertos en el proceso de categorizacin de la fibra,
basados en la NTP 231.300:2004. Tambin, con la aplicacin de tecnologa
de equipos, llamado Lser-Scan, que analiza la estructura de la fibra bajo
estndares internacionales (OFDA-100), entre ellas el espesor. Finalmente, el
artefacto propuesto se bas en el contexto de la Norma Tcnica Peruana
citada, pero adems fue transformada a una escala particular.

Ya que ahora los elementos de comparacin arrojan resultados


diferentes, fue necesario generar un artificio estadstico para estandarizar los
valores y hacerlos comparables en los ensayos experimentales.

5.3.6.4. Mecnica Operativa


Durante la toma de muestra de vellones y de piel se pas a escoger
uno a uno los individuos en forma aleatoria y sin reposicin, los que
formaron parte de los experimentos. Para lo cual, el tcnico, por
observacin,efectu una votacin del aspecto de la fibra de la alpaca, en la
escala que la NTP 231.300 regula. Tambin emiti una opinin de la
apreciacin comercial del individuo. La colecta de estos datos form el
tratamiento por observacin.

- 77 -
La siguiente parte aparece a partir de la actividad anterior, donde las
muestras de la fibra fueron enviadas a laboratorios para su procesamiento,
con el equipo clasificador llamado Laser-Scan, en el cual se us el
estndar del OFDA-100, y siempre manteniendo el contexto de la norma
tcnica peruana para convertir la informacin resultante.

El ltimo tratamiento fue obtenido por el artefacto de la investigacin,


considerando al espesor de la fibra y otras variables de orden fenotpico y
gentico, ya descritos en el trayecto de este documento.

Todos tenan escalas diferentes, pero fueron normalizadas para su


procesamiento posterior en el SPSS.

5.3.7. Prueba de Friedman


Para la prueba de Friedman se ha considerado trabajar con un nivel de
significancia igual a = 0.05.

Se utiliz el software estadstico SPSS versin 19 para el procesamiento de


los experimentos programados, quedando los resultados como siguen:

Durante la ejecucin de los experimentos, en el artefacto se corri los


procesos del modelo independientemente al proceso estadstico usado, con la
informacin recabada para estos fines y que forma parte de la misma fuente utilizada
para todos los tratamientos.

- 78 -
Experimento I:

Localidad de Huaycuyo - Puno

Rangos
Rango promedio
Tratamiento por Observaciones 2,05
Tratamiento por Laser-Scan 1,86
Tratamiento por Artefacto 2,09

Estadsticos de contrastea
N 78
Chi-cuadrado 3,739
Gl 2
Sig. asintt. ,154
a. Prueba de Friedman

Experimento II

Localidad de Chaupihuasi - Cusco

Rangos
Rango promedio
Tratamiento por Observaciones 1,92
Tratamiento por Laser-Scan 1,94
Tratamiento por Artefacto 2,13

- 79 -
Estadsticos de contrastea
N 71
Chi- 3,102
cuadrado
gl 2
Sig. asintt. ,212
a. Prueba de Friedman

Experimento III

Localidad de Paccha - Huancayo

Rangos
Rango promedio
Tratamiento por Observaciones 2,17
Tratamiento por Laser-Scan 2,01
Tratamiento por Artefacto 1,82

Estadsticos de contrastea
N 52
Chi- 4,935
cuadrado
gl 2
Sig. asintt. ,085
a. Prueba de Friedman

5.3.8. Anlisis e Interpretacin


Como se puede apreciar, en todos los experimentos se apreci un valor de X2r
> 0.05, lo que significa que los tratamientos utilizados en el experimento son
similares y que no existen diferencias significativas entre s.

- 80 -
CAPTULO VI
CONCLUSIONES Y TRABAJOS FUTUROS

6.1. Conclusiones
a) Principal:
6.1.1. Se puede concluir que el artefacto tendr un efecto positivo en la
metrizacin y medicin de los individuos. No obstante, se estima que el
artefacto tiene una tendencia hacia la eficiencia, en cuanto a medir la
potencialidad global del animal en relacin a la fibra fina, dado a los
acertados reconocimientos de patrones obtenidos. Adicionalmente, ser de
apoyo en la generacin deestrategias de conservacin, produccin y venta
de los animales.

6.1.2. La utilidad en las variables de salidadestaca en la transformacin dela


informacin y conocimiento en un objeto equiparable. Esto demuestra que
el artefacto imita el proceso de seleccin y categorizacin de la fibra
convenientemente desde la perspectivadel razonamiento del experto, lo
que a largo plazo podr sumar nuevos conocimientos haciendo que el
sistema enriquezca el proceso de reconocimiento de los patrones.

6.1.3. El trabajo de investigacin, a travs de los ensayos experimentales, pudo


demostrar la simplicidad y eficiencia en encontrar respuestas cercanas a
la realidad, convirtindose en una propuesta para su uso extensivo en el
mercado nacional.

6.1.4. La informacin generada por el artefacto se transforma en un valor


estratgico de informacin, pues representa una oportunidad de negocio
que sirve principalmente para establecer estrategias en los ciclos de
reproduccin o seleccin de animales, de tal manera que entre
generaciones sucesivas se pueda predecirla existencia de las capacidades
fenotpicas y genotpicas del individuo en el cobertizo. Esto empuja a que
el modelo otorgue una ventaja competitiva, ya que podr diferenciar su

- 81 -
produccin frentea la competencia y tomar decisiones ms efectivas a
partir del historial que genere el artefacto.

6.1.5.Este artefacto dispone de un alto aporte como complemento de la NTP


231.300:2004, debiendo generar discusin entre la comunidad textil para
el lanzamiento de un marco de referencia nacional para su
comercializacin, siendo til en la gestin de las transacciones de venta y
compra de alpacas para el mercado interno o externo.

6.2. Trabajos Futuros

6.2.1Este trabajo de investigacin no ha cubierto completamente los fenmenos


de lagenmica poblacional en la calificacindebido a que los patrones
estn diseados para calificar y no para identificar problemas sobre las
fuerzas evolutivas que impacta en la poblacin.Se recomienda construir
modelos que midan el impacto en la calificacin.

6.2.2. El trabajo tampoco cubre la posibilidad de agregar nuevos patrones de


datos en el caso que se vayan descubriendo nuevas referencias genticas
y que afecta en las formas de procesar estos patrones en el modelo landa.
Se recomienda definir un nuevo modelo que asocie elementos con
mltiples marcadores moleculares.

- 82 -
BIBLIOGRAFA

AldridgeSusan, El Hilo de la Vida : De los genes a la ingeniera gentica [Libro]. -


Cambridge :ThePressSyndicate of theUniversity of Cambridge, 1996. - Vol. 1 : pgs. 15-16.

Amit Raphael y ZottChristoph, VALUE CREATION IN E-BUSINESS


[Publicacinperidica]. - Pennsylvania : Strategic Management Journal, 2001. - 22 : Vol. 1. -
pgs. 493-520.

Aranguren Jos y Jordania Jordy, Utilizacin de Marcadores de ADN (Micro-satlites) en


Poblaciones de Animales Domsticos en Extincin [Publicacin peridica]. - Barcelona :
[s.n.], 2001. - 1 : Vol. 1.

Aylan-Parker J. y McGregor B.A.,Optimising sampling techniques and estimating


sampling variance of fleece quality attributes in alpacas [Publicacinperidica]. - Attwood :
Small Ruminant Research, 2001. - 1 : Vol. 1.

Barahona Ana y Piero Daniel, GENTICA: LA CONTINUIDAD DE LA VIDA [Libro].


- Mexico D.F. : Fondo de Cultura Econmica, 1994. - Primera : Vol. 1. - ISBN 968-16-4534-
0.

Baxter B.P., Raw-wool Metrology: Recent Developments and Future Directions


[Publicacinperidica]. - Wellingthon : Proceedings Wool Industry Science & Technology
Conference, 2002. - 1 : Vol. 1.

BernackiMariusz y WodarczykPrzemyslaw, Principles of training multi-layer neural


network using backpropagation [En lnea]. - 09 de 2004. -
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html.

Bustamante Ana V. [y otros], Anlisis de diversidad gentica en tres poblaciones de llamas


(Lama glama) del noroeste argentino [Publicacin peridica]. - Santiago : Revista Chilena de
Historia Natural, 2006. - 2 : Vol. 79. - pgs. 175-184.

Bustinza V. La Alpaca, conocimiento del gran potencial andino [Publicacin peridica]. -


Puno : Secciones de Publicaciones UNA-Puno, 2001. - 11-24, 13-32 : Vol. Primera Edicin.

Calvet R., Pastor J.M. y Romero J.L., Frecuencia de los antgenos eritrocitarios en la
poblacin de cantabria [Publicacin peridica] // IV Jornada de Anuales Sociedad Espaola
de Medicina Legal y Forense. - Cdiz : Servicio de Publicaciones de la Universidad de
Cdiz, 1990. - 1 : Vol. 1. - pgs. 303-309.

Chapman Pete [y otros], CRISP-DM 1.0 : Guide, StepbyStep Data Mining [Libro]. -
Londres, Nueva York y Brucelas : CRISP-DM Consortium, 2000. - Vol. 1 : pgs. 9-13.

- 83 -
Chesbrough Henry W. y Appleyard Melissa M., Open Innovation and Strategy
[Publicacinperidica]. - California : CALIFORNIA MANAGEMENT REVIEW, 2007. - 1 :
Vol. 50.

Cook L.M., Gentica de Poblaciones [Libro]. - Madrid : Omega, 1979. - Vol. 1 : pg. 1.

Cooper Mark [y otros], The GP Problem: Quantifying Gene-to-Phenotype Relationships


[Publicacinperidica]. - Queensland : In Silicio Biology, 2002. - 13 : Vol. 2.

Estrategias para el Mejoramiento de Camlidos Sudamericanos [Conferencia] //


Simposium Internacional de Biotecnologa Aplicada en Camlidos Sudamericanos,
Congreso Nacional de Reproduccin y Mejoramiento Gentico de Camlidos
Sudamericanos. - Bariloche : Universidad Nacional de Huancavelica, Facultad de Ciencias
de Ingeniera, Escuela Acadmico Profesional de Zootecnia. Huancavelica. PE. 2007. s.p.,
2007. - Vol. 11. - pgs. 20-23.

FAO PROCEEDINGS OF THE SYMPOSIUM ON NATURAL FIBRES [Conferencia]


// Discover Natural Fibres 2009. - Roma : Common Fund for Commodities, 2009. - Vol. 56.

Feeley N.L. y Munyard K.A.,Characterisation of the melanocortin-1 receptor gene in


alpaca and identification of possible markers associated with phenotypic variations in colour
[Publicacinperidica]. - Perth : Australian Journal of Experimental Agriculture, 2009. - 1 :
Vol. 1.

Frank Diana, Developing a Business Analytics Strategy [Publicacinperidica]. - Iselin


:Enherent, 2010. - 1 : Vol. 1.

Frank E.N. [y otros], Phenotypic and genetic description of fibre traits in South American
domestic camelids [Publicacinperidica]. - Cordoba : Small Ruminant Research, 2005. - 1 :
Vol. 1.

Garca Alonso Rafael, Las Huellas de la Evolucin : Un historial al lmite del caos [Libro].
- Madrid : Publicaciones Digitales, 2008. - Vol. 1 : pgs. 386-389.

Garcia V. Wilber y Leyva V. Victor, ndices genticos estimados para peso corporal en
llamas [Publicacin peridica]. - Lima : Revista Inv. Veterinaria Peruana, 2007. - 1 : Vol. 18.

Gomez Alberto, Briceo Ignacio y Umaa ngela, Marcadores moleculares del


cromosoma-Y - perfiles genticos de identidad patrilineal [Publicacin peridica]. - Bogot :
Publicaciones de la Pontificia Universidad Javeriana, 2000. - 1 : Vol. 1.

Hilera Jos R. y MartinezVictor J., Redes Neuronales Artificiales [Libro]. - Madrid : RA-
MA, 2000. - Vol. 1 : pgs. 9-10.

- 84 -
Holt Cameron Australian Alpaca FleeceIndustry [Libro]. - Canberra :Australian Alpaca
Associationinc, 2006. - Vol. 1.

Huancavelica Gobierno Regional VEINTE MAESTRAS EN CATEGORIZACIN Y


CLASIFICACIN DE FIBRA DE ALPACA [En lnea]. - Abril de 2010. - Mayo de 2010.
-
http://www.regionhuancavelica.gob.pe/web/index.php?option=com_content&view=article&i
d=1006:veinte-maestras-en-categorizacion-y-clasificacion-de-fibra-de-
alpaca&catid=160:noticias-abril-2010&Itemid=196.

HuiLui Ben,StatiscalGenomics : Linkage, mapping and analysis QTL [Libro]. - Florida :


CRC press LLC, 1998. - Vol. 1 :pgs. 507-511.

Indecopi CTN 055, Fibra de Alpaca del Velln. Definiciones, categorizacin, requisitos y
rotulado [Informe]. - Lima : R. 6-2004-CRT-INDECOPI (2004-02-08), 2004.

Iniesta Raquel, GuinElisabet y Moreno Vctor, Anlisis estadstico de polimorfismos


genticos en estudios epidemiolgicos [Publicacin peridica]. - Barcelona : Gaceta
Sanitaria, 2005. - 4 : Vol. 19.

Iiguez L.C. [y otros], Fleece types, fiber characteristics and production system of an
outstanding llama population from Southern Bolivia [Publicacinperidica]. - Madison :
Small Ruminant Research, 1997. - 1 : Vol. 1.

Julio Sastre Hctor, Descripcin, situacin actual y estrategias de conservacin de la raza


bovina colombiana criolla casanare // Tesis Doctoral : Descripcin, situacin actual y
estrategias de conservacin de la raza bovina colombiana criolla casanare. - Crdoba :
Universidad de Crdoba, Facultad de Veterinaria, Departamento de Produccin Animal,
2003. - Vol. 1.

Len-Velarde C.U. y Guerrero J., Improving quantity and quality of Alpaca fiber; using a
simulation model for breeding strategies [Conferencia] // International Livestock Research
Center, ILRI; International Potato Center, CIP. - Lima : 1, 2000. - Vol. 1.

Lupton C.J., McColl A. y Stobart R.H., Fiber characteristics of the Huacaya Alpaca
[Publicacinperidica]. - Texas : Small Ruminant Research, 2006. - 1 : Vol. 1.

Marn E., Efecto del sexo sobre las caractersticas tecnolgicas y productivas de alpacas
para su uso en la industria textil [Libro]. - Lima : UNALM, 2007. - Vol. I.

Martn del Brio Bonifacio y Sanz Molina Alfredo, Redes Neuronales y Sistemas Difusos
[Libro]. - Madrid :Alfaomega-RA-MA, 2002. - Vol. 1 : pgs. 26-28.

- 85 -
McGregor B.A., Production, attributes and relative value of alpaca fleeces in southern
Australia and implications for industry development [Publicacinperidica]. - Attwood :
Small Ruminant Research, 2005. - 1 : Vol. 1.

Mitchell Dereck, Pymex.pe Portal del Comercio Exterior [En lnea]. - Andina, Enero de
2010. - Mayo de 2010. - http://www.pymex.pe/noticias/peru/3370-china-concentro-envios-
de-fibra-y-prendas-de-alpaca-en-enero.html.

Mohammad Meraj, The Road Map for Innovation Success [Publicacinperidica]. -


Waltham : PRTM y Microsoft, 2007. - 1 : Vol. 1.

Montes M. [y otros],QualityCharacteristics of huacaya alpaca fibreproduced in


theperuvianandeanplateauregion oh huancavelica [Publicacin peridica] // SpanishJournal
of AgriculturalResearch. - Huancavelica : Instituto Nacional de Investigacin y Tecnologa
Agraria y Alimentaria (INIA), 2008. - 1 : Vol. 6. - pgs. 33-38.

Mueller J.P., Estrategias para el mejoramiento de camlidos sudamericanos. Conferencia.


[Conferencia] // Simposium Internacional de Biotecnologa Aplicada en Camlidos
Sudamericanos; Congreso Nacional de Reproduccin y Mejoramiento Gentico de
Camlidos Sudamericanos. - Bariloche : Universidad Nacional de Huancavelica, Facultad de
Ciencias de Ingeniera, Escuela Acadmico Profesional de Zootecnia. Huancavelica. PE.
2007. s.p., 2007. - Vol. 11. - pgs. 20-23.

Oliva Rafael [y otros],Gnetica Mdica [Libro]. - Barcelona-Espaa : Publicaciones y


Ediciones de la Universidad de Barcelona, 2004. - Vol. III.

Portela de Carvalho Claudio Guilherme [y otros],Selectionbasedondistancesfromideotype


[Publicacin peridica]. - Vicosa :CropBreeding and AppliedBiotechnology, 2002. - 2 : Vol.
2.

PROCAM PLAN ESTRATGICO NACIONAL DE CIENCIA, TECNOLOGA E


INNOVACIN TECNOLGICA PARA LA COMPETITIVIDAD Y EL
DESARROLLO HUMANO 2006-2021 [Informe]. - Lima : SYNACIT, 2007.

Renieri C. [y otros], Programa de Mejoramiento Gentico en Camlidos Domsticos


[Publicacin peridica]. - Cordoba : Archivo Latinoamericano de Produccin Animal, 2007.
- 1 : Vol. 15.

Rios Eliseo de los,Clasificacin de los Vellones de Alpaca [Entrevista]. - Lima : Correo


Electrnico, 23 de Julio de 2009.

Sarah Schmid,Tesis de Maestra: The value chain of alpaca fiber in Peru,an economic
analysis [Libro]. - Zurich : Swiss Federal Institute of Technology Zurich, 2006. - Vol. 1.

- 86 -
Souza G.L., Sekaran Chandra y Kandaamy A., A Phenomic Algorithm for
Reconstruction of Gene Networks [Publicacinperidica]. - Mangalore : World Academy of
Science, Engineering and Technology, 2007. - 1 : Vol. 3.

Vila Miranda Amparo,Machine Learning. - Granada-Espaa : Grupo de Investigacin de


Base de Datos y Sistemas de Informacin Inteligente, 2001. - Vol. 1.

W. Chan Kim y Mauborgne Rene, Value innovation: a leap into the blue ocean
[Publicacinperidica]. - Harvard : JOURNAL OF BUSINESS STRATEGY, 2005. - 4 :
Vol. 26. - pgs. 22-28.

Weber Renee, van Kuijk Jasper y Boks Casper, User Centred Design for c
[Publicacinperidica]. - Throndheim : International Journal of SustanaibleBehaviour, 2008.
- 1 : Vol. 1.

White T.L., Adams W.T. y Neale D.B., Forest Genetics [Libro]. - Cambridge : CABI
Publishing, 2007. - Vol. 1 :pgs. 523-540.

Wuliji T. [y otros],Production performance repeatability and heritability estimates for live


weight, fleece weight and fiber characteristics of alpacas in New Zeland
[Publicacinperidica]. - Nueva Zelanda : Small Rumiant, 2000. - Vol. I.

- 87 -
ANEXO A

GLOSARIO DE TRMINOS
ADN
El componente qumico dentro del ncleo de una clula que lleva las
instrucciones para elaborar los organismos vivientes.

Alelo
Una de las formas variantes de un gen en un locus o de un marcador
particular en un cromosoma. Diferentes alelos de un gen producen variaciones en las
caractersticas hereditarias tales como el color del cabello o el tipo de sangre.

Fenotipo
Rasgos o caractersticas visibles de un organismo, por ejemplo, el color del
cabello, el peso o la presencia o ausencia de una enfermedad. Los rasgos fenotpicos
no son necesariamente genticos.

Gen
La unidad fsica y funcional de la herencia, que se pasa de padres a hijos. Los
genes estn compuestos por ADN y la mayora de ellos contiene la informacin para
elaborar una protena especfica.

Genotipo
La identidad gentica de un individuo que no se muestra como caractersticas
externas.

Hereditario
Transmitido a travs de los genes, de padres a hijos.

ndice Textil
Nominacin adjudicada a la escala de valores que determina un estado de
calificacin que asocia entre el aspecto fsico y su contenido gentico.

- 88 -
Locus
El lugar del cromosoma donde est localizado un gen especfico, es la
direccin fsica del gen. El plural es "loci".

Microsatlite
Son pequeas regiones de ADN que contienen mltiples copias de secuencias
repetitivas cortas y que se emplean como marcadores genticos para rastrear la
herencia familiar o mapear enfermedades en el genoma.

Marcador
Tambin conocido como marcador gentico, es un segmento de ADN cuya
herencia se puede rastrear. Un marcador puede ser un gen, o puede ser un segmento
de ADN sin funcin conocida. Dado que los segmentos de ADN que se encuentran
contiguos en un cromosoma tienden a heredarse juntos, los marcadores se usan a
menudo como formas indirectas de rastrear el patrn hereditario de genes que no han
sido an identificados, pero cuyas ubicaciones aproximadas se conocen.

Mapa Gnico
Mapa basado en las posiciones relativas de los genes en un cromosoma y de
la distancia entre ellos.

Marcador Gentico
Un segmento de ADN con una ubicacin fsica identificable en un
cromosoma y cuya herencia se puede rastrear. Un marcador puede ser un gen, o
puede ser alguna seccin del ADN sin funcin conocida. Dado que los segmentos del
ADN que se encuentran contiguos en un cromosoma tienden a heredarse juntos, los
marcadores se utilizan a menudo como formas indirectas de rastrear el patrn
hereditario de un gen que todava no ha sido identificado, pero cuya ubicacin
aproximada se conoce.

Polimorfismo
Es la existencia de dos o ms alelos de un gen presentes en una poblacin, en
una frecuencia significativa.

- 89 -
ANEXO B

OFICIO N. 0861-2010-INIA-DIA/J

- 90 -
ANEXO C

Constancia de participacin en el proyecto de investigacin Generacin de ncleos


de alpacas reproductores de alta productividad basados en la seleccin asistida con
marcadores genticos de ADN, financiado por el Programa de Ciencia y Tecnologa
FYNCIT PIBAT 2007, en calidad de tesista.

- 91 -
ANEXO D

Participacin en el II Congreso Peruano de Investigacin de Operaciones y de


Sistemas, del 4-6 noviembre del 2010, en la UNSA-Arequipa, en calidad de ponente
del trabajo titulado: Sistema Inteligente para expresar un nivel de calificacin en
poblaciones de alpacas.

- 92 -
ANEXO E
Universidad Nacional Mayor de San Marcos
Unidad de Posgrado de la Facultad de Sistemas e Informtica
Tesis de Investigacin para optar el grado de Magister
Sistema Inteligente para calificar alpacas en funcin a su fibra fina

Consolidado de la Lista de Cuestionario utilizando el Mtodo Delphi

Nmero de Encuestados: 25 personas


Item Preguntas Formuladas Respuestas Peso del
Impacto
Esperado
01 La fibra fina es un negocio Respondidas: 1
representativo para el mercado nacional e 25
internacional
02 Usted cree que se aprecia el valor de la Respondidas: 2
alpaca utilizando metodologas 24
conocidas
03 Es importante considerar el aspecto Respondidas: 1
gentico del individuo para mejorar la 25
percepcin de valor
04 Usted entiende que existe diferencia Respondidas: 3
entre las razas de los individuos y los 25
lugares de crianza
05 Conoce como interpretar esas diferencias Respondidas: 3
23
06 Si conociera una forma de medir Respondidas: 1
cuantitativamente las alpacas, le ayudara 22
a generar estrategias de mejora gentica
07 Usted cree que de tener una herramienta, Respondidas: 1
para calificar individuos, sera de utilidad 25
para hacer intercambio o negocios
08 La Norma Tcnica Peruana Respondidas: 2
201.300:2004, es un referente que se 25
aplica en la actualidad para la seleccin y
categorizacin de fibra
09 Usted piensa que la Norma Tcnica y el Respondidas: 4
uso de tecnologas para tratar la fibra son 25
suficientes para dar un indicador
eficiente en la toma de decisin.
10 El conocimiento del personal de campo, Respondidas: 2
utilizado en la seleccin y categorizacin 25
de la fibra ayuda al aseguramiento de
especies aptas para el negocio de la fibra.
11 Cree usted que el conocimiento que tiene Respondidas: 1
el personal de campo es correctamente 25

- 93 -
Item Preguntas Formuladas Respuestas Peso del
Impacto
Esperado
gestionado para contribuir a los objetivos
estratgicos.
12 Cul es el valor intrnseco que traera una Respondidas: 3
herramienta que es capaz de identificar 18
individuos potenciales en mejora de la
rentabilidad
13 Sera posible estandarizar los criterios de Respondidas: 4
comercio entre los productores, basado 20
con la aplicacin de una herramienta.
14 Usted cree que la comunidad alpaquera Respondidas: 5
est preparada utilizar una herramienta 23
de calificacin de individuos como regla
de negocio en la oferta y demanda.
15 De implementarse esta herramienta, Respondidas: 5
usted cree que el gobierno, las 25
universidades y el sector textil deberan
ajustar su legislacin

Peso del Impacto:

1: Alto Impacto
2: Muy Importante Impacto
3: Importante Impacto
4: Impacto no Significativo
5: No hay Impacto

- 94 -
ANEXO F

TABLA EXTENDIDA DE CONTINGENCIA DEL


MODELO ALFA

VP FP
1 0 0 0 0 1
0 1 0 0 0 0
0 0 0.6667 0 0 0
0 0 0.3333 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
FN VN

Error = (FP + FN) / (TOTAL) = 0.22221667

xito = (VP+VN) / (TOTAL) = 0.94445

Sensibilidad = (VP) / (VP +FN) = 0.8889

Especificidad = (VN) / (VN + FP) = 0.75

LEYENDA

FP: Falso Positivo


FN: Falso Negativo
VP: Verdadero Positivo
VN: Verdadero Negativo
TOTAL: Suma de columnas involucradas

- 95 -
ANEXO G

TABLA EXTENDIDA DE CONTINGENCIA DEL


MODELO LANDA

VP FP
0.9 0 0 0 0
0.1 1 0 0 0
0 0 0.9 0 0.1
0 0 0.1 1 0.6
0 0 0 0 0.3
FN VN

Error = (FP + FN) / (TOTAL) = 0.04

xito = (VP+VN) / (TOTAL) = 0.96

Sensibilidad = (VP) / (VP +FN) = 0.96666667

Especificidad = (VN) / (VN + FP) = 0.95

LEYENDA

FP: Falso Positivo


FN: Falso Negativo
VP: Verdadero Positivo
VN: Verdadero Negativo
TOTAL: Suma de columnas involucradas

- 96 -

You might also like