Sistema inteligente para calificar alpacas en funcin a su fibra fina
TESIS para optar el Grado de Magster en Ingenieria de Sistemas con la mencin de Gestin de la Tecnologa de la Informacin y Comunicaciones.
AUTOR Sergio Paulo Valcarcel Ascencios
Lima Per 2011 - iv - Sistema inteligente para calificar alpacas en funcin a su fibra fina Orientador: Dr. David Mauricio Snchez Co-orientador: Dr. Jos Espinoza Babiln UNMSM LIMA 2011 Tesis presentada a la Universidad Nacional Mayor de San Marcos, (Lima - Per), para obtener el Grado de Magster en Ingeniera de Sistemas, con la mencin de Gestin de la Tecnologa de la Informacin y Comunicaciones. - v - Sergio Paulo ValcarcelAscencios, 2011. Todos los derechos reservados. - vi - 11/04/2011 FICHA CATALOGRFICA SISTEMA INTELIGENTE PARA CALIFICAR ALPACAS EN FUNCIN DE LA FIBRA Sergio Paulo Valcarcel Ascencios Lima Per, 2011. Orientador: Dr. David Mauricio Snchez. Co-Orientador: Dr. Jos Espinoza Babiln Disertacin: Magster en Ingeniera de Sistemas e Informtica. Universidad Nacional Mayor de San Marcos Escuela de Posgrado Facultad de Ingeniera de Sistemas e Informtica, 2011. Unidad de Posgrado Pginas: 95 pginas. - vii - DEDICATORIA A mis hermosas hijas: Fiorela y Francesca, que fueron en todo momento mi fuente de inspiracin y mi fuerza para resolver este desafo. A Vania, mi esposa, por su gran amor y por compartir conmigo un sueo hecho realidad, lleno de esperanza y crecimiento familiar. A mi padre (+) Oscar y a mi madre Estilita, por el ejemplo de vida que me ensearon y por la labor sacrificada hacia sus hijos en dar lo mejor y guiarnos en esta vida hacia el camino de la felicidad y el xito. A Violeta, mi hermana adorada y a mi cuados Jess, Vicky y Santiago, Alberto. A mis sobrinos(as): Luca, Alejandro, Valeria, Sebastin y Matas, Katrina y Gustavo, Margarita, Jerika y Carol, Danitza y Diego, Alexandra y Juan, Estrellita, y especialmente a todos que no menciono aqu por razones de espacio, por sus deseos de xito y cario personal. A mi suegra: Regina, mi segunda madre. Y a la ta Teresa, quienes siempre se preocuparon por la realizacin de este trabajo. A todos mis queridos tos(as):Pepe y Alicia, Alfredo & Irene, Guillermo(+), Abelardo y Lucha, Esteban y Peta, Lucio y Yola, Elas y Blanca(+), Esther, Ricardo(+), Jos(+) - viii - AGRADECIMIENTOS Al profesor Dr. David Mauricio Snchez, por su orientacin, dedicacin y esfuerzo desinteresado a este trabajo de investigacin. Al profesor Dr. Jos Espinoza Babiln, quien me dio la oportunidad y el apoyo permanente en el camino de la investigacin cientfica. Al Dr. Zuo Burstein Alva, Profesor Emrito de la UNMSM,por su importante aporte en este trabajo. Y, sobre todo, por el cario especial que une a nuestras familias. A los profesores de la Unidad de Posgrado del FISI de la UNMSM, por la calidad profesional y la gran experiencia demostrada. Al grupo humano de la Unidad de Biologa Molecular de la Universidad Particular Cayetano Heredia, especialmente al MSc. Jorge Rodrguez Bailn y alMd. Vet. Giancarlo Alvarez, por compartir sus experiencias y conocimientos. Alos colegas de la UNMSM, Mg. Erick Vicentede Toms, por enriquecer el conocimiento en ciencias de la computacin. Mg. Hugo Vega Huertas, por su ojo crtico. Al Mg. Cayo Len Fernndez, por todo el apoyo recibido. Al profesorMg. Samuel Oporto Daz, un gran amigo, quien me dio los conocimientos en las tcnicas de inteligencia artificial. AlIng. Csar Mauro Osorio Zavala, por apoyarme enla realizacin de los experimentos para este trabajo. A todas aquellas personas que de alguna y otra manera colaboraron con la realizacin de este trabajo de investigacin. Y, por encima de todo, doy gracias a nuestro seor Jesucristo y a Dios. Gracias por todo! - ix - Sistema inteligente para calificar alpacas en funcin a su fibra fina RESUMEN En la secuencia de la cadena de valor de la fibra de alpaca,la medicin es realizada por observacin basada en el conocimiento tradicional. La valorizacin depende en muchos casos de la experiencia emprica, lo cual dificulta entender la riqueza intrnseca del hato.Dando como consecuencia vellonespoco sostenibles en el tiempo.La contribucin principal, pretende comprender el potencial de las alpacas, no slo por el dimetro de la fibra, sino por sus otras caractersticas, estandarizando criteriosa travs de los estereotipos. Este trabajo est sustentado sobre publicaciones relacionadas a las caractersticas de la fibra en sus diferentes dimensiones, proponiendo unasolucin que permita asignar un valor caracterstico en los individuos, que resulte equiparable entre su morfologa y gentica. Diseando un modelo de redes neuronales artificiales y reglas de asociacin, quehizo posible transformar la percepcin de los expertos en un valor caracterstico definida por una escala de calificacin. Se realizaron diferentes ensayos experimentales en Cusco, Puno y Huancayo. Aplicando la prueba de Friedman, como mtodo de comparacin entre tres tratamientos. Se utiliz el estadstico (H 0 , <0.05), como parmetro de decisin. Finalmente, el artefactorespondi en forma similar a los otros tratamientos, manteniendo el estndar de la NTP 231.300:2004 y elOFDA-100. Con cierto grado de madurez, este artefacto puede convertirse en referente nacional y ayudar a la toma de decisiones en estrategias de mejoramiento de la especie. Palabras clave: Redes Neuronales Artificiales, Reglas de Asociacin, Fibra Fina, OFDA. - x - Intelligent system to qualify alpacas in function his fine fiber ABSTRACT In the sequence of the value chain the alpaca fiber, the measurement its made by observation and supported on classic knowledge. The quality depends in many cases of empirical experience, difficult to understand the herd intrinsic richness. Giving due fleece unsustainable in the time. The main contribution aims understand his alpaca potential. Dont only for fiber diameter, but for his other characteristics been to standard criteria through of the sterotypes. This job to be supported of publish relational with fiber characteristics in his dimensions different, proposing a solve how allow to assign a characteristic value individuals, resulting comparable between his genetic and morphologic. Designing a model artificial neural network and rules of association, it made possible to transform the perception of the experts on characteristics value defined for a scale of qualify. Were different tests experimental in Cusco, Puno and Huancayo, applying the test of Friedmann, as method of comparison between three treatments. So used the statistical (H 0 , <0.05), as parameter of decision. Finally, the artifact responded in form similar from others treatments, keeping the standard NTP 231.300:2004 y el OFDA-100.With true grade of maduraty, this artifact can become in a national framework and to help to making decision in strategies of improvement of the species. . Keywords: Artificial Neural Network, Rules Association, Fine Fiber, OFDA. - xi - NDICE Tabla de Figuras xv Tabla de Cuadros xvi Tabla de Acrnimos xvii Captulo 1: INTRODUCCIN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1. Antecedentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Declaracin del problema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3. Objetivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4. Justificacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.5. Alcances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.6. Propuesta de la solucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.7. Organizacin de la tesis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Captulo 2: MARCO TERICO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1. Gentica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2. Fuerzas que afectan las Frecuencias Gnicas . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3. Marcadores Moleculares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4. La Red Neuronal Artificial Back-Propagation (Perceptrn Multicapa). . . . . . 15 2.5. La Regla de Asociacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.6. Mtodo de Minera de Datos: CRISP-DM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.7. Mtodo del Diseo Centrado al Usuario. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Captulo 3: ESTADO DEL ARTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.1. Morfologa de la Alpaca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.2. Mtodos Cuantitativos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.3. Modelos Computacionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.4. Legislacin Vigente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Captulo 4: INGENIERA DEL ARTEFACTO. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.1. Modelo Conceptual del Artefacto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 - xii - 4.2. Comprensin del Negocio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.3. Entendimiento de los Datos......................................................................... 43 4.3.1. Modelos del Sistema: Modelo Alfa..................................................... 45 4.3.1.1. Definicin de las variables de entrada...................................... 45 4.3.1.2. Definicin de las variables de salida......................................... 46 4.3.2. Modelo Beta.............................................................................. 47 4.3.2.1. Definicin de las variables de entrada....................................... 47 4.3.3. Modelo Landa....................................................................................... 49 4.3.3.1. Definicin de las variables de entrada...................................... 49 4.3.3.2. Definicin de las variables de salida......................................... 50 4.4. Preparacin de los Datos............................................................................. 52 4.5. Modelado..................................................................................................... 53 4.5.1. Modelo Alfa.......................................................................................... 54 4.5.1.1. Descripcin y alcance del modelo alfa..................................... 54 4.5.1.2. Topologa de la red................................................................... 54 4.5.1.3. Pruebas..................................................................................... 55 4.5.2. Modelo Beta.......................................................................................... 56 4.5.2.1. Descripcin y alcance del Modelo Beta................................... 56 4.5.2.2. Formacin de las Reglas de Asociacin................................... 56 4.5.3. Modelo Landa....................................................................................... 57 4.5.3.1. Descripcin y alcance del Modelo Landa................................ 57 4.5.3.2. Topologa de la red................................................................... 57 4.5.3.3. Pruebas...................................................................................... 58 4.6. Evaluacin.................................................................................................... 59 4.7. Despliegue................................................................................................... 59 4.8. Especificaciones de Hardware y Software................................................... 60 Captulo 5: CASO DE ESTUDIO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.1. Preparacin de los Datos. . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.1.1. Patrones de Datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.2. Modelado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.2.1. Modelo Alfa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.2.1.1. Ciclo de Aprendizaje. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.2.1.2. Tabla de Contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 - xiii - 5.2.1.3. Instancias de Pruebas de Entrenamiento y Validacin. . . . . . . . 64 5.2.2. Modelo Beta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.2.2.1. Criterios de Asociacin Vinculante. . . . . . . . . . . . . . . . . . . . . . 65 5.2.2.2. Criterios de Asociacin al Gen de Inters. . . . . . . . . . . . . . . . . . 65 5.2.3. Modelo Landa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.2.3.1. Ciclo de Aprendizaje. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.2.3.2. Tabla de Contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.2.3.3. Instancias de Pruebas de Entrenamiento y Validacin. . . . . . . . 68 5.3. Evaluacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.3.1. Descripcin del Caso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.3.2. Ejecucin del Caso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.3.3. Anlisis de los Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.3.4. Descripcin de la experimentacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.3.5. Tcnica de Muestreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.3.6. Procedimiento del Experimento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.3.6.1. Objetivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.3.6.2. Mtodo Estadstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3.6.3. Elementos de Comparacin. . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3.6.4. Mecnica Operativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3.7. Prueba de Friedman. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.3.8. Anlisis e Interpretacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Captulo 6: CONCLUSIONES Y TRABAJOS FUTUROS. . . . . . . . . . . . . . . . . 81 6.1. Conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 6.2. Trabajos Futuros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 REFERENCIA BIBLIOGRAFCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 ANEXOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 A - Glosario de Trminos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 B Oficio N. 0861-2010-INIA-DIA/J del 10 de noviembre. Que autoriza. . . . 90 el uso de las instalaciones para realizar el proceso de experimentacin en campo. - xiv - C- Constancia de participacin en el proyecto de investigacin. . . . . . . . . . . . 91 Generacin de ncleos de alpacas reproductores de alta productividad basados en la seleccin asistida con marcadores genticos de ADN, financiado por el programa de ciencia y tecnologa FYNCIT PIBAT 2007, en calidad de tesista. D- Participacin en el II Congreso Peruano de Investigacin de. . . . . . . . . . . . 92 Operaciones y de Sistemas del 4-6 noviembre de 2010, en la UNSA-Arequipa. En calidad de ponente del trabajo titulado: Sistema Inteligente para expresar un nivel de calificacin en poblaciones de alpacas. E- Consolidado de Lista de Preguntas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 F- Tabla Extendida de Contingencia del Modelo Alfa. . . . . . . . . . . . . . . . . . . . 95 G- Tabla Extendida de Contingencia del Modelo Landa. . . . . . . . . . . . . . . . . . . 96 - xv - TABLA DE FIGURAS Figura 1.1. Distribucin de Camlidos en Sudamrica................................ 02 Figura 1.2. Esquema General del Trabajo de Investigacin......................... 10 Figura 2.1. Muestra de un marcador molecular de microsatlite.. 15 Figura 2.2: Esquema de una Perceptron Multicapa...................................... 16 Figura 2.3. Ciclo de Vida del Modelo Crisp-DM......................................... 19 Figura 2.4. Esquema Metodolgico del desarrollo del Artefacto.... 21 Figura 2.5. Ciclo de Vida del Diseo Centrado al Usuario.......................... 22 Figura 3.1. Grilla de la Muestra que Segmenta a una Alpaca...................... 26 Figura 3.2. Escala del Grosor de la Fibra en Alpacas.................................. 28 Figura 4.1. Esquema del Modelo Conceptual del Artefacto....................... 39 Figura 4.2. Cadena de Valor de la Fibra de Alpaca................ 40 Figura 4.3. Modelo de Stakeholders en la Produccin de Alpaca 42 Figura 4.4. Arquitectura del Motor Algortmico del Artefacto... 44 Figura 4.5. Matriz del Nivel de Calificacin............................................... 51 Figura 4.6. Progreso del Anlisis de Datos................................................. 53 Figura 4.7. Topologa del Modelo Alfa...................................................... 55 Figura 4.8. Matriz de definicin de la topologa de la red.......................... 56 Figura 4.9. Topologa del Modelo Landa.................................................... 58 Figura 4.10. Matriz de la topologa de la red landa..................................... 59 Figura 5.1. Evolucin del aprendizaje del modelo alfa............................. 63 Figura 5.2. Evolucin del aprendizaje en el modelo landa........................ 67 Figura 5.3. Resultados del modelo beta primera parte.............................. 71 Figura 5.4. Resultados del modelo beta segunda parte............................. 71 Figura 5.5. Mapeo de la puntuacin de la poblacin................................ 73 Figura 5.6. Vista del distrito de Marangan, provincia de Canchis 74 Figura 5.7. Vista del distrito de Santa Rosa, provincia de Melgar. 74 Figura 5.8. Vista del distrito de Paccha, provincia de Huancayo 75 Figura 5.9. Ejemplos mostrado desde un cobertizo 75 - xvi - TABLA DE CUADROS Cuadro 1.1. Produccin de Fibra de Camlidos Sudamericanos................ 02 Cuadro 3.1. Clasificacin de la Fibra de Alpaca........................................ 37 Cuadro 4.1. Registro de Datos del Modelo Alfa........................................ 46 Cuadro 4.2. Matriz del modelo de datos de beta........................................ 49 Cuadro 4.3. Matriz del modelo de datos en landa...................................... 50 Cuadro 4.4. Matriz de la definicin de la topologa de la red.................... 55 Cuadro 4.5. Matriz de la topologa en el modelo landa.............................. 59 Cuadro 5.1. Ciclo de aprendizaje del modelo alfa...................................... 62 Cuadro 5.2. Tabla de Contingencia del modelo alfa.................................. 64 Cuadro 5.3. Ciclo de aprendizaje del modelo landa.................................... 66 Cuadro 5.4. Tabla de Contingencia del modelo landa................................. 68 Cuadro 5.5. Reconocimiento de patrones del modelo alfa........................... 69 Cuadro 5.6. Presentacin del modelo de datos de beta............................... 70 Cuadro 5.7.Reconocimiento de patrones del modelo landa........................ 72 - xvii - TABLA DE ACRNIMOS AAA - AustralianAsociation Alpaca ABO - Grupo de sangre A, B y O ADN - cidoDesoxirribonucleico ASMT - American Society of Testing Materials CRISP-DM - CRISP- Data Miningoriginado por Michael Douglas Crisp CONACS - Consejo Nacional de Camlidos Sudamericanos CWY - Clean WashingYield (Rendimiento de Fibra Lavado) D.S. - Decreto Supremo E(NK) - Poblacin de N objetos y K clster EM - Esperanza-Maximizacin GFW - GreasyFleeceWeight (Peso del Velln con Grasa) INDECOPI - Instituto Nacional de Defensa de la Competencia y de la Propiedad LMT - Peso Vivo MCR-1 - Melanocortin-1 MFD - Mean FiberDiameter (Dimetro Promedio de Fibra) MS - MiddleSample (Muestreo Medio) mSat - Micro-satlite NTP - Norma Tcnica Peruana NCBI - National Center for Biotechnology Information OFDA - OpticalFiberDiameterAnalyzer (Analizador Dimetro de Fibra ptico) PCR - Reaccin en cadena de la Polimerasa PE - Probabilidad de Exclusin PIC - PolymorphicInformation Content (Contenido de Informacin Polimrfica) PROMPEX - Comisin para la Promocin de Exportaciones QTL - QuantitativeTrait Locus (Caracterstica Cuantitativa del Locus) RAPD - ADN Polimrfico Amplificado al Azar RFLP - Polimorfismo de Longitud de Fragmentos de Restriccin SGS - Sociedad General de Supervisin y Certificacin - xviii - SNP - Single NucleotidePolymorphic (Nuclotido Simple Polimrfico) SSRT - Short SequenceRepeatTandem(Grupo de Secuencia Repetida Corta) UCD - User Center Design (Diseo Centrado al Usuario) UK - United Kingdom (ReinoUnido) USA - UnitedState American (Estados Unidos de Norteamrica) - 1 - CAPTULO I INTRODUCCIN 1.1. Antecedentes La fibra de alpaca es un producto altamente cotizado en el mercado nacional y extranjero. Su uso se remonta desde los antiguos peruanos, quienes hicieron de este material todo un arte en su vida diaria; as se utiliz en la confeccin de prendas y artculos decorativos usados para actividades ceremoniales debido a sus propiedades textiles como son: la resilencia, la retencin del calor, el brillo, entre otros. Actualmente, la fibra de alpaca es el medio de sustento econmico en los pueblos de la sierra del Per, prueba de ello essu comercializacin permanente.Tambin resulta muy atractivo en los negocios del sector textil, ya sea por la apreciacin del velln en muchos pases del mundoo, primordialmente, por sus caractersticas como son: la finura, el color y el peso. Segn el fomento agrcola (FAO, 2009), la poblacin de alpacas se concentra en las regiones centro-sur del alto andino peruano,inicindose aproximadamente desde el departamento de Huancavelica con direccin al sur, pasando por Arequipa, Cusco, Ayacucho, Puno y extendindose hasta los pases de Bolivia y Chile, tal como lo muestra la Figura 1.1. - 2 - Figura 1.1.Distribucin de Camlidos en Sudamrica (FAO, 2009). Segn datos dela Organizacin de Fomento Agrcola(FAO, 2009), en el Per la produccin de fibra a nivel sudamericano ocupa el primer lugar, obteniendo una produccin anual de hasta 4 millones de kilogramos de peso en fibra, disponibles para su comercializacin. De este modo, se evidencia la importancia de este producto en esta parte del hemisferio. (Ver Cuadro 1.1) Cuadro 1.1.Produccin de Fibra de Camlidos Sudamericanos (FAO, 2009). El departamento de Puno, seguido por el de Cusco, encabezan la produccin total de la fibra de alpaca en el 2005 1 . [ 1 ] Datos consignados en informe por PROMPEX en el 2005. - 3 - Segn el lder, el seor Dereck Mitchell, el pas de China concentr el 59% de las exportaciones peruanas de pelo fino y cardado de alpaca por un monto de 3.5 millones de dlares americanos. Tambin resalt que el pas de Italia se convirti en el segundo destino de comercio, seguido de Australia, Japn, Reino Unido y Estados Unidos. Menciona, adems, que se ha dado apertura a nuevos destinos como los siguientes: Repblica Checa, Noruega, Estonia y Mxico(Mitchell, 2010). Las estadsticas indicadas arriba, apuntan a una vertiente prometedora en la venta del pelo fino de la alpaca. En la sociedad andina, la actividad de esquila, para colectar el pelo de la alpaca representa una ceremonia ancestral que es festejado en diversas regiones del pas. Los individuos son muy bien explotados, sin tomar en cuenta su valorizacin gentica durante su ciclo de vida, apenas son apreciadas subjetivamente. Cabe resaltar que el mtodo tradicional para obtener el velln es hecho por personas del campo, preferentemente de gnero femenino. Segn el Gobierno Regional de Huancavelica (Huancavelica, 2010), las mujeres que realizan la esquilason conocidas popularmente como las Maestras, En el proceso de seleccin y categorizacin de fibra, ellasdestacan por su habilidad en discriminar la fibra por su tamao y espesor, valindose de la observacin y del conocimiento heredado por generaciones. Aunque el proceso es realizado con efectividad, a largo plazo ocasiona una merma, debido al margen de errorque trae el proceso. En la actualidad, la tecnologa es una alternativa para aquellas empresas que puedan sostenerlas.Efecta una categorizacin ms precisa, a travs de equipos electrnicos llamados Lser-Scan. Estos equipos aparecen desde la dcada del noventa, principalmente en universidades del pas, luego se extienden en algunas empresas privadas, como herramienta de apoyo. Lamentablemente, no existe regulacin en el uso de los estndares que manejan estos equipos Algunas empresas de nuestro Per, utilizan estndares internacionales como son: el OFDA-100, IWTO-30:1998, ASMT D584: 2003, Australian Standard 3535:1998, entre otros. - 4 - Ya seapor observacin o usando tecnologa, la categorizacin de la fibra gira alrededor de su espesor, regulada por la Norma Tcnica Peruana 231.300:2004. Otras variables complementarias son el tamao de la fibra, color y dimetro, que son pocas utilizadas debido a la dificultad de introducirlas al proceso de categorizacin. No es comn en esta actividad apreciar su potencial gentico, ni valorizar los individuos de la poblacin, lo cual genera acumulacin de merma en el acopio del velln que se traduce en prdidas de utilidades. De persistir esta problemtica, la tendencia, a corto plazo, ser que los criadores empezarn a comercializar vellones de fibra cada vez ms degradada, debido a la deficiencia en la seleccin de la fibra por individuo en relacin a su fenotipo y condicin gentica. Dando como consecuencia quelas estrategiasempleadas por el criador para la mejora y la preservacin de la especie no sean las ms ptimas, afectando su ventaja competitiva en el negocio y la disminucin del valor al cliente(Amit, y otros, 2001). La propuesta de solucin es proporcionar una herramienta (artefacto) basada enmodelos de reconocimiento de patrones (Chesbrough, y otros, 2007)(Frank, 2010) y con el empleo de los marcadores moleculares, para que los involucrados puedan dimensionar el valor de los individuos de la poblacin, desde su aspecto morfolgico y gentico, de tal manera que sea ms eficiente medirlas entre s, utilizando una escala como parte de la propuesta. Dejando abierta la posibilidad de unificar criterios con la comunidad y estandarizar la comercializacin de alpacas bajo un marco de referencia, que complemente a la Norma Tcnica Peruana 201.300:2004. El resultado obtenido en la prueba de Friedmannindic que el artefacto responde positivamente en la metrizacin ycalificacin en los individuos de alpacas, obteniendo similitud con los otros mtodos actuales. Esto no quiere decir que el artefacto vaya a reemplazar los mtodos actuales, por lo contrario, los complementa, dado que ahora es posible caracterizar no solo por su fenotipo, sino tambin por su genotipo. - 5 - El artefacto fue evaluado mediante los ensayos experimentales que se realizaron en Cusco, Puno y Huancayo, utilizando la prueba de Friedmann. Obteniendo un valor del sigmoide asinttico que interpreta la existencia de relacin entre los tratamientos relacionados que participaron en los experimentos. Estos tratamientos utilizaron como mnimo la variable del espesor de la fibra y fueron bsicamente: 1) El uso del mtodo de observacin en fibra de alpaca para calificar el hato, basado en la NTP 231.300:2004, 2) El mtodo de medicin de fibra mediante tecnologa, usando el Lser-Scan en el estndar OFDA-100 como criterio en valorizar la poblacin y 3) El uso del artefacto que aparece con esta investigacin, el cual se sustent mediante el reconocimiento de patrones y los marcadores moleculares para medir la poblacin. En la bsqueda de la informacin, no se encontraron trabajos de investigacin anteriores que califiquen individuos en poblaciones de alpacas para su comercializacin. Lo que s se hall fueron trabajos similares que destacan en la seleccin de sus reproductores, mediante correlaciones en la variabilidad gentica, as como tambin, el empleo de tcnicas de redes neuronales artificiales para el ligamiento de los genes. 1.2. Declaracin del Problema El principal problema es la deficienciaenmetrizar y medir las caractersticas morfolgicas y genticas entre los individuos de lapoblacin de alpacas en relacin a su fibra. 1.3. Objetivos 1.3.1. Principal Disear un sistema inteligente (artefacto), que permita calificar los individuos y metrizarlo por tipos segn sus caractersticas fsicas y genticas para su diferenciacin en el mercado. 1.3.2. Secundario - Determinar la utilidad de las salidas del sistema inteligente. - Describir que tan eficiente resulto el trabajo. - 6 - - Identificar si el artefacto origina una nueva ventaja competitiva y generaun valor estratgico de la informacin a la comunidad. - Comprender si el artefacto puede usarse como marco de referencia nacional. 1.4. Justificacin 1.4.1. Terica La contribucin de este trabajo de investigacin radica en el uso de una herramienta que haga la metrizacin y medicin de los individuos, con la finalidad de asignar un valor de calificacin de uso universal para la comunidad. Haciendo que los contenidos morfolgicosy genticosse sumen a la calificacin, de tal modo, sea viable la diferenciacin en el mercado nacional. 1.4.2. Prctica El beneficio principal del artefacto es el de contar con una herramienta que complementa a la Norma Tcnica Peruana, la misma que pueda ser usada en la comunidad de alpaquerosy, de este modo,homologar los criterios de transaccin de la oferta y la demandadel mercado desde el enfoque de la calidad de la fibra. De tal maneraque conduzca a la liberacin de un marco de referencia en las empresas del pas y en la regulacin del comercio. Otro beneficio es que la herramienta va a permitir tomar decisiones en las estrategias de mejoramiento gentico y en el manejo del animal, fortaleciendo los individuos de la poblacin para una produccin sostenible en el tiempo. 1.5. Alcances La arquitectura del artefacto requiere de un constante mantenimiento en el aprendizaje evolutivo, en el reconocimiento de los patrones, al menos hasta que las evidencias en el mundo real sugieran un grado de estabilidad. Pero a su vez, es necesario formar los patrones con mucho cuidado, debido que el conocimiento que posee cada experto tienen perspectivas diferentes y puede generarse ambigedad en dicha formacin. La manera como se super esta situacin fue consultando y haciendo discusin con los protagonistas para consensuar el conocimiento implcito. - 7 - La representacin de la caracterizacin gentica del animal mediante los marcadores moleculares queda limitada al descubrimiento que haga la ciencia en cuanto al ligamiento de atributos fsicos. El factor humano y el equipamiento dan paso a la calidad de los resultados de dichos marcadores. Por otro lado, el tamao de muestra, el nmero de marcadores, el ndice de heterocigocidad, PIC y la exclusin afectan al modelo y son crticos para lograr un resultado certero. La regla de asociacin solo sugiere particularidades entre los alelos, la finura y el color de la fibra, como parte de la bsqueda asociativa que ayude a formar un posible criterio de relacin. No busca ligamiento de los genes. El artefacto, en su forma natural, est preparado para un crecimiento eventual en el nmero de individuos de la poblacin e introducirlos al modelo. Pero, la capacidad de almacenamiento y eficiencia depender del hardware que se emplee. Por otro lado, si el artefacto se ingresar datos aleatorios, el comportamiento de los datos resultantes depender de la interpretacin que origine el modelo en relacin al conjunto de patrones entrenados. Es probable encontrar un falso positivo pero el descarte ser inevitable ya que el experto, en el proceso de supervisin debe de tomar en cuenta el contexto de la evaluacin. Eventualmente, el modelo puede sufrir modificaciones en la estructura de las variables de entrada, pero eso implica una reingeniera al modelo, debiendo aplicar nuevamente el ciclo del proceso CRISP-DM para redefinir suinterpretacinsiempre en funcin a la escala de calificacin, con los nuevos juegos de patrones existentes. Finalmente, es importante mencionar que este artefacto requiere de ajustes en la introduccin de los datos (limpieza de datos), particularmente, cuando se inicializa el modelo. Asimismo, el conocimiento requiere de la intervencin del juicio de expertos para decidir una correcta salida en los modelos. - 8 - 1.6. Propuesta de la Solucin La presente propuesta es un desarrollo basado en el reconocimiento de los patrones, utilizando tcnicas de redes neuronales artificiales. La primera, con el empleo de redes de Perceptrn Multicapa, y la segunda, aplicando reglas de asociacin. El objetivo del artefacto est en descubrir primero la caracterstica de inters en los individuos. Luego, la vinculacin entre la presencia de un genotipo importante y el fenotipo del color blanco. Por ltimo, generar un valor en el rango de escala de los tipos de calificacin en la poblacin de alpacas. En el desarrollo de las herramientas informticas, utilizadas para implementar el artefacto, se instalel AnalysesServices de SQL 2008, con sus complementos Add- inDatamingdel Excel 2007 de Microsoft. Esto permiti efectuar el proceso de entrenamiento. Tambin se agreg el software de cdigo abierto Weka en la versin 3.6.x proporcionado por la Universidad de Waikato de Nueva Zelanda, para la parte de pre-procesamiento y reconocimiento de los patrones. 1.7. Organizacin de la Tesis En el captulo I, se explica ampliamente las circunstancias que originan el problema. Se da una explicacin bsica de la propuesta de solucin y, adems, la contribucin e impacto de la investigacin en la comunidad. En el captulo II, se desarrolla el marco terico, el cual hace mencin a todos los conocimientos relacionados a la gentica poblacional, como son los efectos de las fuerzas que ejercen en el individuo. Tambin se desarrolla la tecnologa de informacin utilizada, como son las tcnicas de inteligencia artificial. En el captulo III, se expone el estado del artey, de manera muy concreta, se demuestra el cmulo de experiencias que darn luces para elaborar la estrategia de solucin y que a su vez la sustenta. Los componentes usados en este captulo se - 9 - basan en los conceptos fundamentales de la gentica poblacional y en los modelos computacionales, matemticos y de legislacin. En el captulo IV, se explica todo el desarrollo del artefacto, que parte desde el modelo conceptual hasta la explicacin de una arquitectura de redes neuronales artificiales, las que concluyen con el despliegue de la calificacin poblacional en el objeto del estudio. En el captulo V, se usa un caso de prueba en donde se explica el proceso de de entrenamiento, utilizando para algunos casos la regla de aprendizaje hebbiano. Se explica la prueba experimental, realizada en el departamento de Puno, localidad de Huatauas, con el objeto de medir el comportamiento del artefacto y realizar ajustes al mismo. As, a partir de una serie de ensayos experimentales, se comprobar el grado de eficiencia y aceptacin del artefacto entre los stakeholders. Los ensayos fueron realizados en Cusco, Puno y Huancayo. Como parte de la evaluacin se utiliz el mtodo de Friedman para realizar la demostracin, sumando hasta 3 bloques experimentales de muestras dependientes. En el captuloVI, se menciona una serie de conclusiones y los trabajos futurosde los resultados obtenidos en esta propuesta de trabajo de investigacin. La Figura 1.4 refleja la estrategia usada en organizar la tesis, donde los captulos II y III se convierten en insumos para construir el captulo IV: Ingeniera del Artefacto,posteriormente, transformado en un caso de estudio, para terminar en las conclusiones y trabajos futuros. - 10 - Captulo II: Marco Terico Captulo I: Introduccin Captulo IV: Ingeniera del Artefacto Captulo III: Estado del Arte Captulo V: Caso de Estudio Captulo VI: Conclusiones y Trabajos Futuros Figura 1.4.Esquema General del Trabajo de Investigacin. - 11 - CAPTULO II MARCO TERICO La primera parte del captulo explica concretamente los aspectos generales de gentica, fuerzas que impactan, caracterizacin de los genes y marcadores moleculares. La intencin es dar a conocer la forma de tratar los datos que aparecen a partir de los marcadores genticos como de los fenmenos de la genmica poblacional que afectan en su caracterizacin. La segunda partedefine las diferentes redes neuronales artificiales utilizadas en este trabajo; as tambin, el marco de metodolgico en el uso del CRISP-DM y el Diseo Centrado al Usuario. 2.1.Gentica La gentica de poblaciones permite observar cmo esa materia de ADN 2 determina un conjunto de caractersticas que definen a la misma(Aldridge, 1996). En general, el trmino gen se refiere a la entidad fsica que se transmite de los progenitores a la descendencia durante el proceso reproductivo que influye en los caracteres hereditarios. El estudio del comportamiento de los genes de poblaciones implica la investigacin de la adaptacin de los organismos a ambientes estables y, por consiguiente, el estudio del camino a la evolucin. La evolucin puede estudiarse a muchos niveles distintos y mediante diferentes aproximaciones, pero, reducido a sus trminos ms sencillos, es un proceso de la dinmica del cambio en la frecuencia de genes (Cook, 1979). Los cambios en las frecuencias gnicas se relacionan estrechamente con la gentica evolutiva porque la evolucin depende, en gran medida, de los cambios en las frecuencias gnicas. [ 2 ] Es la materia de la que estn hechos los genes. Los genes transportan informacin biolgica que luego se traducen en caractersticas de los seres vivos, que se transmiten de generacin en generacin, fue descubierto por Watson y Crick, en 1953. - 12 - Asimismo, el estudio de la gentica poblacional corresponde al fenotipo y al genotipo, que forman parte de cualquier organismo. El fenotipo es la descripcin de todos los caracteres de un individuo respecto a su morfologa, fisiologa, relaciones ecolgicas y comportamiento. Las diferencias fenotpicas pueden ser cualitativas (presentes o ausentes) o cuantitativas. Los caracteres cualitativos pueden ser clasificados y los caracteres cuantitativos son medidos. Si los individuos se parecen entre s, comparten el mismo fenotipo. Algunos genotipos pueden tener el mismo fenotipo. El genotipo de un individuo es la suma de todos los genes heredados de sus progenitores. Los genes determinan la composicin de las protenas e influyen en los caracteres externos y en el comportamiento. Los genes pueden tener dos alelos o ms. En realidad, un gen puede tener tantos alelos como para dar origen a una serie allica para ese gen. Los alelos que pertenecen a una serie pueden mostrar diferentes patrones de dominancia entre s. Por ejemplo, un alelo puede mostrar un efecto dominante, lo que significa que expresa su fenotipo aunque est acompaado de un alelo recesivo. Un alelo recesivo es aquel cuyo fenotipo no se expresa en un individuo heterocigoto. Si un alelo es codominante, su efecto fenotpico ser intermedio en el heterocigoto en relacin con el efecto de un homocigoto dominante y el de un homocigoto recesivo. La variacin gentica puede detectarse mediante tecnologas moleculares que evidencian polimorfismos, los cuales resultan tiles como marcadores genticos. 2.2. Fuerzas que afectan las Frecuencias Gnicas Las fuerzas evolutivas que influyen en las frecuencias gnicas en una poblacin son: la mutacin, la migracin, la seleccin natural y la deriva gentica. La endogamia representa otro factor importante. - 13 - La mutacin es una fuerza direccional que origina cambios a las frecuencias gnicas. Su importancia reside en la variabilidad gentica que hace posible la evolucin. Mediante la mutacin, unos elementos genticos (alelos o cromosomas) se transforman en otros similares con funciones alternativas; estas variantes podrn reunirse mediante procesos de recombinacin y, si suponen una alternativa interesante, sern seleccionadas por la seleccin natural(Barahona, y otros, 1994). El proceso de migracin consiste en el intercambio de individuos reproductores entre poblaciones distintas que, en principio, tendrn distintas frecuencias gnicas. El nombre que se da al proceso concreto de intercambio de individuos depende de la poblacin de referencia. Cuando esta misma poblacin pierde individuos, porque pasan a otra poblacin cercana, el proceso se llama emigracin, y cuando esta misma poblacin recibe reproductores de alguna poblacin vecina el proceso se llama inmigracin. La seleccin natural es un proceso por el que un individuo est mejor adaptado a un medio determinado y se reproduce con mejor capacidad, dejando ms descendientes. Este parmetro se mide por el aumento de la cantidad de descendientes que una pareja de individuos es capaz de dejar a la siguiente generacin. La deriva gentica o deriva gnica es una fuerza evolutiva que acta junto con la seleccin natural cambiando las caractersticas de las especies en el tiempo. Es un efecto estocstico en la reproduccin, tratndose de un cambio aleatorio en la frecuencia de alelos de una generacin a otra, resultando una disminucin en la diversidad gentica de la poblacin. Mediante el equilibrio de Hardy-Weinberg, existe una situacin de equilibrio gentico y, por tanto, de estabilidad biolgica, solo se rompe en situaciones de endogamia o como consecuencia de la intervencin de factores que consignan modificar las frecuencias gnicas y genotpicas de una poblacin, como son: las mutaciones, las migraciones, la deriva gentica y la seleccin natural (Garca Alonso, 2008). - 14 - 2.3. Marcadores Moleculares Son sustancias qumicas detectoras que se mezclan con el ADN de un animal, con el propsito de poder ubicar la misma similitud a otros ADN marcados, de tal manera que ese tipo de marcacin pueda ser capaz de identificar una familia, filiacin, raza, especie, etc. Los marcadores moleculares son usados como una manera de identificar a un individuo y comprobar su linaje familiar, de acuerdo a sus registros genealgicos. Esto es posible realizarlo extrayendo una pequea muestra de sangre, fibra, piel o cualquier tejido de un animal como la alpaca, para someterlo a estas sustancias marcadoras. En la actualidad, muchos de estos estudios sobre conservacin de razas se basan en los anlisis genticos, a travs del uso marcadores moleculares de ADN. Entre estos marcadores se cita el uso del micro-satlite(mSat) de secuencia repetida (SSRT). Los marcadores micro-satlites (Aranguren, y otros, 2001) son segmentos cortos de ADN, cuya longitud se mide en pares de bases. En los micro-satlites, pueden llegar de 1 a 6 pares de bases (pb), los cuales se repiten en tndem y de forma aleatoria en el genoma de los seres en vivos; estn compuestos de nucletidos, los cuales forman 4 monmeros, unidos por la base: la adenina (A), tiamina (T), guanina (G) y citosina (C), estos hacen la secuencia de un fragmento del ADN y que se aprovecha para analizar la informacin resultante. En laFigura2.1 se observa un segmento de ADN y la composicin de los nucletidos que forman una cadena de frecuencia de sus bases, develando de esta manera una secuencia repetida. - 15 - Figura 2.1.Muestra de un marcador molecular de micro-satlite(Aranguren, y otros, 2001). Un buen marcador molecular debe reunir una serie de caractersticas para maximizar su utilidad: buena distribucin a lo largo del genoma, alto grado de polimorfismo, la tcnica para analizar el marcador debe ser rpida y prctica, y debe poder repetirse con fiabilidad en otros laboratorios. Si lo que se pretende es analizar las diferencias existentes dentro de las poblaciones, la variabilidad detectada por medio de micro-satlites se convierte en un instrumento eficaz de estudio e informacin. Esto puede hacerse de diversas formas, pero se utiliza generalmente la tasa o ndice de contenido polimrfico (PIC), nmero medio de alelos por locus, el grado de heterocigoto, la probabilidad de exclusin (PE), etc. 2.4. La Red Neuronal Artificial Back-Propagation (Perceptrn Multicapa) Es una regla de aprendizaje que se puede aplicar en modelos de redes con ms de dos capas. Una caracterstica importante es la representacin interna del conocimiento que es capaz de organizar las capas intermedias para conseguir una correspondencia entre las entradas y salidas de la red. El funcionamiento consiste en un aprendizaje de un conjunto predefinido de entradas y salidas. Primero se aplica un patrn de entrada como estmulo en la primera capa de la red y se va propagando a travs de todas las capas superiores - 16 - hasta generar una salida, se compara el resultado con la salida que se desea obtener y se calcula un valor del error para cada neurona de salida. Este proceso se repite, capa por capa, hasta que todas las neuronas de la red hayan recibido un error que describa su aportacin relativa al error total. Sobre el valor del error recibido se reajustan los pesos de conexin de cada neurona, de manera que la siguiente vez que se presente el mismo patrn, la salida est ms cercana a la deseada y, de esta manera, disminuya el error. (Martn del Brio, y otros, 2002) En la Figura 3.1 se explica la dinmica de la red Back-Propagation, donde se muestra cmo el patrn de entrada va desplegando internamente en relacin al valor de sus pesos y es comparado con el resultado, si no es lo buscado, el error recalculado es internalizado y el valor es recalculado para posteriormente obtener una nueva salida. Figura 2.2. Esquema de una Red Back-Propagation(Bernacki, y otros, 2004). El procedimiento para aplicar el algoritmo de entrenamiento es como sigue a continuacin: (Hilera, y otros, 2000) Paso 1: Inicializar los pesos de la red con valores pequeos aleatorios. Paso 2: Presentar un patrn de entrada:X p , x p1 , x p2 .x pn . 1 2 3 4 5 6 - 17 - Paso 3: Calcular la salida de la red, para ello se presentan las entradas a la red y se va calculando la salida de cada capa, hasta llegar a la capa de salida que ser: y 1 , y 2 .y n . Se calculan las entradas netas para las neuronas ocultas, que provienen de las neuronas de entrada. Paso 4: Calcularlos trminos de error para todas las neuronas.Si la neurona k es una neurona de la capa de salida, el valor de la delta es: = ( ) La funcin , debe ser derivable, lo que impide la funcin escaln. Disponemos de dos formas de funcin de salida: a) Funcin lineal: ( = ) b) Funcin Sigmoidal: = Paso 5: Actualizacin de los pesos. Paso 6: El proceso se repite hasta el trmino del error. 2.5. La Regla de Asociacin Los algoritmos de asociacin (Vila Miranda, 2001) surgen de la necesidad de analizar grandes cantidades de datos colectados en grandes repositorios. La idea principal es asociar un elemento de la base de datos con otra, bajo un criterio. Para crear un algoritmo de asociacin, un objeto de inters debe pasar a construir un conjunto de datos de n elementos que pueden parecerse a ella. Despus, para cada elemento se va contando los objetos de inters, cuantas veces aparece la combinacin de subconjuntos de todos los subconjuntos. La combinacin de subconjuntos que tenga la cuenta mayor ser la regla de asociacin de mayor nivel de confianza. El problema principal es que el algoritmo aplicado a una enorme cantidad de transacciones (objetos) se desempear con un rendimiento ineficaz, dejando de ser ptima. Ya que el nmero de asociaciones que se genere ser amplio. - 18 - El algoritmo a priori, para generar reglas de asociacin, realiza al menos dos pasos fundamentales: Paso 1.Generar el conjunto de elementos con un nmero de cobertura x definida por el usuario. Paso 2. A partir de cada conjunto de elementos, determina las reglas que tenga la precisin mnima. Estructura del algoritmo a priori: L[k] es el conjunto de itemsets relevantes que contienen k items. C[k] es el conjunto de k-itemsets candidatos. L[1] = { large 1-itemsets } k = 2 Mientras L[k-1] C[k] = CandidatosAPRIORI( L[k-1] ) Para cada transaccin t Ct = Conjunto de candidatos de C[k] contenidos en t Para cada candidato c Ct c.contador ++ L[k] = { c C[k] | c.contador Z MinSupport } k++ Solucin: [ L[k] - 19 - 2.6.Mtodo de Minera de Datos: CRISP-DM Los actuales modelos de procesos de minera de datos (Chapman, y otros, 2000)en sus marcos de trabajo se sustentan haciendo uso de un ciclo de vida, las mismas que van modelando el comportamiento de los datos y de los conocimientos, y as determinar un resultado que tenga significado en el mundo real. El ciclo de vida de un proyecto de minera de datos consta de seis fases (ver Figura 2.3). En la prctica, se observa que la ejecucin de las fases no son necesariamente secuenciales, solo marca el camino. Las flechas indican el sentido que debe ejecutarse, como el giro indefinido de iteraciones que sern necesarias para conseguir un resultado. En cada interaccin se espera alcanzar mayor madurez, reforzando las lecciones aprendidaspara identificar y mitigar riesgos. Tambin, ayuda a identificar nuevos disparadores enfocados al modelo del negocio. Fase I Comprensin del Negocio Fase II Entendimiento de los Datos Fase III Preparacin de los Datos Fase IV Modelacin Fase VI Despliegue DATOS CRISP - DM Fase V Evaluacin Figura 2.3.Ciclo de Vida del Modelo Crisp-DM (Chapman, y otros, 2000). - Fase I: Entendimiento del Negocio Establecimiento de los objetivos del proyecto y requerimientos; se define el problema de la minera de datos. - 20 - - Fase II: Entendimiento de los Datos Se colecciona la data inicial y la familiarizacin de la misma, se identifica los problemas en la calidad de datos. - Fase III: Preparacin de los Datos Se identifican las tablas, registros y se realiza la seleccin de atributos para la transformacin y limpieza de los datos. - Fase IV: Modelacin Se selecciona las tcnicas de modelacin y su aplicacin, para lo cual se realiza la calibracin de sus parmetros. Es en esta parte donde, se construye los modelos de redes neuronales de Perceptrn Multicapa y las reglas de asociacin. - Fase V: Evaluacin Se comprueba la alineacin de los objetivos del negocio con los resultados obtenidos, validando su aplicacin en el negocio. - Fase VI: Despliegue de Resultado Se procede a la implementacin del proceso de minera de datos en la organizacin. El mtodo CRISP-DM es comnmente usado en el desarrollo de la minera de datos, y se aplica como gua metodolgica para el desarrollo de las redes neuronales artificiales en esta investigacin. Lamentablemente, CRISP-DM no se centra en los detalles del artefacto, ni profundiza la captura las particularidades del artefacto entre los stakeholders. Por tanto, esta metodologa no cubre las expectativas de los actores. Es por esa razn que se integra la fase de modelado del CRISP con las etapas del UCD, principalmente, en la etapa de simulacin y evaluacin. Con esta accin se obtuvo mejores resultados en la concepcin y entrenamiento de los modelos para la explotacin de datos. - 21 - En la Figura2.4 se observa que desde los Stakeholders existen diferentes seales que llegan primero al mtodo del UCD, donde se analiza la solucin con requerimientos basados en la experiencia. Estos requerimientos son trasladados a la fase de modelado del CRISP, en donde se construye una arquitectura ptima desde la experiencia y expectativa de los stakeholders, con la intencin de responder mejor a las necesidades. Ayuda, adems, a dar la forma que deberan de contar las interfaces y mensajes del sistema, pero estas no estn contempladas en este trabajo de investigacin. Figura 2.4. Esquema Metodolgico del desarrollo del Artefacto. Con la aplicacin de esta sinergia se ha comprobado que existen muchos beneficios, los cuales se citan a continuacin: - Mayor fluidez en el diseo del artefacto. - Aumento de la comunicacin con los stakeholders en el descubrimiento de los requisitos y evaluacin del artefacto. - 22 - - Rapidez y simplicidad en la gestin de comprensin del negocio como del modelo de datos a utilizar. - Incorporacin de nuevos elementos para la toma de decisin en el desarrollo del artefacto. Es importante resaltar que ambas metodologas no compiten, ni tampoco se suprimen fases. Simplemente se complementan en puntos comunes para asegurar la aceptacin del artefacto. 2.7. El Mtodo del Diseo Centrado al Usuario La interaccin producto-humano se puede hacer por un diseo centrado al usuario; seenvuelve al usuario en el ciclo del diseo. Las fases del diseo son: Anlisis, Sntesis, Simulacin, Evaluacin y Decisin (Weber, y otros, 2008). No en todos los problemas de diseo est presente el usuario. Las expectativas de los usuarios, representados por el feeling o caractersticas del artefacto, son tomados en cuenta en cada fase. El proceso de diseo (ver Figura 2.5) es explorado por interacciones en la fase de simulacin, aprendiendo del posible comportamiento hasta conseguir un grado de satisfaccin y aceptacin por parte del usuario. Figura 2.5.Ciclo de Vida del Diseo Centrado al Usuario (Weber, y otros, 2008). - 23 - Las siguientes son las etapas del UCD: Etapa 1: Anlisis Son los anlisis de los requerimientos que se realiza a los stakeholders para conocer sus necesidades, la manera como la tecnologa puede ayudar y establecer objetivos de usabilidad. Hay que averiguar tambin cules son las barreras que aparecen y determinar los niveles de eficiencia y efectividad. Etapa2: Sntesis Es la creacin del diseo conceptual, se apoya de las personas involucradas al proyecto. Estos diseos son revisados y aprobados por el equipo de trabajo que incluye a los usuarios. Los diseos pasan por dos fases, el nivel general y detallado, hasta definir el artefacto. Etapa 3: Simulacin El artefacto es probado en diferentes escenarios con participacin del usuario, aqu se mide las mtricas de usabilidad, realizadas en la etapa anterior. Se necesita simular todos los procesos que implica el artefacto. Aqu pueden generarse iteraciones hasta conseguir la satisfaccin con el usuario. Etapa 4: Evaluacin Se evala el impacto del artefacto que se origina con el usuario, hasta conseguir el look and feeling. Los objetivos de usabilidad y los requerimientos son usados en esta parte para conseguir la aceptacin final. Etapa 5: Decisin La implementacin y despliegue se realiza progresivamente, el artefacto es analizado para encontrar nuevas debilidades en su uso, y experimenta con el usuario hasta que se considere finalmente apto. - 24 - CAPTULO III ESTADO DEL ARTE Este captulo tiene el propsito de divulgar diferentes temas de investigacin que tienen relacin con la propuesta antes descrita, haciendo notar en qu medida se puede colaborar en lo que respecta a la medicin de las poblaciones de alpaca. Estos temas de investigacin se descompone en tres dimensiones: conceptos fundamentales, modelos existentes y legislacin. 3.1. Morfologa de la alpaca (Lupton, y otros, 2006) Algunas investigaciones orientadas a las expresiones morfolgicas se centran en descubrir el rendimiento y la calidad en la produccin del velln, como es el caso de (Lupton, y otros, 2006), en cuyo trabajo se estudian las caractersticas de la fibra de alpaca tipo Huacaya en USA, las cuales fueron medidas y calculadas sobre estndares internacionalesteniendo en cuenta los efectos de la edad y el sexo en 23 variables. Estas muestras fueron tomadas en 6 regiones en USA, todos con un peso similar en 585 animales. El mtodo empleado sugiere medir y evaluar la fibra sobre cuatro tipos de pruebas. El primero para conocer las longitudes de estas, usando el IWTO-30,1998. El segundo, evala la fortaleza y resistencia de la fibra empleando IWTO-30,1998, el ASTM D 584, 2003, y el AustralianStandar 3535, 1998. El tercero, despus de un tratamiento de lavado, se procedi a medir el dimetro de la fibra, utilizando el OFDA en los estndares: IWTO-47,2000, IWTO-57,1998. Como resultado de las pruebas se concluyeron que los machos producen una fibra ms resistente que las hembras y, mientras ms joven sea el animal, la produccin del velln resulta ms fina y resistente. Por otro lado, se pudo notar que el color blanco respecto a los otros, mostr mejor brillo y presentacin lo cual es muy bien recogido en las empresas textiles. - 25 - (McGregor, 2005) Otra investigacin, efectuada por (McGregor, 2005), estudia variables de la fibra de alpaca en el enfoque comercial, cuyo inters es descubrir el valor econmico asociado a los datos del precio en el mercado. El mtodo usado fue a travs de un ensayo experimental, tomando 1100 vellones de fibra de alpaca en 5 granjas al sur de Australia, sobre dos especies alpacas: Huacayasp.y Suri sp, para la cual se realiz un muestreo en diferentes zonas del animal en el primer ao, para medir el grosor de la fibra, la desviacin estndar y el coeficiente de variabilidad para distinguir la distribucin relativa de la fibra. Se utiliz el OFDA-100 como herramienta de medicin. En el segundo ao, se adicion 100 muestras ms en el lado medio del animal, aqu se midieron la resistencia de los vellones. (Frank, y otros, 2005) Otro autor, (Frank, y otros, 2005), explicalos factores que afectan comercialmente el valor de la fibra del camlido. En el mtodo se describe los requerimientos textiles en relacin a la sensacin de picazn, que est relacionada con la distribucin del dimetro de la fibra. Otro de los factores son las seales en el mercado con respecto a la calidad de la fibra y el color de la misma, particularmente el asociado al color blanco. Otro factor es el dimetro de la fibra que determina potencialmente la longitud del hilo,que a su vez est fuertemente relacionada con la picazn de la fibra de alpaca. Por el lado gentico, las caractersticas de la produccin de la fibra, tienen relacin con las caractersticas cuantitativas, caractersticas factoriales y/o mendilianas. Adems, el fenotipo del color no depende de su aspecto visual, sino que debe estar sustentada por pruebas bioqumicas para determinar la concentracin de eumelaninas y pheomelaninas. Concluye que la calidad de la alpaca y de las llamas est relacionada directamente a la fibra y, a su vez, est sujeta a un conjunto de atributos como: el color, el tipo del velln, la longitud de la fibra y el rendimiento. Explica, adems, que - 26 - el color blanco en el velln es una caracterstica, altamente probable que sugiere la dominancia en el individuo. Los factores no genticos que influyen en la produccin de la fibrade alpacas son: sexo (2.4%), localidad (32.6%) y edad (6.5%). (Aylan-Parker, y otros, 2001) Segn (Aylan-Parker, y otros, 2001), se realiz una comparacin entre los atributos de la fibra de alpaca, provenientes de Per, para lo cual se busc efectuar mediciones para su optimizacin entre 120 alpacas de especie Huacaya y Suri, en granjas del sur de Australia. El mtodo empleado fue, primeramente, distinguir 3 formas de muestreo: el primero en relacin al lado medio del animal (MS), el segundo, al muestreo simple de la silla de montar (SGS) y, por ltimo, en funcin a la grilla simple del velln. Para cada muestreo se realizaron mediciones caractersticas que, posteriormente, son comparadas. En todos los casos se utilizaron los estndares OFDA, IWTO-47, 1995, definiendo las variables MFD, la desviacin estndar de la misma y su coeficiente de variacin como elementos para el anlisis estadstico. Para ello se usaron como parmetros de comparacin: el peso vivo (LWT) de hembras y machos, el dimetro promedio de la fibra (MFD) y el rendimiento limpio y lavado de la fibra (CWY), valindose para ello de la tcnica de grilla del muestreo (ver Figura 3.1). Figura 3.1.Grilla de la Muestra que segmenta a una Alpaca (Aylan-Parker, y otros, 2001). - 27 - (Iiguez, y otros, 1997) Otro autor, (Iiguez, y otros, 1997), estudia el sistema de produccin, segn tipo de velln y la distribucin de las caractersticas de la fibra en una poblacin de llamas al sur de la ciudad de Potos en Bolivia. Para ello se usaron variables del medio ambiente como son: el pastoreo mixto, el tipo de pasto, la rotacin en pantanos y las superficies planas y montaosas. Como primer paso en el mtodo usado, se agruparon individuos segn dos razas de llamas. Para aquellas que forman parte de la clase de llamas con pelo compacto y cado se le reconoce como Kjarkas (K). De igual forma, para aquellos individuos que muestran notoria cada de la fibra se entienden por la raza Thampullis (T). Una tercera clase se origina a partir de las variaciones de fibra intermedia (I), tomando en cuenta que los extremos corresponden a cada tipo de raza mencionada. Como segundo paso, se realiz el anlisis estadstico del muestreo de acuerdo a las caractersticas principales, como son: el promedio del dimetro de la fibra, su longitud y la fuerza de la misma,regidos en el estndar del AFD, IWTO y ASTM. Se estudiaron tambin los efectos del sexo, el color de la fibra y el tipo de velln utilizando un modelo lineal. (Montes, y otros, 2008; 2007) Otros autores, (Montes, y otros, 2008; 2007), estudiaron la calidad en la produccin de fibra en alpacas para la regin de Huancavelica, realizada en una muestra de 203 individuos, ubicada entre 4 100 y 4 750 m.s.n.m., obteniendo un dimetro de 22.7 considerando el sexo, edad y origen de la comunidad, deduciendo que los machos arrojan mejores resultados en la finura de la fibra respecto a las hembras, siendo la edad un factor importante ya que a medida que el animal era ms viejo su finura perda valor. Adems, se observ que la longitud de la fibra fue un atributo que contribuy en la relacin de la fibra fina. - 28 - (Rios, 2009) En una entrevista realizada, (Rios, 2009) asegur que la medicin de la fibra y su valorizacin econmica se realiza a travs de la NTP 231.300, como proceso de normalizacin de la fibra de alpaca y que, en relacin directa con el peso del velln, se determina un porcentaje por calidades o categoras para hallar una diferenciacin en el individuo. Este proceso se hace en forma manual, tal como lo valida (Mueller, 2007)al realizar el anlisis de muestras de fibra en ovinos, as se vale de la medicin visual para estimar el mrito gentico (fenotipo), como es el caso del peso del velln, peso corporal y finura de la fibra. (Holt, 2006) En el Handbook de la AAA, (Holt, 2006) da el marco de referencia para tratar a las alpacas en su esquila y muestreo en Australia; por ejemplo, demarca las regiones del animal para su diferenciacin, estas regiones son: neck (cuello), backline (lnea oscura), saddle (silla de montar), apron (delantal), belly (vientre), middleleg (pierna media), lowerleg (debajo de la pierna). Por otro lado, el documento explica la tcnica de muestreo de la grilla, cuyo objetivo es tomar una de las regiones y dividir las reas en cuadrculas para identificar las pequeas zonas que lo conforman. Pero tambin sugiere escala en el grosor de la fibra y su distribucin de varianza (ver Figura 3.2). Figura 3.2. Escala del Grosor de la Fibra en Alpacas, (Holt, 2006). - 29 - (Baxter, 2002) Otro autor, (Baxter, 2002), sostiene que el papel de la metrologa en lana o vellones en animales no es una situacin esttica, ya que depende de la evolucin de la tecnologa que determina la profundidad de la precisin y confiabilidad, pudiendo generar reduccin de costos y cambios en una organizacin. Asimismo, el manejo de la tcnica permite la prediccin de rendimiento de productos, as en su estudio se experiment un caso por 5 aos, obteniendo mejoras en la tecnologa de las mtricas. No menciona un mtodo en particular, sino describe los actuales, que son: el grosor, el peso, la longitud, y el color de la fibra con el OFDA-100, la grasa que contiene con el IWTO-57 DTM 43. Actualmente, estas tecnologas han evolucionado, pudiendo en algunos casos hasta hacer doble mediciones a la vez, como es el caso del OFDA-4000, que puede medir el grosor y longitud de la fibra al mismo tiempo. 3.2. Mtodos Cuantitativos (Garcia V., y otros, 2007) En investigacin realizada en llamas, (Garcia V., y otros, 2007) estimque la herencia, la repeticin y la correlacin gentica entre el peso corporal era evidente al nacimiento, el destete,la primera y segunda esquila considerando la edad de la madre y el sexo de la cra, sobre un perodo de 6 aos en la regin de Huancavelica. El mtodo empleado fue del empadre controlado para el apareamiento de los individuos, registrando eventos entre la madre y la cra, como son: los datos del parto, del destete y luego de la primera y segunda esquila, que se realiza cada 2 aos. Para el anlisis estadstico se hizo ajuste de fechas para los perodos 1995-2001. Se utiliz la frmula de Warwick y Legate. As se obtiene una heredabilidad promedio y con tendencia a valores altos.Asimismo, el ndice de repeticin para el peso vivo de las llamas arrojaron resultados bajos, mientras que con la aplicacin de regresiones y las correlaciones genticas entre peso vivo al nacimiento con el peso vivo al destete y primera esquila los resultados fueron altos. - 30 - (Bustamante, y otros, 2006) Otro autor(Bustamante, y otros, 2006) realiz un trabajo de investigacin, en cuanto a la produccin de fibra, que se hizo sobre 3 poblaciones de llamas (Lama glama) ubicadas al noreste de Argentina. El mtodo utilizado para la diversidad gentica fue el clculo del nmero medio de alelos por locus (NMA), los alelos privados de la poblacin (APP), el nmero de alelos detectados por poblacin (A), el nmero total de alelos detectados y el nivel de proporcin de los diferentes genotipos dentro de las poblaciones, mediante la heterocigosidad por locus en cada poblacin y utilizando los algoritmos incluidos en el programa Exel Micro-satlite Tools. La estructura y diferenciacin gentica entre las poblaciones se calcul mediante los parmetros F y Rho. El ndice Rho se basa en el modelo de mutaciones por pasos o StepWiseModel (SMM) y tiene en cuenta, adems,las frecuencias allicasy el tamao de los alelos. En un estudio realizado sobre 77 alpacas subdividas desde 10 aos atrs por una nica poblacin, se tomaron muestras de ADN mediante la amplificacin de 12 loci en microsatlites, se hizo un hallazgo de 140 alelos diferentes y se comprob realizando 19 de 30 pruebas del equilibrio de Hardy-Weinberg, los cuales demostraron desvos significativos debido a la escasa presencia de alelos heterocigotos. Asimismo, la diferenciacin gentica se estima del ingreso progresivo de especies a la poblacin provenientes de otras regiones al descubrir 44 alelos privados. Estos resultados concluyen en la facilidad de identificar las fortalezas genticas y realizar una seleccin dirigida de las especies para futuras estrategias como la reproduccin y la comercializacin de estas. (Julio Sastre, 2003) Otro autor (Julio Sastre, 2003) en su tesis doctoral relacionada con bovinos, explica cmo los micro-satlites SSRs se caracterizan por las repeticiones que se presentan en forma general como pequeos nucletidos entre 1 a 6 y tambin por el nmero de repeticiones.Estas repeticiones, a su vez, se encuentran distribuidas al azar en todo el genoma, estn muy conservadas para utilizarse en especies prximas - 31 - y tienen un alto polimorfismo inclusive en poblaciones en donde no hay mucha variacin. El mtodo usado fue, en primer lugar, identificar los genotipos a travs de 14 marcadores moleculares recomendados por la FAO (2003), para estudios de variabilidad gentica en bovinos de conservacin. Sobre los cuales se usaron en 7 sub-poblaciones con caractersticas fenotpicas similares. Para el anlisis de gentica de poblaciones se utiliz el GenePop versin 3.3, que ayud a calcular los valores de heterocigosidad observada y esperada, el ndice de fijacin, el equilibrio de Hardy- Weinberg y las frecuencias allicas. Finalmente, para el anlisis de correspondencia se utiliz el software Genetix. Como resultado se pudo identificar y seleccionar animalespor sus atributos. (Feeley, y otros, 2009) Este autor (Feeley, y otros, 2009), recientemente ha descubierto la correlacin entre el gen melanocortin-1 (MCR-1) y el color de la fibra de alpaca.Estos experimentos fueron llevados a cabo en granjas de Australia sobre 41 individuos, secuenciados por productos PCR. En el experimento se not que 21 nucletidos fueron polimrficos, es decir, altamente cercanos a los genes de inters (A82G y C901T) que tienen el potencial de reducir la eumelanina, elemento responsable de la pigmentacin en la fibra. Otros alelos como el G82/T901 y G82/Y901 se mostraron homocigotos y recesivos al gen de inters, por lo tanto no son capaces de producir la eumelanina. Esta situacin indica la viabilidad de seleccionar un individuo con caractersticas especficas, como por ejemplo una poblacin dominante con vellones de color blanco para su mejoramiento gentico y comercial. (Calvet, y otros, 1990) El autor (Calvet, y otros, 1990), en una investigacin realizada en la provincia de Cantabria (Espaa), utiliza los marcadores eritrocitarios de membrana, que histricamente corresponden a los caracteres humanos en su transmisin mendeliana. La informacin obtenida se proces aplicando las frecuencias gnicas en fenotipos esperados. Basado en la genmica de poblaciones, se observ que se encuentra en equilibrio de Hardy-Weinberg, el clculo de la misma fuerealizado mediante mtodos bioestadstica siguiendo las indicaciones de Hummel y Cols. - 32 - Particularmente, se observ en el sistema ABO materia del estudio -, que alcanz valores bajos en el alelo B para la regin de Cantabria, en cambio el alelo O fue alta y se extendi desde el norte, disminuyendo hacia el sur.Los resultados fueron validados con el estudio del sistema Rh en la sangre encontrando resultados similares y en algunos casos muy altos. En el estudio se toma en cuenta que los valores de la probabilidad de exclusin son muy semejantes. Este estudio es utilizado para ver el comportamiento de las expresiones genticas a travs de las frecuencias y llegar a una conclusin en cuanto al impacto que tiene en la diferenciacin de sus caractersticas fsicas presentadas. (White, y otros, 2007) Segn el autor (White, y otros, 2007),el QTL (QuantitativeTraitsLoci)aparece como un mtodo estadstico y computacional complejo que gestiona las expresiones genticas para determinar un gen de inters en relacin a una caracterstica fsica, en especialde un individuo. Por ejemplo, un factor simpleen la evaluacin de diferencias entre caractersticas cuantitativas en los valores por clase de marcadores genticos es la aplicacin directa del anlisis de regresin de varianza. La mayor limitacin en la estimacin es que no se puede encontrar con exactitud la posicin del marcador en relacin al fenotipo a relacionar. Utilizando tcnicas conocidas como el RFLP, RAPDs, SNPs, o los micro-satlites SSRs, para el secuenciamiento en laboratorio del ADN, se consigue suficiente data que despus es utilizada por estadstica para predecir una posible caracterstica a descubrir. Este es el caso de nuestra investigacin, en el cual se utilizan los micro-satlites de secuencia repetida (SSRs) que forma el mapa para luego, mediante apoyo computacional, determinar la presencia o no de estados homocigotos dominantes en la muestra. (Hui Lui, 1998) El anlisis de los QTLs(Hui Lui, 1998) identifica agrupaciones de genes para determinar funciones biolgicas especficas, de tal modo que reflejen la estructura molecular del genoma mediante un orden, conseguido por marcadores polimrficos (mltiples caractersticas fsicas). La formacin del mapa est formada por fragmentos de ADN, cuya limitacin est dada por el tamao y el nmero de replicaciones endichos fragmentos. Por consecuencia, los mapas genticos son - 33 - hechos por segmentos largos, pero que son interpretados a travs de una tcnica por secuencia repetida, el cual tiene la informacin para el anlisis de complejas caractersticas.A su vez, los mapas fsicos estn relacionados con los mapas genticos para determinar una expresin en particular, lo que en adelante sirven de soporte para secuenciar y conseguir un gen de inters. En el desarrollo del anlisis se utiliza laestadstica genmica que permite, mediante distribuciones conocidas como la normal, binomial, poisson, chi cuadrado, producir evaluaciones hipotticas contrastadas con el anlisis de la probabilidad del falso positivo y negativo, para contar con la certeza de un posible grado de polimorfismo (relacin entre el gen de inters y una caracterstica deseada). Muchas veces los mapas son procesados por mtodos numricos debido a la complejidad de la funcin estimada, por tanto, utilizando iteraciones de newton raphson, es posible encontrar valores esperados en modelos ms complejos dondese utilizan otras tcnicas como el EM Algoritmo, anlisis de varianza y predicciones. (Iniesta, y otros, 2005) En autores como (Iniesta, y otros, 2005), el anlisis de los polimorfismos genticos permite identificar genes que confieren susceptibilidad a presentar enfermedades. En este trabajo, se presenta el anlisis descriptivo de un nico polimorfismo y la evaluacin del equilibrio Hardy-Weinberg. Para ello se emplean modelos de regresin logstica y se estudian los posibles modelos de herencia. Por ltimo, se presentan mtodos para el anlisis multivariado de polimorfismos: estimacin de las frecuencias de haplotipos y anlisis de asociacin con la enfermedad. (Renieri, y otros, 2007) En trabajo realizado por (Renieri, y otros, 2007), efecta una seleccin gentica en poblaciones de alpaca de la especie Suri spp. yHuacayaspp. en la provincia de Caylloma(Per), cuyo objetivo es evaluar y comparar para la seleccin de un mejoramiento gentico, utilizando diferentes criterios de evaluacin, como son: el tipo del velln, el color del velln, cantidad de fibra, la finura de la fibra y la variabilidad del dimetro de la fibra. - 34 - Se utiliz el mtodo de seleccin para reproductores, para lo cual se evaluaron las caractersticas cuantitativas con el mtodo del test performance, sobre la base de los parmetros genticos considerados. El clculo se hace mediante el modelo del MultipleTraits utilizando el software MTDFREML, ponderando el dimetro de la fibra, el coeficiente de varianza y el peso. Tambin se aplic el mtodo de las frecuencias gnicas para determinar el grado de correlacin que existe entre las variables, explica, adems, que para conseguir un buen programa de mejoramiento gentico requiere que la poblacin se defina con certeza, ya que afectar los resultados.En la investigacin se observ una alta variabilidad fenotpica en los caracteres cualitativos y cuantitativos, a efecto de una deriva gentica provocada por el golpe de la conquista entre la poblacin de individuos. Recomend, adems, de la existencia de un registro para evitar la contaminacin gentica indiscriminada, producto de las fuerzas naturales que impactan a una poblacin. 3.3. Modelos Computacionales (Cooper, y otros, 2002) De acuerdo al autor (Cooper, y otros, 2002), se ha realizado una investigacin en relacin a la caracterizacin del cultivo vegetal Sorghumspp., basado en un modelo E(NK) de Kaufmman utilizando estadstica cuantitativa que relaciona e interacta entre las dimensiones del genotipo y fenotipo, en una interaccin evolutiva para predecir valores de la secuencia del genoma en organismos procariticos y eucariticos. El modelo se sustenta en un marco de trabajo con base de datos experimentales y en la creacin de estructuras de conocimiento de los sistemas de ambientes genotpicos, definiendo prioridades e integrando con las caractersticas fsicas. (Len-Velarde, y otros, 2000) Otro autor (Len-Velarde, y otros, 2000), formula una investigacin desarrollada sobre alpacas (Lama pacus) en relacin a la calidad y cantidad de fibra de alpaca desde el enfoque genotpico y fenotpico, para ello proponen un modelo de simulacin denominado ALPAGEN, basado en la variabilidad gentica en - 35 - variables bio-econmicas como: el peso, la longitud y el dimetro de la fibra, utilizando las correlaciones para determinar un ndice de seleccin. El modelo funciona sobre una lgica que representa los momentos de la evolucin de la poblacin y que es tratado en 5 tipos de escenarios. Los resultados que arrojaron sobre datos de 10 aos, apoyado en la estadstica, es que existe en aquellas variables de nacimiento que presentaron ratios bajos en mortalidad, afectando en menor magnitud el tamao poblacional a 1000 cabezas en la simulacin. Estos resultados se pusieron a discusin. (Souza, y otros, 2007) Otro autor (Souza, y otros, 2007) propone un algoritmo Phenomic, cuyo propsito es integrar los resultados del anlisis de expresin de genes con las caractersticas fsicas de un individuo. Basado en sistemas evolutivos en clustering, sugiere construir una red de expresiones de genes que orienten un perfil fenotpico que se conserva y que se acumula entre las interacciones. Utiliza un modelo similar a un K-means, regida por la distancia euclidiana, la cual, con cierta modificacin propia del autor, determina una bsqueda de informacin gentica emulando el proceso natural de evolucin. Finalmente, simula las agrupaciones que estn involucradas entre genes y caractersticas particulares en individuos. (Portela de Carvalho, y otros, 2002) Otro autor (Portela de Carvalho, y otros, 2002)realiza una investigacin que utiliza dos mtodosen base a la relacin del ideotipo o caractersticas principales de la berenjena, uno de ellos es el ndice de seleccin y el otro, sus principales componentes. Para el primero, toma en consideracin la existencia de un rango ptimo por cada caracterstica evaluada en el modelo y cuya diferencia se estima entre una escala frente a la caracterstica principal, posteriormente, para el segundo, se procesa el ndice para obtener la distancia euclidiana y se ejecute ambos mtodos para predecir la misma ganancia en genes. Como resultado, ambas curvas que produce el modelo, el ndice de seleccin obtuvo un valor ptimo en el intervalo, para el caso del algoritmo de la distancia euclidiana los valores se mantuvieron entre el promedio. En el anlisis se pudo notar que 4 caracteres de la berenjena tuvieron el 35% como porcentaje de seleccin, evidenciando coincidencias entre ambas como estrategia de seleccin. - 36 - 3.4. Legislacin Vigente Segn el D.S. 23-95-AG, se habilita y obliga a los productores a cumplir el reglamento de los registros genealgicos de alpacas de las razas huacaya y suri, muy importante en esa fecha debido a que no se tena la certeza de un inventario, as esta iniciativa permite consolidar la informacin a nivel nacional. En el 2004, se publica la ley 28041 que aparece como medida de proteccin y control del patrimonio nacional de camlidos sudamericanos en apoyo a la exportacin de los productos y sub-productos, a fin que promueva y asegure el mejoramiento gentico, indicando la tica del uso de la biotecnologa, as como de la administracin del empadre respecto a los registros genealgicos. Aparece, posteriormente, la modificacin de la ley 28041, en que faculta al CONACS a realizar supervisin y control bajo su responsabilidad a fin de lograr un registro con informacin de alta confiabilidad. En el 2005, sale publicado la ley de promocin a favor a los camlidos sudamericanos, que propone la mejora gentica en las organizaciones y comunidades vinculadas a nivel nacional. Se establece una reformulacin en el registro genealgico. Es tambin importante aadir que el registro es el instrumento que permite a los productores a defenderse y al estado a controlar los efectos de la contaminacin gentica y de las fuerzas que afectan las frecuencias gnicas en una poblacin. El INDECOPI (Indecopi, 2004), a travs del Comit Tcnico de Normalizacin de Fibra de Alpaca, entre los aos 2002 y 2003, reuni a diferentes instituciones y empresas lderes en materia de produccin de fibra de alpaca, las mismas que en forma consensuada, y tomando como antecedente la informacin proporcionada por el Instituto Peruano de la Alpaca y Camlidos, llegaron a acuerdos significativos para categorizar los grosores de la fibra para el comercio. El Cuadro 3.1 explica los valores que definen los grosores y otros atributos identificados mediante diferentes pruebas y en consenso nacional. - 37 - Cuadro 3.1. Clasificacin de la Fibra de Alpaca (Indecopi, 2004). CLASIFICACIN FINURA (micrones) Largo - mm Humedad % Mx. Slidos Minerales % Mx. Grasa % Mx. Extra Fina Hasta 23 65 8 6 4 Fina 23.1 a 26.5 70 8 6 4 Semi Fina 26.6 a 29 70 8 6 4 Gruesa Mayores a 29 70 a menos 8 6 4 - 38 - CAPTULO IV INGENIERA DEL ARTEFACTO Este captulo trata del diseo fundamental del artefacto, que para esta investigacin corresponde al Motor Algortmico, donde se hace una descripcin detallada de sus partes y modelo de datos. Adems, se da las pautas de integracin entre los diferentes modelos y las especificaciones de hardware y software en el cual ser desarrollado. 4.1. Modelo Conceptual del Artefacto En el Per existen diferentes estudios sobre la mejora y manejo de animales, en relacin a la fibra de alpaca, muchos de estos estudios comparten la esencia de este enunciado emitido por la Unidad de Biologa Molecular de la Universidad Particular Cayetano Heredia, que dice: En el Per los registros en alpacas se basan en observacin y empadre controlado lo cual no asegura el 100% de confiabilidad en la identidad y parentesco de los animales que ingresan a los libros de registro. El uso de marcadores moleculares para la identidad del animal y la seleccin dirigida ayudar a mejorar la productividad como parte de la estrategia usada en la intensa seleccin para la mejora de las caractersticas productivas en otras especies domsticas 3 . Bajo este contexto, los marcadores moleculares se convierten en la piedra angular en el esbozo del modelo conceptual (ver Figura 4.1), porque hasta ahora no es considerado metdicamente su contenido gentico en la seleccin y categorizacin de la fibra. Por otro lado, tambin se requiere ampliar la comprensin del potencial fsico, la seleccin y categorizacin de la fibra, ya que hasta la fecha solo utiliza el espesor de la fibra, como nico elemento de referencia. El estado del arte demuestra la existenciade otros descriptores fsicos del fenotipo del animal y que estn presentes en los libros de los registros genealgicos. [ 3 ] Proyecto de Generacin de Ncleos de Alpacas Reproductoras de alta productividad basados en la seleccin asistida con marcadores genticos de ADN. Financiamiento Concytec FINCyT-PIBAP-2007 - 39 - En la descripcin del modelo conceptual se empiezaagregando los datos de los marcadores moleculares y los registros genealgicos. Estos datos son transformados en patrones para quedar aptos en la ejecucindel motor algortmico. El motor algortmico est compuesto por un sistema de redes neuronales artificiales, cuyo objetivo es lanzar un resultado que exprese un nivel de calificacin. Este motor es alimentado, adems, por los conocimientos de seleccin y categorizacin de la fibra, recogidos desde los expertos, as como tambin de la discusin de esos resultados como parte del proceso de aprendizaje evolutivo en el entrenamiento y reconocimiento con la ayuda de la experimentacin. Figura 4.1. Esquema del Modelo Conceptual del Artefacto. La calificacin se determina entre la convergencia de las variables:calidad de la fibra, valor comercial y la pureza de la raza del animal.Esta convergencia forma un conjunto de estereotipos excluyentes en seis niveles de calificacin, que representan el perfil comercial de la alpaca en el mercado. - 40 - Cabe resaltar que para la elaboracin de este trabajo de investigacin se utiliz la metodologa del CRISP-DM, como gua para el desarrollo del artefacto. La razn de utilizar este modelo de referencia, y segn (Chapman, y otros, 2000), es porque ayud a construir el motor algortmico, el cual necesita de la minera de datos para alcanzar sus objetivos. 4.2. Comprensin del Negocio En el estudio realizado por (Sarah, 2006), acerca de la cadena de valor, evidencia cmo los pequeos y medianos productores acopian el material hacia sus centros de produccin, donde se clasifica y prepara para su posterior hilado o venta de vellones pre-tratados. En este punto, el insumo puede ser exportado o vendido a intermediarios para su distribucin. Las empresas grandes absorben el total de la produccin para producir el hilado o confeccionar prendas, que a su vez son extendidas por los intermediarios para colocar los productos terminados hacia los mercados extranjeros (ver Figura 4.2). Figura 4.2. Cadena de Valor de la Fibra de Alpaca (Sarah, 2006). Se aprecia, adems, que en el circuito de la cadena de valor, los Rescatistas son las personas que se encargan de las actividades de colecta, tratado y preparado de - 41 - la fibra para ofertar a las empresas. Es aqu donde se clasifican y categorizan la produccin de fibra a travs del personal de campo, que por observacin y experiencia tienen el conocimiento de discriminar las calidades de la fibra, inclusive aproximndose a la Norma Tcnica Peruana 231.300 de INDECOPI. En este escenario, los principales actores (Sarah, 2006) que forman el modelo de stakeholders son los Alpaqueros, conocidos tambin como criadores, que van desde campesinos en condiciones precarias hasta aquellas empresas perfectamente constituidas y acreditadas (ver Figura. 4.3). Todos ellos acopian cantidades de vellones. El material es lavado, peinado e hilado por empresas textiles; el otro caso, es que los artesanos hagan la misma tarea. El gobierno apoya bsicamente en el recorrido de la cadena de valor, como son el Ministerio de Agricultura, de la Produccin, PROMPEX, entre otros. Finalmente, las ONGs tienen un papel importante, ya que se encargan de apoyar cuando surgen los problemas sociales y culturales, a favor de que se lleve a cabo un circuito menos complicado. En la Figura 4.3, las flechas de mayor espesor indican una fuerte vinculacin entre los nodos, las flechas con menor espesor denotan una dbil cercana, finalmente, las lneas punteadas explican la presencia de otras unidades estratgicas de negocio dedicadas a la explotacin de otro sub-producto de este animal. - 42 - Figura 4.3. Modelo de Stakeholders en la Produccin de Alpaca (Sarah, 2006). Como se ha apreciado arriba, la crianza de alpacas nace en las comunidades rurales. La manera como se lleva a cabo las crianzasresponde a las formas tradicionales. En algunos lugares todava existe mucha desconfianza en los organismos privados y estatales para aplicar los mtodos en mejora de la especie (Mueller, 2007), esto debido a que se argumenta que no son eficientes y encarecen los costos para su mantenimiento, optando por las enseanzas ancestrales en el manejo de los animales. Todo ello provoca mutaciones inesperadas, migraciones y deriva gentica en las poblaciones, haciendo ms probable una contaminacin gentica y, por consecuencia, una reduccin del potencial gentico, sin que el criador pueda apreciarlo y entenderlo. Estas fuerzas evolutivas hacen que los individuos expresen fenotipos de la fibra no deseados, poniendo en riesgo la sostenibilidad de la produccin en el tiempo. Las empresas de hoy, sujetas a este marco de negocio, cuentan con infraestructuras tecnolgicas con aplicativos ms o menos preparados para explotar los datos y alcanzar una mejora en la gestin de conocimientos; pero poco se ha dicho y hecho por descubrir el verdadero valor estratgico de la tecnologa de informacin (Mohammad, 2007). Requieren de innovacin tecnolgica para relanzar su ventaja competitiva (W. Chan, y otros, 2005). - 43 - Segn el Programa de Camlidos del SYNACIT (PROCAM, 2007), sugiere que este problema forma parte de otros, los que son citados a continuacin: a) No hay suficiente capacidad de innovacin para encontrar procesos para reducir la enorme cantidad de fibra gruesa de descarte de alpaca que se ha acumulado. b) Falta de innovacin en la comercializacin ms moderna para la organizacin de la oferta y para la articulacin comercial con la industria. c) No se ha logrado una tecnificacin e innovacin productiva-comercial que permita mantener una calidad estndar de mejor finura y volumen. d) Existe un bagaje de conocimientos tradicionales, muchos de ellos validados con mtodos modernos, que se vienen perdiendo, lo que deriva en prdidas de calidad en la crianza y cruzamiento, ello a su vez ha conllevado, entre otros problemas, a una escasa disponibilidad de fibras de colores naturales en alpaca. Se estima que existen 22 colores naturales de fibra. En el desarrollo del trabajo, se obtuvieron expertos multidisciplinarios, tanto a nivel del reconocimiento de la fibra, la caracterizacin gentica y, aquel que tiene experiencia en generar un valor econmico al individuo. Se utiliz el mtodo Delphi, para elegir y generar la encuesta que sirvi en el diseo y construccin del artefacto. 4.3. Entendimiento de los Datos El motor algortmico es un sistema que consta de tres componentes: modelo alfa, beta y landa (ver Figura 4.4). El primero, explora la informacin para confirmar la presencia de rasgos fsicos de inters entre los individuos, de tal manera que cumplan un perfil en el mercado. El segundo, pretende encontrar relaciones entre el patrn de la diversidad gentica del animal con el color blanco del animal. De acuerdo a lo encontrado en el estado del arte, muchos de los autores precisan que es altamente probable la presencia de fibra fina cuando el velln tiende al color blanco. Por ltimo, el tercer componenteintegra las respuestas de los componentes anteriores. Este componente tiene como objetivo generar las conexiones entre las caractersticas - 44 - de inters descubiertas en el fenotipo del animal contra la relacin entre su diversidad gentica. Esto da por resultado una votacin en el modelo que calcula un nivel de calificacin para estimar una posicin que explica su perfil en el mercado. Figura 4.4. Arquitectura del Motor Algortmico del Artefacto. La idea del motor algortmico es porque se necesita atender el requerimiento para evaluar los contenidos fenotpicos y genotpicos de la alpaca,asignando una calificacin, tal como en la realidad lo hace el experto en el proceso de seleccin y categorizacin de la fibra. Y en lugar de obtener una percepcin sesgada de la calidad de la fibra, ahora el motor podr ampliar esa percepcin y orientar la calificacin hacia un perfil comercial. Se basaron de los resultados de la encuesta realizada a los stakeholders (Ver Anexo D). El modelo alfa () corresponde al descubrimiento de un fenotipo con caracterstica de inters, utiliza una red de Perceptrn Multicapa. El modelo beta () analiza las relaciones entre el genotipo y el color blanco, utiliza una regla de asociacin. Y, finalmente, el modelo landa ()determina el nivel de calificacin, tambin utiliza una red Perceptrn Multicapa. Durante ese proceso es necesario contar con algunas consideraciones para usar los marcadores moleculares, as se deben cumplir estos requisitos: contar con - 45 - una probabilidad de exclusin 0.989989 y un PIC de 0.968, adems de tener alta presencia de heterocigocidad y el equilibrio de Hardy-Weinbeirg 4 . (Aranguren, y otros, 2001) (White, y otros, 2007).Estos requisitos aseguran que la caracterizacin de los marcadores moleculares expresen valores independientes a los fenmenos de las fuerzas evolutivas. Cabe recordar que la calificacin hallada representa un score entre los individuos de una poblaciny trabaja a manera de un snapshot o fotografa del individuo. 4.3.1. Modelos del Sistema: Modelo Alfa 4.3.1.1. Definicin de las variables de entrada Considerando las referencias bibliogrficas de las investigaciones encontradas desde el estado del arte, en relacin a la fibra fina de la alpaca, las instancias que se usarn en el modelo son:densidad, rizo, uniformidad, color, factor de confort, pureza, edad y sexo(ver Cuadro 4.1). Cuadro 4.1. Registro de Datos del Modelo Alfa. [ 4 ] Es un principio basado en gentica de poblaciones, donde para entrar en equilibrio es como tomar a un individuo de la poblacin, es tomar dos alelos al azar. En el caso de los marcadores moleculares se requiere que se encuentre en equilibrio (Oliva, y otros, 2004). 4.3.1.2. Definicin de las variables de salida Para la salida, en este modelo, la instancia denominada caracterstica de inters se define como un perfil comercial en una escala del 1 al 5. Fue construida coordinacin y consultas por diferentes expertos en la comercializacin de la fibra. Estas son: (1) Individuo para la exportacin color blanco de la fibra, la fibra extrafina y las hembras. Expresan un probable valor 4.3.1.2. Definicin de las variables de salida Para la salida, en este modelo, la instancia denominada caracterstica de inters se define como el conjunto de caractersticas afines que un perfil comercial en una escala del 1 al 5. Fue construida coordinacin y consultas por diferentes expertos en la comercializacin de Estas son: Individuo para la exportacin: domina como atributos principales, el color blanco de la fibra, la fibra extrafina y las hembras. Expresan un probable valor comercial y atractivo para el mercado. - 46 - Para la salida, en este modelo, la instancia denominada caracterstica conjunto de caractersticas afines que forman un perfil comercial en una escala del 1 al 5. Fue construida en coordinacin y consultas por diferentes expertos en la comercializacin de : domina como atributos principales, el color blanco de la fibra, la fibra extrafina y las hembras. Expresan un - 47 - (2) Individuo para la reproduccin: domina la fibra en sus diversos colores y tonalidades, con tendencia a la fibra fina. Un factor de confort debajo del 95% adjudica a un valor sostenible del fenotipo en la poblacin. (3) Individuo para venta local de fibra y carne: domina la pureza, el rizo y la densidad folicular, sin destacar la calidad de la fibra. Simboliza un valor conservador del fenotipo en la poblacin. (4) Individuo no apto para la reproduccin: domina sus caractersticas intrnsecas en valores no significativos para la produccin de fibra fina en alpacas. (5) Individuo propuesta al sacrificio: domina incertidumbre en su caracterizacin fenotpica que expresan valores no significativos y conflictos en la produccin de fibra fina de alpaca. 4.3.2. Modelo Beta 4.3.2.1. Definicin de las variables de entrada En este modelo se usaron los valores del genotipo, es decir, del marcador molecular. Los valores se obtienen de un proceso en laboratorio llamado secuenciamiento de micros-satlites de secuencia repetida. Para el efecto, se toman muestras de ADN por cada animal y se van colocando en forma aleatoria marcadores moleculares. El total de marcadores moleculares que se emplearon fueron de diez unidades por cada individuo. Estos marcadores pasan por un proceso de electroforesis y luego es ampliada la secuencia para formar la caracterizacin gentica que explica la presencia o ausencia del gen del color blanco de la fibra. De esta manera, una propiedad homocigoto es cuando los genes son recesivos y heterocigoto cuando estos son dominantes. El CONACS fue un organismo pblico descentralizado que existi desde 1992-2006 por D.S. N. 026-92-AG del Ministerio de Agricultura, cuya funcin principal fue de proteger y conservar las especies de - 48 - camlidos sudamericanos en el Per; tena entre sus actividades la certificacin de caractersticas heredadas del progenitor, demostrando la pureza de sangre del animal, llamndolos Pedigrs cuando estos animales cumplan diversos requisitos hechos en laboratorio.Es altamente probable que un animal homocigoto tiende a ser no pedigr, debido que poseen genes recesivos y, por tanto, no pertenecen a la lnea directa de descendencia respecto a su progenitor(Gomez, y otros, 2000). Tambin el color blanco de la fibra es sinnimo de la presencia de finura en su espesor. Un escenario ideal es que los individuos sean heterocigotos y pedigrs, con presencia del color blanco en la fibra y relacionados con los marcadores moleculares y que, a su vez, estn contenidos con los genes de inters publicados en la NCBI. En el Cuadro 4.2se observa la coleccin de objetos que participan en el modelo beta y se fundamenta en la regla de asociacin, la cual se describe a continuacin: 4.3.3. Modelo Landa 4.3.3.1. Definicin de las variables de El modelo de datos se origina algortmico, pero adems se agregaron la edad del animal y la apreciacin comercial para entender la percepcin animal. En el Cuadro 4. Cuadro 4.2. Matriz del modelo de datos de beta. 4.3.3. Modelo Landa 4.3.3.1. Definicin de las variables de entrada El modelo de datos se origina de las variables de los otros modelos , pero adems se agregaron la edad del animal y la apreciacin comercial para entender la percepcin del experto al momento de pretender una calificacin al l Cuadro 4.3 se explica estas variables de entradas: - 49 - Cuadro 4.2. Matriz del modelo de datos de beta. las variables de los otros modelos del motor , pero adems se agregaron la edad del animal y la apreciacin comercial al momento de pretender una calificacin al 4.3.3.2. Definicin de las variables de salida La variable de en una escala de seis tipos (ver Figura 4.5) individuo, sugiriendo una accin. Para construir la escala, primeramente se literatura, no encontrando alguna metodologa comn que permita evaluar individuos segn su fenotipo y genotipo, por tanto, se discusiones entre los expertos y personas concluy la convergencia de tres variables y calidad de la fibra. calificacin, es decir de un estereotipo o tipo que perfila al animal de acuerdo a sus caractersticas y oportunidad en el mercado, se consideraron hasta seis niveles, donde el nivel uno es menos importante y el seis ms. sigue: Cuadro 4.3. Matriz del modelo de datos en landa. 4.3.3.2. Definicin de las variables de salida variable de salida para este modelo es el nivel de calificacin, en una escala de seis tipos (ver Figura 4.5). Cada tipo dibuja un perfil comercial del sugiriendo una accin. Para construir la escala, primeramente se literatura, no encontrando alguna metodologa comn que permita evaluar individuos segn su fenotipo y genotipo, por tanto, se cruzaron opiniones los expertos y personas que toman decisin, de tal forma, que se concluy la convergencia de tres variables claves: pureza de la raza, valor econmico alidad de la fibra. La intensidad de estas variables dan como origen a un nivel de calificacin, es decir de un estereotipo o tipo que perfila al animal de acuerdo a sus caractersticas y oportunidad en el mercado, se consideraron hasta seis niveles, donde el nivel uno es menos importante y el seis ms. La descripcin de estos tipos - 50 - de calificacin, expresada perfil comercial del sugiriendo una accin. Para construir la escala, primeramente se analiz la literatura, no encontrando alguna metodologa comn que permita evaluar los cruzaron opiniones como que toman decisin, de tal forma, que se claves: pureza de la raza, valor econmico La intensidad de estas variables dan como origen a un nivel de calificacin, es decir de un estereotipo o tipo que perfila al animal de acuerdo a sus caractersticas y oportunidad en el mercado, se consideraron hasta seis niveles, donde La descripcin de estos tipos es como - 51 - Figura 4.5. Matriz del Nivel de Calificacin. El tipo I, no tiene ningn aporte al valor estratgico del animal. No es un individuo que sea recomendable para exportacin de fibra fina de alpaca, se recomienda efectuar nuevas estrategias en el manejo y seleccin de alpacas por varias generaciones. El tipo II, no siempre demuestra valor en la calidad de la fibra. No es un individuo para la exportacin de fibra fina de alpaca. Su fenotipo no demuestra suficiencia en el cumplimiento de las caractersticas que se exigen en el mercado internacional. El tipo III, demuestra una buena calidad de fibra pero sus individuos no estn certificados adecuadamente. Por tanto, su contribucin no es la esperada. Esta poblacin necesita de nuevas estrategias en el manejo y la inseminacin artificial para mejorar las especies, adems de mejorar el control del empadre y realizar un anlisis de parentesco masivo para su certificacin mientras sea posible. El tipo IV, el individuo presenta una raza pura sangre, pero su potencial gentico probablemente no sea lo esperado o simplemente no se han expresado - 52 - genticamente por el ambiente. No califica para la venta al exterior, pero resulta muy atractivo al mercado nacional. Tambin puede usarse como ejemplares para exposiciones de primera. El tipo V, el individuo en este escenario, por lo general, se caracteriza por su resaltante calidad de fibra fina y est muy bien certificado, conociendo as su origen. La poblacin presenta excelentes oportunidades para apuntalar en el mercado internacional. Esta casta puede ser controlada en generaciones futuras. El tipo VI, el individuo est perfectamente controlado, est certificado como pura sangre y la calidad de fibra fina es casi segura en una siguiente generacin. Los efectos de los fenmenos ocurridos en la genmica poblacional no son frecuentes y de menor impacto. El ejemplar es ideal para ventas estratgicas en el mercado internacional y para una reproduccin selectiva. 4.4. Preparacin de los Datos Una vez estructurado los datos que participan en el modelo, estas variables pasaron por un proceso de limpiezapara descubrir comportamientos inadecuados y cualquier otro ruido, como son: entropa, outliers, redundancia, nulos. Mediante el uso de las herramientas se logr liberar las variables de estos problemas, limpiando y balanceando los datos. Tambin se homolog la informacin, discreteando algunas veces y otras numerando. Por ejemplo, para el modelo Alfa, se analiz el comportamiento de las variables que participan, respecto al ruido existente, encontrndose desviaciones en los datos como son los outliers y los registros nulos. Tambin se discretearon las variables nominales en las entradas y se numer para las variables de salida. Este procedimiento evita cualquier sesgo en la interpretacin de los datos. Un aspecto importante es el anlisis de la entropa de los datos, esto quiere decir, qu tanta informacin aporta la variable en el modelo, encontrndose niveles aceptables en los datos para encaminar un proceso de clasificacin. - 53 - En la Figura 4.6, se puede notar histogramas de las variables utilizadas en el modelo Alfa. Ah se aprecia la diferencia de la moda de los elementos, es as que el tamao de la distribucin de datos entre los valores de la variable determina un discriminante, haciendo posible diferenciarlos. Se observa con cuidado que la variable Sexo, la barra con el valor hembras, se distingue entre la barradel valor machos, lo cual permite tomar una decisin rpida y justifica su utilidad para su clasificacin en el modelo. Sin embargo, en el grfico no se han balanceado los datos, esto significa que es necesario homologar los tamaos de las frecuencias para ganar comprensin en el anlisis. Figura 4.6. Progreso del Anlisis de Datos. 4.5. Modelado Para alcanzar un mejor rendimiento, se consider la informacin de la fase de sntesis del UCD para rescatar los requerimientos y estilos de los stakeholders y agregarlo en los lineamientos del diseo del artefacto, as como para alcanzar un mejor nivel de detalle en cuanto al uso del modelo algortmico, haciendo del look and feeling del artefacto un modo de concepcin. En la estrategia del diseo se utiliz las redes neuronales artificiales y las reglas de asociacin como tcnicas para articular los modelos alfa, beta y landa. A continuacin se pasa a describir su topologa como elemento de diseo: Sexo Color Finura Uniformidad Rizo Densidad Factor de Confort - 54 - 4.5.1. Modelo Alfa 4.5.1.1. Descripcin y alcance del modelo alfa El modelo alfa tiene como objetivo descubrir las propiedades fsicas de las alpacas a partir de un perfil comercial que se refleja en cinco posibles estados. En la prctica, es como descubrir los patrones fenotpicos y clasificarlos segn la perspectiva del vendedor. Al determinar una clasificacin, se puede entender qu tanto aporta el animal en trminos de rentabilidad, debido a la presencia de la fibra fina en su fenotipo. La arquitectura utilizada es una red neuronal del tipo perceptrn multicapa supervisada. El modelo no busca patrones socio-econmicos que se encuentren ligados a la produccin o rentabilidad. 4.5.1.2. Topologa de la red Para definir la topologa es una red de Perceptrn Multicapa fue necesario investigar cmo se comporta sta frente a diferentes configuraciones, tales como: nmero de capas ocultas, error cuadrtico y tipo de funcin de activacin. Se realizaron diferentes ensayos para crear la topologa, para ello se analizaron corridas utilizando diferentes niveles de capas ocultas, as como de un nmero de neuronas para encontrar el mejor desempeo. En el estudio se pudo notarque al trabajar con cinco neuronas en una capa ocultase consigui un mejor rendimientofrente a otros ensayos con configuraciones distintas. Se pudo apreciar que la evolucin del aprendizaje dejaba de ser eficaz cuando se incrementaba niveles en las capas ocultas, obteniendo puntos de saturacin (off-set) que impidieron mejorar los ptimos locales. Por lo contrario, cuando se us una sola capa oculta, la variacin de los resultados alcanzun error cuadrtico menor. En consecuencia, la topologa final y que fue aceptada por los expertos corresponde a una red de 9 neuronas de entradas, una capa intermedia con cinco neuronas y, finalmente, una neurona de salida. Se tom en cuenta la funcin sigmoide como elemento de activacin en la red neuronal (ver Figura 4.7). - 55 - Figura 4.7. Topologa del Modelo Alfa. 4.5.1.3. Pruebas Se realizaron pruebas para medir el rendimiento en funcin a su error cuadrtico que devuelve cada topologa. En la fase de entrenamiento se trabaj con una muestra del 30% de los datos, consiguiendo un error menor en la configuracin de una capa intermedia y cinco neuronas. Para otras configuraciones que implican mayor nmero de capas intermedias el valor del error era creciente, por lo que se descart en la presentacin de los datos. En la fase de test para el reconocimiento se utiliz el 70% de los datos, obteniendo resultados tal como se indica en el cuadro (ver Figura 4.8 y Cuadro 4.4): Cuadro 4.4 Matriz de la definicin de la topologa de la red. - 56 - Figura 4.8. Matriz de definicin de la topologa de la red. 4.5.2. Modelo Beta 4.5.2.1. Descripcin y alcance del Modelo Beta El objetivo del modelo beta es obtener informacin relacionada entre la gentica del animal y el color blanco de la fibra. De tal manera, que se pueda dimensionar la validez de la expresin del fenotipo y decidir la presencia o ausencia de la fibra fina. Su principal limitacin es que se trabaj con un grupo reducido de reglas de asociacin debido a que no existen ms trabajos sobre ello y, por tanto, la experiencia recibida apunt a un nmero finito de reglas. 4.5.2.2. Formacin de las Reglas de Asociacin Los expertos fueron consultados sobre las diferentes reglas que se hallaron viables para descubrir vinculaciones que contribuyan en determinar el objeto color blanco como uno de los elementos de la coleccin. De ser as, se considera altamente probable que el contenido gentico corresponda al fenotipo presente en el animal y que, por tanto, su descendencia herede las caractersticas de fibra fina en generaciones posteriores. Todos los supuestos fueron consultados y revisados en la realidad a travs de ensayo-error con los expertos en gentica, y as definir sus posibles relaciones. No existen experiencias anteriores, por lo que fue necesario la participacin de los conocimientos y experiencia de los expertos para sostener un segmento de reglas que se consideran tiles, aunque en la prctica se contabiliz un nmero exponencial. - 57 - Se utiliz la regla de asociacin con el algoritmo A priori. En las corridas se estabiliz cuando su soporte mnimo era igual a 0.01, la mtrica de 0.09 y un delta de 0.05. La configuracin de sus parmetros dependi de las pruebas de ensayo- error. Las reglas de asociacin, que fueron definidas en el Cuadro 4.3, ahora se presentan siguiendo la estructura lgica como sigue a continuacin: Regla 1: Homocigoto |y| Pedigr |Entonces| No Color Blanco Regla 2: Homocigoto |y| No Pedigr |Entonces| No Color Blanco Regla 3: Homocigoto |y| Pedigr |Entonces| Color Indefinido Regla 4: Heterocigoto |y| Pedigr |Entonces| Color Blanco Regla 5: Heterocigoto |y| No Pedigr |Entonces| Color Blanco Regla 6: Color Blanco |y| Alelo A=X |y| Alelo B=X |Entonces| Heterocigoto Entre este conjunto, se destaca la regla 4, como aquella que esta relacionada directamente con la relacin fenotipo-genotipo y por ende del valor comercial que es reflejado mediante los patrones en la escala de calificacin. 4.5.3. Modelo Landa 4.5.3.1. Descripcin y alcance del Modelo Landa El objetivo principal del modelo landa es conseguir la calificacin individual de la alpaca, la cual se basa en tipos. Con esta parte se concluye el trabajo del motor algortmico que, finalmente, tiene como expectativa asignar un valor a la alpaca en relacin a su contenido fsico y gentico. La mayor limitacin es la transferencia del error de la red. 4.5.3.2. Topologa de la red Se utiliz una red de Perceptrn Multicapa como herramienta para el manejo de los patrones de datos. Se apreci que la funcin de la red se comport mejor cuando se logr una configuracin de 6 neuronas de entradas, una capa intermedia de cinco neuronas y una neurona de salida (ver Figura 4.9), alcanzando - 58 - resultados ms atractivos. Se pudo observar que cuando se increment el nmero de capas intermedias, el error cuadrtico tambin aument, haciendo menos probable su uso. La funcin de activacin utilizada fue la sigmoidea, al igual que en el modelo alfa, lo cual contribuy al logro de una curva de aprendizaje ms corta. Figura 4.9. Topologa del Modelo Landa. 4.5.3.3. Pruebas Para la fase de entrenamiento, se muestre el 30% de los datos, el error cuadrticoconseguido se considera aceptable, llegando hasta al 4% para una configuracin de una capa intermedio y cinco neuronas. En la fase de test(reconocimiento) se utiliz una muestra del 70% de los datos, obteniendo un error - 59 - del 4%. Estos resultados fueron analizados en la realidad, observando un reconocimiento positivo entre los expertos (ver Figura 4.10 y Cuadro 4.5). Otras configuraciones en el test se utilizaron sin mayor inters, debido a la brecha de los errores cuadrticos que se iban develando. Cuadro 4.5 Matriz de la topologa en el modelo landa. Figura 4.10. Matriz de la topologa de la red landa. 4.6. Evaluacin Se realizaron pruebas unitarias por separado en cada modelo, observando que se obtuvo un promedio de 0.346 de error. Estas pruebas no solo midieron el error sino la consistencia de los patrones, los cuales se confirmaron con expertos distintos. Finalmente, se realizaron pruebas integrales, utilizando al modelo landa, como elemento integrador. Estas pruebas miden bsicamente la integridad del uso de las herramientas informticas para la aplicacin en el modelo. - 60 - 4.7. Despliegue El artefacto y los modelos ya entrenados fueron implementados en computadores, inmediatamente, en campo, se desarroll los primeros ensayos experimentales.En el captulo del caso de estudio se describe el proceso de la implementacin de este artefacto, mediante la aplicacin del experimento. 4.8. Especificaciones de Hardware y Software Este trabajo de investigacin necesit correr en un sistema de Windows Server 2003, en donde se instal la base de datos MS-SQL 2008 (versin demo) y su componente AnalysisServices. Tanto para el entrenamiento como para el reconocimiento se utiliz el plug- in, que est publicado en el portal de Microsoft, los complementos para Excel 2007 (versin demo), llamado DataMining. Tambin se descarg del portal de la Universidad de Waikato de Nueva Zelanda, la versin libre del Weka versin 3.7.0, aadiendo el JVM de Java. Para las corridas de las pruebas se utiliz una computadora core 2 duo, marca Intel con 2 Gb. de memoria RAM y un espacio potencial de uso de aproximadamente 3 Gb. entre almacenamiento por instalacin y carga de datos. - 61 - CAPTULO V CASO DE ESTUDIO Este captulo trata del proceso de entrenamiento en los diferentes modelos, se explica la evolucin del aprendizaje y la eficiencia del reconocimiento utilizando la matriz de confusin. Finalmente, se determina los mecanismos en la gestin de errores que produce el motor algortmico. 5.1. Preparacin de los Datos Los diferentes modelos fueron tratados,en primer lugar, con un riguroso pre- procesamientoque busceliminar cualquier ruido en el modelo de datos, teniendo cuidado de la presencia de registros hurfanos. Fue importante prestar atencin a los outliers, para lo cual se redujeron valores extremos, que en este estudio es posible aplicar estabilizando con ello el modelo de datos, los cuales fueron excluidos en el peor de los casos. Otro aspecto importante es que se balancearon los datospara evitar un sesgo que pueda impactar en los resultados y, adems, se haga viable la corrida en el software que aplican estos modelos de clasificacin, agregando a ello la normalizacin de los datos. 5.1.1. Patrones de Datos En la informacin encontrada se observ diferentes estructuras del mundo realque revela ciertas conductas en la expresin de los caracteres fsicos, como consecuencia del medio ambiente y la evidencia encontrada en el fenotipo del animal, con respecto a la fibrade alpaca.Posteriormente,corroborados con la literatura encontrada,se manifest un patrn de datos que fue apropiadamente representado. Este fenmeno, imita la manera como el experto adquiere el conocimiento para estos fines y que gracias a la experiencia de quienes realizan la actividad de clasificacin de la fibra en los cobertizosse pudo capitalizar la riquezadel conocimiento que se agrega tras-generacionalmente, que finalmente fue utilizado en - 62 - los modelos de la arquitectura del motor algortmico. Adems, se agregaron otros conocimientos en los patrones que son persistentes en la poblacin, como son las mutaciones y migraciones, que se suman de las diversas experiencias en el tiempo. 5.2. Modelado 5.2.1. Modelo Alfa 5.2.1.1. Ciclo de Aprendizaje Se agregaron un nmero considerable de ejemplos que explican la formacin de los patrones a reconocer. Cada ejemplo tena correspondencia biunvoca con uno de los estados de salida a reconocer, basados en el comportamiento del fenotipo. El reto mayor es hacer que el modelo aprenda, para ello se entren a la red con ciclos variados para encontrar el punto de evolucin del aprendizaje, donde fue complicado determinar los constructos adecuados, sin embargo,por ensayo-error se hizo posible afinar los parmetros para conseguir resultados que vayan acorde con la realidad, tal como se ve en el Cuadro 5.1. Cuadro 5.1. Ciclo de aprendizaje del modelo alfa. Sise observa en la matriz con detenimiento, se puede confirmar que la red neuronal artificial aprende discretamente entre tramos de pocas - 63 - relativamente amplias, consiguiendo estabilizarla desde el ciclo 1100, donde senota que a partir de este puntoel aporte de aprendizaje es mnimo hasta la poca 2100, en donde deja de aprender(ver el grfico 5.1). Figura 5.1. Evolucin del aprendizaje en el modelo alfa. 5.2.1.2. Tabla de Contingencia. El error cuadrtico es un indicador que ayuda a entender el grado de optimizacin logrado, pero no garantiza que exista una ocurrencia de aciertos entre los ejemplos entregados al modelo. Cuando se ejecut la matriz de confusin sobre el modelo de datos del entrenamiento, se pudo notar que la diagonal resultante tiende al 100%, eso explica que los aciertos del modelo son altamente probables, por tanto, existe gran confiabilidad en la salida de los datos(ver Cuadro 5.2)(mayor detalle vea Anexo F). La diferencia del porcentaje est repetida en el resto de la matriz, lo que significa que existen valores que muestran un falso positivo o falso negativo, descartando esta posibilidad. - 64 - Cuadro 5.2. Tabla de Contingencia del Modelo Alfa. 5.2.1.3. Instancias de Pruebas de Entrenamiento y Validacin Durante el entrenamiento se pudo apreciar que la red neuronal artificial pudo aprender los valores expresados segn las categoras de la clase predictiva. La matriz de confusin pudo confirmar que los eventos de la clase predictiva, como Individuo de Exportacin (1) y Individuo propuesto a sacrificio (5), no llegan a aprender completamente. Para el primer caso, existe un 90% de aciertos lo cual existe un margen mnimo pero probable de que no lo reconozca. Para el segundo caso, el porcentaje de aciertos asciende a 30%, lo que es ms probable no reconozca al mismo. Posiblemente, la estructuracin de los ejemplos se asemeja a otros patrones, por tanto, no son muy reconocidos. Cuando se alter la estructura de los ejemplos para alinear a un porcentaje viable, estos tuvieron impacto en el resto de los elementos reconocidos, haciendo la matriz poco deseable, ya que en su forma general no satisfaca a los requerimientos buscados. Esta situacin fue compensadaen el proceso de juicio de expertos, en donde cada valor publicado era analizado para ratificar o desvirtuar el mismo. - 65 - 5.2.2. Modelo Beta 5.2.2.1. Criterios de Asociacin Vinculante Es importante conocer, en primer lugar, si los resultados del geneotipeado se asocian a una poblacin homocigota o heterocigota. Esto nos explica, en cierto modo, la relacin de la diversidad gentica frente a los atributos claves de color y pureza del animal. En este trabajo de investigacin se busca validar los caracteres dominantes del fenotipoy evidenciar las relaciones que involucren la informacin del genotipo, utilizada desde aqu. Sin embargo, existen casos, en algunas comunidades andinas, donde sus animales recibieron una certificacin de pureza, pero su fenotipo no revelms de lo esperado. A ello se suma los efectos de las fuerzas genmicas, que probablemente sean crticas en el desarrollo para conservar la sostenibilidad en la poblacin. Esta situacin fue corregidatomando en cuenta una mayor atencin en la calidad de los datos, lo cual se puso mayor rigurosidad para evitar ingresos no coherentes o con falsos positivos. La regla principal es que si el individuo es heterocigoto, pedigr y de color de fibra blanca,entonces se infiere que su contribucin a la fibra fina es importante y que posiblemente puede expresarse en el tiempo. Pero esta lgica puede cambiar, debido a que la regla de asociacin puede establecer un nuevo giro, distinto al propuesto arriba. 5.2.2.2. Criterios de Asociacin al Gen de Inters Se sabe, segn la NCBI, que el gen melacortin-1 est asociado al color de la fibra; para constatar que existe alguna afinidad con este gen, no se aplic un algoritmo o modelo adicionalporque es comparado segn los resultados lanzados en funcin a los pares de bases,haciendo que el campo Evaluacin del gen de inters se convierta en 1 si los tamaos de los pares de bases se acercan al mismo. - 66 - 5.2.3. Modelo Landa 5.2.3.1. Ciclo de Aprendizaje En este modelo el aprendizaje fue complicado al definir la salida deseable, frente a los hallazgos concretos para determinar un reconocimiento de calidad. Los ejemplos tuvieron que modificarse en repetidas oportunidades para conseguir la optimizacin. Sin embargo, basado en el estado del arte y por la experiencia de los expertos, se form la matriz del modelo de datos para el entrenamiento. En el entrenamiento se pudo notar que los valores empeoraban por algn punto del ciclo de aprendizaje, luego se reduca hasta conseguir un valor estable, tal como se observa en la poca 1700, que despus poco a poco dejaron de aprender, hacindolo ciertamente viable(verCuadro 5.3). Cuadro 5.3. Ciclo de aprendizaje del modelo landa. En el Figura5.2 se observa lo indicado, lo cual fue importante, luego de comparar con los resultados obtenidos en la matriz de confusin. - 67 - Figura 5.2. Evolucin del aprendizaje en el modelo landa. 5.2.3.2. Tabla de Contingencia. En la evaluacin del modelo se apreci que, a pesar de contar un error cuadrtico alrededor del 3%, la ocurrencia de aciertos no fue lo mejor. La matriz de confusin no puede resolver con certeza el estado 3 y 6. Probablemente, se deba a que los ejemplos no traducen adecuadamente ciertos fenmenos de la realidad, dejando un margen de ineficiencia que fue absuelta por los dictmenes de los expertos.La continuidad de la retroalimentacin y la profundidad del anlisis ayudaron a obtener un consenso en los resultados. Aunque no es un modelo con optimizacin mxima, pues demostr que se alcanz con la expectativa final en el reconocimiento(ver Cuadro 5.4)(mayor detalle vea Anexo G). - 68 - Cuadro5.4. Tabla de Contingencia del Modelo Landa. 5.2.3.3. Instancias de Pruebas de Entrenamiento y Validacin En el entrenamiento, segn matriz de confusin, se puede evidenciar que el tercer y sexto estado de la variable predictiva Tipo no son muy asertivos. El primero tiene un aproximado del 67% de aciertos, lo que se tiene un margen conservador de error, que en trminos generales tiene un reconocimiento con ruido pero aceptable. En el segundo caso es ms crtico, ya que no reconoce por qu, al igual que en el modelo alfa, la estructura de los ejemplos no es suficiente para reflejar el patrn de datos. Para suplir este problema se evala los resultados en funcin al juicio de expertos. 5.3. Evaluacin 5.3.1. Descripcin del Caso Sobre una muestra de 52 individuos de alpacas, tomados en un valle de Puno, en el distrito de Huatasani,se tomaron muestras de piel de la alpaca y extraccin del velln para su posterior medicin. Asimismo, se recogieron los datos del registro genealgico de la poblacin de alpaca en estudio, que fueron reutilizados para completar el llenado de los registros del modelo de datos del fenotipo de los individuos. Se pudo constatar que existe documentacin certificada sobre los animales que son identificados como pedigr. - 69 - Adems, se observ que existe empadre controlado, disminuyendo el riesgo de sesgo en el procesamiento. Las muestras de piel fueron llevadas al laboratorio de la Unidad de Biologa Molecular de la UPCH, para su amplificacin, secuenciamiento y geneotipeado de la mencionada muestra. Sobre la misma, se coloc alrededor de 10 marcadores genticos, ubicados estratgicamente en posiciones del cromosoma, a fin de encontrar relacin con los valores publicados en el gen de inters. El objetivo del caso es ejecutar el artefacto para determinar el nivel de calificacin que corresponde. Previo a esta corrida, no hay antecedentes documentados que mencionen algn alcance o restriccin del mismo. 5.3.2. Ejecucin del Caso En primer lugar, se procede a utilizar los datos entrenados para ser ejecutados en el modelo alfa. Lo que se busca es encontrar resultados que expresan el fenotipo dominante de la alpaca(ver Cuadro 5.5). Cuadro 5.5. Reconocimiento de patrones del modelo alfa. - 70 - Cada individuo tiene referenciado un valor de acuerdo a la escala de estados que maneja el atributo. Es en este momento en donde se puede apreciar qu caracterstica dominante se ha interpretado en razn a los patrones de datos que fue usado en el entrenamiento. Seguidamente, se analiza la informacin que se expidi en el laboratorio para el genotipo del animal. Esta informacin pasa por un proceso de transformacin la convierte a informacin til para su uso en el modelo beta. Utilizando el Weka se realizan los ajustes necesarios para identificar los atributos que se asocian al animal, que pueden o no estar relacionados con la fibra fina de alpaca. En las Figuras 5.3 y 5.4 se observa los resultados que se obtuvieron para este caso. No obstante, se relacionan los atributos que persisten en la muestra y luego los alelos y locus comprometidos que tienen asociados en la muestra. Esta asociacin es comparada con los valores publicados en la NCBI, aadiendo un valor a la columna, si hay o no presencia. Mediante un proceso de transformacin, que implica la valoracin de pesos de acuerdo a la escala definida para este modelo beta, se lograron encontrar los valores de las variables de atributos asociados y la evaluacin del gen de inters (ver Cuadro 5.6). Cuadro 5.6. Presentacin del modelo de datos de beta. - 71 - Figura5.3. Resultados del modelo beta primera parte. Figura5.4. Resultados del modelo beta segunda parte. Para el efecto, en la corrida del modelo se obtuvo un soporte mnimo igual a 0.098, la mtrica de 0.089 y un delta de 0.05 - 72 - Tanto los resultados del modelo alfa como los del beta son trasladados a la base de datos del modelo landa. Hasta el momento se ha podido identificar, en forma separada, qu caracterstica es dominante y si el gen del color juega un papel importante en el contenido gentico del estudio. En esta nueva iteracin lo que se busca es reconocer, ya con los atributos descubiertos, qu nivel de calificacin debe ponderarse individualmente, segn los patrones de datos registrados. En la Cuadro5.7 se observa cmo utilizando el AnalysisServices, el modelo previamente entrenado, se ha sugerido puntuaciones individuales, cuyo significado fue descrito en una seccin anterior. Cuadro 5.7. Reconocimiento de patrones del modelo landa. Para concluir con un resultado global desde el modelo de datos, ya procesado, se requiere mapear la informacin sobre un plano grfico que ayude a visualizar con rapidez en qu valor de la escala corresponde la poblacin de alpacas en trminos de puntuacin (ver Figura 5.5). Figura 5.3.3. Anlisis de los Resultados Como resultado de este proceso se puede notar que la poblacin de alpaca para este cobertizo corresponde al del Tipo I, lo que sugiere una poblacin con pocas posibilidades de exportacin. Probablemente,el verdadero valor debido a la influencia del ambiente antes, esta puntuacin es un snaps en el tiempo. Este ejercicio se manera la poblacin en sucesivas debe ayudar a establecer nuevas estrate 5.3.4.Descripcin de la experimentacin La experimentacin Cusco, Puno y Huancayo. En el departamento de Cusco, encuentra la localidad de Chaupihuasi 3,999.27 Km 2 . Su posicin geogrfica est comprendida a partir de las coordenadas 1430 y 1456 de latitud Sur y 7124 y 7139 de longitud Oeste. Figura 5.5. Mapeo de la puntuacin de la poblacin. . Anlisis de los Resultados Como resultado de este proceso se puede notar que la poblacin de alpaca corresponde al del Tipo I, lo que sugiere una poblacin con pocas s de exportacin. Probablemente,el genotipo no ha expresado su verdadero valor debido a la influencia del ambiente. Como ya se haba mencionado antes, esta puntuacin es un snapshot de la situacin actual, lo cual puede ir variando Este ejercicio se puede repetir muchas veces, calificando de esta manera la poblacin en sucesivas generaciones. El registro de estas calificaciones debe ayudar a establecer nuevas estrategias en el manejo de los individuos. scripcin de la experimentacin La experimentacin se realiz en los cobertizos de 3 departamentos del Per: Cusco, Puno y Huancayo. En el departamento de Cusco, provincia de Canchis, distrito de Marangan encuentra la localidad de Chaupihuasi (ver Figura 5.6), abarcando una superficie de . Su posicin geogrfica est comprendida a partir de las coordenadas 1430 y 1456 de latitud Sur y 7124 y 7139 de longitud Oeste. - 73 - Como resultado de este proceso se puede notar que la poblacin de alpaca corresponde al del Tipo I, lo que sugiere una poblacin con pocas genotipo no ha expresado su . Como ya se haba mencionado , lo cual puede ir variando calificando de esta egistro de estas calificaciones gias en el manejo de los individuos. en los cobertizos de 3 departamentos del Per: , distrito de Marangan, se abarcando una superficie de . Su posicin geogrfica est comprendida a partir de las coordenadas 1430 y 1456 de latitud Sur y 7124 y 7139 de longitud Oeste. A una altitud - 74 - promedio de 3,548 m.s.n.m. En este lugar se desarroll el segundo experimento del trabajo de investigacin. Figura 5.6. Vista del distrito deMarangan, provincia de Canchis. En el departamento de Puno, provincia de Melgar, distrito de Santa Rosa (ver Figura 5.7), se encuentra la localidad de Huaycuyo, que est situado a 134 Km. de Juliaca y a 177 Km. de Puno, est ubicado a 3,993 m.s.n.m. Aqu se trabaj el primer experimento para validar el artefacto. Figura 5.7. Vista del distrito de Santa Rosa, provincia de Melgar. El tercer experimento fue hecho en el departamento Huancayo (ver Figura 5.8) 3750 m.s.n.m., caracterizado de un ecosistema muy cerca a la Puna. El importante es el Mantaro. Figura En estos lugares Figura 5.9), en sus diferentes variedades, con la colaboracin de la Universi Particular Cayetano Heredia y el Instituto Nacional de Innovacin Agraria. Figura El tercer experimento fue hecho en el departamento de Junn, provincia de er Figura 5.8), en el distrito de Paccha, que se ubica aproximadamente caracterizado de un ecosistema muy cerca a la Puna. El importante es el Mantaro. Figura 5.8. Vista del distrito de Paccha, provincia de Huancayo. En estos lugares se experiment con alpacas de la raza huacaya y suri , en sus diferentes variedades, con la colaboracin de la Universi Particular Cayetano Heredia y el Instituto Nacional de Innovacin Agraria. Figura 5.9. Ejemplares mostrado desde un cobertizo. - 75 - de Junn, provincia de e ubica aproximadamente caracterizado de un ecosistema muy cerca a la Puna. El ro ms istrito de Paccha, provincia de Huancayo. con alpacas de la raza huacaya y suri (ver , en sus diferentes variedades, con la colaboracin de la Universidad Particular Cayetano Heredia y el Instituto Nacional de Innovacin Agraria. - 76 - 5.3.5. Tcnica de Muestreo La tcnica de muestreo utilizada fue el muestreo aleatorio al azar sin reposicin, para cada experimento tratado. La seleccin de los individuos de la muestra no mostr sesgo, de tal manera que cada uno tuvo la misma probabilidad de ser elegido. En los tres experimentos la poblacin de alpacas es finita y conocida, por tanto, el tamao de muestra se calcul de la siguiente manera: (N* Z 2 * p * q) n = ____________________ (i 2 * (N 1) + z 2 * p * q) Donde: N: Tamao de la poblacin n: Tamao necesario de la muestra z: Valor asociado al nivel de confianza estimado i: Error que se prev cometer p: Prevalencia esperada q: Valor complementario de 1-p Para cada cobertizo se utiliz esta tcnica para obtener el tamao de la muestra, considerando un escenario pesimista en el valor de prevalencia, en el cual se asigna 0.5. El procesamiento de la misma queda expresado en los siguientes resultados: a) Experimento I, el tamao de la muestra equivale a 78 individuos. b) Experimento II, el tamao de la muestra equivale a 71 individuos. c) Experimento III, el tamao de la muestra equivale a 52 individuos. 5.3.6.Procedimiento del Experimento 5.3.6.1. Objetivo El objeto de la experimentacin es demostrar que el artefacto es eficaz en sus resultados, comparndolos a otros mtodos actuales, de tal forma que deben ser similares. - 77 - 5.3.6.2. Mtodo Estadstico En este experimento se observa la existencia de informacin de ms de dos diferentes mtodos. Cada uno de ellos con escalas distintas pero relacionadas entre s. Estas caractersticas sugieren la utilizacin de la prueba de Friedman, el cual, a travs de un proceso de sumatorias, establece una probabilidad estadstica de que la hiptesis sea cierta (X 2 r = Sigmoideo Asinttico), que es comparado con el valor del nivel de significancia (). El mismo que es rechazado la hiptesis si > X 2 r. Es decir, los tratamientos confrontados no son similares. 5.3.6.3. Elementos de Comparacin A partir de la bsqueda de la informacin con el desarrollo de otros trabajos, no se evidencia un artefacto con caractersticas similares para efectuar la comparacin. As, se ha considerado como criterio tcnico el espesor de la fibra como punto de convergencia entre las observaciones realizadas por los expertos en el proceso de categorizacin de la fibra, basados en la NTP 231.300:2004. Tambin, con la aplicacin de tecnologa de equipos, llamado Lser-Scan, que analiza la estructura de la fibra bajo estndares internacionales (OFDA-100), entre ellas el espesor. Finalmente, el artefacto propuesto se bas en el contexto de la Norma Tcnica Peruana citada, pero adems fue transformada a una escala particular. Ya que ahora los elementos de comparacin arrojan resultados diferentes, fue necesario generar un artificio estadstico para estandarizar los valores y hacerlos comparables en los ensayos experimentales. 5.3.6.4. Mecnica Operativa Durante la toma de muestra de vellones y de piel se pas a escoger uno a uno los individuos en forma aleatoria y sin reposicin, los que formaron parte de los experimentos. Para lo cual, el tcnico, por observacin,efectu una votacin del aspecto de la fibra de la alpaca, en la escala que la NTP 231.300 regula. Tambin emiti una opinin de la apreciacin comercial del individuo. La colecta de estos datos form el tratamiento por observacin. - 78 - La siguiente parte aparece a partir de la actividad anterior, donde las muestras de la fibra fueron enviadas a laboratorios para su procesamiento, con el equipo clasificador llamado Laser-Scan, en el cual se us el estndar del OFDA-100, y siempre manteniendo el contexto de la norma tcnica peruana para convertir la informacin resultante. El ltimo tratamiento fue obtenido por el artefacto de la investigacin, considerando al espesor de la fibra y otras variables de orden fenotpico y gentico, ya descritos en el trayecto de este documento. Todos tenan escalas diferentes, pero fueron normalizadas para su procesamiento posterior en el SPSS. 5.3.7. Prueba de Friedman Para la prueba de Friedman se ha considerado trabajar con un nivel de significancia igual a = 0.05. Se utiliz el software estadstico SPSS versin 19 para el procesamiento de los experimentos programados, quedando los resultados como siguen: Durante la ejecucin de los experimentos, en el artefacto se corri los procesos del modelo independientemente al proceso estadstico usado, con la informacin recabada para estos fines y que forma parte de la misma fuente utilizada para todos los tratamientos. - 79 - Experimento I: Localidad de Huaycuyo - Puno Rangos Rango promedio Tratamiento por Observaciones 2,05 Tratamiento por Laser-Scan 1,86 Tratamiento por Artefacto 2,09 Estadsticos de contraste a N 78 Chi-cuadrado 3,739 Gl 2 Sig. asintt. ,154 a. Prueba de Friedman Experimento II Localidad de Chaupihuasi - Cusco Rangos Rango promedio Tratamiento por Observaciones 1,92 Tratamiento por Laser-Scan 1,94 Tratamiento por Artefacto 2,13 - 80 - Estadsticos de contraste a N 71 Chi- cuadrado 3,102 gl 2 Sig. asintt. ,212 a. Prueba de Friedman Experimento III Localidad de Paccha - Huancayo Rangos Rango promedio Tratamiento por Observaciones 2,17 Tratamiento por Laser-Scan 2,01 Tratamiento por Artefacto 1,82 Estadsticos de contraste a N 52 Chi- cuadrado 4,935 gl 2 Sig. asintt. ,085 a. Prueba de Friedman 5.3.8. Anlisis e Interpretacin Como se puede apreciar, en todos los experimentos se apreci un valor de X 2 r > 0.05, lo que significa que los tratamientos utilizados en el experimento son similares y que no existen diferencias significativas entre s. - 81 - CAPTULO VI CONCLUSIONES Y TRABAJOS FUTUROS 6.1. Conclusiones a) Principal: 6.1.1. Se puede concluir que el artefacto tendr un efecto positivo en la metrizacin y medicin de los individuos. No obstante, se estima que el artefacto tiene una tendencia hacia la eficiencia, en cuanto a medir la potencialidad global del animal en relacin a la fibra fina, dado a los acertados reconocimientos de patrones obtenidos. Adicionalmente, ser de apoyo en la generacin deestrategias de conservacin, produccin y venta de los animales. 6.1.2. La utilidad en las variables de salidadestaca en la transformacin dela informacin y conocimiento en un objeto equiparable. Esto demuestra que el artefacto imita el proceso de seleccin y categorizacin de la fibra convenientemente desde la perspectivadel razonamiento del experto, lo que a largo plazo podr sumar nuevos conocimientos haciendo que el sistema enriquezca el proceso de reconocimiento de los patrones. 6.1.3. El trabajo de investigacin, a travs de los ensayos experimentales, pudo demostrar la simplicidad y eficiencia en encontrar respuestas cercanas a la realidad, convirtindose en una propuesta para su uso extensivo en el mercado nacional. 6.1.4. La informacin generada por el artefacto se transforma en un valor estratgico de informacin, pues representa una oportunidad de negocio que sirve principalmente para establecer estrategias en los ciclos de reproduccin o seleccin de animales, de tal manera que entre generaciones sucesivas se pueda predecirla existencia de las capacidades fenotpicas y genotpicas del individuo en el cobertizo. Esto empuja a que el modelo otorgue una ventaja competitiva, ya que podr diferenciar su - 82 - produccin frentea la competencia y tomar decisiones ms efectivas a partir del historial que genere el artefacto. 6.1.5.Este artefacto dispone de un alto aporte como complemento de la NTP 231.300:2004, debiendo generar discusin entre la comunidad textil para el lanzamiento de un marco de referencia nacional para su comercializacin, siendo til en la gestin de las transacciones de venta y compra de alpacas para el mercado interno o externo. 6.2. Trabajos Futuros 6.2.1Este trabajo de investigacin no ha cubierto completamente los fenmenos de lagenmica poblacional en la calificacindebido a que los patrones estn diseados para calificar y no para identificar problemas sobre las fuerzas evolutivas que impacta en la poblacin.Se recomienda construir modelos que midan el impacto en la calificacin. 6.2.2. El trabajo tampoco cubre la posibilidad de agregar nuevos patrones de datos en el caso que se vayan descubriendo nuevas referencias genticas y que afecta en las formas de procesar estos patrones en el modelo landa. Se recomienda definir un nuevo modelo que asocie elementos con mltiples marcadores moleculares. - 83 - BIBLIOGRAFA AldridgeSusan, El Hilo de la Vida : De los genes a la ingeniera gentica [Libro]. - Cambridge :ThePressSyndicate of theUniversity of Cambridge, 1996. - Vol. 1 : pgs. 15-16. Amit Raphael y ZottChristoph, VALUE CREATION IN E-BUSINESS [Publicacinperidica]. - Pennsylvania : Strategic Management Journal, 2001. - 22 : Vol. 1. - pgs. 493-520. Aranguren Jos y Jordania Jordy, Utilizacin de Marcadores de ADN (Micro-satlites) en Poblaciones de Animales Domsticos en Extincin [Publicacin peridica]. - Barcelona : [s.n.], 2001. - 1 : Vol. 1. Aylan-Parker J. y McGregor B.A.,Optimising sampling techniques and estimating sampling variance of fleece quality attributes in alpacas [Publicacinperidica]. - Attwood : Small Ruminant Research, 2001. - 1 : Vol. 1. Barahona Ana y Piero Daniel, GENTICA: LA CONTINUIDAD DE LA VIDA [Libro]. - Mexico D.F. : Fondo de Cultura Econmica, 1994. - Primera : Vol. 1. - ISBN 968-16-4534- 0. Baxter B.P., Raw-wool Metrology: Recent Developments and Future Directions [Publicacinperidica]. - Wellingthon : Proceedings Wool Industry Science & Technology Conference, 2002. - 1 : Vol. 1. BernackiMariusz y WodarczykPrzemyslaw, Principles of training multi-layer neural network using backpropagation [En lnea]. - 09 de 2004. - http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html. Bustamante Ana V. [y otros], Anlisis de diversidad gentica en tres poblaciones de llamas (Lama glama) del noroeste argentino [Publicacin peridica]. - Santiago : Revista Chilena de Historia Natural, 2006. - 2 : Vol. 79. - pgs. 175-184. Bustinza V. La Alpaca, conocimiento del gran potencial andino [Publicacin peridica]. - Puno : Secciones de Publicaciones UNA-Puno, 2001. - 11-24, 13-32 : Vol. Primera Edicin. Calvet R., Pastor J.M. y Romero J.L., Frecuencia de los antgenos eritrocitarios en la poblacin de cantabria [Publicacin peridica] // IV Jornada de Anuales Sociedad Espaola de Medicina Legal y Forense. - Cdiz : Servicio de Publicaciones de la Universidad de Cdiz, 1990. - 1 : Vol. 1. - pgs. 303-309. Chapman Pete [y otros], CRISP-DM 1.0 : Guide, StepbyStep Data Mining [Libro]. - Londres, Nueva York y Brucelas : CRISP-DM Consortium, 2000. - Vol. 1 : pgs. 9-13. - 84 - Chesbrough Henry W. y Appleyard Melissa M., Open Innovation and Strategy [Publicacinperidica]. - California : CALIFORNIA MANAGEMENT REVIEW, 2007. - 1 : Vol. 50. Cook L.M., Gentica de Poblaciones [Libro]. - Madrid : Omega, 1979. - Vol. 1 : pg. 1. Cooper Mark [y otros], The GP Problem: Quantifying Gene-to-Phenotype Relationships [Publicacinperidica]. - Queensland : In Silicio Biology, 2002. - 13 : Vol. 2. Estrategias para el Mejoramiento de Camlidos Sudamericanos [Conferencia] // Simposium Internacional de Biotecnologa Aplicada en Camlidos Sudamericanos, Congreso Nacional de Reproduccin y Mejoramiento Gentico de Camlidos Sudamericanos. - Bariloche : Universidad Nacional de Huancavelica, Facultad de Ciencias de Ingeniera, Escuela Acadmico Profesional de Zootecnia. Huancavelica. PE. 2007. s.p., 2007. - Vol. 11. - pgs. 20-23. FAO PROCEEDINGS OF THE SYMPOSIUM ON NATURAL FIBRES [Conferencia] // Discover Natural Fibres 2009. - Roma : Common Fund for Commodities, 2009. - Vol. 56. Feeley N.L. y Munyard K.A.,Characterisation of the melanocortin-1 receptor gene in alpaca and identification of possible markers associated with phenotypic variations in colour [Publicacinperidica]. - Perth : Australian Journal of Experimental Agriculture, 2009. - 1 : Vol. 1. Frank Diana, Developing a Business Analytics Strategy [Publicacinperidica]. - Iselin :Enherent, 2010. - 1 : Vol. 1. Frank E.N. [y otros], Phenotypic and genetic description of fibre traits in South American domestic camelids [Publicacinperidica]. - Cordoba : Small Ruminant Research, 2005. - 1 : Vol. 1. Garca Alonso Rafael, Las Huellas de la Evolucin : Un historial al lmite del caos [Libro]. - Madrid : Publicaciones Digitales, 2008. - Vol. 1 : pgs. 386-389. Garcia V. Wilber y Leyva V. Victor, ndices genticos estimados para peso corporal en llamas [Publicacin peridica]. - Lima : Revista Inv. Veterinaria Peruana, 2007. - 1 : Vol. 18. Gomez Alberto, Briceo Ignacio y Umaa ngela, Marcadores moleculares del cromosoma-Y - perfiles genticos de identidad patrilineal [Publicacin peridica]. - Bogot : Publicaciones de la Pontificia Universidad Javeriana, 2000. - 1 : Vol. 1. Hilera Jos R. y MartinezVictor J., Redes Neuronales Artificiales [Libro]. - Madrid : RA- MA, 2000. - Vol. 1 : pgs. 9-10. - 85 - Holt Cameron Australian Alpaca FleeceIndustry [Libro]. - Canberra :Australian Alpaca Associationinc, 2006. - Vol. 1. Huancavelica Gobierno Regional VEINTE MAESTRAS EN CATEGORIZACIN Y CLASIFICACIN DE FIBRA DE ALPACA [En lnea]. - Abril de 2010. - Mayo de 2010. - http://www.regionhuancavelica.gob.pe/web/index.php?option=com_content&view=article&i d=1006:veinte-maestras-en-categorizacion-y-clasificacion-de-fibra-de- alpaca&catid=160:noticias-abril-2010&Itemid=196. HuiLui Ben,StatiscalGenomics : Linkage, mapping and analysis QTL [Libro]. - Florida : CRC press LLC, 1998. - Vol. 1 :pgs. 507-511. Indecopi CTN 055, Fibra de Alpaca del Velln. Definiciones, categorizacin, requisitos y rotulado [Informe]. - Lima : R. 6-2004-CRT-INDECOPI (2004-02-08), 2004. Iniesta Raquel, GuinElisabet y Moreno Vctor, Anlisis estadstico de polimorfismos genticos en estudios epidemiolgicos [Publicacin peridica]. - Barcelona : Gaceta Sanitaria, 2005. - 4 : Vol. 19. Iiguez L.C. [y otros], Fleece types, fiber characteristics and production system of an outstanding llama population from Southern Bolivia [Publicacinperidica]. - Madison : Small Ruminant Research, 1997. - 1 : Vol. 1. Julio Sastre Hctor, Descripcin, situacin actual y estrategias de conservacin de la raza bovina colombiana criolla casanare // Tesis Doctoral : Descripcin, situacin actual y estrategias de conservacin de la raza bovina colombiana criolla casanare. - Crdoba : Universidad de Crdoba, Facultad de Veterinaria, Departamento de Produccin Animal, 2003. - Vol. 1. Len-Velarde C.U. y Guerrero J., Improving quantity and quality of Alpaca fiber; using a simulation model for breeding strategies [Conferencia] // International Livestock Research Center, ILRI; International Potato Center, CIP. - Lima : 1, 2000. - Vol. 1. Lupton C.J., McColl A. y Stobart R.H., Fiber characteristics of the Huacaya Alpaca [Publicacinperidica]. - Texas : Small Ruminant Research, 2006. - 1 : Vol. 1. Marn E., Efecto del sexo sobre las caractersticas tecnolgicas y productivas de alpacas para su uso en la industria textil [Libro]. - Lima : UNALM, 2007. - Vol. I. Martn del Brio Bonifacio y Sanz Molina Alfredo, Redes Neuronales y Sistemas Difusos [Libro]. - Madrid :Alfaomega-RA-MA, 2002. - Vol. 1 : pgs. 26-28. - 86 - McGregor B.A., Production, attributes and relative value of alpaca fleeces in southern Australia and implications for industry development [Publicacinperidica]. - Attwood : Small Ruminant Research, 2005. - 1 : Vol. 1. Mitchell Dereck, Pymex.pe Portal del Comercio Exterior [En lnea]. - Andina, Enero de 2010. - Mayo de 2010. - http://www.pymex.pe/noticias/peru/3370-china-concentro-envios- de-fibra-y-prendas-de-alpaca-en-enero.html. Mohammad Meraj, The Road Map for Innovation Success [Publicacinperidica]. - Waltham : PRTM y Microsoft, 2007. - 1 : Vol. 1. Montes M. [y otros],QualityCharacteristics of huacaya alpaca fibreproduced in theperuvianandeanplateauregion oh huancavelica [Publicacin peridica] // SpanishJournal of AgriculturalResearch. - Huancavelica : Instituto Nacional de Investigacin y Tecnologa Agraria y Alimentaria (INIA), 2008. - 1 : Vol. 6. - pgs. 33-38. Mueller J.P., Estrategias para el mejoramiento de camlidos sudamericanos. Conferencia. [Conferencia] // Simposium Internacional de Biotecnologa Aplicada en Camlidos Sudamericanos; Congreso Nacional de Reproduccin y Mejoramiento Gentico de Camlidos Sudamericanos. - Bariloche : Universidad Nacional de Huancavelica, Facultad de Ciencias de Ingeniera, Escuela Acadmico Profesional de Zootecnia. Huancavelica. PE. 2007. s.p., 2007. - Vol. 11. - pgs. 20-23. Oliva Rafael [y otros],Gnetica Mdica [Libro]. - Barcelona-Espaa : Publicaciones y Ediciones de la Universidad de Barcelona, 2004. - Vol. III. Portela de Carvalho Claudio Guilherme [y otros],Selectionbasedondistancesfromideotype [Publicacin peridica]. - Vicosa :CropBreeding and AppliedBiotechnology, 2002. - 2 : Vol. 2. PROCAM PLAN ESTRATGICO NACIONAL DE CIENCIA, TECNOLOGA E INNOVACIN TECNOLGICA PARA LA COMPETITIVIDAD Y EL DESARROLLO HUMANO 2006-2021 [Informe]. - Lima : SYNACIT, 2007. Renieri C. [y otros], Programa de Mejoramiento Gentico en Camlidos Domsticos [Publicacin peridica]. - Cordoba : Archivo Latinoamericano de Produccin Animal, 2007. - 1 : Vol. 15. Rios Eliseo de los,Clasificacin de los Vellones de Alpaca [Entrevista]. - Lima : Correo Electrnico, 23 de Julio de 2009. Sarah Schmid,Tesis de Maestra: The value chain of alpaca fiber in Peru,an economic analysis [Libro]. - Zurich : Swiss Federal Institute of Technology Zurich, 2006. - Vol. 1. - 87 - Souza G.L., Sekaran Chandra y Kandaamy A., A Phenomic Algorithm for Reconstruction of Gene Networks [Publicacinperidica]. - Mangalore : World Academy of Science, Engineering and Technology, 2007. - 1 : Vol. 3. Vila Miranda Amparo,Machine Learning. - Granada-Espaa : Grupo de Investigacin de Base de Datos y Sistemas de Informacin Inteligente, 2001. - Vol. 1. W. Chan Kim y Mauborgne Rene, Value innovation: a leap into the blue ocean [Publicacinperidica]. - Harvard : JOURNAL OF BUSINESS STRATEGY, 2005. - 4 : Vol. 26. - pgs. 22-28. Weber Renee, van Kuijk Jasper y Boks Casper, User Centred Design for c [Publicacinperidica]. - Throndheim : International Journal of SustanaibleBehaviour, 2008. - 1 : Vol. 1. White T.L., Adams W.T. y Neale D.B., Forest Genetics [Libro]. - Cambridge : CABI Publishing, 2007. - Vol. 1 :pgs. 523-540. Wuliji T. [y otros],Production performance repeatability and heritability estimates for live weight, fleece weight and fiber characteristics of alpacas in New Zeland [Publicacinperidica]. - Nueva Zelanda : Small Rumiant, 2000. - Vol. I. - 88 - ANEXO A GLOSARIO DE TRMINOS ADN El componente qumico dentro del ncleo de una clula que lleva las instrucciones para elaborar los organismos vivientes. Alelo Una de las formas variantes de un gen en un locus o de un marcador particular en un cromosoma. Diferentes alelos de un gen producen variaciones en las caractersticas hereditarias tales como el color del cabello o el tipo de sangre. Fenotipo Rasgos o caractersticas visibles de un organismo, por ejemplo, el color del cabello, el peso o la presencia o ausencia de una enfermedad. Los rasgos fenotpicos no son necesariamente genticos. Gen La unidad fsica y funcional de la herencia, que se pasa de padres a hijos. Los genes estn compuestos por ADN y la mayora de ellos contiene la informacin para elaborar una protena especfica. Genotipo La identidad gentica de un individuo que no se muestra como caractersticas externas. Hereditario Transmitido a travs de los genes, de padres a hijos. ndice Textil Nominacin adjudicada a la escala de valores que determina un estado de calificacin que asocia entre el aspecto fsico y su contenido gentico. - 89 - Locus El lugar del cromosoma donde est localizado un gen especfico, es la direccin fsica del gen. El plural es "loci". Microsatlite Son pequeas regiones de ADN que contienen mltiples copias de secuencias repetitivas cortas y que se emplean como marcadores genticos para rastrear la herencia familiar o mapear enfermedades en el genoma. Marcador Tambin conocido como marcador gentico, es un segmento de ADN cuya herencia se puede rastrear. Un marcador puede ser un gen, o puede ser un segmento de ADN sin funcin conocida. Dado que los segmentos de ADN que se encuentran contiguos en un cromosoma tienden a heredarse juntos, los marcadores se usan a menudo como formas indirectas de rastrear el patrn hereditario de genes que no han sido an identificados, pero cuyas ubicaciones aproximadas se conocen. Mapa Gnico Mapa basado en las posiciones relativas de los genes en un cromosoma y de la distancia entre ellos. Marcador Gentico Un segmento de ADN con una ubicacin fsica identificable en un cromosoma y cuya herencia se puede rastrear. Un marcador puede ser un gen, o puede ser alguna seccin del ADN sin funcin conocida. Dado que los segmentos del ADN que se encuentran contiguos en un cromosoma tienden a heredarse juntos, los marcadores se utilizan a menudo como formas indirectas de rastrear el patrn hereditario de un gen que todava no ha sido identificado, pero cuya ubicacin aproximada se conoce. Polimorfismo Es la existencia de dos o ms alelos de un gen presentes en una poblacin, en una frecuencia significativa. - 90 - ANEXO B OFICIO N. 0861-2010-INIA-DIA/J - 91 - ANEXO C Constancia de participacin en el proyecto de investigacin Generacin de ncleos de alpacas reproductores de alta productividad basados en la seleccin asistida con marcadores genticos de ADN, financiado por el Programa de Ciencia y Tecnologa FYNCIT PIBAT 2007, en calidad de tesista. - 92 - ANEXO D Participacin en el II Congreso Peruano de Investigacin de Operaciones y de Sistemas, del 4-6 noviembre del 2010, en la UNSA-Arequipa, en calidad de ponente del trabajo titulado: Sistema Inteligente para expresar un nivel de calificacin en poblaciones de alpacas. - 93 - ANEXO E Universidad Nacional Mayor de San Marcos Unidad de Posgrado de la Facultad de Sistemas e Informtica Tesis de Investigacin para optar el grado de Magister Sistema Inteligente para calificar alpacas en funcin a su fibra fina Consolidado de la Lista de Cuestionario utilizando el Mtodo Delphi Nmero de Encuestados: 25 personas Item Preguntas Formuladas Respuestas Peso del Impacto Esperado 01 La fibra fina es un negocio representativo para el mercado nacional e internacional Respondidas: 25 1 02 Usted cree que se aprecia el valor de la alpaca utilizando metodologas conocidas Respondidas: 24 2 03 Es importante considerar el aspecto gentico del individuo para mejorar la percepcin de valor Respondidas: 25 1 04 Usted entiende que existe diferencia entre las razas de los individuos y los lugares de crianza Respondidas: 25 3 05 Conoce como interpretar esas diferencias Respondidas: 23 3 06 Si conociera una forma de medir cuantitativamente las alpacas, le ayudara a generar estrategias de mejora gentica Respondidas: 22 1 07 Usted cree que de tener una herramienta, para calificar individuos, sera de utilidad para hacer intercambio o negocios Respondidas: 25 1 08 La Norma Tcnica Peruana 201.300:2004, es un referente que se aplica en la actualidad para la seleccin y categorizacin de fibra Respondidas: 25 2 09 Usted piensa que la Norma Tcnica y el uso de tecnologas para tratar la fibra son suficientes para dar un indicador eficiente en la toma de decisin. Respondidas: 25 4 10 El conocimiento del personal de campo, utilizado en la seleccin y categorizacin de la fibra ayuda al aseguramiento de especies aptas para el negocio de la fibra. Respondidas: 25 2 11 Cree usted que el conocimiento que tiene el personal de campo es correctamente Respondidas: 25 1 - 94 - Item Preguntas Formuladas Respuestas Peso del Impacto Esperado gestionado para contribuir a los objetivos estratgicos. 12 Cul es el valor intrnseco que traera una herramienta que es capaz de identificar individuos potenciales en mejora de la rentabilidad Respondidas: 18 3 13 Sera posible estandarizar los criterios de comercio entre los productores, basado con la aplicacin de una herramienta. Respondidas: 20 4 14 Usted cree que la comunidad alpaquera est preparada utilizar una herramienta de calificacin de individuos como regla de negocio en la oferta y demanda. Respondidas: 23 5 15 De implementarse esta herramienta, usted cree que el gobierno, las universidades y el sector textil deberan ajustar su legislacin Respondidas: 25 5 Peso del Impacto: 1: Alto Impacto 2: Muy Importante Impacto 3: Importante Impacto 4: Impacto no Significativo 5: No hay Impacto - 95 - ANEXO F TABLA EXTENDIDA DE CONTINGENCIA DEL MODELO ALFA Error = (FP + FN) / (TOTAL) = 0.22221667 xito = (VP+VN) / (TOTAL) = 0.94445 Sensibilidad = (VP) / (VP +FN) = 0.8889 Especificidad = (VN) / (VN + FP) = 0.75 LEYENDA FP: Falso Positivo FN: Falso Negativo VP: Verdadero Positivo VN: Verdadero Negativo TOTAL: Suma de columnas involucradas VP FP 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0.6667 0 0 0 0 0 0.3333 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 FN VN - 96 - ANEXO G TABLA EXTENDIDA DE CONTINGENCIA DEL MODELO LANDA VP FP 0.9 0 0 0 0 0.1 1 0 0 0 0 0 0.9 0 0.1 0 0 0.1 1 0.6 0 0 0 0 0.3 FN VN Error = (FP + FN) / (TOTAL) = 0.04 xito = (VP+VN) / (TOTAL) = 0.96 Sensibilidad = (VP) / (VP +FN) = 0.96666667 Especificidad = (VN) / (VN + FP) = 0.95 LEYENDA FP: Falso Positivo FN: Falso Negativo VP: Verdadero Positivo VN: Verdadero Negativo TOTAL: Suma de columnas involucradas