QUIMIOMETRICOS INTRODUCCION El estudio de la estructura molecular de petrleos crudos ha sido muy importante en este campo de petroqumica durante los ltimos porque sus propiedades fsico-qumicas estn muy relacionados con su composicin y estructura qumica (Acevedo et al.2007: Zhang et al., 2009). Parmetros como viscosidad, gravedad api y anlisis SARA caracterizan los petrleos crudos y sus derivados (Speight, 2007). El anlisis SARA separa las muestras en saturados, aromticos, resinas y componentes de asfltenos a travs de la accin de n-alcanos solventes, tolueno y diclorometano y la interaccin entre el petrleo con una fase estacionaria, el anlisis SARA comienza con la precipitacin de asfltenos en n-alcano solventes como pentano o heptano. Subsecuentemente, el petrleo des asfaltado es separado por mtodos cromatgraficos y solventes de variada polaridad (ASTM-D2549, 1995; ASTM-D4124, 1997; ASTM-D2007, 2008). El solvente es removido a travs de evaporacin de cada fraccin eluida y el anlisis SARA es completado con la determinacin del peso de fracciones aisladas. El proceso completo toma un promedio de 2 das por muestra y durante el anlisis una gran cantidad de solventes no deseados al ambiente son usados, creando problemas de eliminacin (Hong-fu et al., 2006;kharrat, et al.,2007). El desarrollo de mtodos precisos y rpidos para anlisis se ha convertido en una necesidad urgente para controlar la calidad de los procesos de produccin, refinacin y transporte de petrleos crudos. Un gran numero de tcnicas analticas incluyendo liquido de alto desempeo cromatografico (HPLC), resonancia magntica nuclear (NMR), espectrometra de masa (MS), espectroscopia de fluorescencia, el espectroscopio raman e infrarrojo han sido ampliamente aplicados en el anlisis de hidrocarburos y sus derivados (bezarra de lira et al.; 2010; Borges and Acevedo, 2007; falla et al., 2006; molina et al.; 2010; mullins 2010; shi et al., 1999). Estas tcnicas han producido buenos resultados pero algunas de ellas son costosas y usualmente no disponibles en los laboratorios. El uso de reflexin total atenuada en zonas infrarrojo intermedio (ATR-MIR) es una alternativa prometedora para reemplazar mtodos tradicionales porque requiere tratamiento de muestra mnimo, la adquisicin de espectros toma pocos minutos y ofrece una repetibilidad aceptable en muestras liquidas (Chung et al., 2000; Orrego-ruiz et al., 2011. Por otro lado, el desarrollo de las llamadas tcnicas quimio mtricas multivariable aplicadas a la informacin espectroscopia ha permitido la determinacin de propiedades fsico-qumicas de muestras complejas. El anlisis de componentes principales (PCA) permite discriminantes de muestras a travs del anlisis de partitura y diagrama de carga (wold, 1995), mientras que la regresin por mininos cuadrados parciales (PLS), proporcionan
modelos para la prediccin de diferentes propiedades de informacin
espectroscopia (Ask et.,al, 2001); Satya et al., 2007). Motivado por esto, nosotros desarrollamos una metodologa para el anlisis SARA de los petrleos crudo de Colombia, basado en el uso combinado de FTIR-ATR y mtodos de calibracin multivariable. La precisin de los mtodos fue establecida evaluando el error de prediccin de la raz cuadrada promedio (RMSEP) y el error de calibracin de la raz cuadrada promedio (RMSEC) tambin como coeficiente de correlacin (R2). 2. Experimental 2.1 Muestras 50 crudos representativos de diferentes zonas de explotacin de petrleo colombianos fueron estudiados. El anlisis SARA convencional fue determinado por precipitacin y posterior cromatografa solido-liquido (mtodo estndar ASTM D-4124). La tabla 1 muestra resultados del anlisis SARA a travs del mtodo ASTM. Las muestras fueron divididas en 2 grupos dependiendo de su composicin de asfltenos y su viscosidad. 25 muestras de petrleo crudo con un rango de asfltenos entre 0,2% a 3,5% y baja viscosidad (lquidos) y un grupo de 25 muestras con 5,5 17,9% de asfltenos y naturaleza viscosa semisolida. 2.2 La adquisicin de espectro ATR-FTIR Espectros ATR-FTIR fueron obtenidos ( shimadzu, Ir-prestigespectrometer) como resultado de la acumulacin de 32 escneres con la velocidad del espejo interfermetro de 2,8mm/s, una resolucin 8cm-1 y un detector con control de temperatura que puede cubrir regiones de infrarrojo intermedio en el rango de 4000-650 cm-1. Adicionalmente nosotros usamos una celda ATR (pike, miracle) equipada con un diamante de cristal con un ndice de refraccin de reflejo simple de 2.4. La celda fue pre alineada al sistema ptico del equipo IR antes de tomar espectro. El ngulo de incidencia de la viga IR fue 45. Cada espectro fue convertido a ASCII para ser posteriormente procesado. 2.3 Anlisis de informacin El proceso de informacin espectroscopia obtenida incluyendo pretratamiento espectral,PCA,PLS, y las validaciones fueron realizadas con el software unscrambler 9.7. 3. Resultados y discusin 3.1 Anlisis espectral Con el fin de determinar los pretratamientos que hicieron la mejor correccin de los espectros, la divisin media estndar (RSD) fue calculada por 3 lneas caractersticas. El espectro original (fig. 1) fue normalizada por
rango y sometido al primer derivado (Norris derivation) para reducir la
superposicin de picos y evitar los problemas de base. En el espectro original las lneas mas intensas aparecen cerca de 3000cm-1: el tramo c-h en c-h2 a 2918 cm-1 y 2853 cm-1. Hay tambin lneas intensas a 1495 cm-1 y 1377 cm-1, otras lneas son encontradas a bajas frecuencias a pesar de asignaciones mas complejas como las lneas de deformacin de los aromticos c-h en el plano y fuera del plano (aske et, al. 2002) la seal observada a 2349cm-1 corresponde al co2 del ambiente, razn para no tomarlo en cuenta en procesos multivaribles. 3.2 Principales componentes del anlisis (PCA) Principales componentes dela anlisis de espectros corregido para los 2 grupos de crudo fue llevado a cabo para determinar valores atpicos adicionalmente a travs de PCA fue posible determinar zonas espectrales con variabilidad mas altas estas zonas fueron entonces asociadas a anlisis SARA a travs de PLS-R. Partituras parcelas de componentes principales pc1 y pc2 y grupo lquido y semi-solidos son mostrados en la fig.3 y 4. En la parte inferior izquierda de estas tablas aparece como cada PC explica x-diferencia en la fig.3 estos valores son 70 y 14% lo que significa que 84% de la diferencia total espectral es explicada con 2 primeros componentes principales. En la fig.4 estos valores son 54 y 25% lo cual es 79% de la diferencia total espectral. Por lo tanto eso permite establecer relaciones entre muestras de acuerdo a su proximidad en el plano PC1 Y PC2: mientras mas cerca tenga muestras pueden tener caractersticas similares. Con la aplicacin de hotelling T2 statisticellipse(fig.3), la tabla de puntos permite determinar cuales muestras son muy distintas o valores atpicos fuera del elipse, en el caso de muestras liquida (fig.3) la muestra 32 fue considerara como un valor atpico posiblemente porque tiene el % mas bajo de resina y asfltenos. Para la muestra semi-solidas a pesar del hecho que las muestras 25, 26,28 estn lejanas de los grupos restantes ellos estn dentro de la elipse y no pueden estar definidos como valores atpicos a pesar de que tienen diferente composicin. Dos tipos de valores atpicos pueden ser identificados en los procesos de calibracin. El primer tipo es una muestra que representa una composicin extrema relativa al recordatorio del conjunto de calibracin el segundo tipo de valor atpico es uno para el cual el valor estimado difiere de los valores de referencia por una cantidad estadsticamente significativa, dichos valores atpicos podran indicar un error en la medida de referencia, un error en la medida espectral, un error en la atribucin de la muestra o transcripcin del valor de referencia, o una falla de modelo ( Orrego-ruiz et al., 2011; standard method ASTM E-1655,2005). Un grafico e influencia (fig.5-6) permiten clasificar en detalle las muestras de cada grupo. De acuerdo al anlisis de la fig.5-6. Las muestras pueden ser atpicas (valores atpicos) y
peligroso (valores atpicos peligrosos), estos grficos dan una indicacin de
las muestras que deberan ser excluidas de la calibracin con el fin de obtener modelos con mejores parmetros estadsticos. Las muestras con diferencia residual altas (parte superior izquierda de la grafica) son definidas como probables valores atpicos, aquellos con alta influencia, i.e, aquellos que se extienden a la parte inferior derecha de la grafica influye lo que significa que ellos son los que mejor describen el modelo de prediccin las muestras que tienen alta influencia y alta diferencia residual son definidas como valores atpicos peligrosos queriendo decir que ellos no sern descritos por el modelo de confianza para la mayora de las muestras, por lo tanto ellos distorsionan el modelo de prediccin. En el caso de muestras liquidas (fig.5) la muestra 4 puede ser definida como un valor atpico potencial. Esta localizada en el tope derecho del grafico de influencia esto quiere decir, su espectro es muy diferente con respecto al resto de las muestras pero esta diferencia no influye en el crudo lquido. Su diferencia puede ser asociada con otras propiedades fsico-qumicas que no fueron consideraras en este trabajo. La muestra 7 y 32 puede ser definido como influyentes y muestra 32 como peligroso valor atpico en el caso de muestras semi-solidas (fig.6) la muestra 21,39 y 44 pueden ser definidas como valores atpicos 25,26, y 28 como influyente , la identificacin de esta muestra en puntos y tablas influyentes dio las razones para separar muestras del conjunto de calibracin. 3.3 Regresin parcial de mnimos cuadrados (PLS) PLS matemticamente de una expresin lineal para cada modelo de prediccin desarrollada (ec 1) Donde Y representa la propiedad para predecir, en este caso cada fraccin SARA es la intensidad en cada nro. De onda de la regin usada para calibracin B representa un vector de coeficiente calculado de la calibracin, que relaciona la propiedad con la informacin espectroscopia y finalmente es el vector que contiene los errores. Intensidades de espectro FITR-ATR y saturados, aromticos, resinas y contenido de asfltenos (anlisis SARA), para los petrleos crudo colombiano estudiados fueron correlacionado (PLS) 8 modelos de regresin fueron obtenidos despus de dividir muestras en los grupos mencionados. El desarrollo de modelos predictivos fue realizado en 2 etapas, la primera consisti en crear modelo de calibracin (fig.7) tomando en consideracin el nro de componentes principales identificados en el PCA y la segunda etapa fue la validacin de los modelos. La validacin permiti evaluar la exactitud de los modelos de calibracin, para este propsito fue utilizado un proceso de validacin. Los valores RMSEC Y RMSEP fueron calculados y se muestran e la tabla 2, conjuntamente con las regiones espectrales IR, el nro. de muestras excluidas y explico diferencias y variables latentes empleadas, como
ejemplo la fig.8 muestra las x-variables mas influyentes en el modelo de
resinas para muestras liquidas de la primera variable latente. Es posible distinguir 3 regiones las cuales explican la mxima variabilidad en las muestras, estas regiones no muestran el ruido espectral. Entendindose porque canal discreto regiones IR y anlisis SARA en petrleos crudos pueden ser calculados es fuera del alcance de este articulo. Adicionalmente en la tabla 2 muestra la distribucin del tipo de grupo de hidrocarburo con modelos desarrollados para muestras liquidas. En la segunda columna de la tabla muestra el rango de calibracin en %wt donde le modelo mostro mejor desempeo. RMSEC Y RMSEP son el error de calibracin y prediccin de la raz cuadrada promedio respectivamente, las muestras excluidas de la prediccin de los modelos fueron aquellas que tuvieron la diferencia residual mas grande y fueron definidas como valores atpicos o influyentes en la seccin 3.2. En la tabla 3 muestra los parmetros estadsticos de modelos predictivos para crudos semi-solidos. El xito de obtener predicciones certeras de los modelos recae en la precisin de los Y-valores. Si estos valores tienen una alta incertidumbre entonces los modelos tambin la tendrn, el modelo predictor de resina tuvo el RMSEP mas alto y el valor mas bajo de varianza explicado probablemente debido a la baja precisin de los valores medidos de resina (Orrego et al. 2010). Como se observa en la tabla 2 y 3 valores de RMSEP para modelos predictivos en muestras semi-solidas fueron ms altas que muestras liquidas. Esto es probablemente porque los valores de anlisis SARA en las muestras de calibracin para muestras semi-solidas no mostraron buena dispersin a lo largo del rango de calibracin y tuvieron muestras con alta varianza residual y alta influencia como es mostrado en la influencia del grafico PCA para muestras semi-solidas (Fig.6) Conclusiones El PCA ayudo a identificar grupos naturales de muestra, i.e, ligero o crudos viscosos a medida que la variabilidad de la informacin espectroscpica y regiones de infrarrojo de mayor importancia fueron encontradas en los rangos de 690-1600 y 2800- 3000 cm-1 los resultados de los modelos PLC para asfltenos son los mas precisos de las fracciones como se observa en los valores RMSEC Y RMSEP y probablemente porque esta fraccin presenta una distribucin mas amplia de la IR junto con la celda ATR mas tcnicas quimio mtricas proporcionan una forma alternativa para la prediccin cuantitativa del %wt SARA, tipos de canales con manipulacin mnima de las muestras en un corto periodo de tiempo, lo que hace una solucin rpida, econmica y no contaminante.