You are on page 1of 27

NOMBRE DEL PROYECTO 1

NOMBRE DEL PROYECTO 2

Autores: Alejandro Marcano


Dr. Ra
ul Jimenez

Encabezado

Indice
1. Introducci
on

2. Estimaci
on no param
etrica de integrales
2.1. El Metodo de Costuras . . . . . . . . . .
2.2. Propiedades Asintoticas . . . . . . . . .
2.3. Caso Bidimiensional del MdC . . . . . .
2.4. Efecto Frontera sobre la Costura . . . . .

de superficie
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .

3. Comprobaci
on de propiedades del M
etodo de
3.1. Estimacion de . . . . . . . . . . . . . . . . .
3.2. Convergencia de E(Ln ) . . . . . . . . . . . . .
3.3. Comportamiento del sesgo . . . . . . . . . . .
3.4. Comportamiento asintotico . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

4
. 4
. 8
. 10
. 12

Costuras
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

13
13
13
15
16

4. Problemas Num
ericos
18
4.1. Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.2. Curva de Koch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5. T
ecnica de remuestreo
21
5.1. Experimentos con curva de Koch 6 y 7 . . . . . . . . . . . . . . . . 21
5.2. Comportamiento del sesgo relativo . . . . . . . . . . . . . . . . . . 22
5.3. Comportamiento asintotico . . . . . . . . . . . . . . . . . . . . . . . 22
6. Estimador Bayesiano

24

7. Conclusi
on

25

Encabezado

Indice de figuras
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

Triangulacion de Delaunay y costuras para el cardiode.


Convergencia para el segmento de recta. . . . . . . . .
Convergencia para el disco. . . . . . . . . . . . . . . . .
QQ-plot: Segmento de recta. . . . . . . . . . . . . . . .
QQ-plot: Disco. . . . . . . . . . . . . . . . . . . . . . .
Logaritmo de las longitudes estimadas . . . . . . . . .
Curva de Koch 6 y 7 con Remuestreo. . . . . . . . . . .
QQ-plot: Koch 6, Iter 1. . . . . . . . . . . . . . . . . .
QQ-plot: Koch 6, Iter 2. . . . . . . . . . . . . . . . . .
QQ-plot: Koch 6, Iter 3. . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

7
14
15
16
17
20
21
22
23
23

Encabezado

1.

Introducci
on

Encabezado

2.

Estimaci
on no param
etrica de integrales de
superficie

En esta seccion presentaremos el metodo de costuras (MdC) en su version


general cuyo enfoque es la estimacion no parametrica de integrales de superficie
sobre la frontera de un conjunto desconocido G [?]. Luego de este punto,
representaremos e interpretaremos el MdC para el caso bidimensional, recordemos
que nuestro objetivo es estimar la longitud de una costa mediante su representacion
digital. La mayora de los conceptos que presentaremos como generales y complejos
en la version general del MdC tienen una interpretacion o definicion sencilla y
equivalente, siempre que sea posible se hara dicha simplificacion. El otro punto a
tratar en esta seccion es la introduccion de una regla heurstica para el MdC para
descartar elementos problematicos para las costuras (concepto que presentaremos
en esta seccion) que afectan de manera negativa la estimacion.

2.1.

El M
etodo de Costuras

Denotemos por la medida de Lebesgue y por Q un rectangulo abierto y


acotado d-dimensional en Rn . En dicho rectangulo estara contenido el conjunto al
cual se le quiere estimar la integral de superficie sobre la frontera. Supongamos que
G es un subconjunto compacto de Q. Ademas G es tal que la clausura del interior
de G tenga -medida positiva, esto se puede interpretar como que G contenga
suficiente contenido de manera tal que G no sea simplemente una coleccion de
puntos aislados. Un concepto importante que siempre tendremos en cuenta en este
trabajo es:
Definicon 1. La frontera de G la denotaremos por y se define como
= {x Q : > 0, B (x) G 6= y B (x) GC 6= },
donde B (x) es la bola cerrada de radio centrada en x y GC es el complemento
de G.
Es decir, son los elementos del rectangulo Q tal que todos sus entornos
contienen al menos a un elementos de G y a uno de GC . La nocion de frontera se
puede extender considerando la medida de la siguiente manera:
Definicon 2. La -frontera de G se define como

= {x Q : > 0, (B (x) G) > 0 y B (x) GC > 0}.
Es decir, que esta definicion es mas exigente que la anterior ya que ademas
de requerir que los entornos de cada x contengan al menos un elemento de G y
otro GC , es necesario que tanto la intersaccion del entorno de x con el conjunto en
cuestion y con su complemento tengan -medida mayor que cero.
Asumiremos que coincide con . Esta suposicion excluye los casos en que G
tenga -medida nula ya que el conjunto B (x) G G tiene -medida positiva.
Por lo tanto, si realizamos un muestreo aleatorio de puntos en Q lo suficientemente

Encabezado
grande en Q, tendremos algunos puntos caeran en G, garantizando que se tengan
puntos tanto afuera como dentro de la frontera .
Finalmente, para la u
ltima suposicion que se realizara sobre se deben
introducir dos ideas mas.
Definicon 3. La medida de Hausdorff m-dimensional [?] se denota por
Hm () y se define como
Hm (S) = lm Hm (S),
0

donde
Hm (S) = nf

(
X

(diam Ui )m :

i=1

)
Ui S, diam Ui <

i=1

donde S X con X un espacio metrico, con m, R+ y diam U es el diametro


del conjunto U .
Realicemos un diseccion de esta definicion: S es al conjunto al cual le queremos
calcular la m-medida de Hausdorff, los conjuntos Ui , i = 1, 2, .., no son mas
que
numerable de S con diametro menor que y el termino
P un cubrimiento
m
on de la medida. Por ejemplo, si d = 2 entonces
i=1 (diam Ui ) es la aproximaci
la serie anterior se puede interpretar como la suma del area de rectangulos Ri con
longitud de lado diamUi respectivamente. El lmite de Hm (S) cuando 0 va
existir ya que Hm (S) es monotonamente decreciente en , aunque este lmite puede
ser infinito. Por lo tanto como 0, de los posible nfimos Hm (S), estaremos
cogiendo el supremo.
Note ademas que si d = 0 la medida de Hausdorff simplemente cuenta el n
umero
de elementos en el conjunto S, si d = 1 entonces la medida de Hausdorff representa
una longitud, si d = 2 entonces la medida de Hausdorff representa un area y as
sucesivamente.
La otra idea es la siguiente
Definicon 4. Un subconjunto S de Rn es m-rectificable si existe un conjunto
numerable de funciones continuamente diferenciables {fi } con fi : Rm Rn tales
que
!

[
m
m
H
S\
fi (R ) = 0.
i=1

Esto se puede interpretar como que podemos aproximar muy bien a S con
con una coleccion numerable de variedades suaves. La definicon de rectificabilidad
tambien implica que los espacios tangentes a S estan definidos en casi todas partes.
Asumiremos entonces que la frontera es un conjunto (d 1)-rectificable y
que tiene medida de Hausdorff finita.
Antes de seguir con mas conceptos previos al MdC, recordemos que el objetivo
de dicho metodo es estimar integrales de superficies, cuya definicion formal es
Z
Z
d = Hd1 (d).
(1)

Como hemos dicho que es rectificable podemos aproximarnos a ella,


especficamente a su medida de Hausdorff, con un conjunto numerable de objetos
5

Encabezado
geometricos suaves. Proseguimos ahora con la construcion de dicha aproximacion
que sera estocastica. Consideremos el modelo de muestreo que consiste en n
variables aleatorias X1 , ..., Xn identicamente distribuidas sobre el rectangulo Q
con una distribucion uniforme. Ademas consideraremos n variables de Bernoulli
1 , ..., n tales que

1, si Xk G,
k =
(2)
0, si Xk
/ G.
Por lo tanto, aunque no conozcamos a G, podemos saber si un punto de
muestreo Xk esta dentro o fuera del cuerpo G, es decir, podemos saber en cual
ladode la frontera se encuentra. Denotemos al conjunto de n puntos de muestreo
por Xn . Lo siguiente es considerar la triangulacion de Delaunay de Xn que esta
formada por los smplices que sastifacen la siguiente propiedad: que ning
un punto
de Xn este dentro de la esfera circumcrista de otro smplice del cual dicho punto
no sea vertice. Cada smplice s estara representado por d + 1 vertices, cada vertice
es un punto de Xn .
Denotaremos por D(Xn ) a la triangulacion de Delaunay para el conjunto de
puntos Xn . Dicha triangulacion es u
nica, casi siempre, para Xn provenientes de
una muestra i.i.d. con distribucion absolutamente continua [?], el cual es nuestro
caso. A partir de la triangulacion de Delaunay se construye el siguiente objeto:
Definicon 5. La costura de se define como
)
(
d+1
X
s(k) d .
S (Xn , ) := s D(Xn ) : 1
k=1

Donde s(k) la variable de Bernoulli definida en la ecuacion 2 para el smplice


s y su vertice k. La condicion garantiza que los smpleces de la costura S tengan
al menos un vertice en G y al menos un vertice fuera de G. La costura es la
estructura fundamental de la que se construyen los objetos con los que se realizara
la estimacion de la integral de superficie de la ecuacion 1.
Recordemos que un smplex de dimension d esta formado por d + 1 facetas
(o caras) que a su vez son smplices de dimension d 1. Por lo tanto, podemos
representar una faceta f por el conjunto de vertices que la conforman V(f ) =
{Xf (1) , ..., Xf (d) } De estas facetas extraemos dos grupos que son de interes, si
representamos por F(s) a las facetas del smplex s
Definicon 6. La costura interna de se define como
S (Xn , ) := {f F(s) : s S (Xn , ) y V(f ) G} .
Definicon 7. La costura externa de se define como


S + (Xn , ) := f F(s) : s S (Xn , ) y V(f ) GC .
La interpretacion es simple: la costura interna son las facetas de los smplices
de S (Xn , ) que tienen todos sus vetices en G, es decir, dentro de G. Note que
esto no implica que la faceta como tal este contenida en G, solo se refiere a sus
6

Encabezado
vertices. De manera analoga, la costura externa son las facetas de los smplices de
S (Xn , ) que tienen todos sus vetices en GC , es decir, fuera de G.

(a) Triangulaci
on de Delaunay (gris) y
costura (magenta).

(b) Costura interna (roja) y costura


externa (azul).

Figura 1: Triangulacion de Delaunay y costuras para el cardiode.


Observamos en la imagen 1a la costura en magenta y en la imagen 1b la costura
interna y la costura externa en rojo y en azul respectivamente. Vemos que estas dos
u
ltimas costuras son un ajuste a la frontera por lo tanto son una herramienta u
til
para la estimacion de la integral de la ecuacion 1. Dicha aproximacion da origen a
dos distintos estadsticos seg
un la costura utilizada:
X
In () :=
Hd1 (f )
(3)
f S (Xn ,)

y
In+ () :=

Hd1 (f )

(4)

f S + (Xn ,)

Entonces, podemos resumir al MdC el los siguientes pasos: dado un cuerpo


geometrico G en un rectangulo abierto Q, se prosigue de la siguiente manera
1. Realizar un muestreo uniforme de n puntos sobre Q.
2. Construir la triangulacion de Delaunay de los n puntos.
3. Determinar el valor de i para cada punto xi .
4. Determinar la costura, la costura interna y la costura externa.
5. Calcular el estadstico In y el estadstico In+ .
Antes de utilizar estos estadstico como estimadores de la ecuacion 1, es
necesario estudiar sus propiedades asintoticas, es decir, si son consistentes, como
se comporta el sesgo, como se comporta la varianza, si se cumple alguna forma de
un TCL, entre otras. Estas importantes propiedades se presentan en la siguiente
seccion.
7

Encabezado

2.2.

Propiedades Asint
oticas

El estudio del comportamiento asintotico de un estadstico y de sus propiedades


asintoticas es un tema de estudio sumamente importante para el correcto uso
de un estadstico en aplicaciones a problemas con datos reales. Sin la validez
de propiedades asintoticas, como la verificacion de alguna forma de TCL o con
un comportamiento asintotico no favorable por parte del sesgo, los estimadores
estadstico pueden llevar a conclusiones erroneas. Esta seccion estara enfocado
en la presentacion e interpretacion de los resultados asintoticos para In y de In+
obtenidos en [?] y proponer una version del TLC para dichos estimadores.
Los resultados asintoticos presentados en [?] han sido probados para una
Poissonizacion de In y de In+ , que denotaremos por, I y de I+ . Para comprender
estos estimadores es necesario primero introducir la idea y el concepto de un
proceso puntual de Poisson.
Ahora bien, en el teorema 2, en lugar de utilizar el estimador In () definido
en la ecuacion 3, utiliza el estimador In () que tiene una diferencia importante:
en lugar de considerar n puntos aleatorios Xn con distribucion uniforme en Q, en
este caso se considera n Poisson() puntos generados por un proceso de Poisson
homogeneo de intensidad en Q. Dicho conjunto de puntos lo denotaremos por
P . Explcitamente se tiene que:
X
I () :=
Hd1 (f )
(5)
f S (P ,)

Teorema 1. Sea la frontera de un conjunto compacto G Rd . Supongamos que


es un conjunto (d 1)-rectificable, que tiene medida de Hausdorff finita y que
coincide con la -frontera de G. Entonces
Z




lm E I () = lm E In () = d d
n

y
lm

() = lm

In

Z
() = d

d casi seguro,

con d una constante que depende de la dimension de G, pero no de su


morfologa. El mismo resultado es valido para I+ e In+ .
Teorema 2. Sea la frontera de un conjunto compacto G Rd . Supongamos que
es un conjunto (d 1)-rectificable, que tiene medida de Hausdorff finita y que
coincide con la -frontera de G. Entonces
Z


d1
d
lm V I () = Vd d,

con Vd una constante que depende de la dimension de G, pero no de su


morfologa. El mismo resultado es valido para I+ e In+ .
Hay varias observaciones que hacer sobre estos resultados. El teorema 1 nos
proporciona dos estimadores consistentes para la integral de superficie de la

Encabezado
ecuacion 1 a partir de las expresiones de In y de In+ , de los cuales se puede definir
un tercer estimador. Estos estimadores consistentes vienen dados por:
1
I () .
(6)
d n
1 +
I () .
(7)
L+
n () :=
d n

1
(8)
Ln () :=
In () + In+ () .
2d
Los denominaremos como el estimador de la costura interna, el estimador de
la costura externa y el estimador de la semisuma, respectivamente. El estimador
de la semisuma suele tener ventajas sobre los dos primeros en la mayora de las
ocasiones, como veremos en el siguiente captulo.
El teorema 1 es valido para tanto para I como para In , pero el teorema 2 es
valido solo para I . Sin embargo, como se sugiere en [?], se espera que al utilizar
la poissonizacion P se introduzca mayor varianza al metodo en comparacion a
utilizar a Xn ya que, en el caso de la poissonizacion P , el n
umero de puntos es
aleatorio. De esto se propone la siguiente conjetura
 d1 
Conjetura 1. Tanto V [In ()] como V [In+ ()] son O n d .
L
n () :=

Es decir, se espera que, en el lmite, la varianza tenga el mismo comportamiento


que en el caso poissonizado para ambos estimadores. Recordemos que el objetivo
de esta seccion es sugerir alguna forma del TLC para los estimadores propuestos. A
partir de la conjetura 1 se propone la siguiente convergencia para los estimadores
In e In+ :
Conjetura 2. Se tiene la siguiente convergencia en distribucion


Z

 D
d1

n 2d In () E In () N 0, Vd d .

De igual forma para In+ .


La idea es obtener una posible distribucion asintotica que relacione los
estimadores con el valor de la integral a estimar. Consideremos lo siguiente
n

d1
2d

In



d1
() E In () = n 2d

=n

d1
2d



Z
Z



In () E In () + d d d d


 

Z
Z



In () d d E In () d d

Sumando 1
Por el teorema 1 sabemos que el sumando 1 converge a cero. Este termino
representa el sesgo (y si lo dividimos por el valor de la integral representa al sesgo
relativo). Para que la convergencia propuesta en la conjetura 2 sea valida como
distribucion asintotica al sustituir a E [In ()] por el valor real de la integral, es
necesario que la convergencia a cero del sesgo sea mas rapida que la convergencia
de la varianza. Por lo tanto se propone la siguiente conjetura sobre la convergencia
del sesgo:
9

Conjetura 3. El sesgo relativo


alg
un > 0.
De igual forma para In+ .

() :=

E[In ()]d
R
d d

Encabezado


( d1
+)
2d
para
es o n

Es decir, tenemos normalidad asintotica para los estimadores siempre y cuando


el sesgo tenga una convergencia a cero mas rapida que la de la varianza. En funcion
de las conjeturas anteriores, en caso de que se verificarsen, se puede extraer el
siguiente resultado:
Conjetura 4. Se tiene la siguiente convergencia en distribucion




Z
Z
d1
D

n 2d In () d d N 0, Vd d .

De igual forma para In+ .


A partir de aqu se pueden determinar intervalos de confianza para la estimacion
de la integral de superficie. Sin embargo, la varianza es desconocida y depende
del
R
valor real de la integral que queremos estimar, es decir, depende de d. Si
sustitumos dicha integral por su valor estimado podemos considerar la siguiente
aproximacion para los intervalos de confianza:
s Z
In t/2 ()

Vd

d.

(9)

Valores que deben ser corregidos dividiendo por d y donde se ha sustitudo a


la distribucion normal por la t-student para compensar el hecho de que la varianza
es desconocida.
Las conjeturas presentadas en esta seccion se comprobaran experimentalmente
en el siguiente captulo, sin embargo, no para el caso general, sino para el caso
bidimensional. En la siguiente seccion exploraremos con profundidad el caso
bidimensional.

2.3.

Caso Bidimiensional del MdC

Nuestro enfoque se limitara a la estimacion de longitudes, especficamente de


permetros de figuras como puede ser la longitud de una costa o el permetro de
una galaxia. Recordando la notacion de las secciones anteriores, consideraremos
que la dimension es d = 2. Por lo tanto, muchos de los conceptos y resultados
presentados pueden interpretarse de una manera mas intuitiva.
Comencemos por la interpretacion de las hipotesis y de los objetos fundamen
del MdC para el caso bidimensional. Por ejemplo, la region Q es un rectangulo
bidimensional de la forma (a1 , b1 ) (a2 , b2 ) R2 y el objeto G es un cuerpo
geometrico bidimensional contenido en Q. La medida de Hausdorff Hd1 para
d = 2 es equivalente a la longitud de una curva. Por lo tanto, la integral de la
ecuacion 1 no es mas que la longitud de la frontera de G denotada por .

10

Encabezado
Por otro lado, el concepto de rectificabilidad para d1 = 1 simplemente implica
que la curva tiene longitud finita. Los smplices para este caso seran triangulos y
las facetas seran los lados de cada triangulo. Las costura estara formada entonces
por el conjunto de triangulos que tengan al menos un vertice fuera y un vertice
dentro de G.
Se sigue entonces que la costura interna estara conformada por los lados de los
triangulos de la costura que tengan ambos vertices dentro de G y, analogamente,
la costura externa estara conformada por los lados de los triangulos de la costura
que tengan ambos vertices fuera de G.
Para clarificar la notacion, expresaremos los resultados asintoticos de la seccion
anterior para el caso bidimensional
en funcion del estimador L
n y considerando la
R
siguiente notacion L = d, 2 = y V2 = V .
La conjetura 1 sugiere que


1
1
()
= V L 2 ,
lm n 2 V L
n

donde V es una constante. Intuitivamente esperamos que la varianza de la


estimacion de L dependa del area de muestreo, es decir, del area del rectangulo
Q. Esta dependencia debera ser creciente en el sentido que si consideramos un
cuerpo G dentro de un rectangulo Q0 de mayor area, dado que la muestra estara
mas dispersa, se espera mayor varianza en la estimacion. Como L y no dependen
del area de muestreo, proponemos que la constante V cargara con este efecto, es
decir:
Conjetura 5. La constante V tiene la forma V = area(Q) 2 para una cierta
constante que no depende de la morfologa de G.
Ahora bien, podemos reinterpretar las conjetura de la seccion anterior de la
siguiente manera. Si Z es una variable normal estandar:
Conjetura 2. Se tiene la siguiente convergencia en distribucion

 D
1 p
1
Z 2 area(Q)L.
n 4 L
n () E Ln ()
De igual forma para L+
n.
Conjetura 3. El sesgo relativo

n () :=

E [L
n ()] L
L



1
es o n( 4 +) para alg
un > 0.
+
De igual forma para In .
Conjetura 4. Dada la convergencia de la conjetura 3, se tiene la siguiente
convergencia en distribucion
p
 D
1
12
n 4 L
area(Q)L.
n () L Z
De igual forma para L+
n.
11

Encabezado
Por tanto, el siguiente objetivo sera la comprobacion experimental de las
conjetura presentadas en esta seccion, que queda reservado para el siguiente
captulo. Se discutira ahora el efecto frontera que experimenta la triangulacion
de Delaunay en un rectangulo en R2 .

2.4.

Efecto Frontera sobre la Costura

La triangulacion de Delaunay

12

Encabezado

3.

Comprobaci
on de propiedades del M
etodo de
Costuras
En esta seccion comprobaremos los siguientes puntos de manera experiemental:
+
Estimar la constante para L
n , Ln y Ln .
+
Verificar la convergencia ?? para L
n , Ln y Ln .

Verificar el comportamiento del sesgo ??.


Verificar el comportamiento asintotico de Ln sugerido en ??

3.1.

Estimaci
on de

En [?] se ha estimado el valor de al realizando 1000 mediciones de la


longitud de una circunferencia con una muestra de n = 106 puntos distribudos
uniformemente en el rectangulo. Se ha realizado el mismo experimento, pero para
nuestro caso hemos elegido como objeto a medir un segmento de recta de longitud 1
por lo tanto la valor obtenido como longitud del segmento de recta es directamente

Media
Des. Est.

L
n

L+
n

Ln

1,1824
0,0056

1,1824
0,0055

1,1824
0,0042

+
Tabla 1: Estimacion de mediante L
n , Ln y Ln .

En la tabla 1 se presentan la media y la desviacion estandar de las estimaciones


de la longitud del segmento de recta obtenidas. Hay dos importante observaciones
que hacer sobre estos resultados: por un lado nuestro difiere a partir de la
cuarta cifra decimal con el presentado en [?], lo cual refuerza la estimacion de
dicho paper. Por otro lado, la desviacion estandar de la semisuma es menor que
Ademas se observa la independencia de de la morfologa de G y que es el
mismo independientemente del estimador utilizado. Para los posteriores calculos
realizado en este trabajo se utilizara = 1, 1824.

3.2.

Convergencia de E(Ln )

El experimento del segmento de recta se ha realizado para distintos tama


nos
+
),
E(L
de muestra n = 103 , 104 , 105 , 106 . Se observa la convergencia de E(L
n
n) y
E(Ln ) hacia la longitud real. Por otro lado, se observa que el sesgo de estimacion
va tambien decreciendo seg
un mayor es la muestra. Ademas, la varianza de Ln es
menor que las de los otros dos estimadores.

13

Encabezado

(a) Convergencia de E(L


n ).

(b) Convergencia de E(L+


n ).

(c) Convergencia de E(Ln ).

Figura 2: Convergencia para el segmento de recta.


Observamos que el sesgo es positivo en los tres casos. Esto puede deberse a
que al estimar un segmento de recta mediante una costura, la costura para nuestro
caso d = 2 es simplemente una poligonal cercana a segmento de recta, pero la
poligonal usualmente tendra mayor longitud que el segmento. Tanto la interna
como la externa y por lo tanto tambien la media.
Imaginemos ahora el caso de estimar la longitud de una circunferencia. La
intuicion nos dice que la costura interna tendra una longitud menor que la longitud
real que a su vez sera menor que longitud de la costura externa. Por lo tanto
intumos que:
La costura interna tendra un sesgo negativo.
La costura externa tendra un sesgo positivo.
14

Encabezado
La costura media tendra un sesgo cercano a cero.
Realizando un experimento analogo al del segmento de recta, pero para un
circunferencia de longitud 10 unidades, observamos que se cumple la intuicion. De
esto conclumos dos cosas: que el sesgo depende de la morfologa de G, pero que
sin embargo decrece a mayor tama
no de la muestra. Por lo tanto el problema que
el sesgo dependa de G se soluciona simplemente tomando una mayor muestra.

(a) Convergencia de E(L


n ).

(b) Convergencia de E(L+


n ).

(c) Convergencia de E(Ln ).

Figura 3: Convergencia para el disco.

3.3.

Comportamiento del sesgo

El sesgo juega un papel importante en la estimacion. Aunque este decrece para


mayor tama
no de la muestra, es interesante determinar cual es el orden de este

15

Encabezado
comportamiento para saber cual es el tama
no de n necesario para que el sesgo no
sea relevante en la estimacion.
Por experimentacion el sesgo parece ser del siguiente orden de convergencia
 2 1 !
log n
ELn L

=O
,
(10)
3
L
n2
con = 0, 05. El la tabla 2 se observa que el cociente entre el sesgo relativo y
el orden estimado parece ser constante para intermedios de n, esto sugiere que la
relacion 10 sea valida.

Segmento
Disco

103

104

105

106

0,037
0,119

0,028
0,091

0,029
0,090

0,011
0,070

Tabla 2: Cociente entre sesgo relativo y orden de convergencia estimado para


distintos n.
Sin embargo, la constante que aparece para los valores intermedios de n es
distintas para ambas figuras por lo que parece ser que dependera de la morfologa
de G. Por lo tanto, el orden de convergencia no parece depender de la morfologa
de G, pero la constante respectiva s.

3.4.

Comportamiento asint
otico

La normalidad asintotica del estimador sugerida se verifica como podemos


comprobar en los QQ-plots 4, 5 y sus p-valores (Shapiro-Wilk) respectivos para
las estimaciones del segmento de recta y del disco. Sin embargo, la constante
propuesta parece depender de la morfologa de G.

Figura 4: QQ-plot: Segmento de recta.

16

Encabezado

Figura 5: QQ-plot: Disco.


Este prueba se ha hecho tambien para otros cuerpos como el cardiode y el
astroide, as como para la curva de Koch de 1 a 7. Para todos estos casos se
ha verificado la normalidad, sin embargo el valor de vara seg
un la figura
considerada.

Segmento
Disco
Astroide
Cardiode
Koch 1
Koch 2
Koch 3
Koch 4
Koch 5
Koch 6
Koch 7

p-valor

0,3436
0,2005
0,2292
0,2055
0,3597
0,3558
0,4140
0,4511
0,6160
0,7112
0,6647

0.20
0.36
0.08
0.25
0.19
0.11
0.53
0.51
0.78
0.11
0.92

Tabla 3: y p-valor de distribucion asintotica.


Por lo tanto, s se cumple la normalidad asintotica del estimador, aunque el
dependera de la morfologa de G.

17

Encabezado

4.

Problemas Num
ericos

La idea de aproximar la longitud de costas implica ciertas dificultades, como


se comentado anteriormente, por lo que hemos limitado el problema a medir la
longitud de la representacion virtual de una costa. Sin embargo, esta simplificacion
del problema no libera de todas las dificultades al momento de estimar la longitud.
Por la propia naturaleza de las costas, la representacion virtual de pueden presentar
secciones suaves, que presentan mayor facilidad al momento de estimar su longitud,
pero tambien pueden presentar puntos en cuyo entorno la representacion virtual
de la costa sea muy irregular. El otro problema fundamental e inevitable es la
limitacion de la resolucion: al tener que fijar una resolucion de la representacion
virtual, siempre habra informacion que deba ser descartada. Por lo tanto, los casos
de estudios que se consideran consisten en curvas a las cuales se les puede calcular
su longitud de manera analitica.
Para presentar los resultados obtenidos con el metodo de costuras, se realizara
una comparativa entre dicho metodo y la funcion contourc de Matlab. Esta
funcion detecta las curvas de nivel de una superficie fijado un nivel z. Una vez
con los puntos que definen la curva de nivel se puede calcular la longitud de
dicha curva directamente como la suma de la distancia entre puntos consecutivos
o interpolando dichos puntos y luego calculando la longitud de la curva de
interpolacion. La interpolacion se puede aplicar a ambos metodos, es decir, en
el metodo de costuras tambien podramos ajustar una curva sobre la costura
obtenida. Por simplicidad, consideraremos para ambos metodos la distancia
eucldea entre los puntos consecutivos como nuestra longitud de la costa.
Para el metodo contourc se tomara un mallado regular en el cual para cada
nodo del mallado se indica si esta en el interior o en el exterior de la curva. Por
lo tanto, dicho mallado regular se puede interpretar como una imagen binaria,
simplemente interesa saber si un punto esta de un lado u otro de las costa. Para
el metodo de costuras se tendra la misma informacion, pero para el mallado de
Delauny.
Los casos de estudios que se consideran consisten en curvas a las cuales se les
puede calcular su longitud de manera analitica. Para el metodo contourc se tomara
un mallado regular en el cual para cada nodo del mallado se indica si esta en el
interior o en el exterior de la curva. Por lo tanto, dicho mallado regular se puede
interpretar como una imagen binaria, simplemente interesa saber si un punto esta
de un lado u otro de las costa. Para el metodo de costuras se tendra la misma
informacion, pero para el mallado de Delauny.

4.1.

Figuras

Se han aplicado ambos metodos a los siguientes cuerpos: segmento de recta,


disco, astroide y cardiode. La longitud del segmento es de 1 unidad y la longitud
para las figuras es de 10 unidades. El metodo contourc a medido con completa
exactitud la longitud del segmento, esto es debido a que el segmento estaba
posicionados exactamente sobre el mallado regular. Por otro lado, el metodo de
costuras ha tenido un error relativo del orden de 104 . Si consideramos un segmento
que no este posicionado de la manera anterior, el metodo contourc presenta un error

18

Encabezado
del orden de 103 .

Figura
Segmento
Disco
Astroide
Cardiode

M
etodo
Error
Costuras Rel ( %)
1,0001
9,9978
9,9782
9,8386

0,01
0,02
0,22
1,61

M
etodo
contourc
1,0000
10,5009
9,9834
10,4562

Error
Rel ( %)
0,00
5,01
0,17
4,56

Tabla 4: Errores relativos para figuras.


Como se observa en la tabla 4, para el resto de los casos se han obtenido
resultados en donde el metodo de costuras esta a la par o es mejor que el metodo
contourc, incluso para el caso del cardiode que es el peor caso para el metodo
de costuras. Tanto el astroide como el cardiode presentan puntos c
uspide, sin
embargo el punto c
uspide del cardiode es el que mas dificultades ha presentado
para el metodo de costuras. En la siguiente seccion se presentara una extension
de dicho metodo para que, en parte, dar mayor precision cuando se mide en la
presencia de puntos c
uspide.

4.2.

Curva de Koch

La naturaleza fractal para las costas propuesta por Mandelbrot [?] implica que
la longitud de estas dependeran de la resolucion elegida para realizar la medicion.
Como ejemplo utilizaremos la conocida curva de Koch hasta una cierta iteracion.
En la grafica 6 se representa en el eje horizontal la iteracion en la curva de
Koch a considerar y en el eje vertical se representa el logaritmo en base 34 de
la longitud obtenida. En el caso ideal, la grafica debera ser la recta identidad ya
que recordemos que la longitud de la curva de Koch viene dada por l = ( 34 )k donde
de k es la iteracion considerada.
Se puede observar que el metodo de contourcse queda estancado para k = 4,
a partir de este punto dicho metodo no aprecia diferencia entre las sucesivas
iteraciones. Por otro lado, el metodo de costuras llega a apreciar diferencias hasta
k = 5.
Aunque ambos metodos no tienen un buen rendimiento para iteraciones
posteriores a k = 5, la longitud estimada por el metodo de costuras sigue al menos
aumentando lo que significa que podra recoger al menos un poco de informacion
de las siguientes iteraciones cosa que el metodo contourcno hace.

19

Encabezado

Figura 6: Logaritmo de las longitudes estimadas

Curva de
Koch
Koch
Koch
Koch
Koch
Koch
Koch
Koch
Koch

0
1
2
3
4
5
6
7

Longitud
Real

M
etodo
Costuras

Error
Rel ( %)

M
etodo
contourc

1,0000
1,3333
1,7778
2,3704
3,1605
4,2140
5,6187
7,4915

1,0001
1,3320
1,7721
2,3471
3,0707
3,8540
4,3283
4,4528

0,01
0,10
0,32
0,98
2,84
8,54
22,97
40,56

0,9968
1,3725
1,8399
2,4172
2,9901
3,3805
3,3939
3,3699

Tabla 5: Errores relativos para curva de Koch.

20

Error
Rel ( %)
0,32
2,94
3,49
1,97
5,39
19,78
39,60
55,02

Encabezado

5.

T
ecnica de remuestreo

En la seccion anterior observamos que el metodo de costuras no recoge suficiente


informacion de la curva de Koch para k mayores que 5 para dar una estimacion
cercana al valor real de la longitud. Una manera de mejorar la estimacion es realizar
un remuestreo en un engordamiento de la costura, este engordamiento consiste en
dada una costura S(Xn , ) incluir los triangulos adjacentes a la costura para luego
construir una nueva S (Xn , ) y reestimar la longitud.

5.1.

Experimentos con curva de Koch 6 y 7

Se han realizado tres iteraciones de remuestreo con una muestra de n = 106


y vemos que con una iteracion del remuestreo la estimacion mejora notablemente
tanto para la curva de Koch 6 como para la curva de Koch 7, incluso la segunda
mejora un poco mas, aunque ya para la tercera no parece mejorar.

(a) Koch 6.

(b) Koch 7.

Figura 7: Curva de Koch 6 y 7 con Remuestreo.


Esto se puede interpretar como que el metodo de costura con remuestreo
aprovecha practicamente toda la informacion y realiza un muy buena aproximacion
a la longitud real de la virtualizacion de la costa.
Iteriaci
on
Koch 6
Koch 7

22,97
40,56

3,12
9,36

1,44
4,14

1,35
3,65

Tabla 6: Errores relativos para curva de Koch.

21

Encabezado

5.2.

Comportamiento del sesgo relativo

Recordemos que en el analisis del comportamiento del sesgo de la seccion


anterior, el area de muestreo no se tomo en consideracion ya que al ser una u
nica
iteracion del metodo dicha area no variaba. Sin embargo ahora s se debe tomar en
cuenta. Tomaremos como base el comportamiento del sesgo dado por la relacion
10.
Se ha realizado un analisis exploratorio para la curva de Koch 6 con tres
iteraciones. Este analisis indica que en el orden de convergencia para el sesgo
relativo hay un factor que depende de la raz cuadrada del area de muestreo,
obteniendo la siguiente relacion
 2 1 !
log n
ELn L p

= area(Qm ) O
,
(11)
3
L
n2
con = 0, 05 y area(Qm ) es el area de muestreo para la iteriacion m. El la
tabla 7 se observa que el cociente entre el sesgo relativo y el orden estimado parece
ser constante para intermedios de n, esto sugiere que la relacion 11 sea valida.
Koch 6

103

104

105

106

Iter. 1
Iter. 2
Iter. 3

1,91
2,29
2,44

3,42
4,04
4,25

3,33
4,20
4,36

3,90
4,11
5,61

Tabla 7: Cociente entre sesgo relativo y orden de convergencia estimado para


distintos n.

5.3.

Comportamiento asint
otico

La normalidad asintotica del sugerida en la ecuacion ?? tambien se verifica para


el estimador con la tecnica del remuestreo, pero actualizando el valor de area(Q)
por el valor de al area de remuestreo para cada iteracion. En los QQ-plots 8, 9, 10
se representan las distintas iteraciones para la curva Koch 6 con una muestra de
n = 105 .

Figura 8: QQ-plot: Koch 6, Iter 1.


22

Encabezado

Figura 9: QQ-plot: Koch 6, Iter 2.

Figura 10: QQ-plot: Koch 6, Iter 3.


Sin embargo, se vuelve a verificar que el factor propuesto no es constante.

23

Encabezado

6.

Estimador Bayesiano

24

Encabezado

7.

Conclusi
on

25

Encabezado

Referencias

26

You might also like