You are on page 1of 8

Introduccin transferencia de conocimiento cifrado

o clasificado, transacciones bancarias


La Deep Web es aquella parte que requieren un alto grado de
de la red que contiene material, seguridad, investigacin, seguridad
informacin y pginas web que no nacional, etc.
estn indexadas en ninguno de los
buscadores existentes como pueden Al ser demasiada la
ser Bing, Google, Yahoo, etc; en la informacin contenida en la red
actualidad, estudios de la Universidad profunda y mnima la poblacin que
de Berkeley estiman que la Internet conoce y tiene acceso dicha
profunda tiene un tamao de informacin, es natural preguntarse
aproximadamente 91,000 TeraBytes: qu uso le estn dando a este
se estima que la mayora de la enorme recurso. Por eso el motivo de
poblacin conoce slo el 4% de todo este artculo es descubrir de qu
el contenido de internet. manera hablan acerca de la deep
web autoridades cientficas y qu uso
La finalidad de la Deep Web es le dan a la misma. Conocimiento
mantener el anonimato, una de las elaborado por revistas cientficas con
formas ms famosas y fciles de altos estndares de calidad ya que
navegar es a travs de es The Onion esta informacin puede ser
Router (TOR), esta es una plataforma indispensable para innumerables
creada por el Laboratorio Naval de hallazgos en beneficio de la sociedad.
EE.UU., que posibilita ocultar la
direccin IP y otros datos
relacionados con la identidad del
usuario, y que funciona utilizando Materiales y mtodos
distintos niveles de codificacin. Para la presente investigacin
Ciertas partes de Deep Web son utilizamos el siguiente mtodo de
tcnicamente inaccesibles a travs de bsqueda y lectura de artculos
los medios tradicionales, por lo que cientficos indexados en Scopus y
se convierte en un lugar protegido y Red SciELO. En la bsqueda inicial,
seguro para que cibercriminales o se pretenda encontrar informacin
sujetos de toda ndole realicen sobre la Deep Web en artculos
actividades ilegales. cientficos indexados en Scopus
A diferencia de lo que se cree, publicados en los ltimos 5 aos. Una
la Deep Web no es usada vez que se accedi a la base de
nicamente para realizar o efectuar datos Scopus, con ayuda de los
actividades ilcitas, a esta pequea operados boleados () se busc el
parte se le conoce como Dark Web, trmino Deep Web limitando la
en cambio existen otros usos que se bsqueda a los ltimos 5 aos, del
le da a este recurso s el de 2012 al 2016, limitado a artculos
como tipo de documento. Dicha Shi, H., Guo, J., Chen, Y. and
bsqueda arroj un total de 85 Ni, D. (2013). Deep web
resultados de 40 diferentes revistas database classification based
on tuple-matching. Journal of
de 24 distintos territorios y pases que Computational Information
han publicado artculos cientficos Systems, [online] 9(17),
sobre la Deep web en los ltimos 5 pp.6775-6783.
aos. Despus de dar lectura a los Wang, T., Li, G., Duan, Q.,
artculos encontrados a pesar de su Liu, Y. and Chen, X. (2013).
Deep Web integrated query
innegable relevancia, decidimos
interface construction
refinar an ms la bsqueda al ao method based on Apriori
resultando ahora un total de 27 Algorithm. Journal of
artculos, y al territorio en el que ms Information and
se public sobre la Deep Web Computational Science,
quedando un total final de 17 10(15), pp.5063-5075.
Li, X., Cui, Z., Zhao, P. and
artculos siendo stos los ms
Mao, J. (2013). Retrieving
relevantes y representativos para deep web data based on
nuestra investigacin. heuristic hierarchy tree
model. Journal of
Por otro lado la bsqueda en la Computational Information
biblioteca virtual Red SciELO la Systems, 9(16), pp.6685-
bsqueda se realiz de la siguiente 6692.
manera: En el buscador de artculos Qiang, B., Shi, L., He, Q.,
Wang, Y. and Li, W. (2013).
se ingres las palabras Deep Web
Integrating Deep Web based
usando el mtodo integrada filtrando on domain ontology. Journal
la bsqueda a regional en todos los of Computational
ndices arrojando como resultado 34 Information Systems, 9(15),
documentos. Hecho siguiente se pp.6259-6267.
aplic el filtro de idioma a espaol Feng, Y. and Wang, H.
(2013). Deep web query
obteniendo un resultado de 14
result pages content
documentos de los cuales extraction based on
seleccionamos los que realmente combination of vision and
hablaban de la Deep Web quedando tag information. Information
as 3 artculos en idioma espaol. (Japan), 16(6), pp.3635-
3641.
Tabla 1. Feng, Y. and Lu, W. (2013).
Heuristics-based semantic
Materiales LIU, L. and PENG, T. (2013). annotation for deep web
Scopus Post-processing of Deep Web query results. Journal of
Information Extraction Based Computational Information
on Domain Ontology. Systems, 9(14), pp.5685-
Advances in Electrical and 5692.
Computer Engineering, 13(4), Li, Y., Wang, Y., Jiang, P. and
pp.25-32. Zhang, Z. (2013). Multi-
objective optimization domain-specific deep web
integration of query databases. J Intell Inf Syst,
interfaces for the Deep Web 40(1), pp.159-184.
based on attribute Yong, F., Xiao, D. and Hong,
constraints. Data & X. (2013). A calculation
Knowledge Engineering, 86, method of Deep Web
pp.38-60. entities recognition. Journal
Duan, Q., Yang, R. and Chen, of Theoretical and Applied
Y. (2013). Automatic Information Technology,
Identifying Query Interfaces 47(3), pp.1255-1259.
of Deep Web Based on Zhang, Y., Li, Q., Zhang, R.
PreClassification-SVM. and Lin, P. (2013). Novel
Sensor Letters, 11(6), Method of Web Database
pp.1389-1395. Redundancy Computing for
Liu, Z. and Wang, J. (2013). Web Data Sources Selection.
Principles and Model for Information Technology J.,
Web Dataspace. JCP, 8(4). 12(19), pp.5216-5220.
Zheng, Q., Wu, Z., Cheng, X., Red SciELO Martnez Larrarte, J. (2015).
Jiang, L. and Liu, J. (2013). Nuestra vlida Web
Learning to crawl deep web. profunda. Revista Cubana de
Information Systems, 38(6), Reumatologa, 17(3), pp.169-
pp.801-819. 170.
Zhang, Z., Du, J. and Wang, L. Bautista Luzardo, D. (2014).
(2013). Formal concept Deep web: aproximaciones a
analysis approach for data la ciber irresponsabilidad.
extraction from a limited Revista Latinoamericana de
deep web database. J Intell Biotica, 15(28-1), p.26.
Inf Syst, 41(2), pp.211-234. Rodrguez Perojo, K. and
Wang, H., Xu, Q., Chen, Y. Ronda Len, R. (200
and Lan, J. (2013). A feature- 6). El web como sistema de
weighted instance-based informacin. ACIMED, 14(1).
learner for deep web search
interface identification.
Research Journal of Applied Resultados
Sciences, Engineering and
Technology, 5(4), pp.1278- Los documentos encontrados
1283. en Scopus resultaron ser de diversas
Zhu, G., Wang, N. and Wang, temticas abarcando ms de 11
H. (2013). An improved
reas de estudio entre las cuales las
method for Deep Web
sources classification based ciencias exactas predominan con dos
on the theme and form terceras partes de los 85 artculos
attributes. Tien Tzu Hsueh publicados en los ltimos 5 aos,
Pao/Acta Electronica Sinica, ciencias de la computacin,
41(2), pp.260-266. ingenieras, matemticas, medicina,
Li, Y., Wang, Y. and Du, J.
entre otras fueron las reas de
(2012). E-FFC: an enhanced
form-focused crawler for estudio que ms publicaron sobre la
Grfica 1. Scopus https://www-scopus-
web profunda, el tercio restante son com.pbidi.unam.mx:2443/term/analyzer.uri?sid=820E17AEF
publicaciones del rea de las 13157EFC82E00AAFFEFBB95.y7ESLndDIsN8cE7qwvy6w
%3a10&origin=resultslist&src=s&s=TITLE-ABS-
Ciencias Sociales entre otros. KEY%28%22Deep+Web%22%29+AND+DOCTYPE%28ar
%29+AND+PUBYEAR+%3E+2011+AND+PUBYEAR+%3C
Tras dar lectura a los +2017&sort=plf-
f&sdt=b&sot=b&sl=25&count=85&analyzeResults=Analyze+
documentos encontrados se puede
results&txGid=0
observar que China es por mucho el
pas que ms investigaciones ha autores y las instituciones ms
realizado sobre la Deep Web del importantes en esta materia
2012 a 2016, aportando un total de publicaron la mayor parte de los El El
47 artculos cientficos mientras que El ao 2013 fue el ao de mayor
el segundo pas que ms public en actividad cientfica en cuanto a
este periodo de tiempo fue Estados artculos sobre la Deep Web, y fue
Unidos con un total de 11 artculos. tambin el ao en que el pas, los
autores y las instituciones ms
La importancia de China en la importantes en esta materia
investigacin sobre la Deep Web se publicaron la mayor parte de los
hizo ms evidente al descubrir que documentos publicados durante el
los 3 autores que ms han publicado periodo de 5 aos de nuestra
sobre la Deep Web con un total de investigacin inicial con un total de 27
14 artculos entre los tres en los artculos cientficos en 2013 y 17
ltimos 5 aos, Yong Feng, Huijuan artculos slo en china, el pas lder
Wang y Qingzhong Li, son de origen en investigacin cientfica sobre la
chino quienes publican en las revistas Deep Web.
ms prestigiosas de la regin
afiliadas a instituciones lderes en la Por consiguiente pareci
investigacin cientfica sobre la red pertinente basar la investigacin en
profunda tales como la Chongqing estos 17 artculos representativos de
University que aporto 7 publicaciones la base de datos Scopus.
durante en el periodo de tiempo antes
De los artculos consultados
mencionado. Lo anterior, sumado a
para esta investigacin, nos dimos
un hallazgo representado en la
cuenta que ms de la mitad de estos,
siguiente grfica:
proponan mtodos para numerosos
objetivos.
Documentos por ao
Dos de los mtodos principales
30
que se usan son los de pre-
20
El ao 2013 fue el ao de mayor clasificacin y clasificacin, ya sea
10 Document
actividad
0
cientfica en cuantoosapor ao para el ordenamiento de las bases de
artculos sobre la Deep Web, y fue datos y las interfaces de consulta de
tambin el ao en que el pas, los la Deep Web, esto con el objetivo de
hacer ms sencillo el estudio de las Por ltimo, es importante
mismas. mencionar que algunos de los
artculos estn basados o toman
Otro mtodo que se utiliz fue como referencia el mtodo de
el de anotacin semntica, con el ontologa, que cataloga las variables
cual se pretenda utilizar informacin necesarias para algn conjunto de
heurstica, mtodo para aumentar el datos y establece la relacin entre
conocimiento, para poder analizar los ellos.
datos de los resultados de consulta
de la Deep Web. Por otro lado, la bsqueda en
Red SciELO demostr que el estudio,
El mtodo de cascada, que en Latinoamrica (habla hispana),
ordena rigurosamente las etapas del sobre este tema es realmente
proceso para el desarrollo de escaso; sin embargo, el pas donde
software, que se utiliz para se publica ms del tema es en cuba
identificar automticamente interfaces con dos artculos y como segundo
de consulta de la Deep Web. lugar a Colombia con una
De igual manera se proponan publicacin.
mltiples mtodos que no tenan un En los artculos encontrados
nombre en especfico, pero que en se ve web profunda como una
algunos iban dirigidos a, detectar herramienta importante de bsqueda
automticamente el filtrado de datos de informacin: ya que segn los
anmalos en las interfaces de mayores buscadores de datos slo
consulta, la respuesta de consulta en almacenan entre un tercio y la mitad
lnea para la superposicin de las de los documentos disponibles para
fuentes, dar un marco de rastreo de el pblico en la red, dejando en claro
la Deep web basado en el las carencias de la organizacin de
reforzamiento del aprendizaje, para documentos por el difcil acceso a
extraer la estructura o la informacin este y habla de los principales
de las pginas de la Deep web y el buscadores de la Deep web as como
mtodo de construccin de la interfaz sus caractersticas.
basado en el algoritmo apriori.
Abordan tambin el hecho de
Los algoritmos tambin juegan lo amplia y vasta que es la Deep Web
un papel importante en estos en comparacin a la web visible, pero
mtodos, ya que algunos estn de ms complejos mecanismos de
basados en algoritmos ya existentes recuperacin documental ya que est
o bien desarrollan uno propio de poco, o nulamente indexada en los
acuerdo a las necesidades de cada motores comunes de bsqueda.
investigacin. Enfatizando que es necesario que los
cientficos tengan en cuenta realizar
bsquedas y utilizar sitios web y acceso a esta gran cantidad de
documentos con valides cientfica de informacin, as como los usos
origen en la web profunda. Tabin ilegales para los que se utiliza; la
profundiza y trata de advertir la investigacin y publicacin de un solo
existencia de nuevos mundos pas de Asia Oriental como lo es
comerciales donde todo es China en un ao roza los 20 artculos
negociable, sin que las autoridades cientficos acerca de la Deep Web.
puedan intervenir, comentando que la
Deep Web es el contenido secreto de Lo anterior infiere que el
internet que no est visible para los contexto en el que est situada cada
usuarios y que requiere vas distintas regin influye a que China que con
a los servicios tradicionales. una mayor industrializacin, una
mejor economa y sus constantes
Discusin esfuerzos por ser una nacin
destacada en innovacin y en
Este estudio implic una desarrollo cientfico y tecnolgico,
bsqueda y lectura de contenido de este ocupado por cmo extraer,
los artculos cientficos sobre la Deep documentar y analizar de manera
Web indexados en una de las ms ms eficiente el contenido de una
grandes bases de datos de literatura herramienta sumamente vasta como
cientfica revisada por pares, as lo es la Deep Web para utilizar esa
como de una de las bibliotecas informacin con el fin de seguir
virtuales ms importantes de lectura desarrollndose en el mbito
cientfica en Amrica Latina y el cientfico y tecnolgico; y a que los
Caribe. pases Latinoamericanos y del
El amplio contraste entre los Caribe, con otro tipo de problemticas
materiales encontrados en cada uno e intereses que tal vez no son, por el
de los recursos antes planteados momento, el desarrollo cientfico y
implica una panormica amplia sobre tecnolgico, no estn interesado o
la visin, problemticas o intereses bien, no cuenten con los recursos
polticos, econmicos y sociales que fsicos, econmicos y humanos para
cada regin vive. Es considerable el hacer ms investigacin acerca de
contraste, en primer lugar, de este enorme repositorio de
cantidad de contenido ya que informacin de diferentes naturalezas
mientras la investigacin y y que por tanto an no profundicen en
publicacin sobre la Deep Web en 15 mtodos para la extraccin de
pases de Amrica Latina y el Caribe informacin contenida en la Deep
no rebasan las 5 publicaciones que Web de manera eficiente y eficaz
apenas abordan en qu es la Deep para su desarrollo en la ciencia y
web, los usos que se lo podran dar y tecnologa.
la relevancia que tendra tener
Reconocimientos

Gracias al profesor Jorge


Alberto Lizama Mendoza por su
valiosa ayuda para poder entender
mejor el contexto que rodea a la
Deep Web; al profesor Jorge Prez
Gmez por la constante revisin,
consejos y ayuda incondicional que
recibimos de su parte.

You might also like