Investigación documental sobre la Deep Web y sus usos alrededor del mundo. En qué países es más usado, qué usos le dan, cuánta información es utilizada.
Investigación documental sobre la Deep Web y sus usos alrededor del mundo. En qué países es más usado, qué usos le dan, cuánta información es utilizada.
Investigación documental sobre la Deep Web y sus usos alrededor del mundo. En qué países es más usado, qué usos le dan, cuánta información es utilizada.
La Deep Web es aquella parte que requieren un alto grado de de la red que contiene material, seguridad, investigacin, seguridad informacin y pginas web que no nacional, etc. estn indexadas en ninguno de los buscadores existentes como pueden Al ser demasiada la ser Bing, Google, Yahoo, etc; en la informacin contenida en la red actualidad, estudios de la Universidad profunda y mnima la poblacin que de Berkeley estiman que la Internet conoce y tiene acceso dicha profunda tiene un tamao de informacin, es natural preguntarse aproximadamente 91,000 TeraBytes: qu uso le estn dando a este se estima que la mayora de la enorme recurso. Por eso el motivo de poblacin conoce slo el 4% de todo este artculo es descubrir de qu el contenido de internet. manera hablan acerca de la deep web autoridades cientficas y qu uso La finalidad de la Deep Web es le dan a la misma. Conocimiento mantener el anonimato, una de las elaborado por revistas cientficas con formas ms famosas y fciles de altos estndares de calidad ya que navegar es a travs de es The Onion esta informacin puede ser Router (TOR), esta es una plataforma indispensable para innumerables creada por el Laboratorio Naval de hallazgos en beneficio de la sociedad. EE.UU., que posibilita ocultar la direccin IP y otros datos relacionados con la identidad del usuario, y que funciona utilizando Materiales y mtodos distintos niveles de codificacin. Para la presente investigacin Ciertas partes de Deep Web son utilizamos el siguiente mtodo de tcnicamente inaccesibles a travs de bsqueda y lectura de artculos los medios tradicionales, por lo que cientficos indexados en Scopus y se convierte en un lugar protegido y Red SciELO. En la bsqueda inicial, seguro para que cibercriminales o se pretenda encontrar informacin sujetos de toda ndole realicen sobre la Deep Web en artculos actividades ilegales. cientficos indexados en Scopus A diferencia de lo que se cree, publicados en los ltimos 5 aos. Una la Deep Web no es usada vez que se accedi a la base de nicamente para realizar o efectuar datos Scopus, con ayuda de los actividades ilcitas, a esta pequea operados boleados () se busc el parte se le conoce como Dark Web, trmino Deep Web limitando la en cambio existen otros usos que se bsqueda a los ltimos 5 aos, del le da a este recurso s el de 2012 al 2016, limitado a artculos como tipo de documento. Dicha Shi, H., Guo, J., Chen, Y. and bsqueda arroj un total de 85 Ni, D. (2013). Deep web resultados de 40 diferentes revistas database classification based on tuple-matching. Journal of de 24 distintos territorios y pases que Computational Information han publicado artculos cientficos Systems, [online] 9(17), sobre la Deep web en los ltimos 5 pp.6775-6783. aos. Despus de dar lectura a los Wang, T., Li, G., Duan, Q., artculos encontrados a pesar de su Liu, Y. and Chen, X. (2013). Deep Web integrated query innegable relevancia, decidimos interface construction refinar an ms la bsqueda al ao method based on Apriori resultando ahora un total de 27 Algorithm. Journal of artculos, y al territorio en el que ms Information and se public sobre la Deep Web Computational Science, quedando un total final de 17 10(15), pp.5063-5075. Li, X., Cui, Z., Zhao, P. and artculos siendo stos los ms Mao, J. (2013). Retrieving relevantes y representativos para deep web data based on nuestra investigacin. heuristic hierarchy tree model. Journal of Por otro lado la bsqueda en la Computational Information biblioteca virtual Red SciELO la Systems, 9(16), pp.6685- bsqueda se realiz de la siguiente 6692. manera: En el buscador de artculos Qiang, B., Shi, L., He, Q., Wang, Y. and Li, W. (2013). se ingres las palabras Deep Web Integrating Deep Web based usando el mtodo integrada filtrando on domain ontology. Journal la bsqueda a regional en todos los of Computational ndices arrojando como resultado 34 Information Systems, 9(15), documentos. Hecho siguiente se pp.6259-6267. aplic el filtro de idioma a espaol Feng, Y. and Wang, H. (2013). Deep web query obteniendo un resultado de 14 result pages content documentos de los cuales extraction based on seleccionamos los que realmente combination of vision and hablaban de la Deep Web quedando tag information. Information as 3 artculos en idioma espaol. (Japan), 16(6), pp.3635- 3641. Tabla 1. Feng, Y. and Lu, W. (2013). Heuristics-based semantic Materiales LIU, L. and PENG, T. (2013). annotation for deep web Scopus Post-processing of Deep Web query results. Journal of Information Extraction Based Computational Information on Domain Ontology. Systems, 9(14), pp.5685- Advances in Electrical and 5692. Computer Engineering, 13(4), Li, Y., Wang, Y., Jiang, P. and pp.25-32. Zhang, Z. (2013). Multi- objective optimization domain-specific deep web integration of query databases. J Intell Inf Syst, interfaces for the Deep Web 40(1), pp.159-184. based on attribute Yong, F., Xiao, D. and Hong, constraints. Data & X. (2013). A calculation Knowledge Engineering, 86, method of Deep Web pp.38-60. entities recognition. Journal Duan, Q., Yang, R. and Chen, of Theoretical and Applied Y. (2013). Automatic Information Technology, Identifying Query Interfaces 47(3), pp.1255-1259. of Deep Web Based on Zhang, Y., Li, Q., Zhang, R. PreClassification-SVM. and Lin, P. (2013). Novel Sensor Letters, 11(6), Method of Web Database pp.1389-1395. Redundancy Computing for Liu, Z. and Wang, J. (2013). Web Data Sources Selection. Principles and Model for Information Technology J., Web Dataspace. JCP, 8(4). 12(19), pp.5216-5220. Zheng, Q., Wu, Z., Cheng, X., Red SciELO Martnez Larrarte, J. (2015). Jiang, L. and Liu, J. (2013). Nuestra vlida Web Learning to crawl deep web. profunda. Revista Cubana de Information Systems, 38(6), Reumatologa, 17(3), pp.169- pp.801-819. 170. Zhang, Z., Du, J. and Wang, L. Bautista Luzardo, D. (2014). (2013). Formal concept Deep web: aproximaciones a analysis approach for data la ciber irresponsabilidad. extraction from a limited Revista Latinoamericana de deep web database. J Intell Biotica, 15(28-1), p.26. Inf Syst, 41(2), pp.211-234. Rodrguez Perojo, K. and Wang, H., Xu, Q., Chen, Y. Ronda Len, R. (200 and Lan, J. (2013). A feature- 6). El web como sistema de weighted instance-based informacin. ACIMED, 14(1). learner for deep web search interface identification. Research Journal of Applied Resultados Sciences, Engineering and Technology, 5(4), pp.1278- Los documentos encontrados 1283. en Scopus resultaron ser de diversas Zhu, G., Wang, N. and Wang, temticas abarcando ms de 11 H. (2013). An improved reas de estudio entre las cuales las method for Deep Web sources classification based ciencias exactas predominan con dos on the theme and form terceras partes de los 85 artculos attributes. Tien Tzu Hsueh publicados en los ltimos 5 aos, Pao/Acta Electronica Sinica, ciencias de la computacin, 41(2), pp.260-266. ingenieras, matemticas, medicina, Li, Y., Wang, Y. and Du, J. entre otras fueron las reas de (2012). E-FFC: an enhanced form-focused crawler for estudio que ms publicaron sobre la Grfica 1. Scopus https://www-scopus- web profunda, el tercio restante son com.pbidi.unam.mx:2443/term/analyzer.uri?sid=820E17AEF publicaciones del rea de las 13157EFC82E00AAFFEFBB95.y7ESLndDIsN8cE7qwvy6w %3a10&origin=resultslist&src=s&s=TITLE-ABS- Ciencias Sociales entre otros. KEY%28%22Deep+Web%22%29+AND+DOCTYPE%28ar %29+AND+PUBYEAR+%3E+2011+AND+PUBYEAR+%3C Tras dar lectura a los +2017&sort=plf- f&sdt=b&sot=b&sl=25&count=85&analyzeResults=Analyze+ documentos encontrados se puede results&txGid=0 observar que China es por mucho el pas que ms investigaciones ha autores y las instituciones ms realizado sobre la Deep Web del importantes en esta materia 2012 a 2016, aportando un total de publicaron la mayor parte de los El El 47 artculos cientficos mientras que El ao 2013 fue el ao de mayor el segundo pas que ms public en actividad cientfica en cuanto a este periodo de tiempo fue Estados artculos sobre la Deep Web, y fue Unidos con un total de 11 artculos. tambin el ao en que el pas, los autores y las instituciones ms La importancia de China en la importantes en esta materia investigacin sobre la Deep Web se publicaron la mayor parte de los hizo ms evidente al descubrir que documentos publicados durante el los 3 autores que ms han publicado periodo de 5 aos de nuestra sobre la Deep Web con un total de investigacin inicial con un total de 27 14 artculos entre los tres en los artculos cientficos en 2013 y 17 ltimos 5 aos, Yong Feng, Huijuan artculos slo en china, el pas lder Wang y Qingzhong Li, son de origen en investigacin cientfica sobre la chino quienes publican en las revistas Deep Web. ms prestigiosas de la regin afiliadas a instituciones lderes en la Por consiguiente pareci investigacin cientfica sobre la red pertinente basar la investigacin en profunda tales como la Chongqing estos 17 artculos representativos de University que aporto 7 publicaciones la base de datos Scopus. durante en el periodo de tiempo antes De los artculos consultados mencionado. Lo anterior, sumado a para esta investigacin, nos dimos un hallazgo representado en la cuenta que ms de la mitad de estos, siguiente grfica: proponan mtodos para numerosos objetivos. Documentos por ao Dos de los mtodos principales 30 que se usan son los de pre- 20 El ao 2013 fue el ao de mayor clasificacin y clasificacin, ya sea 10 Document actividad 0 cientfica en cuantoosapor ao para el ordenamiento de las bases de artculos sobre la Deep Web, y fue datos y las interfaces de consulta de tambin el ao en que el pas, los la Deep Web, esto con el objetivo de hacer ms sencillo el estudio de las Por ltimo, es importante mismas. mencionar que algunos de los artculos estn basados o toman Otro mtodo que se utiliz fue como referencia el mtodo de el de anotacin semntica, con el ontologa, que cataloga las variables cual se pretenda utilizar informacin necesarias para algn conjunto de heurstica, mtodo para aumentar el datos y establece la relacin entre conocimiento, para poder analizar los ellos. datos de los resultados de consulta de la Deep Web. Por otro lado, la bsqueda en Red SciELO demostr que el estudio, El mtodo de cascada, que en Latinoamrica (habla hispana), ordena rigurosamente las etapas del sobre este tema es realmente proceso para el desarrollo de escaso; sin embargo, el pas donde software, que se utiliz para se publica ms del tema es en cuba identificar automticamente interfaces con dos artculos y como segundo de consulta de la Deep Web. lugar a Colombia con una De igual manera se proponan publicacin. mltiples mtodos que no tenan un En los artculos encontrados nombre en especfico, pero que en se ve web profunda como una algunos iban dirigidos a, detectar herramienta importante de bsqueda automticamente el filtrado de datos de informacin: ya que segn los anmalos en las interfaces de mayores buscadores de datos slo consulta, la respuesta de consulta en almacenan entre un tercio y la mitad lnea para la superposicin de las de los documentos disponibles para fuentes, dar un marco de rastreo de el pblico en la red, dejando en claro la Deep web basado en el las carencias de la organizacin de reforzamiento del aprendizaje, para documentos por el difcil acceso a extraer la estructura o la informacin este y habla de los principales de las pginas de la Deep web y el buscadores de la Deep web as como mtodo de construccin de la interfaz sus caractersticas. basado en el algoritmo apriori. Abordan tambin el hecho de Los algoritmos tambin juegan lo amplia y vasta que es la Deep Web un papel importante en estos en comparacin a la web visible, pero mtodos, ya que algunos estn de ms complejos mecanismos de basados en algoritmos ya existentes recuperacin documental ya que est o bien desarrollan uno propio de poco, o nulamente indexada en los acuerdo a las necesidades de cada motores comunes de bsqueda. investigacin. Enfatizando que es necesario que los cientficos tengan en cuenta realizar bsquedas y utilizar sitios web y acceso a esta gran cantidad de documentos con valides cientfica de informacin, as como los usos origen en la web profunda. Tabin ilegales para los que se utiliza; la profundiza y trata de advertir la investigacin y publicacin de un solo existencia de nuevos mundos pas de Asia Oriental como lo es comerciales donde todo es China en un ao roza los 20 artculos negociable, sin que las autoridades cientficos acerca de la Deep Web. puedan intervenir, comentando que la Deep Web es el contenido secreto de Lo anterior infiere que el internet que no est visible para los contexto en el que est situada cada usuarios y que requiere vas distintas regin influye a que China que con a los servicios tradicionales. una mayor industrializacin, una mejor economa y sus constantes Discusin esfuerzos por ser una nacin destacada en innovacin y en Este estudio implic una desarrollo cientfico y tecnolgico, bsqueda y lectura de contenido de este ocupado por cmo extraer, los artculos cientficos sobre la Deep documentar y analizar de manera Web indexados en una de las ms ms eficiente el contenido de una grandes bases de datos de literatura herramienta sumamente vasta como cientfica revisada por pares, as lo es la Deep Web para utilizar esa como de una de las bibliotecas informacin con el fin de seguir virtuales ms importantes de lectura desarrollndose en el mbito cientfica en Amrica Latina y el cientfico y tecnolgico; y a que los Caribe. pases Latinoamericanos y del El amplio contraste entre los Caribe, con otro tipo de problemticas materiales encontrados en cada uno e intereses que tal vez no son, por el de los recursos antes planteados momento, el desarrollo cientfico y implica una panormica amplia sobre tecnolgico, no estn interesado o la visin, problemticas o intereses bien, no cuenten con los recursos polticos, econmicos y sociales que fsicos, econmicos y humanos para cada regin vive. Es considerable el hacer ms investigacin acerca de contraste, en primer lugar, de este enorme repositorio de cantidad de contenido ya que informacin de diferentes naturalezas mientras la investigacin y y que por tanto an no profundicen en publicacin sobre la Deep Web en 15 mtodos para la extraccin de pases de Amrica Latina y el Caribe informacin contenida en la Deep no rebasan las 5 publicaciones que Web de manera eficiente y eficaz apenas abordan en qu es la Deep para su desarrollo en la ciencia y web, los usos que se lo podran dar y tecnologa. la relevancia que tendra tener Reconocimientos
Gracias al profesor Jorge
Alberto Lizama Mendoza por su valiosa ayuda para poder entender mejor el contexto que rodea a la Deep Web; al profesor Jorge Prez Gmez por la constante revisin, consejos y ayuda incondicional que recibimos de su parte.