Please use this identifier to cite or link to this item:
http://hdl.handle.net/10553/59914
Title: | DAWEB: un descargador y analizador morfológico de páginas web | Authors: | Rodríguez Batista, Gustavo Manuel Hernández Figueroa, Zenón José Santana Suárez, Octavio |
UNESCO Clasification: | 57 Lingüística 570104 Lingüística informatizada |
Keywords: | Morfología Análisis de textos Internet Lingüística computacional Morphology, et al |
Issue Date: | 2003 | Journal: | Procesamiento de Lenguaje Natural | Abstract: | DAWeb es una aplicación informática desarrollada como parte de un proyecto
consagrado a la realización de herramientas capaces de facilitar el aprovechamiento para la
realización de estudios lingüísticos del enorme caudal de información que ofrece Internet. Es
una herramienta orientada al análisis morfosintáctico de grandes volumenes de información —
dominios completos— a los que se accede por una o varias URL de partida. Está dotada de una
sencilla interfaz que permite establecer las acciones pertinentes sobre la información accedida.
Como resultado de los análisis realizados, se genera un conjunto estructurado de datos que
pueden estudiarse con facilidad. DAWeb is a computer application developed as part of a project oriented to produce tools designed to get at the big flow of linguistic information of Internet documents. It is a tool for morphosyntactic analysis of great volumes of information —whole domains— reached by its URLs. The simple application interfaz facilitates the configururation of how to accessing and analysing the information obtained. The results of the process are organized in a suitable way for posterior research. |
URI: | http://hdl.handle.net/10553/59914 | ISSN: | 1135-5948 | Source: | Procesamiento del lenguaje natural [ISSN 1135-5948] (30), p. 75-88 | URL: | http://dialnet.unirioja.es/servlet/articulo?codigo=647527 |
Appears in Collections: | Artículos |
Page view(s)
150
checked on Aug 3, 2024
Download(s)
262
checked on Aug 3, 2024
Google ScholarTM
Check
Share
Export metadata
Items in accedaCRIS are protected by copyright, with all rights reserved, unless otherwise indicated.