Please use this identifier to cite or link to this item: http://hdl.handle.net/10553/59914
Title: DAWEB: un descargador y analizador morfológico de páginas web
Authors: Rodríguez Batista, Gustavo Manuel 
Hernández Figueroa, Zenón José 
Santana Suárez, Octavio 
UNESCO Clasification: 57 Lingüística
570104 Lingüística informatizada
Keywords: Morfología
Análisis de textos
Internet
Lingüística computacional
Morphology, et al
Issue Date: 2003
Journal: Procesamiento de Lenguaje Natural
Abstract: DAWeb es una aplicación informática desarrollada como parte de un proyecto consagrado a la realización de herramientas capaces de facilitar el aprovechamiento para la realización de estudios lingüísticos del enorme caudal de información que ofrece Internet. Es una herramienta orientada al análisis morfosintáctico de grandes volumenes de información — dominios completos— a los que se accede por una o varias URL de partida. Está dotada de una sencilla interfaz que permite establecer las acciones pertinentes sobre la información accedida. Como resultado de los análisis realizados, se genera un conjunto estructurado de datos que pueden estudiarse con facilidad.
DAWeb is a computer application developed as part of a project oriented to produce tools designed to get at the big flow of linguistic information of Internet documents. It is a tool for morphosyntactic analysis of great volumes of information —whole domains— reached by its URLs. The simple application interfaz facilitates the configururation of how to accessing and analysing the information obtained. The results of the process are organized in a suitable way for posterior research.
URI: http://hdl.handle.net/10553/59914
ISSN: 1135-5948
Source: Procesamiento del lenguaje natural [ISSN 1135-5948] (30), p. 75-88
URL: http://dialnet.unirioja.es/servlet/articulo?codigo=647527
Appears in Collections:Artículos
Thumbnail
Adobe PDF (163,76 kB)
Show full item record

Google ScholarTM

Check


Share



Export metadata



Items in accedaCRIS are protected by copyright, with all rights reserved, unless otherwise indicated.