Titelaufnahme
Titelaufnahme
- TitelWeb corpus mining by instance of Wikipedia
- Verfasser
- Erschienen
- SpracheEnglisch
- DokumenttypKonferenzband
- URN
Zugriffsbeschränkung
- Das Dokument ist frei verfügbar
Links
- Social MediaShare
- NachweisKein Nachweis verfügbar
- IIIF
Dateien
Klassifikation
Abstract
In this paper we present an approach on structure learning in the area of web documents. This is done in order to approach the goal of webgenre tagging in the area of web corpus linguistics. A central outcome of the paper is that purely structure oriented approaches to web document classification provide an information gain which may be utilized in combined approaches of web content and structure analysis.
Statistik
- Das PDF-Dokument wurde 7 mal heruntergeladen.