Language recognition in the sliding window model

Ganardi, Moses

Titelaufnahme

Titel
Language recognition in the sliding window model
Titel-Übersetzung
Formale Sprachen im Sliding-Window-Modell
Verfasser
Ganardi, Moses
Betreuer
Lohrey, Markus
Erschienen
2019
Verteidigung
2019-10-16
Sprache
Englisch
Dokumenttyp
Dissertation
Schlagwörter
Streaming <Kommunikationstechnik> / streaming algorithms / sliding windows / formal languages and automata theory
URN
urn:nbn:de:hbz:467-15234
DOI
10.25819/ubsi/464

Zugriffsbeschränkung

Das Dokument ist frei verfügbar

Links

Social Media

Share
Nachweis
DigiBib
IIIF
IIIF-Manifest

Dateien

Language recognition in the sliding window model [pdf 1.69 mb]
RIS

Klassifikation

Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Datenverarbeitung; Informatik

Abstract

In many streaming applications recent elements in the stream are considered more important than older elements. In the sliding window model we are given an unbounded stream of elements and the goal is to maintain a data structure which allows performing a certain query (e.g. computing a numerical quantity or verifying a property) on the set or sequence of the last n elements. The number n is called the window size, which can be either a fixed number or controlled online. The challenge is to devise streaming algorithms which avoid maintaining the window explicitly using Θ(n) space.

This thesis considers the language recognition problem in the sliding window problem: Given a formal language (in other words, a property) and a stream of symbols, maintain a small data structure which allows testing whether the current window, i.e. the suffix of length n, belongs to the language (satisfies the property). The main question that we aim to answer is: Which languages admit sliding window algorithms using sublinear space?

The first main result is a space trichotomy (constant, logarithmic, linear) for the space complexity
of regular languages in the fixed- and the variable-size sliding window model, together with language-theoretic descriptions of the space classes. We also study the uniform setting where the regular language is considered as part of the input. On this basis we extend these results in various directions: (i) randomness, (ii) approximation, and (iii) subclasses of context-free languages. We prove a quatrochotomy for the randomized space complexity of regular languages. Concerning approximation, we present a constant-space sliding window property tester for every regular language, which distinguishes between words in the language and words that have large Hamming distance from the language. Finally, we give partial results on context-free languages over sliding windows and extend the space trichotomy for regular languages to the class of visibly pushdown languages.

Zusammenfassung

In vielen Streaminganwendungen sind neue Datenelemente wichtiger als ältere Elemente. Im Sliding-Window-Modell ist die Eingabe ein unbeschränkter Strom von Elementen und das Ziel ist es eine Datenstruktur aufrechtzuerhalten, die es erlaubt gewisse Anfragen (Berechnung von Statistiken oder Überprüfen einer Eigenschaft) an die Menge oder die Folge der letzten n Elemente auszuführen. Die Zahl n ist die sogenannte Fensterlänge, die entweder fixiert ist oder online kontrolliert wird. Die Herausforderung besteht darin Streamingalgorithmen zu entwerfen, die die explizite Speicherung des Fensters in Θ(n) Bits vermeidet.

Diese Arbeit befasst sich mit dem Membershipproblem für formale Sprachen im Sliding-Window-Modell: Gegeben eine formale Sprache (in anderen Worten: eine Eigenschaft) und ein Strom von Symbolen, gesucht ist eine kompakte Datenstruktur, die über dem Strom aufrechterhalten werden kann und es erlaubt zu testen, ob das aktuelle Fenster zur Sprache gehört bzw. die Eigenschaft erfüllt. Die Hauptfrage, die wir uns stellen, lautet: Für welche Sprachen gibt es einen Sliding-Window-Algorithmus mit sublinearem Platz?

Das erste Hauptergebnis ist eine Trichotomie (konstant, logarithmisch, linear) für die Platzkomplexität von regulären Sprachen in dem Sliding-Window-Modell mit fester und variable Fensterlänge. Außerdem werden die Platzklassen sprachentheoretisch beschrieben. Wir betrachten auch das uniforme Problem, bei dem die reguläre Sprache Teil der Eingabe ist. Anschließend werden diese Ergebnisse in verschiedene Richtungen erweitert: (i) Randomisierung, (ii) Approximation und (iii) Teilklassen von kontextfreien Sprachen. Wir beweisen eine Quatrochotomie für die randomisierte Platzkomplexität von regulären Sprachen. Als einen möglichen Approximationsansatz präsentieren wir einen Sliding-Window-Property-Tester mit konstantem Platz für jede reguläre Sprache, der Wörter in der Sprache von Wörtern mit großer Hammingdistanz von der Sprache unterscheidet. Zuletzt untersuchen wir kontextfreie Sprachen im Sliding-Window-Modell und erweitern die Platztrichotomie für reguläre Sprachen auf die Teilklasse der Visibly-Pushdown-Sprachen.

Inhalt

Inhalt des Werkes

Statistik

Das PDF-Dokument wurde 22 mal heruntergeladen.

Lizenz-/Rechtehinweis

Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International Lizenz

Detailsuche

Bibliotheken

Projekt

Impressum

Datenschutz

Titelaufnahme