Institut für Programmstrukturen und Datenorganisation

Terminkalender

ABBRECHEN || neuen Vortrag anmelden | Vorträge durchsuchen
Monat zurück | Vorträge dieser Monat | Monat vor


Fr, 07.04.2017 Herr Lukas Reister (Bachelorthesis) ID: 100281
Improving the Interpretation of Outlier Scores in Subspaces
Betreuer: Holger Trittenbach
Kurzfassung:
Ausreißer bezeichnen, im Vergleich zum Rest, ungewöhnliche Daten in einem Datensatz. Um Ausreißer zu finden gibt es Ausreißer-Modelle die verschiedene Eigenschaften, wie Dichte oder Winkel, der Daten ausnutzen. Viele der Modelle berechnen einen Score zu jedem Datum, um die Ausreißereigenschaft zu quantifizieren. Scores hängen sowohl von Modell als auch den Daten ab und lassen sich oftmals schlecht vergleichen oder kombinieren. In hochdimensionalen Daten funktionieren diese Modelle nicht mehr gut. Man sucht daher in niedrig dimensionalen Projektionen, sogenannten Subspaces, nach Ausreißern. Diese Arbeit untersucht, wie durch Skalieren und Kombinieren der Scores aus den verschiedenen Subspaces ein bestmöglicher finaler Score berechnet werden kann. Es wird untersucht welche Kombination (z.B. Maximum oder Summation) und Skalierung die Qualität der Scores verbessern kann. Dabei können dem Nutzer zusätzliche Informationen, wie z.B. der Subspace mit höchstem Score, als Information bereitgestellt werden.
Passwort:  
 
Frau Henrike Hardt (Bachelorthesis) ID: 100293
Untersuchung der Unterschiede in den Sprachkorporas des Google Books Ngrams-Datensatzes anhand geschichtlicher Ereignisse
Betreuer: Jens Willkomm
Kurzfassung:
Es gibt bereits viele Veröffentlichungen, die den Google Books Ngram-Datensatz verwenden um z.B. eigene Hypothesen zu beweisen. Die meisten dieser Veröffentlichungen nutzen jedoch nur den englischen Sprachkorpus für ihre Beweise. Anschließend werden diese Ergebnisse als global und allgemeingültig dargestellt. Dabei umfasst der Datensatz elf verschiedene Sprachkorpora. An dieser Stelle stellt sich die Frage, ob die Sprachkopora inhaltlich wirklich alle gleich sind. Diese Bachelorarbeit beschäftigt sich damit wie inhaltliche Unterschiede in den Sprachkorporas festgestellt werden können und gibt für ausgewählte Sprachkopora an ob und wie stark sich diese voneinander unterscheiden.
Passwort:  

Fr, 21.04.2017 Herr Christian Ostapczuk (Bachelorthesis) ID: 100292
Unbiased Estimating Mutual Information on Data Streams in Finance
Betreuer: Vadim Arzamasov
Kurzfassung:
Mutual Information (MI) is an established concept which allows us to quantify mutual dependence of two variables. But conventional MI estimators cannot be used on data streams. In this presentation we will present two new approaches for MI estimation on data streams. Both will be compared to the MISE framework, which is an already existing/published MI estimator. We will show that the new approaches can be used to improve MI estimation on streams in regard to calculation speed, memory consumption and accuracy of estimations.
Passwort:  
 
Herr Adrian Englhardt (Masterthesis) ID: 100294
Improving Semantic Change Analysis by Combining Word Embedding Models with Word Frequencies
Betreuer: Jens Willkomm
Kurzfassung:
Language is in constant flux and humans invent or adopt words, while others vanish. Advances in modeling language with word embeddings and the publication of the large diachronic Google Books N-Gram dataset enabled exhaustive analyzes on detecting semantic changes. Previous work trained different types of embeddings and the required alignment for model comparison over time was treated differently. In this thesis the different approaches are unified and compared quantitatively on a therefore specifically created synthetic corpus. It has been proven that frequency negatively correlates with rate of semantic change and we tackle this problem by merging similarity and frequency over time. Additionally, we propose a multidimensional change detection method based on cumulative sums to handle the problem of short time series. After testing various settings on the synthetic corpus we move on to the Books dataset and are able to correctly detect words and exact years of semantic shifts.
Passwort:  

Fr, 28.04.2017 Frau Jasmin Tischner (Bachelorthesis) ID: 100278
Interaktion in kooperativen Modellierungsumgebungen
Betreuer: Stephan Seifermann
Kurzfassung:
Zur Verbesserung der Kooperation in Software-Entwicklungsteams, welche aus Entwicklern mit und ohne Sehschaedigung bestehen, bedarf es barrierefreier Werkzeuge zur Darstellung von aenderungen an UML-Diagrammen. In Teamdiskussionen ist es weiterhin erforderlich, Zeigegesten, die von den sehenden Entwicklern genutzt werden, auch fuer sehgeschaedigte Entwickler zugaenglich zu machen. Herangezogene Arbeiten boten kein Werkzeug oder Konzept, um auf dem Standpunkt der Barrierefreiheit eine aenderungsdarstellung von UML-Diagrammen und eine uebertragung von Zeigegesten zu ermoeglichen. In dieser Arbeit wurde daher ein Konzept entwickelt, das diese Anforderungen umsetzt. Zusaetzlich benoetigt das entwickelte Konzept einen sehr geringen Einarbeitungsaufwand.
Passwort:  
 
Herr Jonas Paczia (Bachelorthesis) ID: 100280
Automatisierte Ahnlichkeitsanalyse der Ereignisketten im naturlichsprachlichen Dialogsystem
Betreuer: Alexander Wachtel
Kurzfassung:
In dieser Arbeit wurde eine Schnittstelle zwischen dem natirlichsprachlichen Dialogsystem JustLingo und der Microsoft Excel API implementiert. JustLingo ermoglicht es, dem Benutzer mittels naturlicher Sprache Operationen zu beschreiben und im Excel auszufuhren. Motiviert durch das grosse Potential der vielfaltigen Interaktionsmoglichkeiten, insbesondere bei der Verwendung von Diagrammen, wurde ein Hybrid-System fur eine Interaktion mit naturlichsprachlichen Eingaben und Gesten entwickelt. Hierzu wird die API Dokumentation von Excel dynamisch zur Laufzeit eingelesen und im weiteren Verlauf mit das hybride System angesprochen. Die Benutzer konnen zur Laufzeit bestehende Interaktionen zu neuen Aktionen zusammenfassen, welche fur die spatere Verwendung gespeichert werden konnen. Durch das hybride System konnten im Rahmen einer Nutzerstudie von mehreren Aufgaben mehr als 80% gelost werden.
Passwort:  
 
Herr Sandro Koch (Masterthesis) ID: 100282
Automatische Vorhersage von Aenderungsausbreitungen am Beispiel von Automatisierungssystemen
Betreuer: Robert Heinrich
Kurzfassung:
Das KAMP-Framework bestimmt anhand der Architektur eines Systems, wie sich eine Aenderung durch dieses propagiert. Zum aktuellen Zeitpunkt umfassen die Domaenen, die mit KAMP analysiert werden koennen, die Softwaredomaene und Geschaeftsprozesse. Diese Arbeit evaluiert die Moeglichkeit, ob das KAMP-Framework derart erweitert werden kann, dass es auch in der Domaene der automatisierten Produktionssysteme aPS Einsatz findet. Auf der Basis einer bestehenden Produktionsanlage der TUM wird das Framework erweitert, dass zuvor definierte Aenderungsszenarien evaluiert werden koennen. Bisher wurde die Aenderungsausbreitung in aPS auf Hardwareebene betrachtet, entkoppelt von der darauf eingesetzten Software. Hier wird eine bisher nicht betrachtete Moeglichkeit aufgezeigt, wie bei der Aenderungsausbreitung sowohl Hardware als auch Software gemeinsam untersucht werden koennen. Dazu wird jeweils ein Metamodell fuer die Anlage, eines fuer die Software und eines fuer die Auslieferung der Software auf die Hardware vorgestellt. Darueber hinaus werden Ausbreitungsregeln heraus gearbeitet, so dass die Aenderungspropagation eines aPS berechnet werden kann.
Passwort: