Unsupervised Object Classification for User Interfaces

Studiengänge: Informatik, Informationstechnik

Hintergrund:

Benutzeroberflächen sind reich an visuellen Eigenschaften, wie Symbolen, Texten, Farbkombinationen. Aktuell werden diese visuellen Eigenschaften nur durch Menschen benutzt, als Kommunikationsmittel zwischen Mensch und Maschine. Algorithmen greifen meist auf den darunterliegenden Quelltext, bspw. HTML, zu. Dies führt dazu, dass Algorithmen eine UI anders wahrnehmen und verarbeiten als Menschen. Dies ist vor allem problematisch im Bereich Software Testing, bei denen Programmierer menschliche Intentionen wie ‘klick auf den login button’ in Quelltext umsetzen müssen, um das Verhalten des Nutzers zu simulieren. Aktuelle Verfahren, die visuelle und sprachliche Eigenschaften vereinen, wie z.B. Image Captioning, Visual Reasoning oder auch Visual Question Answering, sind ohne gute visuelle Repräsentationen nicht möglich. Ein manuelles Annotieren der Benutzeroberflächen ist sehr aufwendig und erzeugt hohe Kosten.

In jüngster Zeit werden vermehrt Algorithmen zur unüberwachten Bildklassifikation entwickelt und verbessert. Diese werden auf Bilddaten, die in sozialen Netzwerken entstehen angewendet, um so den manuellen Annotierungsaufwand zu vermeiden. Einzelne Elemente der Benutzeroberfläche können anhand des Quelltextes aus dem Bild ausgeschnitten werden und anschließend einer unüberwachte Bildklassifikation unterzogen werden. Dies würde den Annotierungsaufwand reduzieren und visuell-sprachliche Probleme auf die Domäne der Benutzeroberflächen transferieren.

Ihre Aufgabe

Recherche zum Stand der Technik und Wissenschaft
Entwickeln eines Web Scrapers
Implementierung eines unsupervised Klassifizierungsalgorithmus
Evaluierung des Algorithmus auf verschiedenen Datensätzen
Wissenschaftliche Aufbereitung und Dokumentation

Wir bieten

Intensive Betreuung
Arbeiten mit Start Up
Eine angenehme Arbeitsatmosphäre und konstruktive Zusammenarbeit

Wir erwarten

Selbstständiges Denken und Arbeiten
Kenntnisse in Python (Tensorflow oder Keras)
Kenntnisse neuronaler Netze

Neugierig? Kontaktieren Sie: Dominik Klotz dominik.klotz@askyourui.com Yexu Zhou zhou@teco.edu

Referenz:

[1] SCAN: Learning to Classify Images without Labels: https://arxiv.org/pdf/2005.12320.pdf

[2] Unsupervised Pre-Training of Image Features on Non-Curated Data: https://arxiv.org/pdf/1905.01278.pdf

[3] A Simple Framework for Contrastive Learning of Visual Representation: https://arxiv.org/pdf/2002.05709.pdf

[4] Bootstrap your own latent: A new approach to self-supervised Learning: https://arxiv.org/pdf/2006.07733.pdf

[5] Deep Clustering for Unsupervised Learning of Visual Features: https://arxiv.org/pdf/1807.05520.pdf

[6] Self-labelling via simultaneous clustering and representation learning: https://arxiv.org/pdf/1911.05371.pdf

[7] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments: https://arxiv.org/abs/2006.09882

[8] Unsupervised Object Detection with LiDAR Clues: https://arxiv.org/pdf/2011.12953.pdf

Datasets:

UIQA-Dataset
askui-Dataset