clunc 2016 – Neues von der Computerlinguistik

 

Die diesjährige dritte clunc 2016 fand am 11. und 12. März 2016 in Stuttgart statt und versammelte zahlreiche am Themengebiet der automatischen Textgenerierung  interessierte Zuhörer. Auf der Computational Linguistics Unconference von aexea treffen Germanisten auf Web-Entwickler, Linguisten auf Programmierer und Marketingfachleute auf Suchmaschinenoptimierer. Den Anfang machte Dr. Michael Steinbrecher mit seiner Keynote zu den Chancen und Risiken von Big Data in unserem alltäglichen Leben. In dem anschließenden Vortrag von Simon Pokorny wurde gezeigt, wie bei home24 mittels automatisch erstellter Produktbeschreibungen die Conversion Rate verbessert werden konnte.

Im Laufe des Tages fanden sich dann die Teilnehmer in verschiedenen Sessions zusammen, um bspw. die Auswirkungen der NLG auf das Berufsfeld von Journalisten zu diskutieren, wie bei der zur Generierung der Texte genutzte Datenbasis die Qualität und Konsistenz sichergestellt werden kann oder wie überhaupt durch AX Semantics und ATML3 automatisierte Texte erstellt werden können.

Insgesamt zeichnete sich die clunc durch ein hohes Maß an spannenden und informativen Vorträgen und Sessions sowie eine rege, aktive Beteiligung aller Teilnehmer aus.

Auch ich hatte die Gelegenheit, meine in Kooperation mit takevalue Consulting verfasste Abschlussarbeit im Masterstudiengang Informationswissenschaft an der h_da vorzustellen. Hier nochmals einen großen Dank an Saim, der mir das ermöglichte.

Automatische Erstellung  von Texten auf Basis von Wetter- und Klimadaten

Patrick_Luerwer_Saim_Alkan_clunc_2016

Mein Vortrag basiert auf meiner jüngst verfassten Masterarbeit an der h_da über die Automatische Erstellung von Texten auf Basis von Wetter- und Klimadaten. Ziel der Arbeit war es, für eine Website, die für Reisedestinationen die aktuellen Wassertemperaturen aufführt, Informationstexte für die Städte zu erstellen. Als Basis für die Contenterstellung mittels AX Semantics dienten historische Wetterdaten.

Im Hinblick auf den Informationsgewinn für den Nutzer sollen die Texte über die reine Repräsentation von Wetterdaten in textlicher Form hinausgehen. Der Anspruch liegt hier vor allem in dem Vergleich der Wetterdaten von Destinationen, um auf dieser Basis Rückschlüsse zu ziehen. Bspw. sollen dem Leser folgende Fragen beantwortet werden: Welche Monate bieten sich für Reisen zur jeweiligen Destination an? Gibt es zu einem bestimmten Zeitpunkt Destinationen in geographischer Nähe, die bessere Wetterbedingungen bieten als die angefragte Destination? Eigenen sich die Wassertemperaturen zum Schwimmen und welchen Taucheranzug sollte man ggf. verwenden?

Da auch für mich der Bereich der NLG mittels AX Semantics Neuland ist, richtete sich der Vortrag insbesondere – aber nicht ausschließlich – an Neueinsteiger. Ich habe Learnings vorgestellt, die Interessierten helfen können, Fehler und Probleme bei einem eigenen Projekt zu vermeiden. Der Fokus meiner Arbeit lag stark auf der Modellierung der Destinationen und der Wetterdaten in einer Graph Datenbank. Zudem ist es absolut entscheidend, die über einen Anbieter bezogenen Daten auf ihre Qualität und Konsistenz zu prüfen. Schließlich beruht die automatische Erstellung  von Texten auf der Bedeutung von Domänenwissen, um adäquate und richtige Rückschlüsse aus einer gegebenen Datenbasis ziehen zu können.

Meinen Vortrag gibt es auch auf Slideshare/takevalue.

nach oben

FAZIT

Es waren 2 spannende Tage mit sehr interessanten Vorträgen. Ich kann allen, die sich für Natural Language Generation interessieren, das BarCamp für Comupterlinguistik sehr empfehlen. Und auch die Schwabenmetropole Stuttgart ist immer wieder eine Reise wert.

Eure Fragen rund um das Thema meiner Masterarbeit Automatische Erstellung von Texten auf Basis von Wetter- und Klimadaten oder zur clunc könnt ihr gerne hier im Kommentarfeld hinterlassen oder schreibt mir eine E-Mail an [email protected].

 

Patrick Lürwer
Patrick Lürwer
Der Autor dieses Artikels hat das Unternehmen verlassen. Bei Fragen zum Artikel wenden Sie sich bitte an [email protected]!
Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert