18. Internationale Konferenz zur Anwendung von natürlicher Sprache in Informationssystemen in Salford

Dieser Artikel behandelt Beiträge der NLDB 2013, der 18ten International Conference on Applications of Natural Language to Information Systems, die vom 19. bis 21. Juni 2013 Salford, Großbritannien stattfand.

Künstliche Intelligenz

Es wurden 68 Beiträge für die Konferenz eingereicht. Jeder Beitrag wurde drei Gutachtern zugeteilt, wobei die von den Mitgliedern des Programmausschusses geäußerten Präferenzen so weit wie möglich berücksichtigt wurden. Nach Ablauf der Begutachtungsfrist wurden die Mitglieder des Programmkomitees gebeten, fehlende Gutachten zu ergänzen. Darüber hinaus fungierten die Mitglieder des Organisationskomitees und der Vorsitzende des Programmkomitees als Meta-Reviewer - sie schrieben zusätzliche Gutachten für Grenzfälle und für Papiere, die Gutachten mit sehr gegensätzlichen Bewertungen erhielten. Am Ende erhielt jedes Papier mindestens drei Bewertungen.

Auf der Grundlage dieser Gutachten entschieden die Mitglieder des Organisationskomitees und der Vorsitzende des Programmkomitees, Papiere mit einer durchschnittlichen Punktzahl um die schwache Akzeptanz als Full Papers und Papiere mit einer etwas niedrigeren Punktzahl als Short Papers zu akzeptieren. In Grenzfällen wurden experimentell orientierte Papiere mit neuartigen und ehrgeizigen Konzepten anerkannt. Die endgültige Annahmequote, bei der die Anzahl der Full Papers nach NLDB-Tradition gezählt wird, lag bei 22% (15 von 68), was im Vergleich zu den Vorjahren ähnlich wettbewerbsfähig ist.

Darüber hinaus wurden 10 Kurzbeiträge und keine Poster angenommen, da die NLDB 2013 eine Videokonferenz sein musste. Full Papers durften maximal 12 und Short Papers maximal 8 Seiten umfassen. Ursprünglich wurden zwei weitere Kurzbeiträge angenommen, aber die Autoren zogen es aus persönlichen Gründen vor, ihre Einreichungen zurückzuziehen. Wie schon in den vergangenen Jahren sind die Themen und spezifischen Fragestellungen breiter gefächert als noch vor zehn Jahren. Mehrere Beiträge befassen sich mit Sprachen, für die es nicht allzu viele Ressourcen gibt - Arabisch und Russisch.

Einige derzeit heiße Themen werden intensiv behandelt, darunter Sentimentanalyse und Chatbots, und erfolgreiche Tools werden wiederverwendet und angepasst, wie z.B. der Transformer BERT. Schließlich wird in mehreren Beiträgen untersucht, wie man über die eigentliche Sprache hinausgehen kann, einschließlich visueller Daten, Affekt, Emotionen und Persönlichkeit.

Zusätzlich zu den begutachteten Beiträgen gab es auf der NLDB 2013 drei eingeladene Vorträge: - Claire Gardent, LORIA Nancy, Frankreich - Ehud Reiter, University of Aberdeen and Arria, Großbritannien - Josef van Genabith, DFKI Saarbrücken, Deutschland Die angenommenen Beiträge (Lang- und Kurzbeiträge) deckten ein breites Spektrum an Themen ab, die wir in sechs Themenbereiche unterteilt haben, die jeweils einen Abschnitt in diesem Band abdecken:

  1. Semantische Analyse
  2. Beantwortung von Fragen und Generierung von Antworten
  3. Klassifizierung
  4. Sentimentale Analyse
  5. Persönlichkeit, Affekt und Emotion
  6. Retrieval, Konversationsagenten
  7. Multimodale Analyse

Semantische Analyse

Zwei lange und zwei kurze Beiträge wurden in diesen Bereich eingeordnet. Im ersten werden psycholinguistische Erkenntnisse in die Eigenschaften von Teilwörtern für das Training von Vektordarstellungen einbezogen. Die nächsten beiden Arbeiten befassen sich mit der Erkennung von benannten Personen, beide in Nicht-Standard-Domänen. Die erste Arbeit befasst sich mit der Cybersicherheit in Russisch und zeigt die Überlegenheit des BERT-Modells. Der zweite Beitrag befasst sich mit biomedizinischen Daten unter Verwendung einer tiefen neuronalen Netzwerkarchitektur (NN). Der letzte Beitrag in diesem Abschnitt enthält Erläuterungen zum semantischen Parsing im Kontext einer natürlichsprachlichen Programmieraufgabe.

Beantwortung von Fragen und Generierung von Antworten

Drei lange und zwei kurze Beiträge wurden in diesem Abschnitt kategorisiert. Der erste Beitrag erzielt eine Leistungssteigerung durch Maßnahmen zur Erweiterung von Abfragen und zur Auflösung von Koreferenzen. Die nächsten beiden Beiträge erweitern die Beantwortung von Fragen durch Dialogmuster. Der erste Beitrag automatisiert den Aufbau von Chatbots mit Klärungsdialogen, der zweite organisiert die Beantwortung von prozeduralen Fragen durch inkrementelles Befolgen von hierarchisch organisiertem Wissen. Die letzten beiden Beiträge befassen sich mit den Beschränkungen des Wissens. Der erste beschäftigt sich mit großen Datenmengen in offenen Bereichen, der zweite verschafft Kontrolle über Beschränkungen, die durch fehlendes Wissen verursacht werden.

Klassifizierung

In diesem Abschnitt wurden eine lange und drei kurze Abhandlungen kategorisiert. Es handelt sich um zwei technologiebasierte und zwei anwendungsorientierte Beiträge. Einer der technologiebasierten Beiträge wendet ein iteratives Verfahren an, das beispielhaft für die Klassifizierung kurzer Texte ist, der andere führt systematische Auswahltechniken ein, um die Stabilität der Latent Dirichlet Allocation zu erhöhen. Die anwendungsorientierten Beiträge zielen auf die Identifizierung von Mängelberichten und damit verbundenen Verbesserungswünschen in speziellen Bewertungen bzw. Gerichtsentscheidungen im Bereich des Wohnungsrechts ab.

Sentiment Analysis

Zwei lange und ein kurzer Beitrag wurden in diesem Abschnitt kategorisiert. Jeder Ansatz zeichnet sich durch eine spezifische, nicht standardisierte Perspektive aus. Der erste Ansatz befasst sich mit der Rolle von Positionsinformationen, die einem Wort zugeschrieben werden und zu einem bestimmten Aspekt beitragen. Der zweite Ansatz untersucht die Rolle der Aufmerksamkeit und zeigt ihre Bedeutung für die Bewertung analytischer Texte auf. Der letzte Ansatz konzentriert sich auf die Nutzung von Gefühlen, um Strategien für das Lernen von Lehrplänen zu entwickeln.

Persönlichkeit, Affekt und Emotionen

Vier lange und ein kurzer Artikel wurden in diese Kategorie eingeordnet. Die ersten beiden Beiträge in dieser Kategorie befassen sich mit der Rolle der Persönlichkeit zu ganz unterschiedlichen Zwecken, einer zur Unterscheidung zwischen ehrlichen und betrügerischen Autoren, der andere zur Modellierung des Sprachverhaltens literarischer Figuren. Die nächsten beiden Beiträge analysieren Emotionen, einer im Kontext von Filmen, der andere durch die Analyse von sprachlichen Eigenschaften auf niedriger Ebene in Social Media Blogs. Im letzten Beitrag wird versucht, aus der Analyse von Dialogen in sozialen Medien auf Zweifel an einer bestimmten Krankheit zu schließen.

Retrieval, Konversationsagenten und multimodal Analyse

Drei lange und ein kurzer Artikel wurden in diesem Abschnitt kategorisiert. Die ersten beiden befassen sich mit erweiterten Mechanismen für die Antwortauswahl unter Berücksichtigung des Dialogkontexts bzw. der semantischen Ähnlichkeit zwischen einer neuen Frage und bereits bearbeiteten Fragen. Der nächste Beitrag befasst sich mit Ankerentitäten, die auf textuellen und visuellen Daten basieren, und der letzte Beitrag beschreibt ein zusammengesetztes praktisches System mit gelegentlichem menschlichen Eingriff.

Die Organisatoren der Konferenz sind den Gutachtern für ihr Engagement bei der Bewertung der eingereichten Beiträge zu Dank verpflichtet. Wir möchten uns auch für die organisatorische Hilfe bedanken.