Demoplattform für KI Anwendungen für Natural Language Processing.

Viel Spaß beim Ausprobieren!

Word-Embedding - auf Basis österreichischer Pressemeldungen

"Word-Embedding" bezeichnet eine Methode aus dem Bereich der künstlichen Intelligenz. Jedem Wort wird ein Vektor zugeordnet, der mithilfe eines neuronalen Netzes und eines großen Textkörpers (hier Pressetexte) erlernt wird. Diese Vektoren liefern dann Hinweise auf die semantische Nutzung eines Wortes.

Die Ergebnisse hier spiegeln die Inhalte der österreichischen Pressetexte ab 1996 wider bzw. nur vom ausgewählten Jahr.

Geben Sie ein Wort (Einzelwort) ein. Sie erhalten eine Liste sinnverwandter oder im Kontext ähnliche Wörter. Je eher ein Wort in einem Pressetextes zu erwarten ist, umso aussagekräftiger sind die Ergebnisse. Das Wort "Kern" wird z.B. in österreichischen Pressemeldungen eindeutig mit einem Politiker assoziiert, "Terror" mit dem Islam und Neonazis u.a. mit Burschenschafter.

Das Word-Embedding Modell erkennt auch Beziehungen zwischen Wörter. Im Pressekontext verhält sich z.B.

Probieren Sie weitere Beispiele aus!

Das Wort verhält sich zu wie zu ...

Im zweiten Teil unserer Demo zeigen wir den Wandel von Bedeutungen im Laufe der Zeit anhand der Word Embeddings!

Ein Sprachmodell basierend auf österreichischen Pressemeldungen

Sprachmodelle sind eine Weiterentwicklung der Word Embeddings und können semantische Inhalte noch besser transportieren. Das Modell hier wurde zuerst mit den über 2 Mio Artikeln des deutschsprachigen Wikipedia trainiert und danach mit 1.2 Mio APA Artikeln.

Schreiben Sie einen ersten Satz oder Teilsatz eines möglichen Presseartikels. Das Modell generiert eine kurze Meldung daraus.

Probieren Sie weitere Beispiele aus! Bitte etwas Geduld, die Berechnung beansprucht etwas Zeit.

Generierung von Stichworten zu österreichischen Pressemeldungen

Auf Basis des obigen Sprachmodells haben wir ein Modell trainiert, dass für Pressetexte passende Stichwörtern vorschlägt. Kopieren Sie dazu einen Absatz oder ganzen Text eines Presseartikels in das Feld.

... oder wählen Sie einen aktuellen OTS Beitrag aus. Bitte etwas Geduld, die Berechnung beansprucht etwas Zeit.

Inhaltliche Zusammenfassung österreichischer Pressemeldungen

Text Summarization ist eine Natural-Language-Processing (NLP) Methode die einen längeren Text zusammenfasst. Derzeit konkurrieren zwei unterschiedliche Ansätze in der Welt der KI um die Gunst der Anwender: Die extrahierende Methode setzt die Kurzfassung aus Wörtern und Sätzen des Ursprungtextes zusammen, die Abstraktionstechnik versucht die Aufgabe gänzlich mit eigenen Sätzen zu lösen. Wir haben für Sie eine Demo zur ersteren Methode zusammengestellt.

... oder wählen Sie einen aktuellen OTS Beitrag aus. Bitte etwas Geduld, die Berechnung beansprucht etwas Zeit.


Kontakt
DI Raimund Oberreiter, raimund.oberreiter@calista.at
Oberreiter & Dandachi OG, Moeringgasse 20/2, 1150 Wien
Impressum