Core Concepts
Eine differenzierbare Pipeline, die die Aufgaben der Zusammenfassung und Übersetzung sequenziell durchführt, um öffentlich verfügbare Ressourcen für monolinguale Zusammenfassung und Übersetzung zu nutzen und eine sehr wettbewerbsfähige Nullschuss-Leistung zu erzielen. Darüber hinaus kann die vorgeschlagene Pipeline durch wenig-schussfeines Finetuning von der Verfügbarkeit weniger Beispiele profitieren.
Abstract
Die Studie präsentiert SUMTRA, ein Modell für übergreifende Zusammenfassung (Cross-Lingual Summarization, XLS), das den traditionellen Ansatz des Zusammenfassens und Übersetzens in eine moderne, differenzierbare Pipeline-Architektur überführt.
Der Hauptzweck von SUMTRA ist es, eine wettbewerbsfähige Nullschuss- und Wenig-Schuss-Leistung zu erzielen, da echte XLS-Annotationen aufwendig sind. Das Modell besteht aus zwei Komponenten: einem monolinguale Zusammenfassungsmodell (SUM) und einem Übersetzungsmodell (TRA). Die SUM-Komponente wird zunächst auf umfangreichen monolinguale Zusammenfassungsdaten trainiert und gibt dann "weiche" Vorhersagen aus, die als Eingabe für die TRA-Komponente dienen. Dadurch bleibt die gesamte Pipeline differenzierbar und kann durch Finetuning optimiert werden.
Die Experimente auf zwei gängigen XLS-Datensätzen zeigen, dass SUMTRA eine sehr starke Nullschuss-Leistung erzielt und mit nur 10% der Finetuning-Beispiele oft die Leistung vergleichbarer mehrsprachiger Sprachmodelle übertreffen kann. Die Analyse zeigt auch, dass SUMTRA weniger anfällig für das "katastrophale Vergessen" ist, das bei mehrsprachigen Modellen auftritt, die mit monolinguale Aufgabendaten trainiert werden.
Stats
Die US-Behörden drohten Yahoo mit einer Strafe von 250.000 US-Dollar pro Tag, wenn das Unternehmen keine Nutzerdaten herausgebe.
Yahoo wurde mit 250.000 US-Dollar (250.000 Pfund Sterling) bestraft, weil es gegen eine Anordnung der US-Regierung zur Überwachung seiner Online-Dienste verstoßen hat.
Quotes
"Die US-Behörden bedrohten das Technologieunternehmen Yahoo mit einer täglichen Strafe von 250.000 US-Dollar, wenn der Computerriese keine Nutzerdaten liefert."
"Yahoo wurde mit 250.000 US-Dollar (250.000 Pfund Sterling) bestraft, weil es gegen eine Anordnung der US-Regierung zur Überwachung seiner Online-Dienste verstoßen hat."