Zeitungsleserin
Bild: Raphael Ferraz / Unsplash 

Datenanalyse mit Swissdox@LiRI

Swissdox kooperiert mit dem LiRI (Linguistic Research Infrastructure) der Universität Zürich. Swissdox@LiRI ist ein Textkorpus, das aus rund 29 Millionen Pressebeiträgen aus Print- und Online-Medien, sowie aus Transkripten und Untertitelbeständen von Radio- und TV-Sendungen besteht. Es deckt mehrere Jahrzehnte ab und wird täglich mit 5’000 bis 6’000 neuen Pressebeiträgen aktualisiert, vornehmlich aus den deutsch- und französischsprechenden Teilen der Schweiz.

Das Projekt Swissdox@LiRI ist mit dem SwissNLP Award 2022 als herausragender Beitrag im Bereich Natural Language Processing (NLP) in der Schweiz ausgezeichnet worden. Auf dem Bild: Roberto Nespeca (Swissdox AG) und Noah Bubenhofer (UZH) an der SwissText 2022 in Lugano.

SwissText Swiss Text Analytics Conference: www.swisstext.org
Swiss Association for Natural Language Processing: swissnlp.org

Servicepaket und Datenbestände

Swissdox@LiRI will Forschenden aus akademischen Einrichtungen ein Servicepaket anbieten, welches rechtssicher maschinenlesbare Datenbestände der Schweizer Journalistenlandschaft in höchster Qualität aus einer Hand ausschliesslich für Forschungsarbeiten zur Verfügung stellt. Die Datenbestände werden von unseren Partnern CH Media, NZZ-Mediengruppe, Ringier, Ringier Axel Springer Schweiz, TX Group (Tamedia), SRG SSR und Wochenzeitung zur Verfügung gestellt – insgesamt 250 Quellen, welche in Zukunft noch weiter ausgebaut werden sollen.

Big Data-Analysen

Neben der Möglichkeit der klassischen deskriptiven, inferenziellen, explorativen oder kontextbasierten Datenanalyse, eignet sich Swissdox@LiRI auch als Rohmaterial für Big Data-Analysen für das Trainieren von Algorithmen oder von neuronalen Netzwerken.
Mehr zum Thema finden Sie in folgendem Beitrag:
Was ist Datenanalyse?

Factsheet Swissdox@LiRI

Download PDF (auf Englisch)

Akademische Nutzung

Der Zugang zu Swissdox@LiRI erfolgt über eine API. Die Datenbasis ist insbesondere für Big Data-Analysen ausgelegt. Die Daten müssen auf der eigenen IT-Infrastruktur in einer akademischen Institution aufbewahrt werden.

Sie können optional mit eigenen Angaben angereichert, automatisch bearbeitet und analysiert werden. Die Rohdaten, aber nicht die davon abgeleiteten Derivate, müssen sechs Monate nach Projektabschluss gelöscht werden und dürfen nicht mit Dritten geteilt werden.

Swissdox@LiRI wird der akademischen Forschergemeinde zum Selbstkostenpreis angeboten.

Interessierte finden alle Informationen auf der Swissdox@LiRI-Seite (auf Englisch):
www.liri.uzh.ch
Kontakt-Seite LiRI

Bisherige Forschungsarbeiten
(Stand Ende August)

Kommerzielle Nutzung

Unternehmen und Organisationen, die diese Datenbestände kommerziell nutzen möchten, richten Ihre Anfragen an:

Roberto Nespeca,
CEO Swissdox AG,
contact@swissdox.ch,
Tel.: +41 315 60 80.