Zeitungsleserin
Photo: Raphael Ferraz / Unsplash 

Analyse des données Swissdox@LiRI

Swissdox coopère avec le LiRI (Linguistic Research Infrastructure) de l’Université de Zurich. Swissdox@LiRI est un corpus de textes composé d’environ 29 millions d’articles de presse issus de médias imprimés et en ligne, ainsi que de transcriptions et de fonds de sous-titres d’émissions de radio et de télévision. Il couvre plusieurs décennies et est mis à jour quotidiennement avec 5’000 à 6’000 nouveaux articles de presse, provenant principalement des régions francophones et germanophones de la Suisse.

Le projet Swissdox@LiRI a été récompensé par le SwissNLP Award 2022 en tant que contribution exceptionnelle dans le domaine du Natural Language Processing (NLP) en Suisse. Sur la photo : Roberto Nespeca (Swissdox AG) et Noah Bubenhofer (UZH) à la SwissText 2022 à Lugano.

SwissText Swiss Text Analytics Conference: www.swisstext.org
Swiss Association for Natural Language Processing: swissnlp.org

Ensemble de services et bases de données

Swissdox@LiRI veut offrir aux chercheurs d’institutions académiques un paquet de services qui met à disposition, exclusivement pour des travaux de recherche, des bases de données du paysage journalistique suisse de la plus haute qualité, lisibles par machine et en toute sécurité juridique. Les bases de données sont mises à disposition par nos partenaires CH Media, NZZ-Mediengruppe, Ringier, Ringier Axel Springer Schweiz, TX Group (Tamedia), SRG SSR, Wochenzeitung, Weltwoche et Le Temps – au total 250 sources, qui seront encore élargies à l’avenir.

Analyses de données volumineuses

Outre la possibilité d’effectuer des analyses de données descriptives, inférentielles, exploratoires ou contextuelles classiques, Swissdox@LiRI convient également comme matière première pour des analyses de données volumineuses pour l’entraînement d’algorithmes ou de réseaux neuronaux.

Pour en savoir plus sur le sujet, consultez l’article suivant :
Qu’est-ce que l’analyse de données ?

Factsheet Swissdox@LiRI

Utilisation académique

L’accès à Swissdox@LiRI se fait via une API. La base de données est notamment conçue pour des analyses de données volumineuses. Les données doivent être conservées sur la propre infrastructure informatique d’une institution académique.

En option, elles peuvent être enrichies de données personnelles, traitées et analysées automatiquement. Les données brutes, mais pas les dérivés qui en découlent, doivent être supprimées six mois après la fin du projet et ne peuvent pas être partagées avec des tiers.

Swissdox@LiRI est proposé à prix coûtant à la communauté des chercheurs universitaires.

Les personnes intéressées trouveront toutes les informations sur la page Swissdox@LiRI (en anglais) :
www.liri.uzh.ch
Page contact LiRI

Travaux de recherche antérieurs
(situation au 26.06.2023).

Utilisation commerciale

Les entreprises et organisations qui souhaitent utiliser ces bases de données à des fins commerciales doivent adresser leurs
demandes à :

Roberto Nespeca,
CEO Swissdox AG,
contact@swissdox.ch,
Tél : +41 315 60 80.