Αναρτήθηκε στην υποδομή Clarin El το corpus του προγράμματος DataPopEU

Αναρτήθηκε στο αποθετήριο της Εθνικής Υποδομή Γλωσσικών Πόρων & Τεχνολογιών Clarin EL για τα γλωσσικά δεδομένα & εργαλεία γλωσσικής επεξεργασίας το Ηλεκτρονικό Σώμα Κειμένων (corpus) που δημιουργήθηκε στο πλαίσιο του χρηματοδοτούμενου από το ΕΛΙΔΕΚ προγράμματος DataPopEU “Καινοτόμες μέθοδοι και δεδομένα υψηλής ποιότητας για την έρευνα του λαϊκισμού και του Ευρω-σκεπτικισμού”.

Η ανάρτηση του ΗΣΚ έγινε σε συνεργασία με το Απολλωνίς ΑΠΘ. Η ΑΠΟΛΛΩΝΙΣ δημιουργήθηκε από τη σύμπραξη του Εθνικού Δικτύου Γλωσσικής Τεχνολογίας clarin:el και του Εθνικού Δικτύου Ψηφιακών Υποδομών για τις Ανθρωπιστικές Επιστήμες DARIAH-GR/ΔΥΑΣ, τα οποία είναι συνιστώσες των αντίστοιχων ευρωπαϊκών υποδομών CLARIN και DARIAH.

Το Ηλεκτρονικό Σώμα Κειμένων (ΗΣΚ) DATAPOPEU περιέχει αποδελτιωμένα δημοσιεύματα του ελληνικού τύπου που αφορούν στα έτη 2020 και 2021. Η θεματολογία αφορά τις Ευρωπαϊκές Υποθέσεις (με λέξεις κλειδιά που βασιζονται στην ρίζα Ευρώπ*), αναφορές στην έννοια του λαού (με λέξεις κλειδιά που βασίζονται στην ρίζα λαο*) και στο λαϊκισμό ( με λέξεις κλειδιά που βασίζονται στη ρίζα λαικ*).

Το ΗΣΚ αποτελείται από 6 subcorpora:

1. 2020_evropi με 10042431 λέξεις που αφορούν στις αναφορές στον όρο ευρωπ* για το έτος 2020
2. 2021_evropi με 12255882 λέξεις που αφορούν στις αναφορές στον όρο ευρωπ* για το έτος 2021
3. 2020_laos με 10701279 λέξεις που αφορούν στις αναφορές στον όρο λαο* για το έτος 2020
4. 2021_laos με 10797296 λέξεις που αφορούν στις αναφορές στον όρο λαο* για το έτος 2021
5. 2020_laikismos με 3573461 λέξεις που αφορούν στις αναφορές στον όρο λαϊκ* για το έτος 2020
6. 2021_laikismos με 3488772 λέξεις που αφορούν στις αναφορές στον όρο λαϊκ* για το έτος 2021