Έλα στην ομάδα της ΕΕΛΛΑΚ!
Έχετε ακούσει για το Ελεύθερο Λογισμικό και θέλετε να μάθετε περισσότερα γι’ αυτό;
Τότε οι αμειβόμενες θέσεις πρακτικής άσκησης είναι για εσάς!
Ο Οργανισμός Ανοιχτών Τεχνολογιών – ΕΕΛΛΑΚ σας προσκαλεί να εκπληρώσετε την πρακτική σας άσκηση ως Activist Data Annotator / Machine Learning Trainer να αξιοποιήσετε τις τεχνικές σας δεξιότητες και να αποκτήσετε νέες γνώσεις! Ως ασκούμεν@Activist Data Annotator / Machine Learning Trainerθα είστε μέλος της ομάδας συνεργατών της ΕΕΛΛΑΚ και θα έχετε ενεργό ρόλο στις δράσεις μας συμβάλλοντας στην προσπάθεια δημιουργίας ενός Μεγάλου Γλωσσικού Μοντέλου Ανοιχτού Κώδικα στα Ελληνικά (Open Source Greek LLM).
Γενικότερα, ωςActivist Data Annotator / Machine Learning Trainee θα ασχοληθείτε με:
- Απογραφή πηγών κειμενικών δεδομένων υψηλής ποιότητας από ελληνικά αποθετήρια
- Συνδιαμόρφωση του συστήματος καταλογογράφησης και διαλογής πηγών υψηλής ποιότητας και αντιπροσωπευτικότητας της ελληνικής γλώσσας
- Απόκτηση και προεπεξεργασία κειμενικών δεδομένων και αποθήκευσή τους σε διαλειτουργικές βάσεις δεδομένων
- Εκπαίδευση γλωσσικών μοντέλων ειδικού σκοπού και ένταξή τους σε παραγωγικές εφαρμογές σε έργα του οργανισμού
- Συμμετοχή στη δράση ανάπτυξης του ελληνικού μεγάλου γλωσσικού μοντέλου της ΕΛΛΑΚ, glossAPI (Open Source Greek LLM)
- Συμμετοχή σε επικοινωνίες και εκδηλώσεις με αναγνωρίσιμους εταίρους της ΕΛΛΑΚ στο χώρο της ακαδημαϊκής βιβλιοθηκονομίας, της τεχνητής νοημοσύνης, των ανοιχτών διασυνδεδεμένων δεδομένων, και της στατιστικής/μηχανικής μάθησης.
Απαιτούμενα προσόντα:
- Γνωσιακό υπόβαθρο σε δυο ή περισσότερα από τα παρακάτω:
- Γνώση command line εργαλείων, όπως bash, zsh και scripting languages ιδίως R, Python, κατά προτίμηση σε περιβάλλον Debian Linux. (Παρέχεται εκπαίδευση)
- Επεξεργασία φυσικού λόγου, Νευρωνικά δίκτυα, Μηχανική Μάθηση ή Επαγωγική Στατιστική
- Κειμενική ή κοινωνική γλωσσολογία, διαλεκτολογία ή εθνογλωσσολογία, ποιοτική έρευνα, ανάλυση περιεχομένου ή grounded theory
- XML, SQL Βάσεις Δεδομένων, Αυτόματη απόκτηση δεδομένων ιστού
- Θεωρία γλωσσολογίας, γνωσιακής επιστήμης, με έμφαση στην γλωσσική απόκτηση και της θεωρίες κοινωνικά τοποθετημένης κατανεμημένης γνώσης.
- ‘Αριστη γνώση μίας Ευρωπαϊκής γλώσσας και γνωσιακό υπόβαθρο στην ιστορική ή συγκριτική γλωσσολογία, ή έμπρακτο σχετικό ενδιαφέρον.
- Άριστη γνώση της ελληνικής γλώσσας και θεωρητικό υπόβαθρο στις ιστορικές φάσεις και τις γλωσσικές ποικιλίες της.
Επιθυμητά προσόντα:
- Ισχυρές δεξιότητες διαπροσωπικής επικοινωνίας.
- Γνώση Debian Linux.
- Γνώσης του Mediawiki και άλλων συστημάτων Wiki.
- Εμπειρία στη διαχείριση αποθετηρίων κώδικα (Git, Github, GitLab, κ.α.)
- Εμπειρία στο σύστημα Redmine (project management)
- Εμπειρία σε συστήματα διαχείρισης περιεχομένου όπως Drupal, WordPress.
- Εμπειρία σε πλατφόρμες ανοιχτών δεδομένων όπως DKAN, CKAN
- Γνώση PostgreSQL
- Django, Flask, ή άλλο πλαίσιο ανάπτυξης Python API’s.
Ο Οργανισμός Ανοιχτών Τεχνολογιών (ΕΕΛΛΑΚ) θα προσφέρει την ευκαιρία σε δύο άτομα στο τελευταίο έτος σπουδών τους ή άρτι αποφοιτήσαντα, καθώς και σε άτομα που σπουδάζουν σε μεταπτυχιακά προγράμματα των ελληνικών ιδρυμάτων να συνδυάσουν τις επαγγελματικές δεξιότητες με το πάθος για ακτιβισμό, βοηθώντας μας να διασφαλίσουμε ότι η διαδικτυακή μας παρουσία έχει αντίκτυπο και αντικατοπτρίζει τις αξίες που υποστηρίζουμε στην ΕΕΛΛΑΚ, και στην εποχή της τεχνητής νοημοσύνης.
Παρακαλούμε τα ενδιαφερόμενα άτομα να στείλουν τα βιογραφικά τους με θέμα “Activist Data Annotator / Machine Learning Trainer” στο hr AT eellak DΟΤ gr έως τις 15 Φεβρουαρίου 2024.
Activist Data Annotator / Machine Learning Trainer