ΚεντρικήΚοινωνικά

Αμειβόμενες θέσεις πρακτικής άσκησης στον Οργανισμό Ανοιχτών Τεχνολογιών (ΕΕΛΛΑΚ)

19/1/2024

Έχετε ακούσει για το Ελεύθερο Λογισμικό και θέλετε να μάθετε περισσότερα γι’ αυτό;

Τότε οι αμειβόμενες θέσεις πρακτικής άσκησης της ΕΕΛΛΑΚ είναι για εσάς!

Ο Οργανισμός Ανοιχτών Τεχνολογιών – ΕΕΛΛΑΚ σας προσκαλεί να εκπληρώσετε την πρακτική σας άσκηση ως Activist Data Annotator / Machine Learning Trainer να αξιοποιήσετε τις τεχνικές σας δεξιότητες και να αποκτήσετε νέες γνώσεις! Ως ασκούμενοι Activist Data Annotator / Machine Learning Trainer θα είστε μέλος της ομάδας συνεργατών της ΕΕΛΛΑΚ και θα έχετε ενεργό ρόλο στις δράσεις του συμβάλλοντας στην προσπάθεια δημιουργίας ενός Μεγάλου Γλωσσικού Μοντέλου Ανοιχτού Κώδικα στα Ελληνικά (Open Source Greek LLM).

Γενικότερα, ως Activist Data Annotator / Machine Learning Trainee θα ασχοληθείτε με:

  • Απογραφή πηγών κειμενικών δεδομένων υψηλής ποιότητας από ελληνικά αποθετήρια
  • Συνδιαμόρφωση του συστήματος καταλογογράφησης και διαλογής πηγών υψηλής ποιότητας και αντιπροσωπευτικότητας της ελληνικής γλώσσας
  • Απόκτηση και προεπεξεργασία κειμενικών δεδομένων και αποθήκευσή τους σε διαλειτουργικές βάσεις δεδομένων
  • Εκπαίδευση γλωσσικών μοντέλων ειδικού σκοπού και ένταξή τους σε παραγωγικές εφαρμογές σε έργα του οργανισμού
  • Συμμετοχή στη δράση ανάπτυξης του ελληνικού μεγάλου γλωσσικού μοντέλου της ΕΛΛΑΚ, glossAPI (Open Source Greek LLM)
  • Συμμετοχή σε επικοινωνίες και εκδηλώσεις με αναγνωρίσιμους εταίρους της ΕΛΛΑΚ στο χώρο της ακαδημαϊκής βιβλιοθηκονομίας, της τεχνητής νοημοσύνης, των ανοιχτών διασυνδεδεμένων δεδομένων, και της στατιστικής/μηχανικής μάθησης.

Απαιτούμενα προσόντα:

  • Γνωσιακό υπόβαθρο σε δυο ή περισσότερα από τα παρακάτω:
    • Γνώση command line εργαλείων, όπως bash, zsh και scripting languages ιδίως R, Python, κατά προτίμηση σε περιβάλλον Debian Linux. (Παρέχεται εκπαίδευση)
    • Επεξεργασία φυσικού λόγου, Νευρωνικά δίκτυα, Μηχανική Μάθηση ή Επαγωγική Στατιστική
    • Κειμενική ή κοινωνική γλωσσολογία, διαλεκτολογία ή εθνογλωσσολογία, ποιοτική έρευνα, ανάλυση περιεχομένου ή grounded theory
    • XML, SQL Βάσεις Δεδομένων, Αυτόματη απόκτηση δεδομένων ιστού
    • Θεωρία γλωσσολογίας, γνωσιακής επιστήμης, με έμφαση στην γλωσσική απόκτηση και της θεωρίες κοινωνικά τοποθετημένης κατανεμημένης γνώσης.
  • ‘Αριστη γνώση μίας Ευρωπαϊκής γλώσσας και γνωσιακό υπόβαθρο στην ιστορική ή συγκριτική γλωσσολογία, ή έμπρακτο σχετικό ενδιαφέρον.
  • Άριστη γνώση της ελληνικής γλώσσας και θεωρητικό υπόβαθρο στις ιστορικές φάσεις και τις γλωσσικές ποικιλίες της.

Επιθυμητά προσόντα:

  • Ισχυρές δεξιότητες διαπροσωπικής επικοινωνίας.
  • Γνώση Debian Linux.
  • Γνώσης του Mediawiki και άλλων συστημάτων Wiki.
  • Εμπειρία στη διαχείριση αποθετηρίων κώδικα (Git, Github, GitLab, κ.α.)
  • Εμπειρία στο σύστημα Redmine (project management)
  • Εμπειρία σε συστήματα διαχείρισης περιεχομένου όπως Drupal, WordPress.
  • Εμπειρία σε πλατφόρμες ανοιχτών δεδομένων όπως DKAN, CKAN
  • Γνώση PostgreSQL
  • Django, Flask, ή άλλο πλαίσιο ανάπτυξης Python API’s.

Ο Οργανισμός Ανοιχτών Τεχνολογιών (ΕΕΛΛΑΚ) θα προσφέρει την ευκαιρία σε δύο άτομα στο τελευταίο έτος σπουδών τους ή άρτι αποφοιτήσαντα, καθώς και σε άτομα που σπουδάζουν σε μεταπτυχιακά προγράμματα των ελληνικών ιδρυμάτων να συνδυάσουν τις επαγγελματικές δεξιότητες με το πάθος για ακτιβισμό, βοηθώντας την ομάδα του ΕΕΛΛΑΚ να διασφαλίσει ότι η διαδικτυακή τους παρουσία έχει αντίκτυπο και αντικατοπτρίζει τις αξίες που υποστηρίζουμε στην ΕΕΛΛΑΚ, και στην εποχή της τεχνητής νοημοσύνης.

Τα ενδιαφερόμενα άτομα μπορούν να στείλουν τα βιογραφικά τους με θέμα “Activist Data Annotator / Machine Learning Trainer” στο hr@eellak.gr έως τις 15 Φεβρουαρίου 2024.

Πηγή: https://www.eduguide.gr

Related posts

Έχετε σεξουαλική δυσλειτουργία; Ελέγξτε τα φάρμακα που παίρνετε

xristiana

Η «Γιορτή Λουλουδιών» Έρχεται Στην Κεντρική Πλατεία Της Ηλιούπολης

xristiana

COP28: «Απλή και εύρυθμη» μείωση της χρήσης ορυκτών καυσίμων προβλέπει το προσχέδιο

xristiana