Loading...

Data Science for Managers with Python

Data Science for Managers with Python

Η Επιστήμη Δεδομένων (Data Science) αξιοποιεί με πολλαπλούς τρόπους τα δεδομένα που τα διάφορα τμήματα μιας επιχείρησης παράγουν υπό την μορφή αριθμητικών ποσοτήτων, κειμένου αλλά και σχέσεων μεταξύ οντοτήτων όπως: πελάτες, προϊόντα, τιμές αγορών και πωλήσεων, προτιμήσεις πελατών σε είδη που αγοράζουν και σχετικές κριτικές, ώρες εργασίας ανά φάση οι οποίες καταγράφονται για την μισθοδοσία και δεδομένα από αισθητήρες που βρίσκονται σε συνδεδεμένα μηχανήματα. Το πρόγραμμα παραθέτει τα νέα εργαλεία που προσφέρει ο τομέας της Επιστήμης των Δεδομένων για εισαγωγή/εξαγωγή, επεξεργασία, οπτικοποίηση για την διερευνητική ανάλυση τέτοιων δεδομένων και προγνωστική αναλυτική. Ο υπεύθυνος λήψης αποφάσεων μπορεί να χρησιμοποιήσει τα εργαλεία αυτά, διαθέσιμα στην διαδεδομένη γλώσσα προγραμματισμού Python μέσα από έτοιμες βιβλιοθήκες λογισμικού, για να εντοπίσει διάφορα πρότυπα (patterns) και τάσεις (trends) μέσα στα δεδομένα, με την εφαρμογή αλγορίθμων, ώστε να επιλύσει τα προβλήματα της επιχείρησης.

Προαπαιτούμενα για τη συμμετοχή

Καλή κατανόηση της περιγραφικής στατιστικής, βασική χρήση πινακοποιημένων δεδομένων και λογιστικών φύλλων, κατανόηση βασικών στοιχείων της γραμμικής άλγεβρας.

Η πρακτική ενασχόληση (hands-on) με την γλώσσα Python δεν απαιτεί προηγούμενη γνώση προγραμματισμού ή εγκατάσταση μιας πλατφόρμας ανάπτυξης λογισμικού. Οι πρακτικές ασκήσεις αφορούν επιχειρησιακά δεδομένα και παρουσιάζουν εφαρμόσιμες λύσεις ώστε οι συμμετέχοντες να είναι σε θέση να τις επαναχρησιμοποιήσουν με ελάχιστες αλλαγές σε παρεμφερή προβλήματα.

Πώς θα ωφεληθείτε

Με το τέλος του προγράμματος, οι συμμετέχοντες θα:

  • κατανοήσουν τους τρόπους που μπορούν να αξιοποιηθούν τα διαθέσιμα δεδομένα της εταιρείας.
  • μπορούν να διαχειριστούν δεδομένα για τη δημιουργία αναλυτικών αναφορών που οδηγούν σε αποτελεσματικές λύσεις για λειτουργίες μιας εταιρείας όπως οι πωλήσεις, το μάρκετινγκ και το HR.
  • εξοικειωθούν με τα σύγχρονα εργαλεία της Προγνωστικής Αναλυτικής (Predictive Analytics) που ανήκουν στον τομέα της Μηχανικής Μάθησης (Machine Learning) όπως, για παράδειγμα, τα Βαθιά Νευρωνικά Δίκτυα (Deep Neural Networks).
  • κατανοήσουν τις καινοτομίες που φέρνει η μετάβαση προς την Βιομηχανία 4.0, οι οποίες θα διαμορφώσουν τις λειτουργίες των επιχειρήσεων.
  • χρησιμοποιούν την γλώσσα Python χωρίς να απαιτείται η πλήρη κατανόηση του τρόπου συγγραφής διαδικαστικών προγραμμάτων και η λεπτομερειακή γνώση των μαθηματικών μοντέλων και αλγορίθμων.

  • αποκτήσουν τεχνικές γνώσεις όπως:
  1. φόρτωση/αποθήκευση δεδομένων στην μνήμη από διαφορετικούς τύπους αρχείων.
  2. επεξεργασία αριθμητικών πινάκων, συλλογών κειμένου και λεξικών κλειδιού-τιμής.
  3. δημιουργία αριθμητικών περιγραφικών μέτρων που εξάγονται σε προσαρμοσμένα λογιστικά φύλλα και βιβλία εργασίας .xlsx με χρήση της βιβλιοθήκης xlwt.
  4. γραφική παρουσίαση των δεδομένων και χρήση της βιβλιοθήκης matplotlib με βασικά και προχωρημένα γραφήματα που εξάγονται σε αρχεία γραφικών.
  5. χειρισμός πινακοποιημένων δεδομένων (tabular data) με χρήση   της βιβλιοθήκης pandas.
  6. εισαγωγή δεδομένων από οποιαδήποτε προέλευση όπως σχεσιακές βάσεις δεδομένων (relational databases) με χρήση SQL και της βιβλιοθήκης pyodbc.
  7. εισαγωγή δεδομένων σε διαμόρφωση JSON από υπηρεσίες παγκόσμιου ιστού (web services) και χρήση αντικειμένων μέσα από αυτήν.
  8. χρήση επιλεγμένων εφαρμογών Μηχανικής Μάθησης (Machine Learning): Ανάλυση Κυρίων Συνιστωσών (Principal Components Analysis - PCA) στην βιβλιοθήκη scikit-learn και Νευρωνικά Δίκτυα (Neural Networks) στο πλαίσιο εργασίας tensorflow.
  9. εργασία με PDF και αναζήτηση λέξεων κλειδιών μέσα σε αυτά.

 

Περιγραφή του προγράμματος

Διάρκεια Προγράμματος

30 ώρες, 5 εβδομάδες

Ημερομηνίες/Ώρες

Οι νέες ημερομηνίες θα ανακοινωθούν σύντομα

Aναλυτική θεματολογία

Εισαγωγή, θέματα ενδιαφέροντος, χρήση Python στο Google Colab.

  • Εισαγωγή στην Επιστήμη των Δεδομένων (Data Science), Ευμεγέθη Δεδομένα (Big Data), και στις μεθόδους συλλογής, αποθήκευσης και ανταλλαγής δεδομένων.
  • Κατανόηση της Μηχανικής Μάθησης και της Επιχειρησιακής Νοημοσύνης 4.0 (BI 4.0).
  • Οι νέοι ρόλοι του Επιστήμονα Δεδομένων (Data Scientist) και του Αρχιτέκτονα Μηχανικής Μάθησης (Machine Learning Engineer) στο εργασιακό περιβάλλον.
  • Το Διαδίκτυο των Πραγμάτων (Internet of Things) ως πηγή δεδομένων για την Βιομηχανία 4.0 (Industry 4.0).
  • Γνωριμία με την Python στο Google Colab, σύνδεση με αρχεία στο Google Drive.
  • Κατανόηση μεταβλητών και διαδικασιών, συγγραφή και εκτέλεση προγράμματος Python.

Φόρτωση δεδομένων, αναζήτηση σε έγγραφα, πράξεις και συναρτήσεις.

  • Φόρτωση από μη-δομημένα αρχεία κειμένου, λεξικογραφική μοναδοποίηση (tokenization), αναζήτηση λέξεων-κλειδιών.
  • Χρήση λιστών-συλλογών, λεξικών και πακέτων τιμών.
  • Φόρτωση δομημένων αρχείων κειμένου, με διαχωριστή ή σταθερού μεγέθους στήλης. Χρήση αριθμητικών δεδομένων.
  • Πράξεις γραμμικής άλγεβρας με αριθμητικά δεδομένα στην numpy. Υπολογισμός μέσου όρου και τυπικής απόκλισης. Σύγκριση διανυσμάτων με ομοιότητα ημιτόνου (cosine similarity).

Εισαγωγή/Εξαγωγή δεδομένων από λογιστικά φύλλα, παραγωγή στατιστικών και δημιουργία οπτικοποιήσεων των δεδομένων.

  • Φόρτωση/αποθήκευση δεδομένων από αρχεία .xlsx και.csv με το
  • Απλά γραφήματα, bar/pie γραφήματα με Matplotlib.
  • Επιλογή και ταξινόμηση με pandas.
  • Περιγραφική στατιστική με Python, ποσοστημόρια (percentiles), συντελεστής συσχέτισης (correlation coefficient).

Ιστογράμματα και προχωρημένες οπτικοποιήσεις.

  • Δημιουργία ιστογραμμάτων. Εξαγωγή γραφημάτων σε αρχεία γραφικών.
  • Γραφήματα με πολλαπλά τμήματα, υπομνήματα, άξονες, χρώματα, τύποι γραμμών.
  • Χάρτες θερμότητας, περιοδογράμματα, χρωματικά θέματα στο Matplotlib.

Δεδομένα ως αντικείμενα, ανάγνωση/δημιουργία αρχείων PDF, δημιουργία προσαρμοσμένων βιβλίων εργασίας Excel.

  • Κατανόηση της έννοιας των αντικειμένων και των δυνατοτήτων επαναχρησιμοποίησης. Εγκιβωτισμός (encapsulation), παράμετροι (attributes) και διαδικασίες (operations) των αντικειμένων.
  • Ανάγνωση/Εγγραφή αρχείων PDF χρησιμοποιώντας σύνθετα αντικείμενα.
  • Δημιουργία προσαρμοσμένων βιβλίων εργασίας excel με το xlwt.

Ανάγνωση δεδομένων από σχεσιακές βάσεις δεδομένων, εκτέλεση ερωτημάτων SQL.

  • Βασικά στοιχεία σχεσιακών βάσεων δεδομένων και η γλώσσα SQL.
  • Σύνδεση σε πηγές δεδομένων ODBC και εκτέλεση ερωτημάτων SQL σε βάσεις δεδομένων.
  • Επιλογή πεδίων και γραμμών από πίνακες με χρήση κριτηρίων.

Ανάγνωση δεδομένων από υπηρεσίες www, φόρτωση/αποθήκευση αρχείων JSON.

  • Εισαγωγή στα πρότυπα του Παγκόσμιου Ιστού (World Wide Web - WWW), τις υπηρεσίες ιστού (web services) και την διαμόρφωση JSON.
  • Γραμμοποίηση (serialization) / απογραμμοποίηση (deserialization) σε αρχεία JSON.
  • Κατανάλωση υπηρεσίας ιστού για ανάγνωση δεδομένων.

Εφαρμογές Μηχανικής Μάθησης, εκτέλεση Ανάλυσης Κυρίων Συνιστωσών πάνω στα δεδομένα.

  • Βασικά στοιχεία Μηχανικής Μάθησης και είδη εφαρμογών ανάλογα με τα δεδομένα. Σύγκριση μεταξύ Στατιστικής και Μηχανικής Μάθησης.
  • Ανάλυση Κυρίων Συνιστωσών - Principal Component Analysis (PCA).
  • Εκμάθηση κυρίων συνιστωσών από πολυδιάστατα δεδομένα με χρήση της scikit-learn.

Χαρακτηριστικά στα δεδομένα, δημιουργία προγνωστικού μοντέλου στο Tensorflow.

  • Συνεχή, διακριτά και κατηγορικά χαρακτηριστικά στα δεδομένα. Χρήση συνόλων δεδομένων (datasets).
  • Το Τεχνητό Νευρωνικό Δίκτυο (Artificial Neural Network - ANN) σαν καθολικός προσεγγιστής συναρτήσεων (universal function approximator)..
  • Παλινδρόμηση (regression) με το Tensorflow.

Προεπεξεργασία δεδομένων, εκπαίδευση ενός Νευρωνικού Δικτύου σε πολυδιάστατα δεδομένα.

  • Προεπεξεργασία δεδομένων, κλιμάκωση (scaling) και κεντράρισμα στο μέσο όρο (z-score standardization).
  • Οπτικοποίηση δεδομένων με πολυδιάστατα χαρακτηριστικά και κατανόηση των ενσωματώσεων (embeddings).
  • Μη-γραμμική παλινδρόμηση σε πολυδιάστατα δεδομένα με την χρήση Βαθέος Νευρωνικού Δικτύου (Deep Neural Network - DNN) στο Tensorflow.

Εισηγητής

Παντελής Καπλάνογλου

Pantelis I. Kaplanoglou 692x692 GrayBack

Ο Παντελής Ι. Καπλάνογλου είναι Αρχιτέκτονας Μηχανικής Μάθησης (Machine Learning Engineer/Architect) και Υποψήφιος Διδάκτορας στην Επεξηγήσιμη Μηχανική Μάθηση, με M.Sc. στις Ευφυείς Τεχνολογίες Διαδικτύου (Web Intelligence) και B.Sc στην Μηχανική Λογισμικού. Έχει δουλέψει για 20+ χρόνια στην βιομηχανία της Πληροφορικής, και στους δύο τομείς των Υπηρεσιών IT και Ανάπτυξης Λογισμικού, πριν την απασχόληση με την έρευνα και την διδασκαλία. Έχει διατελέσει προϊστάμενος τμήματος λογισμικού και συνεργάτης ανάπτυξης διεθνών εφαρμογών σε μεγάλη πολυεθνική εταιρία λιανικών πωλήσεων. Έχει αποκτήσει γνώση σε διάφορους τομείς και θέματα, που εκτείνονται από την Ασφάλεια Πληροφοριακών Συστημάτων μέχρι τα Βαθιά Νευρωνικά Δίκτυα, και ποικιλόμορφες γλώσσες προγραμματισμού από x86 Assembly μέχρι ASP.NET/C# και Python. Τα τελευταία τρία χρόνια συμμετέχει σε ερευνητικά έργα σχετικά με Υπολογιστική
Όραση για Αυτόνομα Μη-Επανδρωμένα Αεροχήματα (UAV), Συστήματα Συστάσεων για Μεγάλα Δεδομένα, Κατανόηση Φυσικής Γλώσσας. Από το 2019, διδάσκει ταυτόχρονα στο Διεθνές Πανεπιστήμιο της Ελλάδας (ΔΙ.ΠΑ.Ε.) και στο American College of Thessaloniki (ACT).

Συμμετοχή

Κόστος συμμετοχής:  

Ειδική τιμή early bird για εγγραφές έως

ΕΓΓΡΑΦΕΙΤΕ ΕΔΩ

Μετά την αποστολή της αίτησης συμμετοχής, ένας εκπρόσωπος του Lifelong Learning Center του ACT θα επικοινωνήσει μαζί σας για τη διαδικασία της εγγραφής σας στο πρόγραμμα και την πληρωμή.

Μετά την ολοκλήρωση του προγράμματος, οι συμμετέχοντες θα λάβουν ένα πιστοποιητικό παρακολούθησης από το ACT.

Περισσότερες πληροφορίες

Μπορείτε να επικοινωνείτε με το ACT Lifelong Learning Center στο τηλέφωνο 2310 398 430 ή μέσω email στο This email address is being protected from spambots. You need JavaScript enabled to view it. με την ένδειξη "Python".

Share

lll white

ACT Lifelong Learning Center
17 V. Sevenidi Str.
555 35 Pylea
Greece
t: +30 2310 398430
e: This email address is being protected from spambots. You need JavaScript enabled to view it.