Τι και πώς πρέπει να σπουδάσω για να γίνω αναλυτής δεδομένων / επιστήμονας δεδομένων; Υπάρχει διαφορά μεταξύ των δύο;


Απάντηση 1:

Αυτό ισχύει ιδιαίτερα για τεχνολογίες όπως η Επιστήμη των Δεδομένων, η Μηχανική Μάθηση και η AI που έχουν χρησιμοποιηθεί, υπερχρησιμοποιηθεί και μερικές φορές προωθούνται για την επίτευξη στόχων μάρκετινγκ. Είναι σημαντικό να καταλάβουμε ότι αν και αυτά τα πεδία αλληλεπικαλύπτονται, δεν μπορούν να χρησιμοποιηθούν εναλλακτικά.

Κάνοντας το με απλά λόγια, η επιστήμη δεδομένων δημιουργεί ιδέες, ενώ η μηχανική μάθηση παράγει προβλέψεις. Το AI, από την άλλη πλευρά, δημιουργεί ενέργειες.

Γνωρίζοντας την Data Science

Η επιστήμη των δεδομένων είναι ένας από τους καλύτερους κλάδους για να αποκτήσουν διαφορετικούς τύπους γνώσεων - περιγραφικές, διερευνητικές, επαγωγικές, περιστασιακές, προγνωστικές και μηχανιστικές. Η επιστήμη των δεδομένων περιλαμβάνει στατιστικά συμπεράσματα, σχεδιασμό πειραμάτων, μηχανική λογισμικού, οπτικοποίηση δεδομένων, ειδικές γνώσεις τομέα και αποτελεσματική επικοινωνία.

Αυτό που θέτει την επιστήμη των δεδομένων εκτός από συναφείς τομείς, όπως η μηχανική μάθηση και η ΑΙ είναι η ανάγκη για ανθρώπινη συμμετοχή στον βρόχο. Υπάρχει πάντοτε η ανάγκη κάποιος να κατανοήσει τις γνώσεις, να κατανοήσει τις γραφικές παραστάσεις και τα αριθμητικά στοιχεία και να λάβει τελεσίδικες αποφάσεις με βάση τις προεκτεθείσες γνώσεις.

Αξιόπιστες προβλέψεις μέσω της μηχανικής μάθησης

Η εκμάθηση μηχανών διασφαλίζει ότι οι προβλέψεις που προκύπτουν από ένα μεγάλο αριθμό συγκεντρωμένων δεδομένων είναι όσο το δυνατόν ακριβέστερες. Η επιστήμη των δεδομένων και η μηχανική μάθηση αλληλεπικαλύπτονται σε μεγάλο βαθμό. Για παράδειγμα, η λογιστική παλινδρόμηση εφαρμόζεται τόσο στην επιστήμη των δεδομένων όσο και στη μηχανική μάθηση. Ωστόσο, στην επιστήμη των δεδομένων, χρησιμοποιείται για να αντλήσει ιδέες σχετικά με τις σχέσεις διαφορετικών παραγόντων ενώ στη μηχανική μάθηση, παράγει προβλέψεις.

Οι επαγγελματίες του κλάδου συχνά αλλάζουν μεταξύ των δύο κλάδων και οι επιστήμονες δεδομένων χρησιμοποιούν συνήθως τη μηχανική μάθηση. Σε μια εφαρμογή ηλεκτρονικής μάθησης, για παράδειγμα, τα δεδομένα κίνησης θα μπορούσαν να διαμορφωθούν για να καθορίσουν ποιοι πελάτες είναι πιθανό να αναζητήσουν ένα συγκεκριμένο προϊόν. Αυτή είναι μια εφαρμογή της μηχανικής μάθησης. Όταν οι περιλήψεις και οι απεικονίσεις σχεδιάζονται με βάση την κίνηση δεδομένων, είναι μια εφαρμογή της επιστήμης των δεδομένων.

Αυτοματοποίηση ενεργειών με τεχνητή νοημοσύνη

Το AI περιλαμβάνει τη διάδοση γνωστικής νοημοσύνης που μοιάζει με τον άνθρωπο σε υπολογιστές. Κάθε μηχανή που εκτελεί μια εργασία ή μια ενέργεια με έξυπνο τρόπο, με τη χρήση αλγορίθμων λέγεται ότι εφαρμόζει AI. Μια σημαντική διάκριση μεταξύ του AI και των άλλων δύο κλάδων είναι το μέρος της «υπόθεσης που ασκείται». Το AI χρησιμοποιείται εκτενώς στη ρομποτική, τη θεωρία ελέγχου, τους αλγορίθμους τυχερών παιχνιδιών, τα bots και την ενίσχυση της μάθησης.

Εξετάστε την ανάλυση των δεδομένων πελατών για ένα συγκεκριμένο προϊόν. Ας υποθέσουμε, ανακαλύπτεται ότι ορισμένοι πελάτες είναι πιθανό να αγοράζουν περισσότερα από άλλα (διορατικότητα). Παρέχονται αριθμητικά και γραφικά αποτελέσματα που επιτρέπουν στα στελέχη να κάνουν προβλέψεις ή / και να καταλήγουν σε συμπεράσματα. Ωστόσο, δεν μπορεί να οδηγήσει σε κάποια συγκεκριμένη ενέργεια. Αυτό θα ήταν μια εφαρμογή της επιστήμης των δεδομένων με ένα συνδυασμό μηχανικής μάθησης, αλλά όχι AI.

Συνδυάζοντας την επιστήμη των δεδομένων, την εκμάθηση μηχανών και την AI

Ας υποθέσουμε ότι κατασκευάζεται ένας θερμοστάτης με δυνατότητα αυτόματης ρύθμισης. Οι τρεις αυτές τεχνολογίες θα μπορούσαν να χρησιμοποιηθούν ως εξής:

  1. Μηχανική μάθηση: Ένα μεγάλο σύνολο δεδομένων που σχετίζονται με το περιβάλλον για να σχεδιάσει έναν αλγόριθμο που θα πρόβλεπε τα επιθυμητά εύρη θερμοκρασιών και θα έφτασε σε μια σταθερή τιμήArtificial Intelligence: Μόλις ικανοποιηθεί μια συγκεκριμένη περιβαλλοντική συνθήκη, ο θερμοστάτης εκτελεί μια αυτοματοποιημένη ρύθμιση δράσης σε μια σταθερή θερμοκρασία από την αντίστοιχη περιοχή

Επιστήμη δεδομένων: Στις δοκιμές με τον θερμοστάτη, μερικές φορές οι θερμοκρασίες είναι ακατάλληλες για τους ανθρώπους στα σπίτια τους, ειδικά κατά τις μικρές ώρες της ημέρας. Αφού μελετήθηκαν τα δεδομένα των δοκιμών, προκύπτουν ενδείξεις ότι δεν ελήφθησαν υπόψη οι μεταβαλλόμενες θερμοκρασίες του σώματος. Έτσι, υπάρχει ανάγκη να κατασκευαστεί ένα καλύτερο σύνολο δεδομένων που να περιλαμβάνει δεδομένα για τις θερμοκρασίες του σώματος. Στη συνέχεια επαναλαμβάνεται ολόκληρη η διαδικασία.

Για όσους ενδιαφέρονται μπορούν να μου ταχυδρομήσουν στο [email protected]