Τι είναι:
ΠαÏ?αμÏ?θι χωÏ?ίς όνομα (Tale Without Name)
Πίνακας περιεχομένων:
- Η εξομάλυνση δεδομένων
- Για παράδειγμα, ας πούμε ότι ένα πανεπιστήμιο αναλύει τα στοιχεία του εγκλήματος του τα τελευταία 10 χρόνια. Ο αριθμός των βίαιων εγκλημάτων φαίνεται κάτι τέτοιο:
- Υπάρχουν πολλοί τρόποι εξομάλυνσης των δεδομένων, μέσους όρους και αλγόριθμους. Η ιδέα είναι ότι η εξομάλυνση των δεδομένων καθιστά τα οντέλα πιο ορατά και έτσι βοηθά στην πρόβλεψη αλλαγών στις τιμές των μετοχών, στις τάσεις των πελατών ή σε οποιαδήποτε άλλη επιχειρηματική πληροφορία. Ωστόσο, η εξομάλυνση δεδομένων μπορεί να παραβλέψει τις βασικές πληροφορίες ή να κάνει τα σημαντικά γεγονότα λιγότερο ορατά. Με άλλα λόγια, η "στρογγυλοποίηση των άκρων" των δεδομένων μπορεί να υπερκεράσει ορισμένα δεδομένα και να αγνοήσει άλλα δεδομένα.
Η εξομάλυνση δεδομένων
είναι μια στατιστική τεχνική που περιλαμβάνει την αφαίρεση των αποδόσεων από ένα σύνολο δεδομένων, Πώς λειτουργεί (Παράδειγμα):
Για παράδειγμα, ας πούμε ότι ένα πανεπιστήμιο αναλύει τα στοιχεία του εγκλήματος του τα τελευταία 10 χρόνια. Ο αριθμός των βίαιων εγκλημάτων φαίνεται κάτι τέτοιο:
Όπως μπορείτε να δείτε, τις περισσότερες φορές το πανεπιστήμιο αντιμετωπίζει λιγότερα από 15 εγκλήματα το χρόνο. Εντούτοις, το 2006 και το 2007 είχε 44 άτομα λόγω της πειραματικής υποχρέωσης υποβολής εκθέσεων από την ομάδα δημόσιας ασφάλειας του πανεπιστημίου. Το πείραμα αναφοράς αναθεώρησε τον ορισμό του βίαιου εγκλήματος ώστε να περιλαμβάνει κλοπή οποιουδήποτε είδους κατά τη διάρκεια αυτών των ετών, γεγονός που δημιούργησε ένα μεγάλο άλμα στον αριθμό των «βίαιων» εγκλημάτων στην πανεπιστημιούπολη. Αν συμπεριλάβουμε αυτά τα χρόνια στο μέσο όρο - δηλαδή, αν κάνουμε κάποια εξομάλυνση των δεδομένων - το πανεπιστήμιο παρουσίασε κατά μέσο όρο περίπου 19 βίαια εγκλήματα ετησίως. Αλλά εάν αφήσουμε τα χρόνια αυτά, μπορούμε να δούμε ότι ένας πιο ρεαλιστικός μέσος όρος είναι 13 βίαια εγκλήματα ετησίως - μια διαφορά 32%.
Γιατί αυτό έχει σημασία: