Βοήθεια & Πληροφορίες
Μείωση Διαστάσεων
Όταν τα δεδομένα μας έχουν πολλές μεταβλητές (χαρακτηριστικά), η ανάλυση τους γίνεται πιο πολύπλοκη. Η μείωση διαστάσεων βοηθάει στο να απλοποιήσουμε τα δεδομένα, διατηρώντας όσο το δυνατόν περισσότερη πληροφορία, μειώνοντας θόρυβο και βελτιώνοντας την κατανόηση, την οπτικοποίηση και την απόδοση σε μετέπειτα μοντέλα μηχανικής μάθησης.
Τι είναι το PCA
Η Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis - PCA) είναι μια τεχνική στατιστικής ανάλυσης που μετασχηματίζει τα αρχικά δεδομένα σε ένα νέο σύνολο από μεταβλητές (συνιστώσες) που είναι ασυσχέτιστες μεταξύ τους και διατηρούν το μέγιστο δυνατό ποσοστό πληροφορίας (διασποράς).
Το PCA βρίσκει τον προσανατολισμό στο χώρο των δεδομένων όπου η διακύμανση είναι η μεγαλύτερη και προβάλλει τα δεδομένα σε αυτούς τους νέους άξονες, επιτρέποντάς μας να δουλέψουμε με λιγότερες διαστάσεις χωρίς σημαντική απώλεια πληροφορίας.
Σχετικά με την εφαρμογή
Η εφαρμογή αυτή έχει σχεδιαστεί για να προσφέρει μια απλή και διαδραστική προσέγγιση στην εκτέλεση PCA σε δικά σας datasets μέσω web. Δεν απαιτεί γνώσεις προγραμματισμού ή τοπική εγκατάσταση βιβλιοθηκών. Όλα γίνονται μέσω του browser σας.
Ο χρήστης μπορεί να ανεβάσει το δικό του CSV αρχείο, να επιλέξει μεθόδους επεξεργασίας (όπως κανονικοποίηση, διαχείριση ελλιπών τιμών κ.ά.) και να δει τα αποτελέσματα του PCA, όπως το ποσοστό πληροφορίας που διατηρείται και τη μείωση των διαστάσεων.
Οδηγίες χρήσης
- Ανεβάστε το αρχείο CSV με τα δεδομένα σας. Το αρχείο μπορεί να περιέχει ή όχι επικεφαλίδες (headers).
- Επιλέξτε αν θέλετε να κανονικοποιηθούν τα δεδομένα και αν πρέπει να αφαιρεθεί η τελευταία στήλη (π.χ. labels).
- Ορίστε πώς θα διαχειριστεί η εφαρμογή τυχόν κενά (NaN) στα δεδομένα.
- Μόλις υποβάλετε, θα δείτε τα αποτελέσματα της ανάλυσης PCA, όπως τις συνιστώσες και το ποσοστό διατήρησης πληροφορίας.
- Μπορείτε να πειραματιστείτε με το πλήθος των συνιστωσών ή με το επιθυμητό ποσοστό διατήρησης πληροφορίας μέσω των sliders.
