Καλησπέρες,
Πόσο θες να εμβαθύνεις? Γενικά πιστεύω πως το βιβλίο θα είναι κάπως χαοτικό οπότε δεν θα έχει και πολύ νόημα (τουλάχιστον στην αρχή) για μένα ξεκίνα και πιάσε βήμα βήμα τους mainstream αλγορίθμους (τους περισσότερους λογικά θα τους ξέρεις ήδη) και διάβασε τι κάνουν και πως δουλεύουν ακριβώς.
Σιγούρεψε γενικά τις έννοιες classification/clustering/regression κτλ
Μετά ξεκίνα και πιάσε τους αλγόριθμους ακριβώς πως δουλεύουν πχ:
Για classification:
- Naive Bayes (έχει διάφορες παραλλαγές )
- Μετά πιάσε τα κλασσικά δέντρα C4.5, CART (Classification and Regression Tree)
- SVM <-- εδώ έχει πολύ ψωμί, από τους δυνατότερους αλγορίθμους που παίζουν, διάβασε γενικά για το πως δουλεύουν οι kernels (linear kernel, polynomial κτλ), την βασική ιδέα για αρχή γιατί τα μαθηματικά από πίσω σε αυτό είναι αρκετά δυσκοίλια.
- Logistic Regression (εδώ δεν έχω ασχοληθεί και τόσο οπότε δεν ξέρω τι να προτείνω
Clustering:
-Τον όμορφο KMeans, εδώ διάβασε και για τον KMeans++ που δεν ξεκινάει με εντελώς random κέντρα.
-Τέλος εδώ πιάσε το Spectral Clustering <-- και αυτό έχει ψωμί ωραίο και παίζουν διάφορα παραλλαγές κτλ. εδώ κοιτάς το
http://engr.case.edu/ray_soumya/mlrg/Lu ... tering.pdf και όπου κολλάς κοίτα από και από στο web για τις γενικές ιδέες
Άμα καλύψεις τα παραπάνω θα έχεις μια πολύ καλή γνώση όσον αφορά τα mainstream πράγματα που παίζουν στο machine learning (και με αυτά καλύπτεις τις βασικές γνώσεις που θα χρειαστείς και σε πιθανή δουλειά για machine learning).
Μετά μπορείς να κοιτάξεις (μπορεί και στην βιβλιοθήκη στην ασοεε) κάποιο βιβλίο άμα θες να εμβαθύνεις σε κάποιο αλγόριθμο και στα μαθηματικά από πίσω του(για άλλη χρήση δεν έχει και πολύ νόημα το βιβλίο). Τέλος μπορείς να κοιτάξεις γενικά για το deep learning (σχετικά νέο trend)
Για να δεις τα πράγματα πρακτικά: Από τα ωραιώτερα εργαλεία (plug-n-play) με έτοιμα examples κτλ είναι το
http://scikit-learn.org/stable/<-- εδώ έχει ό,τι χρειάζεσαι για δεις πως δουλεύουν οι αλγόριθμοι (έχει σχεδόν τα πάντα). Τσέκερε το section με τα examples, έχει έτοιμο κωδικα που κατεβάζει τα dataset που χρειάζεται και τρέχει αλγορίθμους οπότε είναι εύκολο και ωραίο (ειδικά εάν έχεις ξαναασχοληθεί με python).
ΥΓ: και το weka είναι ωραιο αλλά όταν έρθει η στιγμή να γράψεις κάτι δικό σου και να χρειαστεί να καλέσεις έναν αλγόριθμο μέσω κώδικα και όχι απο το gui, το api του είναι κάτι παραπάνω από σάπιο.
ΥΓ2: για πιο powerful εργαλείο και γρήγορο είναι και το shogun(c++)
http://www.shogun-toolbox.org/