Non c'è dubbio che la valutazione delle prestazioni di un algoritmo di clustering sia fondamentale in ambito data science. Tra le varie metriche utilizzate, la metrica di Davies-Bouldin è sicuramente una delle più interessanti.
Ma in cosa consiste esattamente questa metrica e quali vantaggi offre rispetto alla già popolare silhouette?
La metrica di Davies-Bouldin, proposta da David L. Davies e Donald W. Bouldin nel 1979, è un indicatore che misura la bontà di un algoritmo di clustering in base alla separazione tra i cluster e la loro compattazione. Essenzialmente, più basso è il valore ottenuto, migliore sarà il clustering.
Rispetto alla silhouette, si caratterizza per un più efficiente algoritmo di calcolo. Si può misurare, infatti, anche su dataset molto grandi con tempi più che accettabili, contrariamente alla silhouette che invece richiederebbe tempi maggiori. Io uso sempre entrambe le metriche per verificare se le loro indicazioni coincidono e avere maggiore confidenza sulla bontà dei cluster.
In sintesi, più vicina a 0 è la metrica di Davies-Bouldin, più i cluster sono separati correttamente.
#artificialintelligence #MachineLearning #DataScience #intelligenzaartificiale #analisi #python