Inspiration
Davant les dificultats de poder extreure relacions en les diferents dades clíniques, ens vam endisar en poder extreure alguns resultats mitjançant clustering.
What it does
Realitzarem clustering per poder agrupar els diferents pacients i les seves dades. La seva finalitat serà poder trobat característiques semblants entre ells.
How I built it
- Netejar les dades: hem eliminat les columnes (Var12, Var14) per la gran quantitat de dades que falten i també el pacient amb la "id" S20. Hem passat a numèriques les dades categóriques i hem arreglat les dades incorrectes.
- Clustering clínic: hem realitzat en R l'estudi de quants cluster podríem agrupar les dades que teníem i seguidament, amb el valor obtingut, hem realitzat l'algorisme PAM (k-medroids https://www.cs.umb.edu/cs738/pam1.pdf https://www.rdocumentation.org/packages/cluster/versions/2.1.0/topics/pam) per poder clusteritzar per similitud amb la distància Euclidiana.
- Clustering genòmic: hem tornat a realitzar un estudi semblant on hem utilitzat l'algorisme CLARA (algorisme molt semblant a PAM, però amb una gran magnitud de dades, https://www.rdocumentation.org/packages/cluster/versions/2.1.0/topics/clara).
Challenges I ran into
L'objectiu que teníem plantejat era poder extreure relacions entre les diferents clusteritzacions realitzades en cada dataset, i així, trobar patrons o característiques que defineixin els pacients amb les variacions. Però no hem sapigut relacionar els dos resultats. Això ambé es degut a la manca de coneixement sobre profiling que ens podria haver ajudat en aquest aspecte.
Accomplishments that I'm proud of
Gràcies al fet de poder treballar amb dades mèdiques reals hem pogut aplicar i observar diferents algorismes de clustering, cosa que no havíem fet mai. On finalment, hem pogut extreure alguns resultats.
What I learned
En aquest tres dies hem pogut aprender altres tipus d'algoritmes de clustering que no coneixiem anteriorment. També, ens hem barallat amb R per poder dur a terme els resultats.
What's next for Clustering vs Acquired Hempohilia A
Analitzar els resultats i observar les correlacions que s'estableixen. Per una altra part, hauríem d'estudiar amb més exactitud diferents algorismes que podrien ser més adients a les dades del genoma.
Built With
- bioinformatics
- clara
- cluster
- clustering
- pam
- r
Log in or sign up for Devpost to join the conversation.