D’acord amb un article publicat a la revista Forbes, un científic de dades dedica el 80% del seu temps a la preparació de les dades (19% a l’obtenció dels conjunts de dades i un 60% a la depuració i organització d’aquests). A més, l’enquesta també revela que un 76% dels científics de dades creuen que la preparació de les dades és la part menys divertida i agraïda del seu treball.

A Tau Analytics ratifiquem aquestes sentències i, després dels nostres anys d’experiència, creiem fermament que cal aprofitar tots els nostres mitjans per a poder reduir de manera considerable aquestes xifres. Aquesta és la raó de ser del paquet que hem desenvolupat, clickR.

clickR és una llibreria que es troba al repositori CRAN i que pot ser instal·lat fàcilment al software estadístic R amb el comandament: install.packages(”clickR”). Es tracta d’un paquet per a la depuració de bases de dades i l’exportació de resultats.

A les diapositives que es mostren a continuació, s’exposen les principals funcions d’aquest paquet, que consisteixen a explorar les bases de dades i arreglar-les mitjançant la família de funcions “fix”, i en exportar els resultats. D’aquesta manera, aconseguim facilitar, simplificar i reduir la tasca més tediosa, i així podem invertir més temps a les tasques que realment ens apassionen.