Según un artículo publicado en la revista Forbes (https://bit.ly/2lR8dep), un data scientist dedica el 80% de su tiempo a la preparación de los datos, siendo un 19% la obtención de los conjuntos de datos y un 60% la depuración y organización de éstos. Además, la encuesta también revela que un 76% de los data scientists creen que la preparación de los datos es la parte menos divertida de su trabajo.

En Tau Analytics ratificamos estas sentencias y, después de nuestros años de experiencia, creemos firmemente que debemos aprovechar nuestros medios para poder disminuir de manera considerable dichas cifras. Y esta es la razón de ser del paquete que hemos desarrollado, clickR.

clickR es una librería que se encuentra en el repositorio CRAN y que se puede instalar fácilmente en el software estadístico R con el comando: install.packages(”clickR”). Se trata de un paquete para la depuración de bases de datos y la exportación de resultados.

En las diapositivas que se muestran a continuación, observaremos que las funciones principales de esta librería consisten en explorar las bases de datos y arreglarlas a través de las funciones “fix”, y también en la exportación de resultados. De esta manera, conseguimos que se facilite y simplifique el trabajo tedioso, pudiendo dedicar más tiempo a las tareas que realmente nos apasionan.