Análisis de datos
En el Análisis de Datos (o Data Science) tenemos cinco etapas:
- Enmarcar el problema. Hacer las preguntas adecuadas.
- ¿Cuál es el objetivo?
- ¿Qué queremos estimar o predecir? - Adquirir y preparar los datos.
- ¿Qué recursos tenemos para obtener datos?
- ¿Qué información es relevante?
- Limpiar y filtrar los datos para su posterior análisis. - Explorar los datos.
- Visualizar los datos.
- Localizar en los gráficos posibles tendencias, correlaciones o patrones. - Modelizar y evaluar los datos.
- Utilizar algún algoritmo innovador (según el problema) para crear el modelo.
- Evaluar el modelo. - Comunicar los resultados y/o puesta en producción.
- ¿Qué resultados hemos obtenido?
- ¿Qué hemos aprendido?
- ¿Los resultados tienen sentido?
El ciclo de vida de los proyectos de análisis de datos es el siguiente:
Los lenguajes de programación que se suelen utilizar para realizar Análisis de Datos son:
- Python
- R