Want to make creations as awesome as this one?

Transcript

Ciclos de vida de un proyecto de datos

CRISP-DM

Proyecto de datos

Introduccion

Al realizar un proyecto, la ciencia de datos es una base fundamental para manejarlos ya que son el conjunto de planificacion y coordinacion para abordar un problema que se requiera implementar la ciencia de datos.

Antecedentes

Antes de CRISP-DM, no existía un proceso estandarizado y reconocido para realizar proyectos de minería de datos. Cada proyecto podía abordarse de manera diferente, lo que dificultaba la comparación y la replicación de métodos exitosos.Con el aumento de la disponibilidad de datos y la conciencia de su valor, surgió la necesidad de desarrollar un enfoque sistemático para extraer conocimiento útil a partir de grandes conjuntos de datos.

CRISP-DM

CRISP-DM

Antecedentes

CRISP DM fue resultado de un proyecto colaborativo que dio a luz en 1996, liderado por 3 empresas, Daimler-Benz (posteriormente DaimlerChrysler), ISL (posteriormente SPSS) y NCR, financiado por la comision europea, concluyendo en 1999 con un primer borrador, que posteriormente fue revisado hasta primera versión completa (CRISP-DM 1.0) publicada en 2000

La Metodología CRISP-DM, acrónimo de "Cross Industry Standard Process for Data Mining", es un marco de referencia ampliamente aceptado para proyectos de minería de datos. Ofrece una serie de fases y actividades que guían el proceso completo, desde la comprensión del negocio hasta la implementación de modelos para la minería de datos.

CRISP-DM

Entendimiento del negocio:

  • Identificar los objetivos del negocio y transformarlos en metas de minería de datos.
  • Evaluar la situación actual del negocio y sus desafíos.
  • Definir criterios de éxito y establecer un plan de proyecto.

CRISP-DM

Funcionamiento

CRISP-DM

Funcionamiento

Entendimiento de los datos:

  • Recopilar datos relevantes para el proyecto.
  • Explorar los datos para comprender su calidad, distribución y características.
  • Identificar problemas y limitaciones de los datos.

CRISP-DM

Funcionamiento

Preparación de los datos:

  • Limpiar y transformar los datos para su uso en el modelado.
  • Seleccionar y codificar características relevantes.
  • Tratar valores faltantes y normalizar los datos.

CRISP-DM

Funcionamiento

Modelado:

  • Seleccionar y construir modelos de minería de datos.
  • Explorar diferentes algoritmos y técnicas de modelado.
  • Evaluar y ajustar los modelos para mejorar su rendimiento.

CRISP-DM

Funcionamiento

Evaluación:

  • Evaluar la calidad y la adecuación de los modelos construidos.
  • Comparar modelos y seleccionar los más adecuados para los objetivos del negocio.
  • Validar los resultados y medir su impacto en los criterios de éxito.

CRISP-DM

Funcionamiento

Despliegue:

  • Implementar los resultados del análisis en el entorno de producción.
  • Integrar los modelos en sistemas existentes y presentar los resultados a los interesados.
  • Crear un plan de acción para mantener y actualizar los modelos en el futuro.

CRISP-DM

Documentación

Informes Finales:

  • Se debe crear un informe final que resuma todo el proyecto. Este informe es crucial para comunicar los resultados.
  • El informe debe ser claro y comprensible para audiencias no técnicas, proporcionando información sobre el contexto del negocio, los objetivos, los resultados obtenidos y las recomendaciones derivadas del análisis.
  • Es importante incluir visualizaciones efectivas, gráficos y tablas que respalden las conclusiones y faciliten la comprensión de los resultados por parte de los interesados.

CRISP-DM

Documentación

Reproducibilidad:

  • Otros equipos o profesionales deben poder seguir los pasos del proyecto, desde la comprensión inicial hasta la implementación del modelo, utilizando la información documentada.
  • Esto es esencial para la validación de resultados, la auditoría y la colaboración entre equipos.
Versionamiento:
  • Mantener un registro de las versiones ayuda a realizar un seguimiento de los cambios realizados durante el desarrollo del proyecto y facilita la gestión del ciclo de vida del modelo.

FinanzasDetección de fraude, análisis de riesgo crediticio, segmentación de clientes.

TelecomunicionesOptimización de redes, detección de clientes que abandonan el servicio , análisis de patrones de uso.

SaludDiagnóstico de enfermedades, pronóstico de resultados de pacientes, desarrollo de nuevos medicamentos.

MarketingOptimización de campañas, análisis de comportamiento del cliente, desarrollo de productos.

ManufacturaControl de calidad, predicción de mantenimiento, optimización de procesos.

CRISP-DM

¿Dónde se aplica?

Por ejemplo, en un proyecto de minería de datos en salud, se puede utilizar la metodología CRISP-DM para desarrollar un modelo que permita clasificar automáticamente una citología del paciente y complemente la labor de diagnóstico del patólogo, mejorando la precisión diagnóstica.

Ejemplo

CRISP-DM

¿Cómo se aplica?

La metodología CRISP-DM se ha utilizado en el sector salud para proyectos de minería de datos, que buscan mejorar la precisión en el diagnóstico de enfermedades.

CRISP-DM

Conclusión

En conclusión, CRISP-DM (Cross-Industry Standard Process for Data Mining) se posiciona como una respuesta a la falta de estandarización, la necesidad de un enfoque estructurado y la creciente importancia de aprovechar los datos de manera efectiva en diversos contextos empresariales, brindando un enfoque estandarizado y estructurado para la minería de datos en un momento en el que la utilización efectiva de los datos se ha vuelto esencial en diversos contextos empresariales.

https://repositorio.upao.edu.pe/handle/20.500.12759/6629 Libro: The CRISP-DM Process for Data MiningAutores: C.J. Shearer, J.J. Ebecken, T.A. Pfahringer, R.D. Jansen, R.U. Witten Empresas que utilizan CRISP-DM:Telefónica,Banco BBVA,Carrefour,Repsol,Indra,American Express,Amazon,Google,Microsoft,Netflix

Datanauta. (2023, 12 junio). CRISP-DM: la brújula del mundo empresarial data driven. Medium. https://medium.com/@datanauta/crisp-dm-la-br%C3%BAjula-del-mundo-empresarial-data-driven-1139b7623296

G, I. R. (2023, 28 mayo). CRISP-DM, Metodología de Datos - IPMOGuide. iPMOGuide.https://www.google.com/amp/s/ipmoguide.com/crisp-dm-metodologia-de-datos/%3famp

IBM. (2024, 17 septiembre). Conceptos básicos de ayuda de CRISP-DMhttps://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview

Bibliografia