- 12
- 167 253
jorgeklz
เข้าร่วมเมื่อ 20 ก.ย. 2006
Minería de Datos (Clase 2: Selección, limpieza y transformación)
Universidad Técnica de Manabí. Facultad de Ciencias Informáticas. Minería de Datos. Se explica en detalle los procesos de selección, limpieza y transformación de datos que son parte de KDD.
มุมมอง: 875
วีดีโอ
Algoritmo de PRIM (español) funcionamiento.
มุมมอง 7K5 ปีที่แล้ว
Ejemplo de funcionamiento algoritmo de PRIM (español).
Algoritmo de Kruskal (español) funcionamiento.
มุมมอง 1.7K5 ปีที่แล้ว
Ejemplo de funcionamiento del algoritmo de Algoritmo de Kruskal (español) . MST (Árbol de Expansión Mínima).
Penales semifinal CHILE vs Portugal reacción Copa Confederaciones 2017
มุมมอง 9K7 ปีที่แล้ว
Semifinal Chile Portugal penales reacción Copa Confederaciones 2017 Chile. Celebrando como buen extranjero agradecido con este país.
Reacción final copa América Centenario Final Chile Campeón. Chile vs Argentina
มุมมอง 128K8 ปีที่แล้ว
Reacción final Copa América Centenario penales. Chile Campeón Copa América 2016. Chile vs Argentina. Dos chilenos un ecuatoriano celebrando el bicampeonato de Chile desde Porto Alegre
Los cuartiles son medidas de posición que dividen un conjunto de datos en cuatro partes iguales, permitiendo analizar cómo se distribuyen los valores. Conocer estas medidas es crucial para entender la información en análisis de datos reales. 30:18
En el minuto 12:02, se aborda de manera interesante el proceso de selección y limpieza de datos, un aspecto crucial en cualquier análisis de datos. Se destaca la importancia de identificar correctamente las fuentes, que pueden ser tanto internas (como bases de datos SQL) como externas (como repositorios de datos populares como UCI y Kaggle). Este tema resulta fascinante porque subraya cómo la correcta selección de los datos puede determinar el éxito del análisis, evitando que conclusiones erróneas afecten la toma de decisiones. La claridad con la que se explica el proceso muestra lo fundamental que es esta etapa para extraer información valiosa.
Me pareció interesante acerca de la discretización de atributos mas que nada por que transforma las variables cuantitativas en categorías cualitativas, puesto que simplifica lo que son los datos y nos ayuda a analizar mejor el tema de datos creo que es algo bastante útil ya que se puede saber que datos son mas relevantes 42:24
Muy interesante el tema que se a tratado , Quiero destacar algunos momentos clave que me parecieron muy interesantes y están muy bien explicados. Uno de ellos es la solución a la falta de datos mediante el uso de la base de datos. Esto permite ampliar el análisis de manera más detallada y efectiva. Además, resalta la importancia del proceso de limpieza de datos mencionado en el minuto
Excelente video, profesor, Quiero agradecerle por explicar tan claramente las etapas del proceso KDD. Me ayudó a entender mejor cómo cada una de las fases, desde el dominio del problema hasta la interpretación y evaluación, son esenciales para extraer valor de los datos. Me gustó especialmente cómo enfatizó la importancia del análisis exploratorio de datos dentro de la limpieza, ya que proporciona una visión general crítica antes de entrar a la minería de datos. Me permitió reforzar conceptos clave como el enriquecimiento de datos y cómo este proceso impacta en el análisis final. Gracias por compartir su conocimiento.
Muy buena explicacion (minuto 47:50) sobre la normalización de datos siendo crucial para el proceso de minería de datos, se menciona que la naturaleza de datos no cambia al normalizarlos, solo sus valores.. 👍
18:43 Muy interesante resaltar la importancia de la limpieza de datos, ya que es muy común que dentro de conjuntos de datos existan estas inconsistencias como valores faltantes o el uso de distintas nomenclaturas, que nos dificulten manipular los datos que necesitamos para realizar nuestras tareas de minería de datos.
En el minuto 09:38 nos instruye acerca de la adecuada iniciativa para una adecuada selección de datos, ya que necesita contar con fuentes diversas y mucho más en dominios de muestreo estadístico. Las bases de datos frecuentemente encontradas son las bases de datos relacionales, las bases de datos espaciales y las bases de datos temporales. En el minuto 12:02 nos indica que el repositorio UCI perteneciente a la universidad de California cuenta con un número indefinido. En el minuto (17:56) se inicia la explicación sobre la limpieza de datos, detallando que es lo que más tiempo requiere en el flujo de trabajo de la Dirección de Desarrollo. Esta incluye tres fases esenciales: la limpieza en sí misma, el enriquecimiento y el análisis exploratorio de los datos. La limpieza implica la supresión de las observaciones no deseadas de los tados, lo que implica la eliminación de observaciones insignificantes o de fallos estructurales. En el minuto 38:14 nos habla acerca de la transformación de datos en esta fase, donde se pueden efectuar numerosas operaciones en un contexto numérico con toda la información disponible sin modificar los datos.
Excelente explicación en el minuto 36:12 sobre la importancia de la transformación de datos categóricos a numéricos mediante técnicas como el one-hot encoding y el label encoding, lo que facilita que los algoritmos de aprendizaje automático puedan trabajar con estos datos de manera eficiente. Además, en el minuto 19:35, se menciona la relevancia del manejo de valores faltantes y las estrategias para imputar o eliminar dichos datos según el contexto del problema, un paso esencial para evitar sesgos en el análisis. Este proceso de transformación no solo optimiza los modelos, sino que también mejora la calidad del análisis posterior. Un video altamente recomendado para quienes buscan profundizar en la minería de datos.👍
33:36 Gracias por la explicación sobre los gráficos de dispersión. Es interesante ver cómo se puede usar esta técnica para identificar tendencias entre dos variables numéricas, muy útil para el análisis exploratorio de datos
El video está súper bueno, me gustó mucho cómo explica las primeras etapas del KDD. Lo que más me llamó la atención fue lo importante que es entender bien el problema desde el inicio (01:27), porque eso te asegura que estás haciendo el análisis correcto. Además, el tema de la limpieza de datos (18:00) me pareció súper interesante, ya que toma mucho tiempo pero es clave para que los datos sean útiles. También me gustó la parte de la transformación de datos, como eliminar valores que faltan o reducir la dimensionalidad (40:24). En general, es un video bastante claro y útil. gracias por informarnos con este video.
Muy buen video relacionado con las tres primeras etapas del proceso KDD. Quiero destacar algunos momentos clave que me parecieron muy interesantes y están muy bien explicados. Uno de ellos es la solución a la falta de datos mediante el uso de la base de datos "Iris", disponible en el repositorio UCI (12:38). También me llamó la atención el enfoque en el enriquecimiento de datos, que es crucial para el análisis de futuros datos. Esto se explica muy bien en el minuto (24:07), y se complementa con ejemplos de enriquecimiento demográfico (25:37) y geográfico (26:36). En general, fue un excelente video, educativo y entretenido a la vez.
En el minuto 33:39 cuando hablan de los gráficos de dispersión, me pareció muy interesante cómo se muestra la relación entre el precio y las ventas. Es loco ver que hay un punto en que la gente deja de comprar cuando los precios son demasiado altos
Fenomenal explicación en el minuto 44:29 sobre la numerización de atributos y la habilidad de generar nuevas variables a partir de categorías existentes. Esto permite ampliar el análisis de manera más detallada y efectiva. Además, resalta la importancia del proceso de limpieza de datos mencionado en el minuto 17:51, ya que es una de las etapas más laboriosas en la minería de datos. Este proceso se divide en tres subetapas clave: Limpieza: Aquí se eliminan los datos irrelevantes dependiendo del caso específico. Enriquecimiento: En esta fase se buscan nuevos datos a partir de los ya existentes, con el fin de obtener una mayor comprensión de los mismos. Análisis Exploratorio de Datos (EDA): Finalmente, se realiza un análisis estadístico de los datos recopilados para extraer conclusiones útiles. En general, un excelente video. S <3
Muy buena explicación en el 44:29 sobre la numerización de atributos y la capacidad que se tiene de crear nuevas variables a partir de los datos de otra categoría existente. También a destacar sobre la importancia en la limpieza de datos 17:51, esta es una de las partes que más tiempo consumen en la minería de datos. El proceso de la limpieza de datos se divide en tres subetapas: Limpieza.- En donde se hace un gran descarte de los datos irrelevantes según el caso. Enriquecimiento.- Se buscan obtener nuevos datos a partir de lo que ya se tienen, esto para buscar tener un mejor entendimiento de los datos a lo largo del caso. EDA.- En esta etapa se hace un análisis estadístico de los daots que ya se tienen. Muy buen video.
Este video es muy interesante , Nos comenta todo el proceso de mineria de datos, partiendo desde datos sin procesar hasta llevarlo a informacion util La transformación de datos permite preparar los datos para su análisis y garantizar su compatibilidad con los algoritmos de minería de datos (06:05).
Excelente clase! La explicación sobre la importancia de la limpieza de datos en el minuto 18:48 fue especialmente clara y útil. Resaltar cómo las observaciones irrelevantes y los errores estructurales pueden afectar el análisis realmente ayuda a comprender la necesidad de un buen preprocesamiento. Gracias por los ejemplos la verdad son muy buenos. También me pareció muy interesante la parte en el minuto 36:54, donde se habla sobre la correlación y cómo esta no necesariamente implica causalidad. Fue un recordatorio importante para no malinterpretar los datos durante el análisis.
Excelente explicación en el minuto 01:20 sobre la importancia de definir el dominio del problema antes de iniciar cualquier análisis de datos. Tener claro el objetivo y las preguntas clave es esencial para asegurar que el proceso de minería de datos sea efectivo.
Me pareció interesante y entiendo que la "Selección de datos" es uno de los primeros pasos en el proceso de extracción de datos e implica únicamente seleccionar información relevante para el análisis. Esto es importante porque seleccionar datos innecesarios complica el proceso. Por lo general, usamos una base de datos relacional (como SQL) para obtener los datos que necesitamos y, si eso no es suficiente, podemos usar un repositorio externo como el repositorio de la Universidad de California. La clave es utilizar únicamente información que sea útil para resolver el problema que planteó en primer lugar. Este tema fue mencionado a partir del minuto (09:22).
Excelente video, muy preciso e informativo sobre todo lo que conlleva a la Selección, Limpieza y Transformación de Datos. Me pareció interesante lo siguiente: En el minuto 18:51, la explicación del primer paso de la Limpieza de Datos y lo fundamental que debe ser antes de empezar con el proceso mencionado. El ejemplo de la Observación Irrelevante es real, cuando se necesita saber algo sobre un determinado tema, y los datos que no necesitamos dentro del contexto, esto puede afectar de manera negativa. El minuto 20:07 habla sobre los Errores Estructurales, y como una gran cantidad de datos que son relevantes pero que al momento de organizarlos están mal etiquetados, pueden llegar a tener inconsistencias porque toda información es importante siempre y cuando tenga una mejor organización. En el minuto 24:19, el proceso del Enriquecimiento es interesante porque los datos que ya existen dentro de una BD, pueden llegar ampliar la información requerida para que dentro de algún tiempo exista un mejor entendimiento de acuerdo a los datos.
El minuto (9:33) me pareció clave. La explicación sobre la selección de datos es fundamental para garantizar resultados confiables en cualquier análisis y que nos ayude a que sea exitoso. ¡Muy bien explicado y me pareció perfectocomo se detallaron las diferentestécnicas!"
Me pareció excelente la clase sobre minería de datos. Quiero destacar el minuto 18:40, donde se aborda la "Limpieza de Datos". Es crucial eliminar observaciones no deseadas y corregir errores estructurales para garantizar que nuestra base de datos sea confiable. También se mencionan las observaciones irrelevantes, que son un aspecto crítico en este proceso. Además, en el minuto 38:11 se habla de la "Transformación de Datos", que permite dar un contexto numérico a la información sin alterar su originalidad, lo que mejora la utilidad de los datos para los modelos.
Excelente explicación, quiero resaltar el minuto 44:30 Estamos convirtiendo palabras en números, pero no de cualquier manera. La clave está en que mantenemos el orden que tiene sentido en la vida real - como un niño (1) es más joven que un joven (2), que a su vez es más joven que un adulto (3), y así hasta llegar al anciano (4). No podemos poner los números al azar porque perderíamos el significado original de las categorías. Es como crear una escalera donde cada escalón (número) representa una etapa de la vida en el orden correcto. Me parece muy interesante cómo esto ayuda a que las computadoras puedan "entender" y trabajar con conceptos que para nosotros son obvios.
Excelente video, realmente me pareció muy interesante, especialmente la parte del minuto 24:30, donde se profundiza en el enriquecimiento de datos demográficos, me parece fascinante cómo se puede categorizar información como edades, géneros o nacionalidades, lo que facilita enormemente la comprensión de las características de un grupo poblacional específico. Este tipo de análisis es crucial para obtener una visión más detallada y precisa, y sin duda aporta mucho valor en cualquier estudio o proyecto basado en datos.
El tema de la limpieza de datos en el minuto (32:52) me pareció relevante, ya que es un paso esencial antes de crear visualizaciones gráficas. En lo que respecta a histogramas, gráficos de barras y gráficos de dispersión, la limpieza de datos asegura que las visualizaciones reflejen con precisión la información.
Excelente video, muy bien explicado pero quiero resaltar en el minuto (18:40) que nos habla sobre la "Limpieza de Datos" donde básicamente nos enseña a eliminar las observaciones no deseadas incluyendo observaciones duplicadas, las obervaciones irrelevantes son aspectos criticos de limpieza de datos y los errores estructurales que basicamente ocurren cuando no fueron ingresados correctamente a una BD, me intereso mucho este tema ya que nos puede aportar mucho.
Excelente video, muy bien explicado y fácil de entender, definitivamente un video muy útil y recomendable. Lo que más me llamó la atención fue el tema de la transformación de datos que se menciona en el minuto 39:35, donde explican cómo se pueden hacer varias transformaciones sin alterar la naturaleza del dato. Es interesante ver cómo este proceso permite modificar la forma de los datos para un análisis más eficiente sin cambiar su esencia.
Minuto 23 Muy buena explicación sobre la limpieza de datos y correcciones de errores y el minuto 25 la explicación del enriquecimiento de datos demográficos y también explicación el minuto 28 el análisis del exploratorio de datos q permite eso visualizar patrones y tendencias
Excelente video, muy explicativo conciso y al punto👌 sin embargo, me llamó más la atencion el tema de Limpieza de Datos del minuto 18:40 donde se habla de que es importante descartar datos " innecesarios" o "incorrectos" que dañan la estructura de lo demás.
Excelente explicación sobre la "numerización de atributos" y cómo convierte los valores categóricos en datos que los algoritmos de minería pueden procesar. La diferenciación entre numerización 1 a 1 y 1 a n queda muy clara la explicación (44:30). también, el desglose que se hizo a los diferentes tipos de "normalización de atributos". La normalización min-max para escalar los valores entre un rango específico (48:51), la normalización Z que ajusta los datos según la desviación estándar (50:05), la normalización logística ideal para modelos probabilísticos (50:50), y la normalización logarítmica para manejar datos con distribuciones parciales (51:37) :)
Excelente video me intereso mucho la explicación sobre la eliminación de valores faltantes y la discretización de variables en el minuto (40:32)me ayudó a entender mejor cómo estas transformaciones pueden mejorar el análisis sin cambiar la naturaleza de los datos. Muy claro y útil para quienes trabajan con datos complejos.
Me pareció interesante saber como se desenlaza el tema de limpieza de datos ( 17:52 ) ya que me parece muy importante para la eliminación de "datos innecesario, incorrectos, etc", también me percate que se deben tomar tres sub etapas que son limpieza en sí mismo, enrequecimiento de datos y análisis exploratorio de datos (EDA), el video me pareció genial, muy bien explicado.
Me encantaria resaltar la explicacion que da en la parte del video 39:35 sobre la transformación de datos, de como podemos hacer varias transformaciones de datos sin cambiar la naturalidad del dato, ya que esta modifica la información de datos pero no la naturaleza del mismo , me gusta que este vídeo ya que me ha hecho tener el interes en investigar mas sobre el tema.
Excelente explicación de la clase, quiero resaltar el minuto 5:40 donde se explica muy bien la diferencia entre problemas predictivos y descriptivos, destacando que un problema predictivo, como la predicción de ventas, usa datos pasados para anticipar el futuro. Es importante definir esto correctamente, ya que una estrategia predictiva permite optimizar recursos y tomar decisiones más informadas, mientras que un enfoque descriptivo ayuda a entender el estado actual sin hacer proyecciones.
Muy interesante y excelente video, para quienes quieren profundizar en el mundo de la ciencia de datos. La explicación del enriquecimiento de datos demográfico y geográfico en el minuto (24:34) es clara y concisa. Me encantó la parte donde se menciona cómo a partir de una simple fecha de nacimiento se pueden generar múltiples variables de análisis. El ejemplo de Servientrega es un caso de uso real que demuestra el poder de esta técnica en el mundo empresarial. Gracias por compartir estos valiosos conocimientos.
Excelente video, muy bien detallado y explicado cada uno de los temas mencionados en el transcurso del video. Uno de los procesos que llamo mi atención fue la limpieza de datos en el minuto 18:02 en donde nos menciona que se trata de corregir o eliminar datos incorrectos para obtener un conjunto de datos libres de inconsistencia para asegurar la calidad y precisión en el análisis que se realice permitiendo obtener resultados más precisos. Para obtener estos resultados se debe seguir 3 etapas, limpieza, enriquecimiento y el análisis exploratorio de datos cada una de estas etapas aseguran que los datos estén en condiciones óptimas para generar resultados valiosos en cualquier proyecto de análisis. Otro de los procesos que también puedo resaltar es transformación de datos en el minuto 38:19 es el proceso de modificar, estructurar o convertir datos de su formato original a uno más adecuado para el análisis, almacenamiento o integración sin alterar los datos para así obtener resultados más fiables y significativos. Además, me pareció interesante que en cada proceso añadió ejemplos que nos ayudan a entender con mayor claridad cada uno de los temas mencionados.
Me gusta como añade ejemplos bastante comprensibles de los temas mencionados y como se desarrolla el tema de la seleccion de datos, también me pareció interesante saber que para hacer proceso de minería de datos, y al no tener información, podemos contar con otras posibilidades como mencionó (11:57) he inluso explore un poco la página de los repositorios de base de datos, y observe que se pueden descargar gratuitamente o importar a Python y poder manipular la base de datos, excelente video.
Toda la información del video es muy interesante pero el punto que más me llamó la atención es la Normalizacion de atributos, porque se pude cambiar lo svalores pero no la naturaleza de los datos y esto tambien mejora la precisión de resultados, facilita la comparación de los datos y reduce la influencia de valores extremos ( 47:30 )
Muy interesante el video, ya que nos enseña como analizar y darle una una solución a un problema antes de comenzar con la minería de datos, en el minuto (1:00) nos explica como analizar y llevar un orden especifico hacía un problema y la manera en como explica el domino del problema en forma de preguntas para poder dar solución a la problemática, en el minuto (9:35)-(11:00) no dice que unas vez tengamos todas las ideas claras y en orden la llevemos a la parte practica y la base de datos mas flexible para el almacenamiento de información.
Me pareció importante e interesante en el minuto 37:26 donde se habla de la aplicabilidad de los análisis exploratorios que dependen del tipo de variable que utilicemos para trabajar, también me llamó la atención en el minuto 39:35 donde se habla de la transformación de datos y como modifica información o la forma de los datos pero no modifica la naturaleza de los datos.
Excelente video sobre minería de datos. Me llamó la atención el minuto 06:04, donde se discute la diferencia entre el proceso descriptivo, que analiza datos históricos, y el predictivo, que busca anticipar eventos futuros. Esto es clave para tomar decisiones informadas en los negocios. También me gustó el minuto 18:11, que trata sobre la limpieza de datos, un paso fundamental para asegurar la calidad de la información al eliminar duplicados y errores. Además, en el minuto 24:15, se menciona el enriquecimiento de datos, que mejora la comprensión al incorporar información demográfica y geográfica. CHÁVEZ MACÍAS LOYNI NICOLE - PARALELO "B" - GRUPO #8
Excelente video, la explicación está muy bien detallada. A decir verdad sentí muy interesantes todos los temas pero los que más destaco que llamaron mi atención fueron "Numerización de Atributos" minuto 44:28 y "Normalización de Atributos" ya que me resulta fascinante las cantidades de cambios que se le puede dar a una variable sin que esta pierda el valor que tiene.
Una gran guía, excelente video, un punto a destacar que me llamo la atención fue en el minuto 38:16 ya que explica de una forma detallada sobre la transformación de datos y como esto forma parte de un paso fundamental dentro de lo que consta en la minería de datos, permitiendo tomar la información que se encuentra disponible para sintetizar variables con el fin de facilitar el análisis sin necesidad de alterar la naturaleza del dato al realizar varias transformaciones, además de explicarlo con ejemplos que suenan sencillos con el fin de poder captar de lo que trata la transformación de datos.
Excelente video, muy bien explicado todos los conceptos. A continuación estos son los puntos que me parecieron más interesantes y faciles de entender: Minuto 09:38: Se discutió la importancia de seleccionar datos correctamente, ya que estos suelen ser heterogéneos y provienen de varias fuentes, incluyendo bases de datos relacionales, espaciales y temporales. También se habló de muestreo estadístico. Minuto 12:02: Se mencionó el repositorio de la Universidad de California , que contiene numerosas bases de datos para tareas de clasificación. Minuto 17:56: La clase se centró en la limpieza de datos, que implica eliminar observaciones irrelevantes o con errores estructurales. Minuto 38:14: Se trató el tema de la transformación de datos, en particular cómo aplicar operaciones en un contexto numérico sin alterar la integridad de los datos. Segura Loor Franklin Ariel. "B". Grupo#2
Pienso que la pregunta mencionada en el minuto 2:52 y la del minuto 4:07 son clave, puesto que en muchos videos y clases del medio se habla sobre la minería de datos, pero algo importante a tener en cuenta es saber si el proyecto va a ser factible o no, y si la empresa va a contar con los medios para poder llevarlo a cabo. También el saber lo que puede ocurrir si fallamos nos ayuda a tener más claro aquel posible riego que se toma al llevar a cabo un proyecto. -Michael Eduardo Sornoza Moreno
En el minuto 09:38 nos enseño a entender la correcta iniciativa para una correcta selección e datos ya que debe tener fuentes heterogéneas y muchas cosas mas en dominios de muestreo estadístico el cual las bases de datos que se suele encontrar son las bases de datos relacionales, bases de datos espaciales y bases de datos temporales, en el minuto 12:02 nos dice que el repositorio uci que es de la universidad de california tiene un sin numero de bases de datos donde podremos encontrar cualquier tipo de información dedicado netamente para tarea de clasificación. En el minuto (17:56) comienza con la explicación obre la limpieza de datos y nos explico que es lo que mas consume tiempo en el flujo KDD incluye 3 etapas fundamentales las que se divide en la limpieza en si mismo , el enriquecimiento y el análisis exploratorio de datos. La limpieza es eliminar las observaciones no deseadas de los tados y esto conlleva a las observaciones irrelevantes o a errores estructurales. En el minuto 38:14 nos comenta sobre la transformación de datos en esta etapa donde se encontraran muchas operaciones que se pueden realizar en un contexto numerico con toda la información disponible sin alterar los datos.
Me pareció importante resaltar la importancia de lo expresado en el minuto 30:21. En este punto, se menciona un aspecto clave de las medidas de posición, específicamente los cuartiles, que permiten una segmentación precisa de los datos. La explicación sobre cómo el Q3 puede utilizarse para determinar que el 75% de las personas ganan menos de 50,000 dólares anualmente es un excelente ejemplo de cómo la estadística descriptiva ayuda a entender el comportamiento de grandes volúmenes de datos. Esto es fundamental en el análisis exploratorio, ya que permite obtener insights claros antes de aplicar técnicas más avanzadas de minería de datos.
Interesante el contenido que nos muestra el vídeo, los temas detallados, la explicación y como se abordó los conceptos explicados, el análisis descriptivo, predictivo y cómo la minería de datos puede intervenir en las ventas, el proceso KDD con las etapas que este está conformado. El contenido lo encontré bastante educativo e informativo, pero me gustaría resaltar, el minuto (36:23) donde nos muestra que la correlación puede ser positiva, negativa o nula (no correlacionado), también nos dice que, la correlación no implica causalidad, su comprensión esencial en el análisis, donde: - La correlación positiva: Ocurre cuando ambas variables aumentan o disminuyen juntas, indicando una relación directa entre ellas. - La correlación negativa: Implica que cuando una variable aumenta, la otra disminuye, reflejando una relación inversa. - La transformación de datos: Permite ajustar la forma de los datos sin alterar su esencia, esto incluye la eliminación de valores ausentes. Este vídeo me sirvio mucho para comprender mas, los temas mencionados, muchas gracias por este contendio de valor.
Excelente Video Con una muy buena explicación acerca de la MINERIA DE DATOS enfocándose en la (Selección, limpieza y transformación) En el minuto (18:15) esta la limpieza de datos la cual me intereso mucho ya que el objetivo de esta es limpiar, corregir o eliminar datos que no son los correctos En el cual también se habla sobre 3 sub etapas importantes Están las observaciones irrelevantes que se refiere a lo que no tiene sentido dentro de una base de datos Y los errores estructurales que son los datos importantes pero que no fueron guardados correctamente (38:11) Transformación de datos en esta etapa encontramos muchas operaciones que se pueden realizar El objetivo es dar un contexto numérico a la información disponible sin alterar la originalidad de los datos Esto permite que los datos sean útiles para modelos mejorando los resultados. EVA CAROLINA CEVALLOS SANCHEZ PARALELO "B"
Buen video es realmente interesante y hace un gran trabajo al desglosar conceptos estadísticos complicados. Es bueno ver cómo se pueden presentar estos temas de forma tan accesible, lo que lo hace perfecto para quienes están empezando en el análisis de datos... Un momento que me llamó la atención fue cuando hablaron de los cuartiles (30:18) y cómo nos ayudan a entender mejor cómo se distribuyen los datos. Creo que es una herramienta muy útil para identificar patrones. Pero, por otro lado, es fácil perderse en la jerga técnica. Muchas personas podrían sentirse abrumadas y no saber exactamente cómo aplicar esta información en la vida real. José Antonio Moncerrate León "A - Grupo1B"