Buenas tardes, podrias regalarme el link donde pueda acceder al archivo .CSV donde explicas para poder seguirte paso a paso, quedo pendiente de tu respuesta. Mil gracias.
Hola, Automata. Estoy investigando un poco qué herramientas hay para la limpieza de datos o data cleansing. Entiendo que los escripts de procesamiento pueden escribirse en Python también, ¿es así? La duda que tengo es si OpenRefine te permite obtener un registro de operaciones realizadas sobre los datos, y en algún lenguaje, de modo de poder introducir cambios en el algoritmo de procesamiento y depuración de los datos para volver a ejecutarlo con la misma base o con otra. En este sentido, a mí me fue muy útil durante mucho tiempo trabajar con SPSS, que permitía realizar cambios en los datos y registrar cada uno de ellos en un script en lenguaje tipo BASIC. ¡Espero tu respuesta! Gracias.
hola! muy bien explicado. me gustaria saber si a la hora de hacer el cluster por palabra clave de autor (por ejemplo) influye en algo que haya mas conceptos, por ejemplo: Accountability; Authorship; Editorial ethics; Journals; Scientific journals; Scientific process separados por ; muchas gracias un saludo!
¡Hola, gracias! No se puede hacer cluster de listas como las que mencionas. Pero sí puedes hacer facets de los valores separados por ";", y eso puede ser útil. En "Facet", escoges "Custom text facet" y en el recuadro que dice "Expression" pones: value.split(", ");
Gracias por la explicación Sergio, una pregunta: cuando cargas la base de datos se genera una copia o está afectando la principal? Nos sería muy útil una explicación de Expresiones Regulares. Gracias por publicar y compartir.
Hola. Se genera una copia dentro de Open Refine. Después se puede descargar la tabla en diferentes formatos. Voy pensar lo de las Expresiones Regulares, gracias por la sugerencia.
Estupenda presentación de las posibilidades de OpenRefine. ¡Gracias!
Genial amigo! He aprendido mucho con este video, excelente aporte!
Buenas tardes, podrias regalarme el link donde pueda acceder al archivo .CSV donde explicas para poder seguirte paso a paso, quedo pendiente de tu respuesta. Mil gracias.
Hola, Automata. Estoy investigando un poco qué herramientas hay para la limpieza de datos o data cleansing. Entiendo que los escripts de procesamiento pueden escribirse en Python también, ¿es así?
La duda que tengo es si OpenRefine te permite obtener un registro de operaciones realizadas sobre los datos, y en algún lenguaje, de modo de poder introducir cambios en el algoritmo de procesamiento y depuración de los datos para volver a ejecutarlo con la misma base o con otra.
En este sentido, a mí me fue muy útil durante mucho tiempo trabajar con SPSS, que permitía realizar cambios en los datos y registrar cada uno de ellos en un script en lenguaje tipo BASIC. ¡Espero tu respuesta! Gracias.
hola! muy bien explicado. me gustaria saber si a la hora de hacer el cluster por palabra clave de autor (por ejemplo) influye en algo que haya mas conceptos, por ejemplo: Accountability; Authorship; Editorial ethics; Journals; Scientific journals; Scientific process separados por ; muchas gracias un saludo!
¡Hola, gracias! No se puede hacer cluster de listas como las que mencionas. Pero sí puedes hacer facets de los valores separados por ";", y eso puede ser útil. En "Facet", escoges "Custom text facet" y en el recuadro que dice "Expression" pones: value.split(", ");
perdón value.split("; ");
Gracias por la explicación Sergio, una pregunta: cuando cargas la base de datos se genera una copia o está afectando la principal? Nos sería muy útil una explicación de Expresiones Regulares. Gracias por publicar y compartir.
Hola. Se genera una copia dentro de Open Refine. Después se puede descargar la tabla en diferentes formatos. Voy pensar lo de las Expresiones Regulares, gracias por la sugerencia.
@@automata_ Gracias Sergio, muy útil.
Hola, dónde puedo encontrar ese dataset?
¿Cuánto se tardaría procesando 200,000 filas?
@@zurielchavez nada
@@DavidRomero-nm7wu lo puse desde ayer y no termina 😰