Hola, me queda una duda con la función set_index, si es que no la estoy interpretando mal, se supone que fija "Location" como indice (index) ¿para luego realizar la búsqueda de algún dato en especifico? (como en este caso melbourne, pero respecto a los datos que se encuentran en ese indice) y como último para indexar 2 o más columnas ¿es posible?, estoy siguiendo sus videos muy atento y suscrito, saludos!!! :)
Hola Álvaro, index es la posición en la que se localizan los datos, en este vídeo hacemos algunas búsquedas que te pueden servir como guía, cualquier duda nos dices: th-cam.com/video/uzvA7ELCrkI/w-d-xo.html ¡Muchas gracias por tu suscripción!
@@cctmexico Hola!, gracias por responder una consulta más, conocen de algún texto sobre pandas aparte de su pagina oficial y stackoverflow?, excelentes videos!!!!!
HOLA. SABES ,INTENTO UTILIZAR EL ARCHIVO Y ME APARECE EL SIGUIENTE MENSAJE EN SPYDER UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 17: invalid continuation byte NO PUEDE TRAER EL ARCHIVO ATP- COMO LO SOLUCIONO??????
Hola! ese error aparece a veces en Windows, porque no se reconocen algunos caracteres del archivo. Podrías intentar bajar el archivo original: www.kaggle.com/jordangoblet/atp-tour-20002016
@@cctmexico hola y besos- el error se produjo cuando baje el archivo atp del sitio que dices-el error decía algo así como que algo de latín, era lo que no reconocía windows. me puedes enviar el archivo que te funciono a ti- gracias y besosssssss- te empece a seguir por instagran-
Si pones el siguiente: (Data.csv - Es el fichero csv de la ATP bajado) import chardet rawdata = open('Data.csv', 'rb').read() result = chardet.detect(rawdata) charenc = result['encoding'] Esto te dara en "spyder" en consola superior derecha el 'encoding' que tiene el fichero "Data.csv". Luego seria solo cargar el fichero con ese 'encoding'. En mi caso el 'encoding' del fichero me dijo que era 'Windows-1252'. datos=pd.read_csv('Data.csv', encoding='Windows-1252') Y con esto ya te cargaria el '.csv'
Hola buen video..... estaba haciendo pruebas pero cuando datos le asigno a un DataFrame y sobre el Dataframe quiero usar loc me sale ciertos errores, no entiendo por que?
¡Muchas gracias por tan amable comentario!, aquí te dejamos un vídeo que te puede servir como guía para resolver errores de Python en General: th-cam.com/video/X46F2-OxxqY/w-d-xo.html
¡Muy buen vídeo!, te pregunto si no tengo "palabras" sino números que necesito separar por columnas y filas para volverlos matrices mas pequeñas que debo hacer ya que no tengo un atributo "palabra" para seleccionarlos. Muchas gracias¡
Hola, quisiera saber como se pueden seleccionar dos tipos de filas (renglones) especificas? Es decir, si necesito que muestre la información de todos los grand slam (Series) de las finales (Round). Gracias
Hola nos encontramos estos ejemplos que te pueden ser de utilidad: stackoverflow.com/questions/55883053/selecting-specific-rows-from-a-pandas-dataframe
No se puede bajar el archivo de kaggle. Aparece en el apartado "Data Sources", aparece Data.csv y Metadata.txt, sólo el segundo se puede descargar, data.csv no se puede. ¡Ayudaaa!
Muchas gracias por el vídeo, me ha ayudado bastante. Solamente unas preguntas, precisamente para que sirve el comando set_index. Asimismo, cuando aplico el comando loc, la columna asociada al dato que quiero buscar desaparece de mi dataframe. En este caso , cuando busco "Atlanta" con el comando, la columna de "location" desaparece y en donde están las variables, en el apartado de "explorador de variables" mi data frame pasa de tener 54 columnas a 53.
El comando set_index en pandas se utiliza para establecer una o más columnas como el índice de un DataFrame. El parámetro "inplace" se utiliza para indicar si se debe realizar el cambio en el DataFrame original o si se debe crear un nuevo DataFrame con el índice modificado. Si se establece en True, el cambio se realizará en el lugar (en el DataFrame original); si se establece en False (o no se proporciona), se creará un nuevo DataFrame con el índice modificado y se dejará el DataFrame original sin cambios. Fuente: IA ChatGTP
Hola! excelente. tengo un archivo con datos por columnas de años, están de la siguiente manera, 1998-1, 1998-2,1998-3 y asi sucesivamente...Como seria para seleccionar todas las columnas que terminen por ejemplo en "-2" es decir todos los febreros de cada año
hola me encantan tus vídeos ya que son prácticos y entendibles, sin embargo, tengo un problema con la función log, me arroja el siguiente erro "---------------KeyError: '0B'---------------------", pongo el dato tal cual esta en mi CSV pero el error persiste, podrias decirme el por que ?
¡Muchísimas gracias por tan amable comentario! Ese error sale, cuando la columna que quieres localizar tiene un nombre diferente, por ejemplo puede ser que hayas tecleado un cero en lugar de una O mayúscula
Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas. Saludos
Hola, Muchas gracias por los vídeos. Me parecen muy buenos e interesantes. Estoy replicando de replicar el ejercicio con una tabla mía y de forma recurrente se me muestra este error. File "C:\Users\Usuario\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1785, in error axis=self.obj._get_axis_name(axis))) KeyError: 'the label [2] is not in the [index]' Tampoco reconoce las columnas. Por el contrario sí imprime correctamente el DataFrame. Utilizo Windows 10 y Python 3 ¿Podríais ayudarme por favor? - Buscando soluciones en internet he encontrado que le ocurre a más personas, pero no he encontrado una solución. Muchas gracias. Un saludo
Bueno. Tras darle muchas vueltas encontré que el problema es que el DataFrame tomaba la separación de columnas como ";" y el .csv como ",". Para solucionarlo había que especificar el símbolo de separación (sep) a usar. Es decir: datos = pd.read_csv('prueba.csv', sep=";") Muchas gracias a todas las personas que ayudáis a aprender.
Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas. Saludos
Hola, saludos desde la universidad nacional de Colombia, este es la mejor serie de vídeos explicativos de pandas que he encontrado, muchas gracias
Idola total Liliana! Super claro! Muchas gracias!
¡Qué amable! Muchas gracias por dejarnos tan lindo comentario ^_^
Gracias por compartir sus conocimientos muy buen video, muy claro
¡Muchas gracias por tan amable comentario, nos da mucho gusto saber que la información es de utilidad, éxito y saludos desde México!
Si hay problemas con utf-8
Al momento de hacer la lectura del csv ponlo asi: datos=pd.read_csv('archivo1.csv',encoding = "ISO-8859-1")
ídola !!!!
Hola, me queda una duda con la función set_index, si es que no la estoy interpretando mal, se supone que fija "Location" como indice (index) ¿para luego realizar la búsqueda de algún dato en especifico? (como en este caso melbourne, pero respecto a los datos que se encuentran en ese indice) y como último para indexar 2 o más columnas ¿es posible?, estoy siguiendo sus videos muy atento y suscrito, saludos!!! :)
Hola Álvaro, index es la posición en la que se localizan los datos, en este vídeo hacemos algunas búsquedas que te pueden servir como guía, cualquier duda nos dices:
th-cam.com/video/uzvA7ELCrkI/w-d-xo.html
¡Muchas gracias por tu suscripción!
@@cctmexico Hola!, gracias por responder una consulta más, conocen de algún texto sobre pandas aparte de su pagina oficial y stackoverflow?, excelentes videos!!!!!
Una consulta cada archivo csv es diferente en cada clase?
HOLA. SABES ,INTENTO UTILIZAR EL ARCHIVO Y ME APARECE EL SIGUIENTE MENSAJE EN SPYDER
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 17: invalid continuation byte
NO PUEDE TRAER EL ARCHIVO ATP- COMO LO SOLUCIONO??????
Hola! ese error aparece a veces en Windows, porque no se reconocen algunos caracteres del archivo. Podrías intentar bajar el archivo original: www.kaggle.com/jordangoblet/atp-tour-20002016
@@cctmexico hola y besos-
el error se produjo cuando baje el archivo atp del sitio que dices-el error decía algo así como que algo de latín, era lo que no reconocía windows. me puedes enviar el archivo que te funciono a ti-
gracias y besosssssss- te empece a seguir por instagran-
Si pones el siguiente: (Data.csv - Es el fichero csv de la ATP bajado)
import chardet
rawdata = open('Data.csv', 'rb').read()
result = chardet.detect(rawdata)
charenc = result['encoding']
Esto te dara en "spyder" en consola superior derecha el 'encoding' que tiene el fichero "Data.csv". Luego seria solo cargar el fichero con ese 'encoding'. En mi caso el 'encoding' del fichero me dijo que era 'Windows-1252'.
datos=pd.read_csv('Data.csv', encoding='Windows-1252')
Y con esto ya te cargaria el '.csv'
Hola buen video..... estaba haciendo pruebas pero cuando datos le asigno a un DataFrame y sobre el Dataframe quiero usar loc me sale ciertos errores, no entiendo por que?
¡Muchas gracias por tan amable comentario!, aquí te dejamos un vídeo que te puede servir como guía para resolver errores de Python en General: th-cam.com/video/X46F2-OxxqY/w-d-xo.html
¡Muy buen vídeo!, te pregunto si no tengo "palabras" sino números que necesito separar por columnas y filas para volverlos matrices mas pequeñas que debo hacer ya que no tengo un atributo "palabra" para seleccionarlos. Muchas gracias¡
¡Muchas gracias por tan amable comentario! ¿Será algo así cómo lo que deseas hacer? th-cam.com/users/edit?o=U&video_id=BDCZOheytaE
Hola, quisiera saber como se pueden seleccionar dos tipos de filas (renglones) especificas? Es decir, si necesito que muestre la información de todos los grand slam (Series) de las finales (Round). Gracias
Hola nos encontramos estos ejemplos que te pueden ser de utilidad: stackoverflow.com/questions/55883053/selecting-specific-rows-from-a-pandas-dataframe
No se puede bajar el archivo de kaggle. Aparece en el apartado "Data Sources", aparece Data.csv y Metadata.txt, sólo el segundo se puede descargar, data.csv no se puede. ¡Ayudaaa!
Hola! Lo puedes descargar de aquí: bit.ly/2oXiQ1a
Hola ,¿esto también me sirve para archivos alfanuméricos?
Hola, claro que si ^_^
Muchas gracias por el vídeo, me ha ayudado bastante. Solamente unas preguntas, precisamente para que sirve el comando set_index. Asimismo, cuando aplico el comando loc, la columna asociada al dato que quiero buscar desaparece de mi dataframe. En este caso , cuando busco "Atlanta" con el comando, la columna de "location" desaparece y en donde están las variables, en el apartado de "explorador de variables" mi data frame pasa de tener 54 columnas a 53.
El comando set_index en pandas se utiliza para establecer una o más columnas como el índice de un DataFrame. El parámetro "inplace" se utiliza para indicar si se debe realizar el cambio en el DataFrame original o si se debe crear un nuevo DataFrame con el índice modificado. Si se establece en True, el cambio se realizará en el lugar (en el DataFrame original); si se establece en False (o no se proporciona), se creará un nuevo DataFrame con el índice modificado y se dejará el DataFrame original sin cambios.
Fuente: IA ChatGTP
Hola! excelente. tengo un archivo con datos por columnas de años, están de la siguiente manera, 1998-1, 1998-2,1998-3 y asi sucesivamente...Como seria para seleccionar todas las columnas que terminen por ejemplo en "-2" es decir todos los febreros de cada año
Podrías utilizar expresiones regulares (Regex) aquí te dejamos un video que te puede servir como guía: th-cam.com/video/Dlblv2v9f7c/w-d-xo.html
hola me encantan tus vídeos ya que son prácticos y entendibles, sin embargo, tengo un problema con la función log, me arroja el siguiente erro "---------------KeyError: '0B'---------------------", pongo el dato tal cual esta en mi CSV pero el error persiste, podrias decirme el por que ?
¡Muchísimas gracias por tan amable comentario! Ese error sale, cuando la columna que quieres localizar tiene un nombre diferente, por ejemplo puede ser que hayas tecleado un cero en lugar de una O mayúscula
Cual es la diferencia entre .loc y .iloc ?????
¡Hola! con loc puedes buscar valores con base a una etiqueta e iloc regresa resultados utilizando las posiciones del índice
Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas.
Saludos
Con gusto anotamos la idea como un vídeo #petición
Me marca que inplace no esta definido
Hola,
Muchas gracias por los vídeos. Me parecen muy buenos e interesantes.
Estoy replicando de replicar el ejercicio con una tabla mía y de forma recurrente se me muestra este error.
File "C:\Users\Usuario\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1785, in error
axis=self.obj._get_axis_name(axis)))
KeyError: 'the label [2] is not in the [index]'
Tampoco reconoce las columnas.
Por el contrario sí imprime correctamente el DataFrame.
Utilizo Windows 10 y Python 3
¿Podríais ayudarme por favor? - Buscando soluciones en internet he encontrado que le ocurre a más personas, pero no he encontrado una solución.
Muchas gracias.
Un saludo
Bueno. Tras darle muchas vueltas encontré que el problema es que el DataFrame tomaba la separación de columnas como ";" y el .csv como ",".
Para solucionarlo había que especificar el símbolo de separación (sep) a usar.
Es decir: datos = pd.read_csv('prueba.csv', sep=";")
Muchas gracias a todas las personas que ayudáis a aprender.
¡Nos da mucho saber que ya pudiste resolver tu duda! Saludos!
Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas.
Saludos
Con gusto anotamos la idea como un vídeo #petición