Pandas para Python: Selección de renglones y columnas por nombre LOC (Muy Básico)

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ม.ค. 2025

ความคิดเห็น •

  • @jahelsantiago
    @jahelsantiago 4 ปีที่แล้ว +2

    Hola, saludos desde la universidad nacional de Colombia, este es la mejor serie de vídeos explicativos de pandas que he encontrado, muchas gracias

  • @francosecundinogreco1988
    @francosecundinogreco1988 5 ปีที่แล้ว +1

    Idola total Liliana! Super claro! Muchas gracias!

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว +1

      ¡Qué amable! Muchas gracias por dejarnos tan lindo comentario ^_^

  • @plutarcocriterion754
    @plutarcocriterion754 4 ปีที่แล้ว +1

    Gracias por compartir sus conocimientos muy buen video, muy claro

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      ¡Muchas gracias por tan amable comentario, nos da mucho gusto saber que la información es de utilidad, éxito y saludos desde México!

  • @williammoran3921
    @williammoran3921 4 ปีที่แล้ว +5

    Si hay problemas con utf-8
    Al momento de hacer la lectura del csv ponlo asi: datos=pd.read_csv('archivo1.csv',encoding = "ISO-8859-1")

  • @damianomarsilva3233
    @damianomarsilva3233 4 ปีที่แล้ว +1

    ídola !!!!

  • @alvaroriquelme7296
    @alvaroriquelme7296 6 ปีที่แล้ว +1

    Hola, me queda una duda con la función set_index, si es que no la estoy interpretando mal, se supone que fija "Location" como indice (index) ¿para luego realizar la búsqueda de algún dato en especifico? (como en este caso melbourne, pero respecto a los datos que se encuentran en ese indice) y como último para indexar 2 o más columnas ¿es posible?, estoy siguiendo sus videos muy atento y suscrito, saludos!!! :)

    • @cctmexico
      @cctmexico  6 ปีที่แล้ว

      Hola Álvaro, index es la posición en la que se localizan los datos, en este vídeo hacemos algunas búsquedas que te pueden servir como guía, cualquier duda nos dices:
      th-cam.com/video/uzvA7ELCrkI/w-d-xo.html
      ¡Muchas gracias por tu suscripción!

    • @alvaroriquelme7296
      @alvaroriquelme7296 6 ปีที่แล้ว

      @@cctmexico Hola!, gracias por responder una consulta más, conocen de algún texto sobre pandas aparte de su pagina oficial y stackoverflow?, excelentes videos!!!!!

  • @williammoran3921
    @williammoran3921 4 ปีที่แล้ว

    Una consulta cada archivo csv es diferente en cada clase?

  • @walterzanoni9593
    @walterzanoni9593 5 ปีที่แล้ว +2

    HOLA. SABES ,INTENTO UTILIZAR EL ARCHIVO Y ME APARECE EL SIGUIENTE MENSAJE EN SPYDER
    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 17: invalid continuation byte
    NO PUEDE TRAER EL ARCHIVO ATP- COMO LO SOLUCIONO??????

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว

      Hola! ese error aparece a veces en Windows, porque no se reconocen algunos caracteres del archivo. Podrías intentar bajar el archivo original: www.kaggle.com/jordangoblet/atp-tour-20002016

    • @walterzanoni9593
      @walterzanoni9593 5 ปีที่แล้ว

      @@cctmexico hola y besos-
      el error se produjo cuando baje el archivo atp del sitio que dices-el error decía algo así como que algo de latín, era lo que no reconocía windows. me puedes enviar el archivo que te funciono a ti-
      gracias y besosssssss- te empece a seguir por instagran-

    • @mullallofake1956
      @mullallofake1956 5 ปีที่แล้ว +1

      Si pones el siguiente: (Data.csv - Es el fichero csv de la ATP bajado)
      import chardet
      rawdata = open('Data.csv', 'rb').read()
      result = chardet.detect(rawdata)
      charenc = result['encoding']
      Esto te dara en "spyder" en consola superior derecha el 'encoding' que tiene el fichero "Data.csv". Luego seria solo cargar el fichero con ese 'encoding'. En mi caso el 'encoding' del fichero me dijo que era 'Windows-1252'.
      datos=pd.read_csv('Data.csv', encoding='Windows-1252')
      Y con esto ya te cargaria el '.csv'

  • @edisolarias
    @edisolarias 4 ปีที่แล้ว +1

    Hola buen video..... estaba haciendo pruebas pero cuando datos le asigno a un DataFrame y sobre el Dataframe quiero usar loc me sale ciertos errores, no entiendo por que?

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      ¡Muchas gracias por tan amable comentario!, aquí te dejamos un vídeo que te puede servir como guía para resolver errores de Python en General: th-cam.com/video/X46F2-OxxqY/w-d-xo.html

  • @juanvanegas5871
    @juanvanegas5871 6 ปีที่แล้ว +1

    ¡Muy buen vídeo!, te pregunto si no tengo "palabras" sino números que necesito separar por columnas y filas para volverlos matrices mas pequeñas que debo hacer ya que no tengo un atributo "palabra" para seleccionarlos. Muchas gracias¡

    • @cctmexico
      @cctmexico  6 ปีที่แล้ว

      ¡Muchas gracias por tan amable comentario! ¿Será algo así cómo lo que deseas hacer? th-cam.com/users/edit?o=U&video_id=BDCZOheytaE

  • @julianperez8580
    @julianperez8580 4 ปีที่แล้ว

    Hola, quisiera saber como se pueden seleccionar dos tipos de filas (renglones) especificas? Es decir, si necesito que muestre la información de todos los grand slam (Series) de las finales (Round). Gracias

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      Hola nos encontramos estos ejemplos que te pueden ser de utilidad: stackoverflow.com/questions/55883053/selecting-specific-rows-from-a-pandas-dataframe

  • @Elausis
    @Elausis 5 ปีที่แล้ว

    No se puede bajar el archivo de kaggle. Aparece en el apartado "Data Sources", aparece Data.csv y Metadata.txt, sólo el segundo se puede descargar, data.csv no se puede. ¡Ayudaaa!

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว

      Hola! Lo puedes descargar de aquí: bit.ly/2oXiQ1a

  • @hannertotena8978
    @hannertotena8978 6 ปีที่แล้ว +1

    Hola ,¿esto también me sirve para archivos alfanuméricos?

    • @cctmexico
      @cctmexico  6 ปีที่แล้ว

      Hola, claro que si ^_^

  • @irvingpineda4310
    @irvingpineda4310 4 ปีที่แล้ว

    Muchas gracias por el vídeo, me ha ayudado bastante. Solamente unas preguntas, precisamente para que sirve el comando set_index. Asimismo, cuando aplico el comando loc, la columna asociada al dato que quiero buscar desaparece de mi dataframe. En este caso , cuando busco "Atlanta" con el comando, la columna de "location" desaparece y en donde están las variables, en el apartado de "explorador de variables" mi data frame pasa de tener 54 columnas a 53.

    • @spartan9771
      @spartan9771 ปีที่แล้ว

      El comando set_index en pandas se utiliza para establecer una o más columnas como el índice de un DataFrame. El parámetro "inplace" se utiliza para indicar si se debe realizar el cambio en el DataFrame original o si se debe crear un nuevo DataFrame con el índice modificado. Si se establece en True, el cambio se realizará en el lugar (en el DataFrame original); si se establece en False (o no se proporciona), se creará un nuevo DataFrame con el índice modificado y se dejará el DataFrame original sin cambios.
      Fuente: IA ChatGTP

  • @darioavila5807
    @darioavila5807 5 ปีที่แล้ว +1

    Hola! excelente. tengo un archivo con datos por columnas de años, están de la siguiente manera, 1998-1, 1998-2,1998-3 y asi sucesivamente...Como seria para seleccionar todas las columnas que terminen por ejemplo en "-2" es decir todos los febreros de cada año

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว

      Podrías utilizar expresiones regulares (Regex) aquí te dejamos un video que te puede servir como guía: th-cam.com/video/Dlblv2v9f7c/w-d-xo.html

  • @jesusherreracabanas4863
    @jesusherreracabanas4863 5 ปีที่แล้ว +1

    hola me encantan tus vídeos ya que son prácticos y entendibles, sin embargo, tengo un problema con la función log, me arroja el siguiente erro "---------------KeyError: '0B'---------------------", pongo el dato tal cual esta en mi CSV pero el error persiste, podrias decirme el por que ?

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว +1

      ¡Muchísimas gracias por tan amable comentario! Ese error sale, cuando la columna que quieres localizar tiene un nombre diferente, por ejemplo puede ser que hayas tecleado un cero en lugar de una O mayúscula

  • @iggypop1011
    @iggypop1011 4 ปีที่แล้ว +1

    Cual es la diferencia entre .loc y .iloc ?????

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      ¡Hola! con loc puedes buscar valores con base a una etiqueta e iloc regresa resultados utilizando las posiciones del índice

  • @fpejavier
    @fpejavier 4 ปีที่แล้ว

    Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas.
    Saludos

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      Con gusto anotamos la idea como un vídeo #petición

  • @alejandrodeharo9509
    @alejandrodeharo9509 4 ปีที่แล้ว

    Me marca que inplace no esta definido

  • @jorgeg8008
    @jorgeg8008 5 ปีที่แล้ว +1

    Hola,
    Muchas gracias por los vídeos. Me parecen muy buenos e interesantes.
    Estoy replicando de replicar el ejercicio con una tabla mía y de forma recurrente se me muestra este error.
    File "C:\Users\Usuario\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1785, in error
    axis=self.obj._get_axis_name(axis)))
    KeyError: 'the label [2] is not in the [index]'
    Tampoco reconoce las columnas.
    Por el contrario sí imprime correctamente el DataFrame.
    Utilizo Windows 10 y Python 3
    ¿Podríais ayudarme por favor? - Buscando soluciones en internet he encontrado que le ocurre a más personas, pero no he encontrado una solución.
    Muchas gracias.
    Un saludo

    • @jorgeg8008
      @jorgeg8008 5 ปีที่แล้ว +2

      Bueno. Tras darle muchas vueltas encontré que el problema es que el DataFrame tomaba la separación de columnas como ";" y el .csv como ",".
      Para solucionarlo había que especificar el símbolo de separación (sep) a usar.
      Es decir: datos = pd.read_csv('prueba.csv', sep=";")
      Muchas gracias a todas las personas que ayudáis a aprender.

    • @cctmexico
      @cctmexico  5 ปีที่แล้ว +1

      ¡Nos da mucho saber que ya pudiste resolver tu duda! Saludos!

  • @fpejavier
    @fpejavier 4 ปีที่แล้ว

    Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver? Ejemplo: 12/04/2010 234.50 11/04/2010 340.0 9/11/2010 126.90 sin fecha sin precio 12/04/2010 340.00 15/04/2010 300.00 12/04/2010 311.000 son 20 columnas, pero asi las 1500 filas.
    Saludos

    • @cctmexico
      @cctmexico  4 ปีที่แล้ว

      Con gusto anotamos la idea como un vídeo #petición