Análisis de sentimientos con BERT en Python (Tutorial)

Codificando Bits

มุมมอง 22 323

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 29 ธ.ค. 2024

ความคิดเห็น •

@codificandobits 3 ปีที่แล้ว
🔥🔥Academia Online: codificandobits.com 🔥🔥
🔥🔥Asesorías y formación personalizada: codificandobits.com/servicios 🔥🔥
@carlosabcs 3 ปีที่แล้ว ⁺¹¹
Probablemente el mejor vídeo que he encontrado sobre BERT en el tiempo que llevo estudiándolo. He leído y visto contenido en inglés que no se compara con lo que has venido haciendo, desde que explicaste las redes transformers, al video donde explicas cómo funciona BERT y ahora este Tutorial. Felicidades, eres un excelente educador!
@damianquijano1706 4 ปีที่แล้ว ⁺⁹
Me quito el sombrero, lo mejor que he visto , y eso que he visto muchos vídeos. Se nota un gran dominio en todos los aspectos. Para los que somos programadores, que aprendemos sobre temas desconocidos al programarlos, esto es una joya que vale la pena verla y reproducirla muchas veces. Ojalá se pueda ver una demostración en español y otra en Twiter (análisis de sentimiento). Felicitaciones.
@codificandobits 4 ปีที่แล้ว ⁺¹
Gracias por tu comentario Damián. El saber que encuentras útil este contenido anima a continuar desarrollando videos de gran calidad. Ya tomé nota de tu sugerencia de análisis de sentimientos en Twitter, espero pronto hacer un video sobre el tema. Un saludo!
@multimodalia 2 ปีที่แล้ว ⁺²
no sabes lo agradecido que estoy, esto me servirá para mi tesis, antes lo estaba haciendo con RNN pero me quedaba sin memoria GPU, acá se cumple el titulo del paper de transformers "Attention is all you need". Eres un grande!
@andres29865 6 หลายเดือนก่อน
Como siempre un crack. Muchas gracias!!!!!
@cristhian4513 4 ปีที่แล้ว ⁺¹
tus videos me motivan :) , la gente interesada debe conocerte más
@codificandobits 4 ปีที่แล้ว ⁺¹
A mi me motivan los comentarios de todos ustedes. Gracias por ser un fiel seguidor cristhIAn. Un saludo!
@DANITO285 ปีที่แล้ว
Diossss q buen video explicas paso a paso y por que se hacen las cosas es increible muchas gracias
@codificandobits ปีที่แล้ว
Con gusto, un saludo!
@gilbertmurati2043 4 ปีที่แล้ว ⁺¹
Excelente tutorial. Muchísimas gracias por montar esta clase de videos. Me encantaría que pudieras hacer uno aplicado a contestar preguntas en español. Saludos.
@codificandobits 4 ปีที่แล้ว ⁺¹
Hola Gilbert, me leíste la mente! El tema que propones es precisamente el tema del próximo video! Un saludo!
@gilbertmurati2043 4 ปีที่แล้ว
@@codificandobits Excelente!!! Estaré atento. Muchísimas gracias por leer y responder.
@elpucarlino 2 หลายเดือนก่อน
Un muy buen video, me gustaría saber como se puede modificar BERT para que identifique 3 categorías de emociones, al implementar su código me salieron algunas recomendaciones en de remplazar algunas utilidades deprecadas, de ante mano gracias.
@salvadorcontreras8946 4 ปีที่แล้ว
Excelente vídeo y excelente explicación.
@codificandobits 4 ปีที่แล้ว
😉
@marsupilami125 ปีที่แล้ว
Buenísimo el tutorial
@fespinoza32 9 หลายเดือนก่อน
Excelente video, uno de los mejores que he visto. Una consulta es necesario la columna label que generas en base a la columna sentiment que tenias en el archivo csv original?, ya que en el caso que quiero aplicar tengo una lista de comentarios en ingles pero no tengo ninguna columna adicional? Gracias de antemano por tu respuesta.
@josetaboada3796 4 ปีที่แล้ว
Buen vídeo me encanta la inteligencia artificial!
@codificandobits 4 ปีที่แล้ว
Hola José, creo que estamos en la misma barca! Un saludo!
@josetaboada3796 4 ปีที่แล้ว
@@codificandobits Exactamente mi amigo, mi sueño es crear una I.A con conciencia propia, aunque sea algo imposible realizaré muchos esfuerzos.
@capablancastyle 4 ปีที่แล้ว
Felicitaciones, muy claro
@codificandobits 4 ปีที่แล้ว
😉
@kmilores1q2w 4 ปีที่แล้ว
muy buen video, excelente la explicación de cada parte felicitaciones
@codificandobits 4 ปีที่แล้ว
Gracias por tu comentario Camilo. Un saludo!
@alvarodepie6206 4 ปีที่แล้ว
Muy bueno y didáctico ejemplo! Te sigo
@codificandobits 4 ปีที่แล้ว
😉
@josemanuelmanesridaura8874 4 ปีที่แล้ว
Gracias por Compartir. Genial como SIEMPRE.
@codificandobits 4 ปีที่แล้ว
A ti José Manuel por seguir mis videos. Un saludo!
@fernandorojasquezada8928 3 ปีที่แล้ว
Excelente contenido! Gracias
@adrianaperez2134 3 ปีที่แล้ว
Me sirvio muchisimo, gracias!
@samuelramirez2797 4 ปีที่แล้ว
Excelente video, muy explicativo, saludos!
@codificandobits 4 ปีที่แล้ว
😉
@sergioalonso7157 4 ปีที่แล้ว
Muchas gracias!! Gran vídeo! :)
@codificandobits 4 ปีที่แล้ว
😉
@juancarlosgonzalez-avella361 3 ปีที่แล้ว
Gracias son muy buenos tus turoriales
@codificandobits 3 ปีที่แล้ว ⁺¹
Gracias por tu comentario Juan Carlos. Te envío un saludo!
@juancarlosgonzalez-avella361 3 ปีที่แล้ว
@@codificandobits Gracias a ti, por el esfuerzo que pones y lo que aportas
@jalbarracin 4 ปีที่แล้ว
Excelente y felicitaciones por contenidos de valor como este y todos los videos :)
-> Me gustaría ver: como grabar el modelo y luego cargarlo para usarlo en producción (model.save/load)
@acecomia7723 4 ปีที่แล้ว
se refiere a guardar los pesos? torch.save(model.state_dict(), 'BERT_sentimientos.pth') podria ser
@codificandobits 4 ปีที่แล้ว
Hola Javier, qué bueno saber de tí! Sí, es algo parecido a como lo menciona ACECOM IA en el comentario de abajo. Acá más información: pytorch.org/tutorials/beginner/saving_loading_models.html
@camiloalejandroahumadagome6195 ปีที่แล้ว
excelente video
@eduardoalves4772 3 ปีที่แล้ว
Melhor vídeo, parabéns!!
@silviarincon51 3 ปีที่แล้ว ⁺¹⁰
Hola, me ha encantado el vídeo, pero en la sección de Entrenamiento, cuando declaras las Épocas me sale el siguiente error: TypeError: dropout(): argument 'input' (position 1) must be Tensor, not str. He intentado agregar algunos comando que he encontrado como ayudas, pero sigue sin funcionar. Te agradezco algún tipo de ayuda!
@nicolasrodriguez5780 3 ปีที่แล้ว ⁺²⁶
Me pasó igual. Sucede porque HugginFace se actualizó a la versión 4 recientemente. Para que te funciones debes agregar el parámetro "return_dict=False" al Modelo, es decir, en la sección 15 donde se define el modelo debes cambiar esta linea y dejarla así: self.bert = BertModel.from_pretrained(PRE_TRAINED_MODEL_NAME,return_dict=False)
@gonzalosurribassayago4116 2 ปีที่แล้ว
@@nicolasrodriguez5780 Gracias me funciono
@joseluisgonzalezpartida5391 2 ปีที่แล้ว
@@nicolasrodriguez5780 Muchas gracias me funciono
@LuisAlbertoRamosRamirez ปีที่แล้ว
@@nicolasrodriguez5780 Excelente me funcionó, gracias
@emmanueldavezac6645 ปีที่แล้ว
@@nicolasrodriguez5780 muchas gracias, no hubiera podido solucionarlo sin tu comentario
@bryamblasrimac9945 ปีที่แล้ว
Hola Miguel, gracias por la explicación, siempre tus videos son muy didácticos y he aprendido bastante gracias a ello, tengo una duda acerca de que si en la capa de salida puedo usar una función de activación sigmoidea ya que se puede interpretar como una clasificación binaria. Gracias.
@omarmillandelgado1641 ปีที่แล้ว
excelente material, me gustaría poder contactarlo para asesoría en alguno proyectos de investigación,
@softlucionsfreesoft2064 4 ปีที่แล้ว
Muchas gracias, como siempre ;)
@codificandobits 4 ปีที่แล้ว
😉
@sebasgj1982 3 ปีที่แล้ว
Hola!! quiero agradecer por tan excelente y completo video Tutorial! He aprendido muchísimo y me gustaría saber si puedo utilizar DistilBERT con este mismo esquema?. Muchas gracias! y espero tu respuesta!
@felipela2227 ปีที่แล้ว
Podrias hacer un tutorial para Clusterizar usando Bert, explicas bien tus temas.
@ArielotaPelot 4 หลายเดือนก่อน
Hola profe, donde puedo encontrar el CSV?
@Henrry0 2 ปีที่แล้ว
Hola, excelente video, me podria decir cual es la difrencias entre los algoritmos BERT, NER Y POT TAGGING y cuales funcionan mejor o peor uno del otro? por favor.
@codificandobits 2 ปีที่แล้ว
Hola Ramón. BERT es como tal un modelo de Deep Learning que permite analizar el lenguaje (acá en el canal encontrarás un video donde lo explico en detalle).
Por otra parte NER y POS (Part of Speech) Tagging son tareas propias del procesamiento del lenguaje natural. NER viene del inglés "Named Entity Recognition" que busca extraer del texto elementos como nombres de personas, nombres de organizaciones, ubicaciones, fechas, etc.; mientras que POS intenta encontrar los elementos que componen una frase escrita: verbo, adverbio, conjunciones, artículos. etc.
Un saludo!
@wilsonalbertdiazvargas9645 ปีที่แล้ว
En español hay algún data set con muchos datos?
@juansolares7198 ปีที่แล้ว
Hola, muy bueno el curso. ¿Es posible ajustarlo para tener mas clasificaciónes, es decir muy malo, malo, regular, bueno y muy bueno?
@codificandobits ปีที่แล้ว ⁺¹
Claro que sí, aunque en este caso deberías cambiar el set de entrenamiento para incluir esas nuevas categorías. Un saludo!
@raulangeljimenezhernandez3342 ปีที่แล้ว
Muy buen video! Muchas gracias, solo una pregunta si no estoy usando google colab hay alguna forma en la que pueda de igual manera desde el jupyter notebook obtener los dato? o en ese caso si tocaria descargarlos?
@unavidamasporconocer7159 ปีที่แล้ว
Vale, muchas gracias por tu ayuda, cuando ya tengo el resultado, como puedo hacer que el codigo me ayude con 100 reviews?
@omarmillandelgado1641 ปีที่แล้ว
hola, excelente material, es posible utilizar Bert par análisis de sentimientos de varios sitios web la vez?
@codificandobits ปีที่แล้ว ⁺¹
Claro que sí. El problema no es tanto BERT sino más bien la interfaz que usarás. Es decir: debes usar una API que tome los datos de los sitios web y la envíe a la API del servicio donde tengas montado BERT para hacer el análisis de sentimientos. Un saludo!
@omarmillandelgado1641 10 หลายเดือนก่อน
@@codificandobits gracias mil por su respuesta, cómo me podría ayudar en un proceso investigativo? me interesa publicar y podríamos ser coatores, quedo atento
@MegaDragonxD 3 ปีที่แล้ว ⁺¹
Hola! Muchas gracias por el video. Tengo una pregunta. BERT solo procesa lenguaje ingles?
@codificandobits 3 ปีที่แล้ว ⁺¹
No, funciona prácticamente en cualquier idioma. Lo importante es que cuentes con un set de datos lo suficientemente grande para poderlo entrenar. En Hugging Face puedes encontrar varios modelos BERT entrenados para diferentes tareas en Español. Un saludo!
@multimodalia 2 ปีที่แล้ว
Que puedo hacer para buscar la tasa de aprendizaje optima? por ejemplo, en este tutorial usas lr=2e-5, ¿como se que ese valor es el óptimo? Saludos
3 ปีที่แล้ว
Hola, sería fantástico si generases un vídeo usando BertForSequenceClassification en un problema de clasificación multiclase.... ¿te atreves con el reto?
@gutlopmi 3 ปีที่แล้ว ⁺¹
Me sale insistentemente este error y no se que hacer ya.
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
in ()
5 print('-------------------')
6 train_loss,train_loss = train_model(
----> 7 model, train_data_loader, loss_fn, optimizer, device, scheduler,len(df_train)
8 )
9 test_loss, test_loss = eval_model(
4 frames
/usr/local/lib/python3.6/dist-packages/torch/_utils.py in reraise(self)
426 # have message field
427 raise self.exc_type(message=msg)
--> 428 raise self.exc_type(msg)
429
430
RuntimeError: Caught RuntimeError in DataLoader worker process 0.
Original Traceback (most recent call last):
File "/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/worker.py", line 198, in _worker_loop
data = fetcher.fetch(index)
File "/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/fetch.py", line 47, in fetch
return self.collate_fn(data)
File "/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/collate.py", line 73, in default_collate
return {key: default_collate([d[key] for d in batch]) for key in elem}
File "/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/collate.py", line 73, in
return {key: default_collate([d[key] for d in batch]) for key in elem}
File "/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/collate.py", line 55, in default_collate
return torch.stack(batch, 0, out=out)
RuntimeError: stack expects each tensor to be equal size, but got [129] at entry 0 and [200] at entry 1
@daniel_edu7 3 ปีที่แล้ว
Podemos hacer una demostración con técnicas previas a BERT?
@diegofernandomartinezherre9081 2 ปีที่แล้ว
Hola Miguel. Muy bueno su video. Le comento yo ando replicando uno igual para detectar maltrato de clientes. Sin embargo, no sé si la data la debo meter al español o inglés?
@codificandobits 2 ปีที่แล้ว
Hola Diego. Todo depende del idioma que vayas a usar en la aplicación final, que debe coincidir con el idioma que uses para entrenar el modelo. Un saludo!
@danielochoa2300 2 ปีที่แล้ว
Hola, quería preguntarte como puedo acelerar la ejecución del código sabiendo que tengo una tarjeta AMD Radeon (TM) RX Vega 10 Graphics, ya que tengo entendido que CUDA es para NVIDIA. Muchas gracias y Saludos.
@DeyvisGarcia-cm2vk ปีที่แล้ว
Buenas tardes el archivo de Excel de donde lo saca o si nos puede pasar
@felipegfd1 2 ปีที่แล้ว
Hola, hay alguna forma de subir este modelo a huggingface para utilizarlo con la librería de transformers?
Es que lo estoy tratando de hace, pero dice que espera un archivo .bin y este es un archivo .pth
@josecarlosquinonespuma4339 4 ปีที่แล้ว ⁺¹
quede asombrado con el tuturial...!!! tengo la siguiente duda... si yo quiero que analice comentarios en español, debo tener el set de datos en español? tengo que descargar de HUGGING FACE en español? que debo hacer? GRACIAS
@codificandobits 4 ปีที่แล้ว ⁺¹
Hola. Sí, el primer requisito es que el modelo que uses (puede ser uno entrenado por ti mismo, o descargado por ejemplo de Hugging Face) debe estar entrenado con un corpus en español. Un saludo!
@wilfredomartel7781 3 ปีที่แล้ว
Excelente video. ¿Podrías usar spanberta? Y de paso entrenar con tu propio corpus?
@wilfredomartel7781 3 ปีที่แล้ว
Entrenar con set de data en español, por favor.
@katastrofabian 4 ปีที่แล้ว
Buena tarde, estoy tratando de implementar este programa para practicar, practicamente todas las líneas corren bien, excepto la 44 que me muestra BrokenPipeError: [Errno 32] Broken pipe, de casualidad sabe por que?
@albixtor89 4 ปีที่แล้ว
Torch seria muy bueno profe. Muchas gracias
@codificandobits 4 ปีที่แล้ว
Hola. Tienes razón. Desde hace un tiempo tengo pensado un video sobre Pytorch, espero pronto poderlo publicar. Un saludo!
@rafaelguzman5874 3 ปีที่แล้ว
Buenos días una pregunta este modelo también sirve para comentarios es español
@codificandobits 3 ปีที่แล้ว
Hola Rafael. Realmente no, porque el modelo usado en el video está entrenado específicamente para el idioma Inglés.
Lo que debes hacer es usar un modelo en Español (lo puedes encontrar en Hugging Face) y afinarlo con un set de datos con comentarios también en Español.
Un saludo!
@acecomia7723 4 ปีที่แล้ว
yo todo esperanzado lo monte en mi 1050ti, memoria llena en cuda, menos hilos, xd tus 15min me esperanzaron falsamente, buen video jajaja
@codificandobits 4 ปีที่แล้ว
Realmente en Google Colab fueron casi 50 minutos. Aunque no tengo los datos de la GPU usada en el video. Un saludo!
@juanjosecerquera5855 ปีที่แล้ว
Hola!, excelente video!, pero tengo unas dudas, me sale un pequeño error, qué puedo hacer para resolverlo ?
dropout(): argument 'input' (position 1) must be Tensor, not str
@angelbeltran6274 ปีที่แล้ว
Pudiste resolverlo? tambien me sale a mi
@lnnbravo 10 หลายเดือนก่อน
#Codificacion para introducir a BERT
encoding = tokenizer.encode_plus(
sample_txt,
max_length = 10,
truncation = True,
add_special_tokens = True,
return_token_type_ids = False,
#pad_to_max_length = True,
padding = 'max_length',#este corregido
return_attention_mask = True,
return_tensors ='pt'
)
#tambien
#DAta Loader:
def data_loader(df,tokenizer,max_len,batch_size,num_workers):
dataset = IMDBDataset(
reviews = df.review.to_numpy(),
labels = df.label.to_numpy(),
tokenizer = tokenizer,
max_len = MAX_LEN
)
return DataLoader(dataset,batch_size=BATCH_SIZE,num_workers = num_workers)
#tambien
train_data_loader = data_loader(df_train, tokenizer, MAX_LEN, BATCH_SIZE, num_workers=2)
test_data_loader = data_loader(df_test, tokenizer, MAX_LEN, BATCH_SIZE, num_workers=2)
#tambien
def eval_model(model, data_loader, loss_fn, device, n_examples):
model.eval()
losses = []
correct_predictions = 0
with torch.no_grad():
for batch in data_loader:
input_ids = batch['input_ids'].to(device)
attention_mask = batch['attention_mask'].to(device)
labels = batch['label'].to(device)
outputs = model(input_ids=input_ids, attention_mask=attention_mask)
_, preds = torch.max(outputs, dim=1)
loss = loss_fn(outputs, labels)
correct_predictions += torch.sum(preds == labels)
losses.append(loss.item())
return correct_predictions.double() / n_examples, np.mean(losses)
@lnnbravo 10 หลายเดือนก่อน
self.bert = BertModel.from_pretrained(PRE_TRAINED_MODEL_NAME,return_dict=False)
o inenta esto
@mocatis 7 หลายเดือนก่อน ⁺¹
Gracias no pude completar el elercicio:
TypeError: dropout(): argument 'input' (position 1) must be Tensor, not str
@jessytopon4260 7 หลายเดือนก่อน
Disculpa tal vez hubo alguna forma de arreglar el error?
@guillotus2279 3 ปีที่แล้ว
Hola, hay alguna red neuronal que haga lo mismo pero en idioma Español?
3 ปีที่แล้ว
Hola, en primer lugar quiero felicitarte por tus vídeos. Verás he trabajado con embeddings, he creado redes neuronales y usado algoritoms de ML, pero hasta el momento no he usado transformers, y me piden en el pryecto que se empleen en diferentes idiomas (español, inglés y chino). ¿He entendido bien al pensar que BERT es multilingüe? Porque... por otro lado he visto diferentes versiones de BERT, para francés, aleman, español,.... y ya me entran dudas. Por cierto, ¿cómo se podría especificar el uso de una versión concreta? Gracias anticipadas.
Jerónimo
@codificandobits 3 ปีที่แล้ว ⁺¹
Hola Jerónimo y muchas gracias por tu comentario.
Con respecto hasta pregunta: el uso de BERT depende de las características de tu proyecto. En términos generales puedes usar BERT para tareas como comprensión de texto, análisis de sentimientos o pregunta respuesta (por ejemplo). Pero no funciona para generación de texto.
En términos generales hay que mirar las necesidades de tu proyecto y escoger la variante de redes transformer que más se adecúe. En todo caso todas las variantes pueden ser entrenadas para que funcionen en diferentes idiomas.
Un saludo!
3 ปีที่แล้ว ⁺¹
@@codificandobits Muchas gracias, y de nuevo felicidades
@hugoarmandopazvivas5013 3 ปีที่แล้ว
buen día, estoy entrando en el mundo de AI, y quería saber si después de entrenar un modelo con BERT, como el del video; como puedo acceder a ese modelo después de entrenado;
es decir, entreno el modelo y lo uso, si luego de un tiempo lo quiero volver a usar debo entrenar de nuevo o ¿existe alguna manera de guardar los resultados de ese entrenamiento?
@xeazy_gunz1058 3 ปีที่แล้ว
De casualidad encontraste la respuesta?
@leantin9907 3 ปีที่แล้ว
Donde puedo acceder al dataset que usas para replicar tu codigo ?
@codificandobits 3 ปีที่แล้ว
En la descripción del video encuentras el enlace: github.com/codificandobits/Analisis_de_sentimientos_con_BERT
Un saludo!
@hugoapaz7 4 ปีที่แล้ว
buen dia, tengo una duda, quise hacer tokens de una frase en español pero no la reconoce. sabe de alguna solución?
@codificandobits 4 ปีที่แล้ว
Hola Hugo, ¿me puedes compartir el código que estás desarrollando para entender mejor y poder responderte?
@adriangranados3066 4 ปีที่แล้ว
Muchas gracias!
Sería posible hacer un ejemplo con español.
@codificandobits 4 ปีที่แล้ว ⁺²
Claro que sí Adrián. El próximo video es un ejemplo con BETO (BERT en Español). Un saludo!
@rogersjavier 4 ปีที่แล้ว
Hola, ya está publicado el video de beto?
@juancarlosbarajas2091 2 ปีที่แล้ว
puede usarse con 3 clases? positivo, neutro, negativo
@codificandobits 2 ปีที่แล้ว ⁺¹
Sí claro. Lo importante es contar con un set de datos de entrenamiento/prueba/validación que contenga esas 3 categorías. Un saludo!
@DianaFarfanasdqwe ปีที่แล้ว
Hola BERT , es capaz de analizar texto en español?
@danielsoto8889 3 ปีที่แล้ว
Tengo un archivo de Excel de 500 comentarios como puedo clasificar esos comentarios ya hice este tutorial y excelente pero quiero tener los sentimientos de todos los 500 comentarios
@codificandobits 3 ปีที่แล้ว
Hola Daniel. Depende, si están en Inglés puedes usar el código que muestro en el video sin modificación alguna. Simplemente debes llevar los comentarios de Excel a Python (usando por ejemplo la librería Pandas) y preprocesarlos para que queden en el mismo formato requerido por el modelo.
Pero si están en Español debes: (1) usar un modelo BERT pre-entrenado en Español (puedes descargar uno de Hugging Face); (2) afinarlo para análisis de sentimientos; (3) usar el modelo afinado para generar predicciones sobre tu dataset. En el paso (2) necesitas usar también un dataset en Español.
Un saludo!
@acecomia7723 4 ปีที่แล้ว
hubieses guardado los pesos y compartido :(
@codificandobits 4 ปีที่แล้ว
🤔 🤔 tienes razón!

ต่อไป

เล่นอัตโนมัติ

Detección de anomalías cardiacas con Autoencoders (Tutorial Python)