GENERACIÓN DE TEXTO con Redes Recurrentes en Python (Tutorial)

Codificando Bits

มุมมอง 15 676

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 20 ธ.ค. 2024

ความคิดเห็น • 59

@codificandobits 3 ปีที่แล้ว
🔥🔥Academia Online: codificandobits.com 🔥🔥
🔥🔥Asesorías y formación personalizada: codificandobits.com/servicios 🔥🔥
@anilupss2011 3 ปีที่แล้ว
Excelente Miguel... lo que estaba necesitando para entender el tema de RNN..
@pabloartero1155 5 ปีที่แล้ว ⁺⁶
Excelente curso Miguel. Te felicito por lo bien que explicas. Sigue así. Espero con ansias el próximo video de la serie.
@codificandobits 5 ปีที่แล้ว
Gracias por tu comentario Pablo. Esto lo anima a uno a seguir publicando videos.
Y nos vemos en el próximo video! Un saludo!
@octaviooctavio1548 4 ปีที่แล้ว
Una explicación concisa y clara. No obstante yo quería aprender esto para hacer mi propia librería de redes neuronales artificiales, y me ha costado muchísimo entender cómo hacerlo para estas redes, y las redes neuronales recurrentes LSTM.
@codificandobits 4 ปีที่แล้ว ⁺¹
Hola Octavio, gracias por tu comentario. 😬😬😬 qué buen proyecto el de implementar tu propia librería de redes neuronales. Yo creo que las LSTM son, de todas, una de las arquitecturas más difíciles de implementar desde cero, pues están los temas convencionales del entrenamiento y backpropagation (comunes a todas las arquitecturas) pero además está el tema del manejo de las secuencias y de la misma arquitectura LSTM que de por sí tiene muchos elementos.
Te sugiero este enlace, con una implementación LSTM "from scratch" muy buena: www.kaggle.com/navjindervirdee/lstm-neural-network-from-scratch
Un saludo!
@octaviooctavio1548 4 ปีที่แล้ว
@@codificandobits Muchas gracias.
@thisistoplay9376 4 ปีที่แล้ว ⁺¹
Gracias por tus videos amigo , enserio no llegaba a comprender estos conceptos pero tu video me ayudo bastante a mejorar mi AI
@codificandobits 4 ปีที่แล้ว
Qué bueno que te guste el contenido del canal. Un saludo!
@victorvillacortaplasencia611 5 ปีที่แล้ว ⁺¹
Excelentes videos, solo un pequeño aporte, para garantizar la reproducibilidad de Keras en mi caso suelo usar
import os
import numpy as np
import random as rn
SEED = 42
os.environ['PYTHONHASHSEED'] = str(SEED)
np.random.seed(SEED)
rn.seed(SEED)
@codificandobits 5 ปีที่แล้ว
Hola Víctor. Gracias por tu comentario, no había usado esta sintaxis que sugieres. Un saludo!
@jorgesuescun6575 3 ปีที่แล้ว
Excelente como todos los videos. Gran trabajo. Gracias
@codificandobits 3 ปีที่แล้ว
Gracias por tu comentario Jorge. Un saludo!
@andreinaurquiolahernandez4743 9 หลายเดือนก่อน
Explica genial! muchas gracias
@thedarsideofit 5 ปีที่แล้ว ⁺¹
Hola muchas gracias por compartir conocimiento!
@codificandobits 5 ปีที่แล้ว ⁺¹
Hola Diego. Gracias por tu comentario y un saludo!
@davidcardonamontoya4355 11 หลายเดือนก่อน
Hola Miguel, agradezco mucho tus videos, se ve un muy buen trabajo detrás de ellos. Me surge una inquietud, ¿qué libros tienes en la mesita en este vídeo?
@juandavidcardenasp530 8 หลายเดือนก่อน
Genial Miguel. Si quisiéramos hacer este mismo ejercicio pero con nombre de personas qué deberíamos hacer? Solo cambiar el data set?
@M6.rocket 4 ปีที่แล้ว
Excelente video, y un gran aporte.
@codificandobits 4 ปีที่แล้ว
Gracias por tu comentario Ericson, un saludo!
@ezioaltair2194 2 ปีที่แล้ว ⁺¹
Interesante video, tengo una duda con una red recurrente se podria hacer una IA que "hable" (es decir, que a inputs de texto del usuario, responda con ouputs de texto que tengan un minimo de sentido)
@codificandobits 2 ปีที่แล้ว ⁺¹
Es posible, y en este caso te refieres a un "chatbot". Las redes recurrentes funcionan bien, aunque tendrías mejores resultados usando Redes Transformer.
En el canal encontrarás el video "Construyo un chatbot de voz" en donde verás el principio de funcionamiento. ¡Un saludo!
@ezioaltair2194 2 ปีที่แล้ว
@@codificandobits gracias por su respuesta
@wilberliberato3988 2 ปีที่แล้ว ⁺¹
excelente video, Hola Miguel tendras el codigo de la definicion de la variable tam_alfabeto?
@adriannavarro3830 3 ปีที่แล้ว
Otra duda que tengo, en el minuto 7.55 donde muestra el print de iteraciones y error, a que se refiere con error
@vozdominicana 4 ปีที่แล้ว ⁺²
de las 3858 palabras que hablaste solo a prendí 5 jejeje
Muy buen vídeo, mejor te contacto y te pago para que me hagas algo que necesito.
Mas adelante me pongo en contacto, muy excelente video.
@codificandobits 4 ปีที่แล้ว ⁺¹
Ja, ja, ja!!! ¿Y por qué sólo aprendiste 5? ¿Muy confusa la explicación?
Claro que sí, me puedes escribir a codificandobits@gmail.com.
Un saludo!
@vozdominicana 4 ปีที่แล้ว
@@codificandobits hey mi querido profesor, yo no se mucho, use colab de Google y me funcionó muy bien.
Uso un programa y quiero hacer otro así que te hablo por el correo.
@codificandobits 4 ปีที่แล้ว ⁺¹
@@vozdominicana Perfecto, quedo pendiente!
@virgopx3 3 ปีที่แล้ว ⁺²
Buen día Miguel, muchas gracias por el curso, me interesa aprender sobre las redes recurrentes, y la verdad es bastante entendible la forma en que nos explica, me esta sirviendo bastante. Viendo el video, me surgió una duda, ¿Por qué motivo se usan 25 neuronas? ¿Qué pasa si se usan más o menos neuronas?
Muchas gracias por el curso.
Lo sigo viendo, saludos cordiales.
@codificandobits 3 ปีที่แล้ว ⁺¹
Hola Edgar. Es una muy buena pregunta, pero a la vez es una pregunta difícil de responder. El problema de las redes neuronales (y convolucionales y recurrentes y, en general, todas las arquitecturas del Deep Learning) es que no existe una forma analítica de predecir el tamaño de la red (número de capas y/o número de neuronas por capa).
Esto se debe a que los datos con que se entrena la red son muy diversos y usualmente son de tipo perceptual (imágenes, video, audio) y por ello resulta imposible obtener una representación matemática de los mismos. Así que la forma de determinar el tamaño más adecuado de la red es a través de la validación: entrenando el modelo y luego verificando que tenga una precisión alta con el set de prueba.
Así que para responder a tu pregunta: si se incluyen más o menos neuronas se vería afectada la precisión al momento de validar. Si esta precisión mejora quiere decir que ese nuevo número de neuronas resultará más adecuado.
Un saludo!
@virgopx3 3 ปีที่แล้ว
@@codificandobits muchas gracias Miguel por la explicación. Se podra usar Tensorflow con Java en lugar de Python? Saludos cordiales.
@adriannavarro3830 3 ปีที่แล้ว
Buenas, hice un trabajo similar, tome de ejemplo el tuyo, me pareció muy bueno tu video, tengo eso si una consulta, en caso de querer mostrar una métrica, como podría hacerlo?
@hantondark8876 3 ปีที่แล้ว
lo resolviste compañero ? hice una red neuronal que genere texto, paseme su correo o telegram para compartir experiencias amigo
@luisjaimeestudioytrabajo7577 4 ปีที่แล้ว
Gran video
@codificandobits 3 ปีที่แล้ว
😉
@monicamamaniapaza8934 5 ปีที่แล้ว ⁺¹
Podría hacer algún ejemplo en tensorflow basado con Many to one para análisis de sentimientos
@codificandobits 5 ปีที่แล้ว
Hola Mónica. Tensorflow y análisis de sentimientos están en el listado de videos por venir.
En la serie que comenzará próximamente hablaré en principio de Tensorflow 2.0. Un saludo!
@josemanuelmanesridaura8874 4 ปีที่แล้ว
Como SIEMPRE... GENIAL.
@codificandobits 4 ปีที่แล้ว
Gracias de nuevo por tus comentarios José Manuel, y espero sigas conectado al canal!
@davidjolley456 4 ปีที่แล้ว
Brother me dices como hago para instalar las librerias que van al comienzo por favor. Si se que es pip install pero de ahi que mas pongo
@codificandobits 4 ปีที่แล้ว
Hola David. Debes instalar tensorflow 2, que por defecto ya viene con keras. Acá un enlace: www.tensorflow.org/install. Revisa y me cuentas si tienes algún problema
@davidjolley456 4 ปีที่แล้ว
@@codificandobits logro hacer la instalacion pero me sale el siguiente error: mega.nz/file/7MIwHKKI#zPluaO7AT6Jt-2LWy-8lQjpmoJDi8S8W8JU8NwcoCsI
@angellaguna5374 4 ปีที่แล้ว
@@davidjolley456 hola Mega.nz es un drive probablemente tengas que descargarlo y crear una cuenta
@rodrigocasamayou7898 5 ปีที่แล้ว ⁺²
Tengo una pregunta un poco puntillosa.
¿Del dataset de 1536 palabras, 717 tienen la terminación "saurus", porque este patrón no se ve reflejado en los nombres generados?
Perdón por la molestia, espero tengas tiempo y oportunidad de contestar.
Muchas gracias por el vídeo y por el canal, son excelentes.
@codificandobits 5 ปีที่แล้ว ⁺⁵
Hola Rodrigo. Gracias por tu comentario y qué pregunta tan interesante.
Esto se debe a que estamos usando una red recurrente básica, que tiene una memoria de corto plazo. Así, a pesar de que el patrón "saurus" se repite en buena parte del set, se trata de una secuencia (palabra) relativamente extensa (6 caracteres).
El hecho de tener una red con memoria de corto plazo, y un patrón relativamente largo, hace que la red no alcance a percibir este patrón y por tanto no logra aprenderlo.
Un saludo!
@AlexGonzalez-lp3hd 5 ปีที่แล้ว ⁺¹
No soy experto, pero tal vez se deba a la importancia que se le da a ciertos parámetros en el entrenamiento, tengo entendido que eso se puede ver con un análisis de 'feature impact' ( aun soy aprendiz, saludos)
@codificandobits 5 ปีที่แล้ว ⁺³
@@AlexGonzalez-lp3hd Alex, el feature impact se refiere más a los algoritmos tradicionales de "machine learning", en donde antes de entrar a la red neuronal se lleva a cabo una etapa de "extracción de características" (feature extraction). Sin embargo en el caso de las redes recurrentes (o convolucionales, o de los modelos Deep Learning en general) no se usa esta etapa.
@AlexGonzalez-lp3hd 5 ปีที่แล้ว ⁺¹
@@codificandobits Wow, muchas gracias por la aclaración. Haces buen trabajo. Saludos
@anilupss2011 3 ปีที่แล้ว
#Miguel, no he podido compilar el código, me da un error en el Optimizador SGD
@michaelesquivel9417 6 หลายเดือนก่อน
import numpy as np
np.random.seed(5)
from keras.layers import Input, Dense, SimpleRNN
from keras.models import Model
from keras.optimizers import SGD
from keras.utils import to_categorical
from keras import backend as K

# 1. LECTURA DEL SET DE DATOS
# ===========================================================
nombres = open('nombres_dinosaurios.txt','r').read()
nombres = nombres.lower()
# Crear diccionario (listado de caracteres que no se repiten)
alfabeto = list(set(nombres))
tam_datos, tam_alfabeto = len(nombres), len(alfabeto)
print("En total hay %d caracteres, y el diccionario tiene un tamaño de %d caracteres." % (tam_datos, tam_alfabeto))
# Conversión de caracteres a índices y viceversa
car_a_ind = { car:ind for ind,car in enumerate(sorted(alfabeto))}
ind_a_car = { ind:car for ind,car in enumerate(sorted(alfabeto))}
#print(car_a_ind)
#print(ind_a_car)
# 2. MODELO
# ===========================================================
n_a = 25 # Número de neuronas en la capa oculta
entrada = Input(shape=(None,tam_alfabeto))
a0 = Input(shape=(n_a,))
celda_recurrente = SimpleRNN(n_a, activation='tanh', return_state = True) #return_state entregua a la salida el estado oculto actualizado
capa_salida = Dense(tam_alfabeto, activation='softmax')
salida = []
hs, _ = celda_recurrente(entrada, initial_state=a0)
salida.append(capa_salida(hs))
modelo = Model([entrada,a0],salida) #Entradas y salidas
#modelo.summary()
opt = SGD(learning_rate=0.0005)
modelo.compile(optimizer=opt, loss='categorical_crossentropy')
# 3. EJEMPLOS DE ENTRENAMIENTO
# ===========================================================
# Crear lista con ejemplos de entrenamiento y mezclarla aleatoriamente
with open("nombres_dinosaurios.txt") as f:
ejemplos = f.readlines()
ejemplos = [x.lower().strip() for x in ejemplos]
np.random.shuffle(ejemplos)
# Crear ejemplos de entrenamiento usando un generador
def train_generator():
while True:
# Tomar un ejemplo aleatorio
ejemplo = ejemplos[np.random.randint(0,len(ejemplos))]
# Convertir el ejemplo a representación numérica
X = [None] + [car_a_ind[c] for c in ejemplo]
# Crear "Y", resultado de desplazar "X" un caracter a la derecha
Y = X[1:] + [car_a_ind['
']]
# Representar "X" y "Y" en formato one-hot
x = np.zeros((len(X),1,tam_alfabeto))
onehot = to_categorical(X[1:],tam_alfabeto).reshape(len(X)-1,1,tam_alfabeto)
x[1:,:,:] = onehot
y = to_categorical(Y,tam_alfabeto).reshape(len(X),tam_alfabeto)
# Activación inicial (matriz de ceros)
a = np.zeros((len(X), n_a))
yield (x, a), y
# 4. ENTRENAMIENTO
# ===========================================================
BATCH_SIZE = 80 # Número de ejemplos de entrenamiento a usar en cada iteración
NITS = 2000 # Número de iteraciones
for j in range(NITS):
historia = modelo.fit(train_generator(), steps_per_epoch=BATCH_SIZE, epochs=1, verbose=0)
# Imprimir evolución del entrenamiento cada 1000 iteraciones
if j%1000 == 0:
print('
Iteración: %d, Error: %f' % (j, historia.history['loss'][0]) + '
')
import tensorflow as tf
# 5. GENERACIÓN DE NOMBRES USANDO EL MODELO ENTRENADO
# ===========================================================
def generar_nombre(modelo,car_a_num,tam_alfabeto,n_a):
# Inicializar x y a con ceros
x = np.zeros((1, 1, tam_alfabeto))
a = np.zeros((1, n_a))
# Nombre generado y caracter de fin de linea
nombre_generado = ''
fin_linea = '
'
car = -1
# Iterar sobre el modelo y generar predicción hasta tanto no se alcance
# "fin_linea" o el nombre generado llegue a los 50 caracteres
contador = 0
while (car != fin_linea and contador != 50):
# Generar predicción usando la celda RNN
a, _ = celda_recurrente(tf.constant(x), initial_state= tf.constant(a))
y = capa_salida(a)
prediccion = y.numpy()
# Escoger aleatoriamente un elemento de la predicción (el elemento con
# con probabilidad más alta tendrá más opciones de ser seleccionado)
ix = np.random.choice(list(range(tam_alfabeto)),p=prediccion.ravel())
# Convertir el elemento seleccionado a caracter y añadirlo al nombre generado
car = ind_a_car[ix]
nombre_generado += car
# Crear x_(t+1) = y_t, y a_t = a_(t-1)
x = to_categorical(ix,tam_alfabeto).reshape(1,1,tam_alfabeto)
a = a.numpy()
# Actualizar contador y continuar
contador += 1
# Agregar fin de línea al nombre generado en caso de tener más de 50 caracteres
if (contador == 50):
nombre_generado += '
'
print(nombre_generado)
# Generar 100 ejemplos de nombres generados por el modelo ya entrenado
for i in range(10):
generar_nombre(modelo,car_a_ind,tam_alfabeto,n_a)
@niltoncesarrojasvales246 5 ปีที่แล้ว ⁺²
Hola , muy bien explicado tu video y conciso tal como me gusta (Y)
Por otro lado quería preguntarte porque razón se tiene que poner en formato onehot ? porque no se podía dejar con el vector con números? y una pregunta más...
esta RNN cuando pones que tiene 25 neuronas de la capa oculta , como es que se toman los valores ya que en tus ejemplos solo vemos como funciona con 1 neurona, es decir muestras 1 neurona como entra 1 caracter y parece que funciona bien con 1 ... cual es el objeto de tener 24 neuronas más o es que talvez cada caracter va a las 25 neuronas tal cual para que cada neurona se comporte con mayor peso de prediccion a cada letra del alfabeto? y como es que cada neurona toma una entrada , muchas gracias de antemano por tu respuestas.
@Moustacheru 4 ปีที่แล้ว
El vector onehot son los valores de 0..1.
Respecto a la segunda pregunta, tengo la misma duda. ¿Cómo funciona la recurrencia en n neuronas?
Entiendo que la entrada es un vector onehot de 27 elementos que representa una letra alfabética (carácter de una palabra), ¿pero es así para cada neurona?
@hantondark8876 3 ปีที่แล้ว
@@Moustacheru lo resolviste compañero ? hice una red neuronal que genere texto, paseme su correo o telegram para compartir experiencias amigo
@victorhernandomorenoperdom9779 4 ปีที่แล้ว
Excelente Miguel, podrías regalarme nombres de libros para redes recurrentes
@codificandobits 4 ปีที่แล้ว
Gracias por tu comentario Víctor. Se me ocurre el libro de referencia en Deep Learning: the Deep Learning book! Un saludo!
@diversiones100 4 ปีที่แล้ว ⁺²
Su voz me suena similar a la de Goku adulto
@codificandobits 4 ปีที่แล้ว ⁺¹
Ja, ja, ja... se parece! No me había dado cuenta 😂😂
@DavidMartinez-oq1zm 3 ปีที่แล้ว

ต่อไป

เล่นอัตโนมัติ

Predicción de acciones en la bolsa con PYTHON (tutorial redes LSTM)