merci. J'attendais une vidéo sur le sujet en français depuis longtemps et je suis d'autant plus heureux que ce soit toi qui la traite, car tu es un excellent pédagogue.
Cette vidéo et le live coding que tu as fais sont de grande qualité et m'ont permis de comprendre cette architecture et la façon dont on peut coder ce genre de choses ! Merci beaucoup :)
Merci beaucoup pour ces explications claires 👏 Les propositions d’une séance de live coding ou une autre vidéo qui rentrerait dans les détails d’autres applications sont aussi intéressantes l’une que l’autre donc l’idéal serait de faire les 2 😬😇😷
Superbe vidéo d'introduction aux transfomers. Je suis très intéressé pas le live coding d'un transfomers en keras. Et aussi très intéressé par l'explication d'application de transformer a d'autres domaines
Bonjour, Merci pour la qualité de la présentation et de clarté dans vos explications. Est -ce que le transformer peut être utilisé pour enregistrer et distribuer des données (codes imei et imsi)? Pourrai-je si possible avoir ce papier?
salut Thibault , est-ce que tu aurais un schéma où on retrouve en terme simplifié cette suite d'opérations : prompt - token - vecteur - tête d'attention - décodeur ?
Je ne comprends pas un truc. A quoi sert réellement le FFN dans l'encoder et le decoder ? Chaque token va passer dans un réseau de neurones mais je ne vois pas ce que ça apporte au modèle. Quel impact ces réseaux ont sur l'information?
une question qui me hante : la masked self attention ne devrait intervenir UNIQUEMENT que lors de l'entrainement, car on place en input de decoder une séquence contenant la réponse (les tokens futurs). donc, en quoi la masked self attention intervient durant un processus de génération (une fois le modèle entrainé), puisque les tokens encore non générés n'existent tout simplement pas ? Merci de tout éclairage !
Salut ! Tes vidéos sont super ! Merci beaucoup Dis moi est ce que le mécanisme d’attention peut être utilisé non pas pour le traitement de language mais pour prédire des variables numériques continue comme par exemple pour prédire le kwh d’un compteur électrique qui change toutes les 10s
Les documents d'origine sont en anglais et ce sont des concepts relativement nouveaux. Que voulez-vous qu'il fasse? Commencer par faire du boulot de traduction avant celui d'explication? On aurait bien aimé que les papers d'origine soit en français. Pour l'heure, souffrons de ce mélange.
Quel plaisir de revoir une vidéo de ta part sur TH-cam !
En espérant que ce soit le début d'une longue série de vidéo :D.
En manque bq tes vedio machine learnia
nous aimerions aussi que tu fasses une video sur le sujet, ta pedagogie et tes animations sont vraiment utile Machine Learnia. Merci
merci. J'attendais une vidéo sur le sujet en français depuis longtemps et je suis d'autant plus heureux que ce soit toi qui la traite, car tu es un excellent pédagogue.
Excellent Thibault !
Bon retour Thibault.
You deserve more views and more subscribers, I am in love with your channel !!
Cette vidéo et le live coding que tu as fais sont de grande qualité et m'ont permis de comprendre cette architecture et la façon dont on peut coder ce genre de choses ! Merci beaucoup :)
13:17 : ASMR pour penser à nous hydrater ; merci 🥰
Content de revoir des vidéos ... et le son est super bon.
Content de te revoir !!
Merci Monsieur pour tout ce que vous rendez accessible
Merci pour cette vidéo 🙏. C’est super bien expliqué.
c'est si clair, bien dans les détails en expliquant bien des notions complexes, gg
I'm learning french and deep learning at the same time with you :D Thank you very much, well explained.
Super vidéo et bien expliquée , merci pour ce tuto , on attend le TP
Ce que tu fais est supe, continue c'est tres bien detaillé
Très bien expliqué !
Sujet très intéressant , super vidéo
Merci beaucoup pour ces explications claires 👏 Les propositions d’une séance de live coding ou une autre vidéo qui rentrerait dans les détails d’autres applications sont aussi intéressantes l’une que l’autre donc l’idéal serait de faire les 2 😬😇😷
Amazing video, thanks for the explanation
Merci pour ces explications
Heureux de te revoir TN 😏
Le mec explique mieux que mes profs au MIT 💀
Super vidéo, sujet très intéressant !
Très bon travail !! Effectivement un TP pratique serait le bienvenu =)
Merci pour cette vidéo
Hello, merci pour cette video. Un exemple avec keras (ou Pytorch) serait top :-)
Oui l'application des transformers serait très intéressant
merci beaucoup vraiment 🤍🤍🤍
BRAVO ! Vidéo TOP !
merci pour cette videos tres instructive bro !
Superbe vidéo d'introduction aux transfomers. Je suis très intéressé pas le live coding d'un transfomers en keras. Et aussi très intéressé par l'explication d'application de transformer a d'autres domaines
Parfait 😍😍 merci bq
Merci infiniment😍😍😍
Bonjour,
Merci pour la qualité de la présentation et de clarté dans vos explications. Est -ce que le transformer peut être utilisé pour enregistrer et distribuer des données (codes imei et imsi)?
Pourrai-je si possible avoir ce papier?
J'adore le premier Transformers. Michael Bay is all you need.
Merci ..
Je comprends pas pourquoi on a 8 têtes d'attention à 32:35 ?
Merci pour la vidéo
salut Thibault , est-ce que tu aurais un schéma où on retrouve en terme simplifié cette suite d'opérations : prompt - token - vecteur - tête d'attention - décodeur ?
Merci
Je ne comprends pas un truc. A quoi sert réellement le FFN dans l'encoder et le decoder ? Chaque token va passer dans un réseau de neurones mais je ne vois pas ce que ça apporte au modèle. Quel impact ces réseaux ont sur l'information?
une question qui me hante : la masked self attention ne devrait intervenir UNIQUEMENT que lors de l'entrainement, car on place en input de decoder une séquence contenant la réponse (les tokens futurs). donc, en quoi la masked self attention intervient durant un processus de génération (une fois le modèle entrainé), puisque les tokens encore non générés n'existent tout simplement pas ? Merci de tout éclairage !
En effet, seulement utile a l'entrainement
@@ThibaultNeveu merci je me sens moins seul maintenant 🤣
Salut ! Tes vidéos sont super ! Merci beaucoup
Dis moi est ce que le mécanisme d’attention peut être utilisé non pas pour le traitement de language mais pour prédire des variables numériques continue comme par exemple pour prédire le kwh d’un compteur électrique qui change toutes les 10s
excellent
nice
Et aussi il faut L'implémentation svp
il a donné toutes les informations pour coder. Pas besoin de plus.
rien compris
Affreux melange du français et de l'anglais !
Les documents d'origine sont en anglais et ce sont des concepts relativement nouveaux. Que voulez-vous qu'il fasse? Commencer par faire du boulot de traduction avant celui d'explication?
On aurait bien aimé que les papers d'origine soit en français.
Pour l'heure, souffrons de ce mélange.
Merci