FEATURE SELECTION avec SKLEARN (23/30)

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 ส.ค. 2024

ความคิดเห็น • 299

  • @MachineLearnia
    @MachineLearnia  3 ปีที่แล้ว +42

    IMPORTANT ! UPDATE DE SKLEARN :
    - pour RFE : min_features_to_select n'existe plus et l'algorithme a légerement changé : il faut maintenant définir le nombre de variable que l'on veut atteindre avec n_features_to_select et l'algorithme élimine au fur et a mesure les variables en suivant le processus que j'ai mentionné dans la vidéo
    - Pour SelectFromModel, je dis dans la vidéo que les variables sont séléctionnées a partir de la moyenne des coefficients. En fait je fais la une "simplification" mais en réalité les variables séléctionnées sont celles pour lesquelle la Norme des coefficient est supérieure a la moyenne des normes. Ci-dessous un code :
    selector = SelectFromModel(SGDClassifier(), threshold='mean')
    selector.fit(X, y)
    importances = np.linalg.norm(selector.estimator_.coef_, axis=0, ord=1)
    mean = np.mean(importances)
    print(selector.get_support())
    print(importances > mean)

  • @essaidelhaji6844
    @essaidelhaji6844 4 ปีที่แล้ว +22

    Merci pour vos efforts. Vous êtes parmi les rares qui ont décidé de fournir des formations de qualités gratuitement! un contenu progressif, une pédagogie intéressante et des montages très illustratifs. Je recommande cette chaîne pour toute personne désirant faire son pas dans la monde de machine Learning. Bravo cher Guillaume.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci beaucoup, ca me fait tres plaisir :)

  • @pulsorion
    @pulsorion 4 ปีที่แล้ว +19

    Un sujet pas des plus simples mais pourtant très bien expliqué ✔ 😉

  • @cyrilww3750
    @cyrilww3750 3 ปีที่แล้ว +2

    Quel régal ! Ca fait 2 semaines que je suis les vidéos avec mon Jupyter Notebook, tout marche, le prof est clair, c'est que du bonheur !

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว +2

      Que du bonheur pour moi aussi, merci :)

  • @tarluck
    @tarluck 4 ปีที่แล้ว +4

    Bonjour et encore une fois Merci Guillaume pour toutes ces videos, on ne sait vraiment pas comment vous remercier ???!!!!,

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci beaucoup. Vous venez de me remercier avec ce commentaire de remerciement ! ^^
      (vous pouvez aussi me soutenir sur Tipeee, si vous le désirez)

  • @sabnina1920
    @sabnina1920 4 ปีที่แล้ว +7

    waouh quelle vidéo! c'est tellement bien expliqué!! merci du fond du coeur pour toutes ces informations!

  • @moussabamba6216
    @moussabamba6216 4 ปีที่แล้ว +1

    Waouh tout est clair et simple à comprendre vraiment merci ,avec toi le machine learning est simple à comprendre et en plus passionnant .merci infiniment,merci

  • @angesamuel7139
    @angesamuel7139 4 ปีที่แล้ว +1

    Merci bcp pour ton temps que tu nous accordes. Tes vidéos m'aident énormément dans la compréhension de tous ces termes liés au ML qui me paraissaient compliqués bien avant que je ne tombe sur ta chaîne.

  • @GasherProdStudio
    @GasherProdStudio ปีที่แล้ว +2

    Bonjour Guillaume, merci pour cette precieuse video sur la feature selection, en python, avec ScikitLearn !

  • @mohammed_yazidcherifi9816
    @mohammed_yazidcherifi9816 4 ปีที่แล้ว +1

    Vraiment au top comme toujours,
    Merci beaucoup, vous m'aidez beaucoup pour mon apprentissage, dommage étant étudiant donc je n'ai pas d’expérience , j'ai jamais codé un programmes de ML mais grâce à vous je commence à voir mieux ce métier, son principe et comment ça marche à l’intérieur, j'attends avec impatience les prochaine vidéos.
    En fait je trouve que SKlrearn est très riche pour le preprocessing, et beh c'est un peu problématique, je m'explique, on a appris avec vous beaucoup de choses sur le pré traitement du dataset, du la partition du dataset, et de la cross validation etc.., nettoyage des données, choix de la metric, sélection de variable, le choix du modèles, le choix de la cv, les pipeline , et j'aimerais savoir comment avoir une méthodologie ou un ordre à suivre pour appliquer tous ces pré traitement,et comment à chaque fois choisir la meilleure méthodes du prétraitement pour avoir la meilleur performance possible,
    J'attends avec impatience la suite, surtout les vidéos où on étudie vraiment la pratique et suivre pas à pas votre démarche de résolution de problème.
    Vous méritez que votre chaîne soit connue d'avantage car elle est très très très bien et croyez moi c'est assez rare de voir un travail de bonne qualité.
    Merci pour vos efforts immenses, merci de trouver à chaque fois du temps pour nous .
    Merci beaucoup,
    bon courage.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Merci beaucoup pour votre message ! Oui je comprends qu'il y ait beaucoup d'information ! C'est normal d’être un peu perdu et c'est la raison pour laquelle les 5 dernières vidéos de cette série portent sur la méthodologie et la pratique de projets ! Une fois la série terminée, je ferai beaucoup de vidéos de projets également !

    • @mohammed_yazidcherifi9816
      @mohammed_yazidcherifi9816 4 ปีที่แล้ว

      @@MachineLearnia merci infiniment pour vos efforts envers nous, bon courage.

  • @amadoufall3841
    @amadoufall3841 2 ปีที่แล้ว

    Vraiment un grand merci à vous pour tous les efforts que vous faites. J'ai suivi vos enseignements avec admiration à travers votre chaine. Je vous souhaite beaucoup de succès dans vos projets.

  • @donellessame9194
    @donellessame9194 3 ปีที่แล้ว +3

    J'ai remarqué en avançant dans cette série de vidéo, qui tu avais tendance à faire des simplifications de certaines notions. Au début, je ne saisissais pas trop et je pensais que tu te trompais parfois. Et ensuite je me suis rendu compte que tu simplifiais, car les notions que tu partages dans cette série de vidéo son des notions assez complexes et vastes pour certaines et que pour les rendre accessible il est nécessaire parfois de prendre certains raccourcis. Je te félicite, car de cette façon des gens comme moi qui n'avons pas étudier le ML à la fac ou nulle part ailleurs on peut se former quand même sans avoir forcément énormément de prérequis. Et ça, c'est beau.

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว +8

      Merci, tu as tout a fait compris ma démarche et ca me fait vraiment plaisir, car cela demande beaucoup de travail (des dizaines d'heures, voire des centaines, pour faire les scripts, les animations, trouver les bons mots, bien vulgariser) J'écris parfois 5 a 10 brouillons pour expliquer un concept que je connais déjà bien, juste pour trouver l'explication accessible a tous.

  • @nabihamaraoui7082
    @nabihamaraoui7082 4 ปีที่แล้ว +1

    Pas de problème quant à la rapidité , non ce n'est pas trop rapide et c'est très bien expliqué. C'est très intéressant car c'est très similaire
    à l'économétrie, vu de manière plus simple mais l'architecture est semblable. Merci pour cette vidéo limpide et consistante.

  • @Science3D
    @Science3D ปีที่แล้ว

    j'écoute chaque video de ta chaine et je n'ai que du positif à leur sujets. tu es un formateur de très haut calibre! J'avais acheté une formation sur udemy mais la manière que tu explique les concepts dépasse largement la formation. Merci ! Merci !!!

  • @adgsm9202
    @adgsm9202 9 วันที่ผ่านมา

    Merci pour la vidéo, bien expliqué. Ce n'est pas trop court, même peut-être un long poil. Mais ça reste plus agréable que de se taper la doc Scikit-learn ;-)

  • @kamalelbo5116
    @kamalelbo5116 3 ปีที่แล้ว +1

    Merci beaucoup Guillaume pour ce cours très bien expliqué comme d'habitude, je te souhaite plein de succès ;)

  • @joshanambungu8222
    @joshanambungu8222 7 หลายเดือนก่อน

    Encore une magnifique vidéo de votre part. J'ai particulièrement apprécié la manière dont vous avez simplifié l'explication du SelectFromModel avec le threshold = mean.
    J'espère qu'il y a une vidéo qui parle des modules avec la sélection basée sur le pvalue que je trouve plus rigoureux qu'une valeur de seuil arbitraire.
    En passant, l'attribut grid_scores ne fait plus partie de la classe RFECV et est remplacée par cv_results_ qui donne encore plus de détails (merci Chatgpt 😁).
    Encore Merci pour ce que vous faites !

  • @IhebGMAR
    @IhebGMAR ปีที่แล้ว +1

    Hey Guillaume, la vidéo ne va pas vite pour certains au contraire 😉 J'en profite pour te laisser un GRAND MERCI pour tout ce contenu el les efforts fournis afin d'avoir des cours de cette qualité 🤩🤩 Un GRAND MERCI pour toutes ces explications minutieuses et franchement BRAVO pour toutes tes vidéos 💙💙💙💙

  • @Safadiallo
    @Safadiallo 3 ปีที่แล้ว

    Merci Monsieur pour cette belle contribution à la vulgarisation du machine learning

  • @amid7757
    @amid7757 2 ปีที่แล้ว

    merci pour tout Guillaume!
    Vos vidéos sont de très haute qualité

  • @aboubacardiaw6812
    @aboubacardiaw6812 4 ปีที่แล้ว

    Merci beaucoup pour ces vidéos. elles sont vraiment compréhensibles. Grace à toi j'ai beaucoup appris!!!

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je suis heureux de l'apprendre :)

  • @houssam814
    @houssam814 2 ปีที่แล้ว

    Nice work mate, you are a real hero.

  • @eyazouaghi7938
    @eyazouaghi7938 3 ปีที่แล้ว

    c'est tellement bien expliqué!! merci du fond du coeur pour toutes ces informations!

  • @jord-aeleon1887
    @jord-aeleon1887 4 ปีที่แล้ว

    Excellente idée cette petite pause, c'était coton ce passage sur les matrices (même si je pense avoir compris le principe). Encore merci pour cette vidéo ;)

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Merci beaucoup ! Je suis content si tu as pu comprendre le passage avec les matrices

  • @theor5677
    @theor5677 4 ปีที่แล้ว +3

    Au top Guillaume ! Comme d'habitude

  • @THLEx2
    @THLEx2 2 ปีที่แล้ว

    Super vidéo pour reconstruire les bases ! Merci

  • @LaurentD90
    @LaurentD90 3 ปีที่แล้ว +1

    Encore un coup de Maître ! Merci pour cette superbe vidéo.

  • @giuseppepresti2859
    @giuseppepresti2859 4 ปีที่แล้ว +1

    Encore un grand merci pour tout Guillaume. Vous êtes super avec tout ce que vous avez créé (Vos vidéo super explicite , votre livre sur le ml , comunauté discord , Tipeee etc). Par contre , j'aurais une petite question. Est ce que vous parlerez un jour d'interface graphique (pas tkinter car trop simpliste et ce n'est pas très beau)? Je parle d'un interface graphique qui s'ouvre sur une page web afin de vraiment manipuler facilement les choses et de ne plus devoir aller dans le code python pour chipoter (avoir une bonne visibilité==> exemple un onglet qui permet de sélectionner le type de régression que l'on veut faire). D’ailleurs si vous avez un petit lien sur un truc qui permettrai de créer une interface graphique web généré depuis le code python ça m'intéresserait :)
    Encore un grand merci pour tout , vous êtes incroyable.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je ne suis pas un expert en interface graphique. En milieu professionnel, les data scientists et Data Engineer n'ont pas pour rôle de développer des interfaces. A la place, nous utilisons les APIs fournies par des outils comme ceux du Cloud etc.

  • @anassariss5153
    @anassariss5153 4 ปีที่แล้ว

    Très Bonne explication, je vous souhaite une meilleur continuation. Je kiffe tous vos vidéo franchement.

  • @jimdelsol1941
    @jimdelsol1941 4 ปีที่แล้ว +3

    Merci beaucoup pour cette vidéo ! :)

  • @martrom0
    @martrom0 3 ปีที่แล้ว

    Je fais rarement de commentaires mais là .. Tu es le meilleur !! Bravo pour tes cours !! Merci !!

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      Merci beaucoup pour ton commentaire alors ! Je le prends comme un honneur ! :D

  • @yousseffellous8153
    @yousseffellous8153 4 ปีที่แล้ว +1

    Vraiment vos vidéo c'est le top du top, un grande merci ;)

  • @tamervuranok
    @tamervuranok 10 หลายเดือนก่อน

    Bonjour Guillaume. Tout d'abord, je dis: WOUW. Tu es le meilleur. J'ai jamais vu une formation aussi bien structurée et expliquée. Un énorme merci à toi.
    Et une question, stp: Doit-on vraiment appliquer un modèle ML qui fait une sélection des features pour développer un modèle ML avec SelectFromModel ou RFE ? Càd, si on applique directement un modèle (sans faire SelectFromModel ou RFE), le modèle risque de donner un moins bon résultat ?
    Je m'attends à ce que l'algorithme du modèle élimine de toute facon les features inutiles dans sa phase de training..

  • @Hufoodie
    @Hufoodie 3 ปีที่แล้ว +1

    I'm still at the 6th minute but felt the urge to thank you for sharing this !!!!! Merci infiniment

  • @DiizouFR
    @DiizouFR 4 ปีที่แล้ว +1

    Au top merci Guillaume !

  • @aichaelfilali4361
    @aichaelfilali4361 4 ปีที่แล้ว +1

    Très bien expliqué Merci bqqqq

  • @papamatardieng6816
    @papamatardieng6816 2 ปีที่แล้ว

    merci beaucoup pour vos videoes 👍👍👍

  • @antoinetiyadjowe1955
    @antoinetiyadjowe1955 3 ปีที่แล้ว

    Merci infiniment pour cette vidéo

  • @mamadoudiedhiou4997
    @mamadoudiedhiou4997 4 ปีที่แล้ว

    Excellent travail M.Machine Merci beaucoup

  • @sandjakkhaled4492
    @sandjakkhaled4492 2 ปีที่แล้ว

    Merci vidéo très utile

  • @zahrazemam1347
    @zahrazemam1347 4 ปีที่แล้ว

    super bien explique j'adore tes video, merci du fond du coeur

  • @amyd.2840
    @amyd.2840 4 ปีที่แล้ว +1

    Super vidéo comme toujours, merci ! :)

  • @imadsaddik
    @imadsaddik 5 หลายเดือนก่อน

    Merci beaucoup mon ami

  • @mahdouibrahim2022
    @mahdouibrahim2022 3 หลายเดือนก่อน

    t est vraiment genial. merci beaucou p

  • @koueviayiselom3225
    @koueviayiselom3225 4 ปีที่แล้ว

    Votre formation est vraiment géniale. Vous expliquez les choses de manière simple et vous êtes un bon pédagogue. Le petit souci que j'ai eu est dû au langage utilisé parce que je suis un peu plus familiarisé avec R

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je suis heureux de pouvoir vous aider ! :) Que pensez-vous de Python vs R alors ? Je ne maitrise pas R donc je serais curieux de connaitre votre avis :)

  • @IngDAOUDI
    @IngDAOUDI 4 ปีที่แล้ว

    Bonjour,
    Merci bcp pour ces vidéos que je trouve très utile.
    Je viens de terminer toute les vidéos et le problème c'est qu'on je suis à la fin je me souviens plus de toute les notions présentées dans les premières vidéos.
    C'est clair que ça demande bcp de pratique pour les approprier mais je ne sais pas si vous pouvez nous préparer une vidéo dont vous présentez une application de toute les notions fondamentales et souvent utilisées dans le ML.
    Sinon je te félicite pour les vidéos qui sont vraiment magnifique

    • @9raytibook
      @9raytibook ปีที่แล้ว

      l9iti akhouya chi solution ?

  • @idrisseahamadiabdallah7669
    @idrisseahamadiabdallah7669 2 ปีที่แล้ว

    nice videos, well explained

  • @bienvenumoutouama5672
    @bienvenumoutouama5672 4 ปีที่แล้ว

    Vraiment vous étes le meilleur.Merci encore pour vos videos.

  • @abdelazizfeddaoui1993
    @abdelazizfeddaoui1993 4 ปีที่แล้ว

    Un grand merci.

  • @sebastienm2037
    @sebastienm2037 3 ปีที่แล้ว

    Excellent, merci beaucoup !

  • @azizrajim363
    @azizrajim363 2 ปีที่แล้ว

    Génial, bravo.

  • @jean-luctrocello1139
    @jean-luctrocello1139 4 ปีที่แล้ว

    Merci pour cette vidéo et votre travail

  • @touzrimohamedhelmi2332
    @touzrimohamedhelmi2332 2 ปีที่แล้ว

    bravo, et encore... bravo

  • @jawadboujida271
    @jawadboujida271 3 ปีที่แล้ว

    Merci, excellente vidéo.

  • @aydiamine1213
    @aydiamine1213 4 ปีที่แล้ว +1

    tout d'abord merci beaucoup pour votre effort
    vos videos sont très utiles et faciles à comprendre
    autre
    Je travaille actuellement sur un projet qui gère le système de recrutement en utilisant l'apprentissage automatique qui va utiliser des CV et essayer de les classer en fonction de leurs compétences
    je me demandais quel algo est le mieux pour cette situation
    je pense à kBest et chi2
    toutes les suggestions sont les bienvenues
    mercii

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Bonjour, pour faire une bonne étude de CV, il faut surement utiliser un modele de traitement du langage naturel avec LSTM. Vous pouvez aussi créer un Bag of Words des CV analyser et trier les CV qui contiennent le plus certains mots que vous cherchez, mais attention a ne pas trouver les CV spams, je ne suis pas recruteur mais je pense que les bons candidats ne sont pas trouvés a travers le CV

    • @aydiamine1213
      @aydiamine1213 4 ปีที่แล้ว

      @@MachineLearnia Merci pour votre réponse rapide
      oui, je pensais utiliser nltk pour nlp
      puis extraire les informations importantes dans des segments tels que: informations personnelles, compétences, projets etc. ça va aussi être une sélection basée sur la description de poste ou les exigences de l'entreprise.
      extraire les compétences, l'université en utilisant des dictionnaires, puis leur donner un poids en fonction de leur importance et de leurs besoins. puis transférez toutes ces données dans des vecteurs afin que je puisse les utiliser dans l'apprentissage automatique, mais je ne sais pas quoi faire après cela :(
      pour le rendre plus intelligent, je peux importer des informations github et LinkedIn en utilisant Api
      je suis désolé d'avoir perdu votre temps. c'est juste mon premier projet d'apprentissage automatique, donc je suis confronté à beaucoup de difficultés et votre chainne m'aide beaucoup

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Pas de soucis ! Votre démarche est bonne, c'est un bon début, je vous conseille de commencer par mettre en place des modèles simples avec une structure pour évaluer de façon cohérente tous les modèles que vous entraînez. C'est une des astuces les plus importantes en Data Science : Commencez par tester beaucoup d'idées simples et rapide a mettre en place, pour retenir les meilleurs idées et les améliorer avec d'autres idées simples et rapides a mettre en place.

  • @kouleyengouffomartial2903
    @kouleyengouffomartial2903 3 ปีที่แล้ว

    merci pour les efforts car tes vidéos sont très passionnantes. moi personnellement je ne saurai m'enlace

  • @valdimayima9414
    @valdimayima9414 3 ปีที่แล้ว

    Super vidéo

  • @PaulG-xp9lb
    @PaulG-xp9lb 4 ปีที่แล้ว +1

    Merci pour cette vidéo !
    you are very pedagogue ;)

    • @PaulG-xp9lb
      @PaulG-xp9lb 4 ปีที่แล้ว

      En revanche, lorsque j'applique la technique RFECV je n'obtiens pas toujours les mêmes résultats quand je relance plusieurs fois le test c'est normal ?

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Merci beaucoup ! :)

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Oui il faut initialiser votre estimateur avec un générateur aléatoire random_state fixer a une valeur précise, par exemple random_state=0

    • @PaulG-xp9lb
      @PaulG-xp9lb 4 ปีที่แล้ว

      @@MachineLearnia ah oui merci !

  • @quentinuhart6687
    @quentinuhart6687 4 ปีที่แล้ว

    Est ce que tu vas vite dans tes vidéos? Ouiiii ! Mais c'est l'intérêt d'une vidéo, on peut mettre sur pause pour prendre des notes. Il y a tellement d'informations à donner en 30 vidéos que je ne vois pas comment tu pourrais réduire... Encore bravo et un grand merci pour cette formation de qualité !

  • @ulrichkarlodjo1457
    @ulrichkarlodjo1457 4 ปีที่แล้ว +1

    AHAH sa fesait longtemps la tablette pour faire des maths! Bon les vidéos je les trouves pas trop rapide meme celle-ci n'était pas rapide juste la partie ou t'est rentré dans les mathématiques c'était un peu speed mais bon pas exagéré non plus han! Sinon à part sa super vidéo sa me permet de compléter mes outils de features selection et pour l'ACP je m'attendais à la voir mais on ne l'a pas aborder!

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Merci Ulrich ! l'ACP nous allons la voir dans la prochaine vidéo, car ce n'est pas une technique de sélection de variables, mais de projection de variables (grosse nuance)

  • @jonathanblandiaux7502
    @jonathanblandiaux7502 4 ปีที่แล้ว +2

    Super vidéo merci beaucoup Guillaume !
    J'ai une petite question quand on utilise SGDClassifier avec le threshold="mean" pour déterminer les coéfficients à garder. Pourquoi regarde t-on les coéfficients supérieurs à la moyenne seulement ? Un grand coefficient négatif montre également une grande relation entre x et y, non ?
    Merci encore pour cette série de vidéos vraiment au top 😍

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +2

      Bonjour Jonathan ! Oui oui c'est correct. J'ai juste utilisé "mean" dans cette vidéo pour expliquer le principe, mais ca n'est pas forcément celui que j'utiliserai pour un SGDClassifier !

  • @Patchi246
    @Patchi246 4 ปีที่แล้ว +2

    Bonjour et merci pour ces explications . Je pense que le rythme des vidéos est très satisfaisant, c'est vraiment compréhensible
    .
    Est-il judicieux d'utiliser ces méthodes de sélection de variables pour des data set assez large, par exemple 150-200 variables?

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci beaucoup. C'est justement dans ces cas qu'il faut utiliser des méthodes de sélection de variables et de réduction de dimension (algorithme PCA que l'on verra dans la prochaine video)

  • @moussabamba6216
    @moussabamba6216 4 ปีที่แล้ว +2

    bonjour et merci pour tes vidéo j'aimerais savoir si à la fin vous feriez une vidéo dans laquelle vous montreriez les étapes à suivre dans un projet de machine learning .merci d'avance

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Merci ! je vais en faire plusieurs ! (ca commence a la vidéo 26)

  • @DieugoB52
    @DieugoB52 3 วันที่ผ่านมา

    Bonjour prof, j'ai juste une remarque sur sujet. Bien avant vous aviez dit pouvoir nous envoyez votre livre gratuit en vous faisant un mail, mais moi là ça fait presque un mois que je ne reçois pas de réaction de votre part. Merci beaucoup, un admirateur de votre formation 😊

  • @zinemoussa6863
    @zinemoussa6863 4 ปีที่แล้ว

    Le contenue est très condenser c est vrai, mais tant qu il y a l option pause et retour sur TH-cam, alors il y a pas de problèmes. Parfois je reste 2 - 3 heures sur une seule vidéo pour en tirer le maximum.
    Merci de nous faire part de ton savoir.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci beaucoup et bravo pour votre motivation et votre travail, vous irez loin ! :)

  • @Bwaaz
    @Bwaaz 3 ปีที่แล้ว

    Très clair, merci :)

  • @rvstats_ES
    @rvstats_ES 4 ปีที่แล้ว

    J'apprends le francais et le feature selection en meme temp ;) . Thanks!

  • @jmbdeblois
    @jmbdeblois 4 ปีที่แล้ว +1

    Super vidéo très pédago comme d'habitude (on va s'habituer hein !!). Pour le coup, ça vaudrait peut-être la peine, pour compléter, de mettre quelques liens intéressants sur test du Khi2 et d'Anova.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je suis d'accord avec toi pour les liens, je vais les rajouter bientôt, en attendant de produire moi-même des vidéos a ce sujet.

    • @jmbdeblois
      @jmbdeblois 4 ปีที่แล้ว

      @@MachineLearnia qui seront plutôt des vidéos "matheuses" ou toujours orientées ML ? Car ce qui fait ta valeur ajoutée, ce sont les explications et liens avec le ML. Il existe suffisamment de références (très bonnes) sur les stats. Mais ce n'est que mon avis !

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      @@jmbdeblois Je suis d'accord et ma réponse est simple : Je ferai ce que la communauté me demande, donc merci a toi de me communiquer tes réflexions, elles sont vitales !

    • @jmbdeblois
      @jmbdeblois 4 ปีที่แล้ว

      @@MachineLearnia je comprends ! pour moi, ton exploration des immenses possibilités de scikit-learn est géniale. Je me sens à l'aise en maths et en stats donc je n'ai pas besoin de ce genre de vidéos. Et puis après scikit, il y a tensorflow ! et puis il y a pytorch !! Ainsi, une incursion dans le PCA pourrait avantageusement éclairé cette vidéo sur les feature selection tout en parlant (gentiment) d'analyse multivariée

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je vais parler de la PCA dans la prochaine video (apprentissage non-supervisé) car ca n'est pas vraiment de la séléction de variables, mais de la projection de variables dans des espaces de sous-dimension. Mais oui comme tu l'a indiqué mon but est d'expliquer les algos de façon ML/pragmatique sans faire des maths pures et dures, car sinon il y a juste Wikipédia pour les maths, et les définitions

  • @sandrasandji6620
    @sandrasandji6620 3 ปีที่แล้ว

    great!!!! thanks

  • @karlbina9665
    @karlbina9665 4 ปีที่แล้ว

    Vraiment un grand Merci :-)

  • @adelesouleymanova2172
    @adelesouleymanova2172 3 ปีที่แล้ว

    Merci infiniment!!!

  • @Alpha-zf1tw
    @Alpha-zf1tw 3 ปีที่แล้ว

    23/30, très claire as always...

  • @request_scudling
    @request_scudling 5 หลายเดือนก่อน

    Merci pour vos efforts et le partage , j'apprends beaucoup avec vous (je suis dans le secteur télécom) , j'ai une petite remarque : à partir de la minute 24:44 vous dites que le score 80% est obtenu si l'estimateur prends les 4 variable (toutes les variables) en considération et le score 84,66% si on élimine une variable et 77,33% si on élimine deuxième variable , j'ai changé le min_features_to_select de 1 à 4 et j'ai constaté que le dernier score 77,33% est obtenu si l'estimateur prends les 4 variable (toutes les variables), le score 84,66% si on élimine une variable, le score 80% si on élimine la deuxième variable et le score 87,33% si on élimine la troisième variable, je pense qu'il faut lire de droite à gauche et non pas l'inverse , merci monsieur

  • @hananeslimani6513
    @hananeslimani6513 10 หลายเดือนก่อน

    Merc beaucoup pour la vidéo 🙂 très utile et surtout très bien expliqué !
    J'ai une question j'aimerais utiliser les estimateurs à partir des coefficients pour un réseau de neurones mais c'est un réseau implimenté sur torch ( j'utilise une fonction de train implimenté a la main) et je n'utilise pas .fit() pour entraîner le model.
    Ma question peut-on utiliser les estimateurs à partir des modèles appris dans le cas d'un CNN implimenté sur torch ?
    Merci encore une fois pour la vidéo ça m'était très utile 👌

  • @abderrahimcheggour2025
    @abderrahimcheggour2025 3 ปีที่แล้ว

    merci

  • @JeromeVachet
    @JeromeVachet 3 ปีที่แล้ว +1

    Déjà Grand Bravo pour les vidéos. Dans un cours de DataMining, pour travailler la réduction de variables, on utilisait les ACP. Est-ce que l'on peut utiliser les 2 méthodes ou est-ce l'un ou l'autre ?

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      Parfois l'une marche mieux que l'autre, il faut tester les 2 :)

  • @abdellatifkraiem2058
    @abdellatifkraiem2058 4 ปีที่แล้ว +2

    Bonjour Monsieur!
    Bravo, c'est manifique ,
    D'abord je vous remercis pour tous les efforts que vous êtes entrain de fournir pour nous produire des vidéos extrêmement intéressant , en effet je vous demande si c'est possible de m'envoyer des documents à propos l'apprentissage non supervisé ( le problème de régression si j'ai une base non labellisée comment va être résolu) .

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Ma prochaine vidéo porte sur l'apprentissage non-supervisé, je pense que ça répondra a certaines de vos questions !

    • @abdellatifkraiem2058
      @abdellatifkraiem2058 4 ปีที่แล้ว

      Merci monsieur

  • @bernylong4995
    @bernylong4995 4 ปีที่แล้ว +1

    Bonjour,
    Encore bravo pour le fond et la forme. Peut on utiliser ce mécanisme également avec des données qui ont été encodées ?... Dans votre exemple, on exploite des données numériques mais qu'en est il lorsqu'il s'agit de données qualitatives ? après encodage, on peut également sélectionner les variables intéressantes ? Merci de votre retour.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci ! Oui il est possible d'utiliser tous les concepts de cette vidéo pour les variables qualitatives, mais il faut au préalables les encoder en valeur numériques (car sinon les tests de dépendance et autres techniques ne fonctionnent pas, c'est juste mathématique). Donc il faut faire de l'encodage onehot ou encodage ordinale pour les valeurs qui ne sont pas des nombres, pour ensuite utiliser SelectKbest, SelectFromModel, etc.

  • @mackas33
    @mackas33 4 ปีที่แล้ว +2

    Bonjour, un grand merci d’abord.
    Sinon j’aimerais bien savoir pourquoi vous utilisez SGDClassifier (c’est quel genre de modèle de classification SVP).

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +4

      Bonjour, c'est un algorithme de classification trers simple qui repose sur la déscente de gradient stochastique. J'aime bien l'utiliser pour les exemples car c'est un algorithme très représentatif du Machine Learning et c'est un des plus simples a comprendre mathématiquement.
      Je vais bientot lancer une série qui explique la différence entre tous ces algorithmes

  • @amirakorteby6097
    @amirakorteby6097 4 ปีที่แล้ว +1

    D'abord je vous remercie pour ces cours très bien expliquer, vous m'aider vraiment a mieux comprendre les notions du machine learning ....
    mais j'ai tjrs un problem avec la programmation en général pas juste en Machine Learning , je comprend tjrs les bases des langages (java,python.) mais je n'arrive encore pas a programmer correctement ou a avoir des solution pour mes exercices , je veux vraiment apprendre plus de ce domaine mais je ne sais pas comment,
    Si vous pouvez me conseiller une méthode ou des cours précis pour améliorer mon niveau , je serai vraiment reconnaissant :)
    Merciii encore une fois pour tes efforts.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Merci beaucoup.
      Pour progresser je vous conseille d'écrire vous-meme un petit programme comme ce que je fais dans la vidéo. Essayer de visualiser les données des fleurs d'iris et de construire différents modeles (KNN, etc) en jouant avec les hyper-parametres. Arrivez-vous a faire ca pour commencer ?

    • @amirakorteby6097
      @amirakorteby6097 4 ปีที่แล้ว +1

      D'accord, Mercii Beaucoup je vais essayer avec l'exemple des fleurs d'iris , Normalement je y'arriverai :D

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      @@amirakorteby6097 Je suis sur que tu vas y arriver ! :D Go !

  • @allalzaid1872
    @allalzaid1872 2 ปีที่แล้ว

    des videos tres utiles, or pas de regression .
    merci

  • @oumarndiaye32
    @oumarndiaye32 4 ปีที่แล้ว +1

    merci pour le moment..... nous y reviendrons avec des question plutard

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Parfait ! je répondrai a vos questions :)

  • @djibrildiouf9191
    @djibrildiouf9191 3 ปีที่แล้ว

    super

  • @stephaneperriot7845
    @stephaneperriot7845 4 ปีที่แล้ว

    Bonjour,
    Merci encore pour la qualité et clarté de vos vidéos :)
    Est ce que dans le cas d'un SelectFromModel, il ne faudrait pas une moyenne des valeurs absolues pour tenir compte des corrélations négatives ?
    Pour la sélection de variable par variance, une feature pourrait présenter une faible variance et pourtant cette variance serait beaucoup plus impactante qu'une autre feature très variable. Par exemple le nombre de pièce dans un appartement contre le nombre de tableaux (décoration) pour estimer le prix d'un appartement.
    Dans l'ensemble mon commentaire porte sur les critères d'utilisation d'un sélecteur plutôt qu'un autre et le risque que les tests de dépendances ou mesures statistiques utilisées (moyenne, variance) cachent des informations. J'espère être clair ^^
    Pour ma part les vidéos ne vont pas trop vite car chaque point est correctement expliqué sur les bases précédemment acquise. Je mets souvent la vidéo sur pause pour prendre des notes, assimiler ou faire des recherches à coté et parfois je revisionne un passage pour être sur d'avoir bien saisi. En gros, je gère mon rythme :) En général il me faut le double de temps pour visionner une vidéo. Je suis très satisfait de cette méthode, en relisant mes notes plus tard je valide les connaissances acquises.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Je n'ai pas compris ta question sur SelectFromModel. Pour les variances, on utilise surtout cela pour éliminer les variance tres proches de zero (auquel cas, il est rare qu'elle soit bien corrélée a la cible y). A titre personnel, Je ne dépends jamais d'une méthode toute seule et j'essaie d'en utiliser plusieurs pour voir les résultats les plus intéressants.

    • @stephaneperriot7845
      @stephaneperriot7845 4 ปีที่แล้ว

      @@MachineLearnia Merci de voter réponse, je ne suis pas très sur de mes questions. L'idée générale porte sur la possibilité de faire une mauvaise sélection en se basant sur des indicateurs peu pertinents. Tester plusieurs méthodes pour en analyser les résultats me semble une bonne manière de pas tomber dans ce piège.

  • @laconispe06
    @laconispe06 4 ปีที่แล้ว

    Super vidéo !
    Une question sur la sélection de variables : faut-il normaliser avant d’utiliser les transformers ou les tests d’indépendance comme vu dans la vidéo du preprocessing ?
    En effet, admettons deux variables X1 = [1, 2, 3] et X2 = [1000, 2000, 3000].
    La variance de X1 sera de 0.666 contre 666,666 pour X2. Cela pourrait-il donc toujours avoir des répercussions sur les tests de dépendance ou bien cela dépend-il des cas ?
    Un grand merci pour cette série de vidéos.

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      En effet si l'on effectue un test de student (t-test) ou bien ANOVA, alors il est nécessaire d'avoir des variances égales ou similaire, donc de normaliser les données. Sinon, pour un test d'indépendance chi2, ca n'est pas applicable (car on compare des fréquences entre catégories)

  • @soelreza1430
    @soelreza1430 2 ปีที่แล้ว

    Quel prestance monsieur !
    Vos vidéos sont mieux expliquées que tous mes profs réunies 😂
    Je voulais vous posé une question par rapport à ces variables .
    Si j’ai 6 variables X qui sont dans l’ordre précis pour avoir Mon target Y et qui sont aussi dépendants dois je rester sur une régression linéaire simple pu basculer sur la régression linéaire multiple?

    • @MachineLearnia
      @MachineLearnia  2 ปีที่แล้ว

      Bonjour, c'est alors une régression linéaire multiple, mais c'est la meme chose qu'une régression linéaire "simple".

    • @soelreza1430
      @soelreza1430 2 ปีที่แล้ว

      @@MachineLearnia très bien merci beaucoup pour vos vidéos et de votre réponse

  • @noreddinektn9414
    @noreddinektn9414 ปีที่แล้ว

    Bonjour , j'ai une question a vous poser , si on veut tester notre model avec un échantillon externe (ne fait partie ni du train ni du test ) comment appliquer feature selection pour cet echantillon? merci

  • @lyndahadjemi8606
    @lyndahadjemi8606 2 ปีที่แล้ว

    Bonjour Guillaume,
    Je vous remercie pour ce trésor,
    Ça me permet de comprendre beaucoup mieux,.
    Je viens de découvrir votre chaîne TH-cam, vraiment magnifique, j'ai adoré vos explications, trop bien ,super merci beaucoup.
    Je vous demande si c'est possible de faire des exemple de data set comme celui de covid19, pour prendre la main surtout les arbres décisionnel, et SMOTE.
    Je vous remercie par avance

    • @MachineLearnia
      @MachineLearnia  2 ปีที่แล้ว

      Merci et bienvenue dans la communauté. J'ai sorti un tutoriel SMOTE sur ma page Tipeee

    • @lyndahadjemi8606
      @lyndahadjemi8606 2 ปีที่แล้ว

      @@MachineLearnia Merci beaucoup ,je vais regarder

  • @djeiladiakite6161
    @djeiladiakite6161 4 ปีที่แล้ว +1

    Bonsoir Monsieur Guillaume ,je voudrais savoir si possible de m'énvoyé le lien des vidéos a partir de 24 jusqu'à 30 car j'ai pas retrouver ces différentes Vidéos Merci Cordialement.

  • @darkiche3689
    @darkiche3689 3 ปีที่แล้ว

    Super vidéo ! Je me pose une question quant au RFE, lorsque vous abordez les scores à chaque itération, vous dites que "l'algo" s’arrête car il constate une décroissance du score, mais cette technique dépend alors de l'ordre dans lequel sont donnée les features ? Car en s'arrêtant, il n'essaye pas d'enlever les features suivantes qui pourrait être inutiles ? Ou alors je passe à coté de qql chose ;)

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      Oui c'est correct, c'est une des limitations de l'algorithme, je n'ai pas dit qu'il était parfait ^^
      Maintenant peut-etre qu'il va évoluer (et son implémentation dans sklearn) pour s'améliorer, mais c'est un peu comme les arbres de décision : quand on les construits avec la méthode id3, on n'obtient jamais le meilleur modele (c'est un probleme NP).

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      Alors je viens de consulter la documentation est on dirait qu'ils ont en effet modifié le modele RFE : On ne trouve plus de min_features_to_select, mais dorénavant n_features_to_select. Donc la procédure est répétée jusqu'a atteindre le but que l'on a fixé.

  • @pierrenapoletano3889
    @pierrenapoletano3889 ปีที่แล้ว

    Vidéos un peu rapide mais de grande qualité

  • @karimmajdi7012
    @karimmajdi7012 4 ปีที่แล้ว

    D'abord je vous remercie pour ces cours très bien expliquer. quelle methode choisir la methode de feature selection ou le PCA? est ce que ta envisager de faire des videos sur les algo arbre de décision, random forest, lasso, ...

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      je vais faire toute ces vidéos bientot, et elles seront géniales ! :)
      Je conseille PCA uniquement pour réduire le temps de travail de la machine si elle travaille sur des milliers de variables et que ce sont des données non-structurée (par exemple des images et leur différents pixels)
      Sinon, pour les problemes aux données structurées (type tableau excel) avec en général un nombre petit de variables (

  • @tesseract3942
    @tesseract3942 4 ปีที่แล้ว +1

    c'est pour quand les nouvelles vidéos ? en ces temps difficiles ....

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +2

      J'y travaille dessus chaque soir (c'est pour bientôt !)

  • @jipy3220
    @jipy3220 3 ปีที่แล้ว

    Bonjour Guillaume! Merci pour tes vidéos, j'ai une questions: faut il optimiser les paramètres du modèle avant la sélection des variables ou après? Merci

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว +1

      les 2 approches sont possibles, ca dépend de votre méthode de travail. Optimiser les hyper-params sur tous les modeles possibles peut prendre beaucoup de temps (c'est le soucis) Mais ca reste le mieux.

    • @jipy3220
      @jipy3220 3 ปีที่แล้ว

      @@MachineLearnia merci!!

  • @imenfdh4456
    @imenfdh4456 2 ปีที่แล้ว

    Merci Beaucoup pour l'explication ✅☑
    Question : si x contient des valeurs négatives avec SelectKBest ça produit un erreur (Input X must be non-negative). Comment je vais resoudre celle ci en gardant les valeurs négatives comme features.

    • @MachineLearnia
      @MachineLearnia  2 ปีที่แล้ว

      Il faut utiliser une autre technique dans SelectKbest, ca dépend de votre probleme.

  • @henridu31
    @henridu31 4 ปีที่แล้ว

    Salut Guillaume, super vidéo encore une fois ! j'ai toutefois une question, lors de la feature selection, pourquoi on ne dois pas spliter le dataset en train, test ?

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว

      Bonjour. Si si on doit séparer le dataset avant de faire de la sélection de variable. (mais ici je ne le fait pas pour en venir aux faits, et que le tuto avance vite)

  • @korosife
    @korosife 4 ปีที่แล้ว +1

    Top, mais je comprend pas elle étais upload hier ? Sa change rien super boulots👍🏿👌🏿
    Question con mais quand, est il possible de rentrer des teste unitaire dans un programme de ml ?

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +2

      Merci a toi ! La vidéo de hier a eu un petit soucis de qualité (un texte important ne s'affichait pas) je l'ai donc corrigée et remise en ligne !
      Je ne suis pas sur de totalement comprendre ta question, peux-tu la reformuler stp ?

    • @korosife
      @korosife 4 ปีที่แล้ว +1

      Dac je comprend mieux, dommage je peut pas comparer a celle d'hier 😂 bref en tout cas merci pour tes cours, grâce à eux je suis entrain de monter mon entreprise, donc si je flippe et que je dort pas c'est ta faute 😂 merci mille fois🙏🏿
      Ma question est, quand je code un projet je met toujours des teste unitaire pour savoir si le code est pas cassé, ou qu'il a bien migré etc... ( c'est peut être très con mais c'est comme sa que j'ai appris et j'aime bien, " 'c'est pratique")
      Est il possible de faire la même chose dans un code de ml ? Je vois pas comment aborder le problème pour être sur que rien à casser...
      Merci encore

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +2

      Aah oui si je vois tres bien de quoi tu parles. Oui bien sur, je fais tout le temps ca dans mes programmes, il faut mettre en place des tests pour valider ses fonctions, je ferai peut-etre une vidéo a ce sujet a l'avenir, mais c'est plus dans le cadre de la programmation classique que du ML

    • @korosife
      @korosife 4 ปีที่แล้ว +1

      @@MachineLearnia topissime😊 tant qu'il y a des vidéos moi sa me vas

  • @sylvainhansen7463
    @sylvainhansen7463 3 ปีที่แล้ว

    Bonjour Guillaume, merci encore pour ces vidéos. Sais-tu si c'est possible de faire une interval PLS pour la sélection de variable avec python? Merci

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      Il y a sklearn.cross_decomposition.PLSRegression

  • @makhboulame9654
    @makhboulame9654 3 ปีที่แล้ว

    Merci pour vos effort, je voulais savoir quelle étape doit être la première : Features Selection ou Split train-test ? et pourquoi ?

    • @MachineLearnia
      @MachineLearnia  3 ปีที่แล้ว

      toujours le train_test_split en premier lieu, pour ne pas séléctionner vos données en vous basant sur des informations du futur (aka les données de test)

  • @thallhos7461
    @thallhos7461 4 ปีที่แล้ว

    Salut Guillaume, merci pour cette vidéo comme d'hab au top,
    J'ai une question concernant l'apprentissage de ton modèle et l'optimisation des variables :
    - (ça serait super si tu pouvais nous faire plus tard une vidéo avec les meilleures méthodes mathématiques à appliquer dans tel ou tel cas par exemple Qi2 etc)
    - Concernant l'apprentissage des données, je me demande si la machine en te donnant la meilleure performance et en se débarrassant des variables qui ont le moins de corrélation, est-ce que dans certain cas on risque pas de s'éloigner de la réalité ?
    Je n'ai pas d'exemple en tête, mais s'il est facile de comprendre que la corrélation entre le prix d'un appartement et la peinture du hall d'entrée est très faible, j'imagine que dans certain cas ca doit être plus tricky que ca non ?
    Je sais pas si je suis très clair, en fait j'imagine qu'on doit toujours contrôler quelle variable est sélectionnée ou abandonnée par le modèle ?

    • @MachineLearnia
      @MachineLearnia  4 ปีที่แล้ว +1

      Salut et merci :)
      - Oui je compte faire des vidéos qui expliquent quels tests statistiques utiliser dans différentes situations
      - Bonne question ! La "réalité" n'est représentée que par des observations X->y. Le but du ML est d'approcher au mieux cette représentation (en faisant le moins d'erreurs possibles dans les prédictions versus y). Pour ca, on teste sur les données du testset (qui sont sensées représenter la réalité) je suis sur que tu es déja au courant. Le mieux est de tester différents modeles (avec différentes combinaisons de variables) pour retenir celui qui s'approche le plus de la "réalité", meme si cela implique d'éliminer certaines variables. Ce qui compte, ce sont les résultats, les faits.
      - La corrélation n'est en effet qu'un signe de tendance similaires, c'est un élément nécessaire, mais pas suffisant au développement d'un bon modele
      - Il n'est pas nécessaire de controler toutes les variables séléctionnée par le modele, d'autant plus qu'il est parfois tres difficile d'interpréter ces variables (dans le cas d'expansion polynomiales) Mais c'est sur que c'est un grand plus de comprendre quelle variables jouent un role important pour le modele (car ca nous permet d'améliorer sa performance, de discuter avec les spécialistes, et d'affiner notre stratégie)

    • @thallhos7461
      @thallhos7461 4 ปีที่แล้ว

      @@MachineLearnia Super, merci de tes explications !