TRAITER LES VALEURS ABERRANTES

แชร์
ฝัง
  • เผยแพร่เมื่อ 1 ธ.ค. 2024
  • IDENTIFIER ET TRAITER LES VALEURS ABERRANTES OU OUTLIERS [ preparation de donnees, diagramme de boite a moustaches ou boxplot, detection de valeurs aberrantes, détection des anomalies, suppression de valeurs aberrantes, nettoyage de données ], PARTIE II (DATA PRE-PROCESSING, NETTOYAGE DES DONNEES ), JE VOUS MONTRE POURQUOI, COMMENT ET QUANT IL FAUT TRAITER LES VALEURS ABERRANTES(OUTLIERS), C'EST A DIRE DETECTER, REMPLACER, SUPPRIMER OU RECUPERER LES VALEURS ABERRANTES DANS UN SOUS DATASET LES VALEURS ABERRANTES OU OUTLIERS. JE VOUS MONTRE TOUTES LES TECHNIQUES ET ASTUCES POUR TRAITER DE FACON CORRECTE LES VALEURS EXTREMES.
    #datapreparation #openclass4all #datacleaning
    REJOINDRE LA COMMUNAUTÉ: / @openclass4all
    MON PROFIL LINKEDIN: / ousman-hamit-hassani
    PLAYLISTS(FORMATIONS) A REGARDER ET COMMENTER ABSOLUMENT:
    1. ANALYSEEXPLORATION DE DONNEES
    • Visualisation de donnees
    2. DATA PRE-PROCESSING:
    • TRAITER LES VALEURS AB...
    3. MODELE DE MACHINE LEARNING:
    • REGRESSION LINEAIRE - ...
    4. VIDEOS TUTORIELLE(PRISE EN MAIN DE JUPYTER NOTE BOOK):
    • Maitriser les raccourc...

ความคิดเห็น • 95

  • @openclass4all
    @openclass4all  2 ปีที่แล้ว +2

    *REJOINDRE LA COMMUNAUTE OPENCLASS4ALL 👉**th-cam.com/channels/E-613S-bsuLukwHDhnRxIA.html*

  • @vosinh2180
    @vosinh2180 2 ปีที่แล้ว +9

    Vraiment une excellente vidéo pour traiter les valeurs aberrantes, j'ai pas trouvé meilleure que celle-ci.
    Merci beaucoup.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +7

      Je suis vraiment contient que ca vous aide, merci de votre commentaire

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +5

      J'ai egalement d'autres videos a cette URL th-cam.com/video/E3HbvAH9W0A/w-d-xo.html si vous etes interesses

  • @appartementschambres140
    @appartementschambres140 2 ปีที่แล้ว +4

    Merci @Ousman, cette video m'a permis de resoudre plusieurs de mes problemes.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      Ravi d'apprendre que ca vous a aide, merci de la partager avec tes amis 👍

  • @elpacifico7782
    @elpacifico7782 2 ปีที่แล้ว +4

    Merci, j'ai pu résoudre mon problème grace à votre video

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +3

      Je suis vraiment ravi que ca vous a aide, merci beaucoup 👍

  • @khadimsene
    @khadimsene 2 ปีที่แล้ว +5

    Merci pour cette belle vidéo le grand professeur. Ça va beaucoup nous aider sur les problèmes que nous rencontrons chaque jour dans le prétraitement de nos donnés. Merci 🙏.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +5

      Merci pour votre commentaire, c'est extrement encourageant 👍

  • @katibakhaber3493
    @katibakhaber3493 ปีที่แล้ว +1

    Merci beaucoup beaucoup pour l'explication.

  • @octopusconseil8571
    @octopusconseil8571 2 ปีที่แล้ว +1

    Merci beaucoup ! Pour les vidéos et les notebook sur la gestion des outliers. C'est hyper clair et très apprécié :)

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      Merci pour votre appréciation, vos commentaires m'aident beaucoup a améliorer le contenu de prochaines vidéos.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      D'autres vidéos dans le mème ordre d’idée sont également disponible a cette 👉 URL : th-cam.com/video/nJ0olHCZgZI/w-d-xo.html
      Si vous trouvez que c'est intéressant, merci de les partager avec vos amis qui seraient intéressés, ça aide énormément la chaîne à s’agrandir.

  • @daliladerdar7755
    @daliladerdar7755 2 ปีที่แล้ว +1

    Super intéressant et très claire ! Merci beaucoup !

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci @Dalila Derdar pour votre appreciation

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Si vous êtes intéressés voici toute la playlist dédiée au DATA PRE-PROCESSING ICI 👉 th-cam.com/video/SJNw_kxcnpE/w-d-xo.html

  • @openclass4all
    @openclass4all  2 ปีที่แล้ว +3

    👉 github.com/ousmanhamit

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    Bravo pour la pédagogie : ce cours est claire et complet. Merci.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci beaucoup pour votre appréciation, ça nous encourage à proposer toujours plus de contenu.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      *SI CA VOUS INTÉRESSE J'AI UNE PLAYLIST ENTIEREMENT DÉDIÉE AU DATA PREPROCESSING* 👉👉 th-cam.com/video/SJNw_kxcnpE/w-d-xo.html

    • @brigitterabarijaona3872
      @brigitterabarijaona3872 2 ปีที่แล้ว +1

      Bjr, J'ai besoin du drop mais "df.drop(df[df[feature]>limit+Q3].index, inplace = True)" ne fonctionne pas, car df[feature] n'existe pas. Merci de me répondre. Cdlt.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      @@brigitterabarijaona3872 Bonjour

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      @@brigitterabarijaona3872 Vous pouvez telecharger le notebook a cette URL => github.com/OusmanHamit/JUPYTER-NOTEBOOK/blob/master/OUTLIERS(PARTIE%20II).ipynb

  • @HamzaNour
    @HamzaNour 2 ปีที่แล้ว +1

    Vidéo encore une fois instructive. Merci

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci a toi de l'avoir regarde 👍

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      Si ca vous interesse, j'ai une video encore plus interessante a cette URL 👉 th-cam.com/video/t7ZoE9XrF1M/w-d-xo.html

  • @serigneabdoulazizdrame1359
    @serigneabdoulazizdrame1359 2 ปีที่แล้ว +2

    Bonne continuation frère

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +3

      Merci Serigne, on va aller plus loin insha ALLAH.

  • @yannehouman5776
    @yannehouman5776 2 ปีที่แล้ว +1

    Merci beaucoup 🙏

  • @appartementschambres140
    @appartementschambres140 2 ปีที่แล้ว +2

    Plus riche que les formations payantes que j'ai achetes.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      Merci, C'EST TOUT CE QUE JE VOULAIS ENTENDRE 😄

  • @olyneniyomwungere5991
    @olyneniyomwungere5991 2 ปีที่แล้ว +1

    Très intéressantes

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +3

      Merci beaucou pour votre commentaire 👍

  • @brabeatz197
    @brabeatz197 2 ปีที่แล้ว +2

    Merci beaucoup pour vos cours. De la part d'un étudiant de MSDA Université Iba Der THIAM. Sinon on aimerait également des tutos sur le Data Engineering genre Spark, Hadoop. Merci d'avance 🤲

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +1

      Merci THIAM pour votre commentaire.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว +2

      J'ai pris note de votre demande, car les deux formations(Analyse exploratoire des données et Data Pre-processing déjà disponibles sur cette chaîne ne sont pas encore achevées), même si ça va prendre un peu du temps, il y aura du contenu sur SPARK.

    • @brabeatz197
      @brabeatz197 2 ปีที่แล้ว +1

      Super on sera la inchallah pour les suivre et merci beaucoup pour tout.

  • @yuni9896
    @yuni9896 หลายเดือนก่อน +1

    Merci bcp

    • @openclass4all
      @openclass4all  หลายเดือนก่อน

      Merci à toi d'avoir regardé la vidéo

    • @openclass4all
      @openclass4all  หลายเดือนก่อน +1

      Voici la premiere partie de cette video 👉 th-cam.com/video/h-PzukPhUB0/w-d-xo.html ✅

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    j'ai reçu votre message, c'est la cellule 5 , à 17:37. Merci à vous.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      OK, JE REGARDE ET JE VOUS REVIENS TOUT DE SUITE

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      VOUS AVEZ SUREMENT MAL NOTE QUELQUE CHOSE DANS LE CODE SUIVANT ==>
      def drop_outliers(df, feature):
      Q1 = np.percentile(df[feature], 25)
      Q3 = np.percentile(df[feature], 75)
      limit = 1.5*(Q3 - Q1)
      df.drop(df[df[feature] > limit + Q3].index, inplace = True)
      df.drop(df[df[feature] < Q1 - limit].index, inplace = True)
      VERIFIER QUE TOUT EST BIEN ECRIT COMME CECI 👆
      N'OUBLIEZ PAS AUSSI LES INDENTATIONS

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      POUR LA BOUCLE FOR 👇, N'OUBLIEZ PAS QUE LE df NE PAS DE VALEURS ABERRANTES(IL A ETE COMPLETEMENT NETTOYE DANS LES QUESTIONS PRECEDENTES), UTILISER *cp* 👈👈👈
      for feature in features:
      drop_outliers(cp, feature)

  • @hichamkalkha3694
    @hichamkalkha3694 2 ปีที่แล้ว +1

    the best :)

  • @PiracyChecker
    @PiracyChecker ปีที่แล้ว +1

    BONJOUR j'aime beaucoup le contenu de tes tutoriels. je travail sur un projet de prediction des matchs de football et je dispose d'un api qui me fourni toutes les statistique complet equivalent au statistiques des bookmakers. peux tu faire des tutoriel sur orange data mining qui est aussi basé sur python avec plusieurs algorythme.

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Bonjour, merci beaucoup pour le commentaire, l'outil orange data mining je sais de quoi il s'agit mais je ne l'ai jamais utilise dans un projet, c'est assez difficile pour moi de vous proposer des tutos, car cela necessite un temps considerable

  • @mohamedettadrarty7404
    @mohamedettadrarty7404 ปีที่แล้ว +1

    merci

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Merci a vous de l'avoir suivie

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      *SI CA VOUS INTÉRESSE J'AI UNE PLAYLIST ENTIEREMENT DÉDIÉE AU DATA PREPROCESSING* 👉 th-cam.com/video/SJNw_kxcnpE/w-d-xo.html

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    Ok!!!! ça marche ! vous m'avez aidée. Je suis en formation, c'est votre cours qui m'explique TOUT ! J'ai compris votre cours sur régression linéaire, on attaque l'ACP, multivariée, est-ce que vous traiter tous cela ? Comment payer vos cours par mois, ma formation va durer encore 6 mois, au moins. j'aimerais payer par western union, si possible, en début du mois. Merci de me répondre. Cdlt

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci, ravi que le problème soit réglé, je n'ai pas encore de formation payante disponible immédiatement(ça sera l’année prochaine 2023), je ferai également une formation gratuite sur l'ACP, des que j'ai un peu du temps disponible.
      Est-ce vous avez regarde toute les playlist de ma chaine 👉 th-cam.com/users/openclass4allplaylists

    • @brigitterabarijaona3872
      @brigitterabarijaona3872 2 ปีที่แล้ว +1

      @@openclass4all Bonjour, non, je n'ai appris vu que celui-là: je vais m'y mettre dès demain. Merci de m'informer pour la suite. Bien cordialement à vous.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      @@brigitterabarijaona3872 Il suffit d'activer la cloche de notification pour être automatiquement informée des je publie du nouveau contenu.

  • @alima5003
    @alima5003 ปีที่แล้ว +1

    Bonjour prof merci pour votre vidéo j'ai une question après avoir créer un subdataset pour les valeurs aberrantes est ce qu'on va après les supprimer de notre base data initiale ou bien?

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Non, en fait il y a 3 possibilites:
      1. Vous les supprimez comme je vous ai montre dans la video.
      2. Vous les recuperez dans un subdataset pour les analyser a part les autres donnees
      3. Vous les remplacer

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      J'ai traite les 3 cas, parce que ca depend de ce que vous voulez faire

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Merci pour la question et dites-moi si vous avez compris ou pas ?

    • @alima5003
      @alima5003 ปีที่แล้ว

      ​@@openclass4all Moi pour mon travail je les récupérez dans un subdataset mais le problème en ai que quand j'exécute la distribution des variables qui se trouve dans ma base data j'ai toujours les valeurs aberrantes je sais pas ou se trouve le problème.

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Une fois recuperee, vous les SUPPRIMER DE VOTRE DATASET INITIAL, CAR VOUS N'AVEZ PLUS BESOIN,

  • @Mohamedtababi-x6j
    @Mohamedtababi-x6j 5 หลายเดือนก่อน +1

    Bonsoir Mr
    J'ai travaillé sur une dataset sujet du changement climatique en Afrique mais quelque codes ne fonctionnent pas comme vous le signalé
    cordialement

    • @openclass4all
      @openclass4all  5 หลายเดือนก่อน

      Merci de me décrire en détail ton problème à cette URL 👉 ousmanhamit.com/contact/

    • @openclass4all
      @openclass4all  5 หลายเดือนก่อน

      Je vais être disponible demain soir

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    Bonjour, veuillez m'excuser de vous rappeler que je souhaite intégrer votre groupe de discussion si c'est possible: comment faire ? Merci d'avance. cdlt

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci pour l’intérêt que portez au contenu que nous proposons, vous pouvez me contactez via le formulaire de contact à cette URL 👉 ousmanhamithassani.herokuapp.com/ afin que je puisse vous recontacter des que tout le processus d'organisation qui tourne autour de nos formations est achevé.

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว

    features = ['energy_100g','proteins_100g', 'salt_100g','sodium_100g','sugars_100g','fat_100g','carbohydrates_100g','saturated-fat_100g','nutrition-score-fr_100g']

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      SI VOUS AVEZ UN GITHUB, DEPOSEZ VOTRE NOTEBOOK LABAS, DE CETTE FACON, JE PREND VOTRE NOTEBOOK, JE LE CORRIGE PUIS VOUS L'ENVOYER.

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    la boucle parcourt bien les features, mais c'est "df = df.drop(df[df.feature >limit + Q3].index, inplace = True)" , le df.feature ne comprend pas les éléments de features.

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Vous m'avez pas encore précisé quelle fonction, ni a quelle minute de la video mais feature(sans s) contient LA COLONNE COURANTE DANS LA BOUCLE FOR pour parcourir l'objet FEATURES(avec s a la fin)

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      *VOUS NE DEVEZ PAS NOTER df.feature MAIS IL FAUT ECRIRE df[feature] 👈 SANS LES APOSTROPHES A L'INTERIEUR DES CROCHETS*

  • @mostafajerari7560
    @mostafajerari7560 2 ปีที่แล้ว +1

    Merci pour l'effort.
    J'ai un problème que je vous ai expliqué en privé sur Facebook messenger.
    merci infiniment

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      Merci, je vais lire votre message

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว

    Merci, le problème: 1°) " df = df.drop(df[df.feature >limit + Q3].index, inplace = True)" , 2°) "AttributeError: 'DataFrame' object has no attribute 'feature', "

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      A quelle minute(Preciser) exactement de la video ?

  • @mauyvesdonaldchancelnkondo2779
    @mauyvesdonaldchancelnkondo2779 ปีที่แล้ว +1

    def impute_outliers(outliers_100g, features):
    q1 = np.percentile(outliers_100g[feature], 25)
    q3 = np.percentile(outliers_100g[feature], 75)
    iqr = q3 - q1
    lower_bound= q1 - 1.5*iqr
    upper_bound= q3 - 1.5*iqr
    outliers_100g.loc[outliers_100g[feature] < lower_bound,feature] = lower_bound
    outliers_100g.loc[outliers_100g[feature] < upper_bound,feature] = upper_bound
    for feature in features:
    impute_outliers(data, feature)
    ce code envoie une erreur

    • @mauyvesdonaldchancelnkondo2779
      @mauyvesdonaldchancelnkondo2779 ปีที่แล้ว

      TypeError: '

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Que contient ta variable features ?

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Le code est parfaitement correct, regarde seulement la liste de tes variables *features* ou bien ton df que tu as nomme *data*

    • @openclass4all
      @openclass4all  ปีที่แล้ว

      Si malgre tout vous avez une erreur, coppier/coller l'erreur en commentaitre, je vais la voir

    • @mauyvesdonaldchancelnkondo2779
      @mauyvesdonaldchancelnkondo2779 ปีที่แล้ว

      @@openclass4all features= ['code','product_name','quantity','categories','energy-kj_100g','energy-kcal_100g']

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 2 ปีที่แล้ว +1

    le drop marche bien si j'exécute pour une variable précise, sans paramètre feature ni features. Je vous rappelle: je n'ai pas réussi : "from jupyterthemes.stylefx import set_nb_theme
    set_nb_theme('grade3') ". C'est peut-être la raison pour laquelle "df.feature" ne fonctionne pas ?

    • @openclass4all
      @openclass4all  2 ปีที่แล้ว

      VOUS N'AVEZ PAS BESOIN DE CES from jupyterthemes.stylefx import set_nb_theme
      set_nb_theme('grade3') CA C'EST JUSTE POUR CHANGER LE THEME, VOUS LES SUPPRIMEZ OU ALORS VOUS INSTALLEZ
      !pip install jupyterthemes