Maîtriser les Statistiques en Python : Tendance Centrale et Dispersion Expliquées

แชร์
ฝัง
  • เผยแพร่เมื่อ 12 ก.ย. 2024

ความคิดเห็น • 30

  • @sirakhecisse5707
    @sirakhecisse5707 4 หลายเดือนก่อน +1

    On est avec vous natasha on like on partage

  • @kabegaye829
    @kabegaye829 ปีที่แล้ว +4

    Votre dévouement et votre passion pour l'apprentissage ont été une source d'inspiration pour moi et j'ai été époustouflé par votre capacité à produire du contenu de qualité avec une telle régularité.
    Je vous remercie du fond du cœur pour tout le temps, l'énergie et l'effort que vous avez consacrés à cette initiative. Vous avez réellement apporté une contribution précieuse à la communauté et je suis reconnaissant de pouvoir en bénéficier.
    Merci encore pour tout ce que vous faites.
    Depuis le SENEGAL

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Merci beaucoup pour ce magnifique message. C'est grâce à cela que je trouve la motivation pour continuer et produire des vidéos. Merci pour votre soutien.

  • @LeCoinStat
    @LeCoinStat  ปีที่แล้ว +5

    Que pensez-vous de la proposition en fin de vidéo?

  • @brunofambo7997
    @brunofambo7997 6 หลายเดือนก่อน

    Je suis vraiment passionné sur l'apprentissage en Data Science et merci beaucoup pour les vidéos

    • @LeCoinStat
      @LeCoinStat  6 หลายเดือนก่อน

      Avec plaisir et bon courage dans l'apprentissage

  • @corine.k5726
    @corine.k5726 ปีที่แล้ว +1

    Waouh excellente idée merci

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Je vous donne plus de détails très bientôt

  • @user-tc4oh9jm6y
    @user-tc4oh9jm6y ปีที่แล้ว +1

    Jour 9 :
    La tendance centrale et la dispersion sont deux concepts clés en statistiques. La tendance centrale vise à identifier la valeur centrale ou la valeur la plus représentative d'un ensemble de données, tandis que la dispersion mesure la variabilité ou la répartition des données autour de cette valeur centrale.
    Les mesures de tendance centrale les plus courantes sont la moyenne, la médiane et le mode. La moyenne est la somme de tous les éléments d'un ensemble de données, divisée par le nombre total de données. Elle est sensible aux valeurs extrêmes. La médiane est la valeur centrale dans une distribution ordonnée de données. Elle est moins sensible aux valeurs extrêmes que la moyenne. Le mode est la valeur la plus fréquente dans un ensemble de données.
    Les mesures de dispersion les plus courantes sont la variance et l'écart-type. La variance mesure la dispersion des données autour de la moyenne. L'écart-type est la racine carrée de la variance et mesure la dispersion des données en unité de mesure d'origine.
    Il existe également d'autres mesures de tendance centrale et de dispersion, telles que le coefficient de variation, le quartile et l'étendue, qui sont utilisées dans différentes situations et pour différents types de données.
    Il existe plusieurs types de moyennes :
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    • La moyenne arithmétique : c'est la moyenne la plus courante et la plus simple à calculer. Elle est utilisée pour obtenir une mesure de la tendance centrale d'un ensemble de données. Elle est souvent utilisée pour calculer des indicateurs tels que la moyenne de notes d'un étudiant, la moyenne de revenus pour une population donnée, etc.
    10 indicateurs de dispersion couramment utilisés en statistiques, accompagnés de leurs cas d'utilisation typiques :
    1. L'étendue: Cet indicateur mesure la distance entre le plus petit et le plus grand nombre dans un ensemble de données. Il est facile à calculer et à comprendre, mais il est sensible aux valeurs aberrantes.
    2. La variance : Cet indicateur mesure la mesure de la dispersion des données par rapport à leur moyenne. Elle est sensible aux valeurs aberrantes mais populaire pour la visualisation de données.
    3. L'écart-type: Cet indicateur est la racine carrée positive de la variance. Il est exprimé dans la même unité de mesure que les données brutes et permet de quantifier la variabilité d'un échantillon autour de la moyenne.
    4. L'écart interquartile : Cet indicateur mesure l'étendue de la distribution autour de la médiane. Il est moins sensible aux valeurs aberrantes que l'étendue et donne une idée de la répartition de la moitié centrale des données.
    5. Le coefficient de variation : Cet indicateur mesure la variation relative des données par rapport à leur moyenne arithmétique. Il est souvent utilisé pour comparer la dispersion de deux ensembles de données.
    6. La moyenne absolue des écarts : Cet indicateur mesure la moyenne arithmétique des écarts entre chaque point de données et la moyenne arithmétique de l'ensemble de données. Il est souvent utilisé dans les analyses de série chronologique.
    7. Le boxplot: Ce graphique présente les quartiles, l'écart interquartile (IQR) et les valeurs aberrantes dans un ensemble de données. Il offre une vue d'ensemble rapide et visuelle de la dispersion des données.
    8. La gamme interquartile : Cet indicateur mesure la distance entre le premier et le troisième quartile, ce qui donne une mesure robuste de la dispersion des données.
    9. La médiane absolue de la déviation : Cet indicateur mesure la médiane des distances absolues entre chaque point de données et la médiane de l'ensemble de données. Il est souvent utilisé pour les données qui ont une distribution asymétrique.
    10. Le pourcentage interquartile est un indicateur de dispersion qui mesure la proportion des données situées entre le premier et le troisième quartile par rapport à l'ensemble des données
    EXEMPLE D’UTILISATION
    voici des exemples simples d'utilisation de chaque indicateur de dispersion :
    1. L'étendue : Si vous voulez savoir combien de temps il vous faut pour vous rendre au travail chaque jour, vous pouvez prendre note du temps de trajet le plus court et le plus long chaque jour et utiliser l'étendue pour calculer la distance entre eux.
    2. La variance : Si vous êtes en train de jouer à une série de jeux vidéo avec des personnes de différents niveaux de compétence, vous pouvez utiliser la variance pour voir à quel point les scores de chacun varient par rapport à la moyenne.
    3. L'écart-type : Si vous cueillez des fruits dans un verger et que vous voulez savoir si la qualité des fruits varie beaucoup sur différents arbres, vous pouvez utiliser l'écart-type pour calculer la dispersion des scores de chaque arbre.
    4. L'écart interquartile : Si vous surveillez le poids des bébés dans une maternité, vous pouvez utiliser l'écart interquartile pour avoir une idée de la répartition du poids du bébé autour de la médiane.
    5. Le coefficient de variation : Si vous voulez comparer les poids entre deux groupes de fruits différents, vous pouvez utiliser le coefficient de variation pour voir à quel point les poids de chaque groupe varient par rapport à leur moyenne respective.
    6. La moyenne absolue des écarts : Si vous voulez savoir si vos prévisions financières sont précises, vous pouvez utiliser la moyenne absolue des écarts pour calculer l'écart entre chaque prévision et la réalisation correspondante.
    7. Le boxplot : Si vous voulez visualiser rapidement la distribution des scores dans une classe, vous pouvez utiliser un boxplot pour voir les quartiles, l'écart interquartile et les valeurs aberrantes.
    8. La gamme interquartile : Si vous voulez mesurer la variabilité des températures dans une région, vous pouvez utiliser la gamme interquartile pour calculer la distance entre les températures du premier et du troisième quartile.
    9. La médiane absolue de la déviation : Supposons que vous ayez une classe de 20 élèves et que vous vouliez voir comment les notes se répartissent. La médiane absolue de la déviation vous permettrait de voir à quelle distance les notes se trouvent de la note médiane (c'est-à-dire la note qui se situe au milieu).
    Par exemple, si la note médiane est 80, et qu'un élève a une note de 70, la distance absolue entre la note de cet élève et la note médiane est de 10. Si un autre élève a une note de 90, la distance absolue est également de 10. Si vous calculez la médiane de toutes les distances absolues entre chaque note et la note médiane, cela vous donnera un indice de la dispersion des notes.
    10. Le pourcentage interquartile : Supposons que vous ayez des statistiques sur le nombre de pages lues par semaine par un groupe de 50 étudiants pendant un semestre. Vous voulez savoir combien d'étudiants lisent régulièrement un certain nombre de pages chaque semaine pour évaluer l'efficacité de l'enseignement.
    En utilisant le pourcentage interquartile, vous pourriez découvrir qu'il y a 25 étudiants (soit 50% de l'échantillon) qui lisent entre 100 et 300 pages par semaine, tandis que les autres étudiants ont des lectures très différentes. Cela peut vous aider à mieux comprendre la répartition des lectures et à mieux orienter votre enseignement

  • @dyle-m6l
    @dyle-m6l ปีที่แล้ว

    Sacrée Natacha !

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Le challenge continue😇

  • @warysmadia9074
    @warysmadia9074 ปีที่แล้ว +1

    Excellente idée Natacha !

  • @user-tc4oh9jm6y
    @user-tc4oh9jm6y ปีที่แล้ว

    je suis d'accord pour les Lives

  • @astridchodaton410
    @astridchodaton410 ปีที่แล้ว +1

    Bonsoir Dame Natacha,
    Je suis très intéressée par votre proposition. J’avais à cœur de vous le demander mais je me disais que vous en parlerez très certainement dans les prochaines vidéos.

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Ok génial je vous donne plus de détails très bientôt

  • @LeCoinStat
    @LeCoinStat  ปีที่แล้ว

    Lien vers la présentation et le notebook: github.com/LeCoinStat/100JoursDeML/tree/main/02_Statistiques_Pour_Le_Machine_Learning

  • @sirikisoumahoro6828
    @sirikisoumahoro6828 ปีที่แล้ว

    Bonne idée...

  • @franckbatty3668
    @franckbatty3668 ปีที่แล้ว

    Excellente idée

  • @dorothytatiana
    @dorothytatiana ปีที่แล้ว

    Bonne idée 👍

  • @adonislabnobime7213
    @adonislabnobime7213 ปีที่แล้ว

    Ça m'intéresse également

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Génial, je vous plus de détails bientôt

  • @cheikhnaaliou384
    @cheikhnaaliou384 ปีที่แล้ว

    Bonjour
    Je suis intéressé
    Merci

  • @user-tc4oh9jm6y
    @user-tc4oh9jm6y ปีที่แล้ว

    un seul mot waouh comment faire pour discuter avec toi en privée stp

    • @LeCoinStat
      @LeCoinStat  ปีที่แล้ว

      Via discord ou linkedin