Ep 5 : Les indicateurs de dispersion

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 ธ.ค. 2024

ความคิดเห็น • 85

  • @daubert4892
    @daubert4892 6 ปีที่แล้ว +16

    Je trouve que les vulgarisateurs scientifiques sur TH-cam manquent parfois de recul et de nuances sur les notions qu'ils abordent, mais là je suis très satisfait de la petite discussion à la fin de la vidéo qui apportent tout plein de précisions et de perspectives pour creuser le sujet... Cette chaine est vraiment super !

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +4

      Merci beaucoup ! :-)
      J'essaie effectivement de montrer avec mes "petites notes pour finir" qu'il y a matière à aller plus loin et a percevoir qu'il y a parfois des limites.

  • @terpomotestudo
    @terpomotestudo 6 ปีที่แล้ว +2

    Avec tes vidéos, tu as le mérite de m'avoir fait enfin comprendre à fond des notions de statistiques élémentaires. Tu peux être extrêmement fier. Tes vidéos devraient êtres reconnues d'utilité publique.

  • @Denis-ce7fp
    @Denis-ce7fp 6 ปีที่แล้ว +23

    ils ont pris combien de chipolatas du coup?

  • @danspeed93
    @danspeed93 6 ปีที่แล้ว +2

    Bonjour super vidéo. Il ne manque plus qu'à expliquer comment savoir si une distribution est normale. Merci !

  • @felixhinckel4767
    @felixhinckel4767 6 ปีที่แล้ว +18

    5:40 Σi ( Xi - Xmoy ) / n = Σi ( Xi ) / n - Σi ( Xmoy ) / n = Xmoy - Xmoy = 0. La moyenne des écarts (ni au carré ni absolus) à la moyenne sera toujours 0, même si la distribution est asymetrique.

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +3

      Argn ... Exact :-/
      Pourquoi ai-je dis ça ...
      J'ajoute une note dans la description de la vidéo pour indiquer l'erreur !
      Merci beaucoup !

    • @xavieraudier4968
      @xavieraudier4968 6 ปีที่แล้ว +1

      Merci, ça m'évite d'avoir à l'écrire :)

    • @guillaumelimousin7988
      @guillaumelimousin7988 6 ปีที่แล้ว

      Ah oui j'avais vu ce petit truc aussi. Confusion entre la variance (moment d'ordre 2) ou sa racine carrée (l'écart-type) et le moment d'ordre 3 (ou sa racine cubique, si on veut être homogène), et qui, lui, est une mesure de "l'asymétrie moyenne". Très utile, ce moment d'ordre 3, et d'une manière plus générale : l'étude des asymétries. Ca pourrait faire une vidéo entière. Exemple : la taille des hommes en France suit une loi quasi parfaitement normale. En pratique oui. Et pourtant, j'affirme ici qu'en théorie c'est impossible : il y a forcément asymétrie, comme dans toutes les distributions de grandeurs concrètes. Et la distribution normale n'est qu'une approximation (souvent lorsque la moyenne est grande par rapport à l'écart-type). Saurez-vous trouver pourquoi ?... Hi hi hi.

  • @MrShadow1395
    @MrShadow1395 7 ปีที่แล้ว +1

    Merci beaucoup pour les explications, souvent la théorie seule est assez confuse et justement vos videos apportent des exemples concrets. Franchement ça aide énormément !

  • @justasystem1
    @justasystem1 6 ปีที่แล้ว +6

    Merci beaucoup pour cette vidéo ! Je ne travaille pas dans les statistiques mais j'avais besoin d'utiliser des indicateurs, et j'avais du mal à comprendre les différences entre le mal nommé écart-type et les autres indicateurs, et surtout je n'arrivais pas à les interpréter. Grâce à toi tout est clair ! :)

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      Et bien tant mieux alors ! Merci beaucoup ! ^^

  • @abelmadbouh3834
    @abelmadbouh3834 4 ปีที่แล้ว

    Jmen veux ! .... Ce n'est que depuis trop peu de temps que j'ai découvert ta chaîne ! Et il as fallu le c19 pour que je tombe dessus ! Tu fais un travail excellent et ta touche d'humour est juste parfaite ! Maintenant je suis condamné à devoir tout regarder !

    • @RisqueAlpha
      @RisqueAlpha  4 ปีที่แล้ว

      C'est gentil ! ^^
      Bon visionnage !

  • @unikben
    @unikben 7 ปีที่แล้ว +3

    T’es génial!! J’adore tes vidéos, J’ai hate au prochain épisode!
    Merci 1000fois de nous partager ton savoir, en plus tu fait ça avec talent!

    • @RisqueAlpha
      @RisqueAlpha  7 ปีที่แล้ว

      Merci 1000 fois aussi ^^

  • @RobertDupont007
    @RobertDupont007 6 ปีที่แล้ว +10

    Très bonne vidéo :)
    Pour l'histoire de l'étude sur circuit, avant même de vouloir savoir toute les données statistiques, il faudrait que l'on sache avec quel critères ils décident de la note des participants ( la vitesse, la réactivité, ect..) et même si ils ont choisi les meilleurs des critères, ces résultats ne sont pas utilisable pour dire qui à le moins d'accident en conditions réel ( respect du code de la route)
    L'étude de la fille qui compte les accidents sur la route est donc forcément à privilégié :)

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +3

      Absolument !
      D'une façon général répondre (même très correctement) à des questions inutiles ... ne sert a rien ! :-p

    • @Kupperdurden
      @Kupperdurden 5 ปีที่แล้ว

      Oui, mais cette étude ne prends pas en compte le kilométrage, les hommes conduisant plus que les femmes, et en prenant en compte cette donnée, ce sont les femmes qui ont le plus d'accidents. Forcément, si tu conduis 10 fois plus qu'un autre individus, le fait d'avoir plus d'accident ne prouve pas que tu conduises plus mal. Mais cette seconde étude, ne prends pas en compte d'autres facteurs, comme le fait que la majorité des accidents ont lieu sur des trajets cours et répété (maison-travail par exemple), et que ce sont majoritairement les hommes qui conduisent sur les trajets longs et, sur les trajets spécifiques (camionneurs, taxi, route pour les vacances etc). Pour répondre objectivement, il faudrait une étude qui prenne en compte tout ces facteurs de découpage.

  • @MeyoCarpeDiem
    @MeyoCarpeDiem 6 ปีที่แล้ว +1

    Ok, l'intro niveau humour c'est au top ! Franchement, joli montage ^^

  • @abdaroth
    @abdaroth 7 ปีที่แล้ว +13

    Merci à Hygiène Mentale, superbe chaîne ! Et puis qq rappels de maths ça fait pas de mal :) beau boulot

  • @Les2R
    @Les2R 7 ปีที่แล้ว

    Chaque épisode est meilleure que le précédent... pas trop sur le fond (qui a toujours été carré) mais sur la forme ! Bon rythme, juste ce qu'il faut d'humour. Bravo !

    • @RisqueAlpha
      @RisqueAlpha  7 ปีที่แล้ว

      Les2R Merci beaucoup ! 😊

  • @livaatdr3789
    @livaatdr3789 4 ปีที่แล้ว

    Merci pour cette explication terre a terre, si on ne le comprend pas avec cette explication, c'est qu'on ne le comprendra plus jamais ... -:)

  • @grandangleeco
    @grandangleeco 7 ปีที่แล้ว +2

    Super vidéo. Le sujet est assez froid par sa technique mais j'ai même réussi à montrer la vidéo à ma femme ;-)
    La seule chose c'est que l'on sent que tu veux faire la prochaine vidéo sur les problèmes d'échantillonnage mais si je peux me permettre, peut être que tu aurais pu scénariser un petit cliffhanger marrant autour du bbq aussi sympas que tes intros.
    En tout cas, j'accroche bien.

    • @RisqueAlpha
      @RisqueAlpha  7 ปีที่แล้ว

      Merci !
      Oui c'est vrai que si je sais que la vidéo à une suite je devrais pouvoir scénariser un petit truc. J'y penserais ! :-)

  • @weavelybazile4724
    @weavelybazile4724 6 ปีที่แล้ว +1

    merci pour la video. je pense que cette facon d'expliquer les notion est tres interessante. je ne m'ennui pas et je comprend plus vite

  • @Darklink88600
    @Darklink88600 6 ปีที่แล้ว +2

    J'adore vraiment tes vidéos!!!! De mieux en mieux en plus ;)

  • @cofbmaitres1177
    @cofbmaitres1177 4 ปีที่แล้ว +2

    Sinon, il y a aussi le coefficient de variation (ecart-type:moyenne), c'est intéressant aussi

  • @anouarlakhouadri5983
    @anouarlakhouadri5983 3 ปีที่แล้ว

    Nice explication pouvez vous faire des vidéos sur l'analyse des données multidimensionnelle

  • @simonpierre-histoiredislam2074
    @simonpierre-histoiredislam2074 3 ปีที่แล้ว

    9:40 attend: qu est ce que ca change la diiference minime entre ecart type et ecarr moyen ?

  • @eclatoune5341
    @eclatoune5341 6 ปีที่แล้ว

    Tu m'en voudras pas hein mais le "une étendu" ça m'a fait au cœur XD
    En plus, j'oublie tout le temps de dire que tes vidéos sont géniales parce que je sais que plein d'autres le diront pour moi.
    Je vraiment finir passer pour la chieuse de service ._.

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      T'inquiète ! Je me choque parfois moi même avec certaines horreurs orthographiques dont j'ai le secret !
      Merci beaucoup en tout cas ! Ça fait plaisir ^^

  • @AlexLP33
    @AlexLP33 4 ปีที่แล้ว

    Très bien mais si on me dit que l'écart-type d'une étude est de 2,5, que dois-je en déduire puisque visiblement on ne peut pas faire d'interprétation absolue de cette valeur ?

  • @d3siuol
    @d3siuol 6 ปีที่แล้ว +1

    Bravo pour ces explications. Pourrais-tu expliquer les calculs évoqués à 13:25 ?

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +1

      Merci !
      Alors personnellement pour cette vidéo je l'ai "calculé" de façon brutale il me semble. En simulant, sous R, un tirage aléatoire dans ces 2 distributions et en regardant sur plusieurs milliers d'itérations quel % étaient supérieurs ou inférieurs.
      Si le calcul analytique t'intéresse, je pense qui faut se plonger dans la littérature du "d de Cohen".
      Au passage j'ai trouvé ce site :
      rpsychologist.com/d3/cohend/
      Qui permet de visualiser cette "probabilité de supériorité" de façon élégante. (Dans mon exemple le d de Cohen valait 0.5)

    • @d3siuol
      @d3siuol 6 ปีที่แล้ว +1

      Parfait merci je vais regarder

  • @r2ondar
    @r2ondar 6 ปีที่แล้ว +4

    Lol mec je suis déjà mort de rire a 1m de vidéo xD
    Sinon, ça sera trois pour moi, avec du pain et de la moutarde, merci :p

  • @jayce8978
    @jayce8978 6 ปีที่แล้ว +3

    Du coup, bientôt une video sur les indicateurs d’asymétrie et ensuite une sur les indicateurs d’aplatissement :p ?

  • @quentinmangel2265
    @quentinmangel2265 6 ปีที่แล้ว +1

    Excellent taf, très complémentaire des chaines "Hygiène mentale" et "La Statistique expliquée à mon chat" !!!
    Merci, c'est un plaisir de te regarder et surtout, comme beaucoup d'autres chaine de vulgarisation de qualité : ton travail est d'utilité publique ;)
    (Il est ou le tippi pour t'aider à en faire + ? )

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      Merci beaucoup ! Ce sont deux chaines que j'aime beaucoup ! ^^
      C'est super gentil mais pas de Tipeee prévu pour l'instant :-)

  • @colonelklorik4102
    @colonelklorik4102 6 ปีที่แล้ว

    Paix et félicité
    Vidéo toujours intéressante qui soulève aussi le problème de la bonne interprétation des données : ce n'est pas parce que les hommes pilote(rai)ent mieux sur circuit qu'il sont (seraient) moins dangereux sur les routes. J'ai justement connu quelques comiques tellement sûrs de leurs capacités de pilotage qu'ils cumulaient les accidents, mais c'était toujours la faute de l'autre conducteur qui n'aurait jamais du passer par là. On a pas de conducteurs qui viennent en face ou de feu rouges sur circuits...
    Concernant la variance, utiliser le carré est très intéressant pour des valeurs non-entières, puisque les écarts inférieurs à 1 sont comprimés tandis que ceux supérieurs à 1 sont de plus en plus dilatés.
    Bonne continuation

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      Exactement.
      Répondre, correctement, à de mauvaises questions fait rarement avancer les choses.

  • @DrDoud38
    @DrDoud38 4 ปีที่แล้ว

    Salut. J'adore tes vidéos. Seulement cinq et je suis déjà méga fan. Ouais bon okay j'ai pas loin de quatre ans de retard mais j'étais bloqué en Ouzbékistan ces vingt dernières années avec une connexion Internet vraiment pourrie. Petite remarque (désolé si on te l'a déjà dit) mais "espèce" est un nom féminin.

  • @raleighsholyan9974
    @raleighsholyan9974 6 ปีที่แล้ว

    Très bon taf, j’ai recommandé tes vidéos pour mes camarades ayant des soucis en descriptive Haha 😂

  • @myfreedom42
    @myfreedom42 5 ปีที่แล้ว +1

    comment c'est possible que je n'ai tjs pas compris l'interprétation de l'écart type en ayant vu ta vidéo? :s

    • @jonathandauwe
      @jonathandauwe 5 ปีที่แล้ว +1

      L'interprétation (pour une loi normale) c'est la règle 68-95-99.7. Prenons s la valeur de l'écart-type et m la moyenne. Alors 68% (68,27% plus précisément) des valeurs se situe entre m-s et m+s ; 95,45% des valeurs sont entre m-(2*s) et m+(2*s) et 99,73% des valeurs sont entre m-(3*s) et m+(3*s). Il est difficile de calculer ce genre de valeur donc, comme souvent en statistiques, on utilise des tables : des tableaux avec les valeurs souvent utilisée mais difficiles à calculer.
      Si on reprend l'exemple des chipolatas (à 11:13) : la moyenne m = 18, l'écart-type s = 2 donc 68,27% des gens mangent entre 18-2=16 chipolatas et 18+2=20 chipolatas ; 95,45% des gens mangent entre 18-(2*2)=14 et 18+(2*2)=22 chipolatas et enfin, 99,73% des gens mangent entre 12 et 24 chipolatas.
      Pour info, une loi normale, c'est une courbe de la forme montrée et une distribution très classique quand il y a beaucoup de phénomène aléatoire (l'appétit des convives est souvent très aléatoire).

    • @RisqueAlpha
      @RisqueAlpha  5 ปีที่แล้ว +1

      @Argorate ... :-/
      Parce qu'elle ne doit pas être assez bonne...
      Essai ça à l'occasion : th-cam.com/video/c0vmjyRuQRw/w-d-xo.html

    • @myfreedom42
      @myfreedom42 5 ปีที่แล้ว +1

      @@RisqueAlpha Mais du coup vu que rien ne suit jamais exactement une loi normale, en quoi est-ce pertinent de prendre un cas particulier contextuel comme outil de mesure?
      Moi j'ai toujours cru que l'écart type c'était l'écart moyen des écarts entre chaque donnée, ça porte un nom du coup ça?

  • @cofbmaitres1177
    @cofbmaitres1177 4 ปีที่แล้ว

    Comme je m'ennuie un peu durant le confinement et que je voulais que mes cours de stats inferentielle et d'économétrie à la fac me servent à quelquechose (ayant terminé mes études), je me suis amusé à calculer les intervalles de confiance à 95 % (peut-être que je ferais aussi le calcul pour d'autres niveau de probabilité) pour la moyenne et l'écart-type du nombre de chipos consommées par ton groupe d'amis. On suppose ici que le nombre de chipo, pour l'ensemble des barbecues que tu vas organiser durant toute ta vie avec ce groupe de potes, suit une loi normale d'espérance et d'écart-type inconnus. Supposons également que les barbecues futurs ressembleront plus ou moins à ceux effectués jusque-là (évidemment, si le nombre de participants explosent ou que tes amis deviennent végétariens, l'inférence n'a plus aucun sens...).
    Je précise aussi que, pour faire mes petits calculs, j'ai du faire des choix par rapport au graphique présenté dans la vidéo. J'ai considéré que le nombre de chipo consommées allaient de 13 à 23, avec les occurences suivantes (1-1-2-4-8-11-8-4-2-1-1). Nous avons donc un échantillons de 43 barbecues, durant lesquels 774 saucisses ont été mangées (soit effectivement une moyenne de 18). Sans détailler les calculs, voici les résultats :
    IC95 pour l'espérance : [17,2952 ; 18,7048]
    IC95 pour l'écart-type : [1,6392 ; 2,5268]

  • @vincentquignon6507
    @vincentquignon6507 6 ปีที่แล้ว +1

    Salut,
    Je trouve ta vidéo super intéressante. Cependant, j'ai un petit problème que je ne parviens pas à résoudre et qui me pose souci et qui a un rapport avec ta vidéo. Je ne parviens pas à voir où je me trompe dans mon raisonnement.
    Supposons que je lance une pièce et que je compte le nombre de piles (X = nombre de piles).
    Si je lance une pièce la probabilité d'avoir un pile est de 50%. E(X) = 0,5 et Écart-type = 0,25.
    Si je fais de même avec 2 pièces simultanément :
    P(X=0) = 0,25 ; P(X=1) = 0,5 et P(X=2) = 0,25 et on a E(X) = 1 et écart-type = 0,5
    Si je fais de même avec 3 pièces simultanément :
    P(X=0) = 0,125 ; P(X=1) = 0,375 ; P(X=2) = 0,375 et P(X=3)= 0,125 et on obtient E(X) = 1,5 et écart-type = 0,75
    Peu importe le nombre de lancés (L), j'obtiens toujours :
    E(X) = L/2 et écart-type = L/4
    Or d'après, le théorème central limite, la somme de plusieurs variables converge vers une variable aléatoire qui suit une loi normale.
    Donc si je lance 200 pièces, théoriquement X suit une loi normale N(100 ; 50).
    Théoriquement, la probabilité que je tire entre 0 et 200 piles (P0

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      La distribution que tu es en train d'étudier est une distribution binomiale de paramètre n=200 et p=0,5. (et effectivement quand n est grand la loi normale colle) . Son espérance est effectivement n*p=200/2=100
      Mais c'est la variance qui est égale à np(1-p) = 200/4. Pas l'écart type.
      Pour obtenir l'écart type il faut en prendre la racine, et c'est avec 2 écart type que tu auras les 95%.
      J'espère que ça répond à ta question 😊

    • @vincentquignon6507
      @vincentquignon6507 6 ปีที่แล้ว

      Arf... Tout simplement !
      Comment passer pour un simplet. C'est ça de vouloir faire plusieurs choses à la fois et de ne pas être concerntré.
      En tout cas merci beaucoup... Car ça me perturbait de ne pas retomber sur mes pattes.
      Bonne continuation et encore bravo pour les 14 000 abonnés !

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      C'est typiquement le genre d'erreur que je fais systématiquement, alors je ne vais pas te lancer la pierre. ^^

  • @julienf2301
    @julienf2301 6 ปีที่แล้ว

    Faut avoir un sacré nombre de potes à son barbecue pour pouvoir appliquer le TCL et supposer que la distribution est normale (sachant qu'on s'intéresse à la distribution pour prédire un seul barbecue, pas la distribution de la moyenne ré-échantillonnée). S'ils sont que deux ça a de grandes chances d'être foireux, même si on a les stats sur 3 ans.

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      Et surtout beaucoup de barbecue (avec toujours les même potes et toujours le même nombres de potes en plus ...)
      Je te laisse imaginer le sourire de mon boucher quand il me voit arriver ;-)

  • @cooperationhumaine
    @cooperationhumaine 6 ปีที่แล้ว

    A 4:08 ---> "C'étendu" du string, l'orthographe ; en statistique, "étendue" est bel et bien le substantif féminin, et non pas un participe passé. (Même si, vous pourrez me le faire remarquer, le substantif provient du participe passé du verbe "étendre". Bref...)

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +1

      J'y prendrai garde à l'avenir ! ^^
      (Même si soyons honnête ... J'ai une orthographe très "alternative")

  • @Dherlos
    @Dherlos 6 ปีที่แล้ว

    Tes expressions gestuelles, faciales, et ta façon de parler me font trop penser à ScienceEtonnante x) !

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +1

      C'est du compliment de qualité ça !
      Merci beaucoup ! ;-)

  • @martincalderonbinard9880
    @martincalderonbinard9880 6 ปีที่แล้ว +3

    Et si moi je veux des merguez ?

  • @ledouble7337
    @ledouble7337 4 ปีที่แล้ว

    Merci merci merci

  • @Bertrandrobintaudou
    @Bertrandrobintaudou 5 ปีที่แล้ว

    risque alfa = ((38-18)/2x) le risque alfa pour le daly cholesterol sur les risque alfa du daly tension arterielle
    cependant le risque alfa du daly arme à feu reste très présent !!! ...
    daly voire une autre vidéo de risque alfa

  • @flocon1734
    @flocon1734 4 ปีที่แล้ว

    Mais si t'as pas 24 chipo, le groupe ne pourra pas en manger plus de 22... donc la poursuite de l'enquête est faussée sur le plus long terme.
    Et pour chipoter : on connaît pas le poids des chipos ni le poids ingurgité par personne ;D

  • @arthurreitz9540
    @arthurreitz9540 6 ปีที่แล้ว +1

    Réponse 4 : C'est moi qui conduit le mieux

  • @thiah71
    @thiah71 7 ปีที่แล้ว

    je suis le seule à avoir remarquer le "sex with animal" dans le générique, super vidéo

  • @Bertrandrobintaudou
    @Bertrandrobintaudou 5 ปีที่แล้ว

    38 pour les chipolatas !!!
    1.96 x ECART TYPE =96% de la population étudiée
    aucune relation avec les chipolatas ...rassurez vous !!!

  • @guillaumelimousin7988
    @guillaumelimousin7988 6 ปีที่แล้ว +1

    Bonjour. En tant qu'ancien chercheur en sciences (de la vie puis en géologie), et devenu prof de maths, je me suis toujours demandé pourquoi, mais bon dieu pourquoi, on utilise l'écart-type (en effet : un vrai bidouillage) plutôt que tout simplement l'écart moyen ?!!! OK, Mister Fischer, peut-être que pour certains trucs (rares d'utilisation...) l'écart-type c'est mieux. Mais au contraire, pour PLEINS d'autres trucs beaucoup plus fréquents, l'écart-type est merdique puisqu'il est très sensible aux valeurs extrêmes (on pourrait d'ailleurs faire la même remarque avec le "r²" dans les régressions : pourquoi, mais bon dieu pourquoi ?!!!). D'ailleurs, l'histoire des pourcentages avec la loi normale marcherait très bien aussi avec l'écart moyen (on obtiendrait juste des pourcentages différents !). N'est-ce pas ? Enfin, il ne faut pas oublier que la plupart des données ne suivent une loi normale qu'en très grosse approximation, alors que quand on a plein de données et qu'on peut faire des distributions précises, on s'aperçoit qu'elles sont toujours asymétriques, ce qui est... normal, euh non, pardon, logique ! Car il y a un "zéro à gauche" qui n'est pas franchissable alors qu'à droite on peut aller vers l'infini. Bref : auriez-vous une réponse à cette question que je me pose depuis plus de 20 ans et pour laquelle je n'ai jamais obtenu de réponse ? (durant ma thèse, j'avais même tenter de mettre des écarts moyens à la place des écart-types et des coefficients de régression "pas carrés" : un vrai bordel car aucun logiciel de régression ne le fait : il a fallu que je me le programme moi-même, mais je n'ai réussi à convaincre personne). Pourtant, ils sont tellement moins sensibles aux valeurs extrêmes ! Dernière petite remarque : si on veut comparer des écarts-types de populations de tailles différentes, il faut plutôt prendre l'erreur standard (sinon il y a un biais de comparaison : la population de taille supérieure paraitra plus dispersée alors que pas forcément). Là encore : pourtant, même les plus grandes publications font cette erreur !!! Pourquoi ? Bref : si vous pouvez m'éclairer sur ces bizarreries et sur cette erreur souvent faite dans les publis ? D'avance un grand merci pour vos réponses.

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว

      Pourquoi plus l'ET que l'EM en dehors des liens que j'ai mis dans la description je ne sais pas trop. Je dirais peut être tout simplement que c'est lié au fait que Fisher a plus marqué historiquement les statistiques que Eddington ... Rien de plus. Et effectivement l'EM a pleins d'avantages.
      Pour l'erreur-standard moi aussi j'ai remarqué que très souvent on donnait l’écart-type à la place. Est-ce que c'est juste une erreur de notation ou est-ce vraiment un mauvais calcul je ne sais pas.
      Par contre si on veut comparer deux populations "totales" de taille différentes, l’écart-type ne pose pas problème il me semble. C'est quand on sait que ces ecart-types sont calculés sur des échantillons issus d'une population général que se pose le problème.

    • @guillaumelimousin7988
      @guillaumelimousin7988 6 ปีที่แล้ว

      Ah tiens, autre sujet intéressant. L'erreur standard peut être calculée également quand l'échantillon est d'une certaine taille alors que la population peut être considérée comme infinie (ça, j'en suis à peu près certain si je relis mes cours de stats). Ce qui évite les biais liés aux échantillons de tailles différentes dans cette même population. Or, dans beaucoup de sciences, on fait des prélèvements à différents endroits (dans l'espace) ou à différents moments (dans le temps). Or l'espace et le temps étant continu, on peut les considérer comme une population de taille infinie, non ? En tous cas, quand je faisais des mesures de concentrations de polluants à différents endroits d'une parcelle, j'appliquais systématiquement l'erreur-standard (en considérant la population de taille infinie : c'est-à-dire une infinité de concentrations si on prend tous les points de l'espace de la parcelle). Mais je me suis toujours demandé si c'était pertinent. Intuitivement, il me semble que oui : car si un collègue était revenu sur la même parcelle pour faire un échantillonnage d'un nombre différent de mesures et qu'on voulait comparer, il valait alors mieux comparer les erreurs standard plutôt que les écarts-types si on ne veut pas avoir de biais. Puis progressivement, j'ai généralisé cela à tous mes traitements de données de mesures de concentrations : dans le temps, dans l'espace, et même quand je répétais la mesure d'une concentration d'un même échantillon (pour avoir l'erreur standard intrinsèque à la mesure). Mais je me suis également toujours demandé si c'était pertinent. Et je 'ai jamais trouvé quelqu'un qui puisse me répondre. Là aussi, je suis preneur de vos avis. (bon, évidemment, si on a suffisamment de données et qu'elles sont spatialisées, le mieux est de se faire de la géostatistique : et d'ailleurs cocorico : invention française par Gérard Matheron, mais c'est rare d'en avoir suffisamment car les mesures coûtent cher).

  • @cLxJaggy
    @cLxJaggy 7 ปีที่แล้ว +1

    En fait, si, des gens ont payés pour tester ça... Qui d'autre que les MythBusters ? ^^
    en.wikipedia.org/wiki/MythBusters_%282012_season%29#Episode_183_.E2.80.93_.22Battle_of_the_Sexes.22

    • @RisqueAlpha
      @RisqueAlpha  7 ปีที่แล้ว +1

      Damned ! Il va falloir que je trouve cet épisode.
      79 vs 71 sur 100, c'est encore plus serré que dans mon exemple.
      Et a la fin ils font exploser les voitures ? :-p

    • @julienf2301
      @julienf2301 6 ปีที่แล้ว

      Avec tous les tests qu'ils ont chez MythBusters ça aurait tendance à aussi suggérer une prochaine vidéo sur le cherry picking et les indicateurs globaux de significativité vs indicateurs locaux :P

  • @arthurreitz9540
    @arthurreitz9540 6 ปีที่แล้ว +1

    Spersion

  • @Nygaut
    @Nygaut 6 ปีที่แล้ว

    Spersion ! Cateur !

    • @Nygaut
      @Nygaut 6 ปีที่แล้ว +1

      Je découvre ta chaîne depuis quelques jours et je dévore tes vidéos, qui sont d'excellentes qualité ! Je m'abonne, bravo :)

  • @jirtarWorld
    @jirtarWorld 6 ปีที่แล้ว

    Euh, (vu la date de publication... je doute avoir une réponse!)
    Je vois pas le rapport entre un "fait" génétique (homme / femme) versus et "liens" statistique (très peu fiable)!
    Je m'explique:
    La conduite automobile n'est pas inné, non? Donc, ca implique un apprentissage. Et le "niveau" (talent) ne dépand pas que tu "talent naturel"! Il dépand en grande partie du nombre d'heures passé à "partiquer***" (apprendre)... [learning curve]
    Comme notre société est très "stéréotypé", il est fort possible (je connais pas les stas!) que l'homme conduise bien plus souvent que la femme! Et donc, sa maitrise "plus grande" (à supossé qu'il y en ai une! "par sexe") découlerait du fait qu'il pratique plus... pas qu'il est un homme (facteur de confusion!?)
    La femme partant (et surtout l'homme!?) du principe que "lui" est "mielleur", c'est toujours lui qui conduit ...
    Sans parler de d'autre facteurs... comme le stress de sentir le regard de "monsieur" "chequer" le moindre geste de "madame"!
    Et donc, a moins d'isoler des "femmes" et des "hommes" dès la naissance, pour faire en sorte que la "psychologie" (culture, ... apriori) ne veinne pas influencer leur confiance personnel vis-à-vis de leur capacité à être de bon conducteur... et investir la même qualité et quantité d'apprentissage pour les deux groupe, et cela a partir du même âge...
    Car l'âge pourrait aussi être un facteur de confusion... On deveint meilleur quand on apprend plus jeune... si l'on associe la voiture a sa condition "d'homme" et par conséquent, se met à la pratique plus jeunne... (a supposé bien sur que s'y mettre le plutôt possible donne un avantage mesurable/conséquent)
    Je serais curieux de voir quel est la part du sociaux culturel et la part "génétique" (homme / femme).
    Je connais un homme qui a peur de conduire... et donc, les chance qu'il devienne "bon" sont nulle puisqu'il conduira, probablement, jamais!
    Et même les surdoués doivent "travailler" leur talent pour le développer!
    {
    "partiquer***" (apprendre)
    Et en parlant de "pratique" (beaucoup ... learning curve).
    Ceci n'est pas la même chose: "pratiquer" et Pratiquer.
    Analogie pour précisé ma pensée
    "pratiquer" les statistiques par la vulgarisation et Pratiquer les statistiques par l'étude.
    Le niveau de maitrise ne sera pas le même...
    Dans la conduite automobile, faire le strict nécessaire (minimum) se rendre au boulot... (pratiquer 8 minutes par jour)
    versus
    Être pilote de course, Pratiquer intensivement, repousser les limites, profiter des conseils d'expert.... (pratiquer des heures à tout les jours)
    On s'entend tu pour dire que se n'est pas la même "pratique" (apprentissage)
    Et donc, la différence entre prendre quelque chose au sérieux ... ou à la légère...
    (repousser les limites ["études" très sérieuse, bénéficier d'avis expert, ... se surpasser] et se contenté du minimum acceptable)
    Ne vas pas généré les mêmes compétances! (habilité, maitrise)
    Que se soit en conduite automobile... En "études" des statistiques, ... ou en musique... !
    }
    Pour moi une voiture... ca mène du point A au point B... et mes capacités de conduteur se limite a ca... et je ne cherche pas à les améloiré...(je ne cherche as à les empirer non plus!) c'est "suffisant" ... enfin la plupart du temps!
    Mais, dans une condition "innabituelle" (aucun entrainement) il est possible que le "réflexe de base" soit contraire a ce qui serait préférable de faire... et le "réflexe" dans une voiture est de freinner... alors que dans certaines condition... ca va juste "assurer" la collision! Alors que accéléré, par exemple, aurait pu l'éviter!
    Je crois pas qu'aucune étude statistique serait possible pour contrer les possibles facteurs de confusion ici, surtout les facteurs sociaux culturel... (impliquerait, pour faire une tel étude, d'élèver les enfants hors de toute société... et peut-être aussi d'inventer des société alternative

    • @RisqueAlpha
      @RisqueAlpha  6 ปีที่แล้ว +1

      Si un lien existait entre "sexe" et "conduite sur circuit" il pourrait, comme tu le dis très justement, y avoir des tas de raisons différentes de la "simple" génétique. Attente sociale / Entrainement des hommes / expositions culturelle plus intense au sport auto pour les hommes ...etc.
      Et ça ne répondrait même pas à la question de mes personnages dans l'intro ;-)
      Mais ce n'était pas le sujet de ma vidéo.
      Le sujet ici c'est que AVANT même de commencer à chercher un lien de causalité, des facteurs de confusions ou de faire la moindre inférence, il faut se demander si "une différence de X points" ça veut vraiment dire qu'il existe une différence, disons, "franche". (j’évite volontairement le terme "significative")
      Et sinon je suis d'accord pour les voitures autonomes ! ;-)

    • @jirtarWorld
      @jirtarWorld 6 ปีที่แล้ว

      merci

    • @jirtarWorld
      @jirtarWorld 6 ปีที่แล้ว

      Je te cite:
      "
      Si un lien existait entre "sexe" et "conduite sur circuit"
      "
      Je n'ai pas parlé de conduite sur circuit, je l'ai utilisé dans le sens: niveau de la pratique/apprentissage, pour précicé ce que je voulais dire entre pratique et "Pratique". (mettre un accent fort sur l'écart de niveau d'apprentisage/"formation"/pratique/expérience)
      D'ailleur, même dans ce cas, je suis pas sur qu'il y ait une si grande différence entre conduite sur circuit et la route! (en condition de course, et non seul sur un circuit)
      Freiner, évaluer les distances, réagir vite en cas de pépin, ... se tasser quand c'est possible (angle mort, rétro) Toute des choses que le conducteur moyen doit faire sur la route et que doit faire le pilote de course aussi!
      Et, c'était quoi la question déjà, des personnages que je ne répond pas? Qui est le meilleurs entre homme et femme? Ou qui est meilleurs entre le gars et la fille qui parle au début de la vidéo?
      Pour moi, les stats parle de groupe, pas d'individus! Alors dans un débats de capacités entre deux individus... les stas sont irrévélantes (au cas par cas). Mais pour un "joueur" (parieur) elles peuvent s'avéré utile!
      Et puisque tu montre des grahp dans la vidéo... on voit bien que deux graph peuvent bien se chevaucher (dispersion/étallement ) et selon ou chaque individus se retrouve sur le(s) graphe(s)! Les stats devienne "utile/inutile" (selon les cas)
      Donc, effectivement, je suis d'accord avec toi, ceci:
      "
      il faut se demander si "une différence de X points" ça veut vraiment dire qu'il existe une différence, disons, "franche". (j’évite volontairement le terme "significative")
      "
      Entre deux groupe!
      Et encore plus révélant entre deux individus! (selon l'étalement des stats bien évidemment!) [deux graphe qui se chevauche presque comme dans la vidéo]