Ora che sappiamo cos'è la Curva Gaussiana (o "Curva Normale"), cerchiamo di imparare come capire se i dati in nostro possesso seguono o meno questo tipo di Curva....tramite Minitab !
Ciao Sara ! Sono contento che il video ti abbia aiutato...e..In Bocca al Lupo per la tua tesi !!! Ti chiedo solo, se non l'hai già fatto, di iscriverti al canale...avere iscrizioni aiuta ad andare avanti in questo progetto ! Grazie dei Complimenti !
Molto chiaro grazie mille, seguo subito il suo canale. Ma ho una domanda, posso utilizzare questo stesso test per dati con numero di campioni molto alti? mi spiego meglio, sto eseguendo un analisi dei dati di un allevamento sperimentale dove devo valutare le performance di crescita di tali animali in base alla somministrazione di 4 diete differenti e in seguito gli indici di conversione di tali alimenti. per ognuna delle 4 diete ho eseguito 6 repliche, quindi ho 24 contenitori di allevamento. Non ho la possibilità di contare il numero effettivo di individui poiché sono molto piccoli. Il numero lo deduco pesando 100 individui prelevati casualmente e da li calcolo il peso medio di un singolo individuo, infine faccio il rapporto fra peso totale degli individui e peso medio per ottenere una stima sul numero totale di individui. Il mio scopo è quello di confrontare i 4 gruppi suddivisi, appunto in base alle diete, e per farlo pensavo di utilizzare l analisi della varianza ANOVA. In base a ciò che ho descritto sarebbe così gentile da darmi qualche dritta? sono disperato :(
Ciao Serrj (mi dici qual è il tuo nome ? :-) ) Scusami se non ti ho risposto subito, avevo visto il messaggio sul cellulare ma poi mi sono dimenticato..... Beh, anzitutto grazie per: - l'interessamento al Canale - i complimenti che mi fai (sempre graditissimi !) - e la domanda, anzi...le domande Ecco, per quanto riesco, le risposte: - Normality test --> si, si può fare anche con un numero elevato di campioni; anche se ti venisse fuori un valore di p < 0.05, non disperare...i dati possono ancora essere considerati Normali....a tal fine ti raccomando di guardare la playlist advanced "NON-Normalità dei dati" che ti potrà dare molte dritte a riguardo (Tutorial dal 35 al 40) - ANOVA --> il "One-way" ANOVA è il metodo che può fare per te: ti consiglio di guardare i tutorial numero 27 e 28 Spero di esserti stato d'aiuto, A presto e...Grazie ancora !!!
Buongiorno Marisol, prima di tutto gli immancabili ringraziamenti per l'interessamento al Canale e per la domanda. Per venire al tuo punto, il P-value è dato da una formula che quasi oramai nessuno più usa manualmente. Devo rimettermi su alcuni manuali per tirarla fuori ma, credimi, non ha molto senso saperla e oltretutto usarla: ciò che è importante, soprattutto per chi utilizza la statistica nell'ambito dei processi produttivi (che è poi lo scopo di questo Canale, lo si capisce anche dal nome del Canale stesso..), è capirne il significato, ovvero, in questo caso, esprimere a livello di probabilità percentuale la possibilità che un processo produttivo, assunto come "Normale" (Null Hypothesis), avesse generato dati come quelli ottenuti... Un esempio semplice potrebbe essere dato dal lancio di un dado: tirando 100 volte un dado, se ottenessi: - 30 volte il 6 - 13 volte l'1 - 14 volte il 4 - 15 volte il 3 - 12 volte il 2 - 13 volte il 5 ....penseresti che è stato un caso o che il dado è truccato ? Ammettiamo che la tua "Null Hypothesis" sia proprio "Il dado è normale"...quante possibilità ci sono che un dado normale ti dia i risultati sopra ? In questo caso il p-value sarebbe 0.003, ovvero 3 per 1000....certo una possibilità c'è...ma forse è più probabile che il dado sia truccato sul numero 6... Spero di esserti stato di aiuto.... In ogni caso se vuoi la formula, la posso cercare.... Ciao, a presto e...continua a seguirmi !
Ancora una volta tutto molto chiaro e ben contestualizzato, grazie. Una domanda: è stata definita una quantità minima di campioni affinchè si possa considerare attendibile il test di normalità ? Un saluto
Ciao Andrea e grazie del commento ! Si, diciamo che con meno di 15 campioni il test comincia a perdere di attendibilità, di solito la finestra da 20 a 30 è considerata quella ideale.
Salve e complimenti per i suoi tutorial molto chiari. Volevo chiedere nel caso di una misura con range di tolleranza non simmetrico (es. +2-0) posso aspettarmi una distribuzione dei dati normale oppure è ininfluente? Inoltre c'è un modo semplice per calcolare il P-value manualmente? Grazie
Salve, innanzitutto grazie dei complimenti e del commento ! Per venire alla sua domanda posso dirle subito che il range di tolleranza non ha alcuna influenza sulla normalità dei dati. Sicuramente c'è un modo per calcolare il P-value manualmente (posso recuperarlo) ma non è assolutamente nè pratico nè veloce...molto meglio Minitab! Infine, mi farebbe piacere conoscere il suo nome e, se trova i miei video interessanti, perchè no, mi farebbe piacere se si iscrivesse al canale...sempre che non l'abbia già fatto ! Grazie ancora...a presto !
@@SixSigma_CamilloBelluzzi Grazie della risposta. Pensavo si potesse calcolare facilmente anche senza Minitab. Comunque il mio nome è Emanuele Forte e lavoro in ambito manufacturing. A proposito del suo canale quali pensa potranno essere i potenziali futuri temi che tratterà? Solamente statistica applicata? Mi scuso per la domanda ma non conosco esattamente la sua specializzazione.
Ciao Emanuele, quindi benvenuto in questa "piccola" community; principalmente si, il canale tratterà statistica applicata ai processi produttivi ma posso comunque, su richiesta, fare tutorial dedicati, sempre che rientrino nel mio ramo di competenze. Ci saranno, più, avanti, video sulle Validazioni di Processo (IQ, OQ, PQ). Io sono Responsabile Qualità di una piccola azienda Biomedicale Modenese, ma sono certificato Six Sigma Black Belt ed insegno statistica applicata ai Processi e gli AQL in un ITS a Mirandola (MO).
Buonasera professore. Ma se i dati non sono normali non si può procedere corretto? Quindi come devo fare per normalizzare i dati? (Oltre che a rendere precisa la misurazione) Bisogna agire in tutte le variabili di processo finché non risulta “normale” con p-value superiore a 0,05 corretto? Quindi controllare i parametri macchina, controllare pz in accettazione, formazione operatore , etc corretto? Grazie in anticipo per la risposta
Ciao Giulia e grazie per la domanda ma soprattutto per l'interessamento al Canale ! Le tue domande sono tutte pertinenti e corrette ma credo che la Playlist "advanced" sulla Normalità dei Dati possa darti tutte le risposte del caso. Ci sono vari video, sceglierai poi tu quello più adatto a te ! Buona Visione !
Grazie mille. Guarderò tutte la playlist. C’è un indirizzo mail dove la posso contattare? Vorrei porle alcune domande in privato se possibile. Complimenti per le spiegazioni, sono ottime e chiare. Continui così :)
Salve Daniele e, anzitutto, grazie per essersi iscritto al canale; quanto alla sua domanda: non è detto ci siano processi che non seguono la distribuzione normale ma semplicemente sono composti da più curve gaussiane che, quando analizzate in Minitab, vengono viste come "non normali": l'esempio più classico è quello di pezzi prodotti da diversi operatori, pur utilizzando la stessa macchina utensile, o, anche in caso di stesso operatore, potrebbe trattarsi di diversi lotti di materia prima, ad esempio barre di acciaio utilizzate per produrre un lotto di componenti ma appartenenti a lotti di fornitura diverse; a tal proposito le consiglio di guardare i tutorial sulla process capability (CpK e Ppk), con focus su quelli relativi alle subgroup sizes, laddove potrà avere ulteriori spunti riguardo all'argomento qui brevemente esposto. Spero di esserle stato utile.
Buongiorno Giuseppe ! Anzitutto scusami del ritardo nella risposta...è stato un periodo faticoso soprattutto per sostenere aziende con cui ho avuto il piacere ed il privilegio di lavorare anche grazie al Canale tramite il quale quest'ultime sono entrate in contatto con me...quindi, Grazie anche a te per l'interessamento al Canale e per la domanda...alla quale provo a rispondere: il P-value è una percentuale di possibilità (espressa in decimali, ovvero 0.1 equivale al 10%) che un dato evento possa essere capitato ammettendo che la "Null Hypothesis" sia VERA. Nel caso in esame, la nostra "Null Hypothesis", ovvero il nostro "STATEMENT", è che il tuo processo generi dati che seguano la Distribuzione Normale: ammettendo che lo "STATEMENT" sia vero, quale possibilità avrebbe avuto il tuo processo di generare esattamente i dati così come li hai ottenuti ? Se la percentuale è > 5% (0.05), allora si "accetta" lo "STATEMENT"....se è < 5%, allora si considera "improbabile" che lo "STATEMENT" sia vero e quindi di stabilisce che il tuo processo generi dati che NON seguano la distribuzione normale... Spero di essere stato chiaro....ti rimando cmq al tutorial 23 e successivi che ti possono fornire maggiori delucidazioni in merito...a presto e...continua a seguirmi !!!
Ottimo video anche questo! Una spiegazione davvero chiara su come effettuare il test di normalità su Minitab.
Devo consegnare la tesi tra 5 giorni. Mi hai salvato la vita, grazieeeee
Ciao Sara ! Sono contento che il video ti abbia aiutato...e..In Bocca al Lupo per la tua tesi !!! Ti chiedo solo, se non l'hai già fatto, di iscriverti al canale...avere iscrizioni aiuta ad andare avanti in questo progetto ! Grazie dei Complimenti !
@@SixSigma_CamilloBelluzzi certo mi iscrivo volentieri. Crepi il lupo, grazie mille😊
Molto chiaro grazie mille, seguo subito il suo canale.
Ma ho una domanda, posso utilizzare questo stesso test per dati con numero di campioni molto alti?
mi spiego meglio, sto eseguendo un analisi dei dati di un allevamento sperimentale dove devo valutare le performance di crescita di tali animali in base alla somministrazione di 4 diete differenti e in seguito gli indici di conversione di tali alimenti. per ognuna delle 4 diete ho eseguito 6 repliche, quindi ho 24 contenitori di allevamento.
Non ho la possibilità di contare il numero effettivo di individui poiché sono molto piccoli. Il numero lo deduco pesando 100 individui prelevati casualmente e da li calcolo il peso medio di un singolo individuo, infine faccio il rapporto fra peso totale degli individui e peso medio per ottenere una stima sul numero totale di individui.
Il mio scopo è quello di confrontare i 4 gruppi suddivisi, appunto in base alle diete, e per farlo pensavo di utilizzare l analisi della varianza ANOVA. In base a ciò che ho descritto sarebbe così gentile da darmi qualche dritta? sono disperato :(
Ciao Serrj (mi dici qual è il tuo nome ? :-) )
Scusami se non ti ho risposto subito, avevo visto il messaggio sul cellulare ma poi mi sono dimenticato.....
Beh, anzitutto grazie per:
- l'interessamento al Canale
- i complimenti che mi fai (sempre graditissimi !)
- e la domanda, anzi...le domande
Ecco, per quanto riesco, le risposte:
- Normality test --> si, si può fare anche con un numero elevato di campioni; anche se ti venisse fuori un valore di p < 0.05, non disperare...i dati possono ancora essere considerati Normali....a tal fine ti raccomando di guardare la playlist advanced "NON-Normalità dei dati" che ti potrà dare molte dritte a riguardo (Tutorial dal 35 al 40)
- ANOVA --> il "One-way" ANOVA è il metodo che può fare per te: ti consiglio di guardare i tutorial numero 27 e 28
Spero di esserti stato d'aiuto,
A presto e...Grazie ancora !!!
@@SixSigma_CamilloBelluzzi perfetto guarderò un video che mi ha consigliato e le farò sapere 😁 Grazie mille per ora
Buongiorno, anche a me interesserebbe sapere come calcolare manualmente il p-value. Grazie mille per i video e le spiegazioni che sono molto chiare.
Buongiorno Marisol, prima di tutto gli immancabili ringraziamenti per l'interessamento al Canale e per la domanda.
Per venire al tuo punto, il P-value è dato da una formula che quasi oramai nessuno più usa manualmente. Devo rimettermi su alcuni manuali per tirarla fuori ma, credimi, non ha molto senso saperla e oltretutto usarla: ciò che è importante, soprattutto per chi utilizza la statistica nell'ambito dei processi produttivi (che è poi lo scopo di questo Canale, lo si capisce anche dal nome del Canale stesso..), è capirne il significato, ovvero, in questo caso, esprimere a livello di probabilità percentuale la possibilità che un processo produttivo, assunto come "Normale" (Null Hypothesis), avesse generato dati come quelli ottenuti...
Un esempio semplice potrebbe essere dato dal lancio di un dado:
tirando 100 volte un dado, se ottenessi:
- 30 volte il 6
- 13 volte l'1
- 14 volte il 4
- 15 volte il 3
- 12 volte il 2
- 13 volte il 5
....penseresti che è stato un caso o che il dado è truccato ?
Ammettiamo che la tua "Null Hypothesis" sia proprio "Il dado è normale"...quante possibilità ci sono che un dado normale ti dia i risultati sopra ?
In questo caso il p-value sarebbe 0.003, ovvero 3 per 1000....certo una possibilità c'è...ma forse è più probabile che il dado sia truccato sul numero 6...
Spero di esserti stato di aiuto....
In ogni caso se vuoi la formula, la posso cercare....
Ciao, a presto e...continua a seguirmi !
Grazie, molto utile!
Ancora una volta tutto molto chiaro e ben contestualizzato, grazie.
Una domanda: è stata definita una quantità minima di campioni affinchè si possa considerare attendibile il test di normalità ?
Un saluto
Ciao Andrea e grazie del commento ! Si, diciamo che con meno di 15 campioni il test comincia a perdere di attendibilità, di solito la finestra da 20 a 30 è considerata quella ideale.
Grazie della risposta.
Salve e complimenti per i suoi tutorial molto chiari. Volevo chiedere nel caso di una misura con range di tolleranza non simmetrico (es. +2-0) posso aspettarmi una distribuzione dei dati normale oppure è ininfluente? Inoltre c'è un modo semplice per calcolare il P-value manualmente? Grazie
Salve, innanzitutto grazie dei complimenti e del commento ! Per venire alla sua domanda posso dirle subito che il range di tolleranza non ha alcuna influenza sulla normalità dei dati. Sicuramente c'è un modo per calcolare il P-value manualmente (posso recuperarlo) ma non è assolutamente nè pratico nè veloce...molto meglio Minitab! Infine, mi farebbe piacere conoscere il suo nome e, se trova i miei video interessanti, perchè no, mi farebbe piacere se si iscrivesse al canale...sempre che non l'abbia già fatto ! Grazie ancora...a presto !
@@SixSigma_CamilloBelluzzi Grazie della risposta. Pensavo si potesse calcolare facilmente anche senza Minitab. Comunque il mio nome è Emanuele Forte e lavoro in ambito manufacturing. A proposito del suo canale quali pensa potranno essere i potenziali futuri temi che tratterà? Solamente statistica applicata? Mi scuso per la domanda ma non conosco esattamente la sua specializzazione.
Ciao Emanuele, quindi benvenuto in questa "piccola" community; principalmente si, il canale tratterà statistica applicata ai processi produttivi ma posso comunque, su richiesta, fare tutorial dedicati, sempre che rientrino nel mio ramo di competenze. Ci saranno, più, avanti, video sulle Validazioni di Processo (IQ, OQ, PQ). Io sono Responsabile Qualità di una piccola azienda Biomedicale Modenese, ma sono certificato Six Sigma Black Belt ed insegno statistica applicata ai Processi e gli AQL in un ITS a Mirandola (MO).
@@SixSigma_CamilloBelluzzi Ottimo! Mi iscriverò al canale rimanendo in attesa di ulteriori video. Per il momento rinnovo i miei complimenti. A presto
Buonasera professore. Ma se i dati non sono normali non si può procedere corretto? Quindi come devo fare per normalizzare i dati? (Oltre che a rendere precisa la misurazione)
Bisogna agire in tutte le variabili di processo finché non risulta “normale” con p-value superiore a 0,05 corretto? Quindi controllare i parametri macchina, controllare pz in accettazione, formazione operatore , etc corretto?
Grazie in anticipo per la risposta
Ciao Giulia e grazie per la domanda ma soprattutto per l'interessamento al Canale ! Le tue domande sono tutte pertinenti e corrette ma credo che la Playlist "advanced" sulla Normalità dei Dati possa darti tutte le risposte del caso. Ci sono vari video, sceglierai poi tu quello più adatto a te !
Buona Visione !
Grazie mille. Guarderò tutte la playlist. C’è un indirizzo mail dove la posso contattare? Vorrei porle alcune domande in privato se possibile.
Complimenti per le spiegazioni, sono ottime e chiare. Continui così :)
Perchè esistono processi produttivi (es. macchine utensili) che a volte, non seguono una distribuzione normale? Grazie per una rispsta.
Salve Daniele e, anzitutto, grazie per essersi iscritto al canale; quanto alla sua domanda: non è detto ci siano processi che non seguono la distribuzione normale ma semplicemente sono composti da più curve gaussiane che, quando analizzate in Minitab, vengono viste come "non normali": l'esempio più classico è quello di pezzi prodotti da diversi operatori, pur utilizzando la stessa macchina utensile, o, anche in caso di stesso operatore, potrebbe trattarsi di diversi lotti di materia prima, ad esempio barre di acciaio utilizzate per produrre un lotto di componenti ma appartenenti a lotti di fornitura diverse; a tal proposito le consiglio di guardare i tutorial sulla process capability (CpK e Ppk), con focus su quelli relativi alle subgroup sizes, laddove potrà avere ulteriori spunti riguardo all'argomento qui brevemente esposto. Spero di esserle stato utile.
@@SixSigma_CamilloBelluzzi Buon giorno Camillo, grazie per la risposta.
Buongiorno professore, mi sono perso un attimo. cos'è il p-value?
Buongiorno Giuseppe ! Anzitutto scusami del ritardo nella risposta...è stato un periodo faticoso soprattutto per sostenere aziende con cui ho avuto il piacere ed il privilegio di lavorare anche grazie al Canale tramite il quale quest'ultime sono entrate in contatto con me...quindi, Grazie anche a te per l'interessamento al Canale e per la domanda...alla quale provo a rispondere:
il P-value è una percentuale di possibilità (espressa in decimali, ovvero 0.1 equivale al 10%) che un dato evento possa essere capitato ammettendo che la "Null Hypothesis" sia VERA.
Nel caso in esame, la nostra "Null Hypothesis", ovvero il nostro "STATEMENT", è che il tuo processo generi dati che seguano la Distribuzione Normale: ammettendo che lo "STATEMENT" sia vero, quale possibilità avrebbe avuto il tuo processo di generare esattamente i dati così come li hai ottenuti ? Se la percentuale è > 5% (0.05), allora si "accetta" lo "STATEMENT"....se è < 5%, allora si considera "improbabile" che lo "STATEMENT" sia vero e quindi di stabilisce che il tuo processo generi dati che NON seguano la distribuzione normale...
Spero di essere stato chiaro....ti rimando cmq al tutorial 23 e successivi che ti possono fornire maggiori delucidazioni in merito...a presto e...continua a seguirmi !!!