Comment faire une analyse de données de base dans Excel

Comment faire une analyse de données de base dans Excel

La plupart du temps, lorsque vous exécutez des statistiques, vous souhaitez utiliser un logiciel de statistiques. Ces outils sont conçus pour effectuer des calculs tels que t -tests, tests du chi carré, corrélations, etc. Excel n'est pas destiné à l'analyse de données. Mais cela ne veut pas dire que vous ne pouvez pas le faire.



Malheureusement, les fonctions statistiques d'Excel ne sont pas toujours intuitives. Et ils vous donnent généralement des résultats ésotériques. Ainsi, au lieu d'utiliser des fonctions de statistiques, nous allons utiliser le complément de statistiques Excel : le L'analyse des données Boîte à outils.

Le Toolpak, malgré son orthographe plutôt malheureuse, comprend un large éventail de fonctionnalités statistiques utiles. Voyons ce que nous pouvons faire avec les statistiques Excel.





Ajout de l'outil d'analyse de données Excel

Pendant que tu pouvez faire des statistiques sans Data Analysis Toolpak, c'est beaucoup plus facile avec. Pour installer le Toolpak dans Excel 2016, accédez à Fichier > Options > Compléments .

Cliquez sur Aller à côté de « Gérer : compléments Excel ».



Dans la fenêtre qui s'affiche, cochez la case à côté de Boîte à outils d'analyse puis cliquez d'accord .

Si vous avez correctement ajouté le Data Analysis Toolpak à Excel, vous verrez un L'analyse des données bouton dans le Données onglet, regroupés dans le Une analyse section:

Si vous voulez encore plus de puissance, n'oubliez pas de consulter les autres compléments d'Excel.

Statistiques descriptives dans Excel

Quel que soit le test statistique que vous exécutez, vous souhaiterez probablement d'abord obtenir les statistiques descriptives d'Excel. Cela vous donnera des informations sur les moyennes, les médianes, la variance, l'écart type et l'erreur, l'aplatissement, l'asymétrie et une variété d'autres chiffres.

L'exécution de statistiques descriptives dans Excel est simple. Cliquez sur L'analyse des données dans l'onglet Données, sélectionnez Statistiques descriptives, et sélectionnez votre plage d'entrée. Cliquez sur la flèche à côté du champ de la plage de saisie, cliquez et faites glisser pour sélectionner vos données et appuyez sur Entrer (ou cliquez sur la flèche vers le bas correspondante), comme dans le GIF ci-dessous.

Après cela, assurez-vous de dire à Excel si vos données ont des étiquettes, si vous voulez la sortie dans une nouvelle feuille ou sur la même, et si vous voulez des statistiques récapitulatives et d'autres options.

Après cela, appuyez sur d'accord , et vous obtiendrez vos statistiques descriptives :

Test t de l'étudiant dans Excel

Les t -test est l'un des tests statistiques les plus basiques, et il est facile à calculer dans Excel avec le Toolpak. Clique le L'analyse des données et faites défiler vers le bas jusqu'à ce que vous voyiez le t -tester les options.

Vous avez trois choix :

  • Test t : Deux échantillons appariés pour les moyennes doit être utilisé lorsque vos mesures ou observations ont été appariées. Utilisez-le lorsque vous avez pris deux mesures sur les mêmes sujets, comme la mesure de la tension artérielle avant et après une intervention.
  • Test t : à deux échantillons en supposant des écarts égaux doit être utilisé lorsque vos mesures sont indépendantes (ce qui signifie généralement qu'elles ont été effectuées sur deux groupes de sujets différents). Nous discuterons de la partie « variances égales » dans un instant.
  • Test t : à deux échantillons en supposant des variances inégales est également destiné aux mesures indépendantes, mais est utilisé lorsque vos variances sont inégales.

Pour tester si les variances de vos deux échantillons sont égales, vous devrez exécuter un test F. Trouve F-Test à deux échantillons pour les écarts dans la liste Outils d'analyse, sélectionnez-le et cliquez sur d'accord .

Entrez vos deux ensembles de données dans les zones de plage d'entrée. Laissez la valeur alpha à 0,05 à moins que vous n'ayez une raison de la changer -- si vous ne savez pas ce que cela signifie, partez. Enfin, cliquez d'accord .

Excel vous donnera les résultats dans une nouvelle feuille (sauf si vous avez sélectionné Plage de sortie et une cellule dans votre feuille actuelle):

Vous regardez la valeur P ici. S'il est inférieur à 0,05, vous avez écarts inégaux . Alors pour exécuter le t -test, vous devez utiliser l'option variances inégales.

Pour exécuter un t -test, sélectionnez le test approprié dans la fenêtre Outils d'analyse et sélectionnez les deux ensembles de vos données de la même manière que vous l'avez fait pour le test F. Laissez la valeur alpha à 0,05 et appuyez sur d'accord .

Les résultats incluent tout ce dont vous avez besoin pour déclarer un t -test : les moyennes, les degrés de liberté (df), la statistique t et les valeurs P pour les tests unilatéraux et bilatéraux. Si la valeur P est inférieure à 0,05, les deux échantillons sont significativement différents.

Si vous n'êtes pas sûr d'utiliser un appareil unilatéral ou bilatéral t -tester, vérifier cet explicateur de l'UCLA .

ANOVA dans Excel

L'outil Excel Data Analysis Toolpak propose trois types d'analyse de la variance (ANOVA). Malheureusement, cela ne vous donne pas la possibilité d'exécuter les tests de suivi nécessaires comme Tukey ou Bonferroni. Mais vous pouvez voir s'il existe une relation entre quelques variables différentes.

Voici les trois tests ANOVA dans Excel :

  • ANOVA : facteur unique analyse la variance avec une variable dépendante et une variable indépendante. Il est préférable d'utiliser plusieurs t -tests lorsque vous avez plus de deux groupes.
  • ANOVA : à deux facteurs avec réplication est similaire à la paire t -test; il s'agit de mesures multiples sur des sujets uniques. La partie « à deux facteurs » de ce test indique qu'il existe deux variables indépendantes.
  • ANOVA : à deux facteurs sans réplication implique deux variables indépendantes, mais aucune réplication dans la mesure.

Nous allons passer en revue l'analyse à un facteur ici. Dans notre exemple, nous examinerons trois ensembles de nombres, intitulés « Intervention 1 », « Intervention 2 » et « Intervention 3 ». Pour exécuter une ANOVA, cliquez sur L'analyse des données , puis sélectionnez ANOVA : facteur unique .

Sélectionnez la plage d'entrée et assurez-vous d'indiquer à Excel si vos groupes sont en colonnes ou en lignes. J'ai également sélectionné ici « Étiquettes de la première ligne » afin que les noms de groupe soient affichés dans les résultats.

Après avoir frappé d'accord , on obtient les résultats suivants :

Notez que la valeur P est inférieure à 0,05, nous avons donc un résultat significatif. Cela signifie qu'il existe une différence significative entre au moins deux des groupes du test. Mais parce qu'Excel ne fournit pas de tests pour déterminer lequel groupes diffèrent, le mieux que vous puissiez faire est de regarder les moyennes affichées dans le résumé. Dans notre exemple, l'intervention 3 semble être Probablement celui qui diffère.

Ce n'est pas statistiquement valable. Mais si vous voulez juste voir s'il y a une différence, et voir quel groupe est probablement à l'origine de cela, cela fonctionnera.

L'ANOVA à deux facteurs est plus compliquée. Si vous souhaitez en savoir plus sur l'utilisation de la méthode à deux facteurs, consultez cette vidéo de Sophia.org et le ' sans réplication ' et ' avec réplication ' exemples tirés de Real Statistics.

Corrélation dans Excel

Le calcul de la corrélation dans Excel est beaucoup plus simple que le t -test ou une ANOVA. Utilisez le L'analyse des données pour ouvrir la fenêtre Outils d'analyse et sélectionnez Corrélation .

Sélectionnez votre plage d'entrée, identifiez vos groupes sous forme de colonnes ou de lignes et indiquez à Excel si vous avez des étiquettes. Après cela, appuyez sur d'accord .

Vous n'obtiendrez aucune mesure d'importance, mais vous pouvez voir comment chaque groupe est corrélé avec les autres. Une valeur de un est une corrélation absolue, indiquant que les valeurs sont exactement les mêmes. Plus la valeur de corrélation est proche de un, plus la corrélation est forte.

Régression dans Excel

La régression est l'un des tests statistiques les plus couramment utilisés dans l'industrie, et Excel offre une puissance surprenante pour ce calcul. Nous allons exécuter une régression multiple rapide dans Excel ici. Si vous n'êtes pas familier avec la régression, consultez Guide de HBR sur l'utilisation de la régression pour les entreprises .

Disons que notre variable dépendante est la tension artérielle et que nos deux variables indépendantes sont le poids et la consommation de sel. Nous voulons voir quel est le meilleur prédicteur de la pression artérielle (ou s'ils sont tous les deux bons).

Cliquez sur L'analyse des données et sélectionnez Régression . Vous devez faire attention lorsque vous remplissez les zones de plage de saisie cette fois. Les Plage d'entrée Y boîte doit contenir votre unique variable dépendante. Les Plage d'entrée X box peut inclure plusieurs variables indépendantes. Pour une simple régression, ne vous inquiétez pas du reste (mais n'oubliez pas de dire à Excel si vous avez sélectionné des étiquettes).

Voici à quoi ressemble notre calcul :

Après avoir frappé d'accord , vous obtiendrez une grande liste de résultats. J'ai mis en évidence la valeur P ici pour le poids et l'apport en sel :

Comme vous pouvez le voir, la valeur P pour le poids est supérieure à 0,05, il n'y a donc pas de relation significative. La valeur P pour le sel, cependant, est inférieure à 0,05, ce qui indique qu'il s'agit d'un bon prédicteur de la pression artérielle.

Si vous prévoyez de présenter vos données de régression, n'oubliez pas que vous pouvez ajouter une ligne de régression à un nuage de points dans Excel. C'est un excellente aide visuelle pour cette analyse.

Statistiques Excel : étonnamment capables

Bien qu'Excel ne soit pas connu pour sa puissance statistique, il contient en fait des fonctionnalités très utiles, telles que l'outil PowerQuery , ce qui est pratique pour des tâches telles que la combinaison d' ensembles de données . (Apprenez à générer votre premier script Microsoft Power Query .) Il existe également le complément de statistiques Data Analysis Toolpak, qui fait vraiment ressortir certaines des meilleures fonctionnalités d'Excel. J'espère que vous avez appris à utiliser le Toolpak et que vous pouvez maintenant jouer par vous-même pour comprendre comment utiliser davantage de ses fonctions.

comment faire fonctionner ps4 plus rapidement

Avec ceci maintenant à votre actif, faites passer vos compétences Excel au niveau supérieur avec nos articles sur en utilisant la fonction de recherche d'objectifs d'Excel pour plus de traitement des données et rechercher des valeurs avec vlookup . À un moment donné, vous voudrez peut-être aussi apprendre à importer des données Excel dans Python .

Partager Partager Tweeter E-mail Supprimez ces fichiers et dossiers Windows pour libérer de l'espace disque

Besoin de libérer de l'espace disque sur votre ordinateur Windows ? Voici les fichiers et dossiers Windows qui peuvent être supprimés en toute sécurité pour libérer de l'espace disque.

Lire la suite
Rubriques connexes
  • Productivité
  • Tableur
  • Microsoft Excel
A propos de l'auteur Puis Albright(506 articles publiés)

Dann est un consultant en stratégie de contenu et marketing qui aide les entreprises à générer de la demande et des prospects. Il blogue également sur la stratégie et le marketing de contenu sur dannalbright.com.

Plus de Dann Albright

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Cliquez ici pour vous abonner