Statistiques (10h de CI)
Ce cours reprend en grande partie les enseignements délivrés en L1 et L2. Les étudiants de L3 PRO sont encouragés à visiter ces deux pages pour un complément d’information.
Introduction à l’utilisation du logiciel libre R (15h TD)
Séances 1-2
Introduction à R
- Pourquoi R?
- Présentation de RStudio
- Les expressions
- Les types
- La structure des données
- Manipulation de base des données
- Les conditions
- Les boucles
Statistiques descriptives
- Tendance centrale
- Dispersion
- Tables
- Premiers graphiques
Intervalles de confiance
- Intervalle de confiance de la moyenne sous la loi normale
- Intervalle de confiance de la médiane
- Intervalle de confiance d’un pourcentage
- Intervalle de confiance par bootstrap
Comparaison de moyennes
- Comparaison de deux moyennes (n grand ou loi normale)
- Comparaison de deux moyennes (n grand et séries appariées)
- Comparaison de deux moyennes (n petits et variables ne suivant pas une loi normale)
- Comparaison de deux moyennes (échantillons appariés et ne suivant pas une loi normale)
Comparaison de pourcentages
- Comparaison d’un pourcentage observé avec un pourcentage théorique.
- Comparaison d’une distribution observée avec une distribution théorique.
- Comparaison entre elles de plusieurs distributions observées.
Mesure de la liaison entre variables quantitatives
-
Coefficient de corrélation de Pearson
-
Coefficient de Spearman – la monotonie
-
La régression linéaire
Le matériel
Les fichiers a télécharger:
Le diaporama d’introduction: ppt, pdf
TD1-2
TD 3
-
Le TD3 en pdf
Ressources et liens
R pour les statophobes par Denis Poinsot (lien ou pdf).
Statistiques pour les statophobes par Denis Poinsot (lien ou pdf).
Aide-mémoire de statistiques appliquées à la biologie (lien ou pdf)
Statistiques avec R.Un site très bien fait sur l’utilisation de R, illustré par de nombreux exemples (ici).
Le logiciel R
Le logiciel RStudio
Bibliographie générale
Selon votre niveau, et compte tenu de la diversité des origines des L3PRO, je ne peux que vous recommander une visite des pages dédiées aux L1 et L2 STE où les statistiques descriptives, la théorie de l’échantillonnage, les tests paramétriques et non-paramétriques, et les techniques de régression sont détaillées.
En outre, de très nombreux manuels de statistiques existent. Dans la mesure du possible, privilégiez les livres écrits pour les biologistes, qui sont souvent plus digestes que ceux publiés pour les mathématiciens.
Voici une petite liste de bons livres pour maitriser le logiciel R:
Statistiques avec R, Pierre-André Cornillon, Relié: 276 pages, Editeur : Presses Universitaires de Rennes, Langue : Français
Analyse de données avec R, François Husson, Sébastien Lê et Jérôme Pagès, Relié: 226 pages, Editeur : Presses Universitaires de Rennes, Langue : Français
Régression avec R, Pierre-André Cornillon et Eric Matzner-Lober, Relié: 242 pages, Editeur : Springer, Paris, Langue : Français
Statistical data analysis explained. Applied Environmental Statistics with R., Clemens Reimann, Peter Fitzmoser, Robert Garrett, Rudolf Dutter, Relié: 362 pages, Editeur : Wiley, Langue : Anglais
Data Analysis and Graphics Using R: An Example-based Approach., John Maindonald and John Braun, Relié: 525 pages, Editeur : Cambridge, Langue : Anglais.
Bibliographie spécialisée
Statistics and data analysis in Geology, John C. Davis, 638 pages, Editeur : J. Wiley, Langue : Anglais
Practical nonparametric statistics, W.J. Conover, Relié: 589 pages, Editeur : John Wiley and Sons, Langue : Anglais
Très bon livre sur l’approche non-paramétrique. Facile à lire.
Pratique des tests nonparamétriques, P. Sprent, J.-P. Ley, Relié: 312 pages, Editeur : INRA, Langue : Français.