Tag Archives: statistiques

L’article ‘Compositional data analysis (CoDA) as a tool to evaluate a new low-cost settling-based PM10 sampling head in a desert dust source region’ par Xu-Yang et al. publié dans Atmospheric Measurement Techniques

Le dispositif installé en Tunisie (Photo Rémi Losno)
This image has an empty alt attribute; its file name is pdf.jpg

Yangjunjie Xu-Yang, dans le cadre de son doctorat encadré par Rémi Losno, vient de publier dans Atmospheric Measurement Technique, un article qui présente un nouveau collecteur de PM10. L’utilisation de la technique statistique CoDA permet de démontrer que les collecteurs spécifiques (et chers), généralement utilisé pour ce type de prélèvement, peuvent être remplacés efficacement par la technique proposée. Aucun biais n’est à déplorer dans la composition chimique du matériel échantillonné. L’appareil est bon marché, et il est simple à construire, même dans des lieux où l’accès aux fournitures est délicat.

Read more »

Statistiques – L3 ST (10h CM – 15h TP)


Rappels

Les bases

  • Philosophie
  • Quelques définitions
  • Présentation des données
  • Paramètres d’une distribution

Statistiques inférentielles

  • Pourquoi utiliser des statistiques inférentielles?
  • Hypothèses
  • Décision et erreurs
  • Paramétriques ou non paramétriques?
  • Quelques tests parmi les plus courants

Comparaison de k groupes

Analyse de variance à 1 facteur

  • Principe
  • Formalisation
  • Conditions d’application
  • Tests a posteriori

Alternatives non-paramétriques

  • Le test de Kruskal-Wallis
  • Autres

Analyse spatiale avec R – une rapide introduction 

Rappels de statistiques

  • Le test de Kolmogorov-Smirnov
  • La loi de Poisson

Analyse spatiale des motifs (point pattern analysis)

  • Distribution spatiale: le but
  • Analyse des quadrats
  • Analyse du plus proche voisin
  • La fonction G
  • La fonction F
  • Le K de Ripley
  • Représentation par densité kernel

Auto-corrélation spatiale

  • Le principe
  • Un exemple temporel
  • Auto-corrélation spatiale
  • L’indice de Moran
  • Test et graphe de l’indice de Moran

Interpolation

  • Le principe
  • Diagramme de Voronoï
  • IDW: Inverse distance weighted interpolation

Le matériel

CM ANOVAun examplefichiers et correction

CM Kruskal-Wallisun exemplecorrection

CM Statistiques spatiales

TD/TP1 – Apprentissage de R, les données: haches-pour-R.txt; voir aussi ici

TD/TP2 – Tests paramétriques et non-paramétriques –

TD/TP3 – Tests (suite) et régression linéaire, les données : bresilL3

TD/TP4-5 – Analyse spatiale, Les données : PNRM.zip


Ressources et liens

Dès la première séance de TP, les logiciels R et RStudio seront installés (dans cet ordre) sur vos machines personnelles. La vidéo ci-dessous décrit brièvement les principales étapes de l’installation (en cas de besoin), mais aussi l’interface de RStudio .


Des packages pourront être installés (tuto ici en cas de problèmes).

Le logiciel R
Le logiciel RStudio

R pour les statophobes par Denis Poinsot (lien ou pdf).
Statistiques pour les statophobes par Denis Poinsot (lien ou pdf).
Aide-mémoire de statistiques appliquées à la biologie (lien ou pdf)

Statistiques avec R.Un site très bien fait sur l’utilisation de R, illustré par de nombreux exemples (ici).

Un site incontournable pour l’analyse spatiale et R: rspatial

Un excellent livre en pdf sur le net: Analyse spatiale sous R de Nicolas Casajus. ou ici en pdf si le lien ne fonctionne pas.


Bibliographie générale

Voici une liste non exhaustive de bons livres pour maîtriser le logiciel R:

Statistiques avec R, Pierre-André Cornillon, Relié: 276 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Analyse de données avec R, François Husson, Sébastien Lê et Jérôme Pagès, Relié: 226 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Régression avec R, Pierre-André Cornillon et  Eric Matzner-LoberRelié: 242 pages,  Editeur : Springer, Paris,  Langue : Français

Statistical data analysis explained. Applied Environmental Statistics with R., Clemens Reimann, Peter Fitzmoser, Robert Garrett, Rudolf DutterRelié: 362 pages,  Editeur : Wiley,  Langue : Anglais

Data Analysis and Graphics Using R: An Example-based Approach., John Maindonald and John BraunRelié: 525 pages,  Editeur : Cambridge,  Langue : Anglais.

Bibliographie spécialisée

Statistics and data analysis in Geology, John C. Davis638 pages,  Editeur : J. Wiley, Langue : Anglais

Très bon livre comme le Swan et Sandilands, excepté que celui là est disponible. Plutôt cher (aux alentours de 150$), il constitue néanmoins un bon investissement pour l’avenir.

Applied Spatial data analysis, Edzer J. Pebesma et Roger S. Bivand. Relié: 405 p. Editeur: Springer, Langue : Anglais.

La référence concernant l’analyse spatiale avec R!

Séries temporelles avec R, Aragon, Yves. Relié. Editeur: Springer, Langue : Français.

Très bon livre pour débuter avec les séries temporelles sur R.

statsspat

lien

Statistiques, quantification et analyse spatiale- M1 ASA

Rappels de statistiques et introduction à l’utilisation du logiciel libre R 

Statistiques descriptives

  • Tendance centrale
  • Dispersion
  • Tables
  • Premiers graphiques

Intervalles de confiance

  • Intervalle de confiance de la moyenne sous la loi normale
  • Intervalle de confiance de la médiane
  • Intervalle de confiance d’un pourcentage
  • Intervalle de confiance par bootstrap

Comparaison de moyennes

  • Comparaison de deux moyennes (n grand ou loi normale)
  • Comparaison de deux moyennes (n grand et séries appariées)
  • Comparaison de deux moyennes (n petits et variables ne suivant pas une loi normale)
  • Comparaison de deux moyennes (échantillons appariés et ne suivant pas une loi normale)
  • Comparaison simultanée de plus de deux moyennes: l’ANOVA (n grand ou échantillons suivant une loi normale)
  • Comparaison simultanée de plus de deux moyennes: Le test de Kruskal Wallis (n petit ou échantillons ne suivant une loi normale).

 Comparaison de pourcentages

  • Comparaison d’un pourcentage observé avec un pourcentage théorique.
  • Comparaison d’une distribution observée avec une distribution théorique.
  • Comparaison entre elles de plusieurs distributions observées.

Mesure de la liaison entre variables quantitatives

  • Coefficient de corrélation de Pearson
  • Coefficient de Spearman – la monotonie
  • La régression linéaire

Introduction à R

  • Manipulation des objets
  • Vecteurs et matrices

 


Analyse spatiale avec R – une rapide introduction 

Rappels de statistiques

  • Le test de Kolmogorov-Smirnov
  • La loi de Poisson

Analyse spatiale des motifs (point pattern analysis)

  • Distribution spatiale: le but
  • Analyse des quadrats
  • Analyse du plus proche voisin
  • La fonction G
  • La fonction F
  • Le K de Ripley
  • Représentation par densité kernel

Interpolation

  • Le principe
  • Diagramme de Voronoï
  • IDW: Inverse distance weighted interpolation

Le matériel

Les fichiers a télécharger pour les TD:


Ressources et liens

R pour les statophobes par Denis Poinsot (lien ou pdf).
Statistiques pour les statophobes par Denis Poinsot (lien ou pdf).
Aide-mémoire de statistiques appliquées à la biologie (lien ou pdf)

Statistiques avec R. Un site très bien fait sur l’utilisation de R, illustré par de nombreux exemples (ici).

Le logiciel R
Le logiciel RStudio

Pour les étudiants n’ayant pas de formations préalables en statistiques et/ou sur R, il est indispensable de lire attentivement ces deux documents avant la première séance de TP:

R pour les statophobes par Denis Poinsot (lien ou pdf).
Statistiques pour les statophobes par Denis Poinsot (lien ou pdf).

Dès la première séance de TP, les logiciels R et RStudio seront installés (dans cet ordre) sur vos machines personnelles. La vidéo ci-dessous décrit brièvement les principales étapes de l’installation (en cas de besoin), mais aussi l’interface de RStudio .


Des packages pourront être installés (tuto ici en cas de problèmes).


Précisions sur le TP Analyse Spatiale

Travail à réaliser impérativement sur son ordinateur personnel avant le TP en salle.

Installer R et RStudio, si ce n’est pas déjà fait (voir ci-dessus).

Le TP Analyse Spatiale à télécharger (en format doc). Les données à télécharger: PNRM.zip.

Installation des packages:

Les packages à installer sont mentionnés dans la feuille de TD: terra, raster, sp, rgdal, rgeos, spatstat, maptools, dismo, gstat, spdep. Pour le package terra, il peut être nécessaire d’utiliser l’instruction suivante dans la console R:

install.packages('terra', repos='https://rspatial.r-universe.dev')

Vous trouverez plus d’information à l’adresse suivante: https://github.com/rspatial/terra
Afin de vérifier la configuration, vous devrez essayer dans la console :

library(raster)
library(terra)
library(sp)
library(rgdal)
library(rgeos)
library(spatstat)
library(maptools)
library(dismo)
library(gstat)
library(spdep)

Il y aura des messages d’avertissement (ce qui est normal), mais il ne doit pas y avoir d’erreurs. Lancer ces instructions une deuxième fois ne devrait plus produire aucun message.

 


Bibliographie générale

Selon votre niveau, et compte tenu de la diversité des origines des M2 AGE, je ne peux que vous recommander une visite des pages dédiées aux L1 et L2 ST où les statistiques descriptives, la théorie de l’échantillonnage, les tests paramétriques et non-paramétriques, et les techniques de régression sont détaillées.

En outre, de très nombreux manuels de statistiques existent. Dans la mesure du possible, privilégiez les livres écrits pour les biologistes, qui sont souvent plus digestes que ceux publiés pour les mathématiciens.

Voici une liste non exhaustive de bons livres pour maitriser le logiciel R:

Statistiques avec R, Pierre-André Cornillon, Relié: 276 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Analyse de données avec R, François Husson, Sébastien Lê et Jérôme Pagès, Relié: 226 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Régression avec R, Pierre-André Cornillon et  Eric Matzner-Lober, Relié: 242 pages,  Editeur : Springer, Paris,  Langue : Français

Statistical data analysis explained. Applied Environmental Statistics with R., Clemens Reimann, Peter Fitzmoser, Robert Garrett, Rudolf Dutter, Relié: 362 pages,  Editeur : Wiley,  Langue : Anglais

Data Analysis and Graphics Using R: An Example-based Approach., John Maindonald and John Braun, Relié: 525 pages,  Editeur : Cambridge,  Langue : Anglais.


Bibliographie spécialisée

Introduction to Geological Data Analysis, A.R.H. Swan, M. Sandilands , 446 pages,  Editeur : Blackwell Sciences, Langue : Anglais

Très bon livre dédié aux géologues et environnementalistes. Les procédures sont détaillées à partir de problèmes concrets. Très utile également pour les archéologues et les étudiants issus de Vigne et Vin. Malheureusement épuisé.

Statistics and data analysis in Geology, John C. Davis, 638 pages,  Editeur : J. Wiley, Langue : Anglais

Très bon livre comme le Swan et Sandilands, excepté que celui là est disponible. Plutôt cher (aux alentours de 150$), il constitue néanmoins un bon investissement pour l’avenir.

Statistics in archaeology, Michael Baxter 291 pages,  Editeur : Arnold Applications of statistics, Langue : Anglais

Très bon livre qui montre comment des techniques de pointe (de statistiques) peuvent être appliquées à l’archéologie. Attention, les procédures ne sont pas réellement détaillées! Une connaissance préalable assez poussée est requise.

Pratique archéologique statistique et graphique, Robert Chenorkian, 140 pages,  Editeur : Errance, Langue : Français. Un livre épuisé dont on peut s’économiser la lecture. Mieux vaut privilégier les ouvrages cités au dessus.

L’article :”Perturbation vectors to evaluate air quality using lichens and bromeliads. A Brazilian case study” publié par Environmental Monitoring and Assessment

Vue depuis le Parque Nacional da Serra dos Órgãos

Téléchargez le pdf : ici.

L’article “Perturbation vectors to evaluate air quality using lichens and bromeliads. A Brazilian case study”  par Monna, F., Marques Jr., A.N., Guillon, R., Losno, R., Couette, S., Navarro, N., Dongarra, G., Tamburo, E., Varrica, D., Chateau, C., et Nepomuceno, F.O., vient d’être publié par Environmental Monitoring and Assessment, 2017, 189:566.

Les lichens et les broméliades sont des organismes épiphytes capables d’accumuler, par voie atmosphériques, les métaux bien au delà de leurs besoins physiologiques. Ils ont été utilisés ici pour caractériser quatre zonesdifféremment affectés par l’activité anthropique; toutes situées autour de Rio de Janeiro. L’originalité de ce travail consiste à traiter les données à l’aide d’un opérateur mathématique sous-employé: le vecteur perturbation qui traduit les changements en termes de composition chimique. Il appartient à une famille statistique appelée analyse compositionnelle (CoDA). Son application à un large spectre de problèmes géochimiques pourrait bien faciliter l’interprétation des nombreux résultats collectés.

Read more »

L1 statistiques – Exercice 28

Correction pour un modèle CASIO

L1 statistiques – Exercice 27

Correction pour un modèle CASIO

L1 statistiques – Exercice 25

Correction pour un modèle CASIO

L1 statistiques – Exercice 23

Correction pour un modèle CASIO

L1 statistiques – Exercice 24

Correction pour un modèle CASIO

L1 statistiques – Exercice 21

Correction pour un modèle CASIO

L1 statistiques – Exercice 20

Correction pour un modèle CASIO

L1 statistiques – Exercice 19

Correction pour un modèle CASIO

 

L1 statistiques – Exercice 18

Correction pour un modèle CASIO

L1 statistiques – Exercice 17

Correction pour un modèle CASIO

 

L1 statistiques – Exercice 7

Le chargement peut prendre quelques secondes

Un plug-in Flash à jour est requis: (ici)

Correction pour un modèle CASIO