Notitie
Les ontwikkeld door Linfiniti en S Motala (Cape Peninsula University of Technology)
Ruimtelijke statistieken stellen u in staat te analyseren en te begrijpen wat er gaande is in een bepaalde vector gegevensset. QGIS bevat verschillende standaard gereedschappen voor statistische analyses die in dit opzicht hun nut hebben bewezen.
The goal for this lesson: To know how to use QGIS’ spatial statistics tools.
We zullen een willekeurige verzameling van punten maken om een punt gegevensset te krijgen om mee te werken,
U heeft, om dat te doen, een polygoon gegevensset nodig die het bereik van het gebied waarin u de punten wilt maken definieert.
We zullen het gebied gebruiken dat wordt bedekt door straten.
Notitie
You might find that your SRTM DEM layer has a different CRS to that of the roads layer. If so, you can reproject either the roads or DEM layer using techniques learnt earlier in this module.
Now you can check the sampled data from the raster file in the attributes table of the random_samples layer, they will be in a column named srtm_41_19.tif.
Een mogelijke laag voor het monster wordt hier weergegeven:
The sample points are classified by their value such that darker points are at a lower altitude.
U zult deze monster-laag gaan gebruiken voor de rest van de statistische oefeningen.
Nu nog de basisstatistieken voor deze laag ophalen.
Notitie
You can copy and paste the results into a spreadsheet. The data uses a (colon :) separator.
To understand the statistics above, refer to this definition list:
De gemiddelde waarde is eenvoudigweg de som van de waarden, gedeeld door het aantal waarden.
De standaard afwijking. Geeft een indicatie over hoe dicht de waarden zijn geclusterd rondom het gemiddelde. Hoe kleiner de standaard afwijking, hoe meer waarden neigen naar het gemiddelde.
Alle waarden bij elkaar opgeteld.
De laagste waarde.
De hoogste waarde.
Het aantal monsters/waarden.
Het verschil tussen de laagste en de hoogste waarden.
Als u alle waarden schikt van de laagste tot de hoogste, is de middelste waarde (of het gemiddelde van de twee middelste waarden als N een even getal is) de mediaan van de waarden.
To generate a distance matrix using these points:
Stel het als volgt in:
To do a nearest neighbor analysis:
Notitie
You can copy and paste the results into a spreadsheet. The data uses a (colon :) separator.
De gemiddelde coördinaten van een gegevensset verkrijgen:
Laten we dit eens vergelijken met de centrale coördinaat van de polygoon die werd gebruikt om het willekeurige monster te maken.
As you can see from the example below, the mean coordinates and the center of the study area (in orange) don’t necessarily coincide:
The histogram of a dataset shows the distribution of its values. The simplest way to demonstrate this in QGIS is via the image histogram, available in the Layer Properties dialog of any image layer.
Selecteer Eigenschappen.
Kies de tab Histogram. U moet misschien op de knop Histogram herberekenen klikken om de grafiek te genereren. U zult een grafiek zien die de frequentie van de waarden in de afbeelding beschrijft.
U kunt dat als een afbeelding exporteren:
The mean value is 332.8, and the maximum value is 1699! But those values don’t show up on the histogram. Why not? It’s because there are so few of them, compared to the abundance of pixels with values below the mean. That’s also why the histogram extends so far to the right, even though there is no visible red line marking the frequency of values higher than about 250.
Onthoud daarom dat een histogram u de verdeling van de waarden laat zien en dat niet alle waarden noodzakelijkerwijze ook zichtbaar zijn in de grafiek.
Let’s say you have a collection of sample points from which you would like to extrapolate data. For example, you might have access to the random_samples dataset we created earlier, and would like to have some idea of what the terrain looks like.
To start, launch the Grid (Interpolation) tool by clicking on the Raster ‣ Analysis ‣ Grid (Interpolation) menu item.
Hier is een vergelijking van de originele gegevensset (links) met die welke we hebben gemaakt uit onze monsterpunten (rechts). Die van u kan er anders uitzien vanwege de willekeurige herkomst van de locatie van de monsterpunten.
As you can see, 100 sample points aren’t really enough to get a detailed impression of the terrain. It gives a very general idea, but it can be misleading as well. For example, in the image above, it is not clear that there is a high, unbroken mountain running from east to west; rather, the image seems to show a valley, with high peaks to the west. Just using visual inspection, we can see that the sample dataset is not representative of the terrain.
Gebruik die punten om een monster te nemen uit de originele DEM.
De resultaten (afhankelijk van de positie van uw willekeurige punten) zal er min of meer zo uitzien:
The border shows the roads_hull layer (which represents the boundary of the random sample points) to explain the sudden lack of detail beyond its edges. This is a much better representation of the terrain, due to the much greater density of sample points.
Here is an example of what it looks like with 10 000 sample points:
Notitie
It’s not recommended that you try doing this with 10 000 sample points if you are not working on a fast computer, as the size of the sample dataset requires a lot of processing time.
Originally a separate project and then accessible as a plugin, the SEXTANTE software has been added to QGIS as a core function from version 2.0. You can find it as a new QGIS menu with its new name Processing from where you can access a rich toolbox of spatial analysis tools allows you to access various plugin tools from within a single interface.
You will probably see it docked in QGIS to the right of the map. Note that the tools listed here are links to the actual tools. Some of them are SEXTANTE’s own algorithms and others are links to tools that are accessed from external applications such as GRASS, SAGA or the Orfeo Toolbox. This external applications are installed with QGIS so you are already able to make use of them. In case you need to change the configuration of the Processing tools or, for example, you need to update to a new version of one of the external applications, you can access its setting from Processing ‣ Options and configurations.
For a simple indication of the spatial distribution of points in the random_samples dataset, we can make use of SAGA’s Spatial Point Pattern Analysis tool via the Processing Toolbox you just opened.
Notitie
If SAGA is not installed on your system, the plugin’s dialog will inform you that the dependency is missing. If this is not the case, you can skip these steps.
Included in your course materials you will find the SAGA installer for Windows.
Once you have installed SAGA, you’ll need to configure SEXTANTE to find the path it was installed under.
Homebrew users can install SAGA with this command:
If you do not use Homebrew, please follow the instructions here:
http://sourceforge.net/apps/trac/saga-gis/wiki/Compiling%20SAGA%20on%20Mac%20OS%20X
Now that you have installed and configured SAGA, its functions will become accessible to you.
The output will look like this (the symbology was changed for this example):
The red dot is the mean center; the large circle is the standard distance, which gives an indication of how closely the points are distributed around the mean center; and the rectangle is the bounding box, describing the smallest possible rectangle which will still enclose all the points.
Often, the output of an algorithm will not be a shapefile, but rather a table summarizing the statistical properties of a dataset. One of these is the Minimum Distance Analysis tool.
It does not require any other input besides specifying the vector point dataset to be analyzed.
QGIS heeft vele mogelijkheden voor het analyseren van de ruimtelijke statistische eigenschappen van gegevenssets.
Nu we vectoranalyse hebben behandeld, waarom niet eens kijken wat er met rasters gedaan kan worden? Dat is wat we zullen gaan doen in de volgende module!