opgaver:Uge5
Pia Jensen (Talk | contribs) |
Pia Jensen (Talk | contribs) |
||
| Line 18: | Line 18: | ||
| − | == Opgave 1 - | + | == Opgave 1 - Lineær korrelation == |
Disse øvelser viser hvordan lineære korrelationer kan beregnes og visualiseres, metoder som er anvendelige på det meste data med flere parametre. | Disse øvelser viser hvordan lineære korrelationer kan beregnes og visualiseres, metoder som er anvendelige på det meste data med flere parametre. | ||
| Line 28: | Line 28: | ||
=== Spørgsmål 2 === | === Spørgsmål 2 === | ||
Beregn den linære korrelation, manuelt. Er de to variable korrelerede? | Beregn den linære korrelation, manuelt. Er de to variable korrelerede? | ||
| − | Hint: Beregn først kovarians matricen (ligning 1). | + | Hint: Beregn først kovarians matricen (ligning 1 i [[Media:multivariatstatistik.pdf|multivariatstatistik.pdf]] dokumentet). |
| − | + | ||
=== Spørgsmål 3 === | === Spørgsmål 3 === | ||
| Line 35: | Line 34: | ||
=== Spørgsmål 4 === | === Spørgsmål 4 === | ||
| − | Tag logaritmen af begge værdier, og plot resultatet igen. Diskuter forskellen, er korrelationen tydligere nu? | + | Tag logaritmen af begge værdier, og plot resultatet igen. Diskuter forskellen, er korrelationen tydligere nu? Beregn korrelationen for de logaritmiske værdier. Hvorfor er korrelationen anderledes end i spørgsmål 2? |
=== Spørgsmål 5 === | === Spørgsmål 5 === | ||
| − | Beregn korrelationen for de logaritmiske værdier. Hvorfor er korrelationen anderledes end i | + | Beregn korrelationen for de logaritmiske værdier. Hvorfor er korrelationen anderledes end i spørgsmål 2? |
=== Spørgsmål 6 === | === Spørgsmål 6 === | ||
| − | Lav et lineært fit af resultatet i spørgsmål 4. | + | Lav et lineært fit af resultatet i spørgsmål 4. Hvad er Chi^2 for fittet, beskriver en lineær relation forholdet? |
| + | |||
| + | |||
| + | == Opgave 2 - Flere korrelationer == | ||
| + | Disse øvelser viser mere med korrelationer. | ||
| + | |||
| + | * Du skal starte med at hente datasættet [[Media:opg2data.txt|opg2data.txt]]. | ||
| + | |||
| + | === Spørgsmål 1 === | ||
| + | Indlæs datasættet og beregn korrelationerne mellem de to variable. Er variablerne korrelerede? | ||
| + | |||
| + | === Spørgsmål 2 === | ||
| + | Lav et scatter plot af de to variable. Ved visuel inspektion, forklar hvorfor der ikke var en korrelation mellem de to akser i beregningen. | ||
| + | |||
| + | === Spørgsmål 3 === | ||
| + | Datasættet er genereret med følgende udtryk: | ||
| + | :<code>n = 2000; </code> | ||
| + | :<code>x = linspace(-1, 1, n);</code> | ||
| + | :<code>y = - 5 * (x.^2 - 1/2).^2 + unifrnd(-1, 1, [1 n])/3;</code> | ||
| − | + | Der er tydeligvis en afhængighed mellem x og y aksen. I hvilke tilfælde vil en lineær korrelation være et acceptabelt mål for korrelationen mellem to værdier? | |
== Opgave 3 - == | == Opgave 3 - == | ||
| + | Disse øvelser handler om radial acceleration (med Principal Component Analysis). | ||
Revision as of 12:32, 7 March 2012
I denne uge skal I arbejde med lidt mere avanceret statisk, som en forsmag på hvad I kan lære i mere avancerede statistik-kurser, som f.eks. Anvendt Statistik, der afholdes i blok 1.
Som en forberedelse på at kunne lave disse opgaver, skal I læse et lille dokument skrevet af Morten Dam Jørgensen, der desuden også lavede nedenstående opgaver.
- Dokument om multivariat statistik: multivariatstatistik.pdf
Det kan også hjælpe at læse nogle Wikipedia-sider om emnerne, som f.eks.
- Multivariate analysis
- Covariance Matrix
- Correlations
- Autocorrelations (valgfri)
- Principal Component Analysis
- Linear models
- Non-linear models (kernel methods)
- Fast fourier transforms - cool blog om FFT (valgfri)
Contents |
Opgave 1 - Lineær korrelation
Disse øvelser viser hvordan lineære korrelationer kan beregnes og visualiseres, metoder som er anvendelige på det meste data med flere parametre.
Spørgsmål 1
Start med at indlæse datafilen, og plot så populationen i forhold til landenes størrelse.
Spørgsmål 2
Beregn den linære korrelation, manuelt. Er de to variable korrelerede? Hint: Beregn først kovarians matricen (ligning 1 i multivariatstatistik.pdf dokumentet).
Spørgsmål 3
Beregn kovariansmatricen og korrelationsmatricen med MATLAB's indbyggedefunktioner, og sammenlign resultatet med dine egne beregninger.
Spørgsmål 4
Tag logaritmen af begge værdier, og plot resultatet igen. Diskuter forskellen, er korrelationen tydligere nu? Beregn korrelationen for de logaritmiske værdier. Hvorfor er korrelationen anderledes end i spørgsmål 2?
Spørgsmål 5
Beregn korrelationen for de logaritmiske værdier. Hvorfor er korrelationen anderledes end i spørgsmål 2?
Spørgsmål 6
Lav et lineært fit af resultatet i spørgsmål 4. Hvad er Chi^2 for fittet, beskriver en lineær relation forholdet?
Opgave 2 - Flere korrelationer
Disse øvelser viser mere med korrelationer.
- Du skal starte med at hente datasættet opg2data.txt.
Spørgsmål 1
Indlæs datasættet og beregn korrelationerne mellem de to variable. Er variablerne korrelerede?
Spørgsmål 2
Lav et scatter plot af de to variable. Ved visuel inspektion, forklar hvorfor der ikke var en korrelation mellem de to akser i beregningen.
Spørgsmål 3
Datasættet er genereret med følgende udtryk:
n = 2000;x = linspace(-1, 1, n);y = - 5 * (x.^2 - 1/2).^2 + unifrnd(-1, 1, [1 n])/3;
Der er tydeligvis en afhængighed mellem x og y aksen. I hvilke tilfælde vil en lineær korrelation være et acceptabelt mål for korrelationen mellem to værdier?
Opgave 3 -
Disse øvelser handler om radial acceleration (med Principal Component Analysis).