opgaver:Uge4

From Eksperimentel Fysik WIKI
(Difference between revisions)
Jump to: navigation, search
m (RO: linie --> linje)
 
(11 intermediate revisions by one user not shown)
Line 1: Line 1:
I denne opgave skal I, lige som i sidste uge, fabrikere jeres egne data - denne gang en Gaussisk linieprofil med en bestemt bredde og placering, med Poisson statistik på tælletallene.
+
I denne opgave skal I, lige som i sidste uge, fabrikere jeres egne data - denne gang en Gaussisk linjeprofil med en bestemt bredde og placering, med Poisson statistik på tælletallene.
  
  
 
== Opgave 1 - Spektrometer ==
 
== Opgave 1 - Spektrometer ==
Vi forestiller os et spektrometer, der tæller fotoner som funktion af bølgelængde; én bølgelængde ad gangen. Vi skal måle en enkelt spektrallinie. Liniens amplitude er 100 tællinger per sekund, liniens centrum 5000 Å, og den har bredde ($\sigma$) 50 Å. Der er en baggrund på 10 tællinger per sekund. Usikkerheden på tællinger er givet som $\sqrt{N}$ tællestatistik, og antages gaussisk.
+
Vi forestiller os et spektrometer, der tæller fotoner som funktion af bølgelængde; én bølgelængde ad gangen. Vi skal måle en enkelt spektrallinje. Linjens amplitude er 100 tællinger per sekund, linjens centrum 5000 Å, og den har bredde $\sigma$ 50 Å. Der er en baggrund på 10 tællinger per sekund. Usikkerheden på tællinger er givet som $\sqrt{N}$ tællestatistik, og antages gaussisk.
  
 
=== Spørgsmål 1 - Simulation af data ===
 
=== Spørgsmål 1 - Simulation af data ===
Simulér en måleserie fra 4500 Å til 5500 Å med step af 10 Å, ét sekund per punkt. Brug MATLAB <code>fit</code> funktionen til at fitte en Gaussisk linieprofil til dataen. Vis de simulerede data og det bedste fit i samme plot.
+
Simulér en måleserie fra 4500 Å til 5500 Å med step af 10 Å, ét sekund per punkt. Brug MATLAB <code>fit</code> funktionen til at fitte en Gaussisk linjeprofil til dataen. Vis de simulerede data og det bedste fit i samme plot.
 
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
Ligesom i sidste uge skal vi simulere nogle støjede data ud fra en kendt model. Start med at lave dine model-data, og tilføj så støj ved at lægge et tal til hvert af punkternes tælletal-værdi. Støjen skal være et tal der er Gaussisk fordelt omkring nul, med en bredde der er usikkerheden på punktet (og usikkerheden på punktet er jo givet ved tællestatistik!). Husk at tælletal er positive heltal, så du er nødt til at runde støjen op eller ned til heltal.
  
 +
Det kan være en god idé at læse lidt i MATLAB hjælpen om funktionerne <code>randn</code>, <code>round</code> og <code>abs</code>.
 +
 +
Det er vigtigt at holde styr på forskellen mellem bredden af spektrogram-peaken som du laver data over, og bredden på den støj du lægger til dine simulerede datapunkter.
 
{{hidden end}}
 
{{hidden end}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
Først defineres parametrene for den Gaussiske linjeprofil-model. Her defineres signalets amplitude <code>a</code>, baggrundens amplitude <code>d</code>, centrum af peaken <code>x0</code> og bredden af peaken <code>sig</code>
 +
 +
:<code>a = 100;</code>
 +
:<code>b = 10;</code>
 +
:<code>x0 = 5000;</code>
 +
:<code>sig = 50;</code>
 +
 +
videre skal akserne for eksperimentet bestemmes; start og slut for hvor der skal måles, <code>x_min</code> og <code>x_max</code>, samt step-størrelsen <code>x_step</code>.
 +
 +
:<code>x_min = 4500;</code>
 +
:<code>x_max = 5500;</code>
 +
:<code>x_step = 10;</code>
 +
 +
Med disse definitioner er det nu muligt automatisk at lave sin <code>x</code>-akse med
 +
 +
:<code>x_exp = x_min : x_step : x_max;</code>
 +
 +
og til sidst kan man også finde hvor lang tid der måles per datapunkt,
 +
 +
:<code>t = 1;</code>
 +
 +
Nu kan man udregne sit model-datasæt ved at indsætte alle sine informationer i en Gaussisk funktion,
 +
 +
:<code>y_model = t * a * exp( - (( x_exp - x0 ).^2) ./ (2*sig^2) ) + t * b;</code>
 +
 +
Nu er det tid til at lægge støj på punkterne, så man får et simuleret datasæt. Først og fremmest findes en vektor der indeholder usikkerheden på hvert punkt af sin model. Modellen er for tælletal, så denne usikkerhed er bare $\sqrt{N}$, og
 +
 +
:<code>err_model = sqrt(y_model);</code>
 +
 +
Det nye datasæt kan så laves ved at lægge en Gaussisk støj med bredden givet element-vist i <code>err_model</code>, runde af til nærmeste heltal, og til sidst sørge for at tallet er positivt:
 +
 +
:<code>y_exp = abs(round( y_model + err_model .* randn(size(err_model)) ));</code>
 +
 +
Usikkerheden på de simulerede datapunkter er dog ikke den usikkerhed man fandt for modellen. Hvis man målte disse punkter i den virkelige verden ville man i stedet bruge
 +
 +
:<code>err_exp = sqrt(y_exp);</code>
 +
 +
Man kan nu lave et fit til de simulerede data, ved hjælp af MATLAB's indbyggede <code>fit</code> funktion. Denne gang skal man fitte til en funktion man selv skriver ind:
 +
 +
:<code>f1 = fit(x_exp',y_exp','a*exp(-((x-b).^2)/(2*c^2))+d',...</code>
 +
::<code>'Startpoint', [a*t x0 sig b*t]);</code>
 +
 +
Her er <code>Startpoint</code> option'en de første gæt til de fire parametre, altså amplitude, centrum, bredde og baggrund. Her er de bare givet som modellens værdier - men i den virkelige verden kender man selvfølgelig ikke modellen perfekt, og man må bare give nogle cirka-gæt.
 +
 +
De fundne fit-parametre kan man få fra <code>f1</code> objektet. Selve <code>fit</code> funktionen kalder dem for <code>a</code>, <code>b</code>, <code>c</code> og <code>d</code> - efter hvad der blev skrevet som fit-funktion. De numeriske værdier af de bedste parameter-værdier fås så ved f.eks. <code>f1.a</code>. De fire interessante fittede parametre er altså
 +
 +
:<code>a_fit = f1.a/t;</code>
 +
:<code>x0_fit = f1.b;</code>
 +
:<code>sig_fit = f1.c;</code>
 +
:<code>b_fit = f1.d/t;</code>
 +
[[File:uge4fig2.png|frame|De simulerede datapunkter for en Gaussisk linjeprofil, sammen med et Gaussisk fit.]]
 +
og med disse kan man udregne fit-linjen
 +
 +
:<code>x_fit = x_min:0.05:x_max;</code>
 +
:<code>y_fit = t*a_fit(j)*exp(-((x_fit-x0_fit(j)).^2)./(2*sig_fit(j)^2)) + t*b_fit(j);</code>
 +
 +
Til sidst kan man plotte de simulerede datapunkter sammen med fit-linjen,
 +
 +
:<code>figure</code>
 +
:<code>errorbar(x_exp,y_exp,err_exp,'b.','MarkerFaceColor', [0.4 0.4 0.8],...</code>
 +
::<code>'MarkerEdgeColor',[0.4 0.4 0.8])</code>
 +
:<code>hold on</code>
 +
:<code>plot(x_fit,y_fit,'g-')</code>
 +
:<code>axis([x_min-50 x_max+50 0 (a+b)*1.2*t])</code>
 +
:<code>xlabel('Bølgelængde [Å]')</code>
 +
:<code>ylabel('Intensitet [tællinger/s]')</code>
  
 +
Figuren kan ses her til højre.
 
{{hidden end}}
 
{{hidden end}}
  
 
=== Spørgsmål 2 - Flere måleserier ===
 
=== Spørgsmål 2 - Flere måleserier ===
Kør 100 måleserier og lav histogrammer over fitværdierne. Brug histogrammer til at bestemme præcisionen af eksperimentet.
+
Kør 100 måleserier og lav histogrammer over fitværdierne. Brug histogrammerne til at bestemme præcisionen af eksperimentet.
 +
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
Du skal bare bruge den samme kode som du brugte til spørgsmål 1, men nu skal du "pakke" den ind i et loop, hvor du yderligere gemmer dine fit-parametre i arrays, så de kan plottes bagefter.
 +
{{hidden end}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
For at gøre dette, skal man lave et loop over adskillige data-simulationer og fits. Som det første skal man initialisere arrays der skal gemme fit-parametrene:
  
 +
:<code>N = 100;</code>
 +
:<code>a_fit = zeros(1,N);</code>
 +
:<code>b_fit = zeros(1,N);</code>
 +
:<code>x0_fit = zeros(1,N);</code>
 +
:<code>sig_fit = zeros(1,N);</code>
 +
 +
Herefter kan man starte sit loop lige før man udregner sine eksperiment-data, altså
 +
 +
:<code>for j = 1:N</code>
 +
::<code>y_exp = abs(round( y_model + err_model .* randn(size(err_model)) ));</code>
 +
::<code>...</code>
 +
 +
Fit parametrene gemmes, og så kan loopet stoppes igen,
 +
 +
::<code>...</code>
 +
::<code>a_fit(j)  = f1.a/t;</code>
 +
::<code>x0_fit(j)  = f1.b;</code>
 +
::<code>sig_fit(j) = f1.c;</code>
 +
::<code>b_fit(j)  = f1.d/t;</code>
 +
:<code>end</code>
 +
 +
Herefter kan man lave histogrammer over parametrene ved hjælp af MATLAB's <code>hist</code> funktion, og se på formen af dem. F.eks. kan man bestemme bredden af distributionerne, for at se hvor nemt det var for fittet at finde den rigtige værdi.
 
{{hidden end}}
 
{{hidden end}}
  
 
=== Spørgsmål 3 - Planlægning af måling ===
 
=== Spørgsmål 3 - Planlægning af måling ===
(SVÆRT) Hvis der er 100 sekunder til rådighed, hvordan skal målingen så planlægges for at bestemme liniens midtpunkt bedst? Og hvad med liniens bredde?
+
(SVÆRT) Hvis der er 100 sekunder til rådighed, hvordan skal målingen så planlægges for at bestemme linjens midtpunkt bedst? Og hvad med linjens bredde?
 
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
Tænk over hvordan du ville gøre hvis du faktisk sad ved et eksperiment og intet vidste på forhånd. Ville du bare gå i gang fra en ende af og måle punkt efter punkt, eller ville du hoppe rundt og håbe på at du var heldig? Tænk over forskellige fordele og ulemper.
  
 +
Når du har tænkt over de forskellige måder du kunne finde på at måle, så prøv at lave målingerne ved hjælp af MATLAB, og kør et loop så du kan sammenligne distributionerne for de fundne fitte-parametre.
 
{{hidden end}}
 
{{hidden end}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
Som en første iteration kan man se hvad der sker med statistikken hvis man måler på en ligeligt opdelt linje, med samme tælletid for hvert punkt. Start med at omdefinere din værdi af <code>t</code> til at blive udregnet med
  
 +
:<code>t_meas = 100;</code>
 +
:<code>t = t_meas / length(x_exp);</code>
 +
 +
hvor <code>t_meas</code> er den totale tid der skal måles i. Nu kan du køre dit loop, og se på distributionen af dine fitte-parametre. Prøv evt. at ændre på step-størrelsen af dine målinger, så du får færre eller flere datapunkter, mens du stadig tæller den samme tid totalt. Ændrer dette noget ved distributionerne?
 +
 +
Du kan også prøve at lave en dataserie hvor du først måler meget kort tid på mange ligeligt fordelte punkter, og så bagefter måler i lidt længere tid nogle af de steder hvor det ser ud til at der er en peak.
 +
 +
Hvis du gerne vil kode lidt mere avanceret, kan du jo forsøge at kode en søger-mekanisme, som altid vil forsøge at finde det højeste punkt af en peak.
 +
 +
Der er rigtig mange muligheder for at måle på det givne signal, og mange af dem er lige gode. Det vigtige med denne opgave er at I tænker over hvordan I ville optimere den tid I er givet til et sådant eksperiment.
 
{{hidden end}}
 
{{hidden end}}
  
 
=== Spørgsmål 4 - Stor baggrund ===
 
=== Spørgsmål 4 - Stor baggrund ===
 
(SVÆRT) Lad baggrunden være 100 tællinger per sekund og amplituden være 10 tællinger per sekund. Hvor længe skal der tælles for at det kan afgøres, om der er en peak (amplitude signifikant større end nul)?
 
(SVÆRT) Lad baggrunden være 100 tællinger per sekund og amplituden være 10 tællinger per sekund. Hvor længe skal der tælles for at det kan afgøres, om der er en peak (amplitude signifikant større end nul)?
{{hidden begin|toggle=right|title=Hint|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
 
{{hidden end}}
 
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 
{{hidden begin|toggle=right|title=Løsning|titlestyle=background:#ccccff|bg2=#eeeeee}}
 +
For at udregne svaret, løses det hvornår toppunktet for peaken ligger $n$ gange sin usikkerhed plus $n$ gange usikkerheden på baggrunden, væk fra baggrunden. Dette løses med
  
 +
:$\begin{align}
 +
(a+b)t - n\sqrt{(a+b)t} &= bt + n \sqrt{bt} \\
 +
at - n\sqrt{(a+b)t} &= n \sqrt{bt} \\
 +
at &= n (\sqrt{bt} + \sqrt{(a+b)t}) \\
 +
a^2 t^2 &= n^2 (bt + (a+b)t + 2 \sqrt{b(a+b)}t) \\
 +
a^2 t &= n^2 (2b + a + 2\sqrt{b(a+b)}) \\
 +
t &= \dfrac{n^2 (2b + a + 2\sqrt{b(a+b)})}{a^2}
 +
\end{align}$
 +
 +
så hvis f.eks. $a=10$, $b=100$ og $n=1$, så er $t=4.2\,\text{s}$ for et enkelt målepunkt i toppen af peaken. Hvis man vil have bedre sikkerhed, så f.eks. $n=2$ (også kaldt et signifikant signal), så er $t=16.8\,\text{s}$.
 
{{hidden end}}
 
{{hidden end}}
 +
 +
 +
 +
== Samlede løsninger ==
 +
* Et samlet dokument med MATLAB kode til at løse alle opgaverne ovenfor kan hentes her: [[Media:opgaver_uge4_spektrometer.m|opgaver_uge4_spektrometer.m]]

Latest revision as of 21:12, 12 May 2014

I denne opgave skal I, lige som i sidste uge, fabrikere jeres egne data - denne gang en Gaussisk linjeprofil med en bestemt bredde og placering, med Poisson statistik på tælletallene.


Contents

Opgave 1 - Spektrometer

Vi forestiller os et spektrometer, der tæller fotoner som funktion af bølgelængde; én bølgelængde ad gangen. Vi skal måle en enkelt spektrallinje. Linjens amplitude er 100 tællinger per sekund, linjens centrum 5000 Å, og den har bredde $\sigma$ 50 Å. Der er en baggrund på 10 tællinger per sekund. Usikkerheden på tællinger er givet som $\sqrt{N}$ tællestatistik, og antages gaussisk.

Spørgsmål 1 - Simulation af data

Simulér en måleserie fra 4500 Å til 5500 Å med step af 10 Å, ét sekund per punkt. Brug MATLAB fit funktionen til at fitte en Gaussisk linjeprofil til dataen. Vis de simulerede data og det bedste fit i samme plot.

Spørgsmål 2 - Flere måleserier

Kør 100 måleserier og lav histogrammer over fitværdierne. Brug histogrammerne til at bestemme præcisionen af eksperimentet.

Spørgsmål 3 - Planlægning af måling

(SVÆRT) Hvis der er 100 sekunder til rådighed, hvordan skal målingen så planlægges for at bestemme linjens midtpunkt bedst? Og hvad med linjens bredde?

Spørgsmål 4 - Stor baggrund

(SVÆRT) Lad baggrunden være 100 tællinger per sekund og amplituden være 10 tællinger per sekund. Hvor længe skal der tælles for at det kan afgøres, om der er en peak (amplitude signifikant større end nul)?


Samlede løsninger



Personal tools
Namespaces
Variants
Actions
Navigation
Opgaver
Andet
Toolbox
Commercial