Kanonisches Ensemble

Kanonisches Ensemble

Das kanonische Ensemble (auch Gibbs-Ensemble nach J. W. Gibbs) ist in der statistischen Physik ein System mit festgelegter Teilchenzahl in einem konstanten Volumen, das Energie mit einem Reservoir austauschen kann und mit diesem im thermischen Gleichgewicht ist. Dies entspricht einem System mit vorgegebener Temperatur, wie ein geschlossenes System (kein Teilchenaustausch) in einem Wärmebad (makroskopisches System, das sehr viel größer ist als das betrachtete System).

Ein solches Ensemble wird durch einen kanonischen Zustand $ \rho $ beschrieben. Dies ist der Gleichgewichtszustand, dessen statistische Entropie $ S(\rho ) $, unter Berücksichtigung der Nebenbedingung $ \langle {\boldsymbol {H}}\rangle ={\textrm {Tr}}({\boldsymbol {\rho H}})=E $ (der Energieerwartungswert ist festgelegt), nach der Maximum-Entropie-Methode maximal ist, wobei der Zustand mit von außen vorgegebenen Parametern, wie Volumen und Teilchenzahl, verträglich sein muss.

Quantenmechanisch

Der Dichteoperator des kanonischen Zustands ist festgelegt durch

$ {\boldsymbol {\rho }}={\frac {1}{Z(\beta )}}e^{-\beta {\boldsymbol {H}}}={\frac {1}{Z(\beta )}}\sum _{r}|\Psi _{r}\rangle e^{-\beta E_{r}}\langle \Psi _{r}| $

wobei die $ |\Psi _{r}\rangle $ die zu $ {\boldsymbol {H}} $ gehörenden Energieeigenzustände zur Energie $ E_{r} $ sind und die kanonische Zustandssumme durch

$ Z(\beta )={\textrm {Tr}}\left(e^{-\beta {\boldsymbol {H}}}\right)=\sum _{r}e^{-\beta E_{r}} $

gegeben ist. Der Parameter $ \beta $ kann als inverse Temperatur aufgefasst werden:

$ \beta ={\frac {1}{k_{\rm {B}}T}} $

Die Spur eines Operators ist folgendermaßen definiert: $ {\textrm {Tr}}(A)=\sum \nolimits _{m}\langle m|A|m\rangle $, wobei $ \left\{|m\rangle \right\} $ ein beliebiges vollständiges Orthonormalsystem ist.

In der Energieeigenbasis ist die zugehörige Dichtematrix diagonal

$ \rho _{nm}=\langle \Psi _{n}|{\boldsymbol {\rho }}|\Psi _{m}\rangle ={\frac {e^{-\beta E_{n}}}{\sum _{n}e^{-\beta E_{n}}}}\,\delta _{nm} $

Die kanonische Zustandssumme $ Z $ lässt sich mit Hilfe der mikrokanonischen Zustandssumme $ \Omega $ ausdrücken:

$ Z(\beta )=\sum _{r}e^{-\beta E_{r}}=\sum _{l}\Omega (E_{l})\,e^{-\beta E_{l}} $

Während die Summe über $ r $ alle Zustände abzählt, zählt der Index $ l $ nur die Energielevel ab. Die Zahl der verschiedenen Zustände zu einer bestimmten Energie $ E_{l} $ (also der Entartungsgrad) ist durch $ \Omega (E_{l}) $ gegeben.

Klassisch

Analog ergibt sich der klassische kanonische Zustand (Phasenraumdichte)

$ \rho ={\frac {1}{Z(\beta )}}e^{-\beta H({\vec {x}}_{1},{\vec {p}}_{1},\,...\,,{\vec {x}}_{N},{\vec {p}}_{N})} $

mit der klassischen kanonischen Zustandssumme

$ Z(\beta )=\int \mathrm {d} \tau \;e^{-\beta H({\vec {x}}_{1},{\vec {p}}_{1},\,...\,,{\vec {x}}_{N},{\vec {p}}_{N})} $

mit $ \mathrm {d} \tau ={\frac {1}{\xi }}{\frac {1}{(2\pi \hbar )^{3N}}}\;d^{3}x_{1}d^{3}p_{1}\,...\,d^{3}x_{N}d^{3}p_{N} $

wobei für $ N $ identische Teilchen der Faktor $ \xi =N! $ die Mehrfachzählung ununterscheidbarer Teilchen verhindert,

und für $ n $ verschiedene Teilchensorten mit $ N_{1},...,N_{n} $ Teilchenzahlen und $ \sum _{i=1}^{n}N_{i}=N $ der Faktor $ \xi =N_{1}!\,...\,N_{n}! $.

Der Zusammenhang zwischen dem klassischen Phasenraumintegral und der Spur in der quantenmechanischen Zustandssumme kann mit Hilfe kohärenter Zustände hergestellt werden. Damit wird auch geklärt, weshalb das Plancksche Wirkungsquantum in dem klassischen Ausdruck auftritt.

Die kanonische Zustandssumme $ Z $ lässt sich mit Hilfe der mikrokanonischen Zustandssumme $ \Omega (E) $ ausdrücken:

$ Z(\beta )=\int _{0}^{\infty }\mathrm {d} E\int \mathrm {d} \tau \,\delta \!\left(E-H({\vec {x}}_{1},{\vec {p}}_{1},\ldots ,{\vec {x}}_{N},{\vec {p}}_{N})\right)e^{-\beta E}=\int _{0}^{\infty }\mathrm {d} E\,\Omega (E)\,e^{-\beta E} $

Somit ist die kanonische Zustandssumme die Laplace-Transformierte der mikrokanonischen Zustandsdichte $ \Omega (E) $. Da die Laplace-Transformation eindeutig ist, enthalten beide Funktionen identische Informationen.

Erwartungswerte

Im Folgenden werden Erwartungswerte verschiedener makroskopischer Größen gebildet. Der Index k bedeutet kanonisch. Der Hamiltonoperator ist vom Volumen und der Teilchenzahl abhängig $ H(V,N) $, die Zustandssumme von Temperatur, Volumen und Teilchenzahl $ Z(T,V,N) $ bzw. $ Z(\beta ,V,N) $.

Energie

Der Energieerwartungswert kann über die Zustandssumme berechnet werden

$ {\begin{aligned}E_{k}&=\langle {\boldsymbol {H}}\rangle ={\textrm {Tr}}({\boldsymbol {H\rho }})={\frac {1}{Z}}{\textrm {Tr}}\left({\boldsymbol {H}}e^{-\beta {\boldsymbol {H}}}\right)\\&={\frac {1}{Z}}{\textrm {Tr}}\left(-{\frac {\partial }{\partial \beta }}e^{-\beta {\boldsymbol {H}}}\right)=-{\frac {1}{Z}}{\frac {\partial }{\partial \beta }}{\textrm {Tr}}\left(e^{-\beta {\boldsymbol {H}}}\right)=-{\frac {1}{Z}}{\frac {\partial }{\partial \beta }}Z\\&=-{\frac {\partial }{\partial \beta }}\ln Z\end{aligned}} $

Entropie

Die statistische Entropie lässt sich nun durch die Zustandssumme ausdrücken

$ {\begin{aligned}S_{k}&=-k_{\rm {B}}\langle \ln {\boldsymbol {\rho }}\rangle =-k_{\rm {B}}{\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }})\\&=-k_{\rm {B}}\left\langle \ln \left({\frac {1}{Z}}e^{-\beta {\boldsymbol {H}}}\right)\right\rangle =-k_{\rm {B}}\langle -\ln(Z)-\beta {\boldsymbol {H}}\rangle =k_{\rm {B}}\ln Z+k_{\rm {B}}\beta \langle {\boldsymbol {H}}\rangle \\&=k_{\rm {B}}\ln Z-k_{\rm {B}}\beta {\frac {\partial }{\partial \beta }}\ln Z\\&=k_{\rm {B}}\ln Z+k_{\rm {B}}T{\frac {\partial }{\partial T}}\ln Z=k_{\rm {B}}{\frac {\partial }{\partial T}}(T\ln Z)\end{aligned}} $

Druck

Der Druckerwartungswert ist gleich:

$ {\begin{aligned}p_{k}&=-\left\langle {\frac {\partial {\boldsymbol {H}}}{\partial V}}\right\rangle =-{\textrm {Tr}}\left({\frac {\partial {\boldsymbol {H}}}{\partial V}}{\boldsymbol {\rho }}\right)=-{\frac {1}{Z}}{\textrm {Tr}}\left({\frac {\partial {\boldsymbol {H}}}{\partial V}}e^{-\beta {\boldsymbol {H}}}\right)\\&=-{\frac {1}{Z}}{\textrm {Tr}}\left({\frac {1}{-\beta }}{\frac {\partial }{\partial V}}e^{-\beta {\boldsymbol {H}}}\right)={\frac {1}{Z}}{\frac {1}{\beta }}{\frac {\partial }{\partial V}}\underbrace {{\textrm {Tr}}\left(e^{-\beta {\boldsymbol {H}}}\right)} _{Z}={\frac {1}{\beta }}{\frac {\frac {\partial Z}{\partial V}}{Z}}\\&={\frac {1}{\beta }}{\frac {\partial }{\partial V}}\ln Z\end{aligned}} $

Chemisches Potential

Für große Systeme lässt sich auch das chemische Potential berechnen (die Teilchenzahl $ N $ ist eine diskrete Größe; erst im thermodynamischen Limes lässt sich $ N $ quasi-kontinuierlich behandeln und Ableitungen nach $ N $ sind möglich):

$ {\begin{aligned}\mu _{k}&=\left\langle {\frac {\partial {\boldsymbol {H}}}{\partial N}}\right\rangle ={\textrm {Tr}}\left({\frac {\partial {\boldsymbol {H}}}{\partial N}}{\boldsymbol {\rho }}\right)={\frac {1}{Z}}{\textrm {Tr}}\left({\frac {\partial {\boldsymbol {H}}}{\partial N}}e^{-\beta {\boldsymbol {H}}}\right)\\&={\frac {1}{Z}}{\textrm {Tr}}\left({\frac {1}{-\beta }}{\frac {\partial }{\partial N}}e^{-\beta {\boldsymbol {H}}}\right)=-{\frac {1}{Z}}{\frac {1}{\beta }}{\frac {\partial }{\partial N}}\underbrace {{\textrm {Tr}}\left(e^{-\beta {\boldsymbol {H}}}\right)} _{Z}=-{\frac {1}{\beta }}{\frac {\frac {\partial Z}{\partial N}}{Z}}\\&=-{\frac {1}{\beta }}{\frac {\partial }{\partial N}}\ln Z\end{aligned}} $

Freie Energie

Freie Energie für Gleichgewichtszustände

Offensichtlich spielt bei der Berechnung von Erwartungswerten der Logarithmus der Zustandssumme eine wichtige Rolle. Deswegen definiert man die Freie Energie:

$ F(\beta ,V,N):=-{\frac {1}{\beta }}\ln Z_{k}=E_{k}-{\frac {1}{k_{B}\beta }}S_{k} $

Bzw. unter Verwendung der Temperatur $ T $ statt des Parameters $ \beta $:

$ F(T,V,N):=-k_{B}T\,\ln Z_{k}=E_{k}-T\,S_{k} $

Freie Energie als thermodynamisches Potential

Die freie Energie ist das thermodynamische Potential des kanonischen Zustands. Obige Erwartungswerte lassen sich nun kompakt als Gradient des Potentials schreiben:

$ {\begin{pmatrix}-S_{k}\\-p_{k}\\\mu _{k}\end{pmatrix}}={\begin{pmatrix}\partial _{T}\\\partial _{V}\\\partial _{N}\end{pmatrix}}F(T,V,N) $

Das totale Differential der freien Energie lautet somit:

$ \mathrm {d} F=-S\,\mathrm {d} T-p\,\mathrm {d} V+\mu \,\mathrm {d} N $

Allgemeine Definition der freien Energie

Auch für Nicht-Gleichgewichtszustände lässt sich die freie Energie definieren, und zwar als Funktional des Dichteoperators über

$ F[{\boldsymbol {\rho }}]={\textrm {Tr}}\!\left\{{\boldsymbol {\rho }}\left({\boldsymbol {H}}+\beta ^{-1}\ln {\boldsymbol {\rho }}\right)\right\} $

bzw. umgeformt

$ F[{\boldsymbol {\rho }}]={\textrm {Tr}}\!\left\{{\boldsymbol {\rho }}{\boldsymbol {H}}\right\}+k_{B}T\,{\textrm {Tr}}\!\left\{{\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}\right\}=E[{\boldsymbol {\rho }}]-T\,S[{\boldsymbol {\rho }}] $

Im Gleichgewicht mit $ {\boldsymbol {\rho }}_{k}=Z^{-1}e^{-\beta {\boldsymbol {H}}} $ bzw. $ \ln {\boldsymbol {\rho }}_{k}=-\ln Z-\beta {\boldsymbol {H}} $ erhält man obige Gleichgewichts-Definition der freien Energie:

$ F[{\boldsymbol {\rho }}_{k}]={\textrm {Tr}}\!\left\{{\boldsymbol {\rho }}\left({\boldsymbol {H}}-{\boldsymbol {H}}-\beta ^{-1}\ln Z\right)\right\}=-\beta ^{-1}\ln Z\,{\textrm {Tr}}\!\left\{{\boldsymbol {\rho }}\right\}=-\beta ^{-1}\ln Z $

Zustand mit extremalen Eigenschaften

Maximum der Entropie

Es seien zwei Dichteoperatoren $ {\boldsymbol {\rho }} $ und $ {\boldsymbol {\rho }}_{k} $ gegeben, die beide denselben Energieerwartungswert liefern:

$ E={\textrm {Tr}}({\boldsymbol {\rho }}{\boldsymbol {H}})={\textrm {Tr}}({\boldsymbol {\rho }}_{k}{\boldsymbol {H}})=E_{k} $.

Die Entropie des Zustands $ {\boldsymbol {\rho }} $ (der nicht notwendigerweise ein Gleichgewichtszustand sein muss) lässt sich mit Hilfe der Gibbs-Ungleichung $ {\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}')\leq {\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}) $ wie folgt abschätzen:

$ S[{\boldsymbol {\rho }}]=-k_{B}{\textrm {Tr}}\!\left[{\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}\right]\leq -k_{B}{\textrm {Tr}}\!\left[{\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}_{k}\right] $

Sei $ {\boldsymbol {\rho }}_{k}=Z^{-1}e^{-\beta {\boldsymbol {H}}} $ die Dichteverteilung des Gleichgewichtszustands des kanonischen Ensembles. Einsetzen liefert:

$ S[{\boldsymbol {\rho }}]\leq k_{B}{\textrm {Tr}}\!\left[{\boldsymbol {\rho }}(\ln Z+\beta {\boldsymbol {H}})\right]=\underbrace {k_{B}\ln Z} _{-F/T}\,\underbrace {{\textrm {Tr}}\!\left[{\boldsymbol {\rho }}\right]} _{1}+k_{B}\beta \,\underbrace {{\textrm {Tr}}\!\left[{\boldsymbol {\rho }}{\boldsymbol {H}}\right]} _{E=E_{k}}={\frac {1}{T}}(-F+E_{k})=S_{k} $

Daraus folgt:

$ S[{\boldsymbol {\rho }}]\leq S[{\boldsymbol {\rho }}_{k}] $

Das kanonische Ensemble besitzt unter allen Ensembles mit gleicher mittlerer Energie und festgelegtem Volumen und Teilchenzahl die größte Entropie.

Minimum der freien Energie

Hier wird die allgemeine Definition der freien Energie $ F[{\boldsymbol {\rho }}]=E[{\boldsymbol {\rho }}]-T\,S[{\boldsymbol {\rho }}] $ verwendet.

Für einen Zustand $ {\boldsymbol {\rho }}\neq {\boldsymbol {\rho }}_{k} $, der nicht dem Gleichgewichtszustand $ {\boldsymbol {\rho }}_{k} $ entspricht, aber denselben Energieerwartungswert liefert $ E[{\boldsymbol {\rho }}]=E[{\boldsymbol {\rho }}_{k}] $, gilt:

$ F[{\boldsymbol {\rho }}]-F[{\boldsymbol {\rho }}_{k}]=\left(E[{\boldsymbol {\rho }}]-T\,S[{\boldsymbol {\rho }}]\right)-\left(E[{\boldsymbol {\rho }}_{k}]-T\,S[{\boldsymbol {\rho }}_{k}]\right)=T\left(S[{\boldsymbol {\rho }}_{k}]-\,S[{\boldsymbol {\rho }}]\right)>0 $

d.h. die freie Energie ist im Gleichgewicht minimal.

Fluktuationen

Schwankung der Energie

Da im kanonischen Ensemble nicht die Energie, sondern nur der Energieerwartungswert festgelegt ist, sind gewisse Fluktuationen möglich. Im Folgenden wird das Quadrat der Schwankungsbreite $ \Delta E_{k} $ der Energie um ihren Mittelwert $ E_{k} $ berechnet:

$ {\begin{aligned}\left(\Delta E_{k}\right)^{2}&=\left\langle \left({\boldsymbol {H}}-\langle {\boldsymbol {H}}\rangle \right)^{2}\right\rangle =\langle {\boldsymbol {H}}^{2}\rangle -\langle {\boldsymbol {H}}\rangle ^{2}={\frac {1}{Z}}{\textrm {Tr}}\left({\boldsymbol {H}}^{2}e^{-\beta {\boldsymbol {H}}}\right)-\left[{\frac {1}{Z}}{\textrm {Tr}}\left({\boldsymbol {H}}e^{-\beta {\boldsymbol {H}}}\right)\right]^{2}\\&={\frac {1}{Z}}{\frac {\partial ^{2}}{\partial ^{2}\beta }}Z-{\frac {1}{Z^{2}}}\left({\frac {\partial }{\partial \beta }}Z\right)^{2}={\frac {\partial }{\partial \beta }}\left({\frac {1}{Z}}{\frac {\partial }{\partial \beta }}Z\right)={\frac {\partial ^{2}\ln Z}{\partial \beta ^{2}}}\end{aligned}} $

Die erste Ableitung von $ \ln Z $ nach $ -\beta $ lässt sich mit dem Energieerwartungswert identifizieren:

$ \left(\Delta E_{k}\right)^{2}=-{\frac {\partial E_{k}}{\partial \beta }}=k_{\mathrm {B} }T^{2}{\frac {\partial E_{k}}{\partial T}}=k_{\mathrm {B} }T^{2}C_{V} $

Dabei wurde im letzten Schritt die Wärmekapazität $ C_{V}={\tfrac {\partial E_{k}}{\partial T}}|_{V,N} $ eingeführt. Sie ist eine Suszeptibilität, die angibt wie sich eine extensive Größe (Energie) mit Erhöhung einer intensiven Größe (Temperatur) ändert. Der Response der Energie auf eine Temperaturerhöhung ist korreliert mit den spontanen Fluktuationen der Energie (siehe Fluktuations-Dissipations-Theorem).

Die Wärmekapazität ist stets positiv, da die Standardabweichung nicht-negativ sein kann: $ \left(\Delta E_{k}\right)^{2}>0 $.

Außerdem lässt sich mittels $ \ln Z=-\beta F $ die Energiefluktuation mit der zweiten Ableitung der freien Energie nach der Temperatur in Verbindung bringen:

$ \left(\Delta E_{k}\right)^{2}={\frac {\partial ^{2}\ln Z}{\partial \beta ^{2}}}=-{\frac {\partial ^{2}(\beta F)}{\partial \beta ^{2}}}=-k_{\mathrm {B} }T^{3}{\frac {\partial ^{2}F}{\partial T^{2}}}\quad \implies \quad C_{V}=-T{\frac {\partial ^{2}F}{\partial T^{2}}} $

Äquivalenz der Ensembles im thermodynamischen Limes

Die Wärmekapazität und somit das Schwankungsquadrat ist eine extensive Größe, also von der Ordnung $ N $. Ebenso ist der Energieerwartungswert von der Ordnung $ N $. Der Quotient aus Schwankungsbreite und Mittelwert ist von der Ordnung $ N^{-1/2} $:

$ {\frac {\Delta E_{k}}{E_{k}}}\sim {\mathcal {O}}\!\left({\frac {\sqrt {N}}{N}}\right)={\mathcal {O}}\!\left({\frac {1}{\sqrt {N}}}\right) $

Für thermodynamische Systeme mit $ N\sim 10^{22} $ Teilchen ist der Quotient sehr klein (von der Ordnung $ 10^{-11} $) und somit die Energieverteilung sehr scharf um den Mittelwert $ E_{k} $ konzentriert (siehe Gesetz der großen Zahlen). Im Grenzfall großer Teilchenzahlen werden Energiemittelwert $ E_{k} $ und der Energiewert mit der höchsten Wahrscheinlichkeit $ E^{*} $ identisch.

Die Wahrscheinlichkeitsdichte der Energie (nicht eines bestimmten Zustandes zu gegebener Energie) ist gegeben durch $ Z^{-1}\,\Omega (E)\,e^{-\beta E} $, wobei $ \Omega (E) $ die mikrokanonische Zustandssumme ist. Während der Boltzmann-Faktor $ e^{-\beta E} $ monoton mit der Energie abnimmt, steigt die mikrokanonische Zustandsdichte $ \Omega (E) $ monoton mit der Energie $ E $ an (z.B. $ \Omega (E)\propto E^{(3N/2-1)} $ für das klassische ideale Gas), sodass das Produkt ein Maximum besitzt. Der Energiewert $ E^{*} $ mit der größten Wahrscheinlichkeit ist gegeben durch

$ 0=\left.{\frac {\partial }{\partial E}}\left\{\Omega (E)\,e^{-\beta E}\right\}\right|_{E=E^{*}}=\left.{\frac {\partial \Omega (E)}{\partial E}}\right|_{E=E^{*}}e^{-\beta E^{*}}-\beta \Omega (E^{*})e^{-\beta E^{*}} $

Daraus folgt:

$ \beta ={\frac {1}{\Omega (E)}}\left.{\frac {\partial \Omega (E)}{\partial E}}\right|_{E=E^{*}}=\left.{\frac {\partial \ln \Omega (E)}{\partial E}}\right|_{E=E^{*}}=\left.{\frac {\partial \ln \Omega (E)}{\partial E}}\right|_{E=U} $

Im letzten Schritt wurde dabei die mikrokanonische Definition der inversen Temperatur $ 1/T=k_{B}\beta $ nämlich als partielle Ableitung der mikrokanonischen Entropie $ S_{m}=k_{B}\ln \Omega (U) $ nach der inneren Energie $ U $ identifiziert. Somit gilt

$ E^{*}=U $

also entspricht der wahrscheinlichste Wert der Energie dem Energiewert des mikrokanonischen Ensembles.

Entwickelt man die logarithmierte Wahrscheinlichkeitsdichte der Energie in eine Potenzreihe um $ E^{*} $ so erhält man:

$ {\begin{aligned}\Omega (E)\,e^{-\beta E}&=e^{S_{m}/k_{B}-\beta E}=e^{-\beta (E-TS_{m})}=\exp \!\left\{-\beta (E^{*}-TS_{m}^{*})-\beta {\frac {(E-E^{*})^{2}}{2TC_{V}}}+{\mathcal {O}}\!\left((E-E^{*})^{3}\right)\right\}\\&\approx \Omega (E^{*})\,e^{-\beta E^{*}}e^{-(E-E^{*})^{2}/(2k_{B}T^{2}C_{V})}\end{aligned}} $

Dies ist eine Gaußverteilung mit der Breite $ {\sqrt {k_{B}T^{2}C_{V}}} $. Die relative Breite $ {\sqrt {k_{B}T^{2}C_{V}}}/E^{*} $ ist von der Ordnung $ N^{-1/2} $ und geht für $ N\to \infty $ gegen Null, d.h. die Verteilung wird eine Delta-Funktion. Im Grenzfall großer Teilchenzahlen werden mikrokanonisches und kanonisches Ensemble identisch, wobei $ E^{*}=U=E_{k} $ gilt, also die mikronanonische innere Energie $ U $ gleich dem kanonischen Energieerwartungswert $ E_{k} $ ist (z.B. $ E^{*}=(3N/2-1)\beta ^{-1} $ und $ E_{k}=(3N/2)\beta ^{-1} $ für das klassische ideale Gas). Beide Ensembles umfassen dann praktisch dieselben Bereiche im Phasenraum (bzw. Zustände im Hilbertraum).

Die genäherte Wahrscheinlichkeitsdichte wird nun zur Berechnung der kanonischen Zustandssumme verwendet:

$ Z=e^{-\beta F}=\int _{0}^{\infty }\mathrm {d} E\,\Omega (E)\,e^{-\beta E}\approx e^{-\beta (E^{*}-TS_{m}^{*})}\int _{-\infty }^{\infty }\mathrm {d} E\,e^{-(E-E^{*})^{2}/2k_{B}T^{2}C_{V}}=e^{-\beta (E^{*}-TS_{m}^{*})}{\sqrt {2\pi k_{B}T^{2}C_{V}}} $

Daraus lässt sich die freie Energie bestimmen:

$ F=(E^{*}-TS_{m}^{*})-{\frac {k_{B}T}{2}}\ln(2\pi k_{B}T^{2}C_{V})\approx E^{*}-TS_{m}^{*} $

Der letzte Term kann im thermodynamischen Limes vernachlässigt werden, da dieser $ {\mathcal {O}}(\ln N) $ ist, während die anderen $ {\mathcal {O}}(N) $ sind. Somit wurde die zum kanonischen Ensemble gehörige freie Energie auf Größen des mikrokanonischen Ensembles $ E^{*} $ und $ S_{m}^{*} $ zurückgeführt.

Schwankung von Entropie, Druck und chemischen Potential

Die Schwankungsbreite der Entropie lässt sich auf die Schwankungsbreite der Energie zurückführen und somit mit der Wärmekapazität in Verbindung bringen:

$ {\begin{aligned}(\Delta S_{k})^{2}&=\langle (-k_{\rm {B}}\ln {\boldsymbol {\rho }})^{2}\rangle -k_{\rm {B}}^{2}\langle -k_{\rm {B}}\ln {\boldsymbol {\rho }}\rangle ^{2}=k_{\rm {B}}^{2}\langle [\ln(Z)+\beta {\boldsymbol {H}}]^{2}\rangle -k_{\rm {B}}^{2}\langle \ln(Z)+\beta {\boldsymbol {H}}\rangle ^{2}\\&=k_{\rm {B}}^{2}\beta ^{2}\left[\langle {\boldsymbol {H}}^{2}\rangle -\langle {\boldsymbol {H}}\rangle ^{2}\right]={\frac {1}{T^{2}}}(\Delta E_{k})^{2}=k_{\mathrm {B} }C_{V}\end{aligned}} $

Für die quadratische Schwankungsbreite des Drucks ergibt sich:

$ {\begin{aligned}(\Delta p_{k})^{2}&=\left\langle \left(-{\frac {\partial {\boldsymbol {H}}}{\partial V}}\right)^{2}\right\rangle -\left\langle -{\frac {\partial {\boldsymbol {H}}}{\partial V}}\right\rangle ^{2}={\frac {1}{\beta ^{2}}}{\frac {\partial ^{2}\ln Z}{\partial V^{2}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\right\rangle \\&=-{\frac {1}{\beta }}{\frac {\partial ^{2}F}{\partial V^{2}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\right\rangle ={\frac {1}{\beta }}{\frac {\partial p_{k}}{\partial V}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\right\rangle =-{\frac {1}{\beta }}{\frac {1}{V\kappa _{T}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\right\rangle \end{aligned}} $

und für das chemische Potential:

$ {\begin{aligned}(\Delta \mu _{k})^{2}&=\left\langle \left({\frac {\partial {\boldsymbol {H}}}{\partial N}}\right)^{2}\right\rangle -\left\langle {\frac {\partial {\boldsymbol {H}}}{\partial N}}\right\rangle ^{2}={\frac {1}{\beta ^{2}}}{\frac {\partial ^{2}\ln Z}{\partial V^{2}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\right\rangle \\&=-{\frac {1}{\beta }}{\frac {\partial ^{2}F}{\partial N^{2}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial N^{2}}}\right\rangle =-{\frac {1}{\beta }}{\frac {\partial \mu _{k}}{\partial N}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial N^{2}}}\right\rangle =-{\frac {1}{\beta }}{\frac {V}{N^{2}\kappa _{T}}}+{\frac {1}{\beta }}\left\langle {\frac {\partial ^{2}{\boldsymbol {H}}}{\partial N^{2}}}\right\rangle \end{aligned}} $

Aus der Positivität der Varianz und der isothermen Kompressibilität folgt: $ \langle {\tfrac {\partial ^{2}{\boldsymbol {H}}}{\partial V^{2}}}\rangle >-{\tfrac {\partial p_{k}}{\partial V}}={\tfrac {1}{V\kappa _{T}}}>0 $ und $ \langle {\tfrac {\partial ^{2}{\boldsymbol {H}}}{\partial N^{2}}}\rangle >{\tfrac {\partial \mu _{k}}{\partial N}}={\tfrac {V}{N^{2}\kappa _{T}}}>0 $

Herleitung des Gleichgewichtszustands bei festgelegtem Erwartungswert

Variationsproblem

Der Gleichgewichtszustand bei festgelegtem Erwartungswert(en) kann als Variationsproblem aufgefasst werden und mit der Methode der Lagrange-Multiplikatoren hergeleitet werden. Gesucht ist der Dichteoperator $ {\boldsymbol {\rho }} $, dessen statistische Entropie $ S({\boldsymbol {\rho }}) $ unter Berücksichtigung von Nebenbedingungen maximal ist:

Der Ausdruck $ S({\boldsymbol {\rho }})/k_{B}=-{\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }}) $ soll mit den Nebenbedingungen $ {\textrm {Tr}}({\boldsymbol {\rho }})=1 $ (Normierungsbedingung) und $ \langle {\boldsymbol {O}}\rangle ={\textrm {Tr}}({\boldsymbol {\rho }}{\boldsymbol {O}})=O_{0} $ (festgelegter Erwartungswert des Operators $ {\boldsymbol {O}} $) maximiert werden. Sind mehrere Erwartungswerte festgelegt, so sind $ \lambda ,{\boldsymbol {O}},O_{0} $ mehrkomponentige Größen. Zu maximieren ist also folgendes Funktional des Dichteoperators:

$ L({\boldsymbol {\rho }},\lambda ,{\tilde {\lambda }})=-{\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }})-{\tilde {\lambda }}\left({\textrm {Tr}}({\boldsymbol {\rho }})-1\right)-\lambda \left({\textrm {Tr}}({\boldsymbol {\rho O}})-O_{0}\right) $

Man erhält eine stationäre Lösung, wenn die erste Variation von $ L $ verschwindet.

$ 0=\delta L(\rho ,\lambda ,{\tilde {\lambda }})=-\delta {\textrm {Tr}}({\boldsymbol {\rho }}\ln {\boldsymbol {\rho }})-{\tilde {\lambda }}\,\delta {\textrm {Tr}}({\boldsymbol {\rho }})-\lambda \,\delta {\textrm {Tr}}({\boldsymbol {\rho O}})=-{\textrm {Tr}}\left((\ln {\boldsymbol {\rho }}+1+{\tilde {\lambda }}+\lambda {\boldsymbol {O}})\delta {\boldsymbol {\rho }}\right) $

Verwendet wurde im letzten Schritt die Relation $ \delta {\textrm {Tr}}\left(f(\rho )\right)={\textrm {Tr}}\left(f'(\rho )\,\delta \rho \right) $.

$ 0=\sum _{m}\langle m|(\ln {\boldsymbol {\rho }}+1+{\tilde {\lambda }}+\lambda {\boldsymbol {O}})\delta {\boldsymbol {\rho }}|m\rangle =\sum _{m,n}\langle m|\ln {\boldsymbol {\rho }}+1+{\tilde {\lambda }}+\lambda {\boldsymbol {O}}|n\rangle \langle n|\delta {\boldsymbol {\rho }}|m\rangle $

wobei die $ |m\rangle $ und $ |n\rangle $ jeweils ein VONS bilden; die Summe über $ m $ beschreibt die Spurbildung, die Summe über $ n $ ist das Einschieben einer $ 1 $ (Ausnutzen der Vollständigkeit)

Der Ausdruck ist für alle $ m $,$ n $ gleich 0, wenn $ \langle m|\ln {\boldsymbol {\rho }}+1+\lambda {\boldsymbol {O}}+{\tilde {\lambda }}|n\rangle $ gleich 0 ist, bzw wenn gilt:

$ \ln {\boldsymbol {\rho }}+1+\lambda {\boldsymbol {O}}+{\tilde {\lambda }}=0 $

Daraus ergibt sich der Dichteoperator $ {\boldsymbol {\rho }} $

$ {\boldsymbol {\rho }}=e^{-1-{\tilde {\lambda }}-\lambda {\boldsymbol {O}}}={\frac {1}{e^{1+{\tilde {\lambda }}}}}e^{-\lambda {\boldsymbol {O}}}=:{\frac {1}{Z(\lambda )}}e^{-\lambda {\boldsymbol {O}}} $ mit $ Z(\lambda )=e^{1+{\tilde {\lambda }}}={\textrm {Tr}}\left(e^{-\lambda {\boldsymbol {O}}}\right) $

Die Definition eines Dichteoperators fordert, dass die Spur darüber 1 wird: $ {\textrm {Tr}}({\boldsymbol {\rho }})={\frac {1}{Z(\lambda )}}{\textrm {Tr}}\left(e^{-\lambda {\boldsymbol {O}}}\right)=1 $ daraus folgt der Boltzmann-Gibbs-Zustand

$ {\boldsymbol {\rho }}={\frac {1}{Z(\lambda )}}e^{-\lambda {\boldsymbol {O}}} $ mit $ Z(\lambda )={\textrm {Tr}}\left(e^{-\lambda {\boldsymbol {O}}}\right) $

Aus der Variationsrechnung folgt nur das stationäre Verhalten; das Maximum bezüglich der Entropie lässt sich mit der Gibbs-Ungleichung zeigen.

Ist $ \langle {\boldsymbol {H}}\rangle =E $ die einzige Information über das System, so ergibt sich der oben dargestellte kanonische Zustand (ist $ \langle {\boldsymbol {N}}\rangle =N $ eine weitere Nebenbedingung erhält man den großkanonischen Zustand).

Anschauliche Herleitung

Das Wärmebad (Index 2) und das interessierende System (Index 1) haben schwach-energetischen Kontakt. Sie bilden zusammen ein Gesamtsystem, das nach außen vollständig abgeschlossen ist und somit mikrokanonisch beschrieben werden muss.

Der Hamilton-Operator des Gesamtsystems ist $ H=H_{1}+H_{2}+W $, wobei $ H_{i} $ die Hamilton-Operatoren der Teilsysteme und $ W $ der Wechselwirkungsoperator ist. Letzterer ist für die Äquilibrierung der Teilsysteme zwar erforderlich, kann unter der Annahme des schwachen Kontakts aber gegenüber $ H_{1} $ und $ H_{2} $ vernachlässigt werden: $ W\ll H_{1},H_{2} $, d.h. die Wechselwirkungsenergie ist viel kleiner als die Energie der Einzelsysteme. Somit gilt $ H\approx H_{1}+H_{2} $ und man betrachtet zwei praktisch unabhängige Systeme. Dann setzt sich die Energie additiv $ E=E_{1}+E_{2} $ und die Dichtematrix multiplikativ zusammen $ \rho =\rho _{1}\rho _{2} $. Die Entropie ist wegen $ \langle \rho \rangle =\langle \rho _{1}\rangle +\langle \rho _{2}\rangle $ auch additiv: $ S=S_{1}+S_{2} $. Weiterhin gilt: $ V=V_{1}+V_{2} $ und $ N=N_{1}+N_{2} $.

Die Gesamtenergie bleibt stets konstant:

$ E_{{\text{ges}}\,}=E_{1}+E_{2} $

Die Energie $ E_{2}=E_{\text{ges}}-E_{1} $ des Wärmebads sei $ g_{2}(E_{2}) $-fach entartet, die Energie $ E_{1} $ des angekoppelten Systems sei $ g_{1}(E_{1}) $-fach entartet. Der Entartungsgrad des Gesamtsystems zur Energie $ E_{\text{ges}} $ ist

$ g_{12}(E_{\text{ges}})=\sum _{E_{1}^{\prime }=0}^{E_{\text{ges}}}g_{1}(E_{1}^{\prime })\,g_{2}(E_{\text{ges}}-E_{1}^{\prime }) $.

Im mikrokanonischen Ensemble hat jeder mögliche Basiszustand dieselbe Wahrscheinlichkeit $ 1/g_{12}(E_{\text{ges}}) $. Die Wahrscheinlichkeit $ p_{1}(E_{1}) $, dass das System 1 die Energie $ E_{1} $ besitzt, ist gleich der Wahrscheinlichkeit $ p_{2}(E_{2}) $, dass das Wärmebad die Energie $ E_{\text{ges}}-E_{1} $ hat; diese ist der Quotient aus Gesamtentartungsgrad zur Energie $ E_{1} $ des Systems 1, nämlich $ g_{1}(E_{1})\,g_{2}(E_{\text{ges}}-E_{1}) $, und des Gesamtentartungsgrads $ g_{12}(E_{\text{ges}}) $:

$ p_{1}(E_{1})=p_{2}(E_{2})={\frac {g_{1}(E_{1})\,g_{2}(E_{\text{ges}}-E_{1})}{g_{12}(E_{\text{ges}})}} $

Die Wahrscheinlichkeit das System 1 in einem bestimmten Basiszustand (Quantenzahl $ \nu $) mit Energie $ E_{1} $ zu finden ist:

$ p_{1}(E_{1,\nu })={\frac {p_{1}(E_{1})}{g_{1}(E_{1})}}={\frac {g_{2}(E_{\text{ges}}-E_{1})}{g_{12}(E_{\text{ges}})}} $

Man logarithmiert und kann die Entropie des Wärmebades $ S_{2}=k_{B}\ln(g_{2}) $ und die Gesamtentropie $ S_{\text{ges}}=k_{B}\ln(g_{12}) $ identifizieren:

$ {\begin{aligned}\ln p_{1}(E_{1,\nu })&=\ln g_{2}(E_{\text{ges}}-E_{1})-\ln(g_{12}(E_{\text{ges}}))\\&={\frac {1}{k_{B}}}S_{2}(E_{\text{ges}}-E_{1})-{\frac {1}{k_{B}}}S_{\text{ges}}(E_{\text{ges}})\end{aligned}} $

Da das Wärmebad viel größer als das angekoppelte System ist, entspricht die Gesamtenergie fast ausschließlich der Energie des Bades (minus einer vergleichsweise kleinen mittleren Energie des Systems 1) und man kann die Entropie $ S_{2}(E_{\text{ges}}-E_{1n}) $ in eine Taylorreihe von $ E_{2} $ um $ {\bar {E}}_{2}=E_{\text{ges}}-{\bar {E}}_{1}\approx E_{\text{ges}} $ bis zur ersten Ordnung entwickeln:

$ S_{2}(E_{\text{ges}}-E_{1n})=S_{2}(E_{2})\approx S_{2}({\bar {E}}_{2})+\underbrace {\left.{\frac {\partial S_{2}(E_{2})}{\partial E_{2}}}\right|_{E_{2}={\bar {E}}_{2}}} _{1/T=k_{B}\beta }\underbrace {\left(E_{2}-E_{\text{ges}}+{\bar {E}}_{1}\right)} _{{\bar {E}}_{1}-E_{1}}=S_{2}({\bar {E}}_{2})+k_{B}\beta \left({\bar {E}}_{1}-E_{1}\right) $

Dabei wurde ausgenutzt, dass die Ableitung der Entropie nach der Energie die inverse Temperatur ist (siehe Mikrokanonisches Ensemble). Als Korrektur zu obiger Entwicklung, also in der Ordnung $ \left({\bar {E}}_{1}-E_{1}\right)^{2} $, tritt folgender Faktor auf:

$ {\frac {1}{2}}\left.{\frac {\partial ^{2}S_{2}(E_{2})}{\partial ^{2}E_{2}}}\right|_{E_{2}={\bar {E}}_{2}}={\frac {1}{2}}\left.{\frac {\partial T^{-1}}{\partial E_{2}}}\right|_{E_{2}={\bar {E}}_{2}}=-{\frac {1}{2}}{\frac {1}{T^{2}}}\left.{\frac {\partial T}{\partial E_{2}}}\right|_{E_{2}={\bar {E}}_{2}}=-{\frac {1}{2T^{2}}}\left(\left.{\frac {\partial E_{2}}{\partial T}}\right|_{E_{2}={\bar {E}}_{2}}\right)^{-1}=-{\frac {1}{2T^{2}C_{V_{2}}}} $

Hier ist $ C_{V_{2}} $ die Wärmekapazität des Wärmebades. Die Korrekturterme können vernachlässigt werden, da aufgrund der Größe des Wärmebades $ {\tfrac {|{\bar {E}}_{1}-E_{1}|}{TC_{V_{2}}}}\ll 1 $ gilt. Deshalb ist es gerechtfertigt sich bei der Entwicklung der Entropie auf die erste Ordnung zu beschränken. Dies setzt man in die logarithmierte Wahrscheinlichkeit ein. Außerdem werden noch die $ E_{1} $-unabhängigen Terme als Konstante $ (-\ln Z) $ zusammengefasst

$ \ln p_{1}(E_{1,\nu })=-\beta E_{1}+\underbrace {\beta {\bar {E}}_{1}+{\frac {1}{k_{B}}}S_{2}({\bar {E}}_{2})-{\frac {1}{k_{B}}}S_{\text{ges}}(E_{\text{ges}})} _{=:\,\,\ln Z\ =\ {\text{unabh. von }}E_{1}}=-\beta E_{1}-\ln Z $

Exponenzieren liefert die Wahrscheinlichkeit, dass sich das System 1 im Basiszustand $ \nu $ zur Energie $ E_{1} $ befindet:

$ p_{1}(E_{1,\nu })={\frac {1}{Z}}e^{-\beta E_{1}} $

Die Konstante $ Z $ lässt sich über die Normierungsbedingung für Wahrscheinlichkeiten $ \sum \nolimits _{n}p_{n}=1 $ direkt aus den Eigenschaften des Systems 1 bestimmen (es muss eine minimale Energie geben; angenommen das Energiespektrum erstrecke sich bis $ -\infty $, so würde die Summe divergieren):

$ Z=\sum _{E_{1},\nu }e^{-\beta E_{1}} $

Da man normalerweise nur am System 1 interessiert ist, geht das System 2, das Wärmebad, nur über die Temperatur ein.

Literatur

  • Balian: From Microphysics to Macrophysics 1. Springer-Verlag, Berlin, 2. Auflage 2006, ISBN 3-540-45469-1
  • Schwabl: Statistische Mechanik. Springer-Verlag, Berlin, 3. Auflage 2006, ISBN 978-3-540-31095-2
  • Pathria, Beale: Statistical Mechanics. Academic Press, 3. Auflage 2011, ISBN 978-0-12-382188-1

Siehe auch