next up previous
Next: Valutazione numerica Up: Valutazione delle limitazioni Previous: Analisi con le matrici

Analisi con le matrici di Müller

Il punto di partenza è sempre il sistema composto da sei lamine in configurazione tre lamine equivalenti.

Prima di tutto bisogna ricordare la definizione di DGD, che nello spazio dei vettori di Stokes risulta

$\displaystyle DGD=\sqrt{\Omega_{x}^{2}+\Omega_{y}^{2}+\Omega_{z}^{2}} $ (4.2.1)

Dalla definizione, derivando rispetto al generico DGD che caratterizza la lamina i-esima, con rapidi passaggi si ottiene

$\displaystyle \Delta (DGD)=\frac{\partial DGD}{\partial \Delta \tau_{i}} \cdot \Delta (\Delta \tau_{i})$ (4.2.2)

dove con $ DGD$ si indica il ritardo di gruppo differenziale dell'intero sistema e con $ \Delta \tau _{i}$ il $ DGD$ introdotto dalla lamina i-esima, nell'ipotesi che $ \Delta (\Delta \tau_{i})\rightarrow0$.

L'espressione precedente può venir esplicitata nella forma

$\displaystyle \frac{\partial DGD}{\partial \Delta\tau_{i}}=\frac{1}{2\sqrt{\Ome...
...c{\mathbf{\Omega}\frac{\partial \mathbf{\Omega}}{\partial \Delta\tau_{i}}}{DGD}$ (4.2.3)

che costituisce il punto di arrivo della teoria che stiamo sviluppando,

Ci si propone ora di calcolare la matrice di Müller risultante dal contributo degli $ n$ cristalli birifrangenti, e da questa arrivare al calcolo della componenti del vettore $ \mathbf{\Omega}$, da cui ricavare l'espressione del DGD derivato in $ \Delta \tau _{i}$.

Si ricordano le espressioni delle matrici di Müller, e altre espressioni necessarie a svolgere la teoria di Müller, nell'ordine: il vettore $ \mathbf{\Omega}$,

$\displaystyle \mathbf{\Omega}\doteq\left( \begin{array}{c} \Omega_{x} \ \Omega_{y} \ \Omega_{z} \ \end{array}\right),$ (4.2.4)

la matrice $ \mathbf{\Omega} \times$

$\displaystyle \mathbf {\Omega \times}=\dfrac{dB}{d \omega} B^{-1} ,$ (4.2.5)

$\displaystyle \mathbf {\Omega \times}=\left[ \begin{array}{c c c} 0 & -\Omega_{...
...ga_{z} & 0 & -\Omega_{x} \ -\Omega_{y} & \Omega_{x} & 0 \ \end{array}\right],$ (4.2.6)

e la matrice di Müller per una singola lamina ruotata di un generico angolo $ \theta$, ottenuta come prodotto della matrice di Müller $ M_{i}$, dipendente dalla frequenza angolare e dalle caratteristiche della lamina in oggetto, nella forma 4.2.7. La dipendenza dell'angolo $ \theta$, che gli assi della i-esima lamina birifrangente formano con quelli della (i-1)-esima, viene mantenuta nella matrice di rotazione $ R_{i}$ in 4.2.8:

$\displaystyle M_{i}(\omega)=\left[\begin{array}{c c c} 1 & 0 & 0 \ 0 & \cos (\...
...\Delta \tau_{i} \omega) & \cos (\Delta \tau_{i} \omega) \ \end{array} \right],$ (4.2.7)

$\displaystyle R_{i}(\theta)=\left[\begin{array}{c c c} \cos (2 \theta_{i}) & \s...
... (2 \theta_{i}) & \cos (2 \theta_{i}) & 0 \ 0 & 0 & 1 \ \end{array} \right] .$ (4.2.8)

Dalla matrice di Müller e dalla matrice di rotazione i-esima si ottiene la matrice caratteristica della lamina i-esima $ B_{i}(\omega, \theta_{i})$, che descrive il comportamento della lamina nel sistema al variare della frequenza angolare e dell'angolo compreso tra gli assi di due lamine successive,

$\displaystyle B_{i}(\omega, \theta_{i})=R_{i}\cdot M_{i} \cdot R_{i}^{-1} .$ (4.2.9)

Tenuto conto che il sistema in analisi è costituito da sei lamine, la matrice che descrive interamente il comportamento del sistema si otterrà come moltiplicazione di altrettante matrici della forma 4.2.9.

Tuttavia avendo ipotizzato una configurazione a tre lamine equivalenti, e avendo posto il primo banco di lamine a zero gradi, in modo da utilizzzarlo come riferimento per la rotazione dei blocchi successivi, la matrice di rotazione 4.2.8 per $ \theta=0$ diventa la matrice identica, mentre il prodotto di due matrici nella forma 4.2.9 con $ \theta_{i}=\theta_{i-1}$ mantiene ancora la forma di riferimento, tuttavia la matrice di Müller associata assume la forma:

$\displaystyle M_{i-1,i}(\omega)=\left[\begin{array}{c c c} 1 & 0 & 0 \ 0 & \co...
...a) & \cos ((\Delta \tau_{i-1}+\Delta \tau_{i}) \omega) \ \end{array} \right] .$ (4.2.10)

In questo modo si è costruita quella che chiamiamo una lamina eqivalente, ossia la giustapposizione di due lamine con gli assi allineati, che nel caso ideale sarà descritta dalla relazione:

$\displaystyle B_{i-1,i}(\omega)=R(\theta) \left[\begin{array}{c c c} 1 & 0 & 0 ...
...lta \tau_{i-1}+\Delta \tau_{i}) \omega) \ \end{array} \right] R(\theta)^{-1} .$ (4.2.11)

Dalla 4.2.11 risulta evidente che nel caso di perfetto allineamento delle due lamine, il comportamento della lamina equivalente coincide con quello di una singola lamina caratterizzata da $ \Delta \tau=\Delta \tau_{i-1}+\Delta \tau_{i}$ nella forma 4.2.9.

Nell'ipotesi invece che l'allineamento non sia perfetto, e che le lamine adiacenti siano disallineate di un angolo $ \epsilon$, tale che $ \theta_{i}=\theta_{i-1}+\epsilon$, il prodotto tra le matrici di rotazione non offre come risultato la matrice identica.

Pertanto nell'ipotesi di non perfetto allineamento delle lamine la matrice di Müller della lamina equivalente assume la forma


$\displaystyle B_{i-1,i}=B_{i}\cdot B_{i-1}$ $\displaystyle =$ $\displaystyle R(\theta_{i})M(\Delta \tau_{i})R(\theta_{i})^{-1}R(\theta_{i-1})M(\Delta \tau_{i-1})R(\theta_{i-1})^{-1}$ (4.2.12)
  $\displaystyle =$ $\displaystyle R(\theta_{i})M(\Delta \tau_{i})R(\epsilon)M(\Delta \tau_{i-1})R(\theta_{i-1})^{-1} ,$ (4.2.13)

che svolta in forma simile alla 4.2.11, assume invece la forma seguente

$\displaystyle B_{i-1,i} = R(\theta_{i-1}+\epsilon) \left[\begin{array}{c c c} \...
...psilon) & \mathcal{C} & \mathcal{D} \ \end{array} \right] R(\theta_{i-1})^{-1}$ (4.2.14)


$\displaystyle \mathcal{A}$ $\displaystyle =$ $\displaystyle \cos(\Delta \tau_{i} \omega) \cos(\Delta \tau_{i-1} \omega)\cos(2 \epsilon)-\sin(\Delta \tau_{i} \omega)\sin(\Delta \tau_{i-1} \omega)$  
$\displaystyle \mathcal{B}$ $\displaystyle =$ $\displaystyle \sin(\Delta \tau_{i} \omega) \cos(\Delta \tau_{i-1} \omega) +\cos(\Delta \tau_{i} \omega)\sin(\Delta \tau_{i-1} \omega)\cos(2 \epsilon)$  
$\displaystyle \mathcal{C}$ $\displaystyle =$ $\displaystyle -\sin(\Delta \tau_{i} \omega)\cos(\Delta \tau_{i-1} \omega)\cos(2 \epsilon)-\cos(\Delta \tau_{i} \omega)\sin(\Delta \tau_{i-1} \omega)$  
$\displaystyle \mathcal{D}$ $\displaystyle =$ $\displaystyle \cos(\Delta \tau_{i} \omega)\cos(\Delta \tau_{i-1} \omega) -\sin(\Delta \tau_{i} \omega)\cos(\Delta \tau_{i-1} \omega)\cos(2 \epsilon) .$  

Dalle diverse matrici $ B$ associate alle singole lamine o alle lamine equivalenti, si perviene alla matrice del sistema, nel formalismo di Müller, attraverso il semplice prodotto di matrici

$\displaystyle B=B_{n}\cdot B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1} .$ (4.2.15)

Risulta chiaro allora che si perviene al calcolo di $ \frac{\partial \mathbf{\Omega}}{\partial \Delta \tau_{i}}$ attraverso la derivazione della matrice complessiva $ B$ rispetto alla frequenza angolare e della matrice $ \mathbf {\Omega \times}$ rispetto a $ \Delta \tau _{i}$; operazioni tutt'altro che agevoli vista la notevole complessità che possono raggiungere le espressioni.

In letteratura il problema della derivazione è stato in parte risolto adottando la seguente approssimazione

$\displaystyle \frac{d B}{d \omega}\approx\frac{B(\omega+\Delta \omega)-B(\omega)}{\Delta \omega},$ (4.2.16)

che fa coincidere la derivata con il rapporto incrementale, tuttavia si può ritenere che tale approssimazione presenti delle limitazioni dovute alla difficoltà di definire univocamente un intervallo $ \Delta \tau$ che permetta il calcolo corretto sia di $ \frac{d B}{d \omega}$ che di $ \frac{d [\mathbf {\Omega \times}]}{d \omega}$.

Essendo la generica $ B_{i}$ una funzione matriciale, si può applicare la nota regola di derivazione del prodotto di funzioni all'espressione 4.2.15 e si ottiene:

$\displaystyle \frac{dB}{d \omega}=\frac{d(B_{n}\cdot B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1})}{d \omega},$ (4.2.17)

$\displaystyle \frac{d(B_{n}\cdot B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1})}{d \...
...1})+ B_{n}\cdot \frac{d (B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1})}{d \omega} .$ (4.2.18)

Si osserva che la 4.2.18 è una formula ricorsiva, infatti possiamo riscriverla evidenziandone chiaramente la ricorsività intrinseca; definiamo dapprima la matrice complessiva

$\displaystyle P_{n}= B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1}$ (4.2.19)

ed esplicitiamo la derivazione del prodotto nella forma:

$\displaystyle \frac{d P_{n}}{d \omega}=\frac{d P_{n}}{d \omega} \cdot P_{n-1}+ B_{n} \cdot \frac{d P_{n-1}}{d \omega} \;\;\;\;\; n > 0 .$ (4.2.20)

Infatti per $ n=0$ l'espressione 4.2.19 si riduce a

$\displaystyle P_{n}=I_{3}=\left[\begin{array}{c c c} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 1 \ \end{array} \right] \;\;\;\;\; n=0 .$ (4.2.21)

Verificato che si può pervenire al calcolo preciso della derivata senza l'approssimazione incrementale diamo una traccia dei passaggi che portano alla sua implementazione iterativa. Nuovamente dall'espressione 4.2.15 per $ n=1$ si ottiene

$\displaystyle \frac{dB_{1}}{d \omega}=\frac{d B_{1}}{d \omega} \cdot I_{3} + B_{1} \cdot \frac{d I_{3}}{d \omega} $ (4.2.22)

mentre per $ n=2$, cioè per un sistema a due lamine vale la relazione seguente, che può essere estesa a un sistema a tre lamine nella forma 4.2.24, e da questo a un sistema generico di $ n$ lamine.

$\displaystyle \frac{d(B_{2} \cdot B_{1})}{d \omega}=\frac{d B_{2}}{d \omega} \cdot B_{1} + B_{2} \cdot \frac{d B_{1}}{d \omega} $ (4.2.23)

$\displaystyle \frac{d(B_{3} \cdot B_{2} \cdot B_{1})}{d \omega}=\frac{d B_{3}}{...
...cdot (B_{2} \cdot B_{1}) + B_{3} \cdot \frac{d (B_{2} \cdot B_{1})}{d \omega} .$ (4.2.24)

Sostituendo, per un sistema a tre lamine , le espressioni 4.2.22, 4.2.23 e 4.2.24 nella 4.2.19 si ottiene

$\displaystyle \frac{d(B_{3} \cdot B_{2} \cdot B_{1})}{d \omega}=\frac{d B_{3}}{...
...d B_{2}}{d \omega} \cdot B_{1} + B_{2} \cdot \frac{d B_{1}}{d \omega} \right] .$ (4.2.25)

Come si può notare, il problema della derivazione esatta in $ \omega$ del prodotto

$\displaystyle B=B_{n}\cdot B_{n-1} \cdot ...\cdot B_{2} \cdot B_{1} $

è stato semplicemente risolto.

Il calcolo della derivata della matrice $ B_{i}$ di una singola lamina non rappresenta infatti una notevole difficoltà.

Si consideri a tale proposito un generico cristallo birifrangente preso singolarmente, la sua matrice nel formalismo di Müller risulta

$\displaystyle B_{i}(\omega, \theta_{i})=R_{i}\cdot M_{i} \cdot R_{i}^{-1} ,$ (4.2.26)

sostituendo le espressioni della matrice di birifrangenza 4.2.7 e della matrice di rotazione 4.2.8 si ottiene per una singola lamina l'espressione analitica

$\displaystyle \begin{footnotesize}
B_{i}=\left[\begin{array}{c c c}
\par
\cos^{...
... \cos (\Delta \tau_{i} \omega) \\
\par
\end{array} \right]
\end{footnotesize}$ (4.2.27)

la cui derivata rispetto alla frequenza angolare $ \omega$ risulta facilmente

$\displaystyle \begin{footnotesize}
\frac{d B_{i}}{d \omega}=\Delta \tau_{i} \le...
...-\sin (\Delta \tau_{i} \omega) \\
\par
\end{array} \right]
\end{footnotesize}$ (4.2.28)

A questo punto disponiamo di tutti gli elementi necessari per il calcolo della derivata rispetto a $ \Delta \tau _{i}$ di $ \mathbf {\Omega \times}$,

$\displaystyle \frac{\partial\left[\mathbf {\Omega \times} \right] }{\partial \D...
...1}+ \frac{\partial B}{\partial \omega} \frac{B^{-1}}{\partial \Delta \tau_{i} }$ (4.2.29)

dove si sfrutta le seguente relazione per semplificare il calcolo

$\displaystyle \frac{D [B^{-1}]}{d \Delta \tau_{i}}=-B^{-1} \cdot \frac{d B}{d \Delta \tau_{i}} \cdot B^{-1} .$ (4.2.30)

Sostituendo la 4.2.30 nell'espressione della derivata di $ \mathbf {\Omega \times}$ 4.2.29 si ottiene

$\displaystyle \frac{\partial\left[\mathbf {\Omega \times} \right] }{\partial \D...
... \cdot B^{-1} \cdot \frac{\partial B}{ \partial \Delta \tau_{i}}\right] B^{-1}.$ (4.2.31)

Infine, analogamente a quanto scritto nell'espressione 4.2.24, per un sistema a tre lamine, la derivata rispetto a $ \Delta \tau _{i}$ diventa:

$\displaystyle \frac{\partial B }{\partial \Delta \tau_{i}}= \frac{\partial[B_{3...
...ta \tau_{i}} B_{1} + B_{2} \frac{\partial B}{\partial \Delta \tau_{i}} \right],$ (4.2.32)

che sostituita nella precedente 4.2.31, fornisce i termini $ \frac{d \Omega_{j}}{d \Delta \tau_{i}}$, che costituiscono la 4.2.3.

Ugualmente, procedendo con le sostituzioni a ritroso, si possono calcolare le espressioni dei $ \frac{\partial DGD}{\partial \Delta \tau_{i}}$ per $ i=1,2,3$ nel sitema a tre lamine considerato.

Con un ragionamento analogo a quello svolto fin'ora riguardo la derivata del DGD rispetto $ \Delta \tau _{i}$, si può definire anche il rapporto $ \frac{\partial DGD}{\partial \epsilon_{i}}$ col significato di derivata del DGD rispetto al disallineamento all'interno della lamina equivalente i-esima.


next up previous
Next: Valutazione numerica Up: Valutazione delle limitazioni Previous: Analisi con le matrici
Leonardo Sabaini 2003-08-16