Fisica — Physics

La metrica di Minkowski

In uno spazio ordinario (euclideo), il teorema di Pitagora afferma che, dato un triangolo rettangolo AOB, retto in O, vale la seguente relazione tra l'ipotenusa AB e i cateti OA e OB:

AB2 = OA2 + OB2.

Questo è facilmente applicabile ad uno spazio a due dimensioni per calcolare il quadrato della distanza di un punto P di coordinate xP e yP dall'origine O (vedi grafico).



Il teorema di Pitagora fornisce per il quadrato della distanza r = OP il valore:

(7.1): r2 = xP2 + yP2.

Naturalmente, il teorema è estendibile a spazi di qualunque dimensione. Infatti, data una terza dimensione z, si può applicare il teorema dapprima alle coordinate xP e yP ed ottenere r, e poi applicarlo a r e alla coordinata z ed ottenere:

R2 = r2 + zP2 = xP2 + yP2 + zP2.



Sia r che R possiedono un'interessante proprietà. Se applichiamo una rotazione attorno ad un asse, la loro lunghezza non cambia. Perciò essi sono invarianti rispetto alle rotazioni. Includiamo adesso il tempo. Consideriamo un punto di coordinate (txyz) e poniamo per definizione s2 = c2 · t2 + x2 + y2 + z2 (è necessario introdurre la velocità della luce c per ottenere la corretta dimensione). Domanda: è s2 invariante rispetto alle trasformazioni di Lorentz? La risposta è no, come si può verificare facilmente. Allora sorge la seguente domanda: esiste una generalizzazione del teorema di Pitagora che risulti invariante rispetto alle trasformazioni di Lorentz? In questo caso la risposta è sì. Vediamo come funziona.

Limitiamoci per semplicità alle due dimensioni (tx), consideriamo la seguente espressione

(7.2): s2 = c2 · t2 – x2,

e applichiamo la seguente trasformazione di Lorentz:

t' = ( t + x · v / c2 ) · γ, x' = ( x + v · t ) · γ.

I quadrati di t' e x' sono:

t'2 = ( t2 + 2 · t · x · v / c2 + x2 · v2 / c4 ) · γ2,

x'2 = ( x2 + 2 · x · v · t + v2 · t2 ) · γ2.

Espressa in termini delle nuove coordinate, l'equazione (7.2) diventa (le parti in rosso si cancellano a vicenda):

c2 · t'2 – x'2 =

= ( c2 · t2 + 2 · t · x · v x2 · v2 / c2 ) · γ2 – ( x2 + 2 · x · v · t v2 · t2 ) · γ2

= ( c2 · t2 – x2 + x2 · v2 / c2 – v2 · t2 ) · γ2

= [ c2 · t2 – x2 – v2 · ( t2 – x2 / c2 ) ] · γ2

= [ c2 · t2 – x2 · ( v2 / c2 ) · ( c2 · t2 – x2 ) ] · γ2.

= ( c2 · t2 – x2 )  · ( 1 – v2 / c2 ) · γ2

c2 · t2 – x2.

L'ultimo passo è conseguenza del fatto che, secondo la definizione, risulta γ2 = 1 / ( 1 – v2 / c2 ). Perciò, vediamo che attribuendo al quadrato di c · t un segno opposto a quello delle coordinate spaziali otteniamo una ricetta che dà quantità invarianti rispetto alle trasformazioni di Lorentz. Per quale motivo il segno della coordinata tempo è positivo mentre quello della coordinata spaziale è negativo e non viceversa? In effetti, ciò che si richiede è che le coordinate temporali e spaziali abbiano segni opposti. Che uno assegni il segno positivo oppure negativo alla coordinata tempo dipende dall'intervallo in considerazione. Per convenienza si dovrebbe scegliere il segno che rende positivo l'invariante s2, in modo che la sua radice quadrata risulti reale. Perciò il coefficiente del quadrato degli intervalli di tipo tempo dovrebbe essere positivo, mentre nel caso degli intervalli di tipo spazio il segno positivo dovrebbe essere posto davanti alle parti spaziali. Non è coinvolto niente di fisico; si tratta semplicemente di un requisito matematico necessario per rendere reale la radice quadrata.

Che significato ha l'invariante così definito? Supponiamo che sia di tipo spazio. Allora esiste una trasformazione di Lorentz in grado di rendere nulla la coordinata temporale t'. In tali coordinate abbiamo: s2 = x'2. Ciò mostra che s rappresenta la distanza spaziale nel sistema in cui t' = 0. Similmente, se x' = 0, s rappresenta l'intervallo temporale nel sistema in cui x' = 0.

Ed ora veniamo alla metrica. Consideriamo di nuovo l'equazione (7.1), ma applichiamo alle coordinate x e y una trasformazione arbitraria. Allora, naturalmente, tale equazione può non essere più valida. Chiediamoci: è possibile avere un'espressione per r2 che sia valida in qualsiasi sistema di coordinate? La matematica mostra che la soluzione consiste nel considerare la somma di tutte le combinazioni di x2, y2, e x · y con appropriati coefficienti, del tipo:

(7.3): r2 = g11 (x1)2 + g12 x1 x2 + g21 x2 x1 + g22 (x2)2.

Così definiti, i coefficienti gij (ij = 1, 2) prendono il nome di tensore metrico dello spazio a due dimensioni (xy). Con questo trucco si può calcolare il quadrato delle distanze in (quasi) qualsiasi sistema di coordinate. Questa espressione può essere considerata come la generalizzazione del teorema di Pitagora in uno spazio ordinario (euclideo). Domanda: si applica una formula di questo tipo anche allo spazio-tempo? Sì, purché in un sistema di coordinate ortogonali la formula torni ad essere del tipo espresso dall'equazione (7.2). Una metrica che acquisti la forma (7.2) quando gli assi sono ortogonali è detta minkowskiana. Nella metrica di Minkowski, l'equazione (7.2) prende questa forma:

(7.4): s2 = η00 (x0)2 + η01 x0 x1 + η10 x1 x0 + η11 (x1)2.

In questo caso si è applicato un nuovo simbolo, ημν. É il simbolo usato generalmente nella letteratura per rappresentare la metrica di Minkowski (la lettera greca η si pronuncia 'eta'). Per mantenere le corrette dimensioni, x0 sostituisce c · t. Perché ho usato per le coordinate i simboli x1, x2 e x0 invece di x, y e c · t? Per il fatto che con questa notazione si possono applicare alle equazioni (7.3) e (7.4) le seguenti forme abbreviate:

r2 = gij xi xjij = 1, 2,

s2 = ημν xμ xνμν = 0, 1,

dove è sottintesa la sommatoria su tutti i valori degli indici ripetuti. Questa forma abbreviata è molto utile nel trattare con i vettori ed i tensori.

É da notare un'ultima cosa. Applicate a due qualsiasi vettori, le seguenti espressioni

gij xi xj e

ημν xμ xν,

producono scalari, cioè i valori che si ottengono effettuando la sommatoria sugli indici non dipendono dal sistema di riferimento, a patto che gij e ημν si trasformino appropriatamente (non tratterò la loro legge di trasformazione, essendo che richiede l'uso dell'analisi differenziale che probabilmente non conosci; e d'altra parte questi articoli sono intesi a considerare principalmente gli aspetti fisici).

The Minkowski metric

In an ordinary (Euclidean) space, the Pythagoras theorem says that, given a triangle AOB, square in O, the following relation holds between the hypotenuse AB and the sides OA and OB:

AB2 = OA2 + OB2.

This is readily applied in a two dimensional space to get the square of the distance from the origin O of a point P of coordinates xP and yP (see graph).



Pythagoras theorem gives for the square of the distance r = OP the value:

(7.1): r2 = xP2 + yP2.

Of course, the theorem can be extended to any number of dimensions. In fact, given a third dimension z, one can apply the theorem first to the coordinates xP and yP to get r, and then to r and the z coordinate to get:

R2 = r2 + zP2 = xP2 + yP2 + zP2.



Both r and R have an interesting property. If we apply a rotation about any axis, their lengths do not change. They are invariant under rotations. Now let us include time. Consider a point of coordinates (txyz), and define s2 = c2 · t2 + x2 + y2 + z2 (the introduction of the speed of light c is necessary to get the correct dimension). Question: is s2 invariant under Lorentz transformations? The answer is no, as one can easily verify. Then the following question arises: does there exist a generalization of the Pythagoras theorem that is invariant under Lorentz transformations? In this case, the answer is yes. Let us see how it works.

Let's restrict for simplicity to the two dimensional space (tx), consider the following expression

(7.2): s2 = c2 · t2 – x2,

and apply the following Lorentz transformation:

t' = ( t + x · v / c2 ) · γ, x' = ( x + v · t ) · γ.

The squares of t' and x' are:

t'2 = ( t2 + 2 · t · x · v / c2 + x2 · v2 / c4 ) · γ2,

x'2 = ( x2 + 2 · x · v · t + v2 · t2 ) · γ2.

Equation (7.2), expressed in terms of the new coordinates, gives (the parts in red cancel out):

c2 · t'2 – x'2 =

= ( c2 · t2 + 2 · t · x · v x2 · v2 / c2 ) · γ2 – ( x2 + 2 · x · v · t v2 · t2 ) · γ2

= ( c2 · t2 – x2 + x2 · v2 / c2 – v2 · t2 ) · γ2

= [ c2 · t2 – x2 – v2 · ( t2 – x2 / c2 ) ] · γ2

= [ c2 · t2 – x2 · ( v2 / c2 ) · ( c2 · t2 – x2 ) ] · γ2.

= ( c2 · t2 – x2 )  · ( 1 – v2 / c2 ) · γ2

c2 · t2 – x2.

The last step follows from the fact that γ2 = 1 / ( 1 – v2 / c2 ). So, we see that by attributing to the square of c · t a sign opposite to that of the spatial coordinates, we obtain a recipe for getting quantities that are invariant under Lorentz transformations. Why is the sign of the time coordinate positive and that of the space coordinate negative, and not viceversa? Actually, all that is required is that time and spatial coordinates have opposite signs. Whether one assigns a positive or negative sign to the time coordinate depends on the interval one measures. For convenience one should take the sign that makes the invariant s2 positive, so that a real number come out of its square root. Hence, the coefficient of the square of the time coordinate should be positive for time-like intervals, while for space-like intervals the positive sign should be put before the spatial parts. Nothing physical is involved in this; it's just the mathematical requirement necessary for the square root to be real.

What is the meaning of the invariant thus defined? Suppose the interval space-like. Then there exists a Lorentz transformation such that the transformed time coordinate t' is zero, and s2 = x'2. This shows that s represents the spatial distance in the system in which t' = 0. Similarly, if x' = 0, s represents the time interval in the system in which x' = 0.

Now let us consider the metric. Take again equation (7.1), but apply to the coordinates x and y an arbitrary transformation. Then, of course, equation (7.1) may be no more valid. Is it possible to get an expression for r2 that is valid in any system of coordinates? Mathematics shows that the solution consists in considering the sum of all combinations of x2, y2, and x · y, with appropriate coefficients, like:

(7.3): r2 = g11 (x1)2 + g12 x1 x2 + g21 x2 x1 + g22 (x2)2.

People refer to the set of coefficients gij (i, j = 1, 2) as to the metric tensor of the two dimensional space (xy). By using this trick one is able to calculate the square of a distance in (almost) any coordinate system. This expression may be considered as the generalization of Pythagoras theorem in an ordinary (Euclidean) space. Question: does a formula like this apply also to space-time? Yes, provided that when the system of coordinates is orthogonal the formula reduces to the type expressed by equation (7.2). A metric that reduces to type (7.2) when the axes are orthogonal is said to be Minkowskian. In a Minkowski metric, equation (7.2) is usually takes this form:

(7.4): s2 = η00 (x0)2 + η01 x0 x1 + η10 x1 x0 + η11 (x1)2.

In this case a new symbol, ημν, has been used. This is the one generally used in the literature to represent the Minkowski metric (the Greek letter η is pronounced 'eta'). In order to preserve the proper dimension, x0 stands for c · t instead of just t. Why did I use x1, x2 and x0 for the coordinates, instead of x, y and c · t? Because with this notation one can apply to equations (7.3) and (7.4) the following shorter forms:

r2 = gij xi xjij = 1, 2,

s2 = ημν xμ xνμν = 0, 1,

where it is understood that summations are to be applied over the repeated indices. This shorter notation is very useful in dealing with vectors and tensors.

One last thing is to be noted. When applied to any two vectors x and y, the expressions

gij xi xj and

ημν xμ xν,

produce scalars, that is, when summation over the indices are carried out the two expressions produce values independent of the system of reference, provided that gij and ημν transform in the appropriate way (we are not going to consider how they transform, because it requires the use of differential analysis that perhaps you do not know, while we are mostly interested in physics).