La Teoría de la Relatividad Especial

El año 1905 fue un Annus Mirabilis para Einstein porque, en un mismo año, publicó cuatro artículos que transformaron la física y establecieron las bases de la física moderna: el efecto fotoeléctrico, el movimiento browniano, la relatividad especial y la equivalencia masa‑energía. El artículo de Albert Einstein “Zur Elektrodynamik bewegter Körper” (Sobre la Electrodinámica de los Cuerpos en Movimiento, Annalen der Physik, 1905) introdujo una teoría, la de la relatividad especial, que resolvió las tensiones que se habían producido durante el siglo XIX entre la mecánica clásica y el electromagnetismo y entre observaciones astronómicas que parecían absolutamente irreconciliables. Recorreremos brevemente estas observaciones aparentemente contradictorias, algunos de los intentos de solución que se propusieron para reconciliarlas, y la solución definitiva que proporcionó Einstein con su teoría especial de la Relatividad. Deduciremos las principales predicciones de la teoría en un lenguaje que puede entenderse sin conocimientos matemáticos complicados.

Observaciones de la Aberración Astronómica

Ya desde el siglo XVII los astrónomos habían observado que la dirección aparente de los rayos de luz que proceden de las estrellas parecen variar ligeramente de ángulo según la época del año, tal como muestra la figura, en la que el ángulo aparece exagerado.

Bradley, en 1728, fue el primero en interpretar la aberracion astronómica como una suma de velocidades clásica de velocidad de la Tierra en su órbita con la velocidad de la luz.

Young (1908) toma la explicación clásica de Bradley y la adapta a la teoría ondulatoria de la luz de Maxwell. Para que la aberración funcione en un modelo ondulatorio:

  • la luz debe propagarse en un medio (el éter),
  • ese medio debe estar inmóvil en el marco del Sol,
  • la Tierra debe moverse a través de ese medio,
  • por tanto, debe existir un viento de éter relativo a la Tierra.

Young lo expresó de forma muy gráfica:

“El éter luminífero debe atravesar los cuerpos materiales tan libremente como el viento pasa entre los árboles.”

El experimento de Arago y el de Boscovich (1766), Wilson (1772) y Airy (1871) pusieron en crisis esta sencilla interpretación. Ambos experimentos trataron de repetir el experimento de la aberración astronómica pero haciendo que la luz atravesara algún medio denso delante o dentro del telescopio, para ver si el ángulo de aberración astronómica cambiaba. La menor velocidad de la luz en los medios densos debía hacer más manifiesto el efecto de la velocidad de la Tierra. El experimento de Arago (1810–1818) incluía una serie de prismas en el camino óptico de la luz delante de un telescopio. El experimento de Boscovich-Wilson-Airy consistía en repetir la observación de la aberración astronómica pero usando un telescopio cuyo tubo estaba relleno de agua. Este último experimento fue propuesto por Boscovich (1766) y realizado por Wilson (1772) y más tarde por Airy (1871). La idea era muy simple:

  • La aberración astronómica se explica clásicamente como una suma de velocidades: la luz llega con velocidad c, la Tierra se mueve con velocidad v, y el telescopio debe inclinarse un ángulo tanθ=v/c.
  • Pero si el telescopio está lleno de agua, la luz viaja dentro del tubo con velocidad c/n, mucho menor. Entonces, si la aberración dependiera de la velocidad de la luz dentro del telescopio, el ángulo debería cambiar. La predicción era que la aberración debería aumentar aproximadamente por un factor n.

La observación, en ambas clases de experimento mostró que no cambiaba absolutamente nada, el ángulo de aberración era el mismo que en un telescopio normal. Este resultado fue muy desconcertante para la óptica clásica.

Una explicación clásica aparentemente correcta llegó con Augustin Fresnel (1818), que aceptó la idea de Young de un éter inmóvil, pero introdujo una corrección según la cual los cuerpos como la Tierra arrastran parcialmente el éter, por tanto existe un viento de éter parcial. Según Fresnel:

  • El agua arrastra parcialmente al éter.
  • La luz dentro del agua no se mueve simplemente a c/n respecto al telescopio, sino que su velocidad efectiva incluye ese arrastre parcial.
  • Este arrastre compensa exactamente la diferencia que habría producido la menor velocidad de la luz en el agua

Obtuvo así un coeficiente de arrastre parcial de Fresnel: varrastre=v(11n2)que está de acuerdo con la aberración astronómica estándar. El resultado es que la aberración depende de la velocidad de la luz en el vacío, no de la velocidad dentro del medio. Su teoría consigue explicar así la aberración, el experimento del telescopio lleno de agua, y la refracción en medios en movimiento.

Una corrección alternativa fue realizada por George Stokes (1845) quien propuso un éter “viscoso” que estaba inmóvil lejos de la Tierra, pero era arrastrado completamente cerca de la superficie terrestre. Esto implicaba: (i) un flujo de éter alrededor de la Tierra, que explicaba la aberración, y (ii) un arrastre superficial del éter, que explicaba la refracción independiente del movimiento de la Tierra que había observado Arago.

Experimentos de Michelson-morley

Los experimentos de Michelson-Morley contradijeron todo lo que se había pensado hasta entonces sobre el éter y, para rematar, indujeron a pensar que los objetos se contraen en la dirección del movimiento de la Tierra (!) Esto sumió a los físicos en una perplejidad pocas veces vista en la historia.

El experimento fue realizado entre abril y julio de 1887 por los físicos estadounidenses Albert Abraham Michelson (Premio Nobel de Física, 1907)[1] y Edward Morley, en lo que hoy es la Universidad Case de la Reserva Occidental en ClevelandOhio. La experiencia comparaba la velocidad de la luz en dos direcciones perpendiculares entre sí, en un intento de detectar el movimiento relativo de la materia, incluido su laboratorio, a través del éter luminífero o «viento de éter», como a veces se le llamaba.

El sistema experimental (Figura) consistía en un espejo semiplateado que dividía un haz de luz blanca en dos rayos que viajan en un determinado ángulo el uno con respecto al otro, con lo que se logra enviar simultáneamente los dos rayos de luz procedentes de la misma fuente en direcciones perpendiculares, hacerlos recorrer distancias iguales (o caminos ópticos iguales) y recogerlos en un punto común, en donde se crea un patrón de interferencia que depende de la velocidad de la luz en los dos brazos del interferómetro. Cualquier diferencia en esta velocidad (provocada por la diferente dirección de movimiento de la luz con respecto al movimiento del éter) sería detectada.

Fig. Esquema del experimento de Michelson y Morley: [1] Fuente de luz. [2] y [4] Espejo divisor semiplateado. [3] y [3′] Espejos planos. [5] Ocular.

El resultado fue negativo, ya que no encontraron ninguna diferencia significativa entre la velocidad de la luz en la dirección del movimiento a través del presunto éter y la velocidad en ángulo recto. Esto implicaba que el éter era arrastrado totalmente por el movimiento de la Tierra, en contradicción con todos los experimentos anteriormente comentados.

La solución de Lorentz

Lorentz estaba convencido de que el éter existía, estaba inmóvil, y era el soporte de los campos electromagnéticos. Así que su reacción fue modificar las ecuaciones para que pareciera que no hay viento de éter, aunque sí lo haya. La primera propuesta fue la contracción de FitzGerald–Lorentz (1892–1895). Para explicar el resultado del experimento de Michelson–Morley, Lorentz adoptó la idea de FitzGerald:

La interpretación de Lorentz era que los cuerpos se contraen realmente en la dirección del movimiento, debido a fuerzas electromagnéticas internas. Con esa tasa de contracción, el interferómetro no debía detectar el viento de éter real. Pero había un problema adicional: Las ecuaciones de Maxwell no eran invariantes bajo las transformaciones galileanas habituales.

Para que las ecuaciones de Maxwell funcionara también en un sistema moviéndose con velocidad v, Lorentz introdujo en 1895 un “tiempo local” t’:

Este tiempo no era físico para él. Era un artificio matemático para que las ecuaciones transformadas perdieran los términos que delataban el movimiento respecto al éter.

La interpretación de Lorentz era que t era el tiempo verdadero del éter, y que t‘ es un tiempo ficticio que “usan” los electrones en movimiento para que las ecuaciones de Maxwell tengan la forma correcta. Con esto, las ecuaciones de Maxwell quedaban “casi” invariantes, y el movimiento de nuestro interferómetro respecto al éter resultaba prácticamente imposible de detectar, aunque existía según él.

En 1904 Lorentz mejoró la segunda expresión, completando la transformación (posteriormente llamada de Lorentz):

expresión que Einstein no conocía en su forma final cuando enunció su propia solución.

Imagen. Hendrik Antoon Lorentz (1853-1928)

Para Lorentz, solo x‘ era físico (longitudes contraídas); t‘ seguía siendo un truco matemático. Además, el éter seguía siendo el sistema privilegiado, y la transformación no es recíproca: solo valía para pasar del éter a un sistema móvil. De este modo, Lorentz había construido una teoría en la que el éter existe, pero es imposible detectarlo.

La solución es brillante pero no deja de ser insatisfactoria, porque es como si la naturaleza conspirara para ocultar la existencia del éter, contrayendo los cuerpos, desincronizando los relojes, y haciendo que los electrones vean un tiempo local diferente al verdadero.

En sus propias palabras (parafraseando sus escritos de 1904): “Parece como si el movimiento relativo respecto al éter fuera imposible de detectar.” Pero él seguía creyendo que el éter estaba ahí.

La Solución de Einstein

Einstein pensó que otra manera más simple de resolver las aparentes paradojas era llevando a un extremo más radical las propuestas de Lorentz. Supuso que el éter no existía; que el tiempo local de Lorentz t es un tiempo físico, no un artificio; Interpretó la contracción y la dilatación de Lorentz como cinemáticas, no dinámicas; convirtió esa transformación en válida para cualesquiera dos sistemas de referencia en movimiento relativo, no había ningún sistema privilegiado o absoluto.

Con ello, la invariancia de las ecuaciones de Maxwell se convierte en un principio general de la física, no en un ajuste; y con ello, la constancia de la velocidad de la luz en todos los sistemas inerciales de referencia.

Encontró que todo esto se podía resumir de forma concisa axiomáticamente mediante sólo dos postulados:

  • Las leyes de la física deben ser las mismas para todos los observadores inerciales.
  • La velocidad de la luz en el vacío es igual para todos los observadores inerciales (y es independiente del movimiento de la fuente, como ocurre con todas las ondas)

En su artículo de 1905, enuncia estos dos postulados. Luego  define qué significa que dos relojes A y B, en reposo relativo, estén sincronizados en un mismo sistema inercial de referencia. Introduce un método de sincronización basado en el envío de una señal luminosa del reloj A al reloj B y su reflexión de vuelta al reloj A. Einstein establece que el reloj B está sincronizado con A si el instante en que la señal fue reflejada en B, tB, satisface:

Es decir, el tiempo de viaje de ida y el de vuelta se consideran iguales. Esta es la convención de sincronización de Einstein–Poincaré. Tiene sentido, pues se considera a la velocidad de la luz constante e isótropa en todas las direcciones de propagación. Establece que el transcurso del tiempo en un sistema de referencia inercial dado es lo que miden relojes sincronizados según ese procedimiento.

A partir de los dos postulados, la definición de simultaneidad, y la exigencia de linealidad en las transformaciones entre coordenadas de sistemas inerciales, Einstein deduce las transformaciones de Lorentz en su forma completa:

Una vez obtenidas las transformaciones, Einstein deduce la dilatación temporal, la contracción de longitudes, la relatividad de la simultaneidad, y la composición relativista de velocidades. Todo ello como corolarios matemáticos, no como hipótesis adicionales.

Finalmente, Einstein muestra que las ecuaciones de Maxwell son compatibles con sus transformaciones, lo que resuelve la tensión entre electromagnetismo y mecánica clásica.

Aquí vamos a explicar la teoría utilizando los dos postulados y el experimento mental del reloj de luz, un método muy didáctico que no fue utilizado por Einstein en 1905, sino por autores posteriores como Taylor & Wheeler, Rindler, French, etc., en textos pedagógicos posteriores a 1910 que explicaban la teoría de la Relatividad Especial. Un libro ya histórico de Vladimor Kourganoff (Introducción a la Teoría de la Relatividad), enormemente sencillo de entender, fue uno de los primeros traducidos al castellano que  utilizaba este recurso didáctico. Seguiremos aquí la clarísima exposición de Adrián Castelo Dilatación temporal, contracción longitudinal y las transformaciones de Lorentz – Física Tabú, que también utiliza el experimento mental del Reloj de Luz.

Imaginemos el siguiente experimento mental: supongamos que en el centro del interior de un tren situamos una bombilla, y en los extremos del tren dos detectores de luz.

Imaginemos a dos observadores: uno dentro del tren junto a la bombilla, y otro fuera en el andén que puede ver lo que ocurre dentro del tren, que además tiene dos detectores también a una distancia de él igual a la de los detectores de dentro del tren medida cuando el tren esta en reposo.

Ahora el tren comienza a marchar, y justo en el momento en que ambos observadores están alineados la bombilla se enciende, creando una esfera luminosa que se extiende a la velocidad de la luz . Dado que la velocidad de la luz es la misma para todos los observadores, ambos se verán en el centro de la esfera luminosa. Y esto es crucial.

El observador en el tren, que puede considerarse en reposo, verá que dado que ambos detectores están a la misma distancia de la bombilla, se encienden simultáneamente al llegar a ambos el frente de ondas de la esfera luminosa. Pero el observador en el andén discrepa: él ve que la esfera luminosa se expande mientras el observador en el tren avanza, por lo que el detector de la parte trasera llegará antes al frente de la esfera luminosa, haciendo clic, y posteriormente la esfera luminosa acaba por alcanzar al detector situado al frente del tren, oyéndose el segundo clic. Por otro lado, sus detectores hacen clic en el mismo momento.

El observador de dentro del tren considera simultáneos los clics de sus detectores, mientras que el de fuera no. Ahora bien, el observador de dentro del tren bien puede considerarse en reposo, y razonando a la inversa, verá que los clics de los detectores del observador en el andeń no suceden simultáneamente, dado que considera que este observador se mueve en la dirección contraria.

Aceptar que la velocidad de la luz es la misma para todos los observadores inerciales nos lleva a que el concepto de simultaneidad es relativo. Eventos simultáneos para un observador pueden no serlo para otro en movimiento relativo uniforme a éste. ¿Qué implica esto sobre la medición de intervalos temporales? ¿Y sobre la medición de distancias?

EL TIEMPO ES RELATIVO

Es fácil entender que si la simultaneidad es relativa, los intervalos temporales también. Mientras para el observador interno al tren ambos detectores han hecho clic, para el externo no. Si antes de partir el tren, ambos acuerdan que el tiempo medido desde que se enciende la bombilla hasta que ambos detectores hacen clics es un segundo, el observador en el andén verá que el reloj del observador del tren se atrasa si el tren está en movimiento, y lo mismo pensará el observador del tren respecto al observador del andén.

Vamos a intentar encontrar una expresión que relacione los intervalos temporales medidos por ambos observadores. Para ello, recurramos a un nuevo experimento mental.

Supongamos que cada observador porta un reloj. El reloj más sencillo del mundo: un rayo luminoso reflejándose entre dos espejos. Nos podemos imaginar una bolita (el fotón) rebotando entre ambos, e incluso imaginarnos que cada vez que el fotón rebota en un espejo escuchamos un sonoro clic. Antes de montarse en el tren, ambos ponen sus relojes a funcionar a la vez y observan que los clics de ambos espejos están acompasados. Si acuerdan que miden el tiempo contando el número de clics, ambos medirán idénticos intervalos temporales entre dos sucesos.

Pero ahora uno de ellos se monta en un tren que posteriormente se pone en movimiento uniforme. Dado que él, junto con su reloj, están en reposo respecto al tren, sin duda verá al fotón rebotando en trayectorias verticales entre ambos espejos.

Pero el observador externo verá que lo que ocurre es bien distinto: dado que el tren avanza conforme el fotón rebota, su trayectoria no es vertical, sino oblicua. En la siguiente imagen podemos ver un esquema de la situación:

Fig. Esquema con lo que ve el observador en el tren S’ (izquierda) y el observador en reposo en el andén, S (derecha) durante el intervalo de tiempo \Delta t.

Sea el intervalo entre dos rebotes (ida y vuelta) del fotón \Delta t' medido por el observador en movimiento S’, y sea \Delta t el intervalo entre dos rebotes que ve el observador externo S cuando observa el reloj del observador del tren. Vamos a intentar encontrar una expresión que relacione ambos intervalos teniendo en cuenta que ambos observadores miden la misma velocidad de la luz c.

Para el observador S’, el fotón recorre la distancia 2d en su ida y vuelta, donde d es la altura del vagón, con lo que escribirá que el tiempo que ha tardado el fotón en realizar tal vaivén ha sido:

Δt=2DcD=cΔt2 \Delta t=\dfrac{2D}{c} \longleftrightarrow D=\dfrac{c\Delta t}{2}

En cambio, el observador S verá que el fotón recorre la hipotenusa D de un triángulo rectángulo en la subida y en la bajada, de catetos v\Delta t y d, con lo que  mide (notemos que usamos la misma velocidad de la luz c, no se ve «afectada» por el movimiento de S’):

Δt=2DcD=cΔt2  \Delta t=\dfrac{2D}{c} \longleftrightarrow D=\dfrac{c\Delta t}{2}

Por el teorema de Pitágoras, podemos expresar D como: 

D=d2+(vΔt2)2 D=\sqrt{d^2+\left(\dfrac{v\Delta t}{2}\right)^2}

Dado que conocemos d y D en función de los intervalos temporales, lo podemos juntar todo en una expresión que involucre solo a ambos intervalos temporales: 

Δt=2cc2Δt24+v2Δt24 \Delta t=\dfrac{2}{c}\sqrt{\dfrac{c^2 \Delta t’^2}{4}+\dfrac{v^2\Delta t^2}{4}}

Pasamos c multiplicando a la izquierda, y elevando al cuadrado para eliminar la raíz cuadrada queda: 

c2Δt2=c2Δt2+v2Δt2 c^2\Delta t^2=c^2 \Delta t’^2+v^2\Delta t^2

Ahora solo falta despejar \Delta t en función de \Delta t'. Se obtiene: 

Δt=Δt1(vc)2 \Delta t=\dfrac{\Delta t’}{\sqrt{1-\left(\frac{v}{c}\right)^2}}

Que es la famosa ecuación de dilatación temporal. Frecuentemente se escribe el cociente (v/c) como \beta, y se define el factor de Lorentz como:

γ=11β2  \gamma=\dfrac{1}{\sqrt{1-\beta^2}}

Dado que es imposible desplazarse a la velocidad de la luz (entre otras cosas porque contradice el postulado de que la velocidad de la luz ha de ser la misma para todos los observadores), \beta<1, y \gamma>1. Por tanto:   \Delta t> \Delta t' .

Cuando para nosotros (S) han pasado 10 minutos, para el observador en movimiento (S’) ha pasado menos tiempo, 5 minutos por ejemplo. ¡El observador S considera que los relojes de S’ corren más lentos! Pero lo recíproco también es cierto: ¡El observador S’ considera que los relojes de S son los que corren más lentos! No solo los intervalos temporales se dilatan, sino que esta dilatación es relativa.

Aquí llegamos a la conocida paradoja de los gemelos: un gemelo parte en una nave espacial, dispuesto a realizar un vuelo galáctico a velocidades cercanas a la de la luz. Dado que irá a velocidades arbitrariamente altas, puede darse el caso de que mientras que en la Tierra pasan cuarenta años, en la nave pase un año (o cualquier otra cantidad de tiempo en función de la velocidad) medidos desde la Tierra. Y ahí esta la paradoja: el observador en la nave tiene todo el derecho a considerarse en reposo, y por tanto considerar que es el reloj de su gemelo en la Tierra el que corre más lento.

La paradoja se resuelve dándose cuenta de que el observador en la nave no ha permanecido todo el trayecto en un sistema de referencia inercial, pues la nave debe acelerar a la salida y cuando de media vuelta para regresar. Esta asimetría rompe la paradoja. Según la Relatividad General, a su vuelta, habrá envejecido más el viajero que estaba en la nave. Pero esto es otro tema, y más complicado.

EL ESPACIO ES RELATIVO

De igual manera que la relatividad de la simultaneidad implicaba la relatividad de los intervalos temporales, ¡también implica la de los intervalos espaciales! Medir la longitud de un objeto consiste en marcar simultáneamente sus dos extremos, pero como debemos usar pulsos de luz para hacerlo, un observador en reposo puede creer que los marca simultáneamente, mientras que otro que vea a ese observador en movimiento junto con el objeto verá que no los ha marcado a la vez.

Una manera de medir la longitud de, digamos, una viga larga, sería colocar una fuente de luz (que también valga como detector) en un extremo y un espejo  en el otro. Supongamos que se realiza esta medición en un sistema S’, y supongamos que se mueve respecto a otro sistema S a velocidad \vec v (la figura es del excelente artículo de Adrian Castelo, al igual que todo el razonamiento que estamos siguiendo en esta sección):

El observador S’ medirá que la luz tarda en hacer la ida y vuelta 

Δt=2lc\Delta t’= \dfrac{2 l’}{c}

con l’ la longitud en S’ de la regla.

Pero S verá que, mientras el rayo avanza, la vara con el espejo también lo hacen, con lo que el tiempo de ida será mayor y el de vuelta menor. Si \Delta t es el tiempo medido en la ida y vuelta por S, podemos escribir \Delta t=\Delta t_1+\Delta t_2, con el subíndice 1 para la ida y 2 para la vuelta.

Como se ve en el esquema superior, la luz tiene que recorrer a la ida d=l+v\Delta t_1. Por otro lado, dado que lo hará a velocidad c, d=c\Delta t_1. Igualando y despejando: 

Δt1=lcv \Delta t_1 =\dfrac{l}{c-v}

A la vuelta en cambio recorre d'=l-v\Delta t_2, y de igual manera, d'=c\Delta t_2, con lo que:

Δt2=lc+v \Delta t_2= \dfrac{l}{c+v}

El tiempo total medido por S será: 

Δt=lcv+lc+v=2lcc2v2=2lc11v2c2\Delta t= \dfrac{l}{c-v}+\dfrac{l}{c+v}=\dfrac{2lc}{c^2-v^2}=\dfrac{2l}{c}\dfrac{1}{1-\frac{v^2}{c^2}}

Pero el último factor es \gamma^2, con lo que: 

Δt=2lcγ2 \Delta t=\dfrac{2l}{c}\gamma^2

Como ya sabemos, los intervalos temporales se relacionan mediante \Delta t=\gamma \Delta t'. Sustituyendo en esta expresión los tiempos medidos por S y S’ obtenemos que l=\dfrac{1}{\gamma} l', o lo que es lo mismo:

l=1β2l l=\sqrt{1-\beta^2} l’

Dado que \beta<1, S mide una longitud para la vara menor que la que mide S’. Y de nuevo, lo mismo opina S’ de la longitud medida por S. El observador que se considera en reposo ve contraídas las longitudes paralelas a la dirección del movimiento. Las transversales no, se puede demostrar que esto contradeciría los postulados.

Estos efectos no son abstracciones inútiles; sus efectos se han podido comprobar múltiples veces. Un ejemplo conocido es el de los muones, partículas que se producen en rayos cósmicos muy energéticos,  a una altitud aproximada de diez kilómetros.

Entre 10 y 15 km de altura llegan partículas muy energéticas del espacio, sobre todo protones (≈ 90 %) y núcleos de helio (≈ 9 %). Estas partículas tienen energías enormes, en rangos entre el GeV (gigaelectronvoltio o 109 eV) y el TeV (teraelectronvoltio o 1012 eV). Cuando un protón cósmico entra en la atmósfera y choca con un núcleo de nitrógeno u oxígeno, el  choque produce una cascada de partículas. En primer lugar,  se generan sobre todo piones: π⁺, π⁻ y π⁰.

Pero los piones cargados (π⁺ y π⁻) son inestables, tienen una vida media de 2.6 x 10-8 s y se desintegran en muones, neutrinos y antineutrinos:

Los muones salen disparados hacia abajo a velocidades muy cercanas a c. Los muones deberían desintegrarse antes de llegar al suelo… pero llegan. Esto puede explicarse por la relatividad especial.

La vida media del muón en reposo es de 2.2 x 10-6 s. A velocidad ≈ 0.998c, un muón recorrería en su propio tiempo: d = v \tau_0 \approx 660 m. Es decir: un muón “clásico” no debería recorrer más de 600–700 metros antes de desintegrarse. Pero los detectamos en la superficie, tras recorrer 10 km o más. Esto sólo es posible por la dilatación temporal. Desde nuestro punto de vista:

Con \gamma \approx 10 para energías típicas de muones atmosféricos: \tau \approx 2.2 \times 10^{-5} s, y la distancia recorrida:

Y muchos muones tienen energías aún mayores, con \gamma \approx 15-20, lo que les permite llegar a 10–15 km.

Desde el punto de vista del muón su vida media es la misma (2.2 μs). Pero la atmósfera está contraída en la dirección del movimiento. Si la atmósfera mide 10 km para nosotros, para el muón mide:

Y eso sí puede atravesarlo antes de desintegrarse.

La dilatación temporal provoca también que los relojes de los satélites GPS atrasen siete millonésimas de segundo al día, debido a que orbitan a una velocidad de 3.874 m/s. Este efecto hay que tenerlo en cuenta, aunque es compensado de sobra por la aceleración que el reloj sufre debido al efecto de la gravedad. Según la Relatividad General, cuanto más débil es el campo gravitatorio más deprisa corre el tiempo.

TRANSFORMACIONES DE LORENTZ

En este último apartado, veremos cómo juntar los dos efectos relativistas estudiados para obtener las transformaciones de Lorentz, es decir, las transformaciones que conectan las coordenadas con las que etiquetan sucesos dos observadores en movimiento relativo uniforme.

Supongamos dos sistemas de referencia S y S’ en movimiento relativo uniforme a velocidad \vec v, tales que sus orígenes coinciden cuando t=t’=0.

Si S’ etiqueta un punto como x’ y S lo etiqueta como x, podríamos estar tentados de escribir que la relación entre ambos la da la relación galileana x=vt+x', pero no, ahora entendemos que el observador S no mide x’ sino la distancia x' \sqrt{1-\beta^2}, por lo que la relación correcta es x=vt+x'\sqrt{1-\beta^2}. Despejando: 

x=xvt1β2x’=\dfrac{x-vt}{\sqrt{1-\beta^2}}

Esta es la primera de las transformaciones de Lorentz. Notemos que, por la disposición de los ejes, si S’ etiqueta un suceso con las coordenadas y’, z’, S lo hará con y, z de manera que y=y',\: z=z'.

Vamos a obtener ahora la transformación de Lorentz para el tiempo Para ello, recordemos el principio de relatividad: S’ debe emplear las mismas ecuaciones que S para obtener las coordenadas de un suceso en el otro sistema, con la única diferencia de que S’ mide una velocidad igual y opuesta a la que asigna S. Por lo tanto, basta cambiar v\to -v, y podemos escribir: 

x=vt+x1β2x’=-vt’+x \sqrt{1-\beta^2}

Igualando ambas expresiones para x’ (introduciendo \gamma para simplificar notación):

γ(xvt)=vt+1γx\gamma (x-vt)=-vt’+\dfrac{1}{\gamma}x

Queremos despejar t’. Reordenando: 

vt=(1γγ)x+γvtvt’=\left(\dfrac{1}{\gamma}-\gamma\right)x+\gamma v t

Observemos que el factor que multiplica a x en el segundo miembro se puede simplificar de esta forma: 

1γγ=1β211β2=β21β2=γβ2 \dfrac{1}{\gamma}-\gamma=\sqrt{1-\beta^2}-\dfrac{1}{\sqrt{1-\beta^2}}=\dfrac{-\beta^2}{\sqrt{1-\beta^2}}=-\gamma \beta^2

Ahora, como \beta=v/c, obtenemos: 

vt=v2c2x1β2+γvt vt’=\dfrac{-\frac{v^2}{c^2} x}{\sqrt{1-\beta^2}}+\gamma v t

Dividiendo miembro a miembro por la velocidad, nos queda finalmente: 

t=γ(tvc2x)t’=\gamma\left( t-\frac{v}{c^2}x\right)

Con lo que ya hemos deducido todas las transformaciones de Lorentz:

x=amp;γ(xvt)y=amp;yz=amp;zt=amp;γ(tvc2x) \begin{aligned} x’=&amp;\gamma\left(x-vt\right)\\ y’=&amp;y\\ z’=&amp;z\\ t’=&amp;\gamma\left( t-\dfrac{v}{c^2}x\right) \end{aligned}

De la Transformación de Lórentz a E = m c2

Terminaremos con un poco de dinámica relativista, y la deducción de la famosa fórmula que nos da la energía de una masa en reposo.

1. De la transformación de Lorentz al momento relativista.

El primer paso para obtener la famosa fórmula de la energía es obtener una definición relativista apropiada para el momento. Partimos de las transformaciones de Lorentz entre dos sistemas inerciales S y S’, con S’ moviéndose a velocidad v respecto a S en el eje x:

x=γ(xvt),t=γ(tvxc2),γ=11v2/c2x’ = \gamma (x – vt), \qquad t’ = \gamma\left(t – \frac{v x}{c^2}\right), \qquad \gamma = \frac{1}{\sqrt{1 – v^2/c^2}}

Sea u = \frac{dx}{dt} la velocidad de una partícula en S, y u' = \frac{dx'}{dt'} la velocidad en S’. Buscamos obtener la ley de composición de velocidades, para lo cual diferenciamos las dos ecuaciones de Lorentz:

dx=γ(dxvdt),dt=γ(dtvc2dx) dx’ = \gamma (dx – v\, dt), \qquad dt’ = \gamma\left(dt – \frac{v}{c^2} dx\right)

Entonces:

u=dxdt=γ(dxvdt)γ(dtvc2dx)=dxvdtdtvc2dxu’ = \frac{dx’}{dt’} = \frac{\gamma(dx – v\, dt)}{\gamma\left(dt – \frac{v}{c^2} dx\right)} = \frac{dx – v\, dt}{dt – \frac{v}{c^2} dx}

Y dividiendo numerador y denominador por dt:

u=uv1uvc2u’ = \frac{u – v}{1 – \frac{uv}{c^2}}

Tenemos la composición relativista de velocidades.

Queremos encontrar una expresión para el “momento” que se conserve en todos los sistemas inerciales. En mecánica clásica, el momento es p = m u. En relatividad, queremos una expresión p(u) tal que se conserve en colisiones en un sistema S, y también se conserve en cualquier otro sistema S’ relacionado con él por la transformación de Lorentz.

Para ello consideraremos una colisión elástica simétrica. En el sistema S (centro de masas), dos partículas idénticas de masa m chocan frontalmente. Antes del choque, las velocidades son +u y –u; después del choque son -u y +u (choque elástico simétrico). En S, por simetría, el momento total es:

ptotal=p1+p2=f(u)+f(u)=0p_{\text{total}} = p_1 + p_2 = f(u) + f(-u) = 0

donde escribimos p(u)=f(u) para no fijar aún la forma concreta.

Ahora miramos la misma colisión desde un sistema S’ que se mueve con velocidad v respecto a S. Transformamos las velocidades a S’ usando la fórmula:

u1=uv1uvc2,u2=uv1+uvc2u_1′ = \frac{u – v}{1 – \frac{uv}{c^2}}, \qquad u_2′ = \frac{-u – v}{1 + \frac{uv}{c^2}}

El momento total en S’ antes del choque será:

pantes=f(u1)+f(u2)p’_{\text{antes}} = f(u_1′) + f(u_2′)

Después del choque, las velocidades en S se invierten (-u y +u), y en S’ serán:

u1(después)=uv1+uvc2,u2(después)=uv1uvc2u_1′{}_{\text{(después)}} = \frac{-u – v}{1 + \frac{uv}{c^2}}, \qquad u_2′{}_{\text{(después)}} = \frac{u – v}{1 – \frac{uv}{c^2}}

Es decir, las mismas que antes pero intercambiadas. Por tanto, si el momento total se conserva en S’, debe cumplirse:

f(u1)+f(u2)=f(u1(después))+f(u2(después))f(u_1′) + f(u_2′) = f\!\left(u_1′{}_{\text{(después)}}\right) + f\!\left(u_2′{}_{\text{(después)}}\right)

Lo cual es cierto automáticamente si la forma funcional de f(u) es la misma en todos los sistemas y la colisión es simétrica. Pero esto aún no nos da la forma de f. Imponemos que, para u \ll c, el momento se reduzca al clásico: p(u) \approx m u.

La forma más general compatible con la simetría y con Lorentz (y que luego se ve que asegura conservación en todos los sistemas) es:

p(u)=λγ(u)mup(u) = \lambda\, \gamma(u)\, m u

donde \lambda es una constante adimensional y

γ(u)=11u2/c2\gamma(u) = \frac{1}{\sqrt{1 – u^2/c^2}}

Para u \ll c: \gamma(u) \approx 1 + \frac{1}{2}\frac{u^2}{c^2}. Por tanto:

p(u)λmu(1+12u2c2)λmup(u) \approx \lambda\, m u \left(1 + \frac{1}{2}\frac{u^2}{c^2}\right) \approx \lambda\, m u

Para que esto coincida con el momento clásico m u, necesitamos \lambda = 1. Así obtenemos finalmente:

p=γmvp = \gamma m v

2. Del Momento a la Energía Relativista

Para relacionar momento con energía, Einstein parte de la idea clásica de que la energía cinética es el trabajo necesario para acelerar un cuerpo desde el reposo hasta la velocidad v. Partimos del momento relativista en 1D:

p=γmv,γ=11v2c2 p = \gamma m v, \qquad \gamma = \frac{1}{\sqrt{1 – \dfrac{v^2}{c^2}}}

y de la definición de energía cinética como trabajo para acelerar desde el reposo hasta la velocidad v:

K=0vFdx=0vdpdtdx K = \int_0^v F dx = \int_0^v \frac{dp}{dt} dx

Como dx = v dt, tenemos:

K=0vvdpdtdt=vdpK = \int_0^v v \frac{dp}{dt} dt = \int v dp

donde el límite inferior corresponde a p=0 cuando v=0. La integral es algo laboriosa. Pero esta integral es el puente entre el momento relativista y la energía cinética.

3. Escribimos dp en función de dv

Partimos de p(v) = \gamma m v y derivamos respecto a v:

dp=ddv(γmv)dv=m(γ+vdγdv)dvdp = \frac{d}{dv}(\gamma m v)dv = m\left(\gamma + v \frac{d\gamma}{dv}\right) dv

Necesitamos dfrac{d\gamma}{dv}. Como:

γ=(1v2c2)1/2\gamma = \left(1 – \frac{v^2}{c^2}\right)^{-1/2}

Entonces:

dγdv=12(1v2c2)3/2(2vc2)=vc2(1v2c2)3/2=vc2γ3\frac{d\gamma}{dv} = -\frac{1}{2}\left(1 – \frac{v^2}{c^2}\right)^{-3/2}\left(-\frac{2v}{c^2}\right) = \frac{v}{c^2}\left(1 – \frac{v^2}{c^2}\right)^{-3/2} = \frac{v}{c^2}\,\gamma^3

Sustituyendo en dp:

dp=m(γ+vvc2γ3)dv=m(γ+v2c2γ3)dvdp = m\left(\gamma + v \cdot \frac{v}{c^2}\gamma^3\right) dv = m\left(\gamma + \frac{v^2}{c^2}\,\gamma^3\right) dv

Y finalmente la integral K = \int v\,dp sería:

K=vdp=vm(γ+v2c2γ3)dv=m(vγ+v3c2γ3)dvK = \int v\,dp = \int v \cdot m\left(\gamma + \frac{v^2}{c^2}\,\gamma^3\right) dv = m \int \left(v\gamma + \frac{v^3}{c^2}\,\gamma^3\right) dv

Esta forma es correcta pero no tiene una solución fácil. Hay una vía mucho más elegante si cambiamos la variable de integración de p a v de otra manera.

4. Resolución de la Integral de la Energía y E = m c2

Observemos que dK = v\,dp y p = \gamma m v \Rightarrow v = p / (\gamma m). Entonces:

dK=vdp=pγmdpdK = v\,dp = \frac{p}{\gamma m}\,dp

Pero sabemos que:

γ=1+p2m2c2\gamma = \sqrt{1 + \frac{p^2}{m^2 c^2}}

Esto último viene de p = \gamma m v y \gamma^2 = 1 / (1 - v^2/c^2). Entonces:

dK=pm1+p2m2c2dpdK = \frac{p}{m\sqrt{1 + \dfrac{p^2}{m^2 c^2}}}\,dp

Integramos desde p=0 (reposo) hasta p:

K=0ppm1+p2m2c2dp]K = \int_0^p \frac{p’}{m\sqrt{1 + \dfrac{p’^2}{m^2 c^2}}}\,dp’ ]

Hacemos el cambio de variable:

u=1+p2m2c2du=2pm2c2dppdp=m2c22duu = 1 + \frac{p’^2}{m^2 c^2} \quad \Rightarrow \quad du = \frac{2p’}{m^2 c^2}\,dp’ \quad \Rightarrow \quad p’\,dp’ = \frac{m^2 c^2}{2}\,du

Entonces:

K=u=1u=1+p2m2c21m1um2c22du=mc2211+p2m2c2u1/2duK = \int_{u=1}^{u=1 + \dfrac{p^2}{m^2 c^2}} \frac{1}{m} \cdot \frac{1}{\sqrt{u}} \cdot \frac{m^2 c^2}{2}\,du = \frac{m c^2}{2} \int_1^{1 + \dfrac{p^2}{m^2 c^2}} u^{-1/2}\,du

La integral final es bien conocida:

u1/2du=2u1/2\int u^{-1/2}\,du = 2 u^{1/2}

Por tanto:

K=mc222[u]11+p2m2c2=mc2(1+p2m2c21) K = \frac{m c^2}{2} \cdot 2 \left[\sqrt{u}\right]_1^{1 + \dfrac{p^2}{m^2 c^2}} = m c^2 \left(\sqrt{1 + \frac{p^2}{m^2 c^2}} – 1\right)

Pero:

1+p2m2c2=γ\sqrt{1 + \frac{p^2}{m^2 c^2}} = \gamma

así que:

K=(γ1)mc2\boxed{K = (\gamma – 1)\,m c^2}

Este resultado es clave. La expresión sugiere que la energía cinética es: K = E - E_0, donde E es la energía total, y E_0 es la energía en reposo, y en la cual:

E=γmc2E = \gamma \,m c^2

y por tanto:

E0=mc2E_0 = m c^2

que sería una energía de la masa en reposo.

La estructura de la transformación de Lorentz fuerza que la energía total sea proporcional a c^2.

Einstein en su artículo de septiembre de 1905 usó un razonamiento más simple basado en un cuerpo que emite dos pulsos de luz de energía L/2 cada uno, en direcciones opuestas. El cuerpo en reposo pierde energía L. Pero en un sistema en movimiento a velocidad u la energía de la luz varía dependiendo de u, según una expresión que Einstein había obtenido previamente, por lo que la pérdida de energía no coincide, a menos que el cuerpo pierda también masa.

Cuando Einstein publicó la teoría de la Relatividad especial en su artículo de 1905 la reacción entre los que lo leyeron fue de perplejidad y cierto escepticismo. Einstein era un desconocido que trabajaba en la Oficina de Patentes de Berna; el artículo no citaba prácticamente a nadie, lo que lo hacía parecer desconectado de la literatura existente; y el artículo rompía con concepciones que hasta entonces nadie se había atrevido a cuestionar.

Einstein no mencionaba el experimento de Michelson–Morley, no usaba mucho formalismo matemático, y presentaba la teoría de forma muy conceptual. Esto hizo que algunos lo vieran como “demasiado filosófico”. Además, la comunidad física estaba centrada en otros debates (átomos, radiación del cuerpo negro, teoría cuántica incipiente). Por eso, la mayoría de los físicos no reaccionaron: simplemente no se dieron cuenta de la magnitud del trabajo. No hubo un rechazo explícito, pero sí escepticismo pasivo. La idea de que el tiempo y el espacio no eran absolutos chocaba con la intuición clásica, y muchos físicos preferían las teorías del éter de Lorentz o Poincaré.

Quién sí lo entendió y lo apoyó fue Max Planck, que era coeditor de la revista alemana de Anales de Física, y había leído ya los artículos de Einstein de ese mismo año sobre el movimiento browniano y sobre el efecto fotoeléctrico. Pero el artículo que más le impresionó fue el de la Relatividad, reconoció la importancia del trabajo y lo difundió entre sus estudiantes. Planck fue clave para que la teoría empezara a circular en Alemania.

Aun así, la relatividad especial no se convirtió en un pilar de la física hasta alrededor de 1908–1910, cuando Minkowski la reformuló con su geometría del espacio‑tiempo. Se volvió famosa después de que La relatividad general (1915) atrajera atención mundial y el eclipse de 1919 la confirmara, convirtiendo a Einstein en una celebridad. Fue entonces cuando los físicos revisaron los trabajos anteriores de Einstein y reconocieron la importancia del artículo de 1905.

Deja un comentario