Isospin et symétrie SU(2) des quarks up et down
On parle de symétrie entre les quarks up (u) et down (d) parce que, dans l'interaction forte, ils se comportent presque de la même façon. Ils ont des masses très proches, interagissent avec la force forte de manière identique et l'échange de l'un par l'autre ne modifie pas les équations qui décrivent leur dynamique. Autrement dit, du point de vue de l'interaction forte, u et d sont pratiquement indiscernables.
Pour rendre compte de cette invariance, les physiciens introduisent une idée clé : l'isospin.
Le terme peut prêter à confusion, car il évoque le spin, qui décrit les rotations dans l'espace physique. En réalité, l'isospin agit dans un tout autre cadre. Il partage bien la même structure mathématique que le spin, fondée sur le groupe $ SU(2) $, mais il ne correspond à aucune rotation réelle dans l'espace.
- Le spin transforme un état lorsque l'on effectue une rotation dans l'espace.
- L'isospin transforme un état dans un espace interne, purement mathématique, où les quarks up et down forment un doublet. Une rotation dans cet espace mélange leurs états quantiques sans que la particule ne tourne physiquement.
Cette parenté mathématique explique pourquoi les outils utilisés pour décrire l'isospin sont très proches de ceux du moment angulaire, même si les phénomènes qu'ils décrivent sont différents.
L'isospin est donc une symétrie interne, c'est-à-dire une propriété qui ne concerne pas l'espace ordinaire mais la structure interne des particules.
Remarque. Le concept d'isospin permet de comprendre plusieurs régularités frappantes de la physique des particules. Il explique par exemple pourquoi certaines particules de charges différentes ont presque la même masse, pourquoi des processus hadroniques se produisent avec des probabilités comparables ou encore pourquoi certaines désintégrations sont interdites lorsqu'elles brisent la symétrie d'isospin. Ces observations prennent tout leur sens lorsque l'on reconnaît la symétrie profonde de l'interaction forte.
Pour décrire l'isospin, on introduit trois composantes abstraites, $ I_1 $, $ I_2 $, $ I_3 $, qui jouent un rôle analogue à celui des composantes du moment angulaire.
Deux nombres quantiques suffisent pour caractériser un état :
- $ I $, l'isospin total, qui détermine la taille du multiplet.
- $ I_3 $, la troisième composante, qui distingue les différents états du multiplet.
Si l'interaction forte respecte la symétrie $ SU(2) $ de l'isospin, alors, comme le prévoit le théorème de Noether, l'isospin se conserve lors de tous les processus hadroniques régi par cette interaction.
Remarque. L'analogie avec la conservation du moment angulaire dans un espace symétrique sous rotation aide à comprendre pourquoi cette conservation est si naturelle dans le cadre de l'interaction forte.
Le groupe $ SU(2) $ classe les particules en multiplets d'isospin bien définis :
- doublets pour $ I = \frac{1}{2} $
- triplets pour $ I = 1 $
- quadruplets pour $ I = \frac{3}{2} $
Le nombre d'états dans un multiplet se lit directement à partir de la valeur de l'isospin total. Comme \( I_3 \) varie de \( -I \) à \( +I \) par pas entiers, un multiplet d'isospin \( I \) contient exactement \( 2I + 1 \) états.
Cette structure est une conséquence directe des représentations du groupe $ SU(2) $.
Exemple. Les pions $ \pi $ existent sous trois états de charge : $ \pi^+ $, $ \pi^0 $, $ \pi^- $.
$$ 2I+1 = 3 $$
Ils forment donc un triplet d'isospin total :
$$ I = \frac{3-1}{2} = 1 $$
La valeur de $ I_3 $ permet d'associer un état quantique à chaque pion :
- $ \pi^+ $ correspond à $ I_3 = 1 $
- $ \pi^0 $ correspond à $ I_3 = 0 $
- $ \pi^- $ correspond à $ I_3 = -1 $
En notation des kets :
$$ \pi^+ = |1,1 \gt $$
$$ \pi^0 = |1,0 \gt $$
$$ \pi^- = |1,-1 \gt $$
Origine de l'isospin
L'idée d'isospin remonte à Werner Heisenberg en 1932. Son point de départ était une observation qui, à l'époque, déstabilisait la vision classique des particules : le proton et le neutron, malgré leurs charges différentes, ont des masses presque égales et se comportent de manière extrêmement similaire sous l'effet de l'interaction forte.
Pour expliquer cette proximité remarquable, Heisenberg introduisit un nouveau nombre quantique, construit sur la même structure mathématique que le spin mais appliqué à un espace interne imperceptible dans le monde courant. Le concept fut d'abord nommé spin isotopique, puis le terme bref et désormais standard isospin s'est imposé.
Dans cette vision unificatrice, le proton et le neutron sont les deux états d'un même objet fondamental : le nucléon \( N \).
$$ N = \frac{\alpha}{\beta} $$
Les deux états élémentaires du nucléon s'écrivent simplement :
$$ p = \frac{1}{0} $$
$$ n = \frac{0}{1} $$
Le nucléon constitue ainsi un système quantique à deux niveaux, doté d'un isospin total \( I = \tfrac12 \) :
$$ I = \frac{1}{2} $$
La composante \( I_3 \) permet d'identifier sans ambiguïté lequel des deux états est réalisé :
$$ p = \left| \tfrac12, +\tfrac12 \right\rangle \qquad n = \left| \tfrac12, -\tfrac12 \right\rangle $$
Cette représentation fait immédiatement ressortir l'analogie avec le spin : une particule de spin un demi possède elle aussi deux projections distinctes. De la même manière, proton et neutron apparaissent comme deux projections du nucléon dans l'espace d'isospin, et une rotation de 180° dans cet espace transforme l'un en l'autre.
Cette structure trouve naturellement un écho du côté des quarks légers.
Les quarks up (u) et down (d) forment un doublet d'isospin strictement parallèle à celui des nucléons :
$$ u = \left| \tfrac12, +\tfrac12 \right\rangle \qquad d = \left| \tfrac12, -\tfrac12 \right\rangle $$
Les autres saveurs de quarks (s, c, b, t), beaucoup plus lourdes, ne respectent pas cette symétrie et sont décrites par un isospin nul. Leur masse élevée rompt l'approximation \( SU(2) \) qui rend l'isospin pertinent dans le secteur léger.
Le système à deux nucléons
L'isospin n'est pas qu'un outil de classification. Il impose également comment deux nucléons peuvent se combiner de manière cohérente.
Chaque nucléon ayant un isospin \( I = \tfrac12 \), un système formé de deux nucléons se construit comme une somme de moments angulaires :
$$ \tfrac12 \otimes \tfrac12 = 1 \oplus 0 $$
Deux valeurs d'isospin total sont donc possibles : un triplet \( I = 1 \) et un singlet \( I = 0 \). Les états correspondants s'écrivent ainsi :
- Triplet symétrique, \( I = 1 \) :
$$ |1,1\rangle = |pp\rangle \\[4pt] |1,0\rangle = \tfrac{1}{\sqrt{2}}(|pn\rangle + |np\rangle) \\[4pt] |1,-1\rangle = |nn\rangle $$ - Singlet antisymétrique, \( I = 0 \) :
$$ |0,0\rangle = \tfrac{1}{\sqrt{2}}(|pn\rangle - |np\rangle) $$
Ces quatre états couvrent toutes les configurations d'isospin possibles pour deux nucléons.
Mais lequel apparaît réellement dans la nature ?
Le seul état lié composé de deux nucléons est le deutéron, formé d'un proton et d'un neutron. Aucun état lié pp ou nn n'a jamais été observé.
Cette simple constatation suffit à exclure que le deutéron appartienne au triplet \( I = 1 \). S'il en faisait partie, les états pp et nn devraient également être liés, ce qui n'est pas le cas. La seule solution compatible avec l'expérience est donc que le deutéron soit un état du singlet \( I = 0 \).
Comment le doublet (u, d) donne naissance à tous les multiplets d'isospin
Le doublet des quarks u et d
$$ I = \frac12 $$
joue le rôle de représentation fondamentale. À partir de ce bloc élémentaire, on peut construire tous les multiplets d'isospin des hadrons composés exclusivement de quarks légers.
1] Mésons (q\bar q)
En combinant un quark et un antiquark de type u ou d, on produit :
$$ \tfrac12 \otimes \tfrac12 = 1 \oplus 0 $$
Les mésons formés de \(u\bar u\) et \(d\bar d\) appartiennent donc nécessairement à l'un des deux multiplets :
- un triplet avec \( I = 1 \),
- un singlet avec \( I = 0 \).
Exemple 1. Les pions constituent le triplet d'isospin le plus connu : $$ \pi^+ = |1,+1\rangle,\quad \pi^0 = |1,0\rangle,\quad \pi^- = |1,-1\rangle $$
Exemple 2. Le singlet correspondant est une superposition antisymétrique des états \(u\bar u\) et \(d\bar d\), associée au composant léger du méson \( \eta_0 \).
2] Baryons (qqq)
Pour trois quarks légers, la combinaison d'isospin conduit à la structure suivante :
$$ \tfrac12 \otimes \tfrac12 \otimes \tfrac12 = \tfrac32 \oplus \tfrac12 \oplus \tfrac12 $$
On obtient donc :
- un quadruplet d'isospin \( I = \tfrac32 \),
- deux doublets d'isospin \( I = \tfrac12 \).
Exemple 1. Les nucléons constituent l'un des doublets : $$ p = uud = | \tfrac12, +\tfrac12 \rangle,\quad n = udd = | \tfrac12, -\tfrac12 \rangle $$
Exemple 2. Les baryons \( \Delta \) forment le quadruplet \( I = \tfrac32 \) : $$ \Delta^{++} = uuu = | \tfrac32, +\tfrac32 \rangle $$ $$ \Delta^{+} = uud = | \tfrac32, +\tfrac12 \rangle $$ $$ \Delta^{0} = udd = | \tfrac32, -\tfrac12 \rangle $$ $$ \Delta^{-} = ddd = | \tfrac32, -\tfrac32 \rangle $$
L'organisation des hadrons en multiplets d'isospin ne résulte donc pas d'un choix arbitraire, mais de la structure même de QCD. Si la théorie traite u et d comme quasiment interchangeables, alors la classification des hadrons doit suivre mécaniquement les représentations du groupe \( SU(2) \). C'est cette architecture mathématique qui fixe la multiplicité des états et la manière dont ils se regroupent.
Un exemple concret
Les baryons \( \Delta \) constituent un excellent point de départ pour saisir en profondeur le rôle de l'isospin. Ils existent sous quatre états de charge bien distincts : \( \Delta^{++}, \Delta^{+}, \Delta^{0}, \Delta^{-} \). Le simple fait d'en compter quatre suggère déjà qu'ils forment un ensemble structuré, organisé par une symétrie précise.
$$ 2I + 1 = 4 $$
Cette relation indique immédiatement que leur isospin total vaut :
$$ I = \frac{4 - 1}{2} = \tfrac32. $$
Les baryons \( \Delta \) forment donc un quadruplet d'isospin. Ce quadruplet regroupe quatre états, différenciés uniquement par la valeur de la troisième composante :
$$ I_3 = +\tfrac32,\ +\tfrac12,\ -\tfrac12,\ -\tfrac32. $$
- \( \Delta^{++} \) avec \( I_3 = +\tfrac32 \)
- \( \Delta^{+} \) avec \( I_3 = +\tfrac12 \)
- \( \Delta^{0} \) avec \( I_3 = -\tfrac12 \)
- \( \Delta^{-} \) avec \( I_3 = -\tfrac32 \)
En notation ket, qui condense l'information quantique de chaque état :
- \( \Delta^{++} = \left| \tfrac32, +\tfrac32 \right\rangle \)
- \( \Delta^{+} = \left| \tfrac32, +\tfrac12 \right\rangle \)
- \( \Delta^{0} = \left| \tfrac32, -\tfrac12 \right\rangle \)
- \( \Delta^{-} = \left| \tfrac32, -\tfrac32 \right\rangle \)
Leur composition interne reflète parfaitement cette structure :
- \( \Delta^{++} = uuu \)
- \( \Delta^{+} = uud \)
- \( \Delta^{0} = udd \)
- \( \Delta^{-} = ddd \)
Exemple. Considérons le cas du \( \Delta^{++} \). Placé au sommet du multiplet, il possède \( I = \tfrac32 \) et \( I_3 = +\tfrac32 \). Sa valeur de \( I_3 \) s'obtient en ajoutant les contributions de ses trois quarks. Chacun des quarks up apporte \( +\tfrac12 \), ce qui impose la configuration $$ uuu. $$ Cela seul ne fixe pourtant pas la valeur de l'isospin total. Celui-ci découle du fait que l'état appartient à la représentation entièrement symétrique de \( SU(2) \) dans l'espace des saveurs. En résumé, la structure en quarks explique la position de l'état dans le multiplet, mais c'est la symétrie qui lui attribue son isospin total.
Tout cela provient directement du produit tensoriel fondamental :
$$ \tfrac12 \otimes \tfrac12 \otimes \tfrac12 $$
dont la décomposition donne :
$$ \tfrac32 \oplus \tfrac12 \oplus \tfrac12. $$
La représentation totalement symétrique, correspondant à \( I = \tfrac32 \), est précisément celle qui contient les quatre états observés expérimentalement. Les baryons \( \Delta \) constituent donc une illustration directe de la symétrie \( SU(2) \) appliquée aux quarks up et down.
Pourquoi échanger les quarks up et down ne modifie pas l'interaction forte
Pour comprendre l'origine de la symétrie d'isospin, il faut repartir du doublet fondamental :
\[ \begin{pmatrix} u \\ d \end{pmatrix} \]
Ce doublet se transforme sous une rotation interne de type \( SU(2) \) selon :
\[ \begin{pmatrix} u' \\ d' \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix} \begin{pmatrix} u \\ d \end{pmatrix} \]
Une telle rotation mélange les deux saveurs :
- $ u' = \cos\theta\, u + \sin\theta\, d $
- $ d' = -\sin\theta\, u + \cos\theta\, d $
Le point essentiel est que la chromodynamique quantique (QCD) reste strictement inchangée sous cette transformation. Les champs transformés obéissent aux mêmes équations que les champs initiaux. Aux yeux de l'interaction forte, rien n'a changé.
C'est pour cette raison que l'isospin est une symétrie interne. Il décrit des rotations dans un espace abstrait, qui ne correspondent à aucun mouvement physique réel. La dynamique reste exactement la même.
En pratique, cela signifie que les hadrons construits à partir de $ u' $ et $ d' $ sont indiscernables, du point de vue de l'interaction forte, de ceux construits avec $ u $ et $ d $. Les deux quarks sont alors vus comme deux états d'un même degré de liberté interne.
Le cas du proton ($ uud $) et du neutron ($ udd $) montre très bien ce mécanisme. Ensemble, ils forment un doublet d'isospin. Si l'on leur applique la rotation \[ \begin{pmatrix} p' \\ n' \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix} \begin{pmatrix} p \\ n \end{pmatrix} \] la structure de la QCD demeure intacte. L'interaction forte ne peut distinguer les deux nucléons.
Une illustration plus directe
Pour rendre la structure encore plus explicite, on regroupe proton et neutron dans un seul vecteur :
$$ N = \begin{pmatrix} p \\ n \end{pmatrix} $$
Ce doublet représente le nucléon dans ses deux états d'isospin et correspond à la représentation à deux composantes de \( SU(2) \), avec \( I = \tfrac12 \).
Une rotation interne dans cet espace est décrite par :
\[ R(\theta) = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix} \]
Cette matrice satisfait les conditions propres à un élément de \( SU(2) \) :
\[ R^\dagger R = \mathbb{1}, \quad \det R = 1. \]
Son action donne :
\[ \begin{pmatrix} p' \\ n' \end{pmatrix} = R(\theta)\,\begin{pmatrix} p \\ n \end{pmatrix} \]
soit :
\[ \begin{cases} p' = p\,\cos\theta + n\,\sin\theta \\[4pt] n' = -p\,\sin\theta + n\,\cos\theta \end{cases} \]
Pour \( \theta = \frac{\pi}{2} \), on obtient un échange pur :
\[ \begin{cases} p' = n \\[4pt] n' = -p \end{cases} \]
Le signe négatif correspond simplement à une phase globale et n'a aucune incidence physique. Pour l'interaction forte, \( n' \) et \( p \) sont équivalents.
On peut résumer la transformation en une seule équation :
\[ R\left(\frac{\pi}{2}\right)\begin{pmatrix} p \\ n\end{pmatrix} = \begin{pmatrix} n \\ -p \end{pmatrix} \]
Ici, le message physique est transparent : proton et neutron se comportent comme deux composantes d'un même vecteur interne, librement rotatif dans l'espace d'isospin, sans que la force forte n'en soit affectée.
Note. Ces rotations n'ont rien de spatial. Elles concernent exclusivement les degrés de liberté internes. L'invariance de l'interaction forte sous ces transformations explique pourquoi celle-ci agit presque de manière identique sur proton et neutron.
Notes
- Charge électrique et isospin
La relation de Gell Mann Nishijima relie la charge électrique à l'isospin selon $$ Q = I_3 + \tfrac12(A + S). $$ Elle s'applique aux hadrons composés de quarks légers \( u, d, s \). À l'intérieur d'un multiplet, l'état de charge maximale correspond à \( I_3 = I \), les autres suivant dans l'ordre décroissant. - Portée réelle de la symétrie proton neutron
La symétrie concerne le hamiltonien de l'interaction forte, pas les nucléons pris isolément. Échanger un seul proton avec un neutron ne conserve pas l'état quantique global, en raison du principe d'exclusion de Pauli. Seul un échange simultané de tous les protons et de tous les neutrons laisse la symétrie exactement inchangée.
La théorie de l'isospin se poursuit ainsi, illustrant de manière élégante comment une symétrie interne peut unifier la description de particules en apparence différentes.