Durant la Seconde Guerre mondiale, les Alliés ont tenté de déterminer l’ampleur de la production allemande de chars d’assaut. Ils ont entre autres eu recours à l’inférence statistique. Grâce aux chars capturés ou détruits, un échantillonnage, les Alliés ont pu estimer la production totale de chars. De nos jours, cette méthode statistique est utilisée dans de nombreux domaines civils, scientifiques et médicaux pour estimer le nombre total d’unités, d’espèces ou d’individus à partir d’un échantillonnage.
Toute entreprise aimerait connaitre le nombre d’unités que la concurrence peut produire.
Un sondage auprès de 2000 électeurs (l’échantillon) peut évaluer le sentiment de la population à l’égard d’un parti politique. Dans ce cas, nous évaluons un pourcentage.
Lorsqu’il s’agit d’un produit fabriqué, la technique consiste à utiliser un échantillon de numéros de série ou des séquences (c.-à-d. 1, 2, 3, …, n). Par exemple, avec les numéros de série recueillis lors de discussions en ligne, la technique d’échantillonnage a été utilisée pour estimer le nombre d’iPhones vendus.
Posons le problème
Pendant la Seconde Guerre mondiale, les Alliés ont tenté de déterminer l’ampleur de la production allemande. Les Alliés ont eu recours à la collecte de renseignements conventionnels.
Selon les estimations du renseignement conventionnel, la production allemande était d’environ 1 400 chars par mois, entre juin 1940 et septembre 1942:
Pour certains experts, ces chiffres étaient exagérés! C’est là qu’intervient la statistique inférentielle.
Comment?
Figure 2: Numéro de série.
Les Alliés ont utilisé les numéros de série de chars capturés ou détruits.
Les principaux numéros utilisés étaient ceux des boites de vitesses.
Les numéros de châssis et de moteur ont également été utilisés, bien que leur utilisation ait été plus compliquée.
Divers autres éléments ont été utilisés pour contrevérifier l’analyse. Des analyses similaires ont été effectuées sur des pneus.
L’analyse des roues de char a permis d’estimer le nombre de moules de roues utilisées.
Un peu de théorie
Figure 3: LEGO.
Les numéros de série forment une séquence (c.-à-d. 1, 2, 3, …, n). Une séquence est une distribution uniforme discrète. La séquence sur un dé va de 1 à 6. À noter que le maximum est 6, car nous savons qu’il s’agit d’un dé. Dans un lancé de dé, vous avez 1/6 ou 16.7% de faire 1 ou de faire 4.
Nous pouvons estimer le maximum d’une distribution uniforme discrète à partir de l’échantillonnage. Chaque numéro de série étant unique, l’échantillon doit être sans remplacement. Dans les petits ensembles, et souvent dans les grands ensembles, un tel échantillonnage est généralement effectué sans remplacement.
Supposons que \(k = 4\) chars (taille \(k\) de l’échantillon) portent les numéros de série 19, 40, 42 et 60. Le numéro de série maximal observé est \(m = 60\). Le nombre total inconnu de chars est appelé \(N\). La formule pour estimer le nombre total de chars est:
\[N = m + \frac{m}{k} - 1\]
\(N\) donnerait 74. Un grand échantillon est toujours mieux pour arriver à une meilleure estimation.
En appliquant la formule aux numéros de série des chars capturés, le nombre a été calculé comme étant 256 par mois.
Selon les estimations du renseignement conventionnel, il était environ 1 400 par mois.
Après la guerre, les chiffres de la production allemande du ministère d’Albert Speer montraient que la production réelle était 255 par mois.
L’estimation de la production de chars n’était pas la seule application de cette analyse des numéros de série. Elle a également été utilisée pour comprendre la production allemande en général, y compris le nombre d’usines, l’importance relative des usines, la longueur des chaines d’approvisionnement (basée sur le décalage entre la production et l’utilisation), les changements dans la production et l’utilisation des ressources comme le caoutchouc.
Le même modèle statistique a permis d’estimer la production de missiles V-2 à partir de numéros de série prélevés sur les débris de l’explosion.
Si les Alliés cherchaient à estimer la production militaire allemande en préparation de leurs débarquements en Europe, les Soviétiques ont aussi analysé la production militaire allemande avec l’équipement capturé sur le front de l’Est. Tous les autres pays en guerre ont utilisé diverses méthodes statistiques pour estimer les forces en présence, évaluer l’efficacité de l’armement, prévoir les ressources, etc.
Les approches statistiques militaires ont ensuite été appliquées dans d’autres contextes suivant la guerre: industrie, commerce, sondages d’opinion, biologie, écologie, épidémiologie, santé publique, politique publique, génétique, évaluation environnementale, démographie, etc.
L’ambition de repousser les limites entraine l’apparition d’armes toujours plus destructives. Mais cette ambition peut être récupérée à des fins plus constructives. L’ingénieur en chef qui a conçu le missile allemand V-2 durant la Seconde Guerre mondiale est le même qui était à la tête des équipes qui ont développé les lanceurs du programme spatial américain durant les années 1960. Les moteurs-fusées des lanceurs qui ont permis de conquérir l’espace, puis la Lune n’étaient que l’aboutissement du moteur-fusée qui propulsait le V-2.