Bonjour,
Yannou-> Merci, je savais que tu comprendrais. Pourquoi en discuter en MP alors que cela aurait pu intéresser d'autres personnes. Il y a des probabilités en prépa en France mais seulement dans les prépas bio et HEC. Il s'agit uniquement de probabilités discrètes, la théorie générale nécessitant la théorie de la mesure. Mais j'imagine que tu connais bien tout ça puisque tu as eu l'agrégation.
mildiou51 -> Ma démonstration est correcte, je ne supposais pas l'équiprobabilté, seulement l'indépendance des tirages. On fait des mathématiques ici, pas de la cuisine de physicien, de chimiste ou d'informaticien.
Zog Zog -> Zog Zog je vous trouve vraiment agressif. Faut apprendre à lire. J'ai simplement dis que, ce genre de problème étant du niveau du DEUG de mathématiques, il est heureux que, puisque j'enseigne à ce niveau, je maîtrise le problème ; je n'ai de ce fait aucun complexe à l'affirmer. Pour vous faire plaisir il faudrait que je dise que c'est dur alors que ce genre de problèmes a déjà été résolu il y a environ 3 siècles ? Chacun a ses compétences je ne remets pas les votres en question. Je répète que dans ma phrase il n'y avait pas de jugement de valeur, juste une pointe d'humour.
A la demande générale voici le premier message :
Bonjour,
n! désigne factorielle n : n!=n*(n-1)...1 avec les conventions 0!=1!=1 et (-1)!=...=(-n)!=0.
C(n,k) désigne n!/k!/(n-k)! c'est le nombre de manières de choisir k choses parmi n distinctes, l'ordre de sélection n'important pas. Si k>n, C(n,k)=0.
AUB désigne l'union des ensembles A et B.
{bidules verifient Truc} désigne l'ensemble des objets (appartenant déjà à un autre ensemble) vérifiant la propriété Truc.
On considère un troll ayant attiré attiré n mouches parmi m différentes. (On suppose que les tirages de mouche sont indépendants et identiquement distribués sans que la loi les régissant soit uniforme)
Combien y a-t-il de configurations différentes ? Cela revient à calculer le nombre de solutions entières de k_1+...+k_m=n c'est-à-dire C(m-1,m+n-1).
Supposons que la probabilité d'avoir une mouche de type M_i soit p_i. (On a donc p_1+...+p_m=1). La distribution des n mouches suit une loi multinomiale de paramètres (n,p_1,...,p_m) par indépendance des tirages. Quelle chance a-t-il d'en avoir k_1 de type 1,... , k_m de type m ? Exactement n!/(k_1!*...k_m!)*p_1^k_1*...*p_m^k_m.
On s'intéresse désormais à des évènements du type avoir k mouches d'un type donné ou au moins k mouches d'un type donné. Il s'agit d'une loi marginale de la loi multinomiale un calcul ou un petit raisonnement donne :
P(avoir k mouches d'un type donné M_i)=n!/k!*(n-k!)*p_i^k*(1-p_i)^(n-k).
P(avoir au moins k mouches d'un type donné M_i)=n!/k!*(n-k)!*p_i^k*(1-p_i)^(n-k).
On s'intéresse à {situations où le troll a exactement k mouches du meme type}=H_k.
H_k={k mouches du type M_1}U{k mouches de type M_2}U...U{k mouches du type M_m}
En notant G_k_i={k mouches de type M_i}, P(G_k)=C(n,k)*p_i^k*(1-p_i)^(n-k). Or les G_k ne sont pas disjoints dans le cas général (Plus haut avec k=3 n=5 c'était le cas) donc la probabilité de P(H_k) n'est PAS la somme des probabilités P(G_k_1)+...+P(G_k_m) car l'on risque de compter les mêmes situations plusieurs fois.
Exemple si n=6 et k=3 m=2, M_1=Xidant, M_2=Vertie, p_1=1/2, p_2=1/2 : Un troll peut avoir 3 Xidants et 3 Verties. Ceci apparaît à la fois dans G_3_1 et G_3_2 mais une seule fois dans H_3 car c'est un ensemble et dans un ensemble les répétitions sont ignorées. Si une configuration est dans H_3 cela signifie que le troll a 3 mouches d'un type donné donc 3 de l'autre type nécessairement (la somme des mouches vaut 6) : H_3={(3,3)} et P(H_3)=6!/3!/3!*(1/2)^3*(1/2)^3=6*5*4*3*2*1/(3*2*1)/(3*2*1)/8/8=5/16. G_3_1={(3,3)} et G_3_2={(3,3)}. Donc P(G_3_1)=5/16=P(G_3_2) et 5/16=P(H_3)=P(G_3_1UG_3_2)<P(G_3_1)+P(G_3_2)=5/8. Modifions la formule pour tenir compte de des éléments présents dans G_3_1 et G_3_2. P(G_3_2UG_3_1)=P(G_3_1)+P(G_3_2)-P(Elements communs à G_3_1 et G_3_2), c'est à dire 5/16=5/16+5/16-5/16 ce qui est maintenant vrai. (On appelle l'ensemble des éléments communs à deux ensembles A et B leur intersection que je noterai ici Inter(A,B)).
Il va de soi que si l'on considère un plus grand nombre d'ensembles la situation est plus compliquée mais il existe néanmoins une formule appelée formule du crible ou de Poincaré qui permet de résoudre le problème (C'est un exercice de niveau Sup donc âmes sensibles s'abstenir).
Le cas général avec deux types de mouches :
P(H_k)=P(G_k_1)+P(G_k_2)-P(Inter(G_k_1,G_k_2))=C(n,k)*p_1^k*(1-p_1)^(n-k)+C(n,k)*p_2^k*(1-p_2)^(n-k)-P(Inter(G_k_1,G_k_2))
P(Inter(G_k_1,G_k_2))=P(Avoir k mouches de type 1 et k de type 2)=0 si n ne vaut pas 2*k (pas possible car la somme des mouches doit valoir le nombre de tirages)
=C(n,k)*p_1^k*p_2^k=C(n,k)*p_1*(1-p_1)^(n-k) car k=2*n et p_1+p_2=1
=P(G_k_1)=P(G_k_2) lorsque k=2*n.
Donc P(H_k)= C(n,k)*p_1^k*(1-p_1)^(n-k)+C(n,k)*p_2^k*(1-p_2)^(n-k) si n ne vaut pas 2*k
= C(n,k)*p_1^k*(1-p_1)^(n-k) = C(n,k)*p_2^k*(1-p_2)^(n-k) si n=2*k
Le cas général avec trois types de mouches :
P(H_k)=P(G_k_1)+P(G_k_2)+P(G_k_3)-P(Inter(G_k_1,G_k_2))-P(Inter(G_k_1,G_k_3))-P(Inter(G_k_2,G_k_3))+P(Inter(G_k_1,G_k_2,G_k_3))
P(G_k_1)+P(G_k_2)+P(G_k_3)=C(n,k)*p_1^k*(1-p_1)^(n-k)+C(n,k)*p_2^k*(1-p_2)^(n-k)+C(n,k)*p_3^k*(1-p_3)^(n-k)
P(Inter(G_k_1,G_k_2))=P(Avoir k mouches de type 1 et k de type 2). On a la liberté de choisir les k premiers tirages de la mouche 1 parmi n puis il reste k tirages de la mouche 2 parmi (n-k) : C(n,k)*p_1^k*C(n-k,k)*p_2^k*p_3^(n-2*k). On peut aussi le voir ainsi : on choisit les 2k tirages parmi n où sort soit la mouche 1 soit la mouche 2 puis les k parmi 2*k où la mouche 1 : C(n,2k)*C(2*k,k)*p_1^k*p_2^k*p_3^(n-2*k). Cela donne évidemment le même résultat : n!/k!/k!/(n-2*k)!*p_1^k*p_2^k*(1-p_1-p_2)^(n-2*k), où les connaisseurs voient un coefficient multinomial.
P(Inter(G_k_2,G_k_3))=n!/k!/k!/(n-2*k)!*p_3^k*p_2^k*(1-p_3-p_2)^(n-2*k)
P(Inter(G_k_1,G_k_3))=n!/k!/k!/(n-2*k)!*p_1^k*p_3^k*(1-p_1-p_3)^(n-2*k)
P(Inter(G_k_1,G_k_2,G_k_3)= 0 si n ne vaut pas 3*k = n!/k!/k!/k!*p_1^k*p_2^k*p_3^k si n=3*k
Donc P(H_k)= C(n,k)*p_1^k*(1-p_1)^(n-k)+C(n,k)*p_2^k*(1-p_2)^(n-k)+C(n,k)*p_3^k*(1-p_3)^(n-k)-n!/k!/k!/(n-2*k)!*p_1^k*p_2^k*(1-p_1-p_2)^(n-2*k)-n!/k!/k!/(n-2*k)!*p_3^k*p_2^k*(1-p_3-p_2)^(n-2*k)-n!/k!/k!/(n-2*k)!*p_1^k*p_3^k*(1-p_1-p_3)^(n-2*k)+0 si n ne vaut 3*k
= C(n,k)*p_1^k*(1-p_1)^(n-k)+C(n,k)*p_2^k*(1-p_2)^(n-k)+C(n,k)*p_3^k*(1-p_3)^(n-k)-n!/k!/k!/(n-2*k)!*p_1^k*p_2^k*(1-p_1-p_2)^(n-2*k)-n!/k!/k!/(n-2*k)!*p_3^k*p_2^k*(1-p_3-p_2)^(n-2*k)-n!/k!/k!/(n-2*k)!*p_1^k*p_3^k*(1-p_1-p_3)^(n-2*k)+n!/k!/k!/k!*p_1^k*p_2^k*p_3^k si n=3*k
On peut simplifier l'expression si n vaut 3*k : C(3*k,k)*p_1^k*(1-p_1)^(2*k)+C(3*k,k)*p_2^k*(1-p_2)^(2*k)+C(3*k,k)*p_3^k*(1-p_3)^(2*k)-2*(3*k)!/k!/k!/k!*p_1^k*p_2^k*p_3^k si n=3*k
Le cas général avec m types de mouches :
P(H_k)=P(G_k_1)+...+P(G_k_m)-P(Inter(G_k_1,G_k_2)-...-P(Inter(G_k_i,G_k_j)-P(Inter(G_k_m-1,G_k_m)+...+(-1)^t*P(Inter(G_k_i1,..G_k_it))+...+(-1)^m*P(Inter(G_k_1,...,G_k_m)) où la somme s'étend pour t un entier entre 1 et m et {i1,...,it} les ensembles de t entiers inclus dans {1,...,n} c'est-à-dire t entiers distincts compris entre 1 et n.
Les probabilités vont faire apparaître un coefficient multinomial. Comme précédemment il faut distinguer les cas n=m*k et n différent de m*k, mais ceci ne concerne que le calcul de P(Inter(G_k_1,...,G_k_m)).
Commençons par celle-ci : P(Inter(G_k_1,...,G_k_m))= 0 si n ne vaut pas m*k
= n!/(k!)^m*p_1^k*...*p_m^k
Intéressons-nous au terme général de la somme ci dessus : P(Inter(G_k_i1,...,G_k_it) avec t un entier entre 1 et m-1 et {i1,...,it} un ensemble de t entiers inclus dans {1,...,n} c'est-à-dire t entiers distincts compris entre 1 et n.
Si t=1 on a alors P(G_k_i)=C(n,k)*p_i^k*p_i^(n-k)
Si t=2 on a alors, avec i et j deux entiers P(Inter(G_k_i,G_k_j))= n!/k!^2/(n-2*k)!*p_i^k*p_j^k*(1-p_i-p_j)^(n-2*k)
Dans le cas général on a donc P(Inter(G_k_i1,...,G_k_it)= n!/(k!)^t/(n-k*t)!*p_i1^k*...*p_it^k*(1-p_i1-...-p_it)^(n-k*t).
On remarque que si n=k*m alors P(Inter(G_k_1,...,G_k_m))=n!/(k!)^m*p_1^k*...*p_m^k=n!/k!^m*p_i1^k*...*p_i(m-1)^k*(1-p_i1-...-p_i(m-1))^k=P(Inter(G_k_i1,...,G_k_i(m-1)) ce que l'on avait empiriquement vérifié ci-dessus.
La somme ci-dessus peut très vite ne comporter que des termes nuls (comme les cas k=3, n=5 et k=3 n=6). Il suffit de considérer Partie_entière(n/k) pour affirmer que les probabilités associées à un t lui étant strictement supérieures ne peuvent qu'être nulles.
Voici une deuxième approche du problème :
Soit Omega={M_1,...M_m} l'ensemble de tous les types de mouches différents muni de la probabilité P définie par P[w=M_i]=p_i.
Soit n le nombre de tirages de mouches réalisés. On considère alors l'espace probabilisé (Omega^n, P^n).
Un élément w de Omega^n s'écrit (M_i1,...M_in). Ceci permet de définir m variables X_i aléatoires (comprendre fonctions) de Omega^n dans les entiers compris entre 0 et n. X_i(w) est donc le nombre de mouches de type i contenues dans le tirage. La loi des X_i est facile à déterminer puisqu'il s'agit de somme de variables de Bernouilli p_i (1-p_i) indépendantes car on suppose que les tirages le sont.
On a donc P^n(k mouches de type i parmi n)=P^n(X_i=k)=C(n,k)*p_i^k*(1-p_i)^(n-k)
Et P^n(Au moins k mouches de type i parmi n)=P^n(X_i=>k)=C(n,k)*p_i^k*(1-p_i)^(n-k)+...+C(n,n)*p_i^n.
L'évènement {Avoir exactement au plus k mouches d'un meme type parmi n} noté A_k est plus difficile à analyser.
La première idée serait de voir A_k comme union des ensembles B_k_i {avoir k mouches de type i et pas plus de k dans un autre type que i} mais sauf dans des cas particuliers comme l'exemple ci-dessus k=3 n=5 ils ne sont pas disjoints. Ceci ne pose a priori pas de problème car l'on peut néanmoins calculer la probabilité de l'union à l'aide de la formule du crible une fois que l'on connait celle de toutes les intersections des B_k_i et on obtient ces probabiltés à l'aide de probabilités conditionnelles en cascade mais ce n'est pas très explicite.
La deuxième idée est de passer par les fonctions de répartition F_i des X_i (qui suivent une loi binomiale (n,p_i), donc F_i(k)=C(n,0)*p_i^0*(1-p_i)^n+...+C(n,k)*p_i^k*(1-p_i)^(n-k)). En effet intéressons-nous à la fonction F : k -> P{MaX_i<k+1, 0<i<m+1}. Pour qu'il soit réalisé il faut et il suffit que chaque X_i soit inférieur ou égal à k (car les X_i ne prennent que des entières). Or A_k={MaX_i<k+1, 0<i<m+1}{MaX_i<k, 0<i<m+1} car si l'on a au plus k mouches et pas au plus k-1 c'est en avoir exactement au plus k.
Donc P(A_k)=F(k)-F(k-1).
Si les X_i étaient indépendantes on aurait : F(k)=P(X_1<=k)*...*P(X_m<=k)=F_1(k)*...*F_m(k). Ce n'est pas le cas puisque X_1+...+X_m=n (Le troll a n mouches). Cela se "calcule" néanmoins mais je n'ai pas le courage d'écrire la formule ici.
Erstamm, the Evolved Kastar. |