Il est courant pour Mulder et Scully (surtout pour Scully) de devoir classer d'anciens dossiers, et ces dossiers contiennent souvent des relevés de séquences d'acides nucléiques afin de détecter d'éventuelles mutations ou la présence de gènes extraterrestres.
Les relevés auxquels Scully s'intéresse proviennent d'ARN, décrit par une
séquence des 4 bases nucléiques : A
, C
, G
ou U
(Adénine, Cytosine,
Guanine, Uracile).
Les séquences d'acides nucléiques sont parfois décrites à l'aide d'autres
symboles, comme R
(signifie A
ou G
), Y
(signifie C
ou U
), B
(signifie C
,
G
ou U
).
Voici la liste complète des symboles :
A | signifie : | A |
C | signifie : | C |
G | signifie : | G |
U | signifie : | U |
R | signifie : | A ou G |
Y | signifie : | C ou U |
K | signifie : | G ou U |
M | signifie : | A ou C |
S | signifie : | C ou G |
W | signifie : | A ou U |
B | signifie : | différent de A (c.-à-d. C, G ou U) |
D | signifie : | différent de C (c.-à-d. A, G ou U) |
H | signifie : | différent de G (c.-à-d. A, C ou U) |
V | signifie : | différent de U (c.-à-d. A, C ou G) |
N | signifie : | A, C, G ou U |
La séquence ACDMR
signifie donc :
A
C
A
, G
ou U
A
ou C
A
ou G
Il y a donc 12 séquences possibles qui correspondent à la description
ACDMR
: ACAAA
, ACAAG
, ACACA
, ACACG
, ACGAA
, ACGAG
, ACGCA
,
ACGCG
, ACUAA
, ACUAG
, ACUCA
, ACUCG
Étant donnée une séquence décrivant une séquence ARN avec certaines des 15 lettres du tableau précédent, Scully souhaite classer les dossiers en fonction du nombre de séquences ARN qui correspondent à cette description, ce qui lui permettra de répertorier d'une nouvelle manière les différents relevés trouvés dans les affaires non classées.
Cependant, la plupart des séquences sont assez longues, et le nombre correspondant est souvent très grand. Scully décide donc de ne conserver que les 5 derniers chiffres pour le classement.
La séquence BBBBDDDDHHHH
correspond à 531441 séquences différentes. Elle
sera donc classée à 31441.
Aidez Scully en lui développant un système qui fait le travail demandé. Par
exemple, pour la séquence BBBBDDDDHHHH
, le système doit répondre : 31441
.
Validez le défi en donnant la réponse de votre système à la séquence donnée en entrée du problème (rappel : on n'utilise que les 5 derniers chiffres pour le classement des dossiers).