Analyse de séquences 1/2

C'est juste une grosse multiplication

Ce défi est tiré de c0d1ngUP 2024

Il est courant pour Mulder et Scully (surtout pour Scully) de devoir classer d'anciens dossiers, et ces dossiers contiennent souvent des relevés de séquences d'acides nucléiques afin de détecter d'éventuelles mutations ou la présence de gènes extraterrestres.

Les relevés auxquels Scully s'intéresse proviennent d'ARN, décrit par une séquence des 4 bases nucléiques : A, C, G ou U (Adénine, Cytosine, Guanine, Uracile). Les séquences d'acides nucléiques sont parfois décrites à l'aide d'autres symboles, comme R (signifie A ou G), Y (signifie C ou U), B (signifie C, G ou U).

Voici la liste complète des symboles :

A signifie : A
C signifie : C
G signifie : G
U signifie : U
R signifie : A ou G
Y signifie : C ou U
K signifie : G ou U
M signifie : A ou C
S signifie : C ou G
W signifie : A ou U
B signifie : différent de A (c.-à-d. C, G ou U)
D signifie : différent de C (c.-à-d. A, G ou U)
H signifie : différent de G (c.-à-d. A, C ou U)
V signifie : différent de U (c.-à-d. A, C ou G)
N signifie : A, C, G ou U

La séquence ACDMR signifie donc :

  • Le premier acide nucléique est forcément A
  • Le second acide nucléique est forcément C
  • Le troisième acide nucléique est A, G ou U
  • Le quatrième acide nucléique est A ou C
  • Le cinquième est A ou G

Il y a donc 12 séquences possibles qui correspondent à la description ACDMR : ACAAA, ACAAG, ACACA, ACACG, ACGAA, ACGAG, ACGCA, ACGCG, ACUAA, ACUAG, ACUCA, ACUCG

Étant donnée une séquence décrivant une séquence ARN avec certaines des 15 lettres du tableau précédent, Scully souhaite classer les dossiers en fonction du nombre de séquences ARN qui correspondent à cette description, ce qui lui permettra de répertorier d'une nouvelle manière les différents relevés trouvés dans les affaires non classées.

Cependant, la plupart des séquences sont assez longues, et le nombre correspondant est souvent très grand. Scully décide donc de ne conserver que les 5 derniers chiffres pour le classement.

La séquence BBBBDDDDHHHH correspond à 531441 séquences différentes. Elle sera donc classée à 31441.

Aidez Scully en lui développant un système qui fait le travail demandé. Par exemple, pour la séquence BBBBDDDDHHHH, le système doit répondre : 31441.

Validez le défi en donnant la réponse de votre système à la séquence donnée en entrée du problème (rappel : on n'utilise que les 5 derniers chiffres pour le classement des dossiers).

Type de retour
un nombre entier
Entrées du problème

NDNKCNVNUGYWRGCNABGSNCRACGSHWNNCYBCSNVUAAGDCMNKNYNNBNCGUBHUNRANDGDMDRSYMGSNWHNDNCVCMAMCANWKYRKVMWMKC

Vous devez être connecté.e pour proposer une réponse au défi
Vous devez être connecté.e pour accéder aux forums.