- To test the project (macOS & linux):
make ./asm our_champ.s ./disassembler our_champ.s # you don't need to launch this, but we wrote it # /!\ now is a good time to make your terminal window big enough ./corewar ./our_champ.cor ./our_champ.cor ./our_champ.cor -vi -rand
- controls in the visualizer:
- Q: -10cycle/s W: -1cycle/s E: +1cycle/s R: +10 cycle/s
- 1: 50cycle/s 2: ~9999 cycle/s
- space: pause/unpause
- esc: quit
Note the absence of a .gitignore
among other things.
This is because this project is to 42's norme.
This git does not differ in any way (appart from this README) to what was validated at 42.
A very good description of the subject from cepalle:
Ce projet a pour but de vous faire réaliser une arène virtuelle dans laquelle vont s’affronter des programmes (les champions). Vous allez également réaliser un assembleur permettant de compiler ces champions.
-
Votre machine virtuelle va exécuter du code machine (ou "bytecode"), qui devra être généré par votre assembleur. L’assembleur (le programme) va prendre en entrée un fichier écrit en assembleur (le langage), et sortir un champion qui sera compréhensible par la machine virtuelle.
-
Il se lance de la façon suivante :
./asm monchampion.s
-
Il va lire le code assembleur à traiter depuis le fichier .s passé en paramètre, et écrire le bytecode résultant dans un fichier nommé comme l’entrée en remplaçant l’extension .s par .cor .
-
En cas d’erreur, vous devrez afficher un message pertinent sur la sortie d’erreur, et ne pas produire de fichier .cor
,
, params separator, TOKEN_SEPARATOR_CHAR
Space and tabulations are the only white space characters supported. Both count as a single character when tracking locations.
End of lines are \n
, TOKEN_EOL.
The strings are ASCII strings: enclosed by "
, don't support escape character.
In line comment start with #
or ;
.
Labels are composed by any number of alphanumeric characters plus the underscore.
label_ref_direct ::= : % label_ref_indirect
label_ref_indirect ::= : letter { letter | digit | _ }
label_dec ::= letter { letter | digit | _ } :
letter ::=
a | b | c | d | e | f | g | h | i | j | k | l |
m | n | o | p | q | r | s | t | u | v | w | x |
y | z |
digit ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
number_indirect ::= digit { digit }
number_direct ::= % number_indirect
.name
, TOKEN_PROG_NAME.
.comment
, TOKEN_PROG_COMMENT.
Any other character is invalid.
We use Extended BNF, with [
and ]
for zero or once, and {
and }
for any number of repetition including zero.
programe ::= champion_name champion_description {inst}
inst ::= {label :} opcode params
opcode ::=
nb_live | ld | st | add | or | xor | zjmp |
ldi | sti | fork | lld | lldi | lfork | aff
params ::= param [, params] [, params]
param ::= registre | direct | indirect
registre ::= r integer
direct ::= label_ref_direct | number_direct
indirect ::= label_ref_indirect | number_indirect
champion_name ::= .name string
champion_description ::= .comment string
#define MAX_CHECKS 10
Op | Binaire | Hexa | Cycle | Arg 1 | Arg 2 | Arg 3 | carry | octet_param | dir_size_2 |
---|---|---|---|---|---|---|---|---|---|
live | 0000001 | 0x01 | 10 | T_DIR | 0 | 0 | 0 | ||
ld | 0000010 | 0x02 | 5 | T_DIR or T_IND | T_REG | 1 | 1 | 0 | |
st | 0000011 | 0x03 | 5 | T_REG | T_IND or T_REG | 0 | 1 | 0 | |
add | 0000100 | 0x04 | 10 | T_REG | T_REG | T_REG | 1 | 1 | 0 |
sub | 0000101 | 0x05 | 10 | T_REG | T_REG | T_REG | 1 | 1 | 0 |
and | 0000110 | 0x06 | 6 | T_REG or T_DIR or T_IND | T_REG or T_IND or T_DIR | T_REG | 1 | 1 | 0 |
or | 0000111 | 0x07 | 6 | T_REG or T_IND or T_DIR | T_REG or T_IND or T_DIR | T_REG | 1 | 1 | 0 |
xor | 0001000 | 0x08 | 6 | T_REG or T_IND or T_DIR | T_REG or T_IND or T_DIR | T_REG | 1 | 1 | 0 |
zjmp | 0001001 | 0x09 | 20 | T_DIR | 0 | 0 | 1 | ||
ldi | 0001010 | 0x0a | 25 | T_REG or T_DIR or T_IND | T_DIR or T_REG | T_REG | 0 | 1 | 1 |
sti | 0001011 | 0x0b | 25 | T_REG | T_REG or T_IND or T_DIR | T_DIR or T_REG | 0 | 1 | 1 |
fork | 0001100 | 0x0c | 800 | T_DIR | 0 | 0 | 1 | ||
lld | 0001101 | 0x0d | 10 | T_DIR or T_IND | T_REG | 1 | 1 | 0 | |
lldi | 0001110 | 0x0e | 50 | T_REG or T_DIR or T_IND | T_DIR or T_REG | T_REG | 1 | 1 | 1 |
lfork | 0001111 | 0x0f | 1000 | T_DIR | 0 | 0 | 1 | ||
aff | 0010000 | 0x10 | 2 | T_REG | 0 | 1 | 0 |
Les parametres sont précédé par un octet de description sous la forme suivante:
0b __ __ __ 00
sur les 3 duo de bit il est stoque le code du type des parametres. Les types sont les suivant:
Registre: REG_CODE: 1 = 0b01, numeraux d'un registre codé sur REG_SIZE (1) Octet
Direct: DIR_CODE: 2 = 0b10, integer codé sur DIR_SIZE (4) Octet, mais varis en fonction de l'Op
Indirect: IND_CODE3 = 0b11, address relative a PC codé sur IND_SIZE (2) Octets
exemple:
- r2,23,%34 donne l’octet de codage 0b01111000, soit 0x78
- 23,45,%34 donne l’octet de codage 0b11111000, soit 0xF8
- r1,r3,34 donne l’octet de codage 0b01011100, soit 0x5C
Les paramètres, directement, selon le modèle suivant :
- r2,23,%34 donne l’OCP 0x78 puis 0x02 0x00 0x17 0x00 0x00 0x00 0x22
- 23,45,%34 donne l’OCP 0xF8 puis 0x00 0x17 0x00 0x2d 0x00 0x00 0x00 0x22
un label est transformé en valeur indirect qui point relativement au PC vers la declaration du label (ff ff = -1).
L’exécutable commence toujours par un header, défini dans op.h par le type header_t
.name "zork"
.comment "just a basic living prog"
l2: sti r1,%:nb_live,%1
and r1,%0,r1
nb_live: nb_live %1
zjmp %:nb_live
# Executable compile:
#
# 0x0b,0x68,0x01,0x00,0x0f,0x00,0x01
# 0x06,0x64,0x01,0x00,0x00,0x00,0x00,0x01
# 0x01,0x00,0x00,0x00,0x01
# 0x09,0xff,0xfb
> .name "stayin' alive"
> .comment "Ha, Ha, Ha, stayiiiiin' aliiiiiiiiiive"
< 00 ea 83 f3 73 74 61 79 69 6e 27 20 61 6c 69 76
< 65 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
< 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
< *
< 00 00 00 00 00 00 00 00 00 00 00 4d 48 61 2c 20
< 48 61 2c 20 48 61 2c 20 73 74 61 79 69 69 69 69
< 69 6e 27 20 61 6c 69 69 69 69 69 69 69 69 69 69
< 76 65 00 00 00 00 00 00 00 00 00 00 00 00 00 00
< 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
< *
> sti r1, %:nb_live, %1 ;change nb_live by the right value
< 0b 68 01 00-45 00-01
> sti r1, %:live2, %1 ;change nb_live by the right value
< 0b 68 01 00-22 00-01
> ld %1, r3
< 02 90 00-00-00-01 03
> ld %33, r6
< 02 90 00-00-00-21 06
#While (r2 < 10)
forks:
> add r2, r3, r2 ;increment r2
< 04 54 02 03 02
> xor r2, %15, r4 ;if (r4) {carry = 0}
< 08 64 02 00-00-00-0f 04
live2:
> nb_live %4
< 01 00-00-00-04
> zjmp %:endwhile ;if (carry)
< 09 00-10
> fork %:forks
< 0c ff-eb
> ld %0, r4 ;carry = 1
< 02 90 00-00-00-00 04
> zjmp %:forks
< 09 ff-e1
#EndWhile
endwhile:
> ld %0, r4 ;carry = 1
< 02 90 00-00-00-00 04
nb_live:
> nb_live %4
< 01 00-00-00-04
> zjmp %:nb_live
< 09 ff-fb
-
Le langage assembleur est composé d’une instruction par ligne.
-
Une instruction se compose de trois éléments : Un label (optionnel), composé d’une chaîne de caractères parmi LABEL_CHARS suivi par LABEL_CHAR ; un opcode ; et ses paramètres, séparés par SEPARATOR_CHAR. Un paramètre peut être de trois types :
-
Registre : (r1 <–> rx avec x = REG_NUMBER)
-
Direct : Le caractère DIRECT_CHAR suivi d’une valeur numérique ou d’un label (précédé par LABEL_CHAR), ce qui représente une valeur directe.
-
Indirect : Une valeur ou un label (précédé de LABEL_CHAR), ce qui repré- sente la valeur qui se trouve à l’adresse du paramètre, relativement au PC du processus courant.
-
-
Un label peut n’avoir aucune instruction à sa suite, ou être placé sur la ligne d’avant l’instruction qu’il concerne.
-
Le caractère COMMENT_CHAR démarre un commentaire.
-
Un champion comportera également un nom et une description, qui sont présents sur une ligne après les marqueurs NAME_CMD_STRING et COMMENT_CMD_STRING.
-
Tous les adressages sont relatifs au PC et à IDX_MOD sauf pour lld, lldi et lfork.
-
Le nombre de cycles de chaque instruction, leur représentation mnémonique, leur nombre de paramètres et les types de paramètres possibles sont décrits dans le tableau op_tab déclaré dans op.c. Les cycles sont toujours consommés.
-
Tous les autres codes n’ont aucune action a part passer au suivant et perdre un cycle.
-
lfork : Ca signifie long-fork, pour pouvoir fourcher de la paille à une distance de 15 mètres, exactement comme son opcode. Pareil qu’un fork sans modulo à l’adresse.
-
sti : Opcode 11. Prend un registre, et deux index (potentiellement des registres). Additionne les deux derniers, utilise cette somme comme une adresse ou sera copiée la valeur du premier paramètre.
-
fork : Pas d’octet de codage des paramètres, prend un index, opcode 0x0c. Crée un nouveau processus, qui hérite des différents états de son père, à part son PC, qui est mis à (PC + (1er paramètre % IDX_MOD)).
-
lld : Signifie long-load, donc son opcode est évidemment 13. C’est la même chose que ld, mais sans % IDX_MOD. Modifie le carry.
-
ld : Prend un paramètre quelconque et un registre. Charge la valeur du premier paramètre dans le registre. Son opcode est 10 en binaire, et il changera le carry.
-
add : Opcode 4. Prend trois registres, additionne les 2 premiers, et met le résultat dans le troisième, juste avant de modifier le carry.
-
zjmp : Il n’y a jamais eu, n’y a pas, et n’y aura jamais d’octet de codage des paramètres derrière cette opération dont l’opcode est de 9. Elle prendra un index, et fait un saut à cette adresse si le carry est à 1.
-
sub : Pareil que add, mais l’opcode est 0b101, et utilise une soustraction.
-
ldi : ldi, comme son nom l’indique, n’implique nullement de se baigner dans de la crème de marrons, même si son opcode est 0x0a. Au lieu de ça, ca prend 2 index et 1 registre, additionne les 2 premiers, traite ca comme une adresse, y lit une valeur de la taille d’un registre et la met dans le 3eme.
-
or : Cette opération est un OU bit-à-bit, suivant le même principe que and, son opcode est donc évidemment 7.
-
st : Prend un registre et un registre ou un indirect, et stocke la valeur du registre vers le second paramètre. Son opcode est 0x03. Par exemple, st r1, 42 stocke la valeur de r1 à l’adresse (PC + (42 % IDX_MOD))
-
aff : L’opcode est 10 en hexadécimal. Il y a un octet de codage des paramètres, même si c’est un peu bête car il n’y a qu’un paramètre, qui est un registre, dont le contenu est interprété comme la valeur ASCII d’un caractère à afficher sur la sortie standard. Ce code est modulo 256.
-
nb_live : L’instruction qui permet à un processus de rester vivant. A également pour effet de rapporter que le joueur dont le numéro est en paramètre est en vie. Pas d’octet de codage des paramètres, opcode 0x01. Oh, et son seul paramètre est sur 4 octets.
-
xor : Fait comme and avec un OU exclusif. Comme vous l’aurez deviné, son opcode en octal est 10.
-
lldi : Opcode 0x0e. Pareil que ldi, mais n’applique aucun modulo aux adresses. Modifiera, par contre, le carry.
-
and : Applique un & (ET bit-à-bit) sur les deux premiers paramètres, et stocke le résultat dans le registre qui est le 3ème paramètre. Opcode 0x06. Modifie le carry.
Chaque processus aura à sa disposition les éléments suivants, qui lui sont propres :
-
REG_NUMBER registres qui font chacun une taille de REG_SIZE octets. Un registre est une petite "case" mémoire, qui ne contient qu’une seule valeur. Sur une vraie machine, elle est interne au processeur et est donc TRÈS rapide d’accès.
-
Un PC ("Program Counter"). C’est un registre spécial, qui contient juste l’adresse, dans la mémoire de la machine virtuelle, de la prochaine instruction à décoder et exécuter. Très utile pour savoir où l’on se trouve dans l’exécution, afin d’écrire des choses en mémoire...
-
Un flag nommé carry, qui vaut 1 si la dernière opération a réussi. Seules certaines opérations vont modifier le carry.
-
Le numéro du joueur est généré par la machine ou spécifié au lancement, et est fourni aux champions via le registre r1 de leur premier processus au démarrage. Tous les autres registres sont mis à 0. Sauf le PC.
-
Les champions sont chargés en mémoire de façon à espacer équitablement leurs points d’entrée.
-
La machine virtuelle va créer un espace mémoire dédié au combat des joueurs, puis y charger les champions et leurs processus associés, et les exécuter séquentiellement jusqu’à ce que mort s’ensuive.
-
Tous les CYCLE_TO_DIE cycles, la machine doit s’assurer que chaque processus a exécuté au moins un nb_live depuis la dernière vérification. Un processus qui ne se soumet pas à cette règle sera mis à mort à l’aide d’une batte en mousse virtuelle. (Bonus bruitage !)
-
Si au cours d’une de ces vérifications on se rend compte qu’il y a eu au moins NBR_LIVE exécutions de nb_live depuis la dernière vérification en date, on décrémente CYCLE_TO_DIE de CYCLE_DELTA unités.
-
Quand il n’y a plus de processus en vie, la partie est terminée.
-
Le gagnant est le dernier joueur qui a été rapporté comme étant en vie. La machine va ensuite afficher : "le joueur x(nom_champion) a gagne", où x est le numéro du joueur et nom_champion le nom de son champion. Exemple : "le joueur 2(rainbowdash) a gagne"
-
A chaque exécution valide de l’instruction nb_live, la machine doit afficher : "un processus dit que le joueur x(nom_champion) est en vie"
-
En tout état de cause, la mémoire est circulaire et fait MEM_SIZE octets.
-
En cas d’erreur, vous devrez afficher un message pertinent sur la sortie d’erreur.
-
Si on n’a pas décrémenté CYCLE_TO_DIE depuis MAX_CHECKS vérifications, on le décrémente.
-
La machine virtuelle se lance de la façon suivante :
./corewar [-dump nbr_cycles] [[-n number] champion1.cor] ...
-
-dump nbr_cycles
Au bout de nbr_cycles cycles d’exécution, dump la mémoire sur la sortie standard, puis quitte la partie. La mémoire doit être dumpée au format hexadécimal, avec 32 octets par ligne. -
-n
number Fixe le numéro du prochain joueur. Si absent, le joueur aura le prochain numéro libre dans l’ordre des paramètres. Le dernier joueur aura le premier processus dans l’ordre d’exécution. -
Les champions ne peuvent pas dépasser CHAMP_MAX_SIZE, sinon c’est une erreur.
-
La machine virtuelle est supposée émuler une machine parfaitement parallèle.
-
Mais pour des raisons d’implémentation, on supposera que chaque instruction s’exécute entièrement a la fin de son dernier cycle et attend durant toute sa durée. Les instructions qui se terminent à un même cycle s’exécutent dans l’ordre décroissant des numéros de processus.
-
Oui, le dernier né joue en premier
-
Votre champion a trois objectifs indissociables : Faire en sorte que son joueur soit rapporté comme "en vie", comprendre le sens de ladite vie, et annihiler ses adversaires.
-
Pour que son joueur soit dit comme "en vie", votre champion doit faire en sorte que des nb_live soient faits avec son numéro. Si l’un de ses processus fait un nb_live avec le numéro d’un autre joueur ... eh bien, c’est dommage, mais au moins un autre joueur sera content. Si un processus d’un autre joueur fait des nb_live avec votre numéro, vous avez l’autorisation de vous moquer de lui et de profiter éhontément de son erreur, tous en insultant sa famille en binaire.
-
Absolument TOUTES les instructions sont utiles. Toutes les réactions de la machine, décrites plus loin dans le chapitre sur le langage, peuvent être utilisées pour donner vie à votre champion et lui permettre de remporter dix-sept euros cinquante-trois centimes au cours du championnat. Oui, même l’instruction aff est utile, par exemple pour se moquer de l’ineptitude de vos adversaires.
-
Il sera noté, à la soutenance, sur sa capacité à survivre à quelques challenges élémentaires, comme vaincre un champion au Q.I de pot de fleurs, réussir à finir une assiette de tarte aux pommes de ma grand-mère, ou dessiner des fleurs dans un cappucino.
-
Vous pourrez, plus tard, réaliser un nouveau champion qui sera destiné à participer au championnat, (Rappel : C’est un autre projet !) et se battre contre les champions de vos camarades, et peut-être même ceux du Bocal, chose qui transformera probablement assez rapidement votre champion en tas informe de boyaux virtuels, mais qui pourrait bien, au prix d’une ou deux cérémonies vaudou impliquant des épingles à nourrice et un endroit que l’honnêteté et la décence m’interdisent de préciser davantage, vous couvrir de gloire et de chatons.