Assembly x86

famiglia di linguaggi di programmazione

Assembly x86 è una famiglia di linguaggi assembly retrocompatibili usata per produrre codice macchina per i processori con architettura x86. Come tutti i linguaggi assembly utilizza corte mnemoniche, ovvero abbreviazioni facili da ricordare (per esempio cmp sta per compare ovvero "confronta") che rappresentano le operazioni fondamentali che il processore può eseguire.

I processori Intel 8086 e 8088 sono stati i primi ad avere il set di istruzioni che viene comunemente chiamato x86. Questi processori a 16 bit ereditarono molte caratteristiche dai precedenti processori a 8 bit, ma vennero aggiornati ricevendo un numero molto maggiore di istruzioni e funzionalità. Assembly x86 permette di scrivere codice macchina per l'8086, per tutti i processori Intel seguenti e per i processori di altri produttori (come per esempio AMD) che utilizzano l'architettura x86.

Registri modifica

Complessivamente i registri utilizzati nell'assembly x86 sono 14. Quattro sono registri di uso generale, utilizzati per la memorizzazione temporanea:[1]

  • AX, registro accumulatore, è il registro usato per le istruzioni matematiche quali somme, sottrazioni, moltiplicazioni e divisioni.
  • BX, registro base, è il registro che può specificare un indirizzo di memoria.
  • CX, registro contatore, è il registro usato nelle istruzioni di conteggio dei cicli o di operazioni matematiche.
  • DX, registro di I/O, è il registro che indirizza le porte di Input/Output; può essere usato anche in istruzioni matematiche come moltiplicazioni e divisioni.

Due sono registri indice, usati sia per la memorizzazione temporanea (solo a 16 bit) sia nelle istruzioni in cui si manipolano stringhe:

  • SI, registro indice sorgente, è il registro in cui viene specificato l'indirizzo da cui leggere l'array.
  • DI, registro indice destinazione, è il registro in cui viene specificato l'indirizzo in cui scrivere l'array.

Due registri vengono usati per la gestione dello stack e per l'indirizzamento in memoria:

  • BP, registro base pointer, è il registro che contiene il primo indirizzo di memoria della pila di stack.
  • SP, registro stack pointer, è il registro che contiene l'ultimo indirizzo di memoria della pila di stack.

Due registri vengono aggiornati dal processore e per questo non possono essere modificati dal programmatore:

  • IP, registro instruction pointer, è il registro che contiene la parte meno significativa dell'istruzione successiva da eseguire.
  • Flag, registro dei flag, è il registro dove ogni bit ha un significato diverso dopo l'esecuzione di un'istruzione; descrive lo stato del processore.

Gli ultimi quattro registri sono di segmento vengono usati per contenere i 16 bit più significativi di un qualsiasi indirizzo di memoria.[2]

  • CS, registro code segment, è il registro che contiene la parte più significativa del program counter ed è associato al registro IP.
  • DS, registro data segment, è il registro che contiene la parte più significativa di una memoria dati ed è associato ai registri BX, SI e DI.
  • ES, registro extra segment, è uguale al registro DS ma associato ad una seconda memoria dati.
  • SS, registro stack segment, è il registro che contiene la parte più significativa della memoria in cui è assegnato lo stack ed è associato ai registri BP e SP

Istruzioni modifica

MOV modifica

mov a, b

L'istruzione mov copia il contenuto di a (che può essere un valore costante, un contenuto del registro o della memoria) in b.[3]

PUSH modifica

push a

L'istruzione push inserisce all'inizio dello stack a l'indirizzo inserito nel registro SP il quale a sua volta viene decrementato di due unità.[4]

POP modifica

pop b

L'istruzione pop preleva un elemento dallo stack, dall'indirizzo inserito nel registro SP, e lo sposta in b. Il registro SP viene incrementato di due unità.[5]

NOP modifica

nop

L'istruzione nop non fa niente, ma viene usata per esempio se si vuole rallentare l'esecuzione del programma oppure se si vuole aumentare l'indirizzo del codice di una unità.[6]

CMP modifica

cmp a - b

L'istruzione cmp confronta i valori contenuti in a e b effettuando una sottrazione. Successivamente vengono impostati i flag in base al risultato dell'istruzione.[7]

JMP modifica

jmp a

L'istruzione jmp (salto incondizionato) trasferisce nell'indirizzo a il flusso del programma eseguito.[8]

LOOP modifica

loop a

L'istruzione loop, quando viene eseguita, controlla il registro CX. Se è diverso da zero viene decrementato di una unità il suo valore, altrimenti il programma riprende normalmente l'esecuzione.[9]

Operazioni matematiche modifica

add a, b
sub a, b
mul a
div a

L'istruzione add esegue la somma tra a e b; il risultato viene inserito in a.

L'istruzione sub esegue la sottrazione tra a e b; il risultato viene inserito in a.

L'istruzione mul esegue la moltiplicazione tra il valore del registro AX e a; il risultato viene inserito in AX.

L'istruzione div esegue la divisione tra il valore del registro AX e a; il risultato viene inserito in AX.[10]

Interruzioni modifica

Nell'assembly x86 le interruzioni (o interrupt) vengono gestite attraverso delle istruzioni molto importanti se si vuole scrivere un programma, poiché servono per poter accedere allo schermo e alla tastiera.

Gestione dell'output modifica

Le istruzioni int 10 e int 21 sono le istruzioni necessarie per stampare sullo schermo un carattere; quest'ultimo dovrà essere sempre indicato in codifica ASCII anche se è formato da una cifra decimale.[11]

Nell'esempio sotto viene mostrato come si stampa il carattere "A".

; variante int 10
mov al, 41  ; 41h = 'A'
mov ah, 0e
int 10

;variante int 21
mov al, 41h ; 41H = 'A'
mov ah, 02h
int 21h

Gestione dell'input modifica

Le istruzioni int 16 e int 21 sono le istruzioni necessarie per inserire un carattere da tastiera. Quando viene invocata l'interruzione, l'esecuzione del programma viene bloccata in attesa che l'utente digiti un carattere da tastiera. Alla fine dell'esecuzione viene visualizzato in ASCII il carattere premuto dall'utente.[12]

; variante int 16
mov ah, 00
int 16
; visualizzazione del carattere premuto

; variante int 21
mov ah, 01
int 21
; visualizzazione del carattere premuto

Chiusura di un programma modifica

L'istruzione int 20 chiude un programma COM; il DOS non viene informato sullo stato della chiusura. L'istruzione int 21 chiude un programma EXE; il DOS viene informato sullo stato della chiusura.[13]

; per chiudere un programma COM
int 20

; per chiudere un programma EXE
mov al, 00h
mov ah, 4c
int 21

Ora corrente modifica

L'istruzione int 21h restituisce l'ora corrente, inclusi i minuti, i secondi e i centesimi di secondo.[14]

mov ah, 2ch
int 21h

Debug modifica

Per scrivere e compilare programmi in assembly x86 viene utilizzato il programma debug.exe (eseguibile tramite il comando debug nel prompt di Windows e di MS-DOS), presente in MS-DOS e nelle versioni a 16 bit e 32 bit di Windows. Nelle versioni a 64 bit il programma non è presente, tuttavia per questi sistemi è possibile utilizzare emulatori gratuiti scaricabili in rete come DOSBox[15]. La notazione utilizzata è quella esadecimale. Nel debug.exe i comandi sono molto comprensibili dall'utente, e sono anche case sensitive. Sotto vengono riassunti i comandi principali:

Comando Che cosa fa
A Inizia la scrittura del programma.
D Permette di visualizzare la memoria.
L Carica il programma.
N Rinomina il programma.
Q Esce da debug.exe.
R Permette di visualizzare e/o impostare i registri.
U Permette di modificare il programma.
W Salva il programma.

Note modifica

  1. ^ P. Ollari, 2013, pp. 26-27.
  2. ^ P. Ollari, 2013, pp. 27-28.
  3. ^ P. Ollari, 2013, p. 36.
  4. ^ P. Ollari, 2013, p. 86.
  5. ^ P. Ollari, 2013, pp. 86-87.
  6. ^ P. Ollari, 2013, p. 52.
  7. ^ P. Ollari, 2013, p. 54.
  8. ^ P. Ollari, 2013, p. 55.
  9. ^ P. Ollari, 2013, p. 57.
  10. ^ P. Ollari, 2013, pp. 76-77.
  11. ^ P. Ollari, 2013, pp. 44-45.
  12. ^ P. Ollari, 2013, pp. 43-44.
  13. ^ P. Ollari, 2013, p. 45.
  14. ^ P. Ollari, 2013, p. 87.
  15. ^ P. Ollari, 2013, p. 48.

Bibliografia modifica

  • Paolo Ollari, Corso di sistemi e reti. Volume 1. Architetture e network, Bologna, Zanichelli, 2013, ISBN 978-88-08-14169-9.

Voci correlate modifica

Collegamenti esterni modifica

Controllo di autoritàLCCN (ENsh2012003657 · J9U (ENHE987007593028105171
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica