Vi siete mai arrampicati su un albero ? - Alberi binari e database -

Vi siete mai arrampicati su un albero ?
- Alberi binari e database -

gif (Aggiornamento dell'articolo al 11/05/2011)
Non ridete! E’ proprio così: un elaboratore per cercare un dato richiesto fra i numerosi archiviati in un database (elenco clienti, fornitori, scritture contabili) di una ditta o di un qualsiasi ente, si arrampica proprio su un albero … si, un albero particolare: un albero binario.
Dobbiamo, prima di dare una definizione di albero binario, fare alcune considerazioni generali su come vengono archiviati i dati in un supporto di memoria di massa (hard disk) e come questi possono essere successivamente ricercati da un calcolatore utilizzando un programma apposito. Analogamente a quanto noi esseri umani facciamo nello stilare un elenco di nominativi come per esempio un elenco di clienti di una ditta scrivendoli uno dopo l’altro su un registro cartaceo, anche un computer fa la stessa cosa inserendo i dati uno dopo l’altro senza lasciare spazi in settori dell’hard disk e catalogando con un nome il contenitore (file) dei dati stessi: ad esempio il file clienti. La posizione del dato nel file viene determinata in modo non visibile all’utente finale, ma solo conosciuto dal programma, da un puntatore numerico che determina quindi in modo univoco la posizione fisica del dato stesso. Allo stesso modo noi potremmo numerare le righe del nostro registro cartaceo e stabilire che ad ogni riga venga a corrispondere un nominativo dell’elenco.
Se nell’hard disk il puntatore determina la posizione fisica del dato da ricercare, possiamo ordinare, attraverso il nostro programma, alla testina magnetica imputata alla lettura di posizionarsi nella zona determinata dal puntatore numerico a quel dato specifico e quindi di leggerlo.
Il grosso problema che sorge, se gli elementi del nostro elenco di nominativi sono stati inseriti a caso, e quindi di per se in modo non ordinato, è che non poteremo mai conoscere o comunque avvicinarci a quello da ricercare se non ordinando all’elaboratore di leggere tutto in sequenza dal primo fino all’ultimo dato e fermarsi quando quest’ultimo è stato trovato.
Questo tipo di ricerca si chiama ricerca sequenziale. E’ evidente che tutto può funzionare egregiamente con questo algoritmo se l’elenco dei nominativi è composto da poche centinaia di elementi: un elaboratore ci metterebbe, nel peggiore dei casi, una piccola frazione di secondo a seguire lo schema previsto (lettura in sequenza di ogni singolo elemento fino al dato richiesto) e terminare poi l’elaborazione, ma se gli elementi, come spesso accade nei più diffusi database sono diverse migliaia o addirittura centinaia di migliaia, il tempo dell’elaborazione diventerebbe esageratamente troppo lungo per qualsiasi utente specialmente poi se il nominativo ricercato venga a trovarsi in fondo all’elenco.
Per ovviare a questo problema, dobbiamo ordinare l’elenco che, se si tratta di un elenco di nominativi può essere fatto ordinando alfabeticamente tutti gli elementi (ordine conosciuto anche da un elaboratore la “a” viene prima della “b” come “1” viene prima del “2” ecc.).

Un elenco telefonico, ad esempio, è un insieme di nominativi ordinati alfabeticamente.
Per costruire un algoritmo (insieme di istruzioni eseguibili da un computer) capace di ricercare in modo veloce un elemento in un insieme ordinato, dobbiamo prendere come esempio il nostro comportamento nel ricercare un nome sull’elenco telefonico. Di solito noi apriamo l’elenco a circa metà e se dopo aver letto il primo nome, quello da ricercare viene prima alfabeticamente ricerchiamo ancora aprendo la metà inferiore o al contrario ,se viene dopo, quella superiore ripetendo l’operazione fino a giungere alla pagina giusta.
Questo tipo di ricerca viene più comunemente chiamata ricerca binaria perché fa sempre riferimento normalmente nella ricerca a due insiemi di una metà: quello inferiore e quello superiore. Ovviamente se dobbiamo aggiungere un nominativo ad un elenco telefonico saremmo sempre costretti a ristamparlo integralmente e se l’elemento da aggiungere in modo ordinato deve essere incastonato all’interno, anche a ristampare tutte le pagine facendo slittare tutti gli elementi che seguono di una posizione.
La cosa non è altrettanto pensabile nell’inserimento di dati in un archivio elettronico; lo slittamento di posizioni di tutta una serie di dati per mantenere l’ordinamento comporta sempre una riscrittura ed è sempre una cosa laboriosa e lunga anche da parte di un elaboratore. Si è pensato così di mantenere la posizione fisica degli elementi uno dopo l’altro in ordine di inserimento e di ordinarli solo in modo logico e quindi non fisico aggiungendo in fase di inserimento del dato due informazioni numeriche aggiuntive ad esso e solo ad uso del programma: una rappresenta il puntatore all’elemento che lo precede in ordine alfabetico e l’altro rappresenta quello che lo segue. Per convenzione il puntatore inferiore è il primo a sinistra, il superiore quello a destra. Ricordo sempre che il puntatore rappresenta le coordinate della posizione fisica che deve assumere la testina di lettura/scrittura per leggere o scrivere il dato corrispondente.
In questo modo i dati collegati ad una coppia di puntatori, si possono rappresentare a forma di albero detto anche albero binario.

In questo tipo di alberi, alla radice, (il primo elemento inserito) seguono via, via i successivi seguendo il puntatore superiore per elementi che seguono e quello inferiore per quelli che lo precedono. I dati a cui ne seguono altri (puntatori non nulli) si chiamano nodi, quelli terminali (puntatori nulli) si chiamano foglie. Gli alberi binari si rappresentano graficamente capovolti (convenzione): la radice in alto, nodi e foglie via, via sotto.
Se seguite passo dopo passo gli algoritmi qui rappresentati per l'inserimento dei dati e quello per la ricerca, vedrete che nel primo caso l’albero viene costruito e nel secondo invece visitato appunto per la ricerca; è, come vi avevo accennato all’inizio, se nel cercare un dato l’elaboratore si arrampicasse su un albero. Nella ricerca di un qualsiasi elemento su una guida o su un vocabolario, noi facciamo la stessa cosa, ma ormai quasi per tutto noi ci affidiamo ai computer: forse … troppo pigri per arrampicarci ancora ? :-)
La trattazione dell’argomento non finisce qui, vi mostrerò in seguito gli algoritmi di cancellazione di un elemento e di riordino di un albero. Vi segnalerò un grossissimo problema per questo tipo di archiviazione: lo sbilanciamento degli alberi e tutto ciò che ne comporta e poi qualche accenno su programmi di bilanciamento (compattazione archivi). Seguirà una breve guida sui collegamenti di più tabelle e archivi e vi porterò (mah! …) fino a progettare un gestionale completo.
Se farete tesoro di tutto ciò che ho detto fino ad ora sull’argomento, tutto il resto vi sembrerà una passeggiata !!

Vedi:

gif (Aggiunta del 03/11/2025)

Algoritmi e Strutture Dati - Alberi Binari di Ricerca (BST)

Un albero binario di ricerca (BST) è una struttura dati che consente operazioni come ricerca, inserimento e cancellazione di elementi in modo efficiente. Ecco un riepilogo degli algoritmi e delle operazioni principali associati a un BST:
• Ricerca: Inizia dalla radice e segue i confronti tra il valore cercato e i valori dei nodi, fino a trovare il valore cercato o terminare la ricerca.
• Inserimento: L'elemento viene inserito nel sotto-albero sinistro se il valore è minore, o nel sotto-albero destro se il valore è maggiore.
• Cancellazione: La cancellazione di un elemento può essere effettuata in tre casi: se il nodo è una foglia senza figli, basta cancellarlo; se ha un solo figlio, sostituisce il nodo con il suo unico figlio; se ha due figli, si cerca il suo successore e si scambia i valori del nodo da cancellare e del successore trovato.
Questi algoritmi sono progettati per mantenere le proprietà del BST, garantendo che l'albero rimanga bilanciato e che le operazioni di ricerca, inserimento e cancellazione siano performanti.

Vedi link 1
Vedi link 2

png

Codici sorgenti: programma inserimento e ricerca.Scarica qui!


/*

  Nome progetto: Alberi binari
  Autore: Alessio Luffarelli
  Web: www.alessioluffarelli.it
  Data: Dicembre 2001

*/

#include <iostream>
#include <stdlib.h>

using namespace std;

struct nodo {
	int DATO; //albero di valori interi
	struct nodo *DX; //puntatore al sottoalbero destro
	struct nodo *SX; //puntatore al sottoalbero sinistro
	}NODO;

typedef struct nodo* tree; //dichiaro un nuovo tipo di dato: l'albero

bool Is_Empty(tree RADICE)
//restituisce TRUE se l'albero è vuoto. altrimenti restituisce FALSE
{
	return(RADICE==NULL); //NB: questo è un confronto (==) non un'assegnazione
}


tree Albero_Vuoto(void)
//costruisce un albero vuoto
{
	return(NULL);
}


int Valore_Etichetta(tree RADICE)
//restituisce il valore (o etichetta) del nodo
{
	if (Is_Empty(RADICE)) abort();
	else return(RADICE->DATO);
}

tree Sinistro(tree RADICE)
//restituisce il puntatore al sottoalbero sinistro
{ 
	if (Is_Empty(RADICE)) return(NULL);
	else return(RADICE->SX);
}

tree Destro(tree RADICE)
//restituisce il puntatore al sottoalbero destro
{ 
	if (Is_Empty(RADICE)) return(NULL);
	else return(RADICE->DX);
}

tree Costruisci_Albero(int ETICHETTA,tree S,tree D)
//costrisce un albero binario non ordinato
{
	tree RADICE;
	RADICE = (nodo *) malloc(sizeof(NODO)); //chiede l'indirizzo di una nuova cella di memoria
	RADICE->DATO = ETICHETTA;
	RADICE->SX = S;
	RADICE->DX = D;
	return (RADICE);
}

void Inorder(tree RADICE)
//stampa inorder dell'albero
{
	if (!(Is_Empty(RADICE))) {
		Inorder(Sinistro(RADICE));
		cout<<Valore_Etichetta(RADICE)<<"  ";
		Inorder(Destro(RADICE));
		}
}


void Preorder(tree RADICE)
//stampa preorder dell'albero
{
	if (!(Is_Empty(RADICE))) {
		cout<<Valore_Etichetta(RADICE)<<"  ";
		Preorder(Sinistro(RADICE));
		Preorder(Destro(RADICE));
		}
}


void Postorder(tree RADICE)
//stampa postorder dell'albero
{
	if (!(Is_Empty(RADICE))) {
		Postorder(Sinistro(RADICE));
		Postorder(Destro(RADICE));
		cout<<Valore_Etichetta(RADICE)<<"  ";
		}
}


int ContaNodi(tree RADICE)
//restituisce il numero dei nodi dell'albero
{
	if(Is_Empty(RADICE)) return(0);
	else return(1 + ContaNodi(Sinistro(RADICE)) + ContaNodi(Destro(RADICE)));
}

int ContaFoglie(tree RADICE)
//restituisce il numero delle foglie dell'albero
{
	if(Is_Empty(RADICE)) 
		return(0);
	else {
		if ((Sinistro(RADICE)==NULL) && (Destro(RADICE)==NULL))
			return(1);
		else return( ContaFoglie(Sinistro(RADICE)) + ContaFoglie(Destro(RADICE)) );
	}
}

bool Perf_Bil(tree RADICE)
//Restituisce TRUE se l'albero è perfettamente bilanciato
{
	if (Is_Empty(RADICE)) return(true);	//Oppure ERROR, secondo la definizione
	else {
		if ((Sinistro(RADICE)==NULL) && (Destro(RADICE)==NULL))	//Praticamente: se il nodo è una foglia..
			return(true);
		else {
			if ((Sinistro(RADICE)!=NULL) && (Destro(RADICE)!=NULL))	//Se il nodo ha tutti e due i figli..
				return( Perf_Bil(Sinistro(RADICE)) && Perf_Bil(Destro(RADICE)) );
			else return(false);
		}
	}
}


bool Ricerca(tree RADICE,int X)
//ricerca il valore X nell'albero puntato da RADICE
{
	if (Is_Empty(RADICE))
		return(false);
	else {
		if (X==Valore_Etichetta(RADICE))
			return(true);
		else
			return(Ricerca(Sinistro(RADICE),X) || Ricerca(Destro(RADICE),X));
	}
}


int Altezza_Nodo(tree N)	//Restituisce l'altezza di un nodo (vedere definizione di altezza)
{
  int ALTD=0,ALTS=0;
	if (Is_Empty(N)) return(-1);
	else {
		ALTS=Altezza_Nodo(Sinistro(N));
		ALTD=Altezza_Nodo(Destro(N));
		if (ALTS>ALTD) return(ALTS+1);
		else return(ALTD+1);
	}
}

tree Ins_Ord(int E,tree RADICE)
//Costruisce un albero binario di ricerca (un albero "ordinato")
{
	if (Is_Empty(RADICE)) {
		RADICE=(tree)malloc(sizeof(NODO)); //chiede l'indirizzo di una cella di memoria libera
		RADICE->DATO=E;
		RADICE->SX=NULL;
		RADICE->DX=NULL;
		return RADICE;
	}
	else {
		if(E<Valore_Etichetta(RADICE)) {
			RADICE->SX=Ins_Ord(E,Sinistro(RADICE));
			return RADICE;
		}
		else {
			RADICE->DX=Ins_Ord(E,Destro(RADICE));
			return RADICE;
		}
	}
}


bool RicercaBinaria(int X,tree RADICE)
//Ricerca dicotomica (o binaria) per alberi binari di ricerca (ordinati)
{
	if (Is_Empty(RADICE)) return(false);
	else {
		if (X==Valore_Etichetta(RADICE)) return(true);
		else {
			if (X < Valore_Etichetta(RADICE))
				return( RicercaBinaria(X,Sinistro(RADICE)) );
			else 
				return( RicercaBinaria(X,Destro(RADICE)) );
		}
	}
}


// -----------------------------------------------
// Inizio del Main
//
// Il programma che segue mostra come applicare le
// funzioni di cui sopra

int main(int argc, char *argv[])
{
    
	tree t1,t2;
    tree t3,t4;
	int X;
	
	t1=Costruisci_Albero(2,Albero_Vuoto(),Albero_Vuoto());
	t2=Costruisci_Albero(1,Albero_Vuoto(),Albero_Vuoto());
	t3=Costruisci_Albero(7,t1,t2);

	t1=Costruisci_Albero(4,Albero_Vuoto(),Albero_Vuoto());
	t2=Costruisci_Albero(9,Albero_Vuoto(),Albero_Vuoto());
	t4=Costruisci_Albero(3,t1,t2);

	t1=Costruisci_Albero(5,t3,t4);
    /*
    In t1 c'è ora l'albero (o meglio, il puntatore all'albero)
    rappresentato qui sotto:


						5(t1)
					/		\

				7				3

				/\				/\

			2		1		4		9(t2)
	*/


	cout<<"\nStampa in Inorder:\n";
	Inorder(t1);

	cout<<"\n\nStampa in Preorder:\n";
	Preorder(t1);

	cout<<"\n\nStampa in Postorder:\n";
	Postorder(t1);

	cout<<"\n\nLa radice dell 'albero e' : "<<Valore_Etichetta(t1)";

	cout<<"\n\nIl numero totale dei nodi dell'albero e' : "<<ContaNodi(t1)";

	cout<<"\n\nIl numero totale delle foglie dell'albero e' : "<<ContaFoglie(t1)";

	cout<<"\n\nQuesto albero ha altezza "<<Altezza_Nodo(t1)<<" ("<<Altezza_Nodo(t1)+1<<" livelli)";

	if (Perf_Bil(t1)) cout<<"\n\nQuesto albero e' perfettamente bilanciato.";
	else cout<<"\n\nQuesto albero non e' perfettamente bilanciato.";

	cout<<"\n\nInserire un valore da cercare nell'albero : ";
	cin>>X;
	if (Ricerca(t1,X)) cout<<"\n\tValore trovato!!";
	else cout<<"\n\tValore non trovato!!";
 

	t1=Albero_Vuoto();
 
	cout<<"\n\n\n*******************************************************************";
	cout<<"\n*********** COSTRUZIONE DI UN ALBERO BINARIO DI RICERCA ***********";
	cout<<"\n*******************************************************************";
	cout<<"\n\n\nInserire tutti gli elementi (per terminare inserire 0)\n";
	
    while (X!=0) {
		cout<<"\tElemento : ";
		cin>>X;
		if (X==0){break;}
		t1=Ins_Ord(X,t1);
	}

	cout<<"\nStampa in Inorder:\n";
	Inorder(t1);

	cout<<"\n\nStampa in Preorder:\n";
	Preorder(t1);

	cout<<"\n\nStampa in Postorder:\n";
	Postorder(t1);

	cout<<"\n\nLa radice e' : "<<Valore_Etichetta(t1);

	cout<<"\n\nIl numero totale dei nodi dell'albero e' : "<<ContaNodi(t1);

	cout<<"\n\nIl numero totale delle foglie dell'albero e' : "<<ContaFoglie(t1);

	cout<<"\n\nQuesto albero ha altezza "<<Altezza_Nodo(t1)<<" ("<<Altezza_Nodo(t1)+1<<" livelli)";

	if (Perf_Bil(t1)) cout<<"\n\nQuesto albero e' perfettamente bilanciato.";
	else cout<<"\n\nQuesto albero NON e' perfettamente bilanciato.";

	cout<<"\n\nInserire un elemento da cercare con la ricerca dicotomica : ";
	cin>>X;

	if (RicercaBinaria(X,t1)) cout<<"\n\tValore trovato!!";
	else cout<<"\n\tValore non trovato!!";

	cout<<"\n\n\n\n\n";
  
  system("PAUSE");	
  return 0;
}

A breve suddividerò questo codice in più files come ho imparato a fare dal testo di Carlo Mazzone:
C e C++ Le chiavi della programmazione Inoltre implementerò il codice per la cancellazione di un elemento inserito in un albero binario.