Dicionários e Árvores de Busca
Igor Machado Coelho
05/10/2020
São requisitos para essa aula:
Agradecimentos especiais ao prof. Fabiano Oliveira e prof. Fábio Protti, cujo conteúdo didático forma a base desses slides
O Dicionário (do inglês Dictionary) ou Mapa (do inglês Map) é um Tipo Abstrato de Dado (TAD) que visa oferecer operações de chave-valor. Também é conhecido como mapeamento.
Supondo um mapeamento M do tipo caractere para inteiro, por exemplo:
M:
B -> 120
C -> 150
...
Dicionários são estruturas fundamentais na própria computação.
Por exemplo, algumas linguagens de programação (como Python) oferecem suporte nativo a dicionários:
Assim como arrays, servem para armazenar um conjunto de dados de certo tipo (estrutura homogênea). Uma diferença em relação a vetores, é que permitem indexação da chave de busca por tipos arbitrários.
Um Dicionário requer 3 operações básicas:
O conceito de dicionário somente requer suas três operações
básicas. Como consideramos um dicionário genérico (mapa de
inteiro, char, etc), definimos um conceito genérico chamado
DicionarioTAD
(note que precisamos de dois tipos
genéricos, para chave e valor):
char
para int
DicionarioCI
Adiciona pares chave-valor ('A', 100)
e
('B', 200)
. Depois faz consultas e remove chave
'B'
.
Existem duas formas eficientes de implementação de dicionários:
Consideramos o Problema da Busca em que, dados:
Responda: x pertence a S?
Em caso positivo, encontrar si tal que si = x.
Desafio: Como organizar os dados de forma a facilitar a operação de busca?
Podemos utilizar uma Árvore Binária rotulada T, tal que:
T é uma Árvore Binária de Busca (ABB)
Relembrando (aula de Árvores) a estrutura de árvore binária considerada:
Podemos resolver o Problema da Busca, com chave de busca c, através de uma ABB.
Ideia Geral:
v->chave == c
c < v->chave
: refaça o algoritmo na subárvore
esquerdac > v->chave
: refaça o algoritmo na subárvore
direitaAvalie se as árvores abaixo são árvores binárias de busca:
Solução: nenhuma delas é! Erros: 24 < 15, 19 > 21, 4 < 3 e 5 < 4
buscaABB
Implementação da busca em árvores binárias de busca:
std::optional<char> buscaABB(auto* no, char c) {
if(!no)
return std::nullopt; // chave não encontrada
if(no->chave == c)
return std::make_optional(c); // chave encontrada
if(c < no->chave)
return buscaABB(no->esq, c); // recursão esquerda
else
return buscaABB(no->dir, c); // recursão direita
}
Pergunta: Quantos chamadas recursivas esse algoritmo pode precisar?
Resposta: Em uma árvore degenerada com N nós, até N passos (observe que, nesse caso, N também é a altura da árvore)
Encontre o pior caso (pior chave de busca) para a
execução do algoritmo buscaABB
nas quatro árvores abaixo
(avalie primeiro se são ou não árvores binárias de busca):
Solução: 1. N/A, 2. N/A, 3. E, 4. N/A
Como a buscaABB
depende a altura da árvore, qual o
melhor caso possível para a busca (menor altura possível) em uma árvore
binária com N nós?
Relembrando: uma árvore binária completa (ou cheia/perfeita) possui ⌈log2(N+1)⌉ níveis. Verifique essa afirmação:
Solução: 1. N/A, 2. N/A, 3. N/A, 4. N = 7 e log28 = 3
Um tipo importante de Árvore Binária de Busca é a balanceada, que resolve o problema de degeneração da árvore pelo controle de sua altura.
Tal controle é conseguido pelo cálculo de um fator de balanceamento (FB) para cada nó, definido por: altura do filho esquerdo - altura do filho direito. Observe que se o filho não existe, então sua altura será 0 (zero).
Calcule o fator de balanceamento da raiz das quatro árvores abaixo e informe se estão balanceadas:
Solução: 1. 1 − 3 = − 2 (não), 2. 0 − 3 = − 3 (não), 3. 3 − 0 = 3 (não), 4. 2 − 2 = 0 (sim)
Além da bibliografia do curso, recomendamos para esse tópico:
Em especial, agradeço aos colegas que elaboraram bons materiais, como o prof. Fabiano Oliveira (IME-UERJ), e o prof. Jayme Szwarcfiter cujos conceitos formam o cerne desses slides.
Estendo os agradecimentos aos demais colegas que colaboraram com a elaboração do material do curso de Pesquisa Operacional, que abriu caminho para verificação prática dessa tecnologia de slides.
Esse material de curso só é possível graças aos inúmeros projetos de código-aberto que são necessários a ele, incluindo:
Agradecimento especial a empresas que suportam projetos livres envolvidos nesse curso:
Esses slides foram escritos utilizando pandoc, segundo o tutorial ilectures:
Exceto expressamente mencionado (com as devidas ressalvas ao material cedido por colegas), a licença será Creative Commons.
Licença: CC-BY 4.0 2020
Igor Machado Coelho