Filas de Prioridade
Igor Machado Coelho
14/10/2020 - rev. 26/08/2021
São requisitos para essa aula:
A Fila de Prioridade (do inglês Priority Queue) é um Tipo Abstrato de Dado (TAD) que opera de forma similar a uma Fila.
Lembramos que o TAD Fila tem comportamento FIFO (first-in first-out), onde o elemento de maior prioridade para sair da fila é o elemento que entrou primeiro na fila.
O conceito de prioridade é explicitado nas Filas de Prioridade através de um valor numérico. Nesse caso, a lógica de prioridade pode operar pelo menor ou pelo maior valor, dependendo da aplicação.
Filas de Prioridade são estruturas fundamentais na própria computação. Também são úteis na implementações de algoritmos em grafos, como a busca por árvores geradoras mínimas (aulas futuras).
Por exemplo, quando se envia pacotes de dados a roteadores, existem mecanismos que podem tirar vantagem de valores de prioridade entre pacotes (dados de voz e de download, etc). Uma interpretação cotidiana poderia ser uma fila prioritária por idade, na qual os indivíduos mais velhos seriam sempre atendidos antes dos mais novos.
Uma Fila de Prioridade é uma estrutura de dados com uma direção pre-definida (vamos assumir maior prioridade para o menor valor), consistindo de 3 operações básicas:
As operações trabalham com chaves numéricas e, opcionalmente, um conteúdo atrelado a cada chave. Outra operação comum no TAD, embora considerada uma operação interna, é a de redução de chave (decrease key).
A implementação do TAD Fila de Prioridade geralmente se dá através de uma implementação de árvores de prioridade denominada heap binário. O heap (ou min heap) é uma árvore binária completa com a seguinte propriedade:
O conceito de fila de prioridade somente requer suas três operações básicas. Como consideramos uma fila de prioridade genérica (fila de inteiro, char, etc), definimos um conceito genérico chamado FilaPrioridadeTAD
:
template<typename Agregado, typename Tipo>
concept bool
FilaPrioridadeTAD = requires(Agregado a, Tipo t)
{
// requer operação 'frente' mais prioritária
{ a.frente() };
// requer operação 'insere' sobre tipo 't'
{ a.insere(t) };
// requer operação 'remove' mais prioritário
{ a.remove() };
};
Note que o tipo genérico pode ser estendido para comportar um elemento interno, além da chave numérica.
Antes de completar as funções, utilizaremos o FilaPrioridadeTAD
:
int main () {
FilaPrioridadeTAD h = // ... inicializa tipo
// h.cria();
h.insere(20);
h.insere(10);
h.insere(30);
printf("%c\n", h.frente());
printf("%c\n", h.remove());
h.insere(25);
while(p.N > 0)
printf("%c\n", h.remove());
// h.libera();
return 0;
}
Verifique as impressões em tela: 10 10 20 25 30
Apesar de sua estrutura de árvore, podemos representá-la eficientemente com um vetor, numa implementação puramente sequencial.
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Assim, os dados sempre estarão em um espaço contíguo de memória.
A operação frente
retorna o elemento mais prioritário do heap. Felizmente, ele sempre será a raiz da árvore!
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Desafio: verifique se é possível o elemento mais prioritário não estar na raiz do heap.
A operação insere
em adiciona um novo elemento de acordo com sua prioridade. Como manter a corretude das propriedades do heap?
Exemplo: como inserir o elemento 5?
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Para manter a corretude das propriedades do heap, em especial, de uma árvore completa, adicionamos o elemento na última posição do vetor.
Exemplo: como inserir o elemento 5?
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Como corrigir a árvore? Solução: trocas sucessivas subindo até a raiz.
|3| 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |5|
|3| 10 | 7 | 11 | 19 | *5 | 8 | 14 | 12 | 22 | 30 | 44 |*35|
|3| 10 | *5 | 11 | 19 | *7 | 8 | 14 | 12 | 22 | 30 | 44 |*35|
A operação remove
em adiciona um novo elemento de acordo com sua prioridade. Como manter a corretude das propriedades do heap?
Exemplo: como remover o elemento 3?
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Para manter a corretude das propriedades do heap, em especial, de uma árvore completa, trocamos o primeiro com o último elemento do vetor.
Exemplo: como remover o elemento 3?
Representação por níveis (árvore completa):
| 3 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
Como corrigir a árvore? Solução: trocas sucessivas descendo até uma folha.
| 44 | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 3 |
| *7 | 10 | *44 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 3 |
| *7 | 10 | *8 | 11 | 19 | 35 | *44 | 14 | 12 | 22 | 30 | 3 |
| *7 | 10 | *8 | 11 | 19 | 35 | *44 | 14 | 12 | 22 | 30 | x |
Aula: Fila de Prioridade - Parte II
Prof. Igor Machado Coelho
https://github.com/igormcoelho/curso-estruturas-de-dados-i
Revisão 26/08/2021
Consideraremos uma fila sequencial com, no máximo, MAXN
elementos do tipo caractere.
constexpr int MAX_N = 50; // capacidade máxima da fila
class Heap1
{
public:
int elementos [MAX_N]; // elementos na fila
int N; // num. de elementos na fila
void cria () { ... } // inicializa agregado
void libera () { ... } // finaliza agregado
int frente () { ... }
void insere (int chave){ ... }
int remove () { ... }
};
// verifica se agregado Heap1 satisfaz conceito FilaPrioridadeTAD
static_assert(FilaPrioridadeTAD<Heap1, int>);
A operação cria
inicializa a fila para uso, e a função libera
desaloca os recursos dinâmicos.
A operação frente
retorna a raiz do heap, ou seja, o primeiro elemento. Este é sempre o mais prioritário.
Representação por níveis (árvore completa):
| 3* | 10 | 7 | 11 | 19 | 35 | 8 | 14 | 12 | 22 | 30 | 44 |
pai
e filho
Métodos auxiliares pai
e filho
.
A operação sobe
compara sistematicamente um nó com seu pai, efetuando trocas enquanto a prioridade estiver incorreta. Custo: proporcional ao nível.
Representação por níveis:
| 3 | 10 | 7 | 11 | 19 | 35 | ...
| 8 | 14 | 12 | 22 | 30 | 44 |
O método insere
coloca o novo elemento no final do heap e invoca a operação sobe
. Custo: altura da árvore.
A operação desce
compara um nó com seus filhos, trocando enquanto a prioridade for incorreta. Custo: proporcional ao nível.
Representação por níveis:
| 3 | 10 | 7 | 11 | 19 | 35 | ...
| 8 | 14 | 12 | 22 | 30 | 44 |
O método remove
troca o primeiro com último elemento e invoca a operação desce
. Custo: altura da árvore.
A construção de um heap através de um vetor é chamada de heapify. É possível efetuar a construção de forma iterativa, através dos métodos sobe ou desce.
Como vimos anteriormente, o método sobe custa, no máximo, o nível do nó, enquanto o método desce custa, no máximo, a altura do nó.
Veja as alturas dos nós (N=23): vermelho(5), azul(4), roxo(3), amarelo(2), verde(1). Metade dos nós (12) tem altura 1.
A construção do heap (N=31) com o método sobe opera sequencialmente a partir dos nós 1,2,3,4..., e a raiz não efetua nenhuma troca. Cada elemento folha (\approx N/2) irá incorrer em O(h=\lceil lg\;N \rceil) trocas, no pior caso, tendo assim complexidade O(N\;lg\;N).
nós: | 0 | 1 | 2 | 3 | 4 | ... ->
A construção do heap (N=31) com o método desce toma vantagem de que as folhas (\approx N/2) tem altura 1, portanto não necessitando de troca alguma. O método opera sequencialmente em ordem decrescente a partir do nó \lfloor N/2 \rfloor -1=14 como 14,13,12,11,10,.... Note que um único elemento (a raiz) irá incorrer em O(h=\lceil lg\;N \rceil) trocas, sendo a complexidade O(N\;lg\;N) superestimada neste caso.
nós: | 0 | 1 | ... <- | 10 | 11 | 12 | 13 | 14 | ...
Consideramos uma árvore com N nós e h=\lceil lg\;N\rceil níveis. No nível 1, um único nó (a raiz) efetua h-1 trocas, no pior caso. Por outro lado, existem 2^{h-1} folhas que não fazem nenhuma troca.
De forma geral, no nível i, cada um dos 2^{i-1} nós efetuam h-i trocas, no pior caso, totalizando \sum_{i=1}^{h-1}\left(2^{i-1} (h-i)\right) trocas.
Temos que \sum_{i=1}^{h-1}\left(2^{i-1} (h-i)\right) = 2^h - (h+1), dado que \sum_{i=0}^m 2^i = 2^{m+1}-1. Desmembramos em cada linha i abaixo as h-i ocorrências de 2^{i-1}, de i=1 até h-1. Efetuamos então uma soma por colunas.
\begin{matrix} \\ i=1: \\ i=2: \\ i=3: \\ i=4: \\ i: \\ i=h-2: \\ i=h-1: \\ \\ \\ \end{matrix} \overbrace{ \begin{matrix} & 1 & + & 1 & + \cdots + & 1 & + & 1 & + & 1 & + & 1 & \\ + & 2 & + & 2 & + \cdots + & 2 & + & 2 & + & 2 \\ + & 4 & + & 4 & + \cdots + & 4 & + & 4 \\ + & 8 & + & 8 & + \cdots + & 8 \\ + & \cdots & + & \cdots & + \cdots \\ + & 2^{h-3} & + & 2^{h-3}\\ + & 2^{h-2} & + \\ = & \sum_{i=0}^{h-2}2^i & + & \sum_{i=0}^{h-3}2^i & + \cdots + & \sum_{i=0}^{3}2^i & + & \sum_{i=0}^{2}2^i & + & \sum_{i=0}^{1}2^i & + & \sum_{i=0}^{0}2^i \\ \end{matrix} }^{H-1}
\begin{matrix} =& (2^{h-1}-1) + (2^{h-2}-1) &+ \cdots +& (2^3-1) + (2^2-1) + (2^1-1)\\ =& 2^{h-1} + 2^{h-2} &+ \cdots +& 2^3 + 2^2 + 2^1 - (h-1)\\ =& \sum_{i=0}^{h-1} 2^i - h &=& 2^h - (h+1) \qed \end{matrix}
Temos então que o total de trocas do heapify é 2^h -(h+1), e considerando uma altura h=\lceil lg\;N \rceil=O(lg\;N), temos:
2^{O(lg\;N)} - (O(lg\;N) + 1) = O(N)
Na prática, para N=31 e, portanto, h=5, temos: 8\times 1 +4\times 2+ 2\times 3 + 1 \times 4 = 26 trocas.
Veja código em materiais
.
Agradecimentos ao Prof. Fabiano Oliveira, pelo embasamento dessa prova.
Além da bibliografia do curso, recomendamos para esse tópico:
Em especial, agradeço aos colegas que elaboraram bons materiais, como o prof. Fabiano Oliveira (IME-UERJ), e o prof. Jayme Szwarcfiter cujos conceitos formam o cerne desses slides.
Estendo os agradecimentos aos demais colegas que colaboraram com a elaboração do material do curso de Pesquisa Operacional, que abriu caminho para verificação prática dessa tecnologia de slides.
Esse material de curso só é possível graças aos inúmeros projetos de código-aberto que são necessários a ele, incluindo:
Agradecimento especial a empresas que suportam projetos livres envolvidos nesse curso:
Esses slides foram escritos utilizando pandoc, segundo o tutorial ilectures:
Exceto expressamente mencionado (com as devidas ressalvas ao material cedido por colegas), a licença será Creative Commons.
Licença: CC-BY 4.0 2020
Igor Machado Coelho