O que é a Distância de Manhattan?
A Distância de Manhattan, também conhecida como distância L1 ou "distância do táxi", mede o caminho entre dois pontos como se você só pudesse se mover em ângulos retos. Imagine andar pelos quarteirões de uma cidade como Manhattan: você não pode cortar caminho pelas diagonais, precisa seguir as ruas.
Diferente da Distância Euclidiana (a linha reta), a Distância de Manhattan é a soma das diferenças absolutas das coordenadas. É a distância total que você percorreria se andasse apenas para o norte/sul e depois para o leste/oeste para chegar de um ponto a outro.
💡 Fórmula e Seus Componentes
A fórmula da Distância de Manhattan é uma soma simples das distâncias em cada eixo.
Fórmula em 2 Dimensões
Para dois pontos P = (x₁, y₁) e Q = (x₂, y₂):
Fórmula Geral (n-dimensões)
Para vetores P e Q em um espaço de n dimensões:
A fórmula simplesmente soma as diferenças absolutas das coordenadas em todas as dimensões.
🔑 Propriedades Fundamentais
A Distância de Manhattan é uma métrica robusta e bem definida, com propriedades matemáticas importantes.
-
1. Métrica Verdadeira
Ela satisfaz todas as condições de uma métrica formal: é não-negativa, simétrica (a distância de P a Q é a mesma que de Q a P) e obedece à desigualdade triangular.
-
2. Robustez a Outliers
Como não eleva as diferenças ao quadrado (ao contrário da Euclidiana), uma grande diferença em uma única dimensão tem um impacto menos desproporcional. Isso pode torná-la mais robusta a outliers em alguns contextos de machine learning.
-
3. Rotação Variante
Ao contrário da Distância Euclidiana, a Distância de Manhattan é sensível à rotação dos eixos coordenados. Se você girar o sistema de eixos, a distância entre os mesmos dois pontos mudará.
🎯 Aplicações no Mundo Real
A Distância de Manhattan é preferida em cenários onde os caminhos são restritos a uma grade ou quando as diferenças dimensionais são tratadas de forma independente.
🧠 Machine Learning
É frequentemente usada em dados de alta dimensão, onde a Distância Euclidiana pode se tornar menos útil (a "maldição da dimensionalidade"). É a base para a regularização L1 (Lasso), que ajuda a criar modelos mais simples e a selecionar características.
🖥️ Processamento de Imagens
Pode ser usada para comparar blocos de pixels ou histogramas, onde a soma das diferenças absolutas em cada canal de cor ou bin do histograma é uma medida de dissimilaridade útil.
🚗 Robótica e Logística
Ideal para calcular rotas em ambientes de grade, como o layout de um armazém onde um robô se move ao longo de corredores ou em planejamento de rotas em mapas de cidades.
🧬 Bioinformática
Utilizada na análise de dados de expressão gênica, onde pode ser usada para medir a diferença no nível de expressão de múltiplos genes entre duas amostras.
🔬 Calculadora Interativa
Insira as coordenadas de dois pontos para visualizar o caminho de Manhattan e ver a distância calculada. Observe como a distância é a soma dos comprimentos dos segmentos horizontal e vertical.
Ponto 1 (x₁, y₁)
Ponto 2 (x₂, y₂)
Distância de Manhattan:
N/A
O caminho tracejado mostra uma das rotas possíveis.