Arquitetura Multimodal para Sistemas IoT com Tomada de Decisão Baseada em Inteligência Artificial Aplicada à Agricultura de Precisão
Análise de viabilidade técnica de uma arquitetura edge-first para decisão tática local em cenários de operação offline ou conectividade de baixa latência, com validação assíncrona via LLM no backend e comunicação MQTT pub/sub.
O Gargalo da Nuvem em Ambientes Rurais
Sistemas IoT tradicionais dependem de upload contínuo de imagens HD. No campo brasileiro com conectividade 2G intermitente, isso é inviável — e o custo biológico é real.
Uma imagem 4K ≈ 10–25 MB. Numa rede rural 2G (50–100kbps) leva minutos para subir.
Resultado: latência inaceitável, sistema paralisado quando sem rede — tolerância a falhas NULA.
Envia apenas metadados leves (~200 bytes) via MQTT.
Ferrugem-asiática avança 1–2 ha/hora. Cada segundo importa. O edge age antes de qualquer upload.
Loop Percepção–Decisão–Ação
Edge First — Ação Tática Local
O drone opera como um nó de borda cognitivo autônomo. Captura, detecta, decide e age em 16ms — sem internet, sem servidor, sem esperar ninguém.
[Latitude, Longitude, Tipo de Praga, Severidade].① Payload (~200B) enviado imediatamente via MQTT QoS 1
② Imagens HD enviadas quando houver banda
③ UUID + hash SHA-256 associam imagem ao payload
④ YOLO faz auditoria visual assíncrona na nuvem
IoT Legado vs. Farm-LightSeek
| Dimensão | ☁ IoT Tradicional | 🚁 Farm-LightSeek |
|---|---|---|
| Latência de Decisão | Segundos a Minutos | < 16 milissegundos |
| Dependência de Banda | Crítica — Upload HD | Baixa — Metadados textuais |
| Tolerância a Falhas | Nula — Offline = Sem Sistema | Alta — Edge autônomo offline |
| Foco da IA | Visão Genérica | Fusão Multimodal + Raciocínio |
Análise Crítica do Hardware e dos Modelos
AgroLLM — Motor Cognitivo na Nuvem
Enquanto o edge age por reflexo em 16ms, o backend audita, contextualiza e garante conformidade biológica e legal. Pipeline de 6 etapas com YOLO assíncrono.
4 Papers Validados
Alicerces Científicos e Limitações
4 papers peer-reviewed que fundamentam a proposta, a contribuição original e os aspectos de segurança não cobertos pela arquitetura atual.
4 Papers Validados
Limitações Identificadas
① Autenticação dos publishers MQTT (drones) junto ao broker
② Autorização por tópico — cada RPi deve publicar apenas no seu tópico
③ TLS/SSL na comunicação MQTT (porta 8883) e WebSocket (wss://)
④ Controle de acesso ao backend FastAPI (JWT / OAuth2)
⑤ Integridade do payload — o hash SHA-256 já presente é um primeiro passo, mas não substitui assinatura criptográfica
Arquitetura Física: Edge + Broker + Cloud
Servidor centralizado com broker MQTT como middleware pub/sub. Cada RPi autônomo no campo publica eventos. O servidor único processa tudo. Dashboard = cliente WebSocket.
Arquitetura Híbrida em 4 Padrões
Edge → Broker → Cloud → DashboardFluxo unidirecional. Cada camada com responsabilidade clara.
Câmera → CNN → DKPG → Mapa → AçãoEdge: constraints hard-coded no hardware
Cloud: DKPL valida e YOLO audita visualmente
Componentes por Camada
drone / dashboard
tópico · broker · QoS
conexão · ordem · ACK
agro/perception/detected.
MQTT · QoS · Janela In-Flight
Wi-Fi → TCP → MQTT · várias mensagens em voo · 1 PUBACK por packetId · Fundamentação: HiveMQ MQTT Essentials · EMQX Docs · EMQ QoS Guide
pub/sub · QoS · broker
conexão · ordem · ACK
window=3
envia PUBACK
DUP=true.Ex:
{"id":"missao-2026-06-setor-norte-001","temp":28.4,"ts":1717500000,"hash":"sha256..."}No Farm-LightSeek: MQTT QoS 1 no trecho drone→broker · WebSocket no trecho broker→dashboard.
"No MQTT, as mensagens trafegam sobre TCP. Por isso, a ordenação dos segmentos e a confiabilidade básica ficam a cargo do TCP. O MQTT controla a entrega no nível da aplicação, usando tópicos, broker e níveis de QoS."