Resumo Executivo
- Objetivo: Coletar e rankear eventos externos dos ultimos 14 dias (25/mar—8/abr) para alimentar o Horizon Brief #002 (deadline 14/abr).
- Resultado: 25+ eventos coletados via 4 agentes paralelos, filtrados para 8 por mecanismo de impacto e decisao habilitada.
- Correcao adversarial (3 rounds): GPT-5.5 rebaixado de Tier 1 para Tier 3 (especulacao nao e equivalente a evento confirmado). CGU promovida para Tier 1. Confianca (CONFIRMADO/ACADEMICO/ESPECULATIVO) adicionada a cada evento.
1. Alvo da Pesquisa
| Acao Anterior | O que Trouxe | Conexao com Este Trabalho |
|---|---|---|
| Horizon Brief #001 (7/abr) | 4 sinais (TurboQuant, Flash-Lite, CNIAJ+PL2338, open-weight MoE) | Base: o que ja foi coberto. Vies identificado: 4 sinais de custo, 0 de qualidade |
| Strategy triagem dia 2 (8/abr) | 3 propostas pendentes, 4 prioridades ajustadas | Priority #4: HB#002 em 6 dias |
| Research governanca TCU (8/abr) | Framework real: 4 instrumentos, gap PL 2338 | Gap PL 2338 = evento candidato, nao tema central |
| Discovery quality stack (8/abr) | HalluGraph, RRPO, Contextual RAG | Vies #001 requer ao menos 1 sinal de qualidade |
Problema: O Horizon Brief #002 tem deadline em 14/abr e precisa de 3-5 eventos externos que o time nao descobriria sozinho. O Brief #001 foi criticado por vies de custo-reducao (4 sinais sobre 'como pagar menos', nenhum sobre 'como fazer melhor'). Este beat faz o harvest sistematico de candidatos.
Metodo: 4 agentes de pesquisa em paralelo cobrindo: (1) model releases e pricing, (2) regulacao de IA no Brasil, (3) legal AI e qualidade, (4) instituicoes de auditoria pares. Cada agente usou WebSearch com 4-5 queries direcionadas. Resultados filtrados pelo teste 'que decisao isso habilita?' em vez de apenas 'o operador descobriria sozinho?'.
Classificacao de como um evento afeta AssertIA: competitivo (muda paisagem), custo (muda economics), governanca (muda compliance), qualidade (muda medicao), ecossistema (muda parceiros).
O teste real de valor de um sinal: 'se o time souber disso, que decisao pode tomar que antes nao podia?'. Sinal sem decisao habilitada = ruido intelectual.
2. Tier 1 — Eventos que Forcam Decisao
2.1 IAJus 2026 — Sinapses 2.0 + Pesquisa IA Generativa (24/abr)
O CNIAJ (CNJ) agendou para 24 de abril em Brasilia o IAJus 2026: lancamento do Sinapses 2.0, edital de chamamento publico de solucoes de IA, e 2a pesquisa sobre IA generativa no Judiciario. Paineis sobre triagem, automacao, pesquisa juridica e aplicacoes institucionais.
- Time desconhece Sinapses 2.0 e suas capacidades
- Pesquisa de adocao de IA gen no Judiciario nao informaria posicionamento
- Edital de chamamento passaria despercebido
- Time monitora IAJus e adapta narrativa do AssertIA ao novo contexto
- Dados empiricos de adocao informam strategy
- Chamamento publico pode ser oportunidade de procurement
2.2 II ENIATC — Ecossistema de IA nos TCs consolida [CONFIRMADO]
2o Encontro Nacional de IA dos Tribunais de Contas (30-31/mar, BH). 4 solucoes em operacao (IAGO, ANIA, PLATAO, ADELIA). TCE-BA com RAG documental, TCE-PE com geracao de votos, TCE-MG com fiscalizacao de editais. Desafios comuns: confiabilidade, dados sensiveis, capacitacao.
| TC | Solucao | Funcionalidade | Overlap c/ AssertIA? |
|---|---|---|---|
| TCE-BA | Raio-X (TiCianE) | RAG documental, resumos, Q&A | ALTO |
| TCE-PE | — | Geracao assistida de votos | MEDIO |
| TCE-MG | Piloto | Fiscalizacao de editais de concurso | BAIXO |
| TCE-ES | Chat inteligente | Chat sobre processo eletronico | MEDIO |
| TCDF | — | Automacao de ementas | MEDIO |
| TCU | AssertIA | Apoio a instrucao processual | — |
2.3 CGU: BIP + Fala.BR + ALICE em Escala [CONFIRMADO]
CGU lancou BIP (busca de precedentes, 7/abr) e IA no Fala.BR (classificacao automatica de 1.4M manifestacoes, 6/abr). ALICE suportou 388 de 600+ auditorias em 2025, emitindo 35 mil alertas de risco. LAION (out/2025) atende 320+ orgaos com 4 modulos de IA.
| Ferramenta CGU | Funcao | Escala | Overlap c/ AssertIA |
|---|---|---|---|
| ALICE | Analise de risco em licitacoes | 35k alertas, 388 auditorias/ano | Baixo (dominio diferente) |
| BIP | Busca de precedentes (conflito de interesse) | Novo (abr/2026) | ALTO (busca de precedentes) |
| Fala.BR IA | Classificacao de manifestacoes | 1.4M registros/ano | Medio (classificacao textual) |
| LAION | Sumarizacao, similaridade, NER, recomendacao | 320+ orgaos | Medio (sumarizacao) |
3. Tier 2 — Eventos que Habilitam Capacidade
3.1 NAO AI Auditing Catalogue [CONFIRMADO]
O NAO (UK), em parceria com orgaos de auditoria do Brasil, Finlandia, Alemanha, Noruega e Holanda, lancou catalogo pratico para auditoria de IA. 6 dominios: governanca, qualidade de dados, desenvolvimento, avaliacao pre-deploy, controle de mudancas, monitoramento. Disponivel em auditingalgorithms.net.
Checklist pratico de 6 dominios para auditar sistemas de IA em operacao. Co-produzido por 6 paises (incluindo Brasil). Disponivel em auditingalgorithms.net.
Direta e de custo zero. O TCU pode adotar como referencia para auditorias de IA em orgaos federais. Acao concreta: baixar catalogo, mapear contra Res 303/2018 + Portaria Setid 2/2023.
3.2 LRAGE — Avaliacao de Legal RAG Open-Source [ACADEMICO]
Framework open-source (arXiv, 2/abr) para avaliacao holistica de legal RAG: 5 componentes (corpora, retrieval, rerankers, LLM, metricas). Suporta benchmarks multilingue (KBL, LegalBench, LawBench). GUI + CLI. Isola retrieval vs generation — exatamente o que o AssertIA precisa para diagnosticar tipos de erro.
Input:
Pipeline AssertIA (embedding + retrieval + reranker + GPT-4.1 + metricas)
Diagnostico:
Score por componente: retrieval=0.72, reranker=0.85, generation=0.91, overall=0.79. Bottleneck: retrieval
lrage evaluate --corpus tcu-jurisprudencia --pipeline assertia.yaml --metrics faithfulness,relevance,citation_accuracy
4. Tier 3 — Contexto e Especulacao
Sam Altman confirmou pretraining completo. Prediction markets: >90% ate junho. Data e pricing nao confirmados. Relevante para vendor lock-in (88% GPT-4.1) mas nao acionavel ate release oficial. Movido de Tier 1 para Tier 3 apos adversarial: colocar especulacao ao lado de eventos confirmados e falsa equivalencia.
GAO constatou (24/mar) que inventario de IA do IRS esta incompleto e falta plano de forca de trabalho. Gaps de privacidade na orientacao federal sobre IA (26/mar). Referencia comparativa para auditorias de IA pelo TCU.
Modelo de 1T parametros no OpenRouter desde 11/mar com evidencia de ser DeepSeek V4 em teste. Se confirmado, choque open-weight. Nao acionavel.
Dados complementares: 45.8% dos tribunais brasileiros ja usam IA generativa (Conjur, 5/abr). India CAG desenvolve LLM soberano treinado em relatorios historicos. Claude Mythos Preview (SWE-bench 93.9%) lancado 7-8/abr mas nao GA. Preco medio de IA caiu 93% desde 2024.
5. Recomendacoes para o Horizon Brief #002
Com base no harvest e no adversarial, a recomendacao para o Brief #002 e:
Os 5 eventos dos Tiers 1 e 2 (IAJus, ENIATC, CGU, NAO, LRAGE) ja tem formato FATO/CONEXAO/RECOMENDACAO/CUSTO DA INACAO. Todos exceto LRAGE sao confirmados por fontes institucionais. LRAGE entra com caveat explicito.
- 4 sinais, todos sobre custo
- Nenhum sobre qualidade
- Foco em model releases
- 5 sinais: competitivo (2), custo (1), qualidade (1), governanca/ecossistema (1)
- LRAGE + II ENIATC equilibram o mix
- Foco em decisoes, nao em novidades
O brief precisa de 1 dia de adversarial review e ajustes. Target: draft ate 12/abr, publicacao 14/abr.
O Brief #002 deve abrir com atualizacao dos sinais do #001: Flash-Lite continua em Preview? Open-weight models tiveram nova release? PL 2338 teve votacao? Continuidade e tao importante quanto novidade.
6. O Que Nao Sei
| # | Gap | O que preciso saber | Status |
|---|---|---|---|
| G1 | Nenhum dos 8 eventos tem validacao empirica de impacto causal para AssertIA | Historico: eventos similares geraram mudanca de pipeline, contrato, regulacao? | OPEN |
| G2 | Taxa de adocao real das ferramentas de IA nos TCs pos-ENIATC | Follow-up: quantos TCs realmente implementaram as solucoes apresentadas? | OPEN |
| G3 | Qualidade do LRAGE em portugues juridico brasileiro | Teste: rodar LRAGE com corpus de jurisprudencia do TCU | OPEN |
| G4 | Conteudo especifico do Sinapses 2.0 vs Sinapses 1.x | Aguardar lancamento em 24/abr | OPEN |
| G5 | GPT-5.5 pricing e capability real | Aguardar anuncio oficial | OPEN |
7. Contextualizacao e Glossario
Este harvest alimenta o Horizon Brief #002, segunda entrega do ciclo de scanning de horizonte do drucker para o AssertIA. Destinado a equipe de estrategia e ao operador. Conhecimento previo util: Brief #001, strategy triagem dia 2, e o framework de governanca de IA do TCU.
- IAJus
- Encontro de Integracao em IA do Judiciario, organizado pelo CNIAJ (CNJ).
- CNIAJ
- Comite Nacional de Inteligencia Artificial do Judiciario (CNJ). Fiscaliza e normatiza IA judicial.
- Sinapses
- Plataforma do CNJ para IA judicial. Versao 2.0 sera lancada em 24/abr.
- ENIATC
- Encontro Nacional de IA dos Tribunais de Contas. Organizado por Atricon.
- LRAGE
- Legal Retrieval Augmented Generation Evaluation. Framework open-source para medir qualidade de pipelines de legal RAG.
- NAO
- National Audit Office (UK). Equivalente britanico ao TCU.
- BIP
- Buscador Inteligente de Precedentes. Ferramenta da CGU para busca de precedentes em conflitos de interesse.
- ALICE
- Ferramenta de IA da CGU para analise de risco em licitacoes e contratos publicos.
- Mecanismo de Impacto
- Classificacao de como um evento externo afeta operacoes: competitivo, custo, governanca, qualidade, ecossistema.
Referencias
- CNJ — IAJus 2026: Encontro de Integracao em IA do Judiciario https://www.cnj.jus.br/agendas/iajus-2026-encontro-de-integracao-em-inteligencia-artificial-do-judiciario/ WebSearch
- NAO — AI Auditing Catalogue and Helper Tool https://www.nao.org.uk/insights/ai-auditing-tool/ WebSearch
- Atricon — II ENIATC consolida agenda de IA nos Tribunais de Contas https://atricon.org.br/ii-eniatc-consolida-agenda-nacional-de-inteligencia-artificial-nos-tribunais-de-contas/ WebSearch
- arXiv — LRAGE: Legal Retrieval Augmented Generation Evaluation Tool https://arxiv.org/abs/2504.01840 WebSearch
- CGU — BIP: Buscador Inteligente de Precedentes https://www.pontaporainforma.com.br/cgu-lanca-buscador-inteligente-de-precedentes-para-agilizar-analise-de-conflitos-de-interesses/ WebSearch
- CGU — Fala.BR com IA para classificacao automatica https://www.gov.br/cgu/pt-br/assuntos/noticias/2026/04/fala-br-ganha-novo-formato-e-passa-a-usar-inteligencia-artificial-para-simplificar-atendimento-ao-cidadao WebSearch
- Agencia Gov — Ministro da CGU destaca ALICE https://agenciagov.ebc.com.br/noticias/202602/ministro-da-cgu-ressalta-uso-de-ia-no-combate-a-corrupcao-e-na-prevencao-do-desperdicio-de-recursos-publicos WebSearch
- GAO — IRS Artificial Intelligence (GAO-26-107522) https://www.gao.gov/products/gao-26-107522 WebSearch
- GAO — Privacy Gaps in AI Guidance (GAO-26-107681) https://www.gao.gov/products/gao-26-107681 WebSearch
- Conjur — IA e automacao decisoria nos processos administrativos https://www.conjur.com.br/2026-abr-05/inteligencia-artificial-e-automacao-decisoria-nos-processos-administrativos/ WebSearch
- TCE-MG — II ENIATC: aplicacoes de IA nos TCs https://www.tce.mg.gov.br/noticia/Detalhe/1111628722 WebSearch
- India CAG — AI Impact Summit and CAG-LLM roadmap https://www.business-standard.com/technology/tech-news/cag-bets-on-ai-cyber-audits-and-sovereign-llm-to-enhance-public-scrutiny-126021601209_1.html WebSearch
- CNJ — Resolucao 615/2025 https://atos.cnj.jus.br/atos/detalhar/6001 WebSearch
- EU AI Act — Annex III High-Risk Systems https://artificialintelligenceact.eu/annex/3/ WebSearch
- Panstag — GPT-5.5 Spud release date and features https://www.panstag.com/2026/04/gpt-5.5-release-date-features-.html WebSearch
- auditingalgorithms.net — NAO/international AI auditing tool https://www.auditingalgorithms.net/ WebSearch