Research: Harvest de Eventos Externos para Horizon Brief #002

8 eventos em 14 dias, rankeados por mecanismo de impacto

Resumo Executivo

8
Eventos selecionados
25+
Eventos coletados
4
Dominios escaneados
3
Tiers de impacto
16d
Ate IAJus 2026

1. Alvo da Pesquisa

Acao Anterior O que Trouxe Conexao com Este Trabalho
Horizon Brief #001 (7/abr) 4 sinais (TurboQuant, Flash-Lite, CNIAJ+PL2338, open-weight MoE) Base: o que ja foi coberto. Vies identificado: 4 sinais de custo, 0 de qualidade
Strategy triagem dia 2 (8/abr) 3 propostas pendentes, 4 prioridades ajustadas Priority #4: HB#002 em 6 dias
Research governanca TCU (8/abr) Framework real: 4 instrumentos, gap PL 2338 Gap PL 2338 = evento candidato, nao tema central
Discovery quality stack (8/abr) HalluGraph, RRPO, Contextual RAG Vies #001 requer ao menos 1 sinal de qualidade

Problema: O Horizon Brief #002 tem deadline em 14/abr e precisa de 3-5 eventos externos que o time nao descobriria sozinho. O Brief #001 foi criticado por vies de custo-reducao (4 sinais sobre 'como pagar menos', nenhum sobre 'como fazer melhor'). Este beat faz o harvest sistematico de candidatos.

Metodo: 4 agentes de pesquisa em paralelo cobrindo: (1) model releases e pricing, (2) regulacao de IA no Brasil, (3) legal AI e qualidade, (4) instituicoes de auditoria pares. Cada agente usou WebSearch com 4-5 queries direcionadas. Resultados filtrados pelo teste 'que decisao isso habilita?' em vez de apenas 'o operador descobriria sozinho?'.

Mecanismo de Impacto
Classificacao de como um evento afeta AssertIA: competitivo (muda paisagem), custo (muda economics), governanca (muda compliance), qualidade (muda medicao), ecossistema (muda parceiros).
Decisao Habilitada
O teste real de valor de um sinal: 'se o time souber disso, que decisao pode tomar que antes nao podia?'. Sinal sem decisao habilitada = ruido intelectual.

2. Tier 1 — Eventos que Forcam Decisao

Estes 3 eventos tem timing critico e impacto competitivo direto. Todos sao confirmados por fontes institucionais (CNJ, Atricon/TCE-MG, CGU). Acao: monitorar e preparar posicionamento.

2.1 IAJus 2026 — Sinapses 2.0 + Pesquisa IA Generativa (24/abr)

IAJus 2026 — CNIAJ redefine paisagem COMPETITIVO

O CNIAJ (CNJ) agendou para 24 de abril em Brasilia o IAJus 2026: lancamento do Sinapses 2.0, edital de chamamento publico de solucoes de IA, e 2a pesquisa sobre IA generativa no Judiciario. Paineis sobre triagem, automacao, pesquisa juridica e aplicacoes institucionais.

Sem o sinal
  • Time desconhece Sinapses 2.0 e suas capacidades
  • Pesquisa de adocao de IA gen no Judiciario nao informaria posicionamento
  • Edital de chamamento passaria despercebido
Com o sinal
  • Time monitora IAJus e adapta narrativa do AssertIA ao novo contexto
  • Dados empiricos de adocao informam strategy
  • Chamamento publico pode ser oportunidade de procurement
Decisao habilitada: Monitorar/participar do IAJus. Posicionar AssertIA em relacao ao Sinapses 2.0. Custo da inacao: 16 dias para o CNJ definir expectativas que o time so descobre semanas depois.

2.2 II ENIATC — Ecossistema de IA nos TCs consolida [CONFIRMADO]

33 TCs, 4 solucoes, 2200+ participantes COMPETITIVO

2o Encontro Nacional de IA dos Tribunais de Contas (30-31/mar, BH). 4 solucoes em operacao (IAGO, ANIA, PLATAO, ADELIA). TCE-BA com RAG documental, TCE-PE com geracao de votos, TCE-MG com fiscalizacao de editais. Desafios comuns: confiabilidade, dados sensiveis, capacitacao.

TC Solucao Funcionalidade Overlap c/ AssertIA?
TCE-BA Raio-X (TiCianE) RAG documental, resumos, Q&A ALTO
TCE-PE Geracao assistida de votos MEDIO
TCE-MG Piloto Fiscalizacao de editais de concurso BAIXO
TCE-ES Chat inteligente Chat sobre processo eletronico MEDIO
TCDF Automacao de ementas MEDIO
TCU AssertIA Apoio a instrucao processual
Decisao habilitada: Solicitar ao operador levantamento de overlap funcional entre ferramentas dos TCs e AssertIA. Custo da inacao: TCs consolidam solucoes fragmentadas sem interoperabilidade — AssertIA perde potencial de escala pos-contrato.

2.3 CGU: BIP + Fala.BR + ALICE em Escala [CONFIRMADO]

Ecossistema domestico de IA em controle acelera ECOSSISTEMA

CGU lancou BIP (busca de precedentes, 7/abr) e IA no Fala.BR (classificacao automatica de 1.4M manifestacoes, 6/abr). ALICE suportou 388 de 600+ auditorias em 2025, emitindo 35 mil alertas de risco. LAION (out/2025) atende 320+ orgaos com 4 modulos de IA.

Ferramenta CGU Funcao Escala Overlap c/ AssertIA
ALICE Analise de risco em licitacoes 35k alertas, 388 auditorias/ano Baixo (dominio diferente)
BIP Busca de precedentes (conflito de interesse) Novo (abr/2026) ALTO (busca de precedentes)
Fala.BR IA Classificacao de manifestacoes 1.4M registros/ano Medio (classificacao textual)
LAION Sumarizacao, similaridade, NER, recomendacao 320+ orgaos Medio (sumarizacao)
Decisao habilitada: Solicitar ao operador comparacao funcional BIP vs AssertIA para busca de precedentes. Custo da inacao: Duplicacao de esforco sem sinergias; argumento de unicidade do AssertIA enfraquece.

3. Tier 2 — Eventos que Habilitam Capacidade

Estes eventos abrem possibilidades que nao existiam antes. Um e ferramenta pronta (NAO), outro e framework academico nao testado em PT-BR (LRAGE). Nao forcam acao imediata.

3.1 NAO AI Auditing Catalogue [CONFIRMADO]

Ferramenta de auditoria de IA co-produzida com Brasil GOVERNANCA

O NAO (UK), em parceria com orgaos de auditoria do Brasil, Finlandia, Alemanha, Noruega e Holanda, lancou catalogo pratico para auditoria de IA. 6 dominios: governanca, qualidade de dados, desenvolvimento, avaliacao pre-deploy, controle de mudancas, monitoramento. Disponivel em auditingalgorithms.net.

AI Auditing Catalogue
Checklist pratico de 6 dominios para auditar sistemas de IA em operacao. Co-produzido por 6 paises (incluindo Brasil). Disponivel em auditingalgorithms.net.
Transferibilidade
Direta e de custo zero. O TCU pode adotar como referencia para auditorias de IA em orgaos federais. Acao concreta: baixar catalogo, mapear contra Res 303/2018 + Portaria Setid 2/2023.
Decisao habilitada: Adotar como referencia para auditorias de IA — baixar de auditingalgorithms.net e mapear contra framework TCU existente. Custo da inacao: Ferramenta pronta e co-produzida ignorada.

3.2 LRAGE — Avaliacao de Legal RAG Open-Source [ACADEMICO]

Framework para medir qualidade de legal RAG (nao testado em PT-BR) QUALIDADE

Framework open-source (arXiv, 2/abr) para avaliacao holistica de legal RAG: 5 componentes (corpora, retrieval, rerankers, LLM, metricas). Suporta benchmarks multilingue (KBL, LegalBench, LawBench). GUI + CLI. Isola retrieval vs generation — exatamente o que o AssertIA precisa para diagnosticar tipos de erro.

Exemplo: LRAGE isolando componentes de qualidade

Input:

Pipeline AssertIA (embedding + retrieval + reranker + GPT-4.1 + metricas)

Diagnostico:

Score por componente: retrieval=0.72, reranker=0.85, generation=0.91, overall=0.79. Bottleneck: retrieval
lrage evaluate --corpus tcu-jurisprudencia --pipeline assertia.yaml --metrics faithfulness,relevance,citation_accuracy
Gap aberto: LRAGE nao foi testado com portugues juridico brasileiro. Os benchmarks suportados sao coreano, ingles e chines. Adaptacao necessaria.
Caveat (adversarial): Inclusao do LRAGE motivada por gap real (sem ferramenta de medicao de qualidade), nao por compensacao do vies custo-only do #001. Se nao funcionar com PT-BR juridico, o gap permanece e a ferramenta e descartada. Nao ha prova de adocao real.
Decisao habilitada: Ter ferramenta candidata para medir baseline de qualidade. Acao concreta: solicitar ao roberto teste com amostra de 50 queries do AssertIA. Custo da inacao: Recomendacoes de quality stack permanecem especulativas.

4. Tier 3 — Contexto e Especulacao

Eventos especulativos ou de referencia. Nao forcam acao, nao habilitam capacidade nova. Informam contexto e monitoramento.
GPT-5.5 Spud — pretraining completo ESPECULATIVO

Sam Altman confirmou pretraining completo. Prediction markets: >90% ate junho. Data e pricing nao confirmados. Relevante para vendor lock-in (88% GPT-4.1) mas nao acionavel ate release oficial. Movido de Tier 1 para Tier 3 apos adversarial: colocar especulacao ao lado de eventos confirmados e falsa equivalencia.

GAO: Inventarios de IA incompletos no IRS REFERENCIA

GAO constatou (24/mar) que inventario de IA do IRS esta incompleto e falta plano de forca de trabalho. Gaps de privacidade na orientacao federal sobre IA (26/mar). Referencia comparativa para auditorias de IA pelo TCU.

DeepSeek V4 — Stealth test ESPECULATIVO

Modelo de 1T parametros no OpenRouter desde 11/mar com evidencia de ser DeepSeek V4 em teste. Se confirmado, choque open-weight. Nao acionavel.

Dados complementares: 45.8% dos tribunais brasileiros ja usam IA generativa (Conjur, 5/abr). India CAG desenvolve LLM soberano treinado em relatorios historicos. Claude Mythos Preview (SWE-bench 93.9%) lancado 7-8/abr mas nao GA. Preco medio de IA caiu 93% desde 2024.

5. Recomendacoes para o Horizon Brief #002

Com base no harvest e no adversarial, a recomendacao para o Brief #002 e:

Selecionar top 5 eventos dos Tiers 1 e 2 para o Brief HIGH IMPACT

Os 5 eventos dos Tiers 1 e 2 (IAJus, ENIATC, CGU, NAO, LRAGE) ja tem formato FATO/CONEXAO/RECOMENDACAO/CUSTO DA INACAO. Todos exceto LRAGE sao confirmados por fontes institucionais. LRAGE entra com caveat explicito.

Brief #001 (vies)
  • 4 sinais, todos sobre custo
  • Nenhum sobre qualidade
  • Foco em model releases
Brief #002 (corrigido)
  • 5 sinais: competitivo (2), custo (1), qualidade (1), governanca/ecossistema (1)
  • LRAGE + II ENIATC equilibram o mix
  • Foco em decisoes, nao em novidades
Publicar ate 12/abr para revisao em 14/abr MEDIUM

O brief precisa de 1 dia de adversarial review e ajustes. Target: draft ate 12/abr, publicacao 14/abr.

Incluir secao 'O que mudou desde o Brief #001' MEDIUM

O Brief #002 deve abrir com atualizacao dos sinais do #001: Flash-Lite continua em Preview? Open-weight models tiveram nova release? PL 2338 teve votacao? Continuidade e tao importante quanto novidade.

6. O Que Nao Sei

#GapO que preciso saberStatus
G1 Nenhum dos 8 eventos tem validacao empirica de impacto causal para AssertIA Historico: eventos similares geraram mudanca de pipeline, contrato, regulacao? OPEN
G2 Taxa de adocao real das ferramentas de IA nos TCs pos-ENIATC Follow-up: quantos TCs realmente implementaram as solucoes apresentadas? OPEN
G3 Qualidade do LRAGE em portugues juridico brasileiro Teste: rodar LRAGE com corpus de jurisprudencia do TCU OPEN
G4 Conteudo especifico do Sinapses 2.0 vs Sinapses 1.x Aguardar lancamento em 24/abr OPEN
G5 GPT-5.5 pricing e capability real Aguardar anuncio oficial OPEN
Limitacao critica (adversarial): O ranking e por mecanismo de impacto e timing, nao por validacao empirica de efeito real no negocio. Sem historico de como eventos similares afetaram AssertIA, a priorizacao e inferencia informada, nao evidencia.
Sanity check GPT-5.4 (round 2): 'Colocar especulacao (GPT-5.5) ao lado de eventos confirmados (IAJus, ENIATC) e falsa equivalencia.' Resposta: aceito — GPT-5.5 movido para Tier 3. Tier 1 agora contem apenas eventos com fontes institucionais confirmadas.
Sanity check Grok (round 2): 'IAJus seria conhecido pelo time por canais institucionais.' Resposta: parcialmente valido — IAJus pode ser conhecido, mas o conteudo especifico (Sinapses 2.0, edital, pesquisa) e o que torna o sinal nao-trivial. O valor nao e a existencia do evento, e a implicacao.

7. Contextualizacao e Glossario

Este harvest alimenta o Horizon Brief #002, segunda entrega do ciclo de scanning de horizonte do drucker para o AssertIA. Destinado a equipe de estrategia e ao operador. Conhecimento previo util: Brief #001, strategy triagem dia 2, e o framework de governanca de IA do TCU.

Termos usados neste harvest que podem nao ser familiares ao leitor.
IAJus
Encontro de Integracao em IA do Judiciario, organizado pelo CNIAJ (CNJ).
CNIAJ
Comite Nacional de Inteligencia Artificial do Judiciario (CNJ). Fiscaliza e normatiza IA judicial.
Sinapses
Plataforma do CNJ para IA judicial. Versao 2.0 sera lancada em 24/abr.
ENIATC
Encontro Nacional de IA dos Tribunais de Contas. Organizado por Atricon.
LRAGE
Legal Retrieval Augmented Generation Evaluation. Framework open-source para medir qualidade de pipelines de legal RAG.
NAO
National Audit Office (UK). Equivalente britanico ao TCU.
BIP
Buscador Inteligente de Precedentes. Ferramenta da CGU para busca de precedentes em conflitos de interesse.
ALICE
Ferramenta de IA da CGU para analise de risco em licitacoes e contratos publicos.
Mecanismo de Impacto
Classificacao de como um evento externo afeta operacoes: competitivo, custo, governanca, qualidade, ecossistema.

Referencias

  1. CNJ — IAJus 2026: Encontro de Integracao em IA do Judiciario https://www.cnj.jus.br/agendas/iajus-2026-encontro-de-integracao-em-inteligencia-artificial-do-judiciario/ WebSearch
  2. NAO — AI Auditing Catalogue and Helper Tool https://www.nao.org.uk/insights/ai-auditing-tool/ WebSearch
  3. Atricon — II ENIATC consolida agenda de IA nos Tribunais de Contas https://atricon.org.br/ii-eniatc-consolida-agenda-nacional-de-inteligencia-artificial-nos-tribunais-de-contas/ WebSearch
  4. arXiv — LRAGE: Legal Retrieval Augmented Generation Evaluation Tool https://arxiv.org/abs/2504.01840 WebSearch
  5. CGU — BIP: Buscador Inteligente de Precedentes https://www.pontaporainforma.com.br/cgu-lanca-buscador-inteligente-de-precedentes-para-agilizar-analise-de-conflitos-de-interesses/ WebSearch
  6. CGU — Fala.BR com IA para classificacao automatica https://www.gov.br/cgu/pt-br/assuntos/noticias/2026/04/fala-br-ganha-novo-formato-e-passa-a-usar-inteligencia-artificial-para-simplificar-atendimento-ao-cidadao WebSearch
  7. Agencia Gov — Ministro da CGU destaca ALICE https://agenciagov.ebc.com.br/noticias/202602/ministro-da-cgu-ressalta-uso-de-ia-no-combate-a-corrupcao-e-na-prevencao-do-desperdicio-de-recursos-publicos WebSearch
  8. GAO — IRS Artificial Intelligence (GAO-26-107522) https://www.gao.gov/products/gao-26-107522 WebSearch
  9. GAO — Privacy Gaps in AI Guidance (GAO-26-107681) https://www.gao.gov/products/gao-26-107681 WebSearch
  10. Conjur — IA e automacao decisoria nos processos administrativos https://www.conjur.com.br/2026-abr-05/inteligencia-artificial-e-automacao-decisoria-nos-processos-administrativos/ WebSearch
  11. TCE-MG — II ENIATC: aplicacoes de IA nos TCs https://www.tce.mg.gov.br/noticia/Detalhe/1111628722 WebSearch
  12. India CAG — AI Impact Summit and CAG-LLM roadmap https://www.business-standard.com/technology/tech-news/cag-bets-on-ai-cyber-audits-and-sovereign-llm-to-enhance-public-scrutiny-126021601209_1.html WebSearch
  13. CNJ — Resolucao 615/2025 https://atos.cnj.jus.br/atos/detalhar/6001 WebSearch
  14. EU AI Act — Annex III High-Risk Systems https://artificialintelligenceact.eu/annex/3/ WebSearch
  15. Panstag — GPT-5.5 Spud release date and features https://www.panstag.com/2026/04/gpt-5.5-release-date-features-.html WebSearch
  16. auditingalgorithms.net — NAO/international AI auditing tool https://www.auditingalgorithms.net/ WebSearch