O que encontrei
Em 6 de abril de 2026, o Estado de Nova York anunciou a expansão do seu programa de IA de um piloto com 1.200 servidores para toda a força de trabalho estadual — mais de 100 mil pessoas em 50 agências. Na mesma semana, a ProPublica publicou três alertas sobre riscos de adoção acelerada de IA no governo federal americano, e a GSA começou a transição do USAi de serviço gratuito para cobrança.
O cruzamento dessas três fontes, mais uma análise enterprise sobre por que 95% dos pilotos de IA falham em escalar, revela algo que o Sala Lifecycle Playbook V0.1 ainda não endereça: quando uma sala está pronta para ser replicada?
O caso NYS — o que funcionou
O modelo é simples: sandbox seguro (AI Pro, baseado em Google Gemini), treinamento obrigatório antes do acesso (via InnovateUS), e medição desde o primeiro dia. Resultados do piloto: 41% dos participantes nunca haviam usado IA generativa. Após o programa: +36% de confiança, 75% reportaram economia de tempo, 90% melhor entendimento, 86% queriam continuar usando. 170 mil prompts gerados.
A decisão de escalar veio dos números do piloto. Não foi gradual — foi um salto de 83x (1.200 → 100K). O gate não é "mais uma unidade por vez"; é "o piloto provou valor → escala para todos".
Detalhe crítico: treinamento obrigatório como pré-requisito. "Agencies that choose to use AI Pro will be required to complete responsible AI training." Não é sugestão — é condição de acesso.
O que deu errado em outros lugares
ProPublica documenta três armadilhas: (1) Microsoft ofereceu $150 milhões em upgrades de cybersecurity grátis — e depois as agências ficaram presas. (2) FedRAMP, criado para avaliar segurança de cloud, ficou subfinanciado a ponto de virar rubber stamp. (3) Avaliadores "independentes" são pagos pelas empresas que avaliam.
Enterprise AI (análise de padrão): 95% dos pilotos de IA generativa não geram impacto mensurável em escala. O problema? O "iceberg 80/20" — o modelo de IA é apenas 20% do trabalho. Os outros 80% são orquestração de workflow, integração com sistemas existentes, governança, gestão de conhecimento. A maioria das organizações atinge "teatro de produtividade" (funcionários usando Copilot para e-mails) sem alcançar transformação real de processo.
USAi (GSA): suite multi-modelo lançada como gratuita para acelerar adoção. 15 agências aderiram. Agora, em FY27, transição para cost-recovery. O padrão: acesso grátis cria adoção, mas quem paga pela sustentabilidade?
A hipótese: perguntas de prontidão para escala (não diagnóstico comprovado)
Do cruzamento emergem 5 temas recorrentes — não dimensões causais comprovadas, mas perguntas que aparecem repetidamente. Nota metodológica: o "95% falham" vem de peça de consultoria (Virsaic/CoTé) sem amostra ou metodologia auditável. Use como heurística, não como dado.
O layer mais profundo, apontado pelo adversarial: o que realmente determina escala em burocracias de controle pode ser poder político, alinhamento de incentivos e redução de risco jurídico — não checklists operacionais. As 5 dimensões abaixo são a superfície mensurável; a causa pode estar abaixo delas.
- Treinamento: o usuário sabe o que a ferramenta faz e não faz?
- Métricas: existe evidência quantificada de que o piloto gerou valor?
- Integração: o output da IA entra no workflow real do profissional?
- Ownership: alguém dentro da instituição (não o fornecedor) é dono?
- Sustentabilidade: existe funding para operação após o investimento inicial?
Reframing adversarial (GPT + Grok, 2 rounds): Ambos os modelos convergiram na mesma crítica — chamar isso de "gate" cria risco de burocracia prematura. Em ambientes emergentes, gates centralizados podem matar aprendizado orgânico. O conceito foi reframado: diagnóstico, não gate. É uma avaliação de onde estamos, não um bloqueio formal de onde podemos ir.
Grok acrescentou: o que realmente falta não são os 5 itens — é o layer invisível abaixo deles: cultura, incentivos e resistência institucional à mudança. Os 5 são sintomas mensuráveis; a causa é o quanto a organização quer mudar.
Aplicação ao TCU — honesta
O Sala Lifecycle Playbook V0.1 tem 7 fases (candidatura → handoff). Nenhuma delas responde a pergunta "quando replicar". O diagnóstico de prontidão seria usado entre Release e Handoff como avaliação, não como gate bloqueante.
Estado inferido (não verificado) das salas do AssertIA por dimensão:
| Dimensão | Estado | Evidência |
|---|---|---|
| Treinamento | ❌ Inexistente | Nenhum onboarding para auditor |
| Métricas | ❌ Zero | Nenhuma medição de uso/valor |
| Integração | ⚠️ Parcial | Export Word falho na SEPROC |
| Ownership | ⚠️ Ambíguo | Consórcio→Audi Digital? |
| Sustentabilidade | ❓ Incerto | Depende da renovação do contrato |
Teste de valor: 1. "Isso aponta para ação implementável nos próximos 30 dias?" — Sim. Aplicar o diagnóstico à sala de prorrogação de prazo como exercício piloto do diagnóstico. 2. "O operador teria descoberto sozinho?" — Não. Requer cruzar NYS/ProPublica/Enterprise — fontes que ele não monitora para esse padrão.
O que não sei
- Se as 5 dimensões são as certas ou se há outras (ética? bias? fairness? — o cerne da ProPublica)
- Se o modelo NYS funcionaria no contexto brasileiro (cultura organizacional radicalmente diferente)
- Se "diagnóstico de prontidão" não é apenas mais um artefato que soa bem mas que ninguém usa
- Quantas das dimensões já estão sendo endereçadas informalmente por pessoas dentro do TCU
- Se a alternativa ágil (champions + iteração + feedback contínuo) não é simplesmente melhor no contexto TCU
- Se os bloqueadores reais são políticos (resistência de auditores seniores a ferramentas que auditam seu trabalho) e jurídicos (risco de hallucination em parecer técnico) — não operacionais
- Fonte e metodologia do "95% falham" — peça de consultoria sem amostra auditável, tratado como heurística
- Se o NYS escalou pelas 5 dimensões ou por patrocínio político excepcional + mandato top-down (confounding variable)
Próximo passo
Uma conversa com o operador: "Faz sentido adicionar uma avaliação de prontidão ao Playbook V0.1, ou isso é over-engineering prematura?" O diagnóstico de NYS informa, mas a resposta vem de dentro.