IA Generativa no SaaS: Como um erro de cálculo quase levou um startup à falência no primeiro dia de lançamento

O lançamento de um SaaS de análise de perfis do LinkedIn com inteligência artificial quase terminou em desastre. Em seu primeiro dia de operação, a plataforma Scoresu.me enfrentou um problema inesperado de custos com o modelo Claude Haiku, da Anthropic, que ameaçou inviabilizar o negócio antes mesmo de completar uma semana.

O Scoresu.me, lançado na terça-feira, prometia analisar perfis do LinkedIn usando IA, fornecendo um score detalhado em seis seções: Headline, About, Experiência, Completude, Destaque e SEO. A estratégia inicial era oferecer um plano gratuito com análises básicas e um plano pago com sugestões completas e textos prontos para copiar.

No primeiro dia, a plataforma registrou 444 análises e gerou R$ 133 em receita, um resultado promissor. No entanto, a situação mudou drasticamente no segundo dia, quando um post no X (antigo Twitter) viralizou, impulsionando o número de análises para 1.348 em apenas 24 horas. Foi nesse momento que o criador do SaaS percebeu o problema iminente.

O Custo Inesperado do Claude Haiku

Ao monitorar o painel da Anthropic em tempo real, o desenvolvedor viu o custo do Claude Haiku 4.5 no plano gratuito disparar, atingindo $13 em um único dia. A projeção imediata foi assustadora: se o ritmo de uso se mantivesse, o custo mensal apenas para fornecer a análise gratuita poderia chegar a ~$390, tornando o produto insustentável.

O erro fundamental, segundo o relato, foi não calcular o custo da IA antes de lançar. Embora o Claude Haiku fosse conhecido por ser barato, não houve uma simulação do impacto financeiro em larga escala com um volume real de usuários. A análise detalhada do problema revelou que o JSON completo do LinkedIn enviado para o Haiku era excessivamente pesado, incluindo campos desnecessários para a análise, como URLs de fotos em múltiplos tamanhos, listas extensas de perfis similares, IDs internos, URNs, metadados e logos de empresas em diferentes resoluções. Isso resultava em um input de 6 a 8 mil tokens por análise.

Decisão Drástica e Mudança de Estratégia

Diante do cenário, a decisão foi remover o plano gratuito imediatamente e redefinir a estratégia. A consequência direta foi um aumento significativo na taxa de conversão, de 1.9% para 15.6%, pois apenas usuários com maior intenção de compra chegavam ao site. Contudo, o volume de acessos despencou drasticamente, de 1.348 para 92 no dia seguinte.

Essa queda no volume, apesar da alta conversão, mostrou que a estratégia de eliminar o free tier não era sustentável a longo prazo. Era preciso encontrar uma solução que equilibrasse custo e acessibilidade.

A Solução Real: Otimização e Modelo de IA Adequado

Para resolver o problema, duas frentes foram atacadas: a otimização do payload enviado para a IA e a escolha do modelo de inteligência artificial mais adequado para o plano gratuito. O código de preparação do perfil para análise foi reescrito, reduzindo o input de aproximadamente 7 mil tokens para cerca de 800 tokens, uma redução de 88%.

Posteriormente, o Claude Haiku 4.5 foi substituído pelo GPT-4.1 Nano da OpenAI para as análises gratuitas. Essa troca representou uma economia de 23 vezes no custo por mil análises. A qualidade do GPT-4.1 Nano foi considerada suficiente para a análise gratuita, que se concentra em fornecer scores e identificar problemas, sem a necessidade de sugestões detalhadas e textos prontos. Para os usuários pagantes, o modelo mais robusto (Opus) continuou sendo utilizado, onde a qualidade é um diferencial.

Resultados Pós-Ajustes

Com as mudanças implementadas, o custo diário do plano gratuito caiu de $13 para apenas $0.42, com uma projeção mensal de aproximadamente $12. A taxa de conversão atual se estabilizou em 6.3% com o free tier ativo, e a receita em três dias após os ajustes alcançou R$ 955. O caso do Scoresu.me serve como um importante alerta para outras startups sobre a necessidade de planejamento financeiro detalhado em relação aos custos de IA.

As lições aprendidas foram claras: calcule o custo antes de lançar, filtre o payload enviado para a IA, use o modelo certo para cada caso e entenda que volume inesperado pode ser perigoso se a operação não estiver ajustada.