MÓDULO 5.2

📊 SEO + AI Search Auditor

A maioria das ferramentas de SEO não sabe que o llms.txt existe. A maioria dos guias de visibilidade em IA pula a parte técnica. Esta skill faz os dois — ao vivo, em qualquer URL, em menos de 60 segundos.

6
Tópicos
45
Minutos
Avançado
Nível
Prática
Tipo
1

🌐 SEO clássico e AEO no mesmo audit

Existem dois jogos de visibilidade hoje. O SEO mira o Google: ranquear na página de resultados. O AEO (Answer Engine Optimization) mira os motores de resposta — ChatGPT, Perplexity, Gemini, Claude — para ser citado dentro da resposta da IA. São públicos, sinais e checagens diferentes. Esta skill cobre os dois numa só passada.

🔵 SEO tradicional

Aparecer e ranquear no Google.

  • Title, meta description, hierarquia de H1/H2
  • Core Web Vitals, HTTPS, sitemap
  • Links internos, alt text, E-E-A-T

🟦 AEO (busca por IA)

Ser citado na resposta da IA.

  • Crawlers de IA liberados no robots.txt
  • llms.txt e blocos de resposta diretos
  • Schema, autoridade de entidade, SSR

🧩 Por que isto é um diferencial

As ferramentas de SEO de mercado não checam acesso de bots de IA nem geram llms.txt. Os guias de "como aparecer no ChatGPT" raramente medem Core Web Vitals ou schema. Quem entrega os dois no mesmo relatório, sem trocar de ferramenta, oferece algo que o cliente não acha em outro lugar.

2

🤖 robots.txt e o bloqueio invisível

A falha mais cara em AEO é silenciosa: uma regra no robots.txt que bloqueia o crawler de uma IA. Se o GPTBot está proibido, o ChatGPT nunca indexa seu site — e ninguém percebe, porque o tráfego do Google continua igual. A skill checa exatamente isso e marca como prioridade alta.

checagem de acesso de crawlers de IA bash
curl -s "https://DOMINIO/robots.txt" \
  | grep -iE "GPTBot|ClaudeBot|PerplexityBot|GoogleOther|Bytespider|CCBot"

# Se qualquer crawler critico aparecer em "Disallow: /"
# => sinalizar como FIX DE PRIORIDADE ALTA

✓ robots.txt que deixa a IA entrar

User-agent: GPTBot
User-agent: ClaudeBot
User-agent: PerplexityBot
User-agent: GoogleOther
Allow: /

✗ A regra que te apaga da IA

User-agent: GPTBot
Disallow: /

# GPTBot nunca le seu site.
# Voce some das respostas do ChatGPT.

⚠️ Atenção

Muitos templates de CMS e plugins de "privacidade" adicionam regras anti-IA por padrão, achando que protegem o conteúdo. O dono do site quase nunca sabe. Sempre comece o audit pelo robots.txt — é o achado de maior impacto e o mais fácil de corrigir.

3

📄 llms.txt: o mapa para a IA

O llms.txt é um arquivo legível por máquina, na raiz do site, que diz às IAs onde está seu conteúdo de autoridade — docs, guias, glossário, pesquisa. É a ação de AEO de maior impacto que a maioria dos sites ainda não fez. A skill gera o llms.txt e o llms-full.txt prontos para deploy.

/docs /guias /glossario llms.txt mapa de autoridade ChatGPT Perplexity Gemini
llms.txt (esqueleto gerado pela skill) raiz do site
# {nome_da_marca}

> {descricao_da_marca em uma frase}

## Core Documentation
- [Como funciona](/docs): visao geral do produto

## How-To Guides
- [Primeiros passos](/guias/inicio): tutorial passo a passo

## Definitions & Glossary
- [Glossario](/glossario): termos-chave do setor

## About & Authority
- [Sobre](/sobre): credenciais, equipe, time
- [Imprensa](/imprensa): mencoes e reconhecimento

## Contact
- [Contato](/contato): fale com a equipe

📊 llms.txt vs llms-full.txt

  • llms.txt — o índice: links com uma linha de descrição para a IA navegar.
  • llms-full.txt — o conteúdo: o texto completo das páginas-chave, para a IA citar sem precisar buscar.
4

🏷️ Schema markup e blocos de resposta

Para a IA extrair e citar seu conteúdo com confiança, ele precisa de estrutura. Duas técnicas dominam: o schema markup (JSON-LD que descreve a página para a máquina) e o método de bloco de resposta (pergunta no H2, resposta direta logo abaixo).

FAQPage schema (JSON-LD) <script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "O que e AEO?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "AEO (Answer Engine Optimization) e otimizar
               conteudo para ser citado por IAs como ChatGPT
               e Perplexity, alem do ranqueamento no Google."
    }
  }]
}

📐 O método do bloco de resposta

H2: [pergunta como cabeçalho?]
[resposta direta em 1–2 frases, logo após o título]
[3–5 frases de contexto de apoio]
  • estatística com data e fonte
  • entidade ou caso nomeado
  • ponto de comparação ou contraste
Schema Onde usar Para que serve
OrganizationHomepageReconhecimento de entidade
FAQPagePáginas de conteúdoCitação por IA
ArticleBlog e guiasSinal de E-E-A-T
HowToTutoriaisPassos extraíveis
DefinedTermGlossárioAutoridade temática
JSON-LD
Schema legível por máquina.
FAQPage
O schema que mais é citado.
Answer block
Resposta direta no topo.
Pirâmide invertida
Conclusão antes do detalhe.
5

🔬 O fluxo de auditoria ao vivo

Quando você digita audit https://site.com, a skill executa uma sequência fixa: busca os arquivos centrais, checa o acesso dos bots, detecta schema e gera o relatório priorizado. Entender o workflow é o que permite confiar no resultado — e estendê-lo.

1

Buscar arquivos centrais

robots.txt, sitemap.xml, o HTML da página (title, meta, H1) e o status do llms.txt. Tudo via curl/web_fetch.

2

Auditar acesso dos bots de IA

Procurar GPTBot, ClaudeBot, PerplexityBot no robots.txt. Qualquer bloqueio crítico vira prioridade alta.

3

Auditar schema

Extrair os blocos application/ld+json da página e identificar quais tipos existem (ou se não há nenhum).

4

Gerar o relatório

Escrever seo-audit-DOMINIO.md com sumário executivo, achados de SEO e de IA, status de schema e llms.txt, e um plano dividido em quick wins / médio / longo prazo.

Dica prática: concorrentes em paralelo

Para uma análise competitiva, dispare subagentes em paralelo — um por concorrente. Cada um audita um domínio (HTML, schema, llms.txt, robots) e o agente principal funde tudo numa tabela comparativa. Mesma skill, escopo multiplicado.

6

🛠️ Empacotando o seu auditor

A skill real é um exemplo limpo de progressive disclosure: o SKILL.md fica enxuto, com uma árvore de decisão e o playbook resumido, e delega os detalhes aos references/. Os scripts fazem o trabalho pesado.

estrutura da skill seo-aeo-optimization/
seo-aeo-optimization/
├── SKILL.md                    # playbook + arvore de decisao (enxuto)
├── scripts/
│   ├── audit.sh                # auditor de site ao vivo
│   └── generate_llms_txt.py    # gerador interativo de llms.txt
└── references/
    ├── traditional-seo.md      # checklists tecnicos, Core Web Vitals
    ├── ai-seo-aeo.md           # playbook AEO, taticas por plataforma
    └── schema-markup.md        # biblioteca JSON-LD copia-e-cola

🌳 A árvore de decisão dentro do SKILL.md

pedido recebido
├─ "audite meu site" → fluxo de audit ao vivo
├─ "crie schema markup" → ler schema-markup.md → JSON-LD
├─ "escreva llms.txt" → ler ai-seo-aeo.md → gerar arquivo
├─ "analise concorrentes" → subagentes em paralelo
└─ pergunta geral → responder do conhecimento da skill

📊 Por que o SKILL.md fica enxuto

O corpo do SKILL.md só precisa do suficiente para decidir qual caminho seguir e disparar o script certo. O conhecimento profundo — 15 tipos de schema, todas as táticas por plataforma — mora nos references/, carregados sob demanda. Isso mantém o contexto leve e a skill rápida.

📝 Resumo do Módulo

SEO + AEO juntos — uma skill cobre Google e os motores de resposta numa só passada.
robots.txt primeiro — o bloqueio de crawler de IA é o achado mais caro e mais fácil de corrigir.
llms.txt — a ação de AEO de maior impacto; a skill gera os arquivos prontos.
Schema + bloco de resposta — estrutura é o que faz a IA citar com confiança.
Progressive disclosure — SKILL.md enxuto + scripts + references carregados sob demanda.

🎯 Exercícios práticos

  1. Rode o fluxo manualmente num site real: cheque o robots.txt para GPTBot/ClaudeBot e veja se há llms.txt.
  2. Escreva o llms.txt de um site fictício seguindo o esqueleto do tópico 3.
  3. Crie um FAQPage JSON-LD para uma página de preços e valide a sintaxe.
  4. Crie um SKILL.md rodável chamado seo-aeo-audit com uma árvore de decisão e um scripts/audit.sh que receba uma URL, cheque robots.txt + schema e escreva seo-audit-DOMINIO.md. Teste num domínio real.

Próximo Módulo:

5.3 — RAG Architect