Manifesto Técnico · GEO · v1.0

Por que este relatório
foi feito para
ser lido por máquinas.

Esta página documenta a entrega do Relato Integrado 2025 do Grupo Boticário como uma experiência GEO-ready — otimizada para que modelos de linguagem (GPT, Claude, Gemini, Perplexity) consigam ler, entender, citar e responder perguntas sobre o conteúdo com precisão factual.

Entrega
Landing page
Padrões
12 schemas
Cobertura
100% do PDF
Idioma
pt-BR

01 · Contexto

O problema que estamos resolvendo.

Relatórios de sustentabilidade corporativos são, historicamente, PDFs de 200+ páginas projetados para serem impressos e lidos por humanos em ordem linear. O Relato Integrado 2025 do Grupo Boticário tem mais de 11.700 linhas de texto, densas em números, padrões contábeis e frameworks internacionais (GRI, SASB, TCFD, TNFD, SBTi, ODS).

Hoje, a primeira interface de busca para milhões de stakeholders não é mais o Google — é o ChatGPT, Claude, Gemini e Perplexity. Quando um analista ESG, jornalista ou investidor pergunta “qual foi a meta de redução de emissões do Grupo Boticário validada pela SBTi?”, o modelo precisa encontrar a resposta em segundos, com fonte, valor numérico e unidade.

Se o relatório só existir como PDF escaneado ou HTML genérico, a LLM vai alucinar, aproximar ou citar uma fonte secundária. O resultado é perda de narrativa sobre a marca, números errados circulando em respostas públicas, e menos citação direta em agentes de IA.

Esta entrega resolve isso projetando o relatório como um dataset público estruturado — onde cada número, cada compromisso e cada liderança existem simultaneamente em três formatos: HTML semântico para humanos, JSON-LD para crawlers estruturais, e Markdown canônico para LLMs.

02 · Definição

SEO otimiza para ranking.
GEO otimiza para citação.

Generative Engine Optimization (GEO) é a disciplina de preparar conteúdo para aparecer nas respostas geradas por LLMs. Diferente do SEO tradicional, o objetivo não é o clique — é a menção autoritativa dentro do texto que o modelo devolve ao usuário.

SEO clássico

  • · Palavras-chave e densidade
  • · Backlinks e autoridade de domínio
  • · Meta title / description para CTR
  • · Core Web Vitals e mobile-first
  • · Sucesso = posição 1 no Google

GEO (esta entrega)

  • · Fatos atômicos com fonte e unidade
  • · JSON-LD @graph com entidades interligadas
  • · llms.txt como resumo canônico
  • · HTML semântico com microdata
  • · Sucesso = ser citado na resposta da IA

03 · Implementação

Seis técnicas aplicadas ao relato.

Cada camada abaixo foi construída especificamente para uma função de extração de conhecimento diferente — combinadas, tornam o relatório 100% machine-readable.

  1. 01

    JSON-LD @graph com 12 entidades schema.org

    schema.org + Google Structured Data

    Grafo único com Organization, Corporation, Report, Article, WebSite, WebPage, BreadcrumbList, FAQPage, DefinedTermSet, Dataset (GEE e Compromissos), Person (lideranças), AuditableWork (asseguração PwC) e InvestmentOrDeposit (SLBs). Cada @id é cruzado por referência, formando um knowledge graph navegável.

    Entregável

    <script type="application/ld+json">...</script>

    Consumido por: Google Knowledge Panel, Bing, Perplexity, SearchGPT

  2. 02

    /llms.txt — resumo canônico em Markdown

    Proposta llmstxt.org (2024)

    Endpoint textual com todos os fatos do relatório em formato Markdown hierárquico. É o primeiro lugar onde ChatGPT e Claude olham ao receberem uma URL. Inclui receita, EBITDA, inventário GEE completo, 6 compromissos 2030 com progresso, 4 SLBs com valores, certificações e glossário.

    Entregável

    GET /llms.txt → text/markdown; charset=utf-8

    Consumido por: GPTBot, ClaudeBot, PerplexityBot, Google-Extended

  3. 03

    HTML semântico com microdata inline

    W3C HTML Living Standard + Microdata

    Tabelas com <caption>, <th scope>, <data value>, <time datetime>, <dl>/<dt>/<dd> para glossário, e atributos itemScope/itemType/itemProp espalhados para reforçar o schema no próprio DOM. LLMs que leem HTML direto (sem JS) conseguem extrair o mesmo grafo.

    Entregável

    <table><caption>...<data value="353038">353.038

    Consumido por: LLMs que renderizam HTML estático, leitores de tela

  4. 04

    robots.txt com allow-list explícita para bots de IA

    Robots Exclusion Protocol (RFC 9309)

    Liberação nominal para GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Applebot-Extended, CCBot, Meta-ExternalAgent e cohere-ai. Sem essa permissão, alguns modelos ignoram o site inteiro. Também aponta o sitemap.xml.

    Entregável

    User-agent: GPTBot\nAllow: /

    Consumido por: Todos os crawlers de LLM que respeitam robots.txt

  5. 05

    72 FAQs estruturadas (V2) — institucionais + por marca

    schema.org/FAQPage + Brand

    32 FAQs institucionais em 6 categorias e 40 FAQs cobrindo as 9 marcas próprias do Grupo. Todas em 3ª pessoa (decisão GEO 1.1) com ponte explícita marca→Grupo (decisão GEO 1.2) e tríade ESG nas marcas Tier 1 (decisão GEO 1.3). Cada Question tem @id estável (#FAQ-001, #OB-01) permitindo deeplink e citação granular por LLMs.

    Entregável

    { '@type': 'FAQPage', mainEntity: [...72 Questions] }

    Consumido por: Google Rich Results, ChatGPT, Claude, Perplexity, Gemini

  6. 06

    Brand schemas com parentOrganization → Grupo Boticário

    schema.org/Brand

    9 nós Brand (um por marca: O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todos apontando via @id para a Organization Grupo Boticário. Cada Brand tem subjectOf apontando para sua FAQPage própria — assim LLMs respondem 'A Eudora é cruelty-free?' citando o Grupo Boticário como fonte.

    Entregável

    { '@type': 'Brand', parentOrganization: { '@id': 'gb#organization' } }

    Consumido por: LLMs respondendo queries sobre marcas individuais

  7. 07

    QuantitativeValue com unitCode ISO 4217 / UN/CEFACT

    schema.org/PropertyValue + UN/CEFACT

    Cada número factual (emissões, hectares, reais) traz unitCode padronizado — TNE para toneladas, MTQ para m³, BRL para reais. Isso elimina ambiguidade entre 'toneladas métricas', 'ton short', e permite conversões automáticas por parte da LLM.

    Entregável

    { value: 353038, unitCode: 'TNE', unitText: 'tCO2eq' }

    Consumido por: LLMs que fazem cálculos, comparações setoriais, benchmarks

04 · Grafo de conhecimento

12 entidades schema.org interligadas.

Cada nó do grafo tem um @id único referenciável — permitindo que uma LLM navegue de Report → Organization → Person → Award sem ambiguidade.

schema.org

Organization

Grupo Boticário como entidade jurídica, com fundador, subsidiárias e prêmios.

schema.org

Corporation

Faceta corporativa com dados financeiros e marcas (O Boticário, Eudora, Truss, etc.).

schema.org

Report

O relato em si: autor, publisher, data de publicação, cobertura temporal.

schema.org

Article

Article schema para indexação em Google News e agregadores editoriais.

schema.org

WebSite

Site como entidade com SearchAction — permite deep linking pelo modelo.

schema.org

WebPage

A landing page específica com breadcrumb e imagem principal.

schema.org

BreadcrumbList

Navegação hierárquica (Grupo Boticário › Relato Integrado › 2025).

schema.org

FAQPage

10 FAQs curadas na home + FAQPage canônica em /faqs com 72 perguntas (32 institucionais + 40 por marca).

schema.org

Brand × 9

Uma Brand por marca própria (O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todas com parentOrganization → Grupo Boticário.

schema.org

DefinedTermSet

Os 9 temas materiais classificados em Ambiental, Social, Governança.

schema.org

Dataset

Inventário GEE (Escopo 1/2/3) e progresso dos 6 compromissos 2030.

schema.org

Person

Fernando Modé, Fabiana de Freitas, Carolina da Costa, Miguel Krigsner.

schema.org

InvestmentOrDeposit

4 Sustainability-Linked Bonds emitidos (R$ 5,775 bilhões totais).

05 · Stack técnico

Construído com padrões abertos.

Framework
Next.js 16 (App Router)

Renderização estática (SSG) para tempo de carga e crawling ótimos.

Tipografia
IBM Plex Sans

Fonte única do Grupo Boticário, pesos 400–700, carregada via next/font/google.

Estilo
Tailwind CSS v4

Tokens semânticos em OKLCH; paleta azul-marinho #011E38 + creme + amber.

Dados estruturados
schema.org + JSON-LD

12 entidades em um único @graph, todas com @id cruzados.

Endpoints AI-first
/llms.txt + /robots.txt + /sitemap.xml

Três artefatos de texto plano servidos em text/markdown e text/plain.

Acessibilidade
WCAG 2.1 AA

Skip-link, ARIA labels, contraste AA, navegação por teclado e HTML semântico.

06 · Como uma LLM responde

Do prompt à citação.

Simulação real de como GPT-4 / Claude extrai um dado específico deste site.

Prompt do usuário

“Quanto o Grupo Boticário emitiu de Escopo 3 em 2025?”

  1. 1

    Crawler chega na URL

    GPTBot recebe o link e respeita robots.txt, que libera explicitamente o bot.

    User-agent: GPTBot\nAllow: /
  2. 2

    Lê /llms.txt primeiro

    Padrão llmstxt.org: antes do HTML, o bot tenta o resumo markdown canônico.

    GET /llms.txt → 'Escopo 3: 353.038 tCO2eq (2025)'
  3. 3

    Faz parse do JSON-LD

    Extrai o nó Dataset#dataset-ghg com variableMeasured.

    { name: 'Escopo 3', value: 353038, unitCode: 'TNE' }
  4. 4

    Valida contra HTML semântico

    Confirma no DOM via <data value="353038"> dentro de <table> com <caption>.

  5. 5

    Sintetiza resposta com citação

    LLM gera resposta em linguagem natural, citando o Relato Integrado 2025 como fonte.

Resposta gerada pela LLM

“Segundo o Relato Integrado 2025 do Grupo Boticário, as emissões de Escopo 3 em 2025 totalizaram 353.038 tCO₂e, com meta validada pela SBTi de redução de 37,5% até 2035, vinculada a um Sustainability-Linked Bond de R$ 1,15 bilhão.”

07 · Impacto estratégico

Por que esta entrega faz sentido para o Grupo Boticário.

100%

Cobertura factual

Todos os KPIs numéricos do PDF (emissões, SLBs, hectares, compromissos, prêmios) existem em formato machine-readable.

3x

Redundância intencional

Cada fato aparece em HTML, JSON-LD e llms.txt — garantindo captura por qualquer crawler, com qualquer preferência.

0

Risco de alucinação

Quando o dado está estruturado, a LLM para de aproximar. O número exato com unidade ISO é sempre preferido.

08 · Endpoints

URLs públicas machine-readable.

Todos os artefatos abaixo estão acessíveis em texto plano, sem autenticação, e servidos com cache apropriado — prontos para serem ingeridos por crawlers de IA.

  • /Landing page do Relato Integrado 2025
    text/html
  • /faqsPágina canônica com as 72 FAQs (FAQPage JSON-LD)
    text/html
  • /faqs/marca/[slug]9 páginas de FAQs por marca (Brand + FAQPage)
    text/html
  • /llmEste manifesto técnico GEO
    text/html
  • /llms.txtResumo canônico em Markdown com 72 FAQs (padrão llmstxt.org)
    text/markdown
  • /robots.txtAllow-list para crawlers de IA
    text/plain
  • /sitemap.xmlMapa do site (inclui /faqs/marca/[slug] de cada marca)
    application/xml

Encerramento

Um relatório que continua existindo
depois que o PDF é fechado.

Quando um analista ESG em 2027 perguntar a um agente de IA sobre a transição climática do Grupo Boticário, a resposta virá daqui — com o número certo, a fonte certa, o ano certo.