Manifesto Técnico · GEO · v1.0

Por que este relatório
foi feito para
ser lido por máquinas.

Esta página documenta a entrega do Relato Integrado 2025 do Grupo Boticário como uma experiência GEO-ready — otimizada para que modelos de linguagem (GPT, Claude, Gemini, Perplexity) consigam ler, entender, citar e responder perguntas sobre o conteúdo com precisão factual.

Entrega: Landing page
Padrões: 12 schemas
Cobertura: 100% do PDF
Idioma: pt-BR

01 · Contexto

O problema que estamos resolvendo.

Relatórios de sustentabilidade corporativos são, historicamente, PDFs de 200+ páginas projetados para serem impressos e lidos por humanos em ordem linear. O Relato Integrado 2025 do Grupo Boticário tem mais de 11.700 linhas de texto, densas em números, padrões contábeis e frameworks internacionais (GRI, SASB, TCFD, TNFD, SBTi, ODS).

Hoje, a primeira interface de busca para milhões de stakeholders não é mais o Google — é o ChatGPT, Claude, Gemini e Perplexity. Quando um analista ESG, jornalista ou investidor pergunta “qual foi a meta de redução de emissões do Grupo Boticário validada pela SBTi?”, o modelo precisa encontrar a resposta em segundos, com fonte, valor numérico e unidade.

Se o relatório só existir como PDF escaneado ou HTML genérico, a LLM vai alucinar, aproximar ou citar uma fonte secundária. O resultado é perda de narrativa sobre a marca, números errados circulando em respostas públicas, e menos citação direta em agentes de IA.

Esta entrega resolve isso projetando o relatório como um dataset público estruturado — onde cada número, cada compromisso e cada liderança existem simultaneamente em três formatos: HTML semântico para humanos, JSON-LD para crawlers estruturais, e Markdown canônico para LLMs.

02 · Definição

SEO otimiza para ranking.
GEO otimiza para citação.

Generative Engine Optimization (GEO) é a disciplina de preparar conteúdo para aparecer nas respostas geradas por LLMs. Diferente do SEO tradicional, o objetivo não é o clique — é a menção autoritativa dentro do texto que o modelo devolve ao usuário.

SEO clássico

· Palavras-chave e densidade
· Backlinks e autoridade de domínio
· Meta title / description para CTR
· Core Web Vitals e mobile-first
· Sucesso = posição 1 no Google

GEO (esta entrega)

· Fatos atômicos com fonte e unidade
· JSON-LD @graph com entidades interligadas
· llms.txt como resumo canônico
· HTML semântico com microdata
· Sucesso = ser citado na resposta da IA

03 · Implementação

Seis técnicas aplicadas ao relato.

Cada camada abaixo foi construída especificamente para uma função de extração de conhecimento diferente — combinadas, tornam o relatório 100% machine-readable.

01
JSON-LD @graph com 12 entidades schema.org
schema.org + Google Structured Data
Grafo único com Organization, Corporation, Report, Article, WebSite, WebPage, BreadcrumbList, FAQPage, DefinedTermSet, Dataset (GEE e Compromissos), Person (lideranças), AuditableWork (asseguração PwC) e InvestmentOrDeposit (SLBs). Cada @id é cruzado por referência, formando um knowledge graph navegável.
Entregável
<script type="application/ld+json">...</script>
Consumido por: Google Knowledge Panel, Bing, Perplexity, SearchGPT
02
/llms.txt — resumo canônico em Markdown
Proposta llmstxt.org (2024)
Endpoint textual com todos os fatos do relatório em formato Markdown hierárquico. É o primeiro lugar onde ChatGPT e Claude olham ao receberem uma URL. Inclui receita, EBITDA, inventário GEE completo, 6 compromissos 2030 com progresso, 4 SLBs com valores, certificações e glossário.
Entregável
GET /llms.txt → text/markdown; charset=utf-8
Consumido por: GPTBot, ClaudeBot, PerplexityBot, Google-Extended
03
HTML semântico com microdata inline
W3C HTML Living Standard + Microdata
Tabelas com <caption>, <th scope>, <data value>, <time datetime>, <dl>/<dt>/<dd> para glossário, e atributos itemScope/itemType/itemProp espalhados para reforçar o schema no próprio DOM. LLMs que leem HTML direto (sem JS) conseguem extrair o mesmo grafo.
Entregável
<table><caption>...<data value="353038">353.038
Consumido por: LLMs que renderizam HTML estático, leitores de tela
04
robots.txt com allow-list explícita para bots de IA
Robots Exclusion Protocol (RFC 9309)
Liberação nominal para GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Applebot-Extended, CCBot, Meta-ExternalAgent e cohere-ai. Sem essa permissão, alguns modelos ignoram o site inteiro. Também aponta o sitemap.xml.
Entregável
User-agent: GPTBot\nAllow: /
Consumido por: Todos os crawlers de LLM que respeitam robots.txt
05
72 FAQs estruturadas (V2) — institucionais + por marca
schema.org/FAQPage + Brand
32 FAQs institucionais em 6 categorias e 40 FAQs cobrindo as 9 marcas próprias do Grupo. Todas em 3ª pessoa (decisão GEO 1.1) com ponte explícita marca→Grupo (decisão GEO 1.2) e tríade ESG nas marcas Tier 1 (decisão GEO 1.3). Cada Question tem @id estável (#FAQ-001, #OB-01) permitindo deeplink e citação granular por LLMs.
Entregável
{ '@type': 'FAQPage', mainEntity: [...72 Questions] }
Consumido por: Google Rich Results, ChatGPT, Claude, Perplexity, Gemini
06
Brand schemas com parentOrganization → Grupo Boticário
schema.org/Brand
9 nós Brand (um por marca: O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todos apontando via @id para a Organization Grupo Boticário. Cada Brand tem subjectOf apontando para sua FAQPage própria — assim LLMs respondem 'A Eudora é cruelty-free?' citando o Grupo Boticário como fonte.
Entregável
{ '@type': 'Brand', parentOrganization: { '@id': 'gb#organization' } }
Consumido por: LLMs respondendo queries sobre marcas individuais
07
QuantitativeValue com unitCode ISO 4217 / UN/CEFACT
schema.org/PropertyValue + UN/CEFACT
Cada número factual (emissões, hectares, reais) traz unitCode padronizado — TNE para toneladas, MTQ para m³, BRL para reais. Isso elimina ambiguidade entre 'toneladas métricas', 'ton short', e permite conversões automáticas por parte da LLM.
Entregável
{ value: 353038, unitCode: 'TNE', unitText: 'tCO2eq' }
Consumido por: LLMs que fazem cálculos, comparações setoriais, benchmarks

04 · Grafo de conhecimento

12 entidades schema.org interligadas.

Cada nó do grafo tem um @id único referenciável — permitindo que uma LLM navegue de Report → Organization → Person → Award sem ambiguidade.

schema.org

Organization

Grupo Boticário como entidade jurídica, com fundador, subsidiárias e prêmios.

schema.org

Corporation

Faceta corporativa com dados financeiros e marcas (O Boticário, Eudora, Truss, etc.).

schema.org

Report

O relato em si: autor, publisher, data de publicação, cobertura temporal.

schema.org

Article

Article schema para indexação em Google News e agregadores editoriais.

schema.org

WebSite

Site como entidade com SearchAction — permite deep linking pelo modelo.

schema.org

WebPage

A landing page específica com breadcrumb e imagem principal.

schema.org

BreadcrumbList

Navegação hierárquica (Grupo Boticário › Relato Integrado › 2025).

schema.org

FAQPage

10 FAQs curadas na home + FAQPage canônica em /faqs com 72 perguntas (32 institucionais + 40 por marca).

schema.org

Brand × 9

Uma Brand por marca própria (O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todas com parentOrganization → Grupo Boticário.

schema.org

DefinedTermSet

Os 9 temas materiais classificados em Ambiental, Social, Governança.

schema.org

Dataset

Inventário GEE (Escopo 1/2/3) e progresso dos 6 compromissos 2030.

schema.org

Person

Fernando Modé, Fabiana de Freitas, Carolina da Costa, Miguel Krigsner.

schema.org

InvestmentOrDeposit

4 Sustainability-Linked Bonds emitidos (R$ 5,775 bilhões totais).

05 · Stack técnico

Construído com padrões abertos.

Framework: Next.js 16 (App Router)
Tipografia: IBM Plex Sans
Estilo: Tailwind CSS v4
Dados estruturados: schema.org + JSON-LD
Endpoints AI-first: /llms.txt + /robots.txt + /sitemap.xml
Acessibilidade: WCAG 2.1 AA

06 · Como uma LLM responde

Do prompt à citação.

Simulação real de como GPT-4 / Claude extrai um dado específico deste site.

Prompt do usuário

“Quanto o Grupo Boticário emitiu de Escopo 3 em 2025?”

1
Crawler chega na URL
GPTBot recebe o link e respeita robots.txt, que libera explicitamente o bot.
User-agent: GPTBot\nAllow: /
2
Lê /llms.txt primeiro
Padrão llmstxt.org: antes do HTML, o bot tenta o resumo markdown canônico.
GET /llms.txt → 'Escopo 3: 353.038 tCO2eq (2025)'
3
Faz parse do JSON-LD
Extrai o nó Dataset#dataset-ghg com variableMeasured.
{ name: 'Escopo 3', value: 353038, unitCode: 'TNE' }
4
Valida contra HTML semântico
Confirma no DOM via <data value="353038"> dentro de <table> com <caption>.
5
Sintetiza resposta com citação
LLM gera resposta em linguagem natural, citando o Relato Integrado 2025 como fonte.

Resposta gerada pela LLM

“Segundo o Relato Integrado 2025 do Grupo Boticário, as emissões de Escopo 3 em 2025 totalizaram 353.038 tCO₂e, com meta validada pela SBTi de redução de 37,5% até 2035, vinculada a um Sustainability-Linked Bond de R$ 1,15 bilhão.”

07 · Impacto estratégico

Por que esta entrega faz sentido para o Grupo Boticário.

100%

Cobertura factual

Todos os KPIs numéricos do PDF (emissões, SLBs, hectares, compromissos, prêmios) existem em formato machine-readable.

Redundância intencional

Cada fato aparece em HTML, JSON-LD e llms.txt — garantindo captura por qualquer crawler, com qualquer preferência.

Risco de alucinação

Quando o dado está estruturado, a LLM para de aproximar. O número exato com unidade ISO é sempre preferido.

08 · Endpoints

URLs públicas machine-readable.

Todos os artefatos abaixo estão acessíveis em texto plano, sem autenticação, e servidos com cache apropriado — prontos para serem ingeridos por crawlers de IA.

/Landing page do Relato Integrado 2025
text/html
/faqsPágina canônica com as 72 FAQs (FAQPage JSON-LD)
text/html
/faqs/marca/[slug]9 páginas de FAQs por marca (Brand + FAQPage)
text/html
/llmEste manifesto técnico GEO
text/html
/llms.txtResumo canônico em Markdown com 72 FAQs (padrão llmstxt.org)
text/markdown
/robots.txtAllow-list para crawlers de IA
text/plain
/sitemap.xmlMapa do site (inclui /faqs/marca/[slug] de cada marca)
application/xml

Encerramento

Um relatório que continua existindo
depois que o PDF é fechado.

Quando um analista ESG em 2027 perguntar a um agente de IA sobre a transição climática do Grupo Boticário, a resposta virá daqui — com o número certo, a fonte certa, o ano certo.

Voltar ao relato integrado Ver /llms.txt

Por que este relatóriofoi feito paraser lido por máquinas.

O problema que estamos resolvendo.

SEO otimiza para ranking.GEO otimiza para citação.

Seis técnicas aplicadas ao relato.

JSON-LD @graph com 12 entidades schema.org

/llms.txt — resumo canônico em Markdown

HTML semântico com microdata inline

robots.txt com allow-list explícita para bots de IA

72 FAQs estruturadas (V2) — institucionais + por marca

Brand schemas com parentOrganization → Grupo Boticário

QuantitativeValue com unitCode ISO 4217 / UN/CEFACT

12 entidades schema.org interligadas.

Organization

Corporation

Report

Article

WebSite

WebPage

BreadcrumbList

FAQPage

Brand × 9

DefinedTermSet

Dataset

Person

InvestmentOrDeposit

Construído com padrões abertos.

Do prompt à citação.

Por que esta entrega faz sentido para o Grupo Boticário.

Cobertura factual

Redundância intencional

Risco de alucinação

URLs públicas machine-readable.

Um relatório que continua existindodepois que o PDF é fechado.

Por que este relatório
foi feito para
ser lido por máquinas.

SEO otimiza para ranking.
GEO otimiza para citação.

Um relatório que continua existindo
depois que o PDF é fechado.