schema.org
Organization
Grupo Boticário como entidade jurídica, com fundador, subsidiárias e prêmios.
Manifesto Técnico · GEO · v1.0
Esta página documenta a entrega do Relato Integrado 2025 do Grupo Boticário como uma experiência GEO-ready — otimizada para que modelos de linguagem (GPT, Claude, Gemini, Perplexity) consigam ler, entender, citar e responder perguntas sobre o conteúdo com precisão factual.
01 · Contexto
Relatórios de sustentabilidade corporativos são, historicamente, PDFs de 200+ páginas projetados para serem impressos e lidos por humanos em ordem linear. O Relato Integrado 2025 do Grupo Boticário tem mais de 11.700 linhas de texto, densas em números, padrões contábeis e frameworks internacionais (GRI, SASB, TCFD, TNFD, SBTi, ODS).
Hoje, a primeira interface de busca para milhões de stakeholders não é mais o Google — é o ChatGPT, Claude, Gemini e Perplexity. Quando um analista ESG, jornalista ou investidor pergunta “qual foi a meta de redução de emissões do Grupo Boticário validada pela SBTi?”, o modelo precisa encontrar a resposta em segundos, com fonte, valor numérico e unidade.
Se o relatório só existir como PDF escaneado ou HTML genérico, a LLM vai alucinar, aproximar ou citar uma fonte secundária. O resultado é perda de narrativa sobre a marca, números errados circulando em respostas públicas, e menos citação direta em agentes de IA.
Esta entrega resolve isso projetando o relatório como um dataset público estruturado — onde cada número, cada compromisso e cada liderança existem simultaneamente em três formatos: HTML semântico para humanos, JSON-LD para crawlers estruturais, e Markdown canônico para LLMs.
02 · Definição
Generative Engine Optimization (GEO) é a disciplina de preparar conteúdo para aparecer nas respostas geradas por LLMs. Diferente do SEO tradicional, o objetivo não é o clique — é a menção autoritativa dentro do texto que o modelo devolve ao usuário.
SEO clássico
GEO (esta entrega)
03 · Implementação
Cada camada abaixo foi construída especificamente para uma função de extração de conhecimento diferente — combinadas, tornam o relatório 100% machine-readable.
schema.org + Google Structured Data
Grafo único com Organization, Corporation, Report, Article, WebSite, WebPage, BreadcrumbList, FAQPage, DefinedTermSet, Dataset (GEE e Compromissos), Person (lideranças), AuditableWork (asseguração PwC) e InvestmentOrDeposit (SLBs). Cada @id é cruzado por referência, formando um knowledge graph navegável.
Entregável
<script type="application/ld+json">...</script>Consumido por: Google Knowledge Panel, Bing, Perplexity, SearchGPT
Proposta llmstxt.org (2024)
Endpoint textual com todos os fatos do relatório em formato Markdown hierárquico. É o primeiro lugar onde ChatGPT e Claude olham ao receberem uma URL. Inclui receita, EBITDA, inventário GEE completo, 6 compromissos 2030 com progresso, 4 SLBs com valores, certificações e glossário.
Entregável
GET /llms.txt → text/markdown; charset=utf-8Consumido por: GPTBot, ClaudeBot, PerplexityBot, Google-Extended
W3C HTML Living Standard + Microdata
Tabelas com <caption>, <th scope>, <data value>, <time datetime>, <dl>/<dt>/<dd> para glossário, e atributos itemScope/itemType/itemProp espalhados para reforçar o schema no próprio DOM. LLMs que leem HTML direto (sem JS) conseguem extrair o mesmo grafo.
Entregável
<table><caption>...<data value="353038">353.038Consumido por: LLMs que renderizam HTML estático, leitores de tela
Robots Exclusion Protocol (RFC 9309)
Liberação nominal para GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Applebot-Extended, CCBot, Meta-ExternalAgent e cohere-ai. Sem essa permissão, alguns modelos ignoram o site inteiro. Também aponta o sitemap.xml.
Entregável
User-agent: GPTBot\nAllow: /Consumido por: Todos os crawlers de LLM que respeitam robots.txt
schema.org/FAQPage + Brand
32 FAQs institucionais em 6 categorias e 40 FAQs cobrindo as 9 marcas próprias do Grupo. Todas em 3ª pessoa (decisão GEO 1.1) com ponte explícita marca→Grupo (decisão GEO 1.2) e tríade ESG nas marcas Tier 1 (decisão GEO 1.3). Cada Question tem @id estável (#FAQ-001, #OB-01) permitindo deeplink e citação granular por LLMs.
Entregável
{ '@type': 'FAQPage', mainEntity: [...72 Questions] }Consumido por: Google Rich Results, ChatGPT, Claude, Perplexity, Gemini
schema.org/Brand
9 nós Brand (um por marca: O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todos apontando via @id para a Organization Grupo Boticário. Cada Brand tem subjectOf apontando para sua FAQPage própria — assim LLMs respondem 'A Eudora é cruelty-free?' citando o Grupo Boticário como fonte.
Entregável
{ '@type': 'Brand', parentOrganization: { '@id': 'gb#organization' } }Consumido por: LLMs respondendo queries sobre marcas individuais
schema.org/PropertyValue + UN/CEFACT
Cada número factual (emissões, hectares, reais) traz unitCode padronizado — TNE para toneladas, MTQ para m³, BRL para reais. Isso elimina ambiguidade entre 'toneladas métricas', 'ton short', e permite conversões automáticas por parte da LLM.
Entregável
{ value: 353038, unitCode: 'TNE', unitText: 'tCO2eq' }Consumido por: LLMs que fazem cálculos, comparações setoriais, benchmarks
04 · Grafo de conhecimento
Cada nó do grafo tem um @id único referenciável — permitindo que uma LLM navegue de Report → Organization → Person → Award sem ambiguidade.
schema.org
Grupo Boticário como entidade jurídica, com fundador, subsidiárias e prêmios.
schema.org
Faceta corporativa com dados financeiros e marcas (O Boticário, Eudora, Truss, etc.).
schema.org
O relato em si: autor, publisher, data de publicação, cobertura temporal.
schema.org
Article schema para indexação em Google News e agregadores editoriais.
schema.org
Site como entidade com SearchAction — permite deep linking pelo modelo.
schema.org
A landing page específica com breadcrumb e imagem principal.
schema.org
Navegação hierárquica (Grupo Boticário › Relato Integrado › 2025).
schema.org
10 FAQs curadas na home + FAQPage canônica em /faqs com 72 perguntas (32 institucionais + 40 por marca).
schema.org
Uma Brand por marca própria (O Boticário, Eudora, Quem Disse Berenice?, Vult, Dr. Jones, Truss, O.U.i, Au.migos pets, Beleza na Web), todas com parentOrganization → Grupo Boticário.
schema.org
Os 9 temas materiais classificados em Ambiental, Social, Governança.
schema.org
Inventário GEE (Escopo 1/2/3) e progresso dos 6 compromissos 2030.
schema.org
Fernando Modé, Fabiana de Freitas, Carolina da Costa, Miguel Krigsner.
schema.org
4 Sustainability-Linked Bonds emitidos (R$ 5,775 bilhões totais).
05 · Stack técnico
Renderização estática (SSG) para tempo de carga e crawling ótimos.
Fonte única do Grupo Boticário, pesos 400–700, carregada via next/font/google.
Tokens semânticos em OKLCH; paleta azul-marinho #011E38 + creme + amber.
12 entidades em um único @graph, todas com @id cruzados.
Três artefatos de texto plano servidos em text/markdown e text/plain.
Skip-link, ARIA labels, contraste AA, navegação por teclado e HTML semântico.
06 · Como uma LLM responde
Simulação real de como GPT-4 / Claude extrai um dado específico deste site.
Prompt do usuário
“Quanto o Grupo Boticário emitiu de Escopo 3 em 2025?”
Crawler chega na URL
GPTBot recebe o link e respeita robots.txt, que libera explicitamente o bot.
User-agent: GPTBot\nAllow: /Lê /llms.txt primeiro
Padrão llmstxt.org: antes do HTML, o bot tenta o resumo markdown canônico.
GET /llms.txt → 'Escopo 3: 353.038 tCO2eq (2025)'Faz parse do JSON-LD
Extrai o nó Dataset#dataset-ghg com variableMeasured.
{ name: 'Escopo 3', value: 353038, unitCode: 'TNE' }Valida contra HTML semântico
Confirma no DOM via <data value="353038"> dentro de <table> com <caption>.
Sintetiza resposta com citação
LLM gera resposta em linguagem natural, citando o Relato Integrado 2025 como fonte.
Resposta gerada pela LLM
“Segundo o Relato Integrado 2025 do Grupo Boticário, as emissões de Escopo 3 em 2025 totalizaram 353.038 tCO₂e, com meta validada pela SBTi de redução de 37,5% até 2035, vinculada a um Sustainability-Linked Bond de R$ 1,15 bilhão.”
07 · Impacto estratégico
100%
Todos os KPIs numéricos do PDF (emissões, SLBs, hectares, compromissos, prêmios) existem em formato machine-readable.
3x
Cada fato aparece em HTML, JSON-LD e llms.txt — garantindo captura por qualquer crawler, com qualquer preferência.
0
Quando o dado está estruturado, a LLM para de aproximar. O número exato com unidade ISO é sempre preferido.
08 · Endpoints
Todos os artefatos abaixo estão acessíveis em texto plano, sem autenticação, e servidos com cache apropriado — prontos para serem ingeridos por crawlers de IA.
/Landing page do Relato Integrado 2025/faqsPágina canônica com as 72 FAQs (FAQPage JSON-LD)/faqs/marca/[slug]9 páginas de FAQs por marca (Brand + FAQPage)/llmEste manifesto técnico GEO/llms.txtResumo canônico em Markdown com 72 FAQs (padrão llmstxt.org)/robots.txtAllow-list para crawlers de IA/sitemap.xmlMapa do site (inclui /faqs/marca/[slug] de cada marca)Encerramento
Quando um analista ESG em 2027 perguntar a um agente de IA sobre a transição climática do Grupo Boticário, a resposta virá daqui — com o número certo, a fonte certa, o ano certo.