- A combinação de índices léxicos e semânticos em Copilot permite buscas contextuais, rápidas e altamente relevantes em todo o Microsoft 365.
- Microsoft Graph fornece o contexto rico para o Copilot, que usa vetores, sinais de uso e permissões para recuperar apenas conteúdo autorizado.
- Experiências como Busca Copilot, Copilot Chat, Copilot no Windows e Copilot para Power BI aplicam a mesma base semântica a documentos, código e dados analíticos.
- Toda a indexação respeita políticas de segurança, privacidade e conformidade, incluindo DLP, etiquetas de confidencialidade, limites geográficos e suporte a BYOK.

A busca semântica em Copilot está a mudar por completo a forma como encontramos informação dentro do ecossistema Microsoft. Em vez de depender só de palavras‑chave exatas, o Copilot combina índices léxicos tradicionais com índices vetoriais avançados, interpretando o significado das frases, o contexto dos dados e as relações entre pessoas, documentos, e‑mails, reuniões e até modelos semânticos do Power BI. Isso torna as respostas muito mais relevantes, naturais e rápidas para o dia a dia.
Ao mesmo tempo, toda esta inteligência é aplicada respeitando rigorosamente permissões, segurança, privacidade e requisitos de conformidade. O Copilot só devolve conteúdo ao qual o utilizador já tem acesso em Microsoft 365, Power BI ou Windows, e toda a indexação é feita com encriptação, controlo de acesso baseado em funções e suporte para cenários avançados como BYOK, limites de dados da UE e políticas de Minimização de Dados com Microsoft Purview.
O que é um índice em Microsoft 365 Copilot
O coração da pesquisa em Copilot é um índice que combina conhecimento léxico e semântico sobre os dados da organização. A indexação já era um conceito central em Microsoft 365, permitindo que os serviços consultassem o enorme volume de informação armazenado no Microsoft Graph, onde vive o inquilino (tenant) da organização.
No modelo léxico clássico, o índice associa palavras‑chave a localizações de documentos ou conjuntos de documentos, permitindo pesquisas por termos exatos ou parciais. O Microsoft 365 usa o Microsoft Graph para classificar os resultados com base em sinais adicionais, como relações entre pessoas, histórico de colaboração e popularidade do conteúdo, o que gera personalização e relevância social dentro da rede da empresa.
O índice semântico entra como uma camada extra que compreende o significado e o contexto dos dados. Ele é gerado a partir do conteúdo presente no Microsoft Graph e cria representações matemáticas (vetores) de textos, trechos de código, páginas web, PDFs, apresentações e outros tipos de ficheiro. Assim, é possível pesquisar milhares de milhões de vetores e recuperar resultados que não coincidem literalmente com as palavras da consulta, mas que são conceitualmente semelhantes.
A combinação entre índice léxico e índice semântico permite que o Copilot interprete melhor a intenção do utilizador, cruzando a semântica dos conteúdos com sinais de personalização e segurança do Microsoft 365. Tudo isto é feito respeitando as fronteiras do inquilino, as permissões configuradas e as políticas de conformidade configuradas pelo administrador.
Como funciona a indexação semântica em Copilot
A indexação semântica do Microsoft 365 Copilot cria índices vetoriais a partir do conteúdo textual disponível em SharePoint Online, Exchange, OneNote e outros serviços. Um vetor é uma representação numérica de uma entidade — como uma palavra, um parágrafo ou um pixel de imagem — em um espaço multidimensional, onde elementos semelhantes ficam “próximos” uns dos outros.
Nesse espaço vetorial, documentos, e‑mails e outros objetos com significado parecido formam grupos (clusters), o que permite ao Copilot fazer buscas por similaridade em vez de depender apenas da coincidência exata de termos. Assim, uma pergunta como “feedback positivo do fornecedor de design” também pode encontrar um e‑mail onde alguém escreveu “fiquei impressionado com o trabalho da agência de design”.
Na prática, a indexação semântica permite que o Copilot:
- Entenda variações de palavras e formas linguísticas: singular/plural, abreviações, diferentes formas de escrever países (EUA, U.S.A., Estados Unidos da América) ou termos parecidos como “tecnologia” e “tech”.
- Capte sinónimos e expressões equivalentes, ampliando a quantidade de informação que pode ser recuperada a partir de uma mesma intenção.
- Reconheça recursos relacionados a um exemplo ou a uma consulta, encontrando documentos que tratam do mesmo tema mesmo que usem vocabulário diferente.
Além disso, a indexação semântica proporciona pesquisa de similaridade rápida e precisa, calculando a distância vetorial entre a consulta embebida (embedding) e os vetores armazenados no índice. Assim, o Copilot consegue priorizar os conteúdos mais relevantes em termos de significado, e não apenas os que contêm certo termo literal.
Integração entre Microsoft 365 Copilot e Microsoft Graph
O Microsoft Graph é a grande “fonte de verdade” da organização, agregando e‑mails, ficheiros, chats, reuniões, sites e muito mais. O Copilot usa tanto o índice léxico do Graph quanto o índice semântico para recuperar o contexto que será enviado ao modelo de linguagem (LLM).
Quando um utilizador faz uma pergunta em Copilot, o fluxo de dados segue vários passos: a requisição sai da aplicação (Word, Excel, Teams, app Copilot, etc.), é encaminhada ao serviço Copilot, que consulta o Microsoft Graph e o índice semântico para reunir documentos, mensagens e sinais relevantes. Em seguida, o Copilot monta um prompt enriquecido e envia esse contexto para o LLM.
Depois de receber a resposta do modelo de linguagem, o Copilot volta ao Graph e ao índice semântico para refinar a resposta, adicionar referências, comandos específicos da aplicação e garantir que os resultados estejam alinhados com o conteúdo real da organização. Finalmente, a resposta gerada e as ações de aplicação são devolvidas ao utilizador.
Todo este fluxo é protegido por encriptação HTTPS em trânsito e encriptação em repouso, garantindo que os dados do cliente não sejam expostos. Além disso, o LLM não treina nos dados da organização: consultas, respostas e conteúdo usado para grounding não são usados para treinar os modelos base.
Índices de nível de inquilino e de nível de utilizador
Atualmente, o Microsoft 365 Copilot cria um índice semântico em dois níveis principais: o nível de inquilino (tenant) e o nível de utilizador. O índice de tenant é construído a partir de ficheiros de texto em SharePoint Online acessíveis por duas ou mais pessoas, garantindo que conteúdos colaborativos sejam facilmente encontráveis.
Gradualmente, a Microsoft também está a criar índices de nível de utilizador, focados no conjunto de dados com que cada pessoa trabalha no dia a dia: e‑mails, documentos que mencionam o utilizador, ficheiros que ele comenta ou partilha, entre outros. Isto cria uma camada de personalização muito mais rica para o Copilot.
É importante salientar que o índice nunca altera permissões: só aparecem nos resultados itens a que o utilizador já tem acesso, controlado por controlo de acesso baseado em função (RBAC) e pelas propriedades dos sites de SharePoint Online, que precisam permanecer pesquisáveis para entrarem no índice.
O processo de criação e atualização desses índices é automatizado: documentos pessoais de utilizadores são indexados praticamente em tempo real, novos ficheiros em sites de SharePoint Online acessíveis a múltiplos utilizadores são indexados em ciclos diários, e alterações em documentos já indexados são refletidas quase de imediato.
Tipos de conteúdo suportados na busca semântica
O Copilot aproveita o entendimento semântico para uma série de tipos de conteúdo comuns no Microsoft 365, com suporte em diferentes níveis para índices de utilizador e de inquilino. Entre os formatos suportados estão:
- Caixas de correio de utilizador (apenas nível de utilizador, sem suporte a caixas delegadas ou partilhadas).
- Documentos Word (doc/docx) em sites de SharePoint Online.
- Apresentações PowerPoint (pptx), páginas web (aspx) e blocos de notas OneNote (one).
- Ficheiros PDF e dados provenientes de conectores de Microsoft Graph a origens externas (no índice de tenant).
Dados arquivados de caixas de correio e de SharePoint não são indexados semanticamente neste momento, o que ajuda a controlar o escopo de pesquisa e a focar em conteúdos ativos e relevantes para o trabalho corrente.
Administração, exclusões e proteção de dados
A indexação semântica é ativada automaticamente pela Microsoft e não pode ser desativada, já que faz parte da evolução nativa da experiência de Busca em Microsoft 365. No entanto, os administradores continuam a ter várias alavancas de controlo para gerir que conteúdos podem ser pesquisados.
Organizações sem Microsoft Purview Data Loss Prevention (DLP) podem excluir sites específicos de SharePoint Online da pesquisa, por exemplo, sites de folha de pagamento, RH ou finanças confidenciais. Isso é feito nas configurações do próprio site, na opção de permitir (ou não) que o conteúdo apareça nos resultados de busca do Microsoft Search e do índice semântico.
Quando a organização usa DLP, é possível excluir ficheiros sensíveis de forma mais granular, com políticas que previnem a perda de dados e impedem que determinados conteúdos sejam sequer considerados no processo de indexação. Assim, a proteção de informação e a privacidade andam lado a lado com a capacidade de pesquisa avançada.
Outras opções incluem controles de minimização de dados e redução de partilhas excessivas, aproveitando funcionalidades do Microsoft 365 e complementos como gestão avançada de SharePoint e Microsoft Purview Information Protection, com etiquetas de confidencialidade, encriptação e marcação de conteúdo.
Armazenamento, BYOK e limites geográficos
Os dados gerados pela indexação semântica permanecem dentro do inquilino da organização e seguem as mesmas políticas de segurança, identidade, privacidade e conformidade dos restantes serviços Microsoft 365. A informação de índice de utilizador é armazenada onde está localizada a respetiva caixa de correio.
Já os dados do índice de tenant são guardados num contentor isolado por inquilino, hospedado na região em que se encontra o site de SharePoint, seja a região principal de origem ou outra região configurada pelo administrador. Para clientes sujeitos ao limite de dados da União Europeia (EU Data Boundary), o índice é mantido em datacenters na UE/EFTA.
Organizações com cenários multigeográficos têm os limites regionais respeitados, com dados armazenados e processados na respetiva região. Além disso, há suporte para Microsoft Purview Customer Key (BYOK), permitindo que empresas tragam a sua própria chave de encriptação sem perder as capacidades de indexação semântica.
Importante: a indexação semântica não conta para as quotas de armazenamento do cliente, o que elimina preocupações de custo de espaço apenas por ativar a pesquisa mais inteligente.
Busca Copilot: experiência universal de pesquisa
A Busca Copilot (Microsoft 365 Copilot Search) é a interface unificada que aproveita a indexação semântica e o Microsoft Graph para oferecer uma experiência de busca moderna e universal. Integrada na aplicação Microsoft 365 Copilot, ela permite procurar informação em todo o conteúdo da organização e em origens de terceiros através de conectores.
Graças a mais de uma centena de conectores oficiais, conectores personalizados e integrações com ISVs, a Busca Copilot torna‑se o ponto único para descobrir dados espalhados por sistemas Microsoft e não‑Microsoft, mantendo sempre as permissões e a segurança de nível empresarial.
O utilizador pode combinar busca e chat de forma fluida: primeiro pesquisa “qual o estado do relatório de Q2?” e obtém uma resposta resumida com links para documentos relevantes; depois, com um clique, continua a conversa em Copilot Chat para pedir resumos mais detalhados, análises adicionais ou geração de conteúdo a partir desses dados.
Essa abordagem posiciona a busca como a camada organizadora da inteligência artificial, enquanto o chat funciona como ambiente de trabalho interativo para aprofundar tarefas, criar, editar e executar ações em aplicações específicas.
Diferenças entre Busca Copilot, Copilot Chat e Microsoft Search
A Busca de Microsoft 365 Copilot e o Copilot Chat partilham a mesma base de dados (Microsoft Graph) e conectores, mas focam interações diferentes. A Busca Copilot é otimizada para “encontrar rápido”, com interface baseada em caixa de pesquisa e resultados concisos; o Copilot Chat é orientado a conversas, criação de conteúdo e raciocínio mais profundo.
Comparada com o Microsoft Search gratuito, a Busca Copilot traz uma camada semântica e de IA muito mais poderosa. Enquanto o Microsoft Search tradicional trabalha sobretudo com palavras‑chave e resultados intercalados dentro de apps específicas, a Busca Copilot oferece:
- Pesquisa semântica universal em Microsoft 365 e em origens externas via conectores.
- Integração profunda com Copilot Chat, gerando respostas de IA com referências aos documentos corporativos.
- Experiência de utilizador moderna e unificada, acessível numa aplicação dedicada e com suporte a linguagem natural.
Ambas as experiências mantêm o mesmo modelo de segurança e privacidade base, incluindo respeito a etiquetas de confidencialidade, controlo de acesso e políticas de proteção de dados. A diferença principal está na profundidade da experiência de IA e no grau de personalização e semântica envolvidas.
Copilot em Visual Studio: busca semântica aplicada ao código
No contexto de desenvolvimento, o Copilot Chat no Visual Studio utiliza a mesma filosofia de indexação e busca semântica, mas aplicada ao código-fonte. Para repositórios hospedados no GitHub ou Azure DevOps, é criado um índice remoto do codebase; para outros cenários, é gerado um índice local.
Quando o programador faz uma pergunta, o Copilot determina se precisa de mais contexto do projeto e, nesse caso, realiza uma busca semântica sobre esse índice, procurando ficheiros com maior similaridade em relação à solicitação (por exemplo, funções relacionadas, classes adjacentes, módulos relevantes).
Esses ficheiros recuperados são então combinados com o contexto do chat (histórico, ficheiros abertos, mensagens anteriores, erros fornecidos) antes de serem enviados ao modelo de linguagem. Isso garante que as respostas de Copilot sejam altamente específicas ao projeto e à base de código em questão.
Para aplicar sugestões de código de forma robusta, o Copilot Chat usa técnicas de descodificação especulativa e mapeamento baseado em modelo, o que ajuda a inserir alterações de código diretamente em ficheiros existentes com menor risco de conflitos ou erros, sobretudo no modo Agente, em que o Copilot pode compilar, depurar e testar de forma mais autónoma.
Memórias de Copilot para projetos de código
As chamadas “memórias de Copilot” permitem que o assistente aprenda preferências do projeto e padrões de codificação ao longo do tempo. À medida que a equipa interage no chat, o Copilot deteta quando um utilizador corrige um comportamento, define um padrão arquitetónico ou pede explicitamente para “recordar” algo.
Nesses casos, o Copilot sugere guardar a preferência e, ao ser confirmado, classifica a informação em três ficheiros diferentes, conforme a natureza do conhecimento:
- .editorconfig para padrões de codificação (formatação, convenções, etc.).
- CONTRIBUTING.md para boas práticas, diretrizes de contribuição e padrões arquitetónicos.
- README.md para informações de alto nível sobre o projeto.
Com o tempo, estas memórias tornam o Copilot mais alinhado aos padrões específicos da equipa, tornando as sugestões mais consistentes, reduzindo retrabalho e ajudando até a reforçar documentação e governança de desenvolvimento.
Busca semântica de ficheiros no Copilot para Windows
No Windows, a aplicação Copilot+ traz a busca semântica para o sistema operativo, permitindo encontrar ficheiros locais através de descrições em linguagem natural, sem precisar lembrar o nome exato do ficheiro ou termos contidos nele.
Exemplos de consultas como “imagens de pontes ao pôr do sol” ou “o meu currículo” são suficientes para que o Copilot identifique fotos e documentos relevantes com base no significado semântico, rótulos e contexto disponível. Esta funcionalidade está disponível dentro da app Copilot e, inicialmente, apenas em PCs Copilot+, como parte dos canais Windows Insider.
A nova homepage da aplicação Copilot no Windows também foi redesenhada para produtividade, mostrando logo à entrada conversas recentes, aplicações e ficheiros usados recentemente, além de oferecer ações guiadas (“get guided help with your apps”) que ativam sessões Vision para orientar o utilizador passo a passo em determinadas apps.
Um ponto crítico de privacidade é que a aplicação não varre todo o sistema nem envia ficheiros automaticamente para a nuvem. O Copilot lê apenas a pasta de “Recentes” do Windows e só processa um ficheiro quando o utilizador o anexa explicitamente à conversa, garantindo controlo total sobre o que está a ser analisado.
Busca semântica em Power BI com Copilot
No Power BI, a experiência independente de Copilot introduz uma busca orientada a conteúdo analítico, permitindo encontrar relatórios, modelos semânticos, aplicações de área de trabalho, aplicações organizacionais e agentes de dados através de linguagem natural.
Para usar a busca de Power BI no Copilot, algumas configurações de inquilino precisam estar ativas, incluindo a habilitação geral do Copilot e a opção de partilha de dados através de limites geográficos quando o Azure OpenAI não está disponível na região principal. Com isso, o Copilot consegue fazer busca semântica em termos semelhantes.
Quando o utilizador pergunta, por exemplo, “encontrar elementos sobre receitas de vendas”, o Copilot devolve uma lista de itens relacionados com ícones que indicam o tipo de conteúdo, o título, a área de trabalho, a última vez que foi aberto, a descrição (fornecida pelo autor ou gerada a partir de metadados) e se o relatório pertence a alguma aplicação.
Em perguntas de dados mais abertas, como “quantos turistas visitaram em janeiro?”, o Copilot primeiro mostra que itens pretende usar para responder, pedindo confirmação do utilizador. É possível indicar “usar 1” ou escolher uma das sugestões exibidas acima da caixa de entrada para direcionar o modelo ao conteúdo correto.
Metadados, sinais e aprovação de conteúdo em Power BI
Para determinar o que é mais relevante na busca, o Copilot em Power BI analisa uma ampla gama de metadados. Entre eles estão o título do item, descrição, nome da área de trabalho e conteúdo interno como nomes de páginas, títulos visuais, textos em painéis de filtro e caixas de texto em relatórios.
O Copilot também recorre a vários sinais para priorizar determinados itens nos resultados, por exemplo:
- Se o item foi marcado como favorito pelo utilizador.
- Se foi aberto recentemente e com que frequência é visualizado na organização.
- Se o conteúdo está aprovado ou faz parte de uma aplicação de área de trabalho ou organizacional.
- Se o item foi marcado como aprovado para Copilot, reforçando a confiança do utilizador.
Administradores de área de trabalho podem limitar a busca do Copilot a itens aprovados, controlando se o assistente pesquisa em todo o conteúdo ou apenas em artefactos sinalizados de forma explícita. Há também configurações de inquilino para definir padrões globais, como “mostrar apenas itens aprovados na experiência independente de Power BI (pré‑visualização)”.
Para melhorar a descobribilidade, recomenda‑se boas práticas de modelagem e documentação em Power BI: adicionar descrições ricas a relatórios, usar palavras‑chave únicas no título, aplicar etiquetas de aprovação, marcar itens importantes como favoritos e manter metadados bem estruturados.
O Copilot respeita rigorosamente permissões, públicos de aplicações, modelos semânticos marcados como reconhecíveis e elementos ocultos. Ele não revela itens a que o utilizador não tem acesso e não pesquisa em campos ocultos, tabelas ou colunas invisíveis. Atualizações diretas em itens são refletidas em poucos minutos nos resultados, enquanto alterações indiretas (como renomear áreas de trabalho) podem levar até 24 horas.
Com esta combinação de indexação léxica, vetorial e sinais de uso, o Copilot oferece uma experiência de busca mais inteligente, contextual e produtiva em todo o ecossistema Microsoft, desde ficheiros locais no Windows até relatórios avançados em Power BI e conteúdo colaborativo no Microsoft 365.
À medida que a Microsoft aperfeiçoa estas tecnologias, os utilizadores tendem a sentir cada vez menos fricção para encontrar o que precisam e mais foco em decisões e criação de valor, apoiados por uma IA que entende o idioma natural, respeita o contexto e protege os dados da organização de ponta a ponta.