Início » O que é pesquisa semântica? Como isso afeta o SEO

O que é pesquisa semântica? Como isso afeta o SEO

por Marketing Digital Learn
Você já notou que o Google pode lidar com quase qualquer pergunta que você fizer hoje em dia?

Basta olhar para o resultado desta consulta:

Yoda fs 1

Apesar de não mencionar Yoda pelo nome, o Google entendeu de quem estávamos falando e o que queríamos saber sobre ele.

Isso não seria possível sem a busca semântica.

Neste post, você aprenderá:

  • O que é pesquisa semântica
  • Por que a pesquisa semântica é importante
  • As tecnologias do Google que desempenham um papel na pesquisa semântica
  • Como adaptar seu SEO para busca semântica

A pesquisa semântica é um processo de recuperação de informações usado pelos mecanismos de pesquisa modernos para retornar os resultados de pesquisa mais relevantes. Ele se concentra no significado por trás das consultas de pesquisa, em vez da correspondência tradicional de palavras-chave.

A terminologia vem de um ramo da linguística chamado semântica, que se preocupa com o estudo do significado.

Embora existam inúmeras variáveis ​​em jogo, os princípios da pesquisa semântica, por que ela é necessária e como ela é influenciada são fáceis de entender.

  • Os usuários geralmente não usam o mesmo idioma do conteúdo desejado
  • Muitas pesquisas são involuntariamente ambíguas
  • A necessidade de entender a hierarquia lexical e os relacionamentos entre entidades
  • A necessidade de refletir interesses e tendências pessoais

Os usuários geralmente não usam o mesmo idioma do conteúdo desejado

Pior ainda, às vezes nem sabemos como articular uma consulta de pesquisa corretamente.

Digamos que você ouviu uma música desconhecida no rádio. Você gostou e começou a pesquisar letras aleatórias no Google até que finalmente encontrou.

sabão serp 1

Para adicionar outra camada de complexidade, compare o que você digita no Google com o que você diz para Siri, Alexa ou Google Assistant. As palavras-chave agora se tornam conversas.

Existem tantas maneiras de expressar a mesma ideia, e os mecanismos de pesquisa precisam lidar com todas elas. Eles precisam ser capazes de corresponder o conteúdo em seu índice com sua consulta de pesquisa com base no significado de ambos.

Por mais desafiador que isso possa parecer, é apenas o começo.

Muitas pesquisas são involuntariamente ambíguas

Cerca de 40%  das palavras em inglês são polissêmicas – elas têm dois ou mais significados. É sem dúvida o desafio mais significativo que a pesquisa semântica está tentando resolver.

Por exemplo, a palavra-chave “python” tem 533.000 pesquisas mensais apenas nos EUA:

volume de pesquisa python 1

Se eu fosse pesquisar por “python”, provavelmente estaria me referindo à linguagem de programação. Mas qualquer pessoa fora da indústria de tecnologia provavelmente esperaria a cobra real ou a lendária trupe de comédia britânica .

O problema aqui é que as palavras raramente têm um significado definitivo sem contexto. Além das palavras polissêmicas, você tem inúmeros substantivos que também podem ser adjetivos, verbos ou ambos. E ainda estamos no escopo dos significados literais. Fica ainda mais interessante se mergulharmos nos significados inferidos (pense em sarcasmo).

O contexto é tudo em semântica e nos leva aos dois pontos restantes.

A necessidade de entender a hierarquia lexical e os relacionamentos entre entidades

Vamos dar uma olhada na seguinte consulta de pesquisa e no principal resultado da pesquisa:

exemplo de consulta complexa 1

Isso é realmente impressionante. Veja o que o Google precisa fazer para entender essa consulta:

  1. Saiba que “parceira” significa esposa/namorada/marido/namorado/cônjuge.
  2. Entenda que Obi-Wan apareceu em vários filmes e séries interpretados por diferentes atores.
  3. Faça as conexões.
  4. Exiba os resultados da pesquisa de uma forma que reflita a ambigüidade de “obi wan”.

Não consigo nem imaginar que tipo de resultado de pesquisa obteria se fizesse essa pesquisa em 2010 ou antes.

Agora, vamos dar um passo atrás para explicar os conceitos.

A hierarquia lexical  ilustra a relação entre as palavras. A palavra parceiro é superordenada (hiperônimo) para esposa, namorado, cônjuge e outros.

Leia:   Facilidade de leitura de Flesch: o que um teste de legibilidade significa para SEO

Conforme mencionado anteriormente, nossas consultas geralmente não correspondem às palavras exatas do conteúdo desejado. Saber que “acessível” é qualquer coisa entre barato, intermediário e com preços razoáveis ​​é crucial.

Entidades , neste exemplo, são personagens de filmes e séries (Obi-Wan), pessoas com um trabalho específico (ator) e pessoas que estão associadas a eles (parceiros). Em geral, as entidades são objetos ou conceitos que podem ser identificados de forma distinta – geralmente pessoas, lugares e coisas.

E como se não bastassem todos os meandros da linguagem, devemos ir além disso.

Vamos voltar ao exemplo do “python”. Se eu procurar por isso, realmente obtenho todos os resultados relacionados à linguagem de programação.

Não importa o quanto não gostemos de todas as formas como nossos dados pessoais são usados, pelo menos é útil para os mecanismos de busca. O Google usa  dados limitados junto com seu histórico de pesquisa para fornecer resultados de pesquisa mais precisos e personalizados.

Estamos todos cientes disso. Basta digitar qualquer tipo de serviço na barra de pesquisa e você obterá resultados localizados:

resultados locais 1

Mas o que é mais fascinante é a capacidade do Google de ajustar temporariamente os resultados da pesquisa com base na intenção de pesquisa que muda dinamicamente .

Por exemplo, o coronavírus não é um termo novo. Sempre foi o nome de um grupo de vírus. Mas, como todos sabemos, a intenção de pesquisa mudou rapidamente no início de 2020. As pessoas começaram a procurar informações sobre uma cepa específica de coronavírus (SARS-CoV-2), e o SERP teve que ser ajustado de acordo  .

serp história gráfico 1

Como você pode ver no histórico de posições SERP para “coronavírus” acima, nenhum dos cinco principais resultados de pesquisa atuais foi classificado antes de 2020.

Você vê a mesma coisa no setor de comércio eletrônico durante grandes eventos de vendas, como Natal ou Black Friday. A intenção de pesquisa durante esse período é altamente transacional, enquanto as pessoas normalmente preferem ver comparações ou avaliações.

O Google lança continuamente atualizações de algoritmo e tecnologias que melhoram ainda mais seus recursos de compreensão da linguagem natural e da intenção de pesquisa.

Existem quatro marcos importantes que tornam a busca semântica o que é em 2020.

  • Gráfico de conhecimento
  • beija Flor
  • RankBrainName
  • BERT

Gráfico de conhecimento

O Knowledge Graph do Google , lançado em 2012, é uma base de conhecimento de entidades e os relacionamentos entre elas.

Você pode imaginar algo assim, mas com cinco bilhões de entidades  :
imagem colada 0 11

Resumindo, é uma tecnologia que deu o pontapé inicial e permitiu a mudança da correspondência de palavras-chave para a correspondência semântica.

Existem dois métodos principais para alimentar o Gráfico de conhecimento:

  1. Dados estruturados (mais sobre isso depois)
  2. Extração de entidade do texto

Para o segundo ponto, o mecanismo de busca precisa entender a linguagem natural. É quando as três atualizações algorítmicas abaixo entram em ação.

beija Flor

Em 2013, o Google lançou um algoritmo de busca chamado Hummingbird  para retornar melhores resultados de busca. Foi especialmente útil para consultas de pesquisa complexas.

O Hummingbird foi a primeira atualização colossal que enfatizou o significado das consultas de pesquisa em vez de palavras-chave individuais. Foi o catalisador necessário para escrever sobre tópicos, não palavras-chave.

RankBrainName

Se você já encontrou a frase Latent Semantic Indexing ou palavras-chave LSI , esqueça isso. O Google resolve o problema para o qual o LSI foi criado para resolver com um algoritmo chamado RankBrain.

E já discutimos o problema anteriormente. Tratava-se do descompasso entre a linguagem utilizada nas consultas de busca e o conteúdo desejado.

O RankBrain do Google é alimentado por tecnologias muito superiores ao LSI. Em termos leigos, o RankBrain entende o significado até mesmo de palavras e frases desconhecidas usando algoritmos sofisticados de aprendizado de máquina.

Leia:   Estrutura de site de SEO: por que não faz sentido (e o que fazer em vez disso)

E isso é enorme, considerando que 15% de todas as consultas de pesquisa são novas .

Podemos considerar o RankBrain uma atualização para o Hummingbird, não um algoritmo de busca independente. É um dos sinais de classificação mais fortes , mas a única coisa que você pode fazer proativamente para otimizá-lo é satisfazer a intenção de pesquisa .

BERT

Representações de codificador bidirecional de Transformers (BERT) é a mais nova grande atualização de como a pesquisa semântica funciona. Afeta aproximadamente 10% de todas as consultas  desde o final de 2019.

Não se preocupe; também levei algum tempo para lembrar o que significa BERT.

Tudo o que você precisa saber é que o BERT melhora a compreensão de frases e consultas longas e complexas. É uma solução para lidar com ambigüidades e nuances porque busca entender melhor o contexto das palavras.

E embora você não possa fazer nada para otimizar o BERT per se, é bom saber o que ele significa e o que ele faz em poucas palavras.

Eu já espalhei algumas sugestões e dicas ao longo do artigo. Agora vamos nos tornar verdadeiramente acionáveis.

  1. Segmente tópicos, não palavras-chave
  2. Avalie a intenção de pesquisa
  3. Usar HTML semântico
  4. Usar marcação de esquema
  5. Construa sua marca para se tornar uma entidade do Knowledge Graph
  6. Crie relevância por meio de links

1. Segmente tópicos, não palavras-chave

Nos velhos tempos de SEO, você poderia ter uma classificação alta com partes separadas de conteúdo sobre o mesmo tópico, mas segmentando palavras-chave ligeiramente diferentes, como:

  • tags de gráfico aberto
  • metatags de gráfico aberto
  • og meta tags
  • marca de gráfico aberto
  • o que é gráfico aberto
  • tags de gráfico aberto do facebook

Isso não é mais o caso. O Google agora entende que todas essas pesquisas significam praticamente a mesma coisa e classifica principalmente as mesmas páginas para todas elas.

Tenha isso em mente ao criar conteúdo. O objetivo não é mais classificar para apenas uma palavra-chave, mas cobrir um tópico em profundidade para que o Google classifique sua página para muitas palavras-chave semelhantes e de cauda longa .

Por exemplo, nosso artigo sobre meta tags do Open Graph classifica bem para centenas de palavras-chave. Muitos deles são outras formas de pesquisar a mesma coisa, mas alguns são subtópicos como “og:title”, “og url” e “og:image”.

palavras-chave de gráfico aberto 1

Podemos classificar todas essas palavras-chave porque escrevemos um artigo detalhado sobre o tópico, não apenas sobre uma única palavra-chave.

Observar este relatório em busca de uma página de classificação superior sobre o tópico é uma boa maneira de entender sobre quais subtópicos escrever. Por exemplo, digamos que você queira escrever um post sobre o cultivo de aspargos. Se você inserir a página de melhor classificação para “cultivar aspargos” no Site Explorer do Ahrefs  e verificar o relatório de palavras-chave orgânicas  , verá que está classificado para essas palavras-chave entre outras:

  • quão profundo plantar espargos
  • condições de cultivo de espargos
  • quando plantar aspargos
  • melhor lugar para plantar aspargos
  • como colher aspargos
  • como cuidar de espargos

Essas são todas as coisas que você gostaria de mencionar para criar uma postagem detalhada que obtenha o máximo de tráfego orgânico possível.

Contudo, uma palavra de cautela. Segmentar um tópico específico não significa que você deva cobrir absolutamente tudo relacionado a esse tópico ou se aprofundar demais.

Tome este artigo como exemplo. Eu poderia ter passado dezenas de horas pesquisando o processamento de linguagem natural e me aprofundando nos detalhes técnicos da busca semântica. Eu não fiz isso porque a maioria das pessoas não se importa com isso.

O que nos leva ao próximo ponto.

2. Avalie a intenção de pesquisa

Você ainda pode publicar conteúdo sobre um determinado tópico que não esteja alinhado com a intenção de pesquisa.

Leia:   Como a IA pode melhorar as interações com os clientes de viagens

Digamos que você seja um geek de dados de marketing e veja uma oportunidade de segmentar o tópico “relatório de SEO”. Naturalmente, você deseja compartilhar tudo o que é necessário para criar o melhor relatório de SEO. Então você cria algo como “Use o poder da QUERY para criar o melhor relatório de SEO”.

De fato, pode ser o conteúdo que leva ao melhor relatório de SEO. Mas a maioria das pessoas que procuram por esse tópico não está familiarizada com muitas funções das planilhas do Google . Eles só querem algo que possa fazer o trabalho por eles:

classificação de modelo de seo 1

Portanto, antes de começar a delinear um novo conteúdo, observe as páginas com melhor classificação para inferir a intenção da pesquisa.

Leitura recomendada:  Intenção do pesquisador: o ‘fator de classificação’ negligenciado para o qual você deve otimizar

3. Use HTML semântico

Antes de podermos progredir para a pesquisa semântica, tivemos que começar a mudar para uma Web semântica. O conceito original de WWW poderia ser interpretado como documentos interligados padronizados sem nenhum significado explícito. Até agora, deve estar claro que precisamos de significado.

E tudo começa com seu HTML básico.

Compare os seguintes elementos HTML:

pesquisa semântica 1

O HTML semântico adiciona significado ao código para que as máquinas possam reconhecer blocos de navegação, cabeçalhos, rodapés, tabelas ou vídeos.

O HTML5 fornece os elementos mais semânticos, que a maioria dos temas CMS modernos já usam. Se o seu não tiver, geralmente há um plug-in que você pode usar para adicioná-los.

Mas o HTML semântico ainda é bastante limitado. Embora diga “isto é uma tabela, isto é um rodapé”, não transmite o significado do conteúdo real. É por isso que esquematizamos a marcação.

4. Use marcação de esquema

A marcação de esquema é uma maneira adicional de marcar suas páginas. Também são chamados de dados estruturados , que podem ser descritos como uma estrutura semântica comum para a Web.

O vocabulário Schema.org  contém centenas de tipos associados a propriedades. Você pode usá-los para marcar seu conteúdo de uma maneira fácil para o Google entender sem algoritmos complexos.

Por exemplo, seria mais fácil para o Google extrair significado de um conteúdo estruturado como este:

tempo de cozimento: 20 minutos
calorias: 80

… do que da linguagem natural como esta:

Levará 20 minutos para fazer as panquecas. Melhor ainda, são panquecas de baixa caloria - cerca de 80 por porção.

Assim, quando um usuário quiser saber quanto tempo leva para cozinhar uma panqueca, ou quantas calorias ela tem, o Google pode servir a informação da melhor forma.

LEITURA ADICIONAL
  • O que são Dados Estruturados? E por que você deve implementá-lo?
  • Rich Snippets: o que são e como obtê-los?

5. Construa sua marca para se tornar uma entidade do Knowledge Graph

O título é praticamente autoexplicativo porque já falei sobre entidades, então vou apenas indicar nosso artigo sobre como entrar no Gráfico de conhecimento .

Dentre todas as dicas para adequar seu SEO à busca semântica, essa é a mais difícil de se concretizar. É uma consequência de longo prazo da construção da marca e da aplicação do restante dessas dicas.

Os links foram historicamente um dos primeiros indicadores de relevância. Se o documento A estivesse vinculado ao documento B, eles poderiam ser vistos como relacionados.

Links internos  e externos  de páginas relevantes usando texto âncora natural  ajudam o Google a descobrir sobre o que seu conteúdo pode ser, mesmo antes de processá-lo .

Você Pode Gostar