Visualmente compreender a estrutura do site e do impacto de peso ligação externa

A+ A-

Dizem que uma imagem vale mais que mil palavras - e wow, eles são corrigir!

Hoje, eu estou indo para ilustrar maneiras poderosas para visualizar a estrutura do site, especificamente no que se refere às páginas que adquirem ligações recebidas; No entanto, nós também vamos discutir outras aplicações desta técnica usando análise de métricas ou outros dados de terceiros.

Há uma série de razões que você iria querer fazer isso, entre eles para fornecer um contexto visual para dados. Como veremos a seguir, representações visuais de dados podem ajudar a identificar padrões rapidamente nas estruturas do local que pode não ser evidente quando visto como uma planilha ou como dados brutos. Você também pode usar esses recursos visuais para explicar aos clientes e outras partes interessadas o que está acontecendo em uma estrutura de site.

Para construir uma representação visual da nossa estrutura local no que se refere às ligações recebidas, que serão:

  • correndo gritando sapo para reunir dados página interna e estrutura de links.
  • adicionando o número de backlinks cada página tem de métricas da página.
  • usando Gephi para criar uma representação visual dos dados.

Para aqueles não familiarizados com Gephi, é uma ferramenta de visualização de dados de código aberto - basicamente, que transforma dados em um quadro interativo.

Obtendo seus dados núcleo

Independentemente de saber se você quiser visualizar a estrutura do site em relação ao seu tráfego do local ou outra métrica, o processo é essencialmente o mesmo. Então, vamos começar por ...

Coletando suas estrutura de links internos

O primeiro passo é baixar gritando sapo se você não o tenha instalado. Para sites com menos de 500 URLs, a versão gratuita será suficiente; aqueles com maiores sites pode querer comprar a versão premium, embora eles ainda podem usar a versão gratuita para obter algumas idéias aproximada do que sua estrutura local está fazendo.

Agora, use gritando sapo para rastrear o site que você deseja mapear. Você não precisa coletar as imagens, CSS, JavaScript e assim por diante, de modo que a configuração de aranha deve ser semelhante à captura de tela abaixo. (No entanto, você vai querer tomar suas próprias decisões sobre se pretende pesquisar subdomínios e assim por diante, com base em suas necessidades e estrutura do site.)

gritando Sapo

Digite o domínio que você deseja verificar e clique em “Iniciar”. Uma vez que o rastreamento é concluído, é hora de exportar os dados e limpá-lo um pouco. Para fazer isso, basta ir a:

Exportação em massa> Response Codes> Sucesso (2xx) inlinks

Uma vez baixado, abra o arquivo e faça o seguinte:

  • Excluir a primeira linha contendo “Todos os inlinks.”
  • Excluir a primeira coluna, “Type”.
  • Renomeie a coluna “Destination” “Target”.
  • Excluir todas as outras colunas, além de “Fonte” e “Target”.
  • Salve o arquivo editado. Você pode nomeá-lo o que você quiser, mas eu vou estar se referindo a mina de todo o artigo como working.csv.
Limpar os dados de rã gritando em Excel

Eu recomendo a digitalização através de suas colunas origem e destino para procurar anomalias. Por exemplo, o site Eu rastejei para as capturas de tela abaixo continha links de âncora em um grande número de páginas. Eu fiz uma pesquisa rápida para o hashtag na coluna Target e excluídos aqueles que eles não distorcer minhas informações fluxo link.

Com isso, ficamos com uma planilha que deve ser algo como isto:

Estes dados só pode ser muito legal para analisar - e para esse fim, eu recomendo ler o artigo de Patrick Stox, “visualizações fáceis de PageRank e Página Grupos com Gephi.”

Em seu artigo, Stox usado Gephi de visualizar as relações entre páginas de um site e ver quais páginas são mais fortes (com base no gráfico de links internos do site).

Gephi modularidade

Você pode ler o seu artigo para direções e uma descrição, mas em suma, o que estamos vendo é diferentes “clusters” de páginas (com base no qual existem ligações juntos na maioria das vezes - não é perfeito, mas não é ruim), agrupados por cor e tamanho por links internos (com a mais-linked para páginas que aparecem maiores).

Esta informação é útil, para ter certeza. Mas o que se quer mais? O que se deseja colorir verdadeiramente as páginas com base em sua seção do site, e se queremos que eles dimensionados pelo número de links externos de entrada?

Para conseguir isso, você primeiro precisa baixar suas páginas linkadas de topo de Google Search Console. Se você não tiver feito isso antes, você basta fazer login em sua conta do Search Console e faça o seguinte:

  • Clique em “Tráfego Search” na navegação à esquerda.
  • Clique em “Links para seu site” no menu que se abre.
  • Clique em “More >>” na coluna “Seu conteúdo mais ligados.”
  • E “Baixar esta tabela.”

O único problema com os dados, uma vez que é baixado é que para os nossos propósitos, precisamos das URLs na forma de um domínio, e a tabela só mostra o caminho. Para lidar com isso facilmente, você simplesmente pode:

  • Abra a planilha.
  • Inserir uma nova coluna A antes do caminho URL.
  • Ponha seu https://www.yourdomain.com/ domínio na célula A3 (assumindo B2 contém o domínio que estranhamente é a única URL para exibir completamente) para que você não criar https://www.yourdomain.com/https : //www.yourdomain.com/.
  • Clique duas vezes no canto inferior direito da célula com o seu domínio recentemente adicionado ao copiar o domínio para a parte inferior da planilha.
  • Selecione os dados de colunas A e B (o domínio eo caminho) e copiá-lo para o bloco de notas.
  • Localizar e substituir “/ /” com “/” (excluindo as aspas).
  • Selecionar tudo no bloco de notas.
  • Passado isso em coluna B e excluir coluna A.
  • Agora você tem a mesma lista, mas com a URL completa.

Obtendo os dados em Gephi

Aqui, nós estaremos upload do arquivo Source / Target CSV que criamos anteriormente e nomeado working.csv. Isto irá criar as bordas e nós Gephi precisa para criar os gráficos. (Para os nossos propósitos aqui, um é uma página, e uma borda representa a ligação entre as páginas.) Para importar a planilha, basta abrir Gephi e vá para: Arquivo> Importar planilha.

Uma nova janela será aberta onde você irá selecionar o arquivo working.csv e selecione “mesa Edges” (já que estamos importando as conexões entre as páginas). Será algo como:

arestas de importação em Gephi

Na próxima tela, você vai ser mostrado um par de opções (muito limitado neste exemplo). Basta certificar-se a caixa “Criar nós desaparecidas” está marcada e clique em Avançar.

arestas de importação em Gephi

Assumindo que se abre para a guia Overview (que deveria na primeira utilização), você será presenteado com algo que se parece com:

Gephi importado

Um pouco confuso, e nós não estamos indo para limpá-lo ainda. Primeiro, vamos cabeça para o Laboratório de dados e exportar os Nodes (leia-se: páginas).

Laboratório Gephi Dados

Uma vez no Laboratório de dados, verifique se você está olhando para os nós clicando no botão Nodes perto do canto superior esquerdo. Uma vez lá, basta exportar a tabela para que você tenha um arquivo CSV de todos os seus nós.

Quando você abre o CSV, ele deve ter as seguintes colunas:

  • Identidade
  • Rótulo
  • Horário definido

Você vai adicionar uma quarta coluna o nome de qualquer métrica que você deseja puxar. Aqui, eu estou indo para puxar nos domínios referentes conforme relatado no Console de Pesquisa, por isso vou rotular a quarta coluna (D) “, referindo domínios. ”O quinto será‘modularity_class’.

Você vai querer adicionar temporariamente uma segunda folha para a planilha e nomeie-o “console de pesquisa.”

Na célula D2 (logo abaixo do cabeçalho da coluna D), introduzir a seguinte fórmula:

= IFERROR (INDEX ( 'busca console' $ C $ 2: $ C $ 136, MATCH (A2, 'busca console' $ A $ 2: $ A $ 136, 0), 1) “0",)

No meu exemplo aqui, há 136 linhas em meus dados do Search Console. O seu pode variar, caso em que o 136 na fórmula acima deve ser alterado para o número de linhas na sua lista. Além disso, se você queria para listar as suas contagens de ligação e domínios não referindo, você mudaria o Cs BS por isso a busca é através da coluna B em vez de C.

Depois de concluído, você vai querer copiar a coluna domínios referindo e use o comando “colar valores”, que irá mudar as células de conter uma fórmula para que contém o valor de seu número de domínios referindo como um inteiro.

O processo é semelhante a:

Adicionar referindo domínios para nós

Agora, finalmente, você quer adicionar uma quinta coluna, com o título “modularity_class.” Embora Gephi tem modularidade embutido, que irá agrupar páginas semelhantes em conjunto com base na estrutura de links internos, eu prefiro uma abordagem mais manual que defina claramente a categoria do página .

No meu exemplo, eu estou indo para atribuir um dos seguintes valores para cada página na coluna modularity_class, com base na categoria página:

  • 0 - misc / outro
  • 1 - posts
  • 2 - páginas de recurso
  • 3 - Informações da Empresa
  • 4 - serviço
  • 5 - página inicial

Como você quebrar suas categorias a vontade, é claro, depende de seu site (por exemplo, você pode quebrar o seu site de e-commerce por tipo de produto, ou o seu site de viagens pela localização).

Depois de salvar isso como um CSV chamado nodes.csv, você simplesmente precisa importar esta planilha para o projeto atual Gelphi utilizando o botão Import Spreadsheet no Laboratório de dados da tela exportado do.

nós importação para Gephi

Na próxima tela, você vai ter certeza “referindo domínios” e “modularity_class” estão definidas para flutuar e certifique-se os “nós força a ser criado como novos” caixa estiver desmarcada. Em seguida, clique em “Avançar”. Uma vez importado, você vai estar a olhar para uma página como:

importação laboratório dados completos

Em seguida, você clique em voltar para a Visão no topo da Gephi. Neste ponto, você vai perceber que não muita coisa mudou ... mas ele está prestes a.

Há uma tonelada você pode fazer com Gephi. Eu recomendo rodar a simulação PageRank, que você vai encontrar em Configurações no lado direito. As configurações padrão funcionam bem. Agora é hora de usar todos esses dados.

Primeiro, vamos colorir os nós com base no seu tipo de página (modularity_class). No canto superior esquerdo, selecione “Nodes”, depois “atributo.” A partir do drop-down, selecione “modularidade Classe” e escolher a cor que você gostaria representando cada. Do meu exemplo acima, eu optou para as seguintes cores:

  • misc / outro - laranja
  • posts - luz roxa
  • recursos páginas - verde claro
  • Informações da Empresa - verde escuro
  • Serviço - azul
  • Página Inicial - rosa

Isto lhe dará algo próximo a:

modularidade cor em Gephi

Agora, vamos usar esses domínios referentes ao tamanho dos Nodes. Desta vez, precisamos selecionar o tamanho do atributo Para fazer isso, selecione o ícone de dimensionamento “referindo domínios.”; então, nos atributos, selecione “domínios referentes” e definir um min e dimensionamento máx. Eu gosto de começar com 10 e 50, mas cada gráfico é original, assim que encontrar o que funciona para você.

Se você achar que “referindo domínios” não está na lista (o que acontece às vezes), é uma falha estranha com uma solução alternativa igualmente estranho - e de crédito para rbsam no Github para ele:

Em Aparência / Atributos de cor que você pode definir o atributo de particionamento para Ranking no canto inferior esquerdo da janela. Se o atributo é definido como particionamento não aparecerá no atributo de tamanho. Se ele estiver definido para Ranking ela vai aparecer no atributo de tamanho.

O que isto significa é ...

Adicionar referindo domínios solução alternativa

Tudo bem, as coisas agora que temos um código de cores pelas várias seções do site e dimensionado pelo nível de incoming links para a página. Ele ainda parece um pouco confuso, mas nós não terminamos ainda!

O próximo passo é selecionar um layout na parte inferior esquerda. Eles todos parecem um pouco diferente e desempenham funções diferentes. Meus dois favoritos são Fruchterman Reingold (mostrado abaixo) e da Força Atlas 2. Você também pode brincar ao redor com a gravidade (ou seja, o quanto as bordas puxar os nós juntos). O site atual aparece como:

Apenas esta informação pode lhe dar uma visão muito interessante sobre o que está acontecendo em seu site. O que é importante saber é que quando você clica com o botão direito em qualquer nó, você pode optar para selecioná-lo no laboratório de dados. Quer saber o que essa página solitário no topo é e por que ele só tem uma ligação solitário para ele? Botão direito do mouse e vê-lo no laboratório de dados (que é um mapa do site, FYI). Você também pode fazer o mesmo em sentido inverso. Se você não vê uma página individual aparece, você pode encontrá-lo no laboratório de dados e clique com o botão direito e selecione-o na visão geral.

O que essa visualização nos dá é a capacidade de localizar rapidamente anomalias no site, descobrir quais páginas estão agrupadas de maneira específica, e encontrar oportunidades para melhorar o fluxo de PageRank e peso link interno.

E você não é esse limitada

Neste artigo, nós só olhou para uma aplicação, mas há muitos outros - nós simplesmente precisamos usar a nossa imaginação.

Por que não puxar o seu tráfego orgânico de entrada Moz Autoridade Página ou Google Analytics e usar isso como a métrica de dimensionamento para ver quais seções de seu site obter a maioria dos problemas de tráfego e ajudar a detectar em sua estrutura de ligação interna?

Por que não combinar a métrica de peso página Patrick Stox estava trabalhando com em seu artigo e mesclar o dimensionamento de suas páginas pelo seu tráfego de entrada? Com os ajustes certos, você pode começar uma sensação para a correlação entre cálculos de resistência página internos e tráfego.

Se há uma métrica que pode ser atribuído a uma página ou um link, ele pode ser usado aqui. Pense em como isso faz sentido para apresentar visualmente, e siga o processo acima e fazê-lo.

E tudo isso é apenas a ponta do iceberg. Uma das coisas mais poderosas que eu usei essa ferramenta para se ajudar na previsão do que vai acontecer com um site depois de uma grande mudança na sua estrutura interna de ligação. Mas isso é assunto para o artigo do próximo mês!


As opiniões expressas neste artigo são as do autor convidado e não necessariamente Search Engine Land. Autores pessoal aqui.