Blekko Blocos Mais “spam” Domínios: 1,1 milhões deles

A+ A-

Motor de busca Blekko anunciou que tem bloqueado 1,1 milhões de sites de seus resultados de busca usando um novo sistema que chama de “AdSpam”, e novas páginas a partir de qualquer web site não será adicionado se não passar o agrupamento.

Bloqueio de spam antes que ele chegue Em

A partir do comunicado de imprensa Blekko:

“Esta nova tecnologia irá bloquear o spam antes que ele nunca aparece em uma página de resultados de pesquisa”, disse Rich Skrenta, CEO da Blekko. “Temos de algoritmos identificados vários sinais de spam para cada página no índice. Eliminando esses domínios do nosso índice drasticamente limparam nossos resultados de pesquisa “.

E a partir post da empresa:

Hoje, estamos dando o próximo passo gigante para a frente com o lançamento do novo algoritmo AdSpam do Blekko. Esta nova tecnologia vai mudar drasticamente pesquisa. É o primeiro algoritmo de busca já criado para encontrar o spam ao invés de resultados de classificação. O algoritmo é projetado especificamente para reconhecer as páginas que são spam e eliminá-los antes que eles nunca aparecem nos resultados de busca.

Isso é interessante, essa idéia de bloquear páginas de spam antes de serem adicionados a um índice de pesquisa. Ele pode ter sido feito antes, mas se assim for, não me lembro por que serviço. Certamente, nunca foi algo digno de nota o suficiente para me lembrar. Se você manter o spam longe inteiramente, potencialmente que faz para resultados mais limpos.

Então, novamente, é também algo que é muito mais provável para beneficiar Blekko do que o Google ou Bing. A razão é que ambos os motores de busca têm algoritmos de busca muito mais maduros do que Blekko, então eles já pode fazer um trabalho melhor de manter o spam fora dos principais resultados, embora as páginas de spam em si são incluídos no índice pesquisável geral - que é como um grande livro de todas as páginas da web que você coletou.

Mais importante, o Google e Bing tem recursos enormes, onde a indexação de um milhão ou até mesmo um bilhão de páginas de spam realmente não deixar menos “espaço” para armazenar o “bom” material. Eles têm milhares de servidores. Armazenamento para eles é relativamente barato. Mas para Blekko, cada página do spam que índice é potencialmente mais caro.

Quanto ao nome “AdSpam” - isso é terrível. Percebi que vem da idéia de que estas são páginas carregadas com anúncios - mas acho que é bastante confuso.

Anteriormente Em “Proibido No Blekko”

No mês passado, Blekko ganhou alguma atenção, proibindo 20 sites “spam” de seu índice. De nossa cobertura em seguida:

Rica Skrenta, CEO da Blekko confirmou a proibição com a gente hoje. Ele nos disse Blekko decidiu proibir os “top 20 sites de spam do índice do Blekko inteiramente, com base em nossos usuários clicam / spam nos resultados.” Isto inclui ehow.com, um dos locais de geração de receita web top demanda de Media.

Os sites?

  • ehow.com
  • experts-exchange.com
  • naymz.com
  • activehotels.com
  • robtex.com
  • encyclopedia.com
  • fixya.com
  • chacha.com
  • 123people.com
  • download3k.com
  • petitionspot.com
  • thefreedictionary.com
  • networkedblogs.com
  • buzzillions.com
  • shopwiki.com
  • wowxos.com
  • answerbag.com
  • allexperts.com
  • freewebs.com
  • copygator.com.

Mas espere. São estes os sites de spam top 20 ou, como a libertação de Blekko disse hoje, os “top 20 fazendas de conteúdo.” Ambos. Nem. É confuso.

Spam está no olho do motor Beholder Pesquisa

Search engine spam é tudo o que um motor de busca decide que ele seja. Por exemplo, tanto o Google eo Bing, em geral, consideram as páginas que “manto” - show de conteúdo para o usuário que é diferente do que o que seus rastreadores automatizados ver - a ser spam. Ambos concordam em muitas outras táticas que seriam consideradas spam, mas eles podem não concordar com precisão. Nem eles vão concordar com Blekko.

Praticamente nenhum dos sites acima, desde a minha análise rápida, seria considerado spam pelo Google ou Bing. Certamente Google causou alguns deles a perder rankings em sua recente atualização Produtor / Panda. Mas isso não era porque eles estavam spam do Google. Era porque tinham algum conteúdo que o novo algoritmo decidiu não premiar, bem como no passado.

Em suma, conteúdo de baixa qualidade não é igual a spam, não para o Google ou Bing. É apenas algo que não irá classificar como altamente, que é exatamente o que os seus algoritmos é suposto fazer.

Com lista de bloqueio inicial de Blekko, decidiu que os sites eram spam com base em relatórios de usuários, independentemente de esses sites violado quaisquer orientações tradicionais de spam motor de busca. Com o mais recente movimento, Blekko é ainda decidir que a baixa qualidade é igual a spam. Mais uma vez, a partir do posto:

Então, o que é exatamente é AdSpam? Em suma, é um algoritmo de aprendizado de máquina que analisa páginas para sinais de spam específicas - a presença de múltiplas posições de anúncios de exibição em uma única página e fino para o conteúdo zero.

O resultado final da abordagem da Blekko contra Google poderia potencialmente ser o mesmo. Google pretende manter o conteúdo “superficial” de aparecer para muitas pesquisas, mesmo que as páginas estão entre aqueles que recolheu. Blekko também é com o objetivo de manter o conteúdo superficial - mas ao contrário do Google, que se aplica o rótulo de “spam” para tais conteúdos e está impedindo que ele seja indexado em primeiro lugar.

O que foi agora?

Ao longo do New York Times, Claire Cain Miller tinha uma boa parte sobre a mudança da Blekko e se bons sites pode ser prejudicado. Não, diz Blekko:

Embora pareça como muitos sites legítimos poderia ser considerado spam sob este algoritmo - jornais cobrem uma ampla variedade de tópicos, por exemplo, e muitos blogueiros podem ser escritores amadores, mas são especialistas em seus campos - Mr. Skrenta disse que quando ele penteados através de milhares de sites que o algoritmo proibidos, ele encontrou apenas dois falsos positivos.

Exemplos de sites Blekko agora proíbe: cheap-refrigerators.net, best-weddinggifts e Boston.diningguide.com.

Ajuda?

Eu não fiz qualquer teste generalizada. Mas percebendo que o nome do web site cheap-refrigerators.net acima, que foi confirmado como removido - “Frigoríficos Dicas de compra” - pensei uma pesquisa sobre o assunto podem ser interessantes:

Você pode clicar para ampliar a imagem. Eu removi o anúncio que estava no topo dos resultados de ambos Blekko e Google, para que possa concentrar-se nas cinco principais resultados editoriais. Minha vez:

Blekko

  1. OK, mas curto e básico
  2. Irrelevante - você tem que procurar mais no site para obter dicas
  3. Boas dicas básicas de grande varejista
  4. conteúdo fina que apenas links para conteúdo mais fina
  5. Irrelevantes - cerca de filtros de água para frigoríficos

Google

  1. Bom, substancial artigo multi-parte
  2. Bom, dicas curtas que levam a mais comentários
  3. boas dicas
  4. Boas dicas de Consumer Reports, uma importante marca de confiança
  5. dicas OK, cerca de três anos

Desculpe, Blekko - Eu não posso dizer que cair nesse site geladeira, muito menos as outras 1 milhão ou mais outros sites, você ajudou em tudo contra o Google para esta consulta particular. Usando o / comentários slashtag ajudou - que tem um dos bons sites que o Google teve de ser listada em primeiro lugar. Mas os outros três bons sites que o Google teve no top cinco resultados não mostraram.

Além disso, a maioria dos pesquisadores típicas não vão usar slashtags - e há ainda menos razões para usá-los quando a mesma pesquisa no Google traz melhores resultados, não slashtag necessário.

The Human Factor

O post de Blekko também diz:

Ao contrário de algoritmos usados ​​por outros motores de busca, AdSpam está sendo usado em conjunto com curadoria humana para detectar a continuar a guerra contra o Spam.

Verdadeiro - Blekko está fazendo uso de esforços humanos para decidir o que é bom e ruim. Em particular, Blekko recentemente uma parceria com a pilha Exchange (anteriormente Stack Overlow) para curadoria de programação e tópicos técnicos.

Esperar Google para empurrar para trás em toda a “não tem seres humanos” aspecto, no entanto. Ele já fez isso antes, a última vez quando ambos Mahalo e Search Wikia tentou esse ângulo. Google enfatizou que ele tem revisores humanos, que servem como uma espécie de “double-check” no algoritmo de computador muda faz, por exemplo.

Google salientou este novo recentemente, quando ele fez a atualização Farmer, para destacar que a mudança baseado em computador parecia ser apoiada pelos dados humano que busca modelar. Google também sugeriu que o que as pessoas bloquear usando sua extensão Chrome Blocklist pessoais poderiam ser dados que são usados ​​em seu algoritmo de busca, no futuro.

Ainda assim, o Google tem nada como a curadoria slashtag que Blekko oferece. Dito isto, Blekko ainda tem que mostrar que esta curadoria está se transformando em resultados de maior qualidade que estão atraindo usuários significativos do Google, muito menos Bing. Mas em frente ao PR, não há dúvida de que os movimentos de Blekko estão mantendo pressão sobre o Google a melhorar também.

Mais informações

Eu não tive a chance de conversar com Blekko mais sobre o sistema, como eu estou atualmente em nossa conferência de marketing de busca SMX West, em San Jose. Blekko - juntamente com Google e Bing - participa no nosso “The Police Spam” e “Pergunte os motores de busca” sessões de amanhã, então eu esperar mais específica sob o capô detalhes vão surgir a partir disso. Fique atento (e também assistir a cobertura relacionada no Techmeme). Veja também os artigos abaixo para mais fundo em algumas das coisas que eu mencionei acima.


Ads

Compartilhar

Recente

Ocupe-se de sua empresa: Nossos principais colunas de busca local de 2017

profissionais de SEO locais têm um papel cada vez mais impo...

SearchCap: Papai tracker, termos API do Google e métricas de SEO

Abaixo está o que aconteceu em busca de hoje, conforme rela...

Marlene Dietrich Google honras do doodle de carreira da lendária atriz

Marlene Dietrich, a atriz alemã-nascido icônico, está sendo...

Google resultados da pesquisa de imagem testa novo pesquisas relacionadas caixa

Google está testando uma nova caixa “pesquisas relacionadas...

Comentários