Bing Stefan Weitz: Onde é a busca está indo?

A+ A-

Na minha última coluna, eu tive a oportunidade de conversar com o diretor Bing Stefan Weitz sobre como a Microsoft está se aproximando de busca como situa-se hoje. Mas a pergunta que fiz que levam à entrevista, em primeiro lugar foi “Onde é que pesquisa a partir daqui?” Equipe Bing, da Microsoft certamente tem suas próprias idéias do que a busca poderia estar acontecendo e é isso que eu vou fazer a cobertura na continuação do minha conversa com Stefan. Em última análise, eu estou olhando como a pesquisa pode se tornar mais útil para os usuários.

Neste momento, existem dois grandes desafios que são boxe na pesquisa como uma ferramenta que é verdadeiramente útil no nosso dia-a-dia. O primeiro é um desafio de entrada. Idioma é notoriamente ambíguo. No meu último post, Stefan e eu conversamos um pouco sobre o desafio da semântica e da pesquisa. Quando eu digo “Jaguar”, o que quero dizer? É um animal, uma equipe NFL, um carro, um sistema operacional, ou algum outro significado obscuro que tem havido em uso em algum lugar?

O desafio idioma

Se somos pessoas falando com as pessoas, que têm a vantagem de contexto para nos ajudar a entender o significado. Se eu usar o termo “jaguar” em uma conversa sobre qual veículo eu estou comprando, você pode determinar rapidamente que eu quero dizer o carro. No entanto, se eu usar o termo quando estou falando sobre computação, você pode adivinhar que eu estou falando de um sistema operacional. Mas e se eu basta digitar “jaguar” na caixa de pesquisa? Como o Google ou Bing sabe do que estou falando?

Agora, tudo o que pode fazer é usar relevância como um sinal de proxy para minha intenção. Assim, no Bing, ele imagina que, sem a vantagem do contexto, eu provavelmente estou falando tanto o Jacksonville Jaguars, o gato ou o carro e protege suas apostas, apresentando uma mistura de resultados em torno desses três significados possíveis. Google tem um problema disambiguation similar. Dado o desafio de entrada, ambos os conjuntos de resultados são muito diversificado para ser verdadeiramente útil. Ambos exigem alguns ajustes adicionais de mim antes que eles possam entender o que é que eu estou procurando. Assim, o primeiro obstáculo para a pesquisa é tentar entender a linguagem:

Weitz: onde precisamos chegar, e onde estamos trabalhando para chegar, está a fazer melhor trabalho de ter o rastreador eo analisador realmente entender o idioma. Quando digo Tiras Crest White, pense no que índices de hoje estão indo fazer. Eles vão encontrar essas palavras em um PageRank e retornar esses resultados. O sistema tem que saber que Crest é uma marca e tiras brancas são uma forma de branqueamento dos dentes. Clareamento dos dentes é feito por um dentista. E dentistas muitas vezes não gostam de usar produtos off-the-shelf.

Você tem todas as coisas que eu sei sobre Tiras Crest White, só a partir ocasional ponto de vista da compreensão humana. A motores de hoje não sabem que. Tanto do cálculo intenção que temos que fazer para entregar um bom conjunto de resultados está ligada neste desafio de nos impregnando os motores e o índice e os analisadores com uma característica mais humana de compreensão o que estão lendo. Isso vai nos levar a intenção muito mais rápido do que um monte de truques matemáticos.

O triângulo de sinais desambiguação

O que Stefan está falando é a construção de inteligência da máquina que começa a colocar contexto em torno da linguagem. É uma daquelas áreas onde a lógica humana difusa supera drasticamente o poder de computação pura. Na verdade, o teste de Turing para a inteligência artificial é para uma máquina para ser capaz de conduzir uma conversa com um ser humano, sem o ser humano perceber que eles estão falando com uma máquina. Esta é uma tremenda alta barra para pular. Ela exige máquinas de pensar, da mesma forma que fazemos.

No caso da pesquisa, que exige a máquina para conectar uma etiqueta semântica com conceitos conhecidos que podem cercam esse rótulo, como no exemplo de tiras brancas de Stefan. Fazemos isso instantaneamente e sem esforço (embora falta de comunicação não é ocorrência rara, mesmo entre os seres humanos), mas, até agora, as máquinas não têm sido capazes de duplicar a façanha. Então, quais são os sinais de que a Microsoft poderia usar para conseguir isso? Sabendo mais sobre a pessoa que está fazendo a falar é um sinal de potencial:

Weitz: Personalização em busca tem sido falado por anos e anos e anos. Você pode realmente ter bastante precisa em sua personalização com um chocante número pequeno de variáveis: que hora do dia é, onde você está; os dois sozinhos nos dar uma chocantemente alta capacidade de personalizar os resultados de uma forma que aumenta a cliques. Então você começa o material mais complexo: o que você fez antes? Mesmo que, como sabemos, é cheio de problemas. A minha conta Amazon que minha esposa usa tem que ser podada a cada tantas vezes para refletir meus interesses um pouco mais de precisão.

Assim, além de personalização, podemos também explorar o gráfico social, convenientemente capturado através da atividade on-line:

Weitz: O outro modelo intenção, e não estamos chegando ao ponto em que podemos dizer isso com qualquer autoridade, é a sua primeira ordem rede social, o seu primeiro círculo de amigos. Quais são os seus interesses e como é que isso transitively revertem para seu perfil? O problema, claro, é que eu tenho centenas de amigos no Facebook e eu simplesmente não tenho que muitos amigos. E até mesmo meus amigos que estão perto Eu não concordo necessariamente com nem eu considerá-los a ser especialistas em uma determinada área como o projeto de pesquisa integrado que tenho algum interesse. Eu acho que as pessoas falam muito sobre como utilizar o seu gráfico social para encontrar sua intenção e eu acho que é repleta de problemas porque o gráfico social não é um gráfico limpo.

Finalmente, podemos tomar as nossas sugestões em uma base temporal a partir do que está acontecendo agora no mundo. Se Jaguar acaba de lançar um novo modelo que está definindo o Twittersphere um-zumbido e há um aumento repentino no tráfego de pesquisa, podemos conectar esses dois pontos sem um grande salto de fé:

Weitz: O que ele faz, especialmente com o Twitter ou um monte de estes serviços em tempo real, é fornecer sinais adicionais para um motor. Se você pensar sobre o Twitter, por exemplo, e quão rápido as coisas sobem e descem, o modelo tradicional de classificação simplesmente não funciona. Não é rápido o suficiente, não é lógico supor que você tem em links para tweets. Ele só não faz qualquer sentido. Podemos usar todos esses sinais de UGC como parte de um algoritmo que leva em conta a intenção do usuário, a resposta mais lógica para essa intenção e que a resposta é determinada por uma série de sinais: o que está acontecendo em tempo real, o que faz seu círculo social pensar nessas coisas, que é uma autoridade sobre este tema específico, eo que essa pessoa (ou entidade) quer ler ou escrever? Há uma série de fatores diferentes que olhar.

Mas, mesmo com essa triangulada conjunto de sinais, ainda é extremamente difícil determinar a intenção:

Weitz: Agora nós estamos nos estágios iniciais de intenção. Podemos olhar para localização e tempo. Podemos olhar para modelos & puré colaborativos de filtragem, se você fizer estas três consultas, podemos fazer a regressão para descobrir o que os 2 milhões de outras pessoas que fizeram 3 consultas semelhantes finalmente acabou a esse resultado particular. Essa é uma maneira muito matemático de compreender a intenção porque estamos apenas olhando para consultas semelhantes e destinos semelhantes.

Ironicamente, a pesquisa é o desaparecimento de destino

Então, nós temos o problema de entrada de endereço. Mas mesmo que assume que nosso atual paradigma de busca permanece relativamente constante, que é uma suposição irremediavelmente ultrapassada. A probabilidade de nós continuar a usar a caixa de pergunta ubíquo já está erodindo rapidamente. Mesmo agora, nós estamos à procura de maneiras que nunca fizemos antes. Isso também tem de ser tido em conta que a busca poderia estar acontecendo. São os dias de pesquisa como um destino de novo?

Weitz: Eu geralmente pesquisar a partir da barra de URL ou eu pesquisar a partir da pesquisa do navegador ou eu busca de um gadget ou eu faço as coisas que eu nem sequer pensar sobre como pesquisa. Eu vou para Yelp e eu uma “busca” ou eu vou no Facebook e eu faço um “search” ou eu estou no meu telefone e clique no novo aplicativo Bing e eu recebo um mapa e eu pergunto o que encontra nas proximidades e eu recebo um monte de resultados. Essa é uma pesquisa muito implícito. Eu não pedi-lo para fazer uma pesquisa, mas o cliente sabia que a melhor maneira de encontrar a informação sobre o que é perto da minha localização física é a realização de uma meta-pesquisa, passando-o um monte de variáveis: latitude, longitude, categoria, etc , todos em meu nome sem me ter de realmente fazê-lo e me voltar para trás um monte de informações.

Esta noção de “fazer uma pesquisa” está rapidamente se tornando fora de moda. Minha filha é cinco e como você pode imaginar, minha casa tem 12 máquinas rodando em um dado momento. Há um iPod touch que está na web e ela usa-lo para consultar as coisas por diante. Sua noção de “ir para” um motor e pesquisa é bastante cômico. Ela só assume que tudo é sempre cognoscível, instantaneamente, em seus dedos através de algum mecanismo.

Stefan toca em um conceito aqui que aponta para o que temos de começar a olhar para quando pensamos em busca-a idéia de que a pesquisa se senta “sob” a nossa linha atividades de que ele fica “em” um aplicativo ou uma plataforma. No meu próximo Apenas Comporte-se, eu vou ser explorar ainda mais este conceito com John Battelle. Mas, por agora, isso nos leva a outro grande desafio que enfrenta pesquisa: como você apresentar resultados de uma forma verdadeiramente útil? A informação é raramente um “estado final.” A informação é um meio para terminar. Queremos fazer algo com a informação. E a partir dessa perspectiva, a pesquisa ainda tem um longo caminho a percorrer.

Weitz: Não é apenas sobre jogar um monte de documentos que podem ter um alto PageRank de volta para você, mas isso é sobre o modelo da web está se movendo em direção: é muito mais dinâmico, muito mais social, muito mais “tempo real”, tanto menos estático. Uma das coisas que fazemos, em que faz sentido, é para pré-processar os bilhões de pontos de dados que temos de todas as fontes de dados diferentes e quando faz sentido, enviar a consulta uma resposta que faz sentido. Ele não tem que ser apenas mais um link. Por exemplo, poderia ser Farecast, onde vemos os preços subindo e descendo para diferentes companhias aéreas. Poderia ser ranking de opinião, onde nós realmente olhar para todos os comentários de restaurantes em toda a web e resumir os de uma forma inteligente. Nós podemos jogar para trás mais do que apenas uma oportunidade para mais exploração, para ser agradável sobre ele, e nós podemos realmente contribuir para o usuário algum conhecimento que teria levado horas, ou centenas de horas ou uma quantidade infinita de tempo para resolvê-lo em conta própria.

Móvel ... finalmente?

Talvez o teste ácido de “utilidade” em busca podem ser encontrados em nosso dispositivo móvel. Aqui, quando procurar informação, é quase sempre porque nós estamos prontos para fazer algo com ele. Assim, de forma adequada, a minha última pergunta para Stefan tinha a ver com o futuro da pesquisa utilidade móvel.

Weitz: Eu estive neste setor há mais de uma década conhecer e sempre foi que o celular será “no próximo ano”. O próximo ano será o ano para mobile..from 1999 sobre, no próximo ano será o ano para celular. Estamos finalmente no ponto onde eu posso dizer com uma cara séria tanto que já estamos lá ou ele está vindo muito rapidamente. Nós estamos vendo um enorme crescimento no número de consultas a ser emitidos a partir de dispositivos móveis.

É incrível o que você pode fazer com um destes dispositivos do ponto de vista de pesquisa quando você pensa de todas as informações que entender. Nós entendemos a sua latitude e longitude, por isso sabemos a sua localização. Entendemos melhor suas consultas anteriores, porque ao contrário do PC, o dispositivo móvel é bastante pessoal. Minha esposa geralmente não chegar no meu telefone e começar a consultar ao redor. Ela tem seu próprio telefone para isso. Minha filha faz também. Você tem uma melhor oportunidade de adaptar um resultado melhor porque é menos provável de ser corrompido pelo uso de outro. O vídeo, as fotos, toda a informação que podemos reunir se o usuário dá-lo para nós, essa massa de dados que podemos usar para entender melhor quem é essa pessoa eo que eles estão realmente procurando. Nós podemos empurrar as coisas para eles sem sequer ter que pedir, que eu acho que é a coisa que mais me excita.

As coisas que estamos vendo agora com realidade aumentada, onde estamos sobrepondo uma tela de vídeo com dezenas de pesquisas implícitas que estão acontecendo nos bastidores. É como se você está usando os óculos mágicos de histórias em quadrinhos, como se estivesse no Matrix. Quando eu segurar um telefone e eu só pan através de uma paisagem, e mais que a paisagem, como eu estou panning, ele está puxando em casas que estão à venda, é puxar em comentários do Yelp em empresas locais, está puxando em informações sobre o cordilheira que eu vejo ao longe. Estas são as coisas de ficção científica e todos eles são de pesquisa conduzida. É por isso que esta noção de uma caixa de texto que você perfura uma consulta em em um telefone é muito “há quatro anos.”

Como já referi, na próxima coluna, eu estarei compartilhando algumas das coisas que eu tive a chance de conversar com John Battelle sobre quando nós exploramos o potencial futuro da pesquisa.


As opiniões expressas neste artigo são as do autor convidado e não necessariamente Search Engine Land. Autores pessoal aqui.


Ads

Compartilhar