Deep Learning e o futuro do marketing de busca

Enquanto o mercado de SEO está discutindo se haverá uma reversão de algoritmos sem link no Yandex ou não, vamos falar sobre aprendizado profundo (e depois não diga que você não ouviu falar).

Por que você precisa saber sobre isso? Porque o aprendizado profundo é uma revolução no aprendizado de máquina que ocorre diante de nossos olhos. E num futuro próximo, o aprendizado profundo mudará além do reconhecimento tanto da busca em si, quanto da classificação na apresentação natural e do nosso mundo como um todo (não muito, não o suficiente).

Então, o que é aprendizado profundo? Em russo, esse termo ainda não está resolvido e traduzido de maneiras diferentes. Eu prefiro a tradução de "deep learning" (em vez de "deep"), que foi sugerida por Dmitry Vetrov, um dos especialistas russos, como o principal.

“Aprendizado profundo” é um tipo de aprendizado de máquina baseado em redes neurais. Hoje, o uso da "aprendizagem profunda" é baseado em sistemas de reconhecimento de fala, reconhecimento de objetos visuais (estáticos e em movimento) e, finalmente, a interação de sistemas computacionais com a linguagem natural e o isolamento de significados.

Parece que tudo é simples, tudo está claro e, ao que parece, não nos interessa. Mas ... Mas, na verdade, estamos falando de uma verdadeira revolução no aprendizado de máquina. Não começou ontem, os princípios gerais da "aprendizagem profunda" existem há muito tempo. Mas a incorporação real da aprendizagem profunda tornou-se possível no início desta década, quando a criação de redes neurais de computadores foi significativamente mais barata. E começando aproximadamente a partir de 2012, ocorreu um boom real conectado com as tecnologias de "aprendizagem profunda" no aprendizado de máquina. No entanto, ainda há muito poucos especialistas em "aprendizagem profunda" no mundo, e a necessidade deles é muito alta. Por exemplo, o algoritmo para reconhecer significado em textos foi criado por praticamente uma pessoa - Thomas Mikolov. Naquela época, ele estava trabalhando no Google, mas quase imediatamente depois disso, ele foi “fisgado” pelo Facebook.

Acima, eu já disse que "deep learning" é um tipo de aprendizado de máquina. Mas isso não é bem verdade, na verdade. O aprendizado de máquina clássico é a extração de novos conhecimentos de um grande corpo de dados que uma pessoa carrega em uma máquina. Uma pessoa formula as regras de aprendizado de máquina (devido ao chamado "conjunto de treinamento") e a regra de erros de máquina (elimina o efeito do chamado "reconversão"). Mas o aprendizado de máquina clássico tem desvantagens significativas - dados para processamento e exemplos de soluções são dados à máquina por humanos. Em outras palavras, no aprendizado de máquina clássico, um computador executa um grande número de tarefas, mas não forma essas tarefas de forma independente. O conceito de "aprendizagem profunda" sugere que a própria máquina cria um funcional para si, tanto quanto possível no tempo atual.

O conceito de "profundidade" aplicado à aprendizagem de máquina envolve a modelagem de abstrações em vários níveis ("camadas") e traduzi-las em dados. Quanto mais dessas "camadas" ("profundidades"), mais tarefas altamente intelectuais a rede neural pode executar. Ao mesmo tempo, ela os executa sem a ajuda de uma pessoa.

De fato, "aprendizado profundo" é o primeiro e um grande passo em direção à inteligência artificial. Redes neurais são sistemas que, embora ainda primitivos, pensar, isto é criar novas descobertas a partir dos dados criados por eles mesmos. O mecanismo de abstrações de vários níveis ("camadas"), usado em treinamento profundo, é muito semelhante ao mecanismo de aprendizagem de um jovem humano. Quando uma criança aprende primeiro os sons, depois as palavras individuais e só então as frases - a rede neural “profunda” passa de abstrações simples (de superfície) para abstrações mais complexas.

Aprendizagem profunda Revolução

Ao longo de 2012 e 2013, o Google está silenciosamente, mas metodicamente, comprando empresas ativas e start-ups no campo da aprendizagem profunda. Entre eles estavam empresas bastante grandes (por exemplo, o custo da British DeepMind, de acordo com especialistas no momento da compra pelo gigante das buscas, variou entre 400 e 500 milhões de dólares) e muito anão - por exemplo, DNNresearch, no qual o Google trabalhava na época da compra da empresa. apenas três funcionários - Jeffrey Hinton e seus dois alunos de pós-graduação.

Hinton, professor da Universidade de Toronto, iniciou suas pesquisas no campo da construção de redes neurais nos anos 80 do século passado e, de fato, é hoje o especialista mais autorizado do mundo em aprendizado profundo. É no trabalho científico de Hinton que muitos sistemas baseados em "aprendizagem profunda" se basearam. Em 2011, o Google criou sua primeira rede neural, chamada Google Brain (que já está sendo desenvolvida como uma divisão cult do Google X), e Hinton inicialmente participa do desenvolvimento da rede neural como consultor contratado, e dois anos depois se junta à equipe com seus alunos de pós-graduação. Google Brain (sem deixar o seu ensino na Universidade de Toronto).

A rede neural do Google Brain (em 2012, consistia de 16 mil processadores) começa a aprender. Ao longo do caminho, resolvendo problemas aplicados - por exemplo, precisamente por causa da rede neural, o número de erros de reconhecimento de comandos de voz na pesquisa diminuiu em 25% - ela descobre uma criatura como um gato.

Apenas estudando os milhões de imagens no canal do Youtube, a rede neural artificial abriu o gato. De fato, a solução de tal problema é extremamente complicada, porque é difícil formalizá-lo. Você pode criar um algoritmo que reconhecerá gatos em certos tipos de fotos (com um ângulo semelhante, com tamanhos semelhantes de objetos). Você pode criar um algoritmo que desenhe esses gatos. Mas como criar um algoritmo que reconhecerá os gatos de qualquer ângulo, se ele, o algoritmo, não entender o que é um gato?

A rede neural deveria ter começado a entender isso. E ela aprendeu isso. Ela se treinou, a pessoa não definiu tal tarefa para ela.

É claro que, por enquanto, tudo não é tão cor-de-rosa. A rede neural distingue gatos em imagens apenas em 15% dos casos. A precisão pode ser muito maior se a rede estudar o mesmo tipo de material. Isto é, na verdade, a precisão do reconhecimento de gatos pela rede neural é atualmente muito pior do que o reconhecimento de gatos por 4-5 crianças voadoras. Mas, ao contrário da criança, ninguém ensinou a rede neural, ninguém mostrou objetos com um gato, chamando-os. A rede deu origem ao conceito do próprio gato.

O que acontece a seguir?

Em março de 2015, uma “bomba nuclear” explodiu no mundo do SEO - o Google publicou um artigo intitulado “Confiança Baseada no Conhecimento: Avaliando a Confiabilidade dos Recursos da Web”. Sem dúvida, exagero, as notícias, de fato, passaram despercebidas. Bem, por alguns dias, os gerentes sociais ficaram envergonhados e céticos - peço desculpas por essa palavra estúpida, mas não sei mais como identificar a agitação nos fóruns sociais e nos grupos de redes sociais. Não havia limite para a indignação ("o Google nos coloca em experimentos de novo") e ceticismo ("nada virá disso, como Yasha com o cancelamento de uma referência"). É compreensível, em um artigo puramente científico, que os representantes do Google anunciaram um novo algoritmo de classificação, baseado não na autoridade referencial do documento, mas na exatidão factual. Se for simplificado, então a essência do novo algoritmo pode ser expressa pela seguinte máxima: um documento com uma fidedignidade confiável, sendo as outras coisas iguais, deve ser classificado mais alto do que um documento com uma factologia imprecisa.

O ceticismo dos SEOs é, em geral, compreensível - eles (como sempre, a propósito) só viam o que queriam ver. E a pergunta principal que foi feita nos fóruns soou assim: "Isso é o que todos vocês querem fazer, agora temos que criar conteúdo que cite fatos da Wikipedia ou outras fontes autorizadas, mesmo que eles não sejam relevantes na página." ".

Mas o fato é que o novo algoritmo não pode funcionar sem entender o significado dito na página. Entender os significados do texto escrito / sonoro em uma página, em vez de reconhecer a semântica, é o que tornará a pesquisa irreconhecível.

Como o "aprendizado profundo" funcionará na pesquisa? Eu me volto para a experiência de pessoas que entendem isso muito melhor do que eu. Isto é o que Rand Fishkin diz na próxima edição do Whiteboard Friday (a propósito, esta edição é chamada "O que o aprendizado de profundidade e o aprendizado de máquina significam para o futuro SEO?"):

"A rede neural consiste em diferentes camadas. A primeira camada revelará todas as diferentes características do documento. A outra camada da rede neural classificará os tipos desses recursos. Assim, o Google levará em conta todos os recursos possíveis de qualquer tipo de site e qualquer tipo de página para decidir quais sinais úteis em geral, pode ser extraído aqui e agora, neste caso, a rede neural levará em conta os dados acumulados sobre o comportamento do usuário em todas as páginas da Internet (onde ele pode chegar), a fim de prever resultados - se o usuário vai gostar deste ou daquele documento no problema ou não.

Mas a ideia básica é que, no futuro, os dados recebidos não serão controlados por seres humanos. A própria máquina tentará entender o conteúdo da página. Sim, parece estranho. Mas em breve, se você perguntar a um engenheiro do Google - por exemplo, vale a pena continuar a criar links de entrada para o site? - Ele provavelmente vai te responder: eu não sei. Eles, na verdade, não saberão mais exatamente quais sinais o algoritmo de busca destaca para uma consulta específica e um tipo particular de página. Somente a máquina saberá isso, mas não será capaz de explicar nada a ninguém, porque o algoritmo de classificação mudará constantemente à medida que novos documentos sobre esse assunto aparecerem, e muitas métricas que serão usadas pela rede neural serão derivadas de derivadas de um grande número de outras métricas.

"Aprendizagem profunda" vem

A revolução da aprendizagem profunda, na verdade, está apenas começando. Mas hoje redes neurais com o uso de "aprendizagem profunda" funcionam.

Por exemplo, os serviços de monitoramento de congestionamento de tráfego operam com tecnologias de aprendizado profundo. Sim, Yandex.Proborks não só exibe a imagem real, mas também tenta prever a aparência de engarrafamentos, mas sem aprendizagem profunda essa previsão é impossível.

O Google Voice Search e o Apple Siri são equipados com tecnologias de "aprendizado aprofundado".

O serviço de previsão de gripe do Google trabalha com técnicas de aprendizagem profunda.

Os algoritmos de reconhecimento para pessoas em fotos e vídeos enviados para o Facebook diariamente são baseados em tecnologias de aprendizagem profunda.

Para pesquisar. Algoritmos para personalizar os resultados da pesquisa são baseados em tecnologias de aprendizagem profunda.

Estamos entrando em um novo mundo maravilhoso. E os próximos cinco anos serão verdadeiramente revolucionários - não apenas para marketing de busca, mas também para a humanidade como um todo. Muito em breve veremos tudo com nossos próprios olhos.

Assista ao vídeo: Is Artificial Intelligence the Future of Marketing? (Fevereiro 2020).

Loading...

Deixe O Seu Comentário