Introdução
Neste blog, Vou discutir várias coisas sobre o sistema de recomendação, como o que é o sistema de recomendação? Quais são seus casos de uso? Quantos tipos de sistemas de recomendação e métricas são usados para este.
Na foto acima da Amazon, você pode ter visto esta página muitas vezes ao tentar comprar algo na Amazon. Estas são as recomendações do produto que você está tentando comprar e você ficará surpreso ao saber que o 35% da receita da Amazon vem desses mecanismos de recomendação. Agora você deve ter notado o poder do mecanismo de recomendação. Na atualidade, todas as pequenas e grandes empresas usam um mecanismo de recomendação. Então agora deixe-me discutir isso.
Qual é o sistema de recomendação?
Um sistema de recomendação é uma subclasse de sistemas de filtragem de informações que busca prever a avaliação ou preferência que um usuário poderia dar a uma postagem. Em palavras simples, é um algoritmo que sugere itens relevantes para os usuários. Como um exemplo: no caso da Netflix, que filme assistir, no caso do comércio eletrônico, que produto comprar, ou no caso do kindle, que livro ler, etc.
Casos de uso do sistema de recomendação
Existem muitos casos de uso. Alguns são
UMA. Conteúdo personalizado: Ajuda a melhorar a experiência do site, criando recomendações dinâmicas para diferentes tipos de público, como o Netflix faz.
B. Melhor experiência de pesquisa de produto: Ajuda a categorizar o produto com base em suas características. Como um exemplo: material, temporada, etc.
TIPOS DE SISTEMA DE RECOMENDAÇÃO
1. Filtragem baseada em conteúdo
Neste tipo de sistema de recomendação, os itens relevantes são exibidos usando o conteúdo dos itens pesquisados anteriormente pelos usuários. Aqui, o conteúdo se refere ao atributo / etiqueta do produto que o usuário gosta. Neste tipo de sistema, produtos são marcados com certas palavras-chave, mais tarde o sistema tenta entender o que o usuário deseja e pesquisa em seu banco de dados e, finalmente, tenta recomendar diferentes produtos que o usuário deseja.
Vamos dar um exemplo do sistema de recomendação de filmes onde cada filme está relacionado aos seus gêneros, o que no caso anterior é chamado de rótulo / atributos. Agora, suponha que o usuário A venha e, inicialmente, o sistema não tenha nenhum dado sobre o usuário A. portanto inicialmente, o sistema tenta recomendar filmes populares aos usuários ou o sistema tenta obter informações do usuário obtendo um formulário preenchido pelo usuário. Depois de um tempo, os usuários podem ter dado uma classificação a alguns dos filmes, dado que dá uma boa classificação aos filmes baseados no gênero de ação e uma classificação fraca aos filmes baseados no gênero anime. Portanto, aqui o sistema recomenda filmes de ação para os usuários. Mas aqui não se pode dizer que o usuário não gosta de filmes de animação porque talvez o usuário não goste desse filme por algum outro motivo, como atuação ou história, mas na verdade você gosta de filmes de animação e precisa de mais dados nesta circunstância.
Vantagem
- O modelo não precisa de dados de outros usuários, pois as recomendações são específicas para um único usuário.
- Facilita o escalonamento para um grande número de usuários.
- O modelo pode capturar os interesses específicos do usuário e pode recomendar itens nos quais muito poucos usuários estão interessados..
Desvantagem
- A representação das características do item é projetada manualmente até certo ponto, esta tecnologia precisa de muito conhecimento de domínio.
- O modelo só pode fazer recomendações com base no interesse existente de um usuário. Em outras palavras, o modelo tem uma capacidade limitada de expandir os interesses existentes do usuário.
2. Filtragem baseada em colaboração
Recomendar novos itens aos usuários com base no interesse e preferência de outros usuários semelhantes é simplesmente uma filtragem baseada na colaboração. Como um exemplo: – Quando compramos da Amazon, recomenda novos produtos que dizem “O cliente que trouxe isso também trouxe” Como mostrado abaixo.
Isso supera a desvantagem da filtragem baseada em conteúdo, uma vez que usará a interação do usuário em vez do conteúdo dos itens usados pelos usuários. Para isto, você só precisa do desempenho histórico dos usuários. Com base em dados históricos, assumindo que o usuário que concordou no passado tende a também concordar no futuro.
Existem 2 tipos de filtragem colaborativa: –
UMA. Filtragem colaborativa baseada no usuário
A classificação da postagem é feita usando a classificação dos usuários vizinhos. Resumidamente, é baseado na noção de similaridade de usuários.
Vamos ver um exemplo. No lado esquerdo, você pode ver uma foto onde 3 filhos chamados A, B, C y 4 frutas, Em outras palavras, uvas, morango, melancia e laranja, respectivamente.
Com base na imagem, Suponha que A comprou o 4 frutas, B comprou apenas morango e C comprou morango e melancia. Aqui um & C são tipos de usuários semelhantes porque C Grapes e Orange serão recomendados conforme mostrado na linha pontilhada.
B. Filtragem colaborativa baseada em itens
A classificação do item é prevista usando a própria classificação do usuário em itens vizinhos. Em palavras simples, é baseado na noção de similaridade de itens.
Vamos ver com um exemplo como dito anteriormente sobre usuários e itens. Aqui, a única diferença é que vemos postagens semelhantes, nenhum usuário semelhante, como se você visse uvas e melancia, você vai perceber que a melancia é comprada por todos, mas as uvas são compradas pelas crianças A e B. Por isso, Crianças C são uvas recomendadas.
Agora, depois de entender ambos, você pode se perguntar qual usar e quando. Esta é a resposta se o número de itens for maior do que o número de usuários optar pela filtragem colaborativa com base no usuário, uma vez que irá reduzir o poder de cálculo e se o número de usuários for maior que o número de itens, escolha a filtragem colaborativa baseada em itens. . Como um exemplo, A Amazon tem centenas de milhões de postagens para o mercado, mas tem centenas de milhões de clientes. Por isso, Amazon usa filtragem baseada em itens colaborativos devido a menos. de produtos em comparação com seus clientes.
Vantagem
- Funciona bem mesmo se os dados forem pequenos.
- Este modelo ajuda os usuários a descobrir um novo interesse em uma determinada postagem., mas é viável que o modelo ainda o recomende porque usuários semelhantes estão interessados nessa postagem.
- Não há necessidade de conhecimento de domínio
Desvantagem
- Ele não pode lidar com novos itens porque o modelo não treina nos itens recém-adicionados no banco de dados. Esse problema é conhecido como problema de inicialização a frio..
- Característica secundária Pouco relevante. Aqui, as características secundárias podem ser o nome do ator ou o ano de lançamento no contexto da recomendação do filme.
MÉTRICAS DE AVALIAÇÃO
Como discutimos os diferentes tipos de sistemas de recomendação, suas vantagens e desvantagens, mas como podemos examinar se o modelo dado está recomendando as coisas certas ou não e quantas coisas relevantes este sistema prevê e aqui vêm as métricas de avaliação. Existem várias métricas para examinar o modelo, mas aqui vamos discutir 4 métricas principais.
1. Precisão média média em K
Dê o quão relevante é a lista de itens recomendados. Aqui, a precisão em K significa itens recomendados nos principais conjuntos de k que são relevantes..
2. Cobertura
É a porcentagem de itens no modelo de dados de treinamento que podem ser recomendados em conjuntos de teste. Ou simplesmente, a porcentagem de um sistema de recomendação viável pode prever.
3. Personalização
Simplesmente, é sobre quantos dos mesmos itens o modelo recomenda para diferentes usuários. Ou a diferença entre listas de usuários e recomendações.
4. Similaridade intralista
É uma semelhança do cosseno médio de todos os itens em uma lista de recomendações.
CONCLUSÃO
Este blog cobriu muitos tópicos relacionados aos mecanismos de recomendação, como o que são e seus casos de uso. Alem disso, diferentes tipos de sistemas de recomendação, como filtragem baseada em conteúdo e filtragem baseada em colaboração e filtragem colaborativa, bem como baseada em usuário, bem como baseada em item, juntamente com seus exemplos, vantagens e desvantagens, e, finalmente, as métricas de avaliação para examinar o modelo.
A mídia mostrada nesta postagem não é propriedade da DataPeaker e é usada a critério do autor.
Relacionado
Postagens Relacionadas:
- Bancos de dados NoSQL que todo cientista de dados deve conhecer! 2020!
- O Quadrante Mágico 2020 Gartner já está disponível! Confira as melhores ferramentas de análise
- Livros eletrônicos de aprendizado de máquina para cientistas de dados e engenheiros de inteligência artificial
- O que é atribuição de canal? Modelagem de atribuição de canal