Skip to main content

算法

项目01:物品画像构建(Spark、Python、Tensorflow)

内容画像的搭建基础

关键词提取技术tf-idf, textRank

LSTM与注意力机制

Attention的几种常用方式

Self-Attention

Multi-head Attention

HuggingFace的使用

MySQL数据库的搭建

项目02:用户画像项目

用户画像与内容画像的关系

用户画像的架构

用户画像的扩展

用户画像与排序特征

用途:基于标签的用户画像

标签权重的计算方法(贝叶斯平滑、时间衰减)

基于用户画像的召回方法

Hadoop、Hive、Spark等工具使用

项目03:召回项目介绍

MF召回法以及求解

特征值分解

传统奇异值分解之SVM

Embedding与稀疏ID类特征的关系

Item-CF召回与Item2Vec

Airbnb序列召回与冷启动缓解思路

YouTube召回方法

从DSSM到双塔模型

双塔模型工业界的部署方法

多兴趣召回

MIND召回

Faiss工具介绍

项目04:画像召回

随机游走于传统协同方法

Deepwalk

Node2Vec及其同质性与结构性

LINE

随机游走的实现

Alias采样方法

Spark实现Graph Embedding的实现

Eges大规模图召回

Dgl实验pinsage进行推荐

项目05:推荐系统之精确排序

Ranking与用户画像

物品画像

LR模型

GBDT+ LR

FM模型详解、业界使用方法与坑

FFM模型

AUC与GAUC

基于FM实现Ranking精排序

特征自动组合:Deep&Cross、XDeepFM、PNN

序列推荐模型:DIN、DIEN、AttRes、Stamp

深度模型工具的介绍与使用

MLSQL

DeepCTR等与工业界采样方法

项目06:用户画像项目

用户画像概念

用户三大标签类型

基于用户行为的标签构建

dmp平台如何利用标签进行广告定向投放

机器学习类别标签

项目07:实时召回系统构建

实时召回系统架构

基于用户行为的实时召回

召回模型部署

召回算法详解

召回评估方法

项目08:基于大数据的LBS区域推荐

MapReduce介绍

用户行为日志分析

聚类算法的应用

基于区域聚类的lbs推荐

Hadoop从0-1实现百万用户聚类的lbs区域热点推荐