算法
项目01:物品画像构建(Spark、Python、Tensorflow)
内容画像的搭建基础
关键词提取技术tf-idf, textRank
LSTM与注意力机制
Attention的几种常用方式
Self-Attention
Multi-head Attention
HuggingFace的使用
MySQL数据库的搭建
项目02:用户画像项目
用户画像与内容画像的关系
用户画像的架构
用户画像的扩展
用户画像与排序特征
用途:基于标签的用户画像
标签权重的计算方法(贝叶斯平滑、时间衰减)
基于用户画像的召回方法
Hadoop、Hive 、Spark等工具使用
项目03:召回项目介绍
MF召回法以及求解
特征值分解
传统奇异值分解之SVM
Embedding与稀疏ID类特征的关系
Item-CF召回与Item2Vec
Airbnb序列召回与冷启动缓解思路
YouTube召回方法
从DSSM到双塔模型
双塔模型工业界的部署方法
多兴趣召回
MIND召回
Faiss工具介绍
项目04:画像召回
随机游走于传统协同方法
Deepwalk
Node2Vec及其同质性与结构性
LINE
随机游走的实现
Alias采样方法
Spark实现Graph Embedding的实现
Eges大规模图召回
Dgl实验pinsage进行推荐
项目05:推荐系统之精确排序
Ranking与用户画像
物品画像
LR模型
GBDT+ LR
FM模型详解、业界使用方法与坑
FFM模型
AUC与GAUC
基于FM实现Ranking精排序
特征自动组合:Deep&Cross、XDeepFM、PNN
序列推荐模型:DIN、DIEN、AttRes、Stamp
深度模型工具的介绍与使用
MLSQL
DeepCTR等与工业界采样方法
项目06:用户画像项目
用户画像概念
用户三大标签类型
基于用户行为的标签构建
dmp平台如何利用标签进行广告定向投放
机器学习类别标签
项目07:实时召回系统构建
实时召回系统架构
基于用户行为的实时召回
召回模型部署
召回算法详解
召回评估方法
项目08:基于大数据的LBS区域推荐
MapReduce介绍
用户行为日志分析
聚类算法的应用
基于区域聚类的lbs推荐
Hadoop从0-1实现百万用户聚类的lbs区域热点推荐