大数据应用中的算法如何创造商业价值
百林哲咨询(北京)有限公司专家团队成员
海归博士,前网易数据技术中心负责人,技术总监。从事大数据推荐,搜索和广告等应用领域的“精准”落地与变现,负责网易新闻内容的推荐和剩余流量效果广告变现,对于业务数据和机器智能算法的融合有较深经验。
浏览:4766次
详情 DETAILS

简介

阐述了自然语言处理(NLP),数据挖掘(DM)和机器学习(ML)算法的落地和产出过程,对于在大数据处理方面的技巧和变现能力会有很大的提升。

目标

关联做法的模型;算法如何影响用户快速决策购买商品的信息量;不同场景的用户行为如何挖掘潜在有价值信息或者用户意图。

受众人群

企业高管、大数据工程师、算法工程师、系统架构师、开发工程师以及其他对大数据感兴趣的人员。

课程时长

2天(12H)

分享提纲

主题授课内容
引子本次培训主要结合电商的实际应用,阐述了自然语言处理(NLP),数据挖掘(DM)和机器学习(ML)算法的落地和产出过程,对于在大数据处理方面的技巧和变现能力会有很大的提升。

第一单元

关联规则(Apriori)算法在实际应用中的优化

该单元介绍基本关联规则算法在电商实际订单数据中的问题,以及对于问题空间预估保证提升空间的前提下,优化关联规则模型的过程。

1、传统关联规则算法

2、“最佳拍档”中的关联规则

讲述了基本的关联规则算法

3、问题发现与分析

(1)订单数据反作弊

(2)数据+算法融合的角度

(3)badcase实例印证

4、效果空间预估

5、算法改进

6、效果的衡量

(1)上线前:Debug工具

(2)上线:ABtest系统

7、ROI分析

8、案例启示&下一步尝试

第二单元

商品评论排序对于用户购买的影响

该单元介绍了如何处理用户产生的商品评论,将其按照价值由大到小进行排序,评论的价值取决于影响用户快速决策购买商品的信息量。

1、背景介绍

2、评论排序因素

3、内容相关性计算

(1)商品内容表示

(2)评论内容表示

(3)商品和评论的相似性计算

4、排序模型

5、效果评估

(1)测试方法

(2)衡量指标

(3)效果对比及分析

6、作弊与反作弊

7、评论智能排序-ROI分析

第三单元

商品“冷启动” -基于语义主题的新品推荐

该单元介绍了如何处理用户产生的商品评论,将其按照价值由大到小进行排序,评论的价值取决于影响用户快速决策购买商品的信息量。

1、马太效应

2、商品的冷启动

3、基于内容的主题特征抽取

(1)语义主题特征

(2)特征关联

4、正负样本形成

5、CTR预估模型

6、效果衡量与分析

第四单元

用户行为分析

根据不同场景的用户行为,挖掘潜在有价值信息或者用户意图。

1、商品互补类识别

2、优质用户挖掘

3、品牌相似性计算

4、用户点击商品行为建模

5、用户新闻兴趣建模

6、长尾query的智能纠错 




企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1