3月20日上午,统计学院首期校友沙龙举行,知名校友刘思喆应邀为在校学生作题为“产业互联网数据科学最佳实践——以在线教育为例”的分享。本次活动由数据科学与大数据统计系主任吕晓玲教授主持。
刘思喆是松果出行智能中心负责人,前51Talk首席数据科学家、助理副总裁,前京东推荐系统负责人。他也是国内最大统计社区“统计之都”理事会成员,中国人民大学大数据分析实验班、首经贸信息学院校外硕士生导师,中国计算机学会TF数据科学SIG委员。国内R语言的早期推广者,《153分钟学会R》的作者,《R语言核心技术手册》的译者。
活动中,刘思喆以互联网教育为例,对产业互联网行业进行了深度剖析。他认为校外培训的商业形态与国家经济发展水平有关,将其概括为“求生期(职业技能学习)→温饱期(留学热)→小康期(重数理、逻辑课程)→富足期(考公职)”的过程。接着,他以“学而思”学科增长作为案例,解释商业表象行为和底层增长方法论的逻辑关系,并由此指出衡量一家教育培训公司优劣的四项基本能力:流量获取、内容系统化、产品交付和服务运营能力。
刘思喆分享了自己在51Talk主导的数据科学案例,并结合案例给予同学们一些关于数据分析的建议。他表示,不要盲目相信单维度指标分析传递的信息,引入更多数据信息之后,真相才会逐步浮出水面。他强调模型并不是越精准越好,还需要考虑使用者的诉求和使用场景。
刘思喆介绍了团队在实际工作中实施过的一些智能化系统和数据模型。根据不同的商业需求,刘思喆的团队先后研发了服务于班主任的“魔镜系统”,服务于外教成长的“雷霆系统”,以及通过COX比例风险回归模型、概率图模型、IRT理论等方法量化结果指标和过程指标,有效地揭示了业绩增长和学术服务动作之间的关系,取得了良好的效果。对于模型的研发,他说,一些看起来很厉害的算法不一定有商业价值,因为模型的应用方向和问题的定义有很大关系。并且他强调,当条件不具备时,可以尝试“向外走一步”,并号召同学们把思考“二阶和三阶问题”的能力变成一种习惯。
最后,刘思喆总结了对于数据科学家能力的23项基本要求。他鼓励大家重点培养系统化和结构化思维,提升价值与重要性判断能力、问题界定和拆解能力,以及最重要的复盘和反思能力,同时他也根据自己的工作经验针对性地对上述能力的提升给出了具体可操作的建议。
在提问环节,同学们提出了关于数据挖掘深度界定、数据分析师的分类、续费转化评价等方面的问题,刘思喆耐心细致地予以解惑。最后,刘思喆希望大家找到适合自己的方向,做自己喜欢的事情,按照自己的职业发展需求,有针对性地提升个人能力。
活动介绍
统计学院校友沙龙以“与未来的自己对话”为活动理念,旨在通过邀请知名校友返校分享从业经历和工作心得,增强同学们的实践能力,帮助同学们了解业界前沿动态。