Skip to content

Latest commit

 

History

History
39 lines (38 loc) · 2.37 KB

爱奇艺广告算法.md

File metadata and controls

39 lines (38 loc) · 2.37 KB

#爱奇艺广告推荐部 2018.08.10

一面

  • 项目(基本都在这里了)
  • xgboost 推导分裂标准

二面(交叉)

这面是我面试到现在最有水平的一面,根据爱奇艺的广告场景提了5个概率分布问题

  • 项目
  • lstm
  • 特征选择方法
  • gbdt或rf的采样方法与传统方法有何异同
  • 多层fc和少量层fc,多层lstm堆叠和少量层lstm堆叠的优缺点
  • 数据不均衡的采样方法 从我说项目数据不均衡开始正片就来了
  • 有2%正样本,98%的负样本,每次有放回的采样2%的负样本,问多少次后采样会覆盖95%的负样本
  • 一个人等地铁,到达地铁站的时间随机,假设地铁发车服从均匀分布,n次等地铁后每次的等待时间服从什么分布?如果发车时间服从γ分布呢?
  • 假设两个模型离线打分召回率均为10%,上线后,1:1分流给两个模型,但是由于种种原因,两个流量并不能完全相同,假设A模型分流到100个样本召回10个,B分流到200个样本,找回18个(随便举了一个例子,实际不会差这么大),请问这两个模型哪个更好?
  • 爱奇艺普通用户看电视剧需要看广告,推出会员后,会员免广告,假设会员30块一个月,请问如何判断会员价格定的是否过高或过低?(后面面试官提示,买会员的用户都是高频用户,即,推出会员前后,普通用户的分布式不同的)
  • 假设爱奇艺今年毛收入150亿,亏损20亿,怎么估计买电视剧电影的版权花了多少钱?
  • 算法题:
    • 给两个有序数组,返回一个合并后的有序数组
    • 在函数正确的情况下返回值是否会空?(可以从多线程并发的数据相关性角度答)

三面

  • 项目
  • 特征选择方法
  • AUC的含义
  • 推导xgboost
  • xgboost和传统gbdt的区别
  • xgboost源码在缺失值方面怎么处理的
  • 为什么gbdt不适合处理sparse特征
  • FM原理
  • python的修饰器是什么
  • 算法题:
    • 有一个数字在1-n的 n个数,随机去掉一个,然后打乱数列顺序,请找到缺失的那一个
    • 要求时间O(n) 空间O(1)

结果

意向书拿到了,第一次offer call当时在面海康就推了,这一推就是大半个月啊。。。 第二次offer call问了手上拿到的offer情况,问了薪资意向,然后说给她几天帮我申请,不出所料应该是SP