阿里巴巴

299人关注 关注 3398人分享

机器学习与数据挖掘 面试经验( 杭州 ) - 阿里巴巴
发布时间: 2017-09-26 12:01:57 来源:职朋网友分享
面试过程:

三月初的时候实习内推,投的机器学习与数据挖掘岗位,做完测评之后以为会立马收到面试通知,结果等了好几天,第一次面试是简历评估,只是简单介绍了一下项目,然后确定实习地点,就约了第二天的技术面。人生第一面就给了阿里。技术面的时候,原谅我还是个小白,只准备了一些机器学习的基础知识,算法与数据结构压根儿没复习(我真是太天真了)。然后问了最基础的栈,链表,递归,问了项目中用到的机器学习算法,问还会不会通信方面的信息论(我是通信专业的,但是已经不和通信接轨了)。那次面试很挫,但是面试官还是很友好。漫长地等待了一个月,没消息,还是没消息。到了四月中旬,突然接到一个杭州的电话,我就知道是阿里的,不明所以。然后跟我约了面试,告知我被调到了研发工程师(觉得我更适合做工程方面的,因为简历里面涉及工程的稍微多一点,也可能因为我的技术面算法不过关吧)。开始新的一轮了,第一面就问了一些简历的项目,然后就让我上线编程。对了。面试我的部门是阿里搜索的,可想而知面试题目都是跟搜索相关的东西。线上编程是合并有序数组为一个新的有序数组,去重。当时做成了找两个有序数组相同元素了,所幸思路差不多,然后面试官没有挂我。第二面。是在我做阿里笔试那天,正在做笔试题收到电话,还以为不用笔试了,结果面试官让我回去继续笔试,约了第二天。这次感觉就是问的工程的问题以及有关搜索的算法和工程解决方案。然后问了 MapReduce的shuffle,不记得其他了然后就没有然后了,一直面试中,最后就显示挂了。

面试官问的面试题:

阿里巴巴机器学习与数据挖掘面试题

第一题,有两个小时淘宝搜索日志,TB量级?找出top1000的搜索商品,我当时就用了简单的MapReduce解决,先做词频统计,再用一个mapreduce将键值反转,排序。第二题在一个数组中,找出出现词频最高的top1000的数,感觉应该先统计出现次数,再用堆排序,忘了我回答了些啥了。第三个题是合并十个有序数组,当然,不能再简单地考虑归并排序,还要设计具体的两两合并,合并完了找top1000。(真是脱离不了top1000啊)。第四个题是数据库的,储存的是卖家ID,商品ID,根据卖家商品数量排序,写SQL语句。

查看面试题参考答案>>

面试相关细节(职业圈独家调查):

你是通过何种渠道获得这次面试机会的?
答:内部推荐
整个面试花费了多长时间?(从接到面试消息到得到结果)
答:30天
面试形式包括哪些?
答:电话面试
你觉得这次面试的难度如何?
答:困难
你对这次面试的整体感觉怎么样?
答:不好
这次面试的结果如何?
答:面试未得到工作

赞一下(2) 踩一下

以上信息仅代表发布者自己的观点,由于在职时间、职位以及个体本身的影响,和公司整体情况可能会有偏差,仅供参考!

评论

还需查看阿里巴巴 更多信息?

相关公司面试经验