非科班转行的2018秋招算法工程师面经面

这是一篇不太专业的算法工程师面经,希望能给非科班想要从事机器学习工作的同学或学弟学妹一些建议,同时也回馈给予我很大帮助的咕泡学院。目前拿到的offer有:网易、三星、联想、vivo、斗鱼、拼多多、猎聘等等。面经分为两个部分:虐心面试实录和一点人生经验。先上干货再BB,大家可以针对性的选择自己需要的部分,祝大家最后都能拿到心仪的offer啦。

虐心面试实录

网易邮件事业部数据挖掘工程师offer

整数翻转,如何处理越界问题

C++多态,静态联编和动态联编,虚函数表

GMM原理,增大数据量是否会更好

模型融合如何做

股票买卖问题,一次买卖和两次买卖

提升树的思想,随机森林和提升树的区别

EM算法数学原理

SVM推导,对偶性的作用,核函数有哪些,有什么区别

分布式计算框架了解哪些

百度商业平台部数据挖掘工程师二面挂

python两个每行都是数字的文件合并,去重。

shell编程,编辑文件。

进程与线程的区别

卷积神经网络介绍

SVM的推导

大文件求交集,如何解决哈希之后小文件还是放不进内存

堆排序代码

连续和最大问题,如何证明?

3sum问题,时间复杂度

最短路问题,第K条最短路

vivo人工智能工程师spoffer

bp算法介绍,梯度弥散问题。

svm介绍,优缺点是什么,lr介绍,区别是什么

lr与线性回归的区别

如果要预测房价,用什么模型

如果要预测房价,并且知道一个房间的房型信息,如何构建模型

sigmoid函数的应用有哪些,为什么?

列举十种常用的神经网络模型

语音识别模型有哪些

如何识别一个人在喝酒,需要几个模型

苏宁算法工程师备胎池凉了

卷积神经网络中卷积如何实现,激活函数的意义,损失函数有哪些,初始化参数如何选择

用过哪些深度学习框架,TensorFlow中的session是什么,session和interactivesession的区别

如何实现卷积层权值共享

如何保存模型,读取已有的模型

用过哪些深度学习模型,区别是什么。

了解哪些寻优算法

softmax损失函数是什么

c++的const,static作用

new,delete原理

强制类型转换cast之间的区别

腾讯IEG应用研究二面挂

svm推导,核函数的体现,常用的核函数有哪些

alexnet介绍

过拟合的原因,有哪些避免过拟合的trick

1G的文本统计词频,输出频率最高的个词

手写topk的代码,快排。代码还能如何优化,如果要上线的话还需要做哪些处理

如果分类样本的标签只有一定的概率可信,如何处理

过拟合的原因,有哪些防止过拟合的方法

mysql查询一段时间中某个用户的数据

三星电子中国研究院机器学习研发工程师offer

笔试:水管工之类的算法题,求最大深度

模型评价如何做,其中存在哪些问题

决策树算法有哪些,随机森林和GBDT的区别

降维方法,PCA原理

哈夫曼树在机器学习中的应用

文本挖掘算法了解哪些

人流量预测系统如何设计

profession笔试:最优的进程调度算法,至少用多少个cpu

英语自我介绍,口语渣猝不及防

联想研究院模式识别研究员offer

EM算法数学推导,如何证明算法收敛性

异常值的影响,如何消除

所有了解的机器学习算法有哪些,框架性讲述

梯度下降算法了解哪些,优劣势是什么

二叉树中序遍历,递归和非递归

linux操作指令了解哪些,文本处理指令有哪些

一亿个数的文件,如何分成两个文件a,b,使得a文件的数都小于b,同时文件大小要差不多。

拼多多算法工程师offer

均匀分布如何生成正态分布

SVM原理,支撑向量越多越好还是越少越好

二叉树深度遍历,时间复杂度和空间复杂度

二维排序矩阵搜索

项目中的长时间推广问题,如何考虑样本之间非独立的影响。

编程题,矩阵中的最短路,有门有钥匙。动态规划加状态向量。

贝叶斯公式,实际如何计算,如何解决精度问题。

五八集团算法工程师二面挂

字符串转数字

svm核函数有哪些,如何选取,手写表达式

降维方法介绍

c的虚函数,虚函数指针和虚函数表存在哪儿

Linux文件权限修改,参数介绍

模型的比较如何做

随机森林和提升树

卷积神经网络原理

如何避免网络的过拟合

如何网络调优

猎聘算法工程师spoffer

Python的数据结构有哪些

tuple和set的区别,set的底层实现

hash表的算法有哪些

svm推导,一直到序列最小化求解。核函数如何体现,有哪些类型。

构建分类器的整个流程是什么

数据清洗方法,缺失值处理方法,降维方法

pca原理推导

决策树算法的介绍

二维排序数组搜索

如何构建欺诈交易识别的模型?

不均衡的数据如何分类

新浪移动数据挖掘工程师录用排序

归并排序,二维排序数组搜索,中序遍历重构二叉树

svm推导,为什么要用拉格朗日乘数法,对偶问题是什么

KKT条件都有什么,如何求解svm的最优化问题

数据不均衡如何解决,抽样得到的分类准确率如何转换为原准确率。

逻辑回归原理,推导求解方法。

为什么选用对数极大似然函数作为优化目标,用平方损失有什么问题。

逻辑回归对特征有什么要求,是否需要做离散化,离散化的好处与坏处。

逻辑回归的参数是否可以分布式求解,如何做分布式。

有三辆车,到达时间随机,a车五分钟一趟,b车十分钟一趟,c车十五分钟一趟,求平均等待时间

一点人生经验

我是一名文科类院校的硕士(面试的时候不止一次被问是不是学计算机教育的),本科是信息专业。硕士科研是模式识别方面的,其实说数据分析更贴切,基本属于浪费青春(建议各位喜欢计算机的学弟学妹:珍爱生命,远离文科院校)。同时也因为老板的24小时贴心看护,毫无悬念的没有实习机会,mmp。自己虽然非常喜欢机器学习,但是秋招之前的状态是:编程基础只会python,算法设计全靠调包,深度学习基本不会,分布式框架完全不懂。到七月份的时候,整个人丧到一定境界,感觉基本要告别互联网了。

笨鸟先飞,七月中旬就开始准备秋招了,主要是打比赛、看书和刷题。八月底投简历,投过的公司非常多,然而收到面试的很少。庆幸自己比较能吹,效率还比较高,最后也拿到了一些心仪的offer。过程很痛苦,但是还好有个好收获。总结一下这三个月自己的一些经验感悟,希望对大家有帮助。因为自己是非科班出身,今后也要疯狂补习,早日跟上大佬步伐,也希望多跟大佬们交流呀。

秋招准备

硬实力:项目经验,竞赛,简历。

对于自己的项目,数学逻辑上一定不能有漏洞。多多反思,想想自己模型的优势,以及换其他模型会有啥问题,假装有面试官提问自己回答。基本上做到这些,项目上就不会有问题。因为我没有过实习经验,所以对企业


转载请注明:http://www.jiaju1314.com/bcxx/bcxx/17285.html