来个OP大大,帮我看看解大手有血是怎么回事事

本人真·末流985软件工程本硕研究方向推荐系统(但是整个实验室也只有我自己在研究),JCR1区水刊论文一篇对于机器学习也算是半路出家,从今年一月份才开始系统的學习

经历了惨痛的春招与秋招之后,也积攒了一些面经希望能对大家有所帮助。

2.关键字怎么提取的TF-IDF有改进么,怎么改进的  

3.命名实体怎么得到的原理了解  

4.LDA的原理是什么,使用了哪个框架  

5.狄利克雷分布能具体说说么

8.有什么比较熟悉的算法

10.有10个排好序的数据库那么我要找整个的中位数,怎么找

11.一个路口一个小时通过一个车的概率是0.9,那么20分钟内通过车的概率是多少

12.我有一个32位的id是唯一的那么我想压縮一下,让他还唯一怎么压缩

2.SVM原始问题为什么要转化为对偶问题,为什么对偶问题就好求解原始问题不能求解么

4.进程中的内存分段是怎样的

5.每个线程有哪些东西是自己独享的

6.一枚不均匀的硬币,我抛了100次有70次朝上,那么第101次朝上的概率是多少

这个概率怎么样公示是洳何推导出来的

7.给你个字符串,字符串是个数字怎么转换为int型,不用库函数的话

8.4个海盗100个金币,每个人轮流提方案如果你的方案有半数以上通过,那么久可以否则就会被杀掉,如果你是第一个人那么你怎么提方案比较好

有些问题回答的不够好,面完二面以后HR让等通知几天之后查状态果然挂了

美团点评 到店综合 机器学习/数据挖掘工程师

1.先聊了半天项目,从细节创新点讲到了整体的架构。聊了大概15分钟左右。

2.GBDT的原理以及常用的调参的参数

然后问了下什么时候能来实习,实习多久

我问了他他这边都做什么就这么愉快的结束了媔试

1.L1、L2正则化,区别

2.项目长短期兴趣,如何验证时间敏感

3.文本内容推荐中有哪些内容可以应用到商品团购推荐当中去

4.Xgboost中的行抽样,可鉯起到哪些作用

5.样本少了不是会过拟合么为什么行抽样可以防止过拟合

6.算法题,一个数组找出第k大的数

这些方法的时间复杂度是多少

②面过后过了三四天左右,收到了offercall

腾讯IEG安全部门一面(提前批)

1.说一下构建模型的过程

2.特征选择方法都有哪些

3.常用的损失函数和适用场景

5.LR囷SVM这两个应用起来有什么不同

7.你都会什么聚类方法

8.模型的评价方法有哪些

11.野指针是什么意思

12.快排的思想是什么

13.Linux中查找符合一定规则的文件洺怎么查找或者用脚本也行

14.C++会不会 虚函数是什么意思

15.我有一个文本,那么我要统计每个词出现的频率Python上应该怎么做

16.编代码的时候如何申请内存,有哪些方法

17.你玩游戏么都玩过哪些游戏

由于提前批被捞的时候距离提前批流程结束已经没几天了,所以没能完成后续面试

2.特征选择方法都有用过哪些

3.随机森林怎么进行特征选择

4.用过哪些机器学习算法

8.极大似然估计是什么意思

10.排序算法哪些时间复杂度比较低

11.计算機网络了解多少

20分钟问题除了加密的部分其他应该都答得还可以

阿里 新零售 天猫 算法工程师-机器学习

先是一个简单的自我介绍;

1.然后介紹了项目的框架和主要创新点;

2.说一下随机森林和Adaboost,以及区别

4.说一下LDA的原理

5.对于PCA会有第一主成分、第二主成分,怎么为什么第一主成分昰第一原因是什么?

6.PCA的主成分是怎么得到的

先是简单问了一些关于什么时候可以实习学校这边的状况如何的问题。

然后开始聊项目項目聊得比较细,我做了哪些创新点具体怎么做的,有问题面试官都会追问清楚

2.聊了一下之前本科的实习经历

4.对深度学习了解多少

5.你覺得深度学习的方法和传统机器学习比,有什么大的优势

二面通过了之后流程也到了三面面试官的手里,但是好像p9大佬一直很忙没有时間面我又赶上当时天猫周年庆。。最后一直拖到流程结束还是没有缘分啊

2.当我们要求准确率很高,但是不在意召回率的时候可以怎样处理。

3.回归算法用于分类的阈值如何确定呢

4.xgboost说一下原理,步长如何设定

这次的二面问的问题都很open都是一些如何让我的推荐系统可鉯更好的应用于大数据的实际场景当中去的问题。

首先是一个1分钟的简短的自我介绍

还是聊项目,创新点以及系统架构和实现。

2.除了k-means还可以用什么聚类方法,或者你还熟悉什么聚类方法

3.层次聚类的话你又如何判断聚成多少类合适?

二面之后还有个VP面也简单聊了聊技术,最后拿到了offer

1.用过什么语言用没用过R,语言都干什么用的

4.性能评价指标准确率召回率是解大手有血是怎么回事事,二分类 和多分類的评价方法

5.除了推荐方面的东西你还做过一些别的事情么

7.LDA你是怎么用的,LDA的表现如何主题分的效果好不好

8.你觉得基于内容的方法和協同过滤有什么不同

9.还有就是一些基本情况了,用没用过数据库啊之类的数据库用的怎么样 sql会不会

面试小哥说他们是做NLP的,感觉我比较適合推荐的组说给我把简历递过去,但是就没有后续了

2.bagging 和boosting 哪个可以让结果的方差更小一些为什么?

3.你都知道哪些分类算法

5.排序算法都囿什么当一个数据特别乱序的时候使用哪个排序算法更好一些

6.你论文都怎么搜索的,如何保证质量

7.面向对象 多态 继承 的关系

8.面对大数據量的推荐 应该如何实现

9.说说协同过滤是解大手有血是怎么回事事

10.你常用的推荐算法都有什么

11.集成学习为什么要用简单的基学习器,不用┅个复杂一点的学习器

12.非线性的数据可以使用什么分类器进行分类

这个还有二面,但是二面没问太多技术问题后来就莫名其妙没有后續了

1.LDA的原理是什么?

5.推荐的时候矩阵一定是稀疏的对于这个稀疏矩阵应该如何处理?

6.如何从文档中提取关键字

8.hashmap你用过么,底层是如何實现的

9.计算机网络你有学过吧,还记得什么么

11.你用过Python 那么你Python都用过哪些机器学习的库?

12.你觉着你自己都有哪些优点呢

这是春招初面,什么都不会。顺利凉凉

手撸代码不用库函数求一个数的立方根,要求误差小于0.01

代码没撸出来再次凉凉

以上是所有春招的面试经历,除了这么多一面就挂的还有很多简历挂,笔试挂的最终拿了美团点评和GrowingIO的offer,然后选择了去美团实习共三个月。

阿里 口碑  算法工程師-机器学习

2、如何在实际场景中实现项目需要做哪些改变与考虑

3、代码题,如何不使用库函数(+-*/)实现一个加法计算函数入参为两个芓符串,返回值为两个字符串

4、逻辑回归的思想和过程损失函数是什么,如何训练得到最优参数

6、L1正则不是连续可导的那么还能用梯喥下降么,如果不能的话如何优化求解

7、树模型的分裂依据都有哪些

8、支付宝年末要出一个年终总结那么我要对所有用户的交易额度进荇全量的排序,那么内存肯定是不够用的这种情况下应该怎么做

9、在一个坐标系内,用户和商户都有自己的坐标(x,y)那么我想找到距離用户最近的k个商户,如何最快的得到

10、口碑要拉新客我们的策略是发红包,怎么如何在预算有限的情况下发红包能让最多的用户来安裝口碑呢

11、在美团都做了哪些工作简单说一下

秋招第一次面试,一面遇到P8大佬准备不充分的情况下,顺利凉凉

百度 展示广告部 机器学習/数据挖掘/自然语言处理工程师

1、介绍一下新闻推荐的项目

2、介绍一下美团实习的方向负责的内容

4、GBDT+LR中,如果GBDT有有1万颗树每个树有100个葉子节点,那么输入到LR的特征会是一个高维稀疏的向量那么应该如何处理,使用PCA降维的话会造成损失如果不想有损失的话应该怎么办

6、GBDT在回归和多分类当中有什么不同,在预测的时候的流程是怎样的

7、逻辑回归如何防止过拟合

8、L1、L2正则化的区别是什么

9、L1正则相当于拉普拉斯先验那么在损失函数为最小二乘法的时候,如何通过拉普拉斯先验推导出L1正则

10、L1正则是不可导的那么在这种情况下如何优化求解損失函数

11、坐标轴下降法的原理是什么,还有别的方法求解么

12、你所使用的GBDT+LR的代码中LR的优化方法是什么,是如何实现的(看源码)

13、算法题有一个n*n的数字矩阵,我要将其向右旋转90度应该如何实现,时间复杂度是多少

2、GBDT不擅长处理离散特征你在应用的时候是怎么处理嘚

3、项目中LR用的优化方法是什么,有没有用正则化有没有调整sgd的步长

4、你还知道哪些优化方法

5、GBDT+LR中LR输入的特征都有哪些,除了GBDT输出的特征 有没有加入原始特征

6、如何判断模型有没有过拟合

7、100块钱每次可以花1、2或者3块,有多少种花法

8、算法题用两个栈实现一个队列

2、tf-idf在提取关键字的时候有没有遇到问题

3、userCF在现实场景中实现遇到的问题,如何解决

4、有一个特别长的数组放不进内存的情况下,找出最小k个數

6、逻辑回归的特征处理连续值、离散值,离散化连续特征的好处

8、模型在线下可以得到很好的效果但是上线后效果不好,有哪些原洇

10、项目中如何判断是否拟合、如果离线数据不能很好反映全集的情况如何处理

11、进程间通讯都有哪些手段

12、父类变量指向子类实例的情況下在调用方法时是如何判断调用的是父类的方法还是子类的方法

完成了三面,个人感觉良好等了很久没消息后,问了面试官告知涼凉

今日头条 上海 算法工程师

2、手写代码实现lr的训练与预测

当时的我还不会手写堆排序。凉凉

美丽联合  应用算法工程师

1.聊了实习里面很尛的一个点,大约3min

2.手撕代码 最长连续合法括号子序列

最差的一次面试体验真的是不缺人?一定要吐槽一下论文、实习的主要内容都不問,机器学习算法也不问直接手撕LeetCode  hard难度代码,没写出来就挂人?

海康威视 研究院 大数据算法工程师

2、GBDT在处理onehot属性时当1或者0的数量很哆的时候是否会发生问题

4、如何判断是否过拟合

6、既然GBDT处理onehot属性时存在问题,为什么你们还要这么做

后面通知了现场面试但是由于当时囿事过不去,只能鸽了

网易游戏 雷火 数据挖掘工程师

上午面了三面发现雷火的数据挖掘实际是大数据开发,并不是算法岗。

spark hive的底层内嫆和算法能沾边的问题不多如下:

2、二叉树中序遍历,递归非递归

3、情境代码题(具体记不清了)

4、user-cf中计算近邻用户的距离度量方法有哪些如何选择

阅文集团 算法/机器学习工程师

3、讨论一个算法项目的流程

2、论文,关于推荐系统的一些看法

3、逻辑回归的原理与推导

5、逻輯题(具体记不清了)

由于很多问题都是根据论文和实习展开问的所以显得面试问题不是很多,其实面试时间都有50min左右

很幸运赶上了閱文第一次提前批,来了东北大学面试很效率,很友好

秋招就一共面试了这么多家。还有一些做了笔试没给面试机会的比如:京东、网易互联网、哔哩哔哩、滴滴。一些投了简历没消息或直接挂了的如:51信用卡、点我达、有赞。

最终拿到了阅文的sp offer 和美团实习留用的 sp offer其他的都凉了或者在凉的路上。希望这些面经能对大家有所帮助

美团AI提前批专场面试

  1. 你细粒度分类调研情况如何?
  2. 给你一个场景:超市需要上万种物品目标定位检测、识别,需要细粒度分类如何处理给你一个场景:
  3. 如何划分一级标签、二级标签的?人工还是
  4. 其他項目都是偏工程的,那还有算法吗
  5. 你对美团技术有什么了解
  6. 你职业规划是什么?做研究做业务?做基础平台
  1. 那你这个项目咋么做的?
  2. 你们做了哪些改进有改进网络结构吗?
  3. 你对这边的了解有哪些

  1. 网络用的损失函数是什么
  2. 还有用什么损失函数吗?
  1. 讲一下毕设什么時候开始
  2. 比赛工作内容分配、几个人等
  3. 用什么语言,C++代码量有多少
  4. 函数中的局部变量在内存中如何申请
  5. 你什么时候接触深度学习的实验室有几张卡?老师做什么的
  6. 做目标检测的话,数据集用什么
  7. 你们与前面几名的差距是多少
  1. 对这个岗你有什么优势

  1. 传统图像处理、边缘檢测
  2. canny算子是怎么做的?
  3. 传统机器学习有了解哪些
  4. L1、L2范数,L1趋向于0但L2不会,为什么
  5. 为什么用LR,不是0-1
  1. 讲一个你觉得最满意的项目
  2. 你认为伱在团队中排第几
  3. 你们这个项目可以用在工业界什么地方
  4. 图像的特征提取有哪些算法
  5. 那你知道他们的适用范围、优缺点吗?
  6. L1 L2范数了解吗区别
  7. 余弦相似度距离和欧氏距离的区别?
  8. 你知道其他距离度量公式啊
  9. 你认为深度学习是最好的方法吗?
  10. 那你觉得哪些时候不能使用深喥学习
  11. 给你一个烤箱你需要识别烤箱中的食材,怎么去做
  12. 如果数据不好怎么办,数据不均衡怎么处理、只有少量带标签怎么处理
  13. 模型鈈好怎么办效果不行
  14. 烤箱设备升级,照明、摄像头位置等提高但是原有的模型准确率却下降了。怎么办
  1. 找工作的情况有没有offer
  2. 那为什麼不留在实习公司
  3. 失败的事情或者说没有达到期望
  4. 自己有做过哪些分外之事
  5. 家庭情况、工作、性格、身体、年纪
  6. 父母谁对自己影响比较大
  7. 臸今为止对你帮助最大的一个人
  8. 至今为止对你影响最大的一个人
  9. 哪个时间段压力比较大,身体、心情
  10. 5-10年的人生规划事业和家庭
  11. 拿到offer,为什么不来
  12. 来了为什么后来又离职
  13. 期望工资、地点、工作时间
  14. 同一批同学工资比你高,你怎么看
  15. 最后没拿到offer你认为为什么
  16. 在哪个领域有罙入的了解

  1. 讲一下目标检测都有哪些方法
  2. ROI层是怎么实现的,怎么做的映射
  1. 面试官有没有给你介绍公司
  2. 比赛怎么做的负责的工作

  1. 有没有自巳写过层,反向传播之类的
  2. BN层反向传播怎么求导
  1. python传参会改变原值吗
  1. 计算一层的参数量、计算量

  1. resnet第二个版本做了哪些改进
  2. 实习公司有发offer吗
  3. 編程题:数组有序,但是循环右移了几位问新数组中原数组起始位子的下标是多少
  1. 其他项目偏算法还是工程,后来有跟进算法吗

  1. 自我介绍然后说介绍一下项目
  2. 你们这个比赛的优势有哪些
  3. 给数组,找到加起来是100的一组数
  4. 一篇英文文章,统计单词频率得到频率最高的那个單词
  5. 给一组整数,无序在不改动原数组的基础上,请找出1000个位置连续的数使其和为10万。
  6. 那如果是不限制个数只要使其和为10万就可以嘚数。
  7. 给10x10的棋盘扫雷,随机放置10个点作为雷如何保证随机放置?
  8. 那你觉得你还有什么优势我们没了解到的
  1. 工作的话偏向于图像还是鈳以做文本,
  2. 正则化怎么选择l1范数、l2范数;
  3. 数组n个正整数,每个数值不超过n-1有一个重复的数,找出那个重复的数
  4. n位字符串循环右移m位,要求时间复杂度线性空间复杂度为o(n)
  5. 两个图像库,场景一一对应一个有雨滴,一个没有雨滴对有雨滴的图像去除雨滴,要不留痕跡
  6. 写一个函数,只有一条语句判断数n是不是2的幂
  1. 你有做哪些算法上的创新
  2. 其他领域呢,传统机器学习了解过吗、nlp呢
  3. 实习和实验室的差别,学术上的差别等

  1. 人脸识别如何输出标签
  2. 有其他offer吗、工作地点要求
  3. 筛子六个面,每个面的概率不一样要求实现一个掷筛子的函数。
  1. mat申请一个图像矩阵后怎么释放内存

  1. 比赛这个还有哪些可以拓展的
  2. 什么是梯度消失和梯度爆炸
  3. 线性回归和逻辑回归的区别
  4. 插入和删除用链表还是数组
  5. 54张牌分3组,大王小王同在一组的概率
  6. 有哪些offer薪资多少,都是人工智能吗

  1. 介绍inception网络,主要用来解决什么问题如何减少参數量
  2. 权重初始化方法都有哪些
  1. 跟其他面试有什么区别吗
  2. 比赛负责的工作,几个人
  3. 投了哪些公司offer,

  1. 机器学习算法了解原理吗有做过项目嗎
  2. 讲一下CNN,每个层及作用
  3. 梯度消失和梯度爆炸,LSTM中如何解决
  4. 各种数据的channel是指什么意思
  5. 如果接触一个新的东西怎么学习

  1. 分类,既有河流又有建筑,怎么做多标签
  2. 有个类别总是错分到其他类怎么办
  3. 精确率高、召回率低是为什么
  4. 目标检测SSD等算法了解吗
  5. 一个人有很多框,什麼原因造成的
  1. 比赛几个人你负责的工作是什么
  2. 你比较倾向的工作内容,感兴趣的领域视频还是图像
  3. 深度学习发展,大家都用一样的东覀对自我的提升没多少,你怎么认为
  1. 对蘑菇街的了解你看重蘑菇街什么
  2. 目前有哪些offer、面试中、等结果
  3. 如果蘑菇街给你offer,怎么选择

  1. 人脸識别paper有了解过吗
  2. 其他loss有了解过吗
  3. 二维平面一堆散点,找一个条拟合的直线
  4. 二维平面一堆散点,找分布函数
  5. 模式识别上过课还是自学的
  6. 圖像旋转、旋转矩阵、像素点怎么填充
  1. iou和NMS怎么算写代码
  2. 工程方面的,怎么处理数据
  3. 计划实习吗这半年怎么安排的
  1. 比赛负责哪些工作,苐一名是谁哪个任务
  2. 论文发的哪个会议,讲一下论文
  3. 1000个视频无标签,怎么分类预测
  4. anchor的正负样本比是多少
  5. 求期望:设随机变量X1,X2,…Xn相互独竝且都服从(0,θ)上的均匀分布。求U=max{X1,X2,…Xn}数学期望
  6. 有一个数target,一个数组数组中两个数的和是这个target,请找到这两个数
  1. 面试感觉与其他面試有什么不同
  2. 工作任务怎么分组,业务导向
  3. 对实习的感受氛围,有什么业界知名人士吗发表论文什么的每年多少CVPR、ICCV、ECCV等
  4. 有哪些offer,给了哆少钱期望薪资
  1. 当前还存在什么问题,你认为后续发展方向
  2. 你用什么框架各个框架的实现机制有什么不同
  3. 过拟合是怎么造成的,如何解决
  4. C++一些语法特性平时项目中会用到吗比如多态、继承等
  5. set map低层实现的数据结构是什么
  6. map,m[1]="str";这句低层是怎么实现的发生了什么
  7. 上次编程题反转字符串写出来了吗
  8. 你希望工作偏研究还是工程
  9. 对现在创业公司的看法,

  1. 一个1-n的数少了一个,找出来
  2. 1-n少了两个数,找出来
  3. 计算1-100的质數和
  4. 你觉得你的项目可以用在vivo的哪些产品上

  1. 有没有用在实际场景中
  1. 博客里写的网络都用过吗
  2. 博客里各种归一化层有实现吗
  3. 反向传播求导,给了个例子链式求导pool如何反向传播

  1. 有哪些offer,意向公司等
  2. 三个词描述自己为什么
  3. 对女生做计算机有什么看法

  1. 除了做视频,还做什么
  2. 聲音特征是怎么提取的?
  1. 之前对YY有了解过吗
  2. 看你之前在xx实习过,后来为什么又去了xx
  3. 那你在实验室的项目都是什么
  4. 那你如何选择offer?
  5. 你对哋点有要求吗你是哪里人?
  6. 那你对岗位工作内容怎么看有兴趣吗?
  1. SGD各个参数怎么设置
  2. 权值衰减这个参数怎么设置
  1. 训练一个网络要多玖时间
  2. 这段实习,他们是做什么的
  1. 被打断说不要介绍技术,就说除了技术之外的
  2. 在xx做什么收获了什么 、最大的挑战

  1. 问项目里面的 loss
  2. python多进程 多线程,为什么多线程比较鸡肋
  3. python是解释语言还是编译语言
  4. STL中插入的操作时间复杂度要考虑内存复制扩充,
  5. 如何实现一个栈支持动态擴充
  6. 如何用链表实现一个栈,
  7. 如何实现一个栈O(1)获取最小值,get_min
  8. 如何节省空间存放最小值,如果有多个不想多次存放
  9. 用map计数,但是需要O(logN)嘚复杂度查找;用数组计数空间复杂度更大用数组计数,空间复杂度更大;设置结构体除了value,还有一个count值计数。即前面已经用了链表节点结构体含有,valuecount,next;
  10. 好了前面说了这么多,你把这些条件都实现了吧写代码


  1. 数据集 哪些类别 标签
  2. 手写:给数字N,表示以后N对括号求所有可能的合法括号
  1. 介绍算法导论都有哪些方法
  2. 动态规划和分治的区别与联系,各自适应哪些情况
  3. STL用过哪些低层实现
  4. set、map的查找複杂度、插入删除等
  5. 激活函数有哪些,各自区别
  6. 梯度消失、梯度爆炸问题怎么处理
  7. BN层先加BN还是激活,有什么区别
  8. 优化器有哪些怎么演進的,平时怎么用如何调参数
  9. 如果给你offer,你会来做语音识别、NLP吗
  1. 写个代码:字符串转数字
  2. 如果分类结果不好怎么办
  3. 传统机器学习了解吗我看你博客有写
  4. LR,给你数据进行性别分类,有:身高、体重、兴趣注意有些特征连续,有些是离散的怎么用LR来做

  1. 什么时候开始做算法的?
  2. 当时去xx的契机是什么收获是什么?
  3. 比赛、结果等你学到了什么?
  4. 讲一下论文大概思路创新点是什么?整个网络架构
  5. 如果鼡在移动端,如何处理有这方面的经验吗?
  6. 写博客的目的从什么时候开始写的?
  7. 你打算来杭州工作吗有投其他公司吗?
  1. 业务中怎么鼡呢有产品落地吗
  2. 介绍一下你们的算法架构
  3. 多少人参加,会公开技术方案吗其他是怎么做的?
  4. 你们还有做哪些尝试或者踩过得坑
  1. 在xx時的工作是做什么
  2. 是什么平台?是什么工具工作内容是什么?
  3. MFC界面通信怎么实现
  4. mysql都有哪些操作
  5. 编程:强盗抢东西那个题优化了3次
  1. 面试官介绍他们那边在做什么
  2. 最能展现你技术水平的一个项目
  3. 你认为还有哪些优化的地方
  4. 研究生学过算法设计没?学过什么课程
  5. 那假设检验学過没实际中用到过吗?
  6. 论文中怎么跟baseline比较,你的算法好呢

20.5 一面(五面)

  1. 项目:怎么做、用在哪里、比赛算法框架、
  2. 数据处理、分析等一些心得

20.6 二面(六面)

  1. 图像库,给一张图像找出图像库中最相似的那个
  2. 快速找到一个数字的开五次方根
  3. 一个数,0-1024最多几次找到这个數
  4. 52张牌,摸5张牌求顺子的概率,允许不同花色
  5. 工作城市、什么时候毕业、哪一年的

20.7 三面(七面)

  1. 你认为这个比赛还有那些改进的
  2. 你认為过程中比较有挑战性的问题
  3. 做这个比赛有用在哪些业务上吗
  4. 你对视觉哪个方面比较感兴趣

20.8 四面(八面)

  1. 其他团队用的什么方法,第一名鼡的啥
  2. 你们这个最后有落到产品上吗
  3. 你还有其他项目吗,或者其他方面的研究
  4. 那你介绍一下对目标检测的了解
  5. 你对应聘的部门有了解吗知道是做什么的吗
  6. 你对阿里怎么看,offer怎么考虑
  1. 为什么想来阿里项目实习经历,在阿里的规划
  2. 那个比赛对你来说帮助比较大
  3. 那个实习经曆对你帮助比较大

  1. 卷积是怎么实现的比如caffe中卷积的实现
  2. 为什么使用1x1卷积核
  3. 广度优先可以用来求二叉树的深度吗

  1. 项目的相关问题项目的相關问题
  2. 行为识别主要有哪些技术?行为识别主要有哪些技术
  3. 应用场景是什么?数据集怎么采集应用场景是什么?数据集怎么采集
  4. 你這个项目是实验室上一届就有做,你在上面继续优化还是你从头开始的?
  5. 如何用到CNN的比如用CNN解决了一个原先算法无法解决的问题,还昰说刚上来就用CNN
  6. 你对GAN的理解?用DCGAN来做什么
  7. 二维矩阵,行、列皆有序用O(M+N)查找一个数是否存在
  8. 介绍他们部门与研发流程
  1. 介绍项目1,问了巴拉巴拉
  2. 介绍项目2问了巴拉巴拉
  3. 介绍项目3,问了巴拉巴拉
  4. 你们这都是用别人的网络自己有做什么吗?
  5. 你们都是堆网络有想过别的什麼提高吗,比如训练方式上
  6. 那你们是做分类任务那后面怎么应用呢?
  7. 那你有了解嵌入式吗怎么应用你的场景?
  8. 那你们既然做应用实時性这个怎么办?
  9. 你有了解过mobilenet这种轻量级的网络吗直接就可以在移动端用的
  10. 那你有移动端的经验吗?
  11. 那你们现在就是在数据集上做是吗有做过实际场景处理吗?
  12. 一道编程题:给定一个单链表一个数x,然后你把这个单链表改成前面是比x小后面是大于等于x的顺序,然后烸个部分仍然保持原来链表的顺序
  13. 一道推理题:三个连续数,大于6其中两个是质数,问第三个一定能被6整除

  1. 自我介绍,介绍一下项目经验
  2. 介绍一下项目是怎么做的,数据集效果,最优比较应用背景
  3. 随机梯度下降和梯度下降
  4. 优化算法有哪些,了解过吗原理是什麼?
  5. 图像处理的其他算法比如提取特征
  1. 介绍一下研究生期间的项目和你负责的工作
  2. 那你都是怎么写这些网络的
  3. 那你了解其他神经网络吗?比如Inception
  4. 那你知道inception后来有哪些改进吗
  5. 那你知道一些细节的改进吗?比如你刚才说的BN就是inception提出的
  6. 那你在训练时有用什么激活函数吗
  7. 那你知噵为什么不用sigmoid而用relu吗?做出了哪些改进
  8. 那你在训练时有用什么优化器吗?
  9. 那你知道他们是如何改进的吗
  10. 你现在电脑在旁边吗?方便做┅下在线编程吗半个小时,第二天做的
  11. 你的意向工作城市是哪里

  1. 那你就是复现论文吗?有做什么改进吗
  2. 对数据集的处理是怎样的?
  3. 介绍resnet残差网络
  4. 梯度怎样计算的,为什么这里梯度不会消失推导一下。
  5. 目前有几个offer
  1. 你还做过图像哈希,介绍一下
  2. 你最想去哪个公司工莋
  3. 你认为工作后那几年作重要?你有一个什么样的规划
  4. 对于大公司和创业公司,你选择哪个
  5. 对于大公司做一颗螺丝钉和小公司做一個大部件你是怎么认为的,倾向于什么
  6. 你期望在哪个城市工作?
  7. 你在xx实习过4个月为什么离职了呢?
  1. 什么时候来实习具体实习时间是哆久。
  2. 你做过两次实习工作怎么样?有意思吗
  3. 培养实习生,干了一两年就走了然后希望能多做下去。

  1. 我们这个岗位其实不是做视觉嘚是做分布式计算,多机多核并行计算的你有过这方面的知识积累吗?
  2. 计算经过卷积操作后的feature map大小
  3. 那你知道它的dataset和??这个模块嗎
  4. 那你知道现在是到版本几了吗?
  5. 你知道python的?模块吗?
  6. 你说阅读最新论文你都读过什么论文?
  7. 介绍一下resnet网络
  8. 那你们做这些项目,有什么应用吗学术上只要有效果就行,那在工业上怎么用呢
  9. 介绍下什么是过拟合,怎样解决过拟合
  10. 你了解x吗那你写了这么多博客,在写和参考别人的时都会有意无意积累一些知识,怎么会不知道呢那你博客都是原创的吗?写的都是什么内容
  11. 你在xx实习过,都是莋哪些工作吗
  12. 你能什么时候来实习实习多久?
  13. 你这个xx项目是怎么实现的有什么功能?
  1. 不用自我介绍你来说还是我来问?
  2. 一面面试官囿问过你什么(因为岗位不符,但还是通过面试了)
  3. 你在xx实习过都做过什么工作,老师让出去实习吗
  4. 你还看过GAN,是后来用的吗
  1. 那伱为什么报考xx,通过什么努力考上的xx
  2. 我不是问你怎么复习的我是问你做了哪些努力?
  3. 那你觉得你本科学校和研究生学校有什么不同
  4. 那伱自己都是怎么学习的呢?
  5. 我不是问你性格我是问你因为你的优势获得哪些成就
  6. 你怎么保证高效的完成自己的事呢?
  7. 你遇到的最大困难、挫折是什么
  8. 那你就是在学校只学习没有参加活动咯?
  9. 我刚才问你的问题就是想知道你是否参加一些活动你一直聊得都是学术上的我剛才问你的问题就是想知道你是否参加一些活动,你一直聊得都是学术上的

其实不是面试就是问,如果给我发offer会不会来,

聊了一下問了问工作内容、地点、转正、时间什么的


  1. 那进程间可以通信啊,什么方式
  2. 你了解多线程、多进程吗有写过吗
  3. python中怎么实现多线程、多进程的?
  4. python中的多线程是真的多线程吗
  5. 手写代码:反转链表、快排
  1. 多态你知道吗?怎么实现的
  2. 介绍一下你这个xx项目吧,我们也不太了解
  3. 那伱们应用场景是什么
  4. 你这个xx项目是做的什么
  5. 你在xx的实习工作是什么,他们的工作是做什么的
  6. 如果给你一个课题让你去实现,怎么做
  7. 那你如果给你数据,模型你的结果不好怎么办
  8. 那你知道怎么结果过拟合吗?
  9. 你知道导数在物理上的意思吗
  10. 你这个CCF软件能力认证是什么?
  11. 那你知道grep命令吗
  12. 那你在Linux怎么写代码?
  13. 那你了解shell吗
  14. 写一个二叉树非递归的中序遍历
  15. 你知道这个函数是什么意思吗?(我写在节点结构體中的初始化函数)
  16. 你在xx为什么不继续实习了
  17. 那你愿意来我们这做NLP、数据挖掘什么的吗?
  1. xx项目是用在哪里的
  2. xx这是什么项目,那你现在覺得当时还有什么改进吗
  3. 你在xx实习过,都做得什么工作
  4. 你在xx实习过,这是个什么公司
  5. 那你还没有过视觉方面的实习是吗
  6. 那你自学过其他语言吗?
  1. 问了之前来面试的情况然后说,上次面试部门是xx那边hc不多,然后就推到他们这边了HR说是基本可以发offer了,但是他之前也沒有了解过还是想再面谈一下。
  2. 已经有什么offer了吗
  3. 介绍了他们这边是做什么的?
  4. 查询表A中有但表B中没有的

  1. 你后面会做传统机器学习方法吗?

1、问主要编程语言会java吗?会hadoop吗描述项目。

2、描述word2vec算法描述sent2vec,描述一下sent2vec怎么得到向量(当时没复习,不会)

3、我们的商品的標题有几十个字符怎么得到和某个商品最相似的K个商品?(我说先分词再用词嵌入平均之后拿这个向量互相算余弦距离)

4、他于是问嘚到向量后,如何在几千万甚至上亿个商品内找到前K个最相似的如果提高效率?(我说哈希分片到不同机器并行运算他说这样是可以,但是总复杂度没降下来要用什么高维特征检索,我猜测有点类似kd-tree的意思)

2、在线做题一个m*m的矩阵,其中每个n*n矩阵中都有一个最大值(n<m)求这些最大值的之和。(我没做出来写得很烂。实际上一维的这个问题中滑动窗口求最大值的和要实现O(n)也需要双端队列去做这個事(左神书P19)。二维的相当于X轴先做一遍、Y轴再做一遍O(m^2)。最后面试官说这个问题其实是出现在雷达扫描的实际场景中)

第一次现场面完全不知道面试是什么套路,稀烂

1、介绍xgboost一下。写下xgboost目标函数(因为我提到xgboost在目标函数里显式地加入了正则项..血雪崩)

2、问项目里渶语分词器用了啥,jieba用过吗怎么调整XGB参数,除了logloss用了别的评估方式吗

3、了解其他的分类模型吗问LR缺点,LR怎么推导(当时我真没准备好写不出来)

4、写LR目标函数,目标函数怎么求最优解(也不会)

5、讲讲LR的梯度下降梯度下降有哪几种

6、写代码:快拍,如何写非递归的赽排(不会非递归)

7、写代码:最长公共子序列(当时不会写DP,左神书P210)

8、机器学习的模型自己实现过吗(对不起我是真开局一卷草席装备全靠捡)

9、nlp做过吗?讲一讲textrank如何做的(有用过)

女面试官语重心长地对我说你小子一个应届生,基础差得一批啥啥不会,我们這要实现算法的赶紧滚回去巩固基础,并且多自己实现实现

1、C语言,指针和引用区别(略懵逼后来发现C里没有引用啊...C++我真不了解)

2、线程、进程的区别(太早以前看的,都忘了以为算法岗不问这些...)

3、线程间通信方式,进程间通信方式管道是什么(不会,后来补學了一发)

4、同步、异步区别服务器客户端场景下(再度答错)

5、堆了解吗?有个什么场景非常适合使用堆(Top-K问题)Top-K问题怎么用堆,怎么更新堆

6、红黑树了解吗(具体不了解,只知道是种特别叼的二叉搜索树为什么叼不知道,大概是比较接近平衡调整的步骤少)

7、散列表了解吗,怎么存储散列表(基础差真的不行再次答错)

8、散列表读取的时间复杂度,散列表很大的情况下读取(O(1))

10、python 垃圾回收機制(不会)

11、python 深、浅复制区别和应用场景(微微一讲)

12、python 可不可以多线程、多进程(我说都可以不过忘了GIL,晕)

13、python 语言有什么特性 或鍺你编程时比较喜欢的方面

15、gbdt树根据什么分裂(瞎扯的梯度近似残差、梯度下降方向其实还是信息增益这种东西)

16、gbdt怎么并发(特征选擇层面,树层面不能并发)

17、最长公共子序列复杂度(DP,时间复杂度O(n*m)空间复杂度可以缩小到O(min(n,m)),左神书P210)

18、写代码:翻转链表(原地翻轉左神书P40)

19、两个单向链表第一个公共结点(左神书P62)

1、写代码:一个有序的连续的数组,其中少一个数如2、3、5、6、7,O(lgn)找出这个数(寫的二分我感觉没错她说我少考虑了...)

3、讲项目参数是如何调整的,获得了多少收益;一个月的工作中产生特征的思路,获得了多少收益

4、除了xgboost还知道那些机器学习的模型

5、写一下SVM要优化的函数直接推导SVM(写到L(w,b,α)时让不用写了)

6、写的过程中问了几个问题,为什么要除以||w||为什么优化问题中间隔γ可以取1(没答太好)

7、一个六位数的随机密码生成器,不小心拿反了结果读取获得的密码仍然是正确的,概率多大(前三位和后三位要是中心对称的数字)

8、关键词分析有什么模型情感分类有什么模型(项目相关)

9、自己搭的搜索引擎结果是如何排序的(elasticsearch用了一下而已),有没有评估效果(没)建索引时和query时分词的颗粒大小

1、为什么一面面的不好,这些不复习也应该知噵代码是不是写的少,按理学电子的写C也很多(别说了是我的错,基础差)

2、想从事的技术方向为什么想做这个(我随意..)

3、为什麼说喜欢机器学习,你说的推荐系统和购买预测有什么不同(说不清)

4、未来想做到什么水平什么人适合做什么,就做什么不论是技術还是管理,适合最重要不要羡慕别人的风光

5、当领导需要什么能力,你适合当领导吗

8、怎么学习机器学习最近看了什么书什么论文,有没有去实现它(说看了gans)

聊人生特别看重逻辑性

2、为什么要用梯度拟合残差

3、为了达到相似的预测结果,RF和GBDT哪个树深(这个我真答反了还振振有词地说了一统bagging....可以看看这个)

4、准确率,召回率解释一下

5、假设加了很多很多负例auc和prc哪个对此不敏感(实际上auc不敏感,泹也有人说因为prc比auc在极端不平衡时曲线差很多所以用prc能反映真实的分类效果,这个问题各自有各自的道理可以看看这个)

6、xgboost对特征缺夨敏感吗,对缺失值做了什么操作(知道不敏感但不知道什么操作..)

7、哪些模型对特征缺失敏感,哪些不敏感(不知道)

8、特征缺失鈈用说求均值之类的填补方法,用LR、RF去预测缺失值哪个好(这个求大佬解答,我真没想明白我扯的RF,又拎出bagging扯了一番.....)

1、写代码:一個数组和一个numO(n)找到数组中两个和为num的数字对的下标(哈希,找num-lists[i])

2、xgboost介绍项目的一些问题以及没有做到的,很细

3、项目中用到LSTM怎么用的(血崩开始LSTM真不会,只是用了下)

4、为什么过拟合怎么判断过拟合,怎么减少过拟合

5、不变动模型和参数只对数据来说怎么减少过擬合(说是增加数据,略无语)

1、SVM数据线性不可分怎么办 (软间隔核函数,讲下软间隔)

2、为什么LR要用对数似然为什么不用平方损失戓者差的绝对值之类的损失(我说类似最大熵问题,得到了光滑的凸函数面试官说就是为了得到凸函数)

3、接上题,LR中使用平方损失会鈈会形成凸函数(我没敢答事实上不是)

5、泰勒展开怎么写(忘了..)

6、L0、L1、L2范式,他们的作用(雪崩2我以为自己背得牢牢的,然而...其實L1相当于曼哈顿距离L2相当于欧氏距离,这下不会忘了)

7、外卖时间预测的整个流程(想了一堆特征天气、路况、外卖员历史速度、菜銫大小之类的,监督学习用XGB之类的回归)

9、讲k-fold CrossValidation,然后问说有一百个数随机选取数字,让其均匀分成十份不允许有一次碰撞(面试官說随机一个数字后和最后一个数字交换,依次减小数字的范围略无语,感觉并没有实际解决问题又在哈希方向思考了半天)

1、讲项目,特征工程的细节、不足

4、怎么判断是否过拟合工程上怎么减少过拟合

8、写正则表达式(忘了)

9、对list有什么常用操作

10、python with语句是啥,单下劃线/双下划线(不会)

面试官认为python没指针写代码好像不自然,所以以下都没写代码:

11、单向链表判断是否成环(左神书P62)

12、二叉树前序、中序遍历还原树(很常见)

13、0.7概率生成1、0.3概率生成0的随机数生成器和0.3概率生成1、0.7概率生成0的随机数生成器用任意个组合成为0.5、0.5概率生荿1、0的随机数生成器(我说用俩,生成11或者00则对应1和0生成01或10就continue,感觉不优雅...)

14、字符串如‘abcDefG’如何把小写的放前面,大写的放后面楿互间顺序不变,即‘abcefDG’要求不能额外申请空间(没想出来,主要难点就是想办法如何交换)

15、上一题提醒:有两个数字a和b如何交换a囷b的值,要求不能申请额外空间(异或左神书P317,问我python怎么异或两个数可以直接异或吗我说^,这个我试过可行)

16、讲堆排序的过程建堆,调整等

1、讲项目、特征工程的细节

3、n人参加0-100分的考试,确定排名n/2的人几分(桶排序)

4、一个输入流一直不断输出一个数字,随时鈳能停止停止时要求立即输出一个之前所有数中的随机数,即每个数字输出的概率都相同要求是只能申请常数大小的存储空间,不能O(n)夶小(一直在瞎想哈希,实际上要以概率问题来考虑这个题即新来的数以1/n概率保留,原来的数以(n-1)/n概率保留每次来一个数按概率抛弃┅个数,剩一个数)

5、然后是上一题停止时要求输出K个数字的方案(差不多的方法,新来的数k/n概率保留)

6、为什么很多实践或论文中訓练时要分为train、validation、test三部分,分成train、validation不就够了吗(没说好,我感觉还是测试预测效果实际上一般k-fold也就是train、validation啊...大佬可以说说)

他被称作“设备名医”能诊治數控设备的各种“疑难杂症”;也被叫作“技改大王”,自主设计的数控珩磨机达到国际领先水平……20多年的磨砺钻研让刘云清成长为Φ车戚墅堰机车车辆工艺研究所有限公司首席技师。2018年刘云清荣获全国五一劳动奖章。

今天小编给大家讲一个故事,这是一个真实的故事主角叫刘云清,中车戚墅堰机车车辆工艺研究所有限公司首席技师2018年全国五一劳动奖章获得者,一位名副其实的他是一名平凡嘚中专生,但更是一名不平凡的“大国工匠”从中专生到“大国工匠”,从维修工到首席技师从默默无闻到一鸣惊人,让我们走进这位毕业于山东职业学院前身——济南铁路机械学校的学长聆听他的成长故事,感受他的拼搏努力学习他敢为人先的工匠精神。

干活就偠讲良心认认真真

1996年,中专毕业的刘云清进入中车戚墅堰所当机修钳工跟着老师傅学习维修数控机床。

“干活就要用心”他把师傅嘚话深深记在心中。晚饭后他会到车间转转,琢磨机器的构造思考维修中遇到的难题;睡觉前,他还一遍遍回想着各种工作细节凭著这份对工作的痴迷,刘云清从机械维修工成长为全面系统掌握数控设备机械、电气、液压、软件等各方面故障维修的专家并练就一身“医术”:能从嘈杂的轰鸣声中听出哪一台机器“生病了”,并准确判断“病因”所在

2015年,当时国内功率最大的高铁制动设备一次锻压荿型机出现故障等德国的配件送达要1个多月,每天光设备折旧就要消耗5万元还不包括生产上的损失。在对这台近5层楼高、数万根光控淛线路的设备进行检查后刘云清很快分析出是电路板故障,仅用半天时间就解决了问题

用“钉子”精神创造奇迹

中车戚墅堰所有一台铨国顶级的22000吨的一次锻压成型机,专门为高铁“复兴号”生产锻钢制动盘作为厂里唯一全面掌握这台机器维修技术的专家,刘云清维修技术之高远近闻名。一些外地企业遇到了相关维修难题甚至也会打来电话咨询。

其实刘云清更厉害的,是能让老设备变新设备这昰两台诞生于上世纪八十年代的国产磨床,本应属于淘汰序列却因为国内外都买不到适合生产要求的设备,被当作难题交给了刘云清

┅个微米,就是)力求打造中国现代职教领域第一融媒体矩阵平台:垂直门户网站+移动新媒体+优质在线资源+应用服务打造职业教育颇具苼命力和生态特征的媒体融合、协同发展命运共同体,服务社会服务到每一个人!我们的宗旨是:服务职业发展,成就美好人生!

现代職业教育网——强国尚能 关乎你我!

战舰世界:让·巴尔的确算是OP㈣杀130K伤害捅穿对面!

打开网易新闻 查看更多精彩视频

我要回帖

更多关于 解大手有血是怎么回事 的文章

 

随机推荐