首先是自我介绍,介绍完之后,面试官针对简历项目进行提问,包括基础知识和扩展。回答过程中,面试官会逐渐深入展开。这一环节结束后进入反问环节,可以问一些想了解的问题。
面试官问的面试题: 1. 自我介绍
2. GAN模型的原理
3. U-Net输入,最高压缩到多少,4*4可以恢复出细节来吗?
4. 损失函数。
5. 其他的生成式模型,VAE,原理。SD模型,原理
6. Transformer 了解吗
7. SD模型的CLIP原理
8. 场景:文字到相似度高的图像,怎么实现?
9. 对比学习了解吗
10. U-Net去掉skip connection 和VAE对比
11. Flask处理并发,怎么实现基于Flask的服务部署
12. 反问,部门做什么 语音到图像。我主要干什么?数据清洗,图像生成的模型调优、训练。
校园招聘会投了信动力和普通招聘,本人双非本211硕,信动力秒挂,普通招聘在处理简历那里卡了很久,也挂。过了一个多月hr给我捞出来了,给了基础笔试,也就是行测那些,过了之后给了技术笔试,考的题大都是数据结构以及一些Linux之类的知识,以及编程能力。昨天完成了AI面,基本就是聊天,英语我的很简单。等待后续过程中。
面试官问的面试题: 初面就是一些基础题,行测题和性格测试等,有些基础的话问题不大。技术笔试的难度约等于大学本科结课考试,但对于硕士而言确实忘的比较干净,比如问了一个kmp的next数组,之前手到擒来的题现在做一脸懵b。AI面试就随便说说,别犯错就没问题。英语面试分两部分,阅读and回答问题。我的阅读是一段关于音乐的,整体难度约等于高中,有些词较为偏僻。问答题问给我影响最大的人,介绍一下。
一小时,拷打transformer?
你怎么理解AIGC?
讲一下transformer
transformer和cnn的区别
transformer中embeding怎么做的
位置编码你了解哪些形式
三角函数位置编码有哪些好处,旋转位置编码呢
position embeding 和input怎么融合的
多头注意力相比单头优势,encode的时候多头会做融合吗?还是什么时候做融合?
拆成多少个头有什么规律吗?
之后的层归一化怎么实现的
前馈神经网络有几层,为什么要用mlp这种结构?
像gpt和图像生成,大都是decoder-only架构,为什么?参数量多少
相比于传统的模型和思路方法,为什么能达到现在这个效果,以及你怎么看待它未来的发展。
多模态模型了解哪些?
无手撕