本科两个月从零学习llm到找到大厂多模态算法实习经历记录。(回望两个月的学习和考核,其实踩了不少坑,遂记录复盘一下)
时间线:11.1号开始从attention学起+手搓项目,11.27开始尝试投递。12月有五厂约面,只有一家走到二面并在12.26通知通过,还有一些是被我拒了。
基础:只有工程基础,在ai的帮助下能够完成大部分工程coding;对llm的了解仅限于知道怎么调用API。工科非计算机专业(不过读硕要去当码农了)。
感悟:学习资料很重要❗️找到适合的学习资料就已经成功了一半。llm 的相关知识太多了,找准自己最适合的方向,垂直扎根生长。
学习路线:
第一阶段:知识积累。前期找了很多乱七八糟的资料,但是啃了两天之后觉得太难了,和背英语词典一样。遂到处搜集更适合的资料,推荐一个适合纯零基础入门:happyllm
datawhalechina.github.io。看完基本知识之后,可以在网上搜一些面经然后结合八股针对性地看知识。
第二阶段:往简历上写项目。在GitHub上学了点最基础项目,主要是成本限制的多模态大模型的预训练和微调。上手了不同的训练方式和训练架构,但是没有任何的idea上的创新,只是熟悉了流程。如果要把这个作为一个亮眼项目的话,建议自己爬取并制作一部分数据,然后借鉴一些最近新开源的paper的idea,跑通一整个训练微调流程。
第三阶段:投递简历。投递简历的渠道一般有三个:官网,小红书,boss直聘。个人用下来boss体感最好,回复很及时。小红书发帖正经招人的大厂一般两小时以内发送简历才会被看到。投递简历的时候也要高强度看八股(不要停!不然知识会非常容易忘记)。八股很多时候是更高维度的东西,他能逼迫人从“是什么”“怎么做”去思考“为什么”。
第四阶段:面试(这里讲的都是研究型岗位的面试技巧)。约面不建议约太晚,一般今天打电话,约今明后三天,除了周五都尽量不要放到下周。我有一个面试约得超过了一周,该厂已经找到对应的候选人了。首先是自我介绍,建议做个PPT,结合图讲项目会好很多。然后是项目细节和八股问答,项目细节是可以自己私下排练的,包括不限于这里的参数是怎么设置的,数据是怎么格式,参数量大概多少,这个方法的为什么要这样设计。八股问答包括两种,一种是固定的QA,一种是开放式场景题(这个可以靠补一些近期的paper速拔认知),最后是手撕代码题:hot100已经足够了(如果考超难代码题,这种公司不去也罢),有时候面试官可能也不会考代码,而是一些数学思考题🤔。
从开始找实习以来,一直压力都很大,经历过就业市场的竞争之后才知道象牙塔里的考核是多么温柔。每一个在努力生活的人都值得敬佩😭。希望我的经验能有一些帮助和激励,祝大家都找到自己满意的offer!
tips:
1. 持续的坚持永远是最重要的
2. Bg不够的话,哪里不够补哪里
3. 感觉自己Bg够了但是没有约面那就是投得不够多,福气在后面呢!