岗位职责:
1.从事大规模预训练模型 (LLM) 研究、训练、应用,包括但不限于训练任务优化、下游任务迁移、知识融入更新、模型性能提升等
2.从事文本/图像内容理解工作,应用CV、NLP等技术时刻保持技术先进性,将业界SOTA模型落地并改进以获取业务收益,服务亿万用户:
3.利用前沿技术,开展多模预训练、跨模态检索、多模内容理解等算法工作,支持搜索、问答、信息抽取等业务。
岗位要求:
1.本科及以上学历,计算机相关专业,熟悉机器学习,深度学习,自然语言处理等领域的专业知识,具有2年以上工作经验;
2.熟悉transformer,bert,gpt,T5等,对训练数据的组织以及训练代码有深入理解并有相关经验;
3.熟悉pytorch/tensorflow深度学习框架:
4.熟悉自然语言处理领域的前沿研究,具有丰富的研究
经验,具备百亿级以上LLM 训练经验优先;
5.做过机器阅读理解,智能摘要等项目优先