我们的团队
OUR TEAM
CAREERS
1、负责大模型训练所需的数据标注工作,确保数据质量并提升模型性能;
2、根据业务需求,设计和制定数据标注规则和标准,确保标注方案的规范性和高效性;与产品、开发及机器学习团队紧密合作,支持模型预训练、微调及评估过程中的数据需求;
3、跟踪最新大模型及标注技术的发展趋势,优化数据标注方法,提高标注效率与效果;
4、协助搭建并完善数据标注流程,探讨半自动标注及模型辅助标注的可行性;
5、参与标注数据集的质量评估,发现并解决数据标注中的问题,确保数据集的一致性和准确性。
任职要求:
1、技术能力:熟悉主流大模型(如 GPT、BERT、Qwen、LLaMA、GLM等)的基本原理及数据需求;
2、对标注工具及流程有深入理解,有大型数据集标注经验优先;
3、了解常见的数据预处理及管理工具,熟悉数据标注过程中的挑战及优化方案;
4、熟悉数据标注相关的自动化技术或工具者优先。
工作经验与知识:
1、有机器学习、深度学习基础,了解模型训练与优化对数据标注的要求;
2、有实际数据标注项目经验,能够独立完成高质量标注;
3、熟悉标注质量控制的方法,有数据质量评估经验。
能力素质:
1、有较强的分析和解决问题能力,耐心细致,对数据工作充满热情;
2、具有团队合作精神,能积极与需求方沟通并高效完成任务; 愿意学习并掌握最新的标注技术或相关领域工具。
加分项:
有模型压缩(量化、蒸馏、剪枝等)相关知识; 熟悉常见深度学习框架(如 PyTorch)或数据处理工具;在标注过程中使用过机器学习辅助的标注工具或流程优化方法。
1、参与产品功能开发和单元测试。
2、对现有程序进行维护和优化,修复测试中发现的程序缺陷,确保平台安全稳定运行。
3、参与代码走读、协同测试人员开展测试工作。
4、配合研发经理完成相关任务目标。
5、项目需求的开发。
1、本科及以上学历,4年及以上Java开发经验。
2、扎实的编程基础,精通java开发语言,具备oop编程思想,熟悉设计模式和算法。
3、熟练掌握jvm,缓存,分布式架构、消息中间件等核心技术,拥有分布式、高并发的系统开发经验。
4、良好的组织建模能力,熟悉NoSQL、Cache原理,具备设计复杂业务系统的能力。
5、良好的设计能力、沟通能力,技术思路清晰,结构化思维清晰,有较强的性能优化及问题排查、解决能力,善于解决复杂问题。
6、有强烈的责任心,优秀的表达能力,较强的学习和理解能力,思路清晰,有强烈的团队意识强。
7、熟悉业界典型的云架构、docker、kubernetes等技术者最佳。
8、有Python或C++开发经验者优先考虑。
1. 负责基于Hadoop、spark、flink、ElasticSearch平台的离线/实时数据处理、数据计算、数据开发;
2. 负责病种分库系统建设开发、数据治理、分析、处理、编码等工作;
3. 负责病种分库系统高可用性、高可扩展性、高并发的持续优化;
4. 负责搜索引擎ElasticSearch数据加工及分词优化工作。
1、具备扎实的离散数据、数据结构、线性代数、概率论等基础知识;
2、有3年以上的Python、spark、ElasticSearch实际开发经验;
3、熟悉Python、scala进行spark代码开发工作;
4、精通SQL语句,对数据敏感,有较强的逻辑分析能力,对大数据处理和分析技术有丰富的经验和强烈热情;
5、有数据中台实际开发经验、较强的日常故障诊断和性能调优能力;
6、对基于Hadoop集群高并发、高可用、高可扩展性体系系统有一定的理解;
7、有DataWorks、MaxComputer实战经验者优先;
8、有Spark GraphX实战经验者优先;
9、有机器学习、数据分析等相关工作经验优先;
10、熟悉微服务技术架构、Docker技术的优先;
11、熟悉Kafka、Zookeeper、spark、Flink底层源码者优先;
12、性格开朗,善于交流,有良好的团队合作精神和协调沟通能力
有意者请将简历发至:shaoyan@eimageglobal.com
咨询电话:15858139132(人事部-邵女士)
简历中请注明:
1.您所申请的职位
2.您目前或期望的薪资范畴
3.请在Email主题中注明:应聘者姓名--应聘部门--应聘职位
OUR TEAM