365文库

字节：实习生干扰大模型训练损失没有千万

2024-10-20 13:06 财经科技来源：网易新闻

下载成Word

10月18日，多个微信群流传一则消息：“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。”

今天下午，字节跳动发声，针对近期“字节跳动大模型训练被实习生攻击”的传闻，字节跳动发布声明回应称，该涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务，但并不影响商业化的正式项目及线上业务，也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。

字节跳动称，经核实，涉事人一直在商业化技术团队实习，并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。另外，该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校，交由校方处理。

据报道，此事发生在今年6月，涉事实习生田某某是在商业化技术团队实习，因为对团队资源分配不满，使用攻击代码破坏团队的模型训练任务。

知情人士表示：受影响的业务不是该厂的大模型，而是商业化技术团队的模型训练任务，也就是影响了广告部门，更不是有些传言中所说的豆包大模型；“实习生被送进去”是假的，处理方式是辞退+同步行业联盟+同步情况给学校；损失上千万美元也不实。

不过，有行业专家表示，该事件也反映了字节跳动的安全管理问题，包括权限隔离、共用代码的审计等。

据悉，字节跳动豆包大模型是一款多模态预训练模型，于2024年5月15日发布。它包含多个模型，如豆包通用模型Pro、Lite等，支持文本、图片、视频等多种数据类型处理，具备跨模态理解和生成能力。豆包大模型广泛应用于内容创作、智能客服、教育、医疗、工业设计、金融、自动驾驶等领域。其技术特点包括高效训练和推理，以及根据需求自适应调整模型参数。市场需求强劲，日均Tokens使用量超1.3万亿，展现出卓越的产品能力和市场竞争力，为各行各业带来智能化变革。