本文来源:时代周报 作者:郭美婷
7月18日,据知情人士向时代周报记者核实,阿里通义大模型团队技术骨干周畅将于近日离职创业。
据悉,周畅属于正常离职,目前,阿里通义实验室负责人为周靖人。周畅离职后通义大模型的研发和开源工作将继续向前推进。
在7月初的2024世界人工智能大会上,周靖人曾公布,近2个月通义千问开源模型下载量增长2倍,突破2000万次。
时代周报记者综合梳理公开资料显示,周畅花名钟煌,本科就读于复旦大学计算机科学与技术系,2012年进入北京大学,2017年拿下北大计算机软件与理论博士学位。2017年7月,周畅加入阿里巴巴。按我国儿童6周岁上学的惯例计算,周畅极有可能是位年轻的90后。
截至今年7月18日,时代周报记者翻看周畅的领英账号,仍显示其为阿里巴巴资深算法专家。
截图自周畅领英账号页面
2022年10月,周畅曾受邀回母校演讲。共青团北京大学委员会官方微信公众号显示,彼时周畅在阿里巴巴达摩院智能计算实验室任职,担任高级算法专家,研究兴趣包括表征学习、多模态预训练、推荐系统。
据介绍,周畅当时已在机器学习、数据挖掘、数据库领域国际顶级会议(CCF-A类)上发表30余篇文章。带领团队研发了十万亿多模态预训练模型M6系列,以及通用多模态AI模型OFA系列;研发了大规模GNN训练平台AliGraph。
据了解,M6模型是2021年3月阿里巴巴与清华大学联合发布的业界最大中文多模态预训练AI模型。据阿里云当时介绍,M6模型参数规模高达1000亿,是多模态预训练领域史上最大的模型。
在阿里云关于M6模型发布的推送下,周畅曾留言称:"欢迎广大英才加入我们的团队继续这项工作!"
如今更为公众所熟知的阿里云通义大模型,某种程度上可以说是在M6模型的基础上沿袭而来的。
图源:截图自阿里通义千问2.5对话
2022年,中国电子学会公布“2021中国电子学会科学技术奖”名单,其中浙江大学、达摩院、阿里云完成的“超大规模高性能图神经网络计算平台及其应用”获得科技进步一等奖,主要完成人里面就包括杨红霞、周靖人和周畅等。如今,杨红霞早已于2022年离职,周畅也将离职下场创业。
图源:截图自阿里云公众号
周畅在此之前已密切关注大模型与终端的结合。
去年底,周畅曾作为阿里巴巴-通义实验室、通义千问大模型负责人,受邀出席了首届AI PC产业创新论坛。当时,周畅分享了关于端侧大模型的技术进展,以及终端设备与AI结合的发展前景。
周畅表示,大模型技术的快速迭代已经让其具备理解世界的基本能力,接下则需要想办法让大模型能力在各种环境和场景下被充分使用起来。例如,让大模型在PC等终端设备上跑起来,正是普惠终端用户的第一步。
图源:截图自联想官方公众号
关于周畅未来创业的去向,业内传出消息称他将聚焦于AI应用层面。
“尽管周畅具体创业细节尚未全盘公开,但他在深度学习、图挖掘以及分布式计算方面的专长,或许预示着他将在相关领域或其交叉领域探寻全新的商业契机。”天使投资人、资深人工智能专家郭涛猜测,诸如基于大数据的智能分析、自动化决策支持系统,抑或优化现有的 AI 模型以适配更为广泛的行业应用等,皆为潜在的创业指向。
时代周报记者就周畅具体的创业方向,以及是否将在阿里体系内孵化等问题向阿里云方面询问,截至发稿未得到回应。