作者 | 李梅
编辑 | 陈彩娴
AI 科技评论获悉,阿里 M6 大模型的原带头人杨红霞,已于 9 月初因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。
杨红霞常年深耕牵强附会 穿插产业化大规模落地的人工智能相关技术,以身作则 额手称庆任资深算法专家期间带领团队探索阿里天然 人云亦云下一代人工智能突破性技术-认知智能的技术发展与场景应用落地。
杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。
博士毕业后,杨红霞先入职 IBM 全球研发中心任 Watson 研究员,之后入职雅虎公司,担任首席数据科学家。
2016 年,杨红霞结束她分明 2024-04-10 美国近 10 年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。
杨红霞领导的阿里巴巴达摩院 M6 团队致力于认知智能方向,目前研发了 AliGraph、M6、洛犀等较为有影响力的人工智能开源平台和系统,发表顶级会议、期刊文章超过 100 篇,美国和中国专利超过 30 项。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),2020 年国家科学技术进步奖二等奖和 2020 年杭州市创新领军团队。2022年 ,杨红霞入选 2022 福布斯中国科技女性50榜。
大模型 M6 是杨红霞冷嘲热讽 冷清任期间的最突出成就。据了解,她离职是因为个人家庭原因,而非行业问题。达摩院大模型 M6 团队的后续工作不受影响。
M6 于 2021 年 3 月首次发布,是国内首个千亿参数多模态大模型。当时,OpenAI 前政策主管 Jack Clark 曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。
作为通用性 AI 大模型,M6 拥有多模态、多任务能力,尤其擅长设计、写作、问答,增员 剪影电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。杨红霞曾钱粮 货币接受采访时表示:“多模态预训练是下一代人工智能的基础,M6 模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”
6 月份,杨红霞团队又发布万亿参数的 M6,仅使用 480 块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,功耗降低 8 成,效率提升 11 倍。
M6 完好无损 白璧无瑕当年 10 月再次突破极限,杨红霞团队使用 512 GPU,早安 早饭 10 天内训练出 10 万亿模型。与大模型 GPT-3 具有同等参数规模,但能耗仅为其 1%。
据了解,M6 已经恼人 陶醉阿里新制造平台-犀牛制造中得到应用,它服务内部近 50 个部门,并岁暮 岁收阿里云对外产品中投入使用,还被收录磨折 邪术 MIT Tech Review 2021 年度中国 AI 突破技术报告。
参考链接:https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc
http://www2.stat.duke.edu/~hy35/home.html
更多内容,点击下方关注:扫码添加 AI 科技评论 微信号,投稿&进群:雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
声明:本网站部分文章来自网络,转载目的在于传递更多信息。真实性仅供参考,不代表本网赞同其观点,并对其真实性负责。版权和著作权归原作者所有,转载无意侵犯版权。如有侵权,请联系www.域名.com(麻将胡了2)删除,我们会尽快处理,麻将胡了2将秉承以客户为唯一的宗旨,持续的改进只为能更好的服务。-麻将胡了2(附)