{label:top}
首页 >> 风事快> 正文

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

来源:风事快发布时间:2025-09-09 15:01:55
浏览:77

作者 | 李梅
编辑 | 陈彩娴
雷峰网消息:近日,入大模型亚马逊机器学习部门原杰出科学家/VP Alex Smola与首席科学家李沐师徒二人已从亚马逊离职,沐师并且确立新去向:进军大模型方向创业。徒官
此前两个月,宣创逊雷峰网(公众号:雷峰网)与接近李沐师徒二人的业舍亚马 AI 行业人士交谈,获悉二人有离职打算。入大模型北京中学门事件地址但直到今天,沐师二人动态才最终确定。徒官
据微信公众号“亲爱的宣创逊信息”消息,Alex Smola于2023年2月从亚马逊离职后公布了新的业舍亚马创业项目——一家机器智能公司Boson.ai,担任首席执行官兼联合创始人。入大模型其Linkedin资料也更新了新的沐师公司信息。
Alex Smola 与李沐师徒官宣创业:舍亚马逊,徒官入大模型
而其弟子李沐这次也再次追随了导师的脚步。

从李沐到卡内基梅隆大学Alex Smola门下读博开始,业舍亚马这两位顶级AI科学家师徒的轨迹就高度重合。2016年两人就曾在深度学习落地潮中一同创业,如今在ChatGPT引起的新一轮AI大模型热潮之际,两人抓住机遇从大厂离职创业,新事业令人期待。

关于Boson.ai这家新公司,目前的公开资料还不多,Alex Smola简短透露称:“我们正在做一件大事……请保持关注。如果您想从事可扩展基础模型方面的工作,请联系我。”官网目前也在建设中,天津理工大学泄露最新页面显示其创业方向为大模型。

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

Boson.ai 官网

李沐的公开资料还尚未显示其最新动向,但他已在Github上亲自创建了新公司的项目:
Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型



1

深度学习框架开创者李沐

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

李沐
ACM 班的“沐神”传说
李沐的大学本科在上海交通大学ACM班度过。ACM班由总教头俞勇领衔,旨在培养计算机科学家,汇聚了一群最聪明的年轻人。
李沐2004年入学,在吕宝粮教授的实验室学习,开始接触机器智能。从大一开始,李沐就被周围同学尊称为“沐哥”,据他的室友李佐凡回忆,李沐有一股难以压制的领袖气场从内而外地散发出来,让人不禁仰视。
2007年夏,李沐去微软亚洲研究院实习,在互联网搜索与挖掘组(WSM)和搜索工艺中心(STC)受 Steve Macbeth指导(现在亚马逊任CE工艺总监)。这是李沐与工业界的初次接触。
毕业后,李沐并没有直接去业界找工作,当时计算机虽是社会上的热门专业,但IT公司还没有那么厉害,尤其是AI方面的工艺还没那么强。所以在2009年8月,李沐作为访问学生到香港科技大学继续深造,之后在那里继续担任研究助理。
初去百度做广告系统
2011年,李沐尝试申请了一次美国的博士项目,但当时拿到的offer里并没有特别合适的导师。所以李沐选择留在了国内,北上投奔师兄戴文渊,在百度做广告方面的工作。
在百度的一年,李沐的主要工作是利用广告信息训练能够预测客户点击广告率的模型。李沐从中积累了不少工业界经验,也为他后来开发机器学习系统的长久事业开了一个头。李沐后来在回顾百度的这段经历时也说到,在百度“遇到的很多问题成为了之后研究方向的来源,当时深度学习刚出来,冥冥中觉得应该是大规模机器学习的未来”。
一年后,李沐决定再次踏上求学之路。在百度的经历让他清楚了自己的研究短板,而当时国内的机器学习系统并不发达,选择他选择了CMU和MIT两所美国学校,把之前的博士申请材料重新寄了一遍,结果很顺利地拿到了CMU的offer。
某次,李沐在百度的食堂与余凯、张潼一同就餐,谈到去CMU读博,余凯和张潼就建议他去Alex Smola教授门下,并写了一封推荐信过去。
百度少帅与MXNet
李沐去CMU读博的前半年,Alex还在谷歌工作,由于经费不足,就找来另一位做分布式系统的教授Dave Andersen一同指导李沐。
在博士第一年结束的暑假,李沐去谷歌实习,主要在研究内部代码和文档,了解了谷歌的基础架构,开了眼界。当时Google Brain成立不久,李沐在那里见识了Jeff Dean、Geoffrey Hinton等大牛。
博士第二年,李沐实现了一个通用的分布式机器学习框架,即Parameter Server(论文:Parameter Server for Distributed Machine Learning)。该框架一开始的目的是为了做实验更方便,李沐花了大量时间去设计接口,做了多个版本实现,还做了一些工业界级别的大规模实验。最后,这项工作发表在了机器学习系统领域的顶会OSDI上。Parameter Server后来还合并到了MXNet项目中。
李沐对深度学习的接触并非起于在CMU的博士研究,而是在国内的百度见证了深度学习的火热。时任百度深度学习研究院(IDL)副院长的余凯是他的引路人。当时,余凯正在百度推动深度学习,启动了“少帅计划”以吸引优秀的年轻AI人才。李沐入选该计划,并“入坑”深度学习。也是在余凯的建议下,李沐开始酝酿做一个深度学习开源平台。
回到CMU,李沐先是继续做Parameter Server项目,写了许多代码,并帮助客户使用这些代码。但遇到不少困难,比如由于忽视代码的易读性,导致只有少部分人能理解代码从而做一些开发,再者,没有人能一起审核代码接口,导致这些接口个人风格强烈,但很难做到对所有人都简单明了。
幸运的是,李沐发现了当时在华盛顿大学读博的陈天奇,当时陈天奇在做XGBoost项目。两人交流以后,发现很多基础部件是可以多个项目共同使用的,而不是每个项目都造一个轮子。于是,李沐与陈天奇在Github上创建了DMLC(Distributed Machine Learning Community)组织。
MXNet项目也在这个组织中很快启动。李沐将三个不同的开源项目合并到了一起,分别是由在美国的陈天奇的CXXNet,张铮及其学生王敏捷牵头的Minerva,以及颜水成学生林敏牵头的purine2,最终创建了MXNet框架,并于2015年年底开源。



2

“参数支持器之父”Alex Smola
Alex Smola是国际机器学习的知名科学家,此前在亚马逊期间致力于构建机器智能和机器学习工具。在分布式深度学习框架领域,他曾提出并行LDA(Latent Dirichlet Allocation)的框架,是参数支持器概念的最早来源。

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

Alex Smola
Alex Smola于1996年在慕尼黑工业大学获得硕士学位,曾在慕尼黑科技大学、帕维亚大学和霍姆德尔的AT&T 研究院学习物理学。1998年,他获得柏林工业大学的计算机科学博士学位,先后去往柏林GMD 软件工程和计算机体系结构研究所和澳大利亚国立大学信息科学与工程研究院工作。2004年,他在NICTA的统计机器学习项目中担任高级首席研究员和项目负责人,2008年起入职雅虎研究院。
2012年春至2014年底,Alex Smola在谷歌研究院工作,中间从2013年起,他开始担任CMU的教授,指导李沐,后来于2016年加入AWS。



3

李沐师徒的亚马逊往事
2016年李沐准备从CMU博士毕业,那段时期深度学习的落地十分火热,科学家纷纷从学术界去往工业界,各种巨资收购初创公司不断。当时李沐在国内的许多好友都纷纷创业,如余凯离开百度创立地平线,戴文渊从华为离开、创立第四范式。
李沐也跃跃欲试,与两位导师Alex和Dave以及Ash Munshi一起,创立了公司Marianas Labs,李沐出任CTO。
中途,Dave离开公司,去了谷歌与Jeff Dean一起做Tensorflow。之后,公司的项目果然被一个小上市公司看中,就将公司卖了出去。但后来他们认为这家公司不靠谱,就考虑不再合作,另做打算。当时的Alex在阳谷县(SunnyVale)买了房,有还贷的经济压力,于是选择去了亚马逊,担任AWS副总裁级别科学家(Distinguished Scientist),从CMU重返工业界。
所以,这次短暂的、并不算很成功的创业之旅就此终止,李沐也总结了一些教训和经验:团队和工艺强是一方面,更关键的是要把产物做好。
在这时,李沐收到了Jeff Dean从谷歌抛来的橄榄枝。机会很诱人,但李沐考虑到MXNet的后续增长,觉得去亚马逊是更好的选择,“自己挖的坑,总是要自己填的”。李沐便追随导师Alex,以兼职的身份去了亚马逊,直接向Alex汇报,带着一些人做MXNet的开发和AWS上深度学习的应用。
随后,李沐完成博士学位后,于2016年7月正式加入亚马逊AWS。亚马逊的机器智能部门彼时刚刚成立,对深度学习框架正有着强烈的需求。李沐的新目标不再仅仅是深度学习框架的研发,还包括让框架更好地支持客户。在他看来,分布式系统最难的不是如何让每个机器计算的多快,而是机器之间的通讯,如何减少通讯提升交互效率,对系统来说也至关关键。
2016年11月,MXNet被亚马逊选为官方开源平台,这对于MXNet和李沐而言是一次重大胜利。
起初李沐因为想要填MXNet的“坑”而追随导师加入亚马逊,六年多来也主要围绕MXnet展开工作,如今看来他已找到了待发掘的“新坑”。而对于Alex Smola而言,上一次的短暂创业因为背负房贷压力而终止,这次他与弟子再次创业,想必房贷的经济压力早已解决,也有足够的资本来投身烧钱的大模型领域。
当下大模型的火热对人才的吸引力巨大,AI 科学家离开大厂、创业入局ChatGPT已成趋势,期待李沐与Alex Smola师徒在这一赛道上的新动作。

参考链接:

https://mp.weixin.qq.com/s/EEUDKjcEgvD1lGWCXHI36w

https://alex.smola.org/

https://zhuanlan.zhihu.com/p/25099638

https://mp.weixin.qq.com/s/GIkUsPZDsCs3PpZVYXnB_w

更多内容,点击下方关注:

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

雷峰网

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

风集专

更多 >
  • 美国马里兰州一购物中心附近发生枪击 致1死1伤
    更新:2025-09-09 14:40
  • 科学修仙,程序猿通过代码驯服野生「雷神之锤」,挥手即来,痛击队友
    更新:2025-09-09 14:31
  • 这座万亿硬核工业城市正在打造演艺之都
    更新:2025-09-09 14:04
  • 中国歌舞编导夏冰:歌舞诉知音,三曲动心魂
    更新:2025-09-09 13:37

热门文章

  • 他山科技多款新品亮相 WAIC 展会,展现机器人触觉技术新成果
    他山科技多款新品亮相 WAIC 展会,展现机器人触觉技术新成果

    他山科技多款新品亮相 WAIC 展会,展现机器人触觉技术新成果

    2025 年 WAIC 展会在上海盛大开幕,这场汇聚全球顶尖科技力量的盛会,成为展示人工智能与机器人领域前沿成果的重要舞台。他山科技携多款新品精彩亮相,包含TS-F 指尖触觉传感器、TS-E 机械手触 ...

  • 杨少华:蔫了一辈子,逗乐几代人
    杨少华:蔫了一辈子,逗乐几代人

    杨少华:蔫了一辈子,逗乐几代人

    新京报记者 李冰洁 编辑 胡杰 校对 李立军生命被最终定格在94岁之前,杨少华不改恣意本色。他爱下馆子,点名要吃甲鱼,每天要来一只海参、一碗鸡汤,不要蔬菜。他抽烟很凶,每天一包起步,烟雾缭绕里,他向身 ...

  • 悬疑叙事拉升正剧张力
    悬疑叙事拉升正剧张力

    悬疑叙事拉升正剧张力

    来源标题:悬疑叙事拉升正剧张力包 澜最近播出的电视剧《以法之名》,收获了不少好评。剧中,海东省检察院派员指导东平市办理“万海案”,其间发现当地公检法同黑社会性质组织存在利益勾连 ...

  • 杨少华:蔫了一辈子,逗乐几代人
    杨少华:蔫了一辈子,逗乐几代人

    杨少华:蔫了一辈子,逗乐几代人

    新京报记者 李冰洁 编辑 胡杰 校对 李立军生命被最终定格在94岁之前,杨少华不改恣意本色。他爱下馆子,点名要吃甲鱼,每天要来一只海参、一碗鸡汤,不要蔬菜。他抽烟很凶,每天一包起步,烟雾缭绕里,他向身 ...

  • 外交部:敦促新西兰有关部门停止散布谎言制造矛盾
    外交部:敦促新西兰有关部门停止散布谎言制造矛盾

    外交部:敦促新西兰有关部门停止散布谎言制造矛盾

    据央视新闻消息,8月21日外交部发言人毛宁主持例行记者会,针对新西兰的相关指责,发言人毛宁表示,新西兰情报安全机构近年来多次散布谣言,无端污蔑攻击中国,抹黑中国同新西兰各界的正常友好交往。滋扰恐吓在新 ...

  • “特朗普将发表‘重大声明’”
    “特朗普将发表‘重大声明’”

    “特朗普将发表‘重大声明’”

    上周,美国总统特朗普对美国多个贸易伙伴发出新一轮关税威胁,部分国家和地区表示考虑采取反制措施,市场持续关注美国与主要贸易伙伴的谈判,同时谨慎评估部分商品价格上涨对美国通胀前景的作用,美国三大股指上周集 ...

  • 乌军:史上首次,俄军人向机器人部队投降
    乌军:史上首次,俄军人向机器人部队投降

    乌军:史上首次,俄军人向机器人部队投降

    据西班牙《阿贝赛报》网站7月13日报道,乌克兰冲突正在发生前所未有的变化。在一项完全由机器人部队执行的任务中,俄军作战人员首次在没有人类步兵直接干预的情况下被俘。甚至押送俘虏的也是无人系统,无需乌军士 ...

  • Zeus发文:很后悔,但没做错任何事
    Zeus发文:很后悔,但没做错任何事

    Zeus发文:很后悔,但没做错任何事

    昨日,大连工业大学一则因行为不当拟开除一名女生的公告引发舆论关注。涉事的乌克兰前CS2选手Zeus在社交媒体上发文:大概半年前,我在Telegram上发过几段视频,是和我在上海认识的一个女孩一起拍的。 ...

短点

更多 >
  • SpaceX“星舰”成功溅落,第十次试飞圆满结束
    SpaceX“星舰”成功溅落,第十次试飞圆满结束

    美国太空探索技术公司SpaceX)新一代重型运载火箭“星舰”美国中部时间8月26日18时30分北京时间26日7时30分)从得克萨斯州发射升空,实施第十次试飞。此次任务重点目标包括让飞船部署模拟卫星、在 ...

  • 在S+古偶剧组干了180天后,一个追星女火速逃离内娱
    在S+古偶剧组干了180天后,一个追星女火速逃离内娱

    在一部S+古偶剧组待了180天后,一个对娱乐圈充满热情的女孩,毫不犹豫地决定要光速离开。以下是一个年轻人亲自探究内娱行业虚实的生存报告:娱乐圈就像丛林,要自己学会厮杀我从小就是电视迷,又是追星女,所以 ...

  • 他抛弃杨丞琳,伤害过唐嫣,最终却栽在1个二婚女人手上!
    他抛弃杨丞琳,伤害过唐嫣,最终却栽在1个二婚女人手上!

    6月22日,一张3对明星夫妻同框照挂上热搜,其中邱泽夫妇赫然在列,40岁的许玮甯孕肚初显。一晃眼,这对不被众人看好的夫妻竟已成婚4年,而今更是传来怀孕的喜讯,让人不禁感叹,浪子邱泽,也终于打了一手好牌 ...

  • 尹锡悦被捕后 韩国内乱特检组对多部门进行扣押搜查
    尹锡悦被捕后 韩国内乱特检组对多部门进行扣押搜查

    总台记者获悉,当地时间7月14日,韩国内乱特检组对军方无人机作战司令部、国防部防间谍司令部和国防部情报本部展开扣押搜查。尹锡悦时隔124天再被捕△当地时间7月9日晚,尹锡悦结束审查,离开法院当地时间7 ...

  • 超500台军参加美方演习?国台办回应
    超500台军参加美方演习?国台办回应

    8月27日上午,国台办举行例行新闻发布会。记者:据美媒报道称,有超过500名台军士兵参加美军今年度“北方打击”演习,并首度将模拟作战场景自欧洲转为“印太”区域。请问对此有何评论?国台办发言人朱凤莲:我 ...

  • 知名歌手被大喊退票,主办方深夜道歉
    知名歌手被大喊退票,主办方深夜道歉

    7月12日,美国著名说唱歌手YE侃爷)在上海举行演唱会,多名网友吐槽“侃爷迟到了40分钟”“没有灯光舞美开场”,观众在雨中大喊退票。南都记者注意到,7月13日晚,该场演唱会的主办方发表声明致歉称,因天 ...

  • 整治“内卷式”竞争,国家部委、多地接连发声
    整治“内卷式”竞争,国家部委、多地接连发声

    来源:北京青年报撰文丨余晖7月12日,第22届长春国际汽车博览会、第七届中国一汽红旗嘉年华举行开幕式,吉林省委书记黄强出席并宣布开幕。在现场,比亚迪、鸿蒙智行、理想等展位人头攒动,多款新能源车型引人瞩 ...

  • 陕西西安市灞桥区发生2.1级地震
    陕西西安市灞桥区发生2.1级地震

    陕西地震台网正式测定:7月14日11时13分在陕西西安市灞桥区北纬34.45度,东经109.05度)发生2.1级地震,震源深度10千米。 ...

  • 北京市发布暴雨黄色预警
    北京市发布暴雨黄色预警

    来源:北京市气象局预计21日下午至夜间,我市部分地区将出现小时雨强50毫米以上或6小时降雨量70毫米以上的强降水,山区及浅山区可能出现山洪、泥石流、滑坡等次生灾害,低洼地区可能出现积水,请注意防范。 ...

  • 用台湾问题绑架盟友,五角大楼在盘算什么
    用台湾问题绑架盟友,五角大楼在盘算什么

    英国《金融时报》7月12日报道称,五角大楼正在敦促日本和澳大利亚明确表态:如果台海爆发冲突,它们将扮演什么角色。这实际上是要逼迫日澳承诺在“台湾有事”时充当“马前卒”。报道称,此举令日澳感到“沮丧”, ...

  • 印度外长时隔五年访华
    印度外长时隔五年访华

    印度外交部长苏杰生7月13日开启为期3天的新加坡和中国之行。在访问中国期间,苏杰生将赴天津出席上海合作组织成员国外长理事会会议,并与中方举行双边会谈。这是5年来,印度外长首次访华。接受《环球时报》记者 ...

  • 星二代郑欣宜父母离异,15岁200斤,今38岁的她站上《我是歌手》
    星二代郑欣宜父母离异,15岁200斤,今38岁的她站上《我是歌手》

    近期,《我是歌手》节目持续登上热搜,前有单依纯搞怪演唱,被观众嘲笑又low又巅,如今有歌手还未上台就退赛,这些非常规操作,引发大众热议。香港歌手郑欣宜,即将进军《歌手》舞台。歌迷们很是期待这位能与容祖 ...

风点集尊湃侵犯华为海思芯片技术商业秘密案一审判决生效
找番特朗普再提将向乌克兰提供“爱国者”导弹
风谈风李小璐现身KANYE上海演唱会!
话榜影视剧中的反派角色,重回人人喊打的时代
瓜台中国电信天翼AI发布首款AI眼镜,星辰大模型开启第一视角智能交互新时代
风站台悬疑叙事拉升正剧张力

风谈秀

更多 >