94亿！生成式AI领域最大并购案诞生-天天滚动

当前位置：首页 > 资讯 > > 内容页

94亿！生成式AI领域最大并购案诞生-天天滚动

时间：2023-06-28 09:40:36 来源：互联网

作者|李水青编辑|心缘

仅创立两年员工62人，这家AI创企什么来路？

(资料图)

生成式AI领域的最大并购案已经诞生！

智东西6月27日报道，据华尔街日报今日消息，大数据超级独角兽Databricks近日已同意以13亿美元（约合94亿元人民币），收购生成式AI初创公司MosaicML，引起了国内外资本和智能圈的关注。

MosaicML是一家2021年创立于美国旧金山的AI软件公司，截至目前公司总人数62人，此前仅获得了6400万美元融资。这样一家小AI公司为何能卖出百亿元人民币身价？从消息面上看，MosaicML的创业团队由英特尔负责AI的前高管掌舵，刚刚在今年6月开源了一个300亿参数规模的大语言模型MPT-30B，这些动向都为其成为“OpenAI挑战者”埋下伏笔。同样位于旧金山的Databricks是一家知名数据存储和管理公司，本次收购MosaicML，按照其说法，是要助企业客户利用专有数据，以更低成本构建语言模型，赶超GPT等大模型。

当下正值AI掀起新浪潮，微软、OpenAI、谷歌等科技大厂的声势浩大，国内的“百模大战”也进入深水区。当下，一些国内投资者对AI大模型创业的前景产生了怀疑，比如知名投资人、金沙江创投董事总经理朱啸虎就直言，ChatGPT对创业公司很不友好，未来两三年内请大家放弃。MosaicML收购案或许能为当下的产业圈提供新的参考。

在OpenAI及科技大厂当道的大模型时代，AI创企的发展空间在哪里？MosaicML这样创立仅两年的公司为何能卖出高价？这对国内市场有什么参考意义？本文对此进行了深入探讨。

01.MosaicML是谁？仅15名研究员，英特尔AI大佬创业，已开源大模型

首先来看看MosaicML公司是什么来路。从规模上看，MosaicML并不大。根据外媒援引官方披露消息，MosaicML目前拥有62名员工，其中研究人员仅为15名，在旧金山、纽约、帕洛阿尔托和圣迭戈设有办事处，迄今为止主要是从Lux Capital和DCVC等投资者那里筹集了6400万美元。但MosaicML的创业团队不简单。MosaicML联合创始人兼首席执行官Naveen Rao曾任英特尔副总裁兼AI产品事业部总经理。Rao之前创办了AI芯片公司Nervana，于2016年以4.08亿美元被英特尔收购。MosaicML的CTO Hanling Tang是前英特尔AI实验室高级总监，可以说MosaicML是妥妥的大佬创业。

▲MosaicML联合创始人兼首席执行官Naveen Rao（左）和CTO Hanling Tang（右）

MosaicML已经开源了大语言模型，接受市场检阅。今年5月，其开源了70亿参数规模的大语言模型MPT-7B，紧接着在6月开源了第二个开源大型语言模型MPT-30B。该公司称，尽管其参数量仅为300亿，是GPT-3的1750亿参数的1/6，但在推理任务表现超过GPT-3，且能更容易在本地硬件上运行，部署推理成本更低。Rao承认，GPT-4在大多数方面的功能都更为优越，不过，MosaicML的模型提供了更长的上下文长度，这允许独特的用例，例如让其生成著名小说《了不起的盖茨比》的尾声，且成本更低。按照MosaicML的说法，300亿的参数规模是其精心选择的结果，可以更好地针对GPU进行优化：其能够轻松部署在单个GPU上，在16位精度对应一块80GB内存的A100 GPU，也可以在8位精度对应一块40GB的A100GPU。据称该模型在众多任务中实际效果优于更费算力的LLaMA、Falcon。Rao在采访中提到，MosaicML使用了一种名为“FlashAttention”的技术，使用户能更快地进行推理和训练。

同时，MPT-30B接受了比其他模型更长的序列的训练，最多达8000个标记；但包括GPT-3、LLaMA和 Falcon每个模型仅为2000个标记。简单说，这意味着用户可以输入更长的提示，可能更适合数据密集型企业应用程序。医疗保健和银行等行业可以受益于MosaicML解释和汇总大量数据的能力。例如，在医学领域，该模型可以解释实验室结果，并通过分析各种输入来深入了解患者的病史。开源模型更有利于保障医疗数据安全，通过API将其发送给OpenAI则威胁数据安全。

Rao说，其可以助一个模型的构建成本从数千万美元降至数十万美元。不过，很难完全独立验证MosaicML的说法，因为Rao谈到的三个开源大语言模型项目（MosaicML、LLaMA和Falcon）尚未使用斯坦福大学的HELM措施等权威方式进行测试。但可以肯定的是，MosaicML在这帮英特尔系AI大牛的带领下，正通过对准GPT模型的局限之处，试图越过OpenAI实现弯道超车。

02.超级独角兽出手，加码开源大模型与OpenAI掰腕子

不仅MosaicML是开源大语言模型的代表，其收购方Databricks也是开源模型的重要倡导者。Databricks创立于2013年，是一家由美国伯克利大学AMP实验室著名的Spark大数据处理系统多位创始人联合创立的Spark商业化公司。相比于微软、谷歌等大厂，Databricks实际上也只能算一家创企。但其在2021年8月完成了一轮16亿美元融资，当年已成为估值达380亿美元的超级独角兽，赶超了OpenAI当下的估值。营收方面，根据Databricks公布数据，其在2022年年收入超过10亿美元，这都为公司收购MosaicML提供了经济基础。

在AI方面，Databricks主张开源模型可以与OpenAI等公司提供的模型相媲美。今年4月，Databricks公布了其更新之后的开源Dolly大语言模型，它能够响应客户查询，根据Databricks智能湖仓内的数据给出答案。随着ChatGPT卷起新浪潮，Databricks也凭借其湖仓一体平台允许数据团队存储和保护数据，支持机器学习工具的开发；Databricks同时也提供TensorFlow等流行AI框架集成，降低企业构建和部署AI模型的门槛。并不是每个人、每个应用程序都需要GPT-4。Databricks的首席执行官Ali Ghodsi说，现成的模型接受过互联网数据的训练，虽然已经可用，但它们充满了可能扭曲结果的无关信息，外部供应商构建的模型中的数据隐私安全问题也值得警惕。

Databricks的一大核心技术被称为Lakehouse（湖仓一体），可以为AI应用管理数据，并将数据、分析和AI编程工具统一在一个系统中。MosaicML并入Databricks后将成为旗下的一项独立服务，助企业利用专有数据构建低成本语言模型。比如，Replit这样提供编程工具的公司已在使用Databricks作为数据管道，进而将信息传输到MosaicML来训练代码生成模型，进而服务其客户。可以看到，数据智能独角兽Databricks正试图通过并入AI大模型能力，挑战微软、OpenAI、谷歌等大公司的市场统治力，为产业提供了新的参考。不过，也有人将MosaicML收购案看作借大模型热度炒作，因为Databricks主营Lakehouse，主要是用Spark来处理大规模集群数据，因此其整合大语言的价值并不明确。尚不清楚Databricks通过何等方式支付收购项目。因此，这一并购案能否真正证明MosaicML的商业价值，仍需要等待时间的验证。

03.AI大模型创业的机遇点：垂直行业、数据安全、更低成本

当下正值国内“百模大战”进入深水区，MosaicML并购案或许对国内产业也能带来一些新参考。且不论Databrick豪掷千金的真实意图，这一案例体现了国外市场对AI大模型创业的积极态度。本次被收购的MosaicML公司创立仅两年，公司仅62人，但收购价格达到了近100亿元人民币的高价，给国内AI大模型创业增添了一定信心。近日，国内投资圈出现了对生成式AI及大模型投资的怀疑。美团联合创始人王慧文因病离职引起人们对AI创业难度的担忧，昨日猎豹移动CEO傅盛与金沙江创投董事总经理朱啸虎在朋友圈就ChatGPT的争论也引起关注。朱哮虎认为ChatGPT对创业公司很不友好，未来两三年内请大家放弃，傅盛吐槽说“硅谷一半的创业企业都围绕chatgpt开始了，我们的投资人还能这么无知者无畏”，朱啸虎在评论区说傅盛是抬杠。

市场分析公司PitchBook Data数据显示，全球生成式AI市场的支出到今年底预计将达到426亿美元，到2026年将达到981亿美元。报告称，生成式AI初创公司的风险投资从2022年全年的48亿美元增至2023年前5个月的127亿美元。值得一提的是，垂直行业大模型市场正成为重要的机会点，密集数据成为AI大模型创业成功的关键要素。生物制药服务公司Syneos Health的首席信息兼数字官Larry Pickett在近期谈道，目前根据专业健康数据训练模型的成本，大约为100万至200万美元。通过使用较小的开源预训练模型，而不是在OpenAI拥有的整个数据集之上构建，花费会大大减少。企业技术领导者面临着为AI模型准备数据的压力，数据和数据智能平台成为痛点也成为创业者的机会点。可以看到，垂直行业、数据安全、更低成本，这些要素或许都是AI创企避开巨兽脚印，谋求商业化成功的重要机会点。

04.结语：生成式AI创业“吸金” 创企要避开巨兽的脚印

13亿美元的大额生成式AI并购案为AI创业带来了新参考。尽管MosaicML公司的创立时间、规模、人才实力看起来都十分有限，且其大模型效果仍未赶超GPT-4，MosaicML仍被收购方Databricks给予了较高认可，从而阶段性地验证了其价值。实际上，也有人认为Databricks整合大语言模型的价值不够明确，可能是借大模型热度炒作，这一案例参考性还需要时间验证。不过无论如何，MosaicML案例也确实点明了垂直行业、数据安全、更低成本这些AI创业的关键要素，值得产业参考。

标签：

94亿！生成式AI领域最大并购案诞生-天天滚动

01.MosaicML是谁？仅15名研究员，英特尔AI大佬创业，已开源大模型

02.超级独角兽出手，加码开源大模型与OpenAI掰腕子

03.AI大模型创业的机遇点：垂直行业、数据安全、更低成本

04.结语：生成式AI创业“吸金” 创企要避开巨兽的脚印

94亿！生成式AI领域最大并购案诞生-天天滚动

瑞丰银行：已完成增持永康农商银行的事项-天天看热讯

世界微头条丨国际油价下跌纽约期油收跌2.4%

瑞银计划将瑞信4.5万多名员工裁掉一半以上，年内预计有三轮裁员微头条

蔡徐坤事件怀孕女当事人素颜漂亮，蔡母曾约定给女方50万赔偿款|前沿热点

哈姆：两位新秀首要是建立竞争基调并接受我们的防守工作

【天天新视野】2023内蒙古高考提前批录取结果什么时候出几天知道录取结果

范画临本画兰_关于范画临本画兰的简介

投资中介英文简称_投资中介|环球快播报

环球快消息！什么是4050补贴（什么是4g网络）

头条焦点：收入证明贷款额度（收入证明贷款）

每日头条!“医生要像福尔摩斯，学会在身体里‘破案’” ——记湘潭市中心医院主任医师封元清

中国高校最大云上科研智算平台上线，由复旦大学与阿里云共建焦点日报

润本冲刺A股“驱蚊第一股”，拟拿1/3募集资金做推广_最新

普京接见强力部门代表并嘉奖平息叛乱中表现突出人员环球快看点

琼山区开展未成年人心理健康公益课

焦点速递！怎样编辑微信图文（怎么编辑微信图文）

荣威新i5到店实拍！尺寸加长 4S店：包牌价6.6万

手机腾讯视频怎么看电视直播_腾讯视频怎么看电视直播_播资讯

上海师范大学附属嘉定幼儿园招聘启事

k3换刹车油用几升（k3多久换刹车油？）_环球讯息

世界今热点：交通肇事属于什么罪，是如何处罚的每日热讯

赛意信息张成康：AI新时代下制造业实践创新探索_今日讯

应用在数字音频工作站中的ADC芯片

我国首个千万吨级LNG接收站一期工程投产

全球热讯:6月27日钢厂调价信息汇总

女人的英语_人的英语

搅局20万价位星途星纪元STERRA ES价格曝光天天观点

世界速递！通信行业：5G未来五年前景展望

埃弗顿计划聘请前阿森纳主管桑列伊热头条

94亿！生成式AI领域最大并购案诞生-天天滚动

01.MosaicML是谁？仅15名研究员，英特尔AI大佬创业，已开源大模型

02.超级独角兽出手，加码开源大模型与OpenAI掰腕子

03.AI大模型创业的机遇点：垂直行业、数据安全、更低成本

04.结语：生成式AI创业“吸金” 创企要避开巨兽的脚印

94亿！生成式AI领域最大并购案诞生-天天滚动

瑞丰银行：已完成增持永康农商银行的事项-天天看热讯

世界微头条丨国际油价下跌 纽约期油收跌2.4%

瑞银计划将瑞信4.5万多名员工裁掉一半以上，年内预计有三轮裁员 微头条

蔡徐坤事件怀孕女当事人素颜漂亮，蔡母曾约定给女方50万赔偿款|前沿热点

哈姆：两位新秀首要是建立竞争基调 并接受我们的防守工作

【天天新视野】2023内蒙古高考提前批录取结果什么时候出 几天知道录取结果

范画临本画兰_关于范画临本画兰的简介

投资中介英文简称_投资中介|环球快播报

环球快消息！什么是4050补贴（什么是4g网络）

头条焦点：收入证明贷款额度（收入证明贷款）

每日头条!“医生要像福尔摩斯，学会在身体里‘破案’” ——记湘潭市中心医院主任医师封元清

中国高校最大云上科研智算平台上线，由复旦大学与阿里云共建 焦点日报

润本冲刺A股“驱蚊第一股”，拟拿1/3募集资金做推广_最新

普京接见强力部门代表并嘉奖平息叛乱中表现突出人员 环球快看点

琼山区开展未成年人心理健康公益课

焦点速递！怎样编辑微信图文（怎么编辑微信图文）

荣威新i5到店实拍！尺寸加长 4S店：包牌价6.6万

手机腾讯视频怎么看电视直播_腾讯视频怎么看电视直播_播资讯

上海师范大学附属嘉定幼儿园招聘启事

k3换刹车油用几升（k3多久换刹车油？）_环球讯息

世界今热点：交通肇事属于什么罪，是如何处罚的 每日热讯

赛意信息张成康：AI新时代下制造业实践创新探索_今日讯

应用在数字音频工作站中的ADC芯片

我国首个千万吨级LNG接收站一期工程投产

全球热讯:6月27日钢厂调价信息汇总

女人的英语_人的英语

搅局20万价位 星途星纪元STERRA ES价格曝光 天天观点

世界速递！通信行业：5G未来五年前景展望

埃弗顿计划聘请前阿森纳主管桑列伊 热头条

世界微头条丨国际油价下跌纽约期油收跌2.4%

瑞银计划将瑞信4.5万多名员工裁掉一半以上，年内预计有三轮裁员微头条

哈姆：两位新秀首要是建立竞争基调并接受我们的防守工作

【天天新视野】2023内蒙古高考提前批录取结果什么时候出几天知道录取结果

中国高校最大云上科研智算平台上线，由复旦大学与阿里云共建焦点日报

普京接见强力部门代表并嘉奖平息叛乱中表现突出人员环球快看点

世界今热点：交通肇事属于什么罪，是如何处罚的每日热讯

搅局20万价位星途星纪元STERRA ES价格曝光天天观点

埃弗顿计划聘请前阿森纳主管桑列伊热头条