作者|李水青编辑|心缘
仅创立两年员工62人,这家AI创企什么来路?
(资料图)
生成式AI领域的最大并购案已经诞生!
智东西6月27日报道,据华尔街日报今日消息,大数据超级独角兽Databricks近日已同意以13亿美元(约合94亿元人民币),收购生成式AI初创公司MosaicML,引起了国内外资本和智能圈的关注。
MosaicML是一家2021年创立于美国旧金山的AI软件公司,截至目前公司总人数62人,此前仅获得了6400万美元融资。这样一家小AI公司为何能卖出百亿元人民币身价?从消息面上看,MosaicML的创业团队由英特尔负责AI的前高管掌舵,刚刚在今年6月开源了一个300亿参数规模的大语言模型MPT-30B,这些动向都为其成为“OpenAI挑战者”埋下伏笔。同样位于旧金山的Databricks是一家知名数据存储和管理公司,本次收购MosaicML,按照其说法,是要助企业客户利用专有数据,以更低成本构建语言模型,赶超GPT等大模型。
当下正值AI掀起新浪潮,微软、OpenAI、谷歌等科技大厂的声势浩大,国内的“百模大战”也进入深水区。当下,一些国内投资者对AI大模型创业的前景产生了怀疑,比如知名投资人、金沙江创投董事总经理朱啸虎就直言,ChatGPT对创业公司很不友好,未来两三年内请大家放弃。MosaicML收购案或许能为当下的产业圈提供新的参考。
在OpenAI及科技大厂当道的大模型时代,AI创企的发展空间在哪里?MosaicML这样创立仅两年的公司为何能卖出高价?这对国内市场有什么参考意义?本文对此进行了深入探讨。
首先来看看MosaicML公司是什么来路。从规模上看,MosaicML并不大。根据外媒援引官方披露消息,MosaicML目前拥有62名员工,其中研究人员仅为15名,在旧金山、纽约、帕洛阿尔托和圣迭戈设有办事处,迄今为止主要是从Lux Capital和DCVC等投资者那里筹集了6400万美元。但MosaicML的创业团队不简单。MosaicML联合创始人兼首席执行官Naveen Rao曾任英特尔副总裁兼AI产品事业部总经理。Rao之前创办了AI芯片公司Nervana,于2016年以4.08亿美元被英特尔收购。MosaicML的CTO Hanling Tang是前英特尔AI实验室高级总监,可以说MosaicML是妥妥的大佬创业。
▲MosaicML联合创始人兼首席执行官Naveen Rao(左)和CTO Hanling Tang(右)
MosaicML已经开源了大语言模型,接受市场检阅。今年5月,其开源了70亿参数规模的大语言模型MPT-7B,紧接着在6月开源了第二个开源大型语言模型MPT-30B。该公司称,尽管其参数量仅为300亿,是GPT-3的1750亿参数的1/6,但在推理任务表现超过GPT-3,且能更容易在本地硬件上运行,部署推理成本更低。Rao承认,GPT-4在大多数方面的功能都更为优越,不过,MosaicML的模型提供了更长的上下文长度,这允许独特的用例,例如让其生成著名小说《了不起的盖茨比》的尾声,且成本更低。按照MosaicML的说法,300亿的参数规模是其精心选择的结果,可以更好地针对GPU进行优化:其能够轻松部署在单个GPU上,在16位精度对应一块80GB内存的A100 GPU,也可以在8位精度对应一块40GB的A100GPU。据称该模型在众多任务中实际效果优于更费算力的LLaMA、Falcon。Rao在采访中提到,MosaicML使用了一种名为“FlashAttention”的技术,使用户能更快地进行推理和训练。
同时,MPT-30B接受了比其他模型更长的序列的训练,最多达8000个标记;但包括GPT-3、LLaMA和 Falcon每个模型仅为2000个标记。简单说,这意味着用户可以输入更长的提示,可能更适合数据密集型企业应用程序。医疗保健和银行等行业可以受益于MosaicML解释和汇总大量数据的能力。例如,在医学领域,该模型可以解释实验室结果,并通过分析各种输入来深入了解患者的病史。开源模型更有利于保障医疗数据安全,通过API将其发送给OpenAI则威胁数据安全。
Rao说,其可以助一个模型的构建成本从数千万美元降至数十万美元。不过,很难完全独立验证MosaicML的说法,因为Rao谈到的三个开源大语言模型项目(MosaicML、LLaMA和Falcon)尚未使用斯坦福大学的HELM措施等权威方式进行测试。但可以肯定的是,MosaicML在这帮英特尔系AI大牛的带领下,正通过对准GPT模型的局限之处,试图越过OpenAI实现弯道超车。
不仅MosaicML是开源大语言模型的代表,其收购方Databricks也是开源模型的重要倡导者。Databricks创立于2013年,是一家由美国伯克利大学AMP实验室著名的Spark大数据处理系统多位创始人联合创立的Spark商业化公司。相比于微软、谷歌等大厂,Databricks实际上也只能算一家创企。但其在2021年8月完成了一轮16亿美元融资,当年已成为估值达380亿美元的超级独角兽,赶超了OpenAI当下的估值。营收方面,根据Databricks公布数据,其在2022年年收入超过10亿美元,这都为公司收购MosaicML提供了经济基础。
在AI方面,Databricks主张开源模型可以与OpenAI等公司提供的模型相媲美。今年4月,Databricks公布了其更新之后的开源Dolly大语言模型,它能够响应客户查询,根据Databricks智能湖仓内的数据给出答案。随着ChatGPT卷起新浪潮,Databricks也凭借其湖仓一体平台允许数据团队存储和保护数据,支持机器学习工具的开发;Databricks同时也提供TensorFlow等流行AI框架集成,降低企业构建和部署AI模型的门槛。并不是每个人、每个应用程序都需要GPT-4。Databricks的首席执行官Ali Ghodsi说,现成的模型接受过互联网数据的训练,虽然已经可用,但它们充满了可能扭曲结果的无关信息,外部供应商构建的模型中的数据隐私安全问题也值得警惕。
Databricks的一大核心技术被称为Lakehouse(湖仓一体),可以为AI应用管理数据,并将数据、分析和AI编程工具统一在一个系统中。MosaicML并入Databricks后将成为旗下的一项独立服务,助企业利用专有数据构建低成本语言模型。比如,Replit这样提供编程工具的公司已在使用Databricks作为数据管道,进而将信息传输到MosaicML来训练代码生成模型,进而服务其客户。可以看到,数据智能独角兽Databricks正试图通过并入AI大模型能力,挑战微软、OpenAI、谷歌等大公司的市场统治力,为产业提供了新的参考。不过,也有人将MosaicML收购案看作借大模型热度炒作,因为Databricks主营Lakehouse,主要是用Spark来处理大规模集群数据,因此其整合大语言的价值并不明确。尚不清楚Databricks通过何等方式支付收购项目。因此,这一并购案能否真正证明MosaicML的商业价值,仍需要等待时间的验证。
当下正值国内“百模大战”进入深水区,MosaicML并购案或许对国内产业也能带来一些新参考。且不论Databrick豪掷千金的真实意图,这一案例体现了国外市场对AI大模型创业的积极态度。本次被收购的MosaicML公司创立仅两年,公司仅62人,但收购价格达到了近100亿元人民币的高价,给国内AI大模型创业增添了一定信心。近日,国内投资圈出现了对生成式AI及大模型投资的怀疑。美团联合创始人王慧文因病离职引起人们对AI创业难度的担忧,昨日猎豹移动CEO傅盛与金沙江创投董事总经理朱啸虎在朋友圈就ChatGPT的争论也引起关注。朱哮虎认为ChatGPT对创业公司很不友好,未来两三年内请大家放弃,傅盛吐槽说“硅谷一半的创业企业都围绕chatgpt开始了,我们的投资人还能这么无知者无畏”,朱啸虎在评论区说傅盛是抬杠。
市场分析公司PitchBook Data数据显示,全球生成式AI市场的支出到今年底预计将达到426亿美元,到2026年将达到981亿美元。报告称,生成式AI初创公司的风险投资从2022年全年的48亿美元增至2023年前5个月的127亿美元。值得一提的是,垂直行业大模型市场正成为重要的机会点,密集数据成为AI大模型创业成功的关键要素。生物制药服务公司Syneos Health的首席信息兼数字官Larry Pickett在近期谈道,目前根据专业健康数据训练模型的成本,大约为100万至200万美元。通过使用较小的开源预训练模型,而不是在OpenAI拥有的整个数据集之上构建,花费会大大减少。企业技术领导者面临着为AI模型准备数据的压力,数据和数据智能平台成为痛点也成为创业者的机会点。可以看到,垂直行业、数据安全、更低成本,这些要素或许都是AI创企避开巨兽脚印,谋求商业化成功的重要机会点。
13亿美元的大额生成式AI并购案为AI创业带来了新参考。尽管MosaicML公司的创立时间、规模、人才实力看起来都十分有限,且其大模型效果仍未赶超GPT-4,MosaicML仍被收购方Databricks给予了较高认可,从而阶段性地验证了其价值。实际上,也有人认为Databricks整合大语言模型的价值不够明确,可能是借大模型热度炒作,这一案例参考性还需要时间验证。不过无论如何,MosaicML案例也确实点明了垂直行业、数据安全、更低成本这些AI创业的关键要素,值得产业参考。
标签:
Copyright © 2015-2022 时代财富网版权所有 备案号: 联系邮箱: 514 676 113@qq.com