文 | 周鑫雨
编辑 | 邓咏仪
尚未推出自研模型基座的字节跳动,先和第一梯队的模型厂商攒了个局。
【资料图】
6 月 28 日,字节跳动云服务平台火山引擎推出了大模型服务平台 " 火山方舟 ",面向企业提供包括精调、评测、推理等在内的模型服务。
这个时间点并不算早。此前,BTA、商汤、360 等国内互联网企业已经纷纷推出了 MaaS(模型服务)平台,抢占先发优势。多数 MaaS 平台的服务模式大同小异:以厂商自研的通用大模型或数个行业大模型为基座,再推出相应的模型服务。
姗姗来迟的字节走的是差异化路线。没有自研模型基座,那就拉强者组局——火山方舟宛如国内第一梯队模型厂商的 " 陈列柜 ",集成了智谱 AI、MiniMax、百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技七家科技公司及科研机构的大模型。
火山引擎总裁谭待性价比、低成本是火山方舟强调的第一个特性。
随着 AI 赛道从大炼模型的投入期,逐渐到了落地场景的应用期,愈来愈多做 AI 应用的厂商开始重视模型服务的 " 性价比 "。火山引擎总裁谭待在采访中指出:" 一个企业未来一定会在多个场景应用多个模型,因为每个模型在不同场景性价比是不一样的。"
与此同时,火山引擎智能算法负责人吴迪判断,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。
谭待在访谈中打了个比方:大模型好比工资高的博士,不少应用场景则好比小学数学题,付费让博士去解小学数学题显然是不合理的——这也迫使不少厂商选择精调后的中小模型,在获得媲美大模型效果的同时,降低推理成本。
组团合作的亮点在于,可让用户像搭积木一样选择适应自身业务需求、且具高性价比的模型组合。与此同时,火山方舟还提供了模型精调和评测服务,客户可同时对接多家大模型,并通过自动化和人工评估精调后的模型效果。
数据安全,则是火山方舟强调的第二个特点。
大模型私有化部署是目前最为安全的方案,也是国内客户更容易接受的形式,但也意味着企业将承担更高的部署成本。为此,火山方舟推出了大模型安全互信计算方案,用计算隔离、存储隔离、网络隔离、流量审计等方式保证模型的机密性、完整性和可用性——简而言之,就是给不同企业的数据分别建了保险柜。
但相对地,企业也需要牺牲部分的训练推理速度。吴迪指出,大模型安全互信计算方案适用于对训练和推理延时要求较低的客户;火山正在与英伟达合作,基于英伟达新一代硬件探索安全方案。
不过,卖模型弹药的字节,最终仍会亲自上大模型的战场。强调火山引擎本身不训练模型的同时,谭待表示:" 字节内部其他团队,如果做好了模型,大概也会上到方舟平台上对外提供,它在方舟上就是众多模型的一个。"
欢迎交流!