6月28日下午,在火山引擎主办、英伟达合办的“V-Tech体验创新科技峰会”上,火山引擎发布了大模型服务平台“火山方舟”以及该平台面向企业所提供的模型精调、评测、推理等的全方位服务理念(MaaS,即Model-as-a-Service)。据悉,火山方舟大模型服务平台将开启邀测。
资料显示,火山方舟是火山引擎推出的大模型服务与应用平台,其多模型架构支持企业同步试用多个大模型,选用更适合自身业务需要的模型组合,并提供模型精调、评测、推理等多项服务。
大模型竞争如火如荼,火山引擎能凭借平台路线突围吗?对此,火山引擎总裁谭待、火山引擎智能算法负责人吴迪接受了《证券日报》记者的采访。
谭待表示,基于“火山方舟”独特的多模型架构,企业可同步试用多个大模型,且选用更适合自身业务需要的模型组合。
什么是多模型平台架构?
大模型行业正在经历质的飞跃,据中国科学技术信息研究所等机构发布的《中国人工智能大模型地图研究报告》显示,截至今年5月底,国内已公开披露的大模型产品数量达到79个。
面对数量众多的大模型产品,企业面临着选择困难症。谭待认为,目前国内各家大模型产品还处于初级阶段,且该行业技术发展和更新非常快,还没有出现哪家公司大模型产品遥遥领先的局面。众多大模型产品在不同任务上所呈现出的效果也各异,企业不该把业务绑定在一家公司的大模型产品上,而是应该按照业务场景需求,择优选用不同的大模型产品。
“未来应该是多模型时代,所以需要各相关企业把多模型平台架构建设好,让企业可以更方便使用对应的模型产品。火山方舟所搭建的多模型平台,给企业提供安全、低成本的应用服务”谭待进一步表示。
那什么是多模型?赛智产业研究院院长赵刚博士在接受《证券日报》记者时表示,多模型生态就是支持多个大模型共同应用的生态,就大模型应用场景而言,有通用大模型和专用大模型之分;就大模型处理的数据而言,有能对多模态处理的大模型,又有擅长对文本、语音、视频图像等单一模态处理的大模型;就大模型研发的技术路线而言,有采用不同算法构建的不同大模型。因此,未来确实会有多模型生态的存在。
谭待表示,未来的大模型市场将是一个百花齐放的多模型生态,在这个生态系统中,将同时并存几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型。而未来企业自身对于大模型的应用,将会是一个“1+N”的应用模式,即企业通过自研或者与三方模型服务商的深度合作,形成企业自身的1个主力模型;在这个主力模型之外,在不同的场景中,企业还会同时应用N个外部模型。
“单一模型并不能解决企业所有智能应用问题,通用智能模型更多是解决基本智力劳动的自动化,而专用智能模型则更擅长行业领域智力劳动的自动化。因此,未来企业确实需要大模型的组合算法集合,也就是多模型生态。”赵刚进一步表示,并且每个企业都会需要多模型,只是考虑企业大小、投资能力等,目前还是数字化转型水平高的、业务类型复杂的企业更需要多模型。
加速大模型应用落地
那么,大模型服务与应用平台的优势在哪?
吴迪对记者表示,首先火山方舟有统一的工作流,这可以帮助客户对接不同的大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。
“对于模型提供方,火山方舟能够助其以更低的成本触达海量客户,用更小的代价形成规模化的ToB(面向企业)业务。对模型使用者来说,火山方舟可以助其便捷地接触到众多高质量的基座模型。”吴迪进一步表示。
值得一提的是,“火山方舟”的多模型架构不仅为企业提供了丰富的选择,同时也得到众多大模型生产方的积极响应。
“火山方舟”的首批邀测企业,涵盖金融、汽车、消费等众多行业。北京银行CIO龚伟华表示,大模型与客户营销、办公协同、数据智能的结合,在金融应用场景有着巨大潜力。北京银行将与“火山方舟”合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。
NVIDIA开发与技术部亚太区总经理李曦鹏表示,NVIDIA与火山引擎过往合作成果丰硕,双方联合开源了高性能图像处理加速库CV-CUDA,并在大规模稳定训练、多模型混合部署等方面的技术合作上取得成效。
据智谱AI的CEO张鹏介绍,智谱AI在火山引擎平台上解决了千亿模型训练的稳定性、性能优化等挑战。
谭待表示,“火山方舟”还处于起步阶段,工具链和下游应用插件需要持续完善。平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。