股东查

海天瑞声:基础数据服务需求阶段性减缓 多模态大模型将催生新需求

来源: 财联社APP2023-11-18

《科创板日报》11月18日讯(记者 郭辉)“近年来数字经济已成为国家经济发展的核心动能和重要引擎,数据要素作为其中的核心支柱之一,也将迎来新的发展机遇。”在海天瑞声昨日的业绩会上,公司财务负责人、董事会秘书吕思遥表示,公司多年提供的训练数据集及服务作为数据要素的一部分,围绕国家战略,正在积极布局数据要素更多领域的业务,加大对数据要素服务模式和相关技术探索,将其作为公司未来收入增长的潜在支撑。

据海天瑞声近期发布的三季度财报,公司今年前三季度实现营收1.03亿元,同比下降38.25%;归母净利润-3211万元,同比下降272.40%。单季度来看,第三季度营收为2875万元,同比下降45.10%。

针对业绩较大幅度波动,吕思遥表示,亏损主要系报告期内,公司境外收入受境外部分客户阶段性裁员、业务方向调整,以及数据出境相关法规落地实施的阶段性影响,公司境外收入同比下降;同时,为配合整体战略发展及业务拓展目标,公司在营销体系建设、管理架构及激励体系升级方面持续加大投入,叠加新购置办公楼带来折旧费用同比增加,使得管理费用、销售费用大幅增长。

公司本月接受机构调研表示,境内业务方面,虽然宏观稳经济政策已初见成效,但国内仍面临复杂严峻的内外部环境考验,部分境内客户对集中性研发投入仍持谨慎态度,基础数据服务领域客户预算及需求释放出现阶段性减缓,叠加行业内竞争加剧,综合导致境内收入同比下滑。

海天瑞声表示,未来公司将在继续巩固传统基础数据业务的同时,通过持续发展智能驾驶、大模型、数据要素等新兴战略型业务,实现收入的稳步回升。

智能驾驶数据需求广阔

海天瑞声今年境内智能驾驶业务收入表现平稳,整体收入占比有所提升,大模型等新兴数据需求逐步释放,公司称将为下一步驶入良性发展轨道奠定一定基础。

在业绩会上,投资者十分关注未来智能驾驶的数据需求空间,以及海天瑞声是否具备竞争力,能否抓住市场机遇。

海天瑞声董事长贺琳表示,随着智能驾驶相关政策的推出以及单车成本的不断下降,智能驾驶的商业化进程将加速,数据处理需求将呈现指数级增长趋势。根据德勤报告,智能驾驶数据需求在2022-2027年将达到30%以上复合增长率,具有广阔的市场空间。

具体来看,智能驾驶数据业务的市场需求主要与三个要素相关:

1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度,将会直接影响所需数据解决方案的数量;

2)量产车数量。量产车的数量决定了整个训练数据需求基数的大小;

3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。

“这三个要素对训练数据需求的影响,是相互叠加的。”贺琳如是称。

据贺琳介绍,智能驾驶数据领域的核心竞争力主要体现在三个方面,分别是平台能力、算法能力以及数据安全能力。

首先,平台能力是数据标注能力的基石。“平台功能点覆盖的丰富度,是评价平台水平的核心要素,目前同时具备2D标注、3D点云标注、2D-3D联合标注、4D标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商,将能更好掌握智能驾驶数据市场的主动权以及议价能力。”

第二个核心要素是算法能力。平台的智能化程度越高,对人的依赖程度越低,在提高平台生产效率的同时,可以大幅降低生产成本。

第三个要素是数据安全能力。在智能驾驶数据领域,由于其采集图像、视频可能涉及地理及个人隐私信息,为更好防范数据安全风险,国家相关法律法规要求,数据流转链条上各类企业必须做好充分的数据安全保障。“因此,未来不具备相关数据安全能力的供应商,将逐渐被市场淘汰。”

大模型多模态发展,将催生新型数据需求

今年十月,全国信息安全标准化技术委员会发布技术文件《生成式人工智能服务安全基本要求》征求意见稿。该份文件对语料安全、模型安全、安全措施、安全评估等方面内容,给出了生成式人工智能服务在安全方面的基本要求。

该份文件对海天瑞声的数据标注业务将有何影响?贺琳面对投资者提问表示,该文件将进一步提升数据合规要求,增加需求侧对高质量、专业化、合规数据的需求。“预计将会有更多大模型厂商释放更多的数据服务需求,给第三方数据服务商。”

海天瑞声董事长贺琳在业绩会上表示,公司已启动大模型标准化数据集产品的研发投入计划。据了解,该公司此前定增计划的核心内容之一,即为大模型数据集产品建设。“标准化数据集产品是公司区别于其他竞争对手的特色商业模式,标准化数据集产品由于其一次性投入、未来可重复销售的特点,对公司的营收、毛利起着重要作用。”

据介绍,数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,实现基于大模型通用能力和垂直领域数据的训练学习。

“随着更多大模型产品面向公众推出上线,以及不断进行版本迭代,未来的大模型相关数据需求会持续显著增长,这符合当AI进入大规模落地应用后对数据的需求才会规模性增长的规律。”

贺琳表示,预期该类增长将主要体现在预训练阶段对高质量、大规模的版权数据、公共/政务数据、多模态数据、垂直领域的实际场景数据等方面的需求,以及不断提升其交互精准度的强化学习阶段各类数据需求等。未来,随着大模型向更高级、更多维、更广泛垂向拓展,大模型数据需求将呈现快速增长趋势。

此外,海天瑞声判断,未来大模型向多模态发展亦将会产生更多新型数据需求。

大模型向多模态发展后,将会产生更多的例如文生图的多模态大模型,通过文字输入生成对应图片,这就需要机器理解文字语义的同时,将理解的关键词与图片的关键标签进行映射,通过对齐两种独立模态关键特征的方式,实现按指令的创作,以此完成学习训练过程。因此,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,多模态的发展,将推动数据服务行业进入更大的增量空间。