成为注册用户,每天转文章赚钱!
您需要 登录 才可以下载或查看,没有账号?立即注册
x
证券代码:688787 证券简称:海天瑞声
北京海天瑞声科技股份有限公司
投资者关系活动记录表
编号:2023-018
投资者关系活动类别 √特定对象调研 □分析师会议 □媒体采访 □业绩说明会 □新闻发布会 □路演活动 □现场参观 □电话会议 □其他 (请文字说明其他活动内容)
参与单位名称及人员姓名 UBS:Wendy Zhang、Yin Zhang、Qiuyi Lv、Guanyi Wang PICC HK:Benjamin Zhang Oceanlink:Vense ma Tenbagger capital:Wenjie ren Morgan Stanley:Tianyang hong Pleiad Investment Advisors:Dawei Wang Ocean Link:Richard Lu Stoneylake Asset:Henry zhang
会议时间 2023年9月19日
会议地点 Zoom会议
上市公司接待人员姓名 证券事务代表:张哲 投资者关系负责人:袁璐
投资者关系活动主要内容介绍 1、大模型范式下的预训练阶段数据需求和传统的数据需求有什么区别? 大模型预训练阶段的数据需求和深度学习技术路线下的传统训练数据需求,两者在形态上基本一致,都是文本、语音和图像,但在数据规模、质量、来源等方面,预训练数据较传统训练数据会存在一定差异。例如,规模上,预训练数据的token量普遍在万亿量级,而传统模型数量则大约在10亿量级。从数据来源的角度看,由于大模型所需数据规模远超传统模型,因此其数据来源将更加丰富以满足规模化、多元化数据需求。具体来说,大模型数据来源除了来自传统的定向采集外,还将涉及版权数据、公共数据等新型海量高质量数据来源。 此外,数据处理的核心技术也存在一定差异。例如,由于大模型预训练阶段的原料数据规模更大,因此大模型预训练数据更加注重数据清洗的工程化能力,在预训练阶段需要结合原料数据特点以及所涉及的主题、领域等,对海量数据完成高质量清洗,这对数据服务商的工程化数据处理能力以及过往服务经验的积累都提出了更高要求。 2、怎么看大模型时代下,多模态数据的需求? 大模型向多模态发展后,将会产生更多的新型数据需求。例如文生图的多模态大模型,通过文字输入生成对应图片,这就需要机器理解文字语义的同时将理解的关键词与图片的关键标签进行映射,通过对齐两种独立模态关键特征的方式,实现按指令的创作,以此完成学习训练过程。因此,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,多模态的发展将推动数据服务行业进入更大的增量空间。 3、今年上半年公司收入同比下滑的原因是什么?预计什么时候止跌回升? 上半年,公司境外收入受境外部分客户阶段性裁员、业务方向调整,以及数据出境相关法规落地实施的阶段性影响,同比下降,导致公司整体收入下滑。但另一方面,公司境内收入,受智能驾驶业务增长驱动,已在二季度呈现同比增长态势。公司认为收入的下降主要受短期因素影响。未来,预计随着境外客户人员调整进入尾声,以及出境安全评估逐渐转向常态化,境外收入水平将逐步恢复;同时公司也将持续发力智能驾驶、大模型等新兴战略型业务,并积极探索数据要素市场,力争通过多主线合力,实现未来业绩的稳步回升。
附件清单(如有)
日期 2023年9月21日 |
|
5e天资,互联天下资讯!
|
|
|
|