齐向东:高质量数据是稀缺资源,构成高水平AI的基础

发布于:2024-06-06 10:41

6月5日,全球数字经济大会数字安全高层论坛暨BCS2024北京网络安全大会在京举办。全国政协委员、全国工商联副主席、奇安信科技集团董事长齐向东发表了“AI驱动安全”的主题演讲。在演讲的过程中,他用实际案例证明,经过专业知识优化的大模型在实际应用中具有显著优势,其精确性和实用性远超未优化的通用大模型。而此类高水平AI的基础则是高质量的数据。

齐向东强调,要想做好AI驱动安全,高质量的数据至关重要。高质量的数据有两个特点,一是全、二是新。只有拥有最多人才、承担最多国家关基设施防护任务、处理最多安全应急事件的企业,才能积累下又全又新的数据,此类数据则是稀缺资源。

他介绍,第一个特点“全”指的是足够多的基础安全数据用于训练安全大模型。安全设备覆盖越广,得到的数据量越大、越丰富。

第二个特点“新”指的是有足够贴近实战的一手原始语料用于大模型推理。“只有丰富的实战经验,才能磨练出专业的原始语料。”齐向东表示。

齐向东总结,这些实战经验和知识既是训练高水平安全大模型的核心要素,也可以作为大模型推理时所需的最新实时信息,双管齐下确保生成精准的、高价值的答案。

账户登录

获取验证码
记住密码 忘记密码 ?
登录

还没有账户?去注册 >

找回密码

获取验证码
确认

恭喜您成功修改密码

弹窗将在3秒之后关闭,