WAIC 特别专访 | MiniMax 刘华:多模态大模型有望引领新一 轮科技革命
生成式人工智能已经在各行各业展现出巨大潜力,为人类带来前所未有的创新体验。今年WAIC期间,大会组委会特别专访产业界和学术界一批业内大咖,探索人工智能的未来之路。本期嘉宾是MiniMax副总裁刘华。
随着多模态大模型技术的持续演进,文本、语音、视觉这三种模态的融合模型正逐步迈向成熟。刘华表示,目前大模型在某些情况下仍可能产生“幻觉”问题,反馈的准确性有待提升,大模型的落地应用成本相对较高。大模型落地应用需综合考虑技术成熟度、数据隐私和安全问题、跨学科合作等多方面因素。短期内对多模态大模型的大规模落地应用预期应保持审慎态度,中长期来看,坚决不应低估多模态大模型的重要性,它有望引领新一轮的科技革命。
以下是对话实录:
Q:您如何看待人工智能技术的一步步演进?
刘华(MiniMax副总裁):随着算法的不断优化和创新,人工智能在处理复杂问题和执行复杂任务方面的能力将不断增强。同时,配合硬件技术的进步,特别是GPU的快速发展,为人工智能提供强大的计算能力,从而加速人工智能技术的发展。另外,大模型的价值在于应用,只有在丰富多样的实际应用场景中才能有效赋能智能经济与智能社会的蓬勃发展,进而挖掘并体现其产业价值,同时实现大模型自身的完善与提升。MiniMax将持续聚焦于基础模型的研发工作,同时坚持To B与ToC业务并重的发展策略。我们不仅会持续推出、优化高质量的APP产品,同时为企业和开发者提供安全、灵活、可靠的API服务,促进产业跨界融合与转型升级,推动我们的大模型在更多实际场景中得到应用与验证。
Q:大模型还有哪些值得期待的技术突破?您对生成式人工智能的发展趋势有哪些判断?
刘华:随着多模态大模型技术的持续演进,文本、语音、视觉这三种模态的融合模型正逐步迈向成熟。一旦此类大模型技术达到成熟阶段,其应用场景将会进一步拓展,实现更多的实际应用。然而,目前多模态大模型亦面临一些挑战。首先,大模型在某些情况下仍可能产生“幻觉”问题,反馈的准确性有待提升。其次,由于算力成本限制,大模型的落地应用成本相对较高。综合考虑,我们认为在短期内,对多模态大模型的大规模落地应用预期应保持审慎态度,不过从中长期来看,我们坚决不应低估多模态大模型的重要性,它有望引领新一轮的科技革命。
Q:在大模型+金融、社交、医疗、搜索、机器人、科研领域,爆款级应用会在哪出现?
刘华:大模型的落地应用是一个比较复杂的过程,需要综合考虑多方面因素,比如技术成熟度、数据隐私和安全问题、跨学科合作等。上面提到的几个领域中若出现能够解决用户痛点、提供显著价值并且用户易于接受和使用的大模型应用,都有可能成为爆款。当然,具体的成功案例还需要时间、市场和技术的共同验证。MiniMax这两年也一直在不同的商业场景中实践。比如,MiniMax为金山办公提供文本生成、要点总结、任务分发、Excel和PPT生成等能力,帮助其打造“WPS AI”产品;与国内电商龙头企业开展合作,打造记账助手+陪伴闲聊的产品“小陪伴”,帮助用户做购物、日常理财记录与分析,满足日常开销管理的相关需求;与国内生活社区龙头企业合作打造生成式智能搜索,在意图理解、检索、结果梳理等方面进行智能化加强;作为联想指定的语音大模型供应商,与其联合打造AI PC个人智能体“联想小天”;与旅游集团开展合作,为游客提供全方位、个性化、互动式的旅行辅助平台,提升旅游服务的智能化水平,包括自动行程改写、语音客服助手等。
Q:当前,人工智能如何赋能新质生产力,为高质量发展提供新动能?
刘华:针对当前市场环境,不同行业的企业在融合大模型通用能力至其业务过程中,普遍面临着资金、技术、人才等多重挑战。MiniMax在研发过程中深刻认识到大模型研发对人力、物力的高度依赖,因此我们致力于打造一个开放性平台,旨在为企业客户和开发者提供性能卓越、易于使用的API,并确保服务安全合规。我们专注于夯实基础模型能力,并通过我们的大模型技术助力合作伙伴将技术转化为实际生产力,加速其技术落地的进程。
Q:您如何看待世界人工智能大会这一平台的意义?
刘华:世界人工智能大会为上海提供了一个展示城市形象和科技实力的国际舞台,通过这一平台,中国众多优秀企业更快、更有效地与世界各地的科技领袖和创新企业建立联系,促进国际交流与合作。这几年,通过大会的影响力,汇聚全球越来越多人工智能领域的顶尖专家、学者和企业家,他们通过大会分享最新的研究成果和技术趋势,为中国的科技创新提供了丰富的灵感和动力,同时将中国的人工智能技术推介给全球更多用户和企业。
Q:人工智能的全球治理和伦理是本届大会的一个重要话题,以善治促善智,如何建立有效合作机制共同应对人工智能带来的全球性问题?
刘华:面对人工智能带来的全球性挑战,建立有效的国际合作机制至关重要。这需要各国政府、国际组织、学术界、企业以及公民社会的积极参与和协作,共同制定全球性的人工智能伦理准则和治理框架,确保技术的发展能够符合人类共同的价值观和利益。
Q:这次大会,您所在企业将有哪些令外界值得期待的AI新产品、新技术、新体验?
刘华:我们把海螺AI、星野和MiniMax开放平台带到了本次世界人工智能大会。海螺AI可为用户分析财报、速读长文、创作文案,聆听用户的想法和烦恼,捕捉、理解用户情绪。海螺AI背后接入了MiniMax自研的多模态大模型,包括万亿参数MoE大语言模型abab6.5、语音大模型和图像大模型。星野是一款基于自研多模态大模型的AI智能体创作平台,用户可在星野里自由定义AI智能体形象、声音、人设、技能,和TA们共同构建丰富且高质量的内容社区。此外,MiniMax开放平台助力企业级用户和开发者快速搭建AI应用,目前已服务超30000家企业和个人开发者。我们期待在本次大会中与更多业界专家探讨多模态大模型的落地应用新范式。
我们在展区为观众带来“文生音乐”的多模型应用创新体验,这项新的应用场景仍会继续完善。希望通过多模态大模型的持续迭代,进一步推动降低AI的使用门槛,提高AI渗透率。
中企视讯公众号