杨净 发自 合肥量子位 | 公众号 QbitAI
“三项能力超过ChatGPT”
“1024将整体超过GPT水平!”
在科大讯飞星火认知大模型发布会现场,董事长刘庆峰拍着胸脯保证,引起现场掌声雷动!
(相关资料图)
而真机演示效果和多场景产品展示直接把观众们看呆:信息量太大。
网友也围观直呼:这个输出速度也太快了!
比如这个随机问的问题,人类要被AI笑死。
不过也着实被它的语言理解能力所惊到!目前星火已开放优先体验申请,可点击「阅读原文」进入官网申请。
除此之外,还直接体验到了大模型五大应用产品成果,覆盖教育、办公、汽车等多个应用场景的那种。
比如在数字员工场景,只需一句话就可以调出Excel、分析数据、制作表格、自动生成PPT!
还有汽车场景,不光可问自驾游、亲子游推荐路线,还能订餐、买电影票、听新闻等功能。
而在教育场景,可以进行口语交流和作文批改。任意角度拍下作文,就可以从错别字到段落做出细致批改,还会给出内容评价:
虽然早已预告会以产品形式发布,但却没料到不光真机演示,还随机抽取现场观众的提问,还在能现场上手体验落地成品。
而就在十天前,科大讯飞突然向开发者开放内测资格,量子位也抢先体验了一把。结果各方评价来看,效果还算不错。
这接二连三的“反向跳票”操作,着实惊呆现场观众。
光看这现场人从众的架势,就看得出有多受关注。据悉,因为现场报名人数太多,发布会举办地被迫变更,换成了容量更大的会展中心。
三项能力超过ChatGPT
整场发布会看下来,最直观的感受是,主角已并非只是大模型本身,还有倚靠大模型落地的产品成果。
首先来看大模型,现场演示直接体现了7大核心能力。
即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。
尤其在语义理解,长文本生成以及数据能力三方面,据称“已经超过了ChatGPT”。
语义理解部分,正如前文所述,现场科大讯飞研究院院长刘聪直接用语音提问星火大模型,紧接着宁死不屈和能屈能伸的问题来延展:
如果有个小伙子和他女朋友吵架了,它应该是宁死不屈,还是能屈能伸?
结果星火回答:这种情况下,这个小伙子应该能屈能伸。
而在长文本生成上,写邮件、做方案、讲故事、写新闻稿件也通通不在话下。
还有在数学能力表现上,更是直接体现了学霸气质。
除了基本的常规计算、几何、情景应用题,就是更复杂的计算也能解决。
花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?
结果没想到依旧是秒秒钟给出结果,还给出解题步骤。[page]
与此同时,本次共有四大应用成果亮相,包括讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧座舱、讯飞开放平台。
以办公场景为例,就有快速整理会议纪要、语料规整等功能。
在讯飞智能办公本上,根据已有的录音和手写笔记,点击AI助手,就能一键快速自动生成会议纪要。
不仅有整体总结,还有重点关注,尤其手写标注的内容,它也会特别关注到。
除此之外,有时候会议中一些口语交流会比较多,书面语太少,比较难整理。
这时候就可以选择语料规整一键修订,保留重点语料,而且还可以随时看到修订模式。
与此同时,这两项功能在录音转写场景中同样支持。
在“讯飞听见”这一产品中,也同样有了星火大模型的加持。
只需一段录音,就可以生成指定稿件,从现场来看,已经支持品宣文案、新闻稿件、工作总结、工作计划以及工作待办等。
还有数字员工,只需一句话就可以直接打开Excel文档,还可以学习表格数据进行数据分析,并制成表格。
而这些分析图表还可以一键生成PPT。
而对于开发者和合作伙伴而言,此次星火大模型能力接口、插件平台均已开放,将联合各行业合作伙伴共建大模型生态,首批将接入来自36个行业的3000余家企业开发者。
刘庆峰:完全可以重现OpenAI的智能涌现
虽然放眼国内,讯飞星火认知大模型并不占先发优势,尤其在未来产业对接上。但讯飞方面此前就表示:完全不担心。
科大讯飞董事长刘庆峰在现场表示:完全可以重现OpenAI的智能涌现。事实上,此前2022年度业绩说明会上就透露,星火认知大模型距内测到正式发布会有三轮迭代。
随着大模型时代的深入,我们已经明显感知到,其背后核心技术突破并非单纯暴力累积,而是一整套系统工程技术问题。
而科大讯飞能做到官宣即落地,而且迭代速度如此之快,背后手握这几大利器。简单归结起来,就是三驾马车+工程技术能力相辅相成。
自1999年开始,科大讯飞就致力于让机器人像人一样能听会说。2014年,能听会说这一目标升维到了能理解会思考,因此这几个方面讯飞自然都有长期的经验累积和投入。
核心算法上自不必说,科大讯飞提出了知识与大模型融合统一的理解框架X-Reasoner,致力于弥补大模型模糊记忆技术短板;光是去年,就在认知领域取得了常识阅读理解挑战赛OpenBookQA等13项世界第一的成绩。
而数据方面,其数量和质量直接决定了大模型效果的好坏。
作为国内语音AI龙头, 讯飞尤其在中文文本数据以及多语种等方面有着独有优势——
讯飞人工智能开放平台日使用量超过50亿次,天然可为大模型投喂海量文本语料和用户反馈数据;而多语种翻译技术又是讯飞多年深耕,学习并链接全球各语种各行业的知识,这也是通往通用人工智能所必经之路。[page]
至于在数据质量上,依靠于在垂直行业的深度应用,这与企业工程技术能力密不可分。
科大讯飞在教育、办公、医疗等多个领域都有专有认知模型。
以医疗领域为例,作为国内唯一通过国家执业医师资格考试的AI系统,超过96.3%的医学考生,科大讯飞已累计为基层医生提供超过5.8亿次、日均超70多万人次的AI辅诊。
积累了刚需行业数据之后,专有模型反哺通用大模型的发展,促进其智慧涌现。
同样的工程技术能力还体现在算力上。
据透露,目前科大讯飞能实现百亿参数大模型推理效率的近千倍加速,有助于更大更多认知大模型的实际落地。
所以此次科大讯飞之所以直接与大模型一同上线C端直接可用的产品,也是科大讯飞的大模型技术实力体现。
与此同时,也透露了科大讯飞对于此次技术浪潮的理解。
科大讯飞如何理解?
首先,大模型对C端硬件的价值,在于后端理解能力的提升。
此前我们就谈到过,ChatGPT通过每个人都能参与的方式,让全世界感知到大模型的前景,成为AlphaGo之后又一场AI启蒙运动。
虽然一本正经地胡说八道被人诟病,但正是因为大模型,让AI对于人类语言的理解与表达能力有了显著提升。
此前智能终端在前端能听会说,现在融入了能理解会思考之后,给用户的人机交互体验带来极大的提升,变得更便携、更自然以及更有深度,能读懂人们的需求。
比如此次办公场景下,以往可能只是尽可能还原转写的文字,但现在可以将会议记录进行自动校对、自动润色以及自动按需生成摘要或办公文档,提高我们打工人的工作效率。
其次,星火认知大模型是讯飞超脑2030计划的重要阶段。他们最终目标是推出懂知识、会学习的陪伴机器人和自主学习虚拟人家族,全面进入家庭。
自去年启动以来,第一阶段计划就在有序进行。一方面推出可养成的机器宠物、仿生运动机器狗等软硬一体的机器人。在去年全球1024开发者节上科大讯飞就完成机器狗“小黑”首秀。
另一方面推出专业数字虚拟人家族,让虚拟人成为每个行业、每个企业乃至具体每个人的AI助手。
目前,科大讯飞AI虚拟人智能交互一体机产品已经深度触达金融、政务、文旅等多个场景。接入大模型能力之后,虚拟人可以调用更多能力,支持多轮对话,服务也更加细化。
由此可见,星火认知大模型的发布,只不过是科大讯飞“超脑”征程中的必经步骤。
最后,智能涌现趋势已定,千行百业落地更需要同开发者一道。这也是“星火”的题中之义所在。
发布会现场讯飞透露了“星火”有三层寓意:
一方面,这是科大讯飞创业时所感。
24年前,中国的语音市场被国际巨头占领,6个中科大在校大学生提出“中文语音要做到世界最好”,这在当时所有人都不相信。而这批年轻人,在融到第一笔资金之后,就开始了大规模投入研发并整合源头技术创新资源之路,一直走到现在有了今天的科大讯飞。
“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。时至今日还刻在科大讯飞合肥总部A1大楼的墙面上。[page]
另一方面,通用人工智能需要星火燎原。这也是科大讯飞一直以来一以贯之的生态理念。
直观展现就是讯飞开放平台,去年全球1024开发者节上数据显示,讯飞开放平台开放的AI产品及能力,从去年441项增长至今年513项;生态伙伴数从400万快速增长到超500万,年增长率超30%。
而现在要实现机器智慧涌现,需要同更多开发者“星火”一起,燎原千行百业。