5月6日,科大讯飞举办“讯飞星火认知大模型”成果发布会。发布会现场,科大讯飞董事长刘庆峰和科大讯飞研究院院长刘聪对其星火大模型进行了真机实时演示。
科大讯飞董事长刘庆峰现场讲解图片来源:科大讯飞
(资料图片)
现场实时演示的大模型能力共包括七个方面:文本生成、语言理解、知识问答、数学能力、逻辑推理、编程能力、多模态生成。除仅在个别问题上表现略有瑕疵外,整体效果引发了观众阵阵掌声。除了科大讯飞自己准备的问题,发布会还实时收集抽取了观众提问来进行演示,效果同样精彩。
科大讯飞董事长刘庆峰说,讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超过ChatGPT。同时他进一步透露,讯飞的通用大模型将在今年年内三次大升级,10月底整体赶超ChatGPT,“中文超越,英文相当!”
真机实测效果惊艳
刘庆峰认为,ChatGPT本质上是一个对话式的通用人工智能的智慧“涌现”,语言和语义的核心能力是基础条件。在这些能力方面,科大讯飞是人工智能“国家队”,早在2011年,科大讯飞就承建了语音及语言信息处理国家工程实验室,2017年,科大讯飞承建认知智能国家重点实验室。
科大讯飞董事长刘庆峰现场讲解图片来源:科大讯飞
“可以说,多年来,科大讯飞已在认知智能领域有了丰富的储备和积累。我们完全能重现OpenAI的智慧‘涌现’。我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越。”刘庆峰说。
对标OpenAI,首先需要一套对大模型进行科学系统评测的体系。刘庆峰介绍,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。
发布会现场,科大讯飞也将自身的星火认知大模型按照这个评测体系的7大任务进行实测,包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力展开现场实测。
“你为什么叫星火?”科大讯飞研究院院长刘聪直接语音输入,讯飞星火认知大模型不仅准确地进行了语音转文字,而且迅速给出了它的回答。
“今天是科大讯飞星火认知大模型的发布会,线下和线上观看发布会的朋友们一直以来对科大讯飞都非常关心和支持,非常感谢大家,请帮我写一篇欢迎词。”短短几秒钟,一篇要点俱全的欢迎词随机生成。
此外,讯飞大模型还能“带娃”。按照刘聪的指令“就孙悟空和奥特曼来到大会现场编一个故事”,大模型便信手拈来了一个睡前故事,并且还能“读”给小朋友听。
一些“情商”陷阱问题,例如“俗话说男人要宁死不屈,俗话又说男人要能屈能伸,如果我和女朋友吵架,我应该宁死不屈还是能屈能伸”,讯飞大模型也能得体应对。
“某公司股票昨天涨了10%,今天又跌了10%,请问是赚了还是赔了?”股民朋友们关心的股价问题,讯飞大模型也能给出计算方式和计算结果。
无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,讯飞星火大模型都表现出色,精彩回答,引发掌声不断。
刘庆峰自豪地表示,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上赶超ChatGPT。
不过,现场偶尔也会有小bug,比如要求英文回答时会掺杂一两处中文,数学计算时第一次有时会出错,但第二次就能算对。
持续升级
10月赶超ChatGPT
刘庆峰坦言,当前海内外大模型技术普遍存在一些缺陷,例如新知识难以及时更新,事实类问题容易张冠李戴,对史实、典籍内容容易添油加醋等等,但刘庆峰也表示,对这些缺陷,科大讯飞都有办法一一解决。
他还透露,接下来讯飞星火大模型还将进行三次大升级——6月9日,突破开放式问答,多轮对话能力和数学能力再升级;8月15日,突破代码能力,多模态交互再升级;10月24日,通用模型将直接对标ChatGPT,中文能力实现超越,英文能力达到相当!
刘庆峰表示,后续科大讯飞还将联合开发者推动大模型应用落地,首批来自36个行业的3000余家企业开发者将接入星火大模型,共建人工智能“星火”生态,“燎原”新一轮产业变革。
值得注意的是,讯飞星火认知大模型已经结合科大讯飞自身业务实现行业赋能。发布会上,科大讯飞还发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用产品。
例如在教育领域,搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文的深度高阶批改。在办公领域,搭载大模型技术的讯飞智能办公本能够根据手写要点自动生成会议纪要,助力办公效能进一步提升。很多媒体记者熟悉的音频转录工具“讯飞听见”,有了大模型加持后,除了能够实现语音转文字外,还能通过AI分析文字内容,从而一键生成多种文本。
(文章来源:中国证券报)