横店东磁 讯飞星火语音大模型再升级,推动万物互联时代人机交互革命
发布日期:2024-09-06 10:28    点击次数:161
横店东磁

6月27日,科大讯飞在北京发布讯飞星火大模型V4.0,七大核心能力全面升级,全面对标GPT-4 Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的整体超越。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,国内大模型全面领先。

    

同时发布或升级星火在医疗、教育、商业、办公等多个领域的人工智能应用,其中包括讯飞星火APP及桌面版全新升级,率先发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。

面向医疗领域,讯飞星火医疗大模型再次升级,医疗核心能力全面超过GPT-4 Turbo和GPT-4o。在此基础上,讯飞晓医APP各项能力持续升级,覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验,满足用户在看病前、用药时、检查后的核心场景健康需求。当前,讯飞晓医APP累计下载量1200万,用户好评率98.8%,主动推荐率42%。

面向教育场景,科大讯飞发布的首款星火智能批阅机,集智能批改、精准学情、个性学习于一体,支持自由排版,不限纸张大小的作业,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,为老师作业讲评和面批辅导提供了素材。原先要90分钟才能批改完的作业,现在只要5分钟;人工分析学情一般要60分钟,现在只要1分钟就能完成;得益于个性化作业,学生的错题解决率也从50%提升到73%。

    

日前,科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目获得2023年度国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域的首个国家科学技术进步奖一等奖。

刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准,并于2023年5月发布。

面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。发布会现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。

    

大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验。

为了让大模型更好落地,科大讯飞还打造了云边端一体化和软硬件一体化的解决方案,赋能家电、机器人等更多行业场景。面向具身智能和人形机器人企业需求,本次科大讯飞正式发布机器人超脑平台2.0,业内首个支持多模态交互。目前,400+机器人企业已经采用讯飞机器人超脑平台。