燃爆！科大讯飞类 ChatGPT 应用解析

自现象级 AI 应用 ChatGPT 落地至今，作为应用技术商业化大国的中国，在短短半年内，对于这项能照耀未来的技术的商业化探索，堪称气象万千。

对于中国技术公司而言，若无一个类似 ChatGPT 应用的对标产品，可能难以显示其技术色彩。因此，但凡能数得上号的中国技术公司，截至目前，基本上都发布了各自的类 ChatGPT 应用。

5 月 6 日，中国式 ChatGPT 再添新成员：科大讯飞发布星火认知大模型和多行业场景商业应用的 AI 能力。5 月 8 日，科大讯飞股价涨停，为 3 月 23 日以来首次。

(资料图片)

推动中国经济繁荣的改革开放，秉持的实用主义原则，其影响也波及了中国科技公司对于新技术的主流态度：新技术能否创造出确定的应用商业价值。有此指导思想，故其对底层技术的热情很少像对新技术的商业应用那样高涨。

但这不等于，中国技术公司缺乏底层技术探索和积累。他们只是需要有人给出这些底层技术极具商业价值想象空间的路径，然后，其应用这种底层创新技术的商业探索落地速度之快，举世无双。

科大讯飞作为一家以 NLP 语音技术立足的技术公司，自然也不例外——任何技术公司或文化现象，无不受宏观行业环境和历史传统影响。

那么，讯飞星火认知大模型的技术探索是什么？AI 商业价值怎样落地？讯飞 GPT 技术能力如何与之业务匹配？强弱如何？未来这种能力怎样演进？

开放平台：如虎添翼？

5 月 6 日，科大讯飞董事长刘庆峰发布星火认知大模型，并同步发布讯飞 AI 学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等 5 项应用成果。其中，讯飞开放平台是构成科大讯飞商业（技术和产业）护城河的关键要件。

科大讯飞 2022 年财报显示，讯飞开放平台的毛利率为 28.23%，同比提升 7.02 个百分点。在科大讯飞四大业务板块中毛利提升速度最快、升幅最大。

以 AI 技术为基石，通过 " 平台 + 赛道 " 市场战略，凭借 " 算法和数据 " 核心技术优势，科大讯飞在 C 端、B 端和 G 端的 AI 领域攻城略地。

据科大讯飞联合创始人、高级副总裁江涛解释，" 平台 + 赛道 "，这个 " 平台 "，即讯飞开放平台：" 星火认知大模型对讯飞开放平台极具意义。"

2021 年 10 月 25 日，刘庆峰在合肥发布 " 科大讯飞开放平台 2.0 战略 "。

与 1.0 相比，讯飞平台 2.0 战略新增 " 行业龙头 "，构成新的 " 讯飞 + 行业龙头 + 开发者 " 三维结构，目的是通过讯飞开放技术平台和工具，结合行业特性和数据，形成数字底座，再通过开发者将数字底座与特定的软硬件环境做匹配，最终形成完整的行业 AI 数字解决方案。

在这个过程中，开发者数量决定整个开放平台的垂类应用丰富性，开放平台的底层技术能力，决定开发者能用具备怎样强悍能力的技术工具，去开发垂类应用；而行业龙头带动的行业合作伙伴，用 RPA（机器人流程自动化：Robotic Process Automation）等工具开发行业应用的易用性和有效性，也与开放平台的工具能力密切相关。

若对 " 讯飞 + 行业龙头 + 开发者 " 三维结构做个解构，即由科大讯飞提供 AI 技术、大数据平台和相关深度学习训练算法工具，行业龙头在此基础上提供场景、专家知识和各类业务模型。之后，由双方通过贯穿 AI 算法的业务模型形成数字基线底座。

有了基线底座，讯飞开放平台行业开发伙伴，可以做具体场景匹配软硬件环境的技术应用工具，完善和做各种流程开发，最终形成具体的可应用的行业解决方案。

因此，一旦讯飞星火认知大模型集成到开放平台，则平台工具能力之提升幅度，将难以想象。江涛说，" 大模型进一步集成到开放平台后会带来整个开放平台能力的跃升，我们会进一步地赋能这些开放平台的合作伙伴。"

刘庆峰在 5 月 6 日披露，讯飞开放平台实名认证的开发者数量，已经突破 400 万，行业合作伙伴突破 500 万大关。2021 年 10 月 25 日，实名注册开发者数量是 265 万。

讯飞星火认知大模型的底层能力，怎样赋能讯飞开放平台的行业伙伴？刘庆峰说，讯飞将开放插件。" 合作伙伴、开发者可分享这些插件，以深入至大模型。这样用星火大模型就可以直接用到这些插件能力。"

随着应用的深入，可集成越来越多的专业插件：对行业插件安全性有要求的 B 端用户，可用星火认知大模型做富有针对功能的插件，以供其内部使用或做平台共享。这是科大讯飞 To B 策略的体现：建立行业生态圈，共同繁荣整体行业。

刘庆峰透露，" 已有 36 个行业、超 3000 家企业跟我们达成了合作的明确意向。"

解构 "1+N" 的 AI 应用

美国 OpenAI 公司推出的 ChatGPT 应用，AI 技术名称是 GPT，而 "Chat" 则是应用手段或形式。通过 Transformer 架构做 AI 技术开发，应用终端的 AI 能力源自底层 AI 技术对语义大模型（LLM）的训练。

概括而言，OpenAI 的 ChatGPT-3.5（2022 年 12 月推出的初代版），就是用 Problem Models（问题模型）加上 1750 亿个参数 / 节点，以之为基础提供巨量、有监督的学习数据，借助 Transformer 架构，" 投喂 " 给 AI 语义训练大模型（LLM），做出的 AI 应用效果。

科大讯飞星火认知大模型，作用相当于 OpenAI 训练语义大模型（LLM）做出的 AI 应用效果集成和问题模型的集合。这在 2022 年 12 月 15 日启动的科大讯飞认知大模型专项攻关中，属于 "1"，而这个 "1" 落地的行业垂直领域或场景，被概括为 "N"。

因此，科大讯飞的类 ChatGPT 应用，结构就是 "1+N"。"1" 是指星火认知大模型（可认为是通用 AI 技术底座），"N" 即落地多场景。若将之从商业角度做个命名，则可称为 "1+N" 认知智能大模型技术及应用战略。

其中，通用认知 AI 技术底座包括七项能力：多层次跨语种语义理解、多风格多任务长文本生成、多模态输入和表达能力、多功能多语言代码能力、多题型可解析数学能力、情境式思维链逻辑推理和泛领域开放式知识问答。

从商业价值角度，通过通过 AI 技术底座，科大讯飞为各个行业设计行业技术工具，并且以之构建 AI 应用样板间，最终 1 和 N 形成飞轮效应，实现商业价值的正向循环。

科大讯飞主要业务分产品有四个类型：即教育产品和服务、开放平台、信息工程和运营商相关业务。

星火认知大模型除了集成至讯飞开放平台，另外重要的一极是使能讯飞软件和硬件产品，以提升或重构讯飞的业务竞争力。

这些软硬件产品所属场景即处于 "1+N" 中的 "N"。5 月 6 日，科大讯飞推出星火认知大模型的四大行业应用成果：教育、办公、汽车和数字员工。

其中，教育和办公方面，属于人机交互。讯飞主要落地形式是软硬件，如学习机、办公本或语音遥控器，以及讯飞听见（专业级语音转文字效率工具）。江涛说，" 我们相信大模型的智慧涌现一定会带来下一代人机交互的新的入口。"

科大讯飞 2022 年财报显示，教育产品毛利率是 49.39%，在科大讯飞营收中的占比 32.74%，均为最高。

与 To C 相比，市场更关注讯飞医疗中的 AI 辅助诊疗，这块属于 To B 场景。据江涛透露，科大讯飞的智医助理迄今为止已做了 5.8 亿人次的 AI 辅诊，中国 300 多个区县的基层医疗机构的医生正在使用。

一旦讯飞医疗大模型推出，将更好地帮助医生提高病历质检、辅助诊断、方案推荐和用药管理等方面的水平。这属于 B 端中的 C 端应用，比如也能做个人保健咨询、健康管理和疾病管理。

但在 5 月 6 日，讯飞医疗大模型没有推出。对此，刘庆峰表示，" 因为需要相关法规，所以我们应对医疗专业领域模型更加谨慎。下一步我们会跟医疗机构合作，通用大模型也会集成医疗专业知识。"

刘庆峰透露，科大讯飞将会在今年讯飞 1024 开发者大会上正式对外发布医疗大模型。

历史积累和未来目标

虽然科大讯飞的 "1+N" 认知大模型专项攻关于 2022 年 12 月 25 日启动，但讯飞在 AI 技术领域的技术积累已有十多年历史。

从 AI 技术发展路径看，ChatGPT 也不是最新的技术成果。在理论上，ChatGPT 没有更多创建——核心技术在 2017 年就已出现：由谷歌创建的 Transformer 神经网络架构，其革命性在于能让 AI" 听懂人话 "。

科大讯飞星火认知大模型的底层 AI 技术起始源点，始于 2011 年成立的语音及语言信息处理国家工程实验室。这比 ChatGPT 应用的底层 AI 核心技术 "Transformer 神经网络架构 " 早了整整 6 年。

语音及语言信息处理在大模型中的作用是什么？刘庆峰说，" 讯飞星火认知大模型本质上是一次对话式通用智慧的涌现，语音和语言的核心能力是基础条件，科大讯飞是中国（该领域）的国家队。"

讯飞取得和谷歌一样的认识，也就是让 AI" 听懂 " 人话的时间节点是 2014 年，也比谷歌早 3 年。

那年，科大讯飞推出讯飞超脑计划，明确提出要让机器像人一样，具备能理解会思考的能力。2022 年 1 月，刘庆峰在科大讯飞年度总结计划大会上，宣布讯飞超脑 2030 计划：要让懂知识、会学习、能进化的通用人工智能技术，以机器人的实体形态或虚拟形态，进入每个家庭。

坦率地说，在 OpenAI 推出 ChatGPT 应用前，科大讯飞在 AI 领域的技术探索和落地成果相对 " 碎片 " ——这也是中国技术公司的 " 共性 " ——缺乏像 ChatGPT 这样的 AI 能力验证应用体系。ChatGPT 不仅仅是个 AI 应用，也是一个商业化体系应用的象征性标杆。

因此，OpenAI 实际上起的是验证 AI 技术商业价值的作用，以及引领 AI 应用方向。一旦方向确立，大模型的海量场景应用验证得以点亮，素有积累但找不到大规模有效价值应用明确方向的中国技术公司，其类 ChatGPT 技术开发和场景应用激情，就如脱缰野马，不可遏制。

在 2017 年这个关键节点，科大讯飞的 AI 技术积累到什么程度？他们让机器在全球首次通过国家执业医师资格考试综合笔试测试，测试成绩超过 96.3% 参加考试的医生。

两年后 2019 年，在斯坦福大学发起的国际著名的 SQUAD 机器阅读理解比赛中，科大讯飞让机器在英文阅读理解中首次超过人类平均水平；2022 年，在艾伦研究院组织的 Open Book QA 知识推理比赛中，讯飞机器单模型首次超过人类平均水平。

或许意识到体系对于 AI" 听懂人话 " 技术目标达成的重要性，科大讯飞在 5 月 6 日也推出了 AI 应用体系，主要用于评测 AI 技术能力。目前，这项体系已覆盖 7 大类、481 个细分任务类型的通用认知大模型评测。

比如，AI 技术到底发展到什么程度？下一个发展应该往哪里走？技术距离实用是不是已经达标？还有哪些工作要做？

据刘庆峰介绍，目前讯飞星火大模型在文本生成、知识问答、数学能力三项能力已超越 ChatGPT，" 英文如果满分以 5 分计算，Chat GPT 现在是 4.48 分，我们已达到 4.29 分。" 据刘庆峰透露，" 当前讯飞星火认知大模型的文本生成、知识问答和数学能力，已超过 ChatGPT。"

根据既定计划，到今年 10 月底，讯飞星火认知大模型目标中文能力超过 Chat GPT 的水平，英文能力相当。

关键词：