上海汽车报声音

上一版下一版

标题导航

由ChatGPT谈生成式AI的原理和商业应用

按日期检索

12 2017年

上海汽车报

放大

缩小

默认

由ChatGPT谈生成式AI的原理和商业应用

BCG（波士顿咨询公司）是一家全球性管理咨询公司，是世界领先的商业战略咨询机构，客户分布于世界主要商业地区，涉及诸多行业。BCG与客户密切合作，帮助他们辨别最具价值的发展机会，应对至关重要的挑战，并协助他们进行业务转型。在为客户度身定制的解决方案中，BCG融入对公司和市场态势的深刻洞察，并与客户组织的各个层面紧密协作，从而确保客户能够获得可持续的竞争优势，使其成长为更具能力的组织并保证成果持续有效。

深度学习是人工智能领域重要的技术应用。

从2000年开始，深度学习技术每五到七年就会有一个较大的技术进步。以2017/2018年Transformer（一种神经网络模型）和预训练大模型为代表，目前我们正处于由深度学习带来的第三次AI技术发展的高潮期。

生成式AI的创新之处

最近，以ChatGPT为代表的“生成式AI”（Generative AI）技术得到了广泛关注。和传统的对话机器人（Chatbot）不同，OpenAI的ChatGPT确实有独特的技术创新，在人工智能发展史上会是一个里程碑，甚至有可能和2016年谷歌推出的AIphaGo相提并论。

目前看来，ChatGPT比AIphaGo应用的前景会更好、更广泛，可以持续有力地推动这一波AI技术高潮的发展。

早期最有影响力的生成式AI技术是2014年发明的生成式对抗网络。ChatGPT的核心是2017年出现的新生成式AI技术Transformer，以及随后产生的基于Transformer的大规模预训练技术，并引入了一些新的强化学习算法。

在Transformer之前，主要的自然语言处理算法是RNN（循环神经网络），它的原理是每个单词（字）经过计算之后将结果继承给第二个单词（字）。Transformer的另一个巨大贡献是产生了预训练语言模型，比如GPT、BERT和ERNIE等。

ChatGPT属于现象级应用，大家可以直观感受到，未来这类应用的体验提升和更新速度会更快，理解其背后的技术有助于我们把握这个趋势。从大量用户在网上分享的反馈来看，与同类对话机器人相比，ChatGPT具有以下几个明显的优点：

更有“对话”的感觉：ChatGPT在语言组织的逻辑性和系统性方面有了显著提高，感觉像是一位助理，甚至是老师在回答问题。

回答理性又全面：不像网上搜索问题那样，很有可能碰到一些固执的回答者，只从一个角度回答问题，ChatGPT能做到多角度、全方位回答。

可以理解上下文：例如，提出一个问题之后，可以通过“就刚才的回答，你指的xx到底是什么意思”等形式，进行追问。

会根据用户的反馈，持续优化模型：ChatGPT答案的质量、完整性，每天都有一定的提高。这是新的强化学习算法和几十名外包人员每天筛选答案的贡献。

可以协助创作内容，甚至对计算机代码进行指导：注意，ChatGPT并不是简单地从某个模板中选择内容，而是根据实时计算的结果提供答案。你给的信息越精准，回复就越有针对性。

生成式AI待改进之处

ChatGPT拥有强大的逻辑分析和语言组织能力，适合询问观点和态度。但是目前，ChatGPT对事实是完全不检查的，所以不适合用来查询信息，特别是在需要查询信息的对错和真实性的应用场景。ChatGPT提供的答案只能被认为是不保证100%可靠的建议。因为ChatGPT是基于大规模预训练这样的无监督学习，我们无法分辨预训练信息的来源和真实性。

ChatGPT给出答案的精确度取决于预训练样本规模（数据更新延迟）和样本本身的准确度。OpenAI也在其官方资料中说明了ChatGPT的局限性。

为什么ChatGPT会有这些局限性呢？

简单来说，ChatGPT和很多深度学习模型一样，是一个概率生成模型，回答是从一个概率分布中采样的结果。根据你的问题，有些回答的概率更高，有些则较低。当然，ChatGPT还会根据人类的喜好修正权重，从而增加输出人类想要的答案的概率。即使这样，同一个人多次询问同一个问题，不一定会获得相同的答案。有些答案有可能包含错误的信息。

当然，ChatGPT的核心技术中有强化学习的reward模型，实际上是由大量人工进行标注训练的，不是完全的无监督学习。目前ChatGPT模型在某些能力上的不足，在很大程度上是由这个reward模型决定的。Reward模型拟合不好的地方，也成为人们观察到ChatGPT模型不足的地方之一。另外，由于ChatGPT数据更新延迟，还需要更多地学习，常常无法支持时效性答案，用户及ChatGPT都需要时间逐渐提供反馈和学习，才能不断获得更准确的回复和对话。

最明显有待改进的地方是，由于ChatGPT处于测试阶段，知识库很不完善。在模型进行大规模预训练过程中，即使训练语料包含了真实的、正确的信息，但是在推理阶段，ChatGPT还是有可能输出错误信息。而且这样的错误会随着大量的用户测试，更多地暴露出来。

所以很明显，ChatGPT并没有连接一个稳妥可靠的知识库，这也说明目前这个版本无法完全替代搜索引擎，而更适用于一些务虚的任务，比如写小说、写诗歌、搞辩论。

我们认为给ChatGPT连接一个高质量的知识库会极大地提高其准确性。一个可以考虑的方向是，让ChatGPT能够持续更新知识、查询知识，从而带领搜索引擎和互联网的发展。目前看来，至少ChatGPT可以做到将搜索引擎上的信息润色和归纳总结，并组织成最适合人类阅读的形式，直接反馈给用户。

生成式AI的商业应用

直接应用生成式AI的场景是人机互动的文本、图像、语音、视频，也可以生成软件代码、音乐、虚拟世界的三维模型等，在消费领域可以用于艺术创作、游戏开发、人员陪护等，它为商业领域带来很多数字化创新的机会。

企业级解决方案的创新是用户界面的变化，采用自然语言进行交互。

无论是交易型应用还是分析型应用，基于AI采用自然语言进行互动的方式早有探索，例如企业级商业智能可以采用持续的自然语言问答进行数据查询，并自动生成自然语言回答或者直观的图表；利用生成式AI可以进一步提升用户界面生成效率和质量。

能够自动用文字或语音互动，并且在互动中采撷信息输入业务系统的智能机器人早已应用于企业的销售、客服、采购、报销、员工服务等流程。例如，BCG开发了“智能采购助手”，采购人员在与供应商互动过程中，智能助手能够从大数据中实时解析采购物资的市场信息，以及供应商产能、资信等状态，结合供应商反馈和公司的采购策略、协作流程，为采购人员生成行动建议等。

聊天机器人在很多业务场景中并不能完全替代人工，这种方式不仅存在AI准确性的问题，而且在用户体验上缺乏沟通的温度。然而，AI具有超越人脑的信息处理能力，可以提供辅助人员互动的智慧，支持人与人之间有温度的沟通。

近年来，辅助人员互动的“对话式AI”产生了广泛的商业应用。生成式AI进一步提升了此类智能化辅助程度。

可以预见，企业数字化应用可能会发生以下变化：

传统AI技术学习消化的信息资源有限，通过大模型提供更加丰富的业务情景的上下文信息，加强决策的智能深度。通俗地说，普通人下棋想三步，高手下棋想五步。例如，明天我要去见哪位客户会更有助于达成这个月的销售指标？用什么手段能降低5%的费用而不影响员工满意度？

实现业务流程的全自动导航。例如，根据用户反馈，通过生成式AI自动改进产品设计，这将改变传统的产品开发相关企业软件（例如，PLM、CAD）的应用流程。

2B软件架构简化，强调前端开发，进一步实现“数字技术民主化”，降低工作中对数据、信息和知识的访问门槛，用户能够更好地使用数字化技术和AI。传统企业软件架构是应用软件访问集中的数据库，需要用代码连接用户请求和数据。而未来数据和算法都是服务，利用生成式AI产生代码的过程将极为简化，企业软件将完全聚焦于业务运营和用户体验的持续创新。

生成式AI还将改变企业软件行业的商业生态——AI算法和工程等技术平台的开源社区蓬勃发展，利用开源技术开发基础模型越来越普遍。

然而，体现企业差异化能力的是喂给AI的原料，所以数据资源的价值将更加凸显，具有独特know-how及来源的数据将成为AI背后的能力。

分享到：QQ空间微信新浪微博

放大

缩小

默认

朗读