2022 年底,ChatGPT 的横空出世让沉寂许久的 AI 产业重新焕发生机,围绕生成式 AI 的热烈讨论直到今天仍在继续。根据国外一家数据网站 Digitalinformationworld 公布的新数据:ChatGPT 背后母公司 OpenAI 的网站流量,在 3 月份飙升至每月独立访问量 10 亿大关。或许可以说这是炒作带来的热度与流量,但不可否认的是:全球已经有越来越多人将生成式 AI 作为生产力工具,用来提升工作效率、寻找工作灵感,甚至直接让它帮自己处理一部分日常事务。
而对于企业来说,生成式 AI 所展现出的吸引力无疑更是巨大的。它是否能与企业的业务场景相融合?能否使用生成式 AI 实现降本增效?等等一系列问题,为无数行业中的企业提出了全新的挑战,同时也注入了新的希望与想象。
企业该如何正确认知生成式 AI?又该如何迈出 AI 与业务融合的重要一步?生成式 AI 的未来又有哪些值得关注的前景?为了解答这些问题,作者对成都美洽网络科技有限公司(下称“美洽”)的 AI 技术专家们进行了专访,希望能够通过美洽的经验与观点,为有着同样困惑的企业或读者带来一定的启发。
一、揭秘生成式 AI:大力出奇迹,但市场会选择最优解
生成式 AI 有多种表现形式,ChatGPT 是其中一种特定实现,即:生成文本以响应对话设置中的用户输入,而这背后则是大语言模型在发挥着作用。美洽 AI 技术负责人 Russell 在采访中简单解释了大语言模型的原理:
“所谓‘大型语言模型’是基于深度学习的神经网络,它包含大量模型参数。通过使用大量的网络上的语料和其他资料进行无监督学习,该模型可以训练出一种语言模型,根据不同的下游任务,语言模型可以进一步微调,以适应特定的应用场景,例如企业客户或特定行业的语料。
预训练模型如 ChatGPT 已经由 OpenAI 训练好。我们可以将数据输入该模型,进行微调,或者基于我们自己的语料进行基于向量检索的操作,并结合上下文提示,以达到向模型注入特定知识的目的。”
Russell 进一步补充道,与传统人工智能模型不同的是,以前的模型可能只有几千万或上亿的参数,而大语言模型通常拥有数十亿甚至数百亿的参数。这种增加的参数量使得模型更有能力吸纳知识,通过使用大量语料进行训练,模型可以学习到更多的知识。
“当然,这也意味着对数据的质量、数量要求更高,同时需要更强大的计算能力。”Russell 在采访中表示:OpenAI 正是通过大力出奇迹的方式,通过使用大型模型、大规模数据和大量计算资源,才让 ChatGPT 取得如此出色的效果。
一如 Russell 所说:大语言模型训练需要大量的数据、算力。因此目前国内已经发布的一些大语言模型均来自百度、阿里、华为这样资源相对丰富的大厂。随之而来的,是一场围绕大语言模型的竞争,正式打响了。
通过对市面上已有的大语言模型的全面调研,Russell认为:总体上看,国内厂商在大型模型方面的积累时间还不够,包括训练所需的语料也相对不足。但是,国内的大型模型在某些场景下可能会有所优势,比如:对中文语料的应用与理解。而其中的差距,Russell 觉得可以归因于起步较晚、训练语料和时间的不足,以及预训练和调优方面可能还存在一些技巧和技术壁垒。
美洽 AI 算法架构师 Larry 老师同意这一观点。他在采访中说:“有关大模型的竞争,不仅仅是技术上的竞争,技术并不是唯一关键。这场竞争更多是涉及到金钱和资源的角逐。在天然的互联网环境中,人们不愿意将所有的鸡蛋放在一个篮子里,因此需要在各个领域开展竞争。但最终,市场将选择最适合发展的解决方案。”
二、大语言模型+智能客服=?
今年 4 月,美洽宣布将生成式 AI 接入智能客服平台。Russell 告诉笔者,做出这样的决定是因为大语言模型的能力天然地适合客服场景。他解释道:大语言模型可以进行多轮对话、翻译、推理,还可以用于文案的生成和补充,而这都是智能客服产品所需的重要能力。
以美洽为例,接入大语言模型后的客服机器人,不仅可以进行与客户的多轮对话,还可以实现更智能的语义识别,即:机器人可以轻松根据对话的上下文,并给出精准的回复;在客服端,它甚至可以在对话结束后,根据对话内容自动填写对话小结等信息。
但 Russell 坦言,智能客服与大语言模型结合也存在着多方面的难点。大语言模型是使用大量通用语料进行训练的,因此对于通识方面的知识相对较强。但对于具体的企业应用,特别是 B2B 场景提供能力时,由于每个企业的知识都是不同的,如果仅使用原始的大语言模型能力,可能无法满足企业自身的需求。
此外,由于访问量过大,第三方厂商提供的大语言模型 API 也偶尔存在着访问速度的问题,这也是一个亟待解决的难点。难点虽然存在,但这并不影响 Russell 对大语言模型,甚至生成式 AI 与智能客服相结合的前景充满信心。
Russell说,目前美洽只接入了大语言模型在文本方面的能力,但事实上,真正的生成式 AI 是支持多模态的,不仅是文本,图片、语音甚至视频都是支持的。他表示,未来希望让智能客服能够处理更多种形式的用户提问和输入,让企业与客户之间的交互更加丰富多样。
此外,他认为还需要依靠大型模型的能力进行更新和迭代,以丰富现有回答的内容。同时,也要结合大型模型的能力来适应更多场景和客户需求。
Russell 表示:“目前,ChatGPT 已经给我们带来了令人惊喜的成果,但我们仍处于初级阶段。我们可以期待更多、更好、更强大的模型,为我们的智能客服提供更强大的能力,并能够回馈给我们的客户更多价值。”
三、拥抱变化:科幻电影正在变成现实
在采访的最后,美洽的两位技术专家各自展望了对大语言模型、生成式 AI,甚至人工智能产业未来发展的期待。
对 Russell 来说,他认为大语言模型能够提升生产力,虽然不一定会立即取代人类,但可以极大地提高效率;同时,它可以使传统软件和人机交互界面更易于使用。以前的人机交互界面主要基于图形化界面,而现在则可以通过自然语言与机器进行交互。举例来说,以前的电视遥控器可能只能实现基本的频道切换,但现在大语言模型可以带来更强大的功能体验,比如:运用 AI 能力在 Apple 刚刚发布的 Vision Pro 上开发全新交互方式的应用程序。
Larry 老师则从自己的使用经验展开来谈了谈自己的观点。他表示,现阶段大多数人将大语言模型视为一个百科全书,但当他亲自体验时,感受到的是整个搜索领域正在被颠覆。
“过去,我们习惯在搜索框中进行搜索,比如 Google、百度等各种搜索引擎。但现在,我们的交互方式发生了变化,不再是冰冷的搜索框,而是可以与我们对话的方式。科幻电影中出现的许多东西很快就会变为现实。”
他又补充了一个自己的例子:“比如我自己学英文。我的英文水平还不够好,在学习英文时,我需要使用各种各样的应用程序进行翻译和查单词,了解不同国家的文化等等。而现在有了 AI 的加持,通过使用 AI 聊天机器人,我可以直接与 AI 进行练习。因此,AI 还可以在教育领域,特别是语言教育方面,带来巨大的改变。我们需要拥抱这种变化。
以前,我们可能需要去学习各种不同领域的知识或技能,努力将其融入到我们的日常生活和工作中。但现在,借助 AI 聊天机器人,例如使用 AI 聊天机器人进行菜谱查询,它可以为你提供更多的信息,甚至还能提供一些关于菜肴的科普知识。
如果不想要海量的搜索结果,这将是 AI 聊天机器人的下一个发展阶段,即在特定领域进行深入,它们会不断深入挖掘特定领域,并涌现出更多的垂直领域应用,例如:医疗,电商,艺术创作,心理咨询等等。”
结束语
在与美洽的两位技术专家交流的过程中,我们不仅感受到了他们身为技术人,面对新兴技术时的兴奋与憧憬,更感受到了他们身处智能客服领域,对生成式 AI、大语言模型等技术应用的严谨与专业。
AI 的发展带来的不仅仅是颠覆,对于置身科技浪潮中的我们,更应该思考如何正确面对这样的变化。正如 Larry 老师所说,科幻电影正在变成现实,我们需要拥抱这种变化。对于美洽来说是如此,对于我们每一个人来说,更是如此。
|