在 9 月 8 日举办的外滩大会云端 AI 分论坛上,支付宝小程序云负责人李铮以「支付宝小程序云 · 智能开放的增长引擎」为主题,向我们重点介绍小程序云提供的云托管、云开发、AI 智能导购、风险智能等产品,可以如何帮助支付宝合作伙伴实现业务增长、风险把控、研发提效、成本控制。在会上,蚂蚁自研的代码大模型 CodeFuse 也正式宣布开源。
以下是演讲全文。
大家下午好,我是支付宝小程序云的负责人李铮,今天很高兴在外滩大会与大家做分享。
支付宝小程序云今年 7 月份也在上海做了公测发布,截止到现在和全国大概 700 多个合作伙伴达成了合作,支撑了几万个小程序平稳运行。
在服务整个支付宝生态合作伙伴的过程中我们发现,随着大模型智能化的技术趋势发展,越来越多商家、合作伙伴开始更加关注智能化的一些技术能够为他们带来什么样的增量。他们也非常关心小程序云的智能服务会带来什么新的能力,这也是我们近期重点思考和关注的内容,接下来主要围绕这些方面做一些分享。
首先,支付宝小程序云和支付宝生态用户关注的 AI 服务到底是什么样的。经过过去一段时间交流提炼,大家对四个方面非常关心:增长、提效、风险、成本。
大家最关心的是增长,因为增长是每个企业、服务商生存发展的重要内容,智能化到底能够帮助企业发展到什么程度,对具体的营销效果有哪些帮助,在场景里的应用效果是大家关注的核心,而不是模型本身。
在提效方面,能不能的把大模型能力快速的集成到商家应用服务中,让一个 idea 能很快能够落地实现,而不需要掌握大模型训练和算力供应。
风险成本方面,在支付宝商家生态里面,很多行业客户面临线上业务风险挑战。比如说像黑产、黄牛通过技术手段影响正常的业务运行,也包括技术故障、安全攻击方面的控制,能否更低成本的防控。
在我们看来,再厉害的模型、算法,没有很精准、很高效、很有价值的标准化数据也是无法发挥价值的。所以我们做的第一件事情是构建数据产品,也就是「增长分析」产品,它以插件形式插入到很多小程序当中。在插件背后是一套标准化行业模块,比如说点餐行业,我们将插件嵌入到点餐小程序中,形成数据分析,再围绕点餐行业特性形成一套分析报告,这个分析报告商家可以自己看,可以从中获得围绕增长的有用关键信息。
另外,我们知道支付宝是一个亿级用户的全民级 App,如果能将支付宝公域和商家私域数据做一个对接和整合混合运算,这样就能给商家围绕经营策略做一些建议,帮助商家更好在支付宝上做经营。
涉及到数据处理,如何确保数据隐私安全就是一个重要的命题,我们会大量用到支付宝这几年重点发展的隐私计算技术,去保障各方数据可用不可见,安全的产出价值。
商家在清楚整个经营状况之后,下一步是真正获取流量去增长。这时候就看能不能做好广告投放的智能化,让广告投放效果更加精准,让商家获取更加高质量的流量。支付宝有更多商家点位,像卡片、支付成功页、搜索等,商家优惠券、小程序的优惠信息都可以按需投放到点位里面。
如何让投放更加精准呢?
这里面会有很多关键技术,最核心的是公私域联合数据的建模。比如说,有一家成都的做蛋糕生意的客户,在支付宝基于智能广告做相应的投放,自己私域原本大概几千个用户,现在在支付宝公域流量里触达到了几万精准用户,这些用户就可以更好转化为商家自己的私域用户,通过一整套智能广告体系帮助它的交易量提升了 5 倍左右,GMV 提升 6 倍左右,这是对于数据化、智能化运营在智能广告投放方面的一个比较重要的解决方案。
完成了整个流量获取之后,下一步很重要的就是流量承接。比如说线下商家,你去买衣服一定会有一个导购员能够为你做相应的推荐,能够结合你的需求,给你推荐最合适的商品,最终促成转化。但在线上就不是如此,很多商家尝试做过一些智能导购,你问一些问题都是答非所问的,因为背后的技术都是过去沉淀的规则,如果你的问题不在范围内就无法给到很好的效果。
但是,这个时候自然语言的对话恰恰是自然语言大模型最合适的工作,所以把自然语言导购和大模型进行了结合。我们就构建了一个 智能导购插件,我们把它放在旅游导购、数码产品、商品导购的应用当中,作为一个插件接入到商家私域,就可以用大模型时代最先进的技术帮助大家实现更好的导购,促成交易转化。
这背后有很多很关键的技术,比如说,大模型的编排,因为直接使用大模型的对话能力有可能会发散,偏离主题,但我们今天只需要做一个导购,如果不加限制就无法很好的促成交易转换。所以用flowchain等大模型编排的技术约束大模型的输出,因为导购最终还是几个关键的节点和流程,比如说询问真实需求,围绕需求进一步细化,最终推荐出来商家真正有的产品,这是整个流程,提升成交的概率。
在大模型编排之下,很重要的是能够被大模型使用的商家私域数据,基于私域数据构建私域商品库,需要把很多商家私域商品进行一个向量化,让大模型基于向量化快速检索到和用户意图匹配的真正商品,通过高性能的向量数据库真正解决让大模型和商家私域的商品所紧密结合的关键问题。
再往下就是大模型本身的语言模型,结合行业场景数据的微调,让它能够更好满足大家回答专业性问题的效果。
比如在文旅行业,我们跟一个景区目前在合作,最终呈现的效果是你去咨询智能导购,它会围绕景区特性给你制定整个旅游路线。在旅游路线上的酒店、餐饮等相应周边进行相应推荐,并且整个过程能更好满足人的一些交互特性,就像一个导游一样。
前面更多讲了围绕增长的智能化工作。同时我们也发现在做好了这样一些围绕增长营销推荐工作之后,很多商家客户可能面临相应的风险,在支付宝体系下获得很多流量,最终可以获得交易转换。但是很多客户面临一个问题,会受到像黄牛、黑产、刷单、开奖找漏洞的情况影响,这些问题其实严重影响了很多商家的经营效果,因为花很多钱做营销,但最终没有转化为真实客户交易,这个影响是非常大的。
在这里面要解决的是非常难的一件事情。如果仅仅依靠商家自己的数据是很难辨别一个请求到底是真正的客户请求,还是一个黄牛的倒卖性质请求,所以我们也在思考怎么去解决这个问题。
我们的解法是把支付宝积累多年的整个安全风控科技在小程序云进行开放,可以基于支付宝自研的图智能、图计算实时分析,形成局部子图,识别黄牛团伙。我们和耐克、黄山景区做了合作,在非常短的时间之内就接入上线,实现实时的风控检测,帮助他们解决了大量的“黑灰产”的风险。
说完了整个风险控制、营销外,回过头来看一下小程序研发,因为业务要增长必须要有相应的系统上线,要做这个小程序,也需要研发更多的业务功能。
如何提升这块的效率呢?
我们的思考是,把蚂蚁内部整个智能研发体系在小程序云进行开放,我们起了名字叫做“CodeFuse”,核心就是代码大模型,包括网页端和业界主流的IDE插件、OpenAPI,这块最主要的功能就是帮助程序员提效。它的提效除了代码补全、代码解释常规功能外,在SQL生成、生成测试用例、代码bug修复等方面做了很多工作,都能够达到很好的效果。
目前蚂蚁集团、阿里集团内部有几千名工程师在使用 CodeFuse 辅助自己做代码研发。整个代码大模型蚂蚁集团一直在投入,在去年年初的时候就开始在探索智能研发工作到底怎么展开。随着今年大模型这波趋势,我们大概在今年 2 月份的时候开始投入更多资源,让更多工程师专门研发代码大模型。
可以看到有非常多的公司、企业、机构投入这方面的工作。我们的思考也是一样的,在代码大模型来临之后,我们有机会将整个软件工程做一个迭代升级,不仅仅是代码生成部分,其实整软件工程领域的方方面面都有机会做一次整体的提升。所以,我们会不断投入这个方向。
今天也是借着这个机会,向大家宣布 CodeFuse 代码大模型正式开源!(代码:GitHub;模型:Hugging Face 以及 魔搭社区 )现在已经放到了相应的站点上,只有把整个技术开源,与社区对接,让更多人使用它,才能解决整个软件研发领域各个环节的一些问题。
目前整个领域还是在初步阶段,写代码是没有问题的,而且整个能力在不断提升,但是真正解决软件工程各种各样的问题还有很长的路要走,我们也是抱着非常开放的心态和大家一起提升工程和技术。目前整个效果在humaneval代码评测集的Pass@1指标上已经达到了 74.4%,超过了 GPT4官网公布的 67%。
另外,借这样的机会跟大家介绍一下我们和 DCloud 达成了重要合作,它在小程序多端研发非常重要的一个研发平台,我们会和他们一起服务数百万的小程序开发者。这里面小程序云也会贡献云开发、云函数的功能,包括智能化代码生成功能,希望通过整个上下游的链路建设能够把技术带给更多的开发者。
最终在支付宝小程序云上除了智能营销、代码生成、智能风控等专门的一些专有领域的技术和产品外,支付宝小程序云的理念还是与客户一起,把我们的智能能力开放。因为商家也好,服务商也好,它需求的能力不仅仅是这几项,很多能力像文字识别、营业执照识别、菜单识别、图片生成等对大家来说都非常有帮助,比如生成一些小店菜品、营销图案、营销文本等。
所以,我们的理念是把整个支付宝内部这些年沉淀的智能化能力做梳理,围绕支付宝生态的需求做整体的开放,希望与合作伙伴一起,打造一个更加智能化的云服务,提升经营效率,提升营销效果,帮助企业更快更好的增长。
这就是我今天的分享,谢谢大家!