亚马逊开发大型语言模型 LLM 准确率胜过 ChatGPT

2023年 7月 21日 52.3k 0

OpenAI 在 GPT-3.5 模型下进行一系列进行微调,在 2022 年初完成训练,年末进一步推出的 ChatGPT 模型引发热议,带动全球关注AI 热潮。

而亚马逊新开发的大型语言模型 Large Language Models,LLM,宣称只用 10 亿个参数建立模型,准确率比起最先进的GPT-3 高出 16%。

亚马逊近期发布一篇名为《Multimodal Chain-of-Thought Reasoning in Language Models》的论文。

亚马逊资深产品经理 Assaf Yablon 指出,其 LLM 经过 10 亿个参数训练,达到91.68% 的惊人准确率。

相较目前火热的 GPT-3,准确率则是75.17%,亚马逊 LLM 的准确率比 GPT-3 高出16%,这个令人印象深刻的成就在 Chain-of-Thought(CoT)帮助达成。

亚马逊 LLM 推论答案的流程

亚马逊的做法是透过两阶段架构整合语言文字和视觉图像的方式,该架构区分成基本理由和推断答案。

如此一来,答案推论过程可以受惠于多模型资讯。简而言之,亚马逊的 LLM 能够根据更广泛的知识产生更有洞察力的基本理由和答案。

在这波AI 竞赛中,亚马逊并没有打算缺席,其 LLM 的架构不算复杂且已完整开源。想像如能进一步开发成类似 ChatGPT 的对话式 AI。

可以运用在亚马逊电商客服上,解决消费者在 App 操作、付款、到货等问题,也能推荐商品,改善整个购物体验。

此外,由于架构整合文字和图像,或许也能帮助品牌供应商或第三方卖家产生合适的商品文案。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论