亚马逊开发大型语言模型 LLM 准确率胜过 ChatGPT

运维资讯 2023-07-21 张二河手机阅读

OpenAI 在 GPT-3.5 模型下进行一系列进行微调，在 2022 年初完成训练，年末进一步推出的 ChatGPT 模型引发热议，带动全球关注AI 热潮。

而亚马逊新开发的大型语言模型 Large Language Models，LLM，宣称只用 10 亿个参数建立模型，准确率比起最先进的GPT-3 高出 16%。

亚马逊近期发布一篇名为《Multimodal Chain-of-Thought Reasoning in Language Models》的论文。

亚马逊资深产品经理 Assaf Yablon 指出，其 LLM 经过 10 亿个参数训练，达到91.68% 的惊人准确率。

相较目前火热的 GPT-3，准确率则是75.17%，亚马逊 LLM 的准确率比 GPT-3 高出16%，这个令人印象深刻的成就在 Chain-of-Thought（CoT）帮助达成。

亚马逊 LLM 推论答案的流程

亚马逊的做法是透过两阶段架构整合语言文字和视觉图像的方式，该架构区分成基本理由和推断答案。

如此一来，答案推论过程可以受惠于多模型资讯。简而言之，亚马逊的 LLM 能够根据更广泛的知识产生更有洞察力的基本理由和答案。

在这波AI 竞赛中，亚马逊并没有打算缺席，其 LLM 的架构不算复杂且已完整开源。想像如能进一步开发成类似 ChatGPT 的对话式 AI。

可以运用在亚马逊电商客服上，解决消费者在 App 操作、付款、到货等问题，也能推荐商品，改善整个购物体验。

此外，由于架构整合文字和图像，或许也能帮助品牌供应商或第三方卖家产生合适的商品文案。

运维资讯 2023-08-22 张二河

NASA Perseverance Rover毅力号的4个任务

运维资讯 2023-07-21 张二河

运维资讯 2024-02-28 张二河

LLM Serving有效吞吐量的最大化实现

运维资讯 2024-05-31 张二河

运维资讯 2024-03-14 张二河