OpenAI 在 GPT-3.5 模型下进行一系列进行微调,在 2022 年初完成训练,年末进一步推出的 ChatGPT 模型引发热议,带动全球关注AI 热潮。
而亚马逊新开发的大型语言模型 Large Language Models,LLM,宣称只用 10 亿个参数建立模型,准确率比起最先进的GPT-3 高出 16%。
亚马逊近期发布一篇名为《Multimodal Chain-of-Thought Reasoning in Language Models》的论文。
亚马逊资深产品经理 Assaf Yablon 指出,其 LLM 经过 10 亿个参数训练,达到91.68% 的惊人准确率。
相较目前火热的 GPT-3,准确率则是75.17%,亚马逊 LLM 的准确率比 GPT-3 高出16%,这个令人印象深刻的成就在 Chain-of-Thought(CoT)帮助达成。
亚马逊的做法是透过两阶段架构整合语言文字和视觉图像的方式,该架构区分成基本理由和推断答案。
如此一来,答案推论过程可以受惠于多模型资讯。简而言之,亚马逊的 LLM 能够根据更广泛的知识产生更有洞察力的基本理由和答案。
在这波AI 竞赛中,亚马逊并没有打算缺席,其 LLM 的架构不算复杂且已完整开源。想像如能进一步开发成类似 ChatGPT 的对话式 AI。
可以运用在亚马逊电商客服上,解决消费者在 App 操作、付款、到货等问题,也能推荐商品,改善整个购物体验。
此外,由于架构整合文字和图像,或许也能帮助品牌供应商或第三方卖家产生合适的商品文案。