OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力

2024年 7月 15日 41.8k 0

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。

OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力-1

内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。

据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。

OpenAI 还计划让 Strawberry 有能力执行「长线任务」(long-horizon tasks, LHT),即需要提前计划并在较长时间内执行一系列操作的复杂任务。

内部文件提到,OpenAI 正在创建和评估所谓的「深度研究」数据集,并希望其 AI 模型能够在计算机助理(computer-using agent, CUA)的帮助下自主浏览互联网进行研究,并且完成软件和机器学习工程师的工作。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论