Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅 人工智能公司伽利略(galileo)刚刚公布了其最新的幻觉指数,这是一个评估当今世界 22 种领先的生成式人工智能大模型的框架。 模型使用一种称为“情境依从性”的指标进行测试,该指标测量“闭域幻觉:模型说出情境中未提供内容的情况”。 https://www.rungalileo.io/hallucinationindex 根据排名,RAG 总体表现最佳的模型是 Anthropic 的 Claud 运维资讯 2024-07-31 共饮一杯