评估-每日运维

硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

研究称 AI 的涌现能力来自于评估模式的错误 GPT-3 等大语言模型（LLM）随着规模的扩大而表现出意想不到的 “涌现” 能力。然而，有研究人员认为，这是测量错误的后果，而不是奇迹般的能力。他们认为，LLM 是概率模型，它们并不像有些人认为的那样拥有任何一种有知觉的智能。该团队观察到，大多数（92%）检测到的意外行为是在通过 BIG-Bench 评估的任务中发现的。其中一项测试是精确字符串匹配，

linux中国 2024-07-16 大猫

AIGC生图的自动化质量评估

AIGC生图需要进行质量评估以确保满足一定标准。这一评估过程非常重要，因其关系到内容的专业性、商业价值以及顾客的满意度。然而，传统的手动评估方式既耗时又耗力，且容易受到主观偏差的影响，导致评估成本高昂而效果不佳。目前对基模型的优化效果的全面评测，包含了十多个维度，全部标注需要2～4个人日。如果涉及模型整体效果的迭代，则需要更多的人力投入。鉴于此，自动化的质量评估方法成为一种迫切需求。通过采用算法

运维资讯 2024-06-12 贤蛋大眼萌

Go语言：利用Govaluate构建规则配置引擎

Govaluate简介 Govaluate 是一个 Go 语言的表达式评估库，允许你在运行时动态评估字符串表达式。虽然它不是一个完整的规则引擎，但可以用于实现一些简单的规则评估功能。以下是一个简单示例，展示如何使用 Govaluate：首先，你需要导入 Govaluate 库： import "github.com/Knetic/govaluate" 然后，你可以编写代码进行表达式评估： pa

开发运维 2024-05-27 张二河

大促活动OceanBase保障及应急预案

背景一年一度的双11大促又到了，每个使用OceanBase的电商客户都在积极备战，今天我简单介绍针对一次大促活动，在OB数据库层面如何进行保障以及常见的应急预案供大家参考。业务目标每次大促活动前，业务层面一般都会设定一个目标保障值，类似于峰值订单量、全天订单总量等。这个是业务层面的一个指标，DBA需要根据实际的场景，将这个指标分解，得到每个数据库集群/租户对应的TPS和QPS，然后再根据这个

数据运维 2024-05-07 泡泡

唐刘：关于产品质量的思考如何评估质量

每次 TiDB 发版本的时候，我一定会被前线业务部门或者客户问到的一句话就是『这个版本质量好不好？』，每次遇到这种问题，我都会非常的无奈，因为我很难给出让人满意的答案。不过这个问题被问的多了，我自然也会思考，到底如何来评估一个版本质量的好坏？在开始之前，仍然有如下的几个声明：我说的不一定是对的。我也会定期刷新我自己的认知。这仅仅只是我自己关于质量的思考，是我自己在 PingCAP 的经验总结

数据运维 2024-05-07 醒在深海的猫

Java函数的安全性评估标准有哪些？

java 函数安全性评估标准至关重要，用于识别潜在漏洞并制定缓解措施：输入验证：防止注入攻击和恶意输入；输出编码：防止跨站点脚本 (xss) 攻击；异常处理：安全处理异常，防止攻击者访问敏感信息；访问控制：防止未经授权的访问和数据泄露；数据加密：保护敏感数据免遭未经授权的访问。 Java 函数的安全性评估标准对 Java 函数进行安全性评估至关重要，以确保应用程序的完整性。评估标准可帮助开发人员

开发运维 2024-04-21 张二河