News
研究发现,温暖的模型在推广阴谋论、提供不正确的医疗建议和事实信息方面,表现出更高的错误率。以及,当用户表达悲伤情绪并陈述错误信念时,温暖的模型更可能去验证这些错误的信念。
在 IFEval 指令遵循基准里,指令调优版 Gemma 3 270M 拿到 51.2%:胜过 SmolLM2 135M Instruct(44.8%),压过 Qwen 2.5 0.5B Instruct(49.1%),逼近部分十亿级中型模型。
说实话,过去两年我听了太多"AI投资看不到回报"的抱怨。75%的企业都在说AI没有带来预期收益,只有4%的公司从AI中创造了实质价值。但现在,情况开始发生转变。 Confluent的故事更加震撼。他们的IT技术人员以前处理每张客服工单需要花10分钟去找相关信息。现在通过AI搜索,几乎不需要时间就能找到答案。
Some results have been hidden because they may be inaccessible to you
Show inaccessible results