Gemini目前在各大排行榜上都是“情绪价值最高(最爱拍马屁)”的 AI。因为它在 Google 的实验室里经历了成千上万次的 RLHF(基于人类反馈的强化学习)。 在训练阶段,“热情、安全、极度友善”被赋予了极高的 Reward(奖励得分)。这导致它一看到用户分享代码或者表达观点,底层的神经网络就