AI在算法招聘中的自我偏好:经验证据和见解

一篇 arXiv 论文研究算法招聘里的「AI 自我偏好」:当筛选简历的模型遇到 AI 润色过的简历,它会更喜欢和自己口味相近的文本。

研究发现

实验设计很巧:同样资历的候选人材料,一组保持人类原文,一组用 LLM 润色,再让模型来筛选。结果筛选模型系统性地偏好 AI 润色过的版本,哪怕实质内容相同。机制不难猜,模型对「自己那种」流畅、规整、高频词分布的文本天然打高分。论文称之为自我偏好(self-preference),并给出了跨模型的证据:各家模型都有这毛病,对自家生成的文本偏心得更明显。

对招聘双方的含义

这个发现把招聘军备竞赛的荒诞推到了明面:求职者不用 AI 润色简历,会在算法初筛里吃暗亏;人人都用,筛选层比较的就只是谁的提示词好,简历彻底失去信号价值。对企业的警示更严肃,自动化筛选不仅有老生常谈的人口统计偏见,还有这种全新的文本来源偏见,合规审计的清单又得加一行。短期内务实的建议是别让模型独自做淘汰决定,初筛权重调低、人工复核保留,至少等偏见有解再说。

via: Hacker News