一年一度的畢業季即將來臨,伴隨著莘莘學子踏入職場的熱潮,AI面試技術也迎來了前所未有的關注度,變得愈發炙手可熱。
權威媒體報道顯示,AI面試的應用場景在2023年中國網絡招聘市場中已占據超過三成的份額。更有招聘平臺在2024年春季校園招聘的調研中發現,超過半數的受訪應屆生都曾收到過來自企業的AI面試邀請,這標志著AI在招聘流程前端篩選環節的普及已成大勢所趨。
與眾多專注于單一行業企業用戶需求的AI小模型產品不同,AI在求職招聘領域展現出獨特的“雙邊市場”特性。其用戶群體同時覆蓋了B端(企業雇主)和C端(求職者),且兩端都蘊藏著巨大的市場需求潛力。對企業而言,AI面試官能顯著提升海量簡歷初篩和初步溝通的效率,降低招聘成本;對求職者來說,它提供了更便捷的初步展示機會和相對標準化的流程體驗。
然而,審視當前AI招聘與求職市場的發展階段,其表現可謂毀譽參半。用戶對相關產品的評價也呈現出明顯的兩極分化。尤其引人關注的是,不少求職者在社交平臺上直言不諱地“吐槽”,在AI面試過程中遭遇了“人工智障”般的尷尬體驗。他們反映,AI給出的面試題目往往顯得刻板、機械化,缺乏靈活性和深度,使得面試者難以充分展現自身的獨特優勢、思維深度和個人魅力,表達起來倍感吃力。
這些現象揭示了一個核心問題:盡管AI面試官在標準化、流程化處理和信息收集方面效率驚人,但在測評應聘者的“軟實力”維度——如心智成熟度、情緒穩定性、人格魅力、臨場應變能力以及深層次的價值觀匹配度等方面,其能力仍顯得捉襟見肘,力有不逮。這種局限性不僅存在于面試環節,更暴露出整個人才評估體系的深層缺陷。
對此,“中國造隱形冠軍”評選評委、前華為全球招聘負責人、深圳百森咨詢創始人冉濤一針見血地指出:“當下,我們大部分人對AI的應用,可能只是給它套了個馬甲或戴了個帽子,其內核運作邏輯并未發生根本性變革。試圖用AI完全取代真人面試官本身或許就是個偽命題。”他進一步解釋道,“選對一個人,關鍵在于‘好素質+好情緒’的完美結合。AI面試或許能高效地解決對‘好素質’(如知識、技能、過往行為模式)的初步篩選,但人與人之間互動所產生的微妙情緒價值、化學反應以及基于直覺的綜合判斷,是冰冷的算法目前難以復刻和提供的。”
冉濤的見解,直接指向了人才測評工具本身的效度和信度問題。公開的研究數據令人咋舌:現實中竟有高達87%的人才測評工具存在不同程度的隱蔽性測量失真。這就像試圖用體溫計去測量血壓,工具本身的錯配必然導致結果的偏差。那些標榜精準的人才測試工具,其潛在的后果可能是將一位極具潛力的人才誤判為“殘次品”,造成企業和個人的雙重損失。
傳統人才評估方法:觸及效能天花板
現實中不乏因評估工具或方法失當而導致的招聘失誤案例。例如,某知名互聯網大廠曾一度迷信用“快速拼圖能力”作為篩選程序員的核心標準,結果招來的員工中不乏“密室逃脫”高手,但實際編程工作中產生的代碼Bug數量反而飆升了40%。直到該企業引入了嚴謹的“預測效度”驗證機制,才恍然大悟:真正與編程水平高度關聯的預測因子,并非拼圖速度,而是候選人長期堅持撰寫技術博客所體現出的持續學習熱情、知識沉淀能力與問題解決思路的清晰度。
這里提到的“效度”,是心理測量學中的核心概念,它衡量的是一個測評工具或方法能否真正準確地捕捉到它想要測量的特質或能力。簡單說,就是測量結果與目標考察內容的吻合程度——吻合度越高,效度越高。它就像X光片,能夠透視出測評工具內在結構的合理性與可靠性。
在冉濤看來,當前被廣泛使用的傳統人才評估方法——無論是依賴主觀經驗的面試、基于紙面信息的簡歷篩選,還是許多看似科學的傳統測評工具——其預測效度均已觸及明顯的天花板。他指出,尤其當僅依賴單一的人力評估工具時,其對未來工作績效的預測力極限大約只能在0.3到0.5的區間內徘徊。這意味著,僅憑這些工具得出的評估結果,最多只能解釋崗位實際績效表現中9%到25%的變異原因,還有超過75%的績效差異迷霧重重,未被有效揭示。
以下表格中是人才評估手段的效度對比: