谷歌新規引擔憂:消息稱外包人員被迫評估自己不擅長的Gemini回復
12 月 19 日消息,據 TechCrunch 報道,谷歌針對其大型語言模型 Gemini 回復的外包評估流程進行了一項調整,引發了外界對其在敏感領域信息準確性的擔憂。這項調整要求外包評估員不得再像以往那樣,因自身專業知識不足而跳過某些特定的評估任務,這或將導致 Gemini 在醫療保健等高度專業性領域的信息輸出出現偏差。
為了改進 Gemini,谷歌與其外包公司日立旗下的 GlobalLogic 合作,由后者雇傭的合同工負責評估人工智能生成的回復,評估標準包括“真實性”等因素。此前,如果評估員認為某個問題超出了自身專業領域,例如一個關于心臟病學的專業問題,而評估員本身并無相關科學背景,他們可以選擇“跳過”該回應,從而避免評估針對該提示(prompt)的人工智能回復。
然而,上周 GlobalLogic 宣布了一項來自谷歌的變更:評估員不得再以缺乏專業知識為由跳過任何提示。內部通信顯示,此前的指導方針是:“如果您沒有評估此提示所需的關鍵專業知識(例如編碼、數學),請跳過此任務。”而新的指導方針則改為:“您不應跳過需要特定領域知識的提示。”取而代之的是,評估員需要“評估您理解的提示部分”,并注明自己缺乏相關領域知識。
這項變更引發了人們對 Gemini 在某些主題上準確性的擔憂,因為現在評估員有時需要評估一些他們完全不熟悉的、高度專業的技術性人工智能回復,例如關于罕見疾病的問題。一位合同工在內部通信中表示:“我原以為跳過的目的是通過將其交給更專業的人來提高準確性?”
根據新的指導方針,評估員現在只能在兩種情況下跳過提示:一是提示或回復“完全缺失信息”,二是提示包含需要特殊同意書才能評估的有害內容。
這項新規的實施,意味著一些對專業性要求極高的領域,例如醫療健康等,將由缺乏相關背景知識的評估員進行評估,這無疑增加了 Gemini 輸出不準確信息的風險。外界擔憂,此舉可能會對用戶造成誤導,尤其是在涉及健康等重要問題時,不準確的信息可能會帶來嚴重后果。
截至IT之家發稿時,谷歌尚未回應相關報道。
【來源: IT之家 】