2023-07-13 14:12:30
當地時間7月12日(ri),Google和DeepMind的(de)(de)(de)科(ke)研人員在(zai)《自然》雜志上發表一項研究,提(ti)出了(le)MultiMed QA評估基(ji)準,用(yong)于(yu)評測大語言模型在(zai)臨床知識方面的(de)(de)(de)表現(xian)。結果研究人員發現(xian),大語言模型構建的(de)(de)(de)AI醫生在(zai)很(hen)多方面與(yu)人類醫生相當。
谷歌的研(yan)究(jiu)人員表示(shi),這項(xiang)技(ji)術不會威脅到全科醫(yi)(yi)生的工作(zuo),但未(wei)來可能可以用于(yu)醫(yi)(yi)療求助(zhu)熱(re)線(xian)。
研(yan)究人(ren)員提出一個評(ping)(ping)估基準來評(ping)(ping)測(ce)大語言模型在臨床(chuang)知識方面的(de)(de)(de)表(biao)現,在引(yin)入指令提示調整后,由此產生(sheng)(sheng)的(de)(de)(de)模型Med-PaLM表(biao)現令人(ren)鼓舞:92.6%的(de)(de)(de)長篇答(da)(da)案(an)符合科學共識,與臨床(chuang)醫(yi)生(sheng)(sheng)生(sheng)(sheng)成的(de)(de)(de)答(da)(da)案(an)(92.9%)相當;5.9%的(de)(de)(de)答(da)(da)案(an)被評(ping)(ping)為可能導致有(you)害(hai)結果,與臨床(chuang)醫(yi)生(sheng)(sheng)生(sheng)(sheng)成的(de)(de)(de)答(da)(da)案(an)(5.7%)的(de)(de)(de)結果相似。(澎(peng)湃新聞(wen))
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如(ru)您不希望作品出現在本站,可聯系我(wo)們要求撤下您的作品。
歡迎(ying)關注每日經(jing)濟(ji)新聞(wen)APP