華爾街見(jian)聞 2024-07-16 11:41:51
12日,Microsoft發(fa)布了一個新(xin)的(de)大(da)型語言模型,計劃為Excel、谷歌Sheets等電子表(biao)格應用程序開發(fa)全新(xin)的(de)AI大(da)語言模型--SpreadsheetLLM。
Microsoft在(zai)論文指出,SpreadsheetLLM作(zuo)為一款全新的(de)AI模型,將廣泛使(shi)用(yong)于理解并處理復雜的(de)電(dian)子表格數據。
SpreadsheetLLM具有改變電子表格數據管理(li)和(he)分析的(de)潛力,為更智能和(he)高效的(de)用(yong)戶交互鋪平了(le)道路。
這或(huo)許會(hui)讓會(hui)計師(shi)和數據(ju)分析師(shi)們(men)(men)對他們(men)(men)的未來工(gong)作(zuo)前(qian)景(jing)感(gan)到擔憂。網(wang)友們(men)(men)在社交平臺X上調侃,認為“凱倫的工(gong)作(zuo)很快就會(hui)被人工(gong)智能取代”。
“凱倫可能很快就會失業”
研究人員指(zhi)出(chu),當(dang)前的電子表(biao)格(ge)應(ying)用(yong)(yong)程序功能豐富,在(zai)布局(ju)和格(ge)式(shi)方面為(wei)用(yong)(yong)戶提(ti)供了大量選擇(ze),這使得傳統的AI大語(yu)言模型難以在(zai)電子表(biao)格(ge)處理方面發(fa)揮作(zuo)用(yong)(yong)。而(er)(er)SpreadsheetLLM就(jiu)是專門為(wei)電子表(biao)格(ge)應(ying)用(yong)(yong)而(er)(er)設(she)計的AI模型。
微軟還開發(fa)了(le)SheetCompressor(壓(ya)縮電(dian)子(zi)表格(ge))工具,以幫(bang)助(zhu)SpreadsheetLLM更好地(di)理解(jie)和處理電(dian)子(zi)表格(ge)數據。
研(yan)究人員(yuan)稱,SpreadsheetLLM的潛在(zai)應用(yong)非常廣泛,從自(zi)動(dong)執(zhi)行日常數據分(fen)析任(ren)務(wu),到提(ti)(ti)供基于電子表格數據的智能見解和建議。例如,SpreadsheetLLM可用(yong)于自(zi)動(dong)生成財務(wu)報告、識別數據中的異(yi)常或趨(qu)勢、為客戶提(ti)(ti)供個性化的產品(pin)或服務(wu)推薦(jian)等(deng)。
因此,SpreadsheetLLM有可(ke)能徹底改變(bian)企業處理(li)數據的方式。
一(yi)位(wei)用戶(hu)聲稱:“正(zheng)如我們所(suo)知,能夠(gou)編寫(xie)SQL的(de)LLM將扼殺整個(ge)數據工(gong)程行業(ye)。”
另一位寫道,“SaaS陷入了深(shen)(shen)深(shen)(shen)的麻(ma)煩。”
“這對金融界(jie)來說將產生巨大(da)影響”
賓夕法(fa)尼(ni)亞大學沃頓商學院副教授伊桑·莫利(li)克(Ethan Mollick)在推特上寫(xie)道:“這再次表明LLM很快就(jiu)能處理結構(gou)(gou)化(hua)和非結構(gou)(gou)化(hua)電子(zi)(zi)表格數據(ju)。這將解鎖許多用例(li)(預(yu)測、財務、估值等(deng)),并且擁有電子(zi)(zi)表格真(zhen)實(shi)來源(yuan)往往會減少(shao)幻覺。”
SpreadsheetLLM如何工作?
SpreadsheetLLM通過將電子表格數據編碼為大(da)型(xing)語(yu)言模型(xing)(LLM)可以理(li)解的格式,從而使LLM能夠對電子表格數據進(jin)行推理(li)、回(hui)答有關數據的問題,甚至根據自(zi)然語(yu)言提示(shi)生(sheng)成新的電子表格。
SpreadsheetLLM的核心是“SheetCompressor”框(kuang)架,該框(kuang)架可以有效地壓縮和編(bian)碼電子表格數(shu)據,使其更(geng)易于LLM處理。SheetCompressor由三個(ge)模塊組(zu)成:
▲基(ji)于結構(gou)(gou)錨點的壓(ya)縮:在整個電(dian)子表格中放置“結構(gou)(gou)錨點”,以幫助LLM理解數據(ju)結構(gou)(gou)。
▲逆索(suo)引翻(fan)譯:將電子表格(ge)轉換為更緊(jin)湊的格(ge)式,并(bing)消除冗余數據。
▲數(shu)據格式感知聚合:根據數(shu)字格式和數(shu)據類型(xing)對相鄰單元格進行分組。
SHEETCOMPRESSOR框架(jia)的插圖(圖片:Microsoft)
Microsoft稱,SpreadsheetLLM顯(xian)著(zhu)提高了電子表格(ge)檢測任務的(de)性能(neng),在GPT4的(de)上(shang)下(xia)文學習(xi)設置(zhi)中比(bi)普通方(fang)法(fa)高出(chu)25.6%,使用詞元(yuan)(token)的(de)成本降低了96%,并(bing)能(neng)提供(gong)更(geng)好的(de)處理結果。
目(mu)(mu)前(qian),Microsoft還(huan)沒有公布(bu)何時向(xiang)公眾發布(bu)SpreadsheetLLM的(de)(de)消息。該論(lun)文指出,該模型仍有一(yi)些限(xian)(xian)制,如對于復雜或結(jie)構化程(cheng)度(du)高的(de)(de)數據,其理解能(neng)力(li)仍然有限(xian)(xian);SheetCompressor目(mu)(mu)前(qian)還(huan)不能(neng)壓縮(suo)包含自然語言的(de)(de)單元格等等。
(作者 張雅琦(qi))
封面圖片來源:視覺中(zhong)國-VCG41N1472123004
特(te)別(bie)提(ti)醒:如果我們使用了您的圖片,請作者與本站聯系索取(qu)稿酬。如(ru)您不希望作(zuo)品(pin)出現在本站,可聯(lian)系我們(men)要求撤(che)下您的作(zuo)品(pin)。
歡迎關注每日經濟新聞APP