新聞資訊/News information
|
BloombergGPT來了BloombergGPT來了,要替代金融分析師,還是預防被ChatGPT替掉全球最大的金融數據服務公司彭博,已經訓練出了BloombergGPT,金融領域最大的自然語言模型(LLM)。 有不少華爾街人在社交媒體上發問:這是要干掉金融分析師嗎?其實,這也是彭博擔心自己被ChatGPT干掉。 彭博研究人員發布的模型論文稱,這是一個500 億參數的LLM,基于彭博豐富的金融數據源構建了一個3630 億個訓練標志(token)數據集,這可能是迄今為止最大的特定領域數據集,并且增加了來自通用數據集的 3450 億個標志。 研究人員在標準 LLM能力、開放金融能力和“預期用途”的內部能力上驗證了 BloombergGPT。這一混合數據集訓練產生的模型,在金融能力上的表現明顯優于現有模型,而一般能力上又不輸于通用 LLM 。 訓練采用了大模型BLOOM的架構,動用了512張40GB的A100GPU,在AWS上訓練了53天。除此之外,沒有公開更多的參數。而研究人員在論文中稱,也不打算公開。 在做金融領域大模型方面,彭博有著得天獨厚的稟賦,理應先吃螃蟹。作為一家金融數據和科技公司,40年來已經積累了海量的金融數據。專業、獨有、可信的優質數據都是現成的,這是其最大的優勢。下面是其數據集的構成。 彭博認為,自然語言處理(NLP)在金融科技領域越來越重要,擁有巨大的應用前景。金融NLP已經用于市場情緒分析、命名實體識別(NER)、新聞分類、問答等。盡管還是要完成這些任務,但是金融領域復雜性、名詞術語的專業性,讓彭博認為有必要開發一個金融領域的AI計算系統。 研究人員對這幾項任務進行了測試: 1,問答。ConvFinQA數據集是一個針對金融領域的問答數據集,包括從新聞文章中提取出的問題和答案,旨在測試模型對金融領域相關問題的理解和推理能力。 2,情緒分析。FiQA SA,用來測試英語金融新聞和社交媒體標題中的情感走向。 3,標題。對關于黃金商品領域的新聞標題進行分類。 4,情緒分析。金融短語庫數據集(FPB)包括來自金融新聞的句子情緒分類任務。 5,命名實體識別(NER),針對從提交給SEC的金融協議中收集金融數據,進行信用風險評估。 測試結果對照其他模型如下: 但研究人員似乎有意避開了與最強模型的對照,如GPT-4和PaLM。可以看出其最多可能達到 GPT-3 -3.5 之間的水平,在多語言多模態上可能差距明顯。另外,如果GPT-4開放微調功能,BloombergGPT還有優勢嗎? 彭博終端使用起來,有一套非常難記的查詢代碼,而BloombergGPT可以把自然語言轉化成查詢代碼。還能為彭博社記者建議新聞標題,在財經新聞相關事實和知識查詢的準確性方面,更是遠勝其他大模型。 BloombergGPT不僅是金融領域最大的模型,而且是特定領域的最大模型,從中可以看出領域模型和通用模型之爭 。難怪BloombergGPT一再強調,如果我們一樣大小,我金融功能無敵;如果通用模型比我大,我的通用功能也可以替代你。總之,用了BloombergGPT,就不必再用ChatGPT了。 免責聲明:本文來自騰訊新聞客戶端創作者,不代表騰訊網的觀點和立場。 上一篇三星被曝因ChatGPT泄露芯片機密!下一篇AI安全 |