今年以來(lái),AI大模型迎來(lái)高熱度,對經(jīng)濟社會(huì )發(fā)展產(chǎn)生深遠影響,也面臨著(zhù)復雜挑戰。當前,AI發(fā)展所需要的語(yǔ)料數據仍不充足,且獲取成本往往較高,數據多為“小樣本”,數據量也無(wú)法滿(mǎn)足AI深度學(xué)習的要求。
為促進(jìn)AI大模型的深入發(fā)展,基于人民日報及人民網(wǎng)的媒體資源優(yōu)勢,人民數據打造了新聞數據、問(wèn)答數據等語(yǔ)義語(yǔ)料庫,相關(guān)數據量達到了近3億條。
該語(yǔ)義語(yǔ)料庫面向人工智能大模型、通用人工智能、智能互聯(lián)網(wǎng)等應用場(chǎng)景,提供高質(zhì)量的語(yǔ)料生產(chǎn)、定制、供給服務(wù),是支持人工智能行業(yè)安全可持續發(fā)展的剛需、急需資源庫、種子庫、基因庫。

針對當前大模型普遍回答不了、回答不好卻又必須直面、不容回避的重大問(wèn)題、敏感問(wèn)題、疑難問(wèn)題、復雜問(wèn)題,該語(yǔ)義語(yǔ)料庫梳理了1萬(wàn)余個(gè)重點(diǎn)問(wèn)題,并精心編撰建成優(yōu)質(zhì)問(wèn)答語(yǔ)料庫,助力解決大模型在語(yǔ)料方面的剛性需求、緊急需求、安全需求。
AI大模型的發(fā)展需要各界聯(lián)合起來(lái),共同努力。人民數據期待與各界共同推動(dòng)AI大模型的發(fā)展,歡迎咨詢(xún)。