丰满少妇,久久99精品人妻一区二区,亚洲综合视频在线,亚洲人成电影在线网址

云服務(wù)

熱門(mén)搜索: 防爆監(jiān)控 電動(dòng)機(jī) 防爆暖通 防爆風(fēng)機(jī)

首頁(yè) 行業(yè)資訊 政策解讀 電商會(huì)議 人物觀點(diǎn) 電商數(shù)據(jù) 電商干貨 電商報(bào) 博文資訊 客戶庫(kù) 企業(yè)庫(kù)
首頁(yè)>新聞詳情

人民日?qǐng)?bào) | 建設(shè)高質(zhì)量數(shù)據(jù)集,讓人工智能更聰明(新視點(diǎn))

2025年5月27日 來(lái)源:防爆云平臺(tái)--防爆產(chǎn)業(yè)鏈服務(wù)平臺(tái) 防爆空調(diào) 防爆電氣 防爆電機(jī) 防爆風(fēng)機(jī) 防爆通訊 瀏覽 171 次 評(píng)論 0 次

什么是高質(zhì)量數(shù)據(jù)集?簡(jiǎn)單來(lái)說(shuō),就是高價(jià)值、高密度、標(biāo)準(zhǔn)化的數(shù)據(jù)。

“數(shù)據(jù)之于大模型,就像石油之于汽車(chē)。原油只有經(jīng)過(guò)一系列復(fù)雜的過(guò)程煉化成汽油后,才能供汽車(chē)使用。同樣,海量原始數(shù)據(jù)需要經(jīng)過(guò)‘煉化’形成高質(zhì)量數(shù)據(jù)集,才能助力大模型精準(zhǔn)學(xué)習(xí)數(shù)據(jù)特征與規(guī)律,有效提升其對(duì)不同場(chǎng)景和任務(wù)的適應(yīng)能力?!敝袊?guó)信息通信研究院副院長(zhǎng)魏亮告訴記者,數(shù)據(jù)集的質(zhì)量影響人工智能的“智商”,近期發(fā)布的深度求索系列模型訓(xùn)練中,大量使用了高質(zhì)量推理數(shù)據(jù)集,凸顯了高質(zhì)量數(shù)據(jù)的重要性,“大模型與垂直領(lǐng)域深度融合,同樣也需高質(zhì)量數(shù)據(jù)集的支撐?!?

建設(shè)高質(zhì)量數(shù)據(jù)集,有關(guān)方面在積極行動(dòng)。國(guó)家數(shù)據(jù)局等17部門(mén)聯(lián)合印發(fā)的《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》提出,“推動(dòng)科研機(jī)構(gòu)、龍頭企業(yè)等開(kāi)展行業(yè)共性數(shù)據(jù)資源庫(kù)建設(shè),打造高質(zhì)量人工智能大模型訓(xùn)練數(shù)據(jù)集”。第八屆數(shù)字中國(guó)建設(shè)峰會(huì)上,國(guó)務(wù)院國(guó)資委發(fā)布首批10余個(gè)行業(yè)、30項(xiàng)央企人工智能行業(yè)高質(zhì)量數(shù)據(jù)集,涵蓋了電網(wǎng)調(diào)度AI負(fù)荷預(yù)測(cè)數(shù)據(jù)集、核電SPV設(shè)備健康診斷、運(yùn)行異常及故障預(yù)測(cè)數(shù)據(jù)集、金融大模型數(shù)據(jù)集等。

“隨著基礎(chǔ)模型開(kāi)源態(tài)勢(shì)的形成,各方在算力和模型算法層面的差距正在不斷收窄,數(shù)據(jù)要素價(jià)值更加凸顯,已成為人工智能競(jìng)爭(zhēng)的核心領(lǐng)域。”國(guó)務(wù)院國(guó)資委規(guī)劃發(fā)展局副局長(zhǎng)胡武婕表示,要推動(dòng)行業(yè)高質(zhì)量數(shù)據(jù)集加速匯聚共享,為人工智能產(chǎn)業(yè)提供充足“養(yǎng)分”,從而持續(xù)進(jìn)行不同場(chǎng)景的訓(xùn)練優(yōu)化,推動(dòng)基礎(chǔ)模型在千行百業(yè)落地應(yīng)用。

目前,高質(zhì)量數(shù)據(jù)集建設(shè)還存在不少挑戰(zhàn)。魏亮說(shuō),一方面,行業(yè)大模型對(duì)數(shù)據(jù)的需求多樣,不同行業(yè)部門(mén)對(duì)模型場(chǎng)景數(shù)據(jù)的需求各不相同,增加了數(shù)據(jù)處理和管理的復(fù)雜度。另一方面,在行業(yè)大模型的實(shí)際建設(shè)中,對(duì)于構(gòu)建和采買(mǎi)的數(shù)據(jù)沒(méi)有統(tǒng)一衡量標(biāo)準(zhǔn),不同行業(yè)、不同數(shù)據(jù)源的數(shù)據(jù)完整性和準(zhǔn)確性可能參差不齊,影響了大模型的訓(xùn)練效果和預(yù)測(cè)準(zhǔn)確性,造成訓(xùn)練資源浪費(fèi)。

4月30日,《高質(zhì)量數(shù)據(jù)集建設(shè)指南(征求意見(jiàn)稿)》發(fā)布。全國(guó)數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出,將強(qiáng)化標(biāo)準(zhǔn)引領(lǐng),分三類(lèi)建設(shè)高質(zhì)量數(shù)據(jù)集:一類(lèi)為“通識(shí)數(shù)據(jù)集”,包含面向社會(huì)公眾、無(wú)需專(zhuān)業(yè)背景即可理解的通用知識(shí),主要用于支撐通用模型落地應(yīng)用;一類(lèi)為“行業(yè)通識(shí)數(shù)據(jù)集”,包含面向行業(yè)從業(yè)人員、需要一定專(zhuān)業(yè)背景才能理解的行業(yè)領(lǐng)域通用知識(shí),主要用于支撐行業(yè)模型落地應(yīng)用;一類(lèi)為“行業(yè)專(zhuān)識(shí)數(shù)據(jù)集”,包含面向特定業(yè)務(wù)場(chǎng)景相關(guān)人員、需要較深的專(zhuān)業(yè)背景才能理解的行業(yè)領(lǐng)域?qū)I(yè)知識(shí),主要用于支撐業(yè)務(wù)場(chǎng)景模型落地應(yīng)用。

國(guó)家數(shù)據(jù)局副局長(zhǎng)夏冰表示,數(shù)據(jù)集的質(zhì)效提升是人工智能賦能實(shí)體經(jīng)濟(jì)的“催化劑”,下一步,國(guó)家數(shù)據(jù)局將構(gòu)建部際聯(lián)通、央地協(xié)同的工作機(jī)制,推動(dòng)高質(zhì)量數(shù)據(jù)集標(biāo)準(zhǔn)體系研究,促進(jìn)數(shù)據(jù)、技術(shù)、場(chǎng)景對(duì)接,構(gòu)建多元協(xié)同的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài),夯實(shí)人工智能發(fā)展數(shù)據(jù)根基

我來(lái)說(shuō)兩句
人參與 丨 評(píng)論0條)
圖標(biāo)
注冊(cè) 登錄    
評(píng)論列表
每頁(yè) 10 條,共 0 條

品牌商品