霽彩華年,因夢同行—— 慶祝深圳霽因生物醫(yī)藥轉(zhuǎn)化研究院成立十周年 情緒益生菌PS128助力孤獨(dú)癥治療,權(quán)威研究顯示可顯著改善孤獨(dú)癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準(zhǔn)血型 守護(hù)生命 腸道超聲可用于檢測兒童炎癥性腸病 迷走神經(jīng)刺激對抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調(diào)節(jié) 胃食管反流病患者耳鳴風(fēng)險(xiǎn)增加 間質(zhì)性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語言能力可提高自閉癥兒童的認(rèn)知能力 科學(xué)家揭示人類與小鼠在主要癌癥免疫治療靶點(diǎn)上的驚人差異 利用正確的成像標(biāo)準(zhǔn)改善對腦癌結(jié)果的預(yù)測 地中海飲食通過腸道細(xì)菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長得快 物質(zhì)的使用會改變大腦的結(jié)構(gòu)嗎 飲酒如何影響你的健康 20個(gè)月,3大平臺,300倍!元育生物以全左旋蝦青素引領(lǐng)合成生物新紀(jì)元 從技術(shù)困局到創(chuàng)新錨點(diǎn),天與帶來了一場屬于養(yǎng)老的“情緒共振” “華潤系”大動作落槌!昆藥集團(tuán)完成收購華潤圣火 十七載“冬至滋補(bǔ)節(jié)”,東阿阿膠將品牌營銷推向新高峰 150個(gè)國家承認(rèn)巴勒斯坦國意味著什么 中國海警對非法闖仁愛礁海域菲船只采取管制措施 國家四級救災(zāi)應(yīng)急響應(yīng)啟動 涉及福建、廣東 女生查分查出608分后,上演取得理想成績“三件套” 多吃紅色的櫻桃能補(bǔ)鐵、補(bǔ)血? 中國代表三次回?fù)裘婪焦糁肛?zé) 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學(xué)盛會,彰顯科研實(shí)力 圣美生物:以科技之光,引領(lǐng)肺癌早篩早診新時(shí)代 神經(jīng)干細(xì)胞移植有望治療慢性脊髓損傷 一種簡單的血漿生物標(biāo)志物可以預(yù)測患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說出第一句話的關(guān)鍵 研究發(fā)現(xiàn)基因檢測正成為主流 血液測試顯示心臟存在排斥風(fēng)險(xiǎn) 無需提供組織樣本 假體材料有助于減少靜脈導(dǎo)管感染 研究發(fā)現(xiàn)團(tuán)隊(duì)運(yùn)動對孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項(xiàng)研究評估了醫(yī)療保健領(lǐng)域人工智能工具的發(fā)展 利用女子籃球隊(duì)探索足部生物力學(xué) 抑制前列腺癌細(xì)胞:雄激素受體可以改變前列腺的正常生長 肽抗原上的反應(yīng)性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復(fù)發(fā)或難治性 B 細(xì)胞淋巴瘤的風(fēng)險(xiǎn) 適量飲酒可降低高危人群罹患嚴(yán)重心血管疾病的風(fēng)險(xiǎn) STIF科創(chuàng)節(jié)揭曉獎(jiǎng)項(xiàng),新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產(chǎn)品戰(zhàn)略布局!技術(shù)方向支撐產(chǎn)品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復(fù)方塞隆膠囊的品質(zhì)之旅
您的位置:首頁 >行業(yè)動態(tài) >

新的人工智能將自然語言處理的力量帶到非洲語言中

研究人員開發(fā)了一種人工智能模型,以幫助計(jì)算機(jī)更有效地使用更廣泛的語言。

非洲語言很少受到計(jì)算機(jī)科學(xué)家的關(guān)注,因此非洲的大片地區(qū)幾乎沒有自然語言處理能力。滑鐵盧大學(xué) David R. Cheriton 計(jì)算機(jī)科學(xué)學(xué)院的研究人員開發(fā)的新語言模型開始填補(bǔ)這一空白,使計(jì)算機(jī)能夠分析非洲語言文本以執(zhí)行許多有用的任務(wù)。

研究人員稱之為 AfriBERTa 的新神經(jīng)網(wǎng)絡(luò)模型使用深度學(xué)習(xí)技術(shù)為低資源語言實(shí)現(xiàn)了最先進(jìn)的結(jié)果。

該神經(jīng)語言模型專門用于 11 種非洲語言,例如阿姆哈拉語、豪薩語和斯瓦希里語,這些語言的總?cè)藬?shù)超過 4 億。盡管僅從 1 GB 的文本中學(xué)習(xí),但它實(shí)現(xiàn)了與現(xiàn)有最??佳模型相媲美的輸出質(zhì)量,而其他模型需要數(shù)千倍的數(shù)據(jù)。

滑鐵盧大學(xué)計(jì)算機(jī)科學(xué)碩士生 Kelechi Ogueji 說:“預(yù)訓(xùn)練的語言模型已經(jīng)改變了計(jì)算機(jī)處理和分析從機(jī)器翻譯到問答等任務(wù)的文本數(shù)據(jù)的方式。”“可悲的是,非洲語言幾乎沒有受到研究界的關(guān)注。”

“其中一個(gè)挑戰(zhàn)是神經(jīng)網(wǎng)絡(luò)的構(gòu)建需要大量的文本和計(jì)算機(jī)。與擁有大量可用文本的英語不同,全世界使用的大約 7,000 種語言中的大多數(shù)都可以歸為資源匱乏的特征,因?yàn)槿狈捎玫臄?shù)據(jù)來饋送數(shù)據(jù)饑渴的神經(jīng)網(wǎng)絡(luò)。”

大多數(shù)這些模型使用稱為預(yù)訓(xùn)練的技術(shù)工作。為了實(shí)現(xiàn)這一點(diǎn),研究人員向模型展示了一些文字被掩蓋或掩蓋的文本。然后模型必須猜測被屏蔽的詞。通過重復(fù)這個(gè)過程數(shù)十億次,該模型學(xué)習(xí)了單詞之間的統(tǒng)計(jì)關(guān)聯(lián),這模仿了人類的語言知識。

“能夠?qū)δ承┫掠稳蝿?wù)同樣準(zhǔn)確的模型進(jìn)行預(yù)訓(xùn)練,但使用極少的數(shù)據(jù)有很多優(yōu)勢,”計(jì)算機(jī)科學(xué) Cheriton 主席兼 Ogueji 的顧問 Jimmy Lin 說。“需要更少的數(shù)據(jù)來訓(xùn)練語言模型意味著需要更少的計(jì)算,從而降低與運(yùn)營海量數(shù)據(jù)中心相關(guān)的碳排放。較小的數(shù)據(jù)集也使數(shù)據(jù)管理更實(shí)用,這是減少模型中存在的偏差的一種方法。”

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!

最新文章