中國(guó)新聞網(wǎng)-上海新聞
上海分社正文
喜馬拉雅音頻大模型:AI賦能內(nèi)容創(chuàng)作者
2024年09月20日 19:03   來(lái)源:中新網(wǎng)上海  

  中新網(wǎng)上海新聞9月20日電(謝夢(mèng)圓)記者19日從總部位于上海的上海喜馬拉雅科技有限公司獲悉,喜馬拉雅珠峰AI音頻多模態(tài)大模型在展示過(guò)程中引眾多市民駐足圍觀體驗(yàn)。

  AI(人工智能)已經(jīng)在深刻影響著人們的生活,也影響和改變著內(nèi)容創(chuàng)作行業(yè)。作為在線(xiàn)音頻頭部企業(yè),喜馬拉雅以科技賦能文化,圍繞音頻建立了一個(gè)豐富多元的“聲音宇宙”,截至2023年12月底,喜馬拉雅已經(jīng)累積了包含459個(gè)品類(lèi)的4.88億條音頻,總內(nèi)容時(shí)長(zhǎng)超過(guò)36億分鐘,能滿(mǎn)足用戶(hù)從-1歲到100歲不同年齡階段的不同需求。

  近日,喜馬拉雅展示了“珠峰AI音頻多模態(tài)大模型”(簡(jiǎn)稱(chēng)“喜馬拉雅音頻大模型”)的強(qiáng)大功能、應(yīng)用場(chǎng)景及商業(yè)化案例。據(jù)悉,“珠峰AI音頻多模態(tài)大模型”是喜馬拉雅自主研發(fā)的AI音頻生成大模型,依托其超百萬(wàn)小時(shí)的自有版權(quán)音頻數(shù)據(jù)進(jìn)行深度學(xué)習(xí)與訓(xùn)練,具備情感輸出、自然表達(dá)、語(yǔ)種互譯、極速克隆等技術(shù)能力,并在音頻生成領(lǐng)域?qū)崿F(xiàn)了多維度突破,正廣泛應(yīng)用于有聲書(shū)等領(lǐng)域,未來(lái)將不斷推動(dòng)音頻大模型行業(yè)的創(chuàng)新與發(fā)展。

 

 

  基于“珠峰AI音頻多模態(tài)大模型”,喜馬拉雅展示了“珠峰AI創(chuàng)作服務(wù)平臺(tái)”:珠峰AI音視頻創(chuàng)作平臺(tái),依托通義文本大模型對(duì)文本內(nèi)容語(yǔ)義的深度理解,打造珠峰AI音頻大模型,結(jié)合喜馬拉雅獨(dú)有的全品類(lèi)音色庫(kù)和數(shù)字人大模型,為創(chuàng)作者提供高品質(zhì)的AIGC音頻和數(shù)智人服務(wù)。用戶(hù)可以在“珠峰AI數(shù)智人平臺(tái)互動(dòng)體驗(yàn)區(qū)”體驗(yàn)AI為聲音創(chuàng)作帶來(lái)的變革,比如極速體驗(yàn)全領(lǐng)域多品類(lèi)535種AI音色庫(kù)生成全品類(lèi)AIGC音頻內(nèi)容、15秒真人數(shù)智人形象快速定制、10秒聲音極速克隆(不單音色克隆,更包含韻律、腔調(diào)、口吻等“語(yǔ)流”信息)等等,感受AI高效便捷地賦能內(nèi)容創(chuàng)作者。

  AI正在深刻賦能和影響著喜馬拉雅的發(fā)展。數(shù)據(jù)顯示,2023年喜馬拉雅全場(chǎng)景平均月活躍用戶(hù)達(dá)3.03億。截至2023年12月,喜馬拉雅平臺(tái)AIGC內(nèi)容達(dá)2.4億分鐘,占其音頻內(nèi)容的6.6%。同時(shí),喜馬拉雅移動(dòng)端平均月活躍用戶(hù)的AIGC滲透率已達(dá)14.8%。

  喜馬拉雅音頻大模型具備“產(chǎn)模一體生態(tài)系統(tǒng)、持續(xù)進(jìn)化的生態(tài)飛輪”的模型優(yōu)勢(shì),已廣泛應(yīng)用于內(nèi)容創(chuàng)作、數(shù)智分身、語(yǔ)音交互等場(chǎng)景,并已實(shí)現(xiàn)商業(yè)化。

  喜馬拉雅音頻大模型在廣告領(lǐng)域擁有廣泛的應(yīng)用場(chǎng)景,通過(guò)AIGC原生聲音流,實(shí)現(xiàn)“廣告即內(nèi)容”,如喜馬拉雅聯(lián)合貴州茅臺(tái)推出“單田芳AI聲音重現(xiàn)”春運(yùn)公益活動(dòng),聯(lián)合慕思共同打造的“邀李白共啟AI穿越之旅”活動(dòng)等等;诖竽P停磥(lái)喜馬拉雅的AI能力將在智能化廣告營(yíng)銷(xiāo)中發(fā)揮更突出的作用。

 

 

  高質(zhì)量的數(shù)據(jù)集是將AI塑造成可靠的解釋器的訓(xùn)練燃料,從龐大的數(shù)據(jù)集中探索并獲得有意義的見(jiàn)解以推動(dòng)AI不斷發(fā)展。據(jù)灼識(shí)咨詢(xún)資料顯示,喜馬拉雅擁有中國(guó)最全面的音頻內(nèi)容生態(tài),其中包括體量最大的音頻內(nèi)容庫(kù)及數(shù)量最多的音頻內(nèi)容創(chuàng)作者。截至2023年12月,喜馬拉雅擁有約4.9億條音頻內(nèi)容,總內(nèi)容時(shí)長(zhǎng)為36億分鐘。這使得喜馬拉雅在AI時(shí)代能夠輕松獲取海量且多樣化的在線(xiàn)音頻內(nèi)容以不斷演進(jìn)其AI能力,這也是喜馬拉雅在AI時(shí)代的競(jìng)爭(zhēng)優(yōu)勢(shì)。

  AI不僅代表了一種技術(shù)價(jià)值的想象,其背后更是商業(yè)價(jià)值的全新拐點(diǎn)。隨著下一代技術(shù)、AI及大數(shù)據(jù)能力的持續(xù)提升,喜馬拉雅將進(jìn)一步打開(kāi)聲音的想象力,持續(xù)用聲音分享人類(lèi)智慧,用聲音服務(wù)美好生活。(完)

注:請(qǐng)?jiān)谵D(zhuǎn)載文章內(nèi)容時(shí)務(wù)必注明出處!   

編輯:謝夢(mèng)圓  

本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書(shū)面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
常年法律顧問(wèn):上海金茂律師事務(wù)所