成都百都科技有限公司-行業(yè)新聞-AI創(chuàng )新進(jìn)行時(shí)！2019年百度AI十大創(chuàng )新技術(shù)盤(pán)點(diǎn)

您當前位置：成都百都科技有限公司 >> 新聞資訊 >> 行業(yè)新聞 >> 瀏覽文章

百度營(yíng)銷(xiāo)（四川）服務(wù)中心
咨詢(xún)及投訴熱線(xiàn):028-96539
招聘電話(huà)：028-63292650 028-63292647
電子郵箱：ask#cdbaidu.com
地址:成都市武侯區人民南路四段46號附1號上善國際6-7樓

AI創(chuàng )新進(jìn)行時(shí)！2019年百度AI十大創(chuàng )新技術(shù)盤(pán)點(diǎn)

2019年12月16日點(diǎn)擊率:

對于A(yíng)I而言，即將過(guò)去的2019年是一個(gè)碩果累累的年份。一方面，它正在以可見(jiàn)的速度走到我們的身邊、滲透到各行各業(yè)中;另一方面，AI技術(shù)本身也一直處于高速更迭換代的過(guò)程中，支撐著(zhù)各種落地應用成為現實(shí)。技術(shù)的進(jìn)化與多元的應用場(chǎng)景相得益彰、相互促進(jìn)，“智能時(shí)代”幾乎已經(jīng)觸手可及。

作為國內人工智能領(lǐng)域的領(lǐng)頭者，百度一直在積極同步推動(dòng)AI技術(shù)創(chuàng )新和產(chǎn)業(yè)智能化。2019年，百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成——百度大腦，在算法突破和計算架構升級的基礎上，實(shí)現AI算法、計算架構與應用場(chǎng)景的融合創(chuàng )新，成為“軟硬一體的AI大生產(chǎn)平臺”，打通了人工智能產(chǎn)業(yè)化應用落地相關(guān)的全部流程，實(shí)現了AI技術(shù)的標準化、自動(dòng)化、模塊化。由此，企業(yè)和開(kāi)發(fā)者不用重復“造輪子”，能直接將AI應用在各個(gè)產(chǎn)業(yè)場(chǎng)景中，促進(jìn)產(chǎn)業(yè)智能化。百度也率先在業(yè)內提出“人工智能進(jìn)入工業(yè)化大生產(chǎn)階段”。

做行業(yè)的引領(lǐng)者，需要銳意創(chuàng )新的勇氣。對百度而言，還有二十年如一日推動(dòng)技術(shù)進(jìn)步所積淀的實(shí)力與底氣。那么，在這個(gè)大跨步向“智能時(shí)代”邁步的一年中，百度在推動(dòng)AI技術(shù)進(jìn)步方面又給我們帶來(lái)了哪些驚喜?讓我們走近看一看。

1、競逐人工智能皇冠上的明珠：知識增強的語(yǔ)義理解框架ERNIE超越谷歌BERT

自然語(yǔ)言處理關(guān)乎智能體如何理解人類(lèi)的語(yǔ)言與文字、并在理解的基礎上進(jìn)行人機智能交互，被稱(chēng)為“人工智能皇冠上的明珠”，其重要性顯而易見(jiàn)。今年，在自然語(yǔ)言處理技術(shù)方面，百度打造了可持續學(xué)習的知識增強語(yǔ)義理解框架ERNIE，通過(guò)建模海量數據中的實(shí)體概念等先驗知識，學(xué)習真實(shí)世界的語(yǔ)義關(guān)系。這種融合知識的語(yǔ)義建模大幅增強了模型的語(yǔ)義表示能力，在共計16個(gè)中英文自然語(yǔ)言處理任務(wù)上效果超越了谷歌BERT和XLNet。近日，ERNIE更是在自然語(yǔ)言處理領(lǐng)域權威數據集GLUE中榮登榜首，并刷新該榜單歷史，超越了微軟MT-DNN-SMART, 谷歌T5、ALBERT等一眾國際頂級預訓練模型。在全球各國探尋AI關(guān)鍵技術(shù)的道路上，百度ERNIE代表中國AI科技占據了舉足輕重的一席之地。

2、方言、中英混合，通通不是問(wèn)題：SMLTA加持，語(yǔ)音識別準確率提升15%-20%

語(yǔ)音識別方面，百度提出流式多級的截斷注意力模型 SMLTA，這是國際上首次實(shí)現局部注意力建模超越整句的注意力模型，也是國際上首次實(shí)現在線(xiàn)語(yǔ)音大規模使用注意力模型。SMLTA在大幅提升識別速度的同時(shí)，也提高了識別準確率。在輸入法有效產(chǎn)品相對準確率提升15%，音箱有效產(chǎn)品相對準確率提升20%。借助SMLTA，百度輸入法實(shí)現了業(yè)界普遍認為較難實(shí)現的中英文混說(shuō)識別，在完全不影響中文語(yǔ)音輸入準確率的情況下，能進(jìn)行高精準的中英文混合語(yǔ)音識輸入。除此之外，方言與方言、方言與普通話(huà)的混合語(yǔ)音輸入也完全不在話(huà)下。

3、僅需20句話(huà)就能錄制你的專(zhuān)屬聲音：語(yǔ)音合成Meitron讓AI體驗個(gè)性化起來(lái)

你可能已經(jīng)習慣了“前方路口左轉”這樣的地圖語(yǔ)音由一個(gè)標準的女聲發(fā)出，然而百度地圖推出的“語(yǔ)音定制”功能，則可以讓你用自己的聲音、或者是自己想要的其他人的聲音來(lái)幫你指揮方向。這背后是百度語(yǔ)音合成技術(shù)Meitron的功勞。針對現階段語(yǔ)音合成方面面臨的風(fēng)格遷移、音色模擬和情感擬人三大挑戰，百度的語(yǔ)音合成技術(shù) Meitron ，可以把聲音中的音色、風(fēng)格、情感等不同元素解耦分離，獨立組合，靈活控制合成的聲音，只需錄制20句話(huà)，就可以制作一個(gè)人的專(zhuān)屬聲音�；诖思夹g(shù)，百度上線(xiàn)了全球首個(gè)地圖語(yǔ)音定制功能，為用戶(hù)帶來(lái)了前所未有的個(gè)性化體驗。

4、向著(zhù)“巴別塔”之巔前進(jìn)：更高準確、更低時(shí)延的機器同傳

翻譯為人類(lèi)重新建立交流的巴別塔，機器翻譯則讓無(wú)障礙溝通的門(mén)檻降得更低。在機器同傳領(lǐng)域，百度綜合聯(lián)合詞向量解碼、語(yǔ)篇翻譯模型等新技術(shù)，實(shí)現高準確、低時(shí)延的機器同傳，并發(fā)布了語(yǔ)音到語(yǔ)音的機器同傳系統：DuTongChuan(度同傳)，以及全球首個(gè)中文-英文演講場(chǎng)景語(yǔ)音翻譯數據集(BSTC)。經(jīng)過(guò)真實(shí)測試，機器同傳效果媲美人類(lèi)譯員�？梢哉f(shuō)，隨時(shí)隨地自由溝通的夢(mèng)想離我們越來(lái)越近。

5、換個(gè)“姿勢”看視頻：基于知識圖譜的視頻語(yǔ)義理解能力

在今年的“Baidu Create 2019”百度AI開(kāi)發(fā)者大會(huì )上，百度CTO王海峰為大家展示了一段基于知識圖譜理解音樂(lè )紀錄片《大河唱》的內容。影片中的角色、人物關(guān)系、音樂(lè )種類(lèi)、取景地、影片主題等信息，都得到了精準解析，在屏幕上一一呈現給觀(guān)眾。這是融合了百度知識圖譜技術(shù)的視頻語(yǔ)義理解能力，通過(guò)結合視覺(jué)、語(yǔ)音和自然語(yǔ)言處理技術(shù)解析多模態(tài)信息，并與知識圖譜的相關(guān)實(shí)體建立關(guān)聯(lián)，通過(guò)計算和推理，得到電影內容的結構化語(yǔ)義表示，從而理解電影中出現的角色、音樂(lè )和民間藝術(shù)等。還在因為記不住某部電影里紛繁復雜的的人物關(guān)系而頭疼?有知識的AI來(lái)幫你梳理梳理唄。該技術(shù)目前已在百度視頻搜索、推薦、內容生成等多個(gè)產(chǎn)品上線(xiàn)。

6、有溫度的AI，從真人形象虛擬主播開(kāi)始：實(shí)時(shí)合成真人虛擬形象在多個(gè)場(chǎng)景應用

百度的實(shí)時(shí)合成虛擬形象技術(shù)，結合多模態(tài)嘴型生成、GAN、TTS等技術(shù)，實(shí)現了業(yè)界首個(gè)可以量產(chǎn)視頻的真人形象虛擬主播，同時(shí)具備自動(dòng)化、平臺化、實(shí)時(shí)計算、大規模應用和效果逼真等技術(shù)特點(diǎn)，可以解決以往虛擬主播形象生硬、響應速度滯后、播報內容刻板等問(wèn)題。該技術(shù)已經(jīng)成功應用于多個(gè)場(chǎng)景。例如，央視與百度合作打造AI虛擬主持人小靈，亮相央視2019五四晚會(huì );澎湃新聞與百度合作打造了第一個(gè)真人形象的虛擬主播早晚新聞欄目;浦發(fā)銀行與百度合作打造了業(yè)內首個(gè)“金融數字人”，有顏值、有情感、還有專(zhuān)業(yè)的銀行知識，將升級銀行客服體驗。

7、讓中國最好的AI跑在中國自主可控的芯片上：百度鴻鵠芯片發(fā)布，百度昆侖云服務(wù)器上線(xiàn)

AI的發(fā)展需要算力的支撐，當下AI領(lǐng)域精彩紛呈，算力的需求更是大規模上漲。而在算力層面，芯片始終是受到關(guān)注的焦點(diǎn)。特別是在中國，開(kāi)發(fā)者和企業(yè)能否用上自主可控的芯片，又讓這一關(guān)注多了一層意義。今年，百度發(fā)布了專(zhuān)為遠場(chǎng)語(yǔ)音交互打造的百度鴻鵠芯片，其設計變革了傳統芯片設計方法，遵循“軟件定義芯片”的全新設計思路。同時(shí)，它采用雙核 HiFi4 架構，40nm 工藝，2.8M 大內存，在此硬件規格上，僅僅100mW 左右平均工作功耗，即可支持遠場(chǎng)語(yǔ)音交互核心的陣列信號處理和語(yǔ)音喚醒能力，將為車(chē)載語(yǔ)音交互、智能家居等場(chǎng)景帶來(lái)更大想象力。而在12月，基于百度自主研發(fā)的AI加速芯片-KUNLUN1的百度昆侖云服務(wù)器也正式在百度智能云上線(xiàn)。百度昆侖云服務(wù)器與百度自主研發(fā)的產(chǎn)業(yè)級深度學(xué)習開(kāi)源平臺飛槳深度適配，支持知識增強語(yǔ)義理解框架ERNIE等完全自主可控的領(lǐng)先算法模型，讓中國最好的AI跑在中國自己自主可控的芯片之上。

8、打造自動(dòng)駕駛的智慧之眼：國內唯一的城市道路L4級純視覺(jué)感知解決方案Apollo Lite

作為車(chē)輛與周?chē)h(huán)境交互的紐帶，感知系統是實(shí)現自動(dòng)駕駛的關(guān)鍵環(huán)節，可謂是自動(dòng)駕駛系統的一雙“眼睛”。在今年的CVPR 2019召開(kāi)期間，百度公開(kāi)了國內唯一的 L4 級自動(dòng)駕駛純視覺(jué)城市道路閉環(huán)解決方案——百度 Apollo Lite。相比旋轉式激光雷達感知方案，視覺(jué)感知方案價(jià)格低且便于獲得，為企業(yè)、開(kāi)發(fā)者們提供了一個(gè)低價(jià)、優(yōu)質(zhì)的自動(dòng)駕駛解決方案。

9、為自動(dòng)駕駛提供仿真測試保障：增強現實(shí)的自動(dòng)駕駛仿真系統登上《科學(xué)》子刊

安全性也是自動(dòng)駕駛至關(guān)重要的一環(huán)。業(yè)界一般認為，一個(gè)可靠的、安全的自動(dòng)駕駛系統必須能保證在苛刻的測試環(huán)境下安全行駛數億公里。按照這一指標,若完全使用真實(shí)道路測試,可能需要長(cháng)達數十年�；谟嬎銠C視覺(jué)和AR技術(shù)，百度開(kāi)發(fā)了一種增強現實(shí)的自動(dòng)駕駛仿真系統(AADS)，為自動(dòng)駕駛車(chē)輛提供更為可靠且廉價(jià)的仿真模擬方法，兼顧自動(dòng)駕駛系統測試的安全性的同時(shí)，提升測試效果并極大地縮短測試時(shí)間。該系統相較于現有仿真系統，在真實(shí)感、擴展性等方面都實(shí)現了突破性的技術(shù)進(jìn)展，并發(fā)表于《科學(xué)》雜志《機器人學(xué)》子刊。

10、邁向未來(lái)計算新世界：“量脈”實(shí)現量子軟硬件連接

最后一項關(guān)乎未來(lái)。量子計算被認為是未來(lái)計算技術(shù)的心臟。2019年，百度研發(fā)出國際領(lǐng)先、國內第一的云上量子脈沖系統“量脈”,可將量子計算軟件指令(邏輯門(mén))轉換成控制量子硬件的脈沖序列,算法性能較同類(lèi)工具實(shí)現成倍級別的提升,是實(shí)現量子軟硬件連接的關(guān)鍵橋梁。

以上的十大技術(shù)創(chuàng )新，只是百度諸多技術(shù)成果的冰山一角。時(shí)代在繼續向前發(fā)展，百度推動(dòng)技術(shù)創(chuàng )新的步履從不曾停歇。通過(guò)不斷推動(dòng)技術(shù)進(jìn)步，百度還將為人工智能產(chǎn)業(yè)和社會(huì )的發(fā)展貢獻更大的力量。未來(lái)還會(huì )有哪些精彩?讓我們拭目以待。

（文章來(lái)源：大眾新聞）

AI創(chuàng )新進(jìn)行時(shí)！2019年百度AI十大創(chuàng )新技術(shù)盤(pán)點(diǎn)

AI創(chuàng )新進(jìn)行時(shí)！2019年百度AI十大創(chuàng )新技術(shù)盤(pán)點(diǎn)