如今,人工智能的發(fā)展速度非??臁N覀冎車挛锏膹碗s性不斷增長,這促使每個人都依賴人工智能,以多種方式幫助人類,從檢測欺詐交易、預測市場價格到在高層相關者中做出決策。在人工智能蓬勃發(fā)展與應用的面前,任何企業(yè)都沒有理由不嘗試人工智能。基于2021年AI技術的發(fā)展,可以對人工智能在2022的發(fā)展進行預測。
首先,我們對 2021 年AI發(fā)布的技術進行簡要整理。
2021 年 AI 技術
2021年 AI 主要的技術發(fā)布 在2 月份開始,當時谷歌發(fā)布了Tensorflow 3D,將深度學習模型升級到 3D 空間,實現(xiàn) 3D 場景理解,可用于虛擬現(xiàn)實、圖像中的點云應用、激光雷達和自我視覺-自動駕駛汽車。的自我監(jiān)督學習,它能夠完成識別文本、圖像和其他主要在社交媒體中可用的非結構化數(shù)據(jù)的無監(jiān)督任務。SEER 建立在 ImageNet 之上,該 ImageNet 對十億個隨機、未標記和未策劃的公共 Instagram 圖像進行了預訓練。4月份沒有什么新鮮事,但是,歐盟提出了新的人工智能法規(guī),為該地區(qū)的人工智能橫向提供法律框架。擬議的法律框架側重于人工智能系統(tǒng)的具體利用和相關風險。
5 月,谷歌發(fā)布了 Vertex AI,它與谷歌云服務集成,可以使用基于視覺、視頻、自然語言等預訓練 API的自動化 ML (或 AutoML)的強大功能構建 ML。使用 Vertex,通過簡化編碼(低代碼開發(fā))消除了運行 ML 管道的復雜性。然后在 6 月,微軟的 GitHub 發(fā)布了他們的GitHub Copilot,它使用戶能夠通過自動完成來加速編碼。自動完成是,在有人完成他們的代碼之前,GitHub Copilot 將自行完成代碼。7 月,谷歌的DeepMind 發(fā)布了超過 350,000 種蛋白質(zhì)的預測形狀使用他們一年前開發(fā)的 AlphaFold AI 系統(tǒng)。一些人聲稱,該數(shù)據(jù)庫可以在許多方面發(fā)生革命性變化,例如提高了解疾病和開發(fā)新藥的能力。
8 月,來自卡內(nèi)基梅隆大學和麻省理工學院的研究人員發(fā)表了一項開創(chuàng)性的發(fā)明,即一種新型的生成對抗網(wǎng)絡 (GAN),它只能通過繪制草圖來生成模仿圖像,他們稱之為 GAN 草圖。然后在 10 月,NVIDIA 結合了兩個強大的語言轉(zhuǎn)換器,創(chuàng)建了超越 OpenAI 強大的 GPT-3的Megatron-Turing 自然語言生成(NLG)。該 Transformer 模型旨在通過GPU 加速基于數(shù)千億自然語言標記將訓練效率提高 10 倍。11 月,NVIDIA 再次發(fā)布了名為StyleGAN3的下一代 GAN ,它可以生成模仿人類照片幾乎 99.9% 逼真。最后,在 12 月,DeepMind 發(fā)布了另一個名為Gopher的自然語言轉(zhuǎn)換器模型,可以在人機交互中合成響應。
基于這些突破,2022 年人工智能最有可能的五大預測如下。
預測 1:人工智能將在業(yè)務中更易于解釋和自動化
Enthought 的首席運營官 Mike Connel 表示,超過 90% 的工業(yè) AI 或 ML 項目可能無法在 2022 年實現(xiàn)其業(yè)務目標,因為無法解釋他們在業(yè)務中的模型??山忉尩?AI(或 XAI)變得如此重要,因為它對許多企業(yè)構成了威脅,例如,產(chǎn)生有偏見的結果的模型。業(yè)務的高級利益相關者將關注模型如何代表真實業(yè)務問題的問題,而不是如何對其進行編碼。此外,企業(yè)對低代碼 ML 模型開發(fā)的需求變得如此不可避免,因為開發(fā)一個模型可能是乏味和迭代的。近年來,自動化 ML(或 AutoML)發(fā)展得如此迅速。
目前,開發(fā) XAI 和 AutoML 的公司很少。最受歡迎的公司之一是H2O.ai , Inc.。H2O.ai 將其服務命名為Driverless AI。這項 AI 服務使數(shù)據(jù)科學家能夠更快地開發(fā)機器學習模型,因為 AutoML 能夠自動處理所有流程(從數(shù)據(jù)探索、模型選擇和評估),并使用可視化為業(yè)務利益相關者解釋模型。這避免了機器學習是“黑盒”模型的觀點。此外,谷歌還提供 XAI 作為他們今年 5 月初發(fā)布的 Vertex AI 云平臺的堆棧。因此,這將不可避免地推動云中自動化和可解釋的 ML 模型在來年更快的發(fā)展。
預測 2:3D 人工智能將徹底改變自動駕駛汽車
自動駕駛或自動駕駛汽車是一種駕駛者很少或沒有控制的概念。這些汽車可能有傳感器,可以對周圍環(huán)境進行視覺感知,還有一個系統(tǒng)可以消化這些感官信息,以使用所謂的計算機視覺來控制運動。如今,大多數(shù)自動駕駛汽車,例如配備 HW2.5 自動駕駛系統(tǒng)的特斯拉 Model X,都使用基于卷積神經(jīng)網(wǎng)絡算法的2D 對象檢測,即 YOLO(You Only Look Once)。LiDAR 相機傳感儀器捕獲的周圍環(huán)境圖像僅將信息處理為 2D 對象(或無深度對象)。這可能會限制自動駕駛汽車做出自主決策的能力。
最近,出現(xiàn)了從 2D 到 3D 單目場景理解的升級趨勢。被稱為 3D 邊界框估計算法的算法試圖處理這種運動,例如 Deep3DBox、FQNet、Shift R-CNN 和級聯(lián)幾何約束。還有其他方法,例如 Pseudo-3D 方法。隨著2021 年Tensorflow 3D的出現(xiàn),以 3D方式學習周圍物體的自動駕駛汽車的未來非常有前景。據(jù)福布斯報道,由于許多人使用 Tensorflow 進行深度學習,因此使用新的 3D 版本將非常容易。對其他應用的影響以及歷史建筑的保護在增強現(xiàn)實空間中也將在不久的將來可見。
預測 3:生成對抗網(wǎng)絡 (GAN) 將徹底改變設計制造商
毫無疑問,GAN 是人們在談論諸如在 Deepfake 中生成看起來像某人的臉的人臉、使用文森特·梵高的繪畫風格創(chuàng)作新繪畫或制作一瓶酒的逼真圖像時所尋找的東西。 . 近年來,GAN 徹底改變了藝術工作室和電影制作行業(yè)。
在不久的將來,GAN 將登陸制造企業(yè)。最近,GAN 具有從 3D 渲染對象中學習并生成 3D 對象的能力。在科學和技術術語中,這稱為計算機輔助設計(或 CAD)。例如,來自 MIT CSAIL 的一組研究人員表明,GAN 可以學習將 3D 家具對象與 IKEA 包含家具照片的大型數(shù)據(jù)集區(qū)分開來。然后,GAN 生成識別圖像的 3D 渲染對象。這是一個巨大的突破,因為在計算機軟件上手動進行 CAD 是制造業(yè)中漫長而昂貴的過程。
此外,汽車行業(yè)將發(fā)現(xiàn) GAN 在設計車輛及其零部件方面的更多應用。Monolith AI是一家總部位于英國的初創(chuàng)公司,是極少數(shù)在產(chǎn)品設計優(yōu)化中嘗試使用 GAN 的公司之一。他們展示了如何將 GAN 應用于拓撲優(yōu)化和無網(wǎng)格設計生成以產(chǎn)生新的汽車設計。該企業(yè)還實施 GAN 以生成無法通過3D 打印生產(chǎn)的組件的 3D 對象,并解決這些組件的計算流體動力學 (CFD) 模擬。
隨著 GAN 在制造業(yè)中的這些應用,人工智能很可能在明年成為設計優(yōu)化和增材制造過程中的主流。
預測 4:Transformers 和認知 AI 將徹底改變語言應用
自然語言處理和生成 (NLG) 已經(jīng)改變了企業(yè)通過社交媒體上的推文了解客戶、找到正確的事實并從新聞中識別惡作劇以及通過聊天機器人與人類對話的方式。NLG 依賴于使用轉(zhuǎn)換器,這是一種深度學習結構,由編碼器和解碼器處理輸入(可以是任何形式的數(shù)據(jù))和生成輸出(以文本形式)組成。
兩種最流行的 NLG 模型是 BERT(來自 Transformers 的雙向編碼器表示)和 GPT(生成式預訓練 Transformer)。谷歌在 2018 年發(fā)布的 BERT 有 3.4 億個參數(shù),而 OpenAI 的 GPT-3 被稱為最強大的轉(zhuǎn)換器,有 1750 億個參數(shù)。參數(shù)的數(shù)量呈指數(shù)增長。似乎只看它的走勢,變形金剛之間的競爭是無止境的。那么,這對自然語言世代的未來意味著什么?
自然語言處理可以通過將文本分解成句子結構(或句法分析)并分析單詞、語法和意義的關系(或語義分析)來分類好情緒和壞情緒。我們需要提供盡可能多的數(shù)據(jù),讓 NLP 能夠識別上下文。未來,NLP 會“有意識”地從文本中理解更多,比如從作者的情感中尋找隱含的意義,從而做出認知 AI。隨著變壓器中現(xiàn)在有數(shù)十億個參數(shù)可用,認知人工智能的出現(xiàn)即將到來。
認知人工智能將幫助企業(yè)在客戶在聊天機器人中進行對話后,向客戶提供更個性化的反饋。最流行的對話框架是亞馬遜的 Alexa 和蘋果的 Siri。對話的上下文將不再是通用的,例如詢問姓名或職業(yè)。上下文將非常多樣化和具體,例如醫(yī)療保健中的科學、人力資源或醫(yī)療處方。
最后但同樣重要的是,NLP 將與圖像處理相結合,例如處理面部表情、手勢和肢體語言,以了解兩個人之間對話中的情緒。然后,認知 AI 將生成人工對話。這種受生物識別啟發(fā)的認知人工智能將在不久的將來流行。
預測 5:元宇宙中的數(shù)字孿生將主導行業(yè)
數(shù)字孿生是實時顯示物理行為的對象或系統(tǒng)的虛擬表示。如今,許多行業(yè)都使用它來了解其產(chǎn)品的行為和缺陷,例如機械或建筑結構,并通過模擬改進其物理模型。通用電氣和勞斯萊斯等公司是使用數(shù)字孿生改進噴氣發(fā)動機設計的前沿領先行業(yè)。
為了代表數(shù)字孿生版本的原型,該原型配備了許多傳感器,用于測量操作期間的不同物理行為??赡苡袛?shù)百個傳感器需要了解。憑借海量的訓練數(shù)據(jù),人工智能可以了解每個傳感器測量的行為和意義的復雜性,因此可以通過預測性維護或提供來預測故障發(fā)生。
現(xiàn)在,公司正在開發(fā)虛擬現(xiàn)實和增強現(xiàn)實(VR 和 AR)體驗,使人們能夠使用感官直接與現(xiàn)實空間中不存在的物體進行交互。進行 VR 和 AR 最常見的方式是通過有限的交互將體驗“放在桌面上”。現(xiàn)在,技術使人們能夠在真實空間中與物體無縫交互。人們可以通過 VR 和 AR 與對象交互的空間稱為元界。在 Metaverse 中,人們可以實時交互。未來,更多的公司將在元界中結合AI應用開發(fā)用戶體驗。波音公司剛剛宣布,他們將在元宇宙中對其飛機進行 3D 工程設計使用微軟名為 HoloLens 的 AR 和 VR 技術。將工程引入虛擬世界有一些好處,即降低了制造真實原型的成本,因為組件的成本和設計的可重復實驗。在不久的將來,城市規(guī)劃、環(huán)境建筑設計和防災很有可能在元宇宙中進行。
小結
五個關鍵預測是人工智能將在業(yè)務中更加自動化和可解釋,3D 中的人工智能將徹底改變自動駕駛汽車中的計算機視覺,GAN 將通過優(yōu)化實現(xiàn)制造設計,Transformers 將徹底改變自然語言生成和人工人類對話,數(shù)字孿生將在 Metaverse 元宇宙中進行。
鑒于人工智能理論方面的創(chuàng)新速度和復雜技術支持的實際應用的創(chuàng)新速度,人工智能將繼續(xù)推動進程并幫助人類完成各種復雜的任務。
免責申明:此文章轉(zhuǎn)載至網(wǎng)絡如有侵權請聯(lián)系第一時間刪除