×

知識圖譜將成為下一階段的明星賽道

  • 作者:sdfcsd
  • 來源:互聯(lián)網(wǎng)
  • 瀏覽:100
  • 2020-04-10 13:48:31

人工智能與互聯(lián)網(wǎng)或5G等技術(shù)本質(zhì)上存在差別,后者解決的是信息的發(fā)出、傳遞、接收與反饋的閉環(huán)問題,而人工智能的本質(zhì)是進行生產(chǎn)力升級,因此評判人工智能使用的是否有價值,要看其技術(shù)應(yīng)用是否貼近生產(chǎn)核心。

webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial>人們?yōu)槭裁撮_始重視知識圖譜的發(fā)展了?

人工智能與互聯(lián)網(wǎng)或5G等技術(shù)本質(zhì)上存在差別,后者解決的是信息的發(fā)出、傳遞、接收與反饋的閉環(huán)問題,而人工智能的本質(zhì)是進行生產(chǎn)力升級,因此評判人工智能使用的是否有價值,要看其技術(shù)應(yīng)用是否貼近生產(chǎn)核心。

人類生產(chǎn)力可以歸類為知識生產(chǎn)力和勞動生產(chǎn)力,人工智能走入產(chǎn)業(yè)后,可以分為感知智能、認知智能和行為智能,后兩者更與生產(chǎn)力相對應(yīng)。以計算機視覺、語音識別為代表的感知智能應(yīng)用深度學(xué)習(xí),在算力與數(shù)據(jù)的支撐下突破了工業(yè)紅線,實現(xiàn)了機器對于自然界具象事物的判斷與識別,但僅僅如此并沒有觸及核心生產(chǎn)環(huán)節(jié),所以也就限制了其商業(yè)應(yīng)用半徑。當(dāng)人們使用機器能識別更多事物的時候,自然而然的引發(fā)了,對事物背后的事理,理解、分析和決策的深層次需求,認知智能呼之欲出。

認知智能核心解決的問題是對人類文明抽象概念的識別與聯(lián)想,通過自然語言處理(NLP)技術(shù)對文字內(nèi)容在語義上進行初步認知和自動抓取,經(jīng)由知識圖譜對概念間的關(guān)系屬性進行聯(lián)結(jié)、轉(zhuǎn)換,從而對人類社會生產(chǎn)、生活行為進行描繪,實現(xiàn)業(yè)務(wù)規(guī)范梳理、生產(chǎn)流程可視化、人際關(guān)系挖掘等代表應(yīng)用,這與注重經(jīng)驗、邏輯和方法論累積的知識生產(chǎn)力產(chǎn)生了直接對應(yīng),而與勞動生產(chǎn)力相對應(yīng)的行為智能同樣需要知識的指導(dǎo),所以認知智能的發(fā)展才是人工智能回歸本質(zhì)的表征,而搭建知識圖譜是認知智能可以參與生產(chǎn)的基礎(chǔ)錨點。

image001.png人工智能與生產(chǎn)力之間的關(guān)系

知識圖譜的搭建邏輯

知識圖譜從邏輯上可以分為概念層和數(shù)據(jù)層,數(shù)據(jù)層指以三元組為表現(xiàn)形式的客觀事實集合,而概念層是它的“上層建筑”,是經(jīng)過積累沉淀的知識集合。

建設(shè)中以本體模型和實體數(shù)據(jù)庫為核心,根據(jù)二者的建設(shè)順序又分為先定義本體和數(shù)據(jù)規(guī)范,再抽取數(shù)據(jù)的“自頂向下型”和先抽取實體數(shù)據(jù),再逐層構(gòu)建本體的“自底向上型”兩種模式,前者適用于場景較為固定,存在可量化行業(yè)邏輯的領(lǐng)域,如金融、醫(yī)療、法律等;后者適用于新拓展的,有大量數(shù)據(jù)積累,行業(yè)邏輯難以直接展現(xiàn)的領(lǐng)域。

總體而言,搭建知識圖譜從數(shù)據(jù)源開始,經(jīng)歷了知識抽取、知識融合、知識加工等步驟。原始的數(shù)據(jù)通過知識抽取或數(shù)據(jù)整合的方式轉(zhuǎn)換為三元組形式,然后三元組數(shù)據(jù)再經(jīng)過實體對齊,加入數(shù)據(jù)模型,形成標(biāo)準(zhǔn)的知識表示,過程中如產(chǎn)生新的關(guān)系組合,通過知識推理形成新的知識形態(tài),與原有知識共同經(jīng)過質(zhì)量評估,完成知識融合,最終形成完整形態(tài)上的知識圖譜。

image003.png人工智能結(jié)構(gòu)拓撲圖

知識圖譜的應(yīng)用價值

知識圖譜是人工智能符號學(xué)派中知識工程的代表應(yīng)用,其核心價值在于對多源異構(gòu)數(shù)據(jù)和多維復(fù)雜關(guān)系的處理與可視化展示。

其底層邏輯是將人類社會生活與生產(chǎn)活動中難以用數(shù)學(xué)模型直接表示的關(guān)聯(lián)屬性,利用語義網(wǎng)絡(luò)和專業(yè)領(lǐng)域知識進行組織存儲,形成一張以關(guān)系為紐帶的數(shù)據(jù)網(wǎng)絡(luò),通過對關(guān)系的挖掘與分析,能夠找到隱藏在行為之下的利益鏈條和價值鏈條,并進行直觀的圖例展示。

在面對數(shù)據(jù)多樣、復(fù)雜,孤島化,且單一數(shù)據(jù)價值不高的應(yīng)用場景時,存在關(guān)系深度搜索、規(guī)范業(yè)務(wù)流程、規(guī)則和經(jīng)驗性預(yù)測等需求,使用知識圖譜解決方案將帶來最佳的應(yīng)用價值。

連接主義中的深度學(xué)習(xí)算法幾乎代表了當(dāng)代整個人工智能技術(shù),但深度學(xué)習(xí)需要具有明確因果關(guān)系的數(shù)據(jù)對訓(xùn)練,且存在尚缺乏解釋性的黑箱問題,在摻雜眾多非線性問題的復(fù)雜場景中應(yīng)用價值有限,通過與知識圖譜的配合使用,在一定程度上可以解決此類問題,隨著關(guān)系向量法深入研究,圖神經(jīng)網(wǎng)絡(luò)將走向產(chǎn)業(yè)應(yīng)用,屆時依托于行業(yè)知識與經(jīng)驗的深度學(xué)習(xí)將產(chǎn)生更多貼近產(chǎn)業(yè)核心的認知智能應(yīng)用,人工智能技術(shù)也將跟進一步實現(xiàn)生產(chǎn)力升級的終極目標(biāo)。

主要涵蓋知識圖譜、NLP和智能BI分析的大數(shù)據(jù)智能行業(yè)市場規(guī)模和結(jié)構(gòu)

據(jù)艾瑞咨詢統(tǒng)計推算,2019年涵蓋大數(shù)據(jù)分析預(yù)測、領(lǐng)域知識圖譜及NLP應(yīng)用的大數(shù)據(jù)智能市場規(guī)模約為106.6億元,預(yù)計2023年將突破300億元,年復(fù)合增長率為30.8%.

其中2019年市場中以金融領(lǐng)域和公安領(lǐng)域應(yīng)用份額占比最大,金融領(lǐng)域因標(biāo)準(zhǔn)化數(shù)據(jù)積累豐富,行業(yè)認知與直接需求最為明顯等因素,成為數(shù)據(jù)智能最早落地并產(chǎn)生價值的行業(yè).

公安領(lǐng)域經(jīng)過三年的感知智能基礎(chǔ)設(shè)施建設(shè),已經(jīng)初步形成人工智能應(yīng)用環(huán)境,在黨中央和公安部的號召指導(dǎo)下,公安大數(shù)據(jù)建設(shè)將成為下一階段的主題,這一趨勢也在2019年相關(guān)招標(biāo)項目中得以體現(xiàn)。

隨著整體市場數(shù)據(jù)基礎(chǔ)的完善和需求喚醒,大數(shù)據(jù)智能領(lǐng)域規(guī)模持續(xù)走高,但在行業(yè)可落地性和理性建設(shè)的限制下,預(yù)計市場增速將呈現(xiàn)下降趨勢,期間咨詢性需求將會大量出現(xiàn),從整體發(fā)展來看增速處于良性區(qū)間,對真正有價值的公司和產(chǎn)品有正向意義。

image006.png

image009.png

知識圖譜應(yīng)用——搜索引擎領(lǐng)域

搜索引擎是互聯(lián)網(wǎng)發(fā)展中最具代表性的應(yīng)用之一,它解決了人們?nèi)绾畏奖惬@取信息的問題,一度成為大部分流量的入口。但隨著網(wǎng)絡(luò)中信息沉積越來越多,人們真正需要的,隱藏在大量無用信息中有價值的部分,我們稱之為知識的內(nèi)容,往往得不到直觀展現(xiàn),這成為了搜索引擎領(lǐng)域重點要解決的問題。

2012年5月,谷歌率先提出知識圖譜概念,用以更好的描述現(xiàn)實世界中實體關(guān)聯(lián)性問題,進而提高信息搜索中的知識獲取效率,隨后搜狗、微軟、百度紛紛推出相關(guān)概念架構(gòu),知識圖譜被視為下一代搜索引擎的核心技術(shù)。

傳統(tǒng)搜索引擎一般采用網(wǎng)頁索引,按照“網(wǎng)頁 --(預(yù)處理)--> 臨時庫 --(索引)--> 索引好的庫 --(由用戶行為觸發(fā)檢索)--> 為用戶展示網(wǎng)頁結(jié)果”的流程執(zhí)行,信息源來自網(wǎng)頁,展現(xiàn)內(nèi)容也是網(wǎng)頁鏈接。而基于知識圖譜的搜索作為和網(wǎng)頁索引同級、并行的另一套知識索引,更注重信息間的關(guān)聯(lián)性和自然語言理解,通過圖存儲的形式從新組織互聯(lián)網(wǎng)中的信息,再以人類的語言習(xí)慣進行查詢和展現(xiàn),從而提高搜索體驗,因為知識的存儲形式發(fā)生了變化,所以知識索引信息來源和展現(xiàn)載體都不再局限于網(wǎng)頁文字,語音交互和更加豐富的IoT場景將會是未來的發(fā)展方向。

image011.png知識圖譜在搜索引擎中的應(yīng)用

知識圖譜應(yīng)用——金融領(lǐng)域

在金融領(lǐng)域中無論是傳統(tǒng)金融或是互聯(lián)網(wǎng)金融,信用評估、反欺詐和風(fēng)險控制都是最為關(guān)鍵的環(huán)節(jié),隨著近些年金融數(shù)據(jù)的爆發(fā)式增長,傳統(tǒng)風(fēng)控系統(tǒng)逐漸力有不逮,而應(yīng)用機器學(xué)習(xí)算法和知識圖譜的智能風(fēng)控系統(tǒng)在風(fēng)險識別能力和大規(guī)模運算方面具有突出優(yōu)勢,逐漸成為金融領(lǐng)域風(fēng)控反欺詐的主要手段。

機器學(xué)習(xí)和知識圖譜相結(jié)合是目前主流的解決方案,其中機器學(xué)習(xí)算法通過概率計算的方式,以數(shù)學(xué)運算特征反應(yīng)風(fēng)險情況,形成易于機器計算的風(fēng)控模型;而知識圖譜通過權(quán)威經(jīng)驗和規(guī)則創(chuàng)建本體模型和抽取實體的范圍,根據(jù)實體間關(guān)系形成關(guān)聯(lián)數(shù)據(jù)網(wǎng)的圖譜形式,描畫囊括個人基礎(chǔ)信息、金融行為、社交網(wǎng)絡(luò)行為等用戶綜合畫像,根據(jù)畫像情況和模型對應(yīng),形成具有金融業(yè)務(wù)特性的風(fēng)控體系,在解決方案的決策環(huán)節(jié)結(jié)合規(guī)則和概率的綜合評價,給出最終的風(fēng)險評估,整個過程能夠?qū)崿F(xiàn)秒級響應(yīng)。

知識圖譜的應(yīng)用不僅能夠為缺乏可解釋性的機器學(xué)習(xí)算法帶來必要的參考系,還可以串聯(lián)金融業(yè)務(wù)中產(chǎn)生的大量多源異構(gòu)數(shù)據(jù)形成數(shù)據(jù)中臺,挖掘數(shù)據(jù)深層價值,為實現(xiàn)精準(zhǔn)營銷、投資關(guān)系梳理、產(chǎn)業(yè)鏈風(fēng)險預(yù)警、智能催收等上層應(yīng)用打下基礎(chǔ)。

image013.png知識圖譜在智能金融解決方案中的應(yīng)用

知識圖譜應(yīng)用——投研領(lǐng)域

對一級市場或二級市場的投資研究,一直是泛金融領(lǐng)域重要的課題,上市公司或一些重要的標(biāo)的公司在公開網(wǎng)絡(luò)中披露了眾多如財務(wù)數(shù)據(jù)、定期公告、公司研報等有價值的信息,為投資者行為提供了充分的參考依據(jù)。

傳統(tǒng)投研工作需要分析師通過各種渠道去搜集和判別信息,憑借個人經(jīng)驗對零散的數(shù)據(jù)進行組織建模,以報告的形式產(chǎn)出趨勢觀點和數(shù)據(jù)分析,大部分的物料和時間成本都花費在信息和數(shù)據(jù)的搜集上,而且成果可控性不高,縱使頭部金融數(shù)據(jù)機構(gòu)提供了相應(yīng)的軟件產(chǎn)品,但數(shù)據(jù)的顆粒度和產(chǎn)業(yè)鏈關(guān)聯(lián)性仍難以滿足多元需求,這成為了該行業(yè)長久存在的痛點。

投研知識圖譜以公司信息、產(chǎn)業(yè)鏈關(guān)聯(lián)為切入點,利用NLP技術(shù)自動抓取關(guān)鍵信息,搭建投研領(lǐng)域知識圖譜,將各個行業(yè)的發(fā)展變化抽象導(dǎo)入數(shù)字層面,為知識查詢和應(yīng)用開發(fā)提供實現(xiàn)基礎(chǔ)。據(jù)統(tǒng)計,券商研報中80%的數(shù)據(jù)指標(biāo)在傳統(tǒng)軟件產(chǎn)品中無法查詢到,分析師在進入一個新領(lǐng)域時要耗費一周左右的時間搜集類似數(shù)據(jù),而利用投研知識圖譜可以將其必要勞動時間縮短到一分鐘,大幅提高投研效率。

除靜態(tài)領(lǐng)域圖譜外,還可以利用時間序列搭建對網(wǎng)絡(luò)報道、新聞事件進行抓取的事理圖譜,兩相結(jié)合,從行業(yè)固有邏輯和實時信息雙管齊下,推導(dǎo)事情的發(fā)展脈絡(luò)和趨勢走向,為投研機構(gòu)和投資者清晰的梳理關(guān)聯(lián)脈絡(luò),為后續(xù)判斷投資機會和持倉股票風(fēng)險等研判類應(yīng)用提供數(shù)據(jù)支撐。

image015.png投研知識圖譜與傳統(tǒng)產(chǎn)品的對比

知識圖譜應(yīng)用——司法領(lǐng)域

司法領(lǐng)域是以公檢法等國家司法機關(guān)及司法人員依照法定職權(quán)和法定程序,運用法律處理案件的專業(yè)領(lǐng)域。

近年,司法領(lǐng)域積極運用大數(shù)據(jù)、云計算、人工智能等先進技術(shù),深入業(yè)務(wù)場景解決痛點問題,有效提升辦案質(zhì)效、輔助司法管理、服務(wù)群眾訴訟,加速推進司法智慧化、數(shù)字化、現(xiàn)代化轉(zhuǎn)型升級。

知識圖譜的構(gòu)建是實現(xiàn)智慧司法不可或缺的基礎(chǔ)工程。司法知識圖譜將法律領(lǐng)域中的實體、屬性和關(guān)系進行體系化梳理,并建立邏輯關(guān)聯(lián),通過知識圖譜和大數(shù)據(jù)技術(shù)進行數(shù)據(jù)挖掘,輔助決策,洞察知識領(lǐng)域動態(tài)發(fā)展規(guī)律。基于司法知識圖譜,通過技術(shù)手段可實現(xiàn)司法業(yè)務(wù)場景的智能應(yīng)用,解決“案多人少”“同案不同判”等現(xiàn)實問題。

目前,司法知識圖譜已廣泛運用于法律知識檢索和推送、文書自動生成、裁判結(jié)果預(yù)測預(yù)警、知識智能問答、數(shù)據(jù)可視化等方面,為司法人員辦案提供高效參考和科學(xué)依據(jù),全新定義司法數(shù)據(jù)應(yīng)用和司法智能化,凝練司法智慧,服務(wù)法治建設(shè)。

image017.png知識圖譜在司法領(lǐng)域中的應(yīng)用

知識圖譜應(yīng)用——教育領(lǐng)域

當(dāng)前的教育場景可以劃分為教、管、學(xué)、考,主要圍繞教育者和受教育者進行授課、答疑、閱卷和學(xué)習(xí)、練習(xí)、考試等活動,本質(zhì)上是通過系統(tǒng)化的知識傳授與強化練習(xí),使受教育者掌握知識點的過程。

傳統(tǒng)教育模式以教師集中授課為主要方式,存在著特級教師資源少、優(yōu)質(zhì)教學(xué)資源分配不佳、教學(xué)內(nèi)容和教學(xué)節(jié)奏制式化,以及作業(yè)練習(xí)布置缺乏個性化等問題。在教育信息化和線上教育發(fā)展普及之后,AI+教育的概念隨之產(chǎn)生,人工智能公司和教育機構(gòu)希望通過利用AI技術(shù)部分解決上述痛點,以達到對教育參與者減負增效的目的。

教育領(lǐng)域參與個體眾多,采集到的數(shù)據(jù)駁雜且零碎,難以直接有效應(yīng)用,所以目前AI技術(shù)更多應(yīng)用在如拍照搜題、口語評測、課堂監(jiān)控等外圍需求的工具上面,并未能有效深入到教學(xué)場景中。而類似課題推送等應(yīng)用更多是將教學(xué)資源再分配,重視知識的點狀強化練習(xí),卻不深究知識的掌握程度,以至實際使用者反饋平平。

人工智能技術(shù)真正產(chǎn)生生產(chǎn)價值,一定要建立在充分且必要的數(shù)據(jù)基礎(chǔ)上,搭建貫穿教材知識體系、教學(xué)資源管理和受教育者學(xué)習(xí)軌跡的知識圖譜,將教與學(xué)的全過程進行可視化展現(xiàn),使靜態(tài)知識點數(shù)據(jù)與動態(tài)教學(xué)活動(如考試、作業(yè)等)數(shù)據(jù)產(chǎn)生關(guān)聯(lián),為算法應(yīng)用提供支撐環(huán)境,是AI+教育能落地到產(chǎn)業(yè)核心的關(guān)鍵前提。

image019.png

(本文為艾瑞網(wǎng)獨家原創(chuàng)稿件 轉(zhuǎn)載請注明出處)

免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請發(fā)送郵件至:operations@xinnet.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

免費咨詢獲取折扣

Loading