海致金融業(yè)務(wù)副總裁 楊娟
人工智能演進(jìn)的速度遠(yuǎn)超過(guò)所有人的想象,圍棋——這個(gè)人類智慧最后的堡壘,已經(jīng)被人工智能快速攻破了。AlphaGo Zero的成功預(yù)示著沒(méi)有樣本的非監(jiān)督學(xué)習(xí)獲得了歷史性的突破,預(yù)示著AI在行業(yè)的應(yīng)用即將迎來(lái)不可限量的發(fā)展規(guī)模和速度,也許是我們現(xiàn)在無(wú)法想象的爆發(fā)點(diǎn),但我們正站在這個(gè)爆發(fā)點(diǎn)的前夜。
知識(shí)圖譜是人類認(rèn)知世界的基本框架
世界是由物元、事元、關(guān)系元組成。這三個(gè)基本的維度互相交織,不斷變動(dòng)。我們從時(shí)間和空間的不同維度去觀察它們,捕捉它們,進(jìn)而了解它們的運(yùn)行,預(yù)測(cè)它們未來(lái)的發(fā)展變化,然后采取我們的最優(yōu)行動(dòng)。
AI的本質(zhì)是什么? AI的本質(zhì)是要讓機(jī)器替人做決策,做行動(dòng)。機(jī)器在做決策之前,首先要理解世界,詮釋世界,之后才能改變世界。
知識(shí)圖譜將物元、事元、關(guān)系元清晰的展現(xiàn)出來(lái),是人類認(rèn)知世界的基本框架。我們將人類認(rèn)知世界的模型傳遞給機(jī)器,讓機(jī)器也能夠像人一樣理解世界,之后再去做決策,做行動(dòng)。
例如樂(lè)視事件,據(jù)不完全統(tǒng)計(jì),包括樂(lè)視網(wǎng)在內(nèi)的樂(lè)視體系近幾年融資額(直接融資+間接融資)高達(dá)728.59億元,然而不斷地依賴融資為債務(wù)輸血。在交易方面,2016年樂(lè)視系交易額中有44%是關(guān)聯(lián)交易,即有44%的營(yíng)業(yè)額其實(shí)是發(fā)生在樂(lè)視系以及其相關(guān)企業(yè)之間。
從機(jī)器的角度來(lái)判斷該事件,這已經(jīng)符合了一切高風(fēng)險(xiǎn)特征,即實(shí)際控制人在不斷套現(xiàn),不停占用新的融資償還債務(wù);交易、營(yíng)業(yè)額當(dāng)中有將近一半是關(guān)聯(lián)交易。如果是機(jī)器來(lái)做決策的話,結(jié)果顯而易見(jiàn)。而人在做決策時(shí)可能受到感性因素的影響,所以在聚光燈下萬(wàn)眾矚目的企業(yè),依然騙了很多人。
那么對(duì)于成千上萬(wàn)并不在聚光燈下的企業(yè),銀行應(yīng)該怎么辦?
每一家商業(yè)銀行至少有幾千家對(duì)公客戶,上萬(wàn)甚至十萬(wàn)以上的小微企業(yè)客戶,十萬(wàn)、百萬(wàn),甚至上億的個(gè)人客戶,對(duì)于這么多數(shù)量的客戶,我們?cè)趺礃臃婪讹L(fēng)險(xiǎn)、挖掘價(jià)值呢?這已然不是人力能夠覆蓋的事情,卻正是知識(shí)圖譜、人工智能能夠發(fā)揮價(jià)值的地方。
知識(shí)圖譜將成為商業(yè)銀行標(biāo)配
有專家曾經(jīng)表示,知識(shí)圖譜是人工智能的基石。如同人工智能歷經(jīng)了多年的發(fā)展起伏,知識(shí)圖譜的發(fā)展也不是一蹴而就的。
20世紀(jì)70年代,知識(shí)圖譜的前身——專家系統(tǒng)誕生,它積累了大量的某個(gè)領(lǐng)域?qū)<宜降闹R(shí)與經(jīng)驗(yàn),根據(jù)知識(shí)和經(jīng)驗(yàn),模擬人類專家的決策;
1998年語(yǔ)義網(wǎng)誕生了,它是NLP(自然語(yǔ)言處理)的前身,不但能夠理解詞語(yǔ)和概念,而且還能夠理解它們之間的邏輯關(guān)系,可以使交流變得更有效率和價(jià)值;
2012年,谷歌推出了KnowledgeGraph,知識(shí)圖譜正式誕生;
2013年,百度推出了中文知識(shí)圖譜,海致的首席科學(xué)家即來(lái)自于百度中文圖譜創(chuàng)始團(tuán)隊(duì);
2015年,海致團(tuán)隊(duì)開(kāi)始垂直研發(fā)金融知識(shí)圖譜,成為金融知識(shí)圖譜的開(kāi)創(chuàng)者;
2016年8月,海致幫助招商銀行總行建立國(guó)內(nèi)首個(gè)金融知識(shí)圖譜平臺(tái);而后,又陸續(xù)幫助蘭州銀行、青島銀行、南京銀行、長(zhǎng)沙銀行等商業(yè)銀行建立金融知識(shí)圖譜平臺(tái)。
可見(jiàn)這是一個(gè)加速發(fā)展的過(guò)程,金融知識(shí)圖譜將會(huì)成為商業(yè)銀行的標(biāo)配,用于防控風(fēng)險(xiǎn)、精準(zhǔn)營(yíng)銷,也將成為FinTech、監(jiān)管金融當(dāng)中的中堅(jiān)力量。
從百度中文知識(shí)圖譜轉(zhuǎn)向金融知識(shí)圖譜,是海致進(jìn)入知識(shí)圖譜領(lǐng)域的轉(zhuǎn)折點(diǎn)。這是從通用知識(shí)圖譜到行業(yè)知識(shí)圖譜進(jìn)行轉(zhuǎn)化的過(guò)程,它的頂層基礎(chǔ)是相通的,都是海量數(shù)據(jù)處理、語(yǔ)義識(shí)別、復(fù)雜關(guān)系的建立、機(jī)器學(xué)習(xí)和算法進(jìn)行標(biāo)簽化的提取以及更復(fù)雜的模型;但它們之間也有一些不同之處,這也是海致在構(gòu)建金融知識(shí)圖譜的過(guò)程中取得核心競(jìng)爭(zhēng)力的地方,即面向特定的業(yè)務(wù)領(lǐng)域,基于行業(yè)知識(shí)構(gòu)建知識(shí)圖譜,以知識(shí)的深度而非廣度取勝。
海致智能金融知識(shí)圖譜1.0整體架構(gòu)
海致專注向金融產(chǎn)業(yè)進(jìn)行垂直化的深度研發(fā),以知識(shí)圖譜技術(shù)為底層,挖掘風(fēng)險(xiǎn)與營(yíng)銷信息的產(chǎn)生與傳導(dǎo)、打造風(fēng)控與營(yíng)銷模型、探索人工智能與機(jī)器學(xué)習(xí)的實(shí)踐場(chǎng)景,推出海致金融知識(shí)圖譜1.0平臺(tái)。該平臺(tái)是一個(gè)模塊的組合,可以靈活的進(jìn)行拆分與對(duì)接,并且是開(kāi)放式的框架,能夠和現(xiàn)有的金融機(jī)構(gòu)大數(shù)據(jù)框架、開(kāi)源技術(shù)進(jìn)行對(duì)接和整合。作為業(yè)界首個(gè)行業(yè)知識(shí)圖譜平臺(tái),海致金融知識(shí)圖譜1.0將能夠幫助銀行更好地邁向智能金融。
海致智能金融知識(shí)圖譜1.0的總體框架分成三層,底層是海致核心的技術(shù)引擎,包括自然語(yǔ)言處理、圖分析與圖挖掘、機(jī)器學(xué)習(xí)。在這三個(gè)引擎之上,融合了互聯(lián)網(wǎng)的數(shù)據(jù),金融機(jī)構(gòu)內(nèi)部的數(shù)據(jù),第三方合作的數(shù)據(jù),以及業(yè)務(wù)積累。在與銀行業(yè)務(wù)進(jìn)行結(jié)合之后,海致形成了三個(gè)重要的智力資產(chǎn),即海致金融語(yǔ)料庫(kù)、海致金融算法庫(kù)、海致金融標(biāo)簽庫(kù)。在核心資產(chǎn)之上,海致形成了四類知識(shí)圖譜,反欺詐知識(shí)圖譜、風(fēng)險(xiǎn)管理知識(shí)圖譜、智能營(yíng)銷知識(shí)圖譜、反洗錢知識(shí)圖譜。這四類知識(shí)圖譜支撐著不同的業(yè)務(wù)系統(tǒng),如金融機(jī)構(gòu)已有的CRM系統(tǒng)、信貸管理系統(tǒng)、風(fēng)險(xiǎn)預(yù)警系統(tǒng)、反欺詐系統(tǒng)、反洗錢系統(tǒng)、移動(dòng)營(yíng)銷系統(tǒng),甚至OA系統(tǒng)等。
也就是說(shuō),海致智能金融知識(shí)圖譜1.0既可以獨(dú)立成為一個(gè)知識(shí)管理的平臺(tái),也可以無(wú)縫融合行業(yè)已有的業(yè)務(wù)系統(tǒng)、業(yè)務(wù)流程,最大限度地接入到日常工作場(chǎng)景中。
海致智能金融知識(shí)圖譜十二大功能簡(jiǎn)介
(1)企業(yè)股權(quán)關(guān)系、一致行動(dòng)人、實(shí)際控制人等挖掘
企業(yè)股權(quán)關(guān)系查詢能夠查詢?nèi)我黄髽I(yè)與關(guān)聯(lián)企業(yè)之間的投資關(guān)系,在此基礎(chǔ)上進(jìn)行了企業(yè)股權(quán)關(guān)系、一致行動(dòng)人、實(shí)際控制人等的挖掘。
(2)任意兩企業(yè)之間關(guān)聯(lián)關(guān)系查詢
20個(gè)以內(nèi)的企業(yè)可以進(jìn)行秒級(jí)反饋,查詢出企業(yè)間的最短的關(guān)聯(lián)路徑。
(3)擔(dān)保圈、擔(dān)保鏈、擔(dān)保群挖掘
擔(dān)保鏈、擔(dān)保圈、擔(dān)保群是信貸工作中需要密切關(guān)注的業(yè)務(wù)場(chǎng)景。過(guò)去由于計(jì)算技術(shù)以及模型的局限,信貸工作主要靠人力操作或者通過(guò)實(shí)時(shí)程序編寫進(jìn)行查詢。現(xiàn)在通過(guò)圖挖掘和圖分析算法,可以進(jìn)行實(shí)時(shí)、深度的圈、鏈、群挖掘,并且智能地推送給相應(yīng)的責(zé)任人。
(4)企業(yè)集團(tuán)、企業(yè)派系挖掘
企業(yè)派系非常的復(fù)雜,有時(shí)會(huì)涉及到幾百甚至上千企業(yè)。企業(yè)派系以及企業(yè)集團(tuán)關(guān)系的深度挖掘,是銀行進(jìn)行風(fēng)險(xiǎn)管理、貸后預(yù)警中的重要武器。
(5)黑名單企業(yè)傳導(dǎo)分析
黑名單企業(yè)傳導(dǎo)分析是通過(guò)銀行已有的種子黑名單庫(kù)、黑名單企業(yè),或者黑名單個(gè)人,找出和其相關(guān)聯(lián)的可能涉黑或者涉灰的企業(yè)和個(gè)人,同時(shí)根據(jù)關(guān)系親疏程度和重要程度,以及量化指標(biāo),評(píng)估出關(guān)聯(lián)企業(yè)或個(gè)人的涉黑概率。
(6)授信集中度指標(biāo)分析
授信集中度指標(biāo)分析是銀行在授信審批環(huán)節(jié)中評(píng)估現(xiàn)已發(fā)放的貸款的集中程度。對(duì)于銀行來(lái)說(shuō),一般授信集中度有一個(gè)上限,越過(guò)上限或者即將到達(dá)上限需要提前發(fā)出預(yù)警。
(7)疑似欺詐交易發(fā)現(xiàn)及欺詐團(tuán)伙追蹤發(fā)現(xiàn)
反欺詐領(lǐng)域特點(diǎn)之一是數(shù)據(jù)量非常之大,通常是企業(yè)場(chǎng)景的幾何級(jí)倍數(shù);另外,對(duì)于實(shí)時(shí)性要求也非常高,一旦發(fā)現(xiàn)是可疑交易,就必須快速發(fā)出信號(hào)阻斷交易。海致在蘭州銀行知識(shí)圖譜二期項(xiàng)目上就進(jìn)行了類似的重點(diǎn)部署,通過(guò)大數(shù)據(jù)以及實(shí)時(shí)性欺詐檢測(cè),幫助零售金融部以及電子銀行部等進(jìn)行風(fēng)險(xiǎn)防范。
(8)風(fēng)險(xiǎn)事件庫(kù)與風(fēng)險(xiǎn)事件智能推送
海致構(gòu)建了風(fēng)險(xiǎn)事件庫(kù),以及內(nèi)嵌風(fēng)險(xiǎn)事件智能推測(cè)規(guī)則。
(9)標(biāo)簽庫(kù)
標(biāo)簽最早是用在電商行業(yè),用來(lái)識(shí)別不同消費(fèi)者的偏好,進(jìn)行消費(fèi)者畫像的構(gòu)建。如今海致把標(biāo)簽的理念貫徹在了銀行對(duì)公業(yè)務(wù)領(lǐng)域,用標(biāo)簽的方式標(biāo)識(shí)企業(yè)、企業(yè)主以及企業(yè)的領(lǐng)導(dǎo)。標(biāo)簽分為不同的層次:基礎(chǔ)標(biāo)簽、業(yè)務(wù)規(guī)則標(biāo)簽、智能標(biāo)簽。基礎(chǔ)標(biāo)簽包括生命周期、貢獻(xiàn)度、交易行為等;業(yè)務(wù)規(guī)則標(biāo)簽包含營(yíng)收增長(zhǎng)、累計(jì)利潤(rùn)、貸款評(píng)級(jí)等;智能標(biāo)簽包括風(fēng)險(xiǎn)、營(yíng)銷、派系、供應(yīng)鏈等。通過(guò)標(biāo)簽化的方式,銀行能夠最大程度把數(shù)據(jù)、信息知識(shí)化、智能化,轉(zhuǎn)化成直接的業(yè)務(wù)決策和行動(dòng)。
(10)語(yǔ)料庫(kù)
因?yàn)闃?gòu)建知識(shí)圖譜的數(shù)據(jù)中,部分來(lái)源于互聯(lián)網(wǎng)數(shù)據(jù),部分來(lái)源于企業(yè)的財(cái)報(bào)、年報(bào)、輿情等,也可能來(lái)自于行內(nèi)的盡調(diào)報(bào)告、拜訪記錄、群眾意見(jiàn)等,大多是非結(jié)構(gòu)化的文本數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行提取,一方面需要良好的基礎(chǔ)技術(shù),另一方面需要在建立語(yǔ)料庫(kù)方面有豐富的積累。
海致目前在語(yǔ)料庫(kù)有通用類的基礎(chǔ)語(yǔ)料,有和信貸報(bào)告類、研究報(bào)告類、制度類、日常營(yíng)銷以及互聯(lián)網(wǎng)相關(guān)類的語(yǔ)料,同時(shí)也在不斷豐富和完善中。
(11)詞法分析
海致正在和蘭州銀行進(jìn)行授信文本解析這項(xiàng)工作,它用機(jī)器的方式自動(dòng)解讀文本,提取關(guān)鍵要素用來(lái)做自動(dòng)化、監(jiān)管、審計(jì),實(shí)現(xiàn)了大幅的效率和風(fēng)險(xiǎn)控制上的提升。
(12)算法庫(kù)
算法庫(kù)分為基礎(chǔ)平臺(tái)、通用算法、金融算法三個(gè)層次。
基礎(chǔ)平臺(tái)包含圖算法、機(jī)器學(xué)習(xí)算法等;在此基礎(chǔ)之上的通用算法包含社區(qū)檢測(cè)、關(guān)鍵節(jié)點(diǎn)分析、關(guān)聯(lián)度分析、特殊結(jié)構(gòu)發(fā)現(xiàn)、邏輯回歸等。海致專注于金融知識(shí)圖譜領(lǐng)域,所以在通用算法之上結(jié)合業(yè)務(wù)邏輯、業(yè)務(wù)理解和業(yè)務(wù)理念以及在業(yè)務(wù)的實(shí)踐、體驗(yàn),積累了相關(guān)金融算法,包括客戶忠誠(chéng)度、客戶貢獻(xiàn)度、實(shí)際控制人、一致行動(dòng)人、集團(tuán)派系、客戶風(fēng)險(xiǎn)評(píng)估、違約概率傳導(dǎo)、行業(yè)風(fēng)險(xiǎn)、授信集中度、營(yíng)銷價(jià)值評(píng)估、黑名單傳導(dǎo)等。在實(shí)踐當(dāng)中,算法庫(kù)有在金融機(jī)構(gòu)之間一致通用性,再根據(jù)每家金融機(jī)構(gòu)不同的情況進(jìn)行微調(diào)和配置。
知識(shí)圖譜助力金融機(jī)構(gòu)擁抱AI
金融知識(shí)圖譜的核心技術(shù)包括自然語(yǔ)言處理、圖分析和圖挖掘、機(jī)器學(xué)習(xí)以及領(lǐng)域理解。
大數(shù)據(jù)、人工智能時(shí)代有很多數(shù)據(jù)來(lái)源,大多是非結(jié)構(gòu)化的。未來(lái)我們可能也會(huì)把音頻、視頻這些數(shù)據(jù)都納入到金融知識(shí)圖譜數(shù)據(jù)源當(dāng)中,自然語(yǔ)言處理技術(shù)是銀行提升效率與智能水平的關(guān)鍵技術(shù)之一;基于關(guān)系和基于圖的分析和挖掘是非常新興的領(lǐng)域,它的應(yīng)用正呈現(xiàn)出旺盛的增長(zhǎng)趨勢(shì);機(jī)器學(xué)習(xí),無(wú)處不在,在自然語(yǔ)言處理中,語(yǔ)料的訓(xùn)練需要用到深度學(xué)習(xí)模型;在圖分析和圖挖掘中,最短路徑等算法都是機(jī)器學(xué)習(xí)的范疇;還有最重要的是領(lǐng)域的理解,知識(shí)圖譜技術(shù)與金融業(yè)務(wù)在實(shí)踐中進(jìn)行結(jié)合的深入程度,決定著智能金融發(fā)展進(jìn)程的快慢。
海致作為中國(guó)金融知識(shí)圖譜開(kāi)創(chuàng)者,是目前國(guó)內(nèi)擁有銀行客戶案例數(shù)最多的金融知識(shí)圖譜大數(shù)據(jù)公司。通過(guò)在與客戶合作的過(guò)程中,積累了深刻的領(lǐng)域理解與技術(shù)經(jīng)驗(yàn),致力幫助金融機(jī)構(gòu)擁抱金融科技,擁抱人工智能,尋求變化,追求創(chuàng)新。
第三十四屆CIO班招生
國(guó)際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:content
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來(lái)自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),請(qǐng)及時(shí)通知本站,予以刪除。