2012-10-24 14:15:15 來源:eNet硅谷動(dòng)力
大數(shù)據(jù)應(yīng)用在全球各國(guó)發(fā)酵之際,伴隨而來的問題,就是各國(guó)普遍缺乏數(shù)據(jù)科學(xué)家,在國(guó)內(nèi),大數(shù)據(jù)的應(yīng)用雖然才剛剛萌芽,但是要面臨的幾項(xiàng)重大挑戰(zhàn)。
挑戰(zhàn) 1 - 數(shù)據(jù)分析人才不足
因應(yīng)大數(shù)據(jù)處理的需求,不論企業(yè)決定采用哪一種解決方案,最終需要有數(shù)據(jù)科學(xué)家來運(yùn)用這些大數(shù)據(jù),才能活化大數(shù)據(jù)的價(jià)值,重新建構(gòu)數(shù)據(jù)之間的關(guān)系,并賦予新的意義,進(jìn)而轉(zhuǎn)換成企業(yè)的競(jìng)爭(zhēng)武器。
在大數(shù)據(jù)處理環(huán)節(jié)中,數(shù)據(jù)科學(xué)家是能否點(diǎn)燃大數(shù)據(jù)價(jià)值的關(guān)鍵。然而,數(shù)據(jù)科學(xué)家的養(yǎng)成并不容易,因?yàn)閿?shù)據(jù)科學(xué)家必須同時(shí)具備3種條件,包括深入了解企業(yè)內(nèi)的業(yè)務(wù)與組織、具備數(shù)據(jù)探勘等統(tǒng)計(jì)應(yīng)用知識(shí)、熟悉數(shù)據(jù)分析工具操作。
一般而言,擁有一項(xiàng)專長(zhǎng)的人很多,但是,同時(shí)擁有3種專長(zhǎng)的人,就非常稀少。然而,作為數(shù)據(jù)科學(xué)家就必須有整合運(yùn)用的能力。否則如果只是熟悉數(shù)據(jù)分析工具操作,但卻不懂企業(yè)內(nèi)的業(yè)務(wù)運(yùn)作細(xì)節(jié),就無法從既有數(shù)據(jù)中挖掘出新的數(shù)據(jù)價(jià)值。而若只懂業(yè)務(wù)卻不熟悉數(shù)據(jù)分析工具,也很難重新架構(gòu)數(shù)據(jù)的價(jià)值。同樣的道理,如果缺乏數(shù)據(jù)探勘的技巧,最多只能做到OLAP(Online Analytical Processing)的展現(xiàn)。
目前國(guó)內(nèi)的數(shù)據(jù)分析師,較擅長(zhǎng)的是處理已經(jīng)發(fā)生的問題,找出問題源頭,并且盡速排除問題,但是,相對(duì)缺乏發(fā)掘未知問題的能力。根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)Gartner的數(shù)據(jù),有高達(dá)72%的企業(yè)認(rèn)為,大數(shù)據(jù)的應(yīng)用價(jià)值,在于預(yù)測(cè)未來。然而,這樣的應(yīng)用需求與國(guó)內(nèi)數(shù)據(jù)科學(xué)家的人才才不相匹配,預(yù)計(jì)將成為國(guó)內(nèi)發(fā)展大數(shù)據(jù)應(yīng)用的最大挑戰(zhàn)。
數(shù)據(jù)科學(xué)家必須同時(shí)具備3種條件,包括深入了解企業(yè)內(nèi)的業(yè)務(wù)與組織、具備數(shù)據(jù)探勘等統(tǒng)計(jì)應(yīng)用知識(shí)、熟悉數(shù)據(jù)分析工具操作。數(shù)據(jù)科學(xué)家的工作職缺,從2011年開始急速攀升,成為前10大熱門職缺。這項(xiàng)統(tǒng)計(jì)是匯集1千多個(gè)人力招聘公司的數(shù)百萬個(gè)職缺結(jié)果。
挑戰(zhàn) 2-當(dāng)?shù)?strong>大數(shù)據(jù)顧問服務(wù)不足
在大數(shù)據(jù)的應(yīng)用風(fēng)潮下,新興的技術(shù)與人才也備受矚目,其中又以Hadoop架構(gòu)的技術(shù)人才最為缺乏,目前不論企業(yè)或信息廠商都相當(dāng)缺乏非結(jié)構(gòu)數(shù)據(jù)處理的技術(shù)人才,因此,即使是概念驗(yàn)證階段,大多需要依賴國(guó)外顧問飛來國(guó)內(nèi),所花費(fèi)的時(shí)間與成本,都讓大數(shù)據(jù)處理的效益大打折扣。
國(guó)內(nèi)之所以會(huì)面臨Hadoop人才不足的問題,主要是因?yàn)镠adoop的發(fā)展源自美國(guó),所以Hadoop相關(guān)的技術(shù)資源,也都聚集在北美。目前Hadoop的應(yīng)用,雖然逐漸延伸到亞洲國(guó)家,然而相關(guān)的技術(shù)人才與顧問服務(wù)都還在萌芽。
為了解決Hadoop當(dāng)?shù)仡檰柗?wù)不足的問題,企業(yè)也可以考慮培養(yǎng)自己的Hadoop團(tuán)隊(duì)。然而,由于Hadoop的應(yīng)用在國(guó)內(nèi)才剛剛開始,因此,企業(yè)對(duì)于是否要培養(yǎng)自己的Hadoop團(tuán)隊(duì),尚言之過早。一方面是因?yàn)槠髽I(yè)的大數(shù)據(jù)處理,還沒有導(dǎo)入Hadoop的迫切性,另一方面則是對(duì)Hadoop的長(zhǎng)期發(fā)展還在觀望當(dāng)中。
奇美電子信息管理處副總處長(zhǎng)李宴昌不諱言地指出,信息產(chǎn)業(yè)每隔幾年就會(huì)出現(xiàn)一個(gè)新技術(shù),但未來能否普及卻不一定,企業(yè)不可能承擔(dān)這種風(fēng)險(xiǎn),在這個(gè)階段就決定培養(yǎng)Hadoop技術(shù)人才,除非可以確定這種人才的長(zhǎng)期需求,否則寧愿先觀望再布局。
挑戰(zhàn) 3-對(duì)數(shù)據(jù)價(jià)值的敏感度不足
大數(shù)據(jù)的價(jià)值,除了解決現(xiàn)在無法解決的問題,還要能發(fā)掘原本不知道的問題。業(yè)內(nèi)人士認(rèn)為,數(shù)據(jù)分析的前提是,數(shù)據(jù)保留的完整性與正確性。然而,在國(guó)內(nèi)的企業(yè)文化中,長(zhǎng)期以來都沒有依賴數(shù)據(jù)來做決策判斷的習(xí)慣,對(duì)于數(shù)據(jù)的價(jià)值也理解不足,甚至是忽略數(shù)據(jù)的存在,因此,有些企業(yè)根本沒有保留數(shù)據(jù)與應(yīng)用數(shù)據(jù)的長(zhǎng)期規(guī)劃。
舉例來說,在國(guó)內(nèi)部署非常普遍的ERP系統(tǒng),是所有應(yīng)用系統(tǒng)中,與企業(yè)營(yíng)運(yùn)最息息相關(guān)的系統(tǒng),理論上,ERP系統(tǒng)中的數(shù)據(jù)品質(zhì),也就是數(shù)據(jù)的正確性以及一致性等,應(yīng)該都是企業(yè)內(nèi)各應(yīng)用系統(tǒng)中最好的。但實(shí)際的情況并非如此,ERP系統(tǒng)的帳務(wù)數(shù)據(jù),并不能與企業(yè)的營(yíng)運(yùn)畫上等號(hào)。
一般而言,企業(yè)在導(dǎo)入大數(shù)據(jù)應(yīng)用時(shí),如果既有應(yīng)用系統(tǒng)的數(shù)據(jù)品質(zhì)越好,技術(shù)面導(dǎo)入的成功機(jī)率就越高。而若沒有好的數(shù)據(jù)品質(zhì),卻要做大數(shù)據(jù)分析,就要有面對(duì)辛苦的準(zhǔn)備,因?yàn)?strong>大數(shù)據(jù)分析絕對(duì)還是必要的。
大數(shù)據(jù)分析的價(jià)值,在于活化數(shù)據(jù)再利用。信息科技的發(fā)展,本來就是為了處理信息,而不是為了提升硬體效能,如果導(dǎo)入大數(shù)據(jù)的決策單位,是由信息部門主導(dǎo),很有可能就會(huì)專注在系統(tǒng)效能提升層面。如果由執(zhí)行長(zhǎng)等級(jí)的決策者領(lǐng)軍,相對(duì)較易把大數(shù)據(jù)的應(yīng)用與業(yè)務(wù)命脈整合。
根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)Ventana所揭露的數(shù)據(jù),目前導(dǎo)入大數(shù)據(jù)的決策者,高達(dá)66%是信息部門的中階主管,由信息高級(jí)主管等級(jí)來做決策的比例,僅有33%。
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),請(qǐng)及時(shí)通知本站,予以刪除。
