魔變科技于2020年1月1日成立,團(tuán)隊(duì)全部來自于斗米,是斗米投資的AI數(shù)據(jù)服務(wù)公司。同時(shí),魔變科技與黑龍江綏棱縣政府共同打造300人規(guī)模全職自有標(biāo)注中心。
說到人工智能數(shù)據(jù)采集標(biāo)注業(yè)務(wù),很多非專業(yè)人士可能不是很了解這個(gè)業(yè)務(wù)。舉個(gè)例子,我們?nèi)粘T诳爝f柜領(lǐng)取快遞,之前一般都是憑密碼或掃描二維碼領(lǐng)取,現(xiàn)在大部分都是基于掃描人臉領(lǐng)取,這個(gè)就是基于人臉識(shí)別鑒活。數(shù)據(jù)采集標(biāo)注業(yè)務(wù)就是專門去采集相應(yīng)數(shù)據(jù)標(biāo)注后給計(jì)算機(jī)提供數(shù)據(jù)支持?;诤笈_(tái)的算法最終我們將快遞領(lǐng)取。為我們的生活提高了便利。
采集標(biāo)注完之后,這些被采集標(biāo)注的數(shù)據(jù),就會(huì)被人工智能企業(yè)拿去“喂養(yǎng)”人工智能算法,數(shù)據(jù)多了之后,人工智能工具就會(huì)像人類一樣,識(shí)別語音、圖像等。比如,你使用小米的小愛音箱,你跟它說的每一句話,它之所以能識(shí)別出來,并不是因?yàn)樗娴亩撬呀?jīng)被大量的類似語料庫“訓(xùn)練”過,才能識(shí)別我們的問題,當(dāng)然如果在語料庫中或是無法檢索的問題,就無法回答。
數(shù)據(jù)采標(biāo)業(yè)的“三國殺”
從上面的案例中不難發(fā)現(xiàn),所有涉及人工智能研發(fā)、應(yīng)用業(yè)務(wù)的公司,都需要用到被采集標(biāo)注的數(shù)據(jù),“喂養(yǎng)”自己的人工智能算法,讓它的識(shí)別度和應(yīng)答程度更加接近真人。因此,人工智能數(shù)據(jù)采集標(biāo)注業(yè)務(wù),就像我們學(xué)習(xí)的教材、試題一樣,一定是非?;A(chǔ)、不可或缺的一環(huán)且市場空間巨大的。
根據(jù)艾瑞咨詢最新的研究報(bào)告顯示,2018年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為25.86億元,其中,數(shù)據(jù)資源定制服務(wù)占比86.2%,行業(yè)年復(fù)合增長率為23.5%,預(yù)計(jì)2025年市場規(guī)模將突破110億元。
根據(jù)智研發(fā)布的《2019-2025年中國數(shù)據(jù)標(biāo)注與審核行業(yè)市場專項(xiàng)分析研究及投資前景預(yù)測報(bào)告》,截止到2018年,我國數(shù)據(jù)標(biāo)注與審核行業(yè)中,有三分之一是AI公司內(nèi)部的標(biāo)注部門承擔(dān),另外有三分之一被商務(wù)流程外包公司瓜分,剩下的三分之一由專門做數(shù)據(jù)采標(biāo)的第三方公司。
盡管說目前是三足鼎立的局面,不過,未來隨著人工智能行業(yè)的發(fā)展,專門做數(shù)據(jù)采標(biāo)的第三方公司市場份額可能會(huì)有更大的占比。
魔變科技崛起的“三原則”
魔變科技主攻AI人工智能數(shù)據(jù)采集業(yè)務(wù),項(xiàng)目內(nèi)容包括圖像,音頻,文本,視頻相關(guān)方向的智慧家居、智慧交通、智能安防、自動(dòng)駕駛等方面的數(shù)據(jù)采集標(biāo)注業(yè)務(wù)。截止目前,數(shù)據(jù)采集標(biāo)注業(yè)務(wù)覆蓋全國及海外,交付過億級(jí)合格數(shù)據(jù),累計(jì)采集人次50萬。
之所以能在短短兩年的時(shí)間,就能取得如此快速的發(fā)展,除了有行業(yè)的快速發(fā)展紅利之外,魔變科技的主要優(yōu)勢也非常明顯。
?。?)合規(guī)先行
無論是數(shù)據(jù)的采集還是使用,合規(guī)是第一準(zhǔn)則。數(shù)據(jù)的合規(guī)使用是該行業(yè)企業(yè)發(fā)展的底線,魔變科技在立項(xiàng)之初,便會(huì)嚴(yán)格審核客戶資質(zhì)。根據(jù)相關(guān)法律法規(guī),對(duì)客戶資質(zhì)、客戶采集需求、目的等相關(guān)信息獲得合法授權(quán)之后,才會(huì)實(shí)施采集工作。除此之外,魔變科技也會(huì)與被采集人員、數(shù)據(jù)采集執(zhí)行人員分別簽訂授權(quán)書和承諾函,每一步都做到合法合規(guī)。
?。?)保護(hù)隱私,用完即銷毀
除了數(shù)據(jù)使用上的合規(guī),站在個(gè)人或者被采集者的角度看,個(gè)人隱私也格外受到大眾的重視。特別是移動(dòng)互聯(lián)網(wǎng)快速發(fā)展的這幾年,國內(nèi)外經(jīng)常出現(xiàn)數(shù)據(jù)泄漏的社會(huì)事件。針對(duì)這種情況,魔變科技會(huì)在數(shù)據(jù)采集前,向被采集人員充分、詳細(xì)的介紹數(shù)據(jù)采集的相關(guān)規(guī)則,采集過程中不留存、不緩存,使用結(jié)束后,得到合作伙伴認(rèn)可后即完全銷毀。
?。?)標(biāo)準(zhǔn)化和規(guī)范化助力降本增效
數(shù)據(jù)采標(biāo)行業(yè)的發(fā)展也在推動(dòng)者人工智能行業(yè)的發(fā)展,在這個(gè)過程中,除了對(duì)數(shù)據(jù)采標(biāo)的數(shù)量有要求,其實(shí)質(zhì)量也非常關(guān)鍵。“喂養(yǎng)”人工智能算法的數(shù)據(jù)精準(zhǔn)度越高,其算法的識(shí)別度也越高。
如何能提升數(shù)據(jù)的質(zhì)量和數(shù)量,又不會(huì)增加成本、降低效率呢?魔變科技的制勝法寶就是標(biāo)準(zhǔn)化和規(guī)范化。在前文中曾提到,數(shù)據(jù)的采標(biāo)主要是依賴于人工的采集標(biāo)注,也就是說,投入的人力是制約數(shù)據(jù)質(zhì)量和工作效率的關(guān)鍵要素。
魔變科技一方面依靠斗米的大流量和專業(yè)的線下服務(wù)團(tuán)隊(duì),成為保障效率的支撐,而且,除了前文提到的黑龍江綏棱縣標(biāo)注中心,魔變科技也在積極探索與其他地方政府的合作;另一方面,在質(zhì)量把控上,魔變科技分六步:數(shù)據(jù)清洗、整理篩查、人工審核、多重質(zhì)檢、結(jié)構(gòu)化提取和交付驗(yàn)收。
這樣一來,原本復(fù)雜的處理過程就變成了一條“流水線”,當(dāng)年福特汽車“降本增效”的神話將會(huì)在魔變科技團(tuán)隊(duì)中再次出現(xiàn)。
揭秘“數(shù)據(jù)教材”的誕生
魔變科技擅于用算法需求,真實(shí)還原場景的定制化數(shù)據(jù)采集標(biāo)注業(yè)務(wù)。截至目前,已經(jīng)為多家知名企業(yè)提供數(shù)據(jù)采集標(biāo)注服務(wù)。
有一家客戶公司需要一個(gè)車載異常行為數(shù)據(jù)集,但是并不能給出完整的需求,需要探索完善需求。面對(duì)這個(gè)難題,魔變科技根據(jù)相關(guān)項(xiàng)目的經(jīng)驗(yàn),以及對(duì)前期駕駛行為的調(diào)查,研究出了相關(guān)異常行為的場景和行為,并給到客戶公司先行確認(rèn),提供建議。在充分的交流討論之后,完善需求。
針對(duì)完善后的需求,魔變團(tuán)隊(duì)制定了數(shù)據(jù)采標(biāo)計(jì)劃、搭建采集場地,并且模擬采集場景,采集了一套完整的測試集。通過這套測試集對(duì)模型進(jìn)行效果測試,根據(jù)反饋的結(jié)果,不斷改變數(shù)據(jù)集占比。
為了又好又快的完成項(xiàng)目,助力客戶企業(yè)的工作效率,魔變科技以日交付采集數(shù)據(jù),次日客戶公司審核通過后,立即進(jìn)入數(shù)據(jù)標(biāo)注流程,標(biāo)注和質(zhì)檢同步進(jìn)行,大大縮短了工作時(shí)間,提高效率。
在數(shù)據(jù)驗(yàn)收結(jié)束后,由公司DPO(數(shù)據(jù)安全)部門相關(guān)人員對(duì)備份數(shù)據(jù)進(jìn)行銷毀處理,并將相關(guān)證明材料發(fā)送至客戶確認(rèn)。
在整個(gè)采標(biāo)過程中為了保證數(shù)據(jù)安全性,魔變科技采標(biāo)基地24小時(shí)監(jiān)控,所有進(jìn)入工作區(qū)人員手機(jī)上交,進(jìn)入采標(biāo)基地均需通過安檢,并做到同類項(xiàng)目交付團(tuán)隊(duì)不重合。
最后,魔變科技在原定的交付期內(nèi),完成百萬級(jí)數(shù)據(jù)交付,交付合格率99%,超預(yù)期完成項(xiàng)目。
從上面的案例中可以感受到,魔變科技就像一個(gè)聰明、聽話的“乖孩子”,每一步操作都非常規(guī)范、嚴(yán)謹(jǐn),執(zhí)行過程中的每一個(gè)細(xì)節(jié)都能考慮全面,真正做到合規(guī)、安全、保密。
如今,魔變科技已經(jīng)正式獨(dú)立成為一家公司,這就像剛走出大學(xué)校園的青年,朝氣蓬勃,開始獨(dú)自承擔(dān)責(zé)任,不斷“進(jìn)化”成長。
第三十四屆CIO班招生
國際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:wangxu
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),請及時(shí)通知本站,予以刪除。