““我們每個人乘飛機時,都是自己選擇航線,這是人的智慧,但當這反映到具體的一些航程中來,就會有大量的數(shù)據(jù)記錄下來。我們從這些原始的航程記錄中,就可獲取一些航程的最優(yōu)設(shè)計方案。這就是大數(shù)據(jù)的方法。”中國人民大學信息學院院長杜小勇這樣解釋什么是“大數(shù)據(jù)”。”
銀監(jiān)會日前宣布,正式批準三家民營銀行的籌建申請,其最大亮點就是互聯(lián)網(wǎng)公司騰訊的入選。而互聯(lián)網(wǎng)公司做銀行當然要有自己的看家本事,大數(shù)據(jù)或被作為其最強有力的武器。同時,今年“大數(shù)據(jù)”還首次被寫入政府工作報告:要設(shè)立新型產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺,在大數(shù)據(jù)等方面趕超先進,引領(lǐng)未來產(chǎn)業(yè)發(fā)展。
其實,大數(shù)據(jù)的應(yīng)用早已無處不在,利用網(wǎng)購數(shù)據(jù)授信買車;通過博彩和球隊比賽數(shù)據(jù)預(yù)測世界杯;依據(jù)觀眾數(shù)據(jù)來打造的互聯(lián)網(wǎng)電影;就連今年全國高考語文,多省高考作文題,被“百度大數(shù)據(jù)”預(yù)測命中……你能想到的和想不到的都在被數(shù)據(jù)包圍,未來大數(shù)據(jù)對人們生活的顛覆性影響將堪比互聯(lián)網(wǎng)帶來的猛烈沖擊。
釋疑
大數(shù)據(jù)助互聯(lián)網(wǎng)公司做銀行
銀監(jiān)會上周五宣布,已正式批準三家民營銀行的籌建申請,其最大亮點就是互聯(lián)網(wǎng)公司騰訊的入選,而首批落選的阿里也在摩拳擦掌。很多人可能比較疑惑,互聯(lián)網(wǎng)公司憑什么做銀行?
記者了解到,深圳前海微眾銀行將結(jié)合互聯(lián)網(wǎng),提供高效和差異化的金融服務(wù)。以“普惠金融”為概念,主要面對個人或企業(yè)的小微貸款需求。未來會利用互聯(lián)網(wǎng)平臺開展業(yè)務(wù),依托平臺,與其他金融機構(gòu)合作開展業(yè)務(wù)。
生硬而有繁瑣的“表述”的背后,其實就一句話,要用“互聯(lián)網(wǎng)平臺”滿足“小微貸款需求”。這不禁讓人聯(lián)想到此前被央行叫停的騰訊和阿里“網(wǎng)絡(luò)信用卡”,該業(yè)務(wù)是一種運用大數(shù)據(jù)技術(shù)機選并即時調(diào)整授信額度的網(wǎng)絡(luò)數(shù)字信用卡,而發(fā)放的對象就是從傳統(tǒng)銀行拿不到貸款的“屌絲”。這讓我們看到了“互聯(lián)網(wǎng)”銀行產(chǎn)品的“雛形”。
而上周阿里宣布,和中行、招行、建行等7家銀行深度合作,也不失為“互聯(lián)網(wǎng)銀行”服務(wù)小微企業(yè)的一次有益探索,其為中小企業(yè)提供基于網(wǎng)商信用的無抵押貸款,最高授信額度1000萬元。電商起家的阿里,將平臺擁有的數(shù)萬家企業(yè)交易數(shù)據(jù)開放給銀行,降低銀行貸款風控成本的同時,亦為苦于無法自證信用的中小企業(yè),提供了第三方擔保。
這次再問互聯(lián)網(wǎng)公司憑什么做銀行?就再清楚不過了,沒錯,就是大數(shù)據(jù)。
案例
百度大數(shù)據(jù)預(yù)測世界杯淘汰賽結(jié)果全對
那么,什么是大數(shù)據(jù)?枯燥的名字解釋可能會讓很多“技術(shù)盲”望而卻步,中國人民大學信息學院院長杜小勇在騰訊互聯(lián)網(wǎng)與社會研究院主辦的“大數(shù)據(jù)連接的未來”高峰論壇上給出了一個非常鮮活的解釋,“我們每個人乘飛機時,都是自己選擇航線,這是人的智慧,但當這反映到具體的一些航程中來,就會有大量的數(shù)據(jù)記錄下來。我們從這些原始的航程記錄中,就可獲取一些航程的最優(yōu)設(shè)計方案。這就是大數(shù)據(jù)的方法?!?br />
大數(shù)據(jù)又如何連接未來?舉個例子,百度在世界杯期間準確預(yù)測德國奪冠,也是唯一一家通過大數(shù)據(jù)準確地預(yù)測了比賽結(jié)果。百度是如何通過大數(shù)據(jù)進行預(yù)測的呢?
百度大數(shù)據(jù)研究院特別派遣了資深數(shù)據(jù)科學家團隊,利用百度大數(shù)據(jù)全面搜索過去5年內(nèi)全世界987支球隊的3.7萬場比賽數(shù)據(jù),并與國內(nèi)著名彩票網(wǎng)站樂彩網(wǎng)、歐洲必發(fā)指數(shù)獨家數(shù)據(jù)供應(yīng)商Spdex等公司建立數(shù)據(jù)戰(zhàn)略合作伙伴關(guān)系,將博彩市場數(shù)據(jù)融入預(yù)測模型中,構(gòu)建了本次“世界杯預(yù)測”產(chǎn)品的足球賽事預(yù)測模型。
該模型共涉及19972名球員和1.12億條相關(guān)數(shù)據(jù),所參考的數(shù)據(jù)包括百度搜索數(shù)據(jù)、球隊基礎(chǔ)數(shù)據(jù)、球員基礎(chǔ)數(shù)據(jù)、賠率市場數(shù)據(jù)等,所分析的球隊不僅包括207支國家隊,還囊括了歐洲、南美、亞洲等聯(lián)賽俱樂部及低級別球隊信息。在國家隊勝負場預(yù)測上,準確率接近80%。
百度使用這個模型對2006年和2010年世界杯的淘汰賽進行了結(jié)果驗證,準確度接近75%。從此次巴西世界杯的比賽結(jié)果來看,這套模型的準確率要高于微軟、谷歌和高盛,其小組賽階段的預(yù)測成功率為58.33%,淘汰賽階段全部預(yù)測準確。
競爭
BAT加緊布局大數(shù)據(jù)
“大數(shù)據(jù)連接未來”,這讓互聯(lián)網(wǎng)行業(yè)看到了新的機遇,BAT(百度、阿里、騰訊)三大巨頭正在加緊布局,而未來的生死存亡或要在大數(shù)據(jù)一戰(zhàn)上見分曉。
很多人都比較疑惑,阿里到處撒金,動輒上十億級的大手筆投資讓人驚嘆,更重要的是“不務(wù)正業(yè)”,一會兒買足球,一會兒又搞文化,一個電商企業(yè)如此擴張讓外界覺得阿里創(chuàng)始人馬云退休后“很不著調(diào)”。事實上,那不過是“煙霧彈”,一阿里的內(nèi)部中層在采訪中曾告訴北京青年報記者:“馬云的思路很明確,阿里未來要做的是數(shù)據(jù)公司?!?br />
據(jù)了解,馬云很早就意識到大數(shù)據(jù)的價值,曾經(jīng)說過阿里巴巴集團價值最高的不是淘寶,不是天貓,也不是支付寶,而是阿里平臺上所產(chǎn)生的大量數(shù)據(jù)。阿里巴巴、天貓、淘寶、支付寶、阿里金融產(chǎn)生的數(shù)據(jù)構(gòu)成了個人、企業(yè)、商品和金融之間的完全數(shù)據(jù)鏈,這些數(shù)據(jù)能夠讓阿里巴巴提供更精準、高效的服務(wù),而這些數(shù)據(jù)同時也能夠給阿里巴巴帶來不菲的收入。據(jù)悉,很多天貓和淘寶的賣家都購買了數(shù)據(jù)魔方、量子衡道等基于大數(shù)據(jù)的增值服務(wù)。
如果說阿里仍爭分奪秒地搶“數(shù)據(jù)”,那么作為搜索行業(yè)老大,牢牢把住用戶上網(wǎng)入口的百度則加速儲備“人才”。在大數(shù)據(jù)這一前沿領(lǐng)域,全球的高精尖研究人才數(shù)據(jù)極為有限。李彥宏掌舵的百度也正在加大對大數(shù)據(jù)的布局,其推動成立百度深度學習研究院,并親任院長,吸引了一大批世界級科技精英的加盟,比如前Facebook資深科學家徐偉、美國新澤西州立大學統(tǒng)計系教授張潼等,最近還挖來了“谷歌大腦之父”吳恩達。
擁有國內(nèi)豐富的海量數(shù)據(jù)的騰訊,也在人才培養(yǎng)和引進上加大力度,上周五成立騰訊互聯(lián)網(wǎng)與社會研究院,啟動與人大社會管理大數(shù)據(jù)中心首批博士后共同培養(yǎng)項目,雙方將結(jié)合企業(yè)數(shù)據(jù)優(yōu)勢和高校研究力量,共同培養(yǎng)產(chǎn)學研相結(jié)合的高端人才,并聘請牛津大學互聯(lián)網(wǎng)研究院主任Luciano Floridi教授等為名譽顧問。
可以預(yù)見的是,隨著以BAT三大巨頭為首的互聯(lián)網(wǎng)公司在大數(shù)據(jù)方面的布局加快,未來大數(shù)據(jù)的應(yīng)用場景將更加豐富,用戶也期待盡快看到由大數(shù)據(jù)連接的“未來”。文/本報記者 吳琳琳
財經(jīng)觀察
別讓用戶隱私“裸奔”
隨著大數(shù)據(jù)應(yīng)用越來越廣泛,如何保障用戶數(shù)據(jù)的安全隱私,成為大數(shù)據(jù)應(yīng)用的最大挑戰(zhàn)。法律界人士師曉丹在其題為“大數(shù)據(jù)時代的法律應(yīng)對”一文中甚至明言,大數(shù)據(jù)時代人人“被裸奔”。
在大數(shù)據(jù)時代,每個人都是數(shù)據(jù)的貢獻者,當你瀏覽網(wǎng)頁、網(wǎng)購、掃描二維碼、微博、微信以及安裝手機APP時,你的個人信息、消費習慣、偏好,甚至你的社交圈子,就已經(jīng)被大數(shù)據(jù)分析工具捕獲。大數(shù)據(jù)分析工具使智能、高效地處理龐大數(shù)據(jù)成為現(xiàn)實,但同時它也能嗅探到你的所有信息,我們的城市在變得越來越智慧的同時,似乎也越來越危險了。
騰訊公司云平臺部總經(jīng)理陳磊日前在“大數(shù)據(jù)連接的未來”高峰論壇上也表示,騰訊曾經(jīng)對90個要求用戶用信用卡或銀行卡支付的電商網(wǎng)站做過安全掃描分析檢查,發(fā)現(xiàn)超過60個都或多或少存在安全問題,其中20多個的問題非常嚴重,存在包括盜取用戶的身份、惡意去替用戶消費等行為。
“今天我住酒店的時候,如果酒店的工作人員讓我把信用卡留下,我是非常焦慮的,因為今天我們面臨的互聯(lián)網(wǎng)產(chǎn)品里的安全問題非常多?!标惱谌绱吮磉_自己的擔心。
陳磊強調(diào),“要做好大數(shù)據(jù)的服務(wù),我們首先要解決的就是信息安全的問題。特別是對騰訊而言,首先發(fā)生的挑戰(zhàn)就是安全的挑戰(zhàn)?!?br />
師曉丹也提出,大數(shù)據(jù)時代的來臨,使人類歷史仿佛突然進入了一個嶄新的世界。在大數(shù)據(jù)面前,傳統(tǒng)的保護手段顯得蒼白無力。傳統(tǒng)的保護個人信息的法律手段“告知與許可”基本失效,因為大數(shù)據(jù)的價值不單純來源于數(shù)據(jù)的基本用途,更多的源于數(shù)據(jù)的二次利用,很多數(shù)據(jù)在收集時并無意用作其他用途,而最終卻產(chǎn)生了很多創(chuàng)新性的用途,這些都是無法事先告知的,也就沒有所謂的事先同意了。傳統(tǒng)的保護個人信息的技術(shù)手段“匿名化”基本失靈。
師曉丹建議,在傳統(tǒng)手段無力的情況下,大數(shù)據(jù)時代個人信息保護需要新的治理思維,“告知與許可”的基本法律手段依然可發(fā)揮作用,但只適用于數(shù)據(jù)收集階段,如瀏覽網(wǎng)頁時普遍存在的cookie。此時應(yīng)由用戶選擇是否接受數(shù)據(jù)的收集與分析以獲得更好的用戶體驗,如果用戶選擇“否”,其任何數(shù)據(jù)不得被捕獲。在數(shù)據(jù)的“二次利用”階段,可考慮設(shè)置數(shù)據(jù)使用時效機制、大數(shù)據(jù)使用者懲罰機制、新技術(shù)強制適用機制。將數(shù)據(jù)使用限制在一定時效范圍內(nèi),意味著大數(shù)據(jù)收集者不再可以永久地保留和利用數(shù)據(jù)。大數(shù)據(jù)的價值決定了個人信息保護不可能單純依賴企業(yè)自律,大數(shù)據(jù)使用者的責任只有在強制力規(guī)范下才能確保履行到位,只有嚴格的罰則才能防止企業(yè)為了利潤罔顧大眾安全。
新的時代,法律始終要有技術(shù)支撐,“匿名化”技術(shù)可更新為“差別隱私”技術(shù)。體驗式微營銷創(chuàng)始人劉秀光認為企業(yè)真正需要的是有價值的數(shù)據(jù),而不是窺探個人隱私?!安顒e隱私”技術(shù)通過故意的數(shù)據(jù)模糊處理,可以實現(xiàn)大數(shù)據(jù)庫的查詢只顯示近似結(jié)果,而不是精確結(jié)果,挖出特定個人與特定數(shù)據(jù)點的聯(lián)系將難以實現(xiàn)且耗費巨大,強制推行該技術(shù),在現(xiàn)階段不失為良策。