
大數(shù)據(jù)的四大特點與六大行業(yè)領(lǐng)域應(yīng)用
- 2020-04-23 14:00:00
- u9752u5c9bu65b0u6bd4u7279u7535u5b50 原創(chuàng)
- 1223
大數(shù)據(jù)的四大特點與六大行業(yè)領(lǐng)域應(yīng)用
說起大數(shù)據(jù),估計大家都覺得只聽過概念,但是具體是什么東西,怎么定義,沒有一個標準的東西,因為在我們的印象中好像很多公司都叫大數(shù)據(jù)公司,業(yè)務(wù)形態(tài)則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大數(shù)據(jù),在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的《大數(shù)據(jù)時代》提到了大數(shù)據(jù)的4個特征:
1.大量
大數(shù)據(jù)的特征首先就體現(xiàn)為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。只有數(shù)據(jù)體量達到了PB級別以上,才能被稱為大數(shù)據(jù)。1PB等于1024TB,1TB等于1024G,那么1PB等于1024*1024個G的數(shù)據(jù)。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動網(wǎng)絡(luò)、各種智能工具,服務(wù)工具等,都成為數(shù)據(jù)的來源。淘寶網(wǎng)近4億的會員每天產(chǎn)生的商品交易數(shù)據(jù)約20TB;臉書約10億的用戶每天產(chǎn)生的日志數(shù)據(jù)超過300TB。迫切需要智能的算法、強大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計、分析、預(yù)測和實時處理如此大規(guī)模的數(shù)據(jù)。
2.高速
就是通過算法對數(shù)據(jù)的邏輯處理速度非???,1秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。生活中每個人都離不開互聯(lián)網(wǎng),也就是說每天個人每天都在向大數(shù)據(jù)提供大量的資料。并且這些數(shù)據(jù)是需要及時處理的,因為花費大量資本去存儲作用較小的歷史數(shù)據(jù)是非常不劃算的,對于一個平臺而言,也許保存的數(shù)據(jù)只有過去幾天或者一個月之內(nèi),再遠的數(shù)據(jù)就要及時清理,不然代價太大?;谶@種情況,大數(shù)據(jù)對處理速度有非常嚴格的要求,服務(wù)器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
3.多樣
如果只有單一的數(shù)據(jù),那么這些數(shù)據(jù)就沒有了價值,比如只有單一的個人數(shù)據(jù),或者單一的用戶提交數(shù)據(jù),這些數(shù)據(jù)還不能稱為大數(shù)據(jù)。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。比如當前的上網(wǎng)用戶中,年齡,學歷,愛好,性格等等每個人的特征都不一樣,這個也就是大數(shù)據(jù)的多樣性,當然了如果擴展到全國,那么數(shù)據(jù)的多樣性會更強,每個地區(qū),每個時間段,都會存在各種各樣的數(shù)據(jù)多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進行分析,從而進一步推薦用戶喜歡的東西。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,例如圖片、音頻、視頻等,這些數(shù)據(jù)因果關(guān)系弱,就需要人工對其進行標注。
4.價值
這也是大數(shù)據(jù)的核心特征。現(xiàn)實世界所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很小。相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預(yù)測分析有價值的數(shù)據(jù),并通過機器學習方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識。你如果有1PB以上的全國所有20-35年輕人的上網(wǎng)數(shù)據(jù)的時候,那么它自然就有了商業(yè)價值,比如通過分析這些數(shù)據(jù),我們就知道這些人的愛好,進而指導產(chǎn)品的發(fā)展方向等等。如果有了全國幾百萬病人的數(shù)據(jù),根據(jù)這些數(shù)據(jù)進行分析就能預(yù)測疾病的發(fā)生,這些都是大數(shù)據(jù)的價值。大數(shù)據(jù)運用之廣泛,如運用于農(nóng)業(yè)、金融、醫(yī)療等各個領(lǐng)域,從而最終達到改善社會治理、提高生產(chǎn)效率、推進科學研究的效果。
大數(shù)據(jù)已經(jīng)成為過去幾年中大部分行業(yè)的游戲規(guī)則,行業(yè)領(lǐng)袖,學者和其他知名的利益相關(guān)者都同意這一點, 隨著大數(shù)據(jù)繼續(xù)滲透到我們的日常生活中,圍繞大數(shù)據(jù)的炒作正在轉(zhuǎn)向?qū)嶋H使用中的真正價值。
大數(shù)據(jù)已經(jīng)無處不在,大數(shù)據(jù)應(yīng)用于各個行業(yè),包括金融、汽車、餐飲、電信、能源、體能和娛樂等在內(nèi)的社會各行各業(yè)都已經(jīng)融入了大數(shù)據(jù)的印跡。
通訊,媒體和娛樂行業(yè)
由于消費者期望有不同格式和各種設(shè)備的多媒體需求,通信,媒體和娛樂行業(yè)的一些重大數(shù)據(jù)挑戰(zhàn)包括:
(1)分析和利用消費者洞察(2)利用移動和社交媒體內(nèi)容(3)解實時,媒體內(nèi)容使用情況(4)大數(shù)據(jù)在通信,媒體和娛樂行業(yè)的應(yīng)用
該行業(yè)的企業(yè)同時分析客戶數(shù)據(jù)以及行為數(shù)據(jù),以創(chuàng)建詳細的客戶資料,可用于:
(1)為不同的目標受眾創(chuàng)建內(nèi)容(2)根據(jù)需要推薦內(nèi)容(3)衡量內(nèi)容效果
比如,淘寶會根據(jù)你搜索過,瀏覽過的內(nèi)容進行分析,在下次登錄的時候,會在首頁為你推薦你相關(guān)喜好的商品,你喜歡什么樣的球鞋,你愛吃什么樣的零食。大數(shù)據(jù)分析下,為你投其所好。
銀行證券行業(yè)
一項研究對10個頂級投資和零售業(yè)務(wù)銀行的16個項目進行了調(diào)查,結(jié)果顯示:行業(yè)的挑戰(zhàn)包括:證券欺詐預(yù)警,超高頻金融數(shù)據(jù)分析,信用卡欺詐檢測,審計跟蹤歸檔,企業(yè)信用風險報告,貿(mào)易可見度,客戶數(shù)據(jù)轉(zhuǎn)換,交易的社會分析,IT運營分析和IT策略合規(guī)性分析等。
證券交易委員會(SEC)正在使用大數(shù)據(jù)來監(jiān)控金融市場活動。他們目前正在使用網(wǎng)絡(luò)分析和自然語言處理器來捕捉金融市場的非法交易活動。
金融市場的零售商,大銀行,對沖基金和其他所謂的“大男孩”使用大數(shù)據(jù)進行高頻交易,交易前決策支持分析,情緒測量,預(yù)測分析等方面的交易分析。
該行業(yè)還嚴重依賴大數(shù)據(jù)進行風險分析,包括反洗錢,企業(yè)風險管理,“了解你的客戶”和減少欺詐。
醫(yī)療領(lǐng)域
醫(yī)療保健部門獲得了大量的數(shù)據(jù),但一直沒能使用數(shù)據(jù)來遏制醫(yī)療保健成本上升,提高醫(yī)療保健收益,提高系統(tǒng)效率。這主要是因為電子數(shù)據(jù)不足或不可用。另外,保存健康相關(guān)信息的醫(yī)療保健數(shù)據(jù)庫很難與醫(yī)療領(lǐng)域有用模式的數(shù)據(jù)鏈接起來。
大數(shù)據(jù)分析應(yīng)用的計算能力可以讓我們能夠在幾分鐘內(nèi)就可以解碼整個DNA。并且讓我們可以制定出最新的治療方案。同時可以更好的去理解和預(yù)測疾病。就好像人們戴上智能手表等可以產(chǎn)生的數(shù)據(jù)一樣,大數(shù)據(jù)同樣可以幫助病人對于病情進行更好的治療。在醫(yī)療領(lǐng)域中,物聯(lián)網(wǎng)的重大作用就表現(xiàn)在大數(shù)據(jù)上。大數(shù)據(jù)技術(shù)目前已經(jīng)在醫(yī)院應(yīng)用監(jiān)視早產(chǎn)嬰兒和患病嬰兒的情況,通過記錄和分析嬰兒的心跳,醫(yī)生針對嬰兒的身體可能會出現(xiàn)不適癥狀做出預(yù)測。這樣可以幫助醫(yī)生更好的救助嬰兒。
一些醫(yī)院正在使用從數(shù)百萬患者手機應(yīng)用程序收集的數(shù)據(jù),允許醫(yī)生使用循證醫(yī)學,而不是對所有去醫(yī)院的患者均進行多次醫(yī)學檢查。佛羅里達大學運用免費的公共健康數(shù)據(jù)和谷歌地圖創(chuàng)建了視覺數(shù)據(jù),以便更快地識別和有效分析醫(yī)療信息,用于跟蹤慢性病的傳播。
制造業(yè)與能源領(lǐng)域
石油、農(nóng)產(chǎn)品、礦物、天然氣、金屬等自然資源的需求不斷增加,導致數(shù)據(jù)數(shù)量、復雜性增加。制造業(yè)的大量數(shù)據(jù)尚未開發(fā)。這些信息的利用不足會妨礙產(chǎn)品質(zhì)量、能效、可靠性和更高的利潤空間。
能源大數(shù)據(jù)理念是將電力、石油、燃氣等能源領(lǐng)域數(shù)據(jù)及人口、地理、氣象等其他領(lǐng)域數(shù)據(jù)進行綜合采集、處理、分析與應(yīng)用的相關(guān)技術(shù)與思想。能源大數(shù)據(jù)不僅是大數(shù)據(jù)技術(shù)在能源領(lǐng)域的深入應(yīng)用,也是能源生產(chǎn)、消費及相關(guān)技術(shù)革命與大數(shù)據(jù)理念的深度融合,將加速推進能源產(chǎn)業(yè)發(fā)展及商業(yè)模式創(chuàng)新。
在自然資源行業(yè),通過大數(shù)據(jù)可以利用地理空間數(shù)據(jù),圖形數(shù)據(jù),文本和時間數(shù)據(jù)中攝取和整合大量數(shù)據(jù)建立預(yù)測模型,幫助做出決策,應(yīng)用的領(lǐng)域包括:地震解釋和油藏表征。
保險業(yè) 行業(yè)具體挑戰(zhàn)
主要挑戰(zhàn)包括缺乏個性化服務(wù),缺乏個性化定價和缺乏針對新細分市場和特定細分市場的有針對性的服務(wù)。在由Marketforce進行的調(diào)查中,保險業(yè)專業(yè)人士確定的挑戰(zhàn)包括數(shù)據(jù)不足帶來的利潤損失,以及渴望更好的洞察力。
業(yè)界已經(jīng)在使用大數(shù)據(jù),通過從社交媒體,支持GPS的設(shè)備和監(jiān)控錄像中得到的數(shù)據(jù)分析和預(yù)測客戶行為,為透明和簡單的產(chǎn)品提供客戶洞察。大數(shù)據(jù)還可以保護公司更好的提高客戶留存。
在索賠管理方面,大數(shù)據(jù)的預(yù)測分析已被用于提供更快的服務(wù),因為大量的數(shù)據(jù)可以在承保階段進行特別分析。欺詐檢測也得到了加強。通過數(shù)字渠道和社交媒體的大量數(shù)據(jù),索賠周期的索賠實時監(jiān)控已被用于為保險公司提供見解。
交通領(lǐng)域
近來,來自基于位置的社交網(wǎng)絡(luò)的大量數(shù)據(jù)和來自電信的高速數(shù)據(jù)影響了旅游行為。令人遺憾的是,了解旅游行為的研究并沒有如此迅速。在大多數(shù)地方,交通運輸需求模式仍然對社交媒體結(jié)構(gòu)的了解不足。
作為信息時代海量數(shù)據(jù)的來源之一,視頻監(jiān)控產(chǎn)生了巨大的信息數(shù)據(jù)。物聯(lián)網(wǎng)在安防領(lǐng)域應(yīng)用無處不在,特別是近幾年隨著平安城市、智能交通等行業(yè)的快速發(fā)展,大集成、大聯(lián)網(wǎng)、云技術(shù)推動安防行業(yè)進入大數(shù)據(jù)時代。安防行業(yè)大數(shù)據(jù)的存在已經(jīng)被越來越多的人熟知,特別是安防行業(yè)海量的非結(jié)構(gòu)化視頻數(shù)據(jù),以及飛速增長的特征數(shù)據(jù),帶動了大數(shù)據(jù)應(yīng)用的一系列問題。
政府使用大數(shù)據(jù):交通管制,路線規(guī)劃,智能交通系統(tǒng),擁堵管理(預(yù)測交通狀況)
私營部門在運輸中使用大數(shù)據(jù):收入管理,技術(shù)改進,物流和競爭優(yōu)勢(通過整合出貨量和優(yōu)化貨運)
個人使用大數(shù)據(jù)包括:路線規(guī)劃節(jié)省燃料和時間,旅游安排等。
青島新比特電子科技有限公司
聯(lián)系電話:0532-82207378