中国美女a级毛片-在线观看免费视频网站a站-日韩欧群交p片内射中文-国产一极内射視颍一

設(shè)計前線

什么是大數(shù)據(jù)?大數(shù)據(jù)時代的特點

發(fā)布時間: 2021-05-06 04:08

大數(shù)據(jù)是什么?其實很簡單,大數(shù)據(jù)其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產(chǎn)生的數(shù)據(jù),在大數(shù)據(jù)時代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價值。大數(shù)據(jù)有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般我們稱之為4V。
54.png

 一是數(shù)據(jù)體量巨大(Volume)。截至目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB(1PB=210TB),而歷史上全人類說過的所有的話的數(shù)據(jù)量大約是5EB(1EB=210PB)。當前,典型個人計算機硬盤的容量為TB量級,而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(微博、推特、臉書)、移動網(wǎng)絡、各種智能工具,服務工具等,都成為數(shù)據(jù)的來源。淘寶網(wǎng)近4億的會員每天產(chǎn)生的商品交易數(shù)據(jù)約20TB;臉書約10億的用戶每天產(chǎn)生的日志數(shù)據(jù)超過300TB。迫切需要智能的算法、強大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計、分析、預測和實時處理如此大規(guī)模的數(shù)據(jù)。

二是數(shù)據(jù)類型繁多(Variety)。這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對于以往便于存儲的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高要求。
任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進行分析,從而進一步推薦用戶喜歡的東西。

三是價值密度低(Value)。價值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,一部1小時的視頻,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一二秒。如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。


四是處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”的報告,預計到2020年,全球數(shù)據(jù)使用量將達到35.2ZB。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命。
相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預測分析有價值的數(shù)據(jù),并通過機器學習方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運用于農(nóng)業(yè)、金融、醫(yī)療等各個領(lǐng)域,從而最終達到改善社會治理、提高生產(chǎn)效率、推進科學研究的效果。   

標簽

博文

  • 熱點博文
  • 最新博文
我們期待著傾聽您噴薄欲出的商業(yè)構(gòu)想,與您一起書寫經(jīng)典,打造傳奇。我是網(wǎng)站策劃小陳,手機 138-1489-4600 隨時恭候!
一鍵撥號 一鍵導航