解釋大數據
如果讓你組織和分析紐約公民的數據會怎麼樣? Facebook, Instagram 和推特。那就太瘋狂了…為什麼?因為我說的是19.49萬人的按讚、分享、留言、留言、觀看影片以及日常活動的數據。這是大量的活動,意味著大量的數據。

平均有 2.5億字節 每天處理的資料量正以正速度成長。 Facebook 上有 2 億活躍用戶(幾乎超過世界人口的四分之一) 最大的社群媒體平台.
我們談論的是數萬億和數十億的數據,因此顯然需要一組專家來分析這些數據量,因此它被稱為大數據,而分析這些數據的人被稱為大數據分析師。
例如,如果一家食品連鎖店也想在國外開設分支機構,則需要大量數據來分析其目標族群。
他們將根據宗教、文化偏好、天氣、季節、節日和其他地理和文化因素來組織和分析數據。所有這些海量數據都可以由數據分析師團隊進行分析。
1] 挑戰
我們可以描述以下挑戰 大數據分析 三個V,即容量、速度和多樣性。
- 體積:資料流的數量或批量。例如,道路上每輛車的數據用於政府措施。
- 速度:數據傳入的速率。它可以更改例如每個客戶的信用卡操作資料或每個客戶的行動裝置上的下載資料。
- 品種:數據的多樣性;資料可以是結構化的、半結構化的和非結構化的。
2] 資料分析的類型
資料分析有描述性、預測性和規範性三種方式。
- 描述性:描述性技術只是資料的總結,簡化的資料。用簡單的方式解釋了數十億的流數據。
- 預測:這種技術是主要也是最重要的一種,透過分析大量流數據,您將根據觀察來預測結果。請記住,這用於告訴結果 可能 將來發生的事情不會發生。
- 規範性的:這個技術超出了預測,它導出了多個解決方案並規定了最佳解決方案。例如,放置石油公司汽油泵以獲得最大利潤的最佳位置。該系統中的其他兩個組成部分是反饋和可操作的數據。
3]分析工具
大數據分析可以透過以下方式學習 網路課程 資料分析中使用的主要工具有 Tableau Public、OpenRefine、KNIME、RapidMiner、Google Fusion Tables、NodeXL、Wolfram Alpha、Google Search Operators、Solver 和 Dataiku DSS。 這些工具 對數據進行視覺化、挖掘、處理和統計建模,以幫助分析師完成工作。
4]大數據的未來
目前對大數據分析的需求很高,隨著技術進步和互聯網可用性的不斷增長,該領域將變得多樣化和擴展。
汽車製造商正在利用交通大數據來製造未來的自動駕駛汽車。醫學研究實驗室正在使用大數據來匹配 DNA 相容性,以便更好地使用藥物。該領域正在不斷發展,未來前景光明。
