2024-07-28

江南体育官网下载·大数据开发快速入门系列第一章大数据概述

返回

发布时间:2024-09-17 12:09:19 来源:江南官方网站下载 作者:江南app官方网站


  大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  Volume,体量大。从2013至2020年,人类的数据规模将扩大50倍,每年产生的数据将增长到44万亿GB,相当于美国国家图书馆数量的数百万倍,且每18个月翻一番。

  Velocity,速度快。随着现代感测、互联网、计算机技术的发展,数据生成、存储、分析、处理的速度远远超过人类的想象力,这也是大数据区别于传统数据或小数据的显著特征。

  Value,价值高但价值密度低。大数据有巨大的潜在的价值,但同其呈几何指数爆发的增长相比,某一对象或模块数据的价值密度较低,这无疑给我们开发海量数据增加了难度和成本。

  目前,我国有60多个城市,将构建“智慧城市”的目标列入“十二五规划”中。智慧城市即利用大数据的整合和分析来治理社会。2013年期间,有代表提议将发展大数据上升为国家战略

  高频交易:实时性要求高、数据规模大。目前沪深两市每天4个小时交易时间会产生3亿条以上逐笔成交数据,通过对历史和实时数据的挖掘创新,以创造和改进数量化交易模型,并将之应用于基于计算机模型的实时证券交易过程中。

  小额信贷:阿里巴巴和建行在2007年推出一个专注于小企业的计划——e贷通,阿里巴巴利用拥有的用户信息及交易数据,通过大数据技术自动判定是否给予企业;而建行坐拥巨额资金,希望给无信用记录但发展势头良好的小企业。到2012年底,阿里在累计服务小微企业超过20万家,放贷300多亿元,坏账率仅为0.3%左右,低于商业银行水平。

  招商银行:通过数据分析识别出招行信用卡高价值客户经常出现在星巴克、DQ、麦当劳等场所后,通过“多倍积分累计”“积分店面兑换”等活动吸引优质客户;通过构建客户流失预警模型,对流失率等级前20%的客户发售高收益理财产品予以挽留,使得金卡和金葵花卡客户流失率分别降低了15个和7个百分点;通过对客户交易记录进行分析,有效识别出潜在的小微企业客户,并利用远程银行和云转介平台实施交叉销售,取得了良好成效。

  国内有6亿手机用户使用百度地图,用户每次位置变化,百度都能得到数据。把手机网民的定位信息汇总成大数据进行分析,就能勾勒出人们的迁徙轨迹。此次百度图景化地展示春运情况,是基于LBS(基于地理位置的服务)技术的一次创新。它的数据每8小时更新一次,囊括了全国铁路、公路和航空在内的线路。

  推荐系统是大数据中最常见和最容易理解的应用之一,比如说淘宝的猜你喜欢和京东等网站的用户提供个性化的内容。但是不仅仅只有电商会用推荐引擎为用户提供额外的商品,推荐系统也可以被用在其他行业,以及具有不同的应用中使用,如网易云音乐的每日歌曲推荐、活动、产品到约会对象。

  党的提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。

  国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。目前,我国大数据人才只有46万,未来3到5年人才缺口达150万之多。

  在北京大数据开发工程师的平均薪水已经到35000元(数据统计来职友集),而且目前还保持强劲的发展势头。

  当前我国大数据处于起步发展阶段,各地积极性高,市场增速明显。2014年,我国大数据市场规模为759.4亿元,存在结构发展不均衡等特点。


江南体育官网下载


TAG标签耗时:0.0024280548095703 秒