posts - 118,  comments - 447,  views - 27万

  大数据开发,并不仅仅只是一两个组件的简单堆砌,而是需要按照实际的数据量、数据种类以及实际业务的需要进行大量的调优和二次开发,构成一个有机的整体,这样才能保证大数据平台的正常高效的运行。

一. 以下是一个大数据平台的基本组成图:

 

 

1. 硬件环境:

1) X86架构廉价服务器集群:hadoop技术栈是架构在这种服务器上的,所以价格低,横向可扩展性强。

2) GPU服务器集群:如果需要用到机器学习算法,可能使用GPU服务器集群。

2. ETL:对各种类型的数据采集与清洗,跟据不同的数据类型选择不同的组件或者数据采集方法,比如用Python编写采集或清洗数据。

3. 数据存储:将采集清洗或处理好的数据存储在大数据存储器中。

4. 数据计算:

1) 实时计算:对亿条流数据实时进行计算。比如志管理、消息队列等。

2) 离线计算:对海量数据进行计算,特点是:数据量巨大,维度多。

5. 数据分析:对处理好的数据进行交互式分析,主要是用SQL语言进行数据的分析。

6. 资源管理:对资源进行调度和管理,其中包括:内存、CPU、存储等资源。

7. 数据管理:对数据进行安全、质量、权限等的管理以及工作流的管理和元数据治理。

8. 运维监控:对hadoop集群、生态圈组件进行运维、管理和监控。

二.大数据开发应具备的基本技能:

  1. 精通java、python、scala开发
  2. 精通linux使用
  3. 精通SQL开发
  4. 具有开源代码的阅读能力
  5. 熟悉各种组件的使用
posted @ 2018-12-19 17:47 小镇 阅读(1722) 评论(0) 推荐(0) 编辑
摘要: 大数据与人工智能有什么关系呢?AI本身就是一种大数据的应用,特别是在对于AI系统进行训练的时候,使用的数据越多,AI系统就越先进。也就是说对于人工智能系统进行训练使用的数据量越大,数据质量越好,人工智能系统的质量就越高,从这个意义上来说AI本身也是一种大数据应用。 机器学习是人工智能的子集,深度学习 阅读全文
posted @ 2018-12-10 19:32 小镇 阅读(2961) 评论(0) 推荐(0) 编辑
摘要: MPP代表大规模并行处理,这是网格计算中所有单独节点参与协调计算的方法。 是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果。 MPP DBMS是建立在这种方法之上的数据库管理系统。在这些系统中的每个查询都会被分解为由MPP网格的节点并行执行的一 阅读全文
posted @ 2018-12-05 22:40 小镇 阅读(6990) 评论(0) 推荐(1) 编辑
摘要: hadoop是一个由Apache基金会所发布的用于大规模集群上的分布式系统并行编程基础框架。目前已经是大数据领域最流行的开发架构。并且已经从HDFS、MapReduce、Hbase三大核心组件成长为一个具有60多个组件构成的庞大生态,可以满足大数据采集、存储、开发、分析、算法、建模等方方面面。 在h 阅读全文
posted @ 2018-12-03 17:15 小镇 阅读(997) 评论(0) 推荐(0) 编辑
摘要: 什么是大数据? 大数据(Big data),又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。是无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据也可以定义为来自各种来源的大量非结构化或结构化数据。并从各种各样类型的数据中,快速获得有价值信息 阅读全文
posted @ 2018-10-22 23:23 小镇 阅读(968) 评论(0) 推荐(0) 编辑
摘要: 由于我建的三个群都已经满了,但是每天还有很多朋友在加这几个群,为了能和大家更好的交流,大家可以加我的新浪微博 http://weibo.com/u/1766296144,我一直在线的!并且有什么最新的信息等等我也会最早的发到微博上来。 阅读全文
posted @ 2011-11-16 17:01 小镇 阅读(761) 评论(0) 推荐(0) 编辑
摘要: 经过大半年的努力,我参与编写的微软官方Windows Phone 7中文版开发新书《Windows Phone 7应用开发指南 》终于出版了!也终于结束了没有官方中文开发书辑的历史。这本书涉及到了WP7.x开发的方方面面,非常全面,并且还包含了大量的成功开发案例,是一本从入门到深入的书。这本书的第八章和第九章是由我编写的,有什么问题或建议欢迎在我的博客上或给我发微博喔 http://weibo.com/u/1766296144!另外我这两章的开发实例也会分享到这个网站的bbs上。这本书的可以在这里点击购买:http://www.amazon.cn/gp/product/B005UEOH4G.. 阅读全文
posted @ 2011-10-25 11:53 小镇 阅读(2261) 评论(9) 推荐(0) 编辑
摘要: 在千吃呼万唤中,终于可以获取联系人和增加联系人了!但是由于增加联系人是以Task方式来实现的,所以无法通过程序实现批量保存联系人。一.新增了一个命名空间:Microsoft.Phone.UserData;在这个命名空间里新增了多个用于联系人的类,其中通过Contacts类可以异步获取联系人列表。Contacts _contact = new Contacts();_contact.SearchCompleted += new EventHandler<ContactsSearchEventArgs>(_contact_SearchCompleted);_contact.Search 阅读全文
posted @ 2011-10-12 11:32 小镇 阅读(2053) 评论(4) 推荐(2) 编辑
摘要: 这是一个非常有趣的画刷,可以产生视频的蒙板效果,这个画刷在Silverlight中早就有的,但是Windows Phone中却一直没有引入,不过在WP7.1 SDK正式版中这个特性被加入进来了,手机上也可以制做这种效果了。一.原理 这里需要用到MediaElement控件来做为Video 的载体,也就是说由这个控件来播放Video,然后将这个控件做为VideoBrush的源来使用,而VideBrush又以型状控件、容器控件或文字控件的Foreground、Background、Path形式加入到这些控件中,从而利用这些控件的形状或内容做为蒙板产生笔刷效果。注意:在模拟器上无法看到效果,只有用. 阅读全文
posted @ 2011-10-11 11:26 小镇 阅读(1944) 评论(2) 推荐(1) 编辑
摘要: 从8月22起Windows Phone marketplace可以提交7.1 sdk开发的应用了,尽管提交页面和方式与7.0是同一个,但是还是会出现一些问题。并且在提交之前也注意一些问题。1. 7.0 应用转为7.1应用我之前有一些应用都是在7.0下开发的,但是因为要用到7.1的一些新特性,所以就需要把应用转成7.1然后再继续开发。转换方法:1) 打开工程属性页面,将目标版本改为7.12) 在工程上单击右键,选择“Upgrade to Windows Phone 7.1”菜单另外还需要注意的是:如果转为7.1后,一般就无法改回7.0了。一般如果开发应用时是直接在7.1下开发的,应该没有什么问. 阅读全文
posted @ 2011-09-09 16:16 小镇 阅读(2225) 评论(7) 推荐(3) 编辑
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示