大数据的特点和作用是什么?

大数据的特点和作用是什么?,第1张

这部分资料我也懂得不多,我说一些我知道供楼主参考,就当是抛砖引玉了。
相信楼主知道,hadoop的文件系统叫做hdfs,就是hadoop分布式分布式文件系统的中文简写。这个系统是对google的gfs的开源实现。下面来回答问题
首先是节点故障:
google在他们那篇gfs的论文中说,google在使用gfs曾说过,google在使用gfs时遇到过各种各样的问题,主要有:应用程序bug、 *** 作系统的bug、人为失误,甚至还有硬盘、内存、连接器、网络以及电源失效。在一个大型的系统中,硬盘内存等等组件的老化,过度使用(因为数据读写非常频繁)等问题也是不容忽视的。hadoop的hdfs是需要考虑这些问题的。
然后是备份恢复的处理:
备份恢复因为我没有做过,不过我可以提供给楼主一个方法实验。
楼主可以先搭建一个只有3台datanode的小集群,设置数据备份为2。首先清空已有数据,然后在其中一台datanode上上传数据,默认时,hadoop是会在上传数据的datanode存入一个数据备份的。然后在down掉这台datanode,这样,你就少了一个数据备份,之后,你在另一台机器上读取数据,这时,你可以查看剩下的两台datanode中的dfs文件夹(也就是你存储hdfs数据的文件夹),打开其中block开头的文件看,这时应该就可以看到两台机器都有备份了。(推测)
根据gfs的论文,hadoop应该在数据被再次使用时进行检查,如果发现少了一个备份,会进行数据恢复工作。另一个时间是,机器空闲时会在后台监测数据备份情况。也就是说,数据恢复是自动,这也是hadoop的强大之处嘛。
至于namenode的恢复,没有处理过类似的问题,不过猜想和secondary namenode 有关,应该是将secondary namenode 存储的数据copy到namenode上,或是直接将secondary namenode 变成namenode 。
至于节点问题,down的节点经过恢复后,可以直接链接进入hadoop集群,而不用重新启动集群。命令是
bin/hadoop-daemonsh start datanode

法律分析:被称为“史上最严环保法”的新环保法自2015年1月1日起实施。
法律依据:《中华人民共和国环境保护法》 第五十九条 企业事业单位和其他生产经营者违法排放污染物,受到罚款处罚,被责令改正,拒不改正的,依法作出处罚决定的行政机关可以自责令改正之日的次日起,按照原处罚数额按日连续处罚。
前款规定的罚款处罚,依照有关法律法规按照防治污染设施的运行成本、违法行为造成的直接损失或者违法所得等因素确定的规定执行。
地方性法规可以根据环境保护的实际需要,增加第一款规定的按日连续处罚的违法行为的种类。
回答于2022-04-15
全文
除湿机 机工业除湿机-淘宝热卖好物汇集,品牌众多,放心购!
除湿机 机工业除湿机-购物上淘宝,品类集结,热卖好物!海量优质商品,轻松畅购!尽享优惠,买东西上淘宝,一站轻松购!
淘宝热卖广告
家长注意:孩子近视后,用这个方案,成功摘掉眼镜



甜致广告
问题还没解决?试试在线咨询吧~
被称为史上最严的新环保法从哪一年开始实施
答主1对1在线解答问题
5分钟内响应|万名专业答主
马上提问
在海洋馆听讲座的邓艾 正在咨询法律问题
米修米修 正在咨询劳动人事问题
七雪天空 正在咨询交通法规问题
秋痕IU 正在咨询医疗纠纷问题
leo99 正在咨询婚姻继承问题
夏天的风88 正在咨询婚姻继承问题
大漠有鱼 正在咨询劳动人事问题
魅力人生0325 正在咨询法律问题
安冬莫悲伤0325 正在咨询财产房产问题
大蛮蛮09 正在咨询债权债务问题

产后收腹带产妇顺剖两用术后透气专用腹带顺产孕妇月子盆骨修复带
¥225 元¥225 元
购买
淘宝热卖广告
中国知名电线电缆品牌,官方正品,想了解池州起帆电缆
最近30分钟前有人拨打电话咨询问题
上海起帆电子商务有广告
被称为史上最严的新环保法从哪一年开始实施
2015年1月1日施行。十二届全国人大常委会第八次会议表决通过了《环保法修订案》,被称为“史上最严厉”的新法将于2015年1月1日施行。是为保护和改善环境,防治污染和其他公害,保障公众健康,推进生态文明建设,促进经济社会可持续发展,制定的法律。法律依据:《中华人民共和国环境保护法》第一条 为保护和改善环境,防治污染和其他公害,保障公众健康,推进生态文明建设,促进经济社会可持续发展,制定本法。第二条 本法所称环境,是指影响人类生存和发展的各种天然的和经过人工改造的自然因素的总体,包括大气、水、海洋、土地、矿藏、森林、草原、湿地、野生生物、自然遗迹、人文遗迹、自然保护区、风景名胜区、城市和乡村等。第三条 本法适用于中华人民共和国领域和中华人民共和国管辖的其他海域。

大多数的风电机组叶片是由复合材料构成,利用各种材料的互补特性。目前的风电机组叶片通常是由聚合物基质与玻璃纤维或碳纤维加固材料组成。这些复合材料的优点是气动性能优异,并且轻便耐用,但其缺点是难以回收。目前,大部分报废的叶片会被送往垃圾填埋场,但这并不是一种环保的解决方案。
不过,风电行业也并非无所作为。业界已逐渐开始关注退役叶片的处理问题,并作出了一些创新的尝试,以减少风电机组材料的浪费。下面是几个例子:
方案1:建设现代建筑
在2012年,荷兰率先将退役风电机组叶片用作儿童公园的构筑物。
如今,荷兰设计公司SuperuseStudios则进一步将退役叶片用于城市建筑(如公共座椅)和户外遮蔽场所(如公交候车亭)。
根据他们网站的介绍,SuperuseStudios还被邀请成为丹麦Genvind财团的合作伙伴,该财团拥有如Vestas等20家机构在内。该财团的主要目标是找到处理风电机组报废(部件)的解决方案。
方案2:通过化学物质分离再循环
在一个被称为“Dreamwind”的研究项目中,一个丹麦奥胡斯大学的科学家团队正在开发一种化学物质,该物质将有可能将风电机组叶片复合材料进行分离,而这正是解决风电机组叶片循环利用的主要问题。(点击参见《丹麦研究风电叶片回收技术》)
方案3:切碎后再利用
华盛顿州立大学正在与西雅图的全球玻璃纤维解决方案公司(GFS)共同开展退役叶片复合玻璃纤维材料的回收和制造工作。
GFS先将风电机组叶片切碎成手掌大小的碎片,然后再由华盛顿州立大学的研究人员进行提炼并加工成新的型复合材料。经过测试,华盛顿州立大学的团队发现,新材料可以与许多木质复合材料相媲美。
回收后的叶片可以用于不同的途径,从地砖到塑料路面障碍。
方案4:粉碎后作燃料
目前,德国保持着世界上唯一的工业规模的工厂,用来处理风电机组叶片。就像在华盛顿州立大学的研究人员那样,先将退役叶片切成小块,然后再敲碎成碎屑,并与其他废料共同作为水泥厂的燃料。
方案5:在二手市场出售
另外,退役的叶片也可以在二手市场出售,用于小型风电机组。
风电机组业主也可以通过上网,在网上市场出售风电机组部件。例如,在SparesinMotion上搜索“叶片”(点击参见《风电也能“淘宝”了》),就可以找到一个叶片的列表,其中最旧的是1997的叶片。
所以,要问哪种方式是退役风电机组叶片最好的处理方式答案可能不只一个。它取决于风电机组本身、业主、国家和其他可用资源等。也许并没有一个“一刀切”的方案,但走出垃圾填埋场绝对是正确的方向。

1简介

分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。例如,用户可以“发表”一个允许其他客户机访问的目录,一旦被访问,这个目录对客户机来说就像使用本地驱动器一样。

当下我们处在一个互联网飞速发展的信息 社会 ,在海量并发连接的驱动下每天所产生的数据量必然以几何方式增长,随着信息连接方式日益多样化,数据存储的结构也随着发生了变化。在这样的压力下使得人们不得不重新审视大量数据的存储所带来的挑战,例如:数据采集、数据存储、数据搜索、数据共享、数据传输、数据分析、数据可视化等一系列问题。

传统存储在面对海量数据存储表现出的力不从心已经是不争的事实,例如:纵向扩展受阵列空间限制、横向扩展受交换设备限制、节点受文件系统限制。

然而分布式存储的出现在一定程度上有效的缓解了这一问题,之所以称之为缓解是因为分布式存储在面对海量数据存储时也并非十全十美毫无压力,依然存在的难点与挑战例如:节点间通信、数据存储、数据空间平衡、容错、文件系统支持等一系列问题仍处在不断摸索和完善中。

2分布式文件系统的一些解决方案

Google Filesystem适合存储海量大个文件,元数据存储与内存中

HDFS(Hadoop Filesystem)GFS的山寨版,适合存储大量大个文件

TFS(Taobao Filesystem)淘宝的文件系统,在名称节点上将元数据存储与关系数据库中,文件数量不在受限于名称节点的内容空间,可以存储海量小文件LustreOracle开发的企业级分布式系统,较重量级MooseFS基于FUSE的格式,可以进行挂载使用MogileFS

擅长存储海量的小数据,元数据存储与关系型数据库中

1简介

MogileFS是一个开源的分布式文件系统,用于组建分布式文件集群,由LiveJournal旗下DangaInteractive公司开发,Danga团队开发了包括 Memcached、MogileFS、Perlbal等不错的开源项目:(注:Perlbal是一个强大的Perl写的反向代理服务器)。MogileFS是一个开源的分布式文件系统。

目前使用 MogileFS 的公司非常多,比如国外的一些公司,日本前几名的公司基本都在使用这个

国内所知道的使用 MogileFS 的公司有托管网站 yupoo又拍,digg, 土豆, 豆瓣,1 号店, 大众点评,搜狗,安居客等等网站基本很多网站容量,都超过 30T 以上。

2MogileFS特性

1) 应用层提供服务,不需要使用核心组件

2)无单点失败,主要有三个组件组成,分为tracker(跟踪节点)、mogstore(存储节点)、database(数据库节点)

3)自动复制文件,复制文件的最小单位不是文件,而是class

4)传输中立,无特殊协议,可以通过NFS或>

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
乐在赚 » 大数据的特点和作用是什么?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情