有事请发邮件:tt@toutiao.io
点击上方 "云祁QI"关注, 星标一起成长1前言HDFS SecondaryNameNode是干什么的?这是道经典的基础面试题,想必大家都被面试官问过很多次。从了解的情况看来,好多...
本文大纲一、HDFS 是大数据的基石我们都知道,HDFS 是大数据存储的基石,所有的离线数据都存储在 HDFS 上,而 NameNode 是存储所有元数据的地方(所谓元数据就是描述...
为开发者服务
一、分布式系统中的心跳技术心跳是分布式技术中常用的技术手段。心跳,顾名思义,就是以固定的频率向其他节点汇报当前节点状态的方式。收到心跳,一般可以认为发送心跳的这个节点在当前的网络拓...
一、阅读 HDFS 源码的缘由HDFS 是大数据的最基础的设施了,几乎所有的离线存储都在 HDFS 上。但是在大规模 HDFS 集群中,下面的问题通常会让我们无比头疼:元数据的量级...
供稿 | eBay ADI Hadoop Team 作者 | 林意群编辑 | 顾欣怡本文5293字,预计阅读时间17分钟更多干货请关注“数据社”公众号导读HDFS作为大数据的底层存...
供稿 | eBay ADI Hadoop Team 作者 | 林意群 编辑 | 顾欣怡本文5293字,预计阅读时间17分钟更多干货请关注“eBay技术荟”公众号 导读 HDFS作为...
一名普通的程序猿
一、存储机制1、基础描述NameNode运行时元数据需要存放在内存中,同时在磁盘中备份元数据的fsImage,当元数据有更新或者添加元数据时,修改内存中的元数据会把操作记录追加到e...
公众号:知了一笑
免费编程资源分享,搜索微信小程序《程序员武功秘籍》。
没有碰到过 GC 问题的人生对写 Java 的人来说是不完整的。大数据生态圈的框架大都以 JVM 系语言开发(Java Scala 为主),毕竟生态成熟嘛要啥有啥。HDFS 作为大...
微信公众号 秦言夏语
刚刚
欢迎关注"Kooola大数据"微信公众号,一起...
知我者,不因我言,而由我心。