关注TA
大数据架构师 公众号: 老蒙大数据
大叔的原创专栏 << 点击来源 | https://blog.marouni.fr/bidata-trends-analysis/ 作者 | Abbass Marouni I’v...
这是大数据入门常识第一篇,主要讨论大数据工作的方向问题。后续还会把 “大数据实际工作中的职责”,“大数据需要学的内容”,“大数据如何学习” 这三个议题写成三篇文章展开来详细讨论,敬...
MapReduce 就像一台又慢又稳的老爷车,虽然距离 MapReduce 面市到现在已经过去了十几年的时间,但它始终没有被淘汰,任由大数据技术日新月异、蓬蓬勃勃、花里胡哨地发展,...
"最近阿里的数据中台好像挺火的,咱们也搞个中台吧。" Boss一句话,让大数据部门的Leader陷入了沉思,买了本《大数据之路》看了两天… 两天后的夜里,Leader在朋友圈发了公...
你是否也做过这些事情?关注各种牛人的公众号;加入各种社群;买各种技术课程;参加各种技术盛会......也许你自己还没有发觉,其实你做的这些事情在无形中已经让自己加入了一个成长的竞赛...
原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,转载请保留出处。分布式缓存方面,redis勇夺花魁。但对于消息队列mq来说,还处于百花齐放的年代。缓存系统,基本上解决一...
欢迎关注同名微信公众号小姐姐味道:xjjdog
接着前面几篇咱们继续:如何比较装X地回答问题 | 面试系列.1解释下 HDFS 的 Short-Circuit | 面试系列.2HBase 有哪些优化点?| 面试系列.3HBase...
编者按:写微服务的书挺多,小编专门从中精选启军的《持续演进的Cloud Native:云原生架构下微服务最佳实践》一书,而且特别展示一下小编称之为“架构师眼中的文化”的章节。如果说...
这个更新频率可以吧,话不多说,看正文。黑色字体是正经答案,灰色字体是我小声BB。HBase 有哪些优化点?这是个相对开放的问题,问题没有那么得细,面对这种问题千万不要乱了阵脚,其实...
面试不停,装X不止。话不多说我们直接入正题。黑色字体是正经答案,灰色字体是我小声BB。解释下 HDFS 的 Short-Circuit ?这是一个比较高段位的冷门问题了,我也是一般...
今天开始重新写这个系列的文章,已经忘记距离上一次更新有多久了,要不是有童鞋们催更,我都要遗忘这个系列了。言归正传,这次我来讲下spark,先从基础的讲起,不要嫌简单,讲到后面我会讲...
我说的这台战斗机就是combineByKey,为什么这么说它,因为它是很多kv算子的"祖先",它需要的参数有点复杂,可定制化程度有点高,理解起来有点难度,总之就是有点牛逼。话不多说...
后台比较多同学让我写面试相关的文章,在《从面试官的角度谈谈大数据面试》也聊了很多,但是有同学吐槽说我没有把答案写上去,当时我的心里是拒绝写的,这有啥好写的,又不难,Google一大...
2019年的第一篇推送,我们来回顾100offer岗位和求职者人数最多的一个技术岗位——Java的一年市场表现。2017 年底,100offer 曾用「风光背后的危机」来形容 Ja...
Google的BigTable论文提到了一个很重要的东西:它所使用的文件组织方式(LSM-Tree),这个东东出自1996 年的一篇论文《The Log-Structured Me...
前言标题没有看错,真的是让我写个bug!刚接到这个需求时我内心没有丝毫波澜,甚至还有点激动。这可是我特长啊;终于可以光明正大的写bug了🙄。先来看看具体是要干啥吧,其实主要就是要让...
Java工程师
简单地说Compaction 合并是指一个 region 的一个 store 中的一些 HFile 合为一个 HFile 的操作。过程是先从这些待合并的数据文件中读出 KeyVal...
【每日五分钟搞定大数据】系列,HBase第五篇。上一篇我们落下了Bloom Filter,这次我们来聊聊这个东西。Bloom Filter 是什么? 先简单的介绍下Bloom F...
【每日五分钟搞定大数据】系列,HBase第四篇这一篇你可以知道,HFile的内部结构?HBase读文件细粒度的过程?HBase随机读写快除了MemStore之外的原因?上一篇中提到...
【每日五分钟搞定大数据】系列,HBase第三篇聊完场景和数据模型我们来说下HBase的架构,在网上找了张比较清晰的图,我觉得这张图能说明很多问题,那这一篇我们就重点来解析下这张图角...
HBase作为数据库,搞清它的数据模型与操作是最基本的,这篇就讲这些比较基础的东西。文中会涉及到比较多的操作命令,建议收藏,用到时在拿出来查看。 这里有一张表,是用关系型数据库的思...
应届生小祖参加了个需求分析会回来后跟我说被产品怼了一句:"不就是写SQL吗,要那么久吗" 我去,欺负我小弟,这我肯定不能忍呀,于是我写了一篇文章发在了公司的wiki: 贴出来给大家...
上篇文章《zookeeper-一个关于paxos的故事-《每日五分钟搞定大数据》》说到zab是在paxos的基础上做了重要的改造,解决了一系列的问题,这一篇我们就来说下这个zab。...
对于什么是工程师文化,很多人都能说出很多关键词,比如:匠心,创新,专业,担当,开放……然而如果要用一句话来描述什么是工程师文化,如何判断一家公司是不是一家工程师文化的公司,却不是一...
创业者,阿里云MVP,NPDP认证,PMP认证...
学生党以及很多没设计过大数据开发的小伙伴呢,都对大数据这么一个领域感到非常非常的好奇非常非常的神秘,我今天就非要戳穿给你们看。1、对,我们做大数据的也写普通的 Java 代码,写普...
数据应用架构师
阿里妹导读:很多童鞋在后台留言,希望看到大数据相关的文章。因此,今天带来一篇阿里资深专家观滔在2017年云栖大会的精彩分享,为大家展示阿里大数据计算服务的进化演进、以及MaxCom...
在《码农周刊》&《开发者头条》打杂
本篇文章阅读时间4分钟左右 zookeeper作为一个分布式协调系统,很多组件都会依赖它,那么此时它的可用性就非常重要了,那么保证可用性的同时作为分布式系统的它是怎么保证扩展性的...