海量数据
大数据量,海量数据 处理方法总结
布隆过滤器应用
悉数那些“巨型”数据仓库
Hadoop在业界的使用情况
淘宝Hadoop集群的概况
分布式
Paxos在大型系统中常见的应用场景
hadoop的实现
序
HDFS的基本概念
HDFS 读写流程
HDFS namenode源码分析
HDFS datanode源码分析
HDFS dfsclient读文件过程 源码分析
HDFS dfsclient写文件过程 源码分析
MapReduce源码分析总结
mapreduce作业流程概论
How MapReduce Works
基于hadoop的crc校验谈hadoop的离线设计思想
Hadoop在MapReduce中使用压缩详解
HDFS数据的Checksum
Hadoop开发常用的InputFormat和OutputFormat
Hadoop之failed task和killed task
Hadoop的调度器总结
管理
hadoop集群部署
hadoop部署注意项
hadoop配置文件说明
hadoop集群默认配置和常用配置
hadoop集群测量
Hadoop管理员的十个最佳实践
Hadoop 权限管理
Hadoop FS Shell
Hadoop Shell 讲解
hadoop fs -count的结果含义
Hadoop添加节点datanode
Hadoop删除节点
hadoop SecondaryNameNode和NameNode
hadoop 根据SecondaryNameNode恢复Namenode
hadoop机架感知
HDFS 安全模式
hadoop的dfs.replication
Hadoop回收站trash
hadoop升级
Hadoop计算能力调度器算法解析
Hadoop计算能力调度器应用和配置
hadoop和kerberos的整合总结
hadoop的dfs.umask
NFS服务对Hadoop(hdfs)集群影响测试
Facebook团队关于Hadoop/HBase在SSD上的实验和讨论
调优
架构设计
Hadoop使用场景
hive
Hive体系架构
应用
Hadoop和Hive的数据处理流程
hive部署手册
hive元数据中utf8的修改
hive并发调用的运行方式-个人经验篇
hive Cli常用操作(翻译自Hive wiki)
hive数据类型(翻译自Hive Wiki)
hive 创建/删除/截断 表(翻译自Hive wiki)
hive数据操作(翻译自Hive wiki+实例讲解)
hive原生和复合类型的数据加载和使用
hive修改 表/分区语句
hive select操作(翻译自Hive wiki)
hive GroupBy操作(翻译自Hive wiki)
hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法
Hive Join(翻译自Hive wiki)
hive lateral view语句(翻译自Hive wiki)
Hive Union(翻译自Hive wiki)
Hive子查询(翻译自Hive wiki)
hive实例讲解实现in和not in子句
Hive Explain(翻译自Hive wiki)
Hive虚拟列(翻译自Hive wiki)
hive 锁定(翻译自Hive wiki)
hive函数(Hive wiki)
hive udf开发流程(Hive wiki)
hive udaf开发入门和运行过程详解
hive中UDTF编写和使用
hive属性(Hive wiki)
hive中分组取前N个值的实现
hive sql遇到的问题
优化
hive大数据倾斜总结
hive join详解
hive文件存储格式
hive怎样决定reducer个数
hive的hive.exec.parallel参数说明
hive local hadoop特性
hbase
Hbase配置手册
pig
介绍入门
Apache Pig入门 –介绍/基本架构/与Hive对比
pig部署手册
教程
Apache Pig中文教程集合
本文转自:http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465625.html