面对现实,超越自己
逆水行舟,不进则退
posts - 269,comments - 32,trackbacks - 0

海量数据

    大数据量,海量数据 处理方法总结

    布隆过滤器应用

    悉数那些“巨型”数据仓库

    Hadoop在业界的使用情况

    淘宝Hadoop集群的概况

  分布式

    Paxos在大型系统中常见的应用场景

hadoop的实现

    

    HDFS的基本概念

    HDFS 读写流程

    HDFS namenode源码分析 

    HDFS datanode源码分析

      HDFS dfsclient读文件过程 源码分析

      HDFS dfsclient写文件过程 源码分析

    MapReduce源码分析总结

 

    mapreduce作业流程概论

    How MapReduce Works 

 

    基于hadoop的crc校验谈hadoop的离线设计思想

    Hadoop在MapReduce中使用压缩详解

    HDFS数据的Checksum

    Hadoop开发常用的InputFormat和OutputFormat

    Hadoop之failed task和killed task

    Hadoop的调度器总结

  管理

    hadoop集群部署

    hadoop部署注意项

    hadoop配置文件说明

    hadoop集群默认配置和常用配置

      hadoop集群测量

    Hadoop管理员的十个最佳实践

    Hadoop 权限管理

 

    Hadoop FS Shell

    Hadoop Shell 讲解

    hadoop fs -count的结果含义

 

 

    Hadoop添加节点datanode

    Hadoop删除节点

    hadoop SecondaryNameNode和NameNode

    hadoop 根据SecondaryNameNode恢复Namenode

    hadoop机架感知

 

    HDFS 安全模式

    hadoop的dfs.replication

    Hadoop回收站trash

    hadoop升级

 

    Hadoop计算能力调度器算法解析

    Hadoop计算能力调度器应用和配置

 

    hadoop和kerberos的整合总结

    hadoop的dfs.umask

 

    NFS服务对Hadoop(hdfs)集群影响测试

    Facebook团队关于Hadoop/HBase在SSD上的实验和讨论

  调优

  架构设计

   Hadoop使用场景

hive

  Hive体系架构

  应用

    Hadoop和Hive的数据处理流程

  管理

    hive部署手册

    hive元数据中utf8的修改

      hive并发调用的运行方式-个人经验篇

     

    hive Cli常用操作(翻译自Hive wiki)

    hive数据类型(翻译自Hive Wiki)

 

    hive 创建/删除/截断 表(翻译自Hive wiki)

    hive数据操作(翻译自Hive wiki+实例讲解)

    hive原生和复合类型的数据加载和使用

      hive修改 表/分区语句

 

    hive select操作(翻译自Hive wiki)

    hive GroupBy操作(翻译自Hive wiki)

      hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法

     Hive Join(翻译自Hive wiki)

     hive lateral view语句(翻译自Hive wiki)

     Hive Union(翻译自Hive wiki)

     Hive子查询(翻译自Hive wiki)

     hive实例讲解实现in和not in子句

     Hive Explain(翻译自Hive wiki)

     Hive虚拟列(翻译自Hive wiki)

     hive 锁定(翻译自Hive wiki)

 

      hive函数(Hive wiki)

    hive udf开发流程(Hive wiki)

    hive udaf开发入门和运行过程详解

    hive中UDTF编写和使用

    hive属性(Hive wiki)

 

    hive中分组取前N个值的实现

 

    hive sql遇到的问题

  优化

    hive大数据倾斜总结

    hive join详解

     

    hive文件存储格式

 

    hive怎样决定reducer个数

    hive的hive.exec.parallel参数说明

    hive local hadoop特性    

hbase

  管理

    Hbase配置手册

pig

  介绍入门

    Apache Pig入门 –介绍/基本架构/与Hive对比

  管理

    pig部署手册

  教程

    Apache Pig中文教程集合

  

 
本文转自:http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465625.html

posted on 2013-02-27 16:09 王海光 阅读(423) 评论(0)  编辑 收藏 引用 所属分类: Linux

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理