drill-use

Apache Drill 在基于 SQL 的数据分析和商业智能(BI)上引入了 JSON 文件模型,这使得用户能查询固定架构,演化架构,以及各种格式和数据存储中的模式无关(schema-free)数据。

mahout-engine

Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展 的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。

alluxio-dev

Tachyon 的编译安装及使用。

Phoenix-hbase

Phoenix,由saleforce.com开源的一个项目,后又捐给了Apache。它相当于一个Java中间件,帮助开发者,像使用jdbc访问关系型数据库一样,访问NoSql数据库HBase。

Hbase Distibuted Install

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。

ganglia-ubuntu

Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。

sqoop 常用脚本整理

Sqoop是一款开源的工具,主要用于在HADOOP(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递

git manual

Git 使用有段时间了,个人博客也是托管到git上面,经常用到的命令放到这,主要供自己查阅使用