202001-15 大数据学习资源(Awesome Big Data) 362 VIEW 为了让大家更好地学习交流,过往记忆大数据花了一个周末的时间把 Awesome Big Data 里近 600 个大数据相关的调度、存储、计算、数据库以及可视化等介绍全部翻译了一遍,供大家学习交流。 文章目录 1 关系型数据库管理系统 2 框架 3 分布式编程 4 分布式文件系统 5 分布式索引 6 文档数据模型 7 Key Map 数据模型 8 Key-value 数据模型 9 图数据模型 .... Read More >
202001-09 clickhouse搭建 2177 VIEW 基础知识:列式数据库管理系统:columnar DBMS、联机分析处理OLAP 开始 拉取repo源 curl -s https://packagecloud.io/install/repositories/altinity/clickhouse/script.rpm.sh | sudo bas.... Read More >
201912-31 数据分析的利器-clickhouse概述 589 VIEW Clickhouse是Yandex开源的一个用于实时数据分析的数据库,一开始就用在yandex内部的多个数据分析业务上。要介绍clickhouse,还是需要先介绍一下yandex。Clickhouse为什么会出现,其实和yandex的业务关系非常大。Yandex是俄罗斯最大的搜索引擎,会有很多数据分.... Read More >
201906-19 TiDB介绍 2869 VIEW TiDB 是什么?TiDB 是一个分布式 NewSQL 数据库。它支持水平弹性扩展、ACID 事务、标准 SQL、MySQL 语法和 MySQL 协议,具有数据强一致的高可用特性,是一个不仅适合 OLTP 场景还适合 OLAP 场景的混合数据库。TiDB怎么来的?著名的开源分布式缓存服务 Codis.... Read More >
201904-04 impala与hive的比较以及impala的优缺点 1013 VIEW 最近读的几篇关于impala的文章,这篇良心不错:https://www.biaodianfu.com/impala.html(本文截取部分内容)Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive.... Read More >
201709-28 Mahout学习之Mahout简介、安装、配置、入门程序测试 630 VIEW 一、Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout) 步入正文啦:  .... Read More >