大數據

Impala隱藏的驚天秘密

元數據作為大數據的源泉，有著非常重要的作用。可在Impala中卻隱藏著一個秘密？和元數據有著頗深的淵源，我們一起來追溯！一、Impala體系結構（1）每個slave節點運行一個Impala進程，和HD

作者：caosheng03

2020-08-22 13:20:19
深度解析數據挖掘關聯規則Apriori算法

01、關聯規則挖掘背景和基本概念如下所示的數據集，表中的每一行代表一次購買清單，注意我們只關心記錄出現與否，不關心某條記錄購買了幾次，如購買十盒牛奶也只計一次。數據記錄的所有項的集合稱為總項集，上表中

作者：Hjiangxue

2020-08-22 08:01:16
Spark基礎

官方文檔：spark.apache.org/docs/latest ? Spark背景??? MapReduce局限性：??? 1>) 繁雜??????????? map/reduce (map

作者：ycwyong

2020-08-22 02:12:32
NEXT 2019：Hitachi Vantara的一場數據價值宣言

Hitachi Vantara是一家為數據價值而生的公司。如果說2017年Hitachi Data System、Pentaho、Hitachi Insight Group三家公司的合并，標志著Hit

作者：大數據在線

2020-08-20 12:13:12
Hive初識

Hive產生背景：在給大家講解Hive之前，我們要先熟悉下Hadoop的一些概念。 Hadoop可以分為一下幾個部分 HDFS hadoop的文件系統，用于數據存儲 MapReduc

作者：昭帆

2020-08-20 02:44:46
Storm筆記整理（二）：Storm本地開發案例—總和計算與單詞統計

[TOC] 概述在Strom的API中提供了LocalCluster對象，這樣在不用搭建Storm環境或者Storm集群的情況下也能夠開發Storm的程序，非常方便。基于Maven構建工程項目，

作者：xpleaf

2020-08-18 16:18:06
spark源碼系列之累加器實現機制及自定義累加器

一，基本概念累加器是Spark的一種變量，顧名思義該變量只能增加。有以下特點： 1，累加器只能在Driver端構建及并只能是Driver讀取結果，Task只能累加。 2，累加器不會改變Spark L

作者：鯨落大叔

2020-08-17 09:31:05
大數據之HBase基礎

HBase簡介1.1. 什么是HBaseHBase是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。 HBase的目

作者：鯨落大叔

2020-08-17 07:07:52
Oracle樹查詢及相關函數

Oracle樹查詢的最重要的就是select...start with... connect by ...prior 語法了。依托于該語法，我們可以將一個表形結構的中以樹的順序列出來。在下面列述了Or

作者：沙漏半杯

2020-08-17 06:27:20
（第7篇）靈活易用易維護的hadoop數據倉庫工具——Hive

Hivehive是基于Hadoop的一個數據倉庫工具，可以將結構化的數據文件映射為一張數據庫表，并提供完整的sql查詢功能，Hive 定義了簡單的類 SQL 查詢語言，稱為

作者：I加加

2020-08-14 11:20:37

< 上一頁

下一頁>

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Impala隱藏的驚天秘密

深度解析數據挖掘關聯規則Apriori算法

Spark基礎

NEXT 2019：Hitachi Vantara的一場數據價值宣言

Hive初識

Storm筆記整理（二）：Storm本地開發案例—總和計算與單詞統計

spark源碼系列之累加器實現機制及自定義累加器

大數據之HBase基礎

Oracle樹查詢及相關函數

（第7篇）靈活易用易維護的hadoop數據倉庫工具——Hive

相關標簽

大數據

最新資訊

猜你喜歡

相關標簽