91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hive udf如何自定義

發布時間:2021-12-10 10:27:36 來源:億速云 閱讀:167 作者:小新 欄目:云計算

這篇文章主要介紹hive udf如何自定義,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

用hive也有一段時間里,不過一直沒寫過相關到日志,因為主要用hive也無非是create table,upload data,CRUD 這幾個過程。后來工作中需要用到一些常用到方法,了解到hive中支持UDF(User Define Function),看里一些文章發現UDF到編寫也很簡單,繼承UDF然后重寫evaluate方法即可,下面以一個ip2long到方法作為參考。 

1.編寫UDF類 

import org.apache.hadoop.hive.ql.exec.UDF;

public class NewIP2Long extends UDF {

    public static long ip2long(String ip) {

        String[] ips = ip.split("[.]");

        long ipNum = 0;

        if (ips == null) {

            return 0;

        }

        for (int i = 0; i < ips.length; i++) {

            ipNum = ipNum << Byte.SIZE | Long.parseLong(ips[i]);

        }

        return ipNum;

    }

    public long evaluate(String ip) {

        if (ip.matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}")) {

            try {

                long ipNum = ip2long(ip);

                return ipNum;

            } catch (Exception e) {

                return 0;

            }

        } else {

            return 0;

        }

    }

    public static void main(String[] argvs) {

        NewIP2Long ipl = new NewIP2Long();

        System.out.println(ip2long("112.64.106.238"));

        System.out.println(ipl.evaluate("58.35.186.62"));

    }

}

2.編譯,然后打包成ip2long.jar。 

3.在需要使用ip2long這個方法到時候: 

add jar /tmp/NEWIP2Long.jar;

drop temporary function ip2long;

create temporary function ip2long as 'NewIP2Long';//如果類有包名,要加上包名

select ip2long(ip) from XXX ;

這種方法每次使用都要add,create一下,還是很麻煩,如果能把UDF編譯到hive源碼中那一定是件很high的事。 

進階:將自定義UDF編譯到hive中

重編譯hive: 

  1)將寫好的Jave文件拷貝到~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/udf/ 

cd  ~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/udf/

ls -lhgt |head

  2)修改~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java,增加import和RegisterUDF

import com.meilishuo.hive.udf.UDFIp2Long;   //添加import

registerUDF("ip2long", UDFIp2Long.class, false); //添加register

  3)在~/install/hive-0.8.1/src下運行ant -Dhadoop.version=1.0.1 package

?

1

2

cd ~/install/hive-0.8.1/src

ant -Dhadoop.version=1.0.1 package

  4)替換exec的jar包,新生成的包在/hive-0.8.1/src/build/ql目錄下,替換鏈接    

cp hive-exec-0.8.1.jar /hadoop/hive/lib/hive-exec-0.8.1.jar.0628

rm hive-exec-0.8.1.jar

ln -s hive-exec-0.8.1.jar.0628 hive-exec-0.8.1.jar

  5)重啟hive服務 

  6)測試 

以上是“hive udf如何自定義”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泸水县| 枝江市| 玉龙| 揭西县| 延津县| 南郑县| 潼南县| 华安县| 绿春县| 贵溪市| 大理市| 怀远县| 南漳县| 陕西省| 宿州市| 汉川市| 剑川县| 米泉市| 宽甸| 黑山县| 虹口区| 宁国市| 高碑店市| 新建县| 多伦县| 法库县| 曲阳县| 阿荣旗| 寿阳县| 乌鲁木齐县| 环江| 西充县| 祁门县| 达日县| 宁南县| 宜兴市| 奉节县| 敖汉旗| 永兴县| 商都县| 江津市|