您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關CDSW1.6的新功能是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
1.Bring Your Own Editor
你現在可以利用CDSW的所有好處,同時使用你熟悉的編輯器。這個功能支持在你本地電腦上運行第三方的IDE比如PyCharm,或者基于瀏覽器的IDE像Juypter。Base Image v8預打包了Juypter,你可以在Start Session菜單中選擇它。
2.Multiple Cloudera Data Science Workbench Deployments
你現在可以通過一個Cloudera Manager部署多個CDSW。
3.Audits
CDSW會記錄特定的事件,比如用戶登錄和分享,你可以通過查詢數據庫而查看這些事件。
4.Expanded Support for Distributed Machine Learning
CDSW1.6(或更高)允許你使用TensorFlowOnSpark, H2O, XGBoost等這種框架,運行分布式工作負載。這跟你在HDP/CDH集群中已經實現的Spark工作負載是一樣的。
5.cdswctl CLI Client
cdwctl客戶端提供一種額外的方法來與CDSW進行交互,以執行某些操作。例如,你可以使用cdswctl客戶端在你本地電腦上啟動一個SSH端點,然后將一個本地的IDE,比如PyCharm連接到CDSW。
你可以在CDSW的Web UI上下載cdswctl,然后在你的本地電腦中使用它。注意這個客戶端不像cdsw命令行工具比如cdsw status。
6.Status and Validate Commands
Cloudera Manager中的CDSW服務現在包含兩個新命令,可以用來顯示CDSW的部署狀態:Status和Validate。在Cloudera Manager中看到的CDSW服務狀態,與你在命令行執行cdsw status和cdsw validate命令等價。
7.Experiments
如果你的集群配備了GPU,現在你可以在experiment中使用GPU對模型進行訓練。
跟蹤實驗文件現在會刷新并自動出現在Overview頁面,用于運行一個實驗。以前,當一個實驗結束后,你需要手動刷新頁面。
8.Command Line Interface (CLI) Changes - RPM Deployments only
刪掉了cdsw reset命令,取而代之的是cdsw stop。
刪掉了cdsw init命令,取而代之的是cdsw start。
9.Kubernetes and Weave
Kubernetes升級到1.11.7版本,Weave Net升級到2.5.1版本。
10.Logs
Staging Directory
你現在可以配置一個臨時目錄,用于保存當CDSW搜集診斷包時的階段日志。當收集一個新的診斷包時,或者當日志大小大于10 MB時,將刪除目錄中的舊日志。
Logs tab
運行的的會話現在會顯示一個Logs選項卡,這個選項卡會顯示engine的日志,如果存在也會顯示Spark的日志。之前,如果你想訪問這些日志,你需要登錄到CDSW主機和Spark服務器上才查看這兩部分日志。
11.Operating System
CDSW1.6支持RHEL和CentOS7.6
12.Workload Scheduling Changes
從1.6版本開始,CDSW允許你指定一個被標記為Auxiliary Nodes的CDSW gateway主機列表。這些主機將在工作負載調度期間被剝奪。也就是說,他們將被選中來運行不能在任何其他主機上調度的工作負載。例如,使用非常大的資源請求的會話,或者當其他主機被充分利用時。
Reserve Master Host
CDSW1.4.3引入了一個新的特性,允許在CDSW Master主機上只運行內部的應用程序,即不會作為Worker節點。從1.6版本開始,如果是基于CSD的部署,在CM中可以直接配置Reserve Master Host屬性,而不需要在Safety valves中進行配置。
13.Security
FreeIPA Support
除了MIT Kerberos和Active Directory,CDSW現在也支持FreeIPA作為身份管理系統。
New User Role - Operator
1.6版本包括一個新的訪問角色稱為Operator。當一個用戶被分配為一個項目的Operator角色,他就可以啟動和停止已有的作業,并且可以訪問項目代碼,數據和結果,但只有查看權限。
Restricting User-Controlled Kubernetes Pods
CDSW1.6包括三個新屬性,允許你控制授予用戶控制(user-controlled)的Kubernetes pod的權限。一個用戶控制的pod的例子是引擎pod,它為會話、作業等提供了環境。這些pod在每個用戶的Kubernetes名稱空間中啟動。由于這些用戶有能力啟動任意的pod,這些設置主要是為了限制這些pod可以做什么。
LDAP/SAML Configuration Changes
之前,如果你想將site administrator角色授予給LDAP/SAML組的用戶,則該組必須在2個屬性下被列出:LDAP/SAML Full Administrator Groups和LDAP/SAML User Groups。如果一個組只是在LDAP/SAML Full Administrator Groups下被列出,而在LDAP/SAML User Groups下則沒有,這個組的用戶將不能登錄到CDSW。
在1.6版本中,你不需要在這2個屬性下列出admin組,在LDAP/SAML Full Administrator Groups中列出的用戶能夠登錄CDSW,并且擁有site administrator權限,并按預期訪問CDSW。
Project and Team Creation
Site administrators可以在Settings頁面上限制用戶創建項目或team,通過以下2個屬性:
Allow users to create projects
Allow users to create teams
Session Tokens
CDSW Web UI會話令牌的存儲方法已得到加強。升級到版本1.6.0后,用戶必須注銷Cloudera Data Science Workbench Web UI,然后重新登錄。
Sharing
Site administrator現在可以控制是否共享控制臺,通過設置Admin > Security頁面的Allow console output sharing屬性。禁用此屬性可從項目工作區和workbench UI中刪除Share按鈕,并禁用對整個部署中所有共享控制臺輸出的訪問。請注意,重新啟用此屬性不會自動將訪問權限授予以前共享的控制臺。您將需要再次手動共享每個控制臺。
TLS/SSL
CDSW現在默認使用TLS1.2。默認的cipher suites也升級到了Mozilla的Modern cipher suites。
14.Spark UI
現在,在使用Spark的運行會話中,Spark UI是其中一個選項卡,你可以直接點擊查看Spark UI。
1.1 引擎升級
CDSW1.6開始打包的基礎engine鏡像包括的R和Python的版本為(version 8):
R - 3.5.1
Python - 2.7.11, 3.6.1
Engine 8中預安裝的軟件包 - 參考:
https://docs.cloudera.com/documentation/data-science-workbench/1-6-x/topics/cdsw_engines_packaging.html#engine_8
(僅用于升級)將現有項目升級到最新的Base Engine Images
Base Image v8修復了很多bug,確保對現有項目進行測試并升級到Base Image v8 (Project Settings > Engine),這樣做有以下兩個原因:
Container Security
安全最佳實踐表明引擎容器不應以root用戶身份運行。引擎(v7和更低版本)短暫地以root用戶身份初始化,然后以cdsw用戶身份運行。現在,引擎v8(及更高版本)遵循最佳做法,并且僅以cdsw用戶身份運行。
CDH 6 Compatibility
你使用的base engine image必須與正在運行的CDH版本兼容。如果你在Spark上運行工作負載,這尤其重要。較舊的base engine(v6和更低版本)不能支持最新版本的CDH6。如果要在CDH 6上運行Spark工作負載,則必須將項目升級到base engine v7(或更高版本)。
CDSW1.6不再支持SLES12 SP2,SP3
因為SLES12 SP2和SP3,SUSE也將停止支持,所有CDSW1.6或以后的版本將不再支持SLES12 SP2和SP3。
GPU設置更改
不再支持nvidia-docker1
NVIDIA Library Path屬性不再可用。
CDSW1.6默認打包安裝nvidia-docker2,啟用GPU后,也會自動設置NVIDIA庫卷的路徑。
CDSW_PUBLIC_PORT環境變量已被棄用,并將在以后的版本中刪除。改用CDSW_APP_PORT或CDSW_READONLY_PORT環境變量
1.修復了如果列太多,則必須包含pd.options.display.html.table_schema = True才能顯示Pandas Dataframe的水平滾動條的問題。現在你不需要額外設置該屬性。
Cloudera Issue: DSE-3562
2.修復了內置Workbench編輯器無法正確識別使用制表符(tab)而不是空格的導入代碼的問題。這也解決了在使用制表符(tab)導入代碼時在編輯器中發生的導航問題。
Cloudera Issue: DSE-2976, DSE-3221
3.修復了如果附件超過4 MB,帶有由作業觸發的包含附件的Email無法發送的問題。
Cloudera Issue: DSE-5980, DSE-6003
4.修復了在內置Workbench編輯器中運行大型R腳本時hang住的問題。
Cloudera Issue: DSE-2817
5.修復了Markdown中未呈現.md文件的問題。 以前,只有README.md可以正確呈現。
Cloudera Issue: DSE-3315
6.修復了Python模板項目中的模型訓練腳本predict.py的問題。
Cloudera Issue: DSE-5314
7.修復了當生成CDSW診斷包時占用/var/log/cdsw目錄太多空間的問題,現在生成的診斷包大小已減小,現在你也可以配置診斷包生成后的臨時保存目錄。
Cloudera Issue: DSE-5921
8.在模型和實驗中運行的cdsw-build.sh腳本,是以cdsw用戶執行的。
Cloudera Issue: DSE-4340
9.解決了當機器重啟后,CDSW無法自動檢測GPU的問題。
Cloudera Issue: DSE-2847
10.修復了由于版本1.4.x中添加的新HTTP安全header而無法在工作臺中呈現iFrame可視化效果的問題。
Cloudera Issue: DSE-5274
感謝各位的閱讀!關于“CDSW1.6的新功能是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。