91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

?Jax 生態再添新庫:DeepMind 開源 Haiku、RLax

發布時間:2020-08-08 19:30:44 來源:ITPUB博客 閱讀:167 作者:AIBigbull2050 欄目:互聯網科技
2020-02-25 10:51:05

機器之心報道

參與:一鳴

Jax 是一個優秀的代碼庫,在進行科學計算的同時能夠自動微分,還有 GPU、TPU 的性能加速加持。但是 Jax 的生態還不夠完善,使用者相比 TF、PyTorch 少得多。近日,DeepMind 開源了兩個基于 Jax 的新庫,給這個生態注入了新的活力。

?Jax 生態再添新庫:DeepMind 開源 Haiku、RLax

Jax 是谷歌開源的一個科學計算庫,能對 Python 程序與 NumPy 運算執行自動微分,而且能夠在 GPU 和 TPU 上運行,具有很高的性能。基于 Jax 已有很多優秀的開源項目,如 Trax 等。近日,DeepMind 開源了兩個基于 Jax 的新機器學習庫,分別是 Haiku 和 RLax,它們都有著各自的特色,對于豐富深度學習社區框架、提升研究者和開發者的使用體驗有著不小的意義。
Haiku:https://github.com/deepmind/haikuRLax:https://github.com/deepmind/rlax
Haiku:在 Jax 上進行面向對象開發
首先值得注意的是 Haiku,這是一個面向 Jax 的深度學習代碼庫,它是由 Sonnet 作者——一個谷歌的神經網絡庫團隊開發的。
為什么要使用 Haiku?這是因為其支持的是 Jax,Jax 在靈活性和性能上具有相當的優勢。但是另一方面,Jax 本身是函數式的,和面向對象的用戶習慣有差別。因此,通過 Haiku,用戶可以在 Jax 上進行面向對象開發了。
此外,Haiku 的 API 和編程模型都是基于 Sonnet,因此使用過 Sonnet 的用戶可以快速上手。項目作者也表示,Sonnet 之于 TensorFlow 的提升就如同 Haiku 之于 Jax。
目前,Haiku 已公開了 Alpha 版本,已完全開源。項目作者歡迎使用者提出建議。
Haiku 怎么和 Jax 交互
Haiku 主要分為兩個模塊:hk.Modules和 hk.transform。下文將會分別介紹。
hk.Modules 是 Python 對象,保存著到參數、其他模塊和方法的參照(references)。
hk.transform 則負責將面向對象的模塊轉換為純粹的函數式代碼,然后讓 jax 中的 jax.jit, jax.grad, jax.pmap 等進行處理,從而實現和 Jax 組件的兼容。
Haiku 的功能
Haiku 能夠做到很多機器學習需要完成的任務,相關功能和代碼如下:

自定義你的模塊


在 Haiku 中,類似于 TF2.0 和 PyTorch,你可以自定義模塊,作為 hk.Module 的子類。例如,自定義一個線性層:

class MyLinear(hk.Module):  def __init__(self, output_size, name=None):    super(MyLinear, self).__init__(name=name)    self.output_size = output_size  def __call__(self, x):    j, k = x.shape[-1], self.output_size    w_init = hk.initializers.TruncatedNormal(1. / np.sqrt(j))    w = hk.get_parameter("w", shape=[j, k], dtype=x.dtype, init=w_init)    b = hk.get_parameter("b", shape=[k], dtype=x.dtype, init=jnp.zeros)    return jnp.dot(x, w) + b


可以看出,Haiku 的代碼和 TensorFlow 等非常相似,但是你可以看到包括 numpy 等的方法還可以定義在模塊中。Haiku 的優勢就在于,它不是一個封閉的框架,而是代碼庫,因此可以在定義模塊的過程中調用其他的庫和方法。
當定義好線性層后,我們想要試試自動微分的方法了:

def forward_fn(x):  model = MyLinear(10)  return model(x)# Turn `forward_fn` into an object with `init` and `apply` methods.forward = hk.transform(forward_fn)x = jnp.ones([1, 1])# When we run `forward.init`, Haiku will run `forward(x)` and collect initial# parameter values. Haiku requires you pass a RNG key to `init`, since parameters# are typically initialized randomly:key = hk.PRNGSequence(42)params = forward.init(next(key), x)# When we run `forward.apply`, Haiku will run `forward(x)` and inject parameter# values from the `params` that are passed as the first argument. We do not require# an RNG key by default since models are deterministic. You can (of course!) change# this using `hk.transform(f, apply_rng=True)` if you prefer:y = forward.apply(params, x)


這里可以看到,定義好模塊和前向傳播的函數后,使用 hk.transform(forward_fn) 可以將這種面向對象的方法轉換成 Jax 底層的函數式代碼進行處理,因此你不需要擔心底層的計算問題。另外,這里的代碼相比 TensorFlow 還要簡潔。
非訓練狀態
有時候,我們想要在訓練的過程中保持某些內部參數的狀態,在 Haiku 上這也是非常容易實現的。

def forward(x, is_training):  net = hk.nets.ResNet50(1000)  return net(x, is_training)forward = hk.transform_with_state(forward)# The `init` function now returns parameters **and** state. State contains# anything that was created using `hk.set_state`. The structure is the same as# params (e.g. it is a per-module mapping of named values).params, state = forward.init(rng, x, is_training=True)# The apply function now takes both params **and** state. Additionally it will# return updated values for state. In the resnet example this will be the# updated values for moving averages used in the batch norm layers.logits, state = forward.apply(params, state, rng, x, is_training=True)


如上所示,只需要兩行代碼進行設置。
和 jax.pmap 聯合進行分布式訓練
由于所有的代碼都會被轉換成 Jax 的函數,因此它們和 jax.pmap. 是完全兼容的。這說明,我們可以利用 jax.pmap 來進行分布式計算。
如下為進行數據分割的分布式加速代碼,首先,我們先定義模型和訓練步驟:

def loss_fn(inputs, labels):  logits = hk.nets.MLP([8, 4, 2])(x)  return jnp.mean(softmax_cross_entropy(logits, labels))loss_obj = hk.transform(loss_fn)# Initialize the model on a single device.rng = jax.random.PRNGKey(428)sample_image, sample_label = next(input_dataset)params = loss_obj.init(rng, sample_image, sample_label)


然后設定將參數拷貝到所有的設備上:

# Replicate params onto all devices.num_devices = jax.local_device_count()params = jax.tree_util.tree_map(lambda x: np.stack([x] * num_devices), params)


定義數據分批的方法,以及參數更新的方法:

def make_superbatch():  """Constructs a superbatch, i.e. one batch of data per device."""  # Get N batches, then split into list-of-images and list-of-labels.  superbatch = [next(input_dataset) for _ in range(num_devices)]  superbatch_images, superbatch_labels = zip(*superbatch)  # Stack the superbatches to be one array with a leading dimension, rather than  # a python list. This is what `jax.pmap` expects as input.  superbatch_images = np.stack(superbatch_images)  superbatch_labels = np.stack(superbatch_labels)  return superbatch_images, superbatch_labelsdef update(params, inputs, labels, axis_name='i'):  """Updates params based on performance on inputs and labels."""  grads = jax.grad(loss_obj.apply)(params, inputs, labels)  # Take the mean of the gradients across all data-parallel replicas.  grads = jax.lax.pmean(grads, axis_name)  # Update parameters using SGD or Adam or ...  new_params = my_update_rule(params, grads)  return new_params


最后開始分布式計算即可:

# Run several training updates.for _ in range(10):  superbatch_images, superbatch_labels = make_superbatch()  params = jax.pmap(update, axis_name='i')(params, superbatch_images,                                           superbatch_labels)


RLax:Jax 上也有強化學習庫了
除了令人印象深刻的 Haiku 外,DeepMind 還開源了 RLax——這是一個基于 Jax 的強化學習庫。
相比 Haiku,RLax 專門針對強化學習。項目作者認為,盡管強化學習中的算子和函數并不是完全的算法,但是,如果需要構建完全基于函數式的智能體,就需要特定的數學算子。
因此,函數式的 Jax 就成為了一個不錯的選擇。在 Jax 上進行一定的開發后,就可以有專用的強化學習庫了。RLax 目前的資料還較少,但項目已提供了一個示例代碼:使用 RLax 進行 Q-learning 模型的搭建和訓練。
代碼如下,首先,使用 Haiku 構建基本的強化學習模型:

def build_network(num_actions: int) -> hk.Transformed:  def q(obs):    flatten = lambda x: jnp.reshape(x, (-1,))    network = hk.Sequential(        [flatten, nets.MLP([FLAGS.hidden_units, num_actions])])    return network(obs)  return hk.transform(q)


設定訓練的方法:

def main_loop(unused_arg):  env = catch.Catch(seed=FLAGS.seed)  rng = hk.PRNGSequence(jax.random.PRNGKey(FLAGS.seed))  # Build and initialize Q-network.  num_actions = env.action_spec().num_values  network = build_network(num_actions)  sample_input = env.observation_spec().generate_value()  net_params = network.init(next(rng), sample_input)  # Build and initialize optimizer.  optimizer = optix.adam(FLAGS.learning_rate)  opt_state = optimizer.init(net_params)


以下和 Jax 結合,定義策略、獎勵等:

@jax.jitdef policy(net_params, key, obs):    """Sample action from epsilon-greedy policy."""    q = network.apply(net_params, obs)    a = rlax.epsilon_greedy(epsilon=FLAGS.epsilon).sample(key, q)    return q, a@jax.jitdef eval_policy(net_params, key, obs):    """Sample action from greedy policy."""    q = network.apply(net_params, obs)    return rlax.greedy().sample(key, q)@jax.jitdef update(net_params, opt_state, obs_tm1, a_tm1, r_t, discount_t, q_t):    """Update network weights wrt Q-learning loss."""def q_learning_loss(net_params, obs_tm1, a_tm1, r_t, discount_t, q_t):    q_tm1 = network.apply(net_params, obs_tm1)    td_error = rlax.q_learning(q_tm1, a_tm1, r_t, discount_t, q_t)    return rlax.l2_loss(td_error)    dloss_dtheta = jax.grad(q_learning_loss)(net_params, obs_tm1, a_tm1, r_t,                                             discount_t, q_t)    updates, opt_state = optimizer.update(dloss_dtheta, opt_state)    net_params = optix.apply_updates(net_params, updates)    return net_params, opt_stateprint(f"Training agent for {FLAGS.train_episodes} episodes...")


可以看到,RLax 基于 jax.jit 的方法,在性能方面有不錯的提升。更有趣的是,構建模型的過程中使用了前文提到的 Haiku,可見基于 Jax 生態的代碼庫之間都是可以兼容的。
從 DeepMind 近日開源的兩個代碼庫可以看到,雖然現在深度學習框架依然在穩步發展,但是針對高性能的科學計算也漸漸變得更為重要了。而 Jax 這樣的優秀開源項目,無疑也需要更多的生態支持。這次開源的 Haiku 和 RLax,無疑能夠鞏固 Jax 的地位,使其優秀的特性進一步得到發揮。

https://www.toutiao.com/i6797211131191493124/

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

额尔古纳市| 库车县| 来凤县| 通海县| 台江县| 博白县| 文成县| 南汇区| 蚌埠市| 股票| 柏乡县| 鲁甸县| 东阳市| 阳泉市| 武胜县| 抚远县| 平罗县| 普陀区| 宝丰县| 盐津县| 仙居县| 泰宁县| 綦江县| 麻阳| 东海县| 孝感市| 衡东县| 泾川县| 隆子县| 股票| 巴青县| 华池县| 科技| 房山区| 永善县| 长葛市| 商河县| 万全县| 古浪县| 日照市| 彰武县|