BlackCat_Tensors_Doxygen/html/adam_8h_source.html

 /*
  * Adam.h
  *
  *  Created on: Dec 11, 2019
  *      Author: joseph
  */

 #ifndef BLACKCAT_TENSORS_NEURALNETWORKS_OPTIMIZERS_ADAM_H_
 #define BLACKCAT_TENSORS_NEURALNETWORKS_OPTIMIZERS_ADAM_H_

 #include "optimizer_base.h"

 namespace bc {
 namespace nn {

 struct Adam {

     template<class Tensor>
     struct Optimizer;

 } adam;


 template<class Tensor>
 struct Adam::Optimizer: Optimizer_Base {

     using value_type = typename Tensor::value_type;
     using system_tag = typename Tensor::system_tag;

     value_type alpha = bc::nn::default_learning_rate;
     value_type beta_1 = 0.9;
     value_type beta_2 = 0.999;
     value_type epsilon = 1e-8;
     value_type time_stamp = 0;

     Tensor m_t;
     Tensor v_t;

     template<class... Args>
     Optimizer(Args&&... args):
         m_t(std::forward<Args>(args)...),
         v_t(std::forward<Args>(args)...) {

         m_t.zero();
         v_t.zero();
     }

     template<class TensorX, class Gradients>
     void update(TensorX& tensor, Gradients&& delta)
     {
         time_stamp++;
         m_t = beta_1 * m_t + (1-beta_1) * delta;
         v_t = beta_2 * v_t + (1-beta_2) * bc::pow2(delta);

         auto m_cap = m_t/(1-(bc::pow(beta_1, time_stamp)));
         auto v_cap = v_t/(1-(bc::pow(beta_2, time_stamp)));

         tensor += (alpha*m_cap)/(bc::sqrt(v_cap)+epsilon);
     }


     void set_learning_rate(value_type lr) {
         alpha = lr;
     }

     void save(Layer_Loader& loader, std::string name) const {
         //TODO add support for loader saving primitives
     }

     void load(Layer_Loader& loader, std::string name) {
         //TODO add support for loader loading primitives
     }
 };

 }
 }


 #endif /* ADAM_H_ */
bc::nn::Adam::Optimizer
Definition: adam.h:19

bc::tensors::Tensor_Base::zero
self_type & zero()
Definition: tensor_base.h:13

bc::nn::Adam::Optimizer::load
void load(Layer_Loader &loader, std::string name)
Definition: adam.h:70

bc::nn::Adam::Optimizer::save
void save(Layer_Loader &loader, std::string name) const
Definition: adam.h:66

bc::nn::Layer_Loader
Definition: layer_loader.h:19

bc::nn::Adam::Optimizer::set_learning_rate
void set_learning_rate(value_type lr)
Definition: adam.h:62

bc::tensors::Tensor_Base< bc::tensors::exprs::Array< bc::Shape< dim >, ValueType, Allocator > >::value_type
typename parent_type::value_type value_type
Definition: tensor_base.h:41

bc::nn::Adam::Optimizer::value_type
typename Tensor::value_type value_type
Definition: adam.h:27

bc::oper::cmath_functions::sqrt
struct bc::oper::cmath_functions::Sqrt sqrt

bc::nn::Adam::Optimizer::Optimizer
Optimizer(Args &&... args)
Definition: adam.h:40

bc::nn::Adam::Optimizer::system_tag
typename Tensor::system_tag system_tag
Definition: adam.h:28

bc::nn::Optimizer_Base
Definition: optimizer_base.h:16

bc::nn::Adam
Definition: adam.h:16

bc::nn::Adam::Optimizer::m_t
Tensor m_t
Definition: adam.h:36

optimizer_base.h

bc::oper::cmath_functions::pow
struct bc::oper::cmath_functions::Pow pow

bc::nn::adam
struct bc::nn::Adam adam

bc::tensors::Tensor_Base< bc::tensors::exprs::Array< bc::Shape< dim >, ValueType, Allocator > >

bc::nn::Adam::Optimizer::update
void update(TensorX &tensor, Gradients &&delta)
Definition: adam.h:49

bc::tensors::iterators::forward
Definition: common.h:19

bc::nn::Adam::Optimizer::v_t
Tensor v_t
Definition: adam.h:37

bc::tensors::Tensor_Base< bc::tensors::exprs::Array< bc::Shape< dim >, ValueType, Allocator > >::system_tag
typename parent_type::system_tag system_tag
Definition: tensor_base.h:42

bc
The Evaluator determines if an expression needs to be greedily optimized.
Definition: algorithms.h:22

bc::oper::cmath_functions::pow2
struct bc::oper::cmath_functions::Pow2 pow2