BlackCat_Tensors_Doxygen/html/recurrent_8h_source.html

 /*
  * Recurrent.cu
  *
  *  Created on: Jan 28, 2018
  *    Author: joseph
  */

 #ifndef RECURRENT_FEEDFORWARD_CU_
 #define RECURRENT_FEEDFORWARD_CU_

 #include "layer_base.h"

 namespace bc {
 namespace nn {

 template<class SystemTag, class ValueType, class RecurrentNonLinearity=bc::Tanh>
 struct Recurrent:
         public Layer_Base<
                 Recurrent<SystemTag, ValueType, RecurrentNonLinearity>,
                 Tensor_Descriptor<ValueType, SystemTag, Integer<1>>> {

     using system_tag = SystemTag;
     using value_type = ValueType;
     using allocator_type = bc::Allocator<ValueType, SystemTag>;
     using self_type = Recurrent<SystemTag, ValueType, RecurrentNonLinearity>;
     using input_descriptor_t = Tensor_Descriptor<ValueType, SystemTag, Integer<1>>;
     using parent_type = Layer_Base<self_type, input_descriptor_t>;

     using forward_requires_outputs = std::true_type;
     using backward_requires_outputs = std::true_type;
     using greedy_evaluate_delta = std::true_type;

 private:

     using mat = bc::Matrix<value_type, allocator_type>;
     using vec = bc::Vector<value_type, allocator_type>;

     RecurrentNonLinearity g;
     ValueType lr = parent_type::default_learning_rate;

     mat dc; //delta cell_state
     mat w, w_gradients;  //weights
     mat r, r_gradients;
     vec b, b_gradients;  //biases

 public:

     Recurrent(int inputs, int outputs) :
         parent_type(__func__, {inputs}, {outputs}),
         w(outputs, inputs),
         w_gradients(outputs, inputs),
         r(outputs, outputs),
         r_gradients(outputs, outputs),
         b(outputs),
         b_gradients(outputs)
     {
         w.randomize(-2, 2);
         b.randomize(-2, 2);
         r.randomize(-2, 2);
         zero_gradients();
     }

     template<class X>
     auto forward_propagation(const X& x) {
         return w * x + b;
     }

     template<class X, class Y>
     auto forward_propagation(const X& x, const Y& y) {
         return w * x + r * g(y) + b;
     }

     template<class X, class Y, class Delta>
     auto back_propagation(const X& x, const Y& y, const Delta& dy) {
         r_gradients -= dc * g.dx(y).t();

         dc.alias() = dy + r.t() * dc;
         w_gradients -= dy  * x.t();
         b_gradients -= dy;
         return w.t() * dy;
     }

     void update_weights() {
         auto lr = this->lr / this->batch_size();

         w += w_gradients * lr;
         b += b_gradients * lr;
         r += r_gradients * lr;

         zero_deltas();
         zero_gradients();
     }

     void set_batch_size_hook(bc::size_t bs) {
         dc = mat(this->output_size(), bs);
         zero_deltas();
     }

     void zero_deltas() {
         dc.zero();
     }

     void zero_gradients() {
         w_gradients.zero();
         b_gradients.zero();
         r_gradients.zero();
     }

     virtual void save(Layer_Loader& loader) const override {
         loader.save_variable(w, "w");
         loader.save_variable(r, "r");
         loader.save_variable(b, "b");
     }

     virtual void load(Layer_Loader& loader) {
         loader.load_variable(w, "w");
         loader.load_variable(r, "r");
         loader.load_variable(b, "b");
     }
 };

 #ifndef BC_CLING_JIT
 template<class ValueType, class SystemTag>
 Recurrent<SystemTag, ValueType> recurrent(SystemTag system_tag, int inputs, int outputs) {
     return Recurrent<SystemTag, ValueType>(inputs, outputs);
 }
 #endif

 template<class SystemTag>
 auto recurrent(SystemTag system_tag, int inputs, int outputs) {
     return Recurrent<SystemTag, typename SystemTag::default_floating_point_type>(inputs, outputs);
 }

 auto recurrent(int inputs, int outputs) {
     return Recurrent<BLACKCAT_DEFAULT_SYSTEM_T,
             typename BLACKCAT_DEFAULT_SYSTEM_T::default_floating_point_type>(inputs, outputs);
 }


 }
 }

 #endif /* FEEDFORWARD_CU_ */
bc::nn::Recurrent::update_weights
void update_weights()
Definition: recurrent.h:83

bc::tensors::Tensor_Base::randomize
void randomize(value_type lb=0, value_type ub=1)
Definition: tensor_base.h:36

bc::nn::Tensor_Descriptor< ValueType, SystemTag, Integer< 1 > >

bc::nn::Recurrent::greedy_evaluate_delta
std::true_type greedy_evaluate_delta
Definition: recurrent.h:31

bc::nn::Recurrent::set_batch_size_hook
void set_batch_size_hook(bc::size_t bs)
Definition: recurrent.h:94

bc::nn::recurrent
Recurrent< SystemTag, ValueType > recurrent(SystemTag system_tag, int inputs, int outputs)
Definition: recurrent.h:124

bc::nn::Recurrent::zero_deltas
void zero_deltas()
Definition: recurrent.h:99

bc::nn::Recurrent::save
virtual void save(Layer_Loader &loader) const override
Definition: recurrent.h:109

bc::nn::Recurrent::load
virtual void load(Layer_Loader &loader)
Definition: recurrent.h:115

bc::tensors::Tensor_Base::zero
self_type & zero()
Definition: tensor_base.h:13

bc::nn::Recurrent::Recurrent
Recurrent(int inputs, int outputs)
Definition: recurrent.h:48

bc::nn::Recurrent::value_type
ValueType value_type
Definition: recurrent.h:23

bc::nn::Recurrent::forward_requires_outputs
std::true_type forward_requires_outputs
Definition: recurrent.h:29

bc::nn::Layer_Base
Definition: layer_base.h:86

BLACKCAT_DEFAULT_SYSTEM_T
#define BLACKCAT_DEFAULT_SYSTEM_T
Definition: common.h:49

bc::nn::Layer_Loader
Definition: layer_loader.h:19

bc::nn::Recurrent
Definition: recurrent.h:17

bc::nn::Layer_Loader::save_variable
void save_variable(const T &tensor, string variable_name)
Definition: layer_loader.h:44

bc::nn::Recurrent::backward_requires_outputs
std::true_type backward_requires_outputs
Definition: recurrent.h:30

layer_base.h

bc::nn::Recurrent::forward_propagation
auto forward_propagation(const X &x, const Y &y)
Definition: recurrent.h:69

bc::tensors::Tensor_Base::alias
Alias alias()
Definition: tensor_base.h:104

bc::nn::Layer_Base< Recurrent< SystemTag, ValueType, RecurrentNonLinearity >, Tensor_Descriptor< ValueType, SystemTag, Integer< 1 > > >::output_size
bc::size_t output_size() const
Definition: layer_base.h:148

bc::size_t
int size_t
Definition: common.h:283

bc::allocators::Allocator
Definition: allocators.h:20

bc::tensors::Expression_Base::t
const auto t() const
Definition: expression_base.h:94

bc::nn::Recurrent::forward_propagation
auto forward_propagation(const X &x)
Definition: recurrent.h:64

bc::nn::Layer_Loader::load_variable
void load_variable(T &tensor, string variable_name)
Definition: layer_loader.h:50

bc::nn::Layer_Base< Recurrent< SystemTag, ValueType, RecurrentNonLinearity >, Tensor_Descriptor< ValueType, SystemTag, Integer< 1 > > >::batch_size
bc::size_t batch_size() const
Definition: layer_base.h:149

bc::tensors::Tensor_Base
Definition: cmath.h:17

bc::nn::Recurrent::zero_gradients
void zero_gradients()
Definition: recurrent.h:103

bc::nn::Recurrent::system_tag
SystemTag system_tag
Definition: recurrent.h:22

bc::nn::Recurrent::back_propagation
auto back_propagation(const X &x, const Y &y, const Delta &dy)
Definition: recurrent.h:74

bc::nn::Layer_Base::default_learning_rate
static constexpr value_type default_learning_rate
Definition: layer_base.h:107

bc
The Evaluator determines if an expression needs to be greedily optimized.
Definition: algorithms.h:22