Next-gen resource optimization in NB-IoT networks: Harnessing soft actor-critic reinforcement learning.

S. Anbazhagan R. K. Mugelan

Published in: Comput. Networks (2024)

Keyphrases

actor critic
reinforcement learning
temporal difference
approximate dynamic programming
reinforcement learning algorithms
policy gradient
optimal control
function approximation
neuro fuzzy
gradient method
policy iteration
optimal policy
state space
average reward
dynamic programming
control problems
markov decision processes
optimization algorithm
naive bayes
model free
natural actor critic
policy gradient methods
step size
reinforcement learning methods
learning algorithm
optimization method
linear programming
supervised learning
decision trees