Model-Free Online Learning for Waveform Optimization In Integrated Sensing And Communications.

Petteri Pulkkinen Visa Koivunen

Published in: ICASSP (2023)

Keyphrases

model free
online learning
reinforcement learning
function approximation
reinforcement learning algorithms
temporal difference
policy iteration
data sets
e learning
pattern recognition
policy evaluation
average reward
constrained optimization
communication systems
dynamic programming
active learning
genetic algorithm
machine learning