Publication: Policy Adaptive Multi-agent Deep Deterministic Policy Gradient.