強化學習和深度學習都是機器學習的一個子集。
強化學習和深度學習的主要區別在於:
1、深度學習的訓練樣本是有標籤的,強化學習的訓練是沒有標籤的,它是通過環境給出的獎懲來學習
2、深度學習的學習過程是靜態的,強化學習的學習過程是動態的。這裡靜態與動態的區別在於是否會與環境進行交互,深度學習是給什麼樣本就學什麼,而強化學習是要和環境進行交互,再通過環境給出的獎懲來學習
3、深度學習解決的更多是感知問題,強化學習解決的主要是決策問題。因此有深度學習更像是五官,而強化學習更像大腦。
ML-Agents 是一款開源的 Unity 插件, 使得我們得以在遊戲環境和模擬環境中訓練智能 agent。
1. 下載 mlagents,不要問我為什麼不用 20 版本
https://github.com/Unity-Technologies/ml-agents/releases/tag/release_19
2. 下載 conda,(python 環境)
https://anaconda.org/anaconda/conda
3. 創建 conda 環境
conda create -n base1 python=3.8
4. 切換到剛才創建的環境
conda activate base1
5. 安裝 mlagents
cd C:\Users\546546\Desktop\ml-agents-release_19\ml-agents-release_19
pip install torch~=1.7.1
pip install -e./ml-agents-envs
pip install -e./ml-agents
pip uninstall protobuf
pip install protobuf==3.19.6
pip uninstall numpy
pip install numpy==1.19
6. 完成遊戲邏輯部分的開發後,開始訓練
mlagents-learn config/ppo/ball.yaml --run-id=t1
詳細教程可以看我 youtube 教學
https://www.youtube.com/watch?v=eNQpujBpGMY&t=13s