亚洲欧美色视频在线观看,亚洲欧美人清高精品aⅴ,亚洲精品私拍国产在线

單項選擇題在強化學習中，什么是“動態(tài)規(guī)劃”（DynamicProgramming）（）？

A.一種用于優(yōu)化策略的方法
B.一種用于計算狀態(tài)值的方法
C.一種用于選擇動作的規(guī)則
D.一種用于表示環(huán)境模型的數(shù)據(jù)結構

1.單項選擇題在強化學習中，什么是“馬爾可夫性質”（）？

A.智能體可以隨時選擇任何動作
B.環(huán)境的動態(tài)會隨時間改變
C.下一個狀態(tài)只取決于當前狀態(tài)和采取的動作
D.智能體可以看到完整的狀態(tài)空間

2.單項選擇題Mixup 數(shù)據(jù)增廣的關鍵點是什么（）？

A.圖像與圖像疊加
B.樣本與樣本疊加
C.特征與特征疊加
D.標簽與標簽疊加

3.單項選擇題強化學習算法中，用于優(yōu)化策略的一種方法是：（）。

A.監(jiān)督學習
B.無監(jiān)督學習
C.半監(jiān)督學習
D.策略梯度

4.單項選擇題下列哪個是用于圖像分類任務中最著名的預訓練模型之一（）？

A.InceptionV3
B.Word2Vec
C.GRU
D.ARIMA

5.單項選擇題PyTorch 中的torchnnfunctional 模塊主要用于提供什么（）？

A.損失函數(shù)
B.神經網(wǎng)絡層
C.優(yōu)化器
D.激活函數(shù)和其他非層操作