A.沒有影響
B.可能導(dǎo)致局部最優(yōu)解
C.一定導(dǎo)致全局最優(yōu)解
D.使算法收斂速度更快
您可能感興趣的試卷
你可能感興趣的試題
A.因?yàn)長STM 能夠更好地捕獲長期依賴關(guān)系
B.因?yàn)長STM 的計(jì)算速度更快
C.因?yàn)長STM 的模型結(jié)構(gòu)更簡單
D.因?yàn)長STM 不需要反向傳播算法
A.輸入層之前的層
B.輸出層之前的層
C.輸入層和輸出層之間的層
D.輸出層之后的層
A.通過跳躍連接緩解梯度消失問題
B.通過增加深度提高性能
C.通過減少參數(shù)數(shù)量防止過擬合
D.通過改變激活函數(shù)提高性能
A.BERT 考慮了單詞之間的順序關(guān)系。
B.ERT 是一個(gè)靜態(tài)的詞嵌入模型。
C.BERT 不能用于下游任務(wù)。
D.BERT 不依賴于預(yù)訓(xùn)練階段。
A.減少學(xué)習(xí)過程中的方差
B.加速模型的收斂速度
C.優(yōu)化策略的穩(wěn)定性
D.提高策略的探索能力
最新試題
在強(qiáng)化學(xué)習(xí)中,什么是“馬爾可夫性質(zhì)”()?
模型微調(diào)中的提示學(xué)習(xí)是指:()。
在深度學(xué)習(xí)模型訓(xùn)練中,"早停法"(EarlyStopping)策略的應(yīng)用目的是什么()?
反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的主要區(qū)別是什么()?
屬性值約束主要有()。
進(jìn)行模型訓(xùn)練之前,需要先把標(biāo)注好的數(shù)據(jù)進(jìn)行分類。訓(xùn)練有監(jiān)督學(xué)習(xí)模型時(shí)會(huì)將數(shù)據(jù)集劃分為()。
在自然語言處理中,哪些方法可以用于提升自動(dòng)文本摘要的生成效果()?
人工智能中的“序列到序列”模型主要用于處理什么類型的數(shù)據(jù)()?
在強(qiáng)化學(xué)習(xí)中,什么是“動(dòng)態(tài)規(guī)劃”(DynamicProgramming)()?
在深度學(xué)習(xí)中,哪些技術(shù)可以用于加速模型訓(xùn)練并提高模型在圖像分類和文本處理任務(wù)上的精確度()?