首页      文库资料        文章资讯      上传文档  发布文章  登录账户
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
 动手学深度学习 v2.0动量法中的方式使用泄漏平均值,即st ← γst−1 + (1 − γ)g2 t,其中参数γ > 0。保持所有其它部分不变就产生了RMSProp算法。 11.8.1 算法 让我们详细写出这些方程式。 st ← γst−1 + (1 − γ)g2 t, xt ← xt−1 − η √st + ϵ ⊙ gt. (11.8.1) 常数ϵ > 0通常设置为10−6,以确保我们不会因除以零或步长0 码力 | 797 页 | 29.45 MB | 1 年前3 动手学深度学习 v2.0动量法中的方式使用泄漏平均值,即st ← γst−1 + (1 − γ)g2 t,其中参数γ > 0。保持所有其它部分不变就产生了RMSProp算法。 11.8.1 算法 让我们详细写出这些方程式。 st ← γst−1 + (1 − γ)g2 t, xt ← xt−1 − η √st + ϵ ⊙ gt. (11.8.1) 常数ϵ > 0通常设置为10−6,以确保我们不会因除以零或步长0 码力 | 797 页 | 29.45 MB | 1 年前3
共 1 条
- 1













