前言 为什么神经网络要用梯度下降法优化,而不用乘子法,牛顿法等优化? Previous GBDT(文本匹配/文本分类) Next Knowledgegraph CATALOG FEATURED TAGS Blog FRIENDS 简书