博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
分类算法测试
阅读量:2755 次
发布时间:2019-05-13

本文共 345 字,大约阅读时间需要 1 分钟。

今天主要总结一些问题:

(1)Blas GEMM launch failed : a.shape=(50, 784), b.shape=(784, 10), m=50, n=10, k=784

这个问题很诡异:重启jupyter notebook就没有了,然后切换别的程序执行,又有了,查看GPU信息:

程序都执行完很久了,显存还被占用着。待会我看下关闭之后的显存状态。(应该是代码不规范导致的,但是我还不知道怎么来规范代码)

参考:

关闭(jupyter)之后:

(2)loss:nan;acc: < 0.1

学习率太小了,根本学不了。尝试增大;采用SGD。学习率为0.5

但是如果采用Adam,学习率为0.5,直接发散,还不知道为啥。(留待慢慢补充)

因此:修改学习率 + 学习优化算法

 

你可能感兴趣的文章
全球第三大社交网络hi5裁员50% 公司重组所致
查看>>
上海只适合zuoai 不适合恋爱
查看>>
Silverlight 3 新特性
查看>>
关于淘宝网性能测试的思考
查看>>
.net中Dataset数据集的认识
查看>>
日常接口测试的三轮测试
查看>>
项目发布后的问题跟踪
查看>>
不要做需求阶段的“听长”
查看>>
MIX09的感想(之一):About IE8
查看>>
白盒测试体系的探索
查看>>
原始套接字
查看>>
glib与glibc的区别
查看>>
测试人员如何不被开发人员牵着鼻子走?
查看>>
web性能测试术语小集合
查看>>
网站架构探索(3)---负载均衡的方式
查看>>
初识Top命令
查看>>
MySQL权限
查看>>
“火狐”很“51”
查看>>
记录两个CakePHP知识点
查看>>
用预置模板降低JS代码与HTML结构的耦合
查看>>