TA的每日心情 | 慵懒 2024-10-6 14:59 |
---|
签到天数: 82 天 [LV.6]常住居民II
中级会员
- 积分
- 6412
|
0. 背景:想去日本读个研,cs专业
1. 5.0 短时间内不会推出
2. 我并不打算在理论上去拓展4.0,想看看周围能否有能做的东西
目前2个想法
3.1 storage -> 优化预训练的模型,使用内存/硬盘代替部分/全部 显存
这部分其实已经有成果了,要做的话也捡(优化)别人的
3.2 prompt -> 相当于是ai训练师的研究,通过解析transformer模型去反推token等参数,进而反推到prompt
这部分其实就是公司招ai训练师的要求,(感觉如果能写出论文确实直接能找工作了)
|
|