梦中Coding环境
新买的Mac Mini 到了! 是基础配置,之前也有想过要不要升级什么的,最后决定将他作为一个基础的入门款,如果未来我真的能够创造价值的话,再去更新一台也不是什么难事吧! 现在没有奇怪的网络限制,两个屏幕,机械键盘,喜欢的大手办耳机 放着好听的音乐,偶尔啜一口热茶,在冬日的暖气房间里,甚是享受。
2024-11-09
Kaggle TPU 无法启动多核训练 排雷
当使用xmp.spawn(_mp_fn, nprocs=8, start_method='fork') 这样的方式启动TPU 可能会遇到 RuntimeError: Bad StatusOr access: UNKNOWN: TPU initialization failed: Invalid --
2024-11-04
WiseMapping 简单好用的开源思维导图
https://app.wisemapping.com/ 网址在此 很简单但是好用的绘图软件,由于是开源的 也就不需要担心跑路或者什么的,可以自行部署(不过由于是java的话 可能会比较占内存?) 最近用它来整理和规划一下roadmap什么的,会比手写的便签更加好用(大概)
2024-11-02
先做Demo
其实构思这个project花了很久的时间,并不复杂但是担心会要过多的时间所以也就一直没有开工。 今天花了1h, 就用Claude完成了相当可用的MVP,才发现总是把心中的困难放大了,其实想做啥就去做,如果有时间的话,不在乎长短,说不定一下子就做完了呢。 (真开始了的话还是要合理规划一下时间安排
2024-10-23
思路清晰
写实验的时候应当弄清楚原理并去实现,而不是了解大概后实现-> 失败->反复尝试 这样会有较强的挫败感吧
2024-10-22
方向
其实最近一直在思考我的博客会有什么方向,想着哪些有高浏览的博客大多都是做工具分享的,但其实我个人其实不太想做这个部分,主要是别人已经做了很多,我不太想再去重复工作,第二则是,在工具上我已经投入过太多的时间,但其实对自己的提升并不算大。 如果可以的话,我希望可以一直做这样的,杂糅的自我,让大家复杂而有
2024-10-13
无题
还记得陪着外地来玩的哥哥去了金茂大厦登高游玩,那时中国馆刚要建成,父亲想试着让我看看,却发现观光的望远镜需要硬币,无奈只好去买了瓶6元的矿泉水。投入硬币后,也许是身高太矮导致的角度受限,或者是因为太高的倍率确实不太好找,其实到最后也没有看到一点。 — 看得怎么样 — 看到一点,我真的看到了一点
2024-10-08
指针
我们说的话是指针,指向文字背后的内容。
2024-09-25
11-667 实验2 小记
通关记录已经放在上一次ww 通过11-667的代码部分的时候,除了最后的fine tuning 我的感觉就是,这就结束了吗? 相比较15-445 给了简单的注释和警告以外 11-667的代码部分给出了足够详尽的代码解释。甚至预期和结果都会展示在函数内部的注释中,如果有任何问题,也可以通过查看测试文件
2024-09-24
好!我中了! 速记 11-667实验
你中了甚么! 终于在token和模型大小的限制下通过了perplexity的要求, 题目要求75以下可以拿一半分,50以下可以拿满,对于我这种对模型一窍不通的人肯定要把调参的分拿到(bushi) 整个调参还是比较累的,一开始需要找到模型优化方向,大概花了半天时间把指标压到了100以下,这个时候其实只
2024-09-22