即刻App
年轻人的同好社区
下载
App内打开
Tefnut
428
关注
246
被关注
4
夸夸
🧑🏫ENTP-T 6w7
🗂在和遗忘做抗争
💻CS PhD/Al4Science->Structural Biology
Tefnut
1天前
LLM这一波起来之后,有很多人去研究怎么去evaluate AI。但是也许我们应该想想怎么用AI去evaluate人,这样也能将人从人身依附关系中解放出来。我见过的绝大部分教授作为advisor并不能比 AI 提供更好更专业更细致的建议,只是在人的层面上能提供资源。
3
0
0
Tefnut
4天前
😭写CUDA或者Triton的人也要失业了嘛?Pytorch 2 着重做compilation优化,PyTorch不如就做AI compilation优化算了,主打一个自己优化自己
歸藏: 英伟达让 Deepseek R1 编写 GPU 内核 结果 R1 写的内核比英伟达熟练工程师的还好 ! 他们使用的方法也很简单: 1️⃣DeepSeek-R1 生成初始 GPU 内核代码 2️⃣验证器(H100)分析生成的内核并提供反馈 3️⃣将其反馈回 DeepSeek-R1 以生成修订后的内核 4️⃣过程重复一定的持续时间 他们发现只要持续超过 10 分钟就能生成大多数问题的正确代码 详细信息:https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/
1
0
0
Tefnut
4天前
希望一年以内能用上GB200
1
0
0
Tefnut
8天前
Highlight AI做了ChatGPT客户端该做的事,那就是收集context。
2
0
0
Tefnut
10天前
难以想象学校又会立一些什么名目来收钱,用中文来说这是在打破大锅饭,很多tenure躺平的教授或者拿funding不顺利的老师都是被这部分indirect costs养着。把系撤掉,或者打破tenure铁饭碗也许会很快实现。现代的教育系统会变成什么样子呢?在人类社会再次陷入迷茫之前,也许我们连学术自由都不用再提了,人类的research对于AI来说真的算research吗?
2
2
0
Tefnut
11天前
NVIDIA你说的这个HGX H200,deepseek能买到吗?
3
0
0
Tefnut
11天前
生态的作用也很重要,像各种下游AI应用厂商都有了适配自己部署的deepseek模型来降低API费用的动力。Claude Sonnet 3.5 还是太贵了。
李自然: DeepSeek开源真的是非常高明的策略。开源的初衷可能是因为AGI信仰,但商业方面也带来了实实在在的好处: 1. 如果不开源,纯拼性能R1对o1并没有绝对优势,如果只是价格便宜,又要像V3一样被说成是中国资本效率的产物; 2. 获得了很多人的支持和信任,让DeepSeek几乎没有付出什么成本,就在最近的舆论战中不落下风; 3. AWS/微软等云服务商开始给客户提供R1(对他们来说是天上掉馅饼,一下子有了给客户提供顶级模型的能力),DeepSeek获得了品牌影响力,以及实实在在的市场份额,也有利于将来官方卖API。
3
0
0
Tefnut
13天前
老板说NIH要是再不发烧就要拿一个postdoc的工资去换五张GPUs了。🫣那不是能多出十几张卡。
1
0
0
Tefnut
13天前
Perplexity Pro能一天用 500 次 R1
2
2
0
Tefnut
14天前
看起来deep research更应该叫think deeper
Szhans: 深入研究了一天 ChatGPT Deep Research,震撼的不仅是它背后的 o3 模型作为 Agent 的表现——在推理、搜索和综合理解上——显著领先目前 Gemini Deep Research 和 Perplexity Pro+R1,而是它即将引发的知识工作者范式冲击和新一轮红皇后效应。 这个具体例子让我格外感触:今天让它写一份面向大学生、企业家和经济学家的 AI 对比研究的简报。ChatGPT 只用了4分钟,而以我这些年的写作、AI研究和实战经验,至少需要 10 个小时才能达到这样的深度和全面性。 如果你对AI应用、推理模型独特能力以及AI Agent的未来感兴趣,不妨细细阅读这份简报。也许你将和我一样,陷入沉思。
4
0
0