即刻App
年轻人的同好社区
下载
App内打开
Random_thoughts
21
关注
873
被关注
3
夸夸
工程师 跑者
我超越了昨天的自己,哪怕只是那么一丁点儿,才更为重要。
在长跑中,如果说有什么必须战胜的对手,那就是过去的自己。
置顶
Random_thoughts
8月前
写了个 大模型应用开发的教程,公开免费
“因为自己淋过雨,所以想给别人撑把伞”,只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
大模型应用开发教程
193
14
70
Random_thoughts
7天前
我们的 AI be like
00:19
1
0
0
Random_thoughts
23天前
为什么国内那么多大厂都没干过deepseek?
0
6
2
Random_thoughts
24天前
下一代 Agent/AI 应该是什么样子?
应该是更像人学习的方式
R1-zero,是通过生成多种解决方案(即不同的“轨迹”),对成功的方案给予奖励,对失败的方案进行惩罚,从而优化其行为策略。
(其中成功与否,是通过在数学,或者代码,有标准答案或方便做验证的领域)
但是 Train model,RL 是真的高效率的学习方式么?是唯一解么?大脑是真的像强化学习一样在学习么?
我们可能低估了研究人类思考的重要性:记忆如何更新?如何选择性记忆?如何利用经验做下一步行动?
3
0
0
Random_thoughts
1月前
看完了 Karpathy 的新视频,很有启发。提醒一点这个视频是面向小白听众的,非技术背景,非行业从业者也能听懂。对于行业从业者,更是像把知识直接灌到脑子里。建议每个人都听一下,如果实在有难度可以看下我之前写的免费教程打打基础。
www.wolai.com
大神Andrej Karpathy最新讲座:深入探讨ChatGPT类大语言模型_哔哩哔哩_bilibili
4
0
1
Random_thoughts
1月前
20
16
2
Random_thoughts
1月前
29
1
5
Random_thoughts
1月前
Karpathy 发新视频了,yeah!
1
0
0
Random_thoughts
1月前
刚看了DeepMind的《Evolving Deeper LLM Thinking》,他们通过遗传算法让 prompt 进化到 最优的 prompt。但看下来,我感觉这种自优化框架都有点华而不实了。无论是 Dspy、TextGradient,还是这个新出的框架,其核心问题都在于:如何为一个文科任务设计出合适的 reward/evaluation 函数。数学或编程任务的结果容易量化,但要精确衡量主观性极强的文科回答效果,难度就太大了。
理论上,只要能定义出一个理想的 reward 函数,就能找到最优解,反馈准确就能加快收敛速度;即便是最简单的“评价→反馈→调整”循环,都能收敛。不要再被这些看似高大上的自优化框架忽悠了,一切的核心都在于定义好评价函数。
8
3
6
Random_thoughts
1月前
A programmer who subconsciously views himself as an artist will enjoy what he does and will do it better.
Donald E. Knuth 1978
5
1
1
Random_thoughts
1月前
年度福利,个人向
大模型应用开发,最值得关注的信息源及必读文章
信息源推荐
1. OpenAI Build Hours(OpenAI 官方应用开发教程):
vimeo.com
2. Answer.ai(大佬文章集合网站):
www.answer.ai
3. Lilian Weng's Blog(前 OpenAI 员工):
lilianweng.github.io
4. Hust Yichi's Blog(RAG 必读):
hustyichi.github.io
5. Hamel Husain's Blog (做应用必读):
hamel.dev
6. LangChain Blog(很多有意思的新应用):
blog.langchain.dev
7. AI Engineer YouTube Channel(AI Engieer 的 TED Talk):
www.youtube.com
8. GitIngest (快速读一个 Git 项目):
gitingest.com
必读文章
1. 强化学习中的奖励黑客(Lilian Weng):
lilianweng.github.io
posts/2024-11-28-reward-hacking/
2. LLM 评测必读(Hamel Husain):
hamel.dev
hamel.dev
3. 提示工程必读(MedPrompt 研究论文):
arxiv.org
4. LLM 的物理学(Bilibili 视频):
www.bilibili.com
5. OpenAI 官方喂饭1(YouTube 视频):
www.youtube.com
youtube.com
6. 大模型应用开发:
www.oreilly.com
8. TextGrad 解析(YouTube 视频):
www.youtube.com
9. 检索增强生成(RAG)最佳实践:
arxiv.org
www.bilibili.com
github.com
10. GPT 原理(Andrej Karpathy):
www.bilibili.com
82
7
107