即刻App年轻人的同好社区
下载
App内打开
Random_thoughts
21关注873被关注3夸夸
工程师 跑者

我超越了昨天的自己,哪怕只是那么一丁点儿,才更为重要。

在长跑中,如果说有什么必须战胜的对手,那就是过去的自己。
置顶
Random_thoughts
8月前
写了个 大模型应用开发的教程,公开免费

“因为自己淋过雨,所以想给别人撑把伞”,只为了像我一样的工程师/产品入门大模型开发 少走点弯路。

面向小白,尽量通俗易懂且实用。

大模型应用开发教程

1470
Random_thoughts
7天前
我们的 AI be like
00:19
00
Random_thoughts
23天前
为什么国内那么多大厂都没干过deepseek?
62
Random_thoughts
24天前
下一代 Agent/AI 应该是什么样子?

应该是更像人学习的方式
R1-zero,是通过生成多种解决方案(即不同的“轨迹”),对成功的方案给予奖励,对失败的方案进行惩罚,从而优化其行为策略。
(其中成功与否,是通过在数学,或者代码,有标准答案或方便做验证的领域)

但是 Train model,RL 是真的高效率的学习方式么?是唯一解么?大脑是真的像强化学习一样在学习么?

我们可能低估了研究人类思考的重要性:记忆如何更新?如何选择性记忆?如何利用经验做下一步行动?
00
Random_thoughts
1月前
看完了 Karpathy 的新视频,很有启发。提醒一点这个视频是面向小白听众的,非技术背景,非行业从业者也能听懂。对于行业从业者,更是像把知识直接灌到脑子里。建议每个人都听一下,如果实在有难度可以看下我之前写的免费教程打打基础。
www.wolai.com

大神Andrej Karpathy最新讲座:深入探讨ChatGPT类大语言模型_哔哩哔哩_bilibili

01
Random_thoughts
1月前
162
Random_thoughts
1月前
15
Random_thoughts
1月前
Karpathy 发新视频了,yeah!
00
Random_thoughts
1月前
刚看了DeepMind的《Evolving Deeper LLM Thinking》,他们通过遗传算法让 prompt 进化到 最优的 prompt。但看下来,我感觉这种自优化框架都有点华而不实了。无论是 Dspy、TextGradient,还是这个新出的框架,其核心问题都在于:如何为一个文科任务设计出合适的 reward/evaluation 函数。数学或编程任务的结果容易量化,但要精确衡量主观性极强的文科回答效果,难度就太大了。

理论上,只要能定义出一个理想的 reward 函数,就能找到最优解,反馈准确就能加快收敛速度;即便是最简单的“评价→反馈→调整”循环,都能收敛。不要再被这些看似高大上的自优化框架忽悠了,一切的核心都在于定义好评价函数。
36
Random_thoughts
1月前
A programmer who subconsciously views himself as an artist will enjoy what he does and will do it better.

Donald E. Knuth 1978
11
Random_thoughts
1月前
年度福利,个人向
大模型应用开发,最值得关注的信息源及必读文章

信息源推荐
1. OpenAI Build Hours(OpenAI 官方应用开发教程): vimeo.com
2. Answer.ai(大佬文章集合网站): www.answer.ai
3. Lilian Weng's Blog(前 OpenAI 员工): lilianweng.github.io
4. Hust Yichi's Blog(RAG 必读): hustyichi.github.io
5. Hamel Husain's Blog (做应用必读): hamel.dev
6. LangChain Blog(很多有意思的新应用): blog.langchain.dev
7. AI Engineer YouTube Channel(AI Engieer 的 TED Talk): www.youtube.com
8. GitIngest (快速读一个 Git 项目): gitingest.com

必读文章
1. 强化学习中的奖励黑客(Lilian Weng): lilianweng.github.ioposts/2024-11-28-reward-hacking/
2. LLM 评测必读(Hamel Husain):
hamel.dev
hamel.dev
3. 提示工程必读(MedPrompt 研究论文): arxiv.org
4. LLM 的物理学(Bilibili 视频): www.bilibili.com
5. OpenAI 官方喂饭1(YouTube 视频):
www.youtube.com
youtube.com
6. 大模型应用开发: www.oreilly.com
8. TextGrad 解析(YouTube 视频): www.youtube.com
9. 检索增强生成(RAG)最佳实践:
arxiv.org
www.bilibili.com
github.com
10. GPT 原理(Andrej Karpathy):www.bilibili.com
7107