即刻App
年轻人的同好社区
下载
App内打开
evanzh7
353
关注
19
被关注
0
夸夸
🤩
evanzh7
5月前
nocomputer: 福建霞浦四礵列岛 真的是 "人间塞尔达" 今天的苹果原图实况直出 太美了真的 !🥹 这个上岛票真的值! 本来很担心天气 因为昨天都是下雨阴天 结果幸运的是今天岛上是晴天 🌞 缺点是海上太大风了快艇一直颠 上岛后看到这个景色 我们都觉得不枉此行~
0
0
0
evanzh7
5月前
兔撕鸡大老爷: 刷到了别人整理的《一饭封神》餐厅list
0
0
0
evanzh7
11月前
不务正业小胡同学: ⭕️Deepseek R1 API可用平台 deepseek官方的平台一直在被攻击,再加上用的人很多,经常不可用,这里整理了几个可用的API平台,搭配chatbox或者Cherry Studio使用很不错 1️⃣ 硅基流动 联合华为云推出的API服务,671B版本,见p1,注册送2000w token 🔗 https://cloud.siliconflow.cn/i/ql7ojxtv 2️⃣ NVIDIA 老黄的免费平台,个人用户注册可以免费用1000次调用(不计算token数量,而是按照调用次数来),见p2 🔗 https://build.nvidia.com/deepseek-ai/deepseek-r1 3️⃣ Cloudflare cf大善人的AI gateway也支持了deepseek r1模型,包含多个模型,beta阶段的不收费,qw32b蒸馏版收费,见p3 🔗 https://developers.cloudflare.com/workers-ai/models/ 4️⃣ Microsoft Azure 微软出品,虽然这家公司嘴上说着要调查DS毕竟重资OpenAI🙂↕️ 🔗 https://azure.microsoft.com/en-us/blog/deepseek-r1-is-now-available-on-azure-ai-foundry-and-github/ ps:第一次发现Cherry Studio,pc端感觉比chatbox好用多了
0
0
0
evanzh7
1年前
Zilize: 组里的大模型综述更新了许多内容,从51页扩展到了85页,新增了如下内容: 对LLaMA模型及其衍生模型组成的LLaMA家族介绍;具体实验分析,包括指令微调数据集组合方式实验以及部分模型综合能力评测;大语言模型提示设计提示指南以及相关实验,总结了提示设计的原则、经验;参数高效适配和空间高效适配章节,总结了大语言模型相关的轻量化技术;对于规划(planning)的相关工作介绍;许多脉络梳理内容,以及大量最新工作介绍。
0
0
0
evanzh7
1年前
范冰: PDCA = Plan Delay Cancel Apologize
0
0
0
evanzh7
1年前
punky: Andrej Karpathy 的《Let's reproduce GPT-2 (124M)》视频真是学习 LLM 的至宝,虽然时间有点长(4小时), 但完整跟下来收获巨大,强烈推荐。 如果你和我一样,一步一步地跟着增加、修改代码,而不是拿着最终结果 repo 里的代码去直接运行的话,有个小坑:见图 1,红框中的代码,在原视频中是在 L500 loss.backward() 之前才调用的,但如果这么做的话,会导致 loss & HellaSwag eval 没有视频里的效果好,训练完成后没能超过 OpenAI GPT-2 124M checkpoint,见图 2。 需要像红框中代码一样,model.require_backward_grad_sync 放在 forward pass 之前,就能成功复现出来了,参见图 3(所以要注意 repo 里带有“# added after video”的 comment😅)
0
0
0
evanzh7
1年前
MrCoffeeTalker: 做牛肉饭已经 next level 了,从此不再惦记吉野家 我发现常见的食谱学习,基本 3 次迭代能到满意的水平,最近琢磨的牛肉饭也是。 方子是小红书找到的,在第一次跟着某博主学出来味道诡异的牛肉饭后,搜到了另一条食谱笔记,看原笔记评论区一堆说好吃的,于是试了下,果然很接近记忆中的味道。经历了牛肉选品改动、减糖后,现在的味道已经很满意了。 用料 - 肥牛,300g - 黄洋葱,1 个 - 生姜,3 片 - 料汁 - 白糖,20g - 味淋,3 勺 / 45g - 料酒,3 勺 / 45g - 酱油,4 勺 / 60g - 清水,200ml - 木鱼精(可选),3g 步骤 1. 洋葱切丝备用,调好料汁 2. 下料汁、生姜与洋葱,中火煮 5m 3. 放入肥牛并打散,盖盖,中小火煮 15m 4. 开盖,中火再煮 2m 收汁 5. 盖在饭上 部分原料的品牌 - 肥牛:山姆 澳洲肥牛卷 - 味淋:宝 本味淋 - 料酒:日出 料酒 - 酱油:万字 纯酿造酱油 - 木鱼精:味之素 木鱼精
0
0
0
evanzh7
1年前
窗边的伊莲娜Elaine: 笑死😆🤣 过分真实了
0
0
0
evanzh7
1年前
溪河: 问公司算法组同事要来了一些LLM训练领域值得阅读的论文和顺序。 <-- 奠基文章,介绍了PreTrain SFT和RLHF --> Instruct-GPT https://openai.com/index/instruction-following <-- 数据清洗的步骤和效果 --> falcon https://arxiv.org/abs/2306.01116 <-- 使用模型做RLHF --> RLAIF https://arxiv.org/abs/2309.00267 <-- 使用模型评价不同response的质量 --> Panda LLM https://arxiv.org/abs/2305.03025 <-- 生成SFT的数据 --> Self-Instruct https://arxiv.org/abs/2212.10560 <-- 与上一条类似,但是做的更好 --> Evol-Instruct https://arxiv.org/abs/2304.12244 <-- 利用rag生成更好的数据 --> Self-RAG https://arxiv.org/abs/2310.11511 <-- 利用few-shot的特性从头生成数据集(有点prompt trick的感觉) --> GENIE https://arxiv.org/abs/2401.14367 <-- 训练数据风格调整 --> Reformatted Alignment https://arxiv.org/abs/2402.12219 <-- 通过题目-答案对生成CoT数据 --> CoT https://arxiv.org/abs/2402.15729 <--- 我们发布的repo,有完整的pipeline,值得个人和高校复现 --> https://github.com/multimodal-art-projection/MAP-NEO
0
0
0
evanzh7
2年前
黄即弟: 卫健委这个图还是阔以参考一哈😂
0
0
0
evanzh7
2年前
白日梦想家Vivi: 考古珍贵物料: 罗永浩28岁写给新东方的求职信 “我 28岁 一事无成 但有野心”
0
0
0
evanzh7
2年前
Estella也叫黛拉: 我的(不必要正确)人生指南|已更新 2025 一、态度 1. 人生没有什么不可以、一定要。 2. Be water,无他。水在任何冲击之下都能回归原始形态,若生而为人能像水一样,便能克服任何挑战。 3. 若能在任何时候都能保持心灵秩序,便可拥有最优人生体验。 4. 所做的选择和愿意的付出都是自己的课题,都是自愿的和他人无关。 5. 可以做一个唯心的人, perspective is everything,但一定要把 facts 搞清楚。 6. 每次祛媚都是成长,多多祛媚,少些滤镜。 7. 人生本虚无,每个人都是自己的织梦人和建筑师,你想要活成什么样,就会朝什么样去变化,活着的过程本就是创造。因此,想清楚自己想要成为什么样的人很重要。 8. 一个事情看上去越重要,内心的恐惧感就越大,就越容易拖,最后一事无成。所以不要老觉得要等到 ready 才去做。 9. 不要傲慢,除非不怕脸疼。 10. 易见他人过,自见则为难。扬恶如题惊,己过则覆居,如彼狡博者,隐匿其格利。随时自勉。 11. 人间第一流上帝从不肯假手他人,要自己亲手挑选。人所能做的,就是在漫长的平庸时光里,匹夫不改其志,等待被挑选时刻的到来。 二、信息 12. 如果读的一本书想要「传授」什么东西,就去它的序,看看作者是否在序中写清楚了此书的局限性,若有,则表明作者足够 humble,可以放心食用。《原则》和《跨越鸿沟》都是这样的书。 13. 不要依赖算法,不要依赖 AI,警惕信息回音壁和被工具奴役,唯有自己的大脑可以依赖。 14. 超过 200 人以上的群聊 80% 是无效信息,只能当搜索的 database。 15. 人脑的锻炼仰赖于输入和输出,喂进去什么,便长出什么。葡萄藤开不出百合花。 三、交往 16. 多表达。表达是在告诉世界你是谁,也是帮助自己理解我是谁。articulation 的过程就是深度思考最佳的路径。 17. 亲密关系并不只有爱人,更广义地去理解人和去爱人。 18. 天下没有生来 100% 适配的齿轮,如果对亲密关系报以这样的期望,100% 会失望。 19. 亲密关系是养成游戏,而不是索取游戏,对方是队友、战友和玩伴,而不是救赎。 20. 拥抱孤独,再亲密也是孤独,理解这一点,可以更好地在亲密中保持独立个体。 21. 笨拙的吵架只会消耗,艺术的吵架拉近距离,不要害怕和逃避吵架,提升吵架的能力。 22. 对谈过程中多当个 facilitator 而不是 talker。 23. 最高级的说服是通过问问题让对方说出你想告诉 ta 的话。 24. 尊重 ta 人的想法,不为任何人做自己认为为 ta 好的决策,如果爱 ta,为 ta 提供选择权而不是替 ta 选择。 25. 不要看一个人说什么,看一个人做什么。对自己也是,不要急于说,先做,行动是最好的名片。 26. 广结善缘,在己范围之内,能帮则帮。 27. 非锱铢必较,但记住每一次背刺,人生很长,下个路口见,有缘再会会,下次一定。 四、快乐 28. 成长是快乐的永动机。 29. 做一个快乐的人不代表不会不快乐和不悲伤,追求快乐,同时接纳不快乐,喜怒哀乐都是必要的。 30. 最美好的商业。就是螺旋式接近理想的过程。 31. 不恐弱、不耻弱,受伤了就是受伤了,伤口愈合后又是一条更强大的好汉。就算要做传奇,也做个能面对、处理和拥抱自己「弱」的传奇,传奇也是人。真正治愈自己,靠的不是坚强, 而是接纳自己的不坚强。让负面情绪离开的最佳办法,不是“赶走”它,而是接纳它,然后放下它。学会对自己的消极情绪不评判、不 judge、不否定、不抵御。 32. 任何情绪在当下都会放大,觉察它,不需要拒绝它,让它流过自己。 每年更新! 2021/7 我对关系的看法: https://m.okjike.com/originalPosts/60ddc84484d82a001192754f?s=ewoidSI6ICI1Y2NiZjgyZTc0ZDEzZjAwMThjYTMzOWIiCn0= ✨2024 更新: 33. 你所关注的才是生活。 34. 正念是给脑子做的俯卧撑。 35. 常看常新的东西一定要常看,定期脱离微观看宏观。 36. 从每段关系里都有一些沉淀下来的通透 就没有不好的关系;感恩一切遇见。 37. 情绪价值听起来很浅显,但却是最直觉的标尺,如果一段关系连情绪价值都无法给到,继续持续大概率只是无端消耗和无意义地习惯性依赖罢了。 38. 期望不是说出来就会实现,期望的实现是强大意志的集合(足够想要)+足够实力+一些运气。 39. 有些好事儿真的在不经意间,就那么发生了,个人能做的便是在这个机会到达之前,做最好的自己,对,真就这么简单。 🪐2025 更新: 40. 好的关系是滋养、是镜子、是眼里的对方有时候超过自己,专注好的关系,过滤消耗。 41. 钱是赚不完的,不要为了一时得失消耗情绪,更重要的是持续创造价值的能力、动能、能量和凭什么你赚。 42. 在学习这件事上,没有人会照顾你,而是要靠自己领悟。 43. 谋事要找手头宽裕的人,干事要找手头拮据的人,父母从商从政一定多听父母的意见,父母从工从农一定不要盲目的顺从。 44. 当面夸你的人要多加小心,背后夸你的人多加联系。 45. 能赚大钱的人,重在抬头看路,难赚大钱的人,都在低头干活。 46. 与强者相处,要不卑不亢,与弱者相处,要谦卑以待,与熟人相处莫露富,与生人相处莫露穷。 47. 谋划一件事,最忌讳和谁都熟,谋可寡而不可众,有利可图时,最忌讳吃独食,利可共而不可独。 48. 一个人的自驱力,靠不了任何其他人,外人包括父母最多是引导和加速,无法无中生有
0
0
0
evanzh7
2年前
Jason.Wei: 太真实了😂
0
0
0
evanzh7
3年前
西蓝发: 其实网页版打开小宇宙音频 然后右键查看网页代码 就能看到一个mp3文件 可以直接下载 一般人我不告诉他🤫
0
0
0
evanzh7
3年前
唐唐同学: 内置 3000+AI网站,可能是全网最全的AI导航站! 直达体验👉 https://naviai.cn Powered by GPT-4 ❤️ and @唐唐同学 数据使用GPT-4 制作的提取工具,将3387个网站的详细数据提取,然后用 chatGPT将数据分类,重写介绍,打上标签,最后由我复制粘贴到网站中。 由于 chatGPT在输出数据时候存在不稳定因素,部分数据还在持续更新中~ 但是三千多个网站和应用数据,应该是目前最全的导航网站了
0
0
0
evanzh7
3年前
牛村木木山: 预计年营收1亿美金,仅11位全职雇员,其中4位是尚未毕业的本科生 | Midjourney团队成员履历探索。 昨天在讨论群里刷到了最上面这张图(后续考证应该是来自即友@逗砂0228 ),虽然原图有些故意设置对立去引发话题,但是还是让我有些新的输入: 一是很意外,虽然自己觉得Midjourney很好玩,但是没有想到ta已经实现了1亿美金的年营收(后面搜索了下,应该是预计能实现1亿美金的年营收)。这意味ta的产品比我想象中的还要受到市场的欢迎。 二是没有想到这样的成就背后,只有11位员工,这在商业组织模式上也是巨大的成功。 感慨之余,去Midjourney官网亲自求证了一下,发现确实是只有11位全职雇员,其中1位创始人、8位研发人员、1位法务、1位财务: 首先意识到,这家公司是完全没有产品经理、市场销售人员的,除了创始人、两个支持性岗位(法务、财务),80%的人员都是研发人员。 实现了最最精简的配置。 这可能和他们创造性地将整个产品服务都放在Discord(国外相当火爆的社群App)上分不开。 然后又在想,这11位全职雇员得有多厉害,想必每位员工都是身经百战,能够以一当百。 所以,又自己去领英通过各种关键词,找到了这11位员工中10位的领英账户(有一位叫Thomas的研发人员的资料没找到),仔细看了看每一位的经历。 有了些认知更新: 1、中坚力量的研发成员,一半(4位)都是尚未毕业的本科生。 这个确实让我有些惊讶,一方面羡慕这些人在尚未毕业的早期就能够加入这样一家前沿公司,站在世界浪潮的风口上; 另一方面也在思考,Midjourney一定是找到了某种方式可以高效地去提升产品能力,而不是简单地依赖人力数量和水平。 因为客观上来说,虽然这四位本科生都有一些实操甚至是创业经历,但是确实经验有限,而且也非毕业顶尖名校(相较于OpenAI工程师的履历背景)。 2、8位研发人员中,仅有2位是研究员,6位都是开发工程师。 对此的猜测是,可能Midjourney背后的技术并没有大幅度地领先同行,更多的是在工程实现上有什么特别之处。 3、剩下来的4位研发人员,都有着比较丰富的职业经历。 好奇他们最初是怎么接触到Midjourney并且决定加入这个团队的。 既然最早都是22年2月加入,那作为初创成员,应该最早都是和创始人有过接触。 4、创始人有长期的创业经历,是LeapMotion的联合创始人,15年创业经历。 相信创始人在Midjourney的成功中扮演了关键性的角色。 创业15年后凭借Midjourney惊艳世人,创业确实是个持续且厚积薄发的过程。 21年8月成立Midjourney,到22年2月开始招聘正式员工,这中间的半年时间,一定做了相当多的准备,这段时间的故事,也值得挖掘。 据说当时还有他之前在LeapMotion的老同事和他一起(CFO Nadia Ali 和高级研发工程师 Johnathon Selstad),但是不知道为什么没放在官网上。 5、两位支持性岗位(法务、财务)都是相关领域极度有经验的。 不知道当时是如何慧眼识珠,加入Midjourney这个团队的,猜测是创始人的过往履历和对AI相关技术的认知判断。 写在最后的一点思考 阿山觉得从Midjourney这个案例看到最直观的改变就是: 创业的门槛变低了,或者说对于核心的产品服务交付之外的条件依赖变低了。 过去即使你有好的产品、技术,但是没有市场、相关的配备,还是很难成事。 后面慢慢有些SaaS产品,提到了PLG(产品驱动增长),当你产品做得足够好的时候,产品可以自发增长,当然在这个过程中你的团队还是需要慢慢地扩张,增加人手。 但是Midjourney仅仅靠最核心的8位研发人员,其中半数还是尚未毕业的本科生,就能在一年左右的时间里快要实现1亿美金的年营收,这个真的是一个非常有意义的案例。 其实随着AI对个体能力的各方面的支撑,确实能够极大地降低产品服务交付的各方面的门槛,让每个个体可能更专注于核心的idea,以更小的成本交付。 当然AI也会带来新的挑战,比如团队今天在讨论,ta可能会对产研流程有新的要求。 以前的产研流程,可能是产品经理写好产品文档,设计师敲定设计稿,最后交付给研发团队去实现,然后再测试验收。 但是这套产研流程的核心是“确定性”和“可穷举”,产品经理列出所有的逻辑可能,研发同学一一实现,最后全面验收。 但是对于AI产品,很多场景你是很难测试的。 你很难想象OpenAI在推出ChatGPT的时候,产品经理能够穷举所有的场景可能性和逻辑分支。 你也很难想象,ChatGPT上线之前,团队成员能够把所有的边界情况都测试到。 不管你是做AI底层基建的创业,还是尝试把AI融入到特定业务领域中,你都多少要开始和这其中的不确定性打交道。 更不用说,现在AI进展几乎日新月异,各种应用层出不穷,让你眼花缭乱。 在这样的背景下,我们能做的,似乎只有回归业务的本质,抓紧创新的场景,然后保持最新的关注,在动态中去调整自己。 “做好把技能树点乱的准备”。
0
0
0